Stack Explorer

Microsoft Orca

llm-model model

Modelos pequeños que aprenden de modelos grandes

Sitio oficial

Lenguajes soportados

Orca es una familia de modelos de Microsoft Research que aprenden mediante imitación de modelos más grandes como GPT-4. Utilizan técnicas de explanation tuning para transferir capacidades de razonamiento a modelos más pequeños y eficientes.

Conceptos clave

explanation-tuningsynthetic-dataknowledge-distillationreasoning-traceschain-of-thought

Ventajas y Desventajas

Ventajas

  • + Excelente razonamiento para su tamaño
  • + Aprende de trazas de pensamiento de GPT-4
  • + Múltiples tamaños disponibles
  • + Respaldado por Microsoft Research
  • + Técnicas innovadoras de entrenamiento
  • + Buen rendimiento en benchmarks

Desventajas

  • - Dependiente de datos sintéticos de GPT-4
  • - Limitado por conocimiento del maestro
  • - Menos versátil que modelos generales
  • - Disponibilidad variable de pesos

Casos de Uso

  • Razonamiento lógico eficiente
  • Resolución de problemas paso a paso
  • Asistentes de análisis
  • Tareas de matemáticas
  • Explicación de conceptos