Stack Explorer

DeepEval

evaluation framework

Framework de evaluación para aplicaciones LLM con métricas unitarias

Sitio oficial

Lenguajes soportados

Ventajas y Desventajas

Ventajas

  • + Métricas como tests unitarios
  • + Integración con pytest
  • + Múltiples métricas disponibles
  • + Red teaming incluido

Desventajas

  • - Relativamente nuevo
  • - Algunas métricas requieren LLMs

Casos de Uso

  • Testing de aplicaciones LLM
  • Evaluación de RAG
  • CI/CD para IA

Tecnologías Relacionadas

Alternativas