DeepEval
evaluation framework
Framework de evaluación para aplicaciones LLM con métricas unitarias
Lenguajes soportados
Ventajas y Desventajas
Ventajas
- + Métricas como tests unitarios
- + Integración con pytest
- + Múltiples métricas disponibles
- + Red teaming incluido
Desventajas
- - Relativamente nuevo
- - Algunas métricas requieren LLMs
Casos de Uso
- Testing de aplicaciones LLM
- Evaluación de RAG
- CI/CD para IA