Pandas
data-processing library
Librería de análisis de datos para Python
Lenguajes soportados
Conceptos clave
DataFrameSeriesgroupbymergepivot
Ventajas y Desventajas
Ventajas
- + API intuitiva para datos tabulares
- + Excelente para EDA
- + Integración con numpy/scikit-learn
- + Muchos formatos de I/O
- + Estructuras de datos potentes (DataFrame, Series)
- + Excelente para manipulacion de datos tabulares
- + Integracion con NumPy y Matplotlib
- + Soporte para multiples formatos (CSV, Excel, SQL)
- + Operaciones vectorizadas rapidas
Desventajas
- - Lento para big data
- - Consume mucha memoria
- - API inconsistente en partes
- - Consume mucha memoria con datasets grandes
- - API puede ser inconsistente
- - No es ideal para big data (usar Polars/Dask)
- - Curva de aprendizaje moderada
Casos de Uso
- Análisis exploratorio
- Data cleaning
- Feature engineering
- Reportes
- Limpieza y preparacion de datos
- Analisis exploratorio (EDA)
- ETL pipelines
- Reportes y agregaciones
- Feature engineering para ML