Pandas es, sin duda, la biblioteca más poderosa y popular de Python para el análisis de datos. Con ella, puede cargar hojas de cálculo, limpiar datos desordenados, realizar cálculos complejos y generar conocimientos increíbles, todo en pocas líneas de código.

En esta guía completa, dominará Pandas desde los conceptos básicos hasta las técnicas avanzadas.

📦 Instalación e Importación

# Instalación de las bibliotecas necesarias
pip install pandas numpy

# Convención de importación estándar de la comunidad
import pandas as pd
import numpy as np

print(f"Versión de Pandas: {pd.__version__}")

🧱 Las Dos Estructuras Principales

Series: Una columna de datos

Una Series es un objeto unidimensional similar a una matriz que contiene una secuencia de valores y un índice de etiquetas de datos asociado.

import pandas as pd

# Crear una Series con notas de estudiantes
notas = pd.Series([8.5, 7.0, 9.2, 6.8, 10.0],
                  index=["Ana", "Bruno", "Carlos", "Diana", "Eva"])

print(notas.mean())   # Salida: 8.3 (Promedio)

DataFrame: Una tabla completa

El DataFrame es una estructura de datos etiquetada bidimensional con columnas de tipos potencialmente diferentes. Puede pensar en él como una tabla SQL o una hoja de cálculo de Excel.

import pandas as pd

# Crear un DataFrame a partir de un diccionario
datos = {
    "nombre":      ["Ana", "Bruno", "Carlos", "Diana", "Eva"],
    "edad":        [25, 30, 22, 28, 35],
    "salario":     [5000, 8000, 4500, 7200, 9500],
    "area":        ["TI", "TI", "Marketing", "TI", "RH"]
}

df = pd.DataFrame(datos)
print(df.head())

📂 Carga de Datos desde Archivos

Pandas admite una gran variedad de formatos de archivo para la ingesta de datos:

  • CSV: pd.read_csv("datos.csv")
  • Excel: pd.read_excel("reporte.xlsx")
  • JSON: pd.read_json("datos.json")

🔍 Exploración y Limpieza de Datos

Antes del análisis, debe explorar y limpiar sus datos. Utilice métodos como df.info(), df.describe() y df.isnull().sum() para comprender el estado de su conjunto de datos. El manejo de valores faltantes (NaN) es un paso crítico, que a menudo se resuelve con df.dropna() o df.fillna().

🚀 Conclusión

Dominar Pandas lo transforma de un simple programador en un analista de datos. Esta es una de las habilidades más valoradas en el mercado de 2026. Para más información, consulte la documentación oficial de Pandas. Además, explore nuestras guías relacionadas sobre Diccionarios en Python y Manipulación de Archivos.