Dibujar gráficas es una parte esencial del análisis de datos; no sólo para presentar los resultados finales, sino también para entender mejor lo que tenemos entre manos. Como se vió en la entrada anterior, Pandas tiene un subsistema de representación gráfica muy práctico. Sin embargo, a veces los gráficos simples que produce este subsistema son insuficientes para una visualización más completa y profunda. Aquí es donde entra Seaborn, dándonos una serie de representaciones gráficas orientadas a la visualización de conjuntos de datos complejos y con especial atención a la claridad.
pandas
Dibujando gráficas con Pandas
EstándarEn esta entrada, veremos la funcionalidad gráfica que nos provee Pandas y cómo mezclarlo con las funciones de Matplotlib.
Encontrando tendencias con Pandas
EstándarUn aspecto muy importante en series de datos (como los datos usados en la entrada sobre correlación) son las tendencias. Las tendencias indican cambios graduales el comportamiento temporal el promedio en un período prolongado. Aunque medidas consecutivas puedan indicar valores que crecen o decrecen en sentidos opuestos a la tendencia general, el comportamiento promedio persiste en el tiempo.
Continuar leyendo
Correlando variables con Pandas
EstándarEn esta entrada, veremos una aplicación práctica de la librería Pandas al análisis de datos. Para ello, usaremos un objeto DataFrame en el que cargarems los contenidos de un archivo CSV que contiene datos de medida de una celda de flotación.
Continuar leyendo
Crear objetos DataFrame desde bases de datos SQL
EstándarEn una entrada anterior describimos cómo cargar datos desde un archivo CSV. En esta entrada, veremos cómo cargar los contenidos de una tabla SQL el un DataFrame.
Continuar leyendo
Leer y escribir archivos CSV con Pandas
EstándarEl formato CSV (Comma Separated Values) es un método muy extendido y simple para compartir datos. Son archivos
de texto que contienen una tabla de datos, en las que cada línea es una fila y en cada fila, cada valor se asigna a una columna
mediante un separador.
Continuar leyendo
El objeto DataFrame en Pandas
EstándarEn la entrada anterior vimos la clase Series de Pandas, que representa vectores de datos y se asemeja a una columna de una hoja de cálculo de Excel. Siguiendo con esa analogía, la clase DataFrame representa una hoja de cálculo completa, en la que cada columna es un objeto Series.
Continuar leyendo
Series de datos en Pandas
EstándarEn esta entrada, haremos una breve (brevísima) introducción a la clase Series de Pandas. Es la estructura más simple que proporciona Pandas, y se asemeja a una columna en una hoja de cálculo de Excel.
Continuar leyendo
Introducción a Pandas
EstándarEn esta entrada, daré una pequeña introducción a Pandas, una librería que he usado durante el último año para mis tareas de análisis de datos.
Pandas trae la simplicidad y elegancia de Python al análisis de datos. Es parte de la colección de librerías científicas Scipy.
Continuar leyendo