Dibujar gráficas es una parte esencial del análisis de datos; no sólo para presentar los resultados finales, sino también para entender mejor lo que tenemos entre manos. Como se vió en la entrada anterior, Pandas tiene un subsistema de representación gráfica muy práctico. Sin embargo, a veces los gráficos simples que produce este subsistema son insuficientes para una visualización más completa y profunda. Aquí es donde entra Seaborn, dándonos una serie de representaciones gráficas orientadas a la visualización de conjuntos de datos complejos y con especial atención a la claridad.
Dibujando gráficas con Pandas
EstándarEn esta entrada, veremos la funcionalidad gráfica que nos provee Pandas y cómo mezclarlo con las funciones de Matplotlib.
Decorando gráficos en Matplotlib
EstándarEn la última entrada, dimos una breve introducción a Matplotlib dibujando tres tipos básicos de gráfica (una gráfica de líneas, una de barras y una de sectores). No obstante, los resultados podrían ser visualmente muy mejorables.
Continuar leyendo
Introducción a Matplotlib
EstándarEn la entrada anterior, dimos una introducción a las librerías disponibles para representar gráficas en Python. En esta entrada veremos el funcionamiento básico de la primera librería propuesta, Matplotlib. Concretamente, crearemos tres tipos de gráficas: una gráfica de líneas, una de barras y una circular.
Continuar leyendo
Librerías para dibujar gráficas en Python
Estándar
En esta entrada haremos un repaso rápido de las posibilidades que nos da Python para dibujar gráficas. Ni mucho menos es una guía completa (eso lo encontraremos aquí), sino una introducción para empezar a utilizar gráficos en análisis de datos. La visualización de datos juega un papel central en lo que se conoce como data science (literalmente ciencia de los datos, que aquí llamaremos análisis de datos). Las gráficas son la interfaz entre los datos y el analista de datos.
Introducción a Jupyter (IPython Notebook)
EstándarEn esta entrada, vamos a conocer una de las herramientas más útiles de Python: Jupyter (anteriormente conocido como IPython Notebook). La descripción a simple vista muestra una herramienta muy simple: es un intérprete de Python que funciona con celdas independientes de código y texto libre en un navegador web.
Continuar leyendo
Encontrando tendencias con Pandas
EstándarUn aspecto muy importante en series de datos (como los datos usados en la entrada sobre correlación) son las tendencias. Las tendencias indican cambios graduales el comportamiento temporal el promedio en un período prolongado. Aunque medidas consecutivas puedan indicar valores que crecen o decrecen en sentidos opuestos a la tendencia general, el comportamiento promedio persiste en el tiempo.
Continuar leyendo
Correlando variables con Pandas
EstándarEn esta entrada, veremos una aplicación práctica de la librería Pandas al análisis de datos. Para ello, usaremos un objeto DataFrame en el que cargarems los contenidos de un archivo CSV que contiene datos de medida de una celda de flotación.
Continuar leyendo
Crear objetos DataFrame desde bases de datos SQL
EstándarEn una entrada anterior describimos cómo cargar datos desde un archivo CSV. En esta entrada, veremos cómo cargar los contenidos de una tabla SQL el un DataFrame.
Continuar leyendo
Leer y escribir archivos CSV con Pandas
EstándarEl formato CSV (Comma Separated Values) es un método muy extendido y simple para compartir datos. Son archivos
de texto que contienen una tabla de datos, en las que cada línea es una fila y en cada fila, cada valor se asigna a una columna
mediante un separador.
Continuar leyendo