domingo, 10 de diciembre de 2023

ANALISIS EXPLORATORIO DE DATOS – Ejemplo De EDA con JUpyter y Colab

 

¿Qué ventajas tiene utilizar Jupyter Notebook en la ciencia de datos? 

Jupyter Notebook permite integrar código, visualizaciones y explicaciones en un mismo lugar, lo que facilita la colaboración en equipos, la reproducibilidad de los resultados y la exploración interactiva de los datos.

Así mismo, estas son las principales ventajas de usar Google Colab en el ámbito del análisis de datos y la IA: Cuenta con bibliotecas de data science preinstaladas. Permite compartir documentos y colaborar de manera mucho más sencilla. Cuenta con integración con multitud de herramientas y también con GitHub.

Partiendo de los ejemplos propuestos de AD con DS:

/content/Analisis Ventas

/content/dataset_ventas.csv

una vez trasladado a Google Colab tendríamos:


import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Generar datos para el dataset

np.random.seed(0)
fechas = pd.date_range(start='2022-01-01', end='2022-12-31', freq='D')
cantidad_vendida = np.random.randint(1, 20, size=len(fechas))
precio_unitario = np.random.uniform(10, 100, size=len(fechas))

# Crear el DataFrame
df_ventas = pd.DataFrame({
    'Fecha': fechas,
    'Cantidad Vendida': cantidad_vendida,
    'Precio Unitario': precio_unitario
})

# Análisis de los datos
ventas_totales = df_ventas['Cantidad Vendida'] * df_ventas['Precio Unitario']
df_ventas['Ventas Totales'] = ventas_totales
resumen = df_ventas.describe()

# Gráfico de ventas totales por mes
df_ventas['Mes'] = df_ventas['Fecha'].dt.month
ventas_por_mes = df_ventas.groupby('Mes')['Ventas Totales'].sum()

plt.figure(figsize=(10, 6))
ventas_por_mes.plot(kind='bar')
plt.title('Ventas Totales por Mes')
plt.xlabel('Mes')
plt.ylabel('Ventas Totales')
plt.xticks(ticks=range(12), labels=['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio',
                                    'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre'],
           rotation=45)
plt.grid(True)
plt.tight_layout()


Análisis Básico de Ventas

En este notebook, hemos generado un dataset sintético de ventas y realizado un análisis básico. Se calculan las ventas totales y se muestra un resumen estadístico, junto con un gráfico de las ventas por mes.


https://www.blogger.com/blog/post/edit/5691884355340559673/460428542844855830



0 comentarios:

Publicar un comentario