import seaborn as sns

# Cargamos el conjunto de datos
df = sns.load_dataset('iris')

# graficamos el diagrama de tira.
# x: variable categorica
# y: variable continua
ax = sns.stripplot(data=df, x='species',
                   y='sepal_length')


# Podemos agregar un poco de ruido a los puntos
# con el parametro jitter
ax = sns.stripplot(data=df, x='species',
                   y='sepal_length',
                   jitter=True)


# Graficamos el diagrama de tira
ax1 = sns.stripplot(data=df, x='species',
                   y='sepal_length', 
                   # tamanio de los puntos
                   size=7,
                   # contorno de los puntos
                   linewidth=1,
                   # transparencia
                    alpha=0.7,
                   jitter=True)
# graficamos el boxplot
ax2 = sns.boxplot(data=df, x='species',
                   y='sepal_length')


# Diagrama de enjambre
ax = sns.swarmplot(data=df, x='species',
                   y='sepal_length')


# grafico de violin
ax = sns.violinplot(data=df, x='species',
                   y='sepal_length')


ax = sns.boxenplot(data=df, x='species',
                   y='sepal_length')


ax = sns.regplot(data=df, x='petal_width',
                y='petal_length',
                 # establecemos el tipo de punto
                marker='*')


ax = sns.regplot(data=df, x='petal_width',
                y='petal_length',
                order=2)


ax = sns.regplot(data=df, x='petal_width',
                y='petal_length',
                 # Comportamiento cubico
                order=3)


ax = sns.residplot(data=df, x='petal_width',
                y='petal_length')


# Importaciones necesarias
import pandas as pd
import random

# creamos los puntos para que sigan
# cierto comportamiento cuadratico
x = [i for i in range(-10,11) for j in range(40)]
y = [(i + random.random()) ** 2 for i in range(-10,11) for j in range(40)]

# Creamos un dataframe
df_2 = pd.DataFrame({'x': x, 'y': y})
df_2


# Graficamos el diagrama de dispersion
ax = sns.relplot(data=df_2, x='x', y='y', kind='scatter')


ax = sns.residplot(data=df_2, x='x',
                y='y')


ax = sns.regplot(data=df_2, x='x',
                y='y')


# Configuramos un orden de 2
ax = sns.regplot(data=df_2, x='x',
                y='y',
                order=2)


ax = sns.residplot(data=df_2, x='x',
                y='y',
                order=2)


import numpy as np

# Simulamos los totales de las ventas
num_ventas = np.random.randint(1, 100, 60).reshape(12, 5)
num_ventas

array([[93, 30, 74, 64, 46],
       [82,  7, 99, 45, 16],
       [ 6, 82, 85, 51, 82],
       [93, 30, 50, 30, 84],
       [24, 88, 31, 25, 46],
       [ 3, 76,  5, 42, 52],
       [92, 56, 44,  8, 67],
       [88, 11, 30, 64, 40],
       [30, 24, 38, 17, 74],
       [74,  8, 28, 99,  9],
       [31, 91, 39, 91, 77],
       [82,  3, 99, 39, 45]])


# Creamos una lista con los meses del agnio
meses = ["ene", "feb", "mar", "abr", "may", 
         "jun", "jul", "ago", "sep", "oct", 
         "nov", "dic"]

# Creamos el dataframe:
#                               las columnas seran del 2017
#                               al 2022
df_v = pd.DataFrame(num_ventas, columns = np.arange(2017, 2022),
                    # el indice del dataframe seran los meses
                    index = meses)
df_v


ax = sns.heatmap(df_v)


# Podemos hacer que en cada rectangulo se vea el valor
# que le corresponde con annot=True
ax = sns.heatmap(df_v, annot=True)


# Podemos cambiar la paleta de color con cmap=
ax = sns.heatmap(df_v, cmap='Blues',
                 annot=True)


ax = sns.heatmap(df_v, fmt='d',
                 cbar=False)


# Podemos aumentar el tamagnio de las lineas que
# separan a los rectangulos
ax = sns.heatmap(df_v, linewidths=.5)


fig, (ax0, ax1) = plt.subplots(nrows=1, ncols=2, figsize=(12,6))

g1 = sns.heatmap(df_v, cmap='Blues', ax=ax0)
g2 = sns.heatmap(df_v, cmap='Blues',
                 center=df_v.loc['oct', 2020],
                 ax=ax1)
# Titulos
g1.set(title='Normal')
g2.set(title='Cambio de centro')

plt.show()


ax = sns.heatmap(df_v, cmap='Blues',
                 center=df_v.loc['dic', 2018])


df.corr(method='pearson')


ax = sns.heatmap(df.corr(method='pearson'),
                linewidth=0.2)

	x	y
0	-10	93.456814
1	-10	82.899819
2	-10	85.589977
3	-10	84.282628
4	-10	98.856297
...	...	...
835	10	101.432297
836	10	113.053408
837	10	103.559355
838	10	113.799052
839	10	108.740252

	sepal_length	sepal_width	petal_length	petal_width
sepal_length	1.000000	-0.117570	0.871754	0.817941
sepal_width	-0.117570	1.000000	-0.428440	-0.366126
petal_length	0.871754	-0.428440	1.000000	0.962865
petal_width	0.817941	-0.366126	0.962865	1.000000

Curso de introducción a la programación con Python¶

Contenido¶

Gráficos para variables categóricas ¶

Gráfico de tira o stripplot¶

Gráfico de enjambre¶

Gráfico de violín¶

Boxenplot¶

Gráficos de regresión ¶

Gráficos de residuales¶

Matriz de gráficos ¶

Mapa de calor¶

	2017	2018	2019	2020	2021
ene	93	30	74	64	46
feb	82	7	99	45	16
mar	6	82	85	51	82
abr	93	30	50	30	84
may	24	88	31	25	46
jun	3	76	5	42	52
jul	92	56	44	8	67
ago	88	11	30	64	40
sep	30	24	38	17	74
oct	74	8	28	99	9
nov	31	91	39	91	77
dic	82	3	99	39	45

	2017	2018	2019	2020	2021
ene	93	30	74	64	46
feb	82	7	99	45	16
mar	6	82	85	51	82
abr	93	30	50	30	84
may	24	88	31	25	46
jun	3	76	5	42	52
jul	92	56	44	8	67
ago	88	11	30	64	40
sep	30	24	38	17	74
oct	74	8	28	99	9
nov	31	91	39	91	77
dic	82	3	99	39	45

	2017	2018	2019	2020	2021
ene	93	30	74	64	46
feb	82	7	99	45	16
mar	6	82	85	51	82
abr	93	30	50	30	84
may	24	88	31	25	46
jun	3	76	5	42	52
jul	92	56	44	8	67
ago	88	11	30	64	40
sep	30	24	38	17	74
oct	74	8	28	99	9
nov	31	91	39	91	77
dic	82	3	99	39	45