import seaborn as sns
import matplotlib.pyplot as plt

# cargamos el conjunto de datos iris
df_iris = sns.load_dataset('iris')
df_iris.head()


# primero especificamos el conjunto de datos (data=)
# y despues definimos las variables del eje x y el eje y
sns.scatterplot(data=df_iris, x='petal_width', y='petal_length')
plt.show()


# conjunto de datos: data=
# variable categorica: x=
sns.countplot(data=df_iris, x='species')
plt.show()


sns.scatterplot(data=df_iris, x='petal_width', y='petal_length', hue='species')
plt.show()


sns.scatterplot(data=df_iris, x='petal_width', y='petal_length', 
                hue='species',
                # cambiaremos el orden en el que se muestran
                # las etiquetas 
                hue_order=['virginica', 'setosa', 'versicolor'])
plt.show()


# diccionario
dict_color = {'setosa': 'blue',
              'versicolor': 'red',
              'virginica': 'green'}

sns.scatterplot(data=df_iris, x='petal_width', y='petal_length', 
                hue='species',
                # cambiaremos el orden en el que se muestran
                # las etiquetas 
                hue_order=['virginica', 'setosa', 'versicolor'],
                # cambiamos los colores
                palette=dict_color)
plt.show()


sns.relplot(data=df_iris, x='petal_width', y='petal_length', 
            hue='species',
            palette=dict_color,
            kind='scatter')
plt.show()


sns.relplot(data=df_iris, x='petal_width', y='petal_length', 
            hue='species',
            palette=dict_color,
            kind='scatter',
            # obtendremos un diagrama de dispersion por especie
            # organizados por columnas
            col='species')
plt.show()


sns.relplot(data=df_iris, x='petal_width', y='petal_length', 
            hue='species',
            palette=dict_color,
            kind='scatter',
            # obtendremos un diagrama de dispersion por especie
            # organizados por filas
            row='species')
plt.show()


df_tips = sns.load_dataset('tips')
df_tips


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            kind='scatter',
            # hora del dia (almuerzo o cena)
            row='time',
            # estado del fumador
            col='smoker')
plt.show()


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            kind='scatter',
            # hora del dia (almuerzo o cena)
            col='day')
plt.show()


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            kind='scatter',
            # hora del dia (almuerzo o cena)
            col='day',
            # configuramos 2 graficos por fila
            col_wrap=2)
plt.show()


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            kind='scatter',
            # hora del dia (almuerzo o cena)
            col='day',
            # configuramos 2 graficos por fila
            col_wrap=2,
            # cambiamos el orden en el que se muestran
            # los graficos
            col_order=['Sun', 'Sat', 'Fri', 'Thur'])
plt.show()


df_tips.head()


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            # aumentamos el tamagnio de los puntos
            # con base en la columna size
            size='size',
            kind='scatter')
plt.show()


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            # aumentamos el tamagnio de los puntos
            # con base en la columna size
            size='size',
            # configuramos el color de acuerdo a la columna
            # size
            hue='size',
            kind='scatter')
plt.show()


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            # cambiamos el tipo de puntos
            # con base en la columna smoker
            style='smoker',
            # configuramos el color de acuerdo a la columna
            # smoker
            hue='smoker',
            kind='scatter')
plt.show()


sns.relplot(data=df_tips, x='total_bill', y='tip', 
            # cambiamos el tipo de puntos
            # con base en la columna smoker
            style='smoker',
            # configuramos el color de acuerdo a la columna
            # smoker
            hue='smoker',
            # haremos mas transparentes los puntos
            alpha=0.4,
            # y podemos cambiar los colores como habiamos visto
            # antes
            palette={'Yes': 'red', 'No': 'blue'},
            kind='scatter')
plt.show()


# Importacione necesaria
import yfinance as yf

# Accedemos a la informacion de apple con la funcion Ticker()
# donde dentro de dicha funcion colocamos la clave de apple
apple = yf.Ticker('aapl')

# Extraemos la informacion de los precios diarios (interval='1d')
# del 2016-01-01 al 2021-05-10 y reseteamos el indice por defecto.
# Cabe resaltar que lo que obtenemos de la funcion history() es
# un dataframe
df_apple = apple.history(interval='1d', start='2016-01-01', end='2021-05-10').reset_index()
df_apple.head()


# volvemos a resetear el indice
df_apple = df_apple.reset_index()


df_apple.head()


sns.relplot(data=df_apple, x='index', y='Open', 
            kind='scatter')
plt.show()


sns.relplot(data=df_apple, x='index', y='Open', 
            # cambiamos ahora a kind='line'
            kind='line')
plt.show()


# Por simplicidad solo nos quedaremos con las siguientes columnas
df_apple = df_apple[['index', 'Date', 'Open']]
df_apple.head()


def info_acciones(clave):
    # accedemos a la informacion de la compañia dependiendo
    # de la clave
    comp = yf.Ticker(clave)
    # Extraemos la informacion de los precios diarios (interval='1d')
    # del 2016-01-01 al 2021-05-10 y reseteamos el indice por defecto.
    # Cabe resaltar que lo que obtenemos de la funcion history() es
    # un dataframe
    df = comp.history(interval='1d', start='2016-01-01', end='2021-05-10').reset_index()
    # volvemos a resetear el indice
    df = df.reset_index()
    # Por simplicidad solo nos quedaremos con las siguientes columnas
    df = df[['index', 'Date', 'Open']]
    # Retornamos el dataframe anterior
    return df


df_google = info_acciones('goog')
df_tesla = info_acciones('tsla')
df_microsoft = info_acciones('msft')

display(df_google.head(2))
display(df_tesla.head(2))
display(df_microsoft.head(2))


# El nombre de la columna nueva para cada dataframe debe ser el mismo
df_apple['Compañia'] = ['Apple' for i in range(df_apple.shape[0])]
df_google['Compañia'] = ['Google' for i in range(df_apple.shape[0])]
df_tesla['Compañia'] = ['Tesla' for i in range(df_apple.shape[0])]
df_microsoft['Compañia'] = ['Microsoft' for i in range(df_apple.shape[0])]


# veamos el dataframe de apple
df_apple.head()


import pandas as pd

df_gral = pd.concat([df_apple, df_google, df_tesla, df_microsoft])
df_gral.head()


df_gral = df_gral.reset_index()[['index', 'Date', 'Open', 'Compañia']]
df_gral.head()


# Vemos que tenemos 1346 registros por cada compañia
df_gral.value_counts('Compañia')

Compañia
Apple        1346
Google       1346
Microsoft    1346
Tesla        1346
dtype: int64


# los nombres de las columna
df_gral.columns

Index(['index', 'Date', 'Open', 'Compañia'], dtype='object')


# cambiamos el nombre de la columna index por id
df_gral = df_gral.rename(columns={'index': 'id'})

# veamos que tenemos 4 valores para cada id
df_gral[df_gral.id == 0]


sns.relplot(data=df_gral, x='id', y='Open',
            # configuracion de acuerdo a la columna
            # Compañia
            style='Compañia',
            hue='Compañia',
            kind='line')
plt.show()


sns.relplot(data=df_gral, x='id', y='Open',
            # configuracion de acuerdo a la columna
            # Compañia
            style='Compañia',
            hue='Compañia',
            # mostramos los puntos
            markers=True,
            kind='line')
plt.show()


sns.relplot(data=df_gral, x='id', y='Open',
            # configuracion de acuerdo a la columna
            # Compañia
            style='Compañia',
            hue='Compañia',
            # mostramos los puntos
            markers=True,
            # configuramos para que no se vean los 
            # estilos de lineas
            dashes=False,
            kind='line')
plt.show()


# veamos que tenemos 4 valores para cada id
df_gral[df_gral.id == 0]


# veamos que tenemos 4 valores para cada id
df_gral[df_gral.id == 1]


sns.relplot(data=df_gral, x='id', y='Open',
            kind='scatter')
plt.show()


sns.relplot(data=df_gral, x='id', y='Open',
            kind='line')
plt.show()


sns.relplot(data=df_gral, x='id', y='Open',
            ci='sd',
            kind='line')
plt.show()


sns.relplot(data=df_gral, x='id', y='Open',
            ci=None,
            kind='line')
plt.show()

	sepal_length	sepal_width	petal_length	petal_width	species
0	5.1	3.5	1.4	0.2	setosa
1	4.9	3.0	1.4	0.2	setosa
2	4.7	3.2	1.3	0.2	setosa
3	4.6	3.1	1.5	0.2	setosa
4	5.0	3.6	1.4	0.2	setosa

	total_bill	tip	sex	smoker	day	time	size
0	16.99	1.01	Female	No	Sun	Dinner	2
1	10.34	1.66	Male	No	Sun	Dinner	3
2	21.01	3.50	Male	No	Sun	Dinner	3
3	23.68	3.31	Male	No	Sun	Dinner	2
4	24.59	3.61	Female	No	Sun	Dinner	4
...	...	...	...	...	...	...	...
239	29.03	5.92	Male	No	Sat	Dinner	3
240	27.18	2.00	Female	Yes	Sat	Dinner	2
241	22.67	2.00	Male	Yes	Sat	Dinner	2
242	17.82	1.75	Male	No	Sat	Dinner	2
243	18.78	3.00	Female	No	Thur	Dinner	2

	total_bill	tip	sex	smoker	day	time	size
0	16.99	1.01	Female	No	Sun	Dinner	2
1	10.34	1.66	Male	No	Sun	Dinner	3
2	21.01	3.50	Male	No	Sun	Dinner	3
3	23.68	3.31	Male	No	Sun	Dinner	2
4	24.59	3.61	Female	No	Sun	Dinner	4

	Date	Open	High	Low	Close	Volume
0	2016-01-04	23.484390	24.116072	23.344779	24.111494	270597600
1	2016-01-05	24.203049	24.225935	23.438622	23.507282	223164000
2	2016-01-06	23.015209	23.429466	22.857290	23.047251	273829600
3	2016-01-07	22.584929	22.916790	22.069970	22.074547	324377600
4	2016-01-08	22.555181	22.683348	22.145503	22.191277	283192000

	index	Date	Open	High	Low	Close	Volume
0	0	2016-01-04	23.484390	24.116072	23.344779	24.111494	270597600
1	1	2016-01-05	24.203049	24.225935	23.438622	23.507282	223164000
2	2	2016-01-06	23.015209	23.429466	22.857290	23.047251	273829600
3	3	2016-01-07	22.584929	22.916790	22.069970	22.074547	324377600
4	4	2016-01-08	22.555181	22.683348	22.145503	22.191277	283192000

Curso de introducción a la programación con Python¶

Contenido¶

Primeros pasos ¶

Diagrama de dispersión¶

Gráfico de conteo¶

Gráficos relacionales: replot() ¶

Diagramas de dispersión¶

Configuraciones de un gráfico¶

Gráficos de líneas ¶

Librería yfinance¶

Graficando precio de acciones¶

	index	Date	Open	Compañia
0	0	2016-01-04	23.484390	Apple
1	1	2016-01-05	24.203049	Apple
2	2	2016-01-06	23.015209	Apple
3	3	2016-01-07	22.584929	Apple
4	4	2016-01-08	22.555181	Apple