Curso de introducción a la programación con Python¶

    Autor: Luis Fernando Apáez Álvarez
    -Curso PyM-
    Tarea 3: Profundizando en Pandas
    Fecha: 30 de noviembre del 2022

En esta tarea practicarás los conceptos vistos en clase. Para ello trabajaremos con el sigueinte conjunto de datos

In [5]:
# importacion para no ver las advertencias
import warnings
warnings.filterwarnings('ignore')

# seaborn es una libreria de graficacion como matplotlib, pero ademas
# esta tiene conjunto de datos
from seaborn import load_dataset

# cargamos el conjunto de datos que utilizaremos
df = load_dataset('tips')
df.head()
Out[5]:
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4

Ahora bien, lo que deberás de hacer es:

  1. Crea un nuevo dataframe a partir de df cuyo índice sean las columnas tip y sex. Dado que ese dataframe nuevo tiene dos columnas como índices, entonces para acceder a la información de una fila mediante loc[] necesitarás pasar una tupla ( <valor_tip>, <valor_sex>). Escribe el código adecuado, con base en lo dicho anteriormente, para que se muestre en salida lo siguiente
In [6]:
# escribe aqui el codigo para obtener lo que se te pide, para
# tip = 1.01 y
# sex = 'Female'
Out[6]:
total_bill smoker day time size
tip sex
1.01 Female 16.99 No Sun Dinner 2
  1. Obtén la misma información que antes, pero ahora sólo considerando la columna day. Lo anterior lo deberás de obtener utilizando loc[].

  2. Crea un nuevo dataframe a partir del dataframe creado en el punto 1, reseteando el índice para tener de nuevo el índice original.

  3. Con base en el dataframe creado en el punto anterior, obtén los valores comprendidos entre las posiciones 10 y 25, considerando sólo las columnas 0 y 3- Deberás de utilizar iloc[] en este caso. ¿Puedes definir una manera diferente utilizando iloc[] para obtener la misma información que la que se te pidió antes?