Introducción a la Estadística y al Machine Learning









Descripción: En esta sección hallarás los videos grabados de las clases, así como los apuntes generados en las mismas. Adicionalmente encontrarás material complementario para cada clase, ejercicios, tareas y quizzes.
Para cada clase tendremos asociados tres videos: clase de la mañana (AM), clase de la tarde (PM) y clase sabatina.
Adicionalmente, estará el material para efectuar los diferentes proyectos guiados y las clases extras al final del curso.




Contenido



Índice
  1. Introducción a Python: Conceptos básicos
  2. Más de Python: Pandas
  3. Introducción a la inferencia estadística
  4. Regresión lineal simple y múltiple
  5. Regresión logística y modelos predictivos
  6. Introducción a las series de tiempo
  7. Introducción a las redes neuronales artificiales

Plataformas que ocuparemos:



Clase 1: Introducción a Python

En esta clase indagaremos en los conceptos más básicos de Python, tales como tipos de datos, vectores, condicionales y bucles. Asimismo, nos familarizaremos con el entorno de trabajo y las plataformas de Google colab y Kaggle.




Resumen y ejercicios Python Quiz

Clase 2: Manejo de datos y graficación

A lo largo de la clase aprenderemos a seleccionar información de un conjunto de datos, a realizar filtros y a crear dataframes, tanto en Python como R. Asimismo, en dichos lenguajes aprenderemos a realizar algunos gráficos básicos y a personalizarlos. Adicionalmente, veremos el tema de bucles y estructuras de datos.



Complemento: Notas de Pandas Complemento: Agrupaciones con Pandas Complemento R: Manejo de datos y graficación

Formulario y ejerciciio sobre Pandas

Clase 3: Introducción a la estadística y a la probabilidad

En esta clase adquiriremos mayor conocimiento y manejo de la librería Pandas, al abordar los temas de selecciones con loc e iloc. Asimismo, empezaremos a abordar las nociones básicas e intuitivas sobre la Teoría de la Probabilidad.



Práctica 1



Clase 4: Más de probabilidad, estadística y un vistazo a la regresión lineal

En esta clase terminaremos de indagar en los temas necesarios de probabilidad y estadística, los cuales nos abrirán las puertas para el tema de regresión lineal simple.





Formulario y ejercicios


Clase 5: Modelo de regresión lineal

En esta clase veremos el modelo estadístico de regresión lineal, desde su enfoque geométrico, las ideas intuitivas detrás de la recta de regresión hasta la implementación de código con Python de dos maneras diferentes: una, programando directamente las fórmulas con Python y dos, utilizando la librería sklearn.





Recordatorio: PDF completo del curso Práctica 4



Clase 6: Introducción a las series de tiempo

Veremos el concepto de proceso estocástico y a partir de él entraremos en el tema de series de tiempo. Asimismo, veremos los modelos del tipo ARIMA y su aplicación en el análisis de series de tiempo.





Pizarra Video complemento regresión lineal (2 hrs) Video complemento regresión logística (2 hrs)



Clase 7: Introducción a las redes neuronales artificiales

Indagaremos rápidamente en la teoría detrás de las redes neuronales artificiales y ajustaremos una red neuronal para realizar una tarea de clasificación. Veremos cómo definir una arquitectura de un modelo MLP y su implementación en Python utilizando la librería Keras.





EDA sobre dataset Titanic




Clase extra 1: Más sobre R

| Video de clase | Apunte de clase | Tarea |

Clase extra 2: Introducción a Power BI

| Video de clase | Apunte de clase | Tarea |

Clase extra 3: Introducción a la Programación orientada a objetos

| Video de clase | Apunte de clase | Tarea |

Clase extra 4: Introducción a SQL con Python

| Video de clase | Apunte de clase | Tarea |


Proyecto 1: Prediciendo la especie iris con regresión logística y redes neuronales

Descripción | Apunte auxiliar |

Proyecto 2 (Resuelto): Prediciendo el precio de una acción utilizando regresión lineal y redes neuronales

Descripción | Ejercicio |

Podría interesarte

Predicción del precio de apertura de las acciones de google utilizando redes neuronales modelo estándar y LSTM (Long Short Term Memory), además de la implementación de una regresión lineal. En el proyecto se realiza un análisis estadístico y se implementa un modelo GARCH. Además, se desarrolla un código para predecir los valores de : Open, High, Low y Close de las acciones de Google para el día siguiente y los siguientes t días.

Proyecto personal


Proyectos extra (con prerequisitos)


  1. Regresión lineal (Modelo teórico y predictivo):

  2. Algoritmos de Machine Learning y clustering:

  3. Random forest, regresión logística y redes neuronales;


Índice
  1. Introducción a la programación con Python
  2. Librería Pandas
  3. Introducción a SQL con SQLite
  4. Introducción a SQL con PostgreSQL
  5. Consultas avanzadas
  6. Proyecto

Introducción a la programación con Python

Clase 1: | Video de Clase |Notas de Clase | Tarea 1 |

Librería Pandas

Clase 2: | Video de Clase |Notas de Clase | Tarea 2 | Video extra |

Introducción a SQL con SQLite y PostgreSQL

Clase 3: | Video de Clase |Notas de Clase | Tarea 3 |

Introducción a SQL con PostgreSQL

Clase 4: | Video de Clase |Notas de Clase en Python | Código SQL de la clase | Tarea 4 |

Consultas avanzadas y joins

Clase 5.1: Creando datos falsos con Python | Video de Clase |Notas de Clase |

Clase 5.2: WHERE, HAVING, BETWEEN, LIKE, IN, JOINS | Video de Clase | Archivo SQL |

Proyecto

Proyecto | Descripción |


Índice:
  1. 1.