Estadística, Probabilidad y Machine Learning









Descripción: En esta sección hallarás los videos grabados de las clases, así como los apuntes generados en las mismas. Adicionalmente encontrarás material complementario para cada clase.
Para cada clase tendremos asociados tres videos: clase de la mañana (AM), clase de la tarde (PM) y clase extra. En las clases extra veremos temas que no se trataron en las clases pero que son de suma importancia para el curso, de modo que éstos tienen un carácter obligatorio y son requisito para mantener el hilo de las clases posteriores.




Contenido



Índice
  1. Introducción a Python y a R: Conceptos básicos
  2. Introducción a Python y a R: Manejo de datos y graficación
  3. Algo de estadística
  4. Regresión lineal simple y múltiple
  5. Regresión logística y modelos predictivos
  6. Introducción a las series de tiempo
  7. Introducción a las redes neuronales artificiales

Plataformas que ocuparemos:



Clase 1: Introducción a Python y a R

En esta clase indagaremos en los conceptos más básicos de Python y R, tales como tipos de datos, vectores, condicionales y bucles. Asimismo, nos familarizaremos con el entorno de trabajo y las plataformas de Google colab y Kaggle.




Resumen Python Notas en Python ( del video extra) Notas en R (del video extra)

Clase 2: Manejo de datos y graficación en Python y en R

A lo largo de la clase aprenderemos a seleccionar información de un conjunto de datos, a realizar filtros y a crear dataframes, tanto en Python como R. Asimismo, en dichos lenguajes aprenderemos a realizar algunos gráficos básicos y a personalizarlos.





Notas en Python (del video extra) Notas en R (del video extra)

Clase 3: Introducción a la estadística y a la probabilidad

En esta clase veremos probabilidad clásica, variables aleatorias y algunas distribuciones. Adicionalmente, veremos un poco de estadística inferencial, intervalos de confianza y pruebas de hipótesis.







Tarea Práctica 1



Clase 4: Regresión lineal simple y múltiple

Con las herramientas de probabilidad y estadística que hemos visto, podemos comenzar a indagar en el tema de regresión lineal, el cual será fundamental para el resto del curso y para abordar posteriormente en modelos predictivos.

En la clase extra veremos el tema de regresión lineal múltiple (modelo predictivo) y también efectuaremos un análisis de supuestos de un modelo estadísticos de regresión lineal simple.







Notas en R (del video extra) Resumen de los temas teóricos Resumen de códigos Práctica 2


Clase 5: Regresión logística y modelos predictivos

Veremos el tema de regresión logística aplicada a modelos predictivos, asimismo, aprenderemos a realizar la evaluación de modelos de clasificación y a realizar predicciones.





Resumen regresión logística Práctica 3



Clase 6: Introducción a las series de tiempo

Veremos el concepto de proceso estocástico y a partir de él entraremos en el tema de series de tiempo. Asimismo, veremos los modelos del tipo ARIMA y su aplicación en el análisis de series de tiempo.





Pizarra



Clase 7: Introducción a las redes neuronales artificiales

Indagaremos rápidamente en la teoría detrás de las redes neuronales artificiales y ajustaremos una red neuronal para realizar una tarea de clasificación. Veremos cómo definir una arquitectura de un modelo MLP y su implementación en Python utilizando la librería Keras.





EDA sobre dataset Titanic




Clase extra 1: Análisis de supuestos de un modelos ARIMA y modelo Holt-Winters

| Video de clase | Apunte de clase (en Python) | Apunte de clase (en R) | Pizarrón (PDF) |

Clase extra 2: Modelo AR(p) a fondo

| Video de clase | Apunte de clase (en Python) | Apunte de clase (en R) | Pizarrón (PDF) |


Proyecto 1: Prediciendo la especie iris con regresión logística y redes neuronales

Descripción | Apunte auxiliar |

Proyecto 2 (Resuelto): Prediciendo el precio de una acción utilizando regresión lineal y redes neuronales

Descripción | Ejercicio |

Podría interesarte

Predicción del precio de apertura de las acciones de google utilizando redes neuronales modelo estándar y LSTM (Long Short Term Memory), además de la implementación de una regresión lineal. En el proyecto se realiza un análisis estadístico y se implementa un modelo GARCH. Además, se desarrolla un código para predecir los valores de : Open, High, Low y Close de las acciones de Google para el día siguiente y los siguientes t días.

Proyecto personal


Proyectos extra (con prerequisitos)


  1. Regresión lineal (Modelo teórico y predictivo):

  2. Algoritmos de Machine Learning y clustering:

  3. Random forest, regresión logística y redes neuronales;


Índice
  1. Introducción a la programación con Python
  2. Librería Pandas
  3. Introducción a SQL con SQLite
  4. Introducción a SQL con PostgreSQL
  5. Consultas avanzadas
  6. Proyecto

Introducción a la programación con Python

Clase 1: | Video de Clase |Notas de Clase | Tarea 1 |

Librería Pandas

Clase 2: | Video de Clase |Notas de Clase | Tarea 2 | Video extra |

Introducción a SQL con SQLite y PostgreSQL

Clase 3: | Video de Clase |Notas de Clase | Tarea 3 |

Introducción a SQL con PostgreSQL

Clase 4: | Video de Clase |Notas de Clase en Python | Código SQL de la clase | Tarea 4 |

Consultas avanzadas y joins

Clase 5.1: Creando datos falsos con Python | Video de Clase |Notas de Clase |

Clase 5.2: WHERE, HAVING, BETWEEN, LIKE, IN, JOINS | Video de Clase | Archivo SQL |

Proyecto

Proyecto | Descripción |