Se pretende que el alumno desarrolle sentido crítico estadístico, necesario en el ámbito empresarial. Se utilizan métodos estadísticos tradicionales como modelos de regresión, árboles de decisión o reducción de la dimensionalidad. También se imparten metodologías más recientes como Machine Learning y Deep Learning. Entre otros, se estudian Random Forest, K-Means, Procesamiento de Lenguaje Natural o Redes Neuronales.
Preparación y limpieza de los datos (2)
Análisis exploratorio de datos
Pre procesado de datos
Detección de ruido y de outliers.
Tratamiento de valores perdidos
Tratamiento del problema no balanceado
Datos estructurados y no estructurados
Evaluación de las distribuciones de las variables
Análisis estadístico de datos (8)
-
Revisión de probabilidad y variables aleatorias
-
Distribución Bernoulli, binomial, Poisson, binomial negativa, exponencial, normal.
-
Variables aleatorias multidimensionales. Densidad y masa conjunta. Distribuciones condicionales. Covarianza y correlación. Esperanza de un vector aleatorio, matriz de varianzas y covarianzas. Independencia de variables aleatorias.
-
Estadística inferencial. Muestra y población. Teorema central del límite. Estimación puntual y por intervalos. Estimadores de máxima verosimilitud. Booststrapping. Distribución t de Student y chi-cuadrado.
-
Contraste de hipótesis. Potencia, relación potencia, nivel de significación y tamaño muestral. Interpretación del valor p. Diferencia entre estadísticamente significativo y técnicamente importante.
-
Análisis de la varianza.
-
Regresión lineal múltiple y regresión logística
-
Análisis factorial y PCA
-
Series de tiempo
Machine Learning (6)
Aprendizaje supervisado vs. no supervisado. Reglas de clasificación, selección de variables y de modelos
K-means
Árboles de clasificación
Redes neuronales
Vecino más cercano
Naïve Bayes
Ensemblelearning.
Lenguaje Natural.
Deep Learning (3)
Redes neuronales avanzadas.
Markov random fields and Kalman Bucy Filters.
Cellular automation and discrete dynamical systems.
Partiendo de un nivel básico, se pretende que el alumno adquiera conocimientos medios-avanzados y sea capaz de seguir el resto de materias, así como desarrollar cierta autonomía para la fase de aprendizaje personal que precede al máster. Los lenguajes de programación impartidos son R y Python, por ser los más populares y demandados el ámbito profesional.
En este módulo se incluye la fase de extracción de datos, donde el alumno adquiere la capacitación de desenvolverse con bases de datos tradicionales, que por ahora son las más habituales en empresas. También se incluye el manejo de entornos propiamente entendidos como Big Data, como es Hadoop o Spark, y técnicas de recogida de datos en redes sociales como Twitter o Facebook, escrapeo de web o recogida de imágenes.
Por último, se abordarán las técnicas de visualización con las herramientas más demandadas actualmente por el entorno empresarial.
Python para análisis de datos (5)
-
Sintaxis y estructuras de datos.
-
Almacenamiento y manipulación de datos
-
Librerías Numpy, Pandas, Matplotlib y Seaborn
-
Proyectos
Bases de datos (2)
Estructura estática de las bases de datos.
Introducción
Modelo Entidad Relación
Modelo Relacional
Integridad Referencial
Álgebra Relacional
Teoría de SQL
Nuevos tipos de bases de datos.
Bases de datos NoSQL
Tipo documento: ElasticSearch.
Tipo grafo. Neo4J
Tipo columna: Cassandra.
Visualización (2)
Conceptos generales de visualización
Storytelling con datos
Plataformas comerciales para visualización
Técnicas de recogida de datos (2)
Data Management:
Master Data Management (MDM).
Extracción de datos en entornos similares a empresa (SQL, Hive).
Web scraping.
Imágenes.
Redes sociales.
Técnicas de Big Data (3)
Evolución de la arquitectura de computadores, Redes de computadoras, nacimiento del Big Data.
Paralelización (Paradigma MapReduce). Hadoop vs Spark.
Frameworks Big Data: Hortonworks, Cloudera, MapR, BDE.
Cloud computing como tecnología habilitadora de Big Data.
Acceso seguro a proveedores cloud. Nociones de configuración de red y seguridad.
Amazon Web Services y herramientas Big Data.
Herramientas Big Data de Google.
El Máster pretende dar una formación sólida en cuanto a conocimientos técnicos, pero también una visión de negocio, de modo que una vez que concluya el Máster los alumnos puedan actuar como un puente entre los niveles ejecutivo y técnico de un proyecto. De este modo se abordarán, de la mano de profesionales de empresas y multinacionales punteras, casos prácticos y de éxito, buscando aplicar conceptos adquiridos en los dos primeros módulos. Además, contamos con la colaboración de IESE Business School, la Escuela de Negocios de la Universidad de Navarra.
Gestión de proyectos (5)
Planificación de proyectos: identificación, definición y objetivos.
Metodologías Agile
Privacidad y transparencia. Ética de la inteligencia artifical.
Aplicación al capstone Project
Talleres con empresas (4)
Exposición de proyectos y casos reales por parte de empresas.
Método del caso.
Tiene un peso destacado en el programa. Se busca un enfoque práctico que a la vez dé solución a problemas y proyectos reales propuestos por empresas con las que existen acuerdos de colaboración. Puede ser codirigido tanto por éstas como por académicos de la Universidad de Navarra, y supone una excelente oportunidad para que los alumnos lideren la puestaen marcha de proyectosde impacto en su entorno profesional.
Trabajo Fin de Máster (18)
El TFM consistirá en un trabajo original en el que deberán ponerse en práctica las competencias adquiridas durante el Máster. Se podrá desarrollar en el marco de una empresa o institución que proponga un proyecto de recogida, limpieza, preparación, analítica avanzada y visualización de los resultados.
Se han de destacar aquellos aspectos éticos relativos al tratamiento de los datos, así como el impacto económico y social de los resultados. El alumno ha de demostrar que sabe planificar un proyecto y llevarlo a cabo en un entorno real de trabajo, de tal manera que adquiera una experiencia muy práctica en el ámbito de Data Science y Big Data.
Módulo Análisis de Datos (19 ECTS)
MATERIAS | ECTS | ASIGNATURAS |
---|---|---|
Estadística | 10 |
Preparación y limpieza de los datos (2) |
Machine Learning | 9 |
Machine Learning (6) |
ECTS | 10 |
ASIGNATURAS | Preparación y limpieza de los datos (2) |
ECTS | 9 |
ASIGNATURAS | Machine Learning (6) |
Módulo Programación y Computación (14 ECTS)
MATERIAS | ECTS | ASIGNATURAS |
---|---|---|
Preparación y recogida de datos | 7 |
Bases de datos (2) |
Programación | 7 |
ECTS | 7 |
ASIGNATURAS | Bases de datos (2) |
ECTS | 7 |
ASIGNATURAS |
Módulo Proyectos (9 ECTS)
MATERIAS | ECTS | ASIGNATURAS |
---|---|---|
Proyectos | 9 |
Gestión de proyectos y visión de negocio (5) |
ECTS | 9 |
ASIGNATURAS | Gestión de proyectos y visión de negocio (5) |
Módulo Trabajo Fin de Máster (18 ECTS)
MATERIAS | ECTS | ASIGNATURAS |
---|---|---|
Trabajo Fin de Máster | 18 |
ECTS | 18 |
ASIGNATURAS |