Jornadas de Bid Data - Primera jornada, viernes 24 de marzo de 2017

9:30-10:00 - Apertura de las Jornadas

10:00-10:45 - Experiencia Web Scrapping en recogida de información sobre hoteles.
Jorge Aramendi: y Javier San Vicente (Metodología, Innovación e I+D, EUSTAT)

EUSTAT presenta los resultados del que es su primer estudio de caso en el ámbito del Big Data. el proyecto ha consistido en el estudio de las series diarias de precios de habitaciones de hotel. Para llevar a cabo la captura de información se desarrolló un prototipo basado en tecnología web scrapping y se recogió la información sobre precios de habitaciones de hoteles ofertados en la web Booking.com. Se analizarán las ventajas e inconvenientes de la herramienta, contraste con el marco poblacional oficial y la comparación de los resultados obtenidos por la vía web scrapping con los resultados de la operación estadística ETR, así como una valoración sobre los procedimientos previstos para la incorporación de la información obtenida en la operación estadística y desarrollos futuros en el ámbito del Big Data.

10:45-11:00 - Descanso.

11:00-14:00 -  Taller de herramientas para el análisis de Big Data.
Enric Farguell Matesanz (Senior Manager del área de Data Science, EY, Barcelona)

Se verán algunas herramientas que se utilizan en el análisis de datos masivos. No es necesario llevar ordenador, aunque será interactivo, se mostrará el funcionamiento de algunas herramientas con ejemplos concretos.

  • Programa del taller

    1. Introducción a Big Data

      1. Historia, concepto, herramientas

      2. Conceptos básicos de modelado estadístico

    2. Ejemplos de caso de uso:

      1. Banca Retail – modelos de propensión a la compra

      2. Starbucks – Customer Lifetime Value y generalización de operativa comercial

      3. Amazon – análisis de cesta de la compra

      4. Facebook – selección de anuncios y retratos robot

      5. KING – clustering de clientes

      6. Google – motores de búsqueda

      7. Google – deep learning

    3. Ejemplo de herramienta: JMP

      1. Análisis visual

      2. Modelado

      3. Inferencia

    4. Ejemplo de herramienta visual: Tableau

    5. Ejemplo de herramienta de desarrollo: R y RShiny; casos de uso:

      1. Optimización de un Call Center

      2. Pricing dinámico

      3. Mantenimiento predictivo

      4. Optimización de carga de baterías y gestión inteligente de la energía

    • Las versiones que se usarán de JMP y Tableau serán las de demo, y se proporcionarán archivos de datos que permiten a la vez ejecutar el análisis. Esto permitirá a los alumnos reproducirlo y trabajar con ello, si se descargan el software.

    • R es gratis, pero no se compartirá el código por ser ejemplos de aplicaciones confidenciales.

      • Son ejemplos muy interesantes por estar en funcionamiento en el mundo real.

      • R es actualmente la herramienta más extendida en nuestro entorno, pero para desarrollar en R hay que saber programar.

14:15-15:00 -  Prototipo clasificador bayesiano para detectar fraude.
Pablo Urruchi (Everis, Londres)

Clasificador de texto bayesiano para reclamaciones y detección de fraude. ¿Cómo surge la necesidad de implementar esta herramienta? Situación actual del mercado. Por qué un modelo bayesiano, ventajas y desventajas. Ser hará funcionar el código.

Es imprescindible inscribirse para la asistencia al taller enviando un correo a ctduarte@unav.es.