Análisis de datos masivos con Talend Open Studio

Proceso ETL Big Data con Talend Studio

El 17 de febrero alcanzamos las 28 sesiones y celebramos el día del amor por el software libre (#ILOVEFS) con un reto que afrontaremos entre todxs: la herramienta libre Talend Open Studio de la mano de Rigo, analista de datos del ICIJ, Consorcio Internacional de Periodistas de Investigación y que está acostumbrado a trabajar con grandes volúmenes de datos en proyectos periodísticos de primerísima fila.

@JournocodersMAD es el de un encuentro de periodistas interesadxs en aprender programación mientras comparten trucos y consejos prácticos de código y siguen y actualizan pequeños tutoriales.

Fecha

17.02.2016 18:00 - 20:30 h

Lugar

Lugar: Medialab-Prado, C/. Alameda 15. 28014 Madrid. Auditorio (2ª planta/2nd Floor)

Programa

18:30-18:35 - Presentación de vigesimooctava sesión de #periodismodatos Journocoders Madrid.

Adolfo Antón Bravo (flowsta) y Adrián Blanco (Adrián Blanco) presentan la sesión de febrero de 2016 de #periodismodatos

18:35-18:40 - Presentación de asistentes

Al ser un encuentro eminentemente práctico, queremos conocer qué lenguajes o tecnologías interesan más para los próximos encuentros.

18:40-18:50 - Show&Tell

Qué artículos, reportajes, proyectos que mezclen periodismo y programación te han gustado en el último mes. Los compartiremos a través del hashtag periodismodatos

18:50-18:55 - Presentación de Talend Open Studio a cargo de Rigo de ICIJ

18:40-20:30 - Taller de Talend Open Studio

Imaginaos un programa que es capaz de cargar distintas archivos de datos de distintas fuentes, de realizar transformaciones a los datos como lo haríais con Refine, de mezclar esos datos e insertarlos en una base de datos y mostrara el resultado final con un informe del proceso. Ese es un ejemplo de lo que se puede hacer con Talend Open Studio y las herramientas ETL.

Las herramientas ETL sirven para:

  • Control de la extracción de los datos y su automatización
  • Acceso a diferentes tecnologías, haciendo un uso efectivo del hardware, software, datos y recursos.
  • Gestión integrada del Data Warehouse y los Data Marts, integrando la extracción, transformación y carga.
  • Uso de arquitectura de metadatos.
  • Acceso a variedad de fuentes de datos diferentes.
  • Posibilidad de excepciones.

Comentarios

  • Lxs asistentes deben traer su ordenador portátil para seguir el taller.
  • Es imprescindible traer descargado Talend Open Studio
  • Hay conexión WiFi disponible.
  • Puedes Utilizar el hashtag #periodismodatos para dar cobertura del evento o seguirlo desde fuera.

Enlaces de Journocoders

Archivos

Adolfo Antón Bravo
Adolfo Antón Bravo
Coordinador del Máster de Periodismo y Visualización de Datos de la Universidad de Alcalá

Periodismo y visualización de datos, web semántica, bash, emacs, orgmode

Relacionado