Idioma: ES
Fotos_portada_continuada-14.jpg

Curso Manejo de datos semiestructurados

Información General

Presentación

Manejo de datos semiestructurados

Fotos_portada_continuada-14.jpg click para reproducir video
Educación Continuada: programas abiertos y empresariales de educación no formal que optimizan el desempeño profesional.

¿Cómo manejar y analizar datos de Twitter para extraer información y conocimiento?

Los datos semiestructurados son aquellos que no tienen una estructura rígida, como sí la tienen los datos relacionales o tabulares.

Muchas compañías, especialmente las grandes como Twitter, almacenan la información en un formato semiestructurado porque es más flexible. Este tipo de datos tienen sus propias características y complejidades.

“Working with data doesn’t need to be hard”

https://www.mongodb.com/

Actualmente existen soluciones tecnológicas que facilitan el aprovechamiento de estos datos y generar valor en empresas. Aprender a utilizar estas tecnologías es crucial para hacerse camino dentro del mundo de la ciencia de los datos.

Conferencista Invitado

Cerrar

Sandra Ortega Martorell

Sandra Ortega Martorell - Julio Garavito

Ingeniera informática y máster en Informática de la Universidad Tecnológica de La Habana José Antonio Echeverría (Cujae), máster en Tecnología de la Computación de la Universidad de Alicante (España) y doctora en Ciencias de la Computación de la Universidad Autónoma de Barcelona (España), con distinción Suma Cum Laude y “Doctor Europeo”.

Actualmente es profesora del Departamento de Matemáticas de Liverpool John Moores University (Reino Unido).

Ganadora del premio a la joven promesa de la universidad en 2018. Es investigadora activa en el área de Machine Learning aplicado a temas de biomedicina, como por ejemplo en el diagnóstico y la segmentación de tumores cerebrales. Es editora académica de la revista Plos One, y pertenece al colegio de revisores del Consejo de Investigación Británico para Ingeniería y Ciencias Físicas.

Por qué estudiar con nosotros

edificio-h-nocturna.jpg

Adquirir habilidades de manejo de datos semiestructurados que permitan competir en entornos dominados por los datos, permitiendo y facilitando una toma de decisiones más estratégica, basada en el análisis y la interpretación de datos que fluyen constantemente y vuelven el entorno cambiante.

Metodología

La profesora dictará los contenidos necesarios y los respaldará con diapositivas en PowerPoint, e irá cambiando el estilo de enseñanza para mantener la motivación de los estudiantes y favorecer la comprensión del material. Esencialmente, dictará los conceptos necesarios y los explicará en detalle, seguido por la ejercitación de dichos contenidos en el computador.

Se llevarán a la discusión numerosos ejemplos del mundo real, y se presentarán otros cuantos para desarrollar habilidades en los temas abordados.

Deberes del participante

  • Contar con una conexión a internet de banda ancha.
  • Disponer de audífonos (diadema o manos libres) para aislar el ruido externo y lograr concentrarse.
  • Verificar que el equipo de cómputo no haya sido bloqueado para conexiones a herramientas de Microsoft.
  • En caso de ser miembro de Microsoft Teams con otra cuenta, cerrar las sesiones que involucren la cuenta en Microsoft Teams, e ingresar con un navegador libre de caché para que no tenga inconvenientes.
  • Conectarse a las sesiones de clase con mínimo 10 minutos de antelación de manera que verifique que cuenta con una conexión adecuada y no pierda clase por realizar ajustes.
  • Disponer de materiales como libreta, esfero, entre otros.

Certificación

El curso se desarrolla en 3 módulos, con un total de 24 horas de clase presenciales.

La Escuela Colombiana de Ingeniería Julio Garavito otorgará certificados de este curso, así:

  • De asistencia, a quienes se inscriban por educación continuada y participen activa y cumplidamente como mínimo en el 90 % de las sesiones programadas.
  • De contenido, créditos y nota a los estudiantes de pregrado o posgrado de la Escuela.
  • De contenido, créditos y nota a los estudiantes de pregrado o posgrado de otras universidades del país que se matriculen como estudiantes visitantes o de intercambio. Para esto deberán enviar la solicitud a la Oficina de Relaciones Internacionales (ori@escuelaing.edu.co) e indicar la universidad de origen y el programa que cursan.

Perfil del aspirante

Mujer profesional2.jpg
  • Estudiantes de posgrado, estudiantes de últimos semestres de pregrado, profesores universitarios y profesionales relacionados con las temáticas del curso o interesados en ellas.

Contenido temático

Módulo I –Cubrir todos los elementos esenciales requeridos (5 horas).

  • Datos semiestructurados: qué son y de dónde vienen.
  • Streaming data: qué es y por qué es diferente.
  • Lenguaje de consulta MongoDB.

Módulo II – Manejo de datos (10 horas).

  • Explorando y coleccionando streaming data.
  • Manejo de datos MongoDB.
  • Aprender y usar Python MongoDB (PyMongo).
  • Usando otras bibliotecas como TextBlob, WordCloud & CartoPy.

Módulo III –Información de datos semiestructurados (9 horas).

  • Consulta y extracción de información a partir de datos semiestructurados.

Fechas y horario

El curso se desarrollará entre el 5 al 9 de julio de 2022. Las clases se realizarán de martes a viernes de 4:00 a 9:00 p.m. y el sábado de 7:00 a 11:00 a.m., en el campus de la Escuela.

La Escuela Colombiana de Ingeniería, para sus programas de Educación Continuada, se reserva el derecho de cambiar sus conferencistas y fechas de realización, o cancelarlos de no contar con el número de personas requerido para tal fin. Lo anterior se informará a los interesados con antelación.

Objetivos alcanzables

El curso tiene como objetivo desarrollar habilidades prácticas en el manejo de datos semiestructurados utilizando técnicas novedosas que forman parte del entorno de Big Data.

Bloque-I-nocturna.jpg

  • Entender los conceptos esenciales para el manejo de datos semiestructurados.
_DSC4651.jpg

  • Realizar consultas de datos utilizando MongoDB Query Language, tanto directamente como utilizando Python (PyMongo).
_DSC0724.jpg

  • Recolectar datos (streaming data) y realizar análisis de datos apropiados usando MongoDB y librerías de última generación.

Valor de la inversión

edificio-h-nocturna.jpg

El valor de la inversión es de Un millón setecientos ochenta mil pesos moneda corriente ($1.780.000) por participante. Este valor incluye material técnico y memorias en medio electrónico.

Descuento del 5 % hasta el 21 de junio de 2022.

Inscripciones hasta el 28 de junio de 2022.

Solicite Información

Manejo de datos semiestructurados