Introducción

La Analítica en Grafos es una subdisciplina de la Analítica (o Minería) de Datos que permite representar, analizar y visualizar información relacional en forma más clara. En los últimos tiempos ha incrementado su valor acompañando el crecimiento de análisis de redes sociales. Sin embargo, su utilización y potencial puede aplicarse en una gran variedad de temáticas como: detección de fraude, lavado de dinero, distintos tipos de redes, mercadeo, investigación científica, etc.

El estudio de los grafos tiene una trayectoria importante que combinada con la potencialidad de las herramientas propias de la minería puede ofrecer resultados sumamente interesantes, a fin de revelar rasgos y tendencias ocultas en los datos.

Dada la importancia y utilidad de esta disciplina dentro de la Ciencia de Datos, la Sociedad Colombiana de Estadística (SCE) realizará el curso Analítica de Grafos, el cual se llevará a cabo  de forma virtual, los días  2, 9, 16, 23 y 30 de septiembre y el 7 de octubre de 2022, en el horario 5 – 8 p.m.

Objetivos

  • Apropiar los conceptos básicos de grafos y practicar con herramientas genéricas de persistencia, análisis y visualización de grafos.
  • Investigar el enriquecimiento de las técnicas tradicionales de Minería de Datos con el uso de indicadores propios de grafos y aplicarlas en casos de estudio.
  • Investigar nuevas aplicaciones de Minería en Datos en estructuras de grafos.

Temario

El temario sobre el cual se estructurarán las clases del curso está basado en:

  • Conceptos básicos de grafos: indicadores de relación; patrones en grafos; búsquedas en grafos; implementación de bases de persistencia orientadas a grafos. 
  • Aplicación de indicadores de relaciones en prácticas de Analítica de Datos: a partir de la generación de indicadores de relación de una representación de entidades en una base de grafos, enriquecer las prácticas tradicionales de Minería de Datos.
  • Aplicación de nuevas técnicas de Minería de Grafos para diversos problemas como segmentación y reconocimiento de patrones en diversas temáticas como, por ejemplo: lenguaje natural, redes sociales, detección de relaciones particulares en diferentes negocios, etc. 
 

No se incluye en el temario: 

  • Técnicas de modelado de grafos.
  • Técnicas de uso de base de datos orientadas a grafos como medio de persistencia de sistemas transaccionales.

Modalidad

El curso tendrá una fuente orientación práctica. Se brindará a los participantes herramientas, guías y prácticas para aplicar los conceptos básicos con software específico y datos de interés general. 

El curso está estructurado en seis clases virtuales sincrónicas, de tres horas cada una para las exposiciones. Eventualmente se podrá recurrir a una clase pregrabada. 

Se desarrollará al finalizar el curso un evento de cierre para la presentación de los trabajos finales.

Cada participante deberá dedicar además una carga horaria semejante para el desarrollo de las prácticas.

Se aportará bibliografía general y específica para el estudio de los distintos temas y conjuntos de datos para el desarrollo de los ejercicios.

Evaluación

La evaluación estará basada en la exposición, compleción y calidad del informe desarrollada sobre un Trabajo Práctico Integrador (TPI).

Perfil de los participantes

Profesionales que quieran profundizar en las técnicas modernas de persistencia y análisis de datos: científicos de datos, informáticos, estadísticos, actuarios, sociólogos, politólogos, físicos, biólogos, matemáticos, médicos sanitaristas, etc.

Requisitos para los participantes

Para participar en este curso es deseable conocimientos básicos de:

  • Lenguajes de consulta a base de datos (tipo SQL).
  • Programación (idealmente Python en entorno Anaconda).
  • Algoritmos básicos de Aprendizaje Automático (Árboles de Decisión, Bayesianos y KNN).

Programación

Clase

1.

Tema

Aspectos conceptuales de grafos

Descripción

Conceptos básicos de grafos.
Experimentación de persistencia en una base de datos orientada a grafos (BOG) de un dataset, visualización y consultas básicas.

 

Actividad

Práctica1
Instalación de Neo4j

 

2.

Métricas sobre grafos

 

Principales métricas sobre grafos y su aplicación.

 

Práctica2

 

3.

Enriquecimiento de datasets para minería

Obtención de indicadores propios de grafos para enriquecer un dataset y aplicar métodos tradicionales de minería.

Práctica3
Entrega del Enunciado TPI

4.

Subgrafos

Algoritmos para generación de patrones en grafos. Búsqueda de subgrafos frecuentes y extraños.

Práctica4

5.

Análisis de comunidades

Aplicación de técnicas propias de análisis de comunidades.

 

Práctica5

6.

Cierre

Presentación de los trabajos integradores.

Entrega TPI resuelto

Horario

Las clases se realizarán el 2, 9, 16, 23 y 30 de septiembre y el 7 de octubre de 2022, en el horario de 5 a 8 p.m.
El evento de cierre se realizará en día y horario a convenir.

Docentes

Vanina Beraudo

Integra el equipo de Analítica de Datos de la Administración Federal de Ingreso Públicos de la Argentina. También se ha desempeñado como especialista en Minería de Datos en la Subdirección General de Sistemas y Telecomunicaciones de la misma institución. Ha realizado diversas presentaciones sobre aspectos de Minería de Datos en el ámbito fiscal, así mismo, participa como docente del curso de Minería de Datos para el personal de AFIP.

Magister en Explotación de Datos y Descubrimiento del Conocimiento de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, Argentina. Licenciada en Sistemas de Información por UN Luján.

Néstor Coppolillo

Tiene experiencia profesional en proyectos orientados a la gestión de las bases de datos y Data Mining en el ámbito del sector público. Es docente de posgrado en Ciencia de Datos y trabaja en la generación de contenidos de una especialización en Data Science. Así también, participa como docente en distintos cursos de Data Mining ofrecidos en instituciones públicas y privadas.

Especialista en Explotación de Datos y Descubrimiento del Conocimiento por la Universidad de Buenos Aires, Argentina. Licenciado en Ciencias de la Computación por la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, Argentina.

Eduardo Poggi

Cuenta con 40 años de experiencia profesional en proyectos de Tecnología de la Información fundamentalmente orientada al sector público latinoamericano. En la última década se orientó a la gestión de datos públicos: Datos Abiertos, Interoperabilidad y Ciencia de datos. Acredita más 30 años de docencia de grado y posgrado en: Aprendizaje Automático, Analítica / Ciencia / Minería de Datos y gestión de TI Pública en general. Actualmente se desempeña como asesor en la Dirección de Analítica de Datos de la Administración Federal de Ingreso Públicos de la Argentina, docente de posgrado y consultor internacional.

Magister en Administración y Políticas Públicas y Especialista en Negocios y Tecnología por la Universidad de San Andrés, Argentina.  Licenciado en Ciencias de la Computación por la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, Argentina.

Costos y formas de pago

Participante

Costo (COP)

Estudiante

$165.000 

Miembro de la Sociedad Colombiana de Estadística (SCE)

$135.000 

Miembro de otras Sociedades de Estadística

$265.000 

Particular

$375.000 

El pago de la inscripción se debe realizar en la Cuenta de Ahorros 016670445671 del Banco Davivienda, a nombre de la Sociedad Colombiana de Estadística (SCE).

Para pagos desde el exterior el código SWIFT es: CAFECOBB

Inscripciones