Introducción
La Analítica de Grafos es una subdisciplina de la Analítica (o Minería) de Datos que permite representar, analizar y visualizar información relacional en forma más clara. En los últimos tiempos ha incrementado su valor acompañando el crecimiento de análisis de redes sociales. Sin embargo, su utilización y potencial puede aplicarse en una gran variedad de temáticas como: detección de fraude, distintos tipos de redes, mercadeo, investigación científica, etc.
El estudio de los grafos tiene una trayectoria importante que combinada con la potencialidad de las herramientas propias de la minería puede ofrecer resultados sumamente interesantes, a fin de revelar rasgos y tendencias ocultas en los datos.
Dada la importancia y utilidad de esta disciplina dentro de la Ciencia de Datos, la Sociedad Colombiana de Estadística (SCE) realizará el curso Analítica de Grafos, el cual se llevará a cabo de forma virtual, los días 2, 9, 16, 23 y 30 de septiembre y el 7 de octubre de 2022, en el horario 5 – 8 p.m.
Objetivos
- Apropiar los conceptos básicos de grafos y practicar con herramientas genéricas de persistencia, análisis y visualización de grafos.
- Investigar el enriquecimiento de las técnicas tradicionales de Minería de Datos con el uso de indicadores propios de grafos y aplicarlas en casos de estudio.
- Investigar nuevas aplicaciones de Minería en Datos en estructuras de grafos.
Temario
El temario sobre el cual se estructurarán las clases del curso está basado en:
- Conceptos básicos de grafos: indicadores de relación; patrones en grafos; búsquedas en grafos; implementación de bases de persistencia orientadas a grafos.
- Aplicación de indicadores de relaciones en prácticas de Analítica de Datos: a partir de la generación de indicadores de relación de una representación de entidades en una base de grafos, enriquecer las prácticas tradicionales de Minería de Datos.
- Aplicación de nuevas técnicas de Minería de Grafos para diversos problemas como segmentación y reconocimiento de patrones en diversas temáticas como, por ejemplo: lenguaje natural, redes sociales, detección de relaciones particulares en diferentes negocios, etc.
No se incluye en el temario:
- Técnicas de modelado de grafos.
- Técnicas de uso de base de datos orientadas a grafos como medio de persistencia de sistemas transaccionales.
Modalidad
El curso tendrá una fuente orientación práctica. Se brindará a los participantes herramientas, guías y prácticas para aplicar los conceptos básicos con software específico y datos de interés general.
El curso está estructurado en seis clases virtuales sincrónicas, de tres horas cada una para las exposiciones. Eventualmente se podrá recurrir a una clase pregrabada.
Se desarrollará al finalizar el curso un evento de cierre para la presentación de los trabajos finales.
Cada participante deberá dedicar además una carga horaria semejante para el desarrollo de las prácticas.
Se aportará bibliografía general y específica para el estudio de los distintos temas y conjuntos de datos para el desarrollo de los ejercicios.
Evaluación
La evaluación estará basada en la exposición, compleción y calidad del informe desarrollada sobre un Trabajo Práctico Integrador (TPI).
Perfil de los participantes
Profesionales que quieran profundizar en las técnicas modernas de persistencia y análisis de datos: científicos de datos, informáticos, estadísticos, actuarios, sociólogos, politólogos, físicos, biólogos, matemáticos, médicos sanitaristas, etc.
Requisitos para los participantes
Para participar en este curso es deseable conocimientos básicos de:
- Lenguajes de consulta a base de datos (tipo SQL).
- Programación (idealmente Python en entorno Anaconda).
- Algoritmos básicos de Aprendizaje Automático (Árboles de Decisión, Bayesianos y KNN).
Programación
Clase
1.
Tema
Aspectos conceptuales de grafos
Descripción
Conceptos básicos de grafos.
Experimentación de persistencia en una base de datos orientada a grafos (BOG) de un dataset, visualización y consultas básicas.
Actividad
Práctica1
Instalación de Neo4j
2.
Métricas sobre grafos
Principales métricas sobre grafos y su aplicación.
Práctica2
3.
Enriquecimiento de datasets para minería
Obtención de indicadores propios de grafos para enriquecer un dataset y aplicar métodos tradicionales de minería.
Práctica3
Entrega del Enunciado TPI
4.
Subgrafos
Algoritmos para generación de patrones en grafos. Búsqueda de subgrafos frecuentes y extraños.
Práctica4
5.
Análisis de comunidades
Aplicación de técnicas propias de análisis de comunidades.
Práctica5
6.
Cierre
Presentación de los trabajos integradores.
Entrega TPI resuelto
Horario
Las clases se realizarán el 2, 9, 16, 23 y 30 de septiembre y el 7 de octubre de 2022, en el horario de 5 a 8 p.m.
El evento de cierre se realizará en día y horario a convenir.
Docentes
Vanina Beraudo
Integra el equipo de Analítica de Datos de la Administración Federal de Ingreso Públicos de la Argentina. También se ha desempeñado como especialista en Minería de Datos en la Subdirección General de Sistemas y Telecomunicaciones de la misma institución. Ha realizado diversas presentaciones sobre aspectos de Minería de Datos en el ámbito fiscal, así mismo, participa como docente del curso de Minería de Datos para el personal de AFIP.
Magister en Explotación de Datos y Descubrimiento del Conocimiento de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, Argentina. Licenciada en Sistemas de Información por UN Luján.
Néstor Coppolillo
Tiene experiencia profesional en proyectos orientados a la gestión de las bases de datos y Data Mining en el ámbito del sector público. Es docente de posgrado en Ciencia de Datos y trabaja en la generación de contenidos de una especialización en Data Science. Así también, participa como docente en distintos cursos de Data Mining ofrecidos en instituciones públicas y privadas.
Especialista en Explotación de Datos y Descubrimiento del Conocimiento por la Universidad de Buenos Aires, Argentina. Licenciado en Ciencias de la Computación por la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, Argentina.
Eduardo Poggi
Cuenta con 40 años de experiencia profesional en proyectos de Tecnología de la Información fundamentalmente orientada al sector público latinoamericano. En la última década se orientó a la gestión de datos públicos: Datos Abiertos, Interoperabilidad y Ciencia de datos. Acredita más 30 años de docencia de grado y posgrado en: Aprendizaje Automático, Analítica / Ciencia / Minería de Datos y gestión de TI Pública en general. Actualmente se desempeña como asesor en la Dirección de Analítica de Datos de la Administración Federal de Ingreso Públicos de la Argentina, docente de posgrado y consultor internacional.
Magister en Administración y Políticas Públicas y Especialista en Negocios y Tecnología por la Universidad de San Andrés, Argentina. Licenciado en Ciencias de la Computación por la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, Argentina.
Costos y formas de pago
Participante
Costo (COP)
Estudiante
$165.000
Miembro de la Sociedad Colombiana de Estadística (SCE)
$135.000
Miembro de otras Sociedades de Estadística
$265.000
Particular
$375.000
El pago de la inscripción se debe realizar en la Cuenta de Ahorros 016670445671 del Banco Davivienda, a nombre de la Sociedad Colombiana de Estadística (SCE).
Para pagos desde el exterior el código SWIFT es: CAFECOBB