INFO
Curso: Introdução à Agrupamento de Dados com implementações em R
Carga Horária: 30h
Modalidade: Online
Turno/Horário: Segunda a Quinta | 18:00h às 21:00h
Período: 11/Dez a 21/Dez
Professor (a): Pablo Andretta Jaskowiak
Informações em:
https://bit.ly/ufba-tomorrow-dezembro
Inscrição em:
https://bit.ly/ufba-tomorrow-dezembro-form
NÍVEL DO CURSO
Intermediário.
OBJETIVOS DO CURSO
Apresentar os principais conceitos de agrupamento de dados
OBJETIVOS ESPECÍFICOS
Introduzir conceitos de agrupamento de dados
Discutir os principais paradigmas de agrupamento
Apresentar algoritmos de agrupamento particionais e hierárquicos
Discutir algoritmos de agrupamento do paradigma baseado em densidades
Apresentar técnicas de validação de agrupamentos de dados
Realizar implementações e experimentos computacionais em R utilizando as técnicas
QUEM PODE FAZER ESTE CURSO?
Qualquer pessoa com noções básicas de programação em alguma linguagem (não necessariamente R). As técnicas e métodos serão apresentadas em um contexto geral, com exemplos e podem ser aplicadas em diversas áreas.
POR QUE DEVO FAZER ESTE CURSO?
A quantidade de dados coletados e armazenados em meios eletrônicos cresce constantemente. Analisar, explorar e extrair conhecimento de grandes volumes de dados é um dos grandes desafios correntes. Técnicas de agrupamento de dados permitem encontrar padrões inerentes aos dados, auxiliando na sua sumarização e compreensão. Ao longo do curso serão abordadas técnicas clássicas de agrupamento de dados e sua validação. Este conhecimento é fundamental para qualquer pessoa que deseja fazer ciência de dados. Após o curso o estudante será capaz de aplicar algoritmos de agrupamento e interpretar seus resultados utilizando recursos e pacotes da linguagem de programação R.
EMENTA
Aprendizado de Máquina Supervisionado vs Aprendizado de Máquina não Supervisionado. Conceitos gerais de agrupamento de dados. Algoritmos de agrupamento particionais (k-means e k-medoids) e baseados em densidade (DBSCAN). Algoritmos de agrupamento hierárquicos aglomerativos (single, complete e average linkage) e divisivos. Construção e interpretação de dendrogramas. Medidas de (dis)similaridade e distância. Técnicas de validação de agrupamentos: critérios internos, relativos e externos. Determinação do número de grupos. Conceitos básicos da linguagem de programação R. Bibliotecas para agrupamento de dados em R. Utilização das técnicas e métodos em bases de dados sintéticas e reais.
SOBRE O PROFESSOR
Obteve o título de Bacharel em Informática pela UNIOESTE (2008). Seu mestrado e doutorado foram obtidos no ICMC/Universidade de São Paulo (USP), em 2011 e 2015, respectivamente. Durante o doutorado foi pesquisador visitante no CIn/UFPE (2012) e no Departamento de Ciência da Computação/Universidade de Alberta (2013-2014). Após o doutorado foi pós-doutorando no ICMC/Universidade de São Paulo (USP) (2015-2016), saindo para o cargo atual de professor efetivo (concursado) no Centro Tecnológico de Joinville - UFSC. Em 2022 foi pesquisador visitante financiado pelo DAAD no Costa Lab/RWTH Aachen University. Seus interesses de pesquisa são amplamente voltados para aprendizado de máquina e mineração de dados tanto no âmbito teórico (desenvolvimento de métodos) quanto suas aplicações.