Capacitação em Introdução à Agrupamento de Dados com implementações em R

Undefined

INFO  

Curso: Introdução à Agrupamento de Dados com implementações em R

Carga Horária: 30h

Modalidade: Online

Turno/Horário: Segunda a Quinta | 18:00h às 21:00h 

Período: 11/Dez a 21/Dez

Professor (a): Pablo Andretta Jaskowiak

 

Informações em:

https://bit.ly/ufba-tomorrow-dezembro

Inscrição em: 

https://bit.ly/ufba-tomorrow-dezembro-form

 

NÍVEL DO CURSO

Intermediário.

 

OBJETIVOS DO CURSO 

Apresentar os principais conceitos de agrupamento de dados

 

OBJETIVOS ESPECÍFICOS

Introduzir conceitos de agrupamento de dados

Discutir os principais paradigmas de agrupamento
Apresentar algoritmos de agrupamento particionais e hierárquicos

Discutir algoritmos de agrupamento do paradigma baseado em densidades

Apresentar técnicas de validação de agrupamentos de dados

Realizar implementações e experimentos computacionais em R utilizando as técnicas

 
 

QUEM PODE FAZER ESTE CURSO?

Qualquer pessoa com noções básicas de programação em alguma linguagem (não necessariamente R). As técnicas e métodos serão apresentadas em um contexto geral, com exemplos e podem ser aplicadas em diversas áreas.

 
 

POR QUE DEVO FAZER ESTE CURSO?

A quantidade de dados coletados e armazenados em meios eletrônicos cresce constantemente. Analisar, explorar e extrair conhecimento de grandes volumes de dados é um dos grandes desafios correntes. Técnicas de agrupamento de dados permitem encontrar padrões inerentes aos dados, auxiliando na sua sumarização e compreensão. Ao longo do curso serão abordadas técnicas clássicas de agrupamento de dados e sua validação. Este conhecimento é fundamental para qualquer pessoa que deseja fazer ciência de dados. Após o curso o estudante será capaz de aplicar algoritmos de agrupamento e interpretar seus resultados utilizando recursos e pacotes da linguagem de programação R. 

 

 

EMENTA

Aprendizado de Máquina Supervisionado vs Aprendizado de Máquina não Supervisionado. Conceitos gerais de agrupamento de dados. Algoritmos de agrupamento particionais (k-means e k-medoids) e baseados em densidade (DBSCAN). Algoritmos de agrupamento hierárquicos aglomerativos (single, complete e average linkage) e divisivos. Construção e interpretação de dendrogramas. Medidas de (dis)similaridade e distância. Técnicas de validação de agrupamentos: critérios internos, relativos e externos. Determinação do número de grupos. Conceitos básicos da linguagem de programação R. Bibliotecas para agrupamento de dados em R. Utilização das técnicas e métodos em bases de dados sintéticas e reais.

 

SOBRE O PROFESSOR

Obteve o título de Bacharel em Informática pela UNIOESTE (2008). Seu mestrado e doutorado foram obtidos no ICMC/Universidade de São Paulo (USP), em 2011 e 2015, respectivamente. Durante o doutorado foi pesquisador visitante no CIn/UFPE (2012) e no Departamento de Ciência da Computação/Universidade de Alberta (2013-2014). Após o doutorado foi  pós-doutorando no ICMC/Universidade de São Paulo (USP) (2015-2016), saindo para o cargo atual de professor efetivo (concursado) no Centro Tecnológico de Joinville - UFSC. Em 2022 foi pesquisador visitante financiado pelo DAAD no Costa Lab/RWTH Aachen University. Seus interesses de pesquisa são amplamente voltados para aprendizado de máquina e mineração de dados tanto no âmbito teórico (desenvolvimento de métodos) quanto suas aplicações.