Mineração de Dados, Internet das Coisas e Dados Abertos

  • avatar Marcos Vinicius Fidelis
    É professor da UTFPR na graduação desde 1996, e Analista de Informática da UEPG desde 1991.
    Pesquisador e usuário do WEKA (atual Pentaho Data Mining) desde 1999, cursou Data Mining with Weka em 2013 e More Data Mining with Weka em 2014, promovidos pela University of Waikato.
    Participou como palestrante nos seguintes eventos de Software Livre: FISL, Flisol, FTSL, Latinoware e PentahoDay.
Atualmente os dados estão pulverizados em disponíveis através da nuvem, em dados públicos e nas próprias empresas. Dados estão distribuídos em diversos dispositivos e fontes geradoras tais como celulares, sensores, coletores de dados, máquinas, equipamentos, veículos e eletrodomésticos.
Acrescente-se a isto os dados de redes sociais, e rapidamente percebe-se que a capacidade de analisar dados é muito menor que a disponibilidade de dados.
Por isto a Mineração de Dados (Data Mining) é uma das principais áreas dos próximos anos. Esta é a área capaz de extrair conhecimento de grandes bases de dados, convencionais ou não, e capaz de transformar dados e relacionamentos, aparentemente ocultos, em conhecimento útil para a tomada de decisão ou para a avaliação de resultados.
O coração deste processo está na organização dos dados. Esse primeiro passo é uma tarefa desafiadora, porque as corporações contam com diversas fontes de informações e elas precisam de uma base única, limpa e de qualidade para realizar a análise.
Visando a formação dos próximos Cientistas de Dados, pretendo nesta palestra apresentar os conceitos relacionados a esta área, apresentando através de uma abordagem clara e prática, a mineração de dados com o Software WEKA, que é uma das principais ferramentas de código livre e aberto, e que compõe a ferramenta de Business Intelligence chamada Pentaho.
Serão apresentados os principais conceitos e uma experiência prática envolvendo Dados Abertos, Internet das Coisas e Mineração de Dados.
Esta palestra é voltada para aqueles que desejam entender como criar parâmetros para entender o comportamento do consumidor, identificar afinidades entre as escolhas de produtos e serviços, prever hábito de compras, analisar comportamentos habituais para prever fraudes e muito mais.