Posts by Collection

portfolio

Geojags

Você pode fazer o download do módulo já existente para usuários Mac e Linux aqui. Instruções para instalação e um exemplo de uso podem ser encontrados aqui.

Veraz

Projeto de manipulação e análise dos dados do portal da transparência do governo federal.

publications

Model selection criteria for regression models with splines and the automatic localization of knots

Published in ArXiv, 2020

In this paper we propose a model selection approach to fit a regression model using splines with a variable number of knots. We introduce a penalized criterion to estimate the number and the position of the knots where to anchor the splines basis. The method is evaluated on simulated data and applied to covid-19 daily reported cases for short-term prediction.

Recommended citation: Sousa, A.R.S.S,, Severino, M.T.F., Leonardi, F. (2020). "Pre-print". https://arxiv.org/abs/2006.02649

Independent block identification in multivariate time series

Published in Journal of Time Series Analysis, 2020

Model selection criterion to estimate the points of independence of a random vector, producing a decomposition of the vector distribution function into independent blocks.

Recommended citation: Leonardi, F., Lopez‐Rosenfeld, M., Rodriguez, D., Severino, M. T., & Sued, M (2021). "Independent block identification in multivariate time series." Journal of Time Series Analysis, . 42(1), 19-33. https://www.ime.usp.br/~leonardi/artigos/leonardi_et_al_2020.pdf

talks

Prêmio Vídeo Pós-Graduação no combate ao COVID-19

Published:

Com o vídeo abaixo, de divulgação do projeto sobre análise de ados de covid-19, fui premiado pela Pró-Reitoria de Pós-Graduação da USP no edital PRPG 12/2020, que teve como objetivo divulgar as ações dos Programas de Pós-graduação da USP no combate ao covid-19.

Limpeza e organização de bases de dados

Published:

  • Uma mesma base de dados pode ser armazenada/representada em diferentes maneiras.
  • Além disso, os formatos e convenções de armazenamento adotados podem variar muito, podendo dificultar análises.
  • O processo de limpeza e organização de dados é praticamente obrigatório em qualquer contexto de análise de dados, e isso não se deve necessariamente a erros ou falhas no processo de armazenamento.

Introdução à Otimização

Published:

Neste workshop defino o que é um problema de otimização, como modelar um problema de otimização. Além de mostrar como desenvolver uma solução para um problema de otimização linear. Por fim, relaciono a otimização com os conceitos de aprendizagem estatística.

teaching

Análise combinatória, probabilidade e aplicações

Curso de Verão, Instituto de Matemática e Estatística, Universidade de São Paulo, 2021

Curso de graduação ministrado no Programa de Verão do IME-USP, com carga horária de 60h. Primeira disciplina que ministrei. As notas de aula estão (neste bookdown)[https://www.ime.usp.br/~magno/monitorias/verao2021/notas/]

Modelagem Preditiva

Especialização, Insper, 2021

Curso introdutório de modelagem preditiva, incluindo modelos supervisionados, como regressão linear, logística, métodos de regularização, modelos baseados em árvore de decisão (floresta aleatória, bagging e boosting). Ministrado como parte do Programa Avançado em Data Science e Decisão.

Programação para Não Programadores - Módulo R

Curso livre, Insper, 2021

Curso de introduzição aos conceitos de linguagem de programação e aplicados em R. Desenhado para profissionais com interesse em aprender a desenvolver algoritmos para solucionar problemas.

Modelagem Preditiva Avançada

Especialização, Insper, 2021

Curso modelagem preditiva avançada, abordando tidyverse e tidymodels, redes neurais e modelos para dados não supervisionados (PCA, MDS, k-médias, análise de agrupamento) e mineração de texto. Ministrado como parte do Programa Avançado em Data Science e Decisão.

Análise combinatória, probabilidade e aplicações

Curso de Verão, Instituto de Matemática e Estatística, Universidade de São Paulo, 2022

Curso de graduação ministrado no Programa de Verão do IME-USP, com carga horária de 60h. As notas de aula estão (neste bookdown)[https://www.ime.usp.br/~magno/monitorias/verao2021/notas/]

Aprendizagem Estatístico de Máquinas 2

Especialização, Insper, 2022

Aborda tidyverse e tidymodels, redes neurais e modelos para dados não supervisionados (PCA, MDS, k-médias, análise de agrupamento) e mineração de texto. Ministrado como parte do Programa Avançado em Data Science e Decisão.

Introdução à Aprendizagem Estatística e à Ciência de Dados em R

Curso de difusão, Universidade de São Paulo, 2022

Oferecer para a comunidade externa à Universidade de São Paulo um curso de fundamentos teóricos em aprendizagem estatística e ciência de dados e também um treinamento prático usando a linguagem R, considerando a grande demanda atual dos profissionais que atuam no mercado de trabalho por este tipo de conhecimentos/ferramentas. Aproximar os temas de pesquisa desenvolvidos na Universidade para a comunidade externa, proporcionando uma ponte entre a Academia e a comunidade em geral.