ciência de dados

Decision Trees no R: Análise do ENEM 2018

Olá! No post de hoje, utilizarei uma ferramenta fascinante para predição e explicação em modelos tanto de regressão quanto de classificação: as árvores de decisão, ou decision trees. As árvores de decisão, como no exemplo abaixo, são traçadas a partir de uma combinação de nós e folhas, sendo cada nó uma variável com um determinado valor ou categoria dividida e cada folha com um valor ou categoria predita. Tal recurso é interessante pois a interpretação é facilitada pelo apelo gráfico, e nos permite entender quais variáveis são importantes e determinantes na predição/explicação de um modelo.

BBB 20 - Prevendo a final

Olá a todos! Depois de um longo período conturbado, retorno (ainda não com a frequência que gostaria) o blog. Aproveitando essa quarentena por conta do COVID-19 (que posteriormente analisarei aqui), raspei e analisei alguns dados do BBB 20. O intuito do post de hoje é utilizar um modelo logístico para determinar a final do reality show, ou seja, os três participantes que sairão por último, independente da ordem.

Requisições em APIs no R

No post passado, eu falei sobre segurança de redes e inteligência artificial usando o Pwnagotchi. Se você não leu e se interessa por esses temas, recomendo que volte ao post para entender melhor sobre o que tratarei hoje. Se você só quiser saber sobre APIs no R, é só continuar lendo :). Bom, para começar, o que é uma API? Segundo o Wikipedia, Interface de Programação de Aplicações (pt) ou Interface de Programação de Aplicação (pt-BR)), cujo acrônimo API provém do Inglês Application Programming Interface, é um conjunto de rotinas e padrões estabelecidos por um software para a utilização das suas funcionalidades por aplicativos que não pretendem envolver-se em detalhes da implementação do software, mas apenas usar seus serviços.

Imprimindo gráficos em 3D no R

Hadley Wickham, um dos mantenedores do RStudio e criador do pacote tidyverse (que engloba outros, como dplyr, ggplot, forcats, purrr, etc), escreveu um excelente livro com Garret Grolemund chamado “R for Data Science”, que pode ser encontrado gratuitamente aqui. Recomendo fortemente, pois a didática é excelente, os exemplos são claros e os exercícios são desafiadores. Um fato curioso sobr o livro é que o mesmo ensina a fazer gráficos (com o ggplot) antes de ensinar todas as outras coisas, como funções, objetos, tratamento de bancos, análise exploratória e modelos.

Rtweet: baixando e salvando todos os tweets de um usuário

Vivemos em um mundo onde, desde sempre, informação significa poder. Possuir determinados livros, dominar certos conhecimentos, frequentar cursos ou universidades específica, tudo isso leva a um certo status na sociedade. Na obra 1984, de George Orwell, temos o clássico exemplo do que isso representa: o partido IngSoc, a partir do Ministério da Verdade, controla informações e altera a história, ao apagar notícias, livros e acontecimentos do passado. Uma outro exemplo, agora na vida real, foi o da Biblioteca de Alexandria, no Egito Ptolemaico.

Textmining: análise dos discursos de Getúlio Vargas

Getúlio Vargas chega ao poder, como Chefe do Governo Provisório, em 1930, marcando o fim da República Velha, e fica no poder até 1945, elegendo-se novamente em 1951 como Presidente da República, cargo que ocupou até 1954. Implantando uma ditadura em 1930, Vargas modernizou o Brasil, que se tornou um estado autoritário e centralizado na figura do presidente. O “Pai dos Pobres”, como também é conhecido, é responsável pela Consolidação das Leis Trabalhistas (CLT), pela criação do BNDE (atual BNDES), a fundação e o desenvolvimento da Petrobrás, e também pela inserção do Brasil na Segunda Guerra Mundial.

Mapas no R parte I: explorando Moscou

Moscou é famosa por diversos motivos: sua história, milenar, que se inicia nos tempos da Rus’ de Kiev; o fato de ser o berço da Revolução Russa; suas largas ruas, algumas com oito faixas, para tanques de guerra poderem passar; e suas belíssimas estações de metrô, que são verdadeiras obras de arte. O metrô de Moscou, além de servir como ponto de abrigo em casos de guerra nuclear.

Quem Voa - Análise dos vôos da FAB com autoridades do Estado

De Ícaro ao Tesla Roadster, voar sempre foi a vontade de muitos. Há quem diga que tem medo, e não duvido, embora acredite que o medo está não na altura ou no voar, mas nos possíveis acidentes que podem decorrer disso. De uma forma ou de outra, o céu brasileiro está cada vez mais povoado com a democratização do preço dos vôos, da quantidade de trechos disponíveis e da necessidade de chegar mais rápido em algum lugar.

joRge benjoR

Eu sou um grande fã de Jorge Benjor, gosto que herdei de meu pai. O suíngue, as batidas, as letras… Se o dia não está bom, basta ouvir “A Tábua de Esmeralda”, lançado em 1974, categorizado como “samba rock”, que tudo melhora. É, junto com “Racional vol. 1”, do Tim Maia, “Gita”, do Raul Seixas, e “Terra”, do Sá, Rodrix e Guarabyra, um dos meus discos favoritos. Ao mesmo tempo, sou um entusiasta da ciência de dados.