Ciência De Dados

As principais ferramentas de desenvolvimento em ciência de dados

Quando você começa nesse mundo, as coisas ficam extremamente confusas. São milhares de termos e conceitos, todos aprendidos ao mesmo tempo. Normalmente, os textos focam em linguagens a serem estudadas para essa área, mas dessa vez optamos por trazer algo diferente. Nesse texto, vim trazer uma explicação “simples” para algumas ferramentas de desenvolvimento na área de ciência de dados.

10 dicas para mudar do Matlab pro Python

Eu comecei estudar lógica de programação quando me deparei com problemas que me exigiam conhecimento em Matlab. Depois de um tempo estudando Matlab me sugeriram trocar para o Python pela sua facilidade, simplicidade e por poder ser aplicado a inúmeras áreas (além de ser gratuito).

O que fazer quando faltam dados?

Podemos dividir, de forma bastante grosseira, qualquer tipo de dado em duas categorias: temporais e atemporais. Dados atemporais são bastante comuns nos datasets mais utilizados nos tutoriais de ciência de dados: as características dos sobreviventes do Titanic, os tamanhos de pétalas de flores ou as características de um tumor.

Brincando de Processamento Natural de Linguagem com spaCy

Essa semana eu descobri o spaCy, uma bilbioteca Python para Processamento de Linguagem Natural (PLN) que me pareceu excelente. Ao brincar um pouco mais com ela, eu percebi que ela era ainda mais divertida do que eu imaginava e já com um modelo pronto em português, o que facilita bastante para dar uma arranhada na superfície do assunto que é o PLN (ou NLP em inglês).