Nunca se gerou tanta informação como nos dias
atuais – e essa informação é originada a partir de dados. Dados produzidos por
sistemas, celulares, sensores, câmeras, dispositivos de segurança, tudo isso em
grande volume e velocidade.
Nesse contexto, entra o papel da ciência de
dados, trazendo ferramentas, métodos e tecnologias para analisar, visualizar e
tomar decisões a partir dos dados. A ciência de dados é um processo, não um
evento. É o processo de usar dados para entender o mundo, é a arte de descobrir
os insights e tendências
que estão escondidos atrás dessas informações.
A ciência de dados em si é uma área
interdisciplinar que envolve várias áreas de conhecimento, tais como:
estatística, matemática, programação, computação e conhecimento de negócios.
Essas áreas corroboram com técnicas e teorias como a modelagem, análise
preditiva, mineração e visualização de dados.
A ciência de dados se baseia em três pilares. O
primeiro pilar é base, que se vale da matemática e da estatística, utilizando
as regras de Machine Learning,
necessárias para a criação de modelos preditivos de análise de dados. O segundo
pilar refere-se à área de negócio. É daqui que surgem os problemas específicos
que necessitam da ciência de dados para serem resolvidos. Marketing, vendas,
finanças, saúde, entre outras áreas, são o ponto de partida para os projetos em
que os dados serão coletados e analisados com objetivo de responder perguntas
formuladas pelas áreas de negócio.
O terceiro pilar é a ciência da computação.
Neste caso, estamos falando da programação de computadores, infraestrutura de
banco de dados, armazenamento e segurança. Essa área de conhecimento vai
oferecer as ferramentas necessárias para análise, além de permitir a
automatização do processo. Novas tecnologias de banco de dados, como NoSQL,
começam a ganhar cada vez mais espaço no mercado, uma vez que o volume,
variedade e velocidade de dadosexige novas formas de armazenamento.
As empresas estão cada vez mais cientes que
precisam tomar decisões baseadas em informações, principalmente aquelas que
pensam sobre Big Data.
Sendo assim, nunca houve um melhor momento para ser um cientista de dados.
Um cientista de dados precisa de alguma
familiaridade com plataformas de análise, mas esse ponto dispõe apenas suas
habilidades técnicas. Além do conhecimento técnico, há outras características
que até podem ser apontadas como mais importantes. O perfil do cientista de
dados é ser curioso, extremamente argumentativo e julgador. Curiosidade é
absolutamente necessária. Se você não é curioso, não sabe o que fazer com os
dados. Julgador porque, se você não tiver noções preconcebidas, não sabe por
onde começar. Argumentativo porque, se você pode argumentar, então pode
defender um caso ou, pelo menos, começar em algum lugar. Então, aprende com os
dados e poderá modificar suas suposições e hipóteses.
E a última coisa que um cientista de dados
precisa ter é a capacidade de contar uma história. Uma vez que você tem sua
análise e suas tabulações, deve ser capaz de contar uma grande história a
partir delas.
Lembre-se: comunicação é um dos requisitos
principais de um cientista de dados. Afinal, de nada adianta realizar um
excelente trabalho de análise se você não for capaz de mostrá-lo e contar uma
história por meio das informações.
Débora Morales é mestra em Engenharia de
Produção (UFPR) na área de Pesquisa Operacional com ênfase a métodos
estatísticos aplicados à engenharia e inovação e tecnologia, especialista em
Engenharia de Confiabilidade (UTFPR), graduada em Estatística e em Economia.
Atua como Estatística no Instituto das Cidades Inteligentes (ICI).
Nenhum comentário:
Postar um comentário