Da Economia à Ciência de Dados

Em 2012, a Harvard Business Review escreveu um emblemático artigo chamando a profissão de cientista de dados de “profissão mais sexy do mundo”. 10 anos depois, essa carreira segue em crescimento acelerado. As empresas, que só falam em tomar decisões utilizando dados, estão contratando esses profissionais como nunca. É claro, todo mundo quer (e precisa) ser data-driven. Como não existe uma graduação específica para atuar na área, temos alunos de diversos cursos, incluindo o de ECONOMIA.

Hoje, venho com este artigo tentar auxiliar quem é economista e pensa em atuar com dados. Caso você nem saiba o que faz um cientista de dados, você pode dar uma passada neste texto do Vagas.com.br que contém uma descrição bem razoável. Em suma, essa é a pessoa que resolve os problemas utilizando dados. Como essa é uma questão bem ampla, suas tarefas também são, sendo às vezes elaborar um teste AB, outras fazer análises estatísticas, ou então, a preferida da maioria dos cientistas de dados, criar modelos de machine learning – os famosos algoritmos – para prever eventos. O que vale é gerar valor para o negócio através dos dados.

Já notei que muitos alunos de economia não sabem, mas essa graduação é muito bem aceita no mercado de dados. Quando pensamos na formação de um economista, ela contempla matérias quantitativas importantes para formar um bom profissional de data science – e.g. Cálculo, Estatística e Econometria. Eu, particularmente, ainda considero que disciplinas como Teoria dos Jogos e Economia Comportamental podem lhe dar importantes diferenciais na carreira. Afinal, a maioria dos problemas dos cientistas de dados envolve entender pessoas e relações. Resumindo este parágrafo: Você é bem-vindo, colega economista.

Bom, agora que você sabe que sua graduação é aceita na área, precisa entender onde moram seus principais pontos fracos. Podemos começar falando da estatística, disciplina central na profissão. Você provavelmente deve deixar a graduação com conhecimentos básicos em estatística, colocando-o em vantagem em relação a muitas graduações. Porém, saiba que (I) este é o começo da teoria apenas; (II) você precisa garantir que tem conhecimento ao menos no conteúdo que vemos no livro “Estatística Básica”, do Bussab & Morettin. Se você estudou todas as questões abordadas no livro, então seu conhecimento estatístico é o suficiente para ser um cientista de dados júnior. Se ficou faltando algo, recomendo que você complemente sua graduação com o livro ou pelo curso da Khan Academy.

O segundo ponto importante que você vai ter que lidar é na modelagem estatística. Aqui, temos um caso curioso de diferença na perspectiva que cada área tem sobre o tema. Em econometria, costumamos ter uma abordagem mais inferencial, buscando saber se, ou como, um evento A impacta um evento B. Queremos saber, por exemplo, se uma política de bônus para professor causa uma melhora no ensino. Já nos modelos de Machine Learning, usados pelos cientistas de dados, o foco costuma ser a predição.

Enquanto em Econometria a gente quer saber se A causa B, em Machine Learning o importante é prever B. Isso faz com que a gente precise ter um olhar diferente para os modelos, mudando inclusive premissas e restrições a depender do caso. Mas não pense que seus modelos aprendidos na graduação não serão utilizados. Inclusive, se você aprender coisas como inferência causal e modelos em Painel na faculdade, saiba que você vai ter um diferencial enorme no mercado!

Por fim, é importante que vocês aprendam a ser programadores. Na economia, a gente costuma usar a programação apenas para rodar alguma análise. É vista como um meio para que a gente atinja um certo fim. Não somos realmente programadores. Não nos preocupamos com a qualidade do código ou processamento, só precisamos do resultado da análise. Como cientista de dados, é interessante que você seja bom programador, por uma série de motivos. Ou seja, não é mais “só preciso que ele solte o resultado da análise”, mas sim “preciso que ele seja bom, limpo, eficiente, etc”.

Os principais pontos que um economista deveria saber antes de iniciar a carreira como cientista de dados eram esses. Para finalizar, gostaria de deixar aqui um print com uma trilha de estudos que postei recentemente em meu Instagram e que você pode usar como um guia para se tornar um profissional da área. Acho ela interessante porque você não gastará nem 40 reais e ela é toda em português, bem democrática. 

Boa sorte!

———————————————————————————————-

André Yukio

É Matemático, mestre em Economia e já atua como cientista de dados há 7 anos, Tem um canal no Youtube e uma página no Instagram, ambos com o nome Universidade dos Dados, onde ensina Ciência de Dados, Machine Learning, Python, R, SAS e SQL.

 

Sair da versão mobile