Em 12 de abril deste ano um Relatório Técnico da Microsoft (MSR-TR-2015-30), intitulado “The Emerging Role of Data Scientists on Software Development Teams”, foi publicado por um Professor da Universidade da Califórnia, em Los Angeles, EUA (Miryung Kim) e três colaboradores da Microsoft: Thomas Zimmerman, Robert DeLine e Andrew Begel, em Redmond, WA, EUA. 

Os autores observam neste relatório que os times de software estão utilizando crescentemente análise de dados para informar suas decisões de engenharia e negócios, e para construir soluções de dados que utilizem dados nos produtos de software.  As pessoas por trás da coleta e análise de dados são chamadas cientistas de dados, um termo cunhado por DJ Patil e Jeff Hammerbacher em 2008 para definir seus trabalhos na Linkedin e no Facebook.

A missão do cientista de dados é transformar dados em discernimentos, oferecendo guia para líderes tomarem ações.  Como um exemplo, quando o Windows Explorer foi redesenhado para o Windows 8, os cientistas de dados do time do Windows analisaram dados de telemetria de usuários e descobriram que enquanto os 10 top comandos mais usados representavam 81,2% de todos os comandos que os usuários inovocavam/acessavam, somente 2 deles eram facilmente acessíveis da barra de comando na interface do usuário.  Baseados nisso, o time redesenhou a experiência do usuário para tornar estes comandos escondidos mais proeminentes.

Até recentemente os cientistas de dados eram encontrados mais nos times de software cujos produtos eram intensivos em dados, como busca de internet e propaganda. Hoje, observam os autores, nós atingimos um ponto de inflexão onde muitos times de software estão começando a adotar data-driven decision making (tomada de decisão guiada por dados).  O papel do cientista de dados está se tornando padrão nos times de desenvolvimento ao longo com papeis existentes, tais como desenvolvedores, testadores, gestores de programas.  Em um email para os empregados da Microsoft, seu CEO Satya Nadella enfatizou a importância da ciência dos dados para o negócio de software nos dias atuais: “Cada grupo de engenharia terá dados e recursos de ciência aplicada que irão focar em resultados mensuráveis para nossos produtos”.

Este emergente papel do cientista de dados não tem sido descrito na literatura de engenharia de software.  Tem havido alguns poucos estudos documentando os pontos de dor que os cientistas de dados enfrentam no seu trabalho cotidiano, baseado em participantes de muitos diferentes tipos de negócios.  No entanto, ressaltam os autores, o contexto do desenvolvimento de software apresenta várias diferenças que merecem estudo. 

Primeiro, no desenvolvimento de software, a análise de dados não somente influencia a tomada de decisão, a própria análise pode ser o produto, como recomendações de produto da Amazon, recomendações de filmes da Netflix, ou resultados de busca no Bing.  Segundo, a flexibilidade do software torna fácil para os cientistas de dados conduzirem experimentos controlados, como testes A/B quando um serviço web redireciona fração do seu tráfego para uma versão experimental para medir o efeito sobre o comportamento do usuário.  Finalmente, com releases de software mais rápidos e contínuos, os cientistas de dados podem operacionalizar análise de dados mais efetivamente atualizando o software para coletar mais dados, e produzir automaticamente nos resultados de análise.  Estas oportunidades não estão presentes nas práticas de inteligência de negócios.

Para investigar este papel emergente, os autores entrevistaram 16 cientistas de dados de 8 diferentes áreas de produtos na Microsoft.  E eles investigaram as seguintes questões:

1) Que categorias de competências de ciência de dados são importantes para uma grande companhia?

2) Quais são as bases educacionais e de treinamento dos cientistas de dados?

3) Que categorias de problemas e atividades os cientistas de dados trabalham?

4) Quais são os estilos de trabalho dos cientistas de dados nos times de desenvolvimento de dados?

Os resultados apontados pelos autores são bastante ilustrativos da crescente importância do papel deste novo profissional nas empresas de tecnologias de informação e comunicação.  Oxalá isto esteja também ocorrendo no Brasil!

Se sua empresa, organização ou instituição deseja saber mais sobre o papel do cientista de dados, fique a vontade para nos contatar!