Cientista de Dados

Local: São Paulo/SP

Experiência: Sênior

Tipo de Contratação CLT

Atividades:


Adquirir, avaliar e processar dados de várias fontes e sistemas em plataformas de Big Data

Gerenciar dados de end to end• Determinar a abordagem estratégica para o gerenciamento de dados Manipulação e transformação dos dados, por meio de ETLs, pipelines, streamings, realtime ou não 

Suportar correção de bugs e análises de desempenho ao longo do pipeline de dados

Colaborar com cientistas de dados para mapear campos de dados para hipóteses, organizar e preparar dados para uso em seus modelos analíticos avançados Desenvolvimento de software, usando Java e/ou Python, controle de versão com o Git, gerenciamento de dependências usando Maven e/ou Pip e fluxos de trabalho em equipe usando branches, e pull requests 


Requisitos:

Domínio nas linguagens de programação: Java ou Python; Desejável  R

Vivência em sistemas distribuídos, incluindo conceitos como clusters, sharding e quorum•

Conhecimento em Arquitetura Hadoop

Experiência com ecossistema Hadoop (  Hive/Spark)

Experiência com Jupiter Notebooks ou afins

Sólidos conhecimentos em Machine Learning e Deep Learning;


Contratação 

CLT ou PJ ( conforme experiência e negociação)

Local:  São Paulo ( zona sul)

Compartilhe:

Twitter Facebook LinkedIn