Engenheiro(a) de Dados - II (Modelagem, ETL e Infra)

A Vaga

Estamos desenvolvendo um projeto de inovação financiado pela FAPESP, o qual tem o objetivo de elevar a qualidade das informações para a tomada de decisões estratégicas de grandes empresas. Para isso, precisamos de uma equipe apaixonada por propor e desenvolver soluções capazes de revolucionar suas áreas!

Esta vaga está relacionada à nossa área de dados, a qual é responsável por coletar, armazenar, organizar e transformar os dados governamentais em informações úteis para serem utilizados por outras áreas da Sigalei.

Esta é a oportunidade de trabalhar junto com a nossa equipe de dados e se relacionar com as demais áreas da empresa. Você será responsável por modelar e estruturar adequadamente os dados governamentais coletados por robôs automatizados. Espera-se que estas atividades sejam capazes de garantir a confiabilidade dos dados e a recuperação para serem utilizados por outras áreas da Sigalei. Outra responsabilidade será de atuar na correção de bugs dos robôs de coleta, permitindo maior compreensão do processo para propor melhorias na modelagem dos dados. É essencial manter a confiança em nossos dados, pois sem dados confiáveis não existem boas tomadas de decisões!

Oferecemos feedbacks constantes e todo o apoio necessário para você alcançar o sucesso na sua carreira profissional.

Estamos construindo uma cultura horizontal focada no aprendizado e na autonomia da pessoa. Assim, você terá total liberdade para testar ideias e métodos.

‍Vamos juntos!

Responsabilidade da vaga

Junto com o time de desenvolvimento do projeto, você será responsável por modelar e estruturar adequadamente os dados governamentais coletados por robôs automatizados. Você também será responsável por construir e manter pipelines ETL para extração, transformação e carregamento de dados e construir monitores que permitam identificar e comunicar possíveis erros no fluxode processamento de maneira clara e objetiva, mantendo a equipe atualizada através de relatórios de “saúde da infraestrutura”

Por fim, também terá a responsabilidade de atuar na correção de bugs relacionados ao processo de coleta e transformação dos dados.

Requisitos:

  • Comprovar 5 anos de experiência após a graduação; ou título de doutor;
  • Formação em Ciência da Computação, Engenharia da Computação ou áreas correlatas
  • Dedicação de 40 horas semanais
  • Dedicação exclusiva ao projeto em desenvolvimento

Conhecimentos:

  • Programação em Python
  • Conhecimento em modelagem de dados
  • Conhecimento em banco de dados não-relacional
  • Conhecimento em web-crawling

Diferenciais:

  • Conhecimento em Scrapy
  • Conhecimento em ElasticSearch
  • Conhecimento em docker
  • Experiência com provedores de cloud computing (Google Cloud)

Bolsa:

Dedicação: 40 h/semanais

Duração: 24 meses

Valor Mensal Líquido: R$ 9.046,80

Início: Julho de 2024

Informações adicionais sobre a bolsa FAPESP https://fapesp.br/bolsas/tt 

Informação adicional

What’s a Rich Text element?

The rich text element allows you to create and format headings, paragraphs, blockquotes, images, and video all in one place instead of having to add and format them individually. Just double-click and easily create content.

Static and dynamic content editing

A rich text element can be used with static or dynamic content. For static content, just drop it into any page and begin editing. For dynamic content, add a rich text field to any collection and then connect a rich text element to that field in the settings panel. Voila!

How to customize formatting for each rich text

Headings, paragraphs, blockquotes, figures, images, and figure captions can all be styled after a class is added to the rich text element using the "When inside of" nested selector system.

Inscreva-se na nossa newsletter Alquimia Digital, e fique por dentro de como a inteligência artificial impacta seu dia-dia.
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.