RIO- Museu do Amanhã abre vaga para Engenheiro de Dados Júnior.
Descrição
Quais as principais atividades dessa posição?
• Criar pipelines de dados em ambientes Cloud e On Premise;
• Preparar os dados como parte de um processo ETL/ELT;
• Projetar, construir e manter os repositórios de dados e/ou Data Lake;
• Integrar diferentes fontes de dados, garantindo a segurança e a alta disponibilidade;
• Garantir a curadoria de dados e respeito à LGPD;
• Otimizar e executar scripts de atualização de dados de forma performática;
• Conhecer as melhores práticas de modelagem e persistência de dados;
• Conhecer o modelo/regras de negócio para garantir a governança da informação, bem como a definição da estratégia de construção dos pipelines de dados;
• Conhecer estruturação de Data Lake e Data Hub;
• Arquitetar soluções de grande escala, trabalhando com quantidades massivas de dados e com alta frequência de atualização;
• Atualizar-se constantemente com relação às melhores práticas para garantir a segurança dos dados;
Quais as experiências e os conhecimentos necessários para a vaga?
• Processamento distribuído (ex.: Spark, Hadoop, Hive, Glue) em ambientes como AWS EMR, Databricks;
• Conhecimento em modelagem de dados dimensional e relacional;
• Conhecimento de bancos de dados relacionais (Oracle e SQL Server) e NoSql (MongoDB, Cosmos DB ou Cassandra);
• Conhecimento de ferramentas de ETL de mercado;
• Experiência com tecnologias de Big Data, Spark e ecossistema Hadoop;
• Conhecimento em Shell Scripts e Linux;
• Conhecimento em Airflow e Docker;
• Experiência na criação de processos batch e processamento de dados em tempo real;
• Conhecimento em diferentes arquiteturas tradicionais de armazenamento de dados, Data Lake e Data Warehouse.
• Uso das melhores práticas de Governança de Dados
• Conhecimento avançado de Excel.
Qual a formação exigida para desempenhar essa função?
• Graduação em Ciência da Computação, Engenharia De Computação, Sistemas da Informação, ou áreas afins.
O que será considerado como diferencial?
• Processamento distribuído (ex.: Spark, Hadoop, Hive, Glue) em ambientes como AWS EMR, Databricks;
• Conhecimento em modelagem de dados dimensional e relacional;
• Conhecimento de bancos de dados relacionais (Oracle e SQL Server) e NoSql (MongoDB, Cosmos DB ou Cassandra);
• Conhecimento de ferramentas de ETL de mercado;
• Conhecimento de tecnologias de Big Data, Spark e ecossistema Hadoop;
• Conhecimento em Airflow e Docker;
• Conhecimento na criação de processos batch e processamento de dados em tempo real;
• Conhecimento em diferentes arquiteturas tradicionais de armazenamento de dados, Data Lake e Data Warehouse.
• Conhecimento das melhores práticas de Governança de Dados
• Conhecimento avançado de Excel.
Escolaridade miníma: Formação superior completa
Quero me inscrever para essa vaga CLICK AQUI
OUTRAS VAGAS
O Click Museus, desenvolveu o APP VAGAS CULTURAIS, disponível para Android . Através desse aplicativo é possível buscar vagas de emprego exclusivamente no setor da cultural a nível nacional.
É possível também salvar as vagas preferidas, CLIQUE AQUI e baixe agora o APP.