Position Details

Type Not Specified

Experience entry

Exp. Years Not specified

Education Bachelor's Degree

Category Data & Analytics

About this role

Design, implement, and maintain complex batch and real-time data pipelines and architectures. Ensure data quality, optimize data delivery, and support data scientists by integrating diverse datasets for machine learning and deep learning.

Key Responsibilities

Develop and maintain data pipelines and data architectures
Create and document physical data models, data dictionaries, and data flow diagrams
Gather complex business requirements and define data requirements
Build secure batch and real-time (streaming) data processing solutions in cloud and/or on-premises
Mentor Data Engineers and partner with data scientists to integrate datasets for machine learning and deep learning

Technical Overview

The role focuses on data pipeline development (large-scale batch and real-time) across cloud platforms and on-premises environments, with strong data modeling deliverables like physical data models, data dictionaries, and data flow diagrams. It includes DevOps and enterprise architecture standards, secure handling of structured and unstructured data, and collaboration with data scientists on ML/deep learning-ready datasets.

Ideal Candidate

The ideal candidate is an early-career data engineer who can design, implement, and maintain complex batch and real-time data pipelines. They have strong data modeling fundamentals (physical data models, data dictionaries, data flow diagrams) and are able to ensure data quality and secure structured and unstructured data. They also collaborate with data scientists on integrating datasets for machine learning and deep learning models, and contribute to DevOps and enterprise architecture practices.

Must-Have Skills

Bachelor's DegreeAdvanced English skills

Tools & Platforms

DevOpssource code managemententerprise architecturecloud platformson-premises

Required Skills

data pipelinesdata architecturesdata qualityphysical data modelsdata dictionariesdata flow diagramsbusiness requirements gatheringdata requirements definitiondata delivery optimizationautomate manual processesdata integration for machine learning and deep learning modelsstandards for platformssource code managementwork item and project trackingDevOpsenterprise architecturereal-time data processingstreamingbatch data pipelinescloud platformson-premisesstructured and unstructured data securitymentoring Data Engineers

Hard Skills

data pipelinesdata architecturesdata qualityphysical data modelsdata dictionariesdata flow diagramsbusiness requirements gatheringdata requirements definitiondata delivery optimizationautomation of manual processesdata integration for machine learning and deep learning modelsstandards for platformssource code managementwork item and project trackingDevOpsenterprise architecturereal-time data processingstreamingbatch data pipelineslarge-scale data processingcloud platformson-premises data pipelinesstructured dataunstructured datadata securitymentoring Data Engineers

Soft Skills

cross-functional collaborationleadershipmentoringdocumentationcommunicationproblem-solvingrequirement gathering

Industry & Role

Industry Energy

Job Function Engineer scalable, high-quality batch and streaming data pipelines that enable analytics and machine learning

Role Subtype Data Engineer

Keywords for Your Resume

Data Engineerdata pipelinesdata pipelinedata architecturesdata qualityphysical data modelsdata dictionariesdata flow diagramsbusiness requirementsdata requirementsdata deliveryautomate manual processesmachine learningdeep learningdata integrationsource code managementwork itemproject trackingDevOpsenterprise architecturereal-time data processingstreamingbatch data pipelinesstructured dataunstructured datasecure the flow of datacloud platformson-premisesmentor Data Engineersadvanced English

Deal Breakers

Bachelor's Degree, Advanced English skills

Apply for this Position →

Get matched to jobs like this

Luna finds roles that fit your skills and career goals — no endless scrolling required.

Create a Free Profile