Position Details

Type Not Specified

Experience mid

Exp. Years Not specified

Education Not specified

Category AI & Machine Learning

About this role

This role involves developing evaluation strategies and validation processes for AI agents, focusing on large language models, data quality, and safety standards within a SaaS life sciences environment.

Key Responsibilities

Define evaluation strategies
Assess LLM output quality
Design high-quality datasets
Develop automated evaluation pipelines
Perform root cause analysis

Technical Overview

The technical environment includes AI evaluation, data curation, automation pipelines, and model validation, primarily using Python and related tools.

Ideal Candidate

The ideal candidate is an experienced AI Data Engineer with a focus on large language models and evaluation methodologies. They possess strong analytical skills, experience with data curation, model validation, and automation pipelines, and can communicate technical findings effectively.

Must-Have Skills

Evaluation Strategy & PlanningLLM Output Integrity AssessmentCreating High-Fidelity DatasetsAutomation of Evaluation PipelinesRoot Cause AnalysisPerformance Metrics

Nice-to-Have Skills

AI AgentsLarge Language ModelsData CurationBias DetectionSafety StandardsModel Evaluation

Tools & Platforms

PythonAutomated Evaluation PipelinesData SetsModel Validation Tools

Required Skills

Evaluation Strategy & PlanningLLM Output Integrity AssessmentCreating High-Fidelity DatasetsAutomation of Evaluation PipelinesRoot Cause AnalysisPerformance Metrics

Hard Skills

Evaluation Strategy & PlanningLLM Output Integrity AssessmentCreating High-Fidelity DatasetsAutomation of Evaluation PipelinesRoot Cause AnalysisPerformance MetricsAI AgentsLarge Language ModelsData CurationModel EvaluationTest Data SetsBias DetectionSafety StandardsModel ValidationAutomated Evaluation Pipelines

Soft Skills

Analytical thinkingProblem-solvingCommunication skillsCritical thinkingCuriosityCollaboration

Industry & Role

Industry SaaS, Life Sciences, Healthcare IT

Job Function AI model evaluation and validation for life sciences AI agents

Keywords for Your Resume

AI & Machine LearningEvaluation Strategy & PlanningLLM Output Integrity AssessmentCreating High-Fidelity DatasetsAutomation of Evaluation PipelinesRoot Cause AnalysisPerformance MetricsLarge Language ModelsData CurationBias DetectionSafety StandardsModel EvaluationTest Data SetsAI AgentsModel Validation

Deal Breakers

Lack of experience with AI evaluation methodologies, No background in data curation or model validation, Unable to work remotely within North America

Apply for this Position →

Get matched to jobs like this

Luna finds roles that fit your skills and career goals — no endless scrolling required.

Create a Free Profile

Senior AI Data Engineer

Get matched to jobs like this