Skip to content
Tecnologia & Engenharia

Exemplo de currículo Junior AI Research Engineer

Exemplo de currículo profissional Junior AI Research Engineer. Modelo otimizado para ATS.

Escolha seu nível

Selecione o nível de experiência para um modelo de currículo adequado

Por que este currículo funciona

Verbos que sinalizam ownership de research-to-prod

Reproduzi, Desenvolvi, Perfilei, Estendi, Implementei. Frontier labs procuram verbos que provem que você consegue pegar um paper e transformá-lo em código de treinamento executável, não apenas 'usei PyTorch'. Essa é a régua que separa research engineers de MLEs genéricos.

Números de eval e training-run, não vibes

Dentro de 0,6 pontos do HumanEval pass@1, 38 ablation runs, 17% das GPU-hours, de 95 minutos para 22 minutos, de 11% para menos de 2%, 1.7x throughput. Research engineers são julgados por benchmarked deltas; sem número, sua ablation é folclore.

Rigor e disciplina de FLOPs visíveis em cada bullet

Não é 'treinou um modelo', mas 'em 3 tamanhos de modelo destilados' e 'as 4 configurações que sobreviveram ao golden-trace eval replay'. Frontier labs contratam por rigor: ablations que provam uma hipótese, não training runs que queimam compute. Essa é a parte que CVs com sabor de MLE sempre erram.

Sinal de colaboração, mesmo em nível de intern

Em dupla com dois senior research engineers; entrou em 3 internal training stacks. Mesmo como intern, prove que você entrega em codebases compartilhados dos quais outros pesquisadores dependem. Esse NÃO é um papel de MLE; é um papel paper-to-codebase com peer reviewers.

Stack nomeada na camada que um frontier lab se importa

Triton kernel, FSDP-Z2 sharding, golden-trace replay, EleutherAI lm-evaluation-harness. Não escreva 'PyTorch'; escreva a camada específica do training stack que você tocou. É assim que recruiters de research engineer separam hobbyists de contributors.

Alterne entre níveis para recomendações específicas

Habilidades-chave

  • Python
  • PyTorch
  • JAX
  • Hugging Face Transformers
  • Slurm
  • FSDP
  • Weights and Biases
  • lm-evaluation-harness
  • Triton
  • CUDA
  • DeepSpeed-Z2
  • Hydra
  • MMLU
  • GPQA-Diamond
  • HumanEval
  • MATH-500
  • vLLM
  • FSDP-Z3
  • DeepSpeed ZeRO
  • Megatron-LM
  • NCCL profiling
  • SFT
  • DPO
  • RLHF
  • RLAIF
  • PPO
  • Hugging Face TRL
  • DeepSpeed-MII
  • Triton kernels
  • NCCL
  • Rust
  • Tensor Parallel
  • Activation Checkpointing
  • Speculative Decoding
  • Reward Modeling
  • Constitutional AI
  • Golden-trace Replay
  • Scaling Laws
  • Inference-Time Compute
  • Mech-Interp Probes
  • Mixture-of-Experts
  • RLHF/DPO/RLAIF
  • Multimodal Alignment
  • Mech-Interp
  • Red-Team Eval
  • Eval-Harness Contracts
  • FLOPs Accounting
  • Org Design
  • Research Strategy
  • Hiring Rubrics
  • Compute Budget Planning

Melhore seu currículo

Faixas salariais (US)

Junior
$200,000 - $300,000
Middle
$300,000 - $500,000
Senior
$500,000 - $900,000
Lead
$700,000 - $1,500,000

Progressão na carreira

AI Research Engineering é uma das tracks de mais alta alavancagem em frontier labs. A progressão vai de ablation-owner / eval-harness contributor (junior) para small-model training-run lead (middle) para large-model training-run-tier lead (senior) para arquiteto de research area (lead, MTS, staff). Cada nível adiciona escala de compute, ownership de eval-suite e artefatos reusáveis. O teto para ICs é staff ou principal research engineer; muitos leads também pivotam para research-engineering management (head of pretraining, head of post-training).

  1. JuniorMiddle1-3 years

    Reproduzir 2-3 papers de frontier lab com eval deltas nomeados, contribuir com um PR mergeado em lm-evaluation-harness / trl / vLLM, ter ownership end-to-end de uma série de ablations de small-model, fazer profile e reportar GPU-hour cost, entregar um Triton kernel ou um fix de NCCL-tuning e começar a ser o named on-call de pelo menos um secondary training run.

    • FSDP-Z3 + activation checkpointing
    • SFT and DPO post-training
    • Triton kernel authoring
    • Eval-harness golden-trace replay
    • FLOPs accounting
  2. MiddleSenior2-4 years

    Ser primary on-call de um training run real (>=7B parameters) com um percentual de reliability, matar ao menos uma ablation de várias semanas com evidência de eval nomeada, mentorar 2 juniors em suas primeiras rotações de ablation-owner, desenvolver um artefato reusável (post-training run-book, eval template, kernel pack) e começar a influenciar o eval-harness contract usado por times adjacentes.

    • RLHF and RLAIF post-training
    • NCCL collective tuning
    • Tensor parallel + pipeline parallel
    • Speculative decoding stacks
    • Reusable run-books
  3. SeniorLead3-5 years

    Ter ownership de um training run em frontier-tier (GPU count de 4 dígitos, 70B+ parameters, duração de várias semanas), produzir um senior-only kill (initiative de várias semanas parada após uma ablation de eval, com centenas de milhares de GPU-hours redirecionados), mentorar 2 ICs a research-engineer senior, desenvolver um company-wide eval-harness contract ou FLOPs accounting library e fazer parceria com um peer em nível VP no roadmap da research area.

    • Research-area architecture (post-training, inference-time compute, multimodal alignment)
    • Multi-million GPU-hour budget ownership
    • Eval-harness contract design
    • Promotion ladder design and IC rotation mechanisms
    • Cross-team partnerships with VP-level peers

Caminhos adjacentes: research scientist (mais publicações, menos código), MLE / production AI engineer (serving e infra em escala), mech-interp researcher (ramo especializado da área), research-engineering manager (people leadership), inference-systems engineer (especialista em vLLM / TensorRT / speculative decoding). Alguns research engineers também pivotam para papéis específicos de AI safety / red-team ou para fundar startups de research-tooling (eval platforms, training-stack tooling).

Templates e exemplos de CV de AI Research Engineer de intern a lead, escritos para o job spec real de frontier lab. O papel vive entre o research scientist e o MLE de produção: você transforma papers em código de treinamento e inferência executável, tem ownership do eval harness, roda ablations e entrega componentes de frontier model. Recruiters em Anthropic, OpenAI, Google DeepMind, FAIR, NVIDIA Research, Cohere e Apple AIML procuram sinais bem específicos: turnaround paper-to-checkpoint, percentuais de training-run reliability, taxas de pass de eval-suite em MMLU, GPQA-Diamond, HumanEval e MATH-500, eficiência de FLOPs, disciplina de GPU-hour cost e a disciplina de matar ablations que falham em elevar evals. Este guia cobre de junior a lead com métricas concretas, as ferramentas que importam (PyTorch, JAX, FSDP, DeepSpeed ZeRO, Megatron-LM, Triton, RLHF, DPO, golden-trace replay) e o vocabulário que separa research engineers de ML engineers genéricos.

Perguntas frequentes

AI Research Engineers transformam research papers em código de treinamento e inferência executável, rodam ablations, têm ownership do eval harness e entregam componentes de frontier model. Eles ficam entre research scientists (que enquadram a hipótese) e applied-AI / MLE engineers (que produtizam modelos para os usuários). No dia a dia desenvolvem training recipes, ajustam configurações de FSDP / tensor-parallel / activation-checkpoint, escrevem Triton ou CUDA kernels para hot paths, rodam centenas de ablations contra eval suites nomeadas (MMLU, GPQA-Diamond, HumanEval, MATH-500), matam experimentos que falham em elevar evals e escrevem os post-mortems e run-books que outras research teams reusam.

MLE / applied-AI engineers têm ownership de sistemas de produção: serving infrastructure, RAG pipelines, latência, uptime, model deployment. AI Research Engineers têm ownership de training quality, eval harnesses, rigor de ablation, eficiência de FLOPs e dos kernels e estratégias de paralelismo que fazem um training run em frontier-scale terminar sem crash. O bullet de MLE é 'p99 latency 180ms a 50M req/dia'. O bullet de research engineer é '94% wall-clock-without-crash em 4096 H100s a 70B parameters via FSDP-Z3 + selective activation checkpointing'. Ambas são carreiras válidas; recruiters rejeitam CVs que confundem as duas.

Não. O papel de AI Research Engineer é intencionalmente distinto de research scientist; muitos ICs em Anthropic, OpenAI, DeepMind, FAIR e Cohere entraram com um MS forte mais contribuições open-source. PhDs são comuns em senior+ mas não obrigatórios. O que importa: uma reprodução de um paper recente, um PR mergeado em lm-evaluation-harness / trl / vLLM / um Triton kernel, eval deltas nomeados e experiência de treinamento FSDP-based. Níveis de research engineer senior+ cada vez mais esperam PhD ou profundidade equivalente em indústria (5+ anos em um training stack frontier-adjacent).

MMLU (knowledge), GPQA-Diamond (graduate-level reasoning), MATH-500 (math), HumanEval / MBPP / LiveCodeBench (code), AIME (competition math), BBH (Big-Bench Hard) e cada vez mais evals task-specific como SWE-bench (agent). Cite o shot count (ex.: 5-shot MMLU, 0-shot GPQA-Diamond) e ou um número absoluto ou um delta contra um baseline nomeado. 'Avaliado em benchmarks' genérico é um CV killer; as escolhas de eval de um research engineer são por si só um sinal do que o papel de origem se importava.

Escolha um paper de um frontier lab nos últimos 12 meses e reproduza sua training recipe em um stack FSDP-based real. Rode pelo menos 30 ablations, meça deltas em uma eval nomeada (MMLU, GPQA-Diamond, HumanEval) e entregue um PR open-source mergeado (extensão de lm-evaluation-harness, uma trl recipe, um Triton kernel, uma otimização de vLLM). Uma reprodução com um eval delta real e um PR real é mais credível do que dez certificados Coursera.