Skip to content
Tecnologia & EngenhariaMiddle

Exemplo de currículo Middle AI Research Engineer

Exemplo de currículo profissional Middle AI Research Engineer. Modelo otimizado para ATS.

Faixa salarial Middle (US)

$300,000 - $500,000

Por que este currículo funciona

Verbos que sinalizam que você tem dono training runs, não notebooks

Liderei, Desenhei, Reduzi, Construí, Desenvolvi, Substituí, Mentorei. Em nível pleno você é o on-call nomeado de um training run real; os verbos precisam refletir ownership de compute e qualidade, não trabalho de espectador. CVs de MLE dizem 'implementei'; CVs de research engineer dizem 'matei' e 'substituí'.

Números que provam eficiência de FLOPs e lift de eval

MMLU 5-shot em 2,4 pontos, GPU-hour cost em 31%, step time de 2,4s para 1,6s, 96% de wall-clock sem crash. Números de research engineer são evals, FLOPs e confiabilidade, não latência ao usuário. Se seu CV é em p99-ms, você é um MLE.

Rigor de ablation transforma código em hipóteses

612 configs em 5 meses, depois que ablation de eval mostrou nenhum signal lift, depois que ablation de eval mostrou -0,3 pontos em GPQA-Diamond. Frontier labs contratam pela disciplina de matar branches mortos antes de consumirem GPUs, não por empilhar training runs.

Influência cross-IC em training stacks compartilhados

Mentorei 2 junior research engineers, padronizei o post-training eval template, contribuí para a trl library. Research engineers pleno são julgados por se as runs de outros pesquisadores ficaram mais rápidas ou mais nítidas por causa de você.

Profundidade de stack nomeada na camada que importa

FSDP-Z3 + activation checkpointing, Triton kernel pack para fused MoE routing, SFT and DPO post-training stack. Não diga 'fine-tuned LLMs'; nomeie o kernel, a estratégia de paralelismo e o método de post-training. Esse é o sinal de research engineer.

Habilidades essenciais

  • Python
  • PyTorch
  • JAX
  • FSDP-Z3
  • DeepSpeed ZeRO
  • Megatron-LM
  • Triton
  • CUDA
  • NCCL profiling
  • SFT
  • DPO
  • RLHF
  • RLAIF
  • PPO
  • Hugging Face TRL
  • vLLM
  • lm-evaluation-harness
  • MMLU
  • GPQA-Diamond
  • MATH-500
  • HumanEval

Melhore seu currículo

Templates e exemplos de CV de AI Research Engineer de intern a lead, escritos para o job spec real de frontier lab. O papel vive entre o research scientist e o MLE de produção: você transforma papers em código de treinamento e inferência executável, tem ownership do eval harness, roda ablations e entrega componentes de frontier model. Recruiters em Anthropic, OpenAI, Google DeepMind, FAIR, NVIDIA Research, Cohere e Apple AIML procuram sinais bem específicos: turnaround paper-to-checkpoint, percentuais de training-run reliability, taxas de pass de eval-suite em MMLU, GPQA-Diamond, HumanEval e MATH-500, eficiência de FLOPs, disciplina de GPU-hour cost e a disciplina de matar ablations que falham em elevar evals. Este guia cobre de junior a lead com métricas concretas, as ferramentas que importam (PyTorch, JAX, FSDP, DeepSpeed ZeRO, Megatron-LM, Triton, RLHF, DPO, golden-trace replay) e o vocabulário que separa research engineers de ML engineers genéricos.

Boas práticas para CV de Middle AI Research Engineer

  1. Seja o on-call nomeado de pelo menos um training run real. Research engineers pleno são comprados na linha 'primary on-call para o 7B dense run, 96% wall-clock sem crash em 256 H100s'. Sem um named owner role em um training run real, você ainda é um senior junior.

  2. Quantifique eficiência de FLOPs, não apenas speedups. 'Elevou MMLU 5-shot em 2,4 pontos no mesmo FLOPs budget' é mais credível do que 'training 40% mais rápido' porque frontier labs sempre medem qualidade em compute constante. Pareie cada speedup com o que foi mantido constante.

  3. Mostre ao menos uma ablation que você matou. 'Matei a synthetic-data run depois que ablation de eval mostrou -0,3 em GPQA-Diamond' é o bullet que sinaliza maturidade de research engineer. Prova que você troca compute por evidência e abandona branches de sunk-cost; essa é a parte que hiring committees mais agressivamente investigam.

  4. Escolha um post-training stack e tenha ownership dele. SFT to DPO to RLHF to RLAIF é o trio moderno de post-training; CVs pleno devem nomear quais passos você escreveu, quais kernels você desenvolveu (ex.: fused MoE routing em Triton) e qual head-to-head win rate se moveu.

  5. Mentore e padronize. Um bullet como 'mentorei 2 junior research engineers em suas primeiras rotações de ablation-owner e padronizei o post-training eval template' é o sinal mais limpo de que você está pronto para senior.

Erros comuns no CV de Middle AI Research Engineer

  1. Soar como senior MLE em vez de research engineer

Por que isso prejudica: Bullets como 'reduzi p99 latency de 2,5s para 180ms' num CV de research engineer sinalizam que você otimiza serving, não training quality. Screeners de frontier lab encaminham esses CVs para applied-AI em vez de research-engineer pipelines.

Como corrigir: Reformule em unidades de research engineer: eval lift num benchmark nomeado, eficiência de FLOPs em qualidade constante, percentual de training-run completion, ablation kill rate.

  1. Nenhum ablation kill em lugar nenhum do CV

Por que isso prejudica: Research engineers pleno que nunca mataram uma ablation soam como compute-burners. Hiring committees explicitamente investigam 'me conte sobre um experimento que você parou'.

Como corrigir: Adicione um bullet que nomeie o branch morto, a eval que matou ele e os GPU-hours redirecionados. Esse é frequentemente o bullet que empurra a oferta um nível para cima.

  1. Sinal de ownership em training run faltando

Por que isso prejudica: Sem 'primary on-call' ou 'ownership do 7B run' ou 'liderei o tier de distillation 13B', CVs pleno soam como uma pessoa que contribuiu em runs que outras pessoas tinham ownership.

Como corrigir: Escolha um run, reivindique-o explicitamente e reporte o número de reliability (% wall-clock sem crash) mais a estratégia de paralelismo (FSDP-Z3, activation checkpointing, tensor parallel).

Dicas rápidas de CV para Middle AI Research Engineer

  1. Reivindique um named on-call run. Sem um bullet de primary on-call você soa como junior+.

  2. Mostre um ablation kill, com a eval que matou ele e os GPU-hours redirecionados.

  3. Escolha um post-training stack (SFT/DPO/RLHF/RLAIF) e tenha ownership explícito dele.

  4. Um bullet de Triton kernel ou de NCCL-tuning adiciona meio nível de credibilidade.

  5. Mentore e padronize. CVs pleno que incluem 'mentorei 2 juniors e padronizei o eval template' convertem visivelmente melhor.

Perguntas frequentes

AI Research Engineers transformam research papers em código de treinamento e inferência executável, rodam ablations, têm ownership do eval harness e entregam componentes de frontier model. Eles ficam entre research scientists (que enquadram a hipótese) e applied-AI / MLE engineers (que produtizam modelos para os usuários). No dia a dia desenvolvem training recipes, ajustam configurações de FSDP / tensor-parallel / activation-checkpoint, escrevem Triton ou CUDA kernels para hot paths, rodam centenas de ablations contra eval suites nomeadas (MMLU, GPQA-Diamond, HumanEval, MATH-500), matam experimentos que falham em elevar evals e escrevem os post-mortems e run-books que outras research teams reusam.

MLE / applied-AI engineers têm ownership de sistemas de produção: serving infrastructure, RAG pipelines, latência, uptime, model deployment. AI Research Engineers têm ownership de training quality, eval harnesses, rigor de ablation, eficiência de FLOPs e dos kernels e estratégias de paralelismo que fazem um training run em frontier-scale terminar sem crash. O bullet de MLE é 'p99 latency 180ms a 50M req/dia'. O bullet de research engineer é '94% wall-clock-without-crash em 4096 H100s a 70B parameters via FSDP-Z3 + selective activation checkpointing'. Ambas são carreiras válidas; recruiters rejeitam CVs que confundem as duas.

Não. O papel de AI Research Engineer é intencionalmente distinto de research scientist; muitos ICs em Anthropic, OpenAI, DeepMind, FAIR e Cohere entraram com um MS forte mais contribuições open-source. PhDs são comuns em senior+ mas não obrigatórios. O que importa: uma reprodução de um paper recente, um PR mergeado em lm-evaluation-harness / trl / vLLM / um Triton kernel, eval deltas nomeados e experiência de treinamento FSDP-based. Níveis de research engineer senior+ cada vez mais esperam PhD ou profundidade equivalente em indústria (5+ anos em um training stack frontier-adjacent).

MMLU (knowledge), GPQA-Diamond (graduate-level reasoning), MATH-500 (math), HumanEval / MBPP / LiveCodeBench (code), AIME (competition math), BBH (Big-Bench Hard) e cada vez mais evals task-specific como SWE-bench (agent). Cite o shot count (ex.: 5-shot MMLU, 0-shot GPQA-Diamond) e ou um número absoluto ou um delta contra um baseline nomeado. 'Avaliado em benchmarks' genérico é um CV killer; as escolhas de eval de um research engineer são por si só um sinal do que o papel de origem se importava.

Três artefatos movem o nível: (1) um named on-call ownership de um training run real, com um percentual de reliability; (2) um ablation kill, com a eval que matou ele e os GPU-hours redirecionados; (3) um artefato reusável (eval template, kernel pack, componente de post-training stack) que outros ICs usam. Bullets de mentoria e padronização ('mentorei 2 juniors, padronizei o eval template') visivelmente aceleram a conversa de barra de promoção.

Certificações recomendadas

Preparação para entrevistas

Entrevistas de AI Research Engineer em frontier labs combinam rounds de paper-reading, take-home reproductions, distributed-training systems design e um painel de ablation-design. Espere ler um paper recente, esboçar uma training-recipe e um plano de ablation e responder 'o que você mataria primeiro e por quê?'. Rounds de senior+ adicionam um exercício de eval-harness design e um round de research-area architecture (post-training, inference-time compute, multimodal alignment). Code rounds favorecem perguntas de FSDP / Triton / NCCL ao invés de leetcode.

Perguntas frequentes

Perguntas comuns:

  • Me conte sobre um training run do qual você teve ownership end-to-end. O que quebrou?
  • Me conduza por uma ablation que você matou.
  • Como você decidiu entre SFT, DPO e RLHF para uma dada tarefa?
  • Explique um Triton ou CUDA kernel que você escreveu e o speedup vs baseline PyTorch.
  • Desenhe um eval pipeline que captura silent regressions em post-training.

Dicas: Traga um artefato real de run-book (anonimizado) para discutir. Recruiters nesse nível se importam mais com o bullet de kill do que com o de ship. Esteja pronto para defender eficiência de FLOPs em qualidade constante.

Atualizado: