Exemplo de currículo Middle AI Research Engineer
Exemplo de currículo profissional Middle AI Research Engineer. Modelo otimizado para ATS.
Faixa salarial Middle (US)
$300,000 - $500,000
Por que este currículo funciona
Verbos que sinalizam que você tem dono training runs, não notebooks
Liderei, Desenhei, Reduzi, Construí, Desenvolvi, Substituí, Mentorei. Em nível pleno você é o on-call nomeado de um training run real; os verbos precisam refletir ownership de compute e qualidade, não trabalho de espectador. CVs de MLE dizem 'implementei'; CVs de research engineer dizem 'matei' e 'substituí'.
Números que provam eficiência de FLOPs e lift de eval
MMLU 5-shot em 2,4 pontos, GPU-hour cost em 31%, step time de 2,4s para 1,6s, 96% de wall-clock sem crash. Números de research engineer são evals, FLOPs e confiabilidade, não latência ao usuário. Se seu CV é em p99-ms, você é um MLE.
Rigor de ablation transforma código em hipóteses
612 configs em 5 meses, depois que ablation de eval mostrou nenhum signal lift, depois que ablation de eval mostrou -0,3 pontos em GPQA-Diamond. Frontier labs contratam pela disciplina de matar branches mortos antes de consumirem GPUs, não por empilhar training runs.
Influência cross-IC em training stacks compartilhados
Mentorei 2 junior research engineers, padronizei o post-training eval template, contribuí para a trl library. Research engineers pleno são julgados por se as runs de outros pesquisadores ficaram mais rápidas ou mais nítidas por causa de você.
Profundidade de stack nomeada na camada que importa
FSDP-Z3 + activation checkpointing, Triton kernel pack para fused MoE routing, SFT and DPO post-training stack. Não diga 'fine-tuned LLMs'; nomeie o kernel, a estratégia de paralelismo e o método de post-training. Esse é o sinal de research engineer.
Habilidades essenciais
- Python
- PyTorch
- JAX
- FSDP-Z3
- DeepSpeed ZeRO
- Megatron-LM
- Triton
- CUDA
- NCCL profiling
- SFT
- DPO
- RLHF
- RLAIF
- PPO
- Hugging Face TRL
- vLLM
- lm-evaluation-harness
- MMLU
- GPQA-Diamond
- MATH-500
- HumanEval
Melhore seu currículo
Templates e exemplos de CV de AI Research Engineer de intern a lead, escritos para o job spec real de frontier lab. O papel vive entre o research scientist e o MLE de produção: você transforma papers em código de treinamento e inferência executável, tem ownership do eval harness, roda ablations e entrega componentes de frontier model. Recruiters em Anthropic, OpenAI, Google DeepMind, FAIR, NVIDIA Research, Cohere e Apple AIML procuram sinais bem específicos: turnaround paper-to-checkpoint, percentuais de training-run reliability, taxas de pass de eval-suite em MMLU, GPQA-Diamond, HumanEval e MATH-500, eficiência de FLOPs, disciplina de GPU-hour cost e a disciplina de matar ablations que falham em elevar evals. Este guia cobre de junior a lead com métricas concretas, as ferramentas que importam (PyTorch, JAX, FSDP, DeepSpeed ZeRO, Megatron-LM, Triton, RLHF, DPO, golden-trace replay) e o vocabulário que separa research engineers de ML engineers genéricos.
Boas práticas para CV de Middle AI Research Engineer
Seja o on-call nomeado de pelo menos um training run real. Research engineers pleno são comprados na linha 'primary on-call para o 7B dense run, 96% wall-clock sem crash em 256 H100s'. Sem um named owner role em um training run real, você ainda é um senior junior.
Quantifique eficiência de FLOPs, não apenas speedups. 'Elevou MMLU 5-shot em 2,4 pontos no mesmo FLOPs budget' é mais credível do que 'training 40% mais rápido' porque frontier labs sempre medem qualidade em compute constante. Pareie cada speedup com o que foi mantido constante.
Mostre ao menos uma ablation que você matou. 'Matei a synthetic-data run depois que ablation de eval mostrou -0,3 em GPQA-Diamond' é o bullet que sinaliza maturidade de research engineer. Prova que você troca compute por evidência e abandona branches de sunk-cost; essa é a parte que hiring committees mais agressivamente investigam.
Escolha um post-training stack e tenha ownership dele. SFT to DPO to RLHF to RLAIF é o trio moderno de post-training; CVs pleno devem nomear quais passos você escreveu, quais kernels você desenvolveu (ex.: fused MoE routing em Triton) e qual head-to-head win rate se moveu.
Mentore e padronize. Um bullet como 'mentorei 2 junior research engineers em suas primeiras rotações de ablation-owner e padronizei o post-training eval template' é o sinal mais limpo de que você está pronto para senior.
Erros comuns no CV de Middle AI Research Engineer
- Soar como senior MLE em vez de research engineer
Por que isso prejudica: Bullets como 'reduzi p99 latency de 2,5s para 180ms' num CV de research engineer sinalizam que você otimiza serving, não training quality. Screeners de frontier lab encaminham esses CVs para applied-AI em vez de research-engineer pipelines.
Como corrigir: Reformule em unidades de research engineer: eval lift num benchmark nomeado, eficiência de FLOPs em qualidade constante, percentual de training-run completion, ablation kill rate.
- Nenhum ablation kill em lugar nenhum do CV
Por que isso prejudica: Research engineers pleno que nunca mataram uma ablation soam como compute-burners. Hiring committees explicitamente investigam 'me conte sobre um experimento que você parou'.
Como corrigir: Adicione um bullet que nomeie o branch morto, a eval que matou ele e os GPU-hours redirecionados. Esse é frequentemente o bullet que empurra a oferta um nível para cima.
- Sinal de ownership em training run faltando
Por que isso prejudica: Sem 'primary on-call' ou 'ownership do 7B run' ou 'liderei o tier de distillation 13B', CVs pleno soam como uma pessoa que contribuiu em runs que outras pessoas tinham ownership.
Como corrigir: Escolha um run, reivindique-o explicitamente e reporte o número de reliability (% wall-clock sem crash) mais a estratégia de paralelismo (FSDP-Z3, activation checkpointing, tensor parallel).
Dicas rápidas de CV para Middle AI Research Engineer
Reivindique um named on-call run. Sem um bullet de primary on-call você soa como junior+.
Mostre um ablation kill, com a eval que matou ele e os GPU-hours redirecionados.
Escolha um post-training stack (SFT/DPO/RLHF/RLAIF) e tenha ownership explícito dele.
Um bullet de Triton kernel ou de NCCL-tuning adiciona meio nível de credibilidade.
Mentore e padronize. CVs pleno que incluem 'mentorei 2 juniors e padronizei o eval template' convertem visivelmente melhor.
Perguntas frequentes
Certificações recomendadas
Preparação para entrevistas
Entrevistas de AI Research Engineer em frontier labs combinam rounds de paper-reading, take-home reproductions, distributed-training systems design e um painel de ablation-design. Espere ler um paper recente, esboçar uma training-recipe e um plano de ablation e responder 'o que você mataria primeiro e por quê?'. Rounds de senior+ adicionam um exercício de eval-harness design e um round de research-area architecture (post-training, inference-time compute, multimodal alignment). Code rounds favorecem perguntas de FSDP / Triton / NCCL ao invés de leetcode.
Perguntas frequentes
Perguntas comuns:
- Me conte sobre um training run do qual você teve ownership end-to-end. O que quebrou?
- Me conduza por uma ablation que você matou.
- Como você decidiu entre SFT, DPO e RLHF para uma dada tarefa?
- Explique um Triton ou CUDA kernel que você escreveu e o speedup vs baseline PyTorch.
- Desenhe um eval pipeline que captura silent regressions em post-training.
Dicas: Traga um artefato real de run-book (anonimizado) para discutir. Recruiters nesse nível se importam mais com o bullet de kill do que com o de ship. Esteja pronto para defender eficiência de FLOPs em qualidade constante.