Skip to content
Tecnologia & EngenhariaJunior

Exemplo de currículo Junior AI Research Engineer

Exemplo de currículo profissional Junior AI Research Engineer. Modelo otimizado para ATS.

Faixa salarial Junior (US)

$200,000 - $300,000

Por que este currículo funciona

Verbos que sinalizam ownership de research-to-prod

Reproduzi, Desenvolvi, Perfilei, Estendi, Implementei. Frontier labs procuram verbos que provem que você consegue pegar um paper e transformá-lo em código de treinamento executável, não apenas 'usei PyTorch'. Essa é a régua que separa research engineers de MLEs genéricos.

Números de eval e training-run, não vibes

Dentro de 0,6 pontos do HumanEval pass@1, 38 ablation runs, 17% das GPU-hours, de 95 minutos para 22 minutos, de 11% para menos de 2%, 1.7x throughput. Research engineers são julgados por benchmarked deltas; sem número, sua ablation é folclore.

Rigor e disciplina de FLOPs visíveis em cada bullet

Não é 'treinou um modelo', mas 'em 3 tamanhos de modelo destilados' e 'as 4 configurações que sobreviveram ao golden-trace eval replay'. Frontier labs contratam por rigor: ablations que provam uma hipótese, não training runs que queimam compute. Essa é a parte que CVs com sabor de MLE sempre erram.

Sinal de colaboração, mesmo em nível de intern

Em dupla com dois senior research engineers; entrou em 3 internal training stacks. Mesmo como intern, prove que você entrega em codebases compartilhados dos quais outros pesquisadores dependem. Esse NÃO é um papel de MLE; é um papel paper-to-codebase com peer reviewers.

Stack nomeada na camada que um frontier lab se importa

Triton kernel, FSDP-Z2 sharding, golden-trace replay, EleutherAI lm-evaluation-harness. Não escreva 'PyTorch'; escreva a camada específica do training stack que você tocou. É assim que recruiters de research engineer separam hobbyists de contributors.

Habilidades essenciais

  • Python
  • PyTorch
  • JAX
  • Hugging Face Transformers
  • Slurm
  • FSDP
  • Weights and Biases
  • lm-evaluation-harness
  • Triton
  • CUDA
  • DeepSpeed-Z2
  • Hydra
  • MMLU
  • GPQA-Diamond
  • HumanEval
  • MATH-500
  • vLLM

Melhore seu currículo

Templates e exemplos de CV de AI Research Engineer de intern a lead, escritos para o job spec real de frontier lab. O papel vive entre o research scientist e o MLE de produção: você transforma papers em código de treinamento e inferência executável, tem ownership do eval harness, roda ablations e entrega componentes de frontier model. Recruiters em Anthropic, OpenAI, Google DeepMind, FAIR, NVIDIA Research, Cohere e Apple AIML procuram sinais bem específicos: turnaround paper-to-checkpoint, percentuais de training-run reliability, taxas de pass de eval-suite em MMLU, GPQA-Diamond, HumanEval e MATH-500, eficiência de FLOPs, disciplina de GPU-hour cost e a disciplina de matar ablations que falham em elevar evals. Este guia cobre de junior a lead com métricas concretas, as ferramentas que importam (PyTorch, JAX, FSDP, DeepSpeed ZeRO, Megatron-LM, Triton, RLHF, DPO, golden-trace replay) e o vocabulário que separa research engineers de ML engineers genéricos.

Boas práticas para CV de Junior AI Research Engineer

  1. Lidere com evidência paper-to-codebase, não com disciplinas cursadas. Um recruiter de frontier lab se importa se você consegue ler um paper recente (AlphaCodium, MoE routing, speculative decoding) e reproduzi-lo dentro de um training stack FSDP-based existente. Fixe uma reprodução dessas no topo do seu CV com o eval delta que você mediu contra os números reportados (ex.: 'dentro de 0,6 pontos do HumanEval pass@1').

  2. Nomeie a eval suite, nunca diga apenas 'avaliei o modelo'. MMLU, GPQA-Diamond, MATH-500, HumanEval, AIME, BBH. A eval é a unidade de moeda para research engineers; uma eval sem nome é uma dimensão faltante. Mostre os splits exatos e shot counts (5-shot MMLU, 0-shot GPQA-Diamond) dos quais você teve ownership.

  3. Mostre pensamento de ablation, não apenas pensamento de treinamento. Um junior que consegue rodar 5 ablations para isolar uma variável é mais contratável que um que lançou um único 'big' run. Cada bullet deve deixar claro o que a ablation testou e qual eval lift confirmou ou matou ela.

  4. Use o vocabulário real do training stack. FSDP-Z2/Z3, activation checkpointing, NCCL, Slurm, Triton kernels, Hydra configs, Weights and Biases sweeps. Essas são as palavras na JD; se seu CV usa 'distributed training' você soa como MLE genérico.

  5. Abra uma contribuição open-source pequena, mas real. Um PR mergeado em lm-evaluation-harness, trl, vLLM ou um Triton kernel vence cinco certificados Coursera. O link do PR dentro do bullet é o que te leva à entrevista.

Erros comuns no CV de Junior AI Research Engineer

  1. Confundir esse papel com MLE / applied-AI engineer

Por que isso prejudica: Recruiters de frontier lab rejeitam bullets como 'construí um RAG pipeline com LangChain e Pinecone' em pipelines de research engineer. Plumbing de RAG é sinal de applied-AI; research engineering é paper-to-checkpoint. Misturar os dois diz ao screener que você não sabe ao que está se candidatando.

Como corrigir: Tire bullets de LangChain / Pinecone / FastAPI da seção de topo. Substitua por trabalho de eval-harness, FSDP, Triton kernel, ablation e reprodução. Reserve bullets de LangChain para uma seção 'Outros', se for o caso.

  1. Listar 'usei PyTorch' ou 'treinei um modelo' sem eval nomeada

Por que isso prejudica: Um bullet de research engineer sem uma eval nomeada (MMLU, GPQA-Diamond, MATH-500, HumanEval) é uma alegação folclórica. Recruiters não conseguem calibrar o trabalho, então caem no padrão junior.

Como corrigir: Sempre inclua o nome da eval, o shot count e ou um número absoluto ou um delta (dentro de 0,6 pontos do HumanEval pass@1, elevou MMLU 5-shot em 2,4 pontos).

  1. Nenhuma disciplina de FLOPs / GPU-hour mostrada em nenhum lugar

Por que isso prejudica: Frontier labs gerenciam compute como gate. Um junior que já mostra consciência de GPU-hour ('identifiquei uma regressão de activation-checkpoint que desperdiçava 17% das GPU-hours por epoch') se destaca instantaneamente porque a maioria dos juniors queima compute e nunca conta.

Como corrigir: Adicione ao menos um número expresso em GPU-hours, FLOPs budget ou step-time. Mesmo em trabalho de internship, faça profile e reporte o custo das suas ablations.

Dicas rápidas de CV para Junior AI Research Engineer

  1. Uma reprodução vence cinco cursos. Escolha um paper publicado de um frontier lab nos últimos 12 meses, reproduza sua training recipe dentro de um stack FSDP-based, meça o eval delta contra os números reportados e coloque esse bullet no topo.

  2. Sempre nomeie a eval, o shot count e o delta. 'MMLU 5-shot, +2,4 pontos'. Nunca 'avaliado em benchmarks'.

  3. Trate GPU-hours como moeda desde o primeiro dia. Faça profile, reporte, otimize. Bullets que referenciam GPU-hours sinalizam energia future-senior.

  4. Use CV sob vaga & Carta de Apresentação para casar seu CV com o vocabulário exato da JD do frontier lab (FSDP-Z3, RLHF, golden-trace replay) sem perder seus bullets reais.

Perguntas frequentes

AI Research Engineers transformam research papers em código de treinamento e inferência executável, rodam ablations, têm ownership do eval harness e entregam componentes de frontier model. Eles ficam entre research scientists (que enquadram a hipótese) e applied-AI / MLE engineers (que produtizam modelos para os usuários). No dia a dia desenvolvem training recipes, ajustam configurações de FSDP / tensor-parallel / activation-checkpoint, escrevem Triton ou CUDA kernels para hot paths, rodam centenas de ablations contra eval suites nomeadas (MMLU, GPQA-Diamond, HumanEval, MATH-500), matam experimentos que falham em elevar evals e escrevem os post-mortems e run-books que outras research teams reusam.

MLE / applied-AI engineers têm ownership de sistemas de produção: serving infrastructure, RAG pipelines, latência, uptime, model deployment. AI Research Engineers têm ownership de training quality, eval harnesses, rigor de ablation, eficiência de FLOPs e dos kernels e estratégias de paralelismo que fazem um training run em frontier-scale terminar sem crash. O bullet de MLE é 'p99 latency 180ms a 50M req/dia'. O bullet de research engineer é '94% wall-clock-without-crash em 4096 H100s a 70B parameters via FSDP-Z3 + selective activation checkpointing'. Ambas são carreiras válidas; recruiters rejeitam CVs que confundem as duas.

Não. O papel de AI Research Engineer é intencionalmente distinto de research scientist; muitos ICs em Anthropic, OpenAI, DeepMind, FAIR e Cohere entraram com um MS forte mais contribuições open-source. PhDs são comuns em senior+ mas não obrigatórios. O que importa: uma reprodução de um paper recente, um PR mergeado em lm-evaluation-harness / trl / vLLM / um Triton kernel, eval deltas nomeados e experiência de treinamento FSDP-based. Níveis de research engineer senior+ cada vez mais esperam PhD ou profundidade equivalente em indústria (5+ anos em um training stack frontier-adjacent).

MMLU (knowledge), GPQA-Diamond (graduate-level reasoning), MATH-500 (math), HumanEval / MBPP / LiveCodeBench (code), AIME (competition math), BBH (Big-Bench Hard) e cada vez mais evals task-specific como SWE-bench (agent). Cite o shot count (ex.: 5-shot MMLU, 0-shot GPQA-Diamond) e ou um número absoluto ou um delta contra um baseline nomeado. 'Avaliado em benchmarks' genérico é um CV killer; as escolhas de eval de um research engineer são por si só um sinal do que o papel de origem se importava.

Escolha um paper de um frontier lab nos últimos 12 meses e reproduza sua training recipe em um stack FSDP-based real. Rode pelo menos 30 ablations, meça deltas em uma eval nomeada (MMLU, GPQA-Diamond, HumanEval) e entregue um PR open-source mergeado (extensão de lm-evaluation-harness, uma trl recipe, um Triton kernel, uma otimização de vLLM). Uma reprodução com um eval delta real e um PR real é mais credível do que dez certificados Coursera.

Certificações recomendadas

Preparação para entrevistas

Entrevistas de AI Research Engineer em frontier labs combinam rounds de paper-reading, take-home reproductions, distributed-training systems design e um painel de ablation-design. Espere ler um paper recente, esboçar uma training-recipe e um plano de ablation e responder 'o que você mataria primeiro e por quê?'. Rounds de senior+ adicionam um exercício de eval-harness design e um round de research-area architecture (post-training, inference-time compute, multimodal alignment). Code rounds favorecem perguntas de FSDP / Triton / NCCL ao invés de leetcode.

Perguntas frequentes

Perguntas comuns:

  • Me conduza pelo paper mais recente que você reproduziu e o que mediu.
  • Explique FSDP-Z2 vs FSDP-Z3 e quando você escolheria cada um.
  • Como você lê um resultado de ablation e decide que ele eleva uma eval?
  • O que é activation checkpointing e qual o custo dele?
  • Me mostre seu Weights and Biases sweep favorito.

Dicas: Lidere com o eval delta que você mediu, não com código. Tenha um paper que você consegue defender profundamente. Esteja pronto para ler 10 linhas do training script de outra pessoa ao vivo e identificar a estratégia de paralelismo e recompute.

Atualizado: