Skip to content
Technologie & Ingénierie

Exemple de CV Junior AI Research Engineer

Exemple de CV professionnel Junior AI Research Engineer. Modèle optimisé ATS.

Choisissez votre niveau

Sélectionnez votre niveau d'expérience pour un modèle de CV adapté

Pourquoi ce CV fonctionne

Verbes qui signalent l'appropriation research-to-prod

Reproduit, Conçu, Profilé, Étendu, Implémenté. Les frontier labs scrutent les verbes qui prouvent que tu peux prendre un papier et le transformer en code de training exécutable, pas seulement 'utilisé PyTorch'. C'est la barre qui sépare les research engineers des MLE génériques.

Chiffres d'eval et de training-run, pas du flou

À moins de 0,6 point du HumanEval pass@1, 38 ablation runs, 17 % des GPU-hours, 1,7x throughput. Les research engineers sont jugés sur des deltas mesurés ; sans le chiffre, ton ablation reste folklore.

Rigueur et discipline FLOPs visibles dans chaque bullet

Pas 'entraîné un modèle' mais 'sur 3 tailles de modèles distillés' et 'les 4 paramétrages qui ont survécu au golden-trace eval replay'. Les frontier labs recrutent pour la rigueur : des ablations qui prouvent une hypothèse, pas des training runs qui brûlent du compute. C'est la part que les CV au goût MLE ratent toujours.

Signal de collaboration, même au niveau intern

En binôme avec deux research engineers seniors ; intégré dans 3 training stacks internes. Même en stage, prouve que tu pousses dans des codebases partagées dont d'autres chercheurs dépendent. Ce N'est PAS un rôle MLE ; c'est un rôle paper-to-codebase avec des reviewers pairs.

Stack nommé à la couche qui intéresse un frontier lab

Triton kernel, FSDP-Z2 sharding, golden-trace replay, EleutherAI lm-evaluation-harness. N'écris pas 'PyTorch' ; écris la couche précise du training stack que tu as touchée. C'est ainsi que les recruteurs research-engineer distinguent les amateurs des contributeurs.

Changez de niveau pour des recommandations spécifiques

Compétences clés

  • Python
  • PyTorch
  • JAX
  • Hugging Face Transformers
  • Slurm
  • FSDP
  • Weights and Biases
  • lm-evaluation-harness
  • Triton
  • CUDA
  • DeepSpeed-Z2
  • Hydra
  • MMLU
  • GPQA-Diamond
  • HumanEval
  • MATH-500
  • vLLM
  • FSDP-Z3
  • DeepSpeed ZeRO
  • Megatron-LM
  • NCCL profiling
  • SFT
  • DPO
  • RLHF
  • RLAIF
  • PPO
  • Hugging Face TRL
  • DeepSpeed-MII
  • Triton kernels
  • NCCL
  • Rust
  • Tensor Parallel
  • Activation Checkpointing
  • Speculative Decoding
  • Reward Modeling
  • Constitutional AI
  • Golden-trace Replay
  • Scaling Laws
  • Inference-Time Compute
  • Mech-Interp Probes
  • Mixture-of-Experts
  • RLHF/DPO/RLAIF
  • Multimodal Alignment
  • Mech-Interp
  • Red-Team Eval
  • Eval-Harness Contracts
  • FLOPs Accounting
  • Org Design
  • Research Strategy
  • Hiring Rubrics
  • Compute Budget Planning

Améliorez votre CV

Fourchettes salariales (US)

Junior
$200,000 - $300,000
Middle
$300,000 - $500,000
Senior
$500,000 - $900,000
Lead
$700,000 - $1,500,000

Évolution de carrière

L'AI Research Engineering est l'un des tracks à plus fort levier dans les frontier labs. La progression va d'ablation-owner / contributeur d'eval-harness (junior) à small-model training-run lead (intermédiaire) à large-model training-run-tier lead (senior) à architecte de research area (lead, MTS, staff). Chaque niveau ajoute de l'échelle de compute, de l'ownership d'eval-suite et des artefacts réutilisables. Le plafond IC est staff ou principal research engineer ; beaucoup de leads pivotent aussi vers le management research-engineering (head of pretraining, head of post-training).

  1. JuniorMiddle1-3 years

    Reproduire 2-3 papiers frontier-lab avec deltas d'eval nommés, contribuer une PR mergée à lm-evaluation-harness / trl / vLLM, piloter une série d'ablations small-model end-to-end, profiler et rapporter le coût GPU-hour, shipper un Triton kernel ou un fix NCCL-tuning, et commencer à être le named on-call d'au moins un training run secondaire.

    • FSDP-Z3 + activation checkpointing
    • SFT and DPO post-training
    • Triton kernel authoring
    • Eval-harness golden-trace replay
    • FLOPs accounting
  2. MiddleSenior2-4 years

    Être primary on-call d'un vrai training run (>=7B paramètres) avec un pourcentage de fiabilité, tuer au moins une ablation multi-semaines avec une eval evidence nommée, mentorer 2 juniors lors de leurs premières ablation-owner rotations, rédiger un artefact réutilisable (post-training run-book, eval template, kernel pack), et commencer à influencer l'eval-harness contract utilisé par les équipes adjacentes.

    • RLHF and RLAIF post-training
    • NCCL collective tuning
    • Tensor parallel + pipeline parallel
    • Speculative decoding stacks
    • Reusable run-books
  3. SeniorLead3-5 years

    Piloter un training run frontier-tier (GPU count à 4 chiffres, 70B+ paramètres, durée multi-semaines), produire un kill réservé aux seniors (initiative multi-semaines arrêtée après une eval ablation, des centaines de milliers de GPU-hours réorientés), mentorer 2 ICs au niveau research-engineer senior, rédiger un company-wide eval-harness contract ou une FLOPs accounting library, et collaborer avec un peer VP-level sur la roadmap de research area.

    • Research-area architecture (post-training, inference-time compute, multimodal alignment)
    • Multi-million GPU-hour budget ownership
    • Eval-harness contract design
    • Promotion ladder design and IC rotation mechanisms
    • Cross-team partnerships with VP-level peers

Chemins adjacents : research scientist (plus de publications, moins de code), MLE / production AI engineer (serving et infra à grande échelle), mech-interp researcher (branche spécialisée du domaine), research-engineering manager (people leadership), inference-systems engineer (spécialiste vLLM / TensorRT / speculative decoding). Certains research engineers pivotent aussi vers des rôles AI safety / red-team-specific ou fondent des startups de research-tooling (eval platforms, training-stack tooling).

Templates et exemples de CV AI Research Engineer du stage au lead, écrits pour le vrai job spec frontier-lab. Le rôle vit entre le research scientist et le MLE de production : tu transformes des papiers en code de training et d'inference exécutable, tu pilotes l'eval harness, tu lances des ablations et tu shippes des composants de modèles frontier. Les recruteurs chez Anthropic, OpenAI, Google DeepMind, FAIR, NVIDIA Research, Cohere et Apple AIML scannent des signaux très précis : turnaround paper-to-checkpoint, pourcentages de fiabilité de training-run, taux de réussite sur les eval-suites MMLU, GPQA-Diamond, HumanEval et MATH-500, efficacité FLOPs, discipline sur le coût GPU-hour, et la discipline de tuer les ablations qui ne font pas monter les evals. Ce guide couvre du junior au lead avec des métriques concrètes, les outils qui comptent (PyTorch, JAX, FSDP, DeepSpeed ZeRO, Megatron-LM, Triton, RLHF, DPO, golden-trace replay), et la formulation qui sépare les research engineers des ML engineers génériques.

Questions fréquemment posées

Les AI Research Engineers transforment des papiers de recherche en code de training et d'inference exécutable, lancent des ablations, pilotent l'eval harness, et shippent des composants de modèles frontier. Ils sont assis entre les research scientists (qui posent l'hypothèse) et les applied-AI / MLE engineers (qui productionnent les modèles pour les utilisateurs). Au quotidien, ils écrivent des training recipes, tunent les paramètres FSDP / tensor-parallel / activation-checkpoint, écrivent des kernels Triton ou CUDA pour les hot paths, lancent des centaines d'ablations contre des eval suites nommées (MMLU, GPQA-Diamond, HumanEval, MATH-500), tuent les expériences qui ne font pas monter les evals, et écrivent les post-mortems et run-books que d'autres équipes de recherche réutilisent.

Les MLE / applied-AI engineers pilotent les systèmes de production : serving infrastructure, RAG pipelines, latence, uptime, déploiement de modèles. Les AI Research Engineers pilotent la qualité de training, les eval harnesses, la rigueur d'ablation, l'efficacité FLOPs, et les kernels et stratégies de parallélisme qui font qu'un training run frontier-scale finit sans crash. Le bullet MLE c'est 'p99 latence 180ms à 50M req/jour'. Le bullet research-engineer c'est '94 % wall-clock-without-crash sur 4096 H100s à 70B paramètres via FSDP-Z3 + selective activation checkpointing'. Les deux sont des carrières valides ; les recruteurs rejettent les CV qui les confondent.

Non. Le rôle AI Research Engineer est intentionnellement distinct de research scientist ; beaucoup d'ICs chez Anthropic, OpenAI, DeepMind, FAIR et Cohere ont rejoint avec un solide MS plus des contributions open-source. Les PhDs sont courants au niveau senior+ mais pas requis. Ce qui compte : une reproduction d'un papier récent, une PR mergée dans lm-evaluation-harness / trl / vLLM / un Triton kernel, des deltas d'eval nommés, et de l'expérience training FSDP-based. Les niveaux research-engineer senior+ attendent de plus en plus un PhD ou une profondeur industrielle équivalente (5+ ans dans un training stack frontier-adjacent).

MMLU (connaissances), GPQA-Diamond (raisonnement de niveau graduate), MATH-500 (math), HumanEval / MBPP / LiveCodeBench (code), AIME (math de compétition), BBH (Big-Bench Hard), et de plus en plus des evals task-specific comme SWE-bench (agent). Indique le shot count (par ex. 5-shot MMLU, 0-shot GPQA-Diamond) et soit un chiffre absolu soit un delta contre un baseline nommé. Du 'évalué sur des benchmarks' générique est un CV-killer ; les choix d'eval d'un research engineer sont eux-mêmes un signal de ce dont le rôle d'origine se souciait.

Choisis un papier d'un frontier lab dans les 12 derniers mois et reproduis sa training recipe dans un vrai stack FSDP-based. Lance au moins 30 ablations, mesure les deltas sur une eval nommée (MMLU, GPQA-Diamond, HumanEval), et shippe une PR open-source mergée (extension lm-evaluation-harness, recette trl, Triton kernel, optimisation vLLM). Une reproduction avec un vrai delta d'eval et une vraie PR est plus crédible que dix certificats Coursera.