Skip to content
Технологии и Инженерия

Шаблон CV Junior AI ресерч-инженер

Готовый шаблон CV для Junior AI ресерч-инженер. Оптимизирован под ATS-системы.

Выберите свой уровень

Выберите уровень опыта для подходящего шаблона CV

Почему это CV работает

Глаголы, доказывающие переход от paper к runnable training code

Воспроизвёл, Провёл, Запрофилировал, Расширил, Реализовал, Написал. Рекрутер frontier-лаборатории ищет глаголы, доказывающие, что вы превратили статью в обучающий код, а не 'использовал PyTorch'. Это бар, отделяющий research-инженера от MLE.

Числа eval и тренировки, а не общие фразы

В пределах 0.6 пункта от HumanEval pass@1, 38 ablation-прогонов, 17% GPU-часов, 1.7x throughput. Research-инженера измеряют benchmarked-дельтами; без числа ablation остаётся фольклором.

Строгость и FLOPs-дисциплина в каждом пункте

Не 'обучил модель', а 'на 3 размерах дистиллированной модели' и '4 настроек, переживших golden-trace eval-replay'. Frontier-лаборатории нанимают за rigor: за ablation, доказывающие гипотезу, а не за прогоны, сжёгшие compute. Это то, что MLE-резюме всегда упускают.

Командный сигнал даже на стажировке

В паре с двумя senior research engineers; попавшее в 3 внутренних training-stack. Покажите, что вы пишете в shared codebase, на которые опираются другие исследователи. Это НЕ MLE-роль; это paper-to-codebase роль с peer-reviewers.

Стек, названный на уровне frontier-лаборатории

Triton-ядро, FSDP-Z2 шардинг, golden-trace replay, EleutherAI lm-evaluation-harness. Не пишите 'PyTorch'; пишите конкретный слой training-stack, к которому прикоснулись. Так research-engineer рекрутер отличает любителя от контрибьютора.

Переключайтесь между уровнями для конкретных рекомендаций

Ключевые навыки

  • Python
  • PyTorch
  • JAX
  • Hugging Face Transformers
  • Slurm
  • FSDP
  • Weights and Biases
  • lm-evaluation-harness
  • Triton
  • CUDA
  • DeepSpeed-Z2
  • Hydra
  • MMLU
  • GPQA-Diamond
  • HumanEval
  • MATH-500
  • vLLM
  • FSDP-Z3
  • DeepSpeed ZeRO
  • Megatron-LM
  • NCCL profiling
  • SFT
  • DPO
  • RLHF
  • RLAIF
  • PPO
  • Hugging Face TRL
  • DeepSpeed-MII
  • Triton kernels
  • NCCL
  • Rust
  • Tensor Parallel
  • Activation Checkpointing
  • Speculative Decoding
  • Reward Modeling
  • Constitutional AI
  • Golden-trace Replay
  • Scaling Laws
  • Inference-Time Compute
  • Mech-Interp Probes
  • Mixture-of-Experts
  • RLHF/DPO/RLAIF
  • Multimodal Alignment
  • Mech-Interp
  • Red-Team Eval
  • Eval-Harness Contracts
  • FLOPs Accounting
  • Орг-дизайн
  • Research-стратегия
  • Hiring rubrics
  • Планирование compute-бюджета

Улучшите своё CV

Зарплаты (US)

Junior
$200,000 - $300,000
Middle
$300,000 - $500,000
Senior
$500,000 - $900,000
Lead
$700,000 - $1,500,000

Карьерный рост

AI Research Engineering - один из самых рычажных треков во frontier-лабораториях. Прогрессия: ablation-owner / eval-harness contributor (junior) -> small-model training-run lead (middle) -> large-model training-run-tier lead (senior) -> research-area architect (lead, MTS, staff). Каждый уровень добавляет compute-масштаб, eval-suite ownership и reusable-артефакты. Потолок для IC - staff или principal research engineer; многие lead также пивотят в management research-инжиниринга (head of pretraining, head of post-training).

  1. JuniorMiddle1-3 years

    Воспроизвести 2-3 статьи frontier-лаборатории с named eval-дельтами, залить один принятый PR в lm-evaluation-harness / trl / vLLM, владеть small-model ablation-серией end-to-end, профилировать и репортить GPU-hour cost, отгрузить одно Triton-ядро или NCCL-tuning fix и начать быть named on-call хотя бы одного вторичного training-run.

    • FSDP-Z3 + activation checkpointing
    • SFT и DPO post-training
    • Авторство Triton-ядер
    • Golden-trace replay в eval-harness
    • FLOPs accounting
  2. MiddleSenior2-4 years

    Быть primary on-call реального training-run (>=7B параметров) с процентом надёжности, убить минимум один multi-week ablation с named eval-доказательством, проментора 2 джунов через первую ablation-owner ротацию, написать reusable-артефакт (post-training run-book, eval template, kernel pack) и начать влиять на eval-harness contract, используемый соседними командами.

    • RLHF и RLAIF post-training
    • NCCL collective tuning
    • Tensor parallel + pipeline parallel
    • Speculative decoding stacks
    • Reusable run-book
  3. SeniorLead3-5 years

    Владеть frontier-tier training-run (4-значный GPU-count, 70B+ параметров, multi-week длительность), произвести senior-only kill (multi-week инициатива остановлена после eval ablation, сотни тысяч GPU-часов перенаправлены), проментора 2 IC до research-engineer senior, написать company-wide eval-harness contract или FLOPs accounting library и партнёрить с VP-level peer над roadmap research-области.

    • Архитектура research-области (post-training, inference-time compute, multimodal alignment)
    • Владение multi-million GPU-hour бюджетом
    • Дизайн eval-harness contract
    • Дизайн promotion-ladder и механизм ротации IC
    • Кросс-команд партнёрства с VP-level peers

Смежные пути: research scientist (больше публикаций, меньше кода), MLE / production AI engineer (serving и infra в масштабе), исследователь mech-interp (специализированная ветка), manager research-инжиниринга (people-лидерство), inference-systems engineer (специалист по vLLM / TensorRT / speculative decoding). Некоторые research-инженеры пивотят в AI safety / red-team роли или основывают research-tooling стартапы (eval-платформы, training-stack tooling).

Шаблоны и примеры CV для AI ресерч-инженера от стажёра до lead, написанные под реальные вакансии frontier-лабораторий. Роль живёт между research scientist и production MLE: вы превращаете статьи в обучающий и inference-код, владеете eval-harness, ведёте ablation, шипите компоненты frontier-моделей. Рекрутеры в Anthropic, OpenAI, Google DeepMind, FAIR, NVIDIA Research, Cohere и Apple AIML ищут очень конкретные сигналы: paper-to-checkpoint turnaround, надёжность training-run в процентах, pass-rate на MMLU, GPQA-Diamond, HumanEval, MATH-500, FLOPs-эффективность, дисциплину GPU-hour cost и готовность убивать ablation, не поднимающие evals. Это руководство покрывает junior-lead с конкретными метриками, нужным стеком (PyTorch, JAX, FSDP, DeepSpeed ZeRO, Megatron-LM, Triton, RLHF, DPO, golden-trace replay) и формулировками, отделяющими research-инженера от обычного ML-инженера.

Часто задаваемые вопросы

AI ресерч-инженер превращает статьи в обучающий и inference-код, ведёт ablation, владеет eval-harness и шипит компоненты frontier-моделей. Сидит между research scientist (формулирует гипотезу) и applied-AI / MLE-инженером (продуктивизирует модели для пользователей). День за днём пишет training-recipe, тюнит FSDP / tensor-parallel / activation-checkpoint настройки, авторит Triton или CUDA-ядра на горячих путях, гоняет сотни ablation против названных eval-suite (MMLU, GPQA-Diamond, HumanEval, MATH-500), убивает эксперименты, не поднимающие evals, и пишет post-mortem и run-book, переиспользуемые другими research-командами.

MLE / applied-AI владеет production-системами: serving-инфраструктура, RAG-pipelines, latency, uptime, deployment. AI ресерч-инженер владеет качеством обучения, eval-harness, ablation-rigor, FLOPs-эффективностью и ядрами/parallelism-стратегиями, которые позволяют frontier-scale training-run завершиться без крэша. Bullet MLE - 'p99 latency 180мс на 50M req/day'. Bullet research-engineer - '94% wall-clock-without-crash на 4096 H100s при 70B параметров через FSDP-Z3 + selective activation checkpointing'. Обе карьеры валидны; рекрутеры отвергают CV, путающие их.

Нет. Роль AI ресерч-инженера сознательно отделена от research scientist; многие IC в Anthropic, OpenAI, DeepMind, FAIR и Cohere пришли с сильной MS и open-source-вкладом. PhD частый на senior+ но необязательный. Важны: воспроизведение свежей статьи, принятый PR в lm-evaluation-harness / trl / vLLM / Triton-ядро, named eval-дельты и опыт FSDP-based обучения. Senior+ research-engineer всё чаще предполагает PhD или эквивалентную индустриальную глубину (5+ лет на frontier-adjacent training-стеке).

MMLU (знания), GPQA-Diamond (рассуждения на уровне graduate), MATH-500 (математика), HumanEval / MBPP / LiveCodeBench (код), AIME (олимпиадная математика), BBH (Big-Bench Hard) и всё чаще task-specific вроде SWE-bench (agent). Указывайте shot-count (5-shot MMLU, 0-shot GPQA-Diamond) и либо абсолютное число, либо дельту против named baseline. Общее 'оценил на benchmarks' убивает CV; выбор evals research-инженера сам по себе сигнал того, чем заботилась роль, из которой вы пришли.

Возьмите одну статью frontier-лаборатории за последние 12 месяцев и воспроизведите её training-recipe на реальном FSDP-стеке. Прогоните минимум 30 ablation, замерьте дельты на названном eval (MMLU, GPQA-Diamond, HumanEval) и залейте принятый open-source PR (расширение lm-evaluation-harness, recipe для trl, Triton-ядро, оптимизация vLLM). Одно воспроизведение с реальной eval-дельтой и реальным PR убедительнее десяти курсов Coursera.