Skip to content
Новые ТехнологииMiddle

Шаблон CV Middle Инженер по безопасности ИИ

Готовый шаблон CV для Middle Инженер по безопасности ИИ. Оптимизирован под ATS-системы.

Зарплата Middle (US)

$260,000 - $400,000

Почему это CV работает

Глаголы ownership safety-программ

Владел, Написал, Закрыл, Прогнал, Перевёл, Запустил первым, Менторил. Mid-level AI safety ведёт guardrail layer и таксономию, а не ticket в eval. Глаголы должны транслировать выбор.

Цифры safety-исходов, не vanity

ASR с 31 до 9 процентов, FPR с 14 до 3.6 процентов, 14 harm-классов, time-to-mitigation с 11 дней до 38 часов. Mid-level метрики связывают guardrails и таксономии с release-gate решениями.

Tradeoffs и явные kill-решения

Что вы заблокировали, информативнее, чем что выпустили. «Закрыл релиз модели после провала eval-гейта на refusal-recall регрессии» — senior-coded строка.

Cross-org safety-влияние, не сольная eval-работа

Trust and Safety reviewer, alignment-applied team, responsible-AI program lead, Microsoft AI Red Team. Mid-level AI safety меняет, как организация думает о харме, а не только как она его скорит.

Конкретные safety-системы и движения

NeMo Guardrails policy layer, Llama Guard 2 fine-tune, Inspect AI плюс simple-evals, MLCommons AILuminate. Конкретика доказывает, что вы относитесь к safety как к системе.

Необходимые навыки

  • Владение guardrail layer
  • Авторство harm-таксономии
  • Llama Guard 2 fine-tuning
  • NeMo Guardrails policy authoring
  • Inspect AI
  • MLCommons AILuminate
  • Cross-org калибровка рубрик
  • Дизайн release-gate eval
  • Lakera Guard
  • Protect AI Guardian
  • Multimodal jailbreak triage
  • PAIR и AutoDAN chains
  • Microsoft Responsible AI Standard
  • OpenAI Usage Policies
  • NIST AI RMF 1.0
  • Авторство RFC

Улучшите своё CV

Шаблоны и примеры резюме AI Safety Engineer для каждого этапа карьеры. Будь то первый воспроизводимый jailbreak issue, владение production guardrail layer, дизайн release-gate eval suite или учреждение Frontier Safety Council, резюме должно доказывать, что вы относитесь к AI safety как к измеримой инженерной системе, а не как к compliance-постуре или ротации в content-moderation. Хайринг в Anthropic, OpenAI, DeepMind, xAI, NIST AISI и UK AISI сканирует резюме на снижение jailbreak attack success rate (ASR), refusal precision-recall, владение harm-таксономией и release-gate authority. Гайд покрывает стратегии резюме от junior до lead для AI Safety Engineer, с реальным стеком, реальными метриками и языком, отделяющим safety-инжиниринг от generic responsible-AI маркетинга.

Лучшие практики резюме Mid-Level AI Safety Engineer

  1. Открывайте каждую роль буллетом про ownership guardrail-layer или harm-таксономии. «Владел production guardrail layer, прогнал ASR с 31 до 9 процентов» бьёт «контрибьютил в safety evals». Mid-level AI safety ведёт системы, а не eval-тикеты.
  2. Привязывайте eval к release-gate решениям. Mid-level резюме без release-gate authority падают в корзину «safety researcher». Добавьте минимум один буллет, где eval-результат заблокировал, загейтил или переформировал релиз.
  3. Показывайте один явный kill. Закрыл релиз после провала eval-гейта на refusal-recall регрессии. Закрыл guardrail после превышения FPR-порога. Kill-буллеты на этом уровне доказывают суждение сильнее лончей.
  4. Таксономия и guardrail - одна система. Относитесь к harm-таксономии и guardrail layer как к одному стеку. Mid-level аудитория ждёт, что вы видите policy и enforcement вместе.
  5. Покажите внутреннее влияние вне safety-инжиниринга. Trust and Safety reviewer, alignment-applied team, responsible-AI program lead, Microsoft AI Red Team или эквивалент. Mid-level сигнал - менять то, как организация думает о харме, а не только как его скорит.

Частые ошибки в резюме Mid-Level AI Safety Engineer

  1. Читается как researcher-портфолио, а не engineering ownership

Почему вредит: mid-level AI safety резюме, перечисляющие статьи, посты и разовые eval-ы без ownership guardrail layer или harm-таксономии, читаются как research, не engineering. Хайринг во frontier-лабах фильтрует такие резюме в «возможно research».

Как исправить: замените минимум три research-оттенка буллета одним ownership-буллетом с поверхностью, harm-классами и дельтой. «Владел production guardrail layer для внутреннего coding-агента, прогнал ASR с 31 до 9 процентов на 11 harm-категориях» переписывает весь тон.

  1. Нет kill- или release-gate решений

Почему вредит: AI safety программы полны зомби-eval-ов и зомби-guardrail-ов. Mid-level резюме без kill-буллета сигнализирует, что вы не умеете принимать stop-doing или no-go решения. Это блокер для release-gate ролей.

Как исправить: возьмите один заблокированный релиз или один сансетнутый guardrail с проваленной метрикой. «Закрыл релиз модели после провала eval-гейта на refusal-recall регрессии на self-harm классе» - самое senior-coded предложение mid-level резюме.

  1. Смешение авторства policy-таксономии с compliance-бумажками

Почему вредит: mid-level резюме, формулирующие harm-таксономию как «compliance» или «documentation», теряют gating-функцию. Таксономия - контракт, гейтящий релизы; формулировать как бумажку - прятать инжиниринг.

Как исправить: пишите таксономию как принятый артефакт. «Написал policy-таксономию, покрывающую 14 harm-классов, принят Trust and Safety reviewer и alignment-applied team как v2 release-gate input» - нужная форма.

Быстрые советы для резюме Mid-Level AI Safety Engineer

  1. Открывайте каждую роль буллетом про ownership guardrail или таксономии. Поверхность, harm-классы, ASR или FPR дельта - в одном предложении.
  2. Один явный kill на роль. Заблокированный релиз или сансетнутый guardrail доказывает суждение сильнее списка eval-ов.
  3. Привязывайте eval-результат к release-gate решениям. «v2 release-gate input», «загейтил GPT-4 enterprise», «отложил лонч на один цикл».
  4. Упоминайте таксономию и guardrail в одной роли. Mid-level аудитория хочет видеть их как один стек, не два силоса.
  5. Выводите cross-org safety-влияние. Trust and Safety reviewer, alignment-applied team, responsible-AI program lead, Microsoft AI Red Team. По одному на роль хватает.

Часто задаваемые вопросы

AI Safety Engineer пишет и прогоняет adversarial-eval-ы (HarmBench-сценарии, PAIR- или AutoDAN-цепочки), поддерживает guardrail layer (Llama Guard 2, NeMo Guardrails, Lakera Guard) и harm-таксономию, гейтящую релизы, и возвращает воспроизводимое policy-violation evidence владельцам модели и Trust and Safety reviewer. День смешивает harness-работу в Inspect AI с чтением scorecards (ASR, refusal precision-recall, FPR) и согласованием go/no-go решений с release exec council.

Аналитики кибербезопасности защищают инфраструктуру (CVE, сеть, identity); content-модераторы применяют policy платформы к user-контенту; AI Safety Engineer снижает model-level харм: jailbreak, опасный capability uplift (CBRN, cyber), persuasive manipulation и misuse tool-use. Стек метрик другой (ASR, refusal recall, FPR по harm-классам) и стек артефактов другой (eval harness, guardrail layer, harm taxonomy, model card). Смешивать их в резюме — попасть не в ту очередь.

Да для eval harness, guardrail layer и scoring-инфраструктуры. Граница: production-quality код, гейтящий релизы (Inspect AI tasks, Llama Guard 2 wrappers, scoring-пайплайны), а не фичи основной модели. AI Safety Engineer, не способный подключить Inspect AI task end-to-end против Llama Guard 2 стека — функционально policy-researcher с техническим вокабуляром.

Открывайте jailbreak attack success rate (ASR) на названном harm-классе, refusal precision-recall на сайз-промпт-сете, policy-violation false-positive rate на benign-холдауте, покрытие red-team по harm-категориям, time-to-mitigation для нового jailbreak-класса и post-deployment incident rate. Пять чисел по этим осям бьют любую стену прозы про «responsible AI».

Три артефакта: attribution model, связывающая eval-результаты с release-gate решениями и post-deployment incident-ами; coverage scorecard, сравнивающий portfolio harm-классов с capability surface развёрнутой модели; 12-месячный TCO, показывающий стоимость программы на заблокированный или mitigated harm-класс. Вместе они выживают CSO/CFO-ревью; отдельно — ни один.

Когда FPR на benign-холдауте превышает согласованный deployer-facing порог два цикла подряд, когда ASR не двигается после двух итераций тюнинга или когда eval больше не маппится на реальную deployment-поверхность. Поставьте kill-критерии заранее, с явными deployer- и developer-facing порогами; пересматривайте с данными, не с эмоциями.

Рекомендуемые сертификации

Подготовка к собеседованию

Лупы AI Safety Engineer смешивают классическую IC-инженерную панель с тремя safety-специфическими станциями: take-home red-team задача (построить HarmBench scenario pack против незнакомой модели и написать harm-таксономию), live walkthrough eval harness, где вы защищаете coverage и false-positive выборы, и portfolio review, где вы защищаете ASR-дельты, FPR-пороги и release-gate решение. Senior- и head-of лупы добавляют regulator-facing memo, разговор про build-vs-buy на eval harness и защиту бюджета перед CSO.

Частые вопросы

Типичные вопросы:

  • Опишите guardrail layer, которым владели end-to-end, и ASR-дельту
  • Расскажите про релиз, который заблокировали, или guardrail, который сансетнули
  • Как согласовывали harm-таксономию с alignment-applied team?
  • Расскажите про release-gate критерии
  • Как измеряете движение scorecard от квартала к кварталу?
  • Как партнёриться с Trust and Safety, не становясь их очередью?
Обновлено: