Skip to content
Новые ТехнологииJunior

Шаблон CV Junior Инженер по безопасности ИИ

Готовый шаблон CV для Junior Инженер по безопасности ИИ. Оптимизирован под ATS-системы.

Зарплата Junior (US)

$180,000 - $260,000

Почему это CV работает

Глаголы, доказывающие, что вы прогнали eval, а не посмотрели

Написала, Прогнала, Построила, Завела, Воспроизвела. Junior AI safety резюме на «тестировала AI на безопасность» читается как скриншот LinkedIn. Открывайте глаголами, показывающими артефакт.

Каждый red-team артефакт несёт цифру

47 jailbreak-сценариев, ASR с 38 до 22 процентов, 1,200 dual-use промптов, 14 воспроизводимых issue. Без чисел safety-работа неотличима от compliance-театра.

Связывайте каждый eval с release-gate решением

Не «тестировала модель на jailbreak», а «загейтила model-card revision» или «попало в pre-deployment red-team». Заканчивайте safety-решением, которое разблокировал артефакт.

Показывайте handoff в safety-org, не сольную работу

Trust and Safety reviewer, alignment-applied team, safety eval suite owner. Junior AI safety, не передающий сигнал владельцам моделей, читается как академический проект.

Реальный safety-стек внутри реальных артефактов

HarmBench, Inspect AI, PAIR, Llama Guard 2, Eleuther LM-eval, simple-evals. Назвать фреймворк внутри артефакта — доказательство того, что вы его подключили, а не прочитали статью.

Необходимые навыки

  • Авторство HarmBench-сценариев
  • Inspect AI eval harness
  • Llama Guard 2
  • PAIR и AutoDAN attack chains
  • Refusal precision-recall бенчмарки
  • Python
  • Eleuther LM-eval-harness
  • OpenAI simple-evals
  • GCG-style adversarial suffixes
  • MLCommons AILuminate
  • NeMo Guardrails
  • Lakera Guard
  • Protect AI Rebuff
  • Multimodal jailbreak triage
  • Чтение NIST AI RMF 1.0
  • OpenAI Usage Policies

Улучшите своё CV

Шаблоны и примеры резюме AI Safety Engineer для каждого этапа карьеры. Будь то первый воспроизводимый jailbreak issue, владение production guardrail layer, дизайн release-gate eval suite или учреждение Frontier Safety Council, резюме должно доказывать, что вы относитесь к AI safety как к измеримой инженерной системе, а не как к compliance-постуре или ротации в content-moderation. Хайринг в Anthropic, OpenAI, DeepMind, xAI, NIST AISI и UK AISI сканирует резюме на снижение jailbreak attack success rate (ASR), refusal precision-recall, владение harm-таксономией и release-gate authority. Гайд покрывает стратегии резюме от junior до lead для AI Safety Engineer, с реальным стеком, реальными метриками и языком, отделяющим safety-инжиниринг от generic responsible-AI маркетинга.

Лучшие практики резюме Junior AI Safety Engineer

  1. Открывайте каждый буллет воспроизводимым eval-артефактом. Замените «тестировала AI на безопасность» на «47 jailbreak-сценариев в 6 harm-категориях на HarmBench и PAIR templates». Воспроизводимость - главное на junior.
  2. Считайте ASR, refusal recall и false-positive rate. Даже на junior якорьте каждый буллет числом: дельта ASR на названном harm-классе, refusal precision-recall на сайз-промпт-сете, FPR на benign-холдауте. Числа отделяют eval-инженера от prompt-тагера.
  3. Называйте harness, модель и harm-класс. Inspect AI на стеке Llama Guard 2 на cybercrime harm-классе - нужная форма. Размытое «AI safety testing» читается как content moderation, а не eval-инжиниринг.
  4. Показывайте handoff. Trust and Safety reviewer, alignment-applied team, safety eval suite owner. Junior AI safety, не передающий сигнал владельцу модели, читается как академический проект.
  5. Привязывайтесь к одному слоту harm-таксономии. Возьмите один harm-класс (cybercrime, CBRN, self-harm, persuasion) и оставьте два буллета в нём, чтобы показать ownership слота, а не случайные eval-подработки.

Частые ошибки в резюме Junior AI Safety Engineer

  1. «AI safety testing» без harm-класса, harness и метрики

Почему вредит: рекрутеры в Anthropic, OpenAI и DeepMind читают «тестировал AI на безопасность» как шум. Без названного harm-класса, harness и метрики буллет неотличим от content-moderation работы.

Как исправить: замените «тестировал AI на безопасность» на «47 jailbreak-сценариев в 6 harm-категориях на HarmBench и PAIR, поднял ASR на 16 пунктов». Harness, harm-класс, количество, дельта. Четыре якоря, один буллет.

  1. Путаница AI safety с cybersecurity или content moderation

Почему вредит: junior-резюме на «кибербезопасность», «compliance» или «content moderation» уходят не в ту стопку. AI safety хайринг ищет jailbreak/refusal/harm-вокабуляр, а не CVE или Trust-and-Safety-тикет-вокабуляр.

Как исправить: перепишите security/moderation буллеты в терминах eval-инжиниринга. «Триажил 800 abuse reports» превращается в «написал 32 воспроизводимых refusal-recall тест-кейса, выявивших 6-пунктный gap на self-harm классе».

  1. Нет ссылки на реальный eval harness или guardrail

Почему вредит: без Inspect AI, Eleuther LM-eval, simple-evals, Llama Guard 2, NeMo Guardrails или Lakera Guard в буллетах работа невидима для senior eval engineers, ревьюящих резюме.

Как исправить: возьмите один harness и один guardrail и поместите каждый внутрь артефакта. «Реализовал wrapper Eleuther LM-eval-harness для Llama Guard 2 на 900-промптовом dual-use eval-сете» - нужная форма.

Быстрые советы для резюме Junior AI Safety Engineer

  1. Открывайте harness плюс harm-класс плюс дельта. Inspect AI на cybercrime ASR - однострочное доказательство компетенции.
  2. Используйте формат «с кем». «Соавтор refusal-рубрики с Trust and Safety reviewer» сильнее «помогал на safety».
  3. Сочетайте каждый инструмент с release-gate исходом. HarmBench плюс «попало в pre-deployment red-team» - нужная форма.
  4. Один cross-team handoff на роль. Trust and Safety reviewer, alignment-applied team, safety eval suite owner.
  5. Оставьте на резюме один проект, который можете объяснить end-to-end. Возьмите HarmBench scenario pack или Llama Guard 2 wrapper, про который можете говорить 25 минут.

Часто задаваемые вопросы

AI Safety Engineer пишет и прогоняет adversarial-eval-ы (HarmBench-сценарии, PAIR- или AutoDAN-цепочки), поддерживает guardrail layer (Llama Guard 2, NeMo Guardrails, Lakera Guard) и harm-таксономию, гейтящую релизы, и возвращает воспроизводимое policy-violation evidence владельцам модели и Trust and Safety reviewer. День смешивает harness-работу в Inspect AI с чтением scorecards (ASR, refusal precision-recall, FPR) и согласованием go/no-go решений с release exec council.

Аналитики кибербезопасности защищают инфраструктуру (CVE, сеть, identity); content-модераторы применяют policy платформы к user-контенту; AI Safety Engineer снижает model-level харм: jailbreak, опасный capability uplift (CBRN, cyber), persuasive manipulation и misuse tool-use. Стек метрик другой (ASR, refusal recall, FPR по harm-классам) и стек артефактов другой (eval harness, guardrail layer, harm taxonomy, model card). Смешивать их в резюме — попасть не в ту очередь.

Да для eval harness, guardrail layer и scoring-инфраструктуры. Граница: production-quality код, гейтящий релизы (Inspect AI tasks, Llama Guard 2 wrappers, scoring-пайплайны), а не фичи основной модели. AI Safety Engineer, не способный подключить Inspect AI task end-to-end против Llama Guard 2 стека — функционально policy-researcher с техническим вокабуляром.

Открывайте jailbreak attack success rate (ASR) на названном harm-классе, refusal precision-recall на сайз-промпт-сете, policy-violation false-positive rate на benign-холдауте, покрытие red-team по harm-категориям, time-to-mitigation для нового jailbreak-класса и post-deployment incident rate. Пять чисел по этим осям бьют любую стену прозы про «responsible AI».

Да. Большинство успешных junior AI Safety Engineer приходят с двумя-тремя годами обычного software engineering плюс видимыми safety-контрибуциями: HarmBench-сценарии, Inspect AI task, публичный Llama Guard 2 eval, AILuminate submission или write-up воспроизведённой PAIR/AutoDAN атаки. Хайринг заботит воспроизводимый eval-инжиниринг сильнее, чем ICML-статьи на этом уровне.

Один опубликованный HarmBench scenario pack на 20-50 воспроизводимых сценариев плюс Inspect AI task, скорящий Llama Guard 2 против них, плюс одностраничное memo про три policy-taxonomy gap. Этот артефакт бьёт любое портфолио из недоделанных демо и сигнализирует все три AI safety-мышцы (red-team, eval, policy) за пятнадцать минут ревью.

Рекомендуемые сертификации

Подготовка к собеседованию

Лупы AI Safety Engineer смешивают классическую IC-инженерную панель с тремя safety-специфическими станциями: take-home red-team задача (построить HarmBench scenario pack против незнакомой модели и написать harm-таксономию), live walkthrough eval harness, где вы защищаете coverage и false-positive выборы, и portfolio review, где вы защищаете ASR-дельты, FPR-пороги и release-gate решение. Senior- и head-of лупы добавляют regulator-facing memo, разговор про build-vs-buy на eval harness и защиту бюджета перед CSO.

Частые вопросы

Типичные вопросы:

  • Расскажите про HarmBench-сценарий, который написали, и harm-класс, который он стрессит
  • Как измерили бы, что refusal-рубрика работает?
  • Демонстрируй мне этот Inspect AI task и объясни false-positive rate на benign-холдауте
  • Расскажите, когда вы передали воспроизводимое policy-violation evidence владельцу модели
  • Как выбираете между PAIR и GCG для данного attack-бюджета?
  • Какой ваш go-to eval harness и почему?
Обновлено: