Skip to content
Tecnologias Emergentes

Exemplo de currículo Junior AI Safety Engineer

Exemplo de currículo profissional Junior AI Safety Engineer. Modelo otimizado para ATS.

Escolha seu nível

Selecione o nível de experiência para um modelo de currículo adequado

Por que este currículo funciona

Verbos que provam que você rodou o eval, não que consumiu

Redigiu, Executou, Construiu, Reportou, Reproduziu. CVs júnior de AI safety que se apoiam em 'testou AI por segurança' se leem como prints de LinkedIn. Abra com verbos que mostrem que você produziu o artefato.

Cada artefato de red-team carrega um número

47 cenários de jailbreak, ASR de 38 a 22 por cento, 1.200 prompts dual-use, 14 issues reproduzíveis. Sem números, seu trabalho de safety é indistinguível de compliance theatre.

Conecte cada eval a um resultado de release-gate

Não 'testou modelo contra jailbreaks' mas 'gateou uma revisão de model-card' ou 'alimentou o red-team de pre-deployment'. Sempre termine com a decisão de safety que o artefato desbloqueou.

Mostre repasses para a safety org, não trabalho solo

Trust and Safety reviewer, alignment-applied team, safety eval suite owner. Júnior de AI safety que não devolve sinal aos model owners se lê como projeto acadêmico.

Stack real de safety dentro de artefatos reais

HarmBench, Inspect AI, PAIR, Llama Guard 2, Eleuther LM-eval, simple-evals. Nomear o framework dentro de um artefato prova que você o fiou, não apenas leu o paper.

Alterne entre níveis para recomendações específicas

Habilidades-chave

  • HarmBench scenario authoring
  • Inspect AI eval harness
  • Llama Guard 2
  • PAIR and AutoDAN attack chains
  • Refusal precision-recall benchmarking
  • Python
  • Eleuther LM-eval-harness
  • OpenAI simple-evals
  • GCG-style adversarial suffixes
  • MLCommons AILuminate
  • NeMo Guardrails
  • Lakera Guard
  • Protect AI Rebuff
  • Multimodal jailbreak triage
  • NIST AI RMF 1.0 reading
  • OpenAI Usage Policies
  • Guardrail layer ownership
  • Harm taxonomy authoring
  • Llama Guard 2 fine-tuning
  • NeMo Guardrails policy authoring
  • Inspect AI
  • Cross-org rubric calibration
  • Release-gate eval design
  • Protect AI Guardian
  • PAIR and AutoDAN chains
  • Microsoft Responsible AI Standard
  • NIST AI RMF 1.0
  • RFC authorship
  • Release-gate eval suite design
  • Harm taxonomy v3 authoring
  • Model-card disclosure standard
  • Attribution from harm to gate
  • Build-vs-buy on eval harness
  • Multimodal eval design
  • Model-safety IC mentorship
  • Inspect AI architecture
  • MLCommons AILuminate working group
  • ISO/IEC 42001 literacy
  • Tool-use and agentic harm eval
  • UK AISI review preparation
  • License and usage policy posture
  • Hiring loop design
  • Executive communication
  • Safety engineering career ladders
  • Hiring rubrics for AI safety
  • Cross-lab joint red-team agreements
  • Model-policy disclosure standard authorship
  • EU AI Act Article 51 GPAI compliance
  • NIST AISI information-sharing
  • Frontier Safety Council chartering
  • Board safety review communication
  • ISO/IEC 42001 audit readiness
  • Multi-region safety org design
  • Compensation-linked safety scorecards
  • Multi-year safety roadmaps
  • Procurement negotiation for eval vendors
  • Regulated-industry tier design
  • Open-weights deployment posture
  • Incident response on-call

Melhore seu currículo

Faixas salariais (US)

Junior
$180,000 - $260,000
Middle
$260,000 - $400,000
Senior
$380,000 - $600,000
Lead
$500,000 - $900,000

Progressão na carreira

O arco de carreira de AI Safety Engineer é não-linear. AI Safety Engineers fortes vêm de software engineering com side projects de adversarial-ML, de ML research com instintos de deployment, ou de fundos de cybersecurity red-team que reaprendem o vocabulário de harm-class. A velocidade de carreira é gargalada por disciplina de reproduzibilidade, disciplina de morte (autoridade de release-gate) e fluency de policy-taxonomy, não por anos.

  1. JuniorMiddle2-4 years

    Lidere uma camada de guardrails ou um slot de harm-class ponta a ponta com um delta mensurável de ASR. Mantenha um HarmBench scenario pack publicado e um Inspect AI task que produzam sinal de eval repetido. Lidere uma revisão de harm-taxonomy que reconfigura o input de release-gate. Junte-se a um loop interno de hiring para papéis de safety engineering ou alignment-applied.

    • Activation rubric reading
    • Coverage scorecard authoring
    • Internal RFC authorship
    • Guardrail fine-tune confidence
  2. MiddleSenior2-4 years

    Redija uma release-gate eval suite adotada por pelo menos uma superfície de produto. Publique uma harm-taxonomy v3 defensável diante do Trust and Safety reviewer e do alignment-applied team. Lidere um release explicitamente bloqueado com a métrica, a regressão e a mitigação escolhida. Mentore pelo menos um IC para uma promoção sênior.

    • Release-gate eval suite design
    • Attribution from harm to gate
    • Build-vs-buy memos on harnesses
    • Cross-org RFCs
  3. SeniorLead3-5 years

    Lidere um portfólio de safety multi-produto com autoridade go/no-go. Negocie um acordo adjacente ao regulador (NIST AISI, UK AISI, MLCommons working group). Levante pelo menos uma estrutura de governance (Frontier Safety Council, model-policy disclosure standard). Redija o plano de carreira de safety engineering. Promova pelo menos um mentee a Senior IC.

    • Regulator-facing communication
    • Governance structure design
    • Org design
    • Board safety review communication

AI Safety Engineers fortes também pivotam para papéis de AI policy dentro de frontier labs ou em NIST AISI / UK AISI, para papéis Field CISO ou applied-trust em grandes deployers de AI (Stripe, Notion, Linear, Glean), ou para papéis de operating partner em venture funds focados em AI. Um movimento comum no fim da carreira é fundar uma startup de safety-tooling (eval harness, guardrail vendor, ou auditor de model-policy), frequentemente com peers da comunidade MLCommons ou AILuminate.

Modelos e exemplos de currículo de AI Safety Engineer para cada estágio de carreira. Seja você reportando seu primeiro issue de jailbreak reproduzível, operando a camada de guardrails de produção, designando uma release-gate eval suite, ou chartereando um Frontier Safety Council, seu CV deve provar que você trata AI safety como um sistema de engenharia mensurável, não como uma postura de compliance ou uma rotação de moderação de conteúdo. Hiring managers na Anthropic, OpenAI, DeepMind, xAI, NIST AISI e UK AISI escaneiam por redução de jailbreak attack success rate (ASR), refusal precision-recall, ownership de harm-taxonomy e autoridade de release-gate. Este guia cobre estratégias de currículo de júnior a lead para AI Safety Engineers com o stack real, métricas reais e a linguagem que separa safety engineering do marketing genérico de responsible-AI.

Perguntas frequentes

Um AI Safety Engineer redige e executa evals adversariais (cenários HarmBench, cadeias de ataque PAIR ou AutoDAN), mantém a camada de guardrails (Llama Guard 2, NeMo Guardrails, Lakera Guard) e a harm taxonomy que gateá releases, e devolve evidência reproduzível de policy-violation aos model owners e ao Trust and Safety reviewer. O dia mistura trabalho de harness em Inspect AI com leitura de scorecards (ASR, refusal precision-recall, FPR) e brokerar decisões go/no-go com o release exec council.

Analistas de cybersecurity defendem infraestrutura (CVEs, rede, identidade); moderadores de conteúdo aplicam policy de plataforma sobre conteúdo de usuário; AI Safety Engineers reduzem dano em nível de modelo: jailbreaks, capability uplift perigoso (CBRN, cyber), manipulação persuasiva e tool-use misuse. O stack de métricas é diferente (ASR, refusal recall, harm-class FPR) e o stack de artefatos é diferente (eval harness, camada de guardrails, harm taxonomy, model card). Confundi-los em um CV o filtra na queue errada.

Sim para o eval harness, a camada de guardrails e a infraestrutura de scoring. A linha é: código de qualidade de produção que gateá releases (Inspect AI tasks, Llama Guard 2 wrappers, scoring pipelines), não features no modelo de produto principal. Um AI Safety Engineer que não consegue cabear um Inspect AI task ponta a ponta contra um stack de Llama Guard 2 é funcionalmente um policy researcher com vocabulário técnico.

Lidere com redução de jailbreak attack success rate (ASR) em uma classe de dano nomeada, refusal precision-recall em um set de prompts dimensionado, false-positive rate de policy-violation em um holdout benigno, cobertura de red-team por categoria de dano, time-to-mitigation para uma classe inédita de jailbreak, e post-deployment incident rate. Cinco números nesses eixos superam qualquer muro de prosa sobre 'AI responsável'.

Sim. A maioria dos Junior AI Safety Engineers de sucesso vem de dois a três anos de software engineering regular mais contribuições visíveis de safety: cenários HarmBench, um Inspect AI task, uma avaliação pública de Llama Guard 2, uma submission ao AILuminate, ou um write-up de um ataque PAIR ou AutoDAN reproduzido. Hiring managers se importam mais com eval engineering reproduzível do que com papers ICML neste nível.

Um HarmBench scenario pack publicado com 20-50 cenários reproduzíveis, mais um Inspect AI task que pontua Llama Guard 2 contra eles, mais um memo de uma página sobre três lacunas de policy-taxonomy que você fecharia. Esse artefato supera qualquer portfólio de demos pela metade e sinaliza os três músculos de AI safety (red-team, eval, policy) em quinze minutos de tempo de revisão.