Skip to content
Tecnologias EmergentesMiddle

Exemplo de currículo Middle AI Safety Engineer

Exemplo de currículo profissional Middle AI Safety Engineer. Modelo otimizado para ATS.

Faixa salarial Middle (US)

$260,000 - $400,000

Por que este currículo funciona

Verbos que sinalizam ownership de programa de safety

Liderou, Redigiu, Matou, Executou, Migrou, Pioneirou. AI safety pleno opera a camada de guardrails e a taxonomy, não só o ticket de eval. Os verbos devem sinalizar que você escolhe o que entregar e o que bloquear.

Números atrelados a outcomes de safety, não a vaidade

ASR de 31 a 9 por cento, FPR de 14 a 3,6 por cento, 14 classes de dano, time-to-mitigation de 11 dias para 38 horas. Métricas pleno atrelam guardrails e taxonomies a decisões de release-gate.

Tradeoffs e mortes explícitas

O que você bloqueou é mais informativo que o que lançou. 'Matou um release de modelo após o eval gate falhar em regressão de refusal-recall' é a linha com código sênior.

Influência cross-org de safety, não trabalho solo de eval

Trust and Safety reviewer, alignment-applied team, responsible-AI program lead, Microsoft AI Red Team. AI safety pleno muda como a org pensa o dano, não só como o pontua.

Sistemas e movimentos concretos de safety

NeMo Guardrails policy layer, fine-tune de Llama Guard 2, Inspect AI mais simple-evals, MLCommons AILuminate. Especificidades provam que você trata safety como sistema.

Habilidades essenciais

  • Guardrail layer ownership
  • Harm taxonomy authoring
  • Llama Guard 2 fine-tuning
  • NeMo Guardrails policy authoring
  • Inspect AI
  • MLCommons AILuminate
  • Cross-org rubric calibration
  • Release-gate eval design
  • Lakera Guard
  • Protect AI Guardian
  • Multimodal jailbreak triage
  • PAIR and AutoDAN chains
  • Microsoft Responsible AI Standard
  • OpenAI Usage Policies
  • NIST AI RMF 1.0
  • RFC authorship

Melhore seu currículo

Modelos e exemplos de currículo de AI Safety Engineer para cada estágio de carreira. Seja você reportando seu primeiro issue de jailbreak reproduzível, operando a camada de guardrails de produção, designando uma release-gate eval suite, ou chartereando um Frontier Safety Council, seu CV deve provar que você trata AI safety como um sistema de engenharia mensurável, não como uma postura de compliance ou uma rotação de moderação de conteúdo. Hiring managers na Anthropic, OpenAI, DeepMind, xAI, NIST AISI e UK AISI escaneiam por redução de jailbreak attack success rate (ASR), refusal precision-recall, ownership de harm-taxonomy e autoridade de release-gate. Este guia cobre estratégias de currículo de júnior a lead para AI Safety Engineers com o stack real, métricas reais e a linguagem que separa safety engineering do marketing genérico de responsible-AI.

Melhores Práticas para CV de Mid-Level AI Safety Engineer

  1. Abra cada papel com um bullet de ownership de camada de guardrails ou de harm-taxonomy. 'Liderou a camada de guardrails de produção levando ASR de 31 por cento para 9 por cento' supera 'contribuiu com evals de safety'. AI safety pleno opera sistemas, não tickets de eval.
  2. Atrele evals a decisões de release-gate. CVs pleno que omitem autoridade de release-gate caem no balde 'safety researcher'. Adicione pelo menos um bullet onde o resultado do eval bloqueou, gateou ou reconfigurou um release.
  3. Mostre uma morte explícita. Matou um release após o eval gate falhar em regressão de refusal-recall. Matou um guardrail após FPR exceder o limiar. Bullets de morte provam julgamento mais forte que lançamentos neste nível.
  4. Referencie taxonomy e guardrail como um único sistema. Trate harm taxonomy e a camada de guardrails como um stack só. Audiências pleno esperam que você veja policy e enforcement juntos.
  5. Mostre influência interna fora de safety eng. Trust and Safety reviewer, alignment-applied team, responsible-AI program lead, Microsoft AI Red Team ou equivalente. O sinal pleno é mudar como a org pensa o dano, não só como o pontua.

Erros Comuns de CV para Mid-Level AI Safety Engineer

  1. Lê-se como portfólio de researcher, não como história de ownership de engineering

Por que machuca: CVs de AI safety pleno que listam papers, blog posts e evals one-off sem ownership de camada de guardrails ou de harm taxonomy se leem como research, não engineering. Painéis de hiring em frontier labs filtram tais CVs no balde 'talvez research'.

Como consertar: Substitua pelo menos três bullets com sabor de research por um bullet de ownership que nomeie a superfície, as classes de dano e o delta. 'Liderou a camada de guardrails de produção para um coding agent interno, levou ASR de 31 por cento para 9 por cento em 11 categorias de dano' reescreve o tom inteiro.

  1. Sem decisões de morte ou release-gate

Por que machuca: Programas de AI safety estão cheios de evals zumbi e guardrails zumbi. CVs pleno sem um bullet de morte sinalizam que você não pode tomar decisões de stop-doing ou no-go. Isso é um deal-breaker para papéis de release-gate.

Como consertar: Escolha um release que você bloqueou ou um guardrail que sunsetou, com a métrica que falhou. 'Matou um release de modelo após o eval gate falhar em regressão de refusal-recall na classe self-harm' é a frase mais codada como sênior em um CV pleno.

  1. Confundir authoring de policy taxonomy com papelada de compliance

Por que machuca: CVs pleno que enquadram trabalho de harm taxonomy como 'compliance' ou 'documentação' perdem a função de gating. A taxonomy é o contrato que gateá releases; enquadrá-la como papelada esconde a engenharia.

Como consertar: Escreva o bullet de taxonomy como um artefato adotado. 'Redigiu a policy taxonomy cobrindo 14 classes de dano adotada pelo Trust and Safety reviewer e alignment-applied team como input de release-gate v2' é a forma.

Dicas Rápidas de CV para Mid-Level AI Safety Engineer

  1. Abra cada papel com um bullet de ownership de guardrail ou taxonomy. Superfície, classes de dano, delta de ASR ou FPR em uma frase.
  2. Mostre uma morte explícita por papel. Um release bloqueado ou um guardrail sunsetado prova julgamento mais forte que uma lista de evals.
  3. Atrele resultados de eval a decisões de release-gate. 'Input de release-gate v2', 'gateou GPT-4 enterprise', 'adiou lançamento por um ciclo'.
  4. Referencie tanto taxonomy quanto guardrail no mesmo papel. Audiências pleno os querem vistos como um stack só, não dois silos.
  5. Traga à tona influência cross-org de safety. Trust and Safety reviewer, alignment-applied team, responsible-AI program lead, Microsoft AI Red Team. Um por papel basta.

Perguntas frequentes

Um AI Safety Engineer redige e executa evals adversariais (cenários HarmBench, cadeias de ataque PAIR ou AutoDAN), mantém a camada de guardrails (Llama Guard 2, NeMo Guardrails, Lakera Guard) e a harm taxonomy que gateá releases, e devolve evidência reproduzível de policy-violation aos model owners e ao Trust and Safety reviewer. O dia mistura trabalho de harness em Inspect AI com leitura de scorecards (ASR, refusal precision-recall, FPR) e brokerar decisões go/no-go com o release exec council.

Analistas de cybersecurity defendem infraestrutura (CVEs, rede, identidade); moderadores de conteúdo aplicam policy de plataforma sobre conteúdo de usuário; AI Safety Engineers reduzem dano em nível de modelo: jailbreaks, capability uplift perigoso (CBRN, cyber), manipulação persuasiva e tool-use misuse. O stack de métricas é diferente (ASR, refusal recall, harm-class FPR) e o stack de artefatos é diferente (eval harness, camada de guardrails, harm taxonomy, model card). Confundi-los em um CV o filtra na queue errada.

Sim para o eval harness, a camada de guardrails e a infraestrutura de scoring. A linha é: código de qualidade de produção que gateá releases (Inspect AI tasks, Llama Guard 2 wrappers, scoring pipelines), não features no modelo de produto principal. Um AI Safety Engineer que não consegue cabear um Inspect AI task ponta a ponta contra um stack de Llama Guard 2 é funcionalmente um policy researcher com vocabulário técnico.

Lidere com redução de jailbreak attack success rate (ASR) em uma classe de dano nomeada, refusal precision-recall em um set de prompts dimensionado, false-positive rate de policy-violation em um holdout benigno, cobertura de red-team por categoria de dano, time-to-mitigation para uma classe inédita de jailbreak, e post-deployment incident rate. Cinco números nesses eixos superam qualquer muro de prosa sobre 'AI responsável'.

Três artefatos: um modelo de atribuição que conecta resultados de eval a decisões de release-gate e a post-deployment incidents, uma coverage scorecard que compara seu portfólio de harm-class contra a superfície de capability deployada do modelo, e um TCO de 12 meses mostrando custo do programa por classe de dano bloqueada ou mitigada. Juntos sobrevivem a uma revisão de CSO e CFO; sozinhos, nenhum sobrevive.

Quando a false-positive rate em um holdout benigno excede o limiar deployer-facing acordado por dois ciclos, quando ASR permanece plana após duas iterações de tuning, ou quando o eval não mapeia mais para uma superfície real de deployment. Defina os critérios de morte antecipadamente, com limiares explícitos deployer-facing e developer-facing; revise-os com os dados, não com sentimento.

Certificações recomendadas

Preparação para entrevistas

Loops de AI Safety Engineer misturam um painel clássico de IC engineering com três estações específicas de safety: um take-home red-team task (construa um HarmBench scenario pack contra um modelo desconhecido e escreva a harm taxonomy), um walkthrough ao vivo de eval harness onde você defende cobertura e escolhas de false-positive, e uma revisão de portfólio onde você defende deltas de ASR, limiares de FPR e uma decisão de release-gate que você tomou ou propôs. Loops sênior e head-of adicionam um memo voltado ao regulador, uma conversa build-vs-buy sobre eval harness e uma defesa de orçamento ao CSO.

Perguntas frequentes

Perguntas comuns:

  • Descreva uma camada de guardrails que você operou ponta a ponta e o delta de ASR que ela produziu
  • Me conte sobre um release que você bloqueou ou um guardrail que você sunsetou
  • Como você negociou a harm taxonomy com o alignment-applied team?
  • Me leve pelos seus critérios de release-gate
  • Como você mede movimento de scorecard trimestre a trimestre?
  • Como você se associa com Trust and Safety sem virar a queue deles?
Atualizado: