Skip to content
Tecnologías Emergentes

Ejemplo de CV Junior AI Safety Engineer

Ejemplo de CV profesional Junior AI Safety Engineer. Plantilla optimizada para ATS.

Elija su nivel

Seleccione el nivel de experiencia para una plantilla de CV adecuada

Por qué este CV funciona

Verbos que prueban que ejecutaste el eval, no que lo consumiste

Redactó, Ejecutó, Construyó, Reportó, Reprodujo. Los CV junior de AI safety que se apoyan en 'probé AI por seguridad' se leen como capturas de LinkedIn. Abre con verbos que muestren que produjiste el artefacto.

Cada artefacto de red-team lleva un número

47 escenarios de jailbreak, ASR de 38 a 22 por ciento, 1.200 prompts dual-use, 14 issues reproducibles. Sin números, tu trabajo de safety no se distingue del compliance theatre.

Conecta cada eval con un resultado de release-gate

No 'probé el modelo contra jailbreaks' sino 'gateé una revisión de model-card' o 'alimenté el red-team de pre-deployment'. Cierra siempre con la decisión de safety que el artefacto desbloqueó.

Muestra entregas a la safety org, no trabajo en solitario

Trust and Safety reviewer, alignment-applied team, safety eval suite owner. El junior de AI safety que no devuelve señal a los model owners se lee como un proyecto académico.

Stack de safety real dentro de artefactos reales

HarmBench, Inspect AI, PAIR, Llama Guard 2, Eleuther LM-eval, simple-evals. Nombrar el framework dentro de un artefacto demuestra que lo cableaste, no que solo leíste el paper.

Cambie entre niveles para recomendaciones específicas

Habilidades clave

  • HarmBench scenario authoring
  • Inspect AI eval harness
  • Llama Guard 2
  • PAIR and AutoDAN attack chains
  • Refusal precision-recall benchmarking
  • Python
  • Eleuther LM-eval-harness
  • OpenAI simple-evals
  • GCG-style adversarial suffixes
  • MLCommons AILuminate
  • NeMo Guardrails
  • Lakera Guard
  • Protect AI Rebuff
  • Multimodal jailbreak triage
  • NIST AI RMF 1.0 reading
  • OpenAI Usage Policies
  • Guardrail layer ownership
  • Harm taxonomy authoring
  • Llama Guard 2 fine-tuning
  • NeMo Guardrails policy authoring
  • Inspect AI
  • Cross-org rubric calibration
  • Release-gate eval design
  • Protect AI Guardian
  • PAIR and AutoDAN chains
  • Microsoft Responsible AI Standard
  • NIST AI RMF 1.0
  • RFC authorship
  • Release-gate eval suite design
  • Harm taxonomy v3 authoring
  • Model-card disclosure standard
  • Attribution from harm to gate
  • Build-vs-buy on eval harness
  • Multimodal eval design
  • Model-safety IC mentorship
  • Inspect AI architecture
  • MLCommons AILuminate working group
  • ISO/IEC 42001 literacy
  • Tool-use and agentic harm eval
  • UK AISI review preparation
  • License and usage policy posture
  • Hiring loop design
  • Executive communication
  • Safety engineering career ladders
  • Hiring rubrics for AI safety
  • Cross-lab joint red-team agreements
  • Model-policy disclosure standard authorship
  • EU AI Act Article 51 GPAI compliance
  • NIST AISI information-sharing
  • Frontier Safety Council chartering
  • Board safety review communication
  • ISO/IEC 42001 audit readiness
  • Multi-region safety org design
  • Compensation-linked safety scorecards
  • Multi-year safety roadmaps
  • Procurement negotiation for eval vendors
  • Regulated-industry tier design
  • Open-weights deployment posture
  • Incident response on-call

Mejore su CV

Rangos salariales (US)

Junior
$180,000 - $260,000
Middle
$260,000 - $400,000
Senior
$380,000 - $600,000
Lead
$500,000 - $900,000

Progresión profesional

El arco de carrera del AI Safety Engineer es no-lineal. Los AI Safety Engineers fuertes vienen de software engineering con side projects de adversarial-ML, de ML research con instintos de deployment, o de fondos de cybersecurity red-team que reaprenden el vocabulario de harm-class. La velocidad de carrera se cuella por disciplina de reproducibilidad, disciplina de muerte (autoridad de release-gate) y fluency de policy-taxonomy, no por años.

  1. JuniorMiddle2-4 years

    Lidera una capa de guardrails o un slot de harm-class de extremo a extremo con un delta medible de ASR. Mantén un HarmBench scenario pack publicado y un Inspect AI task que produzcan señal de eval repetida. Lidera una revisión de harm-taxonomy que reconfigura el input de release-gate. Únete a un loop interno de hiring para roles de safety engineering o alignment-applied.

    • Activation rubric reading
    • Coverage scorecard authoring
    • Internal RFC authorship
    • Guardrail fine-tune confidence
  2. MiddleSenior2-4 years

    Redacta una release-gate eval suite adoptada por al menos una superficie de producto. Publica una harm-taxonomy v3 defendible ante el Trust and Safety reviewer y el alignment-applied team. Lidera un release explícitamente bloqueado con la métrica, regresión y mitigación elegida. Mentoriza al menos un IC hacia una promoción senior.

    • Release-gate eval suite design
    • Attribution from harm to gate
    • Build-vs-buy memos on harnesses
    • Cross-org RFCs
  3. SeniorLead3-5 years

    Lidera un portfolio de safety multi-producto con autoridad go/no-go. Negocia un acuerdo adyacente al regulador (NIST AISI, UK AISI, MLCommons working group). Levanta al menos una estructura de governance (Frontier Safety Council, model-policy disclosure standard). Redacta el escalafón de safety engineering. Promueve al menos un mentee a Senior IC.

    • Regulator-facing communication
    • Governance structure design
    • Org design
    • Board safety review communication

Los AI Safety Engineers fuertes también pivotan a roles de AI policy dentro de frontier labs o en NIST AISI / UK AISI, a roles de Field CISO o applied-trust en grandes deployers de AI (Stripe, Notion, Linear, Glean), o a roles de operating partner en venture funds enfocados en AI. Un movimiento común de carrera tardía es fundar una startup de safety-tooling (eval harness, guardrail vendor o auditor de model-policy), a menudo con peers de la comunidad MLCommons o AILuminate.

Plantillas y ejemplos de currículum de AI Safety Engineer para cada etapa de carrera. Tanto si reportas tu primer issue de jailbreak reproducible, lideras la capa de guardrails de producción, diseñas una release-gate eval suite, o charteras un Frontier Safety Council, tu CV debe demostrar que tratas la AI safety como un sistema de ingeniería medible, no como una postura de compliance o una rotación de moderación de contenido. Los hiring managers en Anthropic, OpenAI, DeepMind, xAI, NIST AISI y la UK AISI escanean por reducción de jailbreak attack success rate (ASR), refusal precision-recall, ownership de harm-taxonomy y autoridad de release-gate. Esta guía cubre estrategias de currículum de junior a lead para AI Safety Engineers con el stack real, las métricas reales y el lenguaje que separa el safety engineering del marketing genérico de responsible-AI.

Preguntas frecuentes

Un AI Safety Engineer redacta y ejecuta evals adversariales (escenarios HarmBench, cadenas de ataque PAIR o AutoDAN), mantiene la capa de guardrails (Llama Guard 2, NeMo Guardrails, Lakera Guard) y la harm taxonomy que gateá releases, y devuelve evidencia reproducible de policy-violation a model owners y al Trust and Safety reviewer. El día mezcla trabajo de harness en Inspect AI con lectura de scorecards (ASR, refusal precision-recall, FPR) y brokerar decisiones go/no-go con el release exec council.

Los analistas de cybersecurity defienden infraestructura (CVEs, red, identidad); los moderadores de contenido aplican policy de plataforma sobre contenido de usuario; los AI Safety Engineers reducen daño a nivel de modelo: jailbreaks, capability uplift peligroso (CBRN, cyber), manipulación persuasiva y misuse de tool-use. El stack de métricas es distinto (ASR, refusal recall, harm-class FPR) y el stack de artefactos es distinto (eval harness, capa de guardrails, harm taxonomy, model card). Confundirlos en un CV lo filtra a la cola equivocada.

Sí para el eval harness, la capa de guardrails y la infraestructura de scoring. La línea es: código de calidad de producción que gateá releases (Inspect AI tasks, Llama Guard 2 wrappers, scoring pipelines), no features en el modelo de producto principal. Un AI Safety Engineer que no puede cablear un Inspect AI task de extremo a extremo contra un stack de Llama Guard 2 es funcionalmente un policy researcher con vocabulario técnico.

Lidera con reducción de jailbreak attack success rate (ASR) en una clase de daño nombrada, refusal precision-recall en un set de prompts dimensionado, false-positive rate de policy-violation en un holdout benigno, cobertura de red-team por categoría de daño, time-to-mitigation para una clase novedosa de jailbreak y post-deployment incident rate. Cinco números a través de estos ejes superan cualquier muro de prosa sobre 'AI responsable'.

Sí. La mayoría de los Junior AI Safety Engineers exitosos vienen de dos a tres años de software engineering regular más contribuciones de safety visibles: escenarios HarmBench, un Inspect AI task, una evaluación pública de Llama Guard 2, una submission a AILuminate, o un write-up de un ataque PAIR o AutoDAN reproducido. A los hiring managers les importa más el eval engineering reproducible que los papers en ICML en este nivel.

Un HarmBench scenario pack publicado con 20-50 escenarios reproducibles, más un Inspect AI task que puntúa Llama Guard 2 contra ellos, más un memo de una página sobre tres brechas de policy-taxonomy que cerrarías. Ese artefacto supera cualquier portfolio de demos a medio terminar y señala los tres músculos de AI safety (red-team, eval, policy) en quince minutos de tiempo de revisión.