Exemple de CV Junior AI Safety Engineer
Exemple de CV professionnel Junior AI Safety Engineer. Modèle optimisé ATS.
Fourchette salariale Junior (US)
$180,000 - $260,000
Pourquoi ce CV fonctionne
Verbes qui prouvent que tu as fait tourner l'eval, pas que tu l'as consommé
Rédigea, Exécuta, Construisit, Soumit, Reproduisit. Les CV junior d'AI safety qui s'appuient sur 'a testé l'AI pour la sécurité' se lisent comme des captures LinkedIn. Ouvre avec des verbes qui montrent que tu as produit l'artefact.
Chaque artefact red-team porte un chiffre
47 scénarios de jailbreak, ASR de 38 à 22 pour cent, 1 200 prompts dual-use, 14 issues reproductibles. Sans chiffres, ton travail de safety est indistinguible du compliance theatre.
Connecte chaque eval à un résultat de release-gate
Pas 'a testé le modèle pour les jailbreaks' mais 'a gaté une révision de model-card' ou 'a alimenté le red-team de pre-deployment'. Termine toujours avec la décision de safety que l'artefact a débloquée.
Montre les passations à la safety org, pas le travail solo
Trust and Safety reviewer, alignment-applied team, safety eval suite owner. Le junior d'AI safety qui ne renvoie pas de signal aux model owners se lit comme un projet académique.
Stack de safety réel à l'intérieur d'artefacts réels
HarmBench, Inspect AI, PAIR, Llama Guard 2, Eleuther LM-eval, simple-evals. Nommer le framework à l'intérieur d'un artefact prouve que tu l'as câblé, pas seulement lu le paper.
Compétences essentielles
- HarmBench scenario authoring
- Inspect AI eval harness
- Llama Guard 2
- PAIR and AutoDAN attack chains
- Refusal precision-recall benchmarking
- Python
- Eleuther LM-eval-harness
- OpenAI simple-evals
- GCG-style adversarial suffixes
- MLCommons AILuminate
- NeMo Guardrails
- Lakera Guard
- Protect AI Rebuff
- Multimodal jailbreak triage
- NIST AI RMF 1.0 reading
- OpenAI Usage Policies
Améliorez votre CV
Modèles et exemples de CV d'AI Safety Engineer pour chaque étape de carrière. Que tu soumettes ton premier issue de jailbreak reproductible, opères la couche guardrails de production, designs une release-gate eval suite, ou chartes un Frontier Safety Council, ton CV doit prouver que tu traites l'AI safety comme un système d'ingénierie mesurable, pas comme une posture de compliance ou une rotation de modération de contenu. Les hiring managers chez Anthropic, OpenAI, DeepMind, xAI, NIST AISI, et la UK AISI scannent pour la réduction du jailbreak attack success rate (ASR), refusal precision-recall, ownership de harm-taxonomy, et autorité de release-gate. Ce guide couvre les stratégies de CV de junior à lead pour les AI Safety Engineers avec le stack réel, les métriques réelles, et le langage qui sépare le safety engineering du marketing générique de responsible-AI.
Meilleures Pratiques pour CV de Junior AI Safety Engineer
- Ouvre chaque bullet avec un artefact d'eval reproductible. Remplace 'a testé l'AI pour la sécurité' par '47 scénarios de jailbreak à travers 6 catégories de harm en utilisant les templates HarmBench et PAIR'. La reproductibilité est tout l'enjeu au niveau junior.
- Quantifie ASR, refusal recall et false-positive rate. Même au niveau junior, ancre chaque bullet avec un chiffre : delta d'ASR sur une classe de harm nommée, refusal precision-recall sur un set de prompts dimensionné, false-positive rate sur un holdout bénin. Les chiffres séparent les eval engineers des prompt taggers.
- Nomme le harness, le modèle et la classe de harm. Inspect AI sur un stack Llama Guard 2 sur la classe de harm cybercrime est la forme. Une formulation vague de 'AI safety testing' se lit comme de la modération de contenu, pas de l'eval engineering.
- Montre la passation. Trust and Safety reviewer, alignment-applied team, safety eval suite owner. Le junior d'AI safety qui ne renvoie pas de signal au model owner se lit comme un projet académique.
- Ancre à un slot de harm taxonomy. Choisis une classe de harm (cybercrime, CBRN, self-harm, persuasion) et exécute deux bullets dedans pour montrer l'ownership d'un slot, pas des eval gigs aléatoires.
Erreurs Communes de CV pour Junior AI Safety Engineer
- Lister 'AI safety testing' sans classe de harm, harness ou métrique
Pourquoi ça blesse : Les recruteurs chez Anthropic, OpenAI et DeepMind traitent 'a testé l'AI pour la sécurité' comme du bruit. Sans classe de harm nommée, harness et métrique, le bullet est indistinguible du travail de modération de contenu.
Comment fixer : Remplace 'a testé l'AI pour la sécurité' par '47 scénarios de jailbreak à travers 6 catégories de harm en utilisant HarmBench et PAIR, releva l'ASR de 16 points'. Harness, classe de harm, compte, delta. Quatre ancres, un bullet.
- Confondre AI safety avec cybersecurity ou modération de contenu
Pourquoi ça blesse : Les CV junior qui s'appuient sur un cadrage 'cybersecurity', 'compliance' ou 'modération de contenu' filtrent dans la mauvaise pile. Les panels de hiring d'AI safety cherchent du vocabulaire jailbreak/refusal/harm, pas du vocabulaire CVE ou trust-and-safety-ticket.
Comment fixer : Réécris les bullets de security ou modération en termes d'eval engineering. 'A trié 800 abuse reports' devient 'a rédigé 32 cas de test de refusal-recall reproductibles qui ont fait émerger un écart de 6 points sur la classe self-harm'.
- Aucune référence à un eval harness ou guardrail réel
Pourquoi ça blesse : Sans Inspect AI, Eleuther LM-eval, simple-evals, Llama Guard 2, NeMo Guardrails ou Lakera Guard dans les bullets, le travail est invisible aux senior eval engineers qui revoient le CV.
Comment fixer : Choisis un harness et un guardrail et place chacun à l'intérieur d'un artefact. 'A implémenté un Eleuther LM-eval-harness wrapper pour Llama Guard 2 sur un eval set dual-use de 900 prompts' est la forme.
Conseils Rapides de CV pour Junior AI Safety Engineer
- Ouvre avec harness plus classe de harm plus delta. Inspect AI sur ASR cybercrime est une preuve de compétence en une ligne.
- Utilise le format avec-qui. 'A co-rédigé une refusal rubric avec le Trust and Safety reviewer' atterrit plus fort que 'a aidé sur la safety'.
- Apparie chaque outil avec un outcome de release-gate. HarmBench plus 'alimenté dans le red-team de pre-deployment' est la forme.
- Montre une passation cross-team par rôle. Trust and Safety reviewer, alignment-applied team, safety eval suite owner.
- Garde un projet sur le CV que tu peux whiteboarder de bout en bout. Choisis un HarmBench scenario pack ou un Llama Guard 2 wrapper sur lequel tu peux parler 25 minutes.
Questions fréquemment posées
Certifications recommandées
Préparation aux entretiens
Les loops d'AI Safety Engineer mêlent un panel classique d'IC engineering avec trois stations spécifiques à la safety : un take-home red-team task (construis un HarmBench scenario pack contre un modèle inconnu et écris la harm taxonomy), un walkthrough live d'eval harness où tu défends couverture et choix de false-positive, et un review de portfolio où tu défends des deltas d'ASR, des seuils de FPR et une décision de release-gate que tu as prise ou proposée. Les loops senior et head-of ajoutent un memo face au régulateur, une conversation build-vs-buy sur eval harness et une défense de budget au CSO.
Questions fréquentes
Questions communes :
- Décris-moi un scénario HarmBench que tu as rédigé et la classe de harm qu'il stresse
- Comment mesurerais-tu si une refusal rubric fonctionne ?
- Démontre-moi cet Inspect AI task et explique la false-positive rate sur un holdout bénin
- Parle-moi d'une fois où tu as renvoyé de l'evidence reproductible de policy-violation à un model owner
- Comment décides-tu entre PAIR et GCG pour un budget d'attaque donné ?
- Quel est ton eval harness par défaut et pourquoi ?