Tecnologias EmergentesJunior

Exemplo de currículo Junior LLM Engineer

Exemplo de currículo profissional Junior LLM Engineer. Modelo otimizado para ATS.

Faixa salarial Junior (US)

$150,000 - $220,000

Por que este currículo funciona

Verbos que provam que você entregou um LLM, não um prompt

Construí, Entreguei, Configurei, Perfilei, Escrevi. CVs de LLM júnior que se apoiam em 'experimentei com GPT-4' soam como turismo de notebook. Abra com verbos que mostrem um LLM rodando em produção.

Números ancoram cada afirmação de LLM

p95 TTFT, JSON-validity rate, eval-pass rate, custo por 1M tokens, contagem de golden traces. 'Usei GPT' sem métrica soa como pôster de hackathon. Números tornam o LLM real.

Conecte cada mudança a um resultado mensurável do LLM

Não 'usei vLLM' mas 'atingindo 71 por cento de eval-pass rate no eval set interno'. Cada bullet júnior deve aterrissar com um resultado medido, não com vibes.

Mostre feedback loops com pessoas, não apenas frameworks

Senior LLM engineer, time de applied science, inference-platform reviewer. Um LLM engineer júnior que nunca devolve feedback para plataforma ou ciência continua autor de notebooks.

Stack LLM real dentro de artefatos reais

vLLM, Outlines, Instructor, Llama 3.1 8B, lm-eval-harness, LangSmith, Helicone. Nomear o stack dentro de um deliverable prova que você de fato entregou o LLM.

Habilidades essenciais

vLLM
Outlines
Instructor
Llama 3.1 / Qwen 2.5
OpenAI API
Anthropic API
lm-eval-harness
Python
LangSmith
Helicone
TGI
Ollama
llama.cpp
Guidance
JSON Schema
FastAPI

Melhore seu currículo

Receba críticas

Feedback brutal de IA sobre seu currículo

Criticar meu currículo →

Currículo & carta sob medida

Adapte seu currículo para vagas específicas

Adaptar meu currículo →

Editor de Currículo IA

Edite com sugestões de IA

Abrir painel →

Templates e exemplos de CV de LLM Engineer para cada estágio de carreira. Quer você esteja configurando um primeiro fluxo de prompt-engineering e RAG, assumindo um stack LLM eval-driven com structured output e quantização, projetando um multi-model serving fabric em vLLM, ou comandando a plataforma LLM contra a qual o resto da org factura, seu CV precisa provar que você entrega sistemas de language-model com JSON-validity rate, p95 TTFT, eval-pass rate e custo por 1M tokens mensuráveis. Os hiring panels da Anthropic, OpenAI, Cohere, Hugging Face, Mistral, Together AI, Fireworks AI, Anyscale, Databricks Mosaic, Notion AI, Glean, Perplexity, Cursor, Replit e do time da Vercel AI SDK filtram CVs que dizem 'usei GPT' ou 'integrei LLM' sem um eval harness, um serving stack ou um número de custo por 1M tokens. Este guia cobre estratégias de CV de júnior a lead para LLM engineers com o stack específico (vLLM, TGI, Triton, llama.cpp, Outlines, Instructor, Guidance, lm-eval-harness, Braintrust, LangSmith, Helicone, Axolotl, Unsloth, TRL), as métricas que importam e a linguagem senior-coded que rende loops em frontier LLM labs.

Best Practices para CV de LLM Engineer Júnior

Abra cada bullet com um verbo que prove que você entregou um LLM rodando, não um prompt. Construí, Entreguei, Configurei, Perfilei, Escrevi. Substitua 'experimentei com GPT-4' por 'construí uma pipeline de extração structured-output em vLLM com Llama 3.1 8B e Outlines atingindo 71 por cento de eval-pass rate'. O LLM precisa rodar de verdade.
Ancore cada bullet em um delta de eval ou um delta de custo. JSON-validity rate de 22 por cento para 4 por cento, custo de $1,40 para $0,42 por 1M tokens, p95 TTFT de 540ms para 210ms. Números provam que o stack LLM melhorou, não apenas que foi entregue.
Nomeie o stack dentro do deliverable, não em uma lista de skills. vLLM, TGI, Outlines, Instructor, Guidance, lm-eval-harness, LangSmith, Helicone, Llama 3.1 8B, Qwen 2.5. Nomear a runtime dentro de um artefato prova que você de fato a usou.
Mostre um feedback loop com um senior LLM engineer ou inference-platform reviewer. LLM engineers júnior que nunca devolvem feedback para a plataforma continuam autores de notebooks. 'Revisado pelo senior LLM engineer para checks de regressão noturnos' é a forma.
Cite um artefato open-source que você produziu. Um benchmark real, eval kit ou receita de fine-tune (mesmo um side project licenciado MIT) eleva um CV júnior acima do status de pôster de hackathon.

Erros Comuns de CV para LLM Engineer Júnior

'Usei GPT' sem métrica

Por que machuca: CVs de LLM júnior que dizem 'usei GPT' ou 'integrei LLM' soam como pôsteres de hackathon. Hiring panels os pulam em favor de CVs que mostram JSON-validity rate, eval-pass rate, p95 TTFT ou custo por 1M tokens.

Como corrigir: Substitua 'usei GPT' por 'construí uma pipeline de extração structured-output em vLLM com Llama 3.1 8B servida atrás de Outlines, atingindo 71 por cento de eval-pass rate no eval set interno'. O número e o eval set tornam o LLM real.

'Prompt engineering' como única manchete

Por que machuca: Prompt engineering sozinho não é mais um trabalho em frontier LLM labs. CVs que lideram com trabalho prompt-only sinalizam que você não cruzou do prompting para o LLM engineering. A linha é structured output, eval harnesses, serving stack e quantização.

Como corrigir: Adicione ao menos um bullet sobre um schema de structured output (Outlines, Instructor, Guidance, JSON Schema), um sobre serving (vLLM, TGI, Ollama) e um sobre um harness de golden-trace replay em LangSmith ou lm-eval-harness.

Nenhum eval harness mencionado

Por que machuca: Stacks LLM em produção sem eval harnesses são notebooks, não sistemas. CVs que omitem tooling de eval sinalizam que o candidato nunca debugou uma regressão em produção.

Como corrigir: Cite um setup de eval específico: golden-trace replay, benchmarks de JSON-validity, medições de eval-pass rate, lm-eval-harness em uma suíte real. 180 golden traces é um número real.

Tips Rápidos de CV para LLM Engineer Júnior

Abra com um stack LLM deployado. Uma pipeline structured-output específica em vLLM com Outlines bate três linhas de resumos de notebook LangChain.
Pareie cada ferramenta com uma métrica. Outlines mais 'erros de JSON-validity de 22 por cento para 4 por cento' é a forma.
Solte um benchmark open-source ou eval kit. Um artefato real (1,4K estrelas no GitHub, 36 rubricas de schema) é o sinal júnior mais forte.
Use o formato com-quem para sêniores e revisores. 'Revisado pelo senior LLM engineer para checks de regressão noturnos' aterrissa mais forte que 'ajudei um time'.
Mantenha um stack LLM no CV que você consiga whiteboardar end-to-end. Recruiters adoram 'me guie pelo structured-output gateway'. Escolha um sobre o qual você consiga falar 25 minutos.

Perguntas frequentes

Um LLM engineer projeta, entrega e tunea stacks de language-model em produção: prompt engineering, RAG, structured output, fine-tuning, eval e inference serving. O dia mistura escrever schemas de structured output (Outlines, Instructor, Guidance, JSON Schema), tunear um cluster vLLM ou TGI (fp8, INT4-AWQ, prefix caching, speculative decoding), rodar eval harnesses de golden trace em LangSmith, Braintrust ou lm-eval-harness, observar dashboards de custo em Helicone e revisar deltas de fine-tune em Axolotl ou Unsloth. O trabalho LLM em produção é aproximadamente 30 por cento de código de serving e decoding, 35 por cento de eval e structured output, 20 por cento de trabalho de fine-tune e dataset, 15 por cento de governança de custo e reliability.

AI Engineers entregam features movidas a LLM amplamente (RAG, agents, embeddings, vector DBs, classificação); Agentic AI Engineers focam estritamente em loops de agentes autônomos multi-step com tool use; LLM Engineers focam estritamente no stack de language-model em si: prompt engineering, RAG, fine-tuning, eval, structured output, latência, custo e serving (vLLM, TGI, Triton, llama.cpp). Onde um AI engineer trata o LLM como um componente, um LLM engineer possui esse componente end-to-end em qualidade de produção.

Lidere com três lentes: eval (eval-pass rate, JSON-validity rate, structured-output match rate, hallucination rate (custom metric), adoção de context-length), custo (custo por 1M tokens, p95 TTFT, p95 inter-token latency, $-custo de fine-tune por pp em eval) e confiança (red-team review findings, postura de inference-trust, lag de detecção de regressão). Pareie com uma métrica de runtime (número de variantes de modelo, frontier providers cobertos) e uma métrica organizacional (RFCs adotados, ICs mentorados, councils levantados).

Não. A skill é engenharia, não pesquisa. Anthropic, OpenAI, Cohere, Hugging Face, Mistral, Together AI, Fireworks AI e Anyscale contratam LLM engineers com bagagens fortes de sistemas, BS ou MS, que conseguem ler um trace de serving, projetar um structured-output gateway, rodar um fine-tune em Axolotl e raciocinar sobre custo por 1M tokens. PhDs são exigidos para AI research engineering e trabalho de capability frontier, não para LLM platform engineering. A régua é entregar stacks LLM em produção com evals e números de custo mensuráveis, não publicar papers.

Uma pipeline real de structured-output em qualidade de produção em vLLM com Llama 3.1 8B servida atrás de Outlines e um eval harness em lm-eval-harness ou LangSmith, mais um benchmark open-source no GitHub com golden-trace replay (mesmo 180 exemplos rotulados são suficientes), mais um README de uma página sobre a JSON-validity rate, p95 TTFT e custo por 1M tokens que você mediu. Juntos sinalizam os três músculos (serving, eval, custo) em quinze minutos de revisão.

Os dois. A OpenAI API e a Anthropic API são a superfície baseline closed-model que todo LLM engineer precisa conhecer de cor. vLLM é a runtime open-source de serving de fato onde mora o trabalho real de LLM engineering: prefix caching, quantização fp8 e INT4-AWQ, speculative decoding, samplers custom e structured output via Outlines. Um júnior que só usa a OpenAI API ainda não cruzou para o LLM engineering; um júnior que entregou um stack vLLM com custo por 1M tokens medido, sim.