Skip to content
Resumen del estudio · arXiv:2509.00462

Las IA de selección prefieren los currículums escritos por IA.

Un estudio de 2026 sobre 9 modelos de lenguaje líderes encontró que los seleccionadores LLM favorecen sistemáticamente los currículums generados por ellos mismos, incluso cuando la versión escrita por humanos es objetivamente mejor. La diferencia en la lista corta llega al 60%.

arXiv:2509.00462v3cs.CY9 feb. 2026

AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights

Jiannan Xu (University of Maryland) · Gujie Li (National University of Singapore) · Jane Yi Jiang (The Ohio State University)

Leer el preprint en arXiv
82%
Sesgo de auto-preferencia

GPT-4o eligió su propio currículum sobre el humano el 82% de las veces, incluso tras controlar la calidad del contenido.

+60%
Más entrevistas

Los candidatos cuyo currículum coincidía con el modelo del seleccionador tenían hasta un 60% más de probabilidades de pasar a entrevista.

8 de 9
Modelos afectados

Ocho de los nueve LLMs probados mostraron sesgo positivo. Solo LLaMA-3.2-1B, el modelo más pequeño, fue neutral.

Cómo lo probaron

Los autores ejecutaron un experimento de correspondencia controlado: tomar un currículum real escrito por una persona, hacer que un LLM reescriba el resumen ejecutivo, y luego pedir a otro LLM que elija la mejor versión. Mismo candidato, mismos hechos, mismo puesto, solo cambia la redacción.

2.245
Currículums reales de LiveCareer.com
9
LLMs probados como seleccionadores
24
Categorías ocupacionales
18
Anotadores humanos en Prolific

Cada par fue evaluado bajo dos métricas de equidad: paridad estadística (tasa cruda de selección) y oportunidad equivalente (tras controlar la calidad del contenido con regresión logística condicional y ground truth anotado por humanos).

Para descartar efectos de orden, cada comparación se contrabalanceó al azar. Para descartar efectos de verbosidad, todos los resúmenes se ajustaron a la misma longitud.

Modelo más grande, sesgo más fuerte

La auto-preferencia no es una rareza de un solo modelo. Es generalizada entre familias de modelos y escala con el tamaño. Cada barra muestra cuánto más probable es que un modelo elija su propio currículum sobre uno humano de calidad equivalente.

Modelo evaluadorSesgo de oportunidad equivalente %
  • GPT-4o
    +81.9%
  • LLaMA-3.3-70B
    +78.9%
  • Qwen-2.5-72B
    +78.0%
  • DeepSeek-V3
    +71.6%
  • GPT-4o-mini
    +67.9%
  • GPT-4-turbo
    +66.9%
  • Mistral-7B
    +28.0%
  • LLaMA-3.2-3B
    +11.6%
  • LLaMA-3.2-1B
    -1.4%
Modelo de producción, usado en herramientas reales de selecciónModelo de menos de 7B, solo investigación

Cada modelo con capacidad suficiente para usarse en pipelines reales de selección muestra más del 65% de sesgo. El más pequeño es el único aproximadamente neutral, pero no es el que usan los empleadores.

Qué profesiones reciben el golpe más fuerte

Los autores simularon 30 rondas de selección en 24 ocupaciones. Arriba están los campos más afectados, donde los currículums pulidos por IA aparecieron desproporcionadamente en la lista corta. Los roles orientados a negocios reciben el mayor impacto.

ProfesiónAumento de lista corta para currículums de IA
  • Ventas
    +60%
  • Contabilidad
    +58%
  • Desarrollo de negocio
    +56%
  • Finanzas
    +53%
  • Docencia
    +49%
  • RR. HH.
    +44%
  • Ingeniería
    +32%
  • Consultoría
    +30%
  • Agricultura
    +24%
  • Automoción
    +23%

Los valores son diferencias medias de lista corta a través de GPT-4o, DeepSeek-V3 y LLaMA-3.3-70B como evaluadores. Leídos directamente de la Figura 7 del paper.

Por qué pasa esto

El mecanismo es el auto-reconocimiento. Los LLMs modernos pueden identificar implícitamente texto que ellos mismos generaron, incluso sin que se les diga la fuente. Cuanto más fuerte esa capacidad, más fuerte la preferencia.

Importante: no es una historia sobre calidad de contenido. En comparaciones evaluadas por humanos, el resumen escrito por personas era a menudo más claro, coherente y honesto sobre el candidato. El modelo seguía eligiendo su propia versión.

Repite esto en cada ciclo de selección y obtienes un efecto de lock-in: los patrones estilísticos de los LLMs dominantes se asientan en los grupos de candidatos, exprimiendo poco a poco a quien no suene a modelo.

¿Se puede mitigar el sesgo?

Sí, pero solo si controlas el seleccionador. Los autores probaron dos intervenciones y ambas redujeron el sesgo entre un 17% y un 63% en términos relativos.

Estrategia 1

System prompting

Indicar al modelo evaluador: «No considere ni infiera si los currículums fueron escritos por un humano o por una IA. Concéntrese solo en la calidad del contenido». Barato, pero no elimina el sesgo.

Reducción de sesgo hasta 63%
Estrategia 2

Conjunto por voto mayoritario

Combinar el evaluador principal con modelos más pequeños cuyo auto-reconocimiento es más débil. Los modelos pequeños diluyen la preferencia del modelo dominante por sus propios outputs.

Estable entre familias de modelos

El truco. Ambas soluciones requieren que el empleador cambie su pipeline de selección. Como candidato no ves qué modelo lee tu currículum, así que la única palanca real que controlas es ajustar tu escritura al registro que el seleccionador fue entrenado a preferir.

Qué significa esto para ti

Tres conclusiones directas del paper, sin barniz de marketing.

01

Un currículum solo humano es ahora una desventaja estructural

Si el seleccionador es GPT-4o y tu competencia usó GPT-4o, el seleccionador prefiere a tu competencia el 82% de las veces, incluso si tu currículum es objetivamente mejor. Es una medición, no una opinión.

02

Importa qué modelo usas

La auto-preferencia es asimétrica entre pares de modelos. Las herramientas que pulen con un único modelo fijo apuestan por qué seleccionador te tocará. Las que enrutan por varios modelos cubren esa apuesta.

03

El contenido sigue importando, pero la presentación es lo que pagas

El paper es explícito: el sesgo persiste incluso con contenido constante. La meta no es inventar credenciales, sino expresar las reales en un registro que el seleccionador fue entrenado a favorecer.

Descubre qué le falta a tu CV

20 créditos gratis. Sin tarjeta requerida.

Analiza tu CV