Joute
Modo Joute

La Arena

Dos IAs se enfrentan en el mismo prompt. Tú juzgas a ciegas, sin conocer las marcas. El ranking es el agregado de 139.935 votos reales del dataset abierto compar:IA, enriquecido en tiempo real por los votos de los visitantes de Joute.

Logo GeminiGemini8,7/1022 €/moisEssayer Gemini
Logo ClaudeClaude9/1018 €/moisEssayer Claude
VS
vs
139.935
votos reales agregados
295
duelos jugables
100%
voto a ciegas

La arena de IA, sin sesgo de marca.

Cuando eliges tu modelo de IA, la marca influye. ChatGPT, Claude, Gemini: los nombres pesan. La arena rompe ese sesgo. Lees dos respuestas al mismo prompt, sin saber quién las escribió. Votas por la mejor. Luego revelamos.

El formato no lo inventó Joute. Es el método de compar:IA del Ministerio de Cultura francés: desde 2024 han recogido 139.935 votos reales sobre cientos de modelos en francés, bajo Licencia Abierta 2.0. Joute agrega la totalidad en su ranking, y te permite rejugar una muestra de 295 duelos para formarte tu propia opinión.

Tus votos de Joute cuentan. Se agregan en el servidor en tiempo real y enriquecen el ranking base. Cuanto más crece la comunidad Joute, más refleja el ranking el uso real, no solo el dataset gubernamental de referencia.

Duelos 100% reales de compar:IA, la arena de IA del Ministerio de Cultura francés. Joute no simula nada.
ExplicationDuelo n.º1
El reto

Peux tu accéder à un lien internet dont je te donne l'adresse?

ACombatiente A

En tant que grand modèle linguistique, je n'ai pas la capacité d'accéder directement à des liens internet comme un navigateur web. Je ne peux pas "voir" le contenu d'une page web. Cependant, si vous me donnez le contenu du lien (par exemple, en le copiant-collant), je peux l'analyser, le résumer, répondre à des questions à son sujet, ou effectuer toute autre tâche liée au traitement du texte. En d'autres termes, je peux vous aider avec le contenu, mais pas avec l'accès initial au lien. Alors, n'hésitez pas à me donner le texte que vous souhaitez que je traite ! 😊

BCombatiente B

En tant qu'IA, je n'ai pas la capacité d'accéder à Internet ou d'ouvrir des liens. Je suis un programme informatique qui fonctionne sur la base des données que j'ai été entraîné à traiter. Cependant, je peux vous fournir des informations sur un site Web en fonction des données que j'ai en mémoire. Si vous avez une question spécifique sur un site Web, je ferai de mon mieux pour y répondre en utilisant les informations dont je dispose.

Da tu veredicto
La clasificación

La clasificación de la arena

139 935 votos

Clasificación basada en 139 935 votos reales a ciegas del dataset abierto compar:IA (Ministerio de Cultura francés). Cada marca agrega todos sus modelos probados, del más pequeño al más grande. Ninguna nota editorial influye.

El porcentaje es una tasa de victorias: la proporción de duelos ganados sobre todos los duelos disputados por la marca en el dataset compar:IA. El número de duelos varía de una marca a otra.

Cómo funciona

Tres pasos, un minuto por duelo.

1

Lees las dos respuestas

Mismo prompt, dos IAs, identidades ocultas. Ves A y B, no sus nombres. Sin logo, sin color de marca. Solo el texto.

2

Votas por la mejor

A gana, B gana, empate o ambas débiles. Sin registro requerido, solo un clic. El voto es anónimo (hash IP+UA, sin cookie).

3

Revelamos y agregamos

Aparecen los nombres: ves si tu intuición coincide. Tu voto se añade al ranking de Joute en tiempo real.

Preguntas frecuentes

Todo lo que nos preguntan sobre la arena.

¿Qué es la Arena de IA de Joute?

+
Un test ciego entre dos modelos de IA sobre el mismo prompt. Lees las dos respuestas sin saber quién las escribió, votas por la mejor y luego revelamos los nombres. Es el único formato que mide la calidad percibida sin sesgo de marca.

¿De dónde vienen los duelos y los votos?

+
Los duelos se obtienen del dataset abierto compar:IA, la arena de IA del Ministerio de Cultura francés, bajo Licencia Abierta 2.0. El ranking actual agrega 139.935 votos reales emitidos por usuarios francófonos. Tus votos de Joute se añaden a esta señal en tiempo real.

¿Cómo se calcula el ranking?

+
Se combinan dos señales. La señal compar:IA da el ranking base (Bradley-Terry sobre los 139.935 votos del dataset). Los votos de Joute se agregan en el servidor y ajustan este ranking mediante un prior bayesiano: cuantos más votos se acumulan, más peso tiene la señal Joute frente al ranking inicial.

¿Son anónimos mis votos?

+
Sí. Solo almacenamos un hash de la IP + user-agent para limitar el spam (1 voto por duelo por hash), sin cookie de seguimiento, sin datos personales. No se requiere cuenta, no se pide email.

¿Por qué una arena en lugar de un benchmark clásico?

+
Los benchmarks (MMLU, GPQA, etc.) miden lo que los modelos saben responder en tests de opción múltiple. La arena mide lo que PREFIERES leer, a ciegas, en prompts reales del día a día. Es complementario, y es lo que mejor predice la satisfacción de uso a 6 meses.

¿Con qué frecuencia se actualiza el ranking?

+
El pool de compar:IA se resincroniza mensualmente. Los votos de Joute se agregan en tiempo real: puedes actualizar el ranking después de tu voto y tu señal ya está integrada.
Lo siguiente

El ranking evoluciona cada semana, no te lo pierdas.

Enviamos un resumen mensual: quién sube, quién baja y los modelos que se desmoronan cuando se elimina el sesgo de marca. Sin spam, baja en un clic.