Joute
Joute-Modus

Die Arena

Zwei KIs kämpfen auf demselben Prompt. Du urteilst blind, ohne die Marken zu kennen. Das Ranking ist das Aggregat aus 139.935 echten Votes des offenen compar:IA-Datensatzes, in Echtzeit angereichert durch Joute-Besucher-Votes.

Logo GeminiGemini8,7/1022 €/moisEssayer Gemini
Logo ClaudeClaude9/1018 €/moisEssayer Claude
VS
vs
139.935
echte aggregierte Votes
295
spielbare Duelle
100%
Blind-Vote

Die KI-Arena, ohne Markenbias.

Wenn du dein KI-Modell wählst, lässt du dich von der Marke beeinflussen. ChatGPT, Claude, Gemini: Die Namen tragen Gewicht. Die Arena bricht diesen Bias. Du liest zwei Antworten auf denselben Prompt, ohne zu wissen, wer sie geschrieben hat. Du stimmst für die beste ab. Dann enthüllen wir.

Das Format wurde nicht von Joute erfunden. Es ist die Methode von compar:IA des französischen Kulturministeriums: Seit 2024 haben sie 139.935 echte Votes auf Hunderten von Modellen auf Französisch gesammelt, unter Open License 2.0. Joute aggregiert den gesamten Datensatz in seinem Ranking und lässt dich eine Stichprobe von 295 Duellen nachspielen.

Deine Joute-Votes zählen. Sie werden serverseitig in Echtzeit aggregiert und bereichern das Basis-Ranking. Je größer die Joute-Community wird, desto mehr spiegelt das Ranking die echte Nutzung wider.

100% echte Duelle aus compar:IA, der KI-Arena des französischen Kulturministeriums. Joute simuliert nichts.
ExplicationDuell Nr.1
Die Aufgabe

répondre à la question d'EC2 en spécialité SES de terminale en une dizaine de ligne : Montrez que l'accroissement de la productivité globale des facteurs est source de croissance économique.

AKämpfer A

L'accroissement de la productivité globale des facteurs (PGF) correspond à une amélioration de l'efficacité avec laquelle le travail et le capital sont combinés pour produire des biens et services. Cette hausse de la PGF permet de produire davantage avec les mêmes quantités de facteurs, ce qui augmente la production totale. En effet, la croissance économique ne dépend pas seulement de l'augmentation des quantités de travail et de capital, mais aussi de la manière dont ces facteurs sont utilisés. Une meilleure organisation, des innovations technologiques ou des progrès dans les méthodes de production augmentent la PGF, ce qui stimule la croissance économique en rendant la production plus efficace. Ainsi, la croissance économique s’appuie sur la capacité d’une économie à améliorer la PGF, car cela permet d’accroître durablement le produit intérieur brut (PIB) sans augmenter proportionnellement les ressources utilisées. Par conséquent, l’accroissement de la PGF est une source essentielle de croissance économique durable.

BKämpfer B

L’accroissement de la productivité globale des facteurs (PGF) stimule la croissance économique en améliorant l’efficacité combinée du travail et du capital. Lorsque la PGF augmente, une même quantité de facteurs de production génère plus de biens et services, ce qui accroît le PIB. Cela résulte notamment du progrès technique (innovations, digitalisation), d’une meilleure organisation du travail ou de l’accumulation de savoir-faire. Par exemple, l’automatisation permet de produire davantage sans augmenter les heures travaillées ou le capital physique. Selon la théorie de la croissance endogène, ces gains de productivité, liés aux investissements en R&D ou en éducation, engendrent des externalités positives et une croissance durable. Ainsi, la PGF explique la part de la croissance non attribuable à l’accumulation quantitative des facteurs, soulignant le rôle clé de l’innovation dans la prospérité économique.

Fälle dein Urteil
Das Ranking

Das Arena-Ranking

139 935 Stimmen

Ranking auf Basis von 139 935 echten Blind-Stimmen aus dem offenen compar:IA-Datensatz (französisches Kulturministerium). Jede Marke fasst alle getesteten Modelle zusammen, vom kleinsten bis zum größten. Keine redaktionelle Note fließt ein.

Der Prozentsatz ist eine Siegquote: der Anteil gewonnener Duelle an allen von der Marke im compar:IA-Datensatz bestrittenen Duellen. Die Zahl der Duelle variiert je Marke.

So funktioniert es

Drei Schritte, eine Minute pro Duell.

1

Du liest beide Antworten

Gleicher Prompt, zwei KIs, Identitäten versteckt. Du siehst A und B, nicht ihre Namen. Kein Logo, keine Markenfarbe. Nur der Text.

2

Du stimmst für die beste ab

A gewinnt, B gewinnt, Unentschieden oder beide schwach. Keine Registrierung erforderlich, nur ein Klick. Das Vote ist anonym (IP+UA-Hash, kein Cookie).

3

Wir enthüllen und aggregieren

Die Namen erscheinen: Du siehst, ob deine Intuition stimmt. Dein Vote wird dem Joute-Ranking in Echtzeit hinzugefügt.

FAQ

Alles, was wir zur Arena gefragt werden.

Was ist die Joute KI-Arena?

+
Ein Blindtest zwischen zwei KI-Modellen auf demselben Prompt. Du liest beide Antworten, ohne zu wissen, wer sie geschrieben hat, stimmst für die beste ab und dann enthüllen wir die Namen. Das ist das einzige Format, das wahrgenommene Qualität ohne Markenbias misst.

Woher kommen die Duelle und Votes?

+
Die Duelle stammen aus dem offenen Datensatz compar:IA, der KI-Arena des französischen Kulturministeriums, unter Open License 2.0. Das aktuelle Ranking aggregiert 139.935 echte Votes von französischsprachigen Nutzern. Deine Joute-Votes werden diesem Signal in Echtzeit hinzugefügt.

Wie wird das Ranking berechnet?

+
Zwei Signale werden kombiniert. Das compar:IA-Signal liefert das Basis-Ranking (Bradley-Terry auf den 139.935 Datensatz-Votes). Joute-Votes werden serverseitig aggregiert und passen dieses Ranking über einen bayesianischen Prior an: Je mehr Votes sich ansammeln, desto mehr wiegt das Joute-Signal gegenüber dem Ausgangsranking.

Sind meine Votes anonym?

+
Ja. Wir speichern nur einen Hash aus IP + User-Agent, um Spam zu begrenzen (1 Vote pro Duell pro Hash), kein Tracking-Cookie, keine persönlichen Daten. Kein Konto erforderlich, keine E-Mail-Abfrage.

Warum eine Arena statt eines klassischen Benchmarks?

+
Benchmarks (MMLU, GPQA usw.) messen, was Modelle auf Multiple-Choice-Tests antworten können. Die Arena misst, was du BEVORZUGST zu lesen, blind, auf echten Alltags-Prompts. Das ist komplementär und sagt am besten die Nutzungszufriedenheit nach 6 Monaten vorher.

Wie oft wird das Ranking aktualisiert?

+
Der compar:IA-Pool wird monatlich neu synchronisiert. Joute-Votes werden in Echtzeit aggregiert: Du kannst das Ranking nach deinem Vote aktualisieren und dein Signal ist bereits integriert.
Was kommt als Nächstes

Das Ranking entwickelt sich jede Woche, verpasse es nicht.

Wir senden eine monatliche Zusammenfassung: Wer steigt, wer fällt und die Modelle, die kollabieren, wenn man den Markenbias entfernt. Kein Spam, Ein-Klick-Abmeldung.