Crowsnest - OpenAI: Eine Matheblamage offenbart die Probleme beim KI-Konzern

OpenAI: Eine Matheblamage offenbart die Probleme beim KI-Konzern

Datum20.10.2025 18:36

Quellewww.spiegel.de

TLDROpenAI geriet in die Schlagzeilen, nachdem Forscher fälschlicherweise einen Mathe-Durchbruch mittels GPT-5 verkündet hatten. Die KI hatte nicht wirklich zehn Erdős-Probleme gelöst, sondern nur bereits existierende Lösungen entdeckt. Kritiker wie Mathematiker Thomas Bloom äußerten sich über die unzureichende Überprüfung der Erkenntnisse seitens von OpenAI. Der Vorfall beleuchtet die Diskrepanz zwischen dem Hype um KI und den realen Fähigkeiten der Technologie, insbesondere in der Mathematik. OpenAI steht unter Druck wegen des Wettbewerbs im KI-Sektor, was zu übereilten Behauptungen führen könnte.

InhaltForscher von OpenAI feiern einen vermeintlichen Mathedurchbruch – und rudern zurück. Der menschliche Irrtum verrät viel über Hype und Hybris bei dem KI-Unternehmen. "Wow, endlich große Durchbrüche bei bisher ungelösten Problemen!" So feierte Boris Power, Forschungsleiter beim KI-Unternehmen OpenAI, eine Nachricht seiner Mitarbeiter. Auf der Plattform X hatten sie bekannt gegeben, dass sie mithilfe des KI-Modells GPT-5, des KI-Chatbots des Unternehmens, angeblich eine Reihe von bislang ungelösten Mathematikproblemen lösen könnten. Konkret gehe es um zehn sogenannte Erdős-Probleme, benannt nach dem ungarischen Jahrhundert-Mathematiker Paul Erdős, einem Meister der Kombinatorik und Zahlentheorie. Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung. Doch die Freude von Top-KI-Forscher Power verpuffte: Es meldete sich der britische Mathematiker Thomas Bloom. Powers Tweet sei eine, so Bloom, "dramatische Fehldarstellung". Bloom betreibt die Website erdosproblems.com , auf der die zahlreichen Erdős-Probleme kartografiert sind. Auf deren Verzeichnis hatte sich auch OpenAI berufen. Es stellte sich heraus: Die KI von OpenAI hatte mitnichten ein mathematisches Rätsel gelöst. Vielmehr hatte sie in den Weiten des Internets nicht sonderlich bekannte Forschungsarbeiten entdeckt, in denen die Lösungen beschrieben waren. Mathematiker Bloom waren die Ergebnisse jedoch noch nicht bekannt, wie er dem SPIEGEL bestätigt. Auf seiner 2022 gestarteten Seite waren die jeweiligen Erdős-Probleme daher noch irrtümlich als "offen" markiert. Bloom ist Wissenschaftler an der Universität Manchester. Er betreibt seine kleine Website als Hobbyprojekt und aus persönlichem Interesse heraus. Dennoch hatten die OpenAI-Mitarbeiter sie offenbar als Bezugspunkt gewählt. "Das Ziel der Website ist es, irgendwann eine vollständige und korrekte Datenbank zu sein, aber es gibt viele Dinge, die mir nicht bekannt sind", so Bloom unter Verweis auf die mehr als 1000 Erdős-Probleme. Insbesondere die Literaturrecherche sei schwierig – ein Punkt, den GPT-5 nun erfolgreich absolvierte. Die KI als extrem fähiger Rechercheassistent – diese durchaus bemerkenswerte Leistung ging angesichts des blamablen Triumphgeheuls der OpenAI-Mitarbeiter unter. Kevin Weil, Vizepräsident in der Abteilung Wissenschaft bei OpenAI, hatte den vermeintlichen Durchbruch mit den Worten kommentiert: "Diese Probleme waren alle seit Dekaden offen." Weil hat seinen Tweet inzwischen gelöscht. Auch Power und die anderen Beteiligten von OpenAI erkannten ihren Irrtum schnell und gaben den Fehler öffentlich zu. Spott der Konkurrenz erntete das Unternehmen trotzdem. "Das ist peinlich", ätzte DeepMind-Chef und Nobelpreisträger Demis Hassabis von Google. Yann LeCun, KI-Chef bei Meta, legte nach : OpenAI falle dem eigenen, blindwütigen Hype zum Opfer. Mathematiker Bloom, der die Erdős-Seite betreibt, gibt sich in seiner Kritik gegenüber dem SPIEGEL nüchterner. "Ich finde aber schon, dass Mitarbeiter von OpenAI sorgfältig hätten prüfen sollen, was tatsächlich passiert ist, bevor sie aufgeregt berichten." Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung. Natürlich kann jedem, auch einem hoch bezahlten Experten, ein Fehler passieren. Und wer einen solchen Fehler macht, der braucht bei den Mathe-Experten in der KI-Branche für den Spott nicht zu sorgen. Trotzdem ist der Vorfall weit mehr als ein nerdiger Fauxpas. Er legt ein Grundproblem der KI-Branche und speziell von OpenAI offen: die Kluft zwischen Hype und Realität. Wie kann einem Konzern, der sich gern selbst als KI-Forschungslabor und als dem wissenschaftlichen Fortschritt verschrieben inszeniert, ein solcher Fehler passieren? Warum verkündete das mit einer Bewertung von zuletzt wohl 500 Milliarden Dollar versehene Unternehmen derart vorschnell einen unüberprüften Erfolg? Die Antwort liegt vermutlich in dem enormen Druck, der auf dem Start-up aktuell lastet. Trotz des Hypes um ChatGPT steht das Unternehmen in einem harten Konkurrenzkampf mit anderen KI-Anbietern wie etwa Google, Meta oder Anthropic. Erkennbar bemüht sich OpenAI-Chef Sam Altman in den vergangenen Monaten, den Hype um seinen Konzern zu befeuern. So verglich er die Präsentation von GPT-5 im August mit der Präsentation des iPhones von Steve Jobs im Jahr 2007. Eine Parallele, die für viele Experten reichlich absurd wirkte – zumal das neue Modell danach auch noch zahlreiche Fehler produzierte. In den vergangenen Monaten hat Altman den Markt mit neuen Produkten und Ankündigungen geflutet. Mit der neuen Video-App Sora greift er die Social-Media-Konzerne an. Eine Art TikTok-Feed für KI-generierte Inhalte soll wohl neue Geschäftsfelder für seinen Konzern erschließen. Vergangene Woche deutete Altman zudem an, ChatGPT bereits ab Dezember mit einer Erotikfunktion für Erwachsene zu versehen. Der Schritt könnte dem Konzern ebenfalls mehr zahlungswillige Nutzer und neue Einnahmemöglichkeiten erschließen. Gleichzeitig gibt Altman selbst den Mahner und äußerte sich kritisch zu einem möglichen Hype. So sagte er im August laut Technikportal "The Verge" : "Befinden wir uns in einer Phase, in der die Anleger insgesamt zu euphorisch in Bezug auf KI sind? Meiner Meinung nach ja. Ist KI das Wichtigste, was seit sehr langer Zeit passiert ist? Meiner Meinung nach ebenfalls ja", wurde er zitiert. Die Branche ist zwar im Rausch, doch die aktuelle Episode zeigt einmal mehr, wo die Grenzen der Technik bisher noch liegen. KI-Modelle sind zwar gut darin, vorhandenes Wissen zu vereinnahmen, zu sammeln, zu sortieren und es miteinander zu verknüpfen. Wissenslücken aber füllen sie mit plausibel klingendem Unsinn – Experten nennen es "Halluzinationen". Auch Mathematiker Bloom betont, wie nützlich KI-Tools in der Forschung schon seien, etwa um Berechnungen durchzuführen oder Code zu generieren. "Allerdings neigt die KI derzeit noch zu Halluzinationen und subtilen Fehlern, sodass sie ohne die starke Beteiligung eines menschlichen Experten auf dem Gebiet keine neuen Lösungen generieren zu können scheint." Das Wissen um die mathematischen Unzulänglichkeiten der KI erklärt zumindest in Teilen die schadenfrohen bis gehässigen Reaktionen auf die falsche Erfolgsmeldung aus dem Hause OpenAI. "Kein Anflug von Skepsis, nur undifferenziertes Hochjubeln", kritisiert ein Nutzer , dass die KI-Experten sich seiner Meinung nach angesichts ihrer Nachricht stärker selbst hätten hinterfragen müssen. Es gibt zwar Berichte, wonach es KI-Modellen gelungen ist, bislang offene mathematische Probleme zu lösen. So berichtete die Firma Google DeepMind in einem Artikel für die Zeitschrift "Nature" Ende 2023, dass das Unternehmen eine Versuchsanordnung gebaut habe, die neben zahlreichen Fehlversuchen auch eine Lösung für ein Matherätsel gefunden habe. Die Autoren des Artikels betonen aber selbst, wie schwer es KI-Modellen falle , neue Lösungen zu finden. Mathematiker Bloom von erdosproblems.com glaubt, dass die KI tatsächlich einige der einfacheren Erdős-Probleme auf seiner Seite lösen könnte. "Aber einige davon sind wirklich einfach und nur deshalb noch offen, weil sich noch kein Mensch hingesetzt und richtig darüber nachgedacht hat und die ursprünglichen Probleme bis zu meiner Website völlig in Vergessenheit geraten waren." Bei schwierigen Problemen hätten aktuelle KIs seiner Einschätzung nach keine Chance – noch. Einen Arbeitsauftrag für die KIs der Zukunft hätte Bloom aber. Fragt man ihn nach seinem liebsten Erdős-Problem, tut er sich zwar schwer, unter seinen vielen Favoriten auszuwählen. Doch bei der sogenannten Summen-Produkt-Vermutung, Nummer 52 auf seiner Website, sei es wirklich "sehr überraschend, dass sie immer noch offen ist."