5 min read

Wenn KI denkt, wird’s dumm: Apple entlarvt das Denkversagen von OpenAI & Co.

Wenn KI denkt, wird’s dumm: Apple entlarvt das Denkversagen von OpenAI & Co.

Good Morning from San Francisco, 🌉

Apple-Forscher entdeckten ein fatales Problem der neuesten KI-Generation. 🤖 Die "Denkmodelle" von OpenAI und Anthropic versagen komplett bei komplexen Aufgaben. Noch bizarrer: Je schwerer das Problem, desto weniger denken sie. 🧠

Außerdem: Meta verhandelt über eine Rekord-Investition von mehr als 10 Milliarden Dollar in Scale AI. Das wäre Zuckerbergs größter externer KI-Deal. 🚀

Scale AI bereitet Daten für KI-Training auf - der Rohstoff wird knapper. Die Firma beschäftigt tausende schlecht bezahlte Auftragnehmer weltweit. 🌍 Meta hinkt bei KI-Investitionen hinter Microsoft, Amazon und Google hinterher.

Stay curious,

Marcus Schuler


Warum schlauere KI-Modelle bei schweren Problemen weniger denken

Apple-Forscher haben ein verstörendes Geheimnis der neuesten KI-Generation entdeckt. Die "Denkmodelle" von OpenAI und Anthropic scheitern komplett, sobald Probleme eine bestimmte Komplexitätsschwelle überschreiten. Noch merkwürdiger: Sie denken weniger, je schwerer die Aufgabe wird.

Die Studie testete Modelle wie Claude 3.7 Sonnet Thinking und OpenAIs o3-mini an kontrollierten Rätseln statt üblichen Mathe-Tests. Das Ergebnis erschüttert die Grundannahmen über KI-Fähigkeiten.

Forscher identifizierten drei Leistungszonen. Bei einfachen Problemen schlagen Standard-Modelle oft ihre "denkenden" Pendants. Die extra Denkschritte verschwenden nur Rechenpower. Bei mittlerer Komplexität gewinnen Denkmodelle. Bei hoher Komplexität versagen beide komplett.

Das Paradox wird noch absurder: Selbst mit vollständigen Lösungsalgorithmen scheitern die Modelle an denselben Schwellen. Sie können ihre eigenen Anweisungen nicht befolgen. Bei Tower-of-Hanoi-Rätseln versagten sie trotz exakter Schritt-für-Schritt-Algorithmen.

Claude 3.7 Sonnet Thinking nutzt 20.000 Tokens bei simplen Rätseln, aber nur 5.000 bei schweren Versionen - obwohl 64.000 verfügbar wären. Das Modell kapituliert, statt durchzuhalten.

Die Analyse zeigt ineffiziente Denkmuster. Bei simplen Problemen finden Modelle schnell richtige Lösungen, erkunden aber weiter falsche Wege. Bei mittlerer Komplexität irren sie lange umher, bevor sie zufällig richtig liegen. Darüber hinaus finden sie gar keine Lösungen.

Diese Grenzen haben ernste Folgen für kritische Anwendungen. Modelle, die nicht mal explizite Algorithmen befolgen können, taugen nicht für Aufgaben, die logische Konsistenz erfordern.

Traditionelle KI-Tests täuschen durch Datenkontamination. Modelle schneiden bei AIME 2024 besser ab als bei AIME 2025, obwohl Menschen den neuen Test einfacher finden. Sie haben Lösungen auswendig gelernt, statt echtes Denken entwickelt.

Warum das wichtig ist:

  • KI-Denkmodelle stoßen an Architekturgrenzen, die mehr Rechenpower nicht löst - sie denken weniger bei komplexen Problemen, nicht mehr
  • Das Versagen selbst bei expliziten Lösungsschritten zeigt: Das Problem liegt nicht im Finden von Antworten, sondern im logischen Ausführen von Befehlen

Read on, my dear:


KI Photo des Tages

Credit: midjourney

Prompt:

A woman with the head of an Asian white crane, the woman is facing the camera and the crane head is covering half of her face following the woman head shape, black background, surreal photography by Tim Walker and Nona Limmen, fine art portrait, hyper-realistic details, studio lighting, soft shadows, low contrast, clean sharp focus, cinematic colour grading

Meta plant Milliarden-Deal mit Scale AI

Meta verhandelt über eine Investition von mehr als 10 Milliarden Dollar in Scale AI. Das wäre die größte externe KI-Investition des Facebook-Konzerns.

Scale AI bereitet Daten für KI-Training auf. Die Firma beschäftigt tausende Auftragnehmer weltweit, die Texte und Bilder für Algorithmen sortieren und markieren. Kunden sind Microsoft, OpenAI und Meta selbst.

Mark Zuckerberg macht KI zur obersten Priorität. Er plant, 2025 bis zu 65 Milliarden Dollar in KI-Projekte zu stecken. Metas Chatbot Llama erreicht bereits eine Milliarde Nutzer monatlich.

Die Konkurrenz investiert längst massiv. Microsoft steckte über 13 Milliarden in OpenAI. Amazon und Google pumpten Milliarden in Anthropic. Meta hinkt hinterher.

Scale AI wächst rasant. 2024 machte die Firma 870 Millionen Dollar Umsatz. Für 2025 erwartet sie über 2 Milliarden. Der letzte Firmenwert lag bei 14 Milliarden Dollar.

Beide Unternehmen arbeiten fürs Militär. Meta entwickelt mit Rüstungsfirma Anduril KI-Helme für Soldaten. Scale AI baut "Defense Llama" - eine Militär-Version von Metas Sprachmodell.

Scale AI ist umstritten. Die Firma beschäftigt schlecht bezahlte Auftragnehmer auf den Philippinen und in Kenia. Das US-Arbeitsministerium untersuchte Lohnverstöße, stellte die Ermittlungen aber kürzlich ein.

CEO Alexandr Wang hat gute Verbindungen nach Washington. Sein Ex-Manager Michael Kratsios berät Trump bei KI-Fragen.

Warum das wichtig ist:

  • Meta erkauft sich mit dem Deal Zugang zu den besten KI-Trainingsdaten - der Rohstoff der Zukunft wird immer knapper.
  • Der Militär-Fokus zeigt: KI wird zum Geopolitik-Instrument, Tech-Firmen werden zu Rüstungspartnern.

Read on, my dear:


KI & Tech News

Drei US-Redaktionen testen automatische Artikel-Stichpunkte

Das Wall Street Journal, Bloomberg und Yahoo News nutzen künstliche Intelligenz für Artikel-Zusammenfassungen. Die drei Medien erstellen automatische Stichpunkte für eilige Leser - aber setzen weiterhin auf menschliche Kontrolle. Yahoo macht die Funktion optional, das WSJ prüft jeden KI-Text vor Veröffentlichung. Bloomberg nutzt die Technologie besonders bei komplexen Themen wie der Zoll-Politik.

Mistral AI schließt Milliardenverträge ab

Mistral AI aus Paris sichert sich Verträge im Wert von Hunderten Millionen Dollar und plant eine Finanzierungsrunde von einer Milliarde. Das französische KI-Startup profitiert davon, dass europäische und andere Kunden Alternativen zu US-Anbietern suchen, seit Trump wieder im Weißen Haus sitzt.

Treefera sammelt 30 Millionen für KI-Lieferketten

Treefera sichert sich 30 Millionen Dollar in der Series B, angeführt von Notion Capital. Das Startup nutzt Satelliten, Drohnen und KI, um Lieferketten transparent zu machen – besonders dort, wo 60 Prozent der globalen CO2-Emissionen entstehen.

Britisches Startup Skyral holt 20 Millionen für KI-Simulation

Skyral sammelt 20 Millionen Dollar in der Series A, angeführt von NOIA Capital. Das britische Startup baut KI-gestützte digitale Zwillinge, mit denen Regierungen und Unternehmen Politikentscheidungen virtuell testen können, bevor sie sie in der realen Welt umsetzen.

Obvio sammelt 22 Millionen für KI-Kameras an Stoppzeichen

Obvio aus Kalifornien holt sich 22 Millionen Dollar von Bain Capital Ventures für KI-Kameras an Kreuzungen. Die bunten Pylonen erkennen Verkehrsverstöße automatisch und schicken Bußgeldbescheide - versprechen aber, keine Überwachungsmaschine zu werden, da Aufnahmen nach zwölf Stunden gelöscht werden.

Siri bleibt stumm: Apple kämpft mit KI-Update

Apple scheitert daran, Siri mit moderner KI zu verbessern. Ex-Mitarbeiter berichten von Bugs beim Versuch, große Sprachmodelle in den alten Assistenten zu integrieren. Während Konkurrenten wie OpenAI ihre Sprachassistenten von Grund auf neu bauen, versucht Apple das alte System zu flicken.

iOS 26 bringt durchsichtiges Design für alle Geräte

Apple stellt iOS 26 mit "Liquid Glass"-Design vor und bereitet ein iPhone mit Rundumglas für 2027 vor. Das neue Interface soll alle Apple-Geräte vereinen, während das 20-Jahre-iPhone komplett aus Glas bestehen wird.

WordPress-Veteranen starten Gegenprojekt nach Machtkampf

WordPress-Experten und die Linux Foundation bauen ein alternatives Update-System für die Plattform, die 40 Prozent aller Websites antreibt. Das FAIR-Projekt entstand nach dem Streit zwischen WordPress-Chef Matt Mullenweg und dem Hosting-Anbieter WP Engine, der Sicherheitsbedenken bei Unternehmen auslöste.


🚀 KI Profile: Die Unternehmen von Morgen

Scale AI: Datenveredelung für die KI-Elite 🤖

Scale AI verwandelt chaotische Rohdaten in trainierte KI-Algorithmen. Das Unternehmen beliefert Tesla, OpenAI und das Pentagon mit präzise annotierten Datensätzen.

1. Gründer • Alexandr Wang (19) und Lucy Guo gründeten 2016 in San Francisco • 1.500+ Mitarbeiter heute • Wang brach MIT-Studium ab, wurde jüngster Milliardär mit 25 • Guo verließ 2018 wegen Differenzen

2. Produkt • Kern: Menschliche Arbeitskraft trifft KI-Software • Annotiert Millionen Bilder, Videos, Texte für autonome Fahrzeuge • Spezialisiert auf komplexe 3D-Daten und Militär-Anwendungen
• Neue Services: ChatGPT-Optimierung via menschliches Feedback

3. Konkurrenz • Labelbox (Software-fokussiert, $188M Funding) 📊 • Appen (traditioneller Player, kämpft ums Überleben) • Amazon SageMaker (Cloud-integrierte Lösung) • Etablierung durch Pentagon-Verträge und Tesla-Partnerschaft

4. Finanzierung • $1,6 Milliarden gesammelt, Bewertung $14 Milliarden 💰 • Investoren: Accel, Meta, Amazon, Nvidia • Profitabel seit 2020 (seltene Startup-Eigenschaft) • IPO-Gerüchte bei $25 Milliarden Zielwertung

5. Zukunft ⭐⭐⭐⭐ KI braucht weiterhin menschlich kuratierte Daten - Scale sitzt am Schalthebel. Risiko: Automatisierung frisst eigenes Geschäftsmodell. Wang positioniert sich als "nationaler KI-Champion" gegen China. 🇺🇸