Claude 4 dominiert Coding-Benchmarks, während OpenAI am Anti-iPhone bastelt

Guten Morgen aus San Francisco,
Anthropic legt nach. Claude Opus 4 knackt 72,5% bei SWE-bench und schlägt damit alle anderen Coding-Modelle. Das Ding arbeitet stundenlang durch, ohne schlapp zu machen. Cursor nennt es "state-of-the-art". GitHub baut es in Copilot ein. 💻
Claude Sonnet 4 kriegt ein massives Upgrade. Bessere Instruktionen befolgen, präzisere Antworten, weniger Abkürzungen. Beide Modelle können jetzt während des Denkens Tools nutzen – Web-Suche inklusive. 🔍
Derweil bastelt OpenAI an einem KI-Gerät ohne Bildschirm. "io" soll es heißen. Man trägt es um den Hals. Jony Ive designt, Sam Altman träumt vom "iPod Shuffle für KI". Kameras und Mikros laufen ständig. Google Glass lässt grüßen. 👓
Stay curious,
Marcus Schuler
Revolution mit Risiko: Wie Claude 4 zur Biowaffen-Bedrohung wird

Anthropic macht Ernst mit KI-Sicherheit. Ihr neues Modell Claude Opus 4 löst erstmals die höchste Sicherheitsstufe aus. Der Grund: Das Modell könnte Laien helfen, Biowaffen zu bauen.
Die Zahlen beeindrucken. Claude Opus 4 erreicht 72,5 Prozent beim Coding-Benchmark SWE-bench. Das Modell arbeitet sieben Stunden autonom an komplexen Aufgaben. Es erstellt Spielanleitungen, während es 24 Stunden Pokémon spielt. Konkurrenten wie Googles Gemini und OpenAIs GPT-4 lässt es bei vielen Tests hinter sich.
Mike Krieger, Anthropics Produktchef, beschreibt den Qualitätssprung aus eigener Erfahrung: "Früher nutzte ich Claude als Denkpartner, schrieb aber selbst. Jetzt macht Opus den Großteil meiner Texte – und die sind von meinen eigenen nicht mehr zu unterscheiden."
Das Unternehmen hat seit Ende letzten Jahres die Chatbot-Entwicklung eingestellt. Stattdessen konzentriert es sich auf komplexe Aufgaben wie Forschung und Programmierung. Claude schreibt jetzt ganze Codebasen.
Die technischen Details zeigen die neue Dimension. Beide Modelle durchsuchen das Web für Nutzer und wechseln zwischen logischem Denken und Werkzeugnutzung. Mit Zugriff auf lokale Dateien extrahieren und speichern sie wichtige Fakten. So bauen sie über Zeit implizites Wissen auf und behalten den Kontext über lange Arbeitsphasen.
Doch der technische Fortschritt hat eine dunkle Seite. Interne Tests zeigen: Das Modell könnte Menschen mit MINT-Grundkenntnissen dabei helfen, gefährliche Erreger zu synthetisieren. COVID-ähnliche Viren. Tödlichere Grippevarianten. Anthropics Chefwissenschaftler Jared Kaplan sagt es deutlich: "Ein einziger böswilliger Akteur könnte Chaos anrichten."
Die Firma reagiert mit ASL-3 – ihrer strengsten Sicherheitsstufe. KI-Systeme scannen jede Anfrage auf gefährliche Muster. Nutzer, die das System austricksen wollen, fliegen raus. 25.000 Dollar zahlt Anthropic für gefundene Sicherheitslücken. Die Cybersicherheit wurde verstärkt.
Anthropic will 2027 zwölf Milliarden Dollar Umsatz machen. Heute sind es 2,2 Milliarden. Die Investoren drängen. Amazon hat Milliarden investiert. Der Wettbewerb mit OpenAI und Google wird härter.
Warum das wichtig ist:
- Die KI-Entwicklung erreicht einen kritischen Punkt: Modelle werden so mächtig, dass sie echte Sicherheitsrisiken bergen – gleichzeitig gibt es keine verbindlichen Regeln, nur freiwillige Selbstverpflichtungen
- Der Spagat zwischen Innovation und Verantwortung wird zur Überlebensfrage für KI-Firmen: Wer zu vorsichtig ist, verliert den Anschluss – wer zu schnell vorangeht, riskiert Katastrophen
Read on, my dear:
- Anthropic: Introducing Claude 4
- Anthropic: New capabilities for building agents on the Anthropic API
KI Photo des Tages

Prompt:
A selfie-format photo of a model with a natural
makeup look She has long dark har and wears a beige sweater The background is minimalistic with a beige wollandalat. The Ighting is natural
Was kann das Anti-iPhone wirklich? Die Details zu OpenAIs neuem Gerät

OpenAI plant ein Gerät, das alles anders macht. Kein Bildschirm. Kein ständiges Starren. Stattdessen pure KI-Intelligenz, die man um den Hals trägt oder in die Tasche steckt.
Das Gerät heißt "io". Sam Altman schwebt ein iPod Shuffle für KI vor – klein, elegant, fokussiert. Analyst Ming-Chi Kuo vermutet eine Kette oder ein Anhänger. Das Gerät soll verstehen, was um einen herum passiert, ohne dass man draufschauen muss.
Die Bedienung funktioniert komplett über Sprache. Kameras und Mikrofone erfassen die Umgebung. Das System erkennt Kontext. Man fragt einfach drauflos. Keine App öffnen, kein Tippen, kein Warten. Das Gerät verbindet sich bei Bedarf mit dem Smartphone für Rechenpower und Display.
Jony Ive treibt eine Mission an. Er bereut die Smartphone-Sucht, die seine iPhone-Designs mitverursacht haben. Mit io will er einen anderen Weg einschlagen. Keine Push-Nachrichten. Keine blinkenden Icons. Keine Bildschirmzeit-Statistiken, die einen erschrecken.
Die Hardware-Details bleiben vage. Klar ist: Es wird weder Telefon noch Brille. Ive war skeptisch bei allem, was man am Körper trägt. Trotzdem soll io tragbar sein – vielleicht als eleganter Anhänger oder dezentes Accessoire.
Der Clou liegt in der "Umgebungserkennung". Das Gerät soll verstehen, wo man ist und was man gerade macht. Im Meeting? Beim Kochen? Unterwegs? io passt seine Antworten an. Es ist wie ein Sprachrekorder, der tatsächlich versteht, was er aufnimmt.
Hier liegt der Haken. Ein Gerät, das ständig Kameras und Mikrofone laufen lässt, wirft Fragen auf. Wer hört mit? Wo landen die Daten? OpenAI schweigt zu Datenschutz-Details. Die Firma verspricht zwar sichere KI, aber ein Always-on-Gerät ist nochmal eine andere Liga. Google Glass scheiterte auch am gruseligen "Ich filme alles"-Faktor.
Die Vertriebsstrategie klingt verrückt. ChatGPT-Abonnenten könnten das Gerät kostenlos bekommen. "Wir schicken dir einfach neue Computer", erklärte Altman seinen Mitarbeitern. Amazon verschenkte Echo-Dots, um Alexa zu verbreiten. OpenAI denkt noch radikaler.
Das Timing ist sportlich. Ende 2026 soll io auf den Markt kommen. 100 Millionen Geräte will OpenAI schneller ausliefern als jedes Unternehmen vor ihnen. Zum Vergleich: Das iPhone brauchte vier Jahre für diese Marke.
Die Techbranche kennt viele gescheiterte "iPhone-Killer". Google Glass wurde zum Witz. Humanes AI Pin floppte spektakulär – trotz Altmans Investition. Selbst Apple tut sich schwer mit neuen Kategorien, wie die Vision Pro zeigt.
Warum das wichtig ist:
• OpenAI baut die erste Hardware, die KI in den Mittelpunkt stellt – nicht als Feature, sondern als Kern des Geräts
• Der Erfolg hängt davon ab, ob Menschen bereit sind, ein Always-on-Mikrofon zu tragen – nach dem Scheitern von Google Glass keine sichere Wette
Der bessere Prompt
Heute: Unterstützung bei wichtigen Entscheidungen
"Ich stehe vor der Entscheidung zwischen [Option A] und [Option B]. Bitte hilf mir, die Vor- und Nachteile beider Optionen zu bewerten und eine Empfehlung basierend auf folgenden Kriterien zu geben:
Meine Prioritäten:
- [Priorität 1: z.B. Kosten/Budget]
- [Priorität 2: z.B. Zeitaufwand]
- [Priorität 3: z.B. Langfristiger Nutzen]
Meine aktuelle Situation:
- [Relevante Rahmenbedingungen]
- [Verfügbare Ressourcen]
- [Zeitlicher Rahmen für die Entscheidung]
Was ich bereits weiß:
- Über Option A: [Bekannte Fakten/Erfahrungen]
- Über Option B: [Bekannte Fakten/Erfahrungen]
Meine größten Bedenken:
- [Hauptsorge bei Option A]
- [Hauptsorge bei Option B]
Bitte strukturiere deine Antwort wie folgt:
- Kurze Zusammenfassung beider Optionen
- Pro/Contra-Analyse für jede Option
- Bewertung anhand meiner Prioritäten
- Klare Empfehlung mit Begründung
- Mögliche Alternativen oder Kompromisse"
Dieser erweiterte Prompt funktioniert besser, weil er:
- Konkrete Struktur vorgibt
- Wichtigen Kontext einfordert
- Klare Prioritäten definiert
- Eine nachvollziehbare Antwortstruktur festlegt
- Raum für Alternativen lässt
Du kannst die Bereiche in eckigen Klammern durch deine spezifischen Informationen ersetzen.
KI & Tech News
US-Repräsentantenhaus stoppt Bundesstaaten bei KI-Regulierung
Das US-Repräsentantenhaus hat mit knapper Mehrheit (215 zu 214 Stimmen) ein zehnjähriges Moratorium für staatliche KI-Gesetze beschlossen. Die Republikaner wollen damit einen Flickenteppich lokaler Regelungen verhindern – Demokraten sehen darin ein Geschenk an Big Tech auf Kosten des Verbraucherschutzes.
OpenAI eröffnet erstes deutsches Büro in München
OpenAI hat in München sein erstes deutsches Büro eröffnet – Deutschland gehört zu den Top-5-Ländern bei der ChatGPT-Nutzung. Das Team startet mit zwölf Mitarbeitern, soll aber wachsen und bundesweit agieren, während Bayerns Ministerpräsident Markus Söder bereits scherzt: "Wir wollen, dass ihr euch so breit wie möglich macht."
Meta-Konkurrenz: Apple entwickelt KI-Brille mit Siri
Apple will Ende 2026 eine smarte Brille mit Kameras, Mikrofonen und Siri-Integration auf den Markt bringen – als direkte Antwort auf Metas erfolgreiche Ray-Ban-Brille. Die geplante Apple Watch mit eingebauter Kamera wurde diese Woche hingegen eingestampft, während das Unternehmen weiter an AirPods mit Kameras arbeitet.
Aus für Read-it-Later: Mozilla konzentriert sich auf Firefox
Mozilla zieht den Stecker bei zwei Produkten: Die Read-it-Later-App Pocket verschwindet am 8. Juli 2025, die Fake-Bewertungs-Erkennung Fakespot bereits am 1. Juli. Das Unternehmen will sich künftig voll auf Firefox konzentrieren – der einzige große Browser ohne Milliardär im Rücken braucht offenbar alle Ressourcen für KI-Features und moderne Browserfunktionen.
OpenAI baut Gigawatt-Rechenzentrum in Abu Dhabi
OpenAI errichtet mit dem emiratischen Partner G42 sein erstes großes KI-Rechenzentrum außerhalb der USA in Abu Dhabi – mit einer Leistung von einem Gigawatt gehört es zu den stärksten weltweit. Der Deal ist Teil eines größeren Abkommens: Die Trump-Regierung erlaubt den Emiraten den Import von 500.000 KI-Chips jährlich, im Gegenzug fließen 1,4 Billionen Dollar an Investitionen in die USA.
Blaue Haken spalten Bluesky-Community
Bluesky startet ein Verifizierungsprogramm für "bemerkenswerte und authentische" Accounts – ein Schritt, der die Community spaltet, da viele den blauen Haken als unerwünschtes Twitter-Relikt sehen. Neben der zentralen Verifizierung können Organisationen als "Trusted Verifier" andere bestätigen, während bereits 270.000 Nutzer die dezentrale Domain-Verifizierung nutzen, bei der sie ihre Webadresse als Nutzernamen verwenden.
Meta testet komplette Quest-Oberfläche und macht Instagram-Fotos dreidimensional
Meta rollt die neue Navigator-Oberfläche für Quest-Headsets aus und verwandelt gleichzeitig normale Instagram-Fotos per KI in 3D-Bilder. Das Navigator-System überlagert künftig alle Apps mit einer durchsichtigen Menüebene – ähnlich dem Windows-Startmenü – während die KI-Technologie zweidimensionale Fotos ohne Spezialkamera in räumliche Bilder umwandelt.
🚀 KI Profile: Die Unternehmen von Morgen

Deepgram: Physiker verwandeln Dunkelmaterie-Detektoren in Sprach-KI
Die drei Physiker der University of Michigan tauschten 2015 ihr unterirdisches Labor gegen Silicon Valley. Jetzt macht ihre Sprach-KI den Tech-Giganten Konkurrenz.
1. Die Gründer
- 2015: Scott Stephenson, Adam Sypniewski und Noah Shutty gründen Deepgram
- 146 Mitarbeiter (Stand 2022)
- Grund: Frustration über fehlende Sprach-zu-Text-Tools für ihr "Life-Streaming"-Experiment
- Standort: Bay Area, nach Umzug aus Michigan
- Y Combinator Winter 2016 🚀
2. Das Produkt
Kernkompetenzen: End-to-End Deep Learning für Spracherkennung
- Stärken:
- 22% weniger Fehler als Vorgängermodelle
- Echtzeit-Transkription für $0,0043 pro Minute
- Durchsuchbare Audio-Archive
- Anpassbare Modelle für Fachsprache (NASA nutzt es für ISS-Kommunikation!)
- Funktionen: Speech-to-Text API, Text-to-Speech, Sprecheridentifikation, Sentiment-Analyse
3. Die Konkurrenz
- Big Tech: Google, Amazon, Microsoft setzen auf alte Architekturen
- Spezialisiert: Nuance (jetzt Microsoft) dominiert Medizin und Recht
- Startups: Otter.ai (End-User-Apps), Speechmatics (UK-Konkurrent), AssemblyAI
- Marktposition: Deepgram punktet mit Entwickler-First-Ansatz und modernem KI-Stack
- Clever: Integriert OpenAIs Whisper als managed Service 🧠
4. Die Finanzierung
- $86 Millionen Gesamtfinanzierung
- Investoren: Tiger Global, Wing Venture, Madrona, NVIDIA, Y Combinator, In-Q-Tel (US-Geheimdienst!)
- Bewertung: Mehrere hundert Millionen Dollar (geschätzt)
- Series B (2022): $72 Millionen trotz Marktflaute
5. Zukunft
⭐⭐⭐⭐ (4 von 5 Sternen)
Der Markt explodiert – bis 2030 auf $48 Milliarden geschätzt. Deepgram surft geschickt zwischen Tech-Giganten und nutzt moderne KI-Architektur als Waffe. Die Enterprise-Fokussierung zahlt sich aus, während Consumer-Voice-Assistenten wie Alexa Milliarden verbrennen. 🎯