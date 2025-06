Im Rahmen der WWDC 2025 hat Apple über 100 Entwickler-Sessions veröffentlicht, in denen der Konzern die neuen Funktionen für iPhone, iPad, Mac und Apple Watch im Detail vorstellt. In dem 19 Minuten langen Video „Bring advanced speech-to-text to your app with Speech Analyzer“ geht es um eine neue Schnittstelle zur Spracherkennung, die allen interessierten Entwicklern zur Verfügung stehen wird.

Transkription für Drittanbieter

Mit dem Speech Analyzer bietet Apple eine neue API, die Spracheingaben in Text umwandeln und gleichzeitig zeitlich exakt zuordnen kann. Anders als bei der bisherigen Lösung funktioniert die Analyse nun asynchron und speichert zeitgenaue Informationen zu jedem Wort oder Satz.

Die neue Schnittstelle funktioniert wie ein Baukasten, mit dem sich verschiedene Funktionen zur Spracherkennung zusammenstellen lassen. Herzstück ist ein Modul, das gesprochene Sprache erkennt und in geschriebenen Text umwandelt. Entwickler können damit festlegen, wie die App den Ton aufnimmt und wie die Ergebnisse angezeigt oder weiterverarbeitet werden. Dabei laufen Aufnahme und Auswertung getrennt voneinander, sodass die App flüssig reagieren kann.

Lokale Analyse auf dem Gerät

Apple stellt dafür ein neues, lokal nutzbares Sprachmodell zur Verfügung, das laut Cupertino speziell für längere Sprachabschnitte wie Vorlesungen, Gespräche oder Notizen ausgelegt ist. Die Modelle werden systemseitig verwaltet, aktualisieren sich automatisch und benötigen keinen zusätzlichen Speicherplatz in der App. Das soll nicht nur die Privatsphäre verbessern, sondern auch die Einstiegshürden für Entwickler senken.

Wer eine App mit Transkriptionsfunktion entwickeln möchte, kann so direkt auf die gleichen Grundlagen zugreifen, die Apple bereits in hauseigenen Anwendungen wie Notizen, Sprachmemos und dem Tagebuch nutzt. Auch eine Live-Transkription mit direkter Darstellung in der Benutzeroberfläche ist möglich, inklusive optionaler „flüchtiger“ Vorab-Ergebnisse, die nachträglich durch verlässliche Endergebnisse ersetzt werden.