Lokale Verarbeitung auch ohne Abo
Transkription per Tastatur: Whisper-App erweitert iOS-Funktionen
Die Transkriptions-App MacWhisper ist seit einiger Zeit als Whisper-App auch auf iPhone und iPad verfügbar und bietet eine lokale Spracherkennung ohne Datenübertragung an externe Server. Nun hat die Anwendung mit dem aktuellen Update zusätzliche Funktionen erhalten, die den Einsatz deutlich flexibler machen. So steht die Spracherkennung von Whisper ab sofort systemweit über eine eigene Tastatur zur Verfügung.
Nutzer müssen damit nicht mehr zwischen der aktiven App und der Whisper-Anwendung wechseln, um Spracheingaben umzuwandeln.
Durch die Integration der neuen Tastatur kann die Transkriptionsfunktion direkt in Anwendungen wie Nachrichten, E-Mail oder Notizen verwendet werden. Aktuell steht allerdings nur ein englisches Tastaturlayout zur Verfügung, was für deutschsprachige Anwender gewisse Einschränkungen mit sich bringt. Die eigentliche Erkennung deutsch gesprochener Inhalte funktioniert jedoch auch weiterhin, sofern das entsprechende Sprachmodell installiert ist.
Lokale Verarbeitung auch ohne Abo
Whisper erlaubt die lokale Verarbeitung von Audioaufnahmen auf dem Gerät und bietet damit eine datenschutzfreundliche Alternative zu cloudbasierten Lösungen. Unterstützt werden gängige Audioformate wie .mp3, .m4a oder .mp4, die sich direkt aus anderen Apps oder per Mikrofonaufnahme in die Anwendung importieren lassen.
Die App ermöglicht dabei nicht nur die reine Transkription, sondern auch die inhaltliche Erschließung der aufgenommenen Sprache. So können längere Sprachnachrichten automatisch zusammengefasst oder mithilfe einer Chatfunktion weiter analysiert werden.
Neben der neu eingeführten Tastatur liefert das Update weitere Verbesserungen: Unter anderem bleibt bei Mikrofonaufnahmen nun die Einstellung zur Sprechererkennung erhalten, bei Exporten im JSON-Format wird die Dateiendung nun wieder korrekte gesetzt.
Zusätzlich unterstützt Whisper jetzt aktuelle OpenAI-Modelle und erlaubt bei Übersetzungen per DeepL die Wahl zwischen formeller und informeller Ausdrucksweise.
Die App kann kostenlos genutzt werden, sofern man auf lokale Sprachmodelle setzt. Für Cloud-Transkriptionen und erweiterte Funktionen ist ein kostenpflichtiges Abo erforderlich.
Bei reiner on-device Nutzung… ist die Transkription qualitativ besser wie die Systemeigene von IOS?
viel besser!
*als
Ich habe seit langem das komische Verhalten, dass bei diktieren über die Bord eigene ios Tastatur der erste buchstabe der Diktates groß geschrieben wird (korrekt) und sobald ich das Diktat beende ich einen (falschen) Kleinbuchstaben umgewandelt. Völlig unlogisch und nervt mich kolossal. Ich weiß, off topic…
Habe ich auch, allerdings beta26. Gibt keine Besserung? Außerdem ist Karten Routing erstmal auf ohne Ton gestellt.