Vor rund eineinhalb Jahren erschien MacWhisper als eine der ersten Anwendungen, die das von OpenAI veröffentlichte Spracherkennungsmodell Whisper einfach nutzbar machten und Anwendern damit die Möglichkeit boten, Audioaufnahmen oder gesprochene Texte in Windeseile transkribieren zu lassen. Seitdem wurde die App regelmäßig aktualisiert, ist inzwischen in Version 8.5 im Mac App Store verfügbar und hat mit AI Transcription, Aiko und dem Klassiker Audio Hijack zuletzt immer mehr Konkurrenz bekommen.

Umfangreiche Mac-Anwendung

Die Einsatzmöglichkeiten für MacWhisper sind vielfältig. Nutzer können die schlichte Anwendung dafür einsetzen, Audioaufnahmen von Vorlesungen oder Meetings durchsuchbar zu machen oder Untertitel für Filme zu erstellen. Ein wesentlicher Vorteil der Anwendung ist, dass sämtliche Transkriptionen direkt auf dem Mac durchgeführt werden. Weder ist nach dem initialen Download der KI-Modelle eine Internetverbindung zur Spracherkennung nötig, noch verlassen irgendwelche sensitive Daten das eigene System.

Die Nutzung der App ist unkompliziert: Audioaufnahmen können direkt in der App gemacht und in Text umgewandelt werden. Alternativ lassen sich Dateien per Drag-and-Drop in das App-Fenster ziehen. Unterstützte Formate sind unter anderem .mp3, .m4a und .mp4. Die Transkription erfolgt vergleichsweise schnell – als Richtwert gilt das 15-fache der tatsächlichen Dauer der Audioaufnahme. Die Ergebnisse können als Text auf dem Bildschirm angezeigt oder im PDF- beziehungsweise HTML-Format exportiert werden.

iOS-Version per TestFlight nutzbar

Wie Entwickler Jordi Bruin jetzt angekündigt hat, wird MacWhisper bald auch für iOS verfügbar sein. Zwar dauerte die Entwicklung der iOS-App länger als geplant, nun steht aber eine erste Vorabversion über TestFlight zur Verfügung, und die Freigabe im App Store soll in den kommenden Tagen erfolgen. Ähnlich wie bei der macOS-Version sollen auch bei der iOS-App alle Funktionen durch eine einmalige Zahlung freigeschaltet werden.

Das Spracherkennungsmodell Whisper bietet Unterstützung für mehr als 100 Sprachen und verfügt über eine automatische Erkennung der Eingabesprache.

Alternativ kann die Sprache auch manuell ausgewählt werden. Die Basisversion wird in der Mac-Ausgabe kostenlos angeboten, lediglich für den Zugriff auf die leistungsfähigeren Sprachmodelle Medium- und Large, die präzisere Ergebnisse liefern sollen, wird der Kauf der Pro-Version vorausgesetzt.

