Alltagstauglich, aber mit Begrenzungen
Auch Claude bekommt eine Stimme: KI-App erhält Sprachmodus
Der KI-Anbieter Anthropic hat damit begonnen, einen neuen Sprachmodus in seine Claude-App für iOS und Android zu integrieren. Die Funktion wird zunächst in englischer Sprache ausgerollt und soll es Nutzerinnen und Nutzern ermöglichen, komplette Gespräche mit dem Chatbot zu führen – gesprochen statt getippt.
Im Zentrum steht dabei die Interaktion per Spracheingabe und Sprachausgabe, ergänzt um visuelle Kurzzusammenfassungen auf dem Bildschirm.
Zur Auswahl stehen fünf verschiedene Stimmen. Die Sprachausgabe basiert auf dem erst kürzlich gestarteten Claude-Modell Sonnet 4. Der Wechsel zwischen Text- und Sprachmodus ist jederzeit möglich, wobei frühere Gesprächsinhalte erhalten bleiben. In der mobilen App lassen sich auch Transkripte und Gesprächszusammenfassungen einsehen.
Für zahlende Abonnenten gibt es zusätzliche Funktionen wie die Anbindung an den eigenen Google-Kalender oder Gmail-Konten. Die Integration von Google Docs ist allerdings Enterprise-Nutzern vorbehalten.
Alltagstauglich, aber mit Begrenzungen
Gedacht ist der neue Modus vor allem für Situationen, in denen Nutzer nicht tippen können oder wollen – etwa beim Kochen, Spazierengehen oder auf dem Weg zur Arbeit. Neben Alltagsfragen lassen sich auch komplexere Inhalte wie Bilder oder Dokumente besprechen. Das System analysiert gesprochene Eingaben, reagiert auf natürliche Pausen und kann bei Bedarf durch Tippen unterbrochen werden. Auch die Anzeige von Bildern oder das Hinzufügen von Dateien ist im Sprachmodus möglich.
Der neue Sprachmodus ist besonders auf Alltagssituationen abgestimmt, in denen freihändiges Arbeiten gefragt ist. Nutzer können Claude etwa beim morgendlichen Start in den Tag nutzen, um sich über anstehende Termine, neue E-Mails oder aktuelle Nachrichten informieren zu lassen. Auch zum Lernen unterwegs oder zur Ideenentwicklung im Gespräch eignet sich der Modus – etwa beim Spaziergang, beim Sport oder im Haushalt. Darüber hinaus kann die Sprachfunktion beim Vorbereiten von Präsentationen oder Bewerbungsgesprächen hilfreich sein, indem Inhalte laut durchgesprochen werden. Ideen lassen sich spontan festhalten, ohne erst ein Gerät in die Hand nehmen zu müssen.
Die Nutzung ist allerdings nicht unbegrenzt. Für kostenfreie Accounts liegt das Limit bei etwa 20 bis 30 gesprochenen Nachrichten pro Sitzung. Darüber hinaus gelten die allgemeinen Nutzungsgrenzen des jeweiligen Abos.
Ich hoffe Mistral zieht da auch bald mal nach.
Das fände ich auch gut.
Sprachmodus gibt es momentan nur bei US-amerikanischen Anbietern, korrekt?
Würde sagen ja
Die App „Enclave“ bietet u.a. einen Offline Sprachmodus. Ich habe da Gemma 2-2B laufen.