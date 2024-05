Zwar haben wir heute schon über die Vorstellung des neuen ChatGPT-Sprachmodells GPT-4o berichtet, auf die damit einhergehenden Kapazitäten in Sachen Sprachverständnis und Sprachausgabe müssen wir jedoch noch einmal gesondert eingehen.

Beeindruckende Konversationen auf dem iPhone

Denn das, was OpenAI nun in mehreren YouTube-Videos demonstriert, erinnert nicht nur an den Spielfilm „Her“, sondern bietet genau jene Funktionen, die Apples Siri seit Jahren schmerzlich vermissen lässt.

GPT-4o ist in der Lage, nahezu vollständig mit natürlicher Sprache bedient zu werden und kann auf Kommandos der Anwender nicht nur mit einer emotional gefärbten Stimme reagieren, sondern ist zudem auch in der Lage, Emotionen in der Nutzer-Stimme zu erkennen.

ChatGPT kann jetzt auch singen, überrascht oder erfreut reagieren und antwortet (unter den Laborbedingungen der Präsentation) so schnell, dass so gut wie keine Latenzen mehr zu erkennen sind.

GPT-4o lässt sich jederzeit unterbrechen und reagiert unmittelbar auf neue oder veränderte Aufgabenstellungen. Die iPhone-App integriert auf Wunsch das aktuelle Kamerabild in ihre Antworten, ist in der Lage, in Echtzeit zu übersetzen und kann mit weiteren Instanzen von ChatGPT sogar im Chor singen.

22 Demo-Videos veröffentlicht

Insgesamt hat Open AI 22 Demo-Videos auf dem offiziellen YouTube-Account des Unternehmens veröffentlicht, die ihr nicht unbedingt alle anschauen müsst, in drei oder vier Videos solltet ihr euch jedoch hineinklicken, um ein Gespür dafür zu bekommen, wie umfangreich die neuen Fähigkeiten von GPT-4o ausfallen.

Vor allem bei der Stimm-Modulation, der Auswertung von Live-Videos und der schnellen Reaktion auf geänderte Vorgaben macht das neue Sprachmodell eine hervorragende Figur.

GPT-4o – Die Demo-Videos