"Virtual Volunteer" für blinde Menschen
GPT-4 ist da: Die Technik hinter ChatGPT sieht nun auch Bilder
Die beeindruckenden Kapazitäten des Chatbots ChatGPT haben in den vergangenen Wochen für zahlreiche Schlagzeilen, mediale Berücksichtigungen und technische Experimente gesorgt, von denen viele auch auf dem iPhone statt gefunden haben.
Dem amerikanischen Unternehmen OpenAI war mit der Veröffentlichung von ChatGPT ein Überraschungserfolg geglückt. Das in San Francisco ansässige Unternehmen, das sich auf die Erforschung künstlicher Intelligenz spezialisiert hat, bot erstmals einen Chatbot an, der auf Fragen verblüffend menschenähnlich reagierte.
Auf GPT-3 folgt GPT-4
ChatGPT konnte (und kann) mit Rückfragen umgehen, den Kontext des laufenden Gespräches berücksichtigten, Antworten neu formulieren, auf Wünsche nach Stimmung und Tonlage reagieren und nicht nur Witze, sondern auch Klassenarbeiten, Aufsätze, Online-Artikel und Nachrufe verfassen. Texte, die oberflächlich oft fehlerfrei wirken, einer genaueren Betrachtung aber nur selten standhalten.
Die Technik hinter ChatGPT, der KI-Textgenerator GPT-3, wurde nun umfangreich überarbeitet. Der Nachfolger, GPT-4, versteht sich nicht mehr nur auf die Auswertung und die Reaktion auf Texteingaben sondern kann auch mit Bildern umgehen und auf visuelle Eingaben reagieren.
GPT-4 hat nun auch Augen
Neue Kapazitäten, die die GPT-4-Macher in Kooperation mit dem „Be My Eyes“-Projekt in ein Hilfswerkzeug für Blinde umsetzen wollen. Unter dem Arbeitstitel „Virtual Volunteer“ wird hier an einer KI gearbeitet, die Bilder und Bildinhalte verschriftlichen können soll.
Bislang setzte die „Be My Eyes“-App auf menschliche Freiwillige, die Blinden und Menschen mit Sehbehinderungen vorübergehend ihre Sehkraft zur Verfügung stellten, um Anleitungen zu lesen, Ablaufdaten zu erkennen oder Lebensmittel zu unterscheiden. Fortan soll GPT-4 hier einen Großteil der Seharbeit übernehmen.
Textgenerator nun deutlich kompetenter
Ansonsten ist GPT-4 deutlich kompetenter geworden, arbeitet schneller als GPT-3, besteht die Anwaltszulassung in den USA und liefert in zahlreichen standardisierten Tests wie etwa dem LSAT deutlich bessere Ergebnisse als sein Vorgänger.
GPT-4 wird in diesem Blogeintrag beschrieben und dürfte schon bald Microsofts BING-Assistent mit neuen Funktionen ausstatten.