Von "Zuhältertape" über "1899" nach "blyat"
Manuelle Flickschusterei: 5000+ Aussprache-Ausnahmen für Siri
Auf iPhone und Mac ist Siri nicht nur in der Lage Lampen zu schalten, Timer zu setzen und eure Fragen zu beantworten, die auf Apple-Geräten aktive Sprachassistentin kann auch Texte und Nachrichten vorlesen, kennt Sportergebnisse und kann sich relativ sicher durch Popkultur, Film- und Musiklandschaften navigieren.
Hier weiß sich Siri häufig auch verblüffend treffsicher zu artikulieren. Aber warum eigentlichen?
iPhone X: „iPhone zehn“ statt „iPhone x“
Warum spricht Siri „1899 Hoffenheim“ richtig als «Achtzehnhundert Neunundneunzig Hoffenheim» aus, macht aus der Kombination „1799 Hoffenheim“ aber ein «Eintausendsiebenhundert Neunundneunzig Hoffenheim»?
Wieso klingt der Name der R&B-Sängering „Toni Braxton“ auch auf deutschen Geräten so wunderbar amerikanisch, der ihrer Schwester „Traci Braxton“ jedoch so als würde Arnold Schwarzenegger seinen dicksten deutschen Akzent auflegen?
Wieso behandelt Siri römische Ziffern unterschiedlich und spricht „Episode I“ Star Wars-freundlich als «Episode Eins» aus, interpretiert das große I hinter anderen Wörtern aber lediglich als Buchstaben und nennt „Folge I“ nur «Folge i»?
Warum kann Siri einige Fußball-Spieler (etwa Benedikt Höwedes, Per Mertesacker oder Shkodran Mustafi) perfekt aussprechen, bleibt aber schon an einem alleinstehenden „Mertesacker“ hängen?
Aus ARD wird A.R.D. – aus AMD wird amd
Die ARD wird (sowohl groß als auch klein geschrieben) stets ordentlich und einzeln als A-R-D buchstabiert, der Chip-Hersteller AMD klingt jedoch wie das „Amt“ irgendeiner Behörde.
5000+ handgeschriebene Ausnahmen
Fragen, die sich alle auf die gleiche Art und Weise beantworten lassen. Um nach außen wort- und weltgewandt zu wirken, verlässt sich Siri hinter den Kulissen auf einen handgeschriebenen Spickzettel, der über 5000 Aussprache-Ausnahmen definiert.
Die Datei, die sowohl auf dem Mac als auch auf Apples Mobilgeräten zum Einsatz kommt, nennt sich „Vocalizer User Rules“ und definiert, in welchen Fällen auf das phonetische Alphabet gesetzt werden, welche Sportler, Künstler und Persönlichkeiten besondere Aussprache zuteil werden und wann die Aussprache-Sprache temporär gewechselt werden soll.
So war es Apple offenbar sehr wichtig, dass die Produktion „Zuhältertape“ des deutschen Rappers „KOLLEGAH“ auch auf ein englisch klingendes „Tape“ endet. Ein „Sommermixtape“ hingegen wird so deutsch ausgesprochen, dass sich dessen letzte drei Buchstaben so anhören, wie der dreirädrige Kleintransporter von Piaggio.
Zweisprachig ausgesprochen: „Zuhältertape“
Kommentare der Apple-Mitarbeiter lassen tief Blicken
Fast noch einen Zacken interessanter als die Aussprache-Ausnahmen sind die zahlreichen Kommentare der Apple-Mitarbeiter, die sich im Dokument verewigt haben. So liest Siri das englische Wort für „tanzen“ in bestimmten Kombinationen als „dence“ anstatt richtig als „dance“ vor, da dies amerikanischer klingen soll.
+fE.d$.’R+i.gi: Extrawurst für Apple-Manager
Der Nachname „Federighi“ hat eine besondere Aussprache-Behandlung bekommen, da es sich hier um einen wichtigen Apple-Manager handelt – auch der „Gaming-Podcast“ hat im Gegensatz zur „Gaming-Tastatur“ eine Extrawurst spendiert bekommen, muss jedoch selbst intern mit Bindestrich gesprochen werden, da ein Systemfehler die Aussprache ansonsten durcheinander bringt.
Zudem weisen Mitarbeiterkommentare auf noch vorhandene Fehler hin, verlinken YouTube-Videos mit Zeitstempeln, um zukünftigen Editoren zu beweisen, dass „blyat“ laut dem Rapper „Capital Bra“ wie „‚blE:d“ ausgesprochen wird und mahnen an bestimmten Stellen dazu, unbedingt die Reihenfolge der definierten Regeln einzuhalten, da sonst Wortteile ausgetauscht werden, die eigentlich beibehalten werden müssen.
Statt „magic“ eher mühevolle Fleißarbeit
Das Dokument, dass einen tiefen Einblick hinter die Kulissen der Sprachausgabe von Siri, Mac und iPhone gibt, desillusioniert. Wer sich bislang fragte, warum Siri nicht in der Lage war bestimmte Wörter, Song-Titel oder Sportler richtig auszusprechen, wird sich fortan wohl eher darüber wundern, wenn ungewöhnliche Namen richtig betont werden.
Offenbar sehr wichtig: Die richtige Reihenfolge
Denn fast immer war hier ein manueller Eingriff vonnöten, der sich in den Tiefen der „Vocalizer User Rules“-Datei aufspüren lässt.
Apples Sprachverständnis ist nicht (nur) das magische Ergebnis maschinenlernender Big-Data-Technologien, sondern zu großen Teilen schlicht eine handgeschrieben Flickschusterei. Ein zeitraubendes Sammeln und Notieren von Sonderfällen.
Die komplette Ausnahme-Datei könnt ihr hier einsehen – diesen Artikel selbst lasst ihr euch am besten von Siri vorlesen.
Guten Rutsch!