iphone-ticker.de — Alles zum iPhone. Seit 2007. 28 840 Artikel

Von "Zuhältertape" über "1899" nach "blyat"

Manuelle Flickschusterei: 5000+ Aussprache-Ausnahmen für Siri

38 Kommentare 38

Auf iPhone und Mac ist Siri nicht nur in der Lage Lampen zu schalten, Timer zu setzen und eure Fragen zu beantworten, die auf Apple-Geräten aktive Sprachassistentin kann auch Texte und Nachrichten vorlesen, kennt Sportergebnisse und kann sich relativ sicher durch Popkultur, Film- und Musiklandschaften navigieren.

Hier weiß sich Siri häufig auch verblüffend treffsicher zu artikulieren. Aber warum eigentlichen?

Apple Related

iPhone X: „iPhone zehn“ statt „iPhone x“

Warum spricht Siri „1899 Hoffenheim“ richtig als «Achtzehnhundert Neunundneunzig Hoffenheim» aus, macht aus der Kombination „1799 Hoffenheim“ aber ein «Eintausendsiebenhundert Neunundneunzig Hoffenheim»?

Wieso klingt der Name der R&B-Sängering „Toni Braxton“ auch auf deutschen Geräten so wunderbar amerikanisch, der ihrer Schwester „Traci Braxton“ jedoch so als würde Arnold Schwarzenegger seinen dicksten deutschen Akzent auflegen?

Wieso behandelt Siri römische Ziffern unterschiedlich und spricht „Episode I“ Star Wars-freundlich als «Episode Eins» aus, interpretiert das große I hinter anderen Wörtern aber lediglich als Buchstaben und nennt „Folge I“ nur «Folge i»?

Warum kann Siri einige Fußball-Spieler (etwa Benedikt Höwedes, Per Mertesacker oder Shkodran Mustafi) perfekt aussprechen, bleibt aber schon an einem alleinstehenden „Mertesacker“ hängen?

Ard

Aus ARD wird A.R.D. – aus AMD wird amd

Die ARD wird (sowohl groß als auch klein geschrieben) stets ordentlich und einzeln als A-R-D buchstabiert, der Chip-Hersteller AMD klingt jedoch wie das „Amt“ irgendeiner Behörde.

5000+ handgeschriebene Ausnahmen

Fragen, die sich alle auf die gleiche Art und Weise beantworten lassen. Um nach außen wort- und weltgewandt zu wirken, verlässt sich Siri hinter den Kulissen auf einen handgeschriebenen Spickzettel, der über 5000 Aussprache-Ausnahmen definiert.

Die Datei, die sowohl auf dem Mac als auch auf Apples Mobilgeräten zum Einsatz kommt, nennt sich „Vocalizer User Rules“ und definiert, in welchen Fällen auf das phonetische Alphabet gesetzt werden, welche Sportler, Künstler und Persönlichkeiten besondere Aussprache zuteil werden und wann die Aussprache-Sprache temporär gewechselt werden soll.

So war es Apple offenbar sehr wichtig, dass die Produktion „Zuhältertape“ des deutschen Rappers „KOLLEGAH“ auch auf ein englisch klingendes „Tape“ endet. Ein „Sommermixtape“ hingegen wird so deutsch ausgesprochen, dass sich dessen letzte drei Buchstaben so anhören, wie der dreirädrige Kleintransporter von Piaggio.

Tape

Zweisprachig ausgesprochen: „Zuhältertape“

Kommentare der Apple-Mitarbeiter lassen tief Blicken

Fast noch einen Zacken interessanter als die Aussprache-Ausnahmen sind die zahlreichen Kommentare der Apple-Mitarbeiter, die sich im Dokument verewigt haben. So liest Siri das englische Wort für „tanzen“ in bestimmten Kombinationen als „dence“ anstatt richtig als „dance“ vor, da dies amerikanischer klingen soll.

Craig

+fE.d$.’R+i.gi: Extrawurst für Apple-Manager

Der Nachname „Federighi“ hat eine besondere Aussprache-Behandlung bekommen, da es sich hier um einen wichtigen Apple-Manager handelt – auch der „Gaming-Podcast“ hat im Gegensatz zur „Gaming-Tastatur“ eine Extrawurst spendiert bekommen, muss jedoch selbst intern mit Bindestrich gesprochen werden, da ein Systemfehler die Aussprache ansonsten durcheinander bringt.

Zudem weisen Mitarbeiterkommentare auf noch vorhandene Fehler hin, verlinken YouTube-Videos mit Zeitstempeln, um zukünftigen Editoren zu beweisen, dass „blyat“ laut dem Rapper „Capital Bra“ wie „‚blE:d“ ausgesprochen wird und mahnen an bestimmten Stellen dazu, unbedingt die Reihenfolge der definierten Regeln einzuhalten, da sonst Wortteile ausgetauscht werden, die eigentlich beibehalten werden müssen.

Statt „magic“ eher mühevolle Fleißarbeit

Das Dokument, dass einen tiefen Einblick hinter die Kulissen der Sprachausgabe von Siri, Mac und iPhone gibt, desillusioniert. Wer sich bislang fragte, warum Siri nicht in der Lage war bestimmte Wörter, Song-Titel oder Sportler richtig auszusprechen, wird sich fortan wohl eher darüber wundern, wenn ungewöhnliche Namen richtig betont werden.

Move Under

Offenbar sehr wichtig: Die richtige Reihenfolge

Denn fast immer war hier ein manueller Eingriff vonnöten, der sich in den Tiefen der „Vocalizer User Rules“-Datei aufspüren lässt.

Apples Sprachverständnis ist nicht (nur) das magische Ergebnis maschinenlernender Big-Data-Technologien, sondern zu großen Teilen schlicht eine handgeschrieben Flickschusterei. Ein zeitraubendes Sammeln und Notieren von Sonderfällen.

Die komplette Ausnahme-Datei könnt ihr hier einsehen – diesen Artikel selbst lasst ihr euch am besten von Siri vorlesen.

Guten Rutsch!

Dienstag, 31. Dez 2019, 13:54 Uhr — Nicolas
38 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
Rede mit!
  • Kann man die Datei bearbeiten und in ein eigenes System einpflegen?

  • Wäre interessant zu wissen, Amazon und Google das lösen

  • Wie war das noch mit selbstlernender KI?

    • Habe ich auch als erstes gedacht. Passt irgendwie nicht ins Jahr 2020 :)

    • Vor allem wäre das kein Problem mit einer Cloud und Crowd Sourcing, aber dazu müsste man natürlich die Daten online verarbeiten und hier merkt man, wie schnell das ganze „Privatsphäre-Ding“ an seine Grenzen kommt.

      Übrigens auch wunderbar bei der Autokorrektur zu sehen, die bei anderen online verwaltet wird und sehr schnell sprachliche Besonderheiten wie zB. ein Modewort aus der PopKultur, das viele Nutzer plötzlich eingeben, lernen kann und dann den Korrekturvorschlag innerhalb von Stunden auf allen Geräten ausspielt.

    • Siri ist gar nicht als selbstlernende KI konstruiert. Wie also soll sie als selbstlernende KI funktionieren? Das kommt vielleicht irgendwann.
      Zur natürlichen Intelligenz gehört aber ebenfalls: Erst nachdenken, dann schreiben !

      • Dann solltest du das auch beherzigen. Schon 2016 und später im MIT Tech Review wurde berichtet, dass sie durch unsupervised self-learning schlauer werden soll (-> Self-learnings KI).

  • Hauptsache pornhub steht drin :D
    Und das wo Apple doch sonst so Konservativ in der Richtung ist.

  • Ich würde Siri gerne beibringen, das mein TV-Licht (über HomePod Spracheingabe) auch reagiert, wenn einer der Familie „Fernsehlicht“ sagt.
    Also für ein Gerät mehrere Namen. Hat da jemand eine Lösung?

  • Sehr interessanter Beitrag. Vielen Dank für die Info!

  • Einfach mal Synergien bündeln und sich zum Beispiel mit der ARD-Aussprachedaten zusammentun. Die interne Datenbank hat 380.000 Begriffe gespeichert. Selbstverständlich ist diese nicht öffentlich, doch würde das Level von Siri deutlich steigern.

  • Siri ist und bleibt mit Abstand am dämlichstem.

  • Bei mir wird beide „-tape“ deutsch ausgesprochen…

  • Wenn wenigstens einfach Aufgaben wirklich zuverlässig erledigt werden würden… erste gestern wieder:

    „Erinnere mich in einer Stunde an ToDo Liste abarbeiten.“
    … „Es tut mir leid aber du hast keine App ToDo installiert. Im App Store kannst du….“

    Herrlich.

    • Ich habe keine Chance mehr Erinnerungen über Siri zu erstellen, da ich immer auch überfällige Erinnerungen habe. Sobald eine Erinnerung überfällig ist und ich sage z.B. „Erstelle eine neue Erinnerung für 18 Uhr“, bekomme ich nur noch als Antwort: „Ok, ich habe Deine Erinnerung „überfällige Erinnerung“ auf 18 Uhr verschoben“ … Bis vor 2-3 Jahren hat das noch wunderbar funktioniert.

      Habe mir spaßeshalber mal die Alexa App auf dem iPhone installiert um sie zu testen (obwohl ich kein Amazon Gerät besitze). Alexa ist schon der Wahnsinn, sowohl bei Wissensfragen (Wer war der erste Mann auf dem Mond? Siri: Schau mal was ich im Internet gefunden habe, Alexa: Korrekte Aussprache aller Menschen auf dem Mond in chronologischer Reihenfolge) als auch beim Verständnis von Aufgaben (soweit ohne Amazon-Geräte durchführbar). Es ist traurig, aber Siri ist mittlerweile Lichtjahre zurück, bzw. in manchen Punkten (Erinnerungen) schlechter als früher. Die Liste mit den 5.000 Ausnahmen zeigt das meiner Meinung nach, von der Anzahl her ein Witz. 500.000 Ausnamen oder eine KI wären eher nowendig um nicht nur in Sonderfällen zu funktionieren. Ich bin mir sicher, dass es bei Alexa auch eher in diese Richtung geht.

      • Welch wahre Worte. Kann ich so unterschreiben. Ich glaube auch, dass diese ganzen Sprachassistenten ein großer Flop sind/waren. Allen voran Siri und ich habe sie alle getestet.

  • Euch auch einen guten Rutsch ins neue, spannende 2020! Danke für Eure gute Arbeit!

  • Die Playlist „Weihnachtlicher Jazz “ wird komplett englisch ausgesprochen

  • Blöde Frage: Wie kann ich mir diesen Artikel mit Siri Vorlesen lassen?
    Mit „Kannst Du mir das vorlesen?“ fängt Siri nix an…

  • Solange Siri keine deutsche Rechtschreibung beachtet und zusammengesetzte Hauptwörter grundsätzlich getrennt schreibt, ist das alles eh ein Witz – Apropos – genauso, wie die vorgefertigten Flachwitze, auf die sie keine Antwort hat, wenn man sie darauf anspricht.

  • Wir mussten gestern Abend im Auto lachen: in die eine Richtung wurde der Schnellweg als „schnell weg“ ausgesprochen (das war der eigentliche Brüller) und in Erwartung des Knallers bei der Rückfahrt wurde er korrekt ausgesprochen. Yeah!

  • Na, machen wir Menschen es nicht auch so? :-) Fleißig zuhören, alles abspeichern. Alles ist Konvention. Voller Ausnahmen und Sonderfälle. Und Sprache lebt und entwickelt sich genau so.

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPhone, iPad, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 28840 Artikel in den vergangenen 4842 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2020 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven