iphone-ticker.de — Alles zum iPhone. Seit 2007. 37 423 Artikel

Für Entwickler

Spracherkennung: iOS 10 stellt freie Schnittstelle bereit

Artikel auf Mastodon teilen.
8 Kommentare 8

Als wir vor wenigen Tagen die GIF-Applikation Giphy Says ausprobiert haben, sind wir über einen Bildschirm gestolpert, der uns bislang in noch keiner iOS-Anwendung aufgefallen war:

Gif Apple

„Giphy Says“ implementiert eine Option zur Spracherkennung, die auf eine von Apple bereitgestellte Schnittstelle setzt und holt beim ersten Start die Erlaubnis seiner Anwender ein, die aufgezeichneten Sprachdaten auch nach Cupertino übertragen zu dürfen. Die Gratis-App nutzt die Spracherkennung, genau wie Apples Clips, um Text über das aufgezeichnete Kamera-Bild zu legen. Anwender sprechen diesen einfach ein und müssen sich so nicht mit der Bildschirm-Tastatur herumschlagen.

Bei der von Apple bereitgestellten Funktion handelt es sich um eine Neuerung, die erst sein iOS 10 verfügbar ist und von allen interessierten Entwicklern eingesetzt werden kann. So stellt Apple der Entwickler-Community mit iOS 10 nun die „Speech Recognition API“ zur Spracherkennung zur Verfügung, die sich kostenlos nutzen und implementieren lässt. Ein Konkurrent zu kostenpflichtigen Angeboten wie etwa dem Nuance SDK.

Speech 700

Apple deckelt Anzahl der Abfragen

Apple stellt die Funktion dabei zwar kostenlos zur Verfügung, gibt aber an, feste Limits zu setzen. Sowohl für die App als auch für die auf den einzelnen iOS-Geräten installierten Instanzen der App gibt es ein Maximum an täglich möglichen Transkriptionsabfragen – genaue Zahlen dazu, wie viele Nutzer den Dienst wie lange beanspruchen dürfen, gibt Apple allerdings nicht aus. Das Audio-Limit pro Session liegt bei rund 60 Sekunden Spracheingabe.

Gleiche Technik wie bei der Diktat-Tastatur

Apples Spracherkennungs-API setzt auf die selbe Technik, die seit iOS 5 (also seit 2011) hinter der Diktat-Funktion der iPhone-Tastatur steckt und derzeit von rund 65.000 Anwendungen pro Tag genutzt wird.

Also: Solltet ihr an einer App Schrauben, die Fotos auf Zuruf knipsen soll, Sprache in Grafiken verwandeln oder ein Frage-Antwort-Quiz bereitstellen soll – dann müsst ihr nicht mehr zwangsläufig eine Tastatur einblenden, sondern könnt euch fortan auch auf Apples Spracherkennung verlassen. Diese sollte die Eingaben eurer Nutzer übrigens deutlich beschleunigen. Der Durchschnittsnutzer, dies geht aus einem Statistik der BITKOM hervor, kann 150 Wörter pro Minute sprechen, aber nur 40 Wörter pro Minute tippen.

Apple selbst hat die Funktionsweise der „Speech Recognition API“ in Session 509 der WWDC 2016 erklärt.

Video: Using Speech Recognition with AVAudioEngine

Dieser Artikel enthält Affiliate-Links. Wer darüber einkauft unterstützt uns mit einem Teil des unveränderten Kaufpreises. Was ist das?
12. Apr 2017 um 18:29 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    8 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Doch, von „Apalon Apps“ die „Sprechen und Übersetzen“ App hat ebenfalls die Schnittstelle (ich weiß aber nicht ob es die Gratis Version auch hat).

  • Just press Record macht es auch.
    Sogar Apple Watch und man den Text exportieren.

  • Die App von Hello-Fresh hat das zum „umblättern“ der Rezeptschritte auch schon ein Weilchen integriert. Ist ganz praktisch, wenn man die Hände voll hat und mit Kochen beschäftigt ist.

  • Das ist extrem cool und hilfreich für Entwickler! iTranslate nutzt das auch schon lange
    Weiß jemand, ob in das SDK auch Neuerungen von Apple einfließen? Oder sind SDKs sowieso generell immer aktuell? Kenne mich da nicht so genau aus… Freue mich auf die Antwort!

    • Da iTranslate ab IOS 8 läuft, werden die nicht die Apple API verwenden, sondern was eigenes haben.
      Für Apps, die die IOS SDK verwenden und in Swift programmiert sind, ist das SDK so aktuell wie zu dem Zeitpunkt, in dem die App in den Store eingereicht wurde. Die Swift-Bibliotheken sind in jeder App mit enthalten.

  • Das Quiz „VoQui“ benutzt auch schon immer die Spracheingabe für die Antworten (für die Fragen natürlich die Sprachausgabe).
    Dadurch kann man z.B. beim Joggen usw. freihändig spielen.

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPhone, iPad, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 37423 Artikel in den vergangenen 6085 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2024 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven