Drüben bei Teltarif berichtet man über die von Promptu auf der CES vorgestellte Speech-to-SMS Applikation ShoutOUT und wartet mit einer interessanten Information auf: Bereits im Februar soll die Applikation auch hierzulande erhältlich sein und das iPhone dann um eine Deutsche-Spracherkennung erweitern.
Ähnlich der Anfang Dezember vorgestellten Applikation “DragonDictate” sendet auch Promptu kurze Sprachaufzeichnungen an den Firmenserver und liefert dem Gerät eine transkribierte Text-Version zurück.
Bislang erlaubt Promptu nur das Verfassen kurzer SMS-Texte, könnte - je nach Entwicklungsstand - zum Release jedoch schon in der Lage sein, auch die eMail- bzw. die Notiz-Applikation mit euren Texten zu versorgen. Im amerikanischen AppStore ist ShoutOUT schon erhältlich, verlangt für die Erkennung 50 beliebig langer Texte jedoch $1.99.
Die hier im Video vorgestellte Applikation zur Transkription gesprochener Texte ist mittlerweile im AppStore angekommen - lässt sich bislang jedoch nur mit einem US-Account herunterladen. Noch mehr als die fast fehlerfreie Spracherkennung, überrascht uns jedoch das Preischild der 1MB großen Applikation. Die Umwandlung gesprochener Sätze hin zu kopierbaren Texten ist (vorerst?) kostenlos. Solltet ihr über einen amerikanischen iTunes-Account und eine gute, englische Aussprache verfügen, ist Dragon Dictation (AppStore-Link) ein Plichtdownload.
Die heute Nacht veröffentlichte Jailbreak-Applikation für das iPhone 3GS lädt zu kleinen Streifzügen durch das Dateisystem der aktuellen iPhone-Generation ein. So haben wir uns durch die neuen Verzeichnisse gewühlt, Veränderungen gegenüber dem iPhone 3G gesucht und sind letztlich bei der Sprachsteuerung hängen geblieben.
Von Apple nur spärlich dokumentiert, waren wir auf der Suche nach einer Liste aller akzeptierten Sprachbefehle - und Bitte, der vollständige Überblick auf alle vom iPhone unterstützten Kommandos findet sich im System-Ordner “/system/library/voiceservices/plugins“.
Auf drei Plugins verteilt, definieren etliche plist-Einstellungsdateien welche Wörter von der Applikation verstanden werden, wie sich Anrufe absetzen und Wiedergabelisten auswählen lassen. Im Anschluss haben wir alle von der iPod-Applikation umgesetzten Befehle dokumentiert und zusätzlich eine Hand voll eigener Befehle erstellt. Die so entstandenen Test-Kommandos sind wenig einfallsreich, zeigen jedoch, was wir bereits vermuteten: Die Sprachsteuerung lässt sich um beliebig viele Synonyme erweitern.
Mit dem passenden Editor und einem jailbroken Gerät bewaffnet, lassen sich die Änderungen in wenigen Sekunden umsetzen. Zum Test haben wir das Kommando “Welches Lied ist das” um die Wort-Kombination “Wer soll das denn sein” erweitert, zum nächsten Track lässt sich auf unserem 3GS nun mit “langweilig” springen, statt “Shuffle” oder “zufällige Wiedergabe” akzeptiert das iPhone nun auch den Satz “Misch mir was zusammen“.
Dieser MP3-Mitschnitt (MP3 Direkt-Link) zeigt die Interaktion mit der so veränderten iPhone-Sprachsteuerung:
Potentielle Sicherheitslücken im iPhone OS haben in der Vergangenheit fast immer zu konstruktiven Diskussionen und schnellen Patches geführt. Die vom Fraunhofer Institut aufgespürte 0900er-Lücke wurde umgehend mit einem Firmware-Update gestopft, ungewollte SMS-Anzeigen gibt es seit gut einem halben Jahr nicht mehr und auch der, die Passcode-Sperre überlistende Doppelklick auf den Home-Button gehört der Vergangenheit an.
Heute nun stolpern die Kollegen von tuaw über einen neuen, möglichen Angriffs-Vektor des iPhones - werfen jedoch die berechtigte Frage auf, ob sich das Fundstück überhaupt als Sicherheitsrisiko kategorisiert werden kann.
Es geht um die Sprachsteuerung des iPhone 3GS. Ist diese aktiviert, nimmt das Telefon auch bei aktivierter Passcode-Sperre die entsprechenden Befehle entgegen. So lassen sich im Winter zwar die Handschuhe anbehalten - gleichzeitig ermöglicht die weiterhin aktive Spracherkennung potentiellen Dieben so jedoch den Aufbau eigener Telefonverbindungen.
Zwar lässt sich das “Voice Dial”-Feature in den iPhone-Einstellungen deaktivieren - dann jedoch nimmt das Gerät gar keine Befehle mehr entgegen - unabhängig von der eventuell gesetzten Passcode-Sperre.
Wie auch immer: Die Frage nach einer besseren Lösung wirft sich auf. Auf die Schnelle fällt uns der elegante Ansatz der AppStore-Applikation VoiceSafe (AppStore-Link) ein. VoiceSafe nutzt eine zuvor aufgezeichnete Sprachnotiz als biometrisches Passwort und erlaubt die weitere Interaktion mit dem Programm nur nach der erneuten Spracheingabe des geheimen Satzes.
Apple könnte die Idee in zukünftigen Firmware-Versionen adaptieren und mit der Passcode-Sperre kombinieren. So könnte der Satz “Rufe Martin an” durch “Das ist mein Audio-Passwort, rufe Martin an” ersetzt werden - oder auch nicht. Das nächste Firmware-Update wird uns entsprechend informieren.
Nach unseren kritischen Tönen zur Sprachsteuerung des iPhone 3G S hat uns David auf den unten eingebetteten Auszug des iPhone-Nutzerhandbuches verwiesen. In unserem Artikel vom Freitag schrieben wir:
“[…] wir haben jedenfalls bei unseren ersten Experimenten mehrfach auch falsche Nummern gewählt - um den Verbindungsaufbau dann noch schnell abzubrechen bleibt nur der hoffentlich rechtzeitige Fingertipp auf die entsprechende Taste auf dem Display.”
Und wirklich, wir hatten bislang noch kein Glück mit den von Apple angebotenen Eingaben zur Korrektur eines falsch interpretierten Sprachbefehls. Das Handbuch schlägt “Falsch“, “Dieser nicht“, “Nicht dieses” oder “Nein” zum Abbruch vor - uns jedoch scheint das Mikrofon genau bei diesen Wort-Kombinationen zu ignorieren.
Auch Bojan hat sich mit der Sprachsteuerung des iPhones beschäftigt und eine Liste der interpretierten Kommandos zusammengestellt. Auch diese Tabelle haben wir nach dem Klick auf weiterlesen veröffentlicht.
Unsere Fragen an euch: Ist eure Stimme in der Lage bereits im Aufbau befindliche Anrufe abzubrechen? Welche (hier noch nicht aufgeführten) Befehle habt ihr bereits entdecken können? Wie sind eure Erfahrungen mit der Sprachsteuerung?
Ars Technica berichtet von einem bislang unbekannten OS 3.0-Feature mit Codenamen Jibbler. Dabei soll es sich um eine Spracherkennungsfunktion handeln, mit deren Hilfe sich das iPhone durch Sprachbefehle bedienen ließe. Sprachwahl-Funktionen kennen wir bereits von anderen Mobiltelefonen, Jibbler wäre jedoch eine fest im System verankerte Spracherkennung, die über die Rufnummernwahl per Sprachbefehl hinaus noch weitere Anwendungen unterstützen könnte.
Auf Mac Rumors gibt es diesen ausgesprochen interessanten Screenshot zu bestaunen. Angeblich durch die Modifizierung verschiedener Einstellungsdateien brachte man ein mit der Beta des zukünftigen iPhone OS 3.0 ausgestattetes iPhone dazu, dieses Kamerabildschirm anzuzeigen. Offensichtlich kann man zukünftig also mittels eines einfachen Schalters zwischen Foto- und Videoaufnahmen wählen.
Weitere Einstellungsdateien deuten auf eine Autofokusfunktion, einen digitalen Kompass sowie Sprachsteuerungsfunktionen hin.
Update: Die Kollegen vom Boy Genius Report haben weitere interessante Screenshots auf Lager. Dank an Hannes & Marcel.
Kleines Easter Egg in Googles, hier vorgestellter, iPhone-Applikation. Versteckt im Tab “Einstellungen” lässt sich die Extra-Option “Schnickschnack” wie folgt freilegen: Googles iPhone-App (AppStore-Link) öffnen, Einstellungen wählen und 3-4 mal versuchen die Seite weiter nach oben zu scrollen, als eigentlich vorgesehen.
Ist die Zusatzoption Schnickschnack aufgetaucht, lassen sich hier die Farbe der Applikation, Hinweistöne der Spracheingabe und weitere Settings setzen. Mehr Infos gibt es in Googles Mobile Blog.
“There are a couple of other options hidden in there, too. We had (a little too much) fun implementing these features and hope you enjoy them!“
AppleInsider schreibt über die erste, gegen Apple angestrengte Klage über Haar-Risse im Plastik-Gehäuse der 3G-Geräte:
“Koschitzki also claims that he is among several customers who’ve noticed hairline cracks form in the iPhone 3G’s casing at or around the camera module, and adds that some customers have noticed similar cracks immediately upon opening their new iPhones’ boxes for the first time. “Although Apple was and is aware that the iPhones were and are defective, and that consumers have experienced repeated instances of cracked housing, Apple has nevertheless allowed the defectively designed iPhones to be sold to the public,” the complaint says.”
Währenddessen spekuliert Techcrunch, leicht schadenfroh, über das von Google angekündigte Update der eigenen Such-Appliaktion, das aktuell noch immer nicht im AppStore eingetroffen ist. Das Demo-Video (Youtube-Link) zur sprachgesteuerten Suche -von Google zwischenzeitlich wieder zurückgezogen- haben wir euch im Anschluss angehangen.
“The application didn’t appear as promised, and Google took down the YouTube video demo’ing the product (although it’s still on the Google Channel YouTube page and embedded below). This is an extraordinary event. Other search app providers have told me they’ve been kept waiting months for approval of their app, with no explanation from Apple.”
“Pushing ahead in the decades-long effort to get computers to understand human speech, Google researchers have added sophisticated voice recognition technology to the company’s search software for the Apple iPhone. Users of the free application, which Apple is expected to make available as soon as Friday through its iTunes store, can place the phone to their ear and ask virtually any question, like “Where’s the nearest Starbucks?” or “How tall is Mount Everest?” The sound is converted to a digital file and sent to Google’s servers, which try to determine the words spoken and pass them along to the Google search engine. […]”
Die Sache hat nur zwei Haken: Zum einen steht die von Google versprochene, sprachbasierte Applikation bislang noch nicht im AppStore bereit, zum anderen bleibt unerwähnt, ob der Service auch in Deutsch bzw. im Deutschen AppStore erhältlich sein wird. Auch Googles textbasierte Suchapplikation ist mit einer erheblichen Verzögerung in Deutschland aufgeschlagen. Alle News zu Googles Anstrengungen rund ums iPhone findet Ihr hier.
Makayama vertreibt mit Voice Dial for iPhone zum Preis von 20 Euro ein kommerzielles Spracherkennungspaket für das iPhone, eine Testversion gibt es kostenlos über den Installer. Will man die Sprachkommandos für die einzelnen Kontakte, Lesezeichen, Programme oder Systembefehle umfassend einsetzen, steht einiges an Vorarbeit an: Die einzelnen Befehle müssen jeweils separat aufgenommen und zugewiesen werden. Die Trefferrate bei der Erkennung sinkt wie üblich bei derartigen Produkten mit der Menge der eingegebenen Kommandos.
Wir haben uns ja schon mit der Thematik auseinandergesetzt. Dann aber - das iPhone wird nach Deutschland kommen, und der Tausch der dann ausgelieferten Sprachdateien ein Kinderspiel sein - recht schnell die Lust verloren. Doch zum Glück stehen wir nicht allein da. Die Schweizer von Include7 haben sich die Mühe gemacht, die iPhone-Tastatur mit Umlauten zu bestücken. Leider müssen wir bei diesem Kompromiss-Hack auf [, ] und } verzichten, wer aber auf Ä, Ö und Ü angewiesen ist, der wird die fehlenden Sonderzeichen (gerade im Terminal) wohl eher nicht vermissen. Den Download der Tastatur-Layouts sowie ein kleines Tutorial zu Installation findet ihr hier.
Bei mycintosh hat man sich derweil an die Sprachdateien gesetzt und bietet ein komplettes Paket sowie eine eigens geschriebene Step-By-Step Anleitung. Der mycintosh-Download existiert bereits etwas länger, konnte uns (stellenweise falsch übersetzt und gespickt mit vielen Rechtschreib- und Flüchtigkeitsfehler) mit seinem ersten Release aber nicht überzeugen. In den letzten Tagen überarbeitet und heute als frisches Update erhältlich, dürfte die aktuelle Version jedoch zumindest einen Testlauf wert sein.
Wer seinen Einstieg in der Welt der smarten Mobiltelefone auf einem Windows-Mobile betriebenem Gerät erlebt hat, wird höchstwahrscheinlich auch Microsofts Voice-Commander kennen. Ein gutes, und relativ zuverlässiges Tool, dass den eigenen Pocket-PC um ein Spracherkennungs-Feature erweiterte. “Kontakt XYZ anzeigen”, “Frau Mustermann anrufen”, “Neuen Termin anlegen”. Voice Commander war das Tool für autofahrende Viel-Telefonierer.
So wie es aussieht, dürfte auch das iPhone nicht mehr lange auf eine entsprechende Software warten müssen. Die Jungs von voicesignal haben nun zwei Proof of Concept Videos der eigenen (an das iPhone angepassten) Software veröffentlicht. VSearch wartet nach dem Start auf die Spracheingabe und durchsucht -in der aktuellen Version- sowohl Google-Maps als auch die eigene iTunes-Bibliothek.
Noch haben wir weder Infos zum möglichen Verkaufsstart, noch zum anvisierten Preis-Tag. Eine Spracheingabe für das iPhone wäre aber definitiv wünschenswert. DieVideos gibt es im Anschluss. (via engadget-mobile)