Audio und KI-Funktionen bemerkenswert gut
Soundcore Work: Diktiergerät mit iPhone-App und KI-Anbindung
Das seit wenigen Wochen erhältliche Diktiergerät Soundcore Work macht sich für uns vor allem durch seine iPhone-Anbindung interessant. Der kleine Sprachrekorder arbeitet mit der iPhone-App von Soundcore zusammen und lässt sich zudem in Apples „Wo ist?“-Netzwerk integrieren.
Zunächst einmal hat uns die Größe des Soundcore Work überrascht. Der eigentliche Rekorder entspricht vom Durchmesser einer Euro-Münze und ist etwa einen Zentimeter dick. Die zugehörige Ladestation ist mit 6 x 6 cm ebenfalls ausgesprochen kompakt. Beides macht einen hochwertigen Eindruck, Anker bietet das Produkt in den Gehäusefarben Schwarz und Weiß an.
Der Rekorder kann solo mit einer Akkulaufzeit von bis zu acht Stunden betrieben werden. In die Ladestation eingesetzt ist die Nutzung über bis zu 32 Stunden hinweg möglich.
Tischgerät oder Ansteckmikrofon
Der Sprachrekorder lässt sich dabei mit oder ohne Basisstation flexibel verwenden und kann magnetisch auf Metallflächen oder an einem mitgelieferten, selbstklebenden Metallring befestigt werden. Zudem besteht die Möglichkeit, den Rekorder mit einem integrierten Magnetclip wie ein Ansteckmikrofon an der Kleidung zu befestigen.
Die Aufnahme wird durch Drücken einer mechanischen Taste gestartet und durch eine dezent leuchtende LED angezeigt. Tippt man doppelt auf die Oberfläche des Rekorders, wird eine Markierung gesetzt, um die betreffende Stelle in der Aufnahme oder der Transkription schnell wiederzufinden.
Viel mehr gibt es zur Hardware gar nicht zu sagen. Interessant wird der Soundcore Work im Zusammenspiel mit der iPhone-App und den von Anker angebotenen Transkriptionsfunktionen.
Aufnahmegerät mit sehr guter Qualität
Die aufgenommenen Audiodateien werden nach dem Öffnen der Soundcore-App an das iPhone übertragen. Standardmäßig geschieht dies per Bluetooth, was bei größeren Dateien dauern kann. Die App bietet in diesem Fall eine optionale direkte WLAN-Verbindung zum Rekorder an. Der Verbindungsaufbau und das anschließende Wiederherstellen der WLAN-Verbindung haben bei uns prima funktioniert und die Daten werden auf diesem Weg wesentlich schneller übertragen.
Wer die Aufnahmen nun selbst weiterverarbeiten will, hat die Möglichkeit, diese im MP3-Format zu exportieren. Allerdings liegen die Stärken des Soundcore Work zweifellos im Zusammenspiel mit den von Anker angebotenen KI-Funktionen, die allerdings das Einverständnis voraussetzen, dass die Aufnahmen zur Verarbeitung an eine KI-Cloud zu übertragen.
Die Ergebnisse der bislang von uns durchgeführten Tests waren ausgesprochen gut. Die automatische Transkription war stets größtenteils fehlerfrei, wenn etwas nicht gestimmt hat, war die Ursache nachvollziehbar – beispielsweise undeutliches Sprechen oder nicht alltägliche Eigennamen. Das Aufnahmegerät ließ sich auch durch Nebengeräusche und parallel laufende Gespräche oder ein Radiogerät, wenn überhaupt, dann nur minimal verwirren. Die beiden integrierten Mikrofone arbeiten ausgesprochen gut.
KI-Anbindung als enormer Mehrwert
Die Transkription wird nach der Verarbeitung als strukturierter und – sofern der Fall – unterschiedlichen Sprechern zugeordneter Text angezeigt. Den Sprechern lassen sich Namen zuweisen und die Transkription ist direkt mit der Audioaufzeichnung verknüpft. Man kann also durch Tippen auf eine Textstelle das Original hören oder umgekehrt auf eine Position im Audiodiagramm tippen, um zur entsprechenden Textstelle zu gelangen. Für gezielte Navigation kann man während der Aufnahme per Doppeltipp auf den Rekorder Markierungen setzen.
Während alles bis hier noch als Standard in diesem Segment gewertet werden darf, können die durch die Anker-KI erstellten Zusammenfassungen definitiv beeindrucken. Ihr könnt hier eine ausführliche Auswertung der aufgezeichneten Daten abrufen und exportieren, die nicht nur eine einfache Zusammenfassung des Textes enthält, sondern bei Diskussionen auch unterschiedliche Positionen gegenüberstellt oder erwähnte Ziele bündelt.
Im Rahmen der Auswertung kann man es der KI überlassen, das aufgezeichnete Gespräch zu kategorisieren. Man kann aber auch direkt eine Vorlage wählen, hier stehen Sitzungsprotokolle, Debatten oder Präsentationen zur Wahl.
Testweise haben wir mit dem Soundcore Work auch eine englischsprachige Produktpräsentation aufgezeichnet. Die Sprache wurde erkannt und die Transkription ist im Original erfolgt. In der Zusammenfassung hat uns die KI dann aber treffsicher eine Produktbeschreibung in deutscher Sprache vorgelegt, inklusive technischer Details, Anwendungsbeispielen und der im Anschluss gehaltenen FAQ-Session.
Menschliche Kontrolle nicht vergessen
Das klingt alles super und ist ohne Frage auch eine unglaubliche Erleichterung für Menschen, die regelmäßig dergleichen erledigen müssen. Es muss aber auch klar sein, dass eine KI durchaus Fehler produzieren kann. Somit kann keines dieser Systeme ein Selbstläufer sein, sondern wir setzen voraus, dass die automatisiert erstellten Ergebnisse von einem Teilnehmer solcher Veranstaltungen geprüft und wenn nötig korrigiert werden.
Abschließend müssen wir auch noch auf die eventuellen Mehrkosten für ein KI-Abo zu sprechen kommen. Der Soundcore Work funktioniert grundsätzlich ohne weitere Kosten. Allerdings ist das monatliche Transkriptionsvolumen dann auf 5 Stunden beschränkt. Im Rahmen eines Pro-Abonnements stehen zum Monatspreis von 17,99 Euro 20 Stunden sowie erweiterte Zusammenfassungsfunktionen zur Verfügung.
Momentan für 130 Euro erhältlich
Die Hardware selbst wird von Anker zum Preis von 159,99 Euro angeboten. Aktuell gibt es darauf beim Kauf über die Webseite des Herstellers 30 Euro Rabatt, wenn man den Aktionscode WS24D3200DE verwendet.







Top.
Gibt es schon Vergleiche zu Plaud?
Ich nutze hierfür „Just Press Record“ – auch mit Apple Watch Integration und iCloud Sync.
wird das lokal transkripiert oder online?
icloud oder lokal
Benutze ich auch. Glaub sogar aufgrund eines Artikels hier bei Iduna. Allerdings geht’s hier ja auch um Hardware – daher Äpfel und Birnen…
Ein Abo von 18€ für 20 Stunden und 5 Stunden sind aber gratis. Komische Preisgestaltung
Iduna = ifun
Ich sehe leider null Verwendungszweck bei mir, aber ich liebe das Design und die Integration ins iOS bzw. iPhone.
Wegen solcher Produktempfehlungen liebe ich diese Seite so sehr!
Kann mir irgendjemand erklären, wo der Mehrwert darin liegt diese Hardware zu kaufen im Vergleich zu iOS Boardmitteln oder eine App, wie zum Beispiel just press record?
Das Einzige was mit da einfällt ist die Größe wie im Bild dargestellt. Willst du dir dein iPhone genauso umhängen? Oo
Aber ich bin zu alt für den Sch.. ich blogge nicht und ich spreche mir keine Notizen „auf‘s Band“, die ich später evtl. brauche.
Heutzutage ist es natürlich cool, weil man das gleich verschriftlichen lassen kann.
just press hat halt soweit ich im App store lese kein LLM in Verwendung sprich die Audio muss halt sehr top sein damit das gut transkribiert wird und dann musst du das für die summary art deiner Wahl noch gut prompten – damit zb bei Einem Teams Meeting mit Copilot ein Summary in der Qualität rausfällt und die ist halt besser als ein Mensch daa machen könnte ist ein A4 Seitenlanger prompt nötig
Keine KI sondern reine Transkription. Und kein extra Mikrofon, was besonders hilfreich ist für speaker. Handy irgendwo auf dem Pult und Mikro am Kragen.
wieder kein Wort zu wo wird das in der Cloud verarbeitet – ich mein ohne das zu wissen und wie der Hersteller damit umgehen kannst damit maximal deinen Stammtisch recorden!
mehr als das hier findet man nicht – wenn deine Firma vorschreibt, dass das in der EU verarbeitet werden muss, hast halt Pech – warum recherchiert ihr sowas nicht auch immer dazu besser?
„Datenschutz: Daten werden sowohl während der Übertragung (mit TLS 1.3 und ECDH mit AES-256) als auch im Ruhezustand (mit AES-256) verschlüsselt für mehr Sicherheit. Die Daten werden auf AWS gespeichert – die derzeit sicherste Cloud-Computing-Plattform.“
Du kannst das bestimmt nachlesen. Da die Sachen aber zur Cloud geschickt werden, werden sie verarbeitet. Ob dann dsgvo eingehalten wird oder nicht, lässt sich eh nur schwer prüfen.
Leider verstehe ich es immer noch nicht: was kann die Hardware, was das iPhone nicht kann?
Funkmikrofon??? Ladestation??? Eigentlich steht es doch da…
Danke. 1. Die Übertragung auf das iPhone per Funk ist keine zusätzliche Funktion, da bei Aufnahme mit dem IPhone die Audiodaten sofort auf dem iPhone sind. 2. Das iPhone selbst kann auf einer „Ladestation“ geladen werden, die man in der Regel sowieso dabei hat. Das Ding hat also tatsächlich keinen praktische Funktion, die man nicht auch ohne das Ding hätte.
Gute Güte, es fängt schon damit an, wenn du parallel auf dem Handy arbeitest, du trotzdem eine Sprachaufzeichnung brauchst.
Oder in einem Raum mit fünf Personen, wo Du auch dein Handy brauchst.
Klasse Ding, vor allem für gewisse Andere…
Ich bin beruflich in der IT Security. Wir beraten Kunden und versuchen Kunden zu schützen. Viele laufen blind und ungeschützt durch die Unternehmenswelt. Da passt so ein Rekorder super dazu.
Der gesprochene Text wird dann in irgendeine Cloud hochgeladen und dort verarbeitet. Im Ernst?
Und später wundert man sich, warum der Chinese plötzlich mit der gleichen Idee, nur günstiger ankommt?
#kopfschüttel
Die Zeit, in der „die Chinesen“ bei uns kopieren ist mittlerweile vorbei. Herzlich Willkommen in der Zukunft :)
Nein. Aber Du kannst das Land ggfs. durch Nordkorea oder Russland ersetzen, falls Du diesem Glauben erliegen willst. Und selbst sogenannte Freunde haben mindestens 5 Augen.
Abgesehen davon haben Anwender von Diktiergeräten meistens sehr spezifische ergonomische Anforderungen an die Nutzung ihres Gerätes, was zurückspringen und Löschen angeht. Ob das effizient durch ein tastenloses Gerät gewährleistet werden kann, wird hier nicht beschrieben. Die neuen iPhones zumindest der Pro-Reihen haben ja weiterentwickelte Mikrofone und Richtungscharakteristika, letztere wohl durch Software – müsste man mal professionell testen, wie die im Vergleich abschneiden. Aber im Prinzip ist das Produkt so wie es hier dargestellt wird, zunächst einmal ein Kandidat für eine DSGVO-Prüfung für die wohl meisten kommerziellen Zwecke. Und mit dem Abo dann auch eine Ansage, was die Kosten angeht.
Was ist denn, wenn ich mit dem Micro / App aufnehmen möchte (weil Clipfunktion) und die Aufnahme dann an lokales Transkriptmodell exportiere? Sollte dann doch Datenschutz aufrecht erhalten?
Ich gebe zu bedenken, daß ein großer Teil der Menschen, fie Diktiergeräte verwenden, vertrauliche Texte diktieren. Dabei geht es nicht nur um Berufsgeheimnisträger wie Rechtsanwälte und Ärzte, sondern auch einfach um Geschäftsgeheimnisse von Firmen. Für all diese Anwendergruppen wäre eine lokale Lösung (ggf. über eine KI auf einem lokalen Server) viel interessanter.
Leider nur 6 Monate kostenlos, danach dann über 100€ im Jahr :-(
In einem Unternehmen gibt es immer einen aus der Gruppe der nein zu Aufnahmen sagt. Heimlich aufnehmen das klappt nicht. Macht man doch nicht. Und es klappt erst recht nicht, wenn man die Leute fragt. Das ist meine Erfahrung.