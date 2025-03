Das französische KI-Unternehmen Mistral hat eine neue KI-Dokumentenerkennung vorgestellt, die eine erweiterte Dokumentenerfassung ermöglichen soll. Laut Mistral kann das Modell nicht nur reinen Text aus Bildern und PDFs extrahieren, sondern auch komplexe Elemente wie Tabellen, mathematische Formeln und eingebettete Bilder in einer strukturierten Form erfassen.

Mistral OCR sei nativ mehrsprachig und unterstütze eine Vielzahl von Schriftarten und Sprachsystemen, wodurch eine globale Nutzung problemlos möglich sein soll. Das Modell sei außerdem speziell auf die Verarbeitung multimodaler Dokumente ausgelegt, beispielsweise von wissenschaftlichen Arbeiten, Präsentationen oder technischen Dokumentationen.

Anwendungsbereiche und Verfügbarkeit

Das Unternehmen nennt verschiedene Anwendungsmöglichkeiten für die Technologie. Forschungseinrichtungen könnten das Modell beispielsweise zur Digitalisierung wissenschaftlicher Arbeiten nutzen, um den Zugriff auf Fachwissen zu erleichtern. Auch Institutionen, die historische Dokumente archivieren, könnten von einer verbesserten Erfassung profitieren. Weitere mögliche Einsatzgebiete sieht Mistral in der Automatisierung von Kundenservice-Prozessen, indem Betriebsanleitungen und Dokumentationen in durchsuchbare Wissensdatenbanken umgewandelt werden.

Das neue Modell, das deutlich bessere Ergebnisse als konkurrierende KI-Anbieter liefern soll, ist bereits für Nutzer der Mistral-Applikation „Le Chat“ verfügbar und kann über die Entwicklerplattform des Unternehmens genutzt werden.

Über „Le Chat“ direkt ausprobieren

Laut Mistral sei das Modell in der Lage, bis zu 2.000 Seiten pro Minute zu verarbeiten, was es besonders für den Einsatz in datenintensiven Umgebungen interessant machen könnte. Der neue Dienst wird zu einem Preis von 1.000 Seiten pro US-Dollar angeboten, Privatanwender können die neuen Kapazitäten kostenlos ausprobieren.

Die Dokumentenerkennung erfolge durch eine Kombination aus Bilderkennung und strukturierter Textverarbeitung. Durch den sogenannten „Doc-as-Prompt“-Ansatz sollen Nutzer gezielt Informationen aus Dokumenten extrahieren und diese in strukturierten Formaten wie JSON weiterverarbeiten können.