ONDEWO Speech-to-Text (S2T) Plattform

Ihr gesprochenes Wort wird mit modernster Genauigkeit in Text übertragen.

Die menschliche Stimme wird automatisch transkribiert
Anwendungen, Geräte und Prozesse können sprachgesteuert werden
Kundenanwendungsfallspezifische Sprach-Text-Modelle für selbst die komplexesten Vokabeln und Phrasen

Vorteile

Was Sie gewinnen

Die ONDEWO Speech-to-Text (S2T) Plattform ist eine Softwareplattform für Unternehmen, mit der menschliche Stimmen in Form von Audio in Text übertragen werden können. Unser einzigartiger Ansatz für die Sprachausgabe von Text bietet Unternehmen mit komplexeren Vokabeln oder Phrasen viele Vorteile, die erkannt werden können, z. B. eine hochgenaue Transkription der menschlichen Stimme für einen bestimmten Anwendungsfall und eine Optimierung der Transkription im Hinblick auf die Geschwindigkeit.

Unser Hauptmerkmal hierbei ist, dass wir in der Lage sind, hoch kundenspezifische Sprach-Text-Modelle mit unglaublich schnellen Transkriptionsgeschwindigkeiten für mehrere Sprachen zu entwickeln, die auf unseren vorab geschulten allgemeinen und branchenspezifischen Sprach-Text-Modellen basieren.

Höchste Genauigkeit und Geschwindigkeit

Mit unseren neuesten Deep-Learning-Algorithmen ist die Spracherkennung hochgenau (85-95%) und 40-60-mal schneller als Cloud-Anbieter.

Mehrere Sprachen und Dialekte

ONDEWO ist darauf spezialisiert, dass der AI Agent verschiedene Sprachen sowie Dialekte und Nicht-Muttersprachler verstehen kann. Benötigen Sie eine neue Sprache oder einen bestimmten Dialekt, den wir noch nicht haben – kein Problem, wir unterrichten unsere KI innerhalb von 3-4 Wochen.

Erkennt Stimmen aus verschiedenen Kanälen

Es erkennt und transkribiert Stimmen, die über Ihre verschiedenen Kanäle wie Telefon (8 kHz), Mobiltelefon, Laptop oder Tablet (16 kHz) eingehen.

Demo

Konvertieren Sie das, was Sie sagen, in Text

Wählen Sie, ob Sie eine Audiodatei hochladen oder etwas live sagen möchten.

01

Wählen Sie die Echtzeit-Transkription von Audiostreams aus, klicken Sie auf das Mikrofon und sagen Sie etwas.

02

Die KI erledigt den Rest und transkribiert ihn für Sie.

03

Sie können den Text dann kopieren.

Wichtige Funktionen

Was macht es so besonders?

Unterstützt mehrere Sprachen einschließlich Dialekten

Die Speech-to-Text-Algorithmen und -Modelle werden sofort mit 10 Sprachen (Deutsch, Englisch, Spanisch, Französisch, …) unterstützt.

Hochgeschwindigkeits-Sprach-Text-Transkriptionen

Die KI kann Hunderte von parallelen Transkriptionen pro Installation mit einer 40-60-mal schnelleren Transkriptionsgeschwindigkeit als andere Cloud-Anbieter unterstützen, z. So kann das System Hunderte von Telefongesprächen in Echtzeit führen.

Verwenden Sie fallspezifische Sprach-Text-Modelle

Für komplexe Themen mit hochspezialisiertem Vokabular (z. B. Produktnamen, Support-Ticketkategorien) verwenden wir modernstes Transferlernen, um die Sprach-Text-Algorithmen und -Modelle für Ihren spezifischen Anwendungsfall zu trainieren. Dies führt zu einer deutlich höheren Genauigkeit als allgemeine Modelle von Cloud-Anbietern . Es ermöglicht den unterschiedlichsten Kunden, es zu verwenden, auch denen, die ansonsten von der Spracherkennung nicht verstanden werden.

Die Wortfehlerraten (WER) liegen bei allgemeinen Modellen zwischen 10 und 15% und bei benutzerdefinierten spezifischen Sprach-Text-Modellen unter 10% (auf menschlicher Ebene).

Zwei Erkennungsmodi: „Echtzeit“ und „Batchdatei“

Der Echtzeitmodus transkribiert Text, während er Audio hört, das auf die S2T-Plattform gestreamt wird (z. B. über die Web-Socket-Schnittstelle). Dieser transkribierte Text wird kontinuierlich aktualisiert und verbessert, je länger die KI den Audiostream hört („Hypothese der aktualisierten Transkriptionen“). Der Batch-Dateimodus überträgt Audio in Text basierend auf einer WAV-Audiodatei, die an die S2T-Plattform gesendet wird.

Verschiedene Kanäle werden unterstützt

Die Plattform unterstützt die Transkription menschlicher Stimme von verschiedenen Kanälen wie Telefon (8 kHz) und Mobiltelefon, Laptop oder Tablet (16 kHz). Wir arbeiten derzeit daran, Modelle für Funknachrichten zu erstellen.

Schnelle und einfache Integration in Produkte und Dienstleistungen

Alle Plattformfunktionen lassen sich einfach über zwei Client-Bibliotheken für verschiedene Programmiersprachen (z. B. Python, Nodejs, Angular, JavaScript usw.) und gRPC Remote Procedure Calls („GRRPC“) in Ihre Produkte und Services integrieren.

On-Premise- oder Cloud-Hosting

Alle Funktionen sind in beiden Versionen verfügbar. Die On-Premise-Lösung lässt sich problemlos auf allen Betriebssystemen mit einer Standard-Docker-Bereitstellungsumgebung auf Ihrer eigenen IT-Infrastruktur installieren. Darüber hinaus ermöglicht es ein höheres Maß an Datenschutz und Kontrolle. Mit der Cloud-Option ist keine Wartung erforderlich, da sie von ONDEWO bereitgestellt wird. Die Cloud-Option wird auf Nutzungsbasis abgerechnet.

Nachrichten

Was gibt es sonst Neues

Registrieren Sie sich hier für den ONDEWO Newsletter. Sie sind auf dem neuesten Stand und immer der Erste, der über neue Produkte und Lösungen sowie andere Neuigkeiten informiert wird.