Deepva Speech-to-Text

Speech-to-Text

funktionsbeschreibung

Umwandlung von Sprache in Text

Oft reicht das gesprochene Wort allein nicht aus: Es braucht Transkription. Unsere Speech-to-Text-Funktion automatisiert diesen Vorgang. Die Algorithmen zur Spracherkennung wurden gemeinsam mit dem Fraunhofer-Institut entwickelt. Sie machen es möglich, nicht nur visuelle Inhalte aus den Videos zu analysieren, sondern auch die Audioebene einzubeziehen.

Speech-to-Text hilft dabei, noch detailliertere Metadaten von Medien zu erlangen. Sie können somit ermitteln, was genau in dem Video passiert, worum es geht und auch um welches Genre es sich handelt. Die Funktion ist perfekt für die Erstellung von automatisierten Zusammenfassungen des Materials geeignet.

DeepVA Speech-to-Text

vorteile

Daten in Werte umwandeln

Transkription des gesprochenen Worts & Erkennung des Genres

Detaillierte Metadaten Ihrer Medien

Automatisierte Erstellung von Zusammen­fassungen

use cases

Logo Recognition Anwendungsfälle

Wie es funktioniert

Wie funktioniert Logo Recognition?

Die Logo Recognition analysiert Logos hinsichtlich verschiedener Merkmale und vergleicht diese mit der dahinterstehenden Datenbank. Diese kann entweder aus von uns vortrainierten Persönlichkeiten bestehen oder in Zukunft auch aus ganz eigenem Trainingsmaterial. Künftig wird also neben der Face und Landmark Recognition, auch die Logo Recognition an die unternehmensspezifischen Bedürfnisse angepasst werden.