Deepva Speech-to-Text
Speech-to-Text
funktionsbeschreibung
Umwandlung von Sprache in Text
Oft reicht das gesprochene Wort allein nicht aus: Es braucht Transkription. Unsere Speech-to-Text-Funktion automatisiert diesen Vorgang. Die Algorithmen zur Spracherkennung wurden gemeinsam mit dem Fraunhofer-Institut entwickelt. Sie machen es möglich, nicht nur visuelle Inhalte aus den Videos zu analysieren, sondern auch die Audioebene einzubeziehen.
Speech-to-Text hilft dabei, noch detailliertere Metadaten von Medien zu erlangen. Sie können somit ermitteln, was genau in dem Video passiert, worum es geht und auch um welches Genre es sich handelt. Die Funktion ist perfekt für die Erstellung von automatisierten Zusammenfassungen des Materials geeignet.
vorteile
Daten in Werte umwandeln
Transkription des gesprochenen Worts & Erkennung des Genres
Detaillierte Metadaten Ihrer Medien
Automatisierte Erstellung von Zusammenfassungen
use cases
Logo Recognition Anwendungsfälle
Diversitäts- und Gleichberechtigungsstatus
Wie kann ich mir einen schnellen Überblick zu meinem Diversitäts- und Gleichberechtigungsstatus meines Contents verschaffen?
Wie es funktioniert
Wie funktioniert Logo Recognition?
Die Logo Recognition analysiert Logos hinsichtlich verschiedener Merkmale und vergleicht diese mit der dahinterstehenden Datenbank. Diese kann entweder aus von uns vortrainierten Persönlichkeiten bestehen oder in Zukunft auch aus ganz eigenem Trainingsmaterial. Künftig wird also neben der Face und Landmark Recognition, auch die Logo Recognition an die unternehmensspezifischen Bedürfnisse angepasst werden.