Deepva Speech-to-Text

Speech-to-Text

funkti­ons­be­schreibung

Umwandlung von Sprache in Text

Oft reicht das gespro­chene Wort allein nicht aus: Es braucht Transkription. Unsere Speech-to-Text-Funktion automa­ti­siert diesen Vorgang. Die Algorithmen zur Sprach­er­kennung wurden gemeinsam mit dem Fraunhofer-Institut entwi­ckelt. Sie machen es möglich, nicht nur visuelle Inhalte aus den Videos zu analy­sieren, sondern auch die Audio­ebene einzu­be­ziehen.

Speech-to-Text hilft dabei, noch detail­liertere Metadaten von Medien zu erlangen. Sie können somit ermitteln, was genau in dem Video passiert, worum es geht und auch um welches Genre es sich handelt. Die Funktion ist perfekt für die Erstellung von automa­ti­sierten Zusam­men­fas­sungen des Materials geeignet.

DeepVA Speech-to-Text

vorteile

Daten in Werte umwandeln

Transkription des gespro­chenen Worts & Erkennung des Genres

Detail­lierte Metadaten Ihrer Medien

Automa­ti­sierte Erstellung von Zusammen­fassungen

use cases

Logo Recognition Anwen­dungs­fälle

Wie es funktio­niert

Wie funktio­niert Logo Recognition?

Die Logo Recognition analy­siert Logos hinsichtlich verschie­dener Merkmale und vergleicht diese mit der dahin­ter­ste­henden Datenbank. Diese kann entweder aus von uns vortrai­nierten Persön­lich­keiten bestehen oder in Zukunft auch aus ganz eigenem Trainings­ma­terial. Künftig wird also neben der Face und Landmark Recognition, auch die Logo Recognition an die unter­neh­mens­spe­zi­fi­schen Bedürf­nisse angepasst werden.

Tage :
Stunden :
Minuten :
Sekunden

Neueste KI-Nachrichten

Abonnieren Sie unseren Newsletter

Keine Sorge, unser Newsletter ist für wichtige Neuigkeiten reserviert, so dass wir nur hin und wieder ein paar Updates versenden. Kein Spam!