use case: Automatisch Sprecherdatenbank aufbauen

Wie kann ich einen Datensatz für meine Sprechererkennung aufbauen?

Die Herausforderung

Erstellen von Sprecher-Datensätzen

Content enthält nicht nur auf der visuellen Ebene viele Informationen, die systematisch nicht abgebildet oder nachvollziehbar hinterlegt sind. Auch auf der Audio-Ebene gehen Informationen zu Sprecher:innen verloren und tauchen nicht in den Metadaten auf. Wie kann DeepVA mich dabei unterstützen, aus meinem Material Sprecheri:nnen zu extrahieren, um so mein Archiv besser zu strukturieren und durchsuchbar zu machen?

Die Lösung

Deep Collector

Mit dem DeepVA Deep Colletor lässt sich automatisiert Sprecherdatenbanken aufbauen. Dies erfolgt durch das Auslesen von Bauchbinden, in denen der Sprecher:innen Name enthalten ist. Wenn es also Material gibt, das beispielsweise den sprechenden Barack Obama zeigt, und darunter sein Name auftaucht, werden diese Informationen automatisch verknüpft und in ein eigenes Sprecherdataset überführt. Das System kann On-Premise oder in der Cloud genutzt werden. Wenn es Teil eines Arbeitsablaufs sein soll, ist eine Integration erforderlich. Es muss eine Integration über die RESTful API geschaffen werden oder eine vorhandene Integration genutzt werden. Datenschutzvorgaben spielen bei dieser Entscheidung meist eine große Rolle und sollten Bedacht werden.

Welche Resultate können erzielt werden?