use case: Automatisch Sprecherdatenbank aufbauen
Wie kann ich einen Datensatz für meine Sprechererkennung aufbauen?
Die Herausforderung
Erstellen von Sprecher-Datensätzen
Content enthält nicht nur auf der visuellen Ebene viele Informationen, die systematisch nicht abgebildet oder nachvollziehbar hinterlegt sind. Auch auf der Audio-Ebene gehen Informationen zu Sprecher:innen verloren und tauchen nicht in den Metadaten auf. Wie kann DeepVA mich dabei unterstützen, aus meinem Material Sprecheri:nnen zu extrahieren, um so mein Archiv besser zu strukturieren und durchsuchbar zu machen?
Die Lösung
Deep Collector
Mit dem DeepVA Deep Colletor lässt sich automatisiert Sprecherdatenbanken aufbauen. Dies erfolgt durch das Auslesen von Bauchbinden, in denen der Sprecher:innen Name enthalten ist. Wenn es also Material gibt, das beispielsweise den sprechenden Barack Obama zeigt, und darunter sein Name auftaucht, werden diese Informationen automatisch verknüpft und in ein eigenes Sprecherdataset überführt. Das System kann On-Premise oder in der Cloud genutzt werden. Wenn es Teil eines Arbeitsablaufs sein soll, ist eine Integration erforderlich. Es muss eine Integration über die RESTful API geschaffen werden oder eine vorhandene Integration genutzt werden. Datenschutzvorgaben spielen bei dieser Entscheidung meist eine große Rolle und sollten Bedacht werden.
Welche Resultate können erzielt werden?
Die KI erkennt die Einblendung einer Bauchbinde
Sie legt Trainingsdaten aus Audiospur mitsamt dem Namen und ggf. weiterer Angaben in der Datenbank ab.
Automatisiertes Erstellen einer individuellen Sprecherdatenbank
Permanente Erweiterung der Trainigsdaten durch automatisches Hinzufügen.
schnellere Datenerfassung
Kostenreduktion
schnelleres Labeling
Automatisch eine Sprecherdatenbank aufbauen
Funktionsüberblick
Face Index
Mittels Face Index kann jeder Person in Video- und Bildmaterial eine Nummer zugewiesen werden, womit sie im Nachgang in die Metadaten übersetzt werden können.
Kontakt
Haben Sie noch Fragen?
Verwandte Anwendungsfälle
Werfen Sie den Blick auf unsere anderen Use Cases
Schnellere Recherche
Wie kann ich schneller Personen und Objekte erkennen und Bezüge untereinander herstellen?
Verbesserte Bildersuche
Wie kann ich in meinem visuellen Medienmaterial das schneller finden, wonach ich wirklich suche?
Automatisch eine Sprecherdatenbank aufbauen
Wie schaffe ich es, eine Datenbank für meine Sprechererkennung aufzubauen?