
Schnellere Recherche
Wie kann ich schneller Personen und Objekte erkennen und Bezüge untereinander herstellen?
use case: Automatisch Sprecherdatenbank aufbauen
Die Herausforderung
Content enthält nicht nur auf der visuellen Ebene viele Informationen, die systematisch nicht abgebildet oder nachvollziehbar hinterlegt sind. Auch auf der Audio-Ebene gehen Informationen zu Sprecher:innen verloren und tauchen nicht in den Metadaten auf. Wie kann DeepVA mich dabei unterstützen, aus meinem Material Sprecheri:nnen zu extrahieren, um so mein Archiv besser zu strukturieren und durchsuchbar zu machen?
Die Lösung
Mit dem DeepVA Deep Colletor lässt sich automatisiert Sprecherdatenbanken aufbauen. Dies erfolgt durch das Auslesen von Bauchbinden, in denen der Sprecher:innen Name enthalten ist. Wenn es also Material gibt, das beispielsweise den sprechenden Barack Obama zeigt, und darunter sein Name auftaucht, werden diese Informationen automatisch verknüpft und in ein eigenes Sprecherdataset überführt. Das System kann On-Premise oder in der Cloud genutzt werden. Wenn es Teil eines Arbeitsablaufs sein soll, ist eine Integration erforderlich. Es muss eine Integration über die RESTful API geschaffen werden oder eine vorhandene Integration genutzt werden. Datenschutzvorgaben spielen bei dieser Entscheidung meist eine große Rolle und sollten Bedacht werden.
Welche Resultate können erzielt werden?
Die KI erkennt die Einblendung einer Bauchbinde
Sie legt Trainingsdaten aus Audiospur mitsamt dem Namen und ggf. weiterer Angaben in der Datenbank ab.
Automatisiertes Erstellen einer individuellen Sprecherdatenbank
Permanente Erweiterung der Trainigsdaten durch automatisches Hinzufügen.
schnellere Datenerfassung
Kostenreduktion
schnelleres Labeling
Automatisch eine Sprecherdatenbank aufbauen
Mittels Face Index kann jeder Person in Video- und Bildmaterial eine Nummer zugewiesen werden, womit sie im Nachgang in die Metadaten übersetzt werden können.
Kontakt
Geben Sie unten Ihre E-Mail-Adresse ein und wir werden uns so schnell wie möglich bei Ihnen melden.
Verwandte Anwendungsfälle
Wie kann ich schneller Personen und Objekte erkennen und Bezüge untereinander herstellen?
Wie schaffe ich es, eine Datenbank für meine Sprechererkennung aufzubauen?
Wie kann ich in meinem visuellen Medienmaterial das schneller finden, wonach ich wirklich suche?
Kontaktieren Sie uns und wir beantworten gerne alle Ihre Fragen.
Nehmen Sie Kontakt mit uns auf, um:
Das Projekt wurde indirekt durch das Rahmenprogramm Horizon 2020 der Europäischen Kommission über das Projekt STADIEM (Grant Agreement 957321) gefördert.
Keine Neuigkeiten verpassen
Keine Sorge, unser Newsletter ist für wichtige Neuigkeiten reserviert, so dass wir nur hin und wieder ein paar Updates versenden. Kein Spam!