
Automatisch eine Sprecherdatenbank aufbauen
Wie schaffe ich es, eine Datenbank für meine Sprechererkennung aufzubauen?
use case: Contextual Tagging
Die Herausforderung
Werbung sollte die Zuschauer:innen bestenfalls dann erreichen, wenn sie sich mit einer bestimmten Thematik befassen. Intelligent ausgerichtete Markenkommunikation zielt darauf ab, potenzielle Kaufende zum richtigen Zeitpunkt mit einer passenden Botschaft zu bespielen. Auch bei kostenintensiven Werbebannern im Fernsehen ist das nicht anders. Es gilt daher festzustellen, an welcher Stelle eine Werbebotschaft am sinnvollsten eingesetzt werden kann. Die Individualisierung basierend auf ausgestrahlten Handlungen ist eine innovative Möglichkeit, den Ausspielzeitpunkt von Werbemitteln zu optimieren.
Wie kann mir DeepVA dabei helfen, Werbung dann zu platzieren, wenn sie thematisch zu den Inhalten der ausgespielten Szene im Fernsehen passt?
Die Lösung
Mit dem Deep Media Analyzer können Sie mit dem Einsatz von KI die gezeigten Inhalte in den jeweilig ausgestrahlten Szenen erfassen. Mithilfe von Speech-To-Text kann das gesprochene Wort der Protagonist:innen in Textdateien bzw. -pakete umgewandelt und somit die Thematik analysiert werden. Dabei sind vor allem einschlägige Schlüsselworte wie beispielsweise „Frisch“, „Obst“ oder „Salat“ von Relevanz. Anhand dieser Stichworte kann nun simpel ein passendes Werbemittel ausgewählt werden. Unterstützend dazu wirken die Deep Media Analyzer Erkennungs-Funktionen wie die Object, Face und Landmark Recognition. Sie bieten eine umfassende Analyse der gezeigten Szene und können in Kombination mit der Spracherkennung die dargestellten Inhalte innerhalb kürzester Zeit erfassen.
Welche Resultate können erzielt werden?
Inhaltsbasierte Platzierung von Werbemitteln durch Erkennung des gesprochenen Worts
Kontextuelle Szenenerkennung durch Recognition Services
Thematisch ausgerichtete Kommunikation
schnellere Datenerfassung
Kostenreduktion
schnelleres Labeling
Erkenntnisse zum Diversitäts- und Gleichberechtigungsstatus
Oft reicht das gesprochene Wort allein nicht aus: Es braucht Transkribierung. Unsere Speech-to-Text Funktion automatisiert diesen Vorgang.
Die Gesichtserkennung von DeepVA wurde entwickelt, um alle bekannten Persönlichkeiten des öffentlichen Lebens zu erkennen, wie z. B. Personen aus Politik, Sport, Kunst, Unterhaltung und Wirtschaft.
Die Objekt- und Szenenerkennung identifiziert und kennzeichnet verschiedene Objekte und Szenen.
Identifizierungssymbole sind wichtig für einen Regionalbezug. Unsere Landmark Recognition erkennt regionale Wahrzeichen und stellt diese Informationen frame-genau bereit.
Kontakt
Geben Sie unten Ihre E-Mail-Adresse ein und wir werden uns so schnell wie möglich bei Ihnen melden.
Verwandte Anwendungsfälle
Wie schaffe ich es, eine Datenbank für meine Sprechererkennung aufzubauen?
Wie kann ich neue Sprecher:innen in meinem Bestand zukünftig erkennen?
Wie kann ich in meinem visuellen Medienmaterial das schneller finden, wonach ich wirklich suche?
Kontaktieren Sie uns und wir beantworten gerne alle Ihre Fragen.
Nehmen Sie Kontakt mit uns auf, um:
Das Projekt wurde indirekt durch das Rahmenprogramm Horizon 2020 der Europäischen Kommission über das Projekt STADIEM (Grant Agreement 957321) gefördert.
Keine Neuigkeiten verpassen
Keine Sorge, unser Newsletter ist für wichtige Neuigkeiten reserviert, so dass wir nur hin und wieder ein paar Updates versenden. Kein Spam!