CUSTOMER SUCCESS STORY / Bayeri­scher Rundfunk

Erstellung und Verwaltung von Trainings­daten

INDUSTRIE

Öffentlich-rechtlicher Rundfunk

PRODUKT

VORTEILE

Struk­tu­rierung und Auffind­barkeit von Archiv­ma­terial und, als Folge, Optimierung und Beschleu­nigung der Arbeits­pro­zesse.

Das Anlegen und Verwalten von Trainings­daten für die Face Recognition mithilfe von KI erfordert einen hohen Zeit- und Kosten­aufwand.

DeepVA konnte diesen Prozess automa­ti­sieren und 86% der Kosten einsparen. Gleich­zeitig wurde eine Genau­igkeit von 99,32% erreicht.

Seit 1949 steht der Bayerische Rundfunk für verant­wor­tungs­vollen Journa­lismus mit hochwer­tigen Inhalten in den Bereichen Unter­haltung, Infor­mation, Kultur und Bildung. Acht Millionen Menschen nutzen den öffentlich-rechtlichen Anbieter täglich entweder online, in der Mediathek, für Podcasts, auf den sozialen Medien oder sonstigen Apps. Der BR ist stark regional in Bayern verankert und liefert ein lokales Fernseh­an­gebot, das die Leute bewegt. Der Bayerische Rundfunk ist der wichtigste Nachrich­ten­an­bieter für das Bundesland und berichtet in der Rundschau, in der Abend­schau oder in anderen aktuellen Sendungen über alle relevanten Ereig­nisse und Entwick­lungen.

Die Heraus­for­derung: Manuelles Trainingsdaten-Management ist zu teuer und dauert zu lange

Der steigende Durchsatz an Video­ma­terial in den letzten Jahren macht es erfor­derlich, Algorithmen des maschi­nellen Lernens und des Deep Learnings einzu­setzen, um die Effizienz der Medien­ver­waltung und ‑produktion zu erhöhen. Künst­liche Intel­ligenz wird unter anderem dazu verwendet, Bild- und Video­ma­terial im Bereich der Gesichts­er­kennung mit Metadaten anzurei­chern. Eine manuelle Beschriftung bzw. ein manuelles Labeln der Daten ist nicht mehr möglich. Derartige KI-Modelle können nur gut funktio­nieren, wenn dazuge­hörige Trainings­da­ten­sätze aktuell gehalten und gepflegt werden. Das Problem typischer Anbieter von Recognition Services ist oft, dass vorge­fer­tigte KI-Modelle bzw. extern zugelie­fertes Trainings­ma­terial überwiegend nicht den Anfor­de­rungen einer Fernseh­an­stalt wie dem BR hinsichtlich lokaler Prominenz, histo­ri­schem Material oder der deutschen Sprache entsprechen. Die eigene Generierung eines solchen Bestands an Trainings­daten erfordert aller­dings konti­nu­ier­liche perso­nelle Ressourcen und ist zeitauf­wendig und kosten­in­tensiv.

Für den Bayeri­schen Rundfunk stellte sich die Frage, ob der eigene Archiv­be­stand an Nachrich­ten­sen­dungen dazu genutzt werden könne, die Erstellung von Trainings­daten für die unter­neh­mens­spe­zi­fische Gesichts­er­kennung zu automa­ti­sieren und damit einen sich stets weiter­ent­wi­ckelnden Trainings­da­tensatz zu erschließen, ohne dass dafür ein exorbitant hoher Mitar­bei­ter­aufwand anfallen würde.

Lösung: Face Dataset Creation by DeepVA
- eine automa­ti­sierte Trainings­da­ten­er­stellung.

Für diese Heraus­for­derung trat der BR an das Freiburger KI-Startup DeepVA heran und gemeinsam war es möglich, eine automa­ti­sierte Lösung für die Erstellung von Trainings­daten im Bereich der Gesichts- bzw. Perso­nener­kennung zu entwi­ckeln. Mithilfe der sogenannten Face Dataset Creation, wird vom BR breits veröf­fent­lichtes Video­ma­terial hinsichtlich Namens­ein­blen­dungen analy­siert. Namen von Personen werden üblicher­weise in Nachrich­ten­in­halten oder sonstigen Inter­view­szenen einge­blendet. In der Regel wird die gezeigte Person dabei frontal abgebildet, ihr Gesicht hat eine akzep­table Größe und ist meist unver­deckt. Zudem ist die Person oftmals allein­stehend.

Die Infor­ma­tionen aus der Namens­ein­blendung wird zusammen mit dem dazuge­hö­rigen Gesicht extra­hiert und in einem Datensatz abgespei­chert, der dann wiederum für das Training eines KI-Modells verwendet werden kann. Auf diese Art und Weise können große Trainings­da­ten­sätze ohne manuellen Aufwand angelegt werden und es entstehen KI-Modelle, die unter­neh­mens­spe­zi­fische Anfor­de­rungen besser bewäl­tigen können als Out-of-the-Box Recognition Services.

Das Ergebnis: Hohe Zeiter­sparnis bei extremer Genau­igkeit

Im Rahmen der Koope­ration des BR und DeepVA wurden neben dem produk­tiven Betrieb zusätzlich zu Testzwecken 641 videos von Nachrich­ten­sen­dungen mithilfe der Face Dataset Creation analy­siert. Für das Auslesen der Namens­ein­träge konnte eine Genau­igkeit von 96,27 % erreicht werden. Der zeitliche Aufwand für diese Art der Trainings­da­ten­er­stellung wurde mit dem dafür notwen­digen manuellen Aufwand verglichen. Würde man die gleiche Anzahl an Daten händisch generieren (Video­seg­mente finden, in denen Namen einge­blendet werden; Namen manuell abspei­chern; die passenden Gesichter aus den jewei­ligen Stand­bildern extra­hieren und all diese Infor­ma­tionen in einer Ordner­struktur ablegen), so würde ein Mitar­beiter auf Basis einer 40-Stunden-Woche 17 Wochen benötigen. Die Automa­ti­sierung der Trainings­daten durch DeepVA ergab für diese 300 Stunden Video­ma­terial nur eine Zeit von etwa 4 Tagen. Die Automa­ti­sierung dieses Prozesses mit DeepVA dauerte weniger als 4 Tage. Insgesamt wurden 300 Stunden Video­ma­terial verar­beitet; Dies entspricht einer Zeiter­sparnis von 86%, die sogar noch bei leistungs­fä­hi­gerer Server­struktur erhöht werden könnte. Die KI-Modelle, die auf Basis der so erstellten Daten­sätze trainiert wurden, erreichten in der Perso­nener­kennung eine Genau­igkeit von 99,32%. Die Zusam­men­arbeit des Bayeri­schen Rundfunks und DeepVA zeigt, dass es möglich ist, die Erstellung unter­neh­mens­spe­zi­fi­scher Trainings­daten in der Gesichts­er­kennung zu automa­ti­sieren und liefert hinsichtlich Zeit- und Kosten­er­sparnis erstaun­liche Ergeb­nisse. Mithilfe dieser Techno­logie können Medien­un­ter­nehmen umfang­reiche Daten­sätze anlegen und mit den Ergeb­nissen aus den daraus entste­henden indivi­du­ellen KI-Modellen ihr Medien­archiv besser struk­tu­rieren und Content recher­chierbar machen.

0 %

GENAUIGKEIT

100 %

BEDARF AN KI-EXPERTEN

0 %

SCHNELLERE KENNZEICHNUNG

Werfen Sie einen Blick auf unsere weiteren Erfolgs­ge­schichten

Vidispine

Mithilfe von DeepVA kann der User intuitiv und einfach direkt im Media Asset Management System Trainings­daten anlegen und verwalten.

Mehr lesen »

TVN

Die KI-gestützte Unter­ti­telung für das deutsche Bundes­kanz­lerin sorgt für präzise, barrie­re­freie Sendungen mit Echtzeit-Transkription, mensch­licher redak­tio­neller Aufsicht und Einhaltung der DSGVO.

Mehr lesen »

Indivi­duelle Lösungen, die auf Ihre Bedürf­nisse zugeschnitten sind

Sind Sie bereit, das Potenzial von KI für Ihr Unter­nehmen zu nutzen? Jetzt DeepVA 14 Tage kostenlos testen!

Wir werden unter­stützt von

Tage :
Stunden :
Minuten :
Sekunden

Neueste KI-Nachrichten

Abonnieren Sie unseren Newsletter

Keine Sorge, unser Newsletter ist für wichtige Neuigkeiten reserviert, so dass wir nur hin und wieder ein paar Updates versenden. Kein Spam!