Bilder und Videos haben sich in den vergangenen Jahrzehnten zu einer der wichtigsten Medienform entwickelt und werden in verschiedenen Bereichen als effektives Mittel zur Steigerung des Absatzes genutzt. Laut ReportLinker wird der KI-Markt bis 2027 voraussichtlich auf 312,4 Mrd. USD anwachsen.
Neben der Produktion, Nutzung und Verwertung von digitalem Bild- & Videomaterial, das von TV-Sendern (Privaten-, Öffentlichen- und Pay-TV-Sendern), Filmproduktionsfirmen und Streaming-Anbietern (Video-on- Demand), aber auch von Werbeagenturen und Verlagen eingesetzt wird, spielen Bilder und Videos ebenfalls eine wichtige Rolle bei beispielsweise der Qualitätskontrolle, im Digital Asset Management Systemen, beim Autonomen Fahren oder in Archiven von Städten und Kommunen.
Die aktuelle Marksituation bildet eines jedoch nicht ab – wegen der schnell steigenden Menge an Bildern und Videos in unterschiedlichen Branchen fehlt es dem Großteil der Nutzer von visuellen Daten an adäquaten und innovativen Lösungen zur automatisierten Analyse, Verschlagwortung und Verwaltung ihrer Mediendaten um wichtige Entscheidungen zu treffen und Prozesse zu optimieren. Die stetig wachsende Anzahl an Bildern und Videos wird für die Unternehmen zu einem immer größer werdenden Problem, das bis dato nur mit großem zeitlichem Aufwand und höheren Kosten gelöst werden kann. Ein neuer Geschäftsbedarf wurde geschaffen, der von innovativen Unternehmen erfüllt werden muss, die KI und Machine Learning-Tools einsetzen um Inhalte tiefgreifend zu verstehen.
Eine riesen Herausforderung für Content-Produzenten ist das Auffinden von Archivmaterial für qualitativ hochwertige und auf den Nutzer angepasste Inhalte und das für eine Breite an Konsumenten. Es gilt, bessere Inhalte mit weniger Zeitaufwand und Ressourcen zu erstellen. Das ist für viele Unternehmen eine scheinbar unmögliche Herausforderung.
Wie funktioniert die Extraktion von Metadaten bisher?
Gründe hierfür sind vor Allem die Art und Weise wie Redakteure, Journalisten, Rundfunkanstalten ihren Bestand an Mediendaten verwalten, welcher Grundlage für die Erstellung neuer Inhalte darstellt. Bilder und Videos liegen meist nur teilweise beschriftet oder überwiegend sogar komplett ohne Zusatzinformationen unauffindbar in unterschiedlichen Dateisystemen oder internen Ordnern.
Derzeit muss diese Zielgruppe ihre visuellen Daten manuell beschriften, um Erkenntnisse zu gewinnen, was ein sehr zeitaufwändiger, teurer und fehleranfälliger Prozess ist. Ein Mitarbeiter braucht etwa 24mal länger für die Analyse visueller Daten im Vergleich zu einem Recognition Service auf KI-Basis, wie dem von DeepVA. Diese eingesparte Zeit ist sehr wertvoll und kann für andere Aufgaben oder Herausforderungen genutzt werden.
Hat ein Content-Produzent beispielsweise eine Idee für neue Inhalte im Kopf, liegt ein großes Stück Arbeit vor ihm, bevor diese umgesetzt werden kann. Mit etwas Glück kann er anhand von 1-2 Stichworten passendes Material in dem verteilten Dateisystem finden, vorausgesetzt, eine solche Datei wurde beschriftet abgelegt. Realistischer ist jedoch, dass der Content-Produzent zahlreiche Bilder durchsuchen muss, bevor er brauchbares Material findet und selbst dann herrscht Unklarheit, ob nicht doch noch irgendwo ein besseres Bild existiert. Aufgrund von Zeitdruck wird jedoch auf eine weitere Suche verzichtet, worunter die Qualität und damit die Engagement Rate der Nutzer leidet.
Rundfunkanstalten sehen sich in einer noch komplexeren Situation. Die Anzahl der Zuschauer ist sehr viel größer und dementsprechend unterscheiden sich auch die Nutzerpräferenzen bezüglich der Medieninhalte und Endgeräte erheblich. Die daraus resultierende Diversität und der Umfang der Inhalte macht es noch schwieriger schnell benötigte Inhalte abzurufen.
Die Entwicklung der Technologie hat den Zugang zu Live- und On-Demand-Berichterstattung erleichtert. Das Publikum konsumiert Medien und Nachrichten nicht mehr nur über den Fernseher, [TV1] sondern über alle Geräte und Plattformen; und das mit einem nahtlosen On-Demand Zugang. Außerdem konsumieren sie die Medien in einer Vielzahl von Formaten.
Rundfunkanstalten sehen sich gezwungen, täglich kreativere und bessere Inhalte zu erzeugen, ohne zusätzliche Verschwendung von Ressourcen. Dies führt dazu, dass der Datenbestand kontinuierlich wächst und Mitarbeiter mit der manuellen Beschriftung und der Verwaltung ihrer Mediendaten nicht mehr hinterherkommen. Die Produktivität der unterschiedlichen Workflows nimmt rapide ab und somit auch die Qualität der veröffentlichten Inhalte.
Mit dem Einsatz digitaler Hilfsmittel kann die Effizienz und Qualität im Umgang mit Metadaten gesteigert werden und die Arbeitslast bereits verringert werden. Schon heute existiert eine Vielzahl von Tools wie Digital/Media Asset Management Systeme, die bspw. die Arbeit von Online-Redaktionen erleichtert und Journalisten entlasten bzw. die Abläufe für bspw. das Publishing vereinfachen. Zu den technologischen Entwicklungen, denen branchenübergreifend große Mehrwerte zuerkannt werden, gehört auch Künstliche Intelligenz (KI), die die Leistungsfähigkeit derartiger digitaler Tools nochmals deutlich erweitert.
KI wird in der Medienbranche zur Effizienzsteigerung eingesetzt
Der Hauptvorteil von KI ist die Fähigkeit, auch große Datenmengen innerhalb kurzer Zeit zu analysieren und daraus Handlungsempfehlungen abzuleiten. Sie handelt wie ein Mensch – nur dass ihre Entscheidungen streng faktenbasiert sind und auf einer Fülle von Informationen beruhen. Dabei kann sie sowohl auf externe (Social Media, News-Aggregatoren, Suchmaschinen etc.) als auch interne Datenquellen (bspw. Archiv oder Nutzerverhalten auf der Webseite) zugreifen.
Das Ergebnis des Einsatzes von Computer Vision Lösungen ist für viele Unternehmen mehr als vielversprechend. Die präzise Suche nach gewünschten Inhalten mit Vorschlägen für ähnlich geeignete Inhalte und das Navigieren durch große Datenmengen für die Erstellung neuer Inhalte und die Wiederverwendung alter Inhalte soll die Arbeit vieler Mitarbeiter erleichtern und sogar verbessern. Autoren können sich mehr auf den kreativen Part Ihrer Arbeit konzentrieren, Redakteure werden produktiver und Konsumenten können leichter für Sie interessante Inhalte finden.
Das Thema KI ist also allgegenwärtig und wird in Zukunft einen sehr hohen Stellenwert einnehmen.
Trotz des großen Potentials wird KI und Computer Vision dennoch nur von wenigen Medienunternehmen produktiv eingesetzt. Viele Unternehmen sind unvertraut auf diesem Gebiet, müssen aber nachziehen, um konkurrenzfähig zu bleiben.
Das Problem ist, dass viele Unternehmen eine so große Menge an diversen Daten besitzen, dass herkömmliche Recognition Services und Dataset-Management Tools nur einen Bruchteil davon erkennen und richtig verwalten können. Dadurch bleiben nach wie vor viele Inhalte im Archiv versteckt und bieten keinen Mehrwert. Die Lösung dieses Problems ist die manuelle Beschriftung der Daten durch Mitarbeiter, ein Prozess, der aufgrund der Datenmenge für Unternehmen zu teuer und zu aufwendig ist, der Einsatz von KI wird dementsprechend erstmal vertagt.
Wofür wird KI in Medienunternehmen konkret eingesetzt?
Für Medienunternehmen liegt das Potential von KI und Machine Learning wie für viele andere Branchen auch in den Daten, die sie generieren und verarbeiten. Einsatzmöglichkeiten reichen von einem besser durchsuchbaren Archiv über die Optimierung von Geschäftsprozessen bis hin zu einem personalisierten Nachrichten- Stream der Leser:innen und Nutzer:innen, Marktforschung und Nutzeranalysen.
Der Einsatz von KI in Medienunternehmen ermöglicht aber auch völlig neue Services, wie beispielsweise die automatische Verschlagwortung oder die Ableitung von Handlungen in Videos, wie es die Software von DeepVA ermöglicht. Mit Hilfe verschiedener KI-Tools, wie dem Dataset-Management, der automatisierten Trainingsdatenerstellung und somit der Möglichkeit eigene KI-Modelle aufzubauen, und der Indexierung von unbekannten Inhalten können Unternehmen den manuellen Aufwand eliminieren und das volle Potential des Archivs und deren Inhalte zu nutzen. All diese Tools können ganz intuitiv auf der AI-Plattform von DeepVA angewendet werden und ermöglichen einen schnellen und leichten Einstieg in die KI, ganz ohne Expertenwissen.
Künstliche Intelligenz wird für bahnbrechende Veränderungen in allen Branchen verantwortlich sein - auch in der Medienbranche.
Ralf Jansen
Software Architekt bei Vidispine – An Arvato Systems Brand
Warum sollten Medienunternehmen KI einsetzen?
Tools mit integrierter Künstlicher Intelligenz (KI) haben ein großes Potenzial die Arbeit in Medienhäusern zu verändern. Dabei werden gegenwärtig zwei Entwicklungspfade verfolgt: Zum einen können KIs einfache Redaktionsaufgaben übernehmen. Ein prominentes Beispiel ist die Anfertigung standardisierter Berichte von Fußballspielen im Amateurfußball.
Bis KI qualitativ hochwertige Berichte und Reportagen anfertigen kann, ist aber noch weitere Entwicklungsarbeit nötig. Ausgereift hingegen ist der Einsatz von KI für die Unterstützung der redaktionellen Arbeit – insbesondere im Online-Umfeld. KI kann Redaktionen von repetitiven Aufgaben entlasten und so Freiräume für die originäre journalistische Arbeit schaffen. KI-Tools können Redakteuren helfen, die neuen Anforderungen der digitalen Welt leichter zu bewältigen. Die redaktionellen Abläufe werden effizienter, die Resultate können automatisiert aufgewertet und nachverwertet werden.
Verlage, Medienhäuser und insbesondere Online-Redaktionen haben für den Einsatz von KIs außerdem einen entscheidenden Vorteil: Sie verfügen durch ihre Veröffentlichungen über große Mengen an- (digitalisierten) Informationen, die zum Training von KIs, also dem Aufbau eigener KI-Modelle, genutzt werden können. Der Vorteil bei einem KI-Einsatz: Eine separate, zusätzliche Verschlagwortung von Content ist nicht mehr nötig. Die KI analysiert vorhandene Texte und ordnet sie Topics und Begriffen zu. Das gilt nicht nur für Artikel, sondern auch für Inhalte, die auf Webseiten vorhanden sind.
Aus Erfahrung realisiert der Einsatz von KI in der Medienbranche deutliche Produktivitätsgewinne und Zeitersparnisse. Das bestätigt auch der JournalismAI Report: Er findet als Hauptgrund für den Einsatz künstlicher Intelligenz in der redaktionellen Arbeit eine Effizienzsteigerung. Die Erstellung von medialen Inhalten beschleunigt sich. KI kann den kompletten digitalen Publishing Prozess von der Themenfindung bis zur Distribution und Analyse unterstützen und nimmt Redaktionen einen großen Teil der Anforderungen bei der „technischen“ Optimierung des Artikels ab.
„Künstliche Intelligenz wird in allen Branchen für bahnbrechende Veränderungen verantwortlich sein – auch in der Medienbranche. In der Vergangenheit haben sich vor allem Unternehmen durchgesetzt, die den digitalen Wandel angenommen haben. Daher sollten Medienunternehmen besser heute als morgen auf neue Technologien setzen – und dabei mutig sein, etwas ausprobieren.“
Wenn es um Nachrichten geht, wollen die Zuschauer eine aktuelle Berichterstattung und werden einen Medienkanal für einen anderen verlassen, wenn die Berichte schneller eintreffen. Wenn es um Unterhaltung geht, wollen sie einfach zu bedienende Schnittstellen mit einer Fülle von Inhalten, aus denen sie auf Abruf wählen können. Netflix ist aufgrund seiner Benutzerfreundlichkeit in Verbindung mit seiner Bibliothek einzigartiger Inhalte führend, und Medienanbieter und Nachrichtenkanäle müssen schnell handeln und einfache Benutzererfahrungen bieten, um sich gegen die Konkurrenz durchzusetzen.
KI gegen Mensch?
Zukünftig geht es um die Frage: wird KI die Arbeit von Journalisten, Produzenten Archivaren überflüssig machen? Experten sind sich einig und beantworten diese Fragen mit nein. Algorithmen werden Aufgaben abnehmen, die Maschinen schneller und besser erledigen. Aber Algorithmen müssen entwickelt, gesteuert und geprüft werden. Die Zusammenarbeit von Mensch und Maschine ist in der Medienbranche die nächste große Aufgabe.
Die Gefahr, dass künstliche Intelligenz Medienschaffende ersetzen wird, sehen Experten nicht; es gibt bereits KI-Systeme, die Musik komponieren, Texte verfassen oder Bilder malen. Diese Systeme sind jedoch eher die Ausnahmen. Echte Kreativität ist eine Eigenschaft, die uns Menschen eigen ist. Die Maschine schlägt Menschen vor allem in der Verarbeitung und Aufbereitung von Daten. Die Maschine schlägt Menschen vor allem in der Verarbeitung und Aufbereitung von Daten.
Machine Learning und Kreativität sollten also nicht gegensätzlich betrachtet werden, am Besten gehen Kreativität und Data Science von Anfang an Hand in Hand. Erfolgreiches Produzieren von Content, Beiträgen und Filmen ist immer eine Kombination aus Kreativität und Wissen über die Daten.
Journalisten werden algorithmisch aufgerüstet und sind in der Lage, ihre menschlichen Fähigkeiten auf neue und effektivere Weise einzusetzen
Ralf Jansen
Software Architekt bei Vidispine – An Arvato Systems Brand