Open Source auf dem Vormarsch – wie wir uns mit DeepVA diesem Wandel stellen!

Generative KI und das Ende der Trainings­daten?

Künst­liche Intel­ligenz hat Einzug in viele Arbeits­be­reiche genommen, das ist mittler­weile fast jedem bewusst.  Auch wenn vielleicht noch nicht jeder direkte Erfah­rungen damit gemacht hat, so ist es zumindest in den Nachrichten und den Medien omnipräsent.

Gerade die viel erwähnten genera­tiven KI-Modelle, wie ChatGPT, Stable Diffusion oder Midjourney ermög­lichen es, kreative Leistungen, die bisher nur von hochqua­li­fi­zierten Fachkräften erbracht werden konnten, als Massenware herzu­stellen. Dies reicht von Stories, Berichten und anderen Textaus­gaben bis hin zu multi­mo­dalen Inhalten wie Bildern, Videos und Audio.  Immer mehr KI-Systeme verändern die Art und Weise, wie Inhalte produ­ziert, verbreitet, erlebt und auch vermarktet werden.

Doch woher stammen die Trainings­daten, um diese Modelle intel­ligent zu machen?

Was als leise Stimmen zum Jahres­wechsel begann, äußert sich nun in handfesten Forde­rungen: Das Verwenden von Texten, Bildern und Musik­stücken als Trainings­ma­terial soll in Zukunft vergütet werden. Jedes KI-System muss mit Daten trainiert werden. Oftmals sind dies jedoch Daten, deren Ursprung nicht geklärt ist oder deren Nutzung rechtlich gar nicht abgedeckt war – die KI als sogenannte Blackbox.

Nun fordern verschiedene Verbände von Kreativ­schaf­fenden, unter anderem die DJU, Verdi oder Fotogra­fen­ver­bände in einer gemein­samen Stellung­nahme mehr Trans­parenz und eine Vergütung für die Nutzung ihrer Werke als Trainings­daten.

Auch im EU AI Act wird ebenfalls mehr Trans­parenz gefordert werden, was die Trainings­daten betrifft und poten­ziell auch eine, wie auch immer geartete Vergütung. Ob es eher eine an die GEMA angelegte Pauschale ist, oder eine klassische pay-per-use steht bisher in keinem der Konzepte. Die Forderung ist jedoch klar: Kreative Arbeit muss auch als Basis für KI-Modelle in Zukunft vergütet werden.

Daten­si­cherheit und Qualität der Trainings­da­ten­sätze

Die Nutzung bestehender Inhalte für das Training von KI-Systemen wird grund­sätzlich von den Regelungen zum Text- und Data Mining im europäischen Urheber­recht erfasst und sind bislang noch zulässig, sofern die Rechtsinhaber*innen sich diese nicht vorent­halten hat (§ 44 b und § 60 d UrhG). Doch wie werden sich die Forde­rungen und die Lobby­arbeit auf die Geset­zes­no­velle auswirken?

Unsere Partner von Adobe meistern diese recht­liche Hürde, in dem sie die Trainings­daten aus ihrem eigenen Stockfoto Markt­platz beschaffen und lizen­zieren.

Der KI-Markt wird breiter und zunehmend diverser

Zusätzlich zur rasanten Entwicklung von genera­tiver KI erobern immer mehr hochent­wi­ckelte, leistungs­starke Open-Source KI-Modelle den Markt. 

Wachs­tums­ori­en­tierte Unter­nehmen setzen verstärkt auf Open Source Techno­logien, frei einsehbar und trans­parent. Es kommt regel­recht zu einer Renais­sance der Open Source Entwick­lungen.  

In einem Talk an der TU München hat OpenAI CEO Sam Altman dies auch bekräftigt. Viele einfache und risiko­freie Anwen­dungs­sze­narien von KI werden in Zukunft von Open Source Modellen erledigt werden. Spätestens seit Bekannt­werden eines internen Google Dokuments ist klar, dass proprietäre Techno­logien wie Google, Meta und Microsoft diese Bedrohung erkannt haben. Zwar sind ihre Modelle quali­tativ noch besser, aber sie sind nicht mehr alleine im Markt und Open Source entwi­ckelt sich rasant weiter und hat viele Vorteile. 

So haben Forscher*innen und Hobby­isten große Sprach­mo­delle entwi­ckelt, die mit den Angeboten von Open AI und Google konkur­rieren können. Diese sind teilweise besser skalierbar und ermög­lichen diese Sprach­mo­dellen auf weniger leistungs­fä­higen Systemen wie Laptops oder Smart­phones zu nutzen. 

Dies ermög­licht eine Demokra­ti­sierung von KI für ein breites Feld an Nutzer*innen. 

Sprach­mo­delle können so zum Beispiel innerhalb weniger Stunden auf Consumer-Hardware perso­na­li­siert werden. Neues Wissen kann so in Echtzeit einge­bunden und erprobt werden – Entwickler*innen können nun agil KI in ihre Software imple­men­tieren und erproben, ganz ohne Big-Tech. Teilen und Zusam­men­ar­beiten – so wird die Zukunft aussehen. 

Dennoch birgt Open Source auch Heraus­for­de­rungen. Sie müssen für den spezi­fi­schen, eigenen Anwen­dungsfall angepasst werden und sind mitunter schwie­riger imple­men­tierbar als proprietäre Software. Wartung und Service sind über die rege Open Source Community nicht gegeben, sind aber gerade in der Medien­pro­duktion elementar

Das Ziel ist eigentlich einfach: Zuver­lässige, gewartete und verwaltete KI-Systeme, die nach eigenen Spezi­fi­ka­tionen in unter­neh­mens­in­ternen Umgebungen und mit bestehender Software funktio­nieren. Dabei sollte es egal sein, ob man das KI-System im eigenen Rechen­zentrum, in einer Private Cloud oder in einer öffent­lichen Cloud­lösung betreibt.  

Auch in Puncto Daten­schutz wandelt sich der recht­liche Rahmen andauernd, weshalb viele Anwender auch immer noch auf On-Premise oder hybride Systeme setzen, gerade im Umgang mit perso­nen­be­zo­genen Daten. Die Daten bei sich zu wissen, im Zweifel komplett ohne Zugang zum Internet ist nicht nur für Behörden das Extraplus an Sicherheit und Daten­schutz. 

Zukunfts­si­chere KI-Plattform

Wie kann Unter­nehmen geholfen werden, ihr volles Potential durch KI auszu­schöpfen?

Mit DeepVA haben wir den einfachsten, sichersten und vertrau­ens­wür­digsten Zugang zu KI geschaffen. Wir haben nicht nur einfache KI-Modelle entwi­ckelt, sondern bieten ein ganzes KI-Betriebssystem, welches KI-Funktionen über die gesamten Workflows Ihres Unter­nehmens anbietet und verbindet. Die Plattform kann in Zukunft auch als verwaltete Umgebung für einen Plug & Play-Einsatz von Open Source Lösungen verstanden werden. Auf der sowohl eigene KI-Modelle trainiert, Trainings­daten aufgebaut werden können aber auch die Vorteile gemanagter Open Source Modelle genutzt werden können – ohne Verant­wortung für Imple­men­tierung, Wartung und Sicherheit.   

Im Gegensatz zu rein Cloud-basierten Modellen wird DeepVA auch für die On-Premise Nutzung angeboten und bietet somit einen hohen Schutz Ihrer unter­neh­mens­in­ternen Daten, da diese auf eigenen internen Servern gehostet werden und im Unter­nehmen bleiben können.

Die Trainings­daten stammen dabei nicht von irgendwo, sondern entstehen entlang Ihrer Medien­work­flows. Egal ob aus dem Archiv­ma­terial oder beim Ingestieren, unsere Tools helfen Ihnen einen Pool an Trainings­ma­te­rialien aufzu­bauen und zu verwalten, automa­tisch und betreut durch ihre Mitar­bei­te­rinnen. Durch die Rest-API können wir die gewonnen Daten­sätze dann an verschie­denen Stellen entlang der Wertschöpfung einsetzen: Bei der Werbe­plat­zierung, der Nachrich­ten­pro­duktion oder dem Erheben der Diver­sität Ihrer Inhalte.

Wir möchten, dass der produktive Zugang zu KI für Sie so einfach, sicher und trans­parent wie möglich erfolgt.

Teilen

Email
LinkedIn
Facebook
Twitter
Suche

Inhaltsübersicht

Tage :
Stunden :
Minuten :
Sekunden

Neueste KI-Nachrichten

Abonnieren Sie unseren Newsletter

Keine Sorge, unser Newsletter ist für wichtige Neuigkeiten reserviert, so dass wir nur hin und wieder ein paar Updates versenden. Kein Spam!