Eigene KI trainieren – ganz einfach mit DeepVA
Eine eigene KI zu trainieren muss kein komplizierter Prozess sein – versteckt hinter Programmierkenntnissen und Datenwissenschaft. Mit DeepVA können Sie Ihre KI selbst trainieren – ganz ohne Code, einfach mit dem Material, das Sie bereits zur Verfügung haben: Bilder, Videos, Audiodateien.

Maßgeschneiderte Gesichtserkennung
Gesichter erkennen, die für Sie relevant sind
Mit dem Face Training Modell von DeepVA können Sie problemlos Ihre eigene KI trainieren, um bestimmte Gesichter zuverlässig zu erkennen. Laden Sie Bilder oder Videomaterial hoch – DeepVA erkennt und verarbeitet die Gesichter automatisch und erstellt daraus ein maßgeschneidertes Modell.
-
Individuelle, auf Ihre Bedürfnisse zugeschnittene Gesichtserkennung
Trainieren Sie Ihre eigenen Gesichtserkennungsmodelle anhand unternehmensspezifischer Daten – von internen Stakeholdern bis hin zu Stammgästen oder lokalen Persönlichkeiten des öffentlichen Lebens.


Speaker Training
Sprechererkennung: Stimmen automatisch zuordnen
-
Individuelle Modelle zur Identifizierung von Rednern für Ihr Unternehmen
Wir erstellen individuelle Modelle zur Identifizierung von Rednern für Ihr Unternehmen.
Trainieren Sie KI-Modelle zur Erkennung bestimmter Stimmen – z. B. von Moderatoren, Führungskräften oder wiederkehrenden Gästen – mithilfe Ihrer eigenen Audio- oder Videoinhalte.
Eigene Landmarken trainieren
Landmarkenerkennung: Orte werden zu Metadaten
Orte erzählen Geschichten. Das Landmark Training Modell ermöglicht es Ihnen, eine eigene KI zu erstellen und zu trainieren, die bestimmte Gebäude, Orte oder Umgebungen automatisch erkennt – basierend auf Ihrem eigenen Material.
-
Individuelle Erkennung von Orten, Gebäuden und Umgebungen
Trainieren Sie KI-Modelle zur Erkennung unternehmensspezifischer, regionaler oder historisch relevanter Orientierungspunkte auf der Grundlage Ihrer eigenen Bild- oder Videodaten.


Datenqualität
Qualität von KI-Trainingsdaten prüfen
Mit DeepVA können Sie die Qualität Ihrer Trainingsdaten für Gesichts- und Landmarkenerkennung automatisch bewerten. Das System überprüft Faktoren wie Bildauflösung, relative Größe und Position relevanter Merkmale – und gibt Ihnen klares Feedback, um Ihr Datenset vor dem Training gezielt zu optimieren. So erzielen Sie genauere und verlässlichere Ergebnisse – ganz ohne Vorkenntnisse im Bereich Machine Learning.
Das Trainingsmodul für benutzerdefinierte KI-Modelle ist Teil unserer Deep Media Customizer-Anwendung. Jetzt entdecken:
Die Vorteile des individuellen KI-Modell-Trainings von DeepVA
Passen Sie die KI an Ihre Anforderungen an
Erstellen Sie individuelle Erkennungsmodelle für Gesichter, Stimmen und Landmarken – abgestimmt auf unternehmensspezifische, regionale oder inhaltliche Besonderheiten.
No-Code-Trainingsoberfläche für schnelle Einsatzbereitschaft
Erstellen Sie eigene KI-Modelle über eine No-Code-Oberfläche – auch mit sehr wenigen Trainingsdaten dank Few-Shot Learning.
Nahtlose Integration in bestehende Workflows
Die trainierten Modelle lassen sich sofort im DeepVA-Ökosystem einsetzen oder per API in Drittsysteme integrieren – für eine konsistente KI-Erkennung über alle Plattformen hinweg.
Typische Anwendungsfälle
Individuelles KI-Training
Erfolgsgeschichten aus der Praxis

rbb
Die Zusammenarbeit des rbb mit DeepVA hat den regionalen Rundfunk und die Archivierung durch den effizienten Einsatz von KI transformiert.

Heilbronn
DeepVA hilft dem Stadtarchiv Heilbronn dabei, große Fotomengen automatisiert zu verschlagworten und zu digitalisieren.

Bayerischer Rundfunk
Das Anlegen und Verwalten von Trainingsdaten für die Face Recognition mithilfe von KI erfordert einen hohen Zeit- und Kostenaufwand.
häufig gestellte Fragen
Haben Sie Fragen? Wir haben Antworten
Was ist KI-Modell-Training genau?
KI-Training ist der Prozess, bei dem einem künstlichen Intelligenzsystem beigebracht wird, bestimmte Muster zu erkennen – etwa Gesichter, Stimmen oder Landmarken – mithilfe von Beispielen, die Sie bereitstellen. Sie laden Ihre eigenen Medien (Bilder, Videoclips, Audio) hoch, markieren relevante Inhalte, und das System lernt, diese Muster künftig zu erkennen.
Aber das ist wichtig: Wenn Sie ein KI-Modell mit DeepVA trainieren, bleiben Ihre Daten bei Ihnen. Wir speichern, verwenden oder analysieren Ihre Trainingsdaten nicht – niemals. Die Modelle, die Sie trainieren, sind nur für Ihre Organisation bestimmt, und die gesamte Datenverarbeitung ist vollständig DSGVO-konform. Kein verstecktes Training auf Ihren Inhalten, keine unerwartete Nutzung, keine geteilten Datensätze im Hintergrund.
Das ist nicht nur intelligent – das ist sicher. Sie behalten die volle Kontrolle über Ihren Trainingsprozess, Ihre Medien und Ihre Ergebnisse. So erhalten Sie ein maßgeschneidertes KI-Modell, das wirklich zu Ihrer Welt passt – ganz ohne Abstriche bei Datenschutz oder Eigentum.
Wie viele Identitäten kann ich in einem einzigen Modell trainieren?
Sie können mehrere Tausend einzelne Identitäten trainieren – je nach Datensatz und gewünschter Genauigkeit. Das Modell lässt sich flexibel skalieren.
Wie viele Daten benötige ich, um ein Gesicht zu trainieren?
Schon 5–10 hochwertige Bilder pro Person können starke Ergebnisse liefern. Mehr Daten verbessern die Genauigkeit und Vertrauenswerte.
Welche Arten von Landmarken können trainiert werden und wie viele Trainingsdaten werden benötigt?
Alles, was visuell eindeutig und wiedererkennbar ist – einschließlich Gebäude, Denkmäler, Landschaften und sogar markenspezifische Umgebungen oder Innenräume.
In der Regel reichen 20–50 hochwertige Bilder pro Landmarke als solide Trainingsbasis. Mehr Bilder erhöhen die Genauigkeit und das Vertrauen der Erkennung.
Wie viele Sprecher kann ich in einem einzigen Modell trainieren?
Das System unterstützt Hunderte trainierter Sprecherprofile. Größere Deployments können je nach Infrastruktur und Performance-Anforderungen individuell angepasst werden.
Wie viele Audiodaten brauche ich, um eine Stimme zu trainieren? Wie viele Sprecher passen in ein einziges Modell?
Etwa 2–5 Minuten klar verständlicher Sprache pro Person reichen für ein zuverlässiges Training aus. Mehr Audiomaterial erhöht die Genauigkeit und das Vertrauen in die Ergebnisse.
Kann ich das Speaker Training mit Transkriptions-Tools kombinieren?
Ja. Das Modell lässt sich nahtlos in Transkriptions-Workflows integrieren und ordnet jede Sequenz dem richtigen Sprecher zu – für sauberere und besser strukturierte Ergebnisse. Mehr über die Audiotranskription erfahren Sie hier.
Kann ich ein bestehendes Modell aktualisieren oder neu trainieren?
Absolut. Sie können neue Gesichter hinzufügen, veraltete entfernen oder bestehende Modelle jederzeit anpassen – ganz ohne von vorne beginnen zu müssen.
Ist Ihr Service GDPR-konform?
Ja, DeepVA ist vollständig DSGVO-konform. Wir nehmen Datenschutz und Privatsphäre sehr ernst und stellen sicher, dass alle personenbezogenen Daten in Übereinstimmung mit den GDPR-Vorschriften verarbeitet werden.
Wie werden meine Daten verarbeitet? Lernt die KI aus meinen Daten?
Auf unserer KI-Plattform haben Sie die volle Kontrolle über Ihre Daten, um sicherzustellen, dass sie sicher und gesetzeskonform bleiben. Standardmäßig verwenden wir Ihre Daten nicht, um unsere Modelle zu trainieren. Sie haben jedoch die Möglichkeit, Modelle mit Ihren Daten zu trainieren, und in diesem Fall bleiben die Daten exklusiv für Ihre Organisation.
Welche Art von Daten speichern Sie?
Grundsätzlich verarbeiten wir Ihre Daten nur, soweit dies zur Erbringung unserer Dienstleistungen erforderlich ist. Sollte eine weitergehende Verarbeitung erforderlich sein, erfolgt diese nur in Übereinstimmung mit Ihren Anweisungen oder wenn dies gesetzlich vorgeschrieben ist. Beispielsweise können Daten übertragen oder verarbeitet werden, wenn dies zur Erfüllung von Serviceanforderungen erforderlich ist, immer in Übereinstimmung mit unseren Vereinbarungen.
Wenn Sie mehr darüber erfahren möchten, wie wir Ihre Daten verarbeiten und welche Sicherheitsvorkehrungen wir getroffen haben, lesen Sie bitte unsere Datenschutzbestimmungen.