DeepVA changelog march 2025

Changelog März 2025: Audio-Verbesserung, Inhaltsmoderation und mehr Sprachen

Wir haben unsere Composite-AI-Plattform DeepVA aktualisiert und freuen uns, die neuesten Verbesserungen und zwei neue Funktionen vorzustellen. Dieses Update optimiert die Benutzerfreundlichkeit, erweitert die Sprachunterstützung und erhöht die Flexibilität sowie die Zuverlässigkeit der Plattform.

Deep Media Analyzer: Neue Funktionen & Verbesserungen

KI-gestützte Audio-Verbesserung durch AI-Coustics

Das Audio-Enhancement-Modul ist eine neue Erweiterung des Deep Media Analyzers, die die Qualität von Audioaufnahmen erheblich verbessert. Mithilfe von KI-gestützter Rauschreduzierung und Frequenzrekonstruktion wird die Sprachverständlichkeit optimiert und natürlicher gestaltet.

Dies ist besonders hilfreich für die Verarbeitung minderwertiger Audioquellen, die Reduzierung von Hintergrundgeräuschen und die Wiederherstellung eines ausgewogenen Klangbilds.

Das Modul bietet zwei spezialisierte Modellarchitekturen:

  • FINCH

    Fokus auf Rauschunterdrückung durch die Eliminierung von Hintergrundgeräuschen und die Reduzierung unerwünschter Audiostörungen. Ideal für Podcasts, Interviews und Feldaufnahmen, bei denen eine saubere Audioausgabe essenziell ist.

  • LARK

    Schwerpunkt auf Frequenzrekonstruktion und Verbesserung der Audioqualität durch die Wiederherstellung fehlender Frequenzen. Besonders geeignet für Musikremastering, Archivmaterial und die Verbesserung von Original-Tonspuren.

Die Integration des Services, von unserem Partner AI-Coustics entwickelt, zeigt die Stärke von Kooperationen zwischen Start-ups, Forschungseinrichtungen und unserem Entwicklerteam. Durch die Integration spezialisierter KI-Lösungen bringen wir modernste Technologien in Produktionsabläufe und unterstützen den Übergang von Forschung zu praxisnahen Anwendungen.

Zukünftig wird dieses Modul auch die Qualität von Transkriptionen verbessern, indem es schlecht verständliche Aufnahmen aufbereitet und somit genauere Speech-to-Text-Ergebnisse liefert.

Neue Funktion – Content Moderation

Das Content Moderation Modul im Deep Media Analyzer ermöglicht eine automatisierte Analyse und Bewertung von Videoinhalten durch Segmentierung einzelner Szenen und die Vergabe von Einstufungen basierend auf den ESRB Content Descriptors. Dieses KI-gestützte Feature bewertet visuelle Elemente eines Videos oder Bildes und kategorisiert sie in Hauptbewertungskategorien wie z.B. Gewalt, Nacktheit und Drogenkonsum sowie detailliertere Unterkategorien.

Diese Funktion eignet sich besonders zur Automatisierung von Altersfreigaben für große Inhaltsbibliotheken und zur Unterstützung menschlicher Gutachter. Sie hilft Broadcastern, Streaming-Plattformen und Medienarchiven, Richtlinienkonformität sicherzustellen und gleichzeitig Zeit und manuellen Aufwand zu reduzieren.

Zusätzlich verbessert dieses Modul die Konsistenz in der Inhaltsklassifizierung und kann in Automatisierungs-Workflows integriert werden.

Verbesserte Benutzeroberfläche

Es wurden viele kleine Verbesserungen hinsichtlich der Benutzerfreundlichkeit vorgenommen:

  • Die Zeitleisten Derstellung im Ergebnisfenstern wurden optimiert, um eine bessere Sichtbarkeit und Unterscheidbarkeit der einzelnen Ergebnisse zu gewährleisten.
  • Das Threat-Detection-Modul verfügt jetzt über eine vertikale Zeitleiste.
  • Eine Copy-ID-Funktion für Transkriptionen wurde hinzugefügt, um die Navigation und Referenzierung zu erleichtern.

Fehlerbehebungen: Mehr Stabilität und Konsistenz

  • Modellparameter-Fix: Ein Problem wurde behoben, bei dem Parameter beim erneuten Ausführen eines Jobs nicht korrekt wiederhergestellt wurden.

Deep Live Hub: Neue Funktionen & Verbesserungen

Mehr Sprachen

Unser Deep Live Hub bieten jetzt noch mehr Möglichkeiten und unterstützen zusätzlich fünf neue Sprachen: Persisch (fa), Irisch (ga), Hebräisch (he), Maltesisch (mt) und Kantonesisch (yue). Egal, ob Sie internationale Gespräche erleichtern oder Inhalte einem breiteren Publikum zugänglich machen möchten – mit dieser Erweiterung wird Sprachbarrieren noch effektiver überwunden.

Verbesserte Hilfe & Navigation

Der Live-Editor unterstützt nun Tastenkürzel, um die Live-Untertitelung schneller und intuitiver zu gestalten. Diese werden auch über die Infobox beim Hover über einen Button angezeigt. Folgende Hotkeys sind nun Nutzbar:

Funktion Hotkey
Erster Absatz
Alt + Pfeil nach oben
Zweiter Absatz
Alt + Pfeil nach links
Markierter Absatz
Shift
Nächster Absatz
Alt + Pfeil nach rechts
Letzter Absatz
Alt + Pfeil nach unten
Auto-scroll pausieren
Strg + Leertaste

Dies erleichtert die Bearbeitung längerer Transkriptionen mit weniger Mausinteraktion und hält den Fokus auf Tastatur und Text. Zusätzlich haben wir ein Hilfe-Symbol direkt in die Benutzeroberfläche integriert, das schnellen Zugriff auf Supportmaterialien bietet.

Fehlerbehebungen: Mehr Stabilität und Konsistenz

  1. SRT-Formatierung: Die Formatierung von SRT-Dateien wurde korrigiert, und SRT Dateien können jetzt manuell aus vergangenen Jobs gelöscht werden, zusätzlich zur bisherigen automatischen Löschung.
  2. Sprachenliste: Die Dropdown-Liste ist nun korrekt sortiert und enthält die neuen Sprachen.
  3. Live-Viewer-Verbesserungen: Das Problem der nicht löschbaren Live-Viewer-Einträge wurde behoben.
  4. Streaming-Zuverlässigkeit: Zeitzonendifferenzen in der Streaming-Job-Tabelle wurden korrigiert.
  5. Timer bug fix: Ein wiederkehrendes Problem, bei dem der Timer unerwartet zurückgesetzt wurde, wurde behoben.

In den kommenden Monaten bereiten wir neue KI-gestützte Workflows für Transkription, Exporterstellung und Metadatengenerierung vor, um Ihre Medienverarbeitung weiter zu optimieren.

Alle Updates des DeepVA Changelog gibt es hier: https://docs.deepva.com/changelog/

Teilen

Email
LinkedIn
Facebook
Twitter
Suche

Inhaltsübersicht

Tage :
Stunden :
Minuten :
Sekunden

Neueste KI-Nachrichten

Abonnieren Sie unseren Newsletter

Keine Sorge, unser Newsletter ist für wichtige Neuigkeiten reserviert, so dass wir nur hin und wieder ein paar Updates versenden. Kein Spam!

🚀 Erfolgsgeschichte: WELT TV setzt auf KI-gestützte Live-Untertitelung von Aiconix für barrierefreie Inhalte rund um die Uhr.
This is default text for notification bar