Bei DeepVA sind wir ständig bestrebt, unsere Software und Dienstleistungen zu verbessern, um unseren Nutzern das bestmögliche Erlebnis zu bieten. Wir freuen uns, die neuesten Updates und Verbesserungen, die im Update von Mai 2024 veröffentlicht wurden, zu teilen. Unsere jüngsten Änderungen umfassen eine Mischung aus neuen Funktionen, Verbesserungen und Korrekturen, die darauf abzielen, die Funktionalität und Benutzerzufriedenheit zu erhöhen.
Transkript-Editor
Unser wichtigstes Update ist der neue Transcript Editor, der die nahtlose Bearbeitung und Verwaltung von Transkripten aus der Speech Recognition des Deep Media Analyzer ermöglicht. Diese Funktion wurde entwickelt, um mehr Kontrolle und Flexibilität im Umgang mit der Speech-to-Text Ausgabe zu ermöglichen.
Der Transkripteditor wird über den neuen Button im Ergebnisfenster der Spracherkennung gestartet. Abschnitt für Abschnitt können die Passagen manuell entlang des Timecodes angepasst werden, gleichzeitig steht auf der rechten Seite ein Player zur Verfügung, um sich die Passagen im Zweifelsfall noch einmal anzuhören und mehrere Varianten des Textes zu erstellen. Um unter Zeitdruck eine bessere Hilfestellung zu geben, kann man sich unter “Word Confidence Coloring” Wort für Wort farblich anzeigen lassen, wie sicher sich das System bei welchen Wörtern ist. So kann man schneller erkennen, welche Wörter vielleicht noch einmal überprüft werden müssen.

Ist man mit der Bearbeitung fertig, kann man direkt aus dem Editor heraus den Export in gängige Formate starten – alles in einer Oberfläche. Die Funktion steht mit dem Updaten allen Usern in einer ersten Version zur Verfügung.
Aiconix Live
Und auch beim Deep Live Hub, ehemals aiconix Live, tut sich einiges:
Mit den Updates der letzten Wochen können wir nun eine Seamless Transcription ermöglichen, diese erlaubt uns bei wichtigen Systemupdates die Worker auszutauschen, ohne dass die Streams und damit die Transkription unterbrochen werden. Somit ist nicht nur eine nahtlose und unterbrechungsfreie Transkription und Übersetzung möglich, sondern das System wird in Zukunft auch deutlich flexibler in Bezug auf schnelle Änderungen oder Anpassungen während eines Streams werden.
Seit letzter Woche ist auch die neue Benutzeroberfläche online, die nicht nur eine bessere Kontrolle über die Stapelverarbeitung und die Live-Streams ermöglicht, sondern auch Thumbnails der laufenden und vergangenen Streams anzeigt.
Für die kommende Woche sind weitere Neuerungen im Bereich des Viewers und unseres eigenen Protokolls ATT geplant: Über beide Wege werden Partials in Quasi-Echtzeit verfügbar sein. Dies bedeutet, dass bereits erkannte Wörter in der Transkription sofort ausgeliefert werden. Es besteht dadurch aber auch die Möglichkeit diese durch potenzielle Korrekturen direkt zu ersetzten, um für die Mitlesenden noch schneller zu sein. Vorerst wird es die Partials aber nur für Transkriptionen geben – dazu bald mehr Details.
Auch der Deep Live Hub wird in den kommenden Monaten durch die steigende Zahl der Nutzer und deren Feedback zu den unterschiedlichsten Übertragungen und Live-Events, die produziert werden, stark in seiner Entwicklung profitieren.

Weitere Neuerungen
Indexierung der Sprecheridentifikation: Seit März umfasst unsere Speaker Identification Indexierungsfähigkeiten, die es Benutzern ermöglichen, die Stimme des Sprechers zu „fingerprinten“ und zu mittels einer Nummer zu indizieren. Dies wird es in Zukunft ermöglichen, auch Sprecher:innen zu clustern und im Nachgang rückwirkend zu labeln.
Abbruchfunktion für laufende Uploads – wir haben eine neue Funktion im Dialogfeld des Speicher-Uploaders hinzugefügt, die es den Benutzern ermöglicht, laufende Uploads abzubrechen. Diese Verbesserung zielt darauf ab, ein reibungsloseres und ansprechenderes Benutzererlebnis zu bieten.
Erweiterte Gesichtserkennungsfähigkeiten: Veröffentlichung des ‚celebrities v29‘ Modells für unser Gesichtserkennungs-Mining-Modul, welches insgesamt über 100 neue Identitäten umfasst und ebenfalls ab sofort nutzbar ist.
Wichtige Korrekturen & Bugfixes
UI- und Benutzbarkeitsverbesserungen: Wir haben verschiedene kleinere UI-Bugs in der Software behoben, unter anderem im Storage, auf der Indexierungsübersicht und bei den Datensatz Clustern.
Außerdem wurde ein Problem beim erneuten Ausführen von Jobs gelöst: Ab sofort werden beim erneuten Starten das korrekte Modell und Datensatz bereits vorausgewählt, eine kleine Verbesserung mit hohem Mehrwert für Prozesse.
Bereits im Februar wurde ein Fehler bei den Datensatzexporten behoben, der Kollisionen von Klassennamenordnern zur Folge hatte. Somit ist nun ist eine bessere Datenverwaltung gewährleistet.
Alle Updates des DeepVA Changelog gibt es hier: https://docs.deepva.com/changelog/