| Table of Contents |
|---|
Versionierung
Excerpt Include Version und Versionierung Version und Versionierung nopanel true
| Change History | ||
|---|---|---|
|
Durchschnittliche Levenshtein-Distanz
Die Levenshtein-Distanz (auch Editierdistanz) zwischen zwei Zeichenketten ist die minimale Anzahl einfügender, löschender und ersetzender Operationen, um die erste Zeichenkette in die zweite umzuwandeln. Benannt ist die Distanz nach dem russischen Wissenschaftler Wladimir Lewenstein (engl. Levenshtein), der sie 1965 einführte (vgl. Levenshtein-Distanz auf Wikipedia). translate5 misst standardmäßig in jedem Workflow die durchschnittliche Levenshtein-Distanz. Die implementierte Messung entspricht den auf dieser Website dargestellten Formeln; der dort verfügbare Rechner kann zu Vergleichs- und Überprüfungszwecken verwendet werden.
Levenshtein-Distanz auf Segmentebene
In translate5 wird die Levenshtein-Distanz je Segment berechnet und als Durchschnittswert über alle gefilterten Segmente auf Aufgabenebene im Bereich „Aufgaben“ zur Abfrage zur Verfügung gestellt. Das heißt, Sie können jederzeit die durchschnittliche Levenshtein-Distanz einer einzigen oder auch aller Aufgaben, die der aktuellen Filterung entsprechen, abfragen. Oder auch über eine Untermenge der Segmente einer oder mehrerer Aufgaben, wenn die Aufgabenliste nach TQE-Wert, Match-Rate oder nach der/den für die Vorübersetzung verwendeten Sprachressource(n) oder -typen gefiltert wird. Und das für unterschiedliche Zeitpunkte und Zeitspannen innerhalb des Projekts.
translate5 misst die Levenshtein-Distanz:
- vor Beginn des Workflows,
- innerhalb eines Workflow-Schritts,
- seit Import/Vorübersetzung und
- nach Ende des Workflows.
Dabei werden die Segmentstände folgender Zeitpunkte/-spannen miteinander verglichen:
Messpunkte in translate5
- Initialstand – Inhalt des Zielsegments nach Import, also nach der Vorübersetzung (via Translation Memory, Maschinelle Übersetzung oder LLM. Die Vorübersetzung kann auch nachträglich, nach dem Import / im laufenden Projekt stattfinden), resp. bei bilingualen Ausgangsdateien (z.B. XLIFF) zum Zeitpunkt des Imports.
- in der Software, welche die bilingualen Dateien erzeugt. Zielsegmente können leer sein, wenn beim Import
- keine Vorübersetzung vorgenommen wurde. Dieser leere Stand gilt dann bei einer Humanübersetzung als Referenzgröße für die Messung seit Import/Vorübersetzung.
- Iststand – Änderungen seit Import/Vorübersetzung: Hier wird die Differenz berechnet zwischen dem Inhalt nach der Vorübersetzung, respektive dem Import (Initialstand), und der jüngsten Änderung des aktuellen Workflow-Schritts. Das gilt auch, wenn das Zielsegment nach dem Import leer war (da nicht vorübersetzt). In solchen Fällen entspricht dann die Levenshtein-Distanz nach der ersten Bearbeitung genau seiner Segmentlänge, da alle sich im Zielsegment befindlichen Zeichen bei der Humanübersetzung neu eingefügt wurden.
- Differenzstand – Änderungen zwischen zwei aufeinanderfolgenden Workflow-Schritten: Hier wird die Distanz gemessen zwischen der jüngsten Änderung im aktuellen Workflow-Schritt zur jüngsten Änderung des vorangehenden Schritts. Wenn es keinen vorangehenden Schritt gibt (z.B. beim allerersten Workflow-Schritt), entspricht der gemessene Wert demjenigen seit Import/Vorübersetzung.
| Vorübersetzungen durch das Translation Memory, MT oder LLM verursachen keine Statistikeinträge für die Levenshtein-Distanz. | |
Wenn die Segmente maschinell oder mit einem LLM vorübersetzt wurden, gilt die Vorübersetzung als erste Version , und der manuelle Übersetzungsschritt Übersetzungs- respektive Post-editing-Schritt wird bei der Levenshtein-Berechnung berücksichtigt. | |
Die Levenshtein-Distanz wird immer zu Beginn eines Workflow-Schritts für diesen Workflow-Schritt mit dem Wert 0 in die Statistik einbezogen (, damit zu jedem Zeitpunkt der Abfrage der zu diesem Zeitpunkt korrekte Durchschnitt ermittelt werden kann). Da Workflow-Schritte, deren Status noch auf „wartend“ steht, noch keine bearbeitbare bearbeitbaren Segmente beinhalten, wird für sie auch noch keine initiale Levenshtein-Distanz von 0 gesetzt und sie werden auch in den Statistiken noch nicht berücksichtigt. | |
Für Segmente, die nach dem Import leer stehen, für die aber interne 100%-Fuzzy-Matches vorhanden sind (, die aufgrund der Vorübersetzungsrate nicht automatisch ins Zielsegment übernommen wurden), wird nach Übernahme des internen 100%-Fuzzy-Matches die Levenshtein-Distanz des jeweiligen übernommenen Master-Segments gesetzt. | |
Segmente mit dem Status „Entwurf“ fließen normal in die Statistiken mit ein. |
Berechnung und Gewichtung
Die durchschnittliche Levenshtein-Distanz versteht sich immer als nach Segmentzahl gewichteter Mittelwert, auch wenn die Segmente von mehr als einer Aufgabe in die Berechnung miteinfließen. Hierzu ein Beispiel zur Veranschaulichung:
| Aufgabe A | Levenshtein-Distanz | |
|---|---|---|
| Segment 1 | 4 | |
| Segment 2 | 3 | |
| Segment 3 | 2 | |
| Durchschnittliche Levenshtein-Distanz Aufgabe A: | 9 / 3 = 3 | |
| Aufgabe B | Levenshtein-Distanz | |
|---|---|---|
| Segment 1 | 6 | |
| Segment 2 | 4 | |
| Segment 3 | 2 | |
| Segment 4 | 4 | |
| Durchschnittliche Levenshtein-Distanz Aufgabe B: | 16 / 4 = 4 | |
Die durchschnittliche Levenshtein-Distanz über Aufgabe A und Aufgabe B berechnet sich wie folgt:
4 + 3 + 2 + 6 + 4 + 2 + 4 = 25
25 / 7 = 3,5714
Es wird also die Summe aller Levenshtein-Distanzen gebildet, um diese danach durch die kumulierte Anzahl aller Segmente zu teilen.
| Dauerhaft gesperrte Segmente fließen nie in die Statistik mit ein, während gesperrte Segmente nach/vor Sperrung einfließen können. Auch Segmente ohne Übersetzung/Bearbeitung fließen in die Statistik mit ein. |
Messung der Zeichenänderungen innerhalb der Segmente
Zur Veranschaulichung der Auswertungen, respektive, wie die Levenshtein-Distanz gemessen wird, wird der nebenstehende Text bestehend aus vier Segmenten verwendet:
Fit for fun: Klein, klein, smart und sofort einsatzbereit.
Fit for fun passt in jede Tasche, trainiert überall.
Mehr Bewegung im Alltag, ganz ohne Aufwand.
Fit for fun ist dein schneller Boost für Kraft und Energie.
Statistiktypen
Die nachfolgende Grafik visualisiert die unterschiedlichen Zeitpunkte/-spannen, für welche die Levenshtein-Distanz gemessen wird.
Die Farbmarkierung der Zellen in der Grafik oben werden in der untenstehenden Tabelle wieder aufgenommen, in der die verschiedenen Statistiken mit Beispiel erläutert werden:
| Zeitpunkt/Zeitspanne | Erläuterung | Beispiel (ohne Filter gesetzt) | Beispieltext nach Bearbeitung | ||||
|---|---|---|---|---|---|---|---|
vor Beginn des Workflows
Anchor |
| Zeigt die durchschnittliche Levenshtein-Distanz, die aufgrund von Änderungen zustande kam, die vor Beginn des Workflows angebracht wurden, z.B. wenn |
die Projektmanager |
/innen vor der Zuweisung |
der Benutzer/innen Änderungen an den Segmenten |
vornehmen. Der Status „Aktueller Workflow-Schritt“ steht dabei auf „kein Workflow“. Hier wird der Zustand „vor Beginn des Workflows“, sprich noch außerhalb jeglicher Workflow-Schritte, untersucht. Konkret werden also die Segmentinhalte verglichen nach dem Aufgabenimport und vor dem Beginn des Workflows. | Der |
/die Projektmanager |
/in ändert, |
noch vor der Benutzerzuweisungen, nach dem Import mit Vorübersetzung an drei Stellen den Produktnamen „Fit for fun“ zu „Fit4fun“. → 4 Zeichen gelöscht, 1 Zeichen geändert. Levenshtein-Distanz = 3 x 5 = 15; Durchschnittliche Levenshtein-Distanz vor Beginn des Workflows = 3,75 | Fit4fun |
, klein, smart und sofort einsatzbereit. Fit4fun passt in jede Tasche, trainiert überall. Mehr Bewegung im Alltag, ganz ohne Aufwand. Fit4fun ist dein schneller Boost für Kraft und Energie. | ||||||||
innerhalb eines Workflow-Schritts
| Zeigt die durchschnittliche Levenshtein-Distanz innerhalb eines Workflow-Schritts zwischen den letzten Änderungen im vorangehenden Workflow-Schritt und der Version vor der abschließenden Speicherung des aktuellen Workflow-Schritts, also der allerletzten Bearbeitung, bevor der Workflow-Schritt abgeschlossen wurde. | Der |
/die Übersetzer |
/in post-editiert eine Stelle. → 11 Zeichen hinzugefügt, 1 Zeichen geändert Levenshtein-Distanz = 12 Durchschnittliche Levenshtein-Distanz innerhalb des Workflow-Schritts „Übersetzen“ = 3 | Fit4fun |
, klein, smart und sofort einsatzbereit. Fit4fun passt in jede Tasche, damit trainieren Sie überall. Mehr Bewegung im Alltag, ganz ohne Aufwand. Fit4fun ist dein schneller Boost für Kraft und Energie. | |||||
| |||||
| ||||||
| ||||||||
seit Import/Vorübersetzung
| ||||||||
|
|
|
Zeigt die durchschnittliche Levenshtein-Distanz seit Import/Vorübersetzung bis zur neuesten vorhandenen Bearbeitung. | Der |
/die |
Lektor/in ändert die Formalität des Textes. → |
7 Zeichen geändert, 1 Zeichen eingefügt, 1 Zeichen gelöscht Levenshtein-Distanz Lektorat = |
9 Levenshtein-Distanz Übersetzung = 12 Levenshtein-Distanz Projektmanager/in (vor Beginn des Workflows): 15 Total seit Import/Vorübersetzung: |
29 Änderungen Durchschnittliche Levenshtein-Distanz seit Import/Vorübersetzung = |
7, |
25 | Fit4fun |
, klein, smart und sofort einsatzbereit. Fit4fun passt in jede Tasche, damit trainierst du überall. Mehr Bewegung im Alltag, ganz ohne Aufwand. Fit4fun ist Ihr schneller Boost für Kraft und Energie. | |||||||||||
| |||||||||||
| ||||||||
| ||||
| ||||
| ||||
| |||||||
nach Ende des Workflows
| Zeigt die durchschnittliche Levenshtein-Distanz der Änderungen, die ein | ||||||
/e Projektmanager |
/in nach Abschluss des Workflows („Aktueller Workflow-Schritt“ steht auf „Workflow abgeschlossen“) noch angebracht hat. Analog zu „innerhalb eines Workflow-Schritts“ wird hier der Stand nach der letzten Bearbeitung eines Segments „nach Ende des Workflows“ verglichen mit dem jüngsten Stand des allerletzten Workflow-Schritts. | Der |
/die Projektmanager |
/in ergänzt, auf Wunsch des |
/der Kund |
/in, nach Abschluss des Workflows; also nachdem der |
/die Lektor |
/in geliefert hat, den Produktnamen um „Go“. → 6 Zeichen hinzugefügt Levenshtein-Distanz = 6 Durchschnittliche Levenshtein-Distanz nach Ende des Workflows = 1,5 | Fit4funGo: Klein, smart und sofort einsatzbereit. Fit4funGo passt in jede Tasche, damit trainierst du überall. Mehr Bewegung im Alltag, ganz ohne Aufwand. Fit4funGo ist Ihr schneller Boost für Kraft und Energie. |
Inline-Tags werden bei der Berechnung der Levenshtein-Distanz wie Zeichen behandelt:
MQM-Tags fließen nicht in die Berechnung mit ein. | |
Durchschnittliche Levenshtein-Distanz = 0 Bringt ein |
/e Benutzer |
/in Änderungen an, die genau die Änderungen eines |
/r vorangehenden Benutzers |
/in rückgängig macht, hebt das die Levenshtein-Distanz für das/die betroffenen Segmente auf, respektive sie steht auf |
0. Beispiel: Fit4funGo: Klein, smart und sofort einsatzbereit. Stand nach Übersetzung: Fit4funGo: Klein, smart und stets sofort einsatzbereit. → Levenshtein-Distanz innerhalb Workflow-Schritt, Filter auf „Übersetzung“ = 6 (6 Hinzufügungen) Stand nach Lektorat: Fit4funGo: Klein, smart und sofort einsatzbereit. → Levenshtein-Distanz innerhalb Workflow-Schritt, Filter auf „Lektorat“ = 6 (6 Löschungen) Levenshtein-Distanz seit Import/Vorübersetzung: 0 (kein Filter oder Filter auf Übersetzung und Lektorat) | |
| Wenn Sie nur diejenigen Segmente untersuchen möchten, die auch vorübersetzt wurden, die Zielsegmente also nicht leer waren nach dem Import und vor der ersten Bearbeitung, kann der Matchrate-Filter eingesetzt werden. |
Statistiken je Benutzer
*/in
Die Zuordnung der Levenshtein-Distanz zu einem*r Benutzer*in den Benutzer/innen funktioniert so, dass für alle Benutzer*/innen die Workflowrolle Workflow-Rolle ihres jeweiligen Jobs genommen und für diesen Workflow-Schritt je Benutzer*/in die Levenshtein-Distanz eingetragen wird. Der*/die für die Änderungen in einem Segment verantwortliche Benutzer*in Verantwortliche ergibt sich daraus, wer das Segment innerhalb des Workflow-Schritts als letzter gespeichert hat.
Benutzerfilter
Wird für die Auswertung der Levenshtein-Distanz im erweiterten Filter der Aufgabenübersicht der Benutzerfilter gesetzt, gilt die Berechnung für jene Aufgabensegmente, denen der*/die Benutzer*/in zugewiesen ist und in denen er*/sie innerhalb eines Workflow-Schritts als letzte*/r das Segment gespeichert hat. Dabei wird die Levenshtein-Distanz immer im Vergleich zum Zustand beim Start des Workflow-Schritts berechnet, unabhängig davon, welche der Änderungen der*/die Benutzer*/in selbst angebracht hat. Der Grund dafür, dass alle Änderungen innerhalb eines Workflow-Schritts dem*der als letzte*n aktive*/der zuletzt aktive/n Benutzer*/in angerechnet werden, ist, dass der*die letzte Benutzer*indiejenige Person, der*/die ein Segment innerhalb eines Workflow-Schritts speichert, damit die Verantwortung für den finalen Segmentzustand übernimmt.
Messung bei Wiederholungen
Die Levenshtein-Distanz fließt für jede Wiederholung so ein, wie sie beim Mastersegment berechnet wurde.
Umgang mit Wiederholungen, die via Wiederholungseditor bearbeitet werden
Je nach Einstellungen im Wiederholungseditorkönnen können Wiederholungen innerhalb einer Aufgabe automatisch oder halbautomatisch mit Entscheidung durch die Benutzer*/innen übernommen werden. Die Nachbearbeitungszeit Levenshtein-Distanz wird für die unterschiedlichen Einstellungsmöglichkeiten wie folgt gemessen:
- Bearbeitung des Mastersegments, also desjenigen Segments, dessen Inhalt nach Bestätigung in die zu 100% wiederholenden Segmente übernommen wird: Normale normale Messung der Levenshtein-Distanz.
- Übernahme eines sich zu 100% wiederholenden Segmentinhalts mit Entscheidung durch den*/die Benutzer*/in (Einstellung „Bei jeder Wiederholung einzeln entscheiden“): Levenshtein-Distanz des Mastersegments wird auf die auto-propagierten Segmente übertragen.
- Automatische Übernahme der sich zu 100% wiederholenden Segmente, ohne Entscheidung durch den*/die Benutzer*/in (Einstellung „Immer automatisch setzen“): Levenshtein-Distanz des Mastersegments wird auf die auto-propagierten Segmente übertragen.
- Keine Auto-Propagierung bei Einstellung „Nie automatisch setzen“: Normale Messung der Levenshtein-Distanz bei manueller Bearbeitung der sich wiederholenden Segmente.
Durchschnittliche Nachbearbeitungszeit
In translate5 wird für jedes Segment die Bearbeitungszeit gemessen und als Durchschnittswert über alle gefilterten Segmente auf Aufgabenebene zur Abfrage zur Verfügung gestellt. Das heißt, Sie können jederzeit die durchschnittliche Nachbearbeitungszeit einer einzigen oder auch aller Aufgaben, die der aktuellen Filterung entsprechen, abfragen. Oder auch über eine Untermenge der Segmente einer oder mehrerer Aufgaben, wenn die Aufgabenliste nach TQE-Wert, Match-Rate oder nach der/den für die Vorübersetzung verwendeten Sprachressource(n) oder -typen gefiltert wird. Und das für unterschiedliche Zeitpunkte und Zeitspannen innerhalb des Projekts.
Berechnung und Gewichtung
Die durchschnittliche Nachbearbeitungszeit ist diejenige Zeit, während der ein*/e oder mehrere Benutzer*/innen ein Segment in translate5 bearbeitet/n, geteilt durch alle bearbeitbaren Segmente. Die Bearbeitungen können von Benutzer*/innen innerhalb des Workflow-Schritts durchgeführt werden, aber auch von einem*r Projektmanager*in, der*den Projektmanager/innen, die zwischendurch Änderungen an den Segmenten vornimmtvornehmen.
Die Zeitmessung startet beim Öffnen eines Segments zur Bearbeitung und endet, wenn das Segment wieder gespeichert wird. Wird das Segment über ESC oder verlassen, also ohne Änderungen geschlossen, wird keine Zeitmessung vermerkt.
Dauerhaft gesperrte Segmente fließen nie in die Statistik mit ein, während gesperrte Segmente nach/vor Sperrung einfließen |
. Auch Segmente ohne Übersetzung/Bearbeitung fließen in die Statistik mit ein. | |
Wenn auch reine Lesezeit eines Segments gemessen werden soll, während der am Segmentinhalt keine Änderungen vorgenommen werden, müssen die Benutzer |
/innen so instruiert werden, dass sie jedes Segment zur Bearbeitung öffnen und mit der Tastenkombination STRG + ENTER, oder mit zum nächsten Segment springen. Dadurch wird das nächste Segment geöffnet und das aktuelle Segment inhaltlich unverändert mit neuem Status gespeichert. Auf diese Weise können der Statuswechsel wie auch die Bearbeitungszeit des jeweiligen Segments gemessen werden. | |
Bleibt ein Segment offen, ohne dass daran gearbeitet, es also weder gelesen noch editiert wird (z.B. weil sich die betreffende Person einen Kaffee kochen gegangen ist), wird die Zeit dennoch weiter gemessen. translate5 geht dann davon aus, dass es sich auch um Recherchezeit handeln könnte und |
notiert sie deshalb mit. | |
Wenn |
eine Aufgabe nur |
durchgelesen und keine Änderungen |
angebracht wird, also auch keine Segmente zur Bearbeitung |
geöffnet werden, wird keine Nachbearbeitungszeit erfasst, also bleibt jene Statistik für |
die entsprechenden Benutzer/innen auf 0. |
translate5 misst die Nachbearbeitungszeit:
- vor Beginn des Workflows,
- innerhalb eines Workflow-Schritts,
- seit Import/Vorübersetzungund und
- nach Ende des Workflows.
| Zeitpunkt/Zeitspanne | Erläuterung | ||||||
|---|---|---|---|---|---|---|---|
vor Beginn des Workflows | Zeigt die Zeit, die für Änderungen vor Beginn des Workflows aufgewendet wurden, z.B. wenn |
| die Projektmanager |
| /innen in |
| der Zeitspanne zwischen dem Aufgabenimport und der Workflowzuweisung |
| an die Benutzer/innen Änderungen an den Segmenten |
| vornehmen. | |||||||
innerhalb eines Workflow-Schritts
| Zeigt die durchschnittliche Nachbearbeitungszeit innerhalb eines Workflow-Schritts, also der Zeit während der das Segment bearbeitet wurde, solange der Status des jeweiligen Workflow-Schritts auf „offen“ steht. | ||||||
seit Import/Vorübersetzung
|
|
|
|
|
|
| Zeigt die durchschnittliche Nachbearbeitungszeit vom Aufgabenimport beginnend, |
bis zum aktuellen Zustand (das enthält bei abgeschlossenen Workflows auch Änderungen nach dem Ende des Workflows).
| |||||||
nach Ende des Workflows
| Zeigt die durchschnittliche Nachbearbeitungszeit für Änderungen, die die |
| Projektmanager/innen nach Abschluss des Workflows (Workflow-Status steht auf „Workflow abgeschlossen“) noch durchgeführt |
| haben. |
Umgang mit Wiederholungen, die via Wiederholungseditor bearbeitet werden
Je nach Einstellungen im Wiederholungseditor können Wiederholungen innerhalb einer Aufgabe automatisch oder halbautomatisch mit Entscheidung durch den*/die Benutzer*/in übernommen werden. Die Nachbearbeitungszeit wird für die unterschiedlichen Einstellungsmöglichkeiten wie folgt gemessen:
- Bearbeitung des Mastersegments, also desjenigen Segments, dessen Inhalt nach Bestätigung in die zu 100% wiederholenden Segmente übernommen wird: Normale Zeitmessung, solange das Segment zur Bearbeitung geöffnet ist.
- Übernahme eines sich zu 100% wiederholenden Segmentinhalts mit Entscheidung durch den*/die Benutzer*/in (Einstellung „Bei jeder Wiederholung einzeln entscheiden“): Die im Wiederholungseditor verbrachte Zeit geteilt durch die Anzahl der sich wiederholenden Segmente.
- Automatische Übernahme der sich zu 100% wiederholenden Segmente, ohne Entscheidung durch den*/die Benutzer*/in (Einstellung „Immer automatisch setzen“): Nachbearbeitungszeit für diese Segmente = 0.
- Keine Auto-Propagierung bei Einstellung „Nie automatisch setzen“: Normale Messung der Nachbearbeitungszeit bei manueller Bearbeitung der sich wiederholenden Segmente.
Anwendbare Filter
| Anchor | ||||
|---|---|---|---|---|
|
Die Levenshtein-Distanz sowie und Nachbearbeitungszeit können für diverse Filterszenarien abgefragt werden. Dabei kann mit den Spaltenfiltern (einer oder mehrere miteinander kombiniert), aber auch mit dem erweiterten Filter (ebenfalls zusätzlich mit Spaltenfiltern kombinierbar) eine umfangreiche Anzahl an Szenarien dargestellt werden. Je nachdem, für welchen Zeitpunkt oder für welche Zeitspanne eine Auswertung angezeigt werden soll, sind gewisse Filtermöglichkeiten nicht zulässig, respektive liefern keine Resultate, da sie konzeptionell keinen Sinn ergeben (z.B. Filterung auf einen Workflow-Schritt-Typ für eine Messung eine Messung seit Import/Vorübersetzung).
Die nachfolgende Matrix zeigt, welche Filteroptionen des erweiterten Filters und der Spaltenfilter je Auswertungstyp verwendet werden können:
Erweiterter Filter
Spaltenfilter
| Das Setzen von Häkchen in der Checkbox-Spalte der Aufgabenliste hat keinen Einfluss auf die Filterung. | |
Bei der Filterung nach dem*/der Projektmanager*/in der Aufgabe beziehen sich die Werte auf alle Aufgaben, für die der*/die gefilterte Benutzer*/in als PM zuständig ist. Also nicht diejenigen, in denen der*/die gefilterte PM einen Job zugewiesen hat oder Segmente editiert hat. Analog verhält es sich bei den Spalten „Aktueller Workflow-Schritt“ und „Status“ (also Status der Aufgabe). | |
Wenn in der Aufgabenliste kein Benutzerfilter gesetzt ist, wird die Nachbearbeitungszeit, respektive die Levenshtein-Distanz eines Segments berechnet, indem alle Bearbeitungszeiten aller Benutzer/innen innerhalb eines Workflow-Schritts einschließlich der PM-Bearbeitungen addiert werden. Wurde für den/die Workflow-Schritt(e) eine Filterung festgelegt, werden nur die Nachbearbeitungszeiten, respektive Levenshtein-Distanzen innerhalb des/der gefilterten Workflow-Schritt(e)s berücksichtigt. Sie werden aber trotzdem für alle Workflow-Schritte addiert für die Berechnung „seit Import/Vorübersetzung“. Und für die Berechnung „innerhalb eines Workflow-Schritts“ werden die Zeiten innerhalb eines Workflow-Schritts addiert, der Durchschnitt für alle Segmente innerhalb des Workflow-Schritts berechnet und dann über alle Workflow-Schritte in der Filterung hinweg wiederum der Durchschnitt pro Workflow-Schritt berechnet Ein Filter auf der Spalte „Aktueller Workflow-Schritt“ entspricht nicht der Filteroption „Workflow-Schritt“ im erweiterten Filter, sondern zeigt lediglich diejenigen Aufgaben, in denen dieser Workflow-Schritt aktiv ist. Dahingegen holt die Filteroption „Workflow-Schritte“ im erweiterten Filter alle im Dropdown ausgewählten Workflow-Schritte, die der Auswahl (und einer allfälligen zusätzlichen Filterung) entsprechen. Ein Beispiel zur Veranschaulichung: Es gibt 5 Aufgaben, allesamt mit dem Standard-Workflow Übersetzung → Lektorat. Zwei der Aufgaben sind bereits abgeschlossen; in zwei der anderen Aufgaben ist aktuell der Workflow-Schritt „Übersetzung“ offen, in der fünften Aufgabe ist der Workflow-Schritt „Lektorat“ offen. Wird jetzt im Spaltenfilter auf „Aktueller Workflow-Schritt“ = Übersetzung gefiltert, erscheinen nur die zwei Aufgaben, bei denen der Status des Workflow-Schritts „Übersetzung“ auf „offen“ steht in den Filterresultaten. Wird hingegen im erweiterten Filter unter „Workflow-Schritt“ die Option „Übersetzung“ gewählt, erscheinen alle fünf Aufgaben in den Filterresultaten, da sie alle einen Schritt „Übersetzung“ beinhalten. | |
Ein Filter auf der Spalte „Status der Aufgabe“ „Aktueller Workflow-Schritt“ entspricht nicht der Filteroption „Workflow-Status“ Schritt“ im erweiterten Filter, sondern zeigt lediglich diejenigen Aufgaben, die aktuell diesen Status zeigen. | |
Achtung: Auch gelöschte Jobzuweisungen werden in den Statistiken berücksichtigt. Wird beispielsweise einer Koordinatorengruppe eine Kundenzuweisung entfernt, werden alle Jobs der Gruppe für diesen Kunden entfernt. Dann fehlt den betreffenden Aufgaben der Übersetzungsschritt, der entsprechend auch über die Filterung nicht auswählbar ist. In der Statistik für die Filterung wird er allerdings miteinbezogen. |
Verhalten bei inkonsistenten Workflows
Kommt es aufgrund von manuellen Statusanpassungen durch den*die PM zu einem inkonsistenten Workflow, bei dem beispielsweise ein Übersetzungsschritt nach dem Lektorat-Schritt wieder geöffnet wurde, werden Änderungen und Nachbearbeitungszeit dennoch immer demjenigen Workflow-Schritt zugerechnet, zu dem der Job gehört, der dem*die editierende Benutzer*in zugewiesen ist.
So werden jegliche Änderungen, die ein*e Benutzer*in anbringt, respektive die Zeit, die der*die Benutzer*in dafür aufwendet, dem*der der Job „Übersetzung“ zugewiesen ist, immer dem Workflow-Schritt Übersetzung angerechnet, selbst wenn das Editieren erst im nachträglich wieder geöffneten Übersetzungsjob stattfindet.
Auch wenn ein*e PM ohne zugewiesenen Job während des laufenden Workflows Änderungen anbringt, werden diese Änderungen und die entsprechende Bearbeitungszeit dem aktuell für die Aufgabe registrierten Workflow-Schritt angerechnet.
in denen dieser Workflow-Schritt aktiv ist. Dahingegen holt die Filteroption „Workflow-Schritte“ im erweiterten Filter alle im Dropdown ausgewählten Workflow-Schritte, die der Auswahl (und einer allfälligen zusätzlichen Filterung) entsprechen. Ein Beispiel zur Veranschaulichung: Es gibt 5 Aufgaben, allesamt mit dem Standard-Workflow Übersetzung → Lektorat. Zwei der Aufgaben sind bereits abgeschlossen; in zwei der anderen Aufgaben ist aktuell der Workflow-Schritt „Übersetzung“ offen, in der fünften Aufgabe ist der Workflow-Schritt „Lektorat“ offen. Wird jetzt im Spaltenfilter auf „Aktueller Workflow-Schritt“ = Übersetzung gefiltert, erscheinen nur die zwei Aufgaben, bei denen der Status des Workflow-Schritts „Übersetzung“ auf „offen“ steht in den Filterresultaten. Wird hingegen im erweiterten Filter unter „Workflow-Schritt“ die Option „Übersetzung“ gewählt, erscheinen alle fünf Aufgaben in den Filterresultaten, da sie alle einen Schritt „Übersetzung“ beinhalten. | |
Ein Filter auf der Spalte „Status der Aufgabe“ entspricht nicht der Filteroption „Workflow-Status“ im erweiterten Filter, sondern zeigt lediglich diejenigen Aufgaben, die aktuell diesen Status zeigen. | |
Achtung: Auch gelöschte Jobzuweisungen werden in den Statistiken berücksichtigt. Wird beispielsweise einer Koordinatorengruppe eine Kundenzuweisung entfernt, werden alle Jobs der Gruppe für diesen Kunden entfernt. Dann fehlt den betreffenden Aufgaben der Übersetzungsschritt, der entsprechend auch über die Filterung nicht auswählbar ist. In der Statistik für die Filterung wird er allerdings miteinbezogen. |
Verhalten bei inkonsistenten Workflows
Kommt es aufgrund von manuellen Statusanpassungen durch den/die PM zu einem inkonsistenten Workflow, bei dem beispielsweise ein Übersetzungsschritt nach dem Lektorat-Schritt wieder geöffnet wurde, werden Änderungen und Nachbearbeitungszeit dennoch immer demjenigen Workflow-Schritt zugerechnet, zu dem der Job gehört, der dem/der editierenden Benutzer/in zugewiesen ist.
So werden jegliche Änderungen, die ein/e Benutzer/in anbringt, respektive die Zeit, die der/die Benutzer/in dafür aufwendet, dem/der der Job „Übersetzung“ zugewiesen ist, immer dem Workflow-Schritt Übersetzung angerechnet, selbst wenn das Editieren erst im nachträglich wieder geöffneten Übersetzungsjob stattfindet.
Auch wenn ein/e PM ohne zugewiesenen Job während des laufenden Workflows Änderungen anbringt, werden diese Änderungen und die entsprechende Bearbeitungszeit dem aktuell für die Aufgabe registrierten Workflow-Schritt angerechnet.
| Aktuell kann ein/e PM, dem/der ein Workflow-Schritt zugewiesen ist, nur editieren, wenn der Status des Jobs, dem er/sie zugewiesen ist, auf „offen“ steht. Künftig wird auch ein/e solche/r PM jederzeit während des Workflows Jobs bearbeiten können, egal, ob er/sie dafür zugewiesen ist oder nicht. |
Auswertungen aufrufen
- Navigieren Sie in die Aufgabenliste.
- Setzen Sie den gewünschten Filter, damit Ihnen genau die auf diejenigen Projekte passende Auswertung angezeigt wird, die Sie interessiert.
Das kann ein Spaltenfilter sein, ein erweiterter Filter, oder aber auch eine Kombination von beidem; Sie können beliebig viele verschiedene Filter miteinander kombinieren, um genau die gewünschten Aufgaben herauszufiltern. - Klicken Sie auf den Button „Auswertungen anzeigen“
Auswertungen aufrufen
- Navigieren Sie in die Aufgabenliste.
- Setzen Sie den gewünschten Filter, damit Ihnen genau die auf diejenigen Projekte passende Auswertung angezeigt wird, die Sie interessiert.
Das kann ein Spaltenfilter sein, erweiterter Filter, oder aber auch eine Kombination von beidem; Sie können beliebig viele verschiedene Filter miteinander kombinieren, um genau die gewünschten Aufgaben herauszufiltern. - Klicken Sie auf den Button „Auswertungen“ anzeigen oberhalb der Aufgabenliste.
Benötigen Sie nur die Auswertungen für eine einzige Aufgabe, so bietet sich eine Filterung über die Aufgaben-ID-Spalte an. Die Auswahl von Aufgaben via Checkbox-Spalte oder auch einfach die Selektion einer Aufgabenzeile hat keinen Einfluss auf die KPI-Auswertung. | Wenn in der Aufgabenübersicht kein Benutzerfilter gesetzt ist, wird die Nachbearbeitungszeit eines Segments berechnet, indem alle Bearbeitungszeiten aller Benutzer*innen innerhalb eines Workflow-Schritts einschließlich der PM-Bearbeitungen addiert werden. Wurde für den/die Workflow-Schritt(e) eine Filterung festgelegt, werden nur die Nachbearbeitungszeiten innerhalb des/der gefilterten Workflow-Schritt(e)s berücksichtigt. Sie werden aber trotzdem für alle Workflow-Schritte addiert für die Berechnung „seit Import/Vorübersetzung“. Und für die Berechnung „innerhalb eines Workflow-Schritts“ werden die Zeiten innerhalb eines Workflow-Schritts addiert, der Durchschnitt für alle Segmente innerhalb des Workflow-Schritts berechnet und dann über alle Workflow-Schritte in der Filterung hinweg wiederum der Durchschnitt pro Workflow-Schritt berechnet-Spalte oder auch einfach die Selektion einer Aufgabenzeile hat keinen Einfluss auf die KPI-Auswertung. | ||
Wenn einer oder mehrere der Filter „Match-Rate“, „Ressourcentyp“, „Sprachressourcen“ oder „Sprachressourcen“ „TQE“ verwendet werden, werden nur diejenigen Segmente berücksichtigt, die dieser Filterung entsprechen. | |||
Wenn auf die für die Vorübersetzung verwendete Sprachressource gefiltert wird, wird die als erste für die Vorübersetzung verwendete Sprachressource berücksichtigt – auch dann, wenn die Benuter*Benutzer/innen anschließend manuell etwas anderes aus dem Fuzzy-Match-Panel übernehmenübernommen haben. |
Auswertungen außerhalb translate5 weiterbearbeiten
Die Möglichkeit, Filter zu kombinieren reicht Ihnen nicht aus, um genau auf diejenigen Auswertungen zu kommen, die Sie benötigen? Dann können Sie die Auswertungen jederzeit auch exportieren und z.B. in Excel, über Power-BI oder ähnliche Tools weiterbearbeiten. Klicken Sie dazu auf „Meta-Daten exportieren“ und Sie erhalten in Kürze eine herunterladbare Excel-Datei, die alle in der aktuellen Filterung enthaltenen Spalten und deren Werte beinhaltet:.
Anwendungsmöglichkeiten
Die Messung der Nachbearbeitungszeit und der Levenshtein-Distanz birgt umfassende Möglichkeiten, verschiedene Kennzahlen im Übersetzungsprozess zu evaluieren und Ressourcen-, aber auch Leistungsqualitäten zu beurteilen. Nachfolgend einige InputsBeispiele; die Liste ist natürlich bei weitem nicht abschließend:
Qualität der MT- oder LLM-Übersetzung
Vergleichen Sie die Qualität verschiedener MT-/LLM-Engines, indem Sie die durchschnittliche Bearbeitungszeit und Levenshtein-Distanz der Aufgaben/Segmente betrachten, die mit den entsprechenden Ressourcen vorübersetzt wurden. Ausgehend von den gewonnenen Erkenntnissen können Sie beispielsweise auch Ihre Rabattstaffelung für den Einkauf schärfen, sodass diese exakt auf die verwendeten Sprachressourcen abgestimmt sind.
Qualität einer Sprachressource
Vergleichen Sie die durchschnittliche Bearbeitungszeit von Aufgaben, die mit einer bestimmten Sprachressource vorübersetzt wurden, bevor und nachdem Sie sie in der TM Maintenance oder über einen Re-Import zur Bereinigung bearbeitet haben.
Eignung einer Sprachressource für einen bestimmten Kunden oder ein bestimmtes Fachgebiet
Finden Sie heraus, welche LLM-Ressourcen sich für einen bestimmten Kunden oder ein bestimmtes Fachgebiet am besten eignen, indem Sie für ähnliche Texte, die aber mit verschiedenen Ressourcen übersetzt wurden, die Nachbearbeitungszeit und Levenshtein-Distanz analysieren.
Effizienz der Linguist
*/innen
Prüfen Sie, wie unterschiedlich stark Ihre Linguist*/innen die maschinell vorübersetzten Segmente bearbeiten und wie viel Zeit sie auf diese Arbeit verwenden, indem Sie im erweiterten Filter einen Benutzerfilter setzen. Auf diese Weise werden jeweils diejenigen Werte angezeigt, die sich auf alle Segmente beziehen, die der*/die im Filter eingetragene Benutzer*/in als letzte*/r im jeweiligen Workflow-Schritt gespeichert hat. Eine zu geringe Nachbearbeitungszeit könnte beispielsweise bedeuten, dass ein*/e Post-Editor*/in seine*/ihre Arbeit nicht gewissenhaft ausführt, während eine sehr hohe Bearbeitungszeit darauf hinweisen könnte, dass der*/die Post-Editor*/in (zu) viele und möglicherweise auch unnötige Änderungen vornimmt, insbesondere, wenn gleichzeitig auch die durchschnittliche Levenshtein-Distanz auffällig hoch ist.
| Diejenigen Segmente, die in einem Workflow-Schritt bearbeitbar waren, aber nicht bearbeitet wurden, zählen jeweils in die Berechnung für diejenigen Benutzer |
| /innen mit, welche eine Aufgabe als letzte abgeschlossen haben. |
Messen der effektiven Bearbeitungszeit
Verrechnen Sie Ihre Dienstleistungen mit einer akkuraten akkurater Exaktheit, indem Sie genau diejenige Bearbeitungszeit verrechnen, die von translate5 gemessen wurde.











