Table of Contents

Versionierung

Excerpt Include

	Version und Versionierung
	Version und Versionierung
nopanel	true

Change History

limit	3

Durchschnittliche Levenshtein-Distanz

Die Levenshtein-Distanz (auch Editierdistanz) zwischen zwei Zeichenketten ist die minimale Anzahl einfügender, löschender und ersetzender Operationen, um die erste Zeichenkette in die zweite umzuwandeln. Benannt ist die Distanz nach dem russischen Wissenschaftler Wladimir Lewenstein (engl. Levenshtein), der sie 1965 einführte (vgl. Levenshtein-Distanz auf Wikipedia). translate5 misst standardmäßig in jedem Workflow die durchschnittliche Levenshtein-Distanz. Die implementierte Messung entspricht den auf dieser Website dargestellten Formeln; der dort verfügbare Rechner kann zu Vergleichs- und Überprüfungszwecken verwendet werden.

Levenshtein-Distanz auf Segmentebene

In translate5 wird die Levenshtein-Distanz je Segment berechnet und als Durchschnittswert über alle gefilterten Segmente auf Aufgabenebene im Bereich „Aufgaben“ zur Abfrage zur Verfügung gestellt. Das heißt, Sie können jederzeit die durchschnittliche Levenshtein-Distanz einer einzigen oder auch aller Aufgaben, die der aktuellen Filterung entsprechen, abfragen. Oder auch über eine Untermenge der Segmente einer oder mehrerer Aufgaben, wenn die Aufgabenliste nach TQE-Wert, Match-Rate oder nach der/den für die Vorübersetzung verwendeten Sprachressource(n) oder -typen gefiltert wird. Und das für unterschiedliche Zeitpunkte und Zeitspannen innerhalb des Projekts.

translate5 misst die Levenshtein-Distanz:

Dabei werden die Segmentstände folgender Zeitpunkte/-spannen miteinander verglichen:

Messpunkte in translate5

Initialstand – Inhalt des Zielsegments nach Import, also nach der Vorübersetzung (via Translation Memory, Maschinelle Übersetzung oder LLM. Die Vorübersetzung kann auch nachträglich, nach dem Import / im laufenden Projekt stattfinden), resp. bei bilingualen Ausgangsdateien (z.B. XLIFF)

zum Zeitpunkt des Imports.

in der Software, welche die bilingualen Dateien erzeugt. Zielsegmente können leer sein, wenn

beim Import

keine Vorübersetzung vorgenommen wurde. Dieser leere Stand gilt dann bei einer Humanübersetzung als Referenzgröße für die Messung seit Import/Vorübersetzung.
Iststand – Änderungen seit Import/Vorübersetzung: Hier wird die Differenz berechnet zwischen dem Inhalt nach der Vorübersetzung, respektive dem Import (Initialstand), und der jüngsten Änderung des aktuellen Workflow-Schritts. Das gilt auch, wenn das Zielsegment nach dem Import leer war (da nicht vorübersetzt). In solchen Fällen entspricht dann die Levenshtein-Distanz nach der ersten Bearbeitung genau seiner Segmentlänge, da alle sich im Zielsegment befindlichen Zeichen bei der Humanübersetzung neu eingefügt wurden.
Differenzstand – Änderungen zwischen zwei aufeinanderfolgenden Workflow-Schritten: Hier wird die Distanz gemessen zwischen der jüngsten Änderung im aktuellen Workflow-Schritt zur jüngsten Änderung des vorangehenden Schritts. Wenn es keinen vorangehenden Schritt gibt (z.B. beim allerersten Workflow-Schritt), entspricht der gemessene Wert demjenigen seit Import/Vorübersetzung.

	Vorübersetzungen durch das Translation Memory, MT oder LLM verursachen keine Statistikeinträge für die Levenshtein-Distanz.
	Wenn die Segmente maschinell oder mit einem LLM vorübersetzt wurden, gilt die Vorübersetzung als erste Version , und der manuelle Übersetzungsschritt Übersetzungs- respektive Post-editing-Schritt wird bei der Levenshtein-Berechnung berücksichtigt.
	Die Levenshtein-Distanz wird immer zu Beginn eines Workflow-Schritts für diesen Workflow-Schritt mit dem Wert 0 in die Statistik einbezogen (, damit zu jedem Zeitpunkt der Abfrage der zu diesem Zeitpunkt korrekte Durchschnitt ermittelt werden kann). Da Workflow-Schritte, deren Status noch auf „wartend“ steht, noch keine bearbeitbare bearbeitbaren Segmente beinhalten, wird für sie auch noch keine initiale Levenshtein-Distanz von 0 gesetzt und sie werden auch in den Statistiken noch nicht berücksichtigt.
	Für Segmente, die nach dem Import leer stehen, für die aber interne 100%-Fuzzy-Matches vorhanden sind (, die aufgrund der Vorübersetzungsrate nicht automatisch ins Zielsegment übernommen wurden), wird nach Übernahme des internen 100%-Fuzzy-Matches die Levenshtein-Distanz des jeweiligen übernommenen Master-Segments gesetzt.
Image Added	Segmente mit dem Status „Entwurf“ fließen normal in die Statistiken mit ein.

Berechnung und Gewichtung

Die durchschnittliche Levenshtein-Distanz versteht sich immer als nach Segmentzahl gewichteter Mittelwert, auch wenn die Segmente von mehr als einer Aufgabe in die Berechnung miteinfließen. Hierzu ein Beispiel zur Veranschaulichung:

Aufgabe A	Levenshtein-Distanz
Segment 1	4
Segment 2	3
Segment 3	2
Durchschnittliche Levenshtein-Distanz Aufgabe A:		9 / 3 = 3

Aufgabe B	Levenshtein-Distanz
Segment 1	6
Segment 2	4
Segment 3	2
Segment 4	4
Durchschnittliche Levenshtein-Distanz Aufgabe B:		16 / 4 = 4

Die durchschnittliche Levenshtein-Distanz über Aufgabe A und Aufgabe B berechnet sich wie folgt:

4 + 3 + 2 + 6 + 4 + 2 + 4 = 25

25 / 7 = 3,5714

Es wird also die Summe aller Levenshtein-Distanzen gebildet, um diese danach durch die kumulierte Anzahl aller Segmente zu teilen.

	Dauerhaft gesperrte Segmente fließen nie in die Statistik mit ein, während gesperrte Segmente nach/vor Sperrung einfließen können. Auch Segmente ohne Übersetzung/Bearbeitung fließen in die Statistik mit ein.

Messung der Zeichenänderungen innerhalb der Segmente

Zur Veranschaulichung der Auswertungen, respektive, wie die Levenshtein-Distanz gemessen wird, wird der nebenstehende Text bestehend aus vier Segmenten verwendet:

Fit for fun: Klein, klein, smart und sofort einsatzbereit.

Fit for fun passt in jede Tasche, trainiert überall.

Mehr Bewegung im Alltag, ganz ohne Aufwand.

Fit for fun ist dein schneller Boost für Kraft und Energie.

Statistiktypen

Die nachfolgende Grafik visualisiert die unterschiedlichen Zeitpunkte/-spannen, für welche die Levenshtein-Distanz gemessen wird.

Die Farbmarkierung der Zellen in der Grafik oben werden in der untenstehenden Tabelle wieder aufgenommen, in der die verschiedenen Statistiken mit Beispiel erläutert werden:

Zeitpunkt/Zeitspanne

Erläuterung

Beispiel (ohne Filter gesetzt)

Beispieltext nach Bearbeitung

vor Beginn des Workflows

Anchor
pre_workflow
pre_workflow

Zeigt die durchschnittliche Levenshtein-Distanz, die aufgrund von Änderungen zustande kam, die vor Beginn des Workflows angebracht wurden, z.B. wenn

der*

die Projektmanager

*in

/innen vor der Zuweisung

eines*r Benutzers*in

der Benutzer/innen Änderungen an den Segmenten

vornimmt

vornehmen. Der Status „Aktueller Workflow-Schritt“ steht dabei auf „kein Workflow“.

Hier wird der Zustand „vor Beginn des Workflows“, sprich noch außerhalb jeglicher Workflow-Schritte, untersucht. Konkret werden also die Segmentinhalte verglichen nach dem Aufgabenimport und vor dem Beginn des Workflows.

Der

*

/die Projektmanager

*

/in ändert,

bevor er*sie jegliche Benutzerzuweisungen vornimmt

noch vor der Benutzerzuweisungen, nach dem Import mit Vorübersetzung an drei Stellen den Produktnamen „Fit for fun“ zu „Fit4fun“.

→ 4 Zeichen gelöscht, 1 Zeichen geändert.

Levenshtein-Distanz = 3 x 5 = 15;

Durchschnittliche Levenshtein-Distanz vor Beginn des Workflows = 3,75

Fit4fun

: Klein

, klein, smart und sofort einsatzbereit.

Fit4fun passt in jede Tasche, trainiert überall.

Mehr Bewegung im Alltag, ganz ohne Aufwand.

Fit4fun ist dein schneller Boost für Kraft und Energie.

innerhalb eines Workflow-Schritts
Anchor
in_workflow-step
in_workflow-step

Zeigt die durchschnittliche Levenshtein-Distanz innerhalb eines Workflow-Schritts zwischen den letzten Änderungen im vorangehenden Workflow-Schritt und der Version vor der abschließenden Speicherung des aktuellen Workflow-Schritts, also der allerletzten Bearbeitung, bevor der Workflow-Schritt abgeschlossen wurde.

Der

*

/die Übersetzer

*

/in post-editiert eine Stelle.

→ 11 Zeichen hinzugefügt, 1 Zeichen geändert

Levenshtein-Distanz = 12

Durchschnittliche Levenshtein-Distanz innerhalb des Workflow-Schritts „Übersetzen“ = 3

Fit4fun

: Klein

, klein, smart und sofort einsatzbereit.

Fit4fun passt in jede Tasche, damit trainieren Sie überall.

Mehr Bewegung im Alltag, ganz ohne Aufwand.

Fit4fun ist dein schneller Boost für Kraft und Energie.

Image Modified	Segmente fließen für die Filterung innerhalb eines Workflow-Schritts dann in die Statistik ein, wenn sie zum Ende des Workflow-Schritts bearbeitbar waren

oder

bzw. zum Zeitpunkt des KPI-Aufrufs in aktuell bearbeitbaren Aufgaben bearbeitbar sind.
Image Modified	Werden Segmente, die editierbar (also nicht gesperrt) sind, innerhalb eines Workflow-Schritts nicht

editiert

bearbeitet, fließen diese bei der Berechnung der Levenshtein-Distanz mit einer Levenshtein-Distanz von 0 in die Berechnung mit ein.
Image Modified	Wird ein Segment während eines bearbeitbaren Workflow-Schritts (oder im Status „Kein Workflow“ oder „Workflow abgeschlossen“) ent- oder gesperrt, dann werden entsperrte Segmente für diesen Workflow-Schritt (oder für den Status „Kein Workflow“ oder „Workflow abgeschlossen“) zu diesem Zeitpunkt neu in die Statistik geschrieben bzw. beim Sperren aus der Berechnung herausgenommen
Image Modified	Wenn kein Filter gesetzt ist, der die Ergebnisse auf einen einzigen bestimmten Workflow-Schritt einschränkt, dann zeigt der Wert „innerhalb eines Workflow-Schritts“ die durchschnittliche Distanz von vor dem Workflow-Schritt bis zur letzten Bearbeitung innerhalb des Workflow-Schritts an, aber gemittelt über alle Workflow-Schritte hinweg, die in der aktuellen Filterung enthalten sind. Es wird dann noch nicht für einen einzelnen Workflow-Schritt gemessen: Wenn also ein Filter so gesetzt ist, dass sowohl Workflow-Schritte vom Typ „Übersetzung“ und vom Typ „Lektorat“ berücksichtigt werden und für Segment 1 wurden in der Übersetzung 20 Zeichen verändert (Levenshtein-Distanz 20) und im Lektorat wurden für das Segment nochmal 10 Zeichen verändert, dann beträgt die Levenshtein-Distanz innerhalb eines Workflow-Schritts für Segment 1 den Wert 15 (insgesamt 30 Änderungen, geteilt durch zwei Jobs). Und in der Auswertung wird dann der so ermittelte Wert wiederum als Durchschnittswert für alle Segmente gebildet, die am Ende des Workflow-Schritts bzw. für den aktuellen Workflow-Schritt zum Zeitpunkt des KPI-Aufrufs bearbeitbar waren und der aktuellen Filterung entsprechen.

seit Import/Vorübersetzung
Anchor

from

since_import_

beginning

pre-

of-workflow

translation
since_import_pre-translation

from_beginning-of-workflow

Zeigt die durchschnittliche Levenshtein-Distanz seit Import/Vorübersetzung bis zur neuesten vorhandenen Bearbeitung.

Der

*

/die

Revisor*

Lektor/in ändert die Formalität des Textes.

→

4

7 Zeichen geändert, 1 Zeichen eingefügt, 1 Zeichen gelöscht

Levenshtein-Distanz Lektorat =

5

9

Levenshtein-Distanz Übersetzung = 12

Levenshtein-Distanz Projektmanager/in (vor Beginn des Workflows): 15

Total seit Import/Vorübersetzung:

10

29 Änderungen

Durchschnittliche Levenshtein-Distanz seit Import/Vorübersetzung =

2

7,

5

25

Fit4fun

: Klein

, klein, smart und sofort einsatzbereit.

Fit4fun passt in jede Tasche, damit trainierst du überall.

Mehr Bewegung im Alltag, ganz ohne Aufwand.

Fit4fun ist Ihr schneller Boost für Kraft und Energie.

Image Modified

Hier werden keine Werte angezeigt, wenn im erweiterten Filter job-/workflowschrittbezogen gefiltert wird. Da durch diese Filter Teile der Gesamtbearbeitung eingeschränkt/ausgenommen werden, würde ein Gesamtwert seit Import/Vorübersetzung keinen Sinn ergeben.

Anchor

	job-related_filter
	job-related_filter

Job-/workflowschrittbezogene Filter sind folgende:

„Zugewiesene/r

Benutzer“

Benutzer/in“ „Workflow-Schritt-Typ“ „Workflow-Schritt“ „Status des Jobs“
Image Modified	Segmente fließen dann in die Statistik seit Import/Vorübersetzung ein, wenn sie zum Zeitpunkt des KPI-Aufrufs durch PMs bearbeitbar sind.
Image Modified	Achtung: Die Distanz von Beginn des Workflows ist nicht identisch mit der Summe der Distanzen der einzelnen Workflow-Schritte, da es sein kann, dass z.B. ein

*

/e Benutzer

*

/in im Schritt „Lektorat“ Änderungen, die im Schritt „Übersetzung“ vorgenommen wurden, wieder rückgängig macht.

Beispiel:

Stand nach Import: Heut’ ist so ein schöner Tag.

Stand nach Übersetzung: Heute ist solch ein schöner Tag. → Levenshtein-Distanz = 4

Stand nach Lektorat: Heut ist so ein schöner Tag. → Levenshtein-Distanz zur Übersetzung:

6

4; Levenshtein-Distanz zum Import = 1 (und nicht

10

5).

nach Ende des Workflows
Anchor
post_workflow
post_workflow

Zeigt die durchschnittliche Levenshtein-Distanz der Änderungen, die ein

*

/e Projektmanager

*

/in nach Abschluss des Workflows („Aktueller Workflow-Schritt“ steht auf „Workflow abgeschlossen“) noch angebracht hat.

Analog zu „innerhalb eines Workflow-Schritts“ wird hier der Stand nach der letzten Bearbeitung eines Segments „nach Ende des Workflows“ verglichen mit dem jüngsten Stand des allerletzten Workflow-Schritts.

Der

*

/die Projektmanager

*

/in ergänzt, auf Wunsch des

*

/der Kund

*

/in, nach Abschluss des Workflows; also nachdem der

*

/die Lektor

*

/in geliefert hat, den Produktnamen um „Go“.

→ 6 Zeichen hinzugefügt

Levenshtein-Distanz = 6

Durchschnittliche Levenshtein-Distanz nach Ende des Workflows = 1,5

Fit4funGo: Klein, smart und sofort einsatzbereit.

Fit4funGo passt in jede Tasche, damit trainierst du überall.

Mehr Bewegung im Alltag, ganz ohne Aufwand.

Fit4funGo ist Ihr schneller Boost für Kraft und Energie.

Image Modified

Inline-Tags werden bei der Berechnung der Levenshtein-Distanz wie Zeichen behandelt:

Wird ein Tag gelöscht, entspricht das einem gelöschten Zeichen (Levenshtein-Distanz = 1).
Wird ein Tag verschoben, entspricht das einem gelöschten Zeichen und einem eingefügten Zeichen (Levenshtein-Distanz = 2). Wird ein Tag durch ein anderes Tag oder ein anderes Zeichen ersetzt, entspricht das einem ersetzten Zeichen (Levenshtein-Distanz = 1).

MQM-Tags fließen nicht in die Berechnung mit ein.

Image Modified

Durchschnittliche Levenshtein-Distanz = 0

Bringt ein

*

/e Benutzer

*

/in Änderungen an, die genau die Änderungen eines

*

/r vorangehenden Benutzers

*

/in rückgängig macht, hebt das die Levenshtein-Distanz für das/die betroffenen Segmente auf, respektive sie steht auf

null

0.

Beispiel: Fit4funGo: Klein, smart und sofort einsatzbereit.

Stand nach Übersetzung: Fit4funGo: Klein, smart und stets sofort einsatzbereit. → Levenshtein-Distanz innerhalb Workflow-Schritt, Filter auf „Übersetzung“ = 6 (6 Hinzufügungen)

Stand nach Lektorat: Fit4funGo: Klein, smart und sofort einsatzbereit. → Levenshtein-Distanz innerhalb Workflow-Schritt, Filter auf „Lektorat“ = 6 (6 Löschungen)

Levenshtein-Distanz seit Import/Vorübersetzung: 0 (kein Filter oder Filter auf Übersetzung und Lektorat)

Image Modified

Wenn Sie nur diejenigen Segmente untersuchen möchten, die auch vorübersetzt wurden, die Zielsegmente also nicht leer waren nach dem Import und vor der ersten Bearbeitung, kann der Matchrate-Filter eingesetzt werden.

Statistiken je Benutzer

*

/in

Die Zuordnung der Levenshtein-Distanz zu einem*r Benutzer*in den Benutzer/innen funktioniert so, dass für alle Benutzer*/innen die Workflowrolle Workflow-Rolle ihres jeweiligen Jobs genommen und für diesen Workflow-Schritt je Benutzer*/in die Levenshtein-Distanz eingetragen wird. Der*/die für die Änderungen in einem Segment verantwortliche Benutzer*in Verantwortliche ergibt sich daraus, wer das Segment innerhalb des Workflow-Schritts als letzter gespeichert hat.

Benutzerfilter

Wird für die Auswertung der Levenshtein-Distanz im erweiterten Filter der Aufgabenübersicht der Benutzerfilter gesetzt, gilt die Berechnung für jene Aufgabensegmente, denen der*/die Benutzer*/in zugewiesen ist und in denen er*/sie innerhalb eines Workflow-Schritts als letzte*/r das Segment gespeichert hat. Dabei wird die Levenshtein-Distanz immer im Vergleich zum Zustand beim Start des Workflow-Schritts berechnet, unabhängig davon, welche der Änderungen der*/die Benutzer*/in selbst angebracht hat. Der Grund dafür, dass alle Änderungen innerhalb eines Workflow-Schritts dem*der als letzte*n aktive*/der zuletzt aktive/n Benutzer*/in angerechnet werden, ist, dass der*die letzte Benutzer*indiejenige Person, der*/die ein Segment innerhalb eines Workflow-Schritts speichert, damit die Verantwortung für den finalen Segmentzustand übernimmt.

Messung bei Wiederholungen

Die Levenshtein-Distanz fließt für jede Wiederholung so ein, wie sie beim Mastersegment berechnet wurde.

Umgang mit Wiederholungen, die via Wiederholungseditor bearbeitet werden

Je nach Einstellungen im Wiederholungseditorkönnen können Wiederholungen innerhalb einer Aufgabe automatisch oder halbautomatisch mit Entscheidung durch die Benutzer*/innen übernommen werden. Die Nachbearbeitungszeit Levenshtein-Distanz wird für die unterschiedlichen Einstellungsmöglichkeiten wie folgt gemessen:

Bearbeitung des Mastersegments, also desjenigen Segments, dessen Inhalt nach Bestätigung in die zu 100% wiederholenden Segmente übernommen wird: Normale normale Messung der Levenshtein-Distanz.
Übernahme eines sich zu 100% wiederholenden Segmentinhalts mit Entscheidung durch den*/die Benutzer*/in (Einstellung „Bei jeder Wiederholung einzeln entscheiden“): Levenshtein-Distanz des Mastersegments wird auf die auto-propagierten Segmente übertragen.
Automatische Übernahme der sich zu 100% wiederholenden Segmente, ohne Entscheidung durch den*/die Benutzer*/in (Einstellung „Immer automatisch setzen“): Levenshtein-Distanz des Mastersegments wird auf die auto-propagierten Segmente übertragen.
Keine Auto-Propagierung bei Einstellung „Nie automatisch setzen“: Normale Messung der Levenshtein-Distanz bei manueller Bearbeitung der sich wiederholenden Segmente.

Durchschnittliche Nachbearbeitungszeit

In translate5 wird für jedes Segment die Bearbeitungszeit gemessen und als Durchschnittswert über alle gefilterten Segmente auf Aufgabenebene zur Abfrage zur Verfügung gestellt. Das heißt, Sie können jederzeit die durchschnittliche Nachbearbeitungszeit einer einzigen oder auch aller Aufgaben, die der aktuellen Filterung entsprechen, abfragen. Oder auch über eine Untermenge der Segmente einer oder mehrerer Aufgaben, wenn die Aufgabenliste nach TQE-Wert, Match-Rate oder nach der/den für die Vorübersetzung verwendeten Sprachressource(n) oder -typen gefiltert wird. Und das für unterschiedliche Zeitpunkte und Zeitspannen innerhalb des Projekts.

Berechnung und Gewichtung

Die durchschnittliche Nachbearbeitungszeit ist diejenige Zeit, während der ein*/e oder mehrere Benutzer*/innen ein Segment in translate5 bearbeitet/n, geteilt durch alle bearbeitbaren Segmente. Die Bearbeitungen können von Benutzer*/innen innerhalb des Workflow-Schritts durchgeführt werden, aber auch von einem*r Projektmanager*in, der*den Projektmanager/innen, die zwischendurch Änderungen an den Segmenten vornimmtvornehmen.

Die Zeitmessung startet beim Öffnen eines Segments zur Bearbeitung und endet, wenn das Segment wieder gespeichert wird. Wird das Segment über ESC oder verlassen, also ohne Änderungen geschlossen, wird keine Zeitmessung vermerkt.

Image Modified	Dauerhaft gesperrte Segmente fließen nie in die Statistik mit ein, während gesperrte Segmente nach/vor Sperrung einfließen

können

. Auch Segmente ohne Übersetzung/Bearbeitung fließen in die Statistik mit ein.
Image Modified	Wenn auch reine Lesezeit eines Segments gemessen werden soll, während der am Segmentinhalt keine Änderungen vorgenommen werden, müssen die Benutzer

*

/innen so instruiert werden, dass sie jedes Segment zur Bearbeitung öffnen und mit der Tastenkombination STRG + ENTER, oder mit Image Modified zum nächsten Segment springen. Dadurch wird das nächste Segment geöffnet und das aktuelle Segment inhaltlich unverändert mit neuem Status gespeichert. Auf diese Weise können der Statuswechsel wie auch die Bearbeitungszeit des jeweiligen Segments gemessen werden.

Image Modified

Bleibt ein Segment offen, ohne dass daran gearbeitet, es also weder gelesen noch editiert wird (z.B. weil sich die betreffende Person einen Kaffee kochen gegangen ist), wird die Zeit dennoch weiter gemessen. translate5 geht dann davon aus, dass es sich auch um Recherchezeit handeln könnte und

trackt

notiert sie deshalb mit.
Image Modified	Wenn

ein*e Benutzer*in

eine Aufgabe nur

durchliest

durchgelesen und keine Änderungen

anbringt

angebracht wird, also auch keine Segmente zur Bearbeitung

öffnet

geöffnet werden, wird keine Nachbearbeitungszeit erfasst, also bleibt jene Statistik für

diese*n Benutzer*in

die entsprechenden Benutzer/innen auf 0.

translate5 misst die Nachbearbeitungszeit:

Zeitpunkt/Zeitspanne

Erläuterung

vor Beginn des Workflows

Anchor

	pre_workflow_pe-time
	pre_workflow_pe-time

Zeigt die Zeit, die für Änderungen vor Beginn des Workflows aufgewendet wurden, z.B. wenn

der*

die Projektmanager

*

/innen in

in

der Zeitspanne zwischen dem Aufgabenimport und der Workflowzuweisung

eines* Benutzers*in

an die Benutzer/innen Änderungen an den Segmenten

vornimmt

vornehmen.

innerhalb eines Workflow-Schritts

Anchor

	in_workflow-step_pe-time
	in_workflow-step_pe-time

Zeigt die durchschnittliche Nachbearbeitungszeit innerhalb eines Workflow-Schritts, also der Zeit während der das Segment bearbeitet wurde, solange der Status des jeweiligen Workflow-Schritts auf „offen“ steht.

seit Import/Vorübersetzung

Anchor

from

	since_import_

beginning

pre-

of-workflow

translation_pe-time

from

	since_import_

beginning

pre-

of-workflow

translation_pe-time

Zeigt die durchschnittliche Nachbearbeitungszeit vom Aufgabenimport beginnend,

bis der Workflow in den Status „Workflow abgeschlossen“ umspringt oder bis zum jeweiligen Messzeitpunkt während des laufenden Workflows

bis zum aktuellen Zustand (das enthält bei abgeschlossenen Workflows auch Änderungen nach dem Ende des Workflows).

Image Modified	Segmente fließen für die Filterung von Beginn des Workflows dann in die Statistik ein, wenn sie zum Zeitpunkt des KPI-Aufrufs bearbeitbar sind.

nach Ende des Workflows

Anchor

	post_workflow_pe-time
	post_workflow_pe-time

Zeigt die durchschnittliche Nachbearbeitungszeit für Änderungen, die die

ein*e Projektmanager*in

Projektmanager/innen nach Abschluss des Workflows (Workflow-Status steht auf „Workflow abgeschlossen“) noch durchgeführt

hat

haben.

Umgang mit Wiederholungen, die via Wiederholungseditor bearbeitet werden

Je nach Einstellungen im Wiederholungseditor können Wiederholungen innerhalb einer Aufgabe automatisch oder halbautomatisch mit Entscheidung durch den*/die Benutzer*/in übernommen werden. Die Nachbearbeitungszeit wird für die unterschiedlichen Einstellungsmöglichkeiten wie folgt gemessen:

Bearbeitung des Mastersegments, also desjenigen Segments, dessen Inhalt nach Bestätigung in die zu 100% wiederholenden Segmente übernommen wird: Normale Zeitmessung, solange das Segment zur Bearbeitung geöffnet ist.
Übernahme eines sich zu 100% wiederholenden Segmentinhalts mit Entscheidung durch den*/die Benutzer*/in (Einstellung „Bei jeder Wiederholung einzeln entscheiden“): Die im Wiederholungseditor verbrachte Zeit geteilt durch die Anzahl der sich wiederholenden Segmente.
Automatische Übernahme der sich zu 100% wiederholenden Segmente, ohne Entscheidung durch den*/die Benutzer*/in (Einstellung „Immer automatisch setzen“): Nachbearbeitungszeit für diese Segmente = 0.
Keine Auto-Propagierung bei Einstellung „Nie automatisch setzen“: Normale Messung der Nachbearbeitungszeit bei manueller Bearbeitung der sich wiederholenden Segmente.

Anwendbare Filter
Anchor
usable_filters
usable_filters

Die Levenshtein-Distanz sowie und Nachbearbeitungszeit können für diverse Filterszenarien abgefragt werden. Dabei kann mit den Spaltenfiltern (einer oder mehrere miteinander kombiniert), aber auch mit dem erweiterten Filter (ebenfalls zusätzlich mit Spaltenfiltern kombinierbar) eine umfangreiche Anzahl an Szenarien dargestellt werden. Je nachdem, für welchen Zeitpunkt oder für welche Zeitspanne eine Auswertung angezeigt werden soll, sind gewisse Filtermöglichkeiten nicht zulässig, respektive liefern keine Resultate, da sie konzeptionell keinen Sinn ergeben (z.B. Filterung auf einen Workflow-Schritt-Typ für eine Messung eine Messung seit Import/Vorübersetzung).

Die nachfolgende Matrix zeigt, welche Filteroptionen des erweiterten Filters und der Spaltenfilter je Auswertungstyp verwendet werden können:

Erweiterter Filter

Spaltenfilter

	Das Setzen von Häkchen in der Checkbox-Spalte der Aufgabenliste hat keinen Einfluss auf die Filterung.
	Bei der Filterung nach dem/der Projektmanager/in der Aufgabe beziehen sich die Werte auf alle Aufgaben, für die der/die gefilterte Benutzer/in als PM zuständig ist. Also nicht diejenigen, in denen der*/die gefilterte PM einen Job zugewiesen hat oder Segmente editiert hat. Analog verhält es sich bei den Spalten „Aktueller Workflow-Schritt“ und „Status“ (also Status der Aufgabe).
	Wenn in der Aufgabenliste kein Benutzerfilter gesetzt ist, wird die Nachbearbeitungszeit, respektive die Levenshtein-Distanz eines Segments berechnet, indem alle Bearbeitungszeiten aller Benutzer/innen innerhalb eines Workflow-Schritts einschließlich der PM-Bearbeitungen addiert werden. Wurde für den/die Workflow-Schritt(e) eine Filterung festgelegt, werden nur die Nachbearbeitungszeiten, respektive Levenshtein-Distanzen innerhalb des/der gefilterten Workflow-Schritt(e)s berücksichtigt. Sie werden aber trotzdem für alle Workflow-Schritte addiert für die Berechnung „seit Import/Vorübersetzung“. Und für die Berechnung „innerhalb eines Workflow-Schritts“ werden die Zeiten innerhalb eines Workflow-Schritts addiert, der Durchschnitt für alle Segmente innerhalb des Workflow-Schritts berechnet und dann über alle Workflow-Schritte in der Filterung hinweg wiederum der Durchschnitt pro Workflow-Schritt berechnet Ein Filter auf der Spalte „Aktueller Workflow-Schritt“ entspricht nicht der Filteroption „Workflow-Schritt“ im erweiterten Filter, sondern zeigt lediglich diejenigen Aufgaben, in denen dieser Workflow-Schritt aktiv ist. Dahingegen holt die Filteroption „Workflow-Schritte“ im erweiterten Filter alle im Dropdown ausgewählten Workflow-Schritte, die der Auswahl (und einer allfälligen zusätzlichen Filterung) entsprechen. Ein Beispiel zur Veranschaulichung: Es gibt 5 Aufgaben, allesamt mit dem Standard-Workflow Übersetzung → Lektorat. Zwei der Aufgaben sind bereits abgeschlossen; in zwei der anderen Aufgaben ist aktuell der Workflow-Schritt „Übersetzung“ offen, in der fünften Aufgabe ist der Workflow-Schritt „Lektorat“ offen. Wird jetzt im Spaltenfilter auf „Aktueller Workflow-Schritt“ = Übersetzung gefiltert, erscheinen nur die zwei Aufgaben, bei denen der Status des Workflow-Schritts „Übersetzung“ auf „offen“ steht in den Filterresultaten. Wird hingegen im erweiterten Filter unter „Workflow-Schritt“ die Option „Übersetzung“ gewählt, erscheinen alle fünf Aufgaben in den Filterresultaten, da sie alle einen Schritt „Übersetzung“ beinhalten.
	Ein Filter auf der Spalte „Status der Aufgabe“ „Aktueller Workflow-Schritt“ entspricht nicht der Filteroption „Workflow-Status“ Schritt“ im erweiterten Filter, sondern zeigt lediglich diejenigen Aufgaben, die aktuell diesen Status zeigen.
Image Removed	Achtung: Auch gelöschte Jobzuweisungen werden in den Statistiken berücksichtigt. Wird beispielsweise einer Koordinatorengruppe eine Kundenzuweisung entfernt, werden alle Jobs der Gruppe für diesen Kunden entfernt. Dann fehlt den betreffenden Aufgaben der Übersetzungsschritt, der entsprechend auch über die Filterung nicht auswählbar ist. In der Statistik für die Filterung wird er allerdings miteinbezogen.

Verhalten bei inkonsistenten Workflows

Kommt es aufgrund von manuellen Statusanpassungen durch den*die PM zu einem inkonsistenten Workflow, bei dem beispielsweise ein Übersetzungsschritt nach dem Lektorat-Schritt wieder geöffnet wurde, werden Änderungen und Nachbearbeitungszeit dennoch immer demjenigen Workflow-Schritt zugerechnet, zu dem der Job gehört, der dem*die editierende Benutzer*in zugewiesen ist.

So werden jegliche Änderungen, die ein*e Benutzer*in anbringt, respektive die Zeit, die der*die Benutzer*in dafür aufwendet, dem*der der Job „Übersetzung“ zugewiesen ist, immer dem Workflow-Schritt Übersetzung angerechnet, selbst wenn das Editieren erst im nachträglich wieder geöffneten Übersetzungsjob stattfindet.

Auch wenn ein*e PM ohne zugewiesenen Job während des laufenden Workflows Änderungen anbringt, werden diese Änderungen und die entsprechende Bearbeitungszeit dem aktuell für die Aufgabe registrierten Workflow-Schritt angerechnet.

Image Removed

Aktuell kann ein*e PM dem*der ein Workflow-Schritt zugewiesen ist, nur editieren, wenn der Status des Jobs, dem er*sie zugewiesen ist, auf „offen“ steht. Künftig wird auch ein*e solche*r PM jederzeit während des Workflows Jobs bearbeiten können, egal, ob er*sie dafür zugewiesen ist oder nicht.

in denen dieser Workflow-Schritt aktiv ist. Dahingegen holt die Filteroption „Workflow-Schritte“ im erweiterten Filter alle im Dropdown ausgewählten Workflow-Schritte, die der Auswahl (und einer allfälligen zusätzlichen Filterung) entsprechen.

Ein Beispiel zur Veranschaulichung:

Es gibt 5 Aufgaben, allesamt mit dem Standard-Workflow Übersetzung → Lektorat.

Zwei der Aufgaben sind bereits abgeschlossen; in zwei der anderen Aufgaben ist aktuell der Workflow-Schritt „Übersetzung“ offen, in der fünften Aufgabe ist der Workflow-Schritt „Lektorat“ offen.

Wird jetzt im Spaltenfilter auf „Aktueller Workflow-Schritt“ = Übersetzung gefiltert, erscheinen nur die zwei Aufgaben, bei denen der Status des Workflow-Schritts „Übersetzung“ auf „offen“ steht in den Filterresultaten.

Wird hingegen im erweiterten Filter unter „Workflow-Schritt“ die Option „Übersetzung“ gewählt, erscheinen alle fünf Aufgaben in den Filterresultaten, da sie alle einen Schritt „Übersetzung“ beinhalten.

Image Added

Ein Filter auf der Spalte „Status der Aufgabe“ entspricht nicht der Filteroption „Workflow-Status“ im erweiterten Filter, sondern zeigt lediglich diejenigen Aufgaben, die aktuell diesen Status zeigen.

Image Added

Achtung: Auch gelöschte Jobzuweisungen werden in den Statistiken berücksichtigt. Wird beispielsweise einer Koordinatorengruppe eine Kundenzuweisung entfernt, werden alle Jobs der Gruppe für diesen Kunden entfernt. Dann fehlt den betreffenden Aufgaben der Übersetzungsschritt, der entsprechend auch über die Filterung nicht auswählbar ist. In der Statistik für die Filterung wird er allerdings miteinbezogen.

Verhalten bei inkonsistenten Workflows

Kommt es aufgrund von manuellen Statusanpassungen durch den/die PM zu einem inkonsistenten Workflow, bei dem beispielsweise ein Übersetzungsschritt nach dem Lektorat-Schritt wieder geöffnet wurde, werden Änderungen und Nachbearbeitungszeit dennoch immer demjenigen Workflow-Schritt zugerechnet, zu dem der Job gehört, der dem/der editierenden Benutzer/in zugewiesen ist.

So werden jegliche Änderungen, die ein/e Benutzer/in anbringt, respektive die Zeit, die der/die Benutzer/in dafür aufwendet, dem/der der Job „Übersetzung“ zugewiesen ist, immer dem Workflow-Schritt Übersetzung angerechnet, selbst wenn das Editieren erst im nachträglich wieder geöffneten Übersetzungsjob stattfindet.

Auch wenn ein/e PM ohne zugewiesenen Job während des laufenden Workflows Änderungen anbringt, werden diese Änderungen und die entsprechende Bearbeitungszeit dem aktuell für die Aufgabe registrierten Workflow-Schritt angerechnet.

Image Added	Aktuell kann ein/e PM, dem/der ein Workflow-Schritt zugewiesen ist, nur editieren, wenn der Status des Jobs, dem er/sie zugewiesen ist, auf „offen“ steht. Künftig wird auch ein/e solche/r PM jederzeit während des Workflows Jobs bearbeiten können, egal, ob er/sie dafür zugewiesen ist oder nicht.

Auswertungen aufrufen

Navigieren Sie in die Aufgabenliste.
Setzen Sie den gewünschten Filter, damit Ihnen genau die auf diejenigen Projekte passende Auswertung angezeigt wird, die Sie interessiert.
Das kann ein Spaltenfilter sein, ein erweiterter Filter, oder aber auch eine Kombination von beidem; Sie können beliebig viele verschiedene Filter miteinander kombinieren, um genau die gewünschten Aufgaben herauszufiltern.
Klicken Sie auf den Button „Auswertungen anzeigen“

Auswertungen aufrufen

Navigieren Sie in die Aufgabenliste.
Setzen Sie den gewünschten Filter, damit Ihnen genau die auf diejenigen Projekte passende Auswertung angezeigt wird, die Sie interessiert.
Das kann ein Spaltenfilter sein, erweiterter Filter, oder aber auch eine Kombination von beidem; Sie können beliebig viele verschiedene Filter miteinander kombinieren, um genau die gewünschten Aufgaben herauszufiltern.
Klicken Sie auf den Button „Auswertungen“ anzeigen oberhalb der Aufgabenliste.

Benötigen Sie nur die Auswertungen für eine einzige Aufgabe, so bietet sich eine Filterung über die Aufgaben-ID-Spalte an.

Die Auswahl von Aufgaben via Checkbox-Spalte oder auch einfach die Selektion einer Aufgabenzeile hat keinen Einfluss auf die KPI-Auswertung.

Image Removed

Wenn in der Aufgabenübersicht kein Benutzerfilter gesetzt ist, wird die Nachbearbeitungszeit eines Segments berechnet, indem alle Bearbeitungszeiten aller Benutzer*innen innerhalb eines Workflow-Schritts einschließlich der PM-Bearbeitungen addiert werden.

Wurde für den/die Workflow-Schritt(e) eine Filterung festgelegt, werden nur die Nachbearbeitungszeiten innerhalb des/der gefilterten Workflow-Schritt(e)s berücksichtigt. Sie werden aber trotzdem für alle Workflow-Schritte addiert für die Berechnung „seit Import/Vorübersetzung“. Und für die Berechnung „innerhalb eines Workflow-Schritts“ werden die Zeiten innerhalb eines Workflow-Schritts addiert, der Durchschnitt für alle Segmente innerhalb des Workflow-Schritts berechnet und dann über alle Workflow-Schritte in der Filterung hinweg wiederum der Durchschnitt pro Workflow-Schritt berechnet-Spalte oder auch einfach die Selektion einer Aufgabenzeile hat keinen Einfluss auf die KPI-Auswertung.

Wenn einer oder mehrere der Filter „Match-Rate“, „Ressourcentyp“, „Sprachressourcen“ oder „Sprachressourcen“ „TQE“ verwendet werden, werden nur diejenigen Segmente berücksichtigt, die dieser Filterung entsprechen.

Wenn auf die für die Vorübersetzung verwendete Sprachressource gefiltert wird, wird die als erste für die Vorübersetzung verwendete Sprachressource berücksichtigt – auch dann, wenn die Benuter*Benutzer/innen anschließend manuell etwas anderes aus dem Fuzzy-Match-Panel übernehmenübernommen haben.

Auswertungen außerhalb translate5 weiterbearbeiten

Die Möglichkeit, Filter zu kombinieren reicht Ihnen nicht aus, um genau auf diejenigen Auswertungen zu kommen, die Sie benötigen? Dann können Sie die Auswertungen jederzeit auch exportieren und z.B. in Excel, über Power-BI oder ähnliche Tools weiterbearbeiten. Klicken Sie dazu auf „Meta-Daten exportieren“ und Sie erhalten in Kürze eine herunterladbare Excel-Datei, die alle in der aktuellen Filterung enthaltenen Spalten und deren Werte beinhaltet:.

Anwendungsmöglichkeiten

Die Messung der Nachbearbeitungszeit und der Levenshtein-Distanz birgt umfassende Möglichkeiten, verschiedene Kennzahlen im Übersetzungsprozess zu evaluieren und Ressourcen-, aber auch Leistungsqualitäten zu beurteilen. Nachfolgend einige InputsBeispiele; die Liste ist natürlich bei weitem nicht abschließend:

Qualität der MT- oder LLM-Übersetzung

Vergleichen Sie die Qualität verschiedener MT-/LLM-Engines, indem Sie die durchschnittliche Bearbeitungszeit und Levenshtein-Distanz der Aufgaben/Segmente betrachten, die mit den entsprechenden Ressourcen vorübersetzt wurden. Ausgehend von den gewonnenen Erkenntnissen können Sie beispielsweise auch Ihre Rabattstaffelung für den Einkauf schärfen, sodass diese exakt auf die verwendeten Sprachressourcen abgestimmt sind.

Qualität einer Sprachressource

Vergleichen Sie die durchschnittliche Bearbeitungszeit von Aufgaben, die mit einer bestimmten Sprachressource vorübersetzt wurden, bevor und nachdem Sie sie in der TM Maintenance oder über einen Re-Import zur Bereinigung bearbeitet haben.

Eignung einer Sprachressource für einen bestimmten Kunden oder ein bestimmtes Fachgebiet

Finden Sie heraus, welche LLM-Ressourcen sich für einen bestimmten Kunden oder ein bestimmtes Fachgebiet am besten eignen, indem Sie für ähnliche Texte, die aber mit verschiedenen Ressourcen übersetzt wurden, die Nachbearbeitungszeit und Levenshtein-Distanz analysieren.

Effizienz der Linguist

*

/innen

Prüfen Sie, wie unterschiedlich stark Ihre Linguist*/innen die maschinell vorübersetzten Segmente bearbeiten und wie viel Zeit sie auf diese Arbeit verwenden, indem Sie im erweiterten Filter einen Benutzerfilter setzen. Auf diese Weise werden jeweils diejenigen Werte angezeigt, die sich auf alle Segmente beziehen, die der*/die im Filter eingetragene Benutzer*/in als letzte*/r im jeweiligen Workflow-Schritt gespeichert hat. Eine zu geringe Nachbearbeitungszeit könnte beispielsweise bedeuten, dass ein*/e Post-Editor*/in seine*/ihre Arbeit nicht gewissenhaft ausführt, während eine sehr hohe Bearbeitungszeit darauf hinweisen könnte, dass der*/die Post-Editor*/in (zu) viele und möglicherweise auch unnötige Änderungen vornimmt, insbesondere, wenn gleichzeitig auch die durchschnittliche Levenshtein-Distanz auffällig hoch ist.

Image Modified	Diejenigen Segmente, die in einem Workflow-Schritt bearbeitbar waren, aber nicht bearbeitet wurden, zählen jeweils in die Berechnung für diejenigen Benutzer

*

/innen mit, welche eine Aufgabe als letzte abgeschlossen haben.

Messen der effektiven Bearbeitungszeit

Verrechnen Sie Ihre Dienstleistungen mit einer akkuraten akkurater Exaktheit, indem Sie genau diejenige Bearbeitungszeit verrechnen, die von translate5 gemessen wurde.

Page tree

Page History

Versions Compared

Old Version 15

New Version Current

Key

Versionierung

Durchschnittliche Levenshtein-Distanz

Levenshtein-Distanz auf Segmentebene

Messpunkte in translate5

Berechnung und Gewichtung

Messung der Zeichenänderungen innerhalb der Segmente

Statistiktypen

vor Beginn des Workflows

Anchorpre_workflowpre_workflow

innerhalb eines Workflow-Schritts Anchorin_workflow-stepin_workflow-step

seit Import/Vorübersetzung Anchor

since_import_

pre-

translationsince_import_pre-translation

nach Ende des Workflows Anchorpost_workflowpost_workflow

Statistiken je Benutzer

/in

Benutzerfilter

Messung bei Wiederholungen

Umgang mit Wiederholungen, die via Wiederholungseditor bearbeitet werden

Durchschnittliche Nachbearbeitungszeit

Berechnung und Gewichtung

Umgang mit Wiederholungen, die via Wiederholungseditor bearbeitet werden

Anwendbare Filter Anchorusable_filtersusable_filters

Erweiterter Filter

Spaltenfilter

Verhalten bei inkonsistenten Workflows

Verhalten bei inkonsistenten Workflows

Auswertungen aufrufen

Auswertungen aufrufen

Auswertungen außerhalb translate5 weiterbearbeiten

Anwendungsmöglichkeiten

Qualität der MT- oder LLM-Übersetzung

Qualität einer Sprachressource

Eignung einer Sprachressource für einen bestimmten Kunden oder ein bestimmtes Fachgebiet

Effizienz der Linguist

/innen

Messen der effektiven Bearbeitungszeit

Anchor
pre_workflow
pre_workflow

innerhalb eines Workflow-Schritts
Anchor
in_workflow-step
in_workflow-step

seit Import/Vorübersetzung
Anchor

translation
since_import_pre-translation

nach Ende des Workflows
Anchor
post_workflow
post_workflow

Anwendbare Filter
Anchor
usable_filters
usable_filters