translate5 misst standardmäßig in jedem Workflow die Levenshtein-Distanz wie auch die Post-editing-Zeit. Beide Werte können jederzeit und bei Bedarf mit Filterung in der Aufgabenübersicht aufgerufen werden.
Die Levenshtein-Distanz (auch Editierdistanz) zwischen zwei Zeichenketten ist die minimale Anzahl einfügender, löschender und ersetzender Operationen, um die erste Zeichenkette in die zweite umzuwandeln. Benannt ist die Distanz nach dem russischen Wissenschaftler Wladimir Lewenstein (engl. Levenshtein), der sie 1965 einführte (vgl. Levenshtein-Distanz auf Wikipedia).
Die Formel für die Berechnung der Levenshtein-Distanz ist – vereinfacht – wie folgt:

Die Formel für die Berechnung der durchschnittlichen Levenshtein-Distanz in translate5 ist wie folgt:

Die durchschnittliche Nachbearbeitungszeit ist diejenige Zeit, während der ein oder mehrere Benutzer ein Segment in translate5 bearbeitet. Das können Benutzer innerhalb eines Workflow-Schritts sein, aber auch ein Projektmanager, der zwischendurch Änderungen an einem Segment vornimmt.
Die Formel für die Berechnung der durchschnittlichen Nachbearbeitungszeit in translate5 ist wie folgt:

| Die Zeitmessung startet beim Öffnen eines Segments zur Bearbeitung und endet, wenn das Segment wieder gespeichert/geschlossen wird. |
|---|
In translate5 werden die Levenshtein-Distanz je Segment berechnet sowie die Nachbearbeitungszeit gemessen und als durchschnittlicher Prozentsatz, respektive Zeitangabe auf Aufgabenebene zur Abfrage zur Verfügung gestellt. Das heißt, Sie können jederzeit die durchschnittliche Nachbearbeitungszeit und Levenshtein-Distanz einer Aufgabe abrufen, für unterschiedliche Zeitpunkte und Zeitspannen innerhalb des Projekts:
| Zeitpunkt/Zeitspanne | Erläuterung |
|---|---|
vor Beginn des Workflows: | Zeigt die durchschnittliche Levenshtein-Distanz, die aufgrund von Änderungen zustande kam, die vor Beginn des Workflows angebracht wurden, z.B. wenn der Projektmanager vor der Zuweisung eines Benutzers Änderungen an den Segmenten vornimmt. |
| innerhalb eines Workflow-Schritts: | Zeigt die durchschnittliche Levenshtein-Distanz innerhalb eines Workflow-Schrittes zwischen der Version vor der Bearbeitung innerhalb eines Workflow-Schrittes und der letzten Bearbeitung innerhalb des Workflow-Schrittes. |
| ab Beginn des Workflows: | Zeigt die durchschnittliche Levenshtein-Distanz vom Beginn des Workflows zwischen der Version des Segments zu Beginn des Workflows und seiner letzten vorhandenen Bearbeitung. |
| nach Ende des Workflows: | Zeigt die durchschnittliche Levenshtein-Distanz über den kompletten Workflow gesehen. |
| Zeitpunkt/Zeitspanne | Erläuterung |
|---|---|
vor Beginn des Workflows: | Zeit, welche für Änderungen vor Beginn des Workflows aufgewendet wurden, z.B. wenn der Projektmanager vor der Zuweisung eines Benutzers Änderungen an den Segmenten vornimmt. |
| innerhalb eines Workflow-Schritts: | Zeit, welche die Benutzer benötigen, um ein Segment innerhalb eines Workflow-Schritts (z.B. Übersetzung, Lektorat usw.) zu bearbeiten, sprich die aufsummierte Zeit, die alle am Workflow beteiligten Benutzer durchschnittlich für die Bearbeitung der Segmente aufgewendet haben. |
| ab Beginn des Workflows: | Zeit, die für die Bearbeitung eines Segments, für alle Bearbeitungen ab Workflow-Start benötigt wird, sprich für den kompletten Workflow bis zum aktuellen Zeitpunkt. |
| nach Ende des Workflows: | Zeit, die insgesamt für die Bearbeitung eines Segments während des kompletten Workflows benötigt wurde. |
| Wenn in der Aufgabenübersicht kein Benutzerfilter gesetzt ist, wird die Nachbearbeitungszeit eines Segments berechnet, indem alle Bearbeitungszeiten aller Benutzer innerhalb dieses Workflow-Schritts einschließlich der PM-Bearbeitungen addiert werden. Wurde für den/die Workflow-Schritt(e) eine Filterung festgelegt, werden nur die Nachbearbeitungszeiten innerhalb des/der gefilterten Workflow-Schritt(e) berücksichtigt (werden aber trotzdem für alle Workflow-Schritte addiert). Wenn einer oder mehrere der Filter „Matchrate“, „Ressourcentyp“ oder „Sprachressourcen“ verwendet werden, werden nur diejenigen Segmente berücksichtigt, die dieser Filterung entsprechen. Für die Nachbearbeitungszeit kann zusätzlich ein Filter auf Benutzer- oder Workflow-Schritt-Ebene berücksichtigt werden; für die Levenshtein-Distanz werden diese Filter hingegen ignoriert. Die Berechnung der Levenshtein-Distanz erfolgt unabhängig davon, wer das Segment innerhalb des Workflow-Schrittes bearbeitet hat und wann. |
|---|---|
| Die Basiseinheit für die Berechnungen sind ausschließlich diejenigen Segmente, die aktuell bearbeitbar sind. |
| Für Segmente, die nicht innerhalb eines Workflow-Schrittes bearbeitet wurden, wird die Levenshtein-Distanz für diesen Schritt als 0 gespeichert, sobald der letzte Benutzer eines Workflow-Schrittes seine Arbeit beendet hat. Für die Berechnung der Nachbearbeitungszeit werden solche Segmente nicht berücksichtigt. |
| Wenn die Segmente vorübersetzt wurden, gilt die Vorübersetzung als erste Version, und der Übersetzungsschritt wird bei der Levenshtein-Berechnung berücksichtigt. |
| Wenn auf die für die Vorübersetzung verwendete Sprachressource gefiltert wird, wird die als erste für die Vorübersetzung verwendete Sprachressource berücksichtigt – auch dann, wenn der Benutzer anschließend manuell etwas anderes aus dem Fuzzy-Match-Panel übernimmt. |
| Benötigen Sie nur die Auswertungen für eine einzige Aufgabe, so bietet sich eine Filterung über die Aufgaben-ID-Spalte an. |



Die Möglichkeit, Filter zu kombinieren reicht Ihnen nicht aus, um genau auf diejenigen Auswertungen zu kommen, die Sie benötigen? Dann können Sie die Auswertungen jederzeit auch exportieren und z.B. in Excel weiterbearbeiten. Klicken Sie dazu auf „Meta-Daten exportieren“ und Sie erhalten in Kürze eine herunterladbare Excel-Datei, die alle in der aktuellen Filterung enthaltenen Spalten und deren Werte beinhaltet:

Die Messung der Nachbearbeitungszeit und der Levenshtein-Distanz birgt umfassende Möglichkeiten, verschiedene Kennzahlen im Übersetzungsprozess zu evaluieren und Ressourcen-, aber auch Leistungsqualitäten zu beurteilen. Nachfolgend einige Inputs; die Liste ist natürlich bei weitem nicht abschliessend:
Vergleichen Sie die Qualität verschiedener MT-/LLM-Engines, indem Sie die durchschnittliche Bearbeitungszeit und Levenshtein-Distanz der Aufgaben/Segmente betrachten, die mit den entsprechenden Ressourcen vorübersetzt wurden. Ausgehend von den gewonnenen Erkenntnissen können Sie beispielsweise auch Ihre Rabattstaffelung für den Einkauf schärfen, sodass diese exakt auf die verwendeten Sprachressourcen abgestimmt sind.
Vergleichen Sie die durchschnittliche Bearbeitungszeit von Aufgaben, die mit einer bestimmten Sprachressource vorübersetzt wurden, bevor und nachdem Sie sie in der TM Maintenance oder über einen Re-Import zur Bereinigung bearbeitet haben.
Finden Sie heraus, welche LLM-Ressourcen sich für einen bestimmten Kunden oder ein bestimmtes Fachgebiet am besten eignet, indem Sie für ähnliche Texte, die aber mit verschiedenen Ressourcen übersetzt wurden, die Nachbearbeitungszeit und Levenshtein-Distanz analysieren.
Prüfen Sie, wie unterschiedlich stark Ihre Linguisten die maschinell vorübersetzten Segmente bearbeiten und wie viel Zeit sie auf diese Arbeit verwenden.
Verrechnen Sie Ihre Dienstleistungen mit einer akkuraten Exaktheit, indem Sie genau diejenige Bearbeitungszeit verrechnen, die von translate5 gemessen wurde.