
Dateiformate für die technische Übersetzung
Transline übersetzt Dokumente aus allen übliche Dateiformaten unter Windows, Mac und Linux:
- Access
- AmiPro
- CorelDRAW
- EPS
- EXE
- Excel
- FrameMaker
- HTML
- Illustrator
- InDesign
- Interleaf
- Nur Text
- Open Office
- PageMaker
- Papiervorlagen
- Postscript
- PowerPoint
- QuarkXPress
- QuickSilver
- Ressource-Dateien
- SGML
- Software-Übersetzungen
- Ventura
- WinWord
- WordPerfect
- WordPro
- XML
Sie können wählen, ob Sie Ihre Übersetzung im Ausgangsformat oder einem anderen, strukturell verwandten Dateiformat zurückerhalten möchten. Transline übernimmt für Sie den Konvertierungsprozess.
Übersetzbarkeit von Dateiformaten
Die verschiedenen Dateiformate unterscheiden sich hinsichtlich ihrer Übersetzbarkeit. Manche Formate können vom Übersetzer direkt und ohne technische Vorbereitung übersetzt werden. Andere Formate müssen für den Übersetzungsprozess vor- und ggf. auch nachbereitet werden, um eine hohe Qualität der Übersetzung sicherstellen zu können.
Auch der Einsatz von Translation-Memory-Systemen und Terminologiedatenbanken, wodurch insbesondere bei größeren Volumina sowie bei mehrmals wiederkehrenden Textsegmenten die Qualität gesteigert und die Kosten gesenkt werden können, ist bei den meisten Dateiformaten nur mit Vor- bzw. Aufbereitung der Dokumente möglich. Daher bildet die Übersetzbarkeit eines Dateiformats einen wichtigen Bestandteil der Preisgestaltung bei Transline.
Die unterschiedlichen Anforderungen bei der Bearbeitung verschiedener Dateiformate lassen sich an den folgenden Beispielen verdeutlichen.
FrameMaker-Dateien
Die von vielen Firmen als Layoutprogramm eingesetzte Anwendung FrameMaker benutzt eine untypische Codierung für die Textzeichen. Dies hat in der Vergangenheit vielen Übersetzern das Leben schwer gemacht, da hierdurch automatische Übersetzungsprozesse quasi unmöglich waren.
Inzwischen hat sich das Problem verlagert. Mit den neuesten Patches von FrameMaker ist es inzwischen möglich, die lateinischen Standard-Schriftzeichen in eine gängige Textverarbeitung zu konvertieren. Nach wie vor schwierig ist die Situation allerdings bei Sprachen mit seltenen Sonderzeichen, wie z. B. den baltischen Sprachen. Hier muss oftmals improvisiert werden, was den Übersetzungsprozess verlängern und damit teurer machen kann. Auch die Sprachen, deren Schrift nicht auf den lateinischen Zeichen basiert, wie etwa Griechisch, Chinesisch oder Japanisch, können ein Problem darstellen.
Unabhängig von der verarbeitbaren Sprache sind FrameMaker-Dateien nicht einfach zu übersetzen, da das übliche Copy-and-paste-Prinzip nicht funktioniert. Nur über einen unkonventionellen Umweg kommen die übersetzten Texte dorthin, wohin sie sollen.
Transline hat eine eigene Schnittstelle entwickelt, um FrameMaker-Dateien in Übersetzungsdatenbanken einzubinden, wo diese mit Hilfe des Translation-Memory-Systems Across übersetzt werden können. Anschließend werden die Dateien wieder in das Ursprungsformat zurück verwandelt. Dieser Austausch, der das oben beschriebene Formatierungsproblem umgeht, wird durch das plattformübergreifende Maker Interchange Format (MIF) möglich gemacht. Alle Dateiinformationen werden in MIF-Befehle übersetzt und können so von Across gelesen werden. FrameMaker interpretiert die Befehle in der MIF-Datei und wandelt sie wieder in die eigenen Format- und Layouteinstellungen um.
Dadurch kann Transline Ihnen Übersetzungen von FrameMaker-Dateien vergleichsweise günstig anbieten.
PDF-Dateien
PDF (Portable Document Format) ist ein Austauschformat für fertig gestellte Dokumente, das nicht bzw. nur in begrenztem Umfang editiert werden kann und nicht mit üblichen Textverarbeitungsprogrammen vergleichbar ist. Daher eignet sich PDF nicht ohne weiteres zur Übersetzung. Bei Transline können Ihre PDF-Dokumente jedoch ausgelesen und in ein editier- und übersetzbares Format übertragen werden.
Optical Character Recognition (OCR), zu deutsch optische Zeichenerkennung, verwandelt eine Bilddatei oder ein gescanntes Schriftstück in editierbaren Text. Das OCR-System von Transline erkennt Texte in 122 Sprachen. Es nimmt Daten von einem am PC angeschlossenen Scanner entgegen oder bearbeitet Bilddateien der Formate PDF, TIFF, JPEG, PNG, BMP, PCX oder DCX. Das Ergebnis des Erkennungsprozesses speichert das OCR-System wahlweise als PDF, Textdatei, RTF-, HTML-, CSV- oder DBF-Datei sowie im Format von Microsoft Word oder Excel in den Versionen 95 bis 2007.
Dateien, die mit dem OCR-System eingelesen werden, müssen in jedem Fall von einem Mitarbeiter geprüft werden.
Dank zahlreicher Funktionen kann das von Transline angepasste OCR-System auch Spaltensatz, mehrsprachige Texte oder Tabellen einlesen. Bei Eigennamen, Ligaturen, Sonderzeichen oder verschnörkelter Schrift zeigt sich das OCR-System lernfähig, wobei sich der Trainingsaufwand umso mehr lohnt, je umfangreicher der Text ist, auf den das neu Gelernte angewendet werden soll.
Schwierigkeiten ergeben sich bei Handschriften, sehr kleiner Schrift, gedrehten Textteilen, weißer Schrift auf farbigem Hintergrund und Vorlagen, die in einer niedrigen Auflösung eingescannt wurden.
Stehen neben einem PDF-Dokument noch Originaldaten z. B. in QuarkXPress oder Indesign zur Verfügung, sind solche Formate vorzuziehen, da dann der Bearbeitungsprozess mit dem OCR-System entfällt.

