Formats de fichiers pour la traduction technique

Transline assure à votre demande la traduction de documents dans l'ensemble des formats de fichiers courants sous Windows, Mac et Linux :

  • Access
  • AmiPro
  • CorelDRAW
  • EPS
  • EXE
  • Excel
  • FrameMaker
  • HTML
  • Illustrator
  • InDesign
  • Interleaf
  • Texte seul
  • Open Office
  • PageMaker

Vous pouvez choisir le format de livraison. Nous vous livrons la traduction soit dans le format de départ, soit dans un autre format de structure similaire. Transline se charge de la conversion de vos fichiers.

Adéquation des différents formats de fichiers

Les différents formats de fichiers sont plus ou moins propices à la traduction. De nombreux formats peuvent être directement traduits par le traducteur sans nécessiter aucune préparation technique. D'autres formats nécessitent en revanche un préformatage, puis un post-formatage, dans le cadre du processus de traduction, afin de pouvoir garantir la qualité de la traduction.

L'utilisation de systèmes de mémoire de traduction et de bases de données terminologiques, grâce auxquels il devient possible d'assurer la qualité tout en réduisant les coûts, notamment pour les gros volumes de traduction ou les segments récurrents, implique également une préparation des documents pour la plupart des formats de fichiers. L'adéquation d'un format de fichiers à la traduction constitue un paramètre essentiel dans l'estimation du coût de la traduction.

Les divers critères intervenant dans le traitement de différents formats de fichier sont illustrés au travers des exemples suivants.

Fichiers FrameMaker

FrameMaker est un outil de création et de publication de documents utilisé par de nombreuses entreprises et intégrant un codage inhabituel pour les textes. Cet état de fait a compliqué la vie de bien des traducteurs par le passé, car ce codage ne permettait quasiment pas de recourir à des processus de traduction automatiques.

Le problème s'est entretemps déplacé. Grâce aux nouveaux correctifs de FrameMaker, il est désormais possible de convertir les textes en alphabet latin standard sous un format de traitement de texte courant. Toutefois, la situation reste toujours aussi complexe pour les langues utilisant des caractères spéciaux rares, comme les langues baltes par exemple. L'improvisation est souvent de mise, et entraîne un allongement du processus de traduction et une augmentation des coûts. Les langues utilisant un alphabet autre que l'alphabet latin, comme le grec, le chinois ou le japonais, peuvent également générer des difficultés.

Indépendamment des difficultés liées à la langue traitée, les fichiers FrameMaker ne sont pas simples à traduire, car le copier-coller ordinaire ne fonctionne pas. Seuls des moyens détournés peu orthodoxes permettent de mettre les textes traduits à leur place.

Transline a mis au point sa propre interface permettant d'intégrer des fichiers FrameMaker dans des bases de données de traduction, où ils peuvent être traités à l'aide du système de mémoire de traduction Across. Les fichiers sont ensuite reconvertis dans leur format d'origine. Cette méthode permettant de contourner le problème de formatage mentionné précédemment utilise le format Maker Interchange Format (MIF), un format multiplateforme. Toutes les informations contenues dans le fichier sont traduites en commandes MIF, qu'Across peut ensuite lire. FrameMaker interprète les commandes dans le fichier MIF et les convertit en caractéristiques de formatage et de mise en page.

Cette stratégie permet à Transline de vous proposer la traduction de fichiers FrameMaker à des tarifs attractifs.

Fichiers PDF

Le PDF (Portable Document Format) est un format d'échange de documents finalisés, dont le contenu n'est modifiable que dans une certaine mesure. Il n'est donc en rien comparable à un logiciel de traitement de texte. D'emblée, le format PDF n'est pas compatible avec la traduction. Transline est néanmoins en mesure d'extraire le texte de vos documents PDF et de le transférer sous un format modifiable et exploitable pour la traduction.

La reconnaissance optique de caractères (ROC, ou OCR de l'anglais « Optical Character Recognition ») convertit un fichier d'image ou un texte numérisé en texte modifiable. Le système ROC de Transline est capable d'effectuer la détection en 122 langues. Il récupère les données transmises par un scanner raccordé à l'ordinateur ou il traite des fichiers d'image aux formats PDF, TIFF, JPEG, PNG, BMP, PCX ou DCX. Le système ROC enregistre le résultat du processus de reconnaissance sous différents formats au choix, PDF, fichier texte, RTF, HTML, CSV ou DBF, ainsi qu'aux formats Microsoft Word ou Excel (versions 95 à 2007).

Le texte récupéré par le système ROC dans les fichiers doit systématiquement être relu par un collaborateur.

Grâce à la multitude de fonctions dont il dispose, le système ROC personnalisé par Transline est également capable de traiter des tableaux, des textes multilingues ou les compositions en colonnes. Il est en mesure d'apprendre à reconnaître les noms propres, les ligatures, les caractères spéciaux ou une police tortueuse. Plus le volume de texte permettant d'exploiter ces nouveaux acquis est conséquent, plus il est payant de consacrer tout le temps nécessaire à cet apprentissage.

Des difficultés surviennent en présence de textes manuscrits, d'une police très petite, de textes orientés différemment, d'une police blanche sur un fond de couleur et de documents numérisés en faible résolution.

Si vous disposez, en plus du fichier PDF, du fichier d'origine, par exemple au format QuarkXPress ou Indesign, il est préférable d'utiliser ces formats pour la traduction, car il n'est plus nécessaire de traiter le fichier avec le système ROC.