Μπορείτε να χρησιμοποιείτε το OmegaT για να μεταφράσετε αρχεία σε πολλές διαφορετικές μορφές. Υπαρχουν, βασικά, δύο είδη μορφών αρχείου, απλό κείμενο και μορφοποιημένο κείμενο.
Τα αρχεία απλού κειμένου περιέχουν μόνον κείμενο, οπότε, η μετάφρασή τους είναι τόσο απλή σαν να πληκτρολογείτε τη μετάφραση. Υπάρχουν διάφορες μέθοδοι για να ορίσετε την κωδικοποίηση αρχείου, ούτως ώστε τα αρχεία του να μην είναι αλλοιωμένα όταν ανοίγουν στο OmegaT. Αυτά τα αρχεία δεν περιέχουν καμία πληροφορία μορφοποίησης πέραν του "κενού χώρου" που χρησιμοποιείται για τη στοίχιση του κειμένου, την υπόδειξη παραγράφων, ή την εισαγωγή αλλαγής σελίδας. Δεν μπορούν να περιέχουν ή να διατηρούν πληροφορίες για το χρώμα, τη γραμματοσειρά του κειμένου κλπ.. Τρεχόντως, το OmegaT υποστηρίζει τις εξής μορφές απλού κειμένου:
Κείμενο με χαρακτήρες ASCII (.txt, κλπ.)
Κωδικοποιημένο κείμενο (*.UTF8)
Δεσμίδες πόρων Java resource bundles (*.properties)
Αρχεία PO (*.po)
Αρχεία INI key=value (*.ini)
Αρχεία DTD (*.DTD)
Αρχεία DokuWiki (*.txt)
Αρχεία υποτίτλων SubRip (*.srt)
Αρχεία Magento CE Locale CSV (*.csv)
Το OmegaT μπορεί να χειρίζεται και άλλους τύπους αρχείων απλού κειμένου, συνδέοντας την επέκτασή τους με μία υποστηριζόμενη μορφή αρχείου (π.χ., τα αρχεία .pod μπορούν να συνδεθούν με το φίλτρο κειμένου ASCII) και με την προ-επεξεργασία τους με ειδικούς κανόνες κατάτμησης.
Τα αρχεία PO μπορούν να περιέχουν τόσο το αρχείο προέλευσης, όσο και το αρχείο στόχο. Από αυτή τη σκοπιά, είναι συγχρόνως αρχεία απλού κειμένου αλλά και μεταφραστικές μνήμες. Αν για ένα δεδομένο τμήμα προέλευσης δεν υπάρχει, ακόμη, μια μετάφραση στη μνήμη του μεταφραστικού έργου (project_save.tmx), τότε η παρούσα μετάφραση θα αποθηκευθεί στο project_save.tmx ως μετάφραση προεπιλογής. Σε περίπτωση, πάντως, που το ίδιο τμήμα προέλευσης υπάρχει ήδη με μια διαφορετική μετάφραση, τότε η νέα μετάφραση θα αποθηκευθεί ως εναλλακτική.
Τα μορφοποιημένα αρχεία κειμένου περιέχουν πληροφορίες για το είδος γραμματοσειράς, μέγεθος, χρώμα κλπ. καθώς επίσης και για το κείμενο. Συνήθως, δημιουργούνται με προγράμματα επεξεργασίας κειμένου, ή με προγράμματα επεξεργασίας HTML. Αυτές οι μορφές αρχείου σχεδιάστηκαν για να κρατούν πληροφορίες μορφοποίησης. Οι πληροφορίες μορφοποίησης μπορεί να είναι τόσο απλές όπως “αυτό είναι με bold”, ή τόσο σύνθετες, όπως ένας πίνακας δεδομένων με διαφορετικά μεγέθη γραμματοσειρών, χρώματα, θέσεις, κλπ. Στα περισσότερα εργαλεία μετάφρασης, θεωρείται σημαντικό η μορφοποίηση του αρχικού κειμένου να διακρατάται στη μετάφραση. Το OmegaT σας επιτρέπει να το πετύχετε, επισημαίνοντας τους χαρακτήρες/λέξεις που έχουν μια ειδική μορφοποίηση, με εύκολα διαχειρίσιμες ετικέτες. Απλοποιώντας, η αρχική μορφοποίηση κειμένου συνεισφέρει τα μέγιστα στη μείωση του αριθμού των ετικετών. Όπου είναι εφικτή, η ενοποίηση γραμματοσειρών, μεγέθους, χρωμάτων, κλπ. που χρησιμοποιούνται στο έγγραφο, απλοποιεί το έργο της μετάφρασης και μειώνει τον πιθανό αριθμό των σφαλμάτων ετικέτας. Το OmegaT χειρίζεται διαφορετικά το κάθε είδος αρχείου. Μπορείτε να ορίσετε μια ειδική συμπεριφορά για τα φίλτρα αρχείου. Κατά τη στιγμή που γράφονται αυτές οι εξηγήσεις, το OmegaT υποστηρίζει τις εξής μορφοποιημένες μορφές αρχείου:
ODF - OASIS Μορφή Ανοιχτών Εγγράφων ODF (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)
Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)
(X)HTML (*.html, *.xhtml,*.xht)
Μεταγλωττιστής βοήθειας HTML (*.hhc, *.hhk)
DocBook (*.xml)
XLIFF (*.xlf, *.xliff, *.sdlxliff) - of the source=target variety
QuarkXPress CopyFlowGold (*.tag, *.xtg)
Αρχεία ResX (*.resx)
Android resource (*.xml)
LaTex (*.tex, *.latex)
Αρχεία Βοήθειας (*.xml) και Εγχειριδίου (*.hmxp)
Typo3 LocManager (*.xml)
Τοπικοποίηση WiX (*.wxl)
Iceni Infix (*.xml)
Εξαγωγή σε Flash XML (*.xml)
Wordfast TXML (*.txml)
Camtasia για Windows (*.camproj)
Visio (*.vxd)
Το OmegaT μπορεί να χερίζεται και άλλα είδη μορφοροποιημένων αρχείων, συνδέοντας τις επεκτάσεις τους με μια από τις υποστηριζόμενες μορφές αρχείου, υπό την προϋπόθεση ότι οι αντίστοιχοι κανονες κατάτμησης θα τα καταμήσουν σωστά.
Μπορεί να υπάρχουν και άλλες μορφές αρχείου απλού κειμένου, ή και μορφοποιημένου κειμένου, κατάλληλες για επεξεργασία από το OmegaT.
Μπορείτε να χρησιμοποιείτε εξωτερικά εργαλεία για μετατροπή των αρχείων στις υποστηριζόμενες μορφές. Τα μεταφρασμένα αρχεία θα πρέπει, μετά, να ξαναμετατραπούν στην αρχική τους μορφή. Για παράδειγμα, αν έχετε μια παρωχημένη έκδοση του Microsoft Word, η οποία δεν μπορεί να χειρισθεί τη μορφή ODT, ορίστε μια άμεση λύση για αρχεία Word με την επέκταση .DOC:
Εισαγωγή του αρχείου στο πρόγραμμα επεξεργασίας κειμένου ODF
Αποθήκευση του αρχείου σε μορφή ODT
Μεταφράστε το στο αρχείο-στόχο σε μορφή ODT
Φορτώστε το αρχείο-στόχο στο πρόγραμμα επεξεργασίας κειμένου με ODF
Αποθηκεύστε το αρχείο σε μορφή DOC
Η ποιότητα μορφοποίησης του μεταφρασμένου κειμένου θα εξαρτηθεί από την ποιότητα της διαδικασίας μετατροπής. Πριν προχωρήσετε με τέτοιες μετατροπές, βεβαιωθείτε πως ελέγξατε όλες τις επιλογές. Ελέγξτε την αρχική σελίδα του OmegaT για έναν ενημερωμένο κατάλογο με τα βοηθητικά εργαλεία μετάφρασης.
Η στοίχιση μεταξύ τμημάτων προέλευσης και στόχου εξαρτάται από τις γλώσσες του έργου. Από προεπιλογή, η αριστερή στοίχιση χρησιμοποιείται για τις γλώσσες από-αριστερά-προς-τα-δεξιά (LTR), ενώ η δεξιά στοίχιση για τις γλώσσες από δεξιά-προς-τα-αριστερά (RTL). Μπορείτε να αλλάζετε μεταξύ των διαφόρων τρόπων εμφάνισης, πατώντας Shift + Ctrl + O (αυτό είναι το γράμμα O και όχι ο αριθμός 0). Ο τρόπςο εναλλαγής με Shift + Ctrl + O έχει τρεις καταστάσεις:
Στοίχιση προεπιλογής, αυτή ορίζεται από τη γλώσσα
Αριστερή στοίχιση
Δεξιά στοίχιση
Με τη χρήση του RTL, το OmegaT δεν έχει απολύτως καμία επιρροή στον τρόπο εμφάνισης των μεταφρασμένων εγγράφων που δημιουργήθηκαν στο OmegaT. Ο τρόπος εμφάνισης των μεταφρασμένων εγγράφων πρέπει να τροποποιείται με την ίδια εφαρμογή (πχ. με το Microsoft Word) που χρησιμοποιείτε συνήθως για να τα εμφανίζετε, ή για να τα τροποποιείτε (ελέγξτε τα ανάλογα εγχειρίδια για παραπάνω λεπτομέρειες). Η χρήση του Shift + Ctrl + O προκαλεί μια αλλαγή στο κείμενο εισαγωγής και εμφάνισης στο OmegaT. Μπορεί να χρησιμοποιείται χωριστά και στις τρεις περιοχές (Επεξεργασίας, Ατελούς αντιστοίχισης/ Fuzzy Match και Γλωσσαρίου), κάνοντας κλικ στην περιοχή και εναλλάσσοντας τον τρόπο εμφάνισης. Μπορεί, επίσης, να χρησιμοποιείται σε όλα τα πεδία εισαγωγής που υπάρχουν στο OmegaT - στο παράθυρο αναζήτησης, για τους κανόνες κατάτμησης κλπ.
Σημείωση για χρήστες Mac OS X: χρησιμοπιοείτε τη συντόμευση Shift + Ctrl + O και όχι το cmd+Ctrl+O.
Όταν γράφετε καθαρό κείμενο RTL, μπορείτε να χρησιμοποιείτε την προεπιλεγμένη εμφάνιση (LTR). Σε πολλές περιπτώσεις, πάντως, είναι απαραίτητο να ενσωματώσετε κείμενο LTR σε κείμενο RTL. Για παράδειγμα, στις ετικέτες του OmegaT, τα ονόματα προϊόντων που πρέπει να μείνουν στη γλώσσα πηγής LTR, τοποθετούν holders στα αρχεία τοποικοποίησης και αριθμούς στο κείμενο. Σε περιπτώσεις σαν κι αυτές, καθίσταται απαραίτητη η εναλλαγή σε τρόπο RTL, ούτως ώστε το κείμενο RTL (στην πράξη αμφίδρομο) να εμφανίζεται σωστά. Θα πρέπει να έχετε υπ΄όψη πως όταν το OmegaT είναι σε τρόπο RTL, τόσο οι πηγές κόσο και ource and target are displayed in RTL mode. Αυτό σημαίνει πως αν η γλώσσα προέλευσης είναι LTR και η γλώσσα στόχος είναι RTL, ή το αντίθετο, μπορεί να καταστεί απαραίτητο να εναλάσσεστε μρπςο-πίσω μεταξύ RTL and LTR modes to view the source and enter the target easily in their respective modes.
Όπως είπαμε παραπάνω, οι ετικέτες OmegaT είναι συμβολοσειρές LTR. Όταν μεταφράζετε μεταξύ γλωσσών RTL και LTR, η σωστή ανάγνωση ετικετών από την πηγή και η σωστή εισαγωγή τους στο στόχο μπορεί να απαιτήσουν από τον μεταφραστή να εναλλάσσεται πολλές φορές μεταξύ των τρόπων LTR και RTL.
Αν το έγγραφο επιτρέπει, ο μεταφραστής ενθαρρύνεται ιδιαίτερα να διαγράφει τις πληροφορίες προτύπων (style) από το αρχικό έγγραφο, ούτως ώστε, στη διεπαφή του OmegaT, να εμφανίζονται όσο λιγώτερες ετικέτες γίνεται. Ακολυθήστε τις οδηγίες που προσφέρονται στις Συμβουλές (Hints) σχετικά με τη διαχείριση ετικετών. Να επικυρώνετε συχνά τις ετικέτες (βλέπε επικύρωση Tag) και να δημιουργείτε μεταφρασμένα έγγραφα (βλέπε παρακάτω και στο Μενού), ανά τακτά διαστήματα, για ευκολώτερο εντοπισμό οποιωνδήποτε προβλημάτων που ανακύπτουν. Μια συμβουλή: μπορεί να αποδειχθεί μικρώτερος μπελάς να μεταφράζετε ένα απλό αρχείο κειμένου και να προσθέσετε τα απαραίτητα πρότυπα μορφοποίησης (style), με την κατάλληλη εφαρμογή, σε ένα μεταγενέστερο στάδιο.
Όταν δημιουργηθεί το μεταφρασμένο έγγραφο, η κατεύθυνση με την οποία εμφανίζεται θα είναι η ίδια με εκείνη του αρχικού εγγράφου. Αν το αρχικό έγγραφο ήταν σε LTR, η κατεύθυνση εμφάνισης του εγγράφου στόχου πρέπει να αλλαχθεί χειρονακτικά σε RTL με την εφαρμογή που χρησιμοποιείται για την προβολή του. Η κάθε μορφή εξόδου έχει ειδικούτς τρόπους διαχείρισης της εμφάνισης RTL. Ανατρέξτε στα αντίστοιχα εγχειρίδια των εφαρμογών για περισσότερες λεποτομέρειες.
Για τα αρχεία .docx, κάποιες αλλαγές γίνονται, πάντως, με αυτόματο τρόπο:
Για να αποφύγετε να αλλάζετε τις παραμέτρους εμφάνισης των αρχείων στόχου κάθε φορά που ανοίγουν τα αρχεία, είναι δυνατόν να αλλάξετε τις παραμέτρους εμφάνισης του αρχείου προέλευσης με τρόπο ώστε αυτές οι παράμετροι να κληρονομούνται από τα αρχεία-στόχο. Για παράδειγμα, τέτοιες αλλαγές είναι εφικτές στα αρχεία ODF.