OmegaT 3.1 - Manual do Usuário

Arquivos para traduzir

Formatos de arquivos

Com o OmegaT você pode traduzir diversos formatos de arquivo. Basicamente há dois tipos de formatos, o texto simples e o texto formatado.

Arquivos de texto simples

Os arquivos de texto simples contêm apenas texto, portanto sua tradução é um processo simples de inserção do texto. Há diversos métodos para codificar os arquivos de forma que seus conteúdos não apareçam truncados quando abertos no OmegaT. Tais arquivos não contêm nenhuma informação de formatação além do "espaço em branco" usado para alinhar texto, indicar parágrafos ou inserir quebra de páginas. Eles não podem conter ou reter informações sobre a cor, tipo de fonte, etc. do texto. Atualmente, o OmegaT é compatível com os seguintes formatos de texto simples:

  • ASCII text (.txt, etc.)

  • Texto codificado (*.UTF8)

  • Pacotes de recursos Java (*.properties)

  • Arquivos PO (*.po)

  • Arquivos INI (key=value) (*.ini)

  • Arquivos DTD (*.DTD)

  • Arquivos DokuWiki (*.txt)

  • Arquivos de legenda SubRip (*.srt)

  • Arquivos Magento CE Locale CSV (*.csv)

Outros tipos de arquivos de texto simples podem ser processados pelo OmegaT associando sua extensão de arquivo com um tipo de arquivo compatível (por exemplo, os arquivos .pod podem ser associados ao filtro de texto ASCII) e serem pré-processados com regras de segmentação específica.

Arquivos PO podem conter os textos fonte e destino. Deste ponto de vista, eles são arquivos de texto simples mais memórias de tradução. Se ainda não há tradução para um determinado segmento fonte na memória de tradução do projeto (project_save.tmx), a tradução atual será salva no project_save.tmx como a tradução padrão. No entanto, caso o mesmo segmento de origem já exista com uma tradução diferente, a nova tradução será salva como uma alternativa.

Arquivos de texto formatado

Os arquivos de texto formatado contêm texto bem como informações do tipo de fonte, tamanho, cor, etc. Eles são geralmente criados em processadores de texto ou editores de texto html. Tais formatos de arquivos são criados de forma que mantenham as informações de formatação. As informações de formatação podem ser simples como “isto está em negrito” ou tão complexas como dados em tabelas com diferentes tamanhos de fontes, cor, posições, etc. Na maioria dos trabalhos de tradução é considerado importante que o documento traduzido pareça similar ao original. O OmegaT permite-lhe fazer isso através da marcação dos caracteres/palavras que tenham uma formatação especial com tags fáceis de serem manipuladas. Simplificar a formatação do texto original reduz bastante a quantidade de tags. Sempre que possível, unifique as fontes, tamanhos de fonte, cores, etc utilizados no documento, pois isto simplifica a tarefa de tradução e reduz o número possível de erros de tag. Cada tipo de arquivo é tratado de forma diferente no OmegaT. Para especificar um funcionamento específico do OmegaT, use filtros de arquivo. Atualmente, o OmegaT é compatível com os seguintes formatos de texto formatado:

  • ODF - OASIS Open Document Format (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)

  • Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)

  • (X)HTML (*.html, *.xhtml,*.xht)

  • Compilador de Ajuda HTML (*.hhc, *.hhk)

  • DocBook (*.xml)

  • XLIFF (*.xlf, *.xliff, *.sdlxliff) - do tipo fonte=destino

  • QuarkXPress CopyFlowGold (*.tag, *.xtg)

  • Arquivos ResX (*.resx)

  • Recurso Android (*.xml)

  • LaTex (*.tex, *.latex)

  • Arquivos Help (*.xml) & Manual (*.hmxp)

  • Typo3 LocManager (*.xml)

  • Localização WiX (*.wxl)

  • Iceni Infix (*.xml)

  • Flash XML export (*.xml)

  • Wordfast TXML (*.txml)

  • Camtasia for Windows (*.camproj)

  • Visio (*.vxd)

Outros tipos de arquivos de texto formatados podem ser processados pelo OmegaT associando sua extensão de arquivo com um tipo de arquivo compatível, desde que sejam pré-processados com regras de segmentação específica.

Outros formatos de arquivos

Outros formatos de texto simples ou formatado também podem ser processados no OmegaT.

Podem ser usadas ferramentas externas para fazer a conversão dos arquivos para os formatos compatíveis. Os arquivos traduzidos precisarão ser convertidos de novo ao formato original. Por exemplo, se você tem uma versão desatualizada do Microsoft Word, que não lida com o formato ODT, aqui está um atalho para arquivos do Word com a extensão DOC:

  • importe o arquivo no editor ODF

  • salve o arquivo em formato ODT

  • traduza-o no arquivo ODT destino

  • carregue o arquivo destino no editor ODF

  • salve o arquivo como arquivo DOC

A qualidade do arquivo traduzido dependerá da qualidade da conversão. Antes de fazer estas conversões, teste todas as opções. Verifique a home page do OmegaT para uma lista atualizada de ferramentas auxiliares de tradução.

Línguas da Direita para Esquerda (DPE)

O alinhamento dos segmentos fonte e destino depende das línguas do projeto. Por predefinição, o texto de línguas da esquerda para a direita (EPD) é alinhado à esquerda e o das línguas da direita para a esquerda (DPE), à direita. Para alternar entre os modos de exibição diferentes, pressione Shift + Ctrl + O (esta é a letra "O" e não o número 0). O Shift + Ctrl + O tem três modos:

  • alinhamento padrão, definida pela língua

  • alinhamento à esquerda

  • alinhamento à direita

O modo DPE no OmegaT não tem nenhuma influência no modo de exibição dos documentos traduzidos criados no OmegaT. O modo de exibição dos documentos traduzidos deve ser modificado nos programas (como o Microsoft Word) que você usará para exibir ou modificar os documentos (consulte o manual desses programas para detalhes). Usar Shift + Ctrl + O faz com que a entrada de texto e sua exibição no OmegaT mude. Esta função pode ser usada separadamente para os três painéis (Editor, Correspondências parciais e Glossário); basta clicar no painel e alternar o modo de exibição. Também pode ser usada em todos os campos de entrada no OmegaT – na janela de busca, para regras de segmentação, etc.

Usuário do Mac OS X, observem: use o atalho Shift + Ctrl + O e não cmd+Ctrl+O.

Combinação de sequências de texto EPD (esquerda para direita) e DPE (direita para esquerda) nos segmentos

Quando o texto é escrito da direita para a esquerda, o modo de visualização padrão (esquerda para direita) pode ser usado. Em muitos casos, entretanto, é necessário incluir texto EPD em textos DPE. Por exemplo, nas tags do OmegaT, os nomes dos produtos que devem permanecer na língua fonte, espaços reservados em arquivos de localização e números em texto. Em casos como esses é necessário alternar para o modo DPE para que o texto (na verdade bidirecional) seja exibido corretamente. Note que quando o OmegaT está no modo DPE, tanto o texto fonte como o texto destino são exibidos neste modo. Isto significa que se a língua fonte é da EPD e a língua destino é da DPE, ou vice-versa, pode ser necessário alternar entre esses dois modos para visualizar o texto nos seus respectivos modos de escrita.

Tags do OmegaT nos segmentos DPE

Conforme mencionado acima, as tags do OmegaT são sequências da esquerda para a direita. Quando o tradutor trabalhar com línguas da DPE e EPD, para ler as tags do segmento fonte e digitá-las corretamente no segmento destino, será necessário alternar entre os modos EPD e DPE várias vezes.

Se o documento permitir, é recomendado que o tradutor retire as informações de estilo do documento original, dessa forma aparecerá apenas algumas tags na interface do OmegaT. Siga as dicas para lidar com as tags. Verifique as tags (ver Verificação de tags) e gere documentos traduzidos (ver acima e Menu) em intervalos regulares para facilitar a identificação de algum problema que surja. Uma dica: traduzir uma versão de texto simples e depois acrescentar o estilo necessário usando o programa relevante pode gerar menos problemas.

Criação de documentos DPE

Quando o documento traduzido for criado, ele exibirá a mesma direção do texto que o documento original. Se o texto é da esquerda para a direita, o documento traduzido deve ser modificado manualmente no programa onde será visualizado para ter o texto da direita para a esquerda. Cada formato de saída tem maneiras específicas de lidar com exibição da direita para a esquerda; consulte o manual dos programas.

Para arquivos .docx, várias mudanças podem ser feitas automaticamente:

  • Parágrafos, seções e tabelas têm sentido bidirecional
  • Sequências (elementos de texto) são definidas como DPE

Para evitar modificar os parâmetros de exibição dos arquivos destino cada vez que os arquivos são abertos, é possível modificar os parâmetros de exibição do arquivo fonte para que eles sejam usados pelos arquivos destino. Tais modificações podem ser feitas em arquivos ODF, por exemplo.