OmegaT 3.1 - Manual do Usuário

Filtros de Arquivos

O OmegaT apresenta filtros com grandes recursos de customização, assim você pode configurar a maioria dos detalhes do seu funcionamento. Os filtros de arquivos são partes do código e podem:

  • Ler o documento em alguns formatos específicos de arquivo. Por exemplo, arquivos de texto simples.

  • Extrair o conteúdo a ser traduzido do arquivo.

  • Automatizar modificações dos nomes dos arquivos traduzidos substituindo os conteúdos traduzíveis com sua respectiva tradução.

Para ver que formatos de arquivo são compatíveis com o OmegaT, veja o menu Opções > Filtros de arquivo...

A maior parte dos usuários achará as opções padrão de filtro de arquivo suficientes. Se não for o caso, selecione o menu Opções -> Filtros de arquivos... para abrir a caixa de diálogo principal. Também é possivel ativar filtros de arquivo específicos por projeto, que somente serão usados no projeto atual, selecionando a opção Filtros de arquivos... em Propriedade do projeto.

Você pode ativar filtros específicos por projeto em Projeto → Propriedades... . Clique em Filtros de arquivos e ative a caixa de seleção Ativar filtros específicos por projeto . Uma cópia da configuração de filtros será gravada com o projeto neste caso. Se você modificar filtros mais tarde, apenas os filtros do projeto serão atualizados, enquanto os filtros de usuário ficam inalterados.

Atenção! Se você modificar opções de filtro enquanto um projeto estiver aberto, você deve recarregar o projeto para aplicar as modificações.

Caixa de diálogo 'Filtros de arquivos'

Este diálogo enumera filtros de arquivo disponíveis. Se deseja não usar OmegaT para traduzir arquivos de certo tipo, pode apagar o filtro correspondente desativando a caixa de seleção junto ao seu nome. O OmegaT então omitirá tais arquivos ao carregar os projetos e irá apenas copiá-los, sem nenhuma intervenção, quando criar os documentos traduzidos. Quando quiser usar o filtro de novo, basta marcar a caixa de seleção. Clique em Restaurar padrões para restaurar os filtros às configurações padrões. Para editar os arquivos e a codificação que o filtro processará, selecione o filtro na lista e clique em Editar.

A caixa de diálogo permite habilitar ou desabilitar as seguintes opções:

  • Remover tags à esquerda e à direita: desmarque esta opção para exibir todas as tags, inclusive as tags à esquerda e à direita. Atenção: nos formatos Microsoft Open XML (docx, xlsx, etc.), se todas as tags forem exibidas, NÃO escreva nenhum texto antes da primeira tag (é uma tag técnica que deve sempre iniciar o segmento).

  • Remover espaço em branco à esquerda e à direita em projetos não segmentados: por padrão, o OmegaT remove os espaços em branco à esquerda e à direita. Em projetos não segmentados, é possível mantê-los ao desmarcar esta opção.

  • Preservar espaços para todas as tags: marque esta opção se os documentos fonte contêm espaços importantes (para fins de layout) que não devem ser ignorados.

  • Ignorar contexto de arquivos ao identificar segmentos com traduções alternativas: por padrão, o OmegaT usa o nome do arquivo fonte como parte da identificação de uma tradução alternativa. Se a opção estiver marcada, o nome do arquivo fonte não será usado, e traduções alternativas terão efeito em um arquivo, se outros itens de contexto (segmentos anteriores/posteriores, ou algum tipo de identificador, dependendo do formato do arquivo) sejam correspondentes.

Opções de filtro

Vários filtros (arquivos de texto, arquivos XHTML, arquivos HTML e XHTML, arquivos de OpenDocument e arquivos de Microsoft Open XML) têm uma ou várias opções específicas. Para modificar as opções, selecione o filtro na lista e clique em Opções . As opções disponíveis são:

Arquivos de texto

  • Segmentação de parágrafos por quebras de linha, linhas vazias ou nunca:

    se as regras de segmentação por frases estiverem ativadas, o texto será segmentado de acordo com a opção selecionada.

Arquivos PO

  • Permitir traduções em branco no arquivo destino :

    Se for ativado, quando um segmento PO (que pode ser um parágrafo inteiro) não é traduzido, a tradução ficará vazia no arquivo destino. Falando tecnicamente, o segmento msgstr no arquivo destino PO, se criado, será deixado vazio. Como esse é o comportamento padrão de arquivos PO, já vem marcado. Se a opção for desligada, o texto fonte será copiado para o segmento destino.

  • Ignorar cabeçalho PO

    O cabeçalho PO será ignorado e mantido inalterado, se esta opção for marcada.

  • Substituir automaticamente 'nplurals=INTEGER; plural=EXPRESSION;' no cabeçalho

    A opção permite que o OmegaT ignore a especificação no cabeçalho do arquivo PO e use o padrão para o idioma de destino selecionado.

Arquivos XHTML

  • Traduzir os seguintes elementos : os elementos selecionados aparecerão como segmentos na janela Editor.

  • Iniciar um novo parágrafo : a tag <br> do HTML criará um parágrafo para fins de segmentação.

  • Pular texto que corresponde à expressão regular : o texto correspondendo à expressão regular será ignorado. É exibido em vermelho no validador de tags. O texto no segmento fonte correspondente é exibido em itálico.

  • Não traduzir o atributo de conteúdo das meta-tags ... : As seguintes meta-tags não serão traduzidas.

  • Não traduzir o atributo de conteúdo das tags com os seguintes pares de atributo key-value (separados por vírgulas) : caso haja correspondência na lista de pares de valor da chave, o conteúdo das tags será ignorado

    Às vezes é útil poder deixar algumas tags intraduzíveis baseado no valor de atributos. Por exemplo, <div class="hide"> <span translate="no"> É possível definir pares de valor da chave de tags a não serem traduzidas. Para o exemplo acima, o campo conteria: class=hide, translate=no

Arquivos Microsoft Open XML

É possivel selecionar quais elementos devem ser traduzidos. Eles aparecerão como segmentos separados na tradução.

  • Word: texto de instrução não-visível, comentários, notas, notas de fim, notas de rodapé

  • Excel: comentários, nomes de planilhas

  • Power Point : comentários de slides, slides mestre, layouts de slides

  • Global: tabelas, diagramas, desenhos, WordArt

  • Outras Opções:

    • Agregar tags : se selecionado, as tags sem texto traduzível entre elas serão agregadas em tags únicas.

    • Preservar espaço para todas as tags : se selecionado, preserva o "espaço branco" (isto é, os espaços e novas linhas), mesmo se não estabelecido tecnicamente no documento

Arquivos HTML e XHTML

  • Acrescentar ou regravar a declaração de codificação nos arquivos HTML e XHTML : frequentemente os arquivos alvo devem ter o conjunto de caracteres de codificação diferente daquele no arquivo original (seja definido explicita ou implicitamente). Usar esta opção permite que o tradutor especifique se os arquivos destino devem incluir a declaração de codificação. Por exemplo, se o filtro de arquivo especifica que o UTF8 é o esquema de codificação dos arquivos destino, selecionar a opção Sempre assegurará que esta informação seja incluída nos arquivos traduzidos.

  • Traduzir os seguintes elementos : os elementos selecionados aparecerão como segmentos na janela Editor.

  • Iniciar um novo parágrafo : a tag <br> do HTML criará um parágrafo para fins de segmentação.

  • Pular texto que corresponde à expressão regular : o texto correspondendo à expressão regular será ignorado. É exibido em vermelho no validador de tags. O texto no segmento fonte correspondente é exibido em itálico.

  • Não traduzir o atributo de conteúdo das meta-tags ... : As seguintes meta-tags não serão traduzidas.

  • Não traduzir o atributo de conteúdo das tags com os seguintes pares de atributo key-value (separados por vírgulas) : caso haja correspondência na lista de pares de valor da chave, o conteúdo das tags será ignorado

    Às vezes é útil poder deixar algumas tags intraduzíveis baseado no valor de atributos. Por exemplo, <div class="hide"> <span translate="no"> É possível definir pares de valor da chave de tags a não serem traduzidas. Para o exemplo acima, o campo conteria: class=hide, translate=no

  • Compactar espaço em branco no documento traduzido : vários espaços em branco seguidos serão convertidos em um único espaço no documento traduzido.

  • Remover comentários HTML em documento traduzido : todas as partes comentadas (entre <!-- e -->) não serão copiadas no documento traduzido.

Arquivos de Open Document Format (ODF)

  • É possível selecionar quais dos itens seguintes devem ser traduzidos:

    entradas de índice, marcadores de páginas, referências de marcadores, notas, comentários, notas de apresentação, links (URL), nomes de planilhas

Caixa de diálogo 'Editar filtro'

Este diálogo permite configurar os padrões de nome de arquivo fonte a serem processados pelo filtro, personalizar os nomes de arquivos traduzidos e selecionar quais codificações devem ser usadas para carregar o arquivo e salvar o seu correspondente traduzido. Para modificar um padrão de filtro de arquivo, modifique os campos diretamente ou clique em Editar. Para acrescentar um novo padrão de filtro de arquivo, clique em Adicionar . A mesma caixa de diálogo é usada para acrescentar um padrão ou editar um padrão específico. A caixa de diálogo é útil porque inclui um editor especial de padrões de nomes de arquivo destino, no qual é possível personalizar os nomes dos arquivos de saída.

Tipo de arquivo fonte, padrão do nome de arquivo

Quando o OmegaT encontra um arquivo na sua pasta source, ele tenta selecionar o filtro de acordo com a extensão do arquivo. Mais precisamente, o OmegaT tenta corresponder os tipos de arquivo fonte de cada filtro com o nome do arquivo. Por exemplo, o padrão *.xhtml corresponde a qualquer arquivo com a extensão .xhtml. Se for encontrado o filtro apropriado, ele é associado ao arquivo para processamento. Por exemplo, como padrão, os filtros XHTML são usados para processar arquivos com a extensão .xhtml. É possível mudar ou adicionar padrões de nome de arquivo para que os arquivos sejam classificados de acordo com cada filtro. Os tipos de arquivo fonte usam curingas iguais aos usados nas Buscas. O caractere '*' corresponde a zero ou mais caracteres. O caractere '?' corresponde exatamente a um caractere. Todos os outros caracteres correspondem a eles mesmos. Por exemplo, se você quiser que o filtro de texto processe os arquivos leiame (leiame, leia.me e leiame.txt) use o padrão leia*.

Codificação dos arquivos fonte e destino

Apenas uma quantidade limitada de formatos de arquivos requer codificação obrigatória. Os formatos de arquivos que não especificam sua própria codificação usarão aquela que for definida para a extensão correspondente aos seus nomes. Por exemplo, por padrão os arquivos .txt serão carregados usando a codificação padrão do sistema operacional. A codificação fonte pode ser modificada para cada tipo de arquivo fonte diferente. Tais arquivos podem também ser processados sem nenhuma codificação. Por padrão, a codificação do arquivo traduzido é a mesma que a do arquivo fonte. Os campos de codificação fonte e destino usam caixas combinadas com todas as combinações suportadas incluídas. <auto> deixa a opção de codificação para o OmegaT. É assim que funciona:

  • O OmegaT identifica a codificação do arquivo fonte usando sua declaração de codificação, se houver (arquivos HTML, arquivos baseados em XML).

  • O OmegaT está configurado para usar uma codificação obrigatória para alguns formatos de arquivo (propriedades Java, etc.)

  • E usa a codificação padrão do sistema operacional para os arquivos de texto.

Nome de arquivo traduzido

Se quiser, você poderá renomear automaticamente os arquivos que traduz, por exemplo, acrescentando o código de idioma após o nome do arquivo. O tipo de arquivo traduzido usa uma sintaxe especial, portanto se você quiser editar este campo, clique em Editar... para acessar a caixa de diálogo 'Editar padrão'. Se você quiser voltar à configuração padrão do filtro, clique em Restaurar padrões. Também é possível modificar o nome diretamente no campo de tipo de arquivo traduzido, na caixa de diálogo dos filtros de arquivos. A caixa de diálogo Editar padrão contém as seguintes opções:

  • Padrão é ${filename}– nome completo do arquivo fonte com extensão, portanto o nome do arquivo traduzido é o mesmo que o nome do arquivo fonte.

  • ${nameOnly}– permite-lhe inserir apenas o nome do arquivo fonte sem extensão

  • ${extension} – a extensão do arquivo original

  • ${targetLocale}– o código do local destino (em forma de "xx_YY").

  • ${targetLanguage}– o idioma destino e o código de país juntos (em forma de "XX-YY").

  • ${targetLanguageCode} – apenas o idioma destino ("XX").

  • ${targetCountryCode}– apenas o código do país destino ("YY")

  • ${timestamp-????} – data e hora do sistema na criação, em vários padrões

    Veja documentação da Oracle para ter exemplos de padrões "SimpleDateFormat"

  • ${system-os-name}– sistema operacional do computador usado

  • ${system-user-name}– nome do usuário do sistema

  • ${system-host-name} – nome do host do sistema

  • ${file-source-encoding} – codificação do arquivo fonte

  • ${file-target-encoding}– codificação do arquivo destino

  • ${targetLocaleLCID}- local destino Microsoft

Variantes adicionais estão disponíveis para variáveis ${nameOnly} e ${Extension}. Caso o nome do arquivo seja ambivalente, é possível aplicar variáveis na forma ${name only -extension number } e ${extension- extension number} . Se, por exemplo, o arquivo original tiver o nome Documento.xx.docx, as seguintes variáveis darão os seguintes resultados:

  • ${nameOnly-0} Documento

  • ${nameOnly-1} Documento.xx

  • ${nameOnly-2} Documento.xx.docx

  • ${extension-0} docx

  • ${extension-1} xx.docx

  • ${extension-2} Documento.xx.docx