Os ficheiros de texto plano (na maioría dos casos, ficheiros coa extensión .txt) conteñen só información textual e ofrecen un xeito non moi definido de informar ao computador que idioma conteñen. O mellor que pode facer OmegaT neste caso é asumir que o texto está escrito no mesmo idioma que emprega o propio computador. Isto non é un problema para os ficheiros codificados en Unicode e cun sistema de caracteres de 16 bits. Se o texto está codificado en 8 bits, porén, un pode enfrontarse á seguinte situación: en vez de amosar o texto en caracteres xaponeses...
...o sistema amosará o texto como isto, por exemplo:
O computador que executa OmegaT ten ruso coma idioma predeterminado, polo que amosa os caracteres en alfabeto cirílico e non en kanji.
Hai basicamente tres xeitos para enfrontarse a este problema en OmegaT. Todos están relacionados coa aplicación de filtros de ficheiro no menú de Opcións .
abrir o ficheiro orixe nun editor de texto que interprete correctamente a codificación e gardar o ficheiro coa codificación
«UTF-8»
. Cambiar a extensión do ficheiro de .txt
a .utf8.
OmegaT interpretará automaticamente o ficheiro coma un ficheiro UTF-8. Esta é a alternativa de máis sentido común, que soluciona os seus problemas a longo prazo.
é dicir, ficheiros coa extensión .txt
: na sección
Ficheiros de texto
no diálogo de filtros de ficheiro, cambie a
Codificación do ficheiro orixe
de <auto> á codificación que corresponda ao seu ficheiro orixe .txt
, por exemplo, a .jp para o exemplo anterior.
por exemplo, de .txt
a .jp
para textos planos en xaponés: na sección
Ficheiros de texto
do diálogo de filtros de ficheiro, engada un novo
Padrón de nome de ficheiro de orixe
(*.jp
para este exemplo) e seleccione os parámetros apropiados para a codificación de orixe e destino.
OmegaT ten dispoñíbel a seguinte lista predeterminada para facerlle máis fácil a solución ao problema con algúns ficheiros de texto plano:
Os ficheiros .txt
son interpretados automaticamente (<auto>) por OmegaT como se estivesen codificados coa codificación predeterminada do computador.
Pode comprobalo persoalmente seleccionando
Filtros de ficheiro
no menú
Opcións
. Por exemplo, se ten un ficheiro de texto en checo (moi probabelmente escrito coa codificación
ISO-8859-2
), simplemente necesitaría cambiar a extensión .txt
a .txt2
e OmegaT interpretará correctamente os seus contidos. E, por suposto, se desexa estar seguro, considere converter o tipo de ficheiro a Unicode, é dicir, ao formato de ficheiro .utf8
.