OmegaT 4.2 - 用户指南

附录 B. 词汇表

词汇表是术语文件。可以手工创建和更新之,也可以从其他项目中导入。

给定的项目可以拥有任意数量的参考词汇表,但是只有一个词汇表(该项目的默认词汇表)可以直接从 OmegaT 用户界面写入。

无论项目中有多少词汇表,片段中出现的在任一词汇表内有匹配匹配项的术语都会显示在“词汇表”窗格中。

默认词汇表

默认的可写词汇表位于 /glossary 项目文件夹中,名为 glossary.txt

可以在项目属性对话框中更改其名称和位置,但其扩展名必须是 .txt.utf8,且其位置必须位于 /glossary 项目文件夹下。

进行设置时,并不要求相应文件已存在,在添加第一个词条时会自动创建之。如果该文件已存在,不会对其格式或字符集进行检查:新条目始终采用制表符分隔的格式,并且文件将会以 UTF-8 编码保存。

用法

要使用现有的术语表,只需在创建项目后将它放到 /glossary 目录下。在打开项目时,OmegaT 会自动检测该目录下的术语表文件。

要向可写词汇表中添加新词汇,请使用 编辑 > 创建词条 Ctrl+Shift+G )。新添加的词汇立即就会被识别生效。要向参考词汇表中添加词汇,请用外部文本编辑器编辑之。新添加的词汇会在变更保存后立即识别生效。

词汇原文可以是多单词词汇。

词汇表功能使用词干分析来查找匹配项。在 OmegaT 的全局首选项中停用对词条使用词干分析可以只查找词汇的精确匹配项。

在“=”号之前显示的是词汇原文,之后是词汇译文。注释前面会显示一个数字,并且每条注释都单独占一行。来自项目可写词汇表的词汇会使用粗体显示。来自参考词汇表的词汇则用标准字体显示。

要显示词汇表匹配项的自动完成上下文菜单,请按与操作系统关联的热键(对于 macOS 是 Escape ,其他平台则是 Ctrl+Space )。

若要在片段的原文部分中给匹配的词汇加上下划线,请使用视图 > 标记词汇表匹配。右键点击带下划线的词汇并选择一个词汇译文可以将其插入片段的译文部分中当前光标位置处。

文件格式

OmegaT 词汇表文件是简单的纯文本三列列表,第一列是词汇原文,第二列是词汇译文,而第三列则是注释。第二列和第三列都是可选的。

纯文本词汇表可以是“制表符分隔的值”(TSV)文件或“逗号分隔的值”(CSV)文件。第三种可能的格式是“TBX”(TermBase eXchange)ISO 标准。

项目的默认可写词汇表则总是以 UTF-8 编码保存的 TSV 文件。

读取词汇表时使用的编码取决于文件扩展名:

表 B.1. 格式、扩展名和预期编码
格式 扩展名 编码
TSV .txt UTF-8
TSV .utf8 UTF-8
TSV .tab 操作系统默认编码
TSV .tsv 操作系统默认编码
CSV .csv UTF-8
TBX .tbx UTF-8

词汇表必须位于 /glossary 项目文件夹中。位于其中嵌套的文件夹下的词汇表也会被识别。

常见词汇表问题

问题:不显示词汇表词汇——可能的原因:

  • 在 “glossary” 文件夹中没找到词汇表文件。

  • 词汇表文件为空。

  • 条目不是以制表符分隔的。

  • 词汇表文件没有正确的扩展名(.tab、.utf8 或 .txt)。

  • 词汇表的词条和文档中的原文文本之间并不是“精确”匹配——比如,复数形式。

  • 词汇表文件没有采用正确的编码。

  • 当前片段中没有词汇和与词汇表中的词汇相匹配。

  • 已修正了若干以上问题,但还未重新载入项目。

问题:在术语表窗格中某些字符显示不正确

  • ……但这些字符在编辑窗格中能正确显示:扩展名与文件编码不一致。