用語集(Glossaries)は、用語のファイルです。手動で作成および更新することも、他のプロジェクトからインポートすることもできます。
各プロジェクトは任意の数の用語集を参照用に持つことができますが、1つの用語集(プロジェクトのデフォルト用語集)のみがOmegaTユーザー・インターフェースから直接書き込み可能になります。
プロジェクト内の用語集の数に関係なく、セグメント内の単語と一致する用語が[用語集]ペインに表示されます。
デフォルトの書き込み可能な用語集は/glossary
プロジェクトフォルダにあり、glossary.txt
という名前が付いています。
名前と場所はプロジェクトのプロパティダイアログで変更できますが、拡張子は.txt
または.utf8
で、場所は/glossary
プロジェクトフォルダに含まれている必要があります。
ファイルは、設定時に存在する必要はありません。最初の用語集エントリを追加するときに作成されます。ファイルがすでに存在する場合は、ファイルの形式または文字セットの確認は行われません。新しいエントリは常にタブ区切り形式で、ファイルはUTF-8エンコーディングで保存されます。
既存の用語集を使用するには、プロジェクトの作成後に/glossary
フォルダに配置します。OmegaTは、プロジェクトを開くと、このフォルダ内の用語集ファイルを自動的に検出します。
書き込み可能な用語集に新しい用語を追加するには、 Ctrl+Shift+G )を使用します。新しく追加された用語はすぐに認識されます。新しい用語を参照用の用語集に追加するには、外部テキストエディタで編集します。追加した用語は、用語集ファイルの変更が保存され次第、認識されます。
> (用語集の原文は、複数単語からなる用語であっても大丈夫です。
用語集の機能は、一致を見つけるために語幹処理(ステミング)を使用します。 OmegaTの一般設定で
を無効化すると、用語を完全一致検索するようになります。用語集の原文は「=」記号の前に表示され、訳語はその後に表示されます。コメントは、番号の後に個別の行に表示されます。書き込み可能な用語集からの単語は、太字で表示されます。参照用の用語集からの単語は、通常フォントで表示されます。
用語集一致の エスケープ 、その他のプラットフォームの場合は Ctrl+スペース )をクリックします。
コンテキストメニューを表示するには、OS依存キー(macOSの場合は分節の原文部分で一致する用語に下線を付けるには、
> を使用します。下線の付いた用語を右クリックし訳文を選択し、分節のターゲット部分のカーソル位置に挿入します。用語集ファイルは単純なテキストファイルで、3つの列(カラム)からなるリストの形をしています。最初の列は原文で、それ以降はオプションで、2番目の列は訳文の用語、3番目はコメントが入ります。
平文の用語集には、タブ区切り形式(TSV)ファイルとカンマ区切り形式(CSV)ファイルがあります。3番目に可能なフォーマットは"TBX"(TermBase eXchange)ISO標準です。
プロジェクトのデフォルトの書き込み可能な用語集は、常にUTF-8エンコーディングで保存されたTSVファイルです。
用語集は、ファイル拡張子に応じたエンコーディングで読み取られます。
形式 | 拡張子 | エンコーディング |
TSV |
.txt
|
UTF-8 |
TSV |
.utf8
|
UTF-8 |
TSV |
.tab
|
OS のデフォルトエンコーディング |
TSV |
.tsv
|
OS のデフォルトエンコーディング |
CSV |
.csv
|
UTF-8 |
TBX |
.tbx
|
UTF-8 |
用語集は/glossary
プロジェクトフォルダに配置する必要があります。フォルダ内のさらにフォルダー内にある用語集も認識されます。
問題:用語が何も表示されません。
glossary フォルダーに用語集ファイルがない
用語集ファイルが空である
項目がタブ文字で区切られていない
用語集ファイルが有効な拡張子(.tab、.utf8、.txt)ではない
原文の項目と「完全に」一致する用語が用語集にない - たとえばその項目が複数形である場合
用語集ファイルが有効な文字エンコーディングで保存されていない
現在の分節に、用語集と一致する用語が1つもない
以上のうち1つまたは複数の原因を解決したものの、プロジェクトを再読み込みしていない
問題:用語集ウィンドウの中で、いくつかの文字が適切に表示されない(しかし同じ文字が編集ウィンドウには適切に表示されている)
拡張子とファイルの文字エンコーディングが一致していない