OmegaT 6.0.0-取扱説明書

付録

ファイルフィルター

警告

ファイルフィルタは、ローカルで特定のプロジェクトに固有のものか、ユーザーレベルで構成フォルダーを共有するすべてのプロジェクトで使用できるものの二種類あります。

詳細情報は以下を確認してください。

現在のプロジェクトで使用しているフィルターを太字で示します。

特定のフィルターに関連付けられているファイルを翻訳しない場合は、そのチェックボックスをオフにして無効にします。これらのコンテンツは翻訳用には表示されません。

注記

フィルタは、名前または有効かどうかでソートできます。関連するヘッダーをクリックすると、昇順または降順の順序でソートできます。

フィルター対象とするファイルやエンコーディングを変更する場合は編集...をクリックします。

一部のフィルタには、設定をさらにカスタマイズするためのオプション.ボタンがあります。

[初期値を復元] をクリックすると、それまでのフィルター設定をリセットし初期設定に戻します。

変更されたユーザーレベルファイルのフィルター設定は、filters.xmlの設定フォルダーに保存されます。 設定フォルダー に詳細を示します。このファイルを削除すると、フィルターの環境設定もリセットされます。

変更されたプロジェクト専用のファイルフィルタ設定は、プロジェクトフォルダーにあるfilters.xmlファイルに保存されます。詳細については-プロジェクトフォルダーを参照してください。このファイルを削除すると、フィルターの環境設定もリセットされ、ユーザレベルのファイルフィルター設定が使用されるようになります。

共通設定

先頭および末尾のタグを非表示にする

通常、OmegaTが翻訳済みの分節を正しく再作成するには、先頭タグと末尾タグが必要です。これらを翻訳可能なコンテンツで非表示にすると、誤って削除したり変更したりすることがなくなります。

先行タグと後続タグを保持する場合は、それらのタグも訳文に含めるようにしてください。

分節化しないプロジェクトから、先頭と末尾の空白文字を削除

デフォルトではOmegaTは、翻訳対象のコンテンツから先頭と末尾の空白文字を削除します。分節化しないプロジェクトでは、この設定を無効にすると、訳文の先頭と末尾の空白文字が編集可能になります。

すべてのタグの空白を維持

原文の文書ファイルにレイアウトの制御に使用される空白文字が含まれている場合、必要な空白文字は訳文ファイルでも保持されます。

複数訳文の識別時にファイル名情報を無視する

ソースファイル名は、例外訳文を特徴付ける要素の1つです。この設定が有効化された場合、前および次の分節や分節識別子のみが、例外訳文を特徴付けるために使用されます。

他のファイルにある同じ特徴を持つ分節は、指定されている例外訳文として訳文が生成されます。

編集

編集可能なフィールドをダブルクリックして変更を行うか、編集.ボタンをクリックして変更ダイアログにアクセスします。

フィルターパターンを追加するには、追加...をクリックして、同様のダイアログを開きます。

どちらのダイアログでも、このフィルターに関連付けられた原文ファイルと訳文ファイルのファイル名パターンをカスタマイズして、それぞれの文字エンコーディングを選択できます。

ターゲットのファイル名をカスタマイズするには、ファイル名変数ドロップダウンメニューを使用します。

原文ファイル名の構成例

OmegaTはファイル拡張子をチェックし、フィルター内の原文ファイル名パターンと照合します。適合したときに、ファイルにフィルターに関連付けます。

たとえば、構成例 *.xhtml は、拡張子が xhtml のあらゆるファイルに一致します。source フォルダーでそのようなファイルが見つかった時に、XHTMLフィルターによって処理されます。

そのフィルターに関連づけたいファイルに応じて、ファイル名構成例を変更したり追加したりできます。

警告

ファイル拡張子をフィルターに関連付けるだけでは、フィルターがファイルを適切に処理することはできません。ファイルの内部構造が、フィルターが対応する仕様と互換である必要があります。.odtをXHMTLフィルターに関連付けても、フィルターはLibreOffice Writerファイルの内容を理解できません。

原文ファイル名構成例には、ワイルドカード文字を使用できます。*文字は0また1文字以上の文字に、?は厳密に1文字にマッチします。

たとえばテキストフィルターを readme ファイル(readme, read.mereadme.txt)にも対応させたい場合は、ファイル名構成例に read* を指定してください。

原文ファイルと訳文ファイルのエンコーディング

ほとんどのファイル形式では、さまざまな文字コードのエンコーディングが利用可能です。デフォルトでは、訳文ファイルのエンコーディングは、原文ファイルと同じになります。

原文ファイルと訳文ファイルのエンコーディングを指定する項目では、対応したすべてのエンコーディングをドロップダウンメニューから選択できます。<auto>設定を選択すると、次の基準に基づいて、OmegaTが、エンコーディングを選択します。

  • 原文ファイルにエンコーディング宣言があれば、それに従います(HTML ファイル、XML ベースのファイルの場合)

  • いくつかのファイル形式(例えばJava properties )に対しては、その形式に必須のエンコーディングを設定します。

  • テキストファイルには、起動オプションで変更されていなければ、OS デフォルトのエンコーディング(たとえば新規インストールの日本語版の Windows 10/11 OSではUTF-8エンコーディグのUnicode、たとえばWindows8.1からアップデートしたWindows10ではCP932エンコーディングのSJIS日本語コード)を使用します。

訳文ファイル名

targetフォルダーのファイルは、同じ名前で作成された場合、作成するたびに上書きされます。

OmegaTでは、言語コードやタイムスタンプを追加するなどして、作成したファイルの新しいファイル名を自動的に作成できます。

ターゲットファイル名構成例は特別な構文を使用します。最も簡単に変更する方法は、構成例を編集ダイアログを使用することです。このダイアログでは、さまざまな設定ができます。

${filename}

デフォルトの構成例。拡張子を含むソースファイルの完全なファイル名を表します。このパターンを使用すると、訳文ファイルにソースファイルとまったく同じ名前が割り当てられます。

${nameOnly}

ソースファイルの名前(拡張子なし)

${extension}

原文ファイルの拡張子

${targetLocale}

訳文言語コード+地域コード (xx_YY)

${targetLanguage}

訳文言語コード+地域コード (xx-YY)

${targetLanguageCode}

訳文言語コード (xx)

${targetCountryCode}

訳文地域コード (YY)

${timestamp-????}

ファイルが作成されたシステム時間

例については、Oracleのドキュメントを参照してください。

${system-os-name}

オペレーティング・システムの名称

${system-user-name}

ユーザーのログイン名

${system-host-name}

システムのホスト名

${file-source-encoding}

原文ファイルのエンコーディング

${file-target-encoding}

訳文ファイルのエンコーディング

${targetLocaleLCID}

訳文ファイルのMicrosoftロケール(xx-yy形式)

${nameOnly} ${extension} に関しては、追加の変数を使用できます。

ファイル名に複数のピリオドを利用するなどでファイル名と拡張子があいまいな場合、使用する構成要素を ${nameOnly- 番号 } と ${extension-- 番号} の形式で、次に示す例のように指定することができます。

例26 訳文ファイル名

文書.xx.docxという名前のソースファイルに対して、以下の変数定義を使用すると、次のような結果になります。

  • ${nameOnly-0}: Document

  • ${nameOnly-1}: Document.xx

  • ${nameOnly-2}: Document.xx.docx

  • ${extension-0}: docx

  • ${extension-1}: xx.docx

  • ${extension-2}: Document.xx.docx


設定

ファイルフィルターは設定を提供しています。設定を変更する場合は、フィルターを選択して設定... を押してください。

可能な設定は以下の通りです:

テキストファイル

段落の作成場所:

文章ファイルには、一般的な段落マーカーはありません。ここを選択して、テキストファイルから段落に分割する方法を指定します。

訳文ファイルの行の長さ(0=制限なし)

行の文字数

長い行を改行する前の最大文字数を指定します。0を設定すると、制限なしになります。

最大行数

行を切断して残りを無視するまでの最大文字数を指定します。0を設定すると、制限なしになります。

Microsoft Office Open XML ファイル

警告

Microsoft Office Open XML(旧フィルター)は、従前からのOmegaTのフィルターです。以前に、このフィルターで処理したファイルを含むプロジェクトとの互換性の問題を回避するときのみ、利用してください。

追加して翻訳するXML要素を選ぶことができます。選んだ要素は、翻訳時に個別の分節として表示されます。

Word

非表示の命令文章、コメント、脚注、文末脚注、フッタ、重複するフォールバック文章、および文書プロジェクト設定。

Microsoft Excel

コメントとシート名。

Microsoft PowerPoint

スライドのコメント、スライドマスター、スライドレイアウト。

共通

外部リンク、表、ダイアグラム、図、ワードアート

その他の設定:
タグの集約

翻訳対象テキストを含まない連続するタグを1つのタグに集約します。

すべてのタグの空白を維持

チェックが入っていれば、空白文字(半角スペースや改行など)を保持します。たとえそれが文書中で意味が無い場合でも残します。

ソフト改行(任意指定の行区切り)を段落区切りとみなす

ソフトリターンが段落の開始を意図している場合は、この設定を有効にします。

XHTML ファイル
以下の属性を翻訳

選択した属性を編集ウィンドウで翻訳できる分節として表示できます。

以下のタグで分節化

HTML の <br> タグがある場所を段落とみなして分節化することができます。

無視された段落(正規表現)

正規表現に一致する段落は読み込み時に無視され、翻訳用に表示されません。

この設定は、HTMLの一部に翻訳不可能な文章のみの要素を含む場合に便利です。

無視された<meta>タグの"content"属性

関連する「コンテンツ」属性が変換されない<meta>タグ属性値を定義します。

引用文記号を追加したり、値をカンマで区切ったりしないでください。

例27 <meta name="robots" content="index, follow">の内容部分を無視する

このコンテンツを無視するには:

<meta name="robots" content="index, follow">

使う:

name=robots


無視されるタグ(属性=値)

タグを翻訳不可能にする属性値を定義します。

引用文記号を追加したり、値をカンマで区切ったりしないでください。

例28 translate="no"属性があるタグを無視

このコンテンツを無視するには:

<span translate="no">This content is not translatable</span>

translate=noを使用する。

translate="no"でマークされたすべてのタグは無視されます。


HTML ファイル・XHTML ファイル

ここでは、XHTMLファイルのオプション(上記参照)で使用できないフィルターについてのみ説明します。

エンコーディング宣言の変更

文書のエンコーディングは通常、<head>要素内にある<meta>要素内で宣言されます。

原文ファイルと訳文ファイルでは、異なるエンコーディングが必要な場合があります。

ここで、訳文ファイルの宣言を追加するか変更するかを決定できます。

  • 通常どおり、フィルター設定において、

  • ファイルが既に<head>タグを持っている場合のみ。

  • ファイルに、既に宣言されている場合のみ。

  • ファイルフィルター設定で指定のエンコーディングを適用して、訳文ファイルを保存します。

訳文ファイルの空白圧縮

タグの外側の空白文字は、HTML/XHTMLでは重要ではないと見なされます。

連続する空白文字がある場合、訳文ファイル生成時に空白文字一つだけに変換します。

HTML コメントを削除

HTMLファイル中のコメントは、通常開発者むけのものです。この設定を使用して除去します。チェックを外すと、コメントはタグとして表示されます。

HTMLのコメント中のテキスト ( <!---->の間)は、訳文ファイルにコピーされません。

Mozilla FTL
未翻訳分節を訳文ファイルに出力しない

翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。

Mozilla DTD
未翻訳分節を訳文ファイルに出力しない

翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。

PO ファイル

フィルターはデフォルトで、printf変数('%s'など)をチェックします。詳細は printf関数の変数をチェックする の設定を参照してください。

原文が空の分節を許可

訳文の分節が提供されていない場合、常に原文のコンテンツを使用します。未翻訳の分節を空白のままにするには、この設定を使用します。

原文が空の分節を翻訳する

空白の原文分節は、原文言語には存在しないが訳文言語で必要な要素のプレースホルダとして機能することがあります。この設定を使用すると、関連付けられたコメントに基づいて訳文を生成します。

PO ヘッダーを無視

POヘッダーは、翻訳用には表示されません。

複数形指定を自動置換

PO ファイルのヘッダーにある複数形指定を、訳文言語に合わせて自動変更します。

ファイル形式:
通常版

PO ファイルは、msgidを使用した原文と、msgstrに格納された訳文の両方を保持できるファイル形式です。

モノリンガル

PO ファイルは、msgidをIDコードとして使用し、msgstrを原文の場所と解釈して、msgstrに訳文を上書きします。

Moodle PHP
未翻訳分節を訳文ファイルに出力しない

翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。

Java リソースバンドル

デフォルトで、Java の MessageFormat パターン({0} など)をチェックする。詳細は printf関数の変数をチェックする の設定を参照してください。

Java 8と互換のあるエスケープUnicodeリテラルの書き込みを強制する

Java 8はISO-8859-1エンコーディングを必要とし、その文字セット以外の文字にはユニコードのエスケープシーケンスによる文字列を使用します。Java 9以降では、UTF-8エンコーディングが必要です。この設定はJava 8との互換性を強制します。

未翻訳分節を訳文ファイルに出力しない

翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。

ユニコードのリテラル表記(\uXXXX)をエスケープ解除しない

アプリケーションによっては、一部のUnicodeリテラルを保持する必要があります。この設定ではそれが可能です。

OpenDocument Format (ODF) ファイル
以下の要素を翻訳

Index 項目、ブックマーク、ブックマーク参照、脚注、コメント、プレゼンテーションのノート、リンク(URL)、シート名

XLIFF(従来フィルター)

警告

このフィルターは、従来のOmegaT XLIFFフィルターです。以前に、このフィルターで処理したファイルを含むプロジェクトとの互換性の問題を回避するときのみ、利用してください。

OmegaT 2.6 互換モード

OmegaT2.6で作成されたXLIFFファイルで作業する必要がある場合は、このOmegaTを有効にします。

複数訳文における「例外訳文」の識別子

ユーザーは、3つのオプション、前の段落と次の段落、<trans unit>ID、または<trans-unit>resname属性(使用可能な場合)から選択できます。使用できない場合は、IDがフォールバックとして使用されます。

タグのショートカット

これらの設定は、OmegaTがXLIFFコンテンツからタグを作成する方法を指定しています。

訳文分節のstatus属性設定

チェックすると、XLIFFの"target"要素の"status"属性を「translated」ではなく「needs-review-translation」に変更します。

分節化規則

Paragraph or sentence?

翻訳メモリツールは、分節と呼ばれるテキスト単位で処理を行います。訳文を入力すると、原文分節を含むテキストがその翻訳結果とともにプロジェクトのメモリに保存され、その後、プロジェクト内の他の原文セグメントとの一致の判定に使用されます。

文単位の分節化 プロジェクト設定を使用して、分節化のタイプを選択します。

分節は、デフォルトではファイル形式自体によって定義される 段落 になります。

文書に の分節化を使用しないということは、 段落 の分節化を使用することと同じことになります。その場合、各段落(元の文書形式で定義されている)は1つの分節として表示され、翻訳者はその分節内の文を自由に再編成できます。

段落単位の分節化 は、文芸的または創造的なテキストに適しています。一般的に、翻訳メモリの一致がそれほど重要でない文書にも適しています。

文単位の分節化 は、原文の言語を構成する要素を定義する規則( 分節化規則 と呼ばれる)に依存しています。この設定は、技術文書や法律文書など、反復または類似の文が多い文書に適しています。

段落単位の分節化

OmegaTは段落単位の分節化を行うため、まずテキストを構文解析します。このプロセスでは、原文ファイルの構造に依存して分節を生成します。

たとえばテキストファイルでは、改行や空の行で分節化されたり、まったく分節化されないこともあります。フォーマット(ODF、HTML、またはその他のドキュメント)を含むファイルは、ブロックレベル(段落)タグで分割されます。XHTML や HTML ファイルでは、オブジェクトの属性も翻訳の対象になることがあります。このような場合は、属性値だけを別の文として取り出します。

文単位の分節化

原文ファイルを構造単位に分割した後、OmegaTはさらに分節に分割します。

分節化は、文字単位でテキストに沿ってカーソルを移動するプロセスとして視覚化できます。

カーソルが次の文字に移動するたびにOmegaTは、

  • その場所の前のテキストは、 Before ルールに対応します。

  • その場所の後のテキストは、関連する After ルールに対応します。

位置が両方の規則に一致する場合、規則の定義内容に応じて、その位置が分節化または非分節化の場所と見なされます。

ユーザーレベルか、プロジェクトのローカルルールか?

注記

同じメカニズムとダイアログを使用して、ユーザーレベルおよびローカルの分節化規則を定義します。

デフォルトでは、分節化の設定はグローバルであり、すべてのプロジェクトで共有されます。

プロジェクト設定の プロジェクト専用の分節化規則... を使用して、現在のプロジェクトの分節化ルールのスコープを制限します。

コマンドラインからOmegaTを起動しても、同様の結果が得られます。詳細については、 コマンドライン起動を参照してください。

ローカル規則を使用している場合でも、グローバル規則にアクセスすることはできますが、それらを変更してもプロジェクトには影響しません。

規則

OmegaTには事前定義された分節化規則が用意されており、翻訳者は正規表現を使用して規則を変更できます。詳細は、付録の 正規表現 をご覧ください。

規則は次のように機能することに注意してください。OmegaTは規則が一致した場所にマーカーを設定します。そして、その後の規則がその場所を無視するようにします。これが、例外規則が分節化規則よりも前になければならない理由です。

警告

翻訳中に分節化規則を変更した場合は、新しい分節化規則を有効にするためにプロジェクトを再ロードする必要があります。すると、以前に翻訳済みの一部の分節が分割または結合され、翻訳済みの分節と見なされなくなります。ただし、元の翻訳結果はプロジェクトの翻訳メモリ内に残ります。

表5 簡単な設定例
分類 目的 前方の正規表現 後方の正規表現 説明
例外ルール、チェックボックスがオフ、リストの上位 Ms.の後に分節化しない Ms\. \s Msの後にピリオドと空白が続きます。
例外ルール、チェックボックスがオフ、リストの上位 分節を表さない改行のあるExcelセル \n   改行、その後に任意の文字。
リストの下にあるチェックボックスをオンにした分節規則 新しい分節は、ピリオドの後にスペース、タブ、またはその他の空白が続いた後に開始します。 \. \s 空白が後に続くピリオド
リストの下にあるチェックボックスをオンにした分節規則 「。」の後に新しい分節を開始します。   後方の正規表現領域は空でもかまいません。

正規表現

この付録は、生産性を向上させる強力な方法に関心のあるユーザーを対象としています。最も単純な正規表現( regex または regexp と略されることが多い)でさえ、気が遠く複雑に見えますが、OmegaTだけでなく、日常的に使用する他の多くのアプリケーションでも非常に役立ちます。

ここでは、翻訳者にとって最も有用な基礎についてのみ説明します。この付録の最後にある参考資料のセクションでは、この取扱説明書の範囲を超えた高度な使用方法や複雑な使用方法について説明します。特定のケースについてヘルプが必要な場合は、さまざまなサポートチャネルで質問することもできます。

正規表現では、文字、数字、記号( 文字 と総称されます)の組み合わせを使用して、特定のテキストパターンを表す を定義します。

以下にいくつかの例を示します。

[0-9]

0~9の任意の1桁。

\w+

1つ以上の「単語文字」、つまりアルファベット、数字、およびアンダースコア記号の文字を表します。

\h?

0または1つの水平空白文字を表します(これには、通常の改行しないスペースとタブが含まれますが、「垂直空白文字」カテゴリ:\vに属する改行文字は含まれません)。

多くのOmegaT関数は正規表現に依存しているか、または正規表現をオプションとして使用可能にしています。

検索

OmegaT検索には正規表現オプションがあり、ファイルを横断して非常に強力な検索を行うことができます。

テキストの置換 ダイアログの同じオプションを使用すると、検索テキストと置換テキストの両方に正規表現を適用できます。

カスタムタグ

カスタムタグとは、正規表現で定義されたタグであり、ネイティブのOmegaTタグとまったく同じように処理されます。詳細は カスタムタグ の設定を参照してください。

|(OR)文字を使用して、個々のタグ定義を区切ります。

フラグ付き文字列

フラグ付き文字列 設定を使用すると、 OmegaT がデフォルトで赤色でマークする文字列を定義し、検証の際に検証対象ではないタグとして扱うことができます。

|(OR)文字を使用して、個々の文字列定義を区切ります。

整合内のテキストの強調表示

視覚的な手がかりは、位置合わせの整合を確認するのに役立ちます。ハイライト 設定を使用すると、整合された文書内で OmegaT が強調表示する文字列を定義できます。

|(OR)文字を使用して、個々の表現を区切ります。

分節化規則

分節化規則と言語の構成例は、正規表現で定義されます。自由に変更して、文書の分節化を改善したり、一般的なルールを追加したりできます。詳細は、付録の 分節化規則 をご覧ください。

分節化規則または例外規則は、分節に分割する位置または分割しない位置を定義します。その位置を定義するには、2つの正規表現が必要です。1つは「before」式で、ルールが適用される場所の前のテキストパターンを定義し、もう1つは「after」式で、その位置の後のテキストパターンを定義します。

プロジェクトの原文の言語と一致する言語の構成例が、そのプロジェクトに適用されます。

4つのルール

正規表現は、スペース、タブ、改行など、画面に表示されない文字や印刷されない文字を含む文字列を検索するために使用できます。指定された式は、単語、フレーズ、またはその他の文字列に 一致する か、 一致しない かのいずれかです。

式のすべての文字は、一致を判断するときに関連します。

正規表現では、多数の文字または文字の組み合わせに特別な意味があります。

警告

正規表現はテキストとのみ一致します。 太字 斜体 、その他の スタイル効果 などの装飾と一致させることはできません。

注意すべき4つのルールがあります。

ほとんどの文字は単純に一致します。

正規表現のほとんどの文字は、テキストの文字列内で単に 自身を検索します

たとえば、「 example 」という単語をつづる7つの文字は、単に検索機能に対して、その順序でそれらの文字と正確に一致するように指示します。簡単に言うと、この検索では「 example 」という単語が検索されます。

バックスラッシュ(\)がついたアルファベットは、特別な意味を持ちます。

上記のように単純にそれ自体を表す文字とは異なり、\が前にある文字は、正規表現では特別な機能を持ちます。

たとえば、 r は通常の文字ですが、その前に\を付けて\rにすると、 キャリッジリターン文字 と一致する特殊な組み合わせになります。同様に、\R 任意の改行文字 と一致します。

注記

i j l m o y の文字だけは、小文字と大文字の両方で、前にバックスラッシュが付いていても特別な意味はありません。この説明書では、特別な意味を持つ文字のごく一部について説明します。

ここで説明されていない組み合わせについては、以下の参考資料項で紹介されるWebページを参照してください。

デフォルトでは、12文字が特別な意味を持ちます。

その特別な意味は、文字自体に一致する別の文字によってキャンセルされる必要があります。

完全な文字のリストは、次のとおりです。1つの例は.です。これ自体には、 任意の1文字 を照合するという特別な意味があります。

通常のピリオドを見つけるには、\を使用して意味をキャンセルし、式\.を作成する必要があります。これは、ピリオドとのみ一致します。

\文字は非常に特殊な文字です。

前述したように、\文字には、他の文字の特別な意味をキャンセルまたはアクティブにするというデフォルトの特別な意味があります。特別な意味を持たない文字(デフォルトまたは追加)の前に配置しても効果はありません。

\は、\\という形式に二重化することによって、それ自体の特別な意味をキャンセルすることができます。これは、単に バックスラッシュ 文字自体に一致します。

特別な12文字

The twelve special characters are the backslash \, the caret ^, the dollar sign $, the period (or dot ) ., the vertical bar (or pipe symbol ) |, the question mark ?, the asterisk (or star ) *, the plus sign +, the opening parenthesis (, the closing parenthesis , ), the opening square bracket [, and the opening curly brace {.

各文字について、その文字に依存する正規表現と、一致するかどうかにかかわらず一致するテキストの例を使用して簡単に説明します。

バックスラッシュ: \

この文字は、次の文字の特別な意味をキャンセルまたはアクティブにします。

  0\.[0-9]
一致

0.0 から 0.9 の間の数字、または10.5や560.5などのうち、最後の 0.5 だけの数字。

\.は、ピリオドの意味である「任意の文字」をキャンセルして小数点に一致させます。一方、\dは、通常は小文字の「d」文字を、0~9の任意の数字に一致する式に変換します。

一致しない

0,1、0-3、または0x002Eの最初の3文字などのシーケンスは、式が0.[0-9]で、ピリオドの前にバックスラッシュがない場合に一致します。

キャレット: ^

これが式の最初の文字である場合、 キャレット 文字は行の先頭と一致します。

角括弧で囲まれた文字クラスの最初の文字である場合、そのクラスの文字は除外されて、それ以外の文字全てに一致します。

 
  1. ^A

  2. [^abc]

一致
  1. “A long, but exciting journey was about to begin”の最初の大文字の「A」に一致。

  2. 「a」、「b」または「c」 以外 の任意の文字。例えば、単語「back」では、「k」のみが一致します。

一致しない
  1. “My friend is writing a book called A Long Journey ”の大文字の」「A」に一致。

  2. 単語「back」の小文字の「a」、「b」、または「c」に一致。

ドル記号: $

式の最後の文字である場合、 ドル 記号は行の末尾と一致します。

  ^\w+:$
一致

1つの単語で構成され、コロンで終わる行:

Questions:

一致しない

1つの単語で構成され、コロンで終わらない行:

Questions?

ピリオド: .

任意の1文字と一致します。

  c.t
一致

「c」で始まり「t」でおわる3文字の任意の組み合わせ: cat cut cot 、または cot cqt などの無意味な組合せ。

一致しない

「c」で始まり「t」で終わる4文字を含む組み合わせだが、複数の行になっている場合は一致しません。

What is the missing letter?

c
t
縦棒: |

この文字は「OR」として機能し、その前後にある式のいずれかと一致します。

  ^An|^The
一致

次のようなフレーズの最初の「An」または「The」:

“An apple a day…”
“The apple of my eye…”

一致しない

次のようなフレーズの最初の「An」または「The」:

“A story called An Unsung Hero .”
“They work for The Daily Post .”

クエスチョンマーク: ?

この文字は、直前の文字または式の0または1つのインスタンスを照合することを指定します。

  an?␣ (ここで “␣” は1つの空白文字を意味します)。
一致

次の「a」または「an」のいずれか:

“I have a question.”
“I know an excellent doctor.”

また、「Can I help you?」のような文の「Can」の最後の「an」や、「We have pasta for lunch」の「pasta」の最後の「a」も検索されます。

一致しない

"a"も"an"もありません:

The indefinite article: “a” (or “an”).

They are not followed by a space.

アスタリスク文字: *

この文字は、直前の文字または式の0個以上のインスタンスが一致することを指定します。

  run\w*
一致

「run」という単語、「runs」、「runner」、「runway」、「grunt」または「brunt」の「runt」、および「run」の後に0個以上の「 word characters 」(数字とアンダースコアを含むため、run_123@example.email.orgなどの電子メールアドレスの「@」の前の部分も一致します)が続くその他の単語または文字列。

一致しない

\wにはハイフンとアポストロフィは含まれていないため、「run-on」または「run'n'gun」の完全なフレーズには一致しない。これらのフレーズの最初の「run」だけが一致します。

プラス記号: +

この文字は、前の文字または式の1つ以上のインスタンスを一致させることを指定します。

  \d+.d
一致

「1.5」、「23.2」、「5235.8」などの数字。小数点以下が1桁で、小数点の前に任意の桁数があります。

一致しない

「5,235.8」や「21,571.9」などの数値の値全体。千単位の区切り文字の後の部分だけが一致します。

左括弧: (

この文字は グループ を開始します。グループとは、1つの単位として扱われる文字のセットです。グループには番号が付けられ、その内容グループはメモリに格納されます。これらは、後で\n を使用して検索式で再利用できます。ここで、nはグループの番号です。

注記

グループの内容は、置換テキストでも使用できます。検索で定義されたn 番目のグループを参照するには$n を使用します。

開始と終了のペアでは、常に括弧が使用されます。開き括弧または閉じ括弧だけを単独で使用しようとすると、エラーが発生します。

  (\b\w+\b)\h\1\b
一致

次の文の連続する「an」のように、スペースで区切られた重複した単語:

“I bought an an apple.”

一致しない

次の文の「that,that」:

“But that, that is just unbelievable”の最初の「that」の後に、スペースだけではなく、カンマとスペースが続いているため、一致しません。

右括弧: )

この文字はグループを閉じます。それだけでは使えないので、特別です。右括弧文字自体を一致させる必要がある場合は、前に\を付ける必要があります。

  ^\d+\)
一致

次のようなリストの各行の先頭にあるシーケンス番号(括弧を含む):

1)Apples
2)Oranges
3)Pears
一致しない

行の先頭以外にあるシーケンス番号。

Follow these steps:

Step 1) Preparation
Step 2) …
開き角括弧: [

この文字は閉じ角括弧と組み合わせる必要があり、それぞれが有効な一致候補を表す個々の文字のセットを囲みます。

開き括弧だけが特別であり、括弧文字自体を検索するには、前にバックスラッシュを付ける必要があります。閉じ括弧だけをそのまま使用する場合は、前にバックスラッシュを付ける必要はありません。(追加することはできますが、式や結果には影響しません)。

  li[cs]en[cs]e
一致

正しい “licence”や“license”の綴りや、綴り間違いの “lisence” や “lisense”に一致。

一致しない

もっと間違いのある “licensse” や “lissense”には一致しない。

開き中括弧: {

前の文字またはグループの一致するインスタンスの数を指定する 正確な数 最小 最大 、または 範囲 を囲み、閉じ中括弧と対にする必要があります。

中括弧のみが特別であり、中括弧文字自体を検索するには、前にバックスラッシュを付ける必要があります。閉じ括弧をそのまま使用する場合は、前にバックスラッシュを付ける必要はありません。(追加することはできますが、式や結果には影響しません)。

  \d{4}/\d{1,3}
一致

“1234/5”や “1472/69” あるいは “9513/842”といった4桁の数字、1つのスラッシュ、さらに1〜3桁の数字で構成された文字列に一致します。

一致しない

“123/45”や “1472/6985”あるいは “95133/15746”。

注意: 最後の二つのコードは、完全には一致しませんが、この式は “1472/6985”のなかの“ 1472/698 ”の部分や、“95133/15746”の “ 5133/157 ”の部分を返します。

たくさんの表現

この項では、単純なものから複雑なものまで、さまざまなタイプの正規表現について説明します。

注記

\で始まるすべての アルファベット 文字は、 文字自体ではなく、関連する特別な意味 を表す式になることに注意してください。

単純な式

最も単純な正規表現は、単に1つの文字、または\と1つの意味を持つ単位を構成する文字の組み合わせで構成されます。

表6 文字
一致
x

文字「x」自体

ほとんどの文字はそれ自身に一致します。

\t

文字「t」ではなく、タブ文字。

\n 文字「n」ではなく、改行(ラインフィード)文字。
\r

文字「r」ではなく、復帰(キャリッジリターン)文字。

同様に、\Rは任意の改行文字です。


大文字/小文字

通常のOmegaT検索は、デフォルトでは大文字と小文字が区別されません。オプション設定を有効にしない限り、大文字と小文字の両方が一致します。これにより、検索式全体で大文字と小文字が区別されます。

これに対して、正規表現ではデフォルトで大文字と小文字が区別されます。"omegat"を正規表現で検索しても、"OmegaT"とは一致しません。ただし、正規表現には、式の中で大文字/小文字指定を制御するための特別な修飾子もあります。

(?i)

式のうち、修飾子の右側の部分の大文字と小文字を区別しないようにします。

(?-i)

式の修飾子の右側の部分で大文字と小文字が区別されるようにします。

これを利用して、検索時の大文字と小文字の区別を細かく制御できます。たとえば、"omegat"と"OmegaT"の出現箇所を検索し、"OMEGAT"の出現箇所は検索しないようにします。これを行うには、次の式を使用します:(?i)o (?-i)mega (?i)t。これは、大文字と小文字を区別しない「o」の後に大文字と小文字を区別する「mega」が続き、その後に大文字と小文字を区別しない「t」が続くことを表します。

文字クラス

正規表現を使用すると、 文字クラス と呼ばれる文字集合を作成できます。検索をすると、文字集合内の任意の文字が一致します。

文字クラスは、必要な文字を角括弧で囲むことによって定義され、含める個々の文字を逐次指定するか、文字の範囲で指定できます。たとえば、[£€$]を指定して、テキスト内の3つの通貨記号のいずれかを検索したり、[1-3]を指定して、数値1、2、3を検索したりできます。

注記

文字クラスの内部では、バックスラッシュ(\)、キャレット(^)、閉じ括弧(])、ハイフン(-)のみが特別です。残りの12文字は通常の文字であり、これらの文字自体を検索する場合は、前にバックスラッシュを付ける必要はありません。

4つの文字クラスの特殊文字の前にバックスラッシュを付けると、通常の文字として検索できます。また、キャレット、閉じ括弧、およびハイフンを特別な意味を持たない位置に置くことで、キャレット、閉じ括弧、およびハイフン自体を検索することもできます。ただし、キャレットの場合は開き括弧の直後、閉じ括弧の場合はいずれかの開き括弧またはそれに続くキャレットの直後、ハイフンの場合は開き括弧の直後または閉じ括弧の直前を除きます。

頻繁に使用される多くのセットには、バックスラッシュとそれに続くアルファベットの文字で構成される省略形があります。たとえば、\d[0-9]の省略形であり、0~9の任意の数字に一致します。多くの場合、対応する大文字の後がクラスを否定するために使用されます:\Dは、数字ではない 任意の文字に一致します。

次の表に、その他のさまざまな例を示します。これらの文字クラスは、省略形を形成するために使用される実際の文字だけを表すことはありません。

表7 文字クラスの例
一致
[abc]

文字「a」、「b」、または「c」。

単純な文字クラスは、[および]で囲まれた任意の数の文字で構成されます。

[C-X]

「C」から「X」までの文字範囲の文字。

範囲は、連続する最初の文字、ハイフン、連続する最後の文字で定義されます。任意の数の範囲を定義できます:[a-zA-Z0-9]は、「a」から「z」までの任意の小文字、「A」から「Z」までの任意の大文字、または「0」から「9」までの任意の数字を意味します。系列の外に置かれたハイフンは単なるハイフンです:[a-z-]は、「a」から「z」までの任意の小文字、またはハイフン自体を意味します。

[^\n\r\t]

改行、復帰、タブを 除く 任意の文字。

開始角括弧の直後にキャレットを置くと、クラス内の残りの文字が除外されます。

\w

一般に[A-Za-z0-9_]と定義される単語文字。

\Wは、単語文字([^\w])では ない 任意の文字です。

\s

空白文字(スペース、タブ文字、改行を含む)。

\Sは、空白文字([^\s])では ない 任意の文字です。

\h および \v

タブ、スペース、改行などの空白文字(通常、 \sが使用される)。

\Hは水平方向の空白 以外 の文字で、\Vは垂直方向の空白 以外 の文字です(それぞれ[^\h][^\v])。


正規表現は英数字に限定されません。これらはUnicode文字セット全体を対象としています。Unicodeブロック、スクリプトおよびカテゴリを使用して、英数字の範囲外の文字クラスを指定します。いくつかの例を次の表に示します。

Unicode正規表現の詳細については、Unicode正規表現も参照してください。

表8 Unicodeブロック、スクリプト、およびカテゴリ
一致
\p{InGreek}

ギリシャ語ブロック(Unicodeブロック)の文字

\P{InGreek}は、ギリシャ語ブロックに 含まれない 任意の文字です。

\p{IsHan}

CJK言語(Unicodeスクリプト)の表意文字( Han / 漢字 / hanja )

\p{Lu}

大文字(Unicodeカテゴリ)

\p{Sc}

通貨記号、Unicodeカテゴリでもあります


高度な式

式の中には、文字ではなく位置を指定するものもあります。これらは、テキスト内で一致を検索する場所を示しますが、その一致には文字は含まれません。次の表に、一般的な例をいくつか示します。詳細については、参考資料項のWebページを参照してください。

表9 位置を示す式
一致
^

行の先頭

$

行の末尾

\b

単語境界

\B

単語の境界ではない

(?=u)

「u」が後に続く文字。

たとえば、q(?=u)は、文字「q」の後に「u」が続く場合、文字「q」と一致します。したがって、「equal」または「question」の「q」と一致しますが、「qigong」または「Iraq」の「q」とは 一致しません

(?!u)

その後に文字「u」が続く文字 ではない

たとえば、q(!u)は、「u」が後に 続かない 場合に、文字「q」と一致します。したがって、「qigong」(気功の意)または「Iraq」(イラク)の「q」と一致しますが、「equal」または「question」の「q」とは 一致しません

(?<=q)

文字「q」の後に続く文字。

たとえば、(?<=q)uは、文字「u」が「q」の後にある場合に一致します。したがって、「quick」の「u」には一致しますが、「run」の「u」には一致しません。

(?<!q)

文字「q」の前に ない 文字。

たとえば、(?<!q)uは、「q」の後に 来ない 場合、文字「u」と一致します。したがって、「run」の「u」と一致しますが、「quick」の「u」とは 一致しません


その他の例

このセクションでは、上記のさまざまな式を組み合わせて、OmegaTで強力な検索を実行する方法を示す例をいくつか示します。

表10 上記の式を使用する正規表現の例
目的
(\b\w+\b)\h\1\b

ダブルワードを検索します。

,\h[\h(\w+\.\w+)\w,'ʼ"“”-]+[\.,]

コンマで始まり、その後に空白文字が続き、1つ以上の単語(引用符で囲まれた単語、短縮形、およびファイル拡張子の付いたファイル名を含む)を含み、コンマまたはピリオドで終わる句を検索します。

\. \h+$

行末のピリオドの後にある余分な空白を検索します。

\h+a\h+[aeiou]

「an」ではなく、「a」の後にある母音で始まる単語を検索します。

\h+an\h+[^aeiou]

前の例の逆の例です。「a」ではなく「an」の後に来る子音で始まる単語を検索します。

\d{4}([/\.-]\d{1,2}){2}

次のように、スラッシュ、ピリオドまたはハイフンで区切られた月と日を使用して、年、月および日の順序で数値の日付を検索します:

  • 2002/11/8

  • 1969.7.20

  • 2022-10-31

注記

この式は、可能な日付に一致する数値パターンと区切りパターンを検索しますが、検証は行いません。また、「5136/36/71」などのパターンも検索されます。

\.[A-Z]

ピリオドの後に大文字が続く文字列を検索します。ピリオドと新しい文の始まりの間に欠落している可能性のあるスペースを見つけるのに役立ちます。

\bis\b

「is」を文中の単語全体として検索します。「this」、「is not」、または「Is」と一致するものは検索しません。

[\w\.-]+@[\w\.-]+

電子メールアドレスを検索します。この単純な表現では、有効なすべての電子メールアドレス形式に対応していない場合があります。


参考資料

OmegaTは正規表現に派手な色付けをしませんが、OmegaTは一致結果に色を付けるので、 プロジェクトの検索 ウィンドウを使って多くの練習をすることができます。

いくつかの追加リソースを以下に示します。

Javaテクニカル・リファレンスは、標準的なリファレンスとして役立ちます。

Java Regexのドキュメント

Javaで使用される正規表現の公式リファレンスです。

正規表現の使用についてさらに詳しく知りたい場合は、次の2つのWebサイトが非常に便利です。

https://regex101.com

検索したいテキストとテストしたい正規表現を入力できるオンライン正規表現マッチングツール。

https://www.regular-expressions.info

Web上で最も徹底した正規表現のチュートリアルおよびリファレンスの1つ。

注記

OmegaTはいずれのサイトもサポートしていません。どの言語であれ、他にも興味深い参考資料があれば、OmegaTチームは提案されたサイトを追記したいとおもいます。

用語集

用語集は用語集フォルダーに保存されている用語を集めたファイルです。

どれか の用語集で一致する、セグメント内のすべての用語が 用語集 ウィンドウに表示されます。

用語集の原文は、複数単語からなる用語であっても大丈夫です。

次の2種類の用語集ファイルがあります。

プロジェクトの用語集

編集 用語の追加... C + S + G を使用して、この用語集に新しい用語を入力できます。この理由から、 書き込み可能 用語集と呼ばれています。

プロジェクト プロジェクト構成物へのアクセス を使用してアクセスできます。テキストエディタで開いて変更することもできます。

事前にファイルを準備する必要はありません。

これは、最初に項目を用語集に追加するときに、自動的に作成されます。

注記

既存のファイルを標準用語集として使用することを選択した場合、新しいエントリはすべてタブ区切りの書式で記録され、デフォルトでUTF-8の文字エンコーディングで保存されている必要があります。

別のエンコーディングを指定する場合は、次の形式の「magic」コメントを追加します。

# -*- coding: <charset> -*-,

ここで、 <charset> は通常、IANA Charset Registryにリストされている文字エンコーディングの1つになります。

参考用語集

OmegaTが認識できるファイル形式の用語集です。プロジェクト用語集のようにOmegaTのGUIインターフェースから変更はできませんが、テキストエディタで編集できます。

注記

用語集に変更を加えるとOmegaTは変更を自動的に考慮して、一致する用語を 用語集 ウィンドウに表示します。

用語集フォルダー

デフォルトでは、各々のプロジェクトフォルダーには、追加書き込み可能な用語集と参照用語集を保存するための用語集フォルダがあります。詳細は、プロジェクト設定の 用語集フォルダー を確認してください。

すべての用語集は用語集フォルダーに保存しなければなりません。フォルダ内のさらにフォルダー内にある用語集も認識されます。

その参照用語集フォルダー内に、トピック、クライアント、またはワークフローに適したその他の分類別に整理された複数の用語集サブフォルダを作成できます。

用語集フォルダー プロジェクト設定で、参照用語集フォルダーの場所を設定できます。プロジェクトのフォルダーの外部に設定して、他のプロジェクトで使用したり、特定のサブフォルダで使用することもできます。

プロジェクトの用語集

デフォルトで、書き込み可能なプロジェクト用語集は用語集フォルダーにあり、glossary.txtと呼ばれています。

書き込み可能な用語集ファイルを開く ダイアログで名前と場所を変更できますが、.txtまたは.utf8拡張子を付けて、用語集フォルダーまたはそのサブフォルダーに保存する必要があります。

ファイル形式

用語集ファイルは単純なテキストファイルで、3つの列(カラム)からなるリストの形をしています。最初の列は原文で、それ以降はオプションで、2番目の列は訳文の用語、3番目はコメントが入ります。

用語集は、タブ区切り形式(TSV)とカンマ区切り形式(CSV)ファイルにすることも、TermBase eXchange(TBX)形式にすることもできます。

プロジェクトの書き込み可能な用語集は、UTF-8エンコーディングで保存されたTSVファイルです。ラテン文字のみを使用するユーザーで作成されたファイルは、非アスキー文字またはUTF-8として解釈されるその他の文字を含まない場合、ISO-8859-1として認識され、処理される場合があります。

参照用用語集の読み取りに使用されるエンコーディングは、ファイル拡張子によって異なります。

表11 フォーマット、拡張、および予想されるエンコーディング
ファイル形式: 拡張子 エンコーディング
TSV .txt UTF-8
TSV .utf8 UTF-8
TSV .tab OSのデフォルトエンコーディング
TSV .tsv OSのデフォルトエンコーディング
CSV .csv UTF-8
TBX .tbx UTF-8

方向制御用の書式設定文字

Bidi制御文字は 編集 BiDi 制御文字を挿入 から使用できます。これらは次の目的で使用できます。

  • 方向を強く持つ非表示の文字を挿入して、方向性の弱い文字または方向性のない文字に特定の位置を強制します。

  • 分節のなかに、反対方向に文字が綴られる項を作成します。

これらの制御文字は綴り方向を変えますが、見えません。 表示 Bidi制御文字を表示 を使用すると、その位置を視覚的に表示します。

マーク

(句読点記号のような)弱いまたは中立的な方向性を持つ文字の位置を変更するには、その分節の方向に応じて、文字の後にLRMまたはRLM文字を挿入します。

  • 右から左への分節で、左から右に綴る必要がある弱い方向性の文字の後に、左から右へ指示(LRM: left-to-right Mark)文字を挿入します。(例えばアラビア語の文章の中の英語の抜粋の場合)

  • 左から右の分節の中で、右から左に綴る必要がある弱い方向性の文字の後に、右から左へ指示(RLM: right-to-left mark)文字を挿入します。(例えば英語の文章の中のアラビア語の抜粋の場合)

埋め込み

埋め込みを使用して、分節の綴り方向と反対に綴る必要がある(いくつかの単語とスペースを含むような)長い文章を作成することができます。分節の綴り方向に応じて、次の2種類の埋め込みを作成できます。

  • 右から左への分節に左から右への埋め込みを作成するには、左から右への埋め込み(LRE: Left-to-Right Embedding)文字を挿入し、左から右への文章を入力または挿入してから、ポップ方向書式設定(PDF: Pop Directional Formatting)文字を挿入します。

  • 左から右の分節に右から左への埋め込みを作成するには、右から左への埋め込み(RLE: Right-to-Left embedding)文字を挿入し、右から左への文章を入力または挿入してから、PDF文字を挿入します。

後処理用コマンド:

プロジェクト固有のコマンドについては、 プロジェクト専用の後処理用コマンド: プロジェクト設定を参照してください。

ユーザーレベルのコマンドは ユーザーレベルの後処理用外部コマンド 設定を参照してください。

テンプレート変数

コマンドでは、 Java ランタイムの実行時に、テンプレートの値が展開された文字列として渡されます。すべての引数は引用符で囲む必要があります。たとえば、"${fileName}"

次のテンプレート変数は常に使用できます。テンプレート一覧のその他の項目は、システムの環境変数です。

表12 テンプレート変数
変数名
${projectName} プロジェクト・ディレクトリーの名前
${projectRoot} プロジェクトのフォルダーへの絶対パス
${sourceRoot} 原文フォルダーへの絶対パス
${targetRoot} 訳文フォルダーへの絶対パス
${glossaryRoot} 用語集フォルダーへの絶対パス
${tmRoot} TM ルート・フォルダーへの絶対パス
${tmAutoRoot} TM 自動フォルダーへの絶対パス
${dictRoot} 辞書フォルダーへの絶対パス
${tmOtherLangRoot} TM ルート + tmx2source ( 詳細については、 2つの言語の橋渡し の how-to を参照してください。)
${sourceLang} 原文言語
${targetLang} 訳文言語
${filePath} 原文ファイルへの絶対パス
${fileShortPath} 指定されたルートに対する原文ファイル名
${fileName} 原文ファイルの完全な名前
${fileNameOnly} 原文ファイルの拡張子を除いた名前
${fileExtension} 原文ファイルのドットを除いた拡張子

ユーザー定義スクリプト

通常のコマンドに加えて、スクリプトを呼び出すことができます。信頼されていない情報源からの後処理スクリプトは、決して実行しないでください。セキュリティ上の理由から、プロジェクト専用の後処理用コマンドはデフォルトで無効になっています。

テンプレート変数は、通常のコマンドとユーザ定義スクリプトの両方で使用できます。スクリプトには絶対パスを使用する必要があります。OmegaTが使用するPATHは、現在のユーザーのPATHと同じでない場合があります。

STDOUT および STDERR は、 omegat.log ファイルに書き込まれます。終了コードと STDERR 、または最後の STDOUT がステータス・バーに表示されます。

LinuxとmacOSの場合

shebang表記( #! )を使用する必要があります。/bin/bashまたは#!/usr/bin/env python3. スクリプトは実行可能でなければなりません。&& または || またはパイプ | でコマンドをつなぐ機能は利用できません。

例29 簡単な後処理用コマンドの例
Linux で訳文フォルダーを開く
xdg-open ${targetRoot}
macOSで訳文フォルダーを開く
open ${targetRoot}
Windows Powershellで訳文フォルダーを開く
Invoke-Item ${targetRoot}

OmegaTのショートカット

説明

OmegaTでは、通常の機能にアクセスするのに、ボタンをクリックすることがありません。 メニューから機能にアクセスでき、多くの機能にはデフォルトのショートカットがあります。

最も頻繁に使用されるショートカットについては、OmegaTを使用して作業を開始すればすぐに習得できます。ショートカットは各メニュー項目の横に表示され、ソフトウェアを使用するたびに新しいショートカットを学習できます。

OmegaTのほとんどのショートカットはカスタマイズできます。詳細はカスタマイズ項をご覧ください。

OmegaT は、JRE(Java Runtime Environment)がインストールされた、あるいはインストールできる、すべてのオペレーティングシステムl(Windowsや macOS、LinuxなどメジャーなOS)上で動きます。ショートカットを構成する修飾キーは、OSによって多少異なります。読みやすくするために、修飾キーに次の表記法を採用しています。

表13 修飾キー識別子
Linux/Windows キー識別子 macOS
Shift S shift または
Ctrl or Control C command または
Alt A alt / option または
  Ctrl control または

上記の キー識別子 を使用すると、すべてのショートカットに対して複数の表記をリストする必要がなくなります。

例30 複数の表記をリストすることを避ける方法::

Windows と Linuxでは: Ctrl + Shift + N

macOSでは: Shift + Command + N

この説明書での表記は: C + S + N


カスタマイズ

OmegaTは、 プロジェクト 編集 、および 移動 メニューの機能と、 編集 ウィンドウの機能の大多数にショートカットを割り当てています。ほとんどの機能のショートカットを追加または変更することもできます。

そのためには、適切なショートカット定義ファイルをOmegaT構成フォルダーに置く必要があります。詳細は、付録の 設定フォルダー をご覧ください。

2つのショートカット定義ファイルがあります。

MainMenuShortcuts.properties

メニューからアクセスできる機能のショートカット定義です。

EditorShortcuts.properties

編集ウィンドウのショートカット定義ファイルです。

新しいショートカットを有効にするには、ショートカット定義ファイルが変更された後でOmegaTを再始動する必要があります。

注記

SourceforgeのOmegaTの開発サイトからデフォルトのOmegaTショートカットファイルを構成フォルダにコピーし、必要に応じて変更することができます。

Windows や Linux のデフォルトのショートカットキー
macOSのデフォルトのショートカット

The macOS files must be renamed MainMenuShortcuts.properties and EditorShortcuts.properties for OmegaT to recognize them.

次の項では、ショートカット定義ファイルで使用される構文について説明し、変更例を示します。

構文

ショートカット定義ファイルの基本的な構文は次のとおりです。

機能コード=ショートカット

以下の機能とコードのリスト項の表を使用して、機能コードの値を確認してください。

ショートカット は、ユーザーが打鍵するキーの組み合わせを意味します。次の形式になります。

  • 0以上の修飾子

  • 0または1が続くイベント

  • 1 keyが続きます

  • ここで 修飾子 は次のいずれかです: shiftctrlmetaaltaltGraph

    注記

    metaは、WindowsまたはLinuxシステムのほとんどのキーボードにあるWindowsロゴのキーと、macOSのコマンドを指します。

    altGraphは、2つの Alt キーを持つキーボードのスペースバーの右側にある Alt キーを指します。

  • イベントは、入力された押された解放されたです。

  • keyは、キーボードで使用可能な任意のキーです。さまざまな編集ショートカットを示す表を参照して、HomePage Up、矢印キーなどのキーの値を確認できます。

空行とコメントを追加してリストを整理し、読みやすくすることができます。コメント行は#で始まり、それ以降はすべてアプリケーションによって無視されます。

ショートカットを変更する最も簡単な方法は、前述のように、デフォルトのファイルのコピーを構成フォルダーにダウンロードし、そこで必要な変更を行うことです。

例31 ショートカットの変更

WindowsとLinuxでは、プロジェクトを閉じるデフォルトのショートカットは、次のように定義されています:

projectCloseMenuItem=ctrl shift W

macOS では次のようになります:

projectCloseMenuItem=meta shift W

ただし、ショートカットから S キーを削除して、 Ctrl + W (または Command + W (macOSの場合))して、他のアプリケーションで使用するショートカットと一致させることもできます。

そのためにWindowsとLinuxでは、MainMenuShortcuts.propertiesファイルを次のように変更します。

projectCloseMenuItem=ctrl W

macOSでは同様に:

projectCloseMenuItem=meta W


例32 ショートカットの追加

言語ペアが代替翻訳を頻繁に使用する必要がある場合に、デフォルトのショートカットが無いため、ショートカットを割り当てたいと思うでしょう。

以下の手順は、 Alt + X ショートカットを 編集 例外訳文を登録 メニュー項目に割り当てる方法を示しています。

  1. 構成フォルダーにコピーしたMainMenuShortcuts.propertiesをテキストエディターで開きます。

  2. 以下の編集メニュー表に示すように、[例外訳文の作成]の機能コードはeditMultipleAlternateです。

    ファイル内でそのコードを検索すると、次の行が表示されます。

    # editMultipleAlternate=

  3. この行は現在コメントです。行の先頭の#を削除して、OmegaTがショートカットを認識できるようにし、行の最後の=記号の後にalt Xを追加します。

    editMultipleAlternate=alt X

  4. ファイルを保存して閉じます。次にOmegaTを起動すると、新しいショートカットがアクティブになり、メニューの機能名の横に表示されます。


変更が完了したら、ファイルを保存します。OmegaTが開いている場合は、変更を有効にするために再起動する必要があります。

変更または追加したショートカットが、変更したメニュー項目の横に表示されます。他の機能やシステム全体のショートカットと競合しない限り、これらはOmegaTで利用できるようになります。

次の項には、機能コードと、OmegaTの各メニューまたはデフォルトの関数に対応する編集ショートカットを示す表があります。

機能とコードのリスト

メニュー機能

MainMenuShortcuts.propertiesファイルで変更できる機能のデフォルト値を以下の表に示します。括弧内のショートカットは、EditorShortcuts.propertiesにある同じ機能の代替です。

表14 プロジェクトメニュー
メニュー項目 機能コード Windows/Linux macOS
新規作成... projectNewMenuItem ctrl shift N meta shift N
チームプロジェクトをダウンロード... projectTeamNewMenuItem    
開く... projectOpenMenuItem ctrl O meta O
最近使用したプロジェクト projectOpenRecentMenuItem    
ファイルを追加... projectImportMenuItem    
MediaWiki からの原文ファイル追加 projectWikiImportMenuItem    
再読み込み projectReloadMenuItem F5
閉じる projectCloseMenuItem ctrl shift W meta shift W
保存 projectSaveMenuItem ctrl S meta S
原文ファイルをコミット projectCommitSourceFiles    
訳文ファイルをコミット projectCommitTargetFiles    
訳文ファイルを生成 projectCompileMenuItem ctrl D meta D
現在の訳文ファイルのみ生成 projectSingleCompileMenuItem ctrl shift D meta shift D
プロジェクト設定... projectEditMenuItem ctrl E meta E
原文ファイル... viewFileListMenuItem ctrl L meta L
プロジェクト構成物/原文にアクセス projectAccessRootMenuItem    
プロジェクト構成物/辞書にアクセス projectAccessDictionaryMenuItem    
プロジェクト構成物/用語集にアクセス projectAccessGlossaryMenuItem    
プロジェクト構成物/原文にアクセス projectAccessSourceMenuItem    
プロジェクト構成物/訳文にアクセス projectAccessTargetMenuItem    
プロジェクト構成物/翻訳メモリにアクセス projectAccessTMMenuItem    
プロジェクト構成物/エキスポート用翻訳メモリにアクセス projectAccessExportTMMenuItem    
プロジェクト構成物/現在作業中の原文ファイルにアクセス projectAccessCurrentSourceDocumentMenuItem    
プロジェクト構成物/現在作業中の訳文ファイルへアクセス projectAccessCurrentTargetDocumentMenuItem    
プロジェクト構成物/更新可能な用語集にアクセス projectAccessWriteableGlossaryMenuItem    
再起動 projectRestartMenuItem    
終了 projectExitMenuItem ctrl Q meta Q

表15 編集メニュー
メニュー項目 機能コード Windows/Linux macOS
取り消す editUndoMenuItem ctrl Z meta Z
やり直す editRedoMenuItem ctrl Y meta Y
参考訳文または選択範囲によって置換 editOverwriteTranslationMenuItem ctrl R meta R
参考訳文または選択範囲を挿入 editInsertTranslationMenuItem ctrl I meta I
機械翻訳に置換 editOverwriteMachineTranslationMenuItem ctrl M meta M
原文に置換 editOverwriteSourceMenuItem ctrl shift R meta shift R
原文を挿入 editInsertSourceMenuItem ctrl shift I meta shift I
原文テキストを選択 editSelectSourceMenuItem ctrl shift A meta shift A
未使用の原文のタグを挿入 editTagPainterMenuItem ctrl shift T meta shift T
次の未使用のタグを挿入 editTagNextMissedMenuItem ctrl T meta T
選択領域を出力 editExportSelectionMenuItem ctrl shift C meta shift C
用語の追加 editCreateGlossaryEntryMenuItem ctrl shift G meta shift G
プロジェクトを検索... editFindInProjectMenuItem ctrl F meta F
(最新の検索ウィンドウを呼びだす) findInProjectReuseLastWindow ctrl shift F meta shift F
検索と置換... editReplaceInProjectMenuItem ctrl K meta K
辞書を検索 editSearchDictionaryMenuItem alt shift D
大/小文字設定→すべて小文字に lowerCaseMenuItem    
大/小文字設定→すべて大文字に upperCaseMenuItem    
大/小文字設定→単語の先頭を大文字に titleCaseMenuItem    
大文字/小文字の切り替え sentenceCaseMenuItem    
大/小文字の切り替え / 循環 cycleSwitchCaseMenuItem shift F3
前の参考訳文を選択 editSelectFuzzyPrevMenuItem ctrl UP meta UP
次の参考訳文を選択 editSelectFuzzyNextMenuItem ctrl DOWN meta DOWN
一致#1を選択 editSelectFuzzy1MenuItem ctrl 1 meta 1
一致#2を選択 editSelectFuzzy2MenuItem ctrl 2 meta 2
一致#3を選択 editSelectFuzzy3MenuItem ctrl 3 meta 3
一致#4を選択 editSelectFuzzy4MenuItem ctrl 4 meta 4
一致#5を選択 editSelectFuzzy5MenuItem ctrl 5 meta 5
BiDi制御文字/左から右へのマークの挿入(LRM U+200E) insertCharsLRM    
BiDi制御文字/右から左への記号の挿入(RLM U+200F) insertCharsRLM    
BiDi制御文字/右から左への記号の挿入(RLM U+200F) insertCharsLRE    
BiDi制御文字/右から左への埋め込みの挿入(RLE U+202B) insertCharsRLE    
BiDi制御文字/ポップ方向フォーマットの挿入(PDF U+202C) insertCharsPDF    
基本訳文として使用 editMultipleDefault    
例外訳文を登録 editMultipleAlternate    
訳文を削除 editRegisterUntranslatedMenuItem ctrl shift X meta shift X
訳文を<空訳文>にする editRegisterEmptyMenuItem    
原文と同一訳文を登録 editRegisterIdenticalMenuItem ctrl shift S meta shift S

表16 移動メニュー
メニュー項目 機能コード Windows/Linux macOS
次の未翻訳分節 gotoNextUntranslatedMenuItem ctrl U meta U
次の翻訳済み分節 gotoNextTranslatedMenuItem ctrl shift U meta shift U
次の分節 gotoNextSegmentMenuItem ctrl N (Enter/Tab) meta N (Enter/Tab)
前の分節 gotoPreviousSegmentMenuItem ctrl P (ctrl Enter / ctrl Tab) meta P (meta Enter / shift Tab)
分節番号を指定... gotoSegmentMenuItem ctrl J meta J
次のメモ gotoNextNoteMenuItem ctrl alt N meta alt N
前のメモ gotoPreviousNoteMenuItem ctrl alt P meta alt P
次の繰り返しを除いた分節 gotoNextUniqueMenuItem ctrl shift K meta shift K
選択中の参考訳文の元分節 gotoMatchSourceSegment ctrl shift M meta shift M
tm/auto/ からの次の分節 gotoNextXAutoMenuItem ctrl alt COMMA meta alt COMMA
tm/auto/ からの前の分節 gotoPrevXAutoMenuItem ctrl alt shift COMMA meta alt shift COMMA
tm/enforce/からの次の分節 gotoNextXEnforcedMenuItem ctrl alt PERIOD meta alt PERIOD
tm/enforce/からの以前の分節 gotoPrevXEnforcedMenuItem ctrl alt shift PERIOD meta alt shift PERIOD
分節の選択履歴を進む gotoHistoryForwardMenuItem ctrl shift N meta shift N
分節の選択履歴を戻る gotoHistoryBackMenuItem ctrl shift P meta shift P
メモウィンドウ gotoNotesPanelMenuItem ctrl alt 9 meta alt 9
編集ウィンドウ gotoEditorPanelMenuItem ctrl alt 0 meta alt 0

表17 表示メニュー
メニュー項目 機能コード Windows/Linux macOS
翻訳済み分節を色づけ viewMarkTranslatedSegmentsCheckBoxMenuItem    
未翻訳分節を色づけ viewMarkUntranslatedSegmentsCheckBoxMenuItem    
Mark Paragraph Delimitations viewMarkParagraphStartCheckBoxMenuItem    
原文を表示 viewDisplaySegmentSourceCheckBoxMenuItem    
繰り返しのある分節を色づけ viewMarkNonUniqueSegmentsCheckBoxMenuItem    
メモ付き分節を色付け viewMarkNotedSegmentsCheckBoxMenuItem    
ノーブレークスペースを色付け viewMarkNBSPCheckBoxMenuItem    
空白文字を色付け viewMarkWhitespaceCheckBoxMenuItem    
双方向アルゴリズム制御文字を色付け viewMarkBidiCheckBoxMenuItem    
auto フォルダー由来の分節を色付け viewMarkAutoPopulatedCheckBoxMenuItem    
用語集の一致をマーク viewMarkGlossaryMatchesCheckBoxMenuItem    
言語チェッカー viewMarkLanguageCheckerCheckBoxMenuItem    
代替フォントを積極的に使用 viewMarkFontFallbackCheckBoxMenuItem    
更新情報を表示 / 表示しない viewDisplayModificationInfoNoneRadioButtonMenuItem    
Modification Info/Display for Current Segment viewDisplayModificationInfoSelectedRadioButtonMenuItem    
更新情報を表示 / すべての分節で表示 viewDisplayModificationInfoAllRadioButtonMenuItem    

表18 ツールメニュー
メニュー項目 機能コード Windows/Linux macOS
品質チェック... toolsCheckIssuesMenuItem ctrl shift V meta shift V
現在のドキュメントの品質をチェック toolsCheckIssuesCurrentFileMenuItem    
翻訳状況 toolsShowStatisticsStandardMenuItem    
参考訳文の一致率 toolsShowStatisticsMatchesMenuItem    
参考訳文の一致率(ファイル別) toolsShowStatisticsMatchesPerFileMenuItem    
整合ツール... toolsAlignFilesMenuItem    

注記

ツール メニューの スクリプト 項目は例外です。

ショートカットを追加してスクリプト編集を呼び出したり、スクリプトに割り当てられたショートカットを変更したりすることはできません。

表19 設定メニュー
メニュー項目 機能コード Windows/Linux macOS
環境設定 optionsPreferencesMenuItem    
機械翻訳/翻訳を自動的に取得する optionsMTAutoFetchCheckboxMenuItem    
用語集/用語の照合にトークナイザーを使う optionsGlossaryFuzzyMatchingCheckBoxMenuItem    
辞書/辞書項目の照合にトークナイザーを使う optionsDictionaryFuzzyMatchingCheckBoxMenuItem    
自動補完/関連性の強い補完候補を自動的に表示する optionsAutoCompleteShowAutomaticallyItem    
Auto-completion/History Completion optionsAutoCompleteHistoryCompletionMenuItem    
Auto-completion/History Prediction optionsAutoCompleteHistoryPredictionMenuItem    
ファイルフィルター... optionsSetupFileFiltersMenuItem    
分節化規則... optionsSentsegMenuItem    
編集... optionsWorkflowMenuItem    
設定フォルダにアクセス optionsAccessConfigDirMenuItem    

表20 ヘルプメニュー
メニュー項目 機能コード Windows/Linux macOS
取扱説明書... helpContentsMenuItem F1
OmegaT について... helpAboutMenuItem    
最近の更新履歴... helpLastChangesMenuItem    
ログ... helpLogMenuItem    
更新の確認... helpUpdateCheckMenuItem    

表21 検索ウィンドウ
メニュー項目 機能コード Windows/Linux macOS
編集ウィンドウのエントリへジャンプ jumpToEntryInEditor ctrl J meta J

編集機能

EditorShortcuts.propertiesファイルで変更できるショートカットとそのデフォルト値を次の表に示します。

表22 編集
機能 機能コード Windows/Linux macOS
コンテキストメニューを開く editorContextMenu CONTEXT_MENU shift ESCAPE
次の分節に移動 editorNextSegment TAB
前の分節に移動 editorPrevSegment shift TAB
次の分節に移動(Tabキーではない) editorNextSegmentNotTab ENTER
前の分節に移動(Tabキーではない) editorPrevSegmentNotTab ctrl ENTER meta ENTER
Insert Linebreak editorInsertLineBreak shift ENTER
Select All editorSelectAll ctrl A meta A
前のトークンの削除 editorDeletePrevToken ctrl BACK_SPACE alt BACK_SPACE
次のトークンの削除 editorDeleteNextToken ctrl DELETE alt DELETE
最初の分節に移動 editorFirstSegment ctrl PAGE_UP meta PAGE_UP
最後の分節に移動 editorLastSegment ctrl PAGE_DOWN meta PAGE_DOWN
次のトークンをスキップ editorSkipNextToken ctrl RIGHT alt RIGHT
前のトークンをスキップ editorSkipPrevToken ctrl LEFT alt RIGHT
選択した次のトークンをスキップ editorSkipNextTokenWithSelection ctrl shift RIGHT alt shift RIGHT
選択した前のトークンをスキップ editorSkipPrevTokenWithSelection ctrl shift LEFT alt shift LEFT
カーソルロックの切り替え editorToggleCursorLock F2
上書き入力の切り替え editorToggleOvertype INSERT F3

表23 Autocompleter
機能 機能コード Windows/Linux macOS
自動補完機能を開く autocompleterTrigger ctrl SPACE ESCAPE
次の自動補完ビューを開く autocompleterNextView ctrl SPACE ctrl DOWN
前の自動補完ビューを開く autocompleterPrevView ctrl shift SPACE ctrl UP
自動補完を確認して閉じる autocompleterConfirmAndClose ENTER
閉じずに自動補完を確認する autocompleterConfirmWithoutClose INSERT
自動補完を閉じる autocompleterClose ESCAPE
リストを上に移動 autocompleterListUp UP
リストの下へ移動 autocompleterListDown DOWN
1ページ上へ移動 autocompleterListPageUp PAGE_UP
1ページ下へ移動 autocompleterListPageDown PAGE_DOWN
表内を上へ移動 autocompleterTableUp UP
表内を下へ移動 autocompleterTableDown DOWN
表内を左へ移動 autocompleterTableLeft LEFT
表内を右へ移動 autocompleterTableRight RIGHT
表の1ページ上へ移動 autocompleterTablePageUp PAGE_UP
表の1ページ下へ移動 autocompleterTablePageDown PAGE_DOWN
最初の表に移動 autocompleterTableFirst ctrl HOME meta HOME
最後の表に移動 autocompleterTableLast ctrl END meta END
表の最初の行に移動 autocompleterTableFirstInRow HOME
表の最後の行に移動 autocompleterTableLastInRow END

設定フォルダー

設定フォルダーには、OmegaT設定の大部分が格納されます。

設定 設定フォルダにアクセス を使用してアクセスします。

場所

標準設定フォルダーの場所はシステムによって異なります( ~ の文字はホームディレクトリを表します)。

Linux

~/.omegat

macOS

~/Library/Preferences/OmegaT

Windows

~\AppData\Roaming\OmegaT

注記

コマンドラインから起動する場合には、標準以外のOmegaT設定フォルダーを指定できます。詳細については、 コマンドライン起動を参照してください。

変更された環境設定は、プロジェクトで使用される構成フォルダーに保存されます。デフォルトの設定フォルダーを使用しない場合には、環境設定で行われた変更はすべて指定された設定フォルダーに保存されます。そのため、デフォルトの設定フォルダーで作業を再開しても反映されません。

デフォルトで保存されるファイル

omegat.prefs

このファイルには、ユーザーの重要な環境設定が保存されます。

環境設定では、ユーザーインターフェースに対応する設定が無いものがあります。それらの設定は、直接編集して反映させます。

例33 翻訳対象ファイル一覧を自動表示しない

プロジェクトを開いたときに、翻訳対象ファイル一覧ウィンドウを自動的に開かないようにするには、<project_files_show_on_load>を検索して、truefalseに置き換える編集をします。

<project_files_show_on_load>false</project_files_show_on_load>

注記

この設定は、現在手動で編集しなければなりません。

uiLayout.xml

このファイルでは、OmegaTの画面レイアウトが保存されています。

logs/

このフォルダーには、たくさんのログファイルが保存されています。最重要なのは、 OmegaT.logです。

これらのファイルには、様々な内部の状態が記録されており、OmegaT実行中のプログラム内のイベントメッセージが記録されています。もしOmegaTの動作がおかしいときは、サポートのコミュニティに報告するときに、このファイルを添付するようにしてください。

ヘルプ ログ... を使用して、このファイルを閲覧できます。

script/

スクリプト機能を使用する場合、このフォルダーに最大で3つのテキストファイルが保存されます:

selection.txt

編集 選択領域を出力 C + C + S を使用したときに、画面で選択されているテキストが格納されます。ファイル内のテキストは、スクリプト機能が呼び出されるたびに置き換えられます。

source.txt

分節をテキストファイルへ出力 設定が有効になると、編集中の分節の 原文テキスト がこのファイルに入ります。ファイル内のテキストは、次の分節に移動するたびに置き換えられます。

target.txt

分節をテキストファイルへ出力 設定が有効になると、編集中の分節の 訳文テキスト がこのファイルに入ります。ファイル内のテキストは、次の分節に移動するたびに置き換えられます。

これらの3つのファイルをとおして、シェルスクリプトなどのローカルプログラムで自動処理するときに、OmegaTのコンテンツに簡単にアクセスできるようになります。

その他のファイルたち

EditorShortcuts.properties

これは、編集ウィンドウのショートカットをカスタマイズするためのパラメータのファイルです。詳細は、付録の カスタマイズ をご覧ください。

MainMenuShortcuts.properties

これは、ユーザインタフェースのショートカットを変更するパラメータのファイルです。詳細は、付録の カスタマイズ をご覧ください。

filters.xml

これは、ファイル種別ごとのフィルター設定が保存されるファイルです。詳細については、設定- ユーザーレベルファイルフィルタ を参照してください。

finder.xml

これは、外部検索の設定パラメータが保存されるファイルです。詳細については、設定- ユーザーレベルの外部検索 を参照してください。

omegat.autotext

これは、自動テキスト置換の設定パラメータが保存されるファイルです。詳細については、設定- 入力補完 を参照してください。

repositories.properties

これは、チームプロジェクトのリポジトリーのログイン情報が保存されるファイルです。

警告

このファイルは、暗号化されていません。

詳細については、 チームプロジェクトを設定するを参照してください。

segmentation.conf

これは、分節化ルールをカスタマイズするためのファイルです。詳細については、設定- ユーザーレベルの分節化規則 を参照してください。

plugins/

このフォルダは、OmegaTのプラグインをインストールするための標準フォルダーです。詳細は プラグイン の設定を参照してください。

プログラムのplugins/フォルダーにプラグインをインストールすることもできます。

spelling/

このフォルダには、綴り確認用の辞書が格納されます。詳細については、設定- スペルチェッカー を参照してください。

プログラムフォルダー

プログラムフォルダーには、 アプリ本体のOmegaT.jarなどの重要なファイルが多数あります。

注記

プログラムフォルダーの場所は、ご使用のプラットフォームおよびOmegaTのインストール方法によって異なります。推奨またはデフォルトの場所は次のとおりです。

Windows

C:\Program Files\OmegaT\

Linux

/opt/omegat/

macOS

/Applications/OmegaT.app/Contents/Java/

その他のシステム

/opt/omegat/

OmegaT-license.txt

OmegaT ライセンスGPLバージョン3

OmegaT.jar

OmegaTの実行ファイル。コマンドラインからOmegaTを起動するときに使用します。詳細については-コマンドライン起動を参照してください。

changes.txt

改善とバグ修正のリスト。OmegaTの進化に関する情報が必要な場合は、ここをチェックしてください。

doc-license.txt

文書のライセンス。GPLバージョン3

index.html

多言語の取扱説明書の索引を指定します。

join.html

サポートページへのリンク。

readme.txt

簡単なインストールと実行手順。

docs/

文書フォルダです。

contributors.txt

個々の貢献者のリスト。

en/

翻訳された各取扱説明書は、それぞれの言語フォルダに格納されます。

index.html

多言語の取扱説明書の索引を指定します。

libraries.txt

OmegaTが使用するライブラリーのリスト。

images/

OmegaTで使用する画像が保存されるフォルダです。

lib/

OmegaTが使用するライブラリーが保管されているフォルダー。

plugins/

外部プラグインをインストールできるフォルダー。プラグインの手動インストールの推奨場所は、構成フォルダーの中にあるplugins/フォルダーです。詳細の プラグイン 環境設定を参照してください。

scripts/

配布されたスクリプトが格納されているフォルダ。詳細については、 スクリプト ウインドウを参照してください。