ファイルフィルタは、ローカルで特定のプロジェクトに固有のものか、ユーザーレベルで構成フォルダーを共有するすべてのプロジェクトで使用できるものの二種類あります。
詳細情報は以下を確認してください。
現在のプロジェクトで使用しているフィルターを太字で示します。
特定のフィルターに関連付けられているファイルを翻訳しない場合は、そのチェックボックスをオフにして無効にします。これらのコンテンツは翻訳用には表示されません。
フィルタは、名前または有効かどうかでソートできます。関連するヘッダーをクリックすると、昇順または降順の順序でソートできます。
フィルター対象とするファイルやエンコーディングを変更する場合は
をクリックします。一部のフィルタには、設定をさらにカスタマイズするための
ボタンがあります。をクリックすると、それまでのフィルター設定をリセットし初期設定に戻します。
変更されたユーザーレベルファイルのフィルター設定は、filters.xmlの設定フォルダーに保存されます。 設定フォルダー に詳細を示します。このファイルを削除すると、フィルターの環境設定もリセットされます。
変更されたプロジェクト専用のファイルフィルタ設定は、プロジェクトフォルダーにあるfilters.xmlファイルに保存されます。詳細については-プロジェクトフォルダーを参照してください。このファイルを削除すると、フィルターの環境設定もリセットされ、ユーザレベルのファイルフィルター設定が使用されるようになります。
通常、OmegaTが翻訳済みの分節を正しく再作成するには、先頭タグと末尾タグが必要です。これらを翻訳可能なコンテンツで非表示にすると、誤って削除したり変更したりすることがなくなります。
先行タグと後続タグを保持する場合は、それらのタグも訳文に含めるようにしてください。
デフォルトではOmegaTは、翻訳対象のコンテンツから先頭と末尾の空白文字を削除します。分節化しないプロジェクトでは、この設定を無効にすると、訳文の先頭と末尾の空白文字が編集可能になります。
原文の文書ファイルにレイアウトの制御に使用される空白文字が含まれている場合、必要な空白文字は訳文ファイルでも保持されます。
ソースファイル名は、例外訳文を特徴付ける要素の1つです。この設定が有効化された場合、前および次の分節や分節識別子のみが、例外訳文を特徴付けるために使用されます。
他のファイルにある同じ特徴を持つ分節は、指定されている例外訳文として訳文が生成されます。
編集可能なフィールドをダブルクリックして変更を行うか、
ボタンをクリックして変更ダイアログにアクセスします。フィルターパターンを追加するには、
をクリックして、同様のダイアログを開きます。どちらのダイアログでも、このフィルターに関連付けられた原文ファイルと訳文ファイルのファイル名パターンをカスタマイズして、それぞれの文字エンコーディングを選択できます。
ターゲットのファイル名をカスタマイズするには、ファイル名変数ドロップダウンメニューを使用します。
OmegaTはファイル拡張子をチェックし、フィルター内の原文ファイル名パターンと照合します。適合したときに、ファイルにフィルターに関連付けます。
たとえば、構成例 *.xhtml
は、拡張子が xhtml
のあらゆるファイルに一致します。source フォルダーでそのようなファイルが見つかった時に、XHTMLフィルターによって処理されます。
そのフィルターに関連づけたいファイルに応じて、ファイル名構成例を変更したり追加したりできます。
ファイル拡張子をフィルターに関連付けるだけでは、フィルターがファイルを適切に処理することはできません。ファイルの内部構造が、フィルターが対応する仕様と互換である必要があります。.odt
をXHMTLフィルターに関連付けても、フィルターはLibreOffice Writerファイルの内容を理解できません。
原文ファイル名構成例には、ワイルドカード文字を使用できます。*
文字は0また1文字以上の文字に、?
は厳密に1文字にマッチします。
たとえばテキストフィルターを readme ファイル(readme, read.me
や readme.txt
)にも対応させたい場合は、ファイル名構成例に read*
を指定してください。
ほとんどのファイル形式では、さまざまな文字コードのエンコーディングが利用可能です。デフォルトでは、訳文ファイルのエンコーディングは、原文ファイルと同じになります。
原文ファイルと訳文ファイルのエンコーディングを指定する項目では、対応したすべてのエンコーディングをドロップダウンメニューから選択できます。<auto>設定を選択すると、次の基準に基づいて、OmegaTが、エンコーディングを選択します。
原文ファイルにエンコーディング宣言があれば、それに従います(HTML ファイル、XML ベースのファイルの場合)
いくつかのファイル形式(例えばJava properties )に対しては、その形式に必須のエンコーディングを設定します。
テキストファイルには、起動オプションで変更されていなければ、OS デフォルトのエンコーディング(たとえば新規インストールの日本語版の Windows 10/11 OSではUTF-8エンコーディグのUnicode、たとえばWindows8.1からアップデートしたWindows10ではCP932エンコーディングのSJIS日本語コード)を使用します。
targetフォルダーのファイルは、同じ名前で作成された場合、作成するたびに上書きされます。
OmegaTでは、言語コードやタイムスタンプを追加するなどして、作成したファイルの新しいファイル名を自動的に作成できます。
ターゲットファイル名構成例は特別な構文を使用します。最も簡単に変更する方法は、構成例を編集ダイアログを使用することです。このダイアログでは、さまざまな設定ができます。
デフォルトの構成例。拡張子を含むソースファイルの完全なファイル名を表します。このパターンを使用すると、訳文ファイルにソースファイルとまったく同じ名前が割り当てられます。
ソースファイルの名前(拡張子なし)
原文ファイルの拡張子
訳文言語コード+地域コード (xx_YY)
訳文言語コード+地域コード (xx-YY)
訳文言語コード (xx)
訳文地域コード (YY)
ファイルが作成されたシステム時間
例については、Oracleのドキュメントを参照してください。
オペレーティング・システムの名称
ユーザーのログイン名
システムのホスト名
原文ファイルのエンコーディング
訳文ファイルのエンコーディング
訳文ファイルのMicrosoftロケール(xx-yy形式)
${nameOnly}
と ${extension}
に関しては、追加の変数を使用できます。
ファイル名に複数のピリオドを利用するなどでファイル名と拡張子があいまいな場合、使用する構成要素を ${nameOnly-
番号
} と ${extension-
-
番号}
の形式で、次に示す例のように指定することができます。
文書.xx.docxという名前のソースファイルに対して、以下の変数定義を使用すると、次のような結果になります。
${nameOnly-0}
: Document
${nameOnly-1}
: Document.xx
${nameOnly-2}
: Document.xx.docx
${extension-0}
: docx
${extension-1}
: xx.docx
${extension-2}
: Document.xx.docx
ファイルフィルターは設定を提供しています。設定を変更する場合は、フィルターを選択して
を押してください。可能な設定は以下の通りです:
文章ファイルには、一般的な段落マーカーはありません。ここを選択して、テキストファイルから段落に分割する方法を指定します。
長い行を改行する前の最大文字数を指定します。0を設定すると、制限なしになります。
行を切断して残りを無視するまでの最大文字数を指定します。0を設定すると、制限なしになります。
Microsoft Office Open XML(旧フィルター)
は、従前からのOmegaTのフィルターです。以前に、このフィルターで処理したファイルを含むプロジェクトとの互換性の問題を回避するときのみ、利用してください。
追加して翻訳するXML要素を選ぶことができます。選んだ要素は、翻訳時に個別の分節として表示されます。
非表示の命令文章、コメント、脚注、文末脚注、フッタ、重複するフォールバック文章、および文書プロジェクト設定。
コメントとシート名。
スライドのコメント、スライドマスター、スライドレイアウト。
外部リンク、表、ダイアグラム、図、ワードアート
翻訳対象テキストを含まない連続するタグを1つのタグに集約します。
チェックが入っていれば、空白文字(半角スペースや改行など)を保持します。たとえそれが文書中で意味が無い場合でも残します。
ソフトリターンが段落の開始を意図している場合は、この設定を有効にします。
選択した属性を編集ウィンドウで翻訳できる分節として表示できます。
HTML の <br> タグがある場所を段落とみなして分節化することができます。
正規表現に一致する段落は読み込み時に無視され、翻訳用に表示されません。
この設定は、HTMLの一部に翻訳不可能な文章のみの要素を含む場合に便利です。
関連する「コンテンツ」属性が変換されない<meta>タグ属性値を定義します。
引用文記号を追加したり、値をカンマで区切ったりしないでください。
このコンテンツを無視するには:
<meta name="robots" content="index,
follow">
使う:
name=robots
タグを翻訳不可能にする属性値を定義します。
引用文記号を追加したり、値をカンマで区切ったりしないでください。
このコンテンツを無視するには:
<span translate="no">This content
is not translatable</span>
translate=no
を使用する。
translate="no"
でマークされたすべてのタグは無視されます。
ここでは、XHTMLファイルのオプション(上記参照)で使用できないフィルターについてのみ説明します。
文書のエンコーディングは通常、<head>要素内にある<meta>要素内で宣言されます。
原文ファイルと訳文ファイルでは、異なるエンコーディングが必要な場合があります。
ここで、訳文ファイルの宣言を追加するか変更するかを決定できます。
通常どおり、フィルター設定において、
ファイルが既に<head>タグを持っている場合のみ。
ファイルに、既に宣言されている場合のみ。
ファイルフィルター設定で指定のエンコーディングを適用して、訳文ファイルを保存します。
タグの外側の空白文字は、HTML/XHTMLでは重要ではないと見なされます。
連続する空白文字がある場合、訳文ファイル生成時に空白文字一つだけに変換します。
HTMLファイル中のコメントは、通常開発者むけのものです。この設定を使用して除去します。チェックを外すと、コメントはタグとして表示されます。
HTMLのコメント中のテキスト ( <!--
と -->
の間)は、訳文ファイルにコピーされません。
翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。
翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。
フィルターはデフォルトで、printf変数('%s'など)をチェックします。詳細は
printf関数の変数をチェックする
の設定を参照してください。
訳文の分節が提供されていない場合、常に原文のコンテンツを使用します。未翻訳の分節を空白のままにするには、この設定を使用します。
空白の原文分節は、原文言語には存在しないが訳文言語で必要な要素のプレースホルダとして機能することがあります。この設定を使用すると、関連付けられたコメントに基づいて訳文を生成します。
POヘッダーは、翻訳用には表示されません。
PO ファイルのヘッダーにある複数形指定を、訳文言語に合わせて自動変更します。
PO ファイルは、msgid
を使用した原文と、msgstr
に格納された訳文の両方を保持できるファイル形式です。
PO ファイルは、msgid
をIDコードとして使用し、msgstr
を原文の場所と解釈して、msgstr
に訳文を上書きします。
翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。
デフォルトで、Java の MessageFormat パターン({0} など)をチェックする。詳細は
printf関数の変数をチェックする
の設定を参照してください。
Java 8はISO-8859-1エンコーディングを必要とし、その文字セット以外の文字にはユニコードのエスケープシーケンスによる文字列を使用します。Java 9以降では、UTF-8エンコーディングが必要です。この設定はJava 8との互換性を強制します。
翻訳されたファイルに未翻訳コンテンツが含まれていると、互換性の問題が発生することがあります。
アプリケーションによっては、一部のUnicodeリテラルを保持する必要があります。この設定ではそれが可能です。
Index 項目、ブックマーク、ブックマーク参照、脚注、コメント、プレゼンテーションのノート、リンク(URL)、シート名
このフィルターは、従来のOmegaT XLIFFフィルターです。以前に、このフィルターで処理したファイルを含むプロジェクトとの互換性の問題を回避するときのみ、利用してください。
OmegaT2.6で作成されたXLIFFファイルで作業する必要がある場合は、このOmegaTを有効にします。
ユーザーは、3つのオプション、前の段落と次の段落、<trans unit>ID、または<trans-unit>resname属性(使用可能な場合)から選択できます。使用できない場合は、IDがフォールバックとして使用されます。
これらの設定は、OmegaTがXLIFFコンテンツからタグを作成する方法を指定しています。
チェックすると、XLIFFの"target"要素の"status"属性を「translated」ではなく「needs-review-translation」に変更します。
翻訳メモリツールは、分節と呼ばれるテキスト単位で処理を行います。訳文を入力すると、原文分節を含むテキストがその翻訳結果とともにプロジェクトのメモリに保存され、その後、プロジェクト内の他の原文セグメントとの一致の判定に使用されます。
分節化の種類を指定するには、
文単位の分節化
プロジェクト設定を使用します。
分節は、デフォルトではファイル形式自体によって定義される 段落 になります。
文書に 文 の分節化を使用しないということは、 段落 の分節化を使用することと同じことになります。その場合、各段落(元の文書形式で定義されている)は1つの分節として表示され、翻訳者はその分節内の文を自由に再編成できます。
段落単位の分節化 は、文芸的または創造的なテキストに適しています。一般的に、翻訳メモリの一致がそれほど重要でない文書にも適しています。
文単位の分節化 は、原文の言語を構成する要素を定義する規則( 分節化規則 と呼ばれる)に依存しています。この設定は、技術文書や法律文書など、反復または類似の文が多い文書に適しています。
OmegaTは段落単位の分節化を行うため、まずテキストを構文解析します。このプロセスでは、原文ファイルの構造に依存して分節を生成します。
たとえばテキストファイルでは、改行や空の行で分節化されたり、まったく分節化されないこともあります。フォーマット(ODF、HTML、またはその他のドキュメント)を含むファイルは、ブロックレベル(段落)タグで分割されます。XHTML や HTML ファイルでは、オブジェクトの属性も翻訳の対象になることがあります。このような場合は、属性値だけを別の文として取り出します。
原文ファイルを構造単位に分割した後、OmegaTはさらに分節に分割します。
分節化は、文字単位でテキストに沿ってカーソルを移動するプロセスとして視覚化できます。
カーソルが次の文字に移動するたびにOmegaTは、
その場所の前のテキストは、 Before ルールに対応します。
その場所の後のテキストは、関連する After ルールに対応します。
位置が両方の規則に一致する場合、規則の定義内容に応じて、その位置が分節化または非分節化の場所と見なされます。
同じメカニズムとダイアログを使用して、ユーザーレベルおよびローカルの分節化規則を定義します。
デフォルトでは、分節化の設定はグローバルであり、すべてのプロジェクトで共有されます。
プロジェクト設定の を使用して、現在のプロジェクトの分節化ルールのスコープを制限します。
コマンドラインからOmegaTを起動しても、同様の結果が得られます。詳細については、 コマンドライン起動を参照してください。
ローカル規則を使用している場合でも、グローバル規則にアクセスすることはできますが、それらを変更してもプロジェクトには影響しません。
OmegaTには事前定義された分節化規則が用意されており、翻訳者は正規表現を使用して規則を変更できます。詳細は、付録の 正規表現 をご覧ください。
規則は次のように機能することに注意してください。OmegaTは規則が一致した場所にマーカーを設定します。そして、その後の規則がその場所を無視するようにします。これが、例外規則が分節化規則よりも前になければならない理由です。
翻訳中に分節化規則を変更した場合は、新しい分節化規則を有効にするためにプロジェクトを再ロードする必要があります。すると、以前に翻訳済みの一部の分節が分割または結合され、翻訳済みの分節と見なされなくなります。ただし、元の翻訳結果はプロジェクトの翻訳メモリ内に残ります。
分類 | 目的 | 前方の正規表現 | 後方の正規表現 | 説明 |
---|---|---|---|---|
例外ルール、チェックボックスがオフ、リストの上位 | Ms.の後に分節化しない | Ms\. | \s | Msの後にピリオドと空白が続きます。 |
例外ルール、チェックボックスがオフ、リストの上位 | 分節を表さない改行のあるExcelセル | \n | 改行、その後に任意の文字。 | |
リストの下にあるチェックボックスをオンにした分節規則 | 新しい分節は、ピリオドの後にスペース、タブ、またはその他の空白が続いた後に開始します。 | \. | \s | 空白が後に続くピリオド |
リストの下にあるチェックボックスをオンにした分節規則 | 「。」の後に新しい分節を開始します。 | 。 |
後方の正規表現 領域は空でもかまいません。 |
この付録は、生産性を向上させる強力な方法に関心のあるユーザーを対象としています。最も単純な正規表現( regex または regexp と略されることが多い)でさえ、気が遠く複雑に見えますが、OmegaTだけでなく、日常的に使用する他の多くのアプリケーションでも非常に役立ちます。
ここでは、翻訳者にとって最も有用な基礎についてのみ説明します。この付録の最後にある参考資料のセクションでは、この取扱説明書の範囲を超えた高度な使用方法や複雑な使用方法について説明します。特定のケースについてヘルプが必要な場合は、さまざまなサポートチャネルで質問することもできます。
正規表現では、文字、数字、記号( 文字 と総称されます)の組み合わせを使用して、特定のテキストパターンを表す 式 を定義します。
以下にいくつかの例を示します。
0~9の任意の1桁。
1つ以上の「単語文字」、つまりアルファベット、数字、およびアンダースコア記号の文字を表します。
0または1つの水平空白文字を表します(これには、通常の改行しないスペースとタブが含まれますが、「垂直空白文字」カテゴリ:\vに属する改行文字は含まれません)。
多くのOmegaT関数は正規表現に依存しているか、または正規表現をオプションとして使用可能にしています。
検索には正規表現オプションがあり、ファイルを横断して非常に強力な検索を行うことができます。
テキストの置換 ダイアログの同じオプションを使用すると、検索テキストと置換テキストの両方に正規表現を適用できます。
カスタムタグとは、正規表現で定義されたタグであり、ネイティブのOmegaTタグとまったく同じように処理されます。詳細は
カスタムタグ
の設定を参照してください。
|
(OR)文字を使用して、個々のタグ定義を区切ります。
フラグ付き文字列
設定を使用すると、 OmegaT がデフォルトで赤色でマークする文字列を定義し、検証の際に検証対象ではないタグとして扱うことができます。
|
(OR)文字を使用して、個々の文字列定義を区切ります。
視覚的な手がかりは、位置合わせの整合を確認するのに役立ちます。ハイライト 設定を使用すると、整合された文書内で OmegaT が強調表示する文字列を定義できます。
|
(OR)文字を使用して、個々の表現を区切ります。
分節化規則と言語の構成例は、正規表現で定義されます。自由に変更して、文書の分節化を改善したり、一般的なルールを追加したりできます。詳細は、付録の 分節化規則 をご覧ください。
分節化規則または例外規則は、分節に分割する位置または分割しない位置を定義します。その位置を定義するには、2つの正規表現が必要です。1つは「before」式で、ルールが適用される場所の前のテキストパターンを定義し、もう1つは「after」式で、その位置の後のテキストパターンを定義します。
プロジェクトの原文の言語と一致する言語の構成例が、そのプロジェクトに適用されます。
正規表現は、スペース、タブ、改行など、画面に表示されない文字や印刷されない文字を含む文字列を検索するために使用できます。指定された式は、単語、フレーズ、またはその他の文字列に 一致する か、 一致しない かのいずれかです。
式のすべての文字は、一致を判断するときに関連します。
正規表現では、多数の文字または文字の組み合わせに特別な意味があります。
正規表現はテキストとのみ一致します。 太字 、 斜体 、その他の スタイル効果 などの装飾と一致させることはできません。
注意すべき4つのルールがあります。
正規表現のほとんどの文字は、テキストの文字列内で単に 自身を検索します 。
たとえば、「 example 」という単語をつづる7つの文字は、単に検索機能に対して、その順序でそれらの文字と正確に一致するように指示します。簡単に言うと、この検索では「 example 」という単語が検索されます。
\
)がついたアルファベットや数字は、特別な意味を持ちます。
上記のように単純にそれ自体を表す文字とは異なり、\
が前にある文字は、正規表現では特別な機能を持ちます。
たとえば、
r
は通常の文字ですが、その前に\
を付けて\r
にすると、
キャリッジリターン文字
と一致する特殊な組み合わせになります。同様に、\R
は
任意の改行文字
と一致します。
i j l m o と y の文字だけは、小文字と大文字の両方で、前にバックスラッシュが付いていても特別な意味はありません。この説明書では、特別な意味を持つ文字のごく一部について説明します。
ここで説明されていない組み合わせについては、以下の参考資料項で紹介されるWebページを参照してください。
その特別な意味は、文字自体に一致する別の文字によってキャンセルされる必要があります。
完全な文字のリストは、次のとおりです。1つの例は.
です。これ自体には、
任意の1文字
を照合するという特別な意味があります。
通常のピリオドを見つけるには、\
を使用して意味をキャンセルし、式\.
を作成する必要があります。これは、ピリオドとのみ一致します。
\
文字は非常に特殊な文字です。
前述したように、\
文字には、他の文字の特別な意味をキャンセルまたはアクティブにするというデフォルトの特別な意味があります。特別な意味を持たない文字(デフォルトまたは追加)の前に配置しても効果はありません。
\
は、\\
という形式に二重化することによって、それ自体の特別な意味をキャンセルすることができます。これは、単に
バックスラッシュ
文字自体に一致します。
The twelve special characters are the
backslash
\
, the
caret
^
,
the
dollar sign
$
, the
period
(or
dot
)
.
, the
vertical bar
(or
pipe symbol
) |
, the
question mark
?
, the
asterisk
(or
star
)
*
, the
plus sign
+
, the opening
parenthesis
(
, the closing
parenthesis
,
)
, the opening
square bracket
[
, and the opening
curly brace
{
.
各文字について、その文字に依存する正規表現と、一致するかどうかにかかわらず一致するテキストの例を使用して簡単に説明します。
\
この文字は、次の文字の特別な意味をキャンセルまたはアクティブにします。
0\.[0-9]
|
|
一致 |
0.0 から 0.9 の間の数字、または10.5や560.5などのうち、最後の 0.5 だけの数字。
|
一致しない |
0,1、0-3、または0x002Eの最初の3文字などのシーケンスは、式が |
^
これが式の最初の文字である場合、 キャレット 文字は行の先頭と一致します。
角括弧で囲まれた文字クラスの最初の文字である場合、そのクラスの文字は除外されて、それ以外の文字全てに一致します。
|
|
一致 |
|
一致しない |
|
$
式の最後の文字である場合、 ドル 記号は行の末尾と一致します。
^\w+:$
|
|
一致 |
1つの単語で構成され、コロンで終わる行: Questions: |
一致しない |
1つの単語で構成され、コロンで終わらない行: Questions? |
.
任意の1文字と一致します。
c.t
|
||||
一致 |
「c」で始まり「t」でおわる3文字の任意の組み合わせ: cat 、 cut 、 cot 、または cot cqt などの無意味な組合せ。 |
|||
一致しない |
「c」で始まり「t」で終わる4文字を含む組み合わせだが、複数の行になっている場合は一致しません。 What is the missing letter?
|
|
この文字は「OR」として機能し、その前後にある式のいずれかと一致します。
^An|^The
|
|||
一致 |
次のようなフレーズの最初の「An」または「The」:
|
||
一致しない |
次のようなフレーズの最初の「An」または「The」:
|
?
この文字は、直前の文字または式の0または1つのインスタンスを照合することを指定します。
an?␣ (ここで “␣” は1つの空白文字を意味します)。 |
|||
一致 |
次の「a」または「an」のいずれか:
また、「Can I help you?」のような文の「Can」の最後の「an」や、「We have pasta for lunch」の「pasta」の最後の「a」も検索されます。 |
||
一致しない |
"a"も"an"もありません:
They are not followed by a space. |
*
この文字は、直前の文字または式の0個以上のインスタンスが一致することを指定します。
run\w*
|
|
一致 |
「run」という単語、「runs」、「runner」、「runway」、「grunt」または「brunt」の「runt」、および「run」の後に0個以上の「 word characters 」(数字とアンダースコアを含むため、run_123@example.email.orgなどの電子メールアドレスの「@」の前の部分も一致します)が続くその他の単語または文字列。 |
一致しない |
|
+
この文字は、前の文字または式の1つ以上のインスタンスを一致させることを指定します。
\d+.d
|
|
一致 |
「1.5」、「23.2」、「5235.8」などの数字。小数点以下が1桁で、小数点の前に任意の桁数があります。 |
一致しない |
「5,235.8」や「21,571.9」などの数値の値全体。千単位の区切り文字の後の部分だけが一致します。 |
(
この文字は
グループ
を開始します。グループとは、1つの単位として扱われる文字のセットです。グループには番号が付けられ、その内容グループはメモリに格納されます。これらは、後で\
を使用して検索式で再利用できます。ここで、n
n
はグループの番号です。
グループの内容は、置換テキストでも使用できます。検索で定義されたn
番目のグループを参照するには$
を使用します。n
開始と終了のペアでは、常に括弧が使用されます。開き括弧または閉じ括弧だけを単独で使用しようとすると、エラーが発生します。
(\b\w+\b)\h\1\b
|
|
一致 |
次の文の連続する「an」のように、スペースで区切られた重複した単語: “I bought an an apple.” |
一致しない |
次の文の「that,that」: “But that, that is just unbelievable”の最初の「that」の後に、スペースだけではなく、カンマとスペースが続いているため、一致しません。 |
)
この文字はグループを閉じます。それだけでは使えないので、特別です。右括弧文字自体を一致させる必要がある場合は、前に\
を付ける必要があります。
^\d+\)
|
||||
一致 |
次のようなリストの各行の先頭にあるシーケンス番号(括弧を含む):
|
|||
一致しない |
行の先頭以外にあるシーケンス番号。 Follow these steps:
|
[
この文字は閉じ角括弧と組み合わせる必要があり、それぞれが有効な一致候補を表す個々の文字のセットを囲みます。
開き括弧だけが特別であり、括弧文字自体を検索するには、前にバックスラッシュを付ける必要があります。閉じ括弧だけをそのまま使用する場合は、前にバックスラッシュを付ける必要はありません。(追加することはできますが、式や結果には影響しません)。
li[cs]en[cs]e
|
|
一致 |
正しい “licence”や“license”の綴りや、綴り間違いの “lisence” や “lisense”に一致。 |
一致しない |
もっと間違いのある “licensse” や “lissense”には一致しない。 |
{
前の文字またはグループの一致するインスタンスの数を指定する 正確な数 、 最小 、 最大 、または 範囲 を囲み、閉じ中括弧と対にする必要があります。
中括弧のみが特別であり、中括弧文字自体を検索するには、前にバックスラッシュを付ける必要があります。閉じ括弧をそのまま使用する場合は、前にバックスラッシュを付ける必要はありません。(追加することはできますが、式や結果には影響しません)。
\d{4}/\d{1,3}
|
|
一致 |
“1234/5”や “1472/69” あるいは “9513/842”といった4桁の数字、1つのスラッシュ、さらに1〜3桁の数字で構成された文字列に一致します。 |
一致しない |
“123/45”や “1472/6985”あるいは “95133/15746”。 注意: 最後の二つのコードは、完全には一致しませんが、この式は “1472/6985”のなかの“ 1472/698 ”の部分や、“95133/15746”の “ 5133/157 ”の部分を返します。 |
この項では、単純なものから複雑なものまで、さまざまなタイプの正規表現について説明します。
\
で始まるすべての
アルファベット
文字は、
文字自体ではなく、関連する特別な意味
を表す式になることに注意してください。
最も単純な正規表現は、単に1つの文字、または\
と1つの意味を持つ単位を構成する文字の組み合わせで構成されます。
式 | 一致 |
---|---|
x
|
文字「x」自体 ほとんどの文字はそれ自身に一致します。 |
\t
|
文字「t」ではなく、タブ文字。 |
\n
|
文字「n」ではなく、改行(ラインフィード)文字。 |
\r
|
文字「r」ではなく、復帰(キャリッジリターン)文字。 同様に、 |
通常のOmegaT検索は、デフォルトでは大文字と小文字が区別されません。オプション設定を有効にしない限り、大文字と小文字の両方が一致します。これにより、検索式全体で大文字と小文字が区別されます。
これに対して、正規表現ではデフォルトで大文字と小文字が区別されます。"omegat"を正規表現で検索しても、"OmegaT"とは一致しません。ただし、正規表現には、式の中で大文字/小文字指定を制御するための特別な修飾子もあります。
(?i)
式のうち、修飾子の右側の部分の大文字と小文字を区別しないようにします。
(?-i)
式の修飾子の右側の部分で大文字と小文字が区別されるようにします。
これを利用して、検索時の大文字と小文字の区別を細かく制御できます。たとえば、"omegat"と"OmegaT"の出現箇所を検索し、"OMEGAT"の出現箇所は検索しないようにします。これを行うには、次の式を使用します:(?i)o
(?-i)mega
(?i)t
。これは、大文字と小文字を区別しない「o」の後に大文字と小文字を区別する「mega」が続き、その後に大文字と小文字を区別しない「t」が続くことを表します。
正規表現を使用すると、 文字クラス と呼ばれる文字集合を作成できます。検索をすると、文字集合内の任意の文字が一致します。
文字クラスは、必要な文字を角括弧で囲むことによって定義され、含める個々の文字を逐次指定するか、文字の範囲で指定できます。たとえば、[£€$]
を指定して、テキスト内の3つの通貨記号のいずれかを検索したり、[1-3]を指定して、数値1、2、3を検索したりできます。
文字クラスの内部では、バックスラッシュ(\
)、キャレット(^
)、閉じ括弧(]
)、ハイフン(-
)のみが特別です。残りの12文字は通常の文字であり、これらの文字自体を検索する場合は、前にバックスラッシュを付ける必要はありません。
4つの文字クラスの特殊文字の前にバックスラッシュを付けると、通常の文字として検索できます。また、キャレット、閉じ括弧、およびハイフンを特別な意味を持たない位置に置くことで、キャレット、閉じ括弧、およびハイフン自体を検索することもできます。ただし、キャレットの場合は開き括弧の直後、閉じ括弧の場合はいずれかの開き括弧またはそれに続くキャレットの直後、ハイフンの場合は開き括弧の直後または閉じ括弧の直前を除きます。
頻繁に使用される多くのセットには、バックスラッシュとそれに続くアルファベットの文字で構成される省略形があります。たとえば、\d
は[0-9]
の省略形であり、0~9の任意の数字に一致します。多くの場合、対応する大文字の後がクラスを否定するために使用されます:\D
は、数字ではない
任意の文字に一致します。
次の表に、その他のさまざまな例を示します。これらの文字クラスは、省略形を形成するために使用される実際の文字だけを表すことはありません。
式 | 一致 |
---|---|
[abc]
|
文字「a」、「b」、または「c」。 単純な文字クラスは、 |
[C-X]
|
「C」から「X」までの文字範囲の文字。 範囲は、連続する最初の文字、ハイフン、連続する最後の文字で定義されます。任意の数の範囲を定義できます: |
[^\n\r\t]
|
改行、復帰、タブを 除く 任意の文字。 開始角括弧の直後にキャレットを置くと、クラス内の残りの文字が除外されます。 |
\w
|
一般に
|
\s
|
空白文字(スペース、タブ文字、改行を含む)。
|
\h および \v
|
タブ、スペース、改行などの空白文字(通常、
|
正規表現は英数字に限定されません。これらはUnicode文字セット全体を対象としています。Unicodeブロック、スクリプトおよびカテゴリを使用して、英数字の範囲外の文字クラスを指定します。いくつかの例を次の表に示します。
Unicode正規表現の詳細については、Unicode正規表現も参照してください。
式 | 一致 |
---|---|
\p{InGreek}
|
ギリシャ語ブロック(Unicodeブロック)の文字
|
\p{IsHan}
|
CJK言語(Unicodeスクリプト)の表意文字( Han / 漢字 / hanja ) |
\p{Lu}
|
大文字(Unicodeカテゴリ) |
\p{Sc}
|
通貨記号、Unicodeカテゴリでもあります。 |
式の中には、文字ではなく位置を指定するものもあります。これらは、テキスト内で一致を検索する場所を示しますが、その一致には文字は含まれません。次の表に、一般的な例をいくつか示します。詳細については、参考資料項のWebページを参照してください。
式 | 一致 |
---|---|
^
|
行の先頭 |
$
|
行の末尾 |
\b
|
単語境界 |
\B
|
単語の境界ではない |
(?=u)
|
「u」が後に続く文字。 たとえば、 |
(?!u)
|
その後に文字「u」が続く文字 ではない 。 たとえば、 |
(?<=q)
|
文字「q」の後に続く文字。 たとえば、 |
(?<!q)
|
文字「q」の前に ない 文字。 たとえば、 |
このセクションでは、上記のさまざまな式を組み合わせて、OmegaTで強力な検索を実行する方法を示す例をいくつか示します。
式 | 目的 |
---|---|
(\b\w+\b)\h\1\b
|
ダブルワードを検索します。 |
,\h[\h(\w+\.\w+)\w,'ʼ"“”-]+[\.,]
|
コンマで始まり、その後に空白文字が続き、1つ以上の単語(引用符で囲まれた単語、短縮形、およびファイル拡張子の付いたファイル名を含む)を含み、コンマまたはピリオドで終わる句を検索します。 |
\. \h+$
|
行末のピリオドの後にある余分な空白を検索します。 |
\h+a\h+[aeiou]
|
「an」ではなく、「a」の後にある母音で始まる単語を検索します。 |
\h+an\h+[^aeiou]
|
前の例の逆の例です。「a」ではなく「an」の後に来る子音で始まる単語を検索します。 |
\d{4}([/\.-]\d{1,2}){2}
|
次のように、スラッシュ、ピリオドまたはハイフンで区切られた月と日を使用して、年、月および日の順序で数値の日付を検索します:
注記この式は、可能な日付に一致する数値パターンと区切りパターンを検索しますが、検証は行いません。また、「5136/36/71」などのパターンも検索されます。 |
\.[A-Z]
|
ピリオドの後に大文字が続く文字列を検索します。ピリオドと新しい文の始まりの間に欠落している可能性のあるスペースを見つけるのに役立ちます。 |
\bis\b
|
「is」を文中の単語全体として検索します。「this」、「is not」、または「Is」と一致するものは検索しません。 |
[\w\.-]+@[\w\.-]+
|
電子メールアドレスを検索します。この単純な表現では、有効なすべての電子メールアドレス形式に対応していない場合があります。 |
OmegaTは正規表現に派手な色付けをしませんが、OmegaTは一致結果に色を付けるので、 プロジェクトの検索 ウィンドウを使って多くの練習をすることができます。
いくつかの追加リソースを以下に示します。
Javaテクニカル・リファレンスは、標準的なリファレンスとして役立ちます。
Javaで使用される正規表現の公式リファレンスです。
正規表現の使用についてさらに詳しく知りたい場合は、次の2つのWebサイトが非常に便利です。
検索したいテキストとテストしたい正規表現を入力できるオンライン正規表現マッチングツール。
Web上で最も徹底した正規表現のチュートリアルおよびリファレンスの1つ。
OmegaTはいずれのサイトもサポートしていません。どの言語であれ、他にも興味深い参考資料があれば、OmegaTチームは提案されたサイトを追記したいとおもいます。
用語集は用語集フォルダーに保存されている用語を集めたファイルです。
どれか の用語集で一致する、セグメント内のすべての用語が 用語集 ウィンドウに表示されます。
用語集の原文は、複数単語からなる用語であっても大丈夫です。
次の2種類の用語集ファイルがあります。
C + S + G を使用して、この用語集に新しい用語を入力できます。この理由から、 書き込み可能 用語集と呼ばれています。
を使用してアクセスできます。テキストエディタで開いて変更することもできます。
事前にファイルを準備する必要はありません。
これは、最初に項目を用語集に追加するときに、自動的に作成されます。
既存のファイルを標準用語集として使用することを選択した場合、新しいエントリはすべてタブ区切りの書式で記録され、デフォルトでUTF-8の文字エンコーディングで保存されている必要があります。
別のエンコーディングを指定する場合は、次の形式の「magic」コメントを追加します。
# -*- coding: <charset> -*- ,
|
ここで、
<charset>
は通常、IANA Charset Registryにリストされている文字エンコーディングの1つになります。
OmegaTが認識できるファイル形式の用語集です。プロジェクト用語集のようにOmegaTのGUIインターフェースから変更はできませんが、テキストエディタで編集できます。
用語集に変更を加えるとOmegaTは変更を自動的に考慮して、一致する用語を 用語集 ウィンドウに表示します。
デフォルトでは、各々のプロジェクトフォルダーには、追加書き込み可能な用語集と参照用語集を保存するための用語集フォルダがあります。詳細は、プロジェクト設定の
用語集フォルダー
を確認してください。
すべての用語集は用語集フォルダーに保存しなければなりません。フォルダ内のさらにフォルダー内にある用語集も認識されます。
その参照用語集フォルダー内に、トピック、クライアント、またはワークフローに適したその他の分類別に整理された複数の用語集サブフォルダを作成できます。
用語集フォルダー
プロジェクト設定で、参照用語集フォルダーの場所を設定できます。プロジェクトのフォルダーの外部に設定して、他のプロジェクトで使用したり、特定のサブフォルダで使用することもできます。
デフォルトで、書き込み可能なプロジェクト用語集は用語集フォルダーにあり、glossary.txtと呼ばれています。
書き込み可能な用語集ファイルを開く
ダイアログで名前と場所を変更できますが、.txt
または.utf8
拡張子を付けて、用語集フォルダーまたはそのサブフォルダーに保存する必要があります。
用語集ファイルは単純なテキストファイルで、3つの列(カラム)からなるリストの形をしています。最初の列は原文で、それ以降はオプションで、2番目の列は訳文の用語、3番目はコメントが入ります。
用語集は、タブ区切り形式(TSV)とカンマ区切り形式(CSV)ファイルにすることも、TermBase eXchange(TBX)形式にすることもできます。
プロジェクトの書き込み可能な用語集は、UTF-8エンコーディングで保存されたTSVファイルです。ラテン文字のみを使用するユーザーで作成されたファイルは、非アスキー文字またはUTF-8として解釈されるその他の文字を含まない場合、ISO-8859-1として認識され、処理される場合があります。
参照用用語集の読み取りに使用されるエンコーディングは、ファイル拡張子によって異なります。
ファイル形式: | 拡張子 | エンコーディング |
---|---|---|
TSV |
.txt
|
UTF-8 |
TSV |
.utf8
|
UTF-8 |
TSV |
.tab
|
OSのデフォルトエンコーディング |
TSV |
.tsv
|
OSのデフォルトエンコーディング |
CSV |
.csv
|
UTF-8 |
TBX |
.tbx
|
UTF-8 |
Bidi制御文字は から使用できます。これらは次の目的で使用できます。
方向を強く持つ非表示の文字を挿入して、方向性の弱い文字または方向性のない文字に特定の位置を強制します。
分節のなかに、反対方向に文字が綴られる項を作成します。
これらの制御文字は綴り方向を変えますが、見えません。 を使用すると、その位置を視覚的に表示します。
(句読点記号のような)弱いまたは中立的な方向性を持つ文字の位置を変更するには、その分節の方向に応じて、文字の後にLRMまたはRLM文字を挿入します。
右から左への分節で、左から右に綴る必要がある弱い方向性の文字の後に、左から右へ指示(LRM: left-to-right Mark)文字を挿入します。(例えばアラビア語の文章の中の英語の抜粋の場合)
左から右の分節の中で、右から左に綴る必要がある弱い方向性の文字の後に、右から左へ指示(RLM: right-to-left mark)文字を挿入します。(例えば英語の文章の中のアラビア語の抜粋の場合)
埋め込みを使用して、分節の綴り方向と反対に綴る必要がある(いくつかの単語とスペースを含むような)長い文章を作成することができます。分節の綴り方向に応じて、次の2種類の埋め込みを作成できます。
右から左への分節に左から右への埋め込みを作成するには、左から右への埋め込み(LRE: Left-to-Right Embedding)文字を挿入し、左から右への文章を入力または挿入してから、ポップ方向書式設定(PDF: Pop Directional Formatting)文字を挿入します。
左から右の分節に右から左への埋め込みを作成するには、右から左への埋め込み(RLE: Right-to-Left embedding)文字を挿入し、右から左への文章を入力または挿入してから、PDF文字を挿入します。
プロジェクト固有のコマンドについては、
プロジェクト専用の後処理用コマンド:
プロジェクト設定を参照してください。
ユーザーレベルのコマンドは
ユーザーレベルの後処理用外部コマンド
設定を参照してください。
コマンドでは、 Java ランタイムの実行時に、テンプレートの値が展開された文字列として渡されます。すべての引数は引用符で囲む必要があります。たとえば、"${fileName}"
。
次のテンプレート変数は常に使用できます。テンプレート一覧のその他の項目は、システムの環境変数です。
変数名 | 値 |
---|---|
${projectName} | プロジェクト・ディレクトリーの名前 |
${projectRoot} | プロジェクトのフォルダーへの絶対パス |
${sourceRoot} | 原文フォルダーへの絶対パス |
${targetRoot} | 訳文フォルダーへの絶対パス |
${glossaryRoot} | 用語集フォルダーへの絶対パス |
${tmRoot} | TM ルート・フォルダーへの絶対パス |
${tmAutoRoot} | TM 自動フォルダーへの絶対パス |
${dictRoot} | 辞書フォルダーへの絶対パス |
${tmOtherLangRoot} | TM ルート + tmx2source ( 詳細については、 2つの言語の橋渡し の how-to を参照してください。) |
${sourceLang} | 原文言語 |
${targetLang} | 訳文言語 |
${filePath} | 原文ファイルへの絶対パス |
${fileShortPath} | 指定されたルートに対する原文ファイル名 |
${fileName} | 原文ファイルの完全な名前 |
${fileNameOnly} | 原文ファイルの拡張子を除いた名前 |
${fileExtension} | 原文ファイルのドットを除いた拡張子 |
通常のコマンドに加えて、スクリプトを呼び出すことができます。信頼されていない情報源からの後処理スクリプトは、決して実行しないでください。セキュリティ上の理由から、プロジェクト専用の後処理用コマンドはデフォルトで無効になっています。
テンプレート変数は、通常のコマンドとユーザ定義スクリプトの両方で使用できます。スクリプトには絶対パスを使用する必要があります。OmegaTが使用するPATHは、現在のユーザーのPATHと同じでない場合があります。
STDOUT および STDERR は、 omegat.log ファイルに書き込まれます。終了コードと STDERR 、または最後の STDOUT がステータス・バーに表示されます。
shebang表記( #! )を使用する必要があります。/bin/bash
または#!/usr/bin/env python3
. スクリプトは実行可能でなければなりません。&&
または ||
またはパイプ |
でコマンドをつなぐ機能は利用できません。
xdg-open ${targetRoot}
open ${targetRoot}
Invoke-Item ${targetRoot}
OmegaTでは、通常の機能にアクセスするのに、ボタンをクリックすることがありません。 メニューから機能にアクセスでき、多くの機能にはデフォルトのショートカットがあります。
最も頻繁に使用されるショートカットについては、OmegaTを使用して作業を開始すればすぐに習得できます。ショートカットは各メニュー項目の横に表示され、ソフトウェアを使用するたびに新しいショートカットを学習できます。
OmegaTのほとんどのショートカットはカスタマイズできます。詳細はカスタマイズ項をご覧ください。
OmegaT は、JRE(Java Runtime Environment)がインストールされた、あるいはインストールできる、すべてのオペレーティングシステムl(Windowsや macOS、LinuxなどメジャーなOS)上で動きます。ショートカットを構成する修飾キーは、OSによって多少異なります。読みやすくするために、修飾キーに次の表記法を採用しています。
Linux/Windows | キー識別子 | macOS |
---|---|---|
Shift | S | shift または ⇧ |
Ctrl or Control | C | command または ⌘ |
Alt | A | alt / option または ⌥ |
Ctrl | control または ⌃ |
上記の キー識別子 を使用すると、すべてのショートカットに対して複数の表記をリストする必要がなくなります。
Windows と Linuxでは: Ctrl + Shift + N
macOSでは: Shift + Command + N
この説明書での表記は: C + S + N
OmegaTは、 、 、および メニューの機能と、 編集 ウィンドウの機能の大多数にショートカットを割り当てています。ほとんどの機能のショートカットを追加または変更することもできます。
そのためには、適切なショートカット定義ファイルをOmegaT構成フォルダーに置く必要があります。詳細は、付録の 設定フォルダー をご覧ください。
2つのショートカット定義ファイルがあります。
メニューからアクセスできる機能のショートカット定義です。
編集ウィンドウのショートカット定義ファイルです。
新しいショートカットを有効にするには、ショートカット定義ファイルが変更された後でOmegaTを再始動する必要があります。
SourceforgeのOmegaTの開発サイトからデフォルトのOmegaTショートカットファイルを構成フォルダにコピーし、必要に応じて変更することができます。
The macOS files must be renamed MainMenuShortcuts.properties and EditorShortcuts.properties for OmegaT to recognize them.
次の項では、ショートカット定義ファイルで使用される構文について説明し、変更例を示します。
ショートカット定義ファイルの基本的な構文は次のとおりです。
機能コード=ショートカット
以下の機能とコードのリスト項の表を使用して、機能コード
の値を確認してください。
ショートカット
は、ユーザーが打鍵するキーの組み合わせを意味します。次の形式になります。
0以上の修飾子
0または1が続くイベント
1 key
が続きます
ここで 修飾子
は次のいずれかです: shift
、 ctrl
、 meta
、 alt
、altGraph
meta
は、WindowsまたはLinuxシステムのほとんどのキーボードにあるWindowsロゴのキーと、macOSのコマンド
を指します。
altGraph
は、2つの
Alt
キーを持つキーボードのスペースバーの右側にある
Alt
キーを指します。
イベント
は、入力された
、押された
、解放された
です。
key
は、キーボードで使用可能な任意のキーです。さまざまな編集ショートカットを示す表を参照して、Home
、Page Up
、矢印キーなどのキーの値を確認できます。
空行とコメントを追加してリストを整理し、読みやすくすることができます。コメント行は#
で始まり、それ以降はすべてアプリケーションによって無視されます。
ショートカットを変更する最も簡単な方法は、前述のように、デフォルトのファイルのコピーを構成フォルダーにダウンロードし、そこで必要な変更を行うことです。
WindowsとLinuxでは、プロジェクトを閉じるデフォルトのショートカットは、次のように定義されています:
projectCloseMenuItem=ctrl shift W
macOS では次のようになります:
projectCloseMenuItem=meta shift W
ただし、ショートカットから S キーを削除して、 Ctrl + W (または Command + W (macOSの場合))して、他のアプリケーションで使用するショートカットと一致させることもできます。
そのためにWindowsとLinuxでは、MainMenuShortcuts.properties
ファイルを次のように変更します。
projectCloseMenuItem=ctrl W
macOSでは同様に:
projectCloseMenuItem=meta W
言語ペアが代替翻訳を頻繁に使用する必要がある場合に、デフォルトのショートカットが無いため、ショートカットを割り当てたいと思うでしょう。
以下の手順は、 Alt + X ショートカットを メニュー項目に割り当てる方法を示しています。
構成フォルダーにコピーしたMainMenuShortcuts.properties
をテキストエディターで開きます。
以下の編集メニュー表に示すように、 の機能コードはeditMultipleAlternate
です。
ファイル内でそのコードを検索すると、次の行が表示されます。
# editMultipleAlternate=
この行は現在コメントです。行の先頭の#
を削除して、OmegaTがショートカットを認識できるようにし、行の最後の=
記号の後にalt X
を追加します。
editMultipleAlternate=alt X
ファイルを保存して閉じます。次にOmegaTを起動すると、新しいショートカットがアクティブになり、メニューの機能名の横に表示されます。
変更が完了したら、ファイルを保存します。OmegaTが開いている場合は、変更を有効にするために再起動する必要があります。
変更または追加したショートカットが、変更したメニュー項目の横に表示されます。他の機能やシステム全体のショートカットと競合しない限り、これらはOmegaTで利用できるようになります。
次の項には、機能コードと、OmegaTの各メニューまたはデフォルトの関数に対応する編集ショートカットを示す表があります。
EditorShortcuts.properties
ファイルで変更できるショートカットとそのデフォルト値を次の表に示します。
機能 | 機能コード | Windows/Linux | macOS |
---|---|---|---|
コンテキストメニューを開く | editorContextMenu | CONTEXT_MENU | shift ESCAPE |
次の分節に移動 | editorNextSegment | TAB | |
前の分節に移動 | editorPrevSegment | shift TAB | |
次の分節に移動(Tabキーではない) | editorNextSegmentNotTab | ENTER | |
前の分節に移動(Tabキーではない) | editorPrevSegmentNotTab | ctrl ENTER | meta ENTER |
Insert Linebreak | editorInsertLineBreak | shift ENTER | |
Select All | editorSelectAll | ctrl A | meta A |
前のトークンの削除 | editorDeletePrevToken | ctrl BACK_SPACE | alt BACK_SPACE |
次のトークンの削除 | editorDeleteNextToken | ctrl DELETE | alt DELETE |
最初の分節に移動 | editorFirstSegment | ctrl PAGE_UP | meta PAGE_UP |
最後の分節に移動 | editorLastSegment | ctrl PAGE_DOWN | meta PAGE_DOWN |
次のトークンをスキップ | editorSkipNextToken | ctrl RIGHT | alt RIGHT |
前のトークンをスキップ | editorSkipPrevToken | ctrl LEFT | alt LEFT |
選択した次のトークンをスキップ | editorSkipNextTokenWithSelection | ctrl shift RIGHT | alt shift RIGHT |
選択した前のトークンをスキップ | editorSkipPrevTokenWithSelection | ctrl shift LEFT | alt shift LEFT |
カーソルロックの切り替え | editorToggleCursorLock | F2 | |
上書き入力の切り替え | editorToggleOvertype | INSERT | F3 |
機能 | 機能コード | Windows/Linux | macOS |
---|---|---|---|
自動補完機能を開く | autocompleterTrigger | ctrl SPACE | ESCAPE |
次の自動補完ビューを開く | autocompleterNextView | ctrl SPACE | ctrl DOWN |
前の自動補完ビューを開く | autocompleterPrevView | ctrl shift SPACE | ctrl UP |
自動補完を確認して閉じる | autocompleterConfirmAndClose | ENTER | |
閉じずに自動補完を確認する | autocompleterConfirmWithoutClose | INSERT | |
自動補完を閉じる | autocompleterClose | ESCAPE | |
リストを上に移動 | autocompleterListUp | UP | |
リストの下へ移動 | autocompleterListDown | DOWN | |
1ページ上へ移動 | autocompleterListPageUp | PAGE_UP | |
1ページ下へ移動 | autocompleterListPageDown | PAGE_DOWN | |
表内を上へ移動 | autocompleterTableUp | UP | |
表内を下へ移動 | autocompleterTableDown | DOWN | |
表内を左へ移動 | autocompleterTableLeft | LEFT | |
表内を右へ移動 | autocompleterTableRight | RIGHT | |
表の1ページ上へ移動 | autocompleterTablePageUp | PAGE_UP | |
表の1ページ下へ移動 | autocompleterTablePageDown | PAGE_DOWN | |
最初の表に移動 | autocompleterTableFirst | ctrl HOME | meta HOME |
最後の表に移動 | autocompleterTableLast | ctrl END | meta END |
表の最初の行に移動 | autocompleterTableFirstInRow | HOME | |
表の最後の行に移動 | autocompleterTableLastInRow | END |
設定フォルダーには、OmegaT設定の大部分が格納されます。
標準設定フォルダーの場所はシステムによって異なります( ~ の文字はホームディレクトリを表します)。
~/.omegat
~/Library/Preferences/OmegaT
~\AppData\Roaming\OmegaT
このファイルには、ユーザーの重要な環境設定が保存されます。
環境設定では、ユーザーインターフェースに対応する設定が無いものがあります。それらの設定は、直接編集して反映させます。
プロジェクトを開いたときに、翻訳対象ファイル一覧ウィンドウを自動的に開かないようにするには、<project_files_show_on_load>を検索して、trueをfalseに置き換える編集をします。
<project_files_show_on_load>false</project_files_show_on_load>
この設定は、現在手動で編集しなければなりません。
このファイルでは、OmegaTの画面レイアウトが保存されています。
このフォルダーには、たくさんのログファイルが保存されています。最重要なのは、 OmegaT.log
です。
これらのファイルには、様々な内部の状態が記録されており、OmegaT実行中のプログラム内のイベントメッセージが記録されています。もしOmegaTの動作がおかしいときは、サポートのコミュニティに報告するときに、このファイルを添付するようにしてください。
スクリプト機能を使用する場合、このフォルダーに最大で3つのテキストファイルが保存されます:
C + S + C を使用したときに、画面で選択されているテキストが格納されます。ファイル内のテキストは、スクリプト機能が呼び出されるたびに置き換えられます。
分節をテキストファイルへ出力
設定が有効になると、編集中の分節の
原文テキスト
がこのファイルに入ります。ファイル内のテキストは、次の分節に移動するたびに置き換えられます。
分節をテキストファイルへ出力
設定が有効になると、編集中の分節の
訳文テキスト
がこのファイルに入ります。ファイル内のテキストは、次の分節に移動するたびに置き換えられます。
これらの3つのファイルをとおして、シェルスクリプトなどのローカルプログラムで自動処理するときに、OmegaTのコンテンツに簡単にアクセスできるようになります。
これは、編集ウィンドウのショートカットをカスタマイズするためのパラメータのファイルです。詳細は、付録の カスタマイズ をご覧ください。
これは、ユーザインタフェースのショートカットを変更するパラメータのファイルです。詳細は、付録の カスタマイズ をご覧ください。
これは、ファイル種別ごとのフィルター設定が保存されるファイルです。詳細については、 ユーザーレベルファイルフィルタ 環境設定を参照してください。
これは、外部検索の設定パラメータが保存されるファイルです。詳細については、 ユーザーレベルの外部検索 環境設定を参照してください。
これは、自動テキスト置換の設定パラメータが保存されるファイルです。詳細については、 入力補完 環境設定を参照してください。
これは、チームプロジェクトのリポジトリーのログイン情報が保存されるファイルです。
このファイルは、暗号化されていません。
詳細については、 チームプロジェクトを設定するを参照してください。
これは、分節化ルールをカスタマイズするためのファイルです。詳細については、 ユーザーレベルの分節化規則 環境設定を参照してください。
このフォルダは、OmegaTのプラグインをインストールするための標準フォルダーです。詳細は プラグイン の設定を参照してください。
プログラムのplugins/フォルダーにプラグインをインストールすることもできます。
このフォルダには、綴り確認用の辞書が格納されます。詳細については、 スペルチェッカー 環境設定を参照してください。
プログラムフォルダーには、 アプリ本体のOmegaT.jar
などの重要なファイルが多数あります。
プログラムフォルダーの場所は、ご使用のプラットフォームおよびOmegaTのインストール方法によって異なります。推奨またはデフォルトの場所は次のとおりです。
C:\Program Files\OmegaT\
/opt/omegat/
/Applications/OmegaT.app/Contents/Java/
/opt/omegat/
OmegaT ライセンスGPLバージョン3
OmegaTの実行ファイル。コマンドラインからOmegaTを起動するときに使用します。詳細については-コマンドライン起動を参照してください。
改善とバグ修正のリスト。OmegaTの進化に関する情報が必要な場合は、ここをチェックしてください。
文書のライセンス。GPLバージョン3
多言語の取扱説明書の索引を指定します。
サポートページへのリンク。
簡単なインストールと実行手順。
文書フォルダです。
個々の貢献者のリスト。
翻訳された各取扱説明書は、それぞれの言語フォルダに格納されます。
多言語の取扱説明書の索引を指定します。
OmegaTが使用するライブラリーのリスト。
OmegaTで使用する画像が保存されるフォルダです。
OmegaTが使用するライブラリーが保管されているフォルダー。
外部プラグインをインストールできるフォルダー。プラグインの手動インストールの推奨場所は、構成フォルダーの中にあるplugins/フォルダーです。詳細の プラグイン 環境設定を参照してください。
配布されたスクリプトが格納されているフォルダ。詳細については、 スクリプト ウインドウを参照してください。