ウィンドウ は、編集ウィンドウの横に開いたままにしておき、他方のウィンドウを見ながら作業できます。
ダイアログ では、翻訳作業に戻るには、アクションを実行して、それを閉じる必要があります。
C + E からダイアログを開きます。
ダイアログは、新しいプロジェクトを作成するときに最初のプロジェクト設定のために使用されます。また、プロジェクトが作成された後で、修正するためにも使用されます。
詳細については-プロジェクトの新規作成を参照してください。
ドロップダウンの一覧から原文言語と訳文言語を選択するか、手動で入力します。
OmegaTは、2文字の言語コードの便利な短い一覧を提供しますが、BCP-47に準拠する任意のコード(3文字の言語コードを含む)を適切な領域に入力できます。
言語コードは、 OmegaTの様々な箇所で使用されています:
参考訳文 ウィンドウの結果を取得したり、
ユーザーレベルの分節化規則 設定で定義する分節規則を適用したり、
スペルチェッカー 設定でインストールされるスペルチェッカー用辞書をインストールしたり、
LanguageTool 設定などで規則集を選択して、文法エラーや綴りの間違いをチェックしたり、
などなどです。
正しい言語コードを入力し、そのようなコードを必要とする他のすべての場所が、ここで割り当てたものと正確に一致することを確認してください。言語に依存する関数は、言語コード間に不一致がある場合、失敗するか、誤った結果を生成します。
OmegaTは原文言語と訳文言語に対応するトークナイザーを自動的に選択しますが、設定を手動で変更することもできます。トークナイザーは、OmegaTが検索結果を良くするのに重要な働きをしています。
文単位の分節化
文単位の分節化では、原文ファイルが、分節化規則に基づいて分節に分割されます。
段落を分割しない場合は、この設定をオフにします。
デフォルトでは、分節化の設定はユーザーレベルであり、すべてのプロジェクトで共有されます。
をクリックして、ユーザーレベルの規則のかわりに、特定の分節化規則(プロジェクト専用のルール)を使用することができます。OmegaT を実行する際に、コマンドラインに起動オプションをプロジェクト専用の設定を記述して実行することもできます。
詳細はコマンドライン起動項をご覧ください。
ローカル規則を使用している場合でも、グローバル規則にアクセスすることはできますが、それらを変更してもプロジェクトには影響しません。
翻訳中に分節化規則の設定を変更しても、プロジェクトの翻訳メモリに登録されている分節は変更されません。
たとえば、翻訳の途中で分節化を 文単位 から 段落単位 に変更しても、そのプロジェクトの内部翻訳メモリは何も変わりません。OmegaT は段落単位でしか分節化できなかった旧形式の翻訳メモリをアップグレードできますが、その逆はできないのです。ただし OmegaT は、文単位の既存の翻訳を結合して、段落単位の参考訳文を作ることはできます。
翻訳中に分節化規則を変更した場合は、新しい分節化規則を有効にするためにプロジェクトを再ロードする必要があります。すると、以前に翻訳済みの一部の分節が分割または結合され、翻訳済みの分節ではなくなります。ただし、元の翻訳はプロジェクトの翻訳メモリ内に残ります。
(ユーザレベルまたはプロジェクト専用、段落または文、設定など)分節化の一般的な説明については、付録分節化規則を参照してください。
デフォルトでは、分節化の設定はユーザーレベルであり、すべてのプロジェクトで共有されます。
( を使用して) ユーザーレベルの分節化規則 設定を開いたときに表示される分節化規則は、ユーザーレベルです。
プロジェクト専用のルールを作成するには、このボタンを使用します。[分節化規則をプロジェクト専用にする]
チェックボックスにチェックを入れてから、分節化規則を必要な状態に変更してください。
新しい規則集は、プロジェクトと共にomegatフォルダーのsegmentation.confファイルに保存されます。またユーザーレベルの分節化規則集には干渉しません。
プロジェクト専用の分節化規則を削除したい場合は、この設定オプションを無効にするか、このファイルを削除してください。
ローカル規則を使用している場合でも、グローバル規則にアクセスすることはできますが、それらを変更してもプロジェクトには影響しません。
(ユーザレベルまたはプロジェクト専用、段落または文、設定など)分節化の一般的な説明については、付録分節化規則を参照してください。
翻訳自動反映
同じ内容の分節が何箇所か原文に存在する場合、[翻訳自動反映]チェックボックスにチェックを入れると、最初にその内容を一箇所翻訳した時点で、それが基本訳文に設定され、他の訳文分節にも同じ内容が設定されます。
異なる訳文が必要な分節には、例外訳文を割りあてるために、 を使うことができます。
この設定オプションを有効にしていなければ、すべての分節に異なる訳文を割りあてることができます。
タグは一般に、原文の特定のレイアウトまたは修飾属性などを訳文に再現するのに役立ちます。
この機能を有効にすると、原文分節のタグが非表示になり、手動でタグを処理する必要がなくなります。
これはインラインの整形を実際には使わないテキスト(たとえば OCR ソフトが出力した PDF ファイルや、変換精度の低い .odt ファイルや .docx ファイルなど)を扱う場合に役に立ちます。
プロジェクト専用の後処理用コマンド:
OmegaTは、訳文ファイルを生成したあとに自動的にコマンドを実行させることができます。
この領域で実行するコマンドを入力します。
C + D または C + S + D を使用したときに、訳文ファイルを作成してコマンドを起動します。
ここで指定したコマンドは、このプロジェクトでのみ有効です。その指定は、 omegat.project ファイルに保存されます。あなたがコマンドを信頼しているときのみ、プロジェクト専用の後処理コマンドを有効にしてください。
テンプレート変数により、さまざまなプロジェクトのデータや、システム変数へのアクセスが提供されています。
詳細は、付録の 後処理用コマンド: をご覧ください。
また、同じユーザーレベル設定を共有するすべてのプロジェクトで使用可能なフォルダー後処理コマンドを定義することもできます。そのようなコマンドは
ユーザーレベルの後処理用外部コマンド
設定でで定義できます。
プロジェクト専用の後処理用コマンドは、ユーザーレベルコマンドの前に実行されます。
デフォルトでは、フィルターの設定はユーザーレベルであり、すべてのプロジェクトで共有されます。これらの設定は、 ユーザーレベルファイルフィルタ 設定で定義できます。
プロジェクト専用のフィルター設定を作成するには、このボタンを使用します。 フィルター設定をプロジェクト専用にする
チェックボックスにチェックを入れてから、必要な設定に変更してください。
新しいファイルフィルターの設定は、プロジェクトと共にomegatフォルダーのfilters.xmlファイルに保存されます。これらの設定は、ユーザーレベルファイルのフィルター設定よりも優先されます。
プロジェクト専用のファイルフィルターを無効にするには、チェックボックスをオフにするか、そのファイルを削除します。
詳細は、付録の ファイルフィルター をご覧ください。
チームプロジェクトで作業する場合、このウィンドウでリモートフォルダとローカルフォルダ間のマッピングを定義できます。
詳細については、 チームプロジェクトを設定するハウツー項のリポジトリマッピング章を参照してください。
デフォルトでは、外部検索はユーザーレベルであり、すべてのプロジェクトで使用できます。これらの設定は、 ユーザーレベルの外部検索 設定で定義できます。
プロジェクト専用の外部検索を作成するには、このボタンを使用します。
新しい外部検索の設定は、プロジェクトと共にomegatフォルダーのfinder.xmlファイルに保存されます。これらの設定は、ユーザーレベルファイルの外部検索設定よりも優先されます。
プロジェクト専用の外部検索を無効にするには、
をクリックにするか、そのファイルを削除します。詳細については、 ユーザーレベルの外部検索 環境設定を参照してください。
セキュリティ上の理由から、プロジェクトベースの外部検索はデフォルトで無効になっています。有効にするには、
ユーザーレベルの外部検索
設定の
プロジェクト専用の後処理用コマンドを許可
でチェックをいれます。
OmegaT の翻訳プロジェクトは、複数のフォルダーの様々な資材から構成されています。
新しいプロジェクトが作成されると、OmegaTは翻訳で使用されるすべての資材を含むプロジェクトフォルダーを提案しますが、その構造は必須ではありません。
資材のフォルダは、共有ディスクを含むシステム上の任意の場所に配置できます。
詳細については-プロジェクトフォルダーを参照してください。
フォルダにファイルを追加または削除したり、プロジェクトで使用するフォルダを変更したりすることで、プロジェクトの構造を変更することができます。これは、翻訳中でも可能です。
プロジェクト資材の場所にアクセスするには、 を使用しサブメニューを選択します。
ボタンは、すべてのユーザー定義プロジェクト資源で使用できます。
資材は、OmegaTが作成するデフォルトのプロジェクト・フォルダーに保存されている必要はありません。共有ディスク上のフォルダなど、リソースを格納する任意のフォルダーを選択できます。
ボタンをクリックして、デフォルトの資材フォルダの代わりに使用するフォルダを選択します。
原文ファイルフォルダー
翻訳対象の原文ファイルがこのフォルダにあるとみなします。OmegaTは、すべてのファイルを一度に読み取ろうとし、翻訳可能な内容をエディタに表示します。
詳細はsource項をご覧ください。
フォルダーが空の場合、翻訳可能なコンテンツを含むファイルがない場合、またはOmegaTのファイルフィルターでサポートされているファイルがない場合、OmegaTはフォルダーが空であると通知します。
翻訳メモリフォルダー
このフォルダに、翻訳メモリとして利用するファイルが保存されます。すべての辞書ファイルの索引を一度に読み取り、翻訳したい分節に対して比較を行ないます。
詳細はtm項をご覧ください。
一致するものが見つかると、 参考訳文 に表示されます。
用語集フォルダー
このフォルダに用語集として利用するファイルを保存します。すべての辞書ファイルの索引を一度に読み取り、翻訳したい分節に対して比較を行ないます。
詳細は用語集項をご覧ください。
一致するものが見つかると、 用語集 に表示されます。
詳細は、付録の 用語集 をご覧ください。
書き込み可能な用語集ファイルを開く
書き込み可能な用語集は、 C + S + G コマンドを使用して翻訳されたOmegaT用語をプロジェクトに追加するときに用語集機能が使用するファイルです。
このファイルは、最初の用語定義を作成したときに自動的に生成されます。
追加された項目は、現在の分節内の用語と一致する場合に自動的に認識され、表示されます。
このファイルはプロジェクトの用語集フォルダーに 必ず存在 します。
辞書フォルダー
このフォルダに辞書として利用するファイルを保存します。すべての辞書ファイルの索引を一度に読み取り、翻訳したい分節に対する検索を行ないます。
詳細は辞書項をご覧ください。
一致するものが見つかると、 辞書 に表示されます。
訳文ファイルフォルダー
ここはOmegaTが訳文ファイルを作成するフォルダーです。
訳文ファイルは、sourceフォルダーにあるファイルの翻訳バージョンです。
翻訳された分節はその翻訳に置き換えられ、未翻訳分節は元の言語のままになります。
フォルダーの構造は、sourceフォルダーの構造を反映しています。OmegaTのファイルフィルタでサポートされていないファイルは、変更されずにコピーされます。
C + D または C + S + D を使用して、翻訳されたファイルを作成します。
詳細はtarget項をご覧ください。
翻訳メモリ出力フォルダー:
このフォルダーは、OmegaTが訳文生成の際に、翻訳の現在の状態をTMXファイル形式で出力する場所です。
デフォルトでは、そのフォルダーはプロジェクトフォルダーそのものですが、場所を変更して、書き出されたTMファイルを共有しやすくすることができます。
詳細については、 翻訳メモリの共有を参照してください。
TMXファイルには、sourceフォルダーの現在のコンテンツに対応する分節だけが含まれています。
C + D または C + S + D を使用して、訳文ファイルとTMXファイル出力を作成します。
エクスポートする翻訳メモリ
このチェックボックスでは、OmegaTで上記のTMXファイルを作成するときのフォーマットを選択できます。
詳細については、 翻訳メモリを使用するを参照してください。
OmegaT
"OmegaT"のTMXには、OmegaTが作成したタグが、OmegaTプロジェクトでしか適切に使用できない形式で含まれています。
TMX Level 1
level1 ファイルには、文書情報のみが含まれます。
TMX Level 2
「レベル2」TMXには、他のCATツールと互換性のある方法でカプセル化されたタグとともにテキストデータが含まれています。
詳細については、TMX 1.4b仕様を参照してください。
C + L を選択したときと同様に、OmegaT がプロジェクトを読み込むと自動的に表示されます。
このウィンドウは、次の情報を表示します:
任意のテキストを入力するとフィルター欄が開き、そこにファイル名の一部を入力することができます。矢印を使用してファイルを選択し、 Enter キーを押して変換用に開くことができます。
ヘッダーをクリックすると、たとえばファイル名(左端の列)のアルファベット順で並べ替えたりできます。ファイルの位置を変更するには、ファイルを選択し、右側の
ボタンのいずれかをクリックします。ファイル名を右クリックするとポップアップが開き、原文ファイルと訳文ファイル(存在する場合)を開くことができます。
繰り返しを除いた 分節の数は、分節の総数から繰り返される分節の数を削除することによって計算されます。
「すべての分節数」と「繰り返しを除いた分節数」の差から、すべての文中に繰り返しの表現がどれくらいあるかを大まかに見積もることができます。詳細な情報を取得するには、 を使用してください。
分節化規則を修正すると、「すべての分節数」と「繰り返しを除いた分節数」が変わる可能性があります。いったんプロジェクトの翻訳を開始したら、規則の変更はなるべく行わないようにしてください。詳細は、付録の 分節化規則 をご覧ください。
ウィンドウの下部にあるボタンを使用して、プロジェクトにファイルを追加できます。
この2つのアクションは、 および メニュー項目を使用するのと同じです。
omegat.prefs設定ファイルを手動で編集して、プロジェクトのロード時にソースファイル翻訳対象一覧ウィンドウが自動的に開かないようにすることができます。
C + F を使用して新しい検索ウィンドウを開き、検索する単語またはフレーズを検索領域に入力します。
同時に複数の検索ウィンドウを開くことができます。最後に使用した検索ウィンドウを呼びだすには、 C + S + F を使用します。
あるいは、 編集 、 参考訳文 、 または 用語集 ウィンドウで単語や語句を選択してから C + F を使用できます。この場合、検索領域に選択した単語や語句が自動的に入力されます。
[検索文字列]欄のドロップダウンボタンをクリックすると、直近の検索履歴が 10 個まで表示されます。
検索欄を選択して検索をスタートするには、 Enter キーを入力します。
をクリックするか、一致した文字列は、青い太字で表示されます。
-- 148> | language = [[日本語]]・[[ドイツ語]] --------- -- 177> [[2001年]]、ドイツの永住権を取得。 ---------
「プロジェクトの検索」ウィンドウには独自のメニューがあります。
C + F ): 検索欄に選択されている単語や語句が入力されます。
> (C + W ):検索ウィンドウを閉じます。
> (C + S + I ): insert the content of the current source segment.
> (C + S + R ):検索領域の内容を現在の原文分節の内容で置換します。
> (C + S + G ): 新しい用語集の用語を追加します。詳細は C + S + G を参照してください。
> (> :検索ウィンドウのオプションをリセットします。
ラジオボタンを使用して、検索方法を選択します。
以下の検索方法を利用できます:
検索欄に指定した文字列そのまま含む分節を検索します。
これは、Web検索で引用符マークで囲んだ時と同じです。
空白で区切って指定したすべてのキーワードを含む分節を検索します。
引用符を使わずに実行したWeb検索と同様です。
*
および?
文字は、完全一致検索とキーワード検索の両方で使用できます。
*
は、0個以上の任意の文字と一致します。
たとえば、検索文字列がrun*
である場合は、run
や runs
や、さらにrunning
にも一致します。
?
は任意の1文字と一致します。
たとえば、検索文字列がrun?
の時に、runs
に一致すると同時に、running
やrunner
の中のrunn
の部分に一致します。
検索文字列が正規表現として扱われます。
正規表現は、完全一致の文字列ではなく、全般的な検索や複雑なパターンの検索を行なうときに、とても効果的な方法です。詳細は、付録の 正規表現 をご覧ください。
*
と?
の文字は、正規表現では特別な意味を持ちます。したがって、上記のワイルドカード検索は、完全一致検索とキーワード検索にのみ適用されます。
検索語と大文字小文字が一致する結果のみを返します。
検索文字列に入力されたスペース文字は、通常のスペース文字だけでなく、ノーブレークスペース(\u00A)にも一致するようになります。
原文分節を検索します。
訳文分節を検索します。
分節に付加されたメモを検索します。
分節に添付されているコメントを検索します。
翻訳済み分節と未翻訳分節の両方で検索します。
翻訳済分節のみ検索します。
未翻訳分節のみ検索します。
プロジェクト内で内容が同じ分節が複数見つかった場合でも、検索結果にすべての分節を繰り返し表示します。
分節ごとに、その分節が属するファイル名を先頭に表示します。
プロジェクトのさまざまな複数言語の資材を検索します。
検索の範囲を選択:
プロジェクトの内部メモリ(project_save.tmx)を含めます。
tmフォルダーにある翻訳メモリを含めます。
用語集フォルダーにある用語集を含めます。
プロジェクト資材に含まれていない参照用ファイルを検索します。
OmegaTは、原文ファイルとして読み込むことができる全てのファイルで検索を実行できます。詳細については-ファイルフィルターを参照してください。
TMXファイルは、翻訳メモリとしてサポートされていますが、OmegaTでは原文ファイル形式として認識されないため、ファイル検索から除外されます。
翻訳を作成または変更したユーザー、翻訳(変更)の日時、現在の原文に存在しない分節を除外するかどうかなどの追加の検索条件を選択します。
参考訳文の設定は、メインメモリのみに適用され、参照用の翻訳メモリには適用されません。
検索語の文字の全角と半角(CJK文字)の両方に一致する結果を返します。
検索結果領域に表示される一致項目の最大数を設定します。
詳細設定の表示を停止するには、
ボタンを使用します。検索された分節は、プロジェクト中で現れる順に表示されます。翻訳済みの分節の場合、原文は訳文の上に表示されます。未翻訳分節の場合には、原文のみが表示されます。
分節をダブルクリックすることで 編集 ウィンドウで、対象分節にジャンプします。
検索結果画面では、次のショートカットを使用することもできます。
次の分節に移動します
一つ前の分節に移動します
編集ウインドウの現在の分節にジャンプします。
選択した分節が緑色でハイライト表示されます。
-- 148> | language = [[日本語]]・[[ドイツ語]] --------- -- 177> [[2001年]]、ドイツの永住権を取得。 ---------
編集 ウィンドウ内の一致する検索結果分節のみが表示されます。フィルターを解除するには、 編集 ウィンドウの上部にある ボタンをクリックするか、またはプロジェクトを再読み込みしてください。
ボタンをクリックすると、C + K を使用して新しい検索ウィンドウを開き、検索する単語またはフレーズを検索領域に入力します。
あるいは、 編集 、 参考訳文 、 または 用語集 ウィンドウで単語や語句を選択してから C + K を使用できます。この場合、検索領域に選択した単語や語句が自動的に入力されます。
同時に複数の検索ウィンドウを開くことができます。
検索文字列欄や、置換文字列欄のドロップダウンボタンをクリックすると、直近の検索履歴が 10 個まで表示されます。
検索語を置換するために挿入する文字列を置換後の文字列:領域に入力し、 をクリックします。カーソルがフィールド内にある場合は、 Enter を押します。
検索の一致は青い太字で表示され、変更された文字列はオレンジ色で表示され、置換の結果を示します。
多和田葉子.UTF8 -- 148> | language = [[日本語]]・[[ドイツ語]] <- | language = [[Japonais]]・[[Alllemand]] -> | language = [[Japonais]]・[[Allemand]] ---------
この段階では、まだ置換は行われていません。
次のいずれかの選択肢をクリックします。
すべての検索文字列を置換後の文字列で置き換えます(事前に置換件数を示した確認ダイアログが表示されます)。
は、編集ウィンドウのエントリをフィルタし、置換される要素を色付け表示します。
か をクリックしていき、最後に して置換操作を終了します。
変更なしにウィンドウを閉じます。
置換ウィンドウには独自のメニューがあります。
C + F ): 検索欄に選択されている単語や語句が入力されます。
> (C + W ):検索ウィンドウを閉じます。
> (C + S + I ): insert the content of the current source segment.
> (C + S + R ):検索領域の内容を現在の原文分節の内容で置換します。
> (C + S + G ): 新しい用語集の用語を追加します。詳細は C + S + G を参照してください。
> (> :検索ウィンドウのオプションをリセットします。
ラジオボタンを使用して、検索方法を選択します。
以下の検索方法を利用できます:
検索欄に指定した文字列そのまま含む分節を検索します。
これは、Web検索で引用符マークで囲んだ時と同じです。
*
および?
文字は、完全一致検索とキーワード検索の両方で使用できます。
'*'は、現在の位置から単語末までの0個以上の任意の文字と一致します。たとえば、検索文字列がrun*
である場合は、run
や runs
や、さらにrunning
にも一致します。
「?」は任意の1文字と一致します。たとえば、検索文字列がrun?
の時に、runs
に一致すると同時に、running
やrunner
の中のrunn
の部分に一致します。
検索文字列が正規表現として扱われます。
正規表現は、完全一致の文字列ではなく、全般的な検索や複雑なパターンの検索を行なうときに、とても効果的な方法です。詳細は、付録の 正規表現 をご覧ください。
置換文字列は検索文字列で定義されたグループへの参照をサポートします。検索領域のn番目
のグループを参照するには、置換領域で$n
(n
は1~9の数字)を使用します。
検索語と大文字小文字が一致する結果のみを返します。
検索文字列に入力されたスペース文字は、通常のスペース文字だけでなく、ノーブレークスペース(\u00A)にも一致するようになります。
未翻訳分節でも検索できます。
翻訳を作成または変更したユーザー、翻訳(変更)の日時、現在の原文に存在しない分節を除外するかどうかなどの追加の検索条件を選択します。
検索語の文字の全角と半角(CJK文字)の両方に一致する結果を返します。
詳細設定の表示を停止するには、
ボタンを使用します。検索された分節は、プロジェクト中で現れる順に表示されます。翻訳済みの分節の場合、原文は訳文の上に表示されます。未翻訳分節の場合には、原文のみが表示されます。
分節をダブルクリックすることで 編集 ウィンドウで、対象分節にジャンプします。
検索結果画面では、次のショートカットを使用することができます。
次の分節に移動します
一つ前の分節に移動します
編集ウインドウの現在の分節にジャンプします。
選択した分節が緑色で色付け表示されます。
OmegaTでは、キーベースのフォーマット用にコマンドラインベースの整合モードも提供しています。詳細については、
--mode=console-align
--alignDir=<path>
ウインドウを参照してください。
整合ツールでは、配置の途中で作業内容を保存することはできません。そのため、整合ツールで利用するファイルは、1つのセッションで快適に作業できるように、短いファイルに分割することをお勧めします。そうすることは、最初の自動整合における不一致を減少させ、手動補正ステップをより円滑にするという利点もあります。
整合とは、既に翻訳された原文言語と訳文言語の文書ペアから二言語の対の翻訳メモリを作成するプロセスです。ファイルのコンテンツを整合するには、4つのステップで作業します。
原文と訳文の言語を指定し、整合するふたつのファイルを選択します。
整合ツールはファイルを読み取り、元のテキストと翻訳されたテキストで互いに対応するセグメントを一致させようとします。
結果を確認して、必要な手動調整を行います。
結果をTMXファイルに保存します。
整合ツールは、OmegaTがサポートするすべてのファイル形式を読み込むことができます。
翻訳プロジェクトを開いている場合、整合ツールでは自動的にそのプロジェクトの言語が使用されます。また、プロジェクト固有の分割ルールがある場合は、そのルールも使用されます。
言語とファイルを選択した後、整合ウィンドウを表示すると、自動整合の結果が表示されます。
ボタンをクリックしてウィンドウの主要部分は3つの柱に分かれています。
採用:このボックスがオンになっている行の分節ペアは、翻訳メモリファイルに保存されます。チェックのない行は削除されます。
原文:原文テキストからの分節。
訳文:訳文テキストからの分節。
このステップでは、ウィンドウの最下部に、さまざまなパラメータや設定オプションがあり、初期の整合がより良くなるように変更することができます。また、整合の平均スコアの結果も表示されます。経験則として、スコアが低いほど、整合はより正確になります。調整値を変更すると、すぐに整合方法が再計算されるため、さまざまな組み合わせをすばやく試して最適な結果を得ることができます。
可能な設定は以下の通りです:
Heapwiseモードでは、文書のテキストを全体で評価します。
Parsewiseモードでは、分節ごとに評価します。整合するファイルで使用可能な場合にのみ表示されます。
ID: このモードでは、 key = value
のエントリーからなるファイルに適用できます。これは、2つのファイルのキーの順序が同じでない場合や、2つのファイルに同じ量の情報が含まれていない場合でも機能します。整合するファイルが、key=valueファイルだと判断された場合にのみ表示されます。
Viterbi: デフォルトのアルゴリズムによりファイルを整合します。
Forward-Backward: 代替のアルゴリズムで、文書の整合に利用できます。
どのアルゴリズムを選択するとよいのか、堅牢で簡単なルールはありません。双方を試してみて、よりよい結果がでたほうを利用してください。
Normal: 文書を整合するときに使用するデフォルトの統計的分散
Poisson: 代替の統計的分散で文書の整合に利用できます。
アルゴリズムごとに、選択する統計的分散を決定する簡単で堅牢な方法はありません。双方を試してみて、よりよい結果がでたほうを利用してください。
文字:単語の区切りに空白を使用しない言語で、分節のサイズを決定するために使用される基本単位。
単語:単語を区切るために空白を使用する言語で、分節のサイズを決定するために使用される基本単位。
整合ツールは、整合するファイルの原文言語と訳文言語に基づいて、カウンターを自動的に選択します。デフォルトでは、 片方の言語が単語分割に空白文字を使用しないときには文字を選択します。そうでなければ、 単語 を使用します。If you are working with one of each, you can try to switch between the two to see which one yields better results.
整合ツールは文単位の分節化デフォルトではを利用しています。段落単位の分節化を使用するには、チェックボックスをオフにします。詳細については、設定- ユーザーレベルの分節化規則 を参照してください。
整合ツールは、デフォルトでは分節のタグも利用しています。整合および結果のTMXからすべてのタグを削除するには、このチェックボックスをオフにします。
ハイライトを使用しないときは、チェックボックスをオフにします。
整合ツールでは、正規表現\d+
を使用して、原文分節と訳文分節のすべての数字が強調表示されます。
正規表現を修正して、ハイライト表示される部分を追加することができます。詳細については-正規表現を参照してください。
プロジェクトに適用される分節化規則を編集するには、このボタンを使用します。詳細は、付録の 分節化規則 をご覧ください。
分節化規則を変更した場合は、整合ツールを終了するときに変更を保存するかどうか、確認するメッセージが表示されます。デフォルトの選択肢は
です。一般的なOmegaT分節化規則を編集した場合、保存を必要としない場合もあります。プロジェクトに適用されるファイルフィルターを編集するには、このボタンを使用します。詳細については、 ユーザーレベルファイルフィルタ 環境設定を参照してください。
ファイルフィルタを変更した場合は、整合ツールを終了するときに、変更を保存するかどうかを確認するメッセージが表示されます。デフォルトの選択肢は
です。ユーザレベルのOmegaTのファイルフィルターの設定を編集した場合、保存を必要としない場合もあります。この設定では、原文分節と訳文分節の文章を色付け表示する正規表現のパターンを定義できます。整合ツールは、デフォルトでは\d+
を使用して数値を色付け表示します。強調表示すると便利な他の要素がテキストに含まれている場合は、記号を使用して各要素を区切り、それらの要素を含むように正規表現を修正します。
色づけ設定とダイアログにアクセスして、 メニューからパターンを修正したり、 メニューからオプションを修正したりすることもできます。
また、
メニューには次のコマンドがあります。:この項目は、次の手順が完了するまで淡色表示されます。
C + S + R を押して呼び出すこともできます。
:このコマンドは、すべてのパラメータをデフォルト値に復元します。また、ウィンドウの右下にある をクリックするか、:このコマンドは、ディスクからファイルを再ロードします。内容を変更する必要がある場合は、このコマンドを使用して、ファイルを再度解析および整合することができます。
整合ダイアログを閉じます。この手順でキャンセルすると、翻訳メモリファイルにデータを保存せずに整合作業がキャンセルされます。このコマンドは、 C + W を押して呼び出すこともできます。
:これはこのステップでは、
メニューはグレー表示されています。この手順の結果に問題がなければ、
ボタンをクリックして次の手順に進みます。通常の場合、最初の自動整合プロセスの後に手動調整が必要です。分節を上下に移動して他方の言語の正しい分節と対応関係を整合する作業と、分節を分割または結合する作業を行なっていきます。整合ツールでは、分節の内容を編集することもできます。これは、分節のスペルミスなどのエラーに気付いた場合に便利です。
整合に必要な操作は
メニューから実行できるほか、対応するショートカットキーを押すことでも利用できます。最も一般的な操作は、メインウィンドウの右側にあるボタンからもアクセスできます。ショートカットキーは、整合ツールを頻繁に使用する場合や、大きなドキュメントで作業する場合に覚えておくと便利です。ショートカットキーを使用すると、操作をすばやく実行できます。
操作を実行するには、該当する分節または連続する分節のブロックを選択します。個々の分節は、マウスまたは矢印キーで選択できます。分節のブロックは、マウスで最初の分節をクリックし、 Shift キーを押しながら最後の分節をクリックすることによって選択できます。
または、 Shift を押しながら矢印キーを押して、連続する分節を選択することもできます。使用可能な操作を以下に示します。
選択した分節、または連続する分節のブロックを1行上に移動します。
このコマンドは、メインウィンドウの右側にあるボタンからも使用できます。
選択した分節、または連続する分節のブロックを1行下に移動します。
このコマンドは、メインウィンドウの右側にあるボタンからも使用できます。
単一の分節が選択されている場合、このコマンドは文章の分割ダイアログを開きます。マウスまたは矢印キーを使用して文章を分割する位置にカーソルを置き、 ボタンをクリックするか、 Enter を押します。
同じ行の別々のセルを占有する2つ以上の分節(採用チェックボックスのない行を含む複数のセル分節)が選択されている場合、このコマンドは選択されたセルを(採用チェックボックスを使用)別々の行に分割します。
このコマンドは、メインウィンドウの右側にあるボタンからも使用できます。
分節が1つだけ選択されている場合は、整合ツールによって次の分節と結合されます。2つ以上の分節が選択されている場合、それらはすべて結合されますが、別のセルに残ります。同じ選択肢でもう一度このコマンドを呼び出すと、選択したすべてのセルの内容が1つのセルに結合されます。
このコマンドは、メインウィンドウの右側にあるボタンからも使用できます。
このコマンドは、単一の分節に対してのみ実行できます。このコマンドを呼び出すと、テキスト編集ダイアログが開き、分節のテキストを変更できます。終了したら、 ボタンを使用してダイアログを閉じます。このダイアログでは、 Enter は文章に改行を入力します。
C + Enter を使用して、マウスを使用せずにそれを閉じます。
このコマンドは、メインウィンドウの右側にあるボタンからも使用できます。
このコマンドを使用して、選択した行または行のブロックの分節の配置が正しいことを確認します。対応する採用カラムが緑色で強調表示されます。
このコマンドを使用して、分節の配置が疑わしい行または行のブロックを識別します。対応する採用カラムが赤で強調表示されます。
このコマンドを使用して、確定済みまたは要チェックコマンドによって設定された1つまたは複数のマークを削除します。
確定済みとしてマークされている行がある場合は、このコマンドを使用して残りの行の配置を更新できます。
このコマンドを使用して、すべての行の確定済みチェックボックスをオンにします。
このコマンドを使用して、すべての行の確定済みチェックボックスを外します。
このコマンドを使用して、選択した行または行のブロックの確定済みチェックボックスをオンからオフに、またはその逆に切り替えます。
対応するセグメントが数行離れていて、それらをすばやく整列する場合は、このコマンドを使用して最初の分節を選択してから、他の分節の対応するカラムをクリックします。
矢印キーを使用して、対応する分節の Space を押すこともできます。
この方法を使用して位置合わせされた分節は、自動的に受け入れられたものとしてマークされ
ピンポイント整合コマンドを数回使用した後に、
コマンドを実行すると便利です。2つのカラムの整合が完了したら、
ボタンをクリックして翻訳メモリを作成します。翻訳メモリの作成時には、最初の列で確定済みボックスがオンになっている行だけが含まれます。
整合ウィンドウの下部には、最初のステップと同じ色付け表示チェックボックスと ボタンがあります。この設定には、 メニューからもアクセスできます。
ボタンに加えて、手動修正ステップのウィンドウの下部には、 注意して利用してください! このボタンをクリックすると、すべての変更が破棄され、最初のステップに戻ります。
ボタンもあります。スクリプトは、Officeアプリケーションのマクロに似た短いプログラムで、タスクを自動化したり、OmegaTの機能を拡張またはカスタマイズするために使用できます。スクリプトは、ユーザーが基礎となるJava仮想マシンが理解できる任意の言語で作成できます。
スクリプト ウィンドウ上では、既存のスクリプトを読み込んだり、開いているプロジェクト上で実行できます。
スクリプトファイルは、デフォルトでは、OmegaTのプログラムフォルダー配下のscripts/フォルダーに格納されています。
そこに追加された新しいスクリプトは、箇条書きの左側のパネルにある使用可能なスクリプトのウィンドウに表示されます。
スクリプト編集ウィンドウの左側に、スクリプト一覧が表示されない場合は、スクリプトウィンドウの
]> メニューを使用して、スクリプトの場所を設定してください。追加できるスクリプトがOmegaT Scripts にあります。ファイルをscripts/フォルダにコピーします。
イベント ベースのスクリプトもあります。スクリプトを含むフォルダーには、使用可能なイベントに対応するサブフォルダが含まれます。スクリプトを適切なサブフォルダーに配置することで、スクリプトを自動的にトリガーできます。
このフォルダーにあるスクリプトは、OmegaT を終了する前に常に実行されます。
このフォルダーにあるスクリプトは、OmegaT が開始した後すぐに、スクリプト実行エンジンが利用可能になった時に実行されます。
このフォルダーにあるスクリプトは、新たな分節を編集開始するときに実行されます。分節は、newEntry
に保存されます。
このフォルダーにあるスクリプトは、編集画面で次のファイルに遷移するときに実行されます。新しいファイル名は、activeFileName
に保存されます。
このフォルダーにあるスクリプトは、編集ウィンドウで新たな単語を編集するときに実行されます。新たな単語は、newWord
に保存されます。
このフォルダーのスクリプトは、プロジェクトの状態が変更されると実行されます。eventType
オブジェクトの値としてCLOSE、COMPILE、CREATE、READ、またはSAVEを取ります。
これらのサブフォルダは、ディストリビューションに付属しているスクリプトフォルダーにすでに作成されています。
スクリプトは、他のスクリプトを実行しているときにも起動されます。そのため、大規模なプロジェクトでは、すべてのセグメントをループする検索/置換タイプのスクリプトが使用されている場合にentry_activated
スクリプトが頻繁に呼び出され、プログラムが応答しなくなることがあります。
左側のパネルの一覧でスクリプトの名前をクリックします。スクリプトが編集画面に読み込まれます。
ウィンドウの下部にある C + R を押してスクリプトをすぐに起動します。
ボタンをクリックするか、頻繁に使用するスクリプトへのショートカットを作成するには、ウィンドウの下部にあるスクリプトの追加を選択して、その番号にスクリプトを割り当てます。
から までのボタンのいずれかを右クリックし、ショートカットからスクリプトを削除する場合は、そのボタンを右クリックし、スクリプトの削除を選択します。
次に、番号をクリックして、割り当てられたスクリプトを実行できます。また、 メニューからスクリプトを実行するには、該当するメニュー項目を選択するか、関連するショートカット( C + A + F1~F12 )を押します。
Linuxユーザ:オペレーティングシステムの設定によっては、標準のスクリプトフォルダーの場所に書き込む権限がない場合があります。
このような場合、独自のスクリプトを記述したり、新しいスクリプトを追加したり、既存のスクリプトを変更したりするには、設定フォルダーなど、書き込み権限のある場所にスクリプトをコピーしたり、フォルダーを移動する必要があります。
標準フォルダーに書き込む権限がある場合は、変更したスクリプトの名前を変更するか、バックアップを作成してください。OmegaTが更新される時に、スクリプトが上書きされます。
OmegaTには、OmegaTの貢献者によって開発された多くのスクリプトが付属しています。スクリプト編集を使用して、スクリプトを直接開いたり、実行したり、変更したり、さらには独自に使用する新しいスクリプトを作成することもできます。
OmegaTで配布されているスクリプトは、お客様の利便性のために含まれていますが、OmegaTの開発チームではサポートしていません。
スクリプト自体に記載されている指示に従ってください。
[一致するものと置換]コマンドが呼び出されたときに、標準タグを適合させます。
前回使用した OmegaT プロジェクトを自動的に開きます
同一の分節(大文字 /小文字を識別)をチェックします。
原文中の通貨表記を、訳文の言語設定に応じて変換します。
たとえば原文に「$123,399.99」とあれば、これを「123 399,99 USD」に変換します。
GUI を表示するサンプルです
キーバインディング イベントのサンプルです。
分節の変更をおこなうサンプルです。
訳文の置換スクリプト(簡易版)
すべての分節を[project_name].doc
という名前のファイルに書き込み、システムの標準ワードプロセッサで開きます。注意: ファイルはプレーンテキストファイルです。.doc
拡張子は、ワードプロセッサで開くことを保証するだけです。
プロジェクトの内容を単一の文章ファイル(分節ごとに1行)に抽出します。RFE#182「プロジェクトの内容を文章ファイルに抽出」を参照してください。
スペース文字をノーブレークスペース文字に置き換えます(フランス語用)。
現在翻訳中の原文ファイルを開きます
書き込み可能な用語集ファイルをエディターで開きます
現在のプロジェクトフォルダーを OS の標準ファイル管理ソフト上で開きます
/tm
フォルダー(参考訳文用の翻訳メモリ配置フォルダー)を開きます
テキストエディターでproject_save.tmxを開きます。
品質管理スクリプトです。
同一の分節(大文字 /小文字を識別)をチェックします。
現在のプロジェクトまたはローカルの任意の SVN リポジトリ(作業コピー)に対して、クリーンアップ(矛盾した状態を解決する)を実行します
原文と訳文が同一の分節一覧を表示します
綴りの間違いを検査します
現在の訳文からBiDiマークを削除します
現在の訳文や選択からタグを削除します
編集で使用する色のテーマを切り替えます。
タグを削除した参考訳文に置換します
DOCX ファイルからタグを削除します
(no description)(no description)
(no description)(no description)
OmegaT APIのドキュメント。
Java仮想マシン用の動的言語。構文的に Java との互換性を最大限に保った上で、さらに Python や Ruby、Smalltalk に触発された強力な機能を持ちます。詳細については、Apache Groovyを参照してください。
プロトタイプ ベースのスクリプト言語です。動的で、弱い型付け、ファーストクラス関数などの特徴を持ちます。オブジェクト指向、命令型、および関数型プログラミングのスタイルのマルチパラダイム言語です。Practical Nashorn,Part 1:Introducing JavaScript,ECMAScript,and NashornおよびECMAScript®5.1 Language Specificationを参照してください。
すべての言語から、プロジェクトを先頭のオブジェクトとする OmegaT のオブジェクトモデルにアクセスできます。次に示すコードスニペットは、現在のプロジェクトから全ファイルの全分節を走査する groovy スクリプトです。このスクリプトは、もし訳文が存在していれば、その分節の原文と訳文を出力します:
files = project.projectFiles; for (i in 0 ..< files.size()) { for (j in 0 ..< files[i].entries.size()) { currSegment = files[i].entries[j]; if (project.getTranslationInfo(currSegment)) { source = currSegment.getSrcText(); target = project.getTranslationInfo(currSegment).translation; console.println(source + " >>>> " + target); } } }