Dateifilter sind entweder lokal und spezifisch für ein bestimmtes Projekt oder global und für alle Projekte, die sich einen Konfigurationsordner teilen, verfügbar.
Einzelheiten finden Sie unter:
Filter in fetter Schrift werden im aktuellen Projekt verwendet.
Deaktivieren Sie einen Filter durch Entfernen des Häkchens, wenn Sie Dateien, die mit dem Filter verknüpft sind, nicht übersetzen möchten. Der Inhalt dieser Dateien wird während der Übersetzung nicht angezeigt.
Sie können die Filter nach Namen oder Aktivierungsstatus sortieren. Klicken Sie auf die entsprechende Spaltenüberschrift, um auf- oder absteigend zu sortieren.
Um die Dateiendungen, Zieldateinamen und Kodierungen eines Filters zu ändern, wählen Sie ihn in der Liste aus und klicken Sie auf die Schaltfläche
.Einige Filter können über die Schaltfläche
weiter angepasst werden.Klicken Sie auf die Schaltfläche
, um die Dateifilter auf ihre Standardeinstellungen zurückzusetzen.Geänderte globale Dateifiltereinstellungen werden in filters.xml im Konfigurationsordner gespeichert. Einzelheiten finden Sie unter Konfigurationsordner. Wird diese Datei gelöscht, werden die Filtereinstellungen zurückgesetzt.
Geänderte lokale Dateifiltereinstellungen werden in die filters.xml-Datei im Projektordner gespeichert. Einzelheiten finden Sie im Kapitel Projektordner. Wird diese Datei gelöscht, werden die Filtereinstellungen zurückgesetzt und das Projekt verwendet wieder globale Dateifilter.
Führende und nachfolgende Tags werden von OmegaT in der Regel benötigt, um das übersetzte Segment korrekt wiederzugeben. Das Verstecken dieser Tags im übersetzbaren Inhalt stellt sicher, dass sie nicht versehentlich gelöscht oder geändert werden.
Wenn die führenden und nachfolgenden Tags nicht versteckt werden, muss darauf geachtet werden, dass sie auch in den übersetzten Text eingefügt werden.
Standardmäßig entfernt OmegaT alle führenden und nachfolgenden Leerräume (Leerzeichen, Zeilenumbrüche usw.) aus den übersetzbaren Inhalten. In unsegmentierten Projekten bewirkt das Deaktivieren dieser Option, dass führende und nachfolgende Leerräume in der Übersetzung veränderbar sind.
Wenn die Quelldokumente Leerräume (Leerzeichen, Zeilenumbrüche usw.) zur Gestaltung des Layouts enthalten, werden diese im übersetzten Dokument beibehalten.
Standardmäßig ist der Name der Quelldatei eines der Elemente zur Identifizierung einer alternativen Übersetzung. Wenn diese Option aktiviert ist, werden nur die vorherigen/nächsten Segmente oder ein Segmentidentifikator verwendet, um eine alternative Übersetzung zu identifizieren.
Segmente, die dieselben Merkmale aufweisen und sich in anderen Dateien befinden, werden so auf dieselbe Weise übersetzt.
Doppelklicken Sie auf die editierbaren Felder, um einfache Änderungen vorzunehmen, oder klicken Sie auf die Schaltfläche
, um das Bearbeitungsdialogfenster aufzurufen.Wenn Sie ein Filtermuster hinzufügen wollen, klicken Sie auf
, um ein ähnliches Dialogfenster zu öffnen.Beide Dialogfenster bieten Ihnen die Möglichkeit, die Namensmuster für die Quell- und Zieldateien, die mit diesem Filter verknüpft sind, anzupassen und ihre jeweilige Kodierung auszuwählen.
Verwenden Sie das Aufklappmenü Dateinamenvariablen, um den Zieldateinamen anzupassen.
Um einen Filter mit einer Datei zu verknüpfen, prüft OmegaT die Dateiendung und versucht, diese mit einem Quelldateinamensmuster in einem Filter abzugleichen.
Zum Beispiel findet das im XHTML-Filter registrierte Muster .xhtml
jede Datei mit der Endung xhtml
. Wenn eine solche Datei im Ordner source gefunden wird, wird sie vom XHTML-Filter erfasst und verarbeitet.
Sie können Dateinamensmuster ändern oder hinzufügen, um verschiedene Dateien mit einem Filter zu verknüpfen.
Die Verknüpfung einer Dateiendung mit einem Filter ist kein Garant dafür, dass der Filter die Datei korrekt erfasst und verarbeitet. Auch die Dateistruktur muss mit dem Filter kompatibel sein: Selbst wenn Sie .odt
mit dem XHMTL-Filter verknüpfen, kann der Filter den Inhalt einer LibreOffice Writer-Datei nicht verstehen.
Quelldateinamensmuster verwenden Platzhalterzeichen: Das *
-Zeichen findet null oder mehr Zeichen, während das ?
-Zeichen genau ein Zeichen findet.
Zum Beispiel können Sie das Muster read*
für den Textfilter verwenden, um Readme-Dateien (readme, read.me
oder readme.txt
) zu erfassen.
Die meisten Dateiformate erlauben verschiedene Kodierungen. Standardmäßig sind die Kodierungen der Quell- und Zieldateien identisch.
Die Felder bei der Quell- und Zielkodierung sind Aufklappmenüs, die alle unterstützten Kodierungen auflisten. Die Auswahloption <auto> überlässt OmegaT die Wahl der Kodierung, basierend auf den folgenden Kriterien:
OmegaT verwendet die Kodierungsdeklaration in der Quelldatei, falls vorhanden, um die Kodierung zu bestimmen (HTML- oder XML-basierte Dateien).
OmegaT erzwingt eine bestimmte Kodierung für einige Dateiformate (z.B. Java-Eigenschaften).
Für Textdateien verwendet OmegaT die Standardkodierung des Betriebssystems.
Dateien im Ordner target werden jedes Mal überschrieben, wenn sie generiert werden (sofern sie denselben Namen haben).
OmegaT kann automatisch neue Namen für die generierten Dateien vergeben, z.B. durch Anfügen eines Sprachcodes oder eines Zeitstempels.
Das Zieldateinamensmuster verwendet eine spezielle Syntax. Mit dem Dialogfenster Muster bearbeiten kann es auf einfache Weise geändert werden. Das Dialogfenster bietet verschiedene Optionen:
Das Standardmuster. Es repräsentiert den vollständigen Dateinamen der Quelldatei, inklusive Endung. Dieses Muster bewirkt, dass die Zieldatei den Namen der Quelldatei zugewiesen bekommt.
Name der Quelldatei, ohne Endung
originale Dateiendung
Zielsprache+Regionscode (xx_YY)
Zielsprache+Region (xx-YY)
Code der Zielsprache (xx)
Code der Zielregion (YY)
Systemzeit, als die Datei erstellt wurde
Beispiele dafür finden Sie in der Oracle-Dokumentation.
Name des Betriebssystems
Anmeldename des Benutzers
Hostname auf dem System
Kodierung der Quelldatei
Kodierung der Zieldatei
Microsoft-Ziel-Locale
Zusätzliche Varianten sind für ${nameOnly}
und ${extension}
verfügbar.
Wenn die Verwendung von mehreren Punkten die Identifizierung des Dateinamens und der Dateiendung erschwert, können Sie Variablen in Form von ${nameOnly-
Nummer
}
oder ${extension-
Nummer
}
verwenden, um anzugeben, welche Teile zum Namen oder zur Endung gehören, wie im folgenden Beispiel gezeigt.
Für eine Quelldatei mit dem Namen Dokument.xx.docx würde die Verwendung der folgenden Variablenvarianten zu den folgenden Ergebnissen führen:
${nameOnly-0}
: Dokument
${nameOnly-1}
: Dokument.xx
${nameOnly-2}
: Dokument.xx.docx
${extension-0}
: docx
${extension-1}
: xx.docx
${extension-2}
: Document.xx.docx
Einige Filter bieten zusätzliche Optionen. Wählen Sie den Filter in der Liste aus und klicken Sie auf
, um ihn zu ändern.Die verfügbaren Optionen sind:
Textdateien haben keine generischen Absatzmarken. Wählen Sie hier, wie OmegaT Absätze in Ihren Textdateien erzeugen soll.
gibt die maximale Anzahl von Zeichen an, bevor eine lange Zeile umgebrochen wird. 0 bedeutet unbegrenzt.
gibt die maximale Anzahl von Zeichen an, bevor eine Zeile abgeschnitten und der Rest ignoriert wird. 0 bedeutet unbegrenzt.
Der Filter Microsoft Office Open XML (Legacy-Filter)
ist der originale OmegaT-Filter. Sie sollten ihn nur verwenden, um Kompatibilitätsprobleme mit früheren Projekten zu verhindern, die bereits Dateien enthalten, welche Sie mit diesem Filter bearbeitet haben.
Sie können zusätzliche Dokumentelemente für die Übersetzung auswählen. Diese Elemente werden im Editor als separate Segmente angezeigt.
Unsichtbare Anweisungstexte, Kommentare, Fußnoten, Endnoten, Fußzeilen, Reservetext für Kompatibilität, und Dokumenteigenschaften.
Kommentare und Blattnamen.
Folienkommentare, Folienmasters und Folienlayouts.
Externe Links, Grafiken, Diagramme, Zeichnungen und WordArt.
Tags, die keinen übersetzbaren Text umschließen, werden zu einem einzigen Tag zusammengefasst.
Leerräume (Leerzeichen, Zeilenumbrüche usw.) werden beibehalten, auch wenn diese Option im Dokument nicht definiert ist.
Aktivieren Sie diese Option, wenn weiche Zeilenumbrüche zum Starten neuer Absätze gedacht sind.
Die ausgewählten Attribute werden als übersetzbare Segmente im Editor-Bereich angezeigt.
Das HTML-Tag <br> wird als Absatzumbruch für die Segmentierung verwendet.
Beim Laden werden alle Absätze, die dem regulären Ausdruck entsprechen, ignoriert und nicht zur Übersetzung angeboten.
Diese Option ist nützlich, wenn Sie mit HTML-Abschnitten arbeiten, die unübersetzbaren Text enthalten.
Definieren Sie <meta>-Tag-Attributwerte, für die das zugehörige "content"-Attribut nicht übersetzt werden soll.
Fügen Sie keine Anführungszeichen hinzu und trennen Sie die Werte mit einem Komma.
Um den folgenden Content zu ignorieren:
<meta name="robots" content="index,
follow">
können Sie folgendes verwenden:
name=robots
Definieren Sie die Attributwerte, die ein Tag unübersetzbar machen sollen.
Fügen Sie keine Anführungszeichen hinzu und trennen Sie die Werte mit einem Komma.
Um den folgenden Content zu ignorieren:
<span translate="no">Dieser Content ist nicht übersetzbar</span>
können Sie Folgendes nutzen: translate=no
.
Alle Tags, die mit translate="no"
gekennzeichnet sind, werden ignoriert.
Hier werden nur die Optionen beschrieben, die beim XHTML-Dateien-Filter (siehe oben) nicht verfügbar sind.
Die Kodierung eines HTML-Dokuments wird in der Regel in einem <meta>-Element angegeben, das sich im <head>-Element befindet.
Quell- und Zieldateien benötigen manchmal eine unterschiedliche Kodierung.
Hier können Sie festlegen, ob die Deklaration der Zieldatei hinzugefügt oder geändert werden soll
immer, abhängig von den Dateifiltereinstellungen,
nur wenn die Datei bereits einen <head>-Tag hat,
nur wenn die Datei bereits eine Deklaration hat,
oder nie und die Zieldatei nur mit der Kodierung speichern, die in den Einstellungen des Dateifilters angegeben ist.
Leerräume (Leerzeichen, Zeilenumbrüche usw.) außerhalb von Tags werden in HTML/XHTML als unbedeutend angesehen.
Diese Option wandelt mehrere zusammenhängende Leerraumzeichen im übersetzten Dokument in ein einzelnes Leerzeichen um.
Kommentare in einer HTML-Datei sind normalerweise nur für Entwickler von Interesse. Verwenden Sie diese Option, um die Kommentare zu entfernen. Wenn diese Option deaktiviert ist, werden die Kommentare als Tags angezeigt.
Der Text in den HTML-Kommentaren (zwischen <!--
und -->
) wird nicht in das übersetzte Dokument übernommen.
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Der Filter prüft standardmäßig printf-Variablen (z.B. %s). Einzelheiten finden Sie unter
Variablen der printf-Funktion prüfen
(Einstellungen).
OmegaT fügt immer den Quelltext eines Segments in die Zieldatei ein, wenn kein Zieltext angegeben ist. Verwenden Sie diese Option, um ein unübersetztes Segment leer zu lassen.
Leere Quelltexte agieren manchmal als Platzhalter für Abschnitte, die in der Quellsprache nicht vorhanden sind, aber in der Zielsprache benötigt werden. Verwenden Sie diese Option, um eine Übersetzung auf Basis der zugehörigen Kommentare zu erstellen.
Der PO-Header wird bei der Übersetzung nicht angezeigt.
Überschreibt die Pluralspezifikation im Header und verwendet den Zielsprachenstandard.
PO-Dateien, die msgid
als Quellcontainer verwenden und erwarten, dass die Übersetzung in msgstr
abgelegt wird
PO-Dateien, die msgid
als ID-Code nutzen, verwenden msgstr
als Quellcontainer und erwarten, dass die Übersetzung msgstr
überschreibt
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Der Filter prüft standardmäßig Java-MessageFormat-Muster (z.B. \{0\}). Einzelheiten finden Sie unter
Variablen der printf-Funktion prüfen
(Einstellungen).
Java 8 benötigt die ISO-8859-1-Kodierung und verwendet Unicode-Literale für Zeichen außerhalb dieses Zeichensatzes. Java 9 oder höher benötigt die UTF-8-Kodierung. Diese Option erzwingt die Kompatibilität mit Java 8.
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Einige Applikationen erfordern die Beibehaltung bestimmter Unicode-Literale. Diese Option ermöglicht dies.
Indexeinträge, Lesezeichen, Lesezeichenreferenzen, Notizen, Kommentare, Präsentationsnotizen, Links (URL) und Blattnamen.
Dieser Filter ist der originale XLIFF-Filter von OmegaT. Sie sollten ihn nur verwenden, um Kompatibilitätsprobleme mit früheren Projekten zu verhindern, die bereits Dateien enthalten, welche Sie mit diesem Filter bearbeitet haben.
Aktivieren Sie diese Option, wenn Sie mit XLIFF-Dateien arbeiten müssen, die mit OmegaT 2.6 erstellt wurden.
Der Benutzer kann zwischen drei Optionen wählen: vorheriger und nächster Absatz, <trans-unit>-ID, oder <trans-unit>-resname-Attribut sofern verfügbar (wenn nicht verfügbar, wird die ID als Fallback verwendet).
Diese Optionen bestimmen, wie OmegaT die Tags aus den XLIFF-Inhalten erzeugt.
Wenn diese Option aktiviert ist, ändert OmegaT den XLIFF-Zielstatus auf "needs-review-translation" anstelle von "translated".
Translation-Memory-Tools arbeiten mit Texteinheiten, die als Segmente bezeichnet werden. Nachdem eine Übersetzung eingegeben wurde, wird das Segment, das den Quelltext enthält, zusammen mit seiner Übersetzung in den Translation Memory des Projekts gespeichert und anschließend mit anderen Quelltexten im Projekt verglichen.
Um die Art der Segmentierung anzugeben, verwenden Sie die Projekteigenschaft
Segmentierung auf Satzebene
.
Segmente sind standardmäßig Absätze , die durch das Dateiformat selbst vorgegeben sind.
Der Verzicht auf die Satzsegmentierung in einem Dokument führt dazu, dass automatisch die Absatzsegmentierung verwendet wird. In diesem Fall wird jeder Absatz (abhängig vom Format des Originaldokuments) als ein einzelnes Segment angezeigt. Dem Übersetzer ist es somit freigestellt, die Sätze innerhalb des Segments beliebig anzuordnen.
Absatzsegmentierung eignet sich gut für eher literarische oder kreative Texte und generell für Dokumente, bei denen Translation-Memory-Matches nicht so wichtig sind.
Satzsegmentierung stützt sich auf eine Reihe von Regeln (sogenannte Segmentierungsregeln ), die definieren, was einen Satz in der Quellsprache ausmacht. Diese Einstellung eignet sich gut für Dokumente, in denen Wiederholungen oder ähnliche Sätze häufig vorkommen, wie z.B. in technischen oder juristischen Dokumenten.
OmegaT segmentiert den Text zunächst auf Absatzebene. Dieses Verfahren verwendet ausschließlich die Struktur der Quelldatei zur Segmentgenerierung.
Textdateien können zum Beispiel an Zeilenumbrüchen, Leerzeilen oder gar nicht segmentiert werden. Dateien mit Formatierungen (z.B. ODF- oder HTML-Dokumente) werden an Blockelementen (Paragraph-Tags) segmentiert. Übersetzbare Objektattribute in XHTML- oder HTML-Dateien können als separate "Absätze" extrahiert werden.
Nachdem OmegaT die Quelldatei in Struktureinheiten zerlegt hat, werden diese weiter in Segmente zerlegt.
Sie können sich die Segmentierung so vorstellen, dass Sie den Textcursor zeichenweise über den Text bewegen und nach der Stelle suchen, an der ein Umbruch erfolgen oder nicht erfolgen soll.
Jedes Mal, wenn sich der Textcursor zum nächsten Zeichen bewegt, prüft OmegaT, ob:
der Text vor der Stelle einer Davor -Regel entspricht,
und der Text nach der Stelle der zugehörigen Danach -Regel entspricht.
Wenn die Stelle beide Regeln erfüllt, wird der Text an dieser Stelle je nach Regeltyp geteilt oder nicht geteilt.
Für die Definition von globalen und lokalen Segmentierungsregeln werden die gleichen Mechanismen und Dialogfenster verwendet.
Standardmäßig sind Segmentierungseinstellungen global und werden von allen Projekten gemeinsam genutzt.
Verwenden Sie die Projekteigenschaft , um den Geltungsbereich der Segmentierungsregeln auf das aktuelle Projekt zu beschränken.
Sie können dasselbe erreichen, wenn Sie OmegaT über die Befehlszeile starten. Einzelheiten finden Sie unter Start über die Befehlszeile.
Wenn Sie lokale Regeln verwenden, können Sie zwar immer noch auf die globalen Regeln zugreifen, aber eine Änderung der globalen Regeln wirkt sich nicht auf Ihr Projekt aus.
OmegaT bietet vordefinierte Segmentierungsregeln, die der Übersetzer mit regulären Ausdrücken ändern kann. Einzelheiten finden Sie unter Reguläre Ausdrücke.
Zur Erinnerung: Regeln funktionieren wie folgt: Wenn eine Regel zutrifft, setzt OmegaT eine Markierung an die entsprechende Stelle, so dass nachfolgende Regeln diese Stelle ignorieren. Aus diesem Grund müssen Ausnahmeregeln vor Segmentierungsregeln definiert werden.
Wenn Sie die Segmentierung während einer laufenden Übersetzung ändern, müssen Sie das Projekt neu laden, damit die neue Segmentierung wirksam wird. Dabei kann es vorkommen, dass einige bereits übersetzte Segmente geteilt oder zusammengeführt werden, wodurch sie nicht mehr übersetzt sind. Die ursprüngliche Übersetzung bleibt jedoch im Translation Memory des Projekts erhalten.
Kategorie | Absicht | Davor | Danach | Erklärung |
---|---|---|---|---|
Ausnahmeregel, Häkchen nicht gesetzt, weiter oben in der Liste | Nicht segmentieren nach Ms. | Ms\. | \s | Ms, gefolgt von einem Punkt, gefolgt von einem Leerraum. |
Ausnahmeregel, Häkchen nicht gesetzt, weiter oben in der Liste | Excel-Zellen mit Zeilenumbrüchen, die keine Segmente repräsentieren | \n | . | Zeilenumbruch, gefolgt von irgendetwas. |
Umbruchregel, Häkchen gesetzt, weiter unten in der Liste | Beginn eines neuen Segments nach einem Punkt, gefolgt von einem Leerraum wie z.B. Leer- oder Tabulatorzeichen. | \. | \s | Ein Punkt, gefolgt von einem Leerraum |
Umbruchregel, Häkchen gesetzt, weiter unten in der Liste | Beginn eines neuen Segments nach "。" (japanischer Punkt). | 。 | Beachten Sie, dass das Feld Muster danach leer sein kann. |
Diese Seite richtet sich an Benutzer, die ihre Produktivität erheblich steigern möchten. Obwohl reguläre Ausdrücke (oft mit regex oder regexp abgekürzt) als abschreckend und komplex empfunden werden, sind die einfachsten unter ihnen äußerst nützlich - sowohl in OmegaT als auch in vielen anderen Applikationen, die Sie tagtäglich verwenden, mit einigen Variationen.
Es werden nur die Grundlagen behandelt, die für Übersetzer am nützlichsten sind. Der Abschnitt Referenzen am Ende dieser Seite enthält einige Beispiele für fortgeschrittene oder komplexe Anwendungsfälle, die den Rahmen dieser Dokumentation sprengen würden. Wenn Sie Hilfe benötigen, können Sie Ihre Fragen auch in den verschiedenen Support-Kanälen stellen.
Reguläre Ausdrücke verwenden eine Kombination aus Buchstaben, Ziffern und Symbolen (zusammenfassend als Zeichen bezeichnet), um einen Ausdruck zu definieren, der ein bestimmtes Textmuster repräsentiert.
Hier einige Beispiele.
Eine beliebige Ziffer von 0 bis 9.
Repräsentiert ein oder mehr "Wortzeichen" (Buchstaben, Ziffern und der Unterstrich).
Repräsentiert ein optionales horizontales Leerraumzeichen (dazu zählen reguläre und geschützte Leerzeichen sowie Tabulatorzeichen, aber keine Zeilenumbruchzeichen, die zur Kategorie "vertikaler Leerraum" gehören: \v.)
Viele OmegaT-Funktionen verwenden reguläre Ausdrücke oder bieten diese als Option an:
Die Suche bietet die Option Reguläre Ausdrücke, mit der Sie Ihre Dateien effizient durchsuchen können.
Das Dialogfenster Textersetzung bietet die gleiche Option, mit der Sie reguläre Ausdrücke sowohl auf den gesuchten als auch auf den ersetzten Text anwenden können.
Benutzerdefinierte Tags sind regex-definierte Tags, die von OmegaT wie normale Tags behandelt werden. Einzelheiten finden Sie unter
Benutzerdefinierte Tags
(Einstellungen).
Verwenden Sie das |
-Zeichen (OR), um mehrere Tags voneinander zu trennen.
Mit der Einstellung
Geschützte Texte
können Sie Zeichenketten definieren, die OmegaT standardmäßig rot markiert und für Validierungszwecke als überflüssige Tags behandelt.
Verwenden Sie das |
-Zeichen (OR), um mehrere Textfragmente voneinander zu trennen.
Mithilfe von visuellen Indikatoren können Sie prüfen, ob Ihre Ausrichtung korrekt ist. Mit der EinstellungHervorheben können Sie Zeichenketten festlegen, die OmegaT in den ausgerichteten Dokumenten hervorheben soll.
Verwenden Sie das |
-Zeichen (OR), um mehrere Ausdrücke voneinander zu trennen.
Segmentierungsregeln und Sprachmuster werden mit regulären Ausdrücken definiert. Sie können diese nach Belieben ändern, um die Segmentierung eines Dokuments zu verbessern oder um weitere Grundregeln hinzuzufügen. Einzelheiten finden Sie unter Segmentierung.
Segmentierungs- oder Ausnahmeregeln definieren die Position in einem Segment, an der eine Trennung erfolgen oder nicht erfolgen soll. Um diese Position zu definieren, werden zwei reguläre Ausdrücke benötigt: ein "davor"-Ausdruck, um das Textmuster vor der Position zu definieren, auf die die Regel angewendet werden soll, und ein "danach"-Ausdruck, um das Textmuster nach dieser Position zu definieren.
Jedes Sprachmuster, das mit der Quellsprache des Projekts übereinstimmt, wird auf dieses Projekt angewendet.
Reguläre Ausdrücke werden verwendet, um Texte zu finden, einschließlich Zeichen, die auf dem Bildschirm oder im Ausdruck nicht sichtbar sind, wie z.B. Leerzeichen, Tabulatorzeichen oder Zeilenumbrüche. Jeder Ausdruck ist so beschaffen, dass er entweder mit einem Wort, einem Satz oder einer anderen Zeichenkette übereinstimmt oder nicht übereinstimmt .
Jedes einzelne Zeichen des Ausdrucks ist für die Ermittlung einer Übereinstimmung relevant.
Eine Vielzahl von Zeichen oder Zeichenkombinationen haben in regulären Ausdrücken eine Sonderbedeutung.
Reguläre Ausdrücke finden ausschließlich Text. Sie finden keine Schriftauszeichnungen wie fett , kursiv oder andere stilistische Effekte .
Es gibt vier Regeln, die zu beachten sind.
Die meisten Zeichen in einem regulären Ausdruck suchen sich einfach selbst in der Zeichenkette.
Zum Beispiel bewirken die acht Buchstaben des Wortes " Beispiel ", dass die Suchfunktion genau diese Buchstaben in dieser Reihenfolge versucht zu finden. Das heißt, es wird einfach nach dem Wort " Beispiel " gesucht.
\
) vorangestellt ist, haben eine Sonderbedeutung
Im Gegensatz zu einem einzelnen Buchstaben, der, wie oben beschrieben, nur für sich selbst steht, hat ein Buchstabe mit einem vorangestelltem \
eine spezielle Funktion in einem regulären Ausdruck.
Zum Beispiel ist
r
ein normales Zeichen, aber wenn \
vorangestellt wird, um es zu \r
zu machen, wird daraus eine spezielle Kombination, die ein
Wagenrücklaufzeichen (CR)
findet. \R
hingegen findet
ein beliebiges Zeilenumbruchzeichen
.
Nur die Buchstaben i j l m o und y , egal ob groß- oder kleingeschrieben, haben keine Sonderbedeutung, wenn ihnen ein umgekehrter Schrägstrich vorangestellt wird. Diese Dokumentation behandelt nur einen kleinen Teil der Buchstaben, die eine Sonderbedeutung haben.
Andere hier nicht aufgelistete Kombinationen finden Sie auf den Seiten im Abschnitt Referenzen.
Diese Sonderbedeutung muss durch ein anderes Zeichen aufgehoben werden, wenn das Zeichen selbst gefunden werden soll.
Die vollständige Liste der Zeichen finden Sie unten. Ein Beispiel ist .
: Allein hat es die Sonderbedeutung,
ein beliebiges Zeichen
zu finden.
Um einen normalen Punkt zu finden, muss ihm ein \
vorangestellt werden, also \.
.
\
-Zeichen ist etwas ganz Besonderes
Wie bereits erwähnt, hat das \
-Zeichen standardmäßig den Effekt, die Sonderbedeutung der anderen Zeichen entweder aufzuheben oder zu aktivieren. Es hat keine Wirkung, wenn es vor einem Zeichen ohne Sonderbedeutung steht (entweder standardmäßig oder durch Hinzufügen).
\
kann seine eigene Sonderbedeutung aufheben, indem man es verdoppelt, also \\
. Auf diese Weise kann ein
umgekehrter Schrägstrich
gefunden werden.
Die zwölf Sonderzeichen sind der
umgekehrte Schrägstrich
\
, der
Zirkumflex
^
, das
Dollarzeichen
$
, der
Punkt
.
, der
senkrechte Strich
(oder
Pipe
) |
, das
Fragezeichen
?
, das
Sternchen
(oder
Asterisk
) *
, das
Pluszeichen
+
, die öffnende
runde Klammer
(
, die schließende
runde Klammer
)
, die öffnende
eckige Klammer
[
, und die öffnende
geschweifte Klammer
{
.
Nachfolgend wird jedes Zeichen kurz beschrieben, mit entsprechenden RegEx-Beispielen und was damit gefunden oder nicht gefunden wird.
\
Dieses Zeichen bewirkt, dass die Sonderbedeutung des nächsten Zeichens aufgehoben oder deaktiviert wird.
0\.[0-9]
|
|
Findet |
Eine Zahl zwischen 0.0 und 0.9 oder eine Zahl, die mit 0.5 endet, z.B. 10.5 oder 560.5.
|
Findet nicht |
Sequenzen wie 0,1, 0-3 oder die ersten drei Zeichen von 0x002E, die übereinstimmen würden, wenn der Ausdruck nur |
^
Wenn der Zirkumflex als erstes Zeichen in einem Ausdruck verwendet wird, findet er den Anfang einer Zeile.
Wenn der Zirkumflex als erstes Zeichen in einer mit eckigen Klammern umschlossenen Zeichenklasse verwendet wird, findet die Zeichenklasse alle Zeichen, die nicht Teil dieser Klasse sind.
|
|
Findet |
|
Findet nicht |
|
$
Wenn das Dollarzeichen als erstes Zeichen in einem Ausdruck verwendet wird, findet es das Ende einer Zeile.
^\w+:$
|
|
Findet |
Eine Zeile, die nur aus einem einzigen Wort besteht und mit einem Doppelpunkt endet: Fragen: |
Findet nicht |
Eine Zeile, die nur aus einem einzigen Wort besteht, aber nicht mit einem Doppelpunkt endet: Fragen? |
.
Findet ein beliebiges Zeichen.
c.t
|
||||
Findet |
Beliebige Kombinationen aus drei Buchstaben, die mit "c" beginnen und mit "t" enden: " cat ", " cut ", " cot ", oder auch sinnlose Kombinationen wie " czt " oder " cqt ". |
|||
Findet nicht |
Kombinationen aus drei Buchstaben, die mit "c" beginnen und mit "t" enden, aber auf mehrere Zeilen verteilt sind. Welcher Buchstabe fehlt?
|
|
Dieses Zeichen fungiert als "ODER" und findet entweder den vorherigen oder nächsten Ausdruck.
^An|^The
|
|||
Findet |
Das einleitende "An" oder "The" in Sätzen wie:
|
||
Findet nicht |
Das einleitende "An" oder "The" in Sätzen wie:
|
?
Dieses Zeichen bewirkt, dass keine oder eine Instanz des vorherigen Zeichens oder Ausdrucks gefunden wird.
an?␣ (wobei "␣" für ein einzelnes Leerzeichen steht). |
|||
Findet |
Das "a" oder das "an" in:
Es findet auch das letzte "an " von "Can " in einem Satz wie "Can I help you?" oder das letzte "a " von "pasta " in "We had pasta for lunch." |
||
Findet nicht |
Das "a" noch das "an" in:
Sie haben kein Leerzeichen dahinter. |
*
Dieses Zeichen bewirkt, dass keine oder mehrere Instanzen des vorherigen Zeichens oder Ausdrucks gefunden werden.
run\w*
|
|
Findet |
Das Wort "run" sowie "runs", "runner", "runway", "runt" in "grunt" oder "brunt" und jede andere Zeichenkette, die "run" gefolgt von null oder mehr " Wortzeichen " enthält (dazu gehören auch Ziffern und der Unterstrich, so dass z.B. auch der Teil vor dem "@" in einer E-Mail-Adresse wie run_123@example.email.org gefunden wird). |
Findet nicht |
Den vollständigen Satz in "run-on" oder "run'n'gun", da der Bindestrich und der Apostroph nicht in |
+
Dieses Zeichen bewirkt, dass eine oder mehrere Instanzen des vorherigen Zeichens oder Ausdrucks gefunden werden.
\d+.d
|
|
Findet |
Zahlen wie "1.5", "23.2" oder "5235.8" mit einer Dezimalstelle und beliebig vielen Ziffern vor dem Dezimalpunkt. |
Findet nicht |
Den gesamten Wert von Zahlen wie "5,235.8" oder "21,571.9". Es wird nur der Teil nach dem Tausendertrennzeichen gefunden. |
(
Dieses Zeichen beginnt eine
Gruppe
, d.h. mehrere Zeichen, die als eine Einheit behandelt werden. Die Gruppen sind nummeriert, und ihr Inhalt wird im Speicher abgelegt. Sie können später im Suchausdruck mit \
wiederverwendet werden, wobei n
n
die Nummer der Gruppe ist.
Der Inhalt der Gruppe kann auch im Ersetzungstext verwendet werden. Verwenden Sie $
, wobei n
n
die Nummer der in der Suche definierten Gruppe ist.
Öffnende und schließende runde Klammern werden immer paarweise verwendet. Der Versuch, eine runde Klammer ohne ihr Gegenstück zu verwenden, löst einen Fehler aus.
(\b\w+\b)\h\1\b
|
|
Findet |
Doppelte Wörter, die mit einem Leerzeichen voneinander getrennt sind, z.B. das doppelte "an" im folgenden Satz: “I bought an an apple.” |
Findet nicht |
Das "that, that" im folgenden Satz: “But that, that is just unbelievable”, weil das erste "that" sowohl ein Komma als auch ein Leerzeichen dahinter hat, nicht nur ein Leerzeichen. |
)
Dieses Zeichen beendet eine Gruppe. Es ist besonders, weil es nie allein verwendet werden kann. Um die schließende runde Klammer selbst zu finden, muss ihr ein \
vorangestellt werden.
^\d+\)
|
||||
Findet |
Die Ordnungszahlen (einschließlich der runden Klammern) am Anfang jeder Zeile einer Liste, zum Beispiel:
|
|||
Findet nicht |
Ordnungszahlen, die nicht am Anfang einer Zeile stehen. Gehen Sie wie folgt vor:
|
[
Dieses Zeichen muss zusammen mit der schließenden eckigen Klammer verwendet werden, um mehrere einzelne Zeichen zu umschließen, von denen jedes eine potenzielle Übereinstimmung darstellt.
Nur die öffnende eckige Klammer ist besonders und muss einen umgekehrten Schrägstrich davor haben, um gefunden zu werden. Um die schließende eckige Klammer selbst zu finden, muss ihr kein umgekehrter Schrägstrich vorangestellt werden. (Sie können den Schrägstrich trotzdem hinzufügen, aber er hat keinen Einfluss auf den Ausdruck oder das Ergebnis.)
li[cs]en[cs]e
|
|
Findet |
Die korrekte Schreibweise von "licence" und "license" sowie mögliche Falschschreibungen wie "lisence" oder "lisense" |
Findet nicht |
Grobe Falschschreibungen wie "licensse" oder "lissense". |
{
Dieses Zeichen muss zusammen mit der schließenden geschweiften Klammer verwendet werden, um eine genaue Anzahl , ein Minimum , ein Maximum oder einen Zahlenbereich zu umschließen. Diese geben an, wie viele Instanzen des vorherigen Zeichens oder der vorherigen Gruppe gefunden werden sollen.
Nur die öffnende geschweifte Klammer ist besonders und muss einen umgekehrten Schrägstrich davor haben, um gefunden zu werden. Um die schließende geschweifte Klammer selbst zu finden, muss ihr kein umgekehrter Schrägstrich vorangestellt werden. (Sie können den Schrägstrich trotzdem hinzufügen, aber er hat keinen Einfluss auf den Ausdruck oder das Ergebnis.)
\d{4}/\d{1,3}
|
|
Findet |
Codes wie "1234/5", "1472/69" oder "9513/842", die aus vier Ziffern, einem Schrägstrich und 1-3 weiteren Ziffern bestehen. |
Findet nicht |
Codes wie "123/45", "1472/6985" oder "95133/15746". Warnung: Obwohl die letzten beiden Codes nicht als Ganzes gefunden werden, gibt der Ausdruck den Teil " 1472/698 " von "1472/6985" und den Teil " 5133/157 " von "95133/15746" zurück. |
Dieser Abschnitt enthält verschiedene Arten von regulären Ausdrücken, von einfach bis komplex.
Beachten Sie, dass die meisten
alphabetischen
Zeichen, denen ein \
vorangestellt ist,
nicht das Zeichen selbst darstellt, sondern eine Sonderbedeutung hat
.
Der einfachste reguläre Ausdruck besteht aus einem einzelnen Zeichen, oder aus einem \
und einem Zeichen, die zusammen eine Sonderbedeutung haben.
Ausdruck | Übereinstimmung |
---|---|
x
|
Das Zeichen "x" selbst Die meisten Zeichen finden sich selbst. |
\t
|
Das Tabulatorzeichen, nicht der Buchstabe "t". |
\n
|
Das Zeilenvorschubzeichen (LF), nicht der Buchstabe "n". |
\r
|
Das Wagenrücklaufzeichen (CR), nicht der Buchstabe "r".
|
Die normale OmegaT-Suche ist standardmäßig nicht Groß-/Kleinschreibung-sensitiv: Sie findet sowohl Groß- als auch Kleinbuchstaben, es sei denn, Sie haben die Option Optionen aktiviert. Dadurch wird die Groß- und Kleinschreibung des gesamten Suchbegriffs berücksichtigt.
Reguläre Ausdrücke hingegen sind standardmäßig Groß-/Kleinschreibung-sensitiv. Das bedeutet, dass eine RegEx-Suche nach "OmegaT" zum Beispiel "omegat" nicht finden wird. Allerdings bieten reguläre Ausdrücke spezielle Modifikatoren, mit denen die Groß-/Kleinschreibung-Sensitivität innerhalb des Ausdrucks umgeschaltet werden kann:
(?i)
Macht den Teil des Ausdrucks rechts vom Modifikator nicht-Groß-/Kleinschreibung-sensitiv.
(?-i)
Macht den Teil des Ausdrucks rechts vom Modifikator Groß-/Kleinschreibung-sensitiv.
Damit können Sie die Groß-/Kleinschreibung-Sensitivität bei der Suche genau einstellen. Angenommen, Sie möchten Instanzen von "OmegaT" und "omegat" finden, aber nicht von "OMEGAT". Dies können Sie mit dem folgenden Ausdruck erreichen: (?i)o
(?-i)mega
(?i)t
(ein großes oder kleines "o", gefolgt von einem kleingeschriebenen "mega", gefolgt von einem großen oder kleinen "t").
Mit regulären Ausdrücken können Sie Zeichengruppen erstellen, die als Klassen bezeichnet werden. Bei der Suche werden alle Zeichen in der Klasse berücksichtigt.
Um eine Klasse zu definieren, umschließen Sie einzelne Zeichen und/oder Zeichenbereiche mit eckigen Klammern. Zum Beispiel können Sie die Klasse [£€$]
erstellen, um eines der drei Währungssymbole im Text zu finden, oder [1-3], um die Zahlen 1, 2 oder 3 zu finden.
Innerhalb einer Klasse haben nur der umgekehrte Schrägstrich (\
), der Zirkumflex (^
), die schließende eckige Klammer (]
) und der Bindestrich (-
) eine Sonderbedeutung. Die restlichen zwölf sind normale Zeichen und müssen nicht mit einem umgekehrten Schrägstrich versehen werden, um nach diesen selbst zu suchen.
Um nach einem der vier Sonderklassenzeichen selbst zu suchen, muss ihm ein umgekehrter Schrägstrich vorangestellt werden. Sie können auch nach dem Zirkumflex, der schließenden eckigen Klammer und dem Bindestrich selbst suchen, indem Sie sie an eine Position setzen, die ihre Sonderbedeutung nicht auslöst: Im Falle des Zirkumflexes an einer beliebigen Stelle außer direkt nach der öffnenden eckigen Klammer, im Falle der schließenden eckigen Klammer direkt nach entweder der öffnenden eckigen Klammer oder dem Zirkumflex und im Falle des Bindestrichs entweder direkt nach der öffnenden eckigen Klammer oder direkt vor der schließenden eckigen Klammer.
Viele häufig verwendete Zeichengruppen haben eine Kurzschreibweise in Form eines umgekehrten Schrägstrichs gefolgt von einem Buchstaben. Zum Beispiel ist \d
die Kurzschreibweise für [0-9]
, mit der eine beliebige Ziffer zwischen 0 und 9 gefunden werden kann. In vielen Fällen wird der entsprechende Großbuchstabe verwendet, um die Klasse zu negieren: \D
findet ein beliebiges Zeichen, das
keine
Ziffer ist.
Die folgende Tabelle zeigt weitere Beispiele. Diese Klassen repräsentieren nie nur den eigentlichen Buchstaben, mit dem die Kurzschreibweise gebildet wird.
Ausdruck | Übereinstimmung |
---|---|
[abc]
|
Der Buchstabe "a", "b" oder "c". Eine einfache Klasse besteht aus beliebig vielen Zeichen, die von |
[C-X]
|
Ein Zeichen aus dem Buchstabenbereich "C" bis "X". Um einen Bereich zu definieren, geben Sie das erste Zeichen, einen Bindestrich und das letzte Zeichen an. Es können beliebig viele Bereiche definiert werden: |
[^\n\r\t]
|
Ein beliebiges Zeichen, das kein Zeilenvorschub-, Wagenrücklauf- oder Tabulatorzeichen ist. Der Zirkumflex unmittelbar nach der öffnenden eckigen Klammer bewirkt, dass ein Zeichen gefunden wird, dass keines der nachfolgenden Zeichen ist. |
\w
|
Ein Wortzeichen, allgemein definiert als
|
\s
|
Ein Leerraumzeichen wie z.B. Leer-, Tabulator- oder Zeilenumbruchzeichen.
|
\h und \v
|
Horizontales bzw. vertikales Leerraumzeichen (grundsätzlich besser als
|
Reguläre Ausdrücke sind nicht auf alphanumerische Zeichen beschränkt. Sie decken den gesamten Unicode-Zeichensatz ab. Verwenden Sie Unicode-Blöcke, -Skripte und -Kategorien, um Zeichenklassen außerhalb des alphanumerischen Zeichenbereichs anzugeben. Die folgende Tabelle enthält einige Beispiele.
Eine ausführliche Übersicht über Unicode-basierte reguläre Ausdrücke finden Sie auch unter Unicode Regular Expressions (englisch).
Ausdruck | Übereinstimmung |
---|---|
\p{InGreek}
|
Ein Zeichen im griechischen Block (Unicode-Block)
|
\p{IsHan}
|
Ein Logogramm ( Han / Kanji / Hanja -Zeichen), das in CJK-Sprachen vorkommt (Unicode-Skript) |
\p{Lu}
|
Ein Großbuchstabe (Unicode-Kategorie) |
\p{Sc}
|
Ein Währungssymbol, das ebenfalls eine Unicode-Kategorie ist. |
Einige Ausdrücke geben eher eine Position als ein Zeichen an. Sie geben an, wo im Text nach der Übereinstimmung gesucht werden soll, enthalten aber keine Zeichen in dieser Übereinstimmung. Die folgende Tabelle enthält einige der am häufigsten verwendeten Beispiele. Weitere Informationen finden Sie auf den Seiten im Abschnitt Referenzen.
Ausdruck | Übereinstimmung |
---|---|
^
|
Der Anfang einer Zeile |
$
|
Das Ende einer Zeile |
\b
|
Eine Wortgrenze |
\B
|
Keine Wortgrenze |
(?=u)
|
Ein Zeichen gefolgt von einem "u". Zum Beispiel findet |
(?!u)
|
Ein Zeichen, hinter dem kein "u" steht. Zum Beispiel findet |
(?<=q)
|
Ein Zeichen, dem der Buchstabe "q" vorangestellt ist. Zum Beispiel findet |
(?<!q)
|
Ein Zeichen, dem nicht der Buchstabe "q" vorangestellt ist. Zum Beispiel findet |
Dieser Abschnitt enthält einige Beispiele, die zeigen, wie die verschiedenen oben beschriebenen Ausdrücke kombiniert werden können, um die Suche in OmegaT zu optimieren.
Ausdruck | Zweck |
---|---|
(\b\w+\b)\h\1\b
|
Wortwiederholungen finden. |
,\h[\h(\w+\.\w+)\w,'ʼ"“”-]+[\.,]
|
Nebensätze finden, die mit einem Komma gefolgt von einem Leerzeichen beginnen, ein oder mehrere Wörter enthalten (einschließlich Wörtern in Anführungszeichen, Kompositionen und Dateinamen mit einer Dateiendung) und entweder mit einem Komma oder einem Punkt enden. |
\. \h+$
|
Überschüssige Leerräume nach dem Punkt am Ende einer Zeile finden. |
\h+a\h+[aeiou]
|
Wörter finden, die mit einem Vokal beginnen und den Artikel "a" statt "an" davor haben. |
\h+an\h+[^aeiou]
|
Die Kehrseite des vorherigen Beispiels. Wörter finden, die mit einem Konsonanten beginnen und den Artikel "an" statt "a" davor haben. |
\d{4}([/\.-]\d{1,2}){2}
|
Numerische Datumsangaben in der Reihenfolge Jahr, Monat und Tag finden, wobei Monat und Tag mit einem Schrägstrich, Punkt oder Bindestrich voneinander getrennt sind, zum Beispiel:
AnmerkungDieser Ausdruck findet Zahlen- und Trennzeichenmuster, die eventuell Datumsangaben sein könnten, prüft sie aber nicht auf Richtigkeit. Er findet auch Muster wie "5136/36/71". |
\.[A-Z]
|
Einen Punkt gefolgt von einem Großbuchstaben finden. Nützlich, um fehlende Leerzeichen zwischen dem Punkt und dem Beginn eines neuen Satzes zu finden. |
\bis\b
|
"is" als ganzes Wort in einem Satz finden, aber nicht "this", "isn't" oder sogar "Is". |
[\w\.-]+@[\w\.-]+
|
Eine E-Mail-Adresse finden. Dieser einfache Ausdruck findet vermutlich nicht alle möglichen gültigen E-Mail-Adressformate. |
Obwohl OmegaT keine ausgefallene Syntaxhervorhebung für Ihre regulären Ausdrücke bietet, können Sie durch Nutzung des Fensters Textsuche viel Übung bekommen, da OmegaT die passenden Ergebnisse einfärbt.
Im Folgenden sind einige zusätzliche Ressourcen aufgelistet.
Die Java Technical Reference ist als kanonische Referenz nützlich.
Die offizielle Referenz für reguläre Ausdrücke in Java.
Wenn Sie mehr über die Nutzung von regulären Ausdrücken erfahren möchten, könnten die beiden folgenden Seiten sehr nützlich sein.
Ein RegEx-Online-Tool, um reguläre Ausdrücke auf einem bestimmten Text zu testen.
Eines der ausführlichsten Tutorials und Referenzen zu regulären Ausdrücken, das im Internet gefunden werden kann.
OmegaT unterstützt keine der beiden Seiten in irgendeiner Weise. Wenn Sie weitere interessante Referenzen finden - egal in welcher Sprache - würde sich das OmegaT-Team freuen, davon zu hören.
Glossare sind Terminologiedateien, die im glossary-Ordner aufbewahrt werden.
Alle Begriffe in einem Segment, die in irgendeinem der Glossare übereinstimmen, werden im Glossare -Bereich angezeigt.
Quellbegriffe können aus mehreren Wörtern bestehen.
Es gibt zwei Arten von Glossardateien:
Verwenden Sie C + S + G , um neue Begriffe in dieses Glossar einzutragen. Es wird daher auch als beschreibbares Glossar bezeichnet.
Verwenden Sie , um direkt darauf zuzugreifen. Sie können es dann in einem Texteditor öffnen und ändern.
Sie müssen die Datei nicht vorab vorbereiten.
Die Datei wird automatisch erstellt, sobald Sie den ersten Glossareintrag hinzufügen.
Wenn Sie eine vorhandene Datei als Standardglossar verwenden, werden alle neuen Einträge standardmäßig im tabulatorgetrennten Format gelesen und in UTF-8 gespeichert.
Wenn Sie eine andere Kodierung angeben möchten, können Sie einen "magischen" Kommentar in folgender Form hinzufügen:
# -*- coding: <Zeichensatz> -*- , |
wobei
<Zeichensatz>
üblicherweise einer der Zeichensätze ist, die in der IANA Charset Registry aufgelistet sind.
Referenzglossare sind Terminologiedateien in einem von OmegaT erkannten Format. Im Gegensatz zum Projektglossar können solche Glossare nicht mit der Benutzeroberfläche von OmegaT geändert werden. Verwenden Sie stattdessen einen Texteditor.
Änderungen an einer beliebigen Glossardatei werden von OmegaT sofort erkannt und im Glossare -Bereich angezeigt.
Standardmäßig enthält jedes Projekt einen glossary-Ordner, in dem das beschreibbare Glossar sowie alle Referenzglossare, die Sie dem Projekt hinzufügen möchten, gespeichert werden. Einzelheiten finden Sie unter
Ordner für Glossardateien
(Projekteigenschaft).
Alle Glossare müssen sich im glossary-Ordner befinden. Glossare in Unterordnern werden ebenfalls erkannt.
Innerhalb dieses Ordners können Sie mehrere Terminologie-Unterordner erstellen, die nach Thema, Kunde oder einer beliebig anderen Kategorie geordnet sind.
Verwenden Sie die Projekteigenschaft
Ordner für Glossardateien
, um den Speicherort des Ordners für Glossardateien zu ändern. Dieser Ordner kann außerhalb des Projekts festgelegt werden, so dass Sie ihn oder einen seiner Unterordner auch in anderen Projekten verwenden können.
Das beschreibbare Projektglossar befindet sich standardmäßig im glossary-Ordner und heißt glossary.txt.
Sie können den Namen und den Speicherort im Dialogfenster
Beschreibbare Glossardatei
ändern, aber die Datei muss die Endung .txt
oder .utf8
haben und im glossary-Ordner oder in einem seiner Unterordner gespeichert sein.
OmegaT-Glossardateien sind reine Textdateien, die aus drei Spalten bestehen. Die erste Spalte enthält den Quellbegriff, die zweite Spalte einen optionalen Zielbegriff und die dritte Spalte einen optionalen Kommentar.
Glossare können TSV-Dateien (TSV = tab-separated values), CSV-Dateien (CSV = comma-separated values) oder im TermBase-eXchange-Format (TBX 2) sein.
Das von OmegaT erstellte beschreibbare Glossar ist eine TSV-Datei mit UTF-8-Kodierung. Vom Benutzer erstellte Dateien, die nur lateinische Zeichen verwenden, können als ISO-8859-1 erkannt und behandelt werden, wenn sie keine ASCII-fremden oder andere als UTF-8 interpretierte Zeichen enthalten.
Die zum Lesen von Referenzglossaren verwendete Kodierung hängt von der Dateiendung ab:
Format | Endung | Kodierung |
---|---|---|
TSV |
.txt
|
UTF-8 |
TSV |
.utf8
|
UTF-8 |
TSV |
.tab
|
Standardkodierung des Betriebssystems |
TSV |
.tsv
|
Standardkodierung des Betriebssystems |
CSV |
.csv
|
UTF-8 |
TBX |
.tbx
|
UTF-8 |
BiDi-Steuerzeichen sind über zugänglich. Diese können verwendet werden, um:
Ein unsichtbares Zeichen mit starker Direktionalität einzufügen, um eine bestimmte Position für ein Zeichen mit schwacher oder neutraler Direktionalität zu erzwingen.
Einen Textabschnitt zu erstellen, der in die entgegengesetzte Richtung des Abschnitts fließt.
Diese Steuerzeichen ändern die Richtung, sind aber unsichtbar. Mit können Sie deren Position sichtbar machen.
Um die Position eines Zeichens mit schwacher oder neutraler Direktionalität (z.B. Interpunktionszeichen) zu ändern, fügen Sie je nach der Direktionalität des Segments ein LRM- oder RLM-Zeichen nach dem Zeichen ein:
Fügen Sie eine LRM nach einem Zeichen mit schwacher Direktionalität ein, das in einem Rechts-nach-Links-Segment von links nach rechts laufen muss (z.B. ein englischer Auszug in einem arabischen Text).
Fügen Sie eine RLM nach einem Zeichen mit schwacher Direktionalität ein, das in einem Links-nach-Rechts-Segment von rechts nach links laufen muss (z.B. ein arabischer Auszug in einem englischen Text).
Einbettungen können verwendet werden, um einen längeren Textabschnitt (mit mehreren Wörtern und Leerzeichen) zu erstellen, der in die entgegengesetzte Richtung des Segments fließen muss. Sie können je nach Direktionalität des Segments zwei Arten von Einbettungen erstellen:
Um eine Links-nach-Rechts-Einbettung in einem Rechts-nach-Links-Segment zu erstellen, fügen Sie ein LRE-Zeichen (LRE = left-to-right embedding) ein, geben/fügen Sie den Links-nach-Rechts-Text ein, und fügen Sie dann das PDF-Zeichen (PDF = pop directional formatting) ein, um die Einbettung zu beenden.
Um eine Rechts-nach-Links-Einbettung in einem Links-nach-Rechts-Segment zu erstellen, fügen Sie ein RLE-Zeichen (LRE = right-to-left embedding) ein, geben/fügen Sie den Rechts-nach-Links-Text ein, und fügen Sie dann das PDF-Zeichen (PDF = pop directional formatting) ein, um die Einbettung zu beenden.
Einzelheiten zu projektspezifischen Befehlen finden Sie unter
Lokale Nachbearbeitungsbefehle
(Projekteigenschaft).
Einzelheiten zu globalen Befehlen finden Sie unter
Globale Nachbearbeitungsbefehle
(Einstellungen).
Der Befehl wird an die Java Runtime als Zeichenkette übergeben, wobei die Variablen in ihre Werte aufgelöst werden. Alle Argumente sollten in Anführungszeichen gesetzt werden, z.B. "${fileName}"
.
Die folgenden Variablen sind immer verfügbar. Die anderen Einträge in der Variablenliste sind Umgebungsvariablen Ihres Systems.
Variablenname | Wert |
---|---|
${projectName} | Der Name des Projektverzeichnisses |
${projectRoot} | Vollständiger Pfad des Projektordners |
${sourceRoot} | Vollständiger Pfad des Quellordners |
${targetRoot} | Vollständiger Pfad des Zielordners |
${glossaryRoot} | Vollständiger Pfad des Glossarordners |
${tmRoot} | Vollständiger Pfad des TM-Root-Ordners |
${tmAutoRoot} | Vollständiger Pfad des TM-Auto-Ordners |
${dictRoot} | Vollständiger Pfad des Wörterbuchordners |
${tmOtherLangRoot} | TM Root + tmx2source (Einzelheiten finden Sie unter Zwei Sprachen überbrücken.) |
${sourceLang} | Quellsprache |
${targetLang} | Zielsprache |
${filePath} | Vollständiger Pfad der Quelldatei |
${fileShortPath} | Name der Quelldatei relativ zum angegebenen Stammverzeichnis |
${fileName} | Vollständiger Name der Quelldatei |
${fileNameOnly} | Name der Quelldatei ohne Endung |
${fileExtension} | Endung der Quelldatei ohne Punkt |
Zusätzlich zu einem regulären Befehl können Sie auch ein Skript aufrufen. Führen Sie nur Nachbearbeitungsskripte aus, die aus vertrauenswürdigen Quellen stammen. Aus Sicherheitsgründen sind lokale Nachbearbeitungsbefehle standardmäßig deaktiviert.
Die Variablen können sowohl mit regulären Befehlen als auch mit benutzerdefinierten Skripten verwendet werden. Möglicherweise müssen Sie einen absoluten Pfad für Ihr Skript verwenden. Der von OmegaT verwendete PATH kann von dem des aktuellen Benutzers abweichen.
STDOUT und STDERR werden in die Datei omegat.log geschrieben. Der Exitcode und STDERR oder das letzte STDOUT werden in der Statusleiste angezeigt.
Sie sollten ein Shebang verwenden, z.B. #! /bin/bash
oder #! /usr/bin/env python3
. Das Skript muss ausführbar sein. Die Verkettung von Befehlen mit &&
oder ||
oder Pipes |
funktioniert hier nicht.
xdg-open ${targetRoot}
open ${targetRoot}
Invoke-Item ${targetRoot}
Die Benutzeroberfläche von OmegaT bietet grundsätzlich keine Schaltflächen für den Zugriff auf die Funktionen von OmegaT. Stattdessen werden die Funktionen über die Menüs oder die meisten davon über ihre zugewiesenen Tastenkürzel ausgeführt.
Es wird nicht lange dauern, bis Sie die gebräuchlichsten Tastenkürzel gelernt haben, sobald Sie mit OmegaT arbeiten. Die Tastenkürzel werden neben jedem Menüpunkt angezeigt, so dass Sie nach und nach neue Tastenkürzel lernen können, während Sie die Software verwenden.
Sie können die meisten Tastenkürzel in OmegaT individuell anpassen. Einzelheiten finden Sie im Abschnitt Anpassung.
OmegaT läuft auf jeder Plattform, auf der eine Java Runtime installiert ist (Windows, macOS und Linux sind die gängigsten). Die Modifikatortasten der Tastenkürzel unterscheiden sich leicht je nach Plattform. Um das Lesen zu erleichtern, werden wir die Modifikatortasten in dieser Dokumentation wie folgt darstellen:
Linux/Windows | Tastendarstellung | macOS |
---|---|---|
Shift | S | shift / ⇧ |
Ctrl / Control | C | command / ⌘ |
Alt | A | alt / option / ⌥ |
Ctrl | control / ⌃ |
Dank der obigen Tastendarstellungen müssen wir nicht für jedes Tastenkürzel mehrere Schreibweisen auflisten.
Unter Windows und Linux: Strg + Umschalt + N
Unter macOS: Shift + Command + N
In dieser Bedienungsanleitung: C + S + N
OmegaT weist den meisten Funktionen, die über die Menüs , und aufrufbar sind, sowie einer Reihe von Funktionen im Editor -Bereich Tastenkürzel zu. Für die meisten Funktionen können Sie auch Tastenkürzel hinzufügen oder ändern.
Um das zu tun, müssen Sie die entsprechende Tastenkürzel-Definitionsdatei in Ihrem OmegaT-Konfigurationsordner ablegen. Einzelheiten finden Sie unter Konfigurationsordner.
Es gibt zwei Tastenkürzel-Definitionsdateien.
Die Tastenkürzel-Definitionsdatei für Menüs und einige andere Menüpunkte.
Die Tastenkürzel-Definitionsdatei für den Editor.
Nach dem Ändern einer Tastenkürzel-Definitionsdatei muss OmegaT neu gestartet werden, damit die neuen Tastenkürzel wirksam werden.
Sie können die Standard-OmegaT-Dateien von der OmegaT-Entwicklungsseite auf Sourceforge in Ihren Konfigurationsordner kopieren und sie nach Belieben anpassen:
Die macOS-Dateien müssen MainMenuShortcuts.properties und EditorShortcuts.properties heißen, damit OmegaT sie erkennt.
Der folgende Abschnitt beschreibt die Syntax, die in den Tastenkürzel-Definitionsdateien verwendet wird, und enthält ein Änderungsbeispiel.
Die Grundsyntax der Tastenkürzel-Definitionsdateien ist einfach:
Funktionscode=Tastenkürzel
Verwenden Sie für Funktionscode
die Tabellen im Abschnitt Listen der Funktionen und Codes unten.
Tastenkürzel
repräsentiert die vom Benutzer gedrückte Tastenkombination. Es hat die folgende Form:
0 oder mehr Modifikator
gefolgt von 0 oder 1 Ereignis
gefolgt von 1 Taste
wobei Modifikator
folgendes sein kann: shift
, ctrl
, meta
, alt
oder altGraph
meta
bezieht sich auf die Taste mit dem Windows-Logo, die auf den meisten Tastaturen für Windows- oder Linux-Systeme zu finden ist, und auf die command
-Taste unter macOS.
altGraph
bezieht sich auf die
Alt
-Taste rechts neben der Leertaste bei Tastaturen mit zwei
Alt
-Tasten.
Ereignis
folgendes sein kann: typed
(eingegeben), pressed
(gedrückt), released
(losgelassen)
und Taste
eine beliebige Taste auf Ihrer Tastatur sein kann. In der Editor-Tastenkürzel-Tabelle finden Sie die Werte für Tasten wie Pos1
, Bild↑
oder die Pfeiltasten.
Es können Leerzeilen und Kommentare hinzugefügt werden, um die Liste zu ordnen und lesbarer zu machen. Eine Kommentarzeile beginnt mit einem #
, und alles was danach kommt, wird von der Applikation ignoriert.
Am einfachsten ändern Sie die Tastenkürzel, indem Sie die Standarddateien wie oben beschrieben herunterladen, in Ihren Konfigurationsordner kopieren und dort die gewünschten Änderungen vornehmen.
Das reguläre Tastenkürzel zum Schließen eines Projekts ist unter Windows und Linux wie folgt definiert:
projectCloseMenuItem=ctrl shift W
und in macOS als:
projectCloseMenuItem=meta shift W
Möglicherweise möchten Sie jedoch die S -Taste aus dem Tastenkürzel entfernen, um in Endeffekt Ctrl + W (bzw. Command + W unter macOS) zu haben, entsprechend dem Tastenkürzel, das Sie in anderen Applikationen verwenden.
Um das zu tun, ändern Sie die Datei MainMenuShortcuts.properties
wie folgt für Windows und Linux:
projectCloseMenuItem=ctrl W
oder wie folgt für macOS:
projectCloseMenuItem=meta W
Wenn Ihr Sprachpaar die häufige Nutzung alternativer Übersetzungen erfordert, sollten Sie dieser Funktion ein Tastenkürzel zuweisen, da sie standardmäßig keines hat.
Die folgenden Schritte zeigen, wie Sie dem Menüpunkt das Tastenkürzel Alt + X zuweisen.
Öffnen Sie die Datei MainMenuShortcuts.properties
, die Sie in Ihren Konfigurationsordner kopiert haben, in einem Texteditor.
Wie in der Bearbeiten-Menü-Tabelle unten gezeigt, hat die Funktion " " den Funktionscode editMultipleAlternate
.
Wenn Sie in der Datei nach diesem Code suchen, werden Sie die folgende Zeile finden:
# editMultipleAlternate=
Derzeit ist diese Zeile ein Kommentar. Löschen Sie das #
am Anfang der Zeile, damit OmegaT das Tastenkürzel erkennt, und fügen Sie alt X
nach dem =
-Zeichen am Ende der Zeile ein:
editMultipleAlternate=alt X
Speichern und schließen Sie die Datei. Wenn Sie OmegaT das nächste Mal starten, sollte Ihr neues Tastenkürzel aktiv sein und im Menü neben dem Namen der Funktion angezeigt werden.
Speichern Sie die Datei, nachdem Sie Ihre Änderungen vorgenommen haben. Wenn OmegaT geöffnet ist, müssen Sie es neu starten, damit Ihre Änderungen wirksam werden.
Ihre geänderten oder hinzugefügten Tastenkürzel sollten nun neben den von Ihnen geänderten Menüpunkten angezeigt werden. Sie sind nun in OmegaT verfügbar, sofern es keine Konflikte mit anderen Funktionen oder mit systemweiten Tastenkürzeln gibt.
Der nächste Abschnitt enthält Tabellen mit den Funktionscodes und den zugehörigen regulären Tastenkürzeln für jede Menü- oder Editorfunktion in OmegaT.
Die folgenden Tabellen enthalten Funktionen, die in der Datei EditorShortcuts.properties
geändert werden können, sowie deren Standardwerte.
Funktion | Funktionscode | Windows/Linux | macOS |
---|---|---|---|
Kontextmenü öffnen | editorContextMenu | CONTEXT_MENU | shift ESCAPE |
Zum nächsten Segment springen | editorNextSegment | TAB | |
Zum vorherigen Segment springen | editorPrevSegment | shift TAB | |
Zum nächsten Segment springen (nicht TAB) | editorNextSegmentNotTab | ENTER | |
Zum vorherigen Segment springen (nicht TAB) | editorPrevSegmentNotTab | ctrl ENTER | meta ENTER |
Zeilenumbruch einfügen | editorInsertLineBreak | shift ENTER | |
Alles auswählen | editorSelectAll | ctrl A | meta A |
Vorheriges Token löschen | editorDeletePrevToken | ctrl BACK_SPACE | alt BACK_SPACE |
Nächstes Token löschen | editorDeleteNextToken | ctrl DELETE | alt DELETE |
Zum ersten Segment springen | editorFirstSegment | ctrl PAGE_UP | meta PAGE_UP |
Zum letzten Segment springen | editorLastSegment | ctrl PAGE_DOWN | meta PAGE_DOWN |
Nächstes Token überspringen | editorSkipNextToken | ctrl RIGHT | alt RIGHT |
Vorheriges Token überspringen | editorSkipPrevToken | ctrl LEFT | alt LEFT |
Nächstes Token mit Markierung überspringen | editorSkipNextTokenWithSelection | ctrl shift RIGHT | alt shift RIGHT |
Vorheriges Token mit Markierung überspringen | editorSkipPrevTokenWithSelection | ctrl shift LEFT | alt shift LEFT |
Textcursormodus umschalten | editorToggleCursorLock | F2 | |
Überschreibmodus umschalten | editorToggleOvertype | INSERT | F3 |
Funktion | Funktionscode | Windows/Linux | macOS |
---|---|---|---|
Autovervollständiger öffnen | autocompleterTrigger | ctrl SPACE | ESCAPE |
Nächste Autovervollständiger-Ansicht öffnen | autocompleterNextView | ctrl SPACE | ctrl DOWN |
Vorherige Autovervollständiger-Ansicht öffnen | autocompleterPrevView | ctrl shift SPACE | ctrl UP |
Autovervollständiger bestätigen und schließen | autocompleterConfirmAndClose | ENTER | |
Autovervollständiger ohne Schließen bestätigen | autocompleterConfirmWithoutClose | INSERT | |
Autovervollständiger schließen | autocompleterClose | ESCAPE | |
Liste hochgehen | autocompleterListUp | UP | |
Liste runtergehen | autocompleterListDown | DOWN | |
Liste in größeren Schritten hochgehen | autocompleterListPageUp | PAGE_UP | |
Liste in größeren Schritten runtergehen | autocompleterListPageDown | PAGE_DOWN | |
Tabelle hochgehen | autocompleterTableUp | UP | |
Tabelle runtergehen | autocompleterTableDown | DOWN | |
Tabelle nach links gehen | autocompleterTableLeft | LEFT | |
Tabelle nach rechts gehen | autocompleterTableRight | RIGHT | |
Tabelle in größeren Schritten hochgehen | autocompleterTablePageUp | PAGE_UP | |
Tabelle in größeren Schritten runtergehen | autocompleterTablePageDown | PAGE_DOWN | |
Zur ersten Tabelle springen | autocompleterTableFirst | ctrl HOME | meta HOME |
Zur letzten Tabelle springen | autocompleterTableLast | ctrl END | meta END |
Zur ersten Tabellenzeile springen | autocompleterTableFirstInRow | HOME | |
Zur letzten Tabellenzeile springen | autocompleterTableLastInRow | END |
Der Konfigurationsordner enthält die meisten OmegaT-Optionen und -Einstellungen für den Benutzer.
Verwenden Sie , um direkt darauf zuzugreifen.
Der Speicherort des regulären Konfigurationsordners variiert je nach System (das Zeichen ~ repräsentiert den Benutzerordner):
~/.omegat
~/Library/Preferences/OmegaT
~\AppData\Roaming\OmegaT
Sie können einen benutzerdefinierten Konfigurationsordner angeben, wenn Sie OmegaT über die Befehlszeile starten. Einzelheiten finden Sie unter Start über die Befehlszeile.
Geänderte Einstellungen werden im vom Projekt verwendeten Konfigurationsordner gespeichert. Wenn Sie nicht den regulären Konfigurationsordner verwenden, werden alle Änderungen, die in den Einstellungen vorgenommen wurden, im angegebenen Konfigurationsordner gespeichert. Diese Änderungen haben keine Wirkung, wenn Sie Ihre Arbeit mit dem regulären Konfigurationsordner fortsetzen.
Diese Datei enthält eine Reihe wichtiger Benutzereinstellungen.
Einige Einstellungen haben kein Äquivalent in der Benutzeroberfläche. Diese müssen manuell geändert werden.
Um das automatische Öffnen des Projektdateien-Fensters beim Laden eines Projekts zu verhindern, suchen Sie nach <project_files_show_on_load> und ersetzen Sie true mit false:
<project_files_show_on_load>false</project_files_show_on_load>
Derzeit muss nur diese Einstellung manuell geändert werden.
Diese Datei beschreibt das gesamte OmegaT-Layout.
Dieser Ordner enthält eine Reihe von Log-Dateien. Zum Beispiel OmegaT.log
.
Diese Dateien protokollieren verschiedene interne Statusmeldungen und Programmereignisse, die während der Ausführung von OmegaT erzeugt werden. Wenn OmegaT sich fehlerhaft verhält, fügen Sie diese Datei oder den entsprechenden Teil davon Ihrem Fehlerbericht bei.
Wenn die entsprechenden Funktionen verwendet werden, kann dieser Ordner bis zu drei Textdateien enthalten:
Diese Datei enthält den aktuell markierten Text, wenn C + S + C verwendet wird. Der Text in der Datei wird jedes Mal ersetzt, wenn diese Funktion aufgerufen wird.
Diese Datei enthält den
Quelltext
des aktuellen Segments, wenn die Einstellung
Segment in eine Textdatei exportieren
aktiviert ist. Der Text in der Datei wird jedes Mal ersetzt, wenn ein neues Segment betreten wird.
Diese Datei enthält den
Zieltext
des aktuellen Segments, wenn die Einstellung
Segment in eine Textdatei exportieren
aktiviert ist. Der Text in der Datei wird jedes Mal ersetzt, wenn ein neues Segment betreten wird.
Diese drei Dateien bieten eine einfache Möglichkeit, auf einige OmegaT-Inhalte zuzugreifen und sie mit lokalen Programmen wie Shell-Skripten weiterzuverarbeiten.
Diese Parameterdatei enthält benutzerdefinierte Tastenkürzel für den Editor. Einzelheiten finden Sie unter Anpassung.
Diese Parameterdatei enthält benutzerdefinierte Tastenkürzel für die Benutzeroberfläche. Einzelheiten finden Sie unter Anpassung.
Diese Parameterdatei enthält benutzerdefinierte Dateifilter. Einzelheiten finden Sie unter Globale Dateifilter (Einstellungen).
Diese Parameterdatei enthält benutzerdefinierte Parameter für externe Suchvorgänge. Einzelheiten finden Sie unter Globale externe Suchvorgänge (Einstellungen).
Diese Parameterdatei enthält benutzerdefinierte Autotext-Parameter. Einzelheiten finden Sie unter Autovervollständigung (Einstellungen).
Diese Datei enthält die Zugangsdaten für Ihre Teamprojekt-Repositories.
Der Inhalt der Datei ist unverschlüsselt.
Einzelheiten finden Sie unter Ein Teamprojekt einrichten.
Diese Parameterdatei enthält benutzerdefinierte Segmentierungsparameter. Einzelheiten finden Sie unter Globale Segmentierungsregeln (Einstellungen).
Dieser Ordner ist der Standardspeicherort für manuell installierte OmegaT-Erweiterungs-Plugins. Einzelheiten finden Sie unter Plugins (Einstellungen).
Es ist auch möglich, Plugins in den plugins/-Ordner des Programms zu installieren.
Dieser Ordner enthält Ihre Rechtschreibwörterbücher. Einzelheiten finden Sie unter Rechtschreibprüfung (Einstellungen).
Der Applikationsordner enthält die OmegaT.jar
-Applikation und eine Reihe anderer wichtiger Dateien.
Der Speicherort des Applikationsordners hängt davon ab, welche Plattform Sie verwenden und wie Sie OmegaT installiert haben. Folgende Speicherorte werden empfohlen bzw. sind Standard:
C:\Program Files\OmegaT\
/opt/omegat/
/Applications/OmegaT.app/Contents/Java/
/opt/omegat/
Vertriebslizenz von OmegaT. GPL-Version 3.
Ausführbare Datei von OmegaT. Dient zum Starten von OmegaT über die Befehlszeile. Einzelheiten finden Sie im Kapitel Start über die Befehlszeile.
Eine Liste von Verbesserungen und Fehlerbehebungen. Schauen Sie hier nach, wenn Sie Informationen über die Entwicklung von OmegaT benötigen.
Die Distributionslizenz für die Dokumentation. GPL-Version 3.
Der Index der mehrsprachigen Bedienungsanleitung.
Ein Link zur Supportseite.
Einfache Installations- und Bedienungsanleitung.
Der Dokumentationsordner.
Die Liste der Mitwirkenden.
Jede übersetzte Bedienungsanleitung befindet sich in einem eigenen Sprachordner.
Der Index der mehrsprachigen Bedienungsanleitung.
Die Liste der von OmegaT verwendeten Bibliotheken.
Ein Ordner mit Bildern, die von OmegaT verwendet werden.
Ein Ordner mit Bibliotheken, die von OmegaT verwendet werden.
Ein Ordner, in dem externe Plugins installiert werden können. Der bevorzugte Ort für manuelle Plugin-Installationen ist der plugins/-Ordner im Konfigurationsordner. Einzelheiten finden Sie unter Plugins (Einstellungen).
Ein Ordner mit Skripten. Einzelheiten finden Sie unter Scripting (Fenster).