Dateifilter sind entweder lokal und spezifisch für ein bestimmtes Projekt, oder global und für alle Projekte verfügbar, die sich einen Konfigurationsordner teilen.
Einzelheiten finden Sie unter:
Filter in fetter Schrift werden im aktuellen Projekt verwendet.
Deaktivieren Sie einen Filter durch Entfernen des Häkchens, wenn Sie die mit ihm verknüpften Dateien nicht übersetzen möchten. Der Inhalt dieser Dateien wird bei der Übersetzung nicht angezeigt.
Sie können die Filter nach Namen oder aktiviertem Zustand sortieren. Klicken Sie auf die entsprechende Spaltenüberschrift, um diese in aufsteigender oder absteigender Reihenfolge zu sortieren.
Um die Dateiendungen, Zieldateinamen und Kodierungen eines Filters zu ändern, wählen Sie ihn in der Liste aus und klicken Sie auf die Schaltfläche
.Einige Filter lassen sich mit der Schaltfläche
weiter anpassen.Klicken Sie auf die Schaltfläche
, um die Dateifilter auf ihre Standardeinstellungen zurückzusetzen.Geänderte globale Dateifiltereinstellungen werden in filters.xml im Konfigurationsordner gespeichert. Einzelheiten finden Sie unter Konfigurationsordner. Löscht man diese Datei, werden auch die Filtereinstellungen zurückgesetzt.
Geänderte lokale Dateifiltereinstellungen werden in die filters.xml-Datei im Projektordner gespeichert. Einzelheiten finden Sie unter Projektordner. Löscht man diese Datei, werden auch die Filtereinstellungen zurückgesetzt und das Projekt wird wieder auf globale Dateifilter umgestellt.
Führende und nachfolgende Tags werden von OmegaT in der Regel benötigt, um das übersetzte Segment korrekt wiederzugeben. Die Tags im übersetzbaren Inhalt zu verstecken, stellt sicher, dass Sie sie nicht versehentlich löschen oder verändern.
Wenn Sie die führenden und nachfolgenden Tags nicht verstecken, müssen Sie darauf achten, die Tags auch in den übersetzten Text einzufügen.
Standardmäßig entfernt OmegaT alle führenden und nachfolgenden Leerzeichen aus den übersetzbaren Inhalten. Wenn ein Projekt nicht segmentiert ist, bewirkt die Deaktivierung dieser Option, dass führende und nachfolgende Leerräume in der Übersetzung geändert werden können.
Wenn die Quelldokumente Leerräume zur Gestaltung des Layouts enthalten, werden die Leerräume im übersetzten Dokument beibehalten.
Der Name der Quelldatei ist eines der Elemente, die eine alternative Übersetzung kennzeichnen. Wenn diese Option aktiviert ist, werden nur die vorherigen/nächsten Segmente oder ein Segmentidentifikator verwendet, um eine alternative Übersetzung zu kennzeichnen.
Segmente, die dieselben Merkmale aufweisen und sich in anderen Dateien befinden, werden so auf dieselbe Weise übersetzt.
Doppelklicken Sie auf die editierbaren Felder, um einfache Änderungen vorzunehmen, oder klicken Sie auf die Schaltfläche
, um das Bearbeitungsdialogfenster aufzurufen.Wenn Sie ein Filtermuster hinzufügen wollen, klicken Sie auf
, um ein ähnliches Dialogfenster zu öffnen.Beide Dialogfenster bieten Ihnen die Möglichkeit, die Namensmuster für die Quell- und Zieldateien, die mit diesem Filter verbunden sind, anzupassen und ihre jeweilige Kodierung auszuwählen.
Verwenden Sie das Aufklappmenü Dateinamenvariablen, um den Zieldateinamen anzupassen.
Um einen Filter mit einer Datei zu verknüpfen, überprüft OmegaT die Dateiendung und versucht, sie mit einem Quelldateinamensmuster in einem Filter abzugleichen.
Zum Beispiel findet das im XHTML-Filter registrierte Muster .xhtml
jede Datei mit der Endung xhtml
. Wenn eine solche Datei im Ordner source gefunden wird, wird sie vom XHTML-Filter erfasst und bearbeitet.
Sie können Dateinamensmuster ändern oder hinzufügen, um verschiedene Dateien mit einem Filter zu verknüpfen.
Die Verknüpfung einer Dateiendung mit einem Filter ist kein Garant dafür, dass der Filter die Datei ordnungsgemäß erfasst und bearbeitet. Die Dateistruktur muss ebenfalls mit dem Filter kompatibel sein: Selbst wenn Sie .odt
mit dem XHMTL-Filter verknüpfen, kann der Filter den Inhalt einer LibreOffice Writer-Datei nicht verstehen.
Quelldateinamensmuster verwenden Platzhalterzeichen: Das *
-Zeichen findet null oder mehr Zeichen, während das ?
-Zeichen genau ein Zeichen findet.
Zum Beispiel können Sie das Muster read*
verwenden, um den Textfilter Readme-Dateien (readme, read.me
oder readme.txt
) erfassen und bearbeiten zu lassen.
Die meisten Dateiformate lassen verschiedene Kodierungen zu. Standardmäßig sind die Kodierung der Quelldatei und die Kodierung der übersetzten Dateien identisch.
Die Felder bei der Quell- und Zielkodierung sind Aufklappmenüs, die alle unterstützten Kodierungen auflisten. Die Auswahloption <auto> überlässt OmegaT die Wahl der Kodierung, basierend auf folgenden Kriterien:
OmegaT verwendet die Kodierungsdeklaration in der Quelldatei, falls vorhanden, um die Kodierung zu bestimmen (HTML- oder XML-basierte Dateien).
OmegaT erzwingt für einige Dateiformate (z. B. Java-Eigenschaften) eine bestimmte Kodierung.
Für Textdateien verwendet OmegaT die Standardkodierung des Betriebssystems.
Dateien im Ordner target werden bei jeder Erstellung überschrieben, wenn sie mit demselben Namen erstellt wurden.
OmegaT kann automatisch neue Namen für Dateien vergeben, die Sie erstellen, indem es z. B. einen Sprachcode oder einen Zeitstempel hinzufügt.
Das Zieldateinamensmuster verwendet eine spezielle Syntax. Mit dem Dialogfenster Muster bearbeiten kann es auf einfache Weise geändert werden. Das Dialogfenster bietet verschiedene Optionen:
Das Standardmuster. Es repräsentiert den vollständigen Dateinamen der Quelldatei, inklusive Endung. Dieses Muster bewirkt, dass der Zieldatei der Name der Quelldatei zugewiesen wird.
Name der Quelldatei, ohne Endung
originale Dateiendung
Zielsprache+Regionscode (xx_YY)
Zielsprache+Region (xx-YY)
Code der Zielsprache (xx)
Code der Zielregion (YY)
Systemzeit, als die Datei erstellt wurde
Beispiele dafür finden Sie in der Oracle-Dokumentation.
Name des Betriebssystems
Anmeldename des Nutzers
Hostname auf dem System
Kodierung der Quelldatei
Kodierung der Zieldatei
Microsoft-Ziel-Locale
Zusätzliche Varianten sind für ${nameOnly}
und ${extension}
verfügbar.
Wenn die Nutzung mehrerer Punkte die Identifizierung des Dateinamens und der Dateiendung erschwert, können Sie Variablen in Form von ${nameOnly-Nummer}
oder ${extension-Nummer}
verwenden, um anzugeben, welche Teile zum Namen oder zur Endung gehören, wie im folgenden Beispiel gezeigt.
Handelt es sich zum Beispiel um eine Quelldatei namens Dokument.xx.docx, würde die Nutzung folgender Variablenvarianten zu folgenden Ergebnissen führen:
${nameOnly-0}
: Dokument
${nameOnly-1}
: Dokument.xx
${nameOnly-2}
: Dokument.xx.docx
${extension-0}
: docx
${extension-1}
: xx.docx
${extension-2}
: Document.xx.docx
Mehrere Filter bieten zusätzliche Optionen. Wählen Sie den Filter in der Liste aus und klicken Sie auf
, um ihn zu ändern.Die verfügbaren Optionen sind:
Textdateien haben keine generischen Absatzmarkierungen. Wählen Sie hier, wie OmegaT Absätze in Ihren Textdateien erzeugt.
spezifiziert die maximale Anzahl von Zeichen, bevor eine lange Zeile umgebrochen wird. 0 bedeutet unlimitiert.
spezifiziert die maximale Anzahl von Zeichen, bevor eine Zeile abgeschnitten und der Rest ignoriert wird. 0 bedeutet unlimitiert.
Der Filter Microsoft Office Open XML (Legacy-Filter)
ist der originale OmegaT-Filter. Sie sollten ihn nur verwenden, um Kompatibilitätsprobleme mit früheren Projekten zu verhindern, die bereits Dateien enthalten, welche Sie mit diesem Filter bearbeitet haben.
Sie können zusätzliche Dokumentelemente für die Übersetzung auswählen. Die Elemente werden im Editor als separate Segmente angezeigt.
Unsichtbare Anweisungstexte, Kommentare, Fußnoten, Endnoten, Fußzeilen, Reservetext für Kompatibilität, und Dokumenteigenschaften.
Kommentare und Blattnamen.
Folienkommentare, Folienmasters und Folienlayouts.
Externe Links, Grafiken, Diagramme, Zeichnungen und WordArt.
Tags, die keinen übersetzbaren Text umschließen, werden zu einem einzigen Tag zusammengefasst.
Leerräume (Leerzeichen, Zeilenumbrüche usw.) werden beibehalten, selbst wenn diese Option im Dokument nicht definiert ist.
Aktivieren Sie diese Option, wenn weiche Zeilenumbrüche zum Starten neuer Absätze gedacht sind.
Die ausgewählten Attribute werden als übersetzbare Segmente im Editor-Bereich angezeigt.
Das HTML-Tag <br> wird als Absatzumbruch für die Segmentierung verwendet.
Beim Laden werden alle Absätze, die dem regulären Ausdruck entsprechen, ignoriert und nicht zum Übersetzen angeboten.
Diese Option ist praktisch, wenn Sie mit HTML-Abschnitten arbeiten, die unübersetzbare Texte enthalten.
Definieren Sie <meta>-Tag-Attributwerte, für die das zugehörige "content"-Attribut nicht übersetzt werden soll.
Fügen Sie keine Anführungszeichen hinzu und trennen Sie die Werte mit einem Komma.
Um den folgenden Content zu ignorieren:
<meta name="robots" content="index,
follow">
können Sie Folgendes nutzen:
name=robots
Definieren Sie die Attributwerte, die ein Tag unübersetzbar machen sollen.
Fügen Sie keine Anführungszeichen hinzu und trennen Sie die Werte mit einem Komma.
Um den folgenden Content zu ignorieren:
<span translate="no">Dieser Content ist nicht übersetzbar</span>
können Sie Folgendes nutzen: translate=no
.
Alle Tags, die mit translate="no"
gekennzeichnet sind, werden ignoriert.
Hier werden nur die Optionen beschrieben, die beim XHTML-Dateien-Filter (siehe oben) nicht verfügbar sind.
Die Kodierung eines HTML-Dokuments wird in der Regel in einem <meta>-Element angegeben, das sich im <head>-Element befindet.
Quell- und Zieldateien benötigen manchmal eine unterschiedliche Kodierung.
Hier können Sie einstellen, ob die Deklaration der Zieldatei hinzugefügt oder geändert werden soll
immer, basierend auf den Einstellungen des Dateifilters,
nur wenn die Datei bereits einen <head>-Tag hat,
nur wenn die Datei bereits eine Deklaration hat,
oder nie und die Zieldatei nur mit der Kodierung speichern, die in den Einstellungen des Dateifilters angegeben ist.
Leerräume außerhalb der Tags werden in HTML/XHTML als unbedeutend angesehen.
Diese Option wandelt mehrere zusammenhängende Leerraumzeichen im übersetzten Dokument in ein einzelnes Leerzeichen um.
Kommentare in einer HTML-Datei sind in der Regel nur für Entwickler interessant. Verwenden Sie diese Option, um die Kommentare zu entfernen. Wenn diese Option deaktiviert ist, werden die Kommentare als Tags angezeigt.
Texte in den HTML-Kommentaren (zwischen <!--
und -->
) werden nicht in das übersetzte Dokument kopiert.
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Der Filter überprüft standardmäßig printf-Variablen (z. B. %s). Siehe die Variablen der printf-Funktion überprüfen
-Einstellung für weitere Informationen.
OmegaT fügt immer den Quelltext eines Segments in die Zieldatei ein, wenn kein Zieltext angegeben ist. Verwenden Sie diese Option, um ein unübersetztes Segment leer zu lassen.
Leere Quelltexte dienen manchmal als Platzhalter für Abschnitte, die es in der Quellsprache nicht gibt, die aber in der Zielsprache notwendig sind. Verwenden Sie diese Option, um eine Übersetzung auf Basis der zugehörigen Kommentare zu erstellen.
Der PO-Header wird bei der Übersetzung nicht angezeigt.
Überschreiben Sie die Pluralspezifikation im Header und verwenden Sie den Zielsprachenstandard.
PO-Dateien, die msgid
als Quellcontainer verwenden und erwarten, dass die Übersetzung in msgstr
abgelegt wird
PO-Dateien, die msgid
als ID-Code nutzen, verwenden msgstr
als Quellcontainer und erwarten, dass die Übersetzung msgstr
überschreibt
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Der Filter überprüft standardmäßig Java-MessageFormat-Muster (z. B. \{0\}). Siehe die Variablen der printf-Funktion überprüfen
-Einstellung für weitere Informationen.
Java 8 benötigt die ISO-8859-1-Kodierung und verwendet Unicode-Literale für Zeichen außerhalb dieses Zeichensatzes. Java 9 und höher benötigt die UTF-8-Kodierung. Diese Option erzwingt die Kompatibilität mit Java 8.
Unübersetzte Inhalte in den übersetzten Dateien können zu Kompatibilitätsproblemen führen.
Einige Applikationen erfordern die Beibehaltung einiger Unicode-Literale. Diese Option ermöglicht das.
Indexeinträge, Lesezeichen, Lesezeichenreferenzen, Notizen, Kommentare, Präsentationsnotizen, Links (URL) und Blattnamen.
Dieser Filter ist der originale XLIFF-Filter von OmegaT. Sie sollten ihn nur verwenden, um Kompatibilitätsprobleme mit früheren Projekten zu verhindern, die bereits Dateien enthalten, welche Sie mit diesem Filter bearbeitet haben.
Aktivieren Sie diese Option, wenn Sie mit XLIFF-Dateien arbeiten müssen, die mit OmegaT 2.6 erstellt wurden.
Der Nutzer kann zwischen drei Optionen wählen: vorheriger und nächster Absatz, <trans-unit>-ID, oder <trans-unit>-resname-Attribut, sofern verfügbar (ist es nicht verfügbar, wird die ID als Fallback verwendet).
Diese Option bestimmt, wie OmegaT die Tags aus den XLIFF-Inhalten erzeugt.
Wenn diese Option aktiviert ist, ändert OmegaT den XLIFF-Zielstatus auf "needs-review-translation" anstelle von "translated".
Translation-Memory-Tools arbeiten mit Texteinheiten, die als Segmente bezeichnet werden. Nachdem eine Übersetzung eingegeben wurde, wird das Segment, das den Quelltext enthält, zusammen mit seiner Übersetzung in den Translation Memory des Projekts gespeichert und anschließend mit anderen Quelltexten im Projekt abgeglichen.
Verwenden Sie die Projekteigenschaft Segmentierung auf Satzebene
, um die Art der Segmentierung auszuwählen.
Segmente sind standardmäßig Absätze, die vom Dateiformat selbst vorgegeben werden.
Der Verzicht auf die Satzsegmentierung in einem Dokument führt dazu, dass automatisch die Absatzsegmentierung verwendet wird. In diesem Fall wird jeder Absatz (wie vom Format des Originaldokuments vorgegeben) als ein einzelnes Segment angezeigt, wodurch es dem Übersetzer freisteht, die Sätze innerhalb des Segments nach Belieben neu anzuordnen.
Absatzsegmentierung funktioniert gut bei eher literarischen oder kreativen Texten sowie generell bei Dokumenten, bei denen Translation-Memory-Matches nicht so wichtig sind.
Satzsegmentierung stützt sich auf eine Reihe von Regeln (sogenannte Segmentierungsregeln), die definieren, was einen Satz in der Quellsprache ausmacht. Diese Einstellung eignet sich gut für Dokumente, in denen Wiederholungen oder ähnliche Sätze häufig vorkommen, wie z. B. in technischen oder juristischen Dokumenten.
OmegaT segmentiert den Text zunächst auf Absatzebene. Dieser Vorgang verlässt sich nur auf die Struktur der Quelldatei, um Segmente zu erzeugen.
Textdateien können zum Beispiel an Zeilenumbrüchen, Leerzeilen oder überhaupt nicht segmentiert werden. Dateien, die Formatierungen enthalten (ODF-, HTML- oder andere Dokumente), werden bei Block-Elementen (Paragraph-Tags) geteilt. Übersetzbare Objektattribute in XHTML- oder HTML-Dateien können als separate "Absätze" extrahiert werden.
Nach der Unterteilung der Quelldatei in Struktureinheiten teilt OmegaT diese Einheiten weiter in Segmente auf.
Sie können sich die Segmentierung auch so vorstellen, dass der Textcursor zeichenweise entlang des Textes bewegt wird und nach der Stelle gesucht wird, an der ein Umbruch erfolgen oder nicht erfolgen soll.
Jedes Mal, wenn sich der Textcursor zum nächsten Zeichen bewegt, prüft OmegaT, ob:
der Text vor der Stelle einer Davor-Regel entspricht,
und der Text nach der Stelle der zugehörigen Danach-Regel entspricht.
Wenn die Stelle beide Regeln erfüllt, wird der Text an dieser Stelle je nach Regeltyp geteilt oder nicht geteilt.
Die gleichen Mechanismen und Dialogfenster werden verwendet, um globale und lokale Segmentierungsregeln zu definieren.
Standardmäßig sind Segmentierungseinstellungen global und werden für alle Projekte verwendet.
Verwenden Sie die Projekteigenschaft , um den Geltungsbereich der Segmentierungsregeln auf das aktuelle Projekt zu beschränken.
Sie können dasselbe erreichen, wenn Sie OmegaT über die Befehlszeile starten. Einzelheiten finden Sie unter Start über die Befehlszeile.
Wenn Sie lokale Regeln verwenden, können Sie zwar immer noch auf die globalen Regeln zugreifen, aber diese zu ändern, wirkt sich nicht auf Ihr Projekt aus.
OmegaT bietet vordefinierte Segmentierungsregeln, die der Übersetzer mit regulären Ausdrücken ändern kann. Einzelheiten finden Sie unter Reguläre Ausdrücke.
Zur Erinnerung: Regeln funktionieren wie folgt: Wenn eine Regel zutrifft, setzt OmegaT eine Markierung an die entsprechende Stelle, so dass nachfolgende Regeln diese Stelle ignorieren. Das ist der Grund, warum Ausnahmeregeln vor Segmentierungsregeln erfolgen müssen.
Wenn Sie die Segmentierung während einer laufenden Übersetzung ändern, müssen Sie das Projekt neu laden, damit die neue Segmentierung wirksam wird. Dabei werden einige zuvor übersetzte Segmente geteilt oder zusammengeführt, so dass sie nicht mehr als übersetzt gelten. Die Originalübersetzung bleibt jedoch im Translation Memory des Projekts erhalten.
Kategorie | Absicht | Davor | Danach | Erklärung |
---|---|---|---|---|
Ausnahmeregel, Häkchen nicht gesetzt, weiter oben in der Liste | Nicht segmentieren nach Ms. | Ms\. | \s | Ms, gefolgt von einem Punkt, gefolgt von einem Leerraum. |
Ausnahmeregel, Häkchen nicht gesetzt, weiter oben in der Liste | Excel-Zellen mit Zeilenumbrüchen, die keine Segmente repräsentieren | \n | . | Zeilenumbruch, gefolgt von irgendetwas. |
Umbruchregel, Häkchen gesetzt, weiter unten in der Liste | Ein neues Segment nach einem Punkt, gefolgt von einem Leer-, Tabulator- oder sonstigem Leerraumzeichen, beginnen. | \. | \s | Ein Punkt, gefolgt von einem Leerraum |
Umbruchregel, Häkchen gesetzt, weiter unten in der Liste | Ein neues Segment nach "。" (japanischer Punkt) beginnen. | 。 | Beachten Sie, dass das Feld Muster danach leer sein kann. |
Diese Seite richtet sich an Nutzer, die ihre Produktivität erheblich steigern möchten. Obwohl reguläre Ausdrücke (oft mit regex oder regexp abgekürzt) als abschreckend und komplex angesehen werden, sind die einfachsten unter ihnen äußerst nützlich - sowohl in OmegaT als auch in vielen anderen Applikationen, die Sie tagtäglich verwenden, mit einigen Variationen.
Es werden nur die Grundlagen behandelt, die für Übersetzer am nützlichsten sind. Der Abschnitt Referenzen am Ende dieser Seite bietet einige Anregungen für fortgeschrittene oder komplexe Anwendungsfälle, die über den Rahmen dieser Dokumentation hinausgehen. Wenn Sie Hilfe benötigen, können Sie Ihre Fragen auch in den verschiedenen Support-Kanälen stellen.
Reguläre Ausdrücke verwenden eine Kombination aus Buchstaben, Ziffern und Symbolen (zusammenfassend als Zeichen bezeichnet), um einen Ausdruck zu definieren, der ein bestimmtes Textmuster repräsentiert.
Hier einige Beispiele.
Eine beliebige Ziffer von 0 bis 9.
Repräsentiert ein oder mehr "Wortzeichen" (Buchstaben, Ziffern und der Unterstrich).
Repräsentiert ein optionales horizontales Leerraumzeichen (dazu zählen reguläre und geschützte Leerzeichen sowie Tabulatorzeichen, aber keine Zeilenumbruchzeichen, die zur Kategorie "vertikaler Leerraum" gehören: \v.)
Viele OmegaT-Funktionen verwenden reguläre Ausdrücke oder stellen sie als Option zur Verfügung:
Die Suche in OmegaT bietet die Option Reguläre Ausdrücke, mit der Sie Ihre Dateien mit hoher Effizienz durchsuchen können.
Das Dialogfenster Textersetzung besitzt dieselbe Option, mit der Sie reguläre Ausdrücke sowohl auf den gesuchten als auch auf den ersetzten Text anwenden können.
Benutzerdefinierte Tags sind regex-definierte Tags, die von OmegaT wie normale Tags behandelt werden. Siehe die Benutzerdefinierte Tags
-Einstellung für weitere Informationen.
Verwenden Sie das |
-Zeichen (OR), um mehrere Tags voneinander zu trennen.
Die Geschützter Text
-Einstellung ermöglicht es Ihnen, Zeichenketten zu definieren, die OmegaT standardmäßig rot markiert und zu Validierungszwecken als überschüssige Tags behandelt.
Verwenden Sie das |
-Zeichen (OR), um mehrere Textfragmente voneinander zu trennen.
Mithilfe von visuellen Indikatoren können Sie überprüfen, ob Ihre Ausrichtung korrekt ist. Mit der Hervorheben-Einstellung können Sie Zeichenketten festlegen, die OmegaT in den ausgerichteten Dokumenten hervorheben soll.
Verwenden Sie das |
-Zeichen (OR), um mehrere Ausdrücke voneinander zu trennen.
Segmentierungsregeln und Sprachmuster werden mit regulären Ausdrücken definiert. Sie können diese nach Belieben ändern, um die Segmentierung eines Dokuments zu verbessern oder zusätzliche Grundregeln hinzuzufügen. Einzelheiten finden Sie unter Segmentierung.
Segmentierungs- oder Ausnahmeregeln definieren die Position in einem Segment, an der eine Trennung erfolgen oder nicht erfolgen soll. Um diese Position zu definieren, sind zwei reguläre Ausdrücke erforderlich: ein "davor"-Ausdruck, um das Textmuster vor der Position zu definieren, auf die die Regel angewendet werden soll, und ein "danach"-Ausdruck, um das Textmuster nach dieser Position zu definieren.
Jedes Sprachmuster, das mit der Quellsprache des Projekts übereinstimmt, wird auf dieses Projekt angewendet.
Reguläre Ausdrücke werden verwendet, um Texte zu finden, einschließlich Zeichen, die auf dem Bildschirm oder beim Ausdruck nicht sichtbar sind, wie z. B. Leerzeichen, Tabulatorzeichen oder Zeilenumbrüche. Jeder Ausdruck ist so beschaffen, dass er entweder mit einem Wort, einem Satz oder einer anderen Zeichenkette übereinstimmt oder nicht übereinstimmt.
Jedes einzelne Zeichen des Ausdrucks ist für die Ermittlung einer Übereinstimmung relevant.
Eine Vielzahl von Zeichen oder Zeichenkombinationen haben eine besondere Bedeutung in regulären Ausdrücken.
Reguläre Ausdrücke finden nur Text. Sie können keine Schriftauszeichnungen wie fett, kursiv oder andere stilistische Effekte finden.
Es gibt vier Regeln, die zu beachten sind.
Die meisten Zeichen in einem regulären Ausdruck suchen sich einfach selbst in der Zeichenkette.
Die acht Buchstaben des Wortes "Beispiel" bewirken zum Beispiel, dass die Suchfunktion genau diese Buchstaben in dieser Reihenfolge finden soll. Es wird einfach nach dem Wort "Beispiel" gesucht.
\
) davor haben eine besondere BedeutungIm Gegensatz zu einem einzelnen Buchstaben, der wie oben erwähnt einfach nur sich selbst repräsentiert, hat ein Buchstabe, dem ein \
vorangestellt ist, eine spezielle Funktion in einem regulären Ausdruck.
r ist zum Beispiel ein normales Zeichen, aber wenn ein \
vorangestellt wird, um es zu einem \r
zu machen, wird daraus eine spezielle Kombination, die ein Wagenrücklaufzeichen (CR) findet. \R
hingegen findet ein beliebiges Zeilenumbruchzeichen.
Nur die Buchstaben i j l m o und y, egal ob groß- oder kleingeschrieben, haben keine besondere Bedeutung, wenn ihnen ein umgekehrter Schrägstrich vorangestellt wird. Diese Dokumentation behandelt nur einen kleinen Teil der Buchstaben, die eine besondere Bedeutung haben.
Informieren Sie sich auf den Seiten im Abschnitt Referenzen über Kombinationen, die hier nicht aufgeführt sind.
Diese besondere Bedeutung muss durch ein anderes Zeichen aufgehoben werden, um das Zeichen selbst zu finden.
Die vollständige Liste der Zeichen finden Sie unten. Ein Beispiel ist .
: Alleinstehend hat es die besondere Bedeutung, ein beliebiges Zeichen zu finden.
Um einen normalen Punkt zu finden, muss diese Bedeutung mithilfe von \
aufgehoben werden, wodurch der Ausdruck \.
entsteht.
\
-Zeichen ist etwas ganz BesonderesWie bereits erwähnt, hat das \
-Zeichen standardmäßig die besondere Bedeutung, die besondere Bedeutung der anderen Zeichen entweder aufzuheben oder zu aktivieren. Es hat keine Wirkung, wenn es vor einem Zeichen ohne besondere Bedeutung steht (entweder standardmäßig oder durch Hinzufügen).
\
kann seine eigene besondere Bedeutung aufheben, indem man es verdoppelt, um \\
zu erhalten. Auf diese Wiese kann ein umgekehrter Schrägstrich gefunden werden.
Die zwölf Sonderzeichen sind der umgekehrte Schrägstrich \
, der Zirkumflex ^
, das Dollarzeichen $
, der Punkt .
, der senkrechte Strich (oder Pipe) |
, das Fragezeichen ?
, das Sternchen (oder Asterisk) *
, das Pluszeichen +
, die öffnende runde Klammer (
, die schließende runde Klammer )
, die öffnende eckige Klammer [
, und die öffnende geschweifte Klammer {
.
Nachfolgend wird jedes Zeichen kurz beschrieben, mit entsprechenden RegEx-Beispielen und was damit gefunden oder nicht gefunden wird.
\
Dieses Zeichen hebt die besondere Bedeutung des nächsten Zeichens entweder auf oder aktiviert sie.
0\.[0-9] | |
Findet |
Eine Zahl zwischen 0.0 und 0.9, oder eine Zahl, die mit 0.5 endet, wie z. B. 10.5 oder 560.5.
|
Findet nicht |
Sequenzen wie 0,1, 0-3 oder die ersten drei Zeichen von 0x002E, die übereinstimmen würden, wenn der Ausdruck nur |
^
Wird er als erstes Zeichen in einem Ausdruck verwendet, findet der Zirkumflex den Anfang einer Zeile.
Wird er als erstes Zeichen in einer mit eckigen Klammern umschlossenen Zeichenklasse verwendet, werden alle Zeichen gefunden, die nicht zu dieser Klasse gehören.
| |
Findet |
|
Findet nicht |
|
$
Wird es als erstes Zeichen in einem Ausdruck verwendet, findet das Dollarzeichen das Ende einer Zeile.
^\w+:$ | |
Findet |
Eine Zeile, die aus einem einzigen Wort besteht und mit einem Doppelpunkt endet: Fragen: |
Findet nicht |
Eine Zeile, die aus einem einzigen Wort besteht, aber nicht mit einem Doppelpunkt endet: Fragen? |
.
Findet ein beliebiges Zeichen.
c.t | ||||
Findet |
Beliebige Kombinationen aus drei Buchstaben, die mit "c" beginnen und mit "t" enden: "cat", "cut", "cot", oder auch absurde Kombinationen wie "czt" oder "cqt". | |||
Findet nicht |
Kombinationen aus drei Buchstaben, die mit "c" beginnen und mit "t" enden, aber auf mehr als eine Zeile verteilt sind. Welcher Buchstabe fehlt?
|
|
Dieses Zeichen fungiert als "ODER" und findet entweder den vorangehenden oder den nachfolgenden Ausdruck.
^An|^The | |||
Findet |
Das einleitende "An" oder "The" in Sätzen wie:
| ||
Findet nicht |
Das einleitende "An" oder "The" in Sätzen wie:
|
?
Dieses Zeichen bewirkt, dass entweder keine oder eine Instanz des vorangehenden Zeichens oder Ausdrucks gefunden wird.
an?␣ (wobei "␣" ein einzelnes Leerzeichen repräsentiert). | |||
Findet |
Das "a" oder das "an" in:
Es findet auch das letzte "an " von "Can " in einem Satz wie "Can I help you?" oder das letzte "a " von "pasta " in "We had pasta for lunch." | ||
Findet nicht |
Das "a" noch das "an" in:
Sie haben kein Leerzeichen dahinter. |
*
Dieses Zeichen bewirkt, dass entweder keine oder mehrere Instanzen des vorangehenden Zeichens oder Ausdrucks gefunden werden.
run\w* | |
Findet |
Das Wort "run" sowie auch "runs", "runner", "runway", "runt" in "grunt" oder "brunt" und jede andere Zeichenkette, die "run" enthält, gefolgt von null oder mehr "Wortzeichen" (zu denen auch Ziffern und der Unterstrich gehören, so dass der Teil vor dem "@" in einer E-Mail-Adresse wie run_123@example.email.org ebenfalls gefunden werden kann). |
Findet nicht |
Den vollständigen Satz in "run-on" oder "run'n'gun", weil der Bindestrich und Apostroph nicht in |
+
Dieses Zeichen bewirkt, dass entweder eine oder mehrere Instanzen des vorangehenden Zeichens oder Ausdrucks gefunden werden.
\d+.d | |
Findet |
Zahlen wie "1.5", "23.2" oder "5235.8" mit einer Dezimalstelle und einer beliebigen Anzahl von Ziffern vor dem Dezimalpunkt. |
Findet nicht |
Den gesamten Wert von Zahlen wie "5,235.8" oder "21,571.9". Es wird nur der Teil nach dem Tausendertrennzeichen gefunden. |
(
Dieses Zeichen leitet eine Gruppe ein; also eine Gruppe von Zeichen, die als eine Einheit behandelt werden. Die Gruppen sind nummeriert, und ihr Inhalt wird im Speicher abgelegt. Sie können später im Suchausdruck mit \
wiederverwendet werden, wobei n
n
die Nummer der Gruppe ist.
Der Inhalt der Gruppe kann auch im Ersetzungstext verwendet werden. Verwenden Sie $
, wobei n
n
die Nummer der Gruppe ist, die in der Suche definiert wurde.
Öffnende und schließende runde Klammern werden immer paarweise verwendet. Der Versuch, eine runde Klammer ohne ihr Gegenstück zu benutzen, löst einen Fehler aus.
(\b\w+\b)\h\1\b | |
Findet |
Doppelte Wörter, die mit einem Leerzeichen voneinander getrennt sind, wie z. B. das doppelte "an" im folgenden Satz: “I bought an an apple.” |
Findet nicht |
Das "that, that" im folgenden Satz: “But that, that is just unbelievable”, weil das erste "that" sowohl ein Komma als auch ein Leerzeichen dahinter hat, nicht nur ein Leerzeichen. |
)
Dieses Zeichen schließt eine Gruppe. Es ist besonders, weil es niemals allein verwendet werden kann. Um die schließende runde Klammer selbst zu finden, müssen Sie ihr das Zeichen \
voranstellen.
^\d+\) | ||||
Findet |
Die Ordnungszahlen (einschließlich der runden Klammern) am Anfang jeder Zeile einer Liste wie z. B.:
| |||
Findet nicht |
Ordnungszahlen, die nicht am Anfang einer Zeile stehen. Gehen Sie wie folgt vor:
|
[
Dieses Zeichen muss mit der schließenden eckigen Klammer kombiniert werden, um eine Reihe von einzelnen Zeichen zu umschließen, die jeweils eine potenzielle Übereinstimmung darstellen.
Nur die öffnende eckige Klammer ist besonders und muss mit einem umgekehrten Schrägstrich vorangestellt werden, wenn sie gefunden werden soll. Wenn Sie nur die schließende eckige Klammer finden wollen, müssen Sie ihr keinen umgekehrten Schrägstrich voranstellen. (Sie können den Schrägstrich trotzdem hinzufügen, aber er hat keine Auswirkungen auf den Ausdruck oder das Ergebnis).
li[cs]en[cs]e | |
Findet |
Die korrekte Schreibweise von "licence" und "license" sowie die möglichen Falschschreibungen von "lisence" und "lisense" |
Findet nicht |
Krassere Falschschreibungen wie "licensse" oder "lissense". |
{
Dieses Zeichen muss mit der schließenden geschweiften Klammer kombiniert werden, um eine genaue Anzahl, ein Minimum, ein Maximum oder einen Zahlenbereich zu umschließen. Diese geben an, wie viele Instanzen des vorherigen Zeichens oder der vorherigen Gruppe gefunden werden sollen.
Nur die öffnende geschweifte Klammer ist besonders und muss mit einem umgekehrten Schrägstrich vorangestellt werden, wenn sie gefunden werden soll. Wenn Sie nur die schließende geschweifte Klammer finden wollen, müssen Sie ihr keinen umgekehrten Schrägstrich voranstellen. (Sie können den Schrägstrich trotzdem hinzufügen, aber er hat keine Auswirkungen auf den Ausdruck oder das Ergebnis).
\d{4}/\d{1,3} | |
Findet |
Codes wie "1234/5", "1472/69" oder "9513/842", die aus vier Ziffern, einem Schrägstrich und 1-3 weiteren Ziffern bestehen. |
Findet nicht |
Codes wie "123/45", "1472/6985" oder "95133/15746". Warnung: Obwohl die beiden letzten Codes als Ganzes nicht gefunden werden, gibt der Ausdruck den Teil "1472/698" von "1472/6985" sowie den Teil "5133/157" von "95133/15746" zurück. |
Dieser Abschnitt enthält verschiedene Arten von regulären Ausdrücken, die von einfach bis komplex reichen.
Denken Sie daran, dass die meisten alphabetischen Zeichen, denen ein \
vorangestellt ist, zu einem Ausdruck werden, der nicht das Zeichen selbst, sondern die damit verbundene besondere Bedeutung repräsentiert.
Der einfachste reguläre Ausdruck besteht aus einem einzigen Zeichen, oder aus einem \
und einem Zeichen, die zusammen eine besondere Bedeutung haben.
Ausdruck | Übereinstimmung |
---|---|
x |
Das "x"-Zeichen selbst Die meisten Zeichen finden sich selbst. |
\t |
Das Tabulatorzeichen, nicht der Buchstabe "t". |
\n | Das Zeilenvorschubzeichen (LF), nicht der Buchstabe "n". |
\r |
Das Wagenrücklaufzeichen (CR), nicht der Buchstabe "r".
|
Die normale OmegaT-Suche ist standardmäßig nicht Groß-/Kleinschreibung-sensitiv: Sie findet sowohl Groß- als auch Kleinbuchstaben, es sei denn, Sie haben die Option Optionen aktiviert. Dadurch wird die Groß- und Kleinschreibung des gesamten Suchbegriffs berücksichtigt.
Reguläre Ausdrücke hingegen sind standardmäßig Groß-/Kleinschreibung-sensitiv. Das bedeutet, dass eine RegEx-Suche nach "OmegaT" zum Beispiel "omegat" nicht finden wird. Allerdings bieten reguläre Ausdrücke spezielle Modifikatoren, um die Groß-/Kleinschreibung-Sensitivität innerhalb des Ausdrucks umzustellen:
(?i)
Macht den Teil des Ausdrucks rechts vom Modifikator nicht-Groß-/Kleinschreibung-sensitiv.
(?-i)
Macht den Teil des Ausdrucks rechts vom Modifikator Groß-/Kleinschreibung-sensitiv.
Sie können das nutzen, um die Groß-/Kleinschreibung-Sensitivität bei der Suche präzise einzustellen. Nehmen wir zum Beispiel an, dass Sie Instanzen von "OmegaT" und "omegat" finden wollen, aber nicht "OMEGAT". Sie können das mit folgendem Ausdruck tun: (?i)o
(?-i)mega
(?i)t
(ein groß- oder kleingeschriebenes "o", gefolgt von einem kleingeschriebenen "mega", gefolgt von einem groß- oder kleingeschriebenen "t").
Reguläre Ausdrücke ermöglichen es Ihnen, Zeichensätze zu erstellen, die als Klassen bezeichnet werden. Bei der Suche werden alle Zeichen des Satzes berücksichtigt.
Um eine Klasse zu definieren, umschließen Sie einzelne Zeichen und/oder Zeichenbereiche mit eckigen Klammern. Sie können zum Beispiel die Klasse [£€$]
erstellen, um eines der drei Währungssymbole im Text zu finden, oder [1-3], um die Zahlen 1, 2 oder 3 zu finden.
Innerhalb einer Klasse haben nur der umgekehrte Schrägstrich (\
), der Zirkumflex (^
), die schließende eckige Klammer (]
) und der Bindestrich (-
) eine besondere Bedeutung. Die restlichen zwölf Zeichen sind normal und müssen nicht mit einem umgekehrten Schrägstrich versehen werden, wenn Sie nach diesen Zeichen selbst suchen möchten.
Wenn Sie eines der vier besonderen Klassenzeichen als normales Zeichen suchen möchten, setzen Sie einen umgekehrten Schrägstrich davor. Sie können auch nach dem Zirkumflex, der schließenden eckigen Klammer und dem Bindestrich selbst suchen, indem Sie sie an einer Position platzieren, die ihre besondere Bedeutung nicht auslöst: Im Falle des Zirkumflexes an einer beliebigen Stelle außer direkt nach der öffnenden eckigen Klammer, im Falle der schließenden eckigen Klammer direkt nach entweder der öffnenden eckigen Klammer oder dem Zirkumflex und im Falle des Bindestrichs entweder direkt nach der öffnenden eckigen Klammer oder direkt vor der schließenden eckigen Klammer.
Viele häufig verwendete Zeichensätze haben eine Kurzform, die aus einem umgekehrten Schrägstrich, gefolgt von einem Buchstaben, besteht. Zum Beispiel ist \d
die Kurzform für [0-9]
, womit eine beliebige Ziffer zwischen 0 und 9 gefunden werden kann. In vielen Fällen wird der entsprechende Großbuchstabe verwendet, um die Klasse zu negieren: \D
findet ein beliebiges Zeichen, das keine Ziffer ist.
Die folgende Tabelle enthält weitere Beispiele. Diese Klassen repräsentieren niemals nur den eigentlichen Buchstaben, mit dem die Kurzform gebildet wird.
Ausdruck | Übereinstimmung |
---|---|
[abc] |
Der Buchstabe "a", "b" oder "c". Eine einfache Klasse besteht aus einer beliebigen Anzahl von Zeichen, die von |
[C-X] |
Ein Zeichen im Bereich von "C" bis "X". Ein Zeichenbereich besteht aus dem ersten Zeichen einer Reihe, gefolgt von einem Bindestrich, gefolgt vom letzten Zeichen der Reihe. Es können beliebig viele Zeichenbereiche definiert werden: |
[^\n\r\t] |
Ein beliebiges Zeichen, das kein Zeilenvorschub-, Wagenrücklauf- oder Tabulatorzeichen ist. Der Zirkumflex unmittelbar nach der öffnenden eckigen Klammer exkludiert die nachfolgenden Zeichen in der Klasse. |
\w |
Ein Wortzeichen, generell definiert als
|
\s |
Ein Leerraumzeichen, wozu auch die Leer- und Tabulatorzeichen sowie Zeilenumbrüche gehören.
|
\h und \v
|
Horizontales und vertikales Leerraumzeichen (grundsätzlich gegenüber
|
Reguläre Ausdrücke sind nicht auf alphanumerische Zeichen beschränkt. Sie decken den gesamten Unicode-Zeichensatz ab. Verwenden Sie Unicode-Blöcke, -Skripte und -Kategorien, um Zeichenklassen außerhalb des alphanumerischen Zeichenbereichs anzugeben. Einige Beispiele sind in der folgenden Tabelle aufgeführt.
Eine ausführliche Übersicht über Unicode-basierte reguläre Ausdrücke finden Sie auch unter Unicode Regular Expressions (englisch).
Ausdruck | Übereinstimmung |
---|---|
\p{InGreek} |
Ein Zeichen im griechischen Block (Unicode-Block)
|
\p{IsHan} |
Ein Logogramm (Han/Kanji/Hanja-Zeichen), das in CJK-Sprachen vorkommt (Unicode-Skript) |
\p{Lu} |
Ein Großbuchstabe (Unicode-Kategorie) |
\p{Sc} |
Ein Währungssymbol, das auch eine Unicode-Kategorie ist. |
Einige Ausdrücke spezifizieren eher eine Position als ein Zeichen. Sie geben an, wo im Text nach der Übereinstimmung zu suchen ist, enthalten aber keine Zeichen in dieser Übereinstimmung. Die folgende Tabelle enthält einige der Beispiele, die häufiger verwendet werden. Informieren Sie sich auf den Seiten im Abschnitt Referenzen, um mehr zu erfahren.
Ausdruck | Übereinstimmung |
---|---|
^ |
Der Anfang einer Zeile |
$ |
Das Ende einer Zeile |
\b |
Eine Wortgrenze |
\B |
Keine Wortgrenze |
(?=u) |
Ein Zeichen gefolgt von einem "u". Zum Beispiel findet |
(?!u) |
Ein Zeichen, das nicht den Buchstaben "u" dahinter hat. Zum Beispiel findet |
(?<=q) |
Ein Zeichen, das den Buchstaben "q" davor hat. Zum Beispiel findet |
(?<!q) |
Ein Zeichen, das nicht den Buchstaben "q" davor hat. Zum Beispiel findet |
Dieser Abschnitt enthält einige Beispiele, die zeigen, wie die verschiedenen oben beschriebenen Ausdrücke kombiniert werden können, um die Suche in OmegaT zu optimieren.
Ausdruck | Zweck |
---|---|
(\b\w+\b)\h\1\b |
Wortwiederholungen finden. |
,\h[\h(\w+\.\w+)\w,'ʼ"“”-]+[\.,] |
Nebensätze finden, die mit einem Komma gefolgt von einem Leerzeichen beginnen, ein oder mehrere Wörter enthalten (einschließlich Wörter in Anführungszeichen, Verschmelzungen und Dateinamen mit einer Dateiendung) und entweder mit einem Komma oder einem Punkt enden. |
\. \h+$ |
Überschüssige Leerräume nach dem Punkt am Ende einer Zeile finden. |
\h+a\h+[aeiou] |
Wörter finden, die mit einem Vokal beginnen und den Artikel "a" statt "an" davor haben. |
\h+an\h+[^aeiou] |
Die Kehrseite des vorherigen Beispiels. Wörter finden, die mit einem Konsonanten beginnen und den Artikel "an" statt "a" davor haben. |
\d{4}([/\.-]\d{1,2}){2} |
Numerische Datumsangaben in der Reihenfolge Jahr, Monat und Tag finden, wobei Monat und Tag mit einem Schrägstrich, Punkt oder Bindestrich voneinander getrennt sind, wie z. B.:
AnmerkungDieser Ausdruck findet Zahlen- und Trennzeichenmuster, die eventuell Datumsangaben sein könnten, prüft sie aber nicht auf Richtigkeit. Er wird auch Muster wie "5136/36/71" finden. |
\.[A-Z] |
Einen Punkt gefolgt von einem Großbuchstaben finden. Nützlich, um eventuell fehlende Leerzeichen zwischen dem Punkt und dem Beginn eines neuen Satzes zu finden. |
\bis\b |
"is" als ganzes Wort in einem Satz finden, ohne "this", "isn't" oder sogar "Is" einzubeziehen. |
[\w\.-]+@[\w\.-]+ |
Eine E-Mail-Adresse finden. Dieser einfache Ausdruck findet vermutlich nicht alle möglichen gültigen E-Mail-Adressformate. |
Obwohl OmegaT keine ausgefallene Färbung für Ihre regulären Ausdrücke bereitstellt, können Sie durch Nutzung des Fensters Textsuche viel Übung bekommen, da OmegaT die passenden Ergebnisse einfärbt.
Nachfolgend sind einige zusätzliche Ressourcen aufgeführt.
Die technische Java-Referenz ist nützlich als kanonische Referenz.
Die offizielle Referenz für in Java verwendete reguläre Ausdrücke.
Wenn Sie mehr über die Nutzung regulärer Ausdrücke erfahren möchten, könnten die beiden folgenden Seiten sehr nützlich sein.
Ein RegEx-Online-Tool, das Ihnen erlaubt, den Text, der durchsucht werden soll, und die regulären Ausdrücke, die getestet werden sollen, einzutragen.
Eines der ausführlichsten Tutorials und Referenzen für reguläre Ausdrücke im Internet.
OmegaT unterstützt keine der beiden Seiten in irgendeiner Weise. Wenn Sie weitere interessante Referenzen finden - egal in welcher Sprache - würde sich das OmegaT-Team freuen, davon zu hören.
Glossare sind Terminologiedateien, die im glossary-Ordner aufbewahrt werden.
Alle Begriffe in einem Segment, die in irgendeinem der Glossare übereinstimmen, werden im Glossare-Bereich angezeigt.
Quellbegriffe können aus mehreren Wörtern bestehen.
Es gibt zwei Arten von Glossardateien:
Verwenden Sie C+S+G , um neue Begriffe in dieses Glossar einzutragen. Deshalb wird es auch als beschreibbares Glossar bezeichnet.
Verwenden Sie , um direkt darauf zuzugreifen. Sie können es dann in einem Texteditor öffnen und ändern.
Sie müssen die Datei nicht vorab vorbereiten.
Sie wird erstellt, wenn Sie das erste Mal einen Eintrag zum Glossar hinzufügen.
Wenn Sie eine vorhandene Datei als Standardglossar verwenden, werden alle neuen Einträge standardmäßig im tabulatorgetrennten Format und in UTF-8 gespeichert.
Wenn Sie eine andere Kodierung angeben möchten, können Sie einen "magischen" Kommentar hinzufügen, der die folgende Form hat:
# -*- coding: <Zeichensatz> -*- , |
wobei <Zeichensatz>
in der Regel einer der Zeichensätze ist, die in IANA Charset Registry aufgelistet sind.
Referenzglossare sind Terminologiedateien in einem von OmegaT erkannten Format. Sie können diese nicht über die Benutzeroberfläche von OmegaT ändern, wie es beim projekteigenen Glossar der Fall ist, aber Sie können stattdessen einen Texteditor verwenden.
Änderungen an einer beliebigen Glossardatei werden von OmegaT sofort erkannt und im Glossare-Bereich angezeigt.
Standardmäßig enthält jedes Projekt einen glossary-Ordner, wo das beschreibbare Glossar aufbewahrt wird, sowie alle Referenzglossare, die Sie dem Projekt hinzufügen möchten. Siehe die Projekteigenschaft Ordner für Glossardateien
für weitere Informationen.
Alle Glossare müssen sich im glossary-Ordner befinden. Glossare in Unterordnern werden ebenfalls erkannt.
Innerhalb dieses Ordners können Sie mehrere Terminologie-Unterordner erstellen, die nach Thema, Kunde oder einer anderen Kategorie passend zu Ihrem Workflow geordnet sind.
Verwenden Sie die Projekteigenschaft Ordner für Glossardateien
, um den Speicherort des Ordners für Glossardateien zu ändern. Dieser Ordner kann außerhalb des Projekts festgelegt werden, so dass Sie ihn oder einen der spezifischen Unterordner in anderen Projekten verwenden können.
Das beschreibbare Glossar des Projekts befindet sich standardmäßig im glossary-Ordner und heißt glossary.txt.
Sie können den Namen und den Speicherort im Dialogfenster Beschreibbare Glossardatei
ändern, aber Sie müssen der Datei die Endung .txt
oder .utf8
geben und sie in den glossary-Ordner oder in einen seiner Unterordner ablegen.
OmegaT-Glossardateien sind reine Textdateien, die aus drei Spalten bestehen. In der ersten Spalte steht der Quellbegriff, in der zweiten Spalte ein optionaler Zielbegriff und in der dritten Spalte ein optionaler Kommentar.
Glossare können Dateien mit tabulatorgetrennten Werten (TSV) oder kommagetrennten Werten (CSV) sein oder auch das TermBase-eXchange-Format (TBX 2) verwenden.
Ein beschreibbares Glossar, das von OmegaT für das Projekt erstellt wird, wird als UTF-8-kodierte TSV-Datei gespeichert. Benutzerdefinierte Dateien, die nur lateinische Zeichen verwenden, werden eventuell erkannt und als ISO-8859-1 behandelt, wenn sie keine ASCII-fremden Zeichen oder andere Zeichen enthalten, die als UTF-8 interpretiert werden.
Die Kodierung, die zum Lesen von Referenzglossaren verwendet wird, hängt von deren Dateiendung ab:
Format | Endung | Kodierung |
---|---|---|
TSV |
.txt
| UTF-8 |
TSV |
.utf8
| UTF-8 |
TSV |
.tab
| Standardkodierung des Betriebssystems |
TSV |
.tsv
| Standardkodierung des Betriebssystems |
CSV |
.csv
| UTF-8 |
TBX |
.tbx
| UTF-8 |
BiDi-Steuerzeichen sind über zugänglich. Diese können verwendet werden, um:
Ein unsichtbares Zeichen mit einer starken Direktionalität einzufügen, um eine bestimmte Position für ein Zeichen mit schwacher oder neutraler Direktionalität zu erzwingen.
Einen Textabschnitt zu erstellen, der in die entgegengesetzte Richtung des Abschnitts fließt.
Diese Steuerzeichen ändern die Richtung, sind aber unsichtbar. Mit können Sie deren Position sichtbar machen.
Um die Position eines Zeichens mit schwacher oder neutraler Direktionalität (z. B. Interpunktionszeichen) zu ändern, fügen Sie je nach der Direktionalität des Segments ein LRM- oder RLM-Zeichen nach dem Zeichen ein:
Fügen Sie eine LRM nach einem Zeichen mit schwacher Direktionalität ein, das von links nach rechts in einem Rechts-nach-Links-Segment verlaufen muss (z. B. ein englischer Auszug in einem arabischen Text).
Fügen Sie eine RLM nach einem Zeichen mit schwacher Direktionalität ein, das von rechts nach links in einem Links-nach-Rechts-Segment verlaufen muss (z. B. ein arabischer Auszug in einem englischen Text).
Einbettungen können verwendet werden, um einen längeren Textabschnitt (mit mehreren Wörtern und Leerzeichen) zu erstellen, der in die entgegengesetzte Richtung des Segments fließen muss. Sie können je nach Direktionalität des Segments zwei Arten von Einbettungen erstellen:
Um eine Links-nach-Rechts-Einbettung in einem Rechts-nach-Links-Segment zu erstellen, fügen Sie ein Links-nach-Rechts-Einbettungszeichen (LRE) ein, geben oder fügen Sie den Links-nach-Rechts-Text ein, und fügen Sie dann das Einbettung-beenden-Zeichen ("pop directional formatting" oder kurz PDF) ein.
Um eine Rechts-nach-Links-Einbettung in einem Links-nach-Rechts-Segment zu erstellen, fügen Sie ein Rechts-nach-Links-Einbettungszeichen (RLE) ein, geben oder fügen Sie den Rechts-nach-Links-Text ein, und fügen Sie dann das Einbettung-beenden-Zeichen ("pop directional formatting" oder kurz PDF) ein.
Siehe die Projekteigenschaft Lokale Nachbearbeitungsbefehle
für projektspezifische Befehle.
Siehe die Einstellung Globale Nachbearbeitungsbefehle
für globale Befehle.
Der Befehl wird an die Java-Laufzeitausführung als Zeichenkette übergeben, wobei die Variablen in ihre Werte aufgelöst werden. Alle Argumente sollten in Anführungszeichen gesetzt werden, z. B. "${fileName}"
.
Die folgenden Variablen sind immer verfügbar. Die anderen Einträge in der Variablenliste sind Umgebungsvariablen Ihres Systems.
Variablenname | Wert |
---|---|
${projectName} | Der Name des Projektverzeichnisses |
${projectRoot} | Vollständiger Pfad des Projektordners |
${sourceRoot} | Vollständiger Pfad des Quellordners |
${targetRoot} | Vollständiger Pfad des Zielordners |
${glossaryRoot} | Vollständiger Pfad des Glossarordners |
${tmRoot} | Vollständiger Pfad des TM-Root-Ordners |
${tmAutoRoot} | Vollständiger Pfad des TM-Auto-Ordners |
${dictRoot} | Vollständiger Pfad des Wörterbuchordners |
${tmOtherLangRoot} | TM Root + tmx2source (Einzelheiten finden Sie unter Zwei Sprachen überbrücken.) |
${sourceLang} | Quellsprache |
${targetLang} | Zielsprache |
${filePath} | Vollständiger Pfad der Quelldatei |
${fileShortPath} | Name der Quelldatei relativ zum angegebenen Stammverzeichnis |
${fileName} | Vollständiger Name der Quelldatei |
${fileNameOnly} | Name der Quelldatei ohne Endung |
${fileExtension} | Endung der Quelldatei ohne Punkt |
Zusätzlich zu einem regulären Befehl können Sie auch ein Skript aufrufen. Führen Sie nur Nachbearbeitungsskripte aus, die aus vertrauenswürdigen Quellen stammen. Aus Sicherheitsgründen sind lokale Nachbearbeitungsbefehle standardmäßig deaktiviert.
Die Variablen können sowohl mit regulären Befehlen als auch mit benutzerdefinierten Skripten verwendet werden. Möglicherweise müssen Sie einen absoluten Pfad für Ihr Skript verwenden. Der PATH, den OmegaT verwendet, ist möglicherweise nicht derselbe wie der PATH des aktuellen Benutzers.
STDOUT und STDERR werden in die omegat.log-Datei geschrieben. Der Exitcode und STDERR oder das letzte STDOUT werden in der Statusleiste angezeigt.
Sie sollten ein Shebang verwenden, z. B. #! /bin/bash
oder #! /usr/bin/env python3
. Und das Skript muss ausführbar sein. Die Verkettung von Befehlen mit &&
oder ||
oder Pipes |
wird hier nicht funktionieren.
xdg-open ${targetRoot}
open ${targetRoot}
Invoke-Item ${targetRoot}
Die Benutzeroberfläche von OmegaT verwendet in der Regel keine Schaltflächen für den Zugriff auf die Funktionen von OmegaT. Stattdessen werden sie über die Menüs oder, bei den meisten Funktionen, über ihre Tastenkürzel aufgerufen.
Es wird nicht lange dauern, bis Sie die häufig verwendeten Tastenkürzel gelernt haben, sobald Sie mit OmegaT arbeiten. Die Tastenkürzel werden neben jedem Menüpunkt angezeigt, so dass Sie nach und nach neue Tastenkürzel lernen können, während Sie die Software verwenden.
Sie können die meisten Tastenkürzel in OmegaT individuell anpassen. Einzelheiten finden Sie im Abschnitt Anpassung.
OmegaT läuft auf jeder Plattform, auf der eine Java-Laufzeitumgebung installiert ist (Windows, macOS und Linux sind die gängigsten). Die Modifikatortasten der Tastenkürzel unterscheiden sich leicht je nach Plattform. Um das Lesen zu erleichtern, werden wir die Modifikatortasten in dieser Dokumentation wie folgt darstellen:
Linux/Windows | Tastendarstellung | macOS |
---|---|---|
Umschalt | S | shift oder ⇧ |
Strg oder Ctrl | C | command oder ⌘ |
Alt | A | alt / option oder ⌥ |
Ctrl | control oder ⌃ |
Dank der oben genannten Tastendarstellungen müssen wir nicht für jedes Tastenkürzel mehrere Schreibweisen auflisten.
Bei Windows und Linux: Strg+Umschalt+N
In macOS: Shift+Command+N
In dieser Bedienungsanleitung: C+S+N
OmegaT weist den meisten Funktionen, die über die Menüs , und aufrufbar sind, sowie einer Reihe von Funktionen im Editor-Bereich Tastenkürzel zu. Sie können auch die Tastenkürzel für die meisten Funktionen hinzufügen oder ändern.
Um das zu tun, müssen Sie die entsprechende Tastenkürzel-Definitionsdatei in Ihrem OmegaT-Konfigurationsordner ablegen. Einzelheiten finden Sie unter Konfigurationsordner.
Es gibt zwei Tastenkürzel-Definitionsdateien.
Die Tastenkürzel-Definitionsdatei für Menüs und einigen anderen Menüpunkten.
Die Tastenkürzel-Definitionsdatei für den Editor.
OmegaT muss nach dem Ändern einer Tastenkürzel-Definitionsdatei neu gestartet werden, damit die neuen Tastenkürzel wirksam werden.
Sie können die Standard-OmegaT-Dateien von der OmegaT-Entwicklungsseite auf Sourceforge in Ihren Konfigurationsordner kopieren und sie nach Belieben anpassen:
Die macOS-Dateien müssen MainMenuShortcuts.properties und EditorShortcuts.properties heißen, damit OmegaT sie erkennt.
Der nächste Abschnitt beschreibt die Syntax, die in den Tastenkürzel-Definitionsdateien verwendet wird, und enthält ein Bearbeitungsbeispiel.
Die grundlegende Syntax der Tastenkürzel-Definitionsdateien ist einfach:
Funktionscode=Tastenkürzel
Verwenden Sie die Tabellen im Abschnitt Listen von Funktionen und Codes unten, um die Werte für Funktionscode
zu finden.
Tastenkürzel
repräsentiert die vom Nutzer gedrückte Tastenkombination. Es hat die folgende Form:
0 oder mehr Modifikator
gefolgt von 0 oder 1 Ereignis
gefolgt von 1 Taste
wobei Modifikator
folgendes sein kann: shift
, ctrl
, meta
, alt
oder altGraph
meta
bezieht sich bei den meisten Tastaturen für Windows- oder Linux-Systeme auf die Taste mit dem Windows-Logo und bei macOS auf die command
-Taste.
altGraph
bezieht sich auf die Alt-Taste rechts neben der Leertaste bei Tastaturen mit zwei Alt-Tasten.
Ereignis
folgendes sein kann: typed
(eingegeben), pressed
(gedrückt), released
(losgelassen)
und Taste
eine beliebige Taste auf Ihrer Tastatur sein kann. In der Editor-Tastenkürzel-Tabelle finden Sie die Werte für Tasten wie Pos1
, Bild↑
oder die Pfeiltasten.
Es können Leerzeilen und Kommentare hinzugefügt werden, um die Liste zu ordnen und besser lesbar zu machen. Eine Kommentarzeile beginnt mit einem #
; alles, was danach kommt, wird von der Applikation ignoriert.
Am einfachsten können Sie die Tastenkürzel ändern, indem Sie, wie oben erwähnt, die Standarddateien herunterladen und in Ihren Konfigurationsordner kopieren und dort die gewünschten Änderungen vornehmen.
Das reguläre Tastenkürzel zum Schließen eines Projekts ist in Windows und Linux definiert als:
projectCloseMenuItem=ctrl shift W
und in macOS als:
projectCloseMenuItem=meta shift W
Möglicherweise möchten Sie jedoch die S-Taste aus dem Tastenkürzel entfernen, so dass es nur noch Ctrl+W (bzw. Command+W unter macOS) ist, damit es dem Tastenkürzel entspricht, das Sie in anderen Applikationen verwenden.
Um das zu tun, ändern Sie die MainMenuShortcuts.properties
-Datei wie folgt für Windows und Linux:
projectCloseMenuItem=ctrl W
oder wie folgt für macOS:
projectCloseMenuItem=meta W
Wenn Ihr Sprachpaar die häufige Nutzung alternativer Übersetzungen erfordert, sollten Sie dieser Funktion ein Tastenkürzel zuweisen, da sie standardmäßig keines hat.
Die folgenden Schritte zeigen, wie Sie das Tastenkürzel Alt+X dem Menüpunkt zuweisen.
Öffnen Sie die MainMenuShortcuts.properties
-Datei, die Sie in Ihren Konfigurationsordner kopiert haben, in einem Texteditor.
Wie in der Bearbeiten-Menü-Tabelle unten gezeigt, lautet der Funktionscode für die Funktion editMultipleAlternate
.
Wenn Sie nach diesem Code in der Datei suchen, werden Sie die folgende Zeile finden:
# editMultipleAlternate=
Aktuell ist die Zeile ein Kommentar. Löschen Sie das #
am Anfang der Zeile, damit OmegaT das Tastenkürzel erkennt, und fügen Sie alt X
nach dem =
-Zeichen am Ende der Zeile ein:
editMultipleAlternate=alt X
Speichern und schließen Sie die Datei. Wenn Sie OmegaT das nächste Mal starten, sollte Ihr neues Tastenkürzel aktiv sein und neben dem Namen der Funktion im Menü angezeigt werden.
Speichern Sie die Datei, nachdem Sie Ihre Änderungen vorgenommen haben. Wenn OmegaT offen ist, müssen Sie es neu starten, damit Ihre Änderungen wirksam werden.
Ihre geänderten oder hinzugefügten Tastenkürzel sollten nun neben den von Ihnen geänderten Menüpunkten angezeigt werden. Sie stehen nun in OmegaT zur Verfügung, sofern es keine Konflikte mit anderen Funktionen oder mit systemweiten Tastenkürzeln gibt.
Der nächste Abschnitt enthält Tabellen mit den Funktionscodes und den zugehörigen regulären Tastenkürzeln für jedes Menü oder jede Editorfunktion in OmegaT.
In den folgenden Tabellen finden Sie Funktionen, die in der EditorShortcuts.properties
-Datei geändert werden können, sowie ihre Standardwerte.
Funktion | Funktionscode | Windows/Linux | macOS |
---|---|---|---|
Kontextmenü öffnen | editorContextMenu | CONTEXT_MENU | shift ESCAPE |
Zum nächsten Segment springen | editorNextSegment | TAB | |
Zum vorherigen Segment springen | editorPrevSegment | shift TAB | |
Zum nächsten Segment springen (nicht TAB) | editorNextSegmentNotTab | ENTER | |
Zum vorherigen Segment springen (nicht TAB) | editorPrevSegmentNotTab | ctrl ENTER | meta ENTER |
Zeilenumbruch einfügen | editorInsertLineBreak | shift ENTER | |
Alles auswählen | editorSelectAll | ctrl A | meta A |
Vorheriges Token löschen | editorDeletePrevToken | ctrl BACK_SPACE | alt BACK_SPACE |
Nächstes Token löschen | editorDeleteNextToken | ctrl DELETE | alt DELETE |
Zum ersten Segment springen | editorFirstSegment | ctrl PAGE_UP | meta PAGE_UP |
Zum letzten Segment springen | editorLastSegment | ctrl PAGE_DOWN | meta PAGE_DOWN |
Nächstes Token überspringen | editorSkipNextToken | ctrl RIGHT | alt RIGHT |
Vorheriges Token überspringen | editorSkipPrevToken | ctrl LEFT | alt RIGHT |
Nächstes Token mit Markierung überspringen | editorSkipNextTokenWithSelection | ctrl shift RIGHT | alt shift RIGHT |
Vorheriges Token mit Markierung überspringen | editorSkipPrevTokenWithSelection | ctrl shift LEFT | alt shift LEFT |
Textcursormodus umschalten | editorToggleCursorLock | F2 | |
Überschreibmodus umschalten | editorToggleOvertype | INSERT | F3 |
Funktion | Funktionscode | Windows/Linux | macOS |
---|---|---|---|
Autovervollständiger öffnen | autocompleterTrigger | ctrl SPACE | ESCAPE |
Nächste Autovervollständiger-Ansicht öffnen | autocompleterNextView | ctrl SPACE | ctrl DOWN |
Vorherige Autovervollständiger-Ansicht öffnen | autocompleterPrevView | ctrl shift SPACE | ctrl UP |
Autovervollständiger bestätigen und schließen | autocompleterConfirmAndClose | ENTER | |
Autovervollständiger ohne Schließen bestätigen | autocompleterConfirmWithoutClose | INSERT | |
Autovervollständiger schließen | autocompleterClose | ESCAPE | |
Liste hochgehen | autocompleterListUp | UP | |
Liste runtergehen | autocompleterListDown | DOWN | |
Liste in größeren Schritten hochgehen | autocompleterListPageUp | PAGE_UP | |
Liste in größeren Schritten runtergehen | autocompleterListPageDown | PAGE_DOWN | |
Tabelle hochgehen | autocompleterTableUp | UP | |
Tabelle runtergehen | autocompleterTableDown | DOWN | |
Tabelle nach links gehen | autocompleterTableLeft | LEFT | |
Tabelle nach rechts gehen | autocompleterTableRight | RIGHT | |
Tabelle in größeren Schritten hochgehen | autocompleterTablePageUp | PAGE_UP | |
Tabelle in größeren Schritten runtergehen | autocompleterTablePageDown | PAGE_DOWN | |
Zur ersten Tabelle springen | autocompleterTableFirst | ctrl HOME | meta HOME |
Zur letzten Tabelle springen | autocompleterTableLast | ctrl END | meta END |
Zur ersten Tabellenzeile springen | autocompleterTableFirstInRow | HOME | |
Zur letzten Tabellenzeile springen | autocompleterTableLastInRow | END |
Der Konfigurationsordner enthält den Großteil der OmegaT-Optionen und -Einstellungen für den Nutzer.
Verwenden Sie , um direkt darauf zuzugreifen.
Der Speicherort des regulären Konfigurationsordners variiert je nach System (das Zeichen ~ repräsentiert den Benutzerordner):
~/.omegat
~/Library/Preferences/OmegaT
~\AppData\Roaming\OmegaT
Sie können einen benutzerdefinierten Konfigurationsordner angeben, wenn Sie OmegaT über die Befehlszeile starten. Einzelheiten finden Sie unter Start über die Befehlszeile.
Geänderte Einstellungen werden im Konfigurationsordner gespeichert, der vom Projekt verwendet wird. Wenn Sie nicht den regulären Konfigurationsordner verwenden, werden alle Änderungen, die in den Einstellungen vorgenommen wurden, im angegebenen Konfigurationsordner gespeichert. Diese Änderungen haben keine Wirkung, wenn Sie Ihre Arbeit mit dem regulären Konfigurationsordner fortsetzen.
Diese Datei enthält eine Reihe von wichtigen Benutzereinstellungen.
Einige Einstellungen haben kein Äquivalent in der Benutzeroberfläche. Diese müssen manuell geändert werden.
Um das automatische Öffnen des Projektdateien-Fensters beim Laden eines Projekts zu verhindern, suchen Sie <project_files_show_on_load> und ersetzen Sie true mit false:
<project_files_show_on_load>false</project_files_show_on_load>
Derzeit muss nur diese Einstellung manuell geändert werden.
Diese Datei beschreibt das gesamte OmegaT-Layout.
Dieser Ordner enthält eine Reihe von Log-Dateien. Zum Beispiel OmegaT.log
.
Diese Dateien protokollieren verschiedene interne Statusmeldungen und Programmereignisse, die während der Ausführung von OmegaT erzeugt werden. Wenn OmegaT sich fehlerhaft verhält, fügen Sie diese Datei oder den entsprechenden Teil davon Ihrem Fehlerbericht bei.
Wenn die entsprechenden Funktionen verwendet werden, kann dieser Ordner bis zu drei Textdateien enthalten:
Diese Datei enthält den aktuell markierten Text, wenn C+C+S verwendet wird. Der Text in der Datei wird jedes Mal ersetzt, wenn diese Funktion aufgerufen wird.
Diese Datei enthält den Quelltext des aktuellen Segments, wenn die Einstellung Segment in eine Textdatei exportieren
aktiviert ist. Der Text in der Datei wird jedes Mal ersetzt, wenn ein neues Segment betreten wird.
Diese Datei enthält den Zieltext des aktuellen Segments, wenn die Einstellung Segment in eine Textdatei exportieren
aktiviert ist. Der Text in der Datei wird jedes Mal ersetzt, wenn ein neues Segment betreten wird.
Diese drei Dateien bieten eine einfache Möglichkeit, auf einige OmegaT-Inhalte zuzugreifen und sie mit lokalen Programmen wie Shell-Skripten weiterzuverarbeiten.
Diese Parameterdatei enthält benutzerdefinierte Tastenkürzel für den Editor. Einzelheiten finden Sie unter Anpassung.
Diese Parameterdatei enthält benutzerdefinierte Tastenkürzel für die Benutzeroberfläche. Einzelheiten finden Sie unter Anpassung.
Diese Parameterdatei enthält benutzerdefinierte Dateifilter. Siehe die Globale Dateifilter-Einstellungen für weitere Informationen.
Diese Parameterdatei enthält benutzerdefinierte Parameter für externe Suchvorgänge. Siehe die Globale externe Suchvorgänge-Einstellungen für weitere Informationen.
Diese Parameterdatei enthält benutzerdefinierte Autotext-Parameter. Siehe die Autovervollständigung-Einstellungen für weitere Informationen.
Diese Datei enthält die Zugangsdaten für Ihre Teamprojekt-Repositories.
Der Inhalt der Datei ist nicht verschlüsselt.
Einzelheiten finden Sie unter Ein Teamprojekt einrichten.
Diese Parameterdatei enthält benutzerdefinierte Segmentierungsparameter. Siehe die Globale Segmentierungsregeln-Einstellungen für weitere Informationen.
Dieser Ordner ist der Standardspeicherort für manuell installierte OmegaT-Erweiterungs-Plugins. Siehe die Plugins-Einstellung für weitere Informationen.
Es ist auch möglich, Plugins in den plugins/-Ordner des Programms zu installieren.
Dieser Ordner enthält Ihre Rechtschreibwörterbücher. Siehe die Rechtschreibprüfung-Einstellungen für weitere Informationen.
Der Applikationsordner enthält die OmegaT.jar
-Applikation und eine Reihe anderer wichtiger Dateien.
Der Speicherort des Applikationsordners ist abhängig davon, welche Plattform Sie verwenden und wie Sie OmegaT installiert haben. Folgende Speicherorte werden empfohlen bzw. sind Standard:
C:\Program Files\OmegaT\
/opt/omegat/
/Applications/OmegaT.app/Contents/Java/
/opt/omegat/
Vertriebslizenz von OmegaT. GPL-Version 3.
Ausführbare Datei von OmegaT. Dient zum Starten von OmegaT über die Befehlszeile. Einzelheiten finden Sie unter Start über die Befehlszeile.
Eine Liste mit Verbesserungen und Fehlerbehebungen. Schauen Sie hier nach, wenn Sie Informationen über die Entwicklung von OmegaT benötigen.
Die Vertriebslizenz für die Dokumentation. GPL-Version 3.
Der Index der mehrsprachigen Bedienungsanleitung.
Ein Link zur Support-Seite.
Einfache Installation und Bedienungsanleitung.
Der Dokumentationsordner.
Die Liste der Mitwirkenden.
Jede übersetzte Bedienungsanleitung befindet sich in einem eigenen Sprachordner.
Der Index der mehrsprachigen Bedienungsanleitung.
Die Liste der von OmegaT verwendeten Bibliotheken.
Ein Ordner mit Bildern, die von OmegaT verwendet werden.
Ein Ordner mit Bibliotheken, die von OmegaT verwendet werden.
Ein Ordner, den Sie zum Installieren externer Plugins verwenden können. Der bevorzugte Ort für manuelle Plugin-Installationen ist der plugins/-Ordner im Konfigurationsordner. Siehe die Plugins-Einstellungen für weitere Informationen.
Ein Ordner mit Skripten. Siehe das Scripting-Fenster für weitere Informationen.