OmegaT 3.5 - Guida del usator

Expressiones regular

Le expressiones regular (o in breve regex) usate in le regulas de recercas e de segmentation son illos supportate per Java. Si tu deberea necessitar information plus specific, consulta le documentation Regex Java. Vide referentias additional e exemplos in sequito.

Note

Iste capitulo es designate pro usatores experte, que debe definir lor proprie variantes de regulas de segmentation o imagina elementos clave de recerca plus complexe e potente.

Table 20. Regex - Flags
Le construction ... concorda le sequente
(?i) Habilita concordantia insensitive al majusculas (per base prefixate, le schema es sensitive al majusculas).

Table 21. Regex - Character
Le construction ... concorda le sequente
x Le character x, excepte le sequente...
\uhhhh Le character con valor hexadecimal 0xhhhh
\t Le character de tabulation ('\u0009')
\n Le character nove linea ('\u000A')
\r Le character retorna-carro ('\u000D')
\f Le character nove folio ('\u000C')
7.A. Le character alerta (campana) ('\u0007')
\e Le character escappa ('\u001B')
\cx Le character de controlo correspondente a x
\0n Le character con valor octal 0n (0 <= n <= 7)
\0nn Le character con valor octal 0nn (0 <= n <= 7)
\0mnn Le character con valor octal 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh Le character con valor hexadecimal 0xhh

Table 22. Regex - Citation
Le construction ... concorda le sequente
\ Nihil, excepte quotes le character sequente. Isto necessita si tu amarea inscriber alicun del meta-characteres !$()*+.<>?[\]^{|} pro concordar con ipsos.
\\ Per exemplo, isto is le character barra reverse
\Q Nihil, sed virgulettas omne characteres usque \E
\E nihil, sed termina le citation initiate per \Q

Table 23. Classes - Regex pro blocos Unicode e categorias
Le construction ... concorda le sequente
\p{InGreek} Un character in le bloco grec (simplice bloco)
\p{Lu} Un littera majuscule (simplice categoria)
\p{Sc} Un symbolo de numerario
\P{InGreek} omne character preter uno in le bloco grec (negation)
[\p{L}&&[^\p{Lu}]] omne littera si non un littera majuscule (subtraction)

Table 24. Regex - Classes de character
Le construction ... concorda le sequente
[abc] a, b, o c (classe simplice)
[^abc] Cata character extra a, b, o c (negation)
[a-zA-Z] De a per z o A per Z, inclusive (campo)

Table 25. Regex - Classes de character prefixate
Le construction ... concorda le sequente
. Cata character (excepte pro le terminatores del linea)
\d Un cifra: [0-9]
\D Un non-cifra: [^0-9]
\s Un character spatio blanc: [ \t\n\x0B\f\r]
\S Un character non-spatio blanc: [^\s]
\w Un character parola: [a-zA-Z_0-9]
\W Un character non-parola: [^\w]

Table 26. Regex - Concordatores del confinios
Le construction ... concorda le sequente
^ Le principio de un linea
$ Le fin de un linea
7.B. Un frontiera de parola
7.B. Un frontiera non-parola

Table 27. Regex - Quantificatores avide
Le construction ... concorda le sequente
X ? X, un vice o non del toto
X * X, zero o plus vices
X + X, un o plus vices

Note

La quantificatores avide concordara tanto como illos pote. Per exemplo, a+ concordara le aaa in aaabbb

Table 28. Quantificatores Regex - Reluctante (non-avide)
Le construction ... concorda le sequente
X?? X, un vice o non del toto
X*? X, zero o plus vices
X+? X, un o plus vices

Note

Le quantificatores non-avide concordara assi pauc quam illos pote. Per exemplo, a+? concordara le prime a in aaabbb

Table 29. Regex - Operatores Logic
Le construction ... concorda le sequente
XY X sequite per Y
X|Y Vel X vel Y
(XY) XY como un gruppo singule

Instrumentos Regex e exemplos de uso

Plure instrumentos interactive son disponibile pro disveloppar e essayar le expressiones regular. Illos seque generalmente multo le mesme schema (Per un exemplo ex le Probator de Expression Regular vide in sequito): le expression regular (entrata vertice) analyse le texto de recerca (Cassa del texto in le medio) , que rende le occurrentias, monstrate in le cassa de Taxo resultato.

Figure 13. Probator de Regex
Probator de Regex

Vide Le Repetitor Regex pro le versiones de un application autonome in Windows, Linux, FreeBSD. Isto es identic al exemplo precedente.

Un amabile collection de casos regex utile pote esser discoperte trovate in OmegaT ipse (vide Optiones > Segmentation). Le lista sequente include expressiones que tu pote trovar utile quando cerca per le memoria de traduction:

Table 30. Regex - Exemplos de expressiones regular in le traductiones
Expression regular Trova le sequente:
(\b\w+\b)\s\1\b parolas duple
[\.,]\s*[\.,]+ un virgula o un periodo, sequite per spatios e ancora un altere virgula o periodo
\. \s+$ spatios extra post le periodo al fin del linea
\s+a\s+[aeiou] Anglese: parolas, incipiente con le vocales, deberea generalmente esser precedite per "an", non "a"
\s+an\s+[^aeiou] Anglese: le mesme controlo quam ante, ma re le consonantes ("a", non "an")
\s{2,} plus que un spatio
\.[A-Z] Periodo, sequite per un littera majuscule - possibilemente un spatio es mancante inter le periodo e le initio de un phrase nove?
\bis\b cerca pro “is”, non “this” o “isn't” etc.