Le instrumentos de memoria de traduction functiona con unitates textual nominate segmentos. OmegaT ha duo manieras a segmentar un texto: per paragrapho o per segmentation a phrase (alsi referite como "segmentation basate sur le regulas”). Pro seliger le typo del segmentation, selige → ex le menu principal e marca o leva le marca in le quadrato de controlo supplite. Le segmentation a paragrapho es avantagiose in certe casos, assi como traductiones multo creative o stilistic in le qual le traductor pote desiderar de cambiar le ordine de phrases integre; pro le majoritate del projectos, comocunque, le segmentation a phrase es un selection a preferer, pois que illo delivra concordantias melior ex traductiones previe. Si le segmentation per phrase esseva seligite, tu pote prefixar le regulas con → del menu principal.
Son jam disponibile regulas de segmentation confidibile pro plurime linguas, assi il es verisimile que tu non necessitara de ser implicate con le script de tu proprie regulas de segmentation. Al altere latere iste functionalitate pote esser multo utile in casos particular, ubi tu pote accrescer tu productivitate accordante le regulas de segmentation al texto a traducer.
Advertimento: viste que le texto essera segmentate differentemente postquam le optiones del filtro esseva cambiate, ergo tu pote deber initiar a render de zero. Al mesme tempore le segmentos valide previe in le memoria de traduction del projecto rotara in segmentos orphane. Si tu cambia le optiones de segmentation durante que un projecto es aperte, tu debe recargar le projecto pro que le cambios sume effecto.
OmegaT usa le sequentia de grados sequente:
OmegaT in prime loco analysa le texto pro le segmentation a nivello de structura. Durante iste processo il es solmente le structura del file fonte que es usate pro generar le segmentos.
Per exemplo, le files de texto pote esser segmentate sur interruptiones de linea, lineas vacue, o non esser segmentate del toto. Files continente formattation (documentos ODF, documentos HTML, et cetera) son segmentate sur le tags de nivello de bloco (paragrapho). Le attributos de objecto traducibile in le files XHTML o HTML pote esser extrahite como segmentos separate.
Post le segmentation del file fonte in unitates structural, OmegaTsegmentara iste blocos ulteriormente in phrases.
Le processo de segmentation pote esser illustrate assi: le cursor move se secundo le le, un character a un vece. A cata position del cursor, le regulas, consistente de un modello Ante e Post , son applicate in lor ordine date pro vider si alicun del modellos Ante es valide pro le texto sur le sinistra e le correspondente modello Post pro le texto al dextra del cursor. Si le regula concorda, o le cursor move se super sin inserer un interruption de segmento (pro un regula de exception) o es create un interruption de segmento nove al position del cursor actual (pro le regula de interruption).
Le duo typos de regulas conduce se como seque:
Separa le texto fonte in segmentos. Per exemplo, " Did it make sense? I was not sure ." deberea esser fisse in duo segmentos. Pro que isto accide, ibi deberea esser un regula de interruption pro le "?", quando sequite per spatios e un parola majuscule. Pro definir un regula quam regula de interruption, marca le quadrato de controlo Interruption/Exception.
specifica qual partes de texto NON deberea esser separate. Nonobstante le periodo, "Mrs. Dalloway " non deberea esser fisse in duo segmentos, assi unregula de exception deberea esser establite pro Mrs (e pro Mr, pro Dr, pro prof et cetera), sequite per un periodo. Pro definir un regula quam regula de exception, lassa le quadrato de controlo Interruption/Exception non marcate.
Le regulas de interruption prefixate deberea esser bastante pro le major parte del linguas europee e le japonese. in viste del flexibilitate, tu pote considerar de definir magis regulas de exception pro tu lingua fonte, pro suppler segmentos plus significative e coherente.
Omne le collectiones de regula de segmentation pro un modello de lingua que concorda son active e son applicate in le ordine de prioritate date, assi regulas pro lingua specific deberea esser superior in ordine de prioritate quam los base. Per exemplo, le regulas pro le francese canadian (FR-CA) debe esser superior que le regulas pro le francese (FR.*), e superior que los Base (.*) . Assi, quando rendente ab francese canadian le regulas pro francese canadian - si alicun - essera applicate antea, sequite per le Regulas pro le francese e in fin, per le regulas Base.
Major cambios al regulas de segmentation deberea esser generalmente evitate, in modo special post le completamento del prime minuta, sed cambios minor, ut le addition de un abbreviation admittite, pote esser avantagiose.
Pro modificar o expander un collection de regulas existente, clicca simplemente sur illo in le summitate del tabella. Le regulas pro ce collection apparera in le medietate basso del fenestra.
Pro crear un collection de regulas vacue pro un modello de lingua nove clicca Adde in le medietate superior del fenestra de dialogo. Un linea vacue apparera al fundo del tabella superior (tu pote deber rolar in basso pro vider lo). Cambia le nomine del collection de regula, le modello de lingua al lingua concernite e su codice (vide Appendix A, Linguas - lista del codices ISO 639 pro un lista del codices de lingua). Le syntaxe del schema del lingua conforma al syntaxe del expression regular. Si tu collection de regulas tracta un par lingua-pais, nos monera te a mover lo al summitate usante le button Move in alto .
Adde le modellos Ante e Post . Pro verificar lor syntaxe e lor applicabilitate, il es consiliabile usar instrumentos que permitte te pro vider lor effecto directemente. Vide le capitulo re le Expressiones regular. Un bon puncto de initio essera semper le regulas existente.
Intention | Ante | Postt | Nota |
---|---|---|---|
Impone que le segmento initia post un periodo ('.') sequite per un spatio, tabulation ... | \. | \s | "\." sta pro le character periodo. "\s" significa qualcunque character spatio blanc (spatio, tabulation, pagina nove et cetera.) |
Non segmentar post Mr. | mr | \s | Isto es un regula de exception, ergo le quadrato de controlo del regula non debe esser marcate |
Prefixa un segmento post "。" (periodo japonese) | 。 | Note que after es vacue |
|
Non segmentar post M. Mr. Mrs. e Ms. | Mr??s??\. | \s | Regula de exception - vide le uso del ? in expressiones regular |