Mi ĵus aldonis ankoraŭ unu Ĉu-romanon al la Tekstaro de Esperanto (kaj mi planas aldoni pliajn, kredeble ĉiujn el ili). Temas pri “Ĉu li bremsis sufiĉe?” (verkita kompreneble de Claude Piron sub la plumnomo Johán Valano).
Kiam mi rulis la Perl-programeton, kiu aldononas “streketojn” inter vortelementoj (farante ekz. “mal•grand•eg•a•j•n” el “malgrandegajn”), mi kompreneble trakontrolis perokule la rezulton. Pli-malpli ĉio estis en ordo, sed kiel ĉiam estis tamen kelkaj misaĵoj korektendaj. Tia programo ne povas ĉiam ĝuste diveni, kiel vortoj estas kunmetitaj. Fakte iafoje eĉ homo povas heziti, ĉu ekz. “sentema” estas “sen•tem•a” aŭ “sent•em•a”. Ĉi-foje mi rimarkis la vorton “sindefende”, kiu aperis kiel “sin•defend•e”, kio estas tute sencohava analizo – oni ja povas defendi sinon. Sed kompreneble, kaj laŭkuntekste, temas vere pri “si•n•defend•e”. Ho ve!
Mi rapide konstatis, ke tio ne estas sola okazo de misanalizita “sin…”. La tuta Tekstaro estis plena je vortoj kiel “sin•gard•a”, “sin•don•em•a”, “sin•tro•taks•ec•o”, “sin•ofer•ad•o” kaj simile, kaj praktike ĉiuj el ili vere estu “si•n•…”. La senca diferenco estas ne nur grava, sed eĉ iom tikla.
Mi do devis trakorekti la tutan Tekstaron (kiu nun enhavas 9.223.198 da vortoj). Feliĉe en tiu tasko la potencega tekstoredaktilo Vim povis helpi min per inteligenta aŭtomata serĉado kaj anstatŭigado. Vim estas mia ĉefa laborilo. Kaj nun ĉiuj el tiuj misanalizitaj vortoj estas en ordo.
Sendube mi ankoraŭ estonte bezonos fari multajn similajn korektojn en la Tekstaro.