Hoiatus: see lehekülg ja siit viidatud asjad on üsna vanad ja mitmesuguste teadaolevate puudustega. Uuematest selleteemalistest tegemistest on olemas nt PLAMK ning plaan selle, Eesti Keele Instituudis valmivate asjade ja Voikko baasil midagi uut ja paremat teha. Huvilised võivad julgesti allpool oleval aadressil ühendust võtta.
(16.04.2013)

Mis see on?

Sellelt lehelt leiab minu bakalaureusetööna valminud nägemuse sõnastikupõhisest eesti keele õigekirjakontrollijast.

Peamiselt on siin ispell'ile ja myspell'ile mõeldud sõnastikud ning tarkvara nende tekitamiseks kasutades Eesti Keele Instituudist pärit infot sõnade ja nende muutumise kohta.

Lisaks on siin eesti keele poolitamist kirjeldav fail OpenOffice.org'ile. (paigaldamise juhis tuleks siia ka tekitada.) See fail on saadud vastava TeX'i faili (vt Tõnu Tamme TeX'ilehelt) minimaalse teisendamise teel. Originaali autor on Enn Saar. (Hetkel on siin fail 9. aprillist 2004)

Viimase versiooni failist saab CTAN arhiivist http://www.ctan.org/tex-archive/language/hyphenation/eehyph.tex.

Sõnastikud

/kunagi saab siia ka jutt selle kohta, mida ette võtta, et asjad kasutatavaks muutuks ja ka selle kohta, kuidas ise sõnastikku täiendada/

Sõnastikus on umbes 15 miljonit sõna.

NB! Äärmiselt oluline on sisse lülitada ispelli liitsõnade tugi. See põhjustab küll mõnede väärvormide õigeteks pidamist, kuid kuna liitsõnade iseseisvalt sõnastikus esinemine teeks sõnastiku ebapraktiliselt suureks, siis ei ole eriti muud võimalust.

NB! Tegemist on suhteliselt värske asjaga. Kindlasti leidub sõnu/sõnavorme, mida sõnastikus ei leidu. Olulisemad on ilmselt kõikvõimalikud pärisnimed -- levinumad ees- ja perenimed, kohanimed jms.

NB! Tehnilistel ja sõnastikust mitte sõltuvatel asjaoludel ei oska ispell (ja ilmselt ka myspell) pakkuda korrektseid variante tundmatute liitsõnade asemele.

NB! Allpool viidatud sõnastikufailidest on olemas ka ISO-8859-15 kodeeringus variandid. Need on tarvilikud peamiselt sellepärast, et OO.o ei osanud arvestada sellega, et kasutatud Latin-1 tabel on veidi modifitseeritud..

ispell

Olulised on failid estonian.dict ja estonian.aff, milledest käsuga
buildhash estonian.dict estonian.aff estonian.hash
saab tekitada ispelli paisktabeli. (Lühendites esineva punkti peale pahandamine on teadaolev viga, kas või mida sellega ette võtta, pole veel otsustatud)

Saadud paisktabeli võib ispellile otse -d võtmega kasutada anda või siis võib selle kopeerida süsteemsesse ispelli sõnastikekataloogi (tõenäoliselt /usr/lib/ispell). Traditsiooni kohaselt kopeeritakse sinna ka afiksite fail (see, mille laiend .aff on).

myspell

myspell on OpenOffice.org'i sisseehitatud spellerimootor, sisuliselt on tegemist ispellist välja võetud sõnastikumooduliga. Sõnastik asub failides et_EE.dic ja et_EE.aff. Paigaldamiseks piisab, kui need failid kopeerida OO.o sõnastike kataloogi (selle kataloogi, kuhu OO.o paigaldatud on, alamkataloog share/dict/ooo, tõeäoliselt). Lisaks tuleb samas kataloogis olevasse faili dictionary.lst lisada rida
DICT et EE et_EE
ning OO.o taaskäivitada. Peale taaskäivitamist peaks keelemoodulite häälestusest (Tools, Options, Writing Aids, esimene edit nupp) olema võimalik valida, et eesti keele õigekirja kontrolliga tegeleb myspell. (analoogiliselt toimub poolituse lisamine).

Litsents

Praktiliselt kogu sõnastikes leiduv materjal on genereeritud kasutades Eesti Keele Instituudis loodud tüvebaasi. Tüvebaasile kehtib EKI tarkvara litsentsileping. Lisaks on kasutatud Ülle Viks'i "Väikest Vormisõnastikku".

Käseoleval lehel leiduvad sõnastikufailid ise on levitatavad GNU vähem üldise avaliku litsentsi (originaal) alusel.

Täiendamisest

Kuna tegemist on väga värske asjaga, siis vajab see ilmselt kiiret täiendamist. Praegu on ilmselt parim idee saata ettepanekud e-postiga aadressil jjpp @ meso . ee. Lähemal ajal peaks sellele lehele ilmuma ka vahendid, mille abil ülaltoodud sõnastikud genereeriti ning mille põhjal on võimalik kohe sobival kujul lisandusi tekitada.

Valmispakendatud versioonid

Loodetavasti tekib siia kohe varsti ka erinevate süsteemide jaoks valmispakendatud kuju sõnastikest. Töös on pakid Debianile, muude pakendamissüsteemide osas on igasugune abi teretulnud.

OpenOffice.org Mac OS X versioon

Vastukajana Arvo Mägi
artiklile Delfis tekitas Filipp Lepalaan paigaldusvahendid sõnastike lisamiseks OO.o MacOS X versioonile. (vt ka esialgset foorumipostitust)

MacOS X 10.6+ süsteemne speller

Hasso Tepper kirjeldab kuidas MacOS X eesti keele tuge täiendada, sh kuidas siin kirjeldatud failide abil süsteemne spellimine käima saada.

Debianile pakendamise aluseks olev pakk

Et koguaeg poleks vaja suuri sõnastikke üles laadida, on nüüdsest siin olemas tar-fail, mis on aluseks Debiani pakkidele.
© Jaak Pruulmann, 2003.
Viimane muudatus: 16. aprill 2013 -- märkus lehe alguses ja MacOS X süsteemse spelleri viide
Enne seda: 30. mai 2007 -- debiani originaal tgz.
Enne seda: 15. jaanuar 2005.