Český slovník pravopisu, který nyní používáme, pochází z GNU ispellu, programu, který se pro kontrolu pravopisu používá pod linuxem, v rámci různých GNU projektů. To z něj ale činí slovník výběrový. Obsahuje spoustu výrazů z prostředí počítačových sítí a Linuxu vůbec, tam je bohatší než slovníky používané v rámci Wordu, ale těžce kulhá v oblastech, kde Linux nedominuje, postrádá výrazy z prostředí stavebnictví, nepočítačového průmyslu, právního a medicínské výrazy. Slovník je již hodně starý, základy byly položeny někdy před deseti lety. A je průběžně doplňován, metoda je prostá, vezme se uživatelký slovník ispellu a zašle se správci slovníku, Petru Kolářovi, který ve volné chvíli ke slovům přiřadí tagy umožňující jejich skloňování a časování a vloží kořen slova do hlavního slovníku. Ten zase později zveřejňuje na Internetu.
Plán tedy je posílat uživatelské slovníky vznikající průběžně při práci v OpenOffice.org. Zatímco ispell používá primitivní formát jedno slovo na řádce a prakticky každý jeho uživatel dokáže před odesláním vymazat řádky, které zveřejňovat nechce, v OpenOffice.org je potřeba pro reportování slov vytvořit makro, které jej zjednoduší. Formát slovníku není nijak komplikovaný, ale jeho ruční editace je obtížná. Soubor je v zásadě binární, obsahuje na začátku magic sekvenci podle které jej OOo pozná a potom seznam slov oddělený sekvencí 0x00 0x03. Nástroj pro reportování slov chybějících ve slovníku by měl dvě komponenty, serverovou a klientskou.
Klientská by bylo makro, které by po startu načetlo uživatelův slovník a po odsouhlasení uživatele by pro každé slovo provedlo dotaz na server, jestli je slovo reportované nebo není. Ze slov, která by reportovaná nebyla by sestavilo seznam, který by byl uživateli zobrazen, uživatel by mohl odstranit slova, které nemají být reportována a v luxusnější verzi by mohl editovat slova, která budou reportována (jejich převedení do základní formy). Nakonec by makro odeslalo seznam slov na server a vytvořilo lokální soubor, kde by byla uložena již zpracovaná slova, aby nebyl uživatel příště obtěžován.
Serverová strana by prostě jen udržovala seznam slov reportovaných uživateli, případně by v luxusni variantě umožnila hlasovat o zařazení slov do slovníku a nebo dokonce otagovat slova přímo na webu, aby bylo uložení do hlavního slovníku rychlé a bezbolestné. Výstupem iniciativy by bylo rozšíření slovníku pro ispell a tím současně i rozšíření slovníku pro OOo. Tak co, troufá si někdo na takovou věc, nebo její část? Mohu přispět radou, vysvětlením, mám k dispozici spoustu serverů, ale nemám čas to napsat.