Testování nové verze slovníků pro kontrolu pravopisu

Připravovaná verze OpenOffice.org 2.0.2 bude obsahovat vylepšenou kontrolu pravopisu. Aby správně fungovala, musely být upraveny slovníky pro kontrolu pravopisu.  

Slovníky jsou založeny na slovnících z programu ispell a jsou licencovány pod GNU/GPL licencí, proto nebudou součástí instalace OpenOffice.org. Mohou být však doinstalovány separátně pomocí průvodce DicOOo. Prosím všechny podnikavé uživatele, aby odzkoušeli, že připravené slovníky jsou funkční a bezproblémové. Mohou být použity s libovolnou verzí OpenOffice.org, od 1.0, jsou "zpětně kompatibilní". Slovníky můžete stáhnout z http://ftp.linux.cz/pub/localization/OpenOffice.org/devel/Czech/spell_checking/cs_CZ.zip a instalovat je do adresáře share/dict/ooo, pokud tam již nějaké české slovníky máte, pouze je nahraďte těmito, pokud ne, je kromě nahrání souborů nutné vložit do souboru dictionary.lst řádek DICT cs CZ cs_CZ a restartovat OOo.

Těšíme se hlášení slov, která slovník neobsahuje, abychom je mohli doplnit.

Komentáře

user avatar
Odpovědět
bude se jednat pouze o
1. 03. 2006, 00:04:30
bude se jednat pouze o vylepšení pravopisu nebo i syntaxe??? zvlášť v německém a anglickém jazyce.
user avatar dan
Odpovědět
Ja nejak nevim co si mam
1. 03. 2006, 01:05:17
Ja nejak nevim co si mam predstavit pod syntaxi.

V OOo je kontrola pravopisu - honosne znejici nazev pro neco co porovnana jestli napsane slovo je v danem jazyce zname.

A kontrolu gramatiky, sledujici nektere zakladni gramaticke konstrukce.

Zmeny se momentalne delaji vsude, ale ty zasadni jsou v kontrole pravopisu.
user avatar Anonymní
Odpovědět
Funguje velmi dobře
2. 03. 2006, 09:12:26
Velmi děkuji, funguje bez problémů, prošel jsem asi 500 stran textů a na nic jsem nenarazil,
S pozdravem jmenovec Dan :-))
user avatar Jan Hutař
Odpovědět
chybejici slova?
2. 03. 2006, 22:17:41
Dobrý den, nejsem žádný češtin, ale myslím že ve slovníku chybí:
"nedostatek"
"sigmoida" (a další tvary tohoto; kde je hranice odbornosti?)
"s.r.o." (to je ale možná spíš feature než bug)

S pozdravem, Jan Hutař :)
user avatar
Odpovědět
uf
2. 03. 2006, 22:28:06
Tak sigmoida se dá prominout. Problém je, že odborných počítačových výrazů je tam hodně, ale máma to třeba používá v stavební kanceláři a stavebních výrazů české slovníky neznají fůůůru. Vypadá to, že geometrů asi mezi uživateli GNU ispellu také moc není.

s.r.o. - bohužel, tato zkratka zatím nedokáže projít úspešně přes algoritmus lámání slov do fragemtů předhazovaných slovníku.

Ale s nedostatek jste mě připravil pracovní noc. ispell totiž se stejným slovníkem nedostatek zná, takže jste našel možná chybu v OOo, to musím zjistit, protože to teoreticky může postihnout fůru slov.
user avatar dan
Odpovědět
Vyřešeno
3. 03. 2006, 19:45:13
Ještě jednou děkuji za pěkný bugreport. Chyba nebyla v OOo ale ve slovníku, protože u některých slov došlo k duplicitám. Slova se generují ze seznamů slov v kombinaci s modifikátory - příponami a předponami. Zrovna u nedostatku se slovo ve slovníku vyskytovalo jednak jako spojení slov dostatek a předpony ne a jednak jako statek ve spojení s předponou do. Protože algoritmus generování to zanedbal, tak se slovo do výsledného slovníku dostalo dvakrát s různým skloňováním. To starému myspellu nevadilo, ale nový to již netoleruje.

Takže na výše zmíněném URL jsou vystaveny nové slovníky, problém se vyskytl asi u 700 slov, takže tyto slovníky umí o 700 slov více než staré.

Je otázkou, jestli to nebude vyžadovat ještě ruční revizi slovníků, protože autor slova statek vyznačil, že se kombinuje s předponou do i když ve slovníku už bylo slovo dostatek. Ale to zřejmě při hlídání duplicit ve výsledném slovníku není zas tak velký problém.
user avatar Jan Hutař
Odpovědět
Re: Vyřešeno
3. 03. 2006, 22:33:21
Tomu se říká rychlost :) Děkuji
user avatar
Odpovědět
jeste update
3. 03. 2006, 22:48:56
Pokud si nekdo stihl stahnout slovniky od minuleho oznameni, vezte ze doslo k dalsi aktualizaci, byly pridany soubory potrebne k tomu, aby sla udelat lokalni instalace prostrednictvim DictOoo.
user avatar Cenda
Odpovědět
chybějící písmena
3. 03. 2006, 23:31:00
Mám nainstalovaný slovník z 3.3. 19.36 (nedostatek už zná). Vyhazuje mi poměrně dost slov, u kterých bych to neočekával:
- (o) tom jací (jsou), která, které, kterou, kteří, kterými, kterému, kluby, vědy, termoizolace, kým, jakých, těmi, těch, ta, té, taková, takové, takového, jaké, jakého, jakému, absorbci, místa, nemá, saunování, síťovinové, nejvíce, místě, webdesign, nejméně, parkovné, účtu.
Dále jsem zjistil, že slovník zná výrazy exspirace i expirace - nejsem si jistý, že jsou oba správné, ale nezná "exspirovat" ani "expirovat".
Jako poslední mi slovníkem neprošla některá plemena psů - chrtík, vipet, vlkodav, greyhound a některá další, méně známá.
user avatar
Odpovědět
u me to vetsinu tech slov
3. 03. 2006, 23:47:00
u me to vetsinu tech slov zna:

[node:2455]
user avatar Cenda
Odpovědět
soubor cs_CZ.dic
4. 03. 2006, 00:18:56
Díval jsem se do souboru cs_CZ.dic. Například slovo "který" je tam uvedeno ve tvaru "který/YR", ale "která" či "které" tam není. Nemáte ta slova v nějakém uživatelském slovníku nebo nastavená v "ingnorovat vždy"?

Pár dalších slov: Míst, stylusu, výši, dopravy, bojů, nejdříve, obratem.
user avatar
Odpovědět
stylusu by znat nemel,
4. 03. 2006, 00:33:52
stylusu by znat nemel, ostatni ano

který/YR znamena, ze:

vezmi ktery a aplikuj na nej flag Y, flag Y obsahuje 147 pravidel podle ktery se slovo sklonuje/casuje, v nasem pripade se uplatni pravidlo rikajici, ze konci-li slovo na y, tak se y odstrani a misto nej se postupne vyzkousi á, é, ého, ému, ém

kdyz se tohle projde bez uspechu jde se na flag R, ktery osetruje nejake extra speciality, ted se mi nedari najit tvar slova ktery potrebny k jeho aktivaci, v nasem pripade se neuplatni.

Takze slovnik by slovo znat mel. Ve skutecnosti je to jeste malinko slozitejsi, protoze OOo postupuje obracene, hleda koren slova a ten potom testuje proti slovniku, ale princip je stejny.

Jeste dejte vedet jakou mate verzi OOo.
user avatar Cendai
Odpovědět
verze OOo
4. 03. 2006, 01:05:11
Instalační soubor: OOo_2.0.2rc4_060227_Win32Intel_install
Staženo dnes, pardon, včera.
user avatar dan
Odpovědět
Tak to mame priblizne
4. 03. 2006, 01:10:02
Tak to mame priblizne stejnou verzi. Instaloval se ten slovnik rucne nebo pres dictooo? Dictooo totiz jak jsme prave zjistil nechodi, zkracuje soubor na nulu.

Nemohou tam byt slovniky dva? Dival jsem se ted a slovnik co se dostal na ftp.openoffice.org od pana rejce slovo ktery skutecne podle vseho nezna. Mohlo by se stat, ze by jeden byl v profilu uzivatele a jeden v instalaci.
user avatar Cendai
Odpovědět
Slovnik cs_CZ.dic jsem
5. 03. 2006, 15:48:45
Slovnik cs_CZ.dic jsem instaloval rucne, je jediny, v adresari c:\Program Files\OpenOffice.org 2.0\share\dict\ooo\, datum 3.3., čas 19:36, velikost 3 764 008B. Slovo "ktery", jak jsem jiz psal, ve slovniku je uvedeno.
user avatar dan
Odpovědět
Tak to je jiste spravny
5. 03. 2006, 16:01:34
Tak to je jiste spravny slovnik. Nemam tady windows, ale zitra ve skole to nainstaluju a overim jestli se to pod windows nechova jinak.
user avatar Cendai
Odpovědět
asi chyba na mem stroji
6. 03. 2006, 13:14:47
Nainstaloval jsem si nový slovník v práci a funguje stejně (správně)jako vám (nikoli jako můj doma). Takže budu hledat závadu na mém domácím stroji.
user avatar dan
Odpovědět
Diky za zpravu, u me na
6. 03. 2006, 18:03:08
Diky za zpravu, u me na window se problem neprojevil. Zameril bych se na to, jestli nekde nezustala stara verze cs_CZ.dic a nebo jestli se nemohlo stat, ze byste pouzil cs_CZ.aff z jineho baliku nez cs_CZ.dic, ty soubory nelze kombinaovat uplne libovolne (temer libovolne ale ano ;-0).
user avatar TenCoUmíČesky
Odpovědět
S.R.O.???
11. 03. 2006, 11:16:57
Dobrý den, drobná poznámka. To, že ve slovníku není slovo "s.r.o." je správné, protože jste to napsal špatně Vy. Ono se totiž mezi jednotlivými zkratkami musí napsat mezera, jinak je to nesmysl! Tedy spárvně "s. r. o.". Pročtěte si PČP nebo P. Č. P., v P.Č.P. to uvedené není. :-)
user avatar dan
Odpovědět
To sice mate pravdu, ale na
11. 03. 2006, 11:28:01
To sice mate pravdu, ale na pravech se pravopis nevyucuje, takze vsechna s. r. o. v ceske republice jsou uspesne soudy zapsana do rejstriku bez mezer. Uplne stejne tak a. s.

Tady potom vznika drobny problem, protoze zakon stanovi, ze firma musi svuj nazev pouzivat presne tak jak je zapsan v obchodnim rejstriku a nekteri pravnici z toho dovozuji, ze se verze s mezeremi pouzivat nesmi.

Tohle jeste neni zdaleka takovy problem jako datum, kde ma byt mezera take, ale kdyz ji tam mate, stava se pocitacem tezko rozeznatelne. Excel to nezvlada vubec a Calc se o to snazi, ale jde mu to spise se stridavymi uspechy.
user avatar ubuntu
Odpovědět
chybějící slovo
22. 03. 2006, 15:45:45
Slovníky fungují dobře, ale právě jsem narazil na absenci slova "dozorný". Jedná se např. o dozorné orgány.
user avatar mustang2
Odpovědět
potřebuji slovníky
26. 02. 2007, 19:08:37
prosím vás nejsem programátor a ani jsem s těmito soubory nikdy nepřišel do styku nemohl by mi prosím někdo poslat slovník na Mustang2@seznam.cz nemám doma internet a nevím co s toho guláše co se mi objevil mám stáhnout moc děkuji

Přidat názor

 

Nejsou podporovány žádné značky, komentáře jsou jen čistě textové. Více o diskuzích najdete v nápovědě. Diskuzi můžete sledovat pomocí RSS kanálu.

 
 
 
woo jaw demo hz