OpenOffice.cz

Komentáře LibreOffice 7–9/2016: brněnská konference a Google Summer of Code

ondra.kl

Odpovědět
LibreOffice 7–9/2016: brněnská konference a Google Summer of Code
6. 10. 2016, 07:48:46

" data pro vědecké studie by měla být zpracovávána v odpovídajících softwarových nástrojích, kterými – při vší úctě – tabulkové procesory nejsou. "

Snaží se tady někdo říci že tabulkové procesory nejsou určeny ke zpracování dat? Fakt? A k čemu tedy jsou?

Lukáš Jelínek

Odpovědět
Re:LibreOffice 7–9/2016: brněnská konference a Google Summer of Code
6. 10. 2016, 08:08:37

Tabulkové procesory patří mezi kancelářské aplikace. Hodí se pro ad hoc zpracování malého množství jednoduchých dat (přestože se je leckdo snaží "znásilňovat" i pro různé jiné účely). Ale zpracovávat v nich rozsáhlá vědecká data, nad jejichž zpracováním je potřeba mít plnou kontrolu (a ne nechávat působit nějakou "chytristiku" programu, která se snaží vystihnout záměry uživatele), je asi jako vozit na stavbu materiál na kole.

strepon

Odpovědět
Re:LibreOffice 7–9/2016: brněnská konference a Google Summer of Code
6. 10. 2016, 23:00:47

Jasně, někteří dokáží v tabulkovém procesoru vykouzlit ledacos (bez ironie) a každý má práh toho, kdy mu začne práce v něm připadat těžkopádná, nastaven jinak - nicméně ve vědě jsou z dobrých důvodů na ústupu.

Licenčně Calc výhodu nemá, svobodných nástrojů na zpracování dat je spousta. Obsahuje sice nějaké funkce, ale s množstvím specializovaných vědeckých knihoven a jejich možnostmi se nedá srovnat. A nejde jen o to zpracovat data jednorázově, bývá také potřeba flexibilně měnit vstupy či způsoby výpočtu, a to s minimálním úsilím a s automatickou aktualizací výstupů.

Petr Valach

Odpovědět
Re:LibreOffice 7–9/2016: brněnská konference a Google Summer of Code
6. 10. 2016, 23:46:13

Díky za vysvětlení a komentáře, myslím, že spousta lidí (včetně mě) možná ani netuší, jak velký problém je zpracovávat velká data a chtít relevantní výsledky.

neutr

Odpovědět
LibreOffice 7–9/2016: brněnská konference a Google Summer of Code
6. 10. 2016, 10:09:32

Tabulkové procesory jsou vhodné pro většinu vědeckých prací zejména technického charakteru. Stačí se podívat do matematických fukcí kde se to jen hemží funkcemi kterým se říká inženýrské.

Počínaje statistikou až například pro výpočty pomocí goniometrických funkcí, nebo až po finanční speciály. Calc se tak docela blíží například Matlabu.

Calc má ale značné omezení na rozsah dat se kterými operuje. Na úkol týkající se konkrétně molekulární genetiky zřejmě stačí zejména ve spolupráci s Base. Při tom například práce na lidském genomu vyžadují operace nad miliardami záznamů.
Zde došlo zřejmě k chybě při práci s programem. Většina zkušenějších uživatelů tento problém zná. Když si Calc myslí že jde o formát datumu tak to naformátuje - ale tohle je spíš uživatelská neznalost. Nebo také nesprávné nastavení parametrů, které udělá neočekávanou chybu a ztratí se "z dohledu" dříve, nežli je zjištěna (podobným chybám se nezabrání ani ve specializovaných programech).
Zase lze přiznat opodstatněnost v tom, že k nástrojům LO mohou všichni (pedagog i jeho studenti, externisté ...) - bez větších nákladů lze sdílet data mezi vědeckou komunitou. Myslím že tohle je opravdu "bohulibé" počínání. Mělo by se spíš podepřít podporou ze strany vývojářů, nežli to kritizovat. Stačí si uvědomit co molekulární genetika může přinést lidstvu.

Samozřejmě existují vědecké projekty kde Calc i Base nestačí na objemy. Nejde při tom ani tak o velikosti jako o rychlost zpracování. Velké objemy se dají zmáknout jen vhodnou strukturou a vyhledávacími algoritmy. V důsledku toho určité objemy nelze zpracovat interpretovanými programovacími jazyky.

Zřejmě nikdy nepůjde zpracovávat Calcem oblast astronomie kde se přidává omezení velikosti čísel. Podobně nevhodné je zřejmě zpracování meteorologických dat, nebo projekty které simulují nějaký složitý vývoj.
Ale molekulární genetika je ještě na hranici zvladatelnosti a má zřejmě ještě jiné výhody nežli jen to, že stačí zpracovat objemy dat (čísla z oboru N). Genom je jenom kód který má sice fyzikálně - chemickou podstatu, ale je to jen prostředek logiky. Domnívám se, že je možné využívat snadno přístupné vzorce pro testování variant - tedy činnosti které se do značné míry podobají tomu čemu programátoři říkají "ladění a testování".

lp.

Odpovědět
Re:LibreOffice 7–9/2016: brněnská konference a Google Summer of Code
7. 10. 2016, 01:11:09

"Tabulkové procesory jsou vhodné pro většinu vědeckých prací zejména technického charakteru."

Jen pokud se v nich toho moc nepočítá. Calc špatně zvládá obyčejné základy - lineární regrese počítá jen naprosté základy za dobrých podmínek, neexistuje diagnostika, nelineární problémy řeší velice omezeně, "moderní metody" = statistika posledních cca 40 let není zastoupena vůbec. Prostě - microsoft to taky nezná. Grafy jsou jen základní.

Dá se to do určité míry naprogramovat, pokud nechybí nadšení a znalosti. I tak se těžko vytváří knihovny podobných řešení. Připouštím také, že řada "vědeckých" prací to nepotřebuje.

"Počínaje statistikou až například pro výpočty pomocí goniometrických funkcí, nebo až po finanční speciály. Calc se tak docela blíží například Matlabu."

O statistice jsem se zmínil, komplexní čísla jsou slabou náhražkou, vyzdvihování goniometrických funkcí patří do 60-tých let. min. století a použití "finančních" speciálů označují auditorské zdroje za rizikovou operaci. A přibližování k Matlabu - na dohled to podle mne není a nevadí mi to. Nemyslím, že je ambicí calcu nahradít někdy matlab.

Zmíněná studie se týkala zejména excelu. Z vlastní zkušenosti mohu potvrdit, že v případě tabulky středního rozsahu (několik listů, cca desítky vzorců) se pravděpodobnost chyby velká a v sešitech s více listy a stovkami vzorců je chyba prakticky jistá. Toto je nezávislé na použitém programu. Viděl jsem kalkulaci (lotus 123), ve které byla chyba cca 2 miliardy Kč ze 6 miliard - nebylo to automatickými opravami. Lotus 123 uměl funkcí najít a nahradit v okně obrazovky a ty listy se do okna nevešly.

V případě calcu je zde proti konkurenci aspoň jeden nástroj - zvýrazňování hodnot (bohužel osamocený a nedotažený, minimálně neodlišuje vzorce s konstantou). Proti tomu je zde na můj vkus hodně přepínačů, které ovlivňují chování výpočtu. To vede k vyšší pravděpodobnosti vzniku chyby.

Zpracovávat v Base miliardy záznamů je jistě zajímavé, snad se dočkáme.
Jinak souhlasím, že jsou výpočty, kde je (zatím?) použití Calcu nevhodné: Předpověď počasí pro planetu, simulace vývoje vesmíru a možná několik dalších úloh.

neutr

Odpovědět
LibreOffice 7–9/2016: brněnská konference a Google Summer of Code
7. 10. 2016, 06:29:55

Nejlepší asi bude když napíšu něco z nedávné historie. Protože mám rád čísla dostal jsem v roce 1978 od příbuzných manželky dárek - svou první kalkulačku (tedy první byly hodinky s kalkulačkou ale to nebylo nic pro praktické používání).

Byl to Privileg LC 10000 a stál 199 západoněmeckých marek. Byl velmi tenký (asi 5mm) LCD se žlutě - zlatým obalem. Uměl mimo běžných věcí také přirozený a dekadický logaritmus, druhou mocninu + odmocninu, základní goniometrické funkce a paměť. Byl jsem velice rád, ale když by se mne zeptali vybral bych si TexasInstrument který byl silnější, v černém obalu také asi maličko lacinější a hlavně měl mnohem víc funkcí.

Prostě dobu kdy neexistovali tabulkové procesory si snad většina ještě pamatuje. Samozřejmě jsem si později koupil "tz" vědeckou kalkulačku. Najednou jsem stál před problémem jak správně zadávat. Některé věci bylo nutné přepsat na papír a pokračovat na klávesnici.

Co tím chci říct? Musel jsem vědět co a jak udělat. Nejdříve jsem se musel seznámit v jakém módu a jaké parametry zadat. Teprve potom to lze použít k výpočtu. Takže docela samozřejmou věcí byla konstrukce postupu kde se musely ověřit nejprve všechny samostatné kroky včetně dílčí a celkové kontroly. Proto mi vůbec nepřipadalo divné, že totéž musím udělat u tabulkového procesoru - byla a je to stále jen sofistikovanější VĚDECKÁ KALKUKLAČKA.

Nejdřív se mesíme seznámit s tím co ještě umí (může) tabulkový procesor pomocí vestavěných funkcí a co už musíme sami poskládat k vyřešení.

A ještě poznámku - zapomeňte na tabulkové procesory a z vědců všech různých oborů se stanou programátoři svého speciálu. Pokud tam nebudou mít kalkulačku tak tam budou mít sčot.

Takže můj názor je v tom, že co tabulkový procesor sám od sebe neumí - pokusím se alespoň přizpůsobit - ale nečekám že umí vše co bych mohl někdy potřebovat. A i toto je zřejmě základní předpoklad pro úspěch vědecké práce - přizpůsobit si nástroj ke své potřebě. Recitovat co všechno Calc, Excel ap. neumí je docela konzumní - sterilní přístup bez jakékoliv ambice či spíš invence.

V každém případě tvrdit, že se tabulkový procesor nehodí k vědecké práci je krátkozrakost. Ještě bych se přidal k tomu původnímu dotazu od "ondry.kl" - Snaží se tady někdo říci že tabulkové procesory nejsou určeny ke ZPRACOVÁNÍ DAT? Fakt? A k čemu tedy jsou?