Reda

Změna formátu souboru ve verzi 2.0

Po dnešní diskuzi v konferenci uživatelů jsem se rozhodl napsat podrobnější článeček o velké změně, která se chystá. OpenOffice.org 2.0 bude mít totiž jiný výchozí formát souborů.  

Není to změna příjemná, ale doufejme, že je na dlouho poslední. Nebude znamenat žádnou revoluci nebo velký otřes. Verze 2.0 si stále rozumí s původním (v současnosti používaným) formátem a bude vydána speciální revize pro verzi 1.1, která bude umět otevírat a ukládat ve formátu verze 2.0. Bude možné nastavit si, jaký formát chci používat, tak jako si nyní někdo nastavuje jako výchozí formát pro ukládání souborů .doc, bude si moct vybrat mezi OpenOffice.org 1.1 a 2.0.

Nicméně pro nové projekty není starý formát perspektivní a předpokládá se, že tam kde to půjde, bude provedena hromadná konverze souborů ze staré verze na novou, s použítím nějakých automatických nástrojů. Starý fomát nedokáže uložit některé parametry a funkcionality zavedené v rámci verze 2.0.

Nový formát se zavádí z mnoha důvodů a každý asi upřednostní jiný. Pro mě je tím hlavním snaha něco udělat se situaci, kdy vlastně jediný formát, který je skutečně podporován na všech platformách je .doc, samozřejmě nikoliv autorem. Když si vezmete pět kancelářských balíku pro Linux, zjistíte že ani dva z nich si nemohou dokumenty vyměnit ve svém formátu, ale všichni umí .doc, stejně tak v prostředí Mac OS a nebo Windows. Takže moudré hlavy začaly pracovat na něčem co by to nějak sjednotilo. Sama EU měla problém s tím, že chce výměnu dát mezi orgány jednotlivých státu v otevřeném dokumentovém formátu, ale nějak se nemohli shodnout v kterém z toho počtu ODF co existují. Sxw (sxc...) to být sice mohl, ale mám pocit, že ani lidé z vývoje OpenOffice.org jej nepovažovali za vhodný. Samozřejmě idea je dobrá, ostatně je zachována i v novém formátu, ale různé detaily nevyhovovaly. Proto byl vytvořen formát nový, velmi podobný sxw, ale přece jen jiný. A má úspěch, již je přijat OASIS OPEN consorciem, jedna se o tom, že bude dokonce přijat jako ISO norma.

Viz http://europa.eu.int/ida/en/document/3197 a http://europa.eu.int/ida/en/document/3428.

Podporu tomuto formátu vyjádřili vývojáři KDE, kteří jej implementovali v Koffice. Skutečně má šanci stát se normou pro výměnu dokumentu v rámci EU a jakmile se tak stane, bude i Microsoft nucen jej implementovat v MSO. Další projekty se přidávají, chystají se knihovny pro všechny v free software světě běžné programnovaci jazyky, aby bylo možné soubory generovat z různých informačních systému. Tento formát má nakročeno na to, aby se používal minimálně stejně dlouho a široce jako .doc.

Obsahuje spoustu funcionalit, které OpenOffice.org zatím neumí využít, ale nepoškozuje je. Stejně tak další projekty, které jej budou používat. Fomát souboru je popsán na adrese http://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office Budou se používat následující přípony: text - oot šablona textu - ott master dokument - oom tabulka - oos šablona tabulky - ots kresba - ood šablona kresby - otd prezentace - oop šablona prezentace - otp matematický vzorec - oom databáze - odb Jistě jste si všimli, že přípona oom je použita dvakrát, nevím jestli je to chyba specifikace a nebo zda to tak zůstane. Pokud si chcete nové soubory prohlédnout a vyzkoušet, je možné je vytvořit libovolnou verzí vývojářského buildu OOo 2.0, aktuálně verzi 1.9.61. Stále se jedná o XML soubory uložené v zipovém archivu.

UPDATE: Nechci článek moc měnit, takže jen upresnění. V souvislosti s přijetím formátu sdružením OASIS OPEN se změnil namespace ve kterém jsou definovány jednotlivé tagy a také přípony souborů. Nově jsou: text - odt šablona textu - ott master dokument - odm tabulka - ods šablona tabulky - ots kresba - odg šablona kresby - otg prezentace - odp šablona prezentace - otp matematický vzorec - odf databáze - odb Platí od 11. listopadu do další změny.

Komentáře

user avatar Anonymní
Odpovědět
dik
16. 11. 2004, 23:13:44
diky za pekny clanek ;-)
user avatar Jan Minář
Odpovědět
.DOC není jeden formát
16. 11. 2004, 23:54:36
> Tento formát má nakročeno na to, aby se používal minimálně stejně dlouho a široce jako .doc

Jen pro upřesnění: .DOC je přípona, která znamená "tento soubor otevřít programem 'asociovaným' s příponou .DOC", formát se mění více-méně s každou revizí Wordu. Vlastně se ani nedá mluvit o formátu stejného druhu, jako je ooo, protože důležité nejsou formální specifikace, ale to, jak soubor uloží/přečte ten který Word.
user avatar Martin Trčka
Odpovědět
Mýtus: častá změna formátu DOC
23. 11. 2004, 21:16:29
Jan Minář napsal: "formát se mění více-méně s každou revizí Wordu"

No to je zajímavé, já se jinde dočetl, že binární formát Wordu se v podsledních 8 letech nezměnil... Vizte článek Word Myths and Feedback na adrese http://blogs.msdn.com/chris_pratley/archive/2004/04/28/122004.aspx
user avatar Anonymní
Odpovědět
Format Word-u sa nemeni od MS
28. 12. 2004, 23:00:50
Format Word-u sa nemeni od MS-Office 97. Sam pouzivam Office97 a s kompatibilitou som doteraz nemal problemy.
user avatar dejf
Odpovědět
format wordu
2. 01. 2005, 17:51:01
Dle vyjardeni M$ tomu tak je a principielne to skoro funguje, ale stejny dokument ulozeny v 97, 2000 a XP ma velmi odlisnou velikost a vzezreni v oo.org a nekdy i ve wordu jine nez vytvarejici verze.
Je pravda, ze kolizi word-word je vyrazne mene, nez kolizi word-oo.org a prave proto si myslim, ze resit kraviny jako gui je opravdu plytvani casem, lide uz jsou opravdu na***ni polofunkcnim softem a kdyz jim jako alternativu predhodite oo.org, vrati se zpet k M$, protoze kompatibilita a rychlost jsou radove vyssi a pravdepodobnost padu, ci jineho nechteneho chovani srovnatelna. Hlavni je, ze urcite vzniknou znatelne funkcni problemu v nestandardnich windowmanagerech, to je jiste zasadni vyhoda.
user avatar JardaK
Odpovědět
Format Word-u sa nemeni od MS
11. 03. 2005, 09:39:57
No tak to buďte rád a zbytečně si to neškrábejte! :-) Formát Wordu se změnil naposledy u Office XP a možná i 2003. Filtry do některých aplikací, které ještě u verze 2000 fungovaly o.k. již tyto docy nezvládají. Jmenujme například QuarkXPress verze 3.x, 4.x ... Jsem zvědav, zda pro tyto staré aplikace, které se stále velmi hojně používají, někdo napíše import toho otevřeného zázraku. Ale asi ne, jen ať je důvod k upgradu!
user avatar Jan Minář
Odpovědět
Vypadá to, že autoři těch
17. 11. 2004, 00:54:49
Vypadá to, že autoři těch stránek, na něž je odkazováno výše, naprosto nechápou, co je XML. Ukázka:

``eXtensible Markup Language (XML)-based applications separate content, structure, semantics and presentation. This allows electronic text to be moved from one hardware and software environment to another without loss of information.''

(http://europa.eu.int/ida/en/document/3428)
user avatar dan
Odpovědět
Re: Vypadá to, že autoři těch
17. 11. 2004, 01:04:11
S cim presne nesouhlasite? Me ta definice nesmyslna neprijde.
user avatar l4m4
Odpovědět
Definice XML
17. 11. 2004, 10:53:15
Podle vás vstup FO procesoru nebo XML konfigurák není XML?

Uvedená ,definice` není žádná definice XML, to je popis jedné z aplikací XML.
user avatar dan
Odpovědět
Re: Definice XML
17. 11. 2004, 11:15:10
Rici o XML, ze umoznuje prenaset texty mezi ruznymi harwarovymi a softwarovymi zarizenimi, bez ztraty informace v kontextu kodifikace souboroveho formatu kancelarskeho baliku se mi zda byt spravne az az.

Vstup FO procesoru i konfigurak neni nic jineho nez text.
user avatar dejf
Odpovědět
Re: Definice XML
2. 01. 2005, 17:46:31
Hm, mam pocit, ze tohle je spis popis toho co umi HTML 1.0, nez definice XML. XML zadnou kloudnou a srozumitelnou definici, ktera by byla kratka azaroven se nedala pouzit i na HTML proste nema. XML ma sice oproti HTML par vyhod, ale jde spis o aplikace s nim pracujici (wrappery a to co se na ne navaze), nez o XML; tedy to co je mozne v XML, lze po drobnem rozsireni udelat i s HTML.
XML je pokud vim jen definice, ze dokument na zacatku rekne do jakeho formatu patri a ze se tam pouzivaji <> tagy, vse ostatni zalezi na uzivateli/programatorovi, pokud se to zazipuje, situace se lehce zamota, protoze dany komprimacni algoritmus uz nemusi byt vsude dostupny a prenositelnost se silne snizuje.
user avatar dan
Odpovědět
Re: Definice XML
2. 01. 2005, 18:34:19
XML a HTML pouzivaji podobne znackovani, jinak je to uplne o necem jinem. ALe to je na dlouhe vysvetlovani, doporucuji precist si treba knihu Jirka Koska.

ZIP je dostupny vsude, protoze se pouziva normalizovana a dokumentovana verze ZIPu. To neni zadny rar, pkzip nebo jine nedokumentovane a patentovane zalezitosti. Pokud nekde zip neni, tak je mozne jej snadno implementovat.
user avatar izsak
Odpovědět
XML
17. 11. 2004, 09:28:39
Však to je správne. Ktorá časť sa vám nepáči?
user avatar Michal Čihař
Odpovědět
Přípony
17. 11. 2004, 14:12:51
Ve specifikace OpenOffice.org (http://specs.openoffice.org/appwide/fileIO/FileFormatNames.sxw), je pro vzorce (OpenDocument Formula) uvedená přípona odf a vůbec naprosto jiné přípony než zde v článku :-)
user avatar dan
Odpovědět
Re: Přípony
17. 11. 2004, 16:12:18
To je velmi trefny komentar. A pravdivy, to je proste vyvoj, ja jsem psal pripony podle verze OOo, kterou mam instalovanou, kdezto zmineny dokument to meni.

Na svoji obhajobu musim rict, ze se pripony podle changelogu zmenily mezi 29. rijnem a 11. listopadem, coz je bezmala vcera.
user avatar Petr G.
Odpovědět
Přípony
18. 11. 2004, 00:26:42
Tipl bych, ze misto

prezentace - otp
šablona prezentace - odp

ma byt:

prezentace - odp
šablona prezentace - otp
user avatar dan
Odpovědět
Re: Přípony
18. 11. 2004, 00:38:35
Jo
user avatar Lubomír Čevela
Odpovědět
Souhlas, ale bez nadšení
9. 05. 2005, 10:28:16
Z pohledu běžných uživatelů více formátů znamená pouze více komplikací a nepříjemností. Z mé zkušenosti vyplývá, že běžný uživatel tak tak v OOo zvládne Uložit jako ->MS Word. Z nového formátu tedy z čistě uživatelského pohledu nejsem příliš nadšen, zvláště když se technicky jedná o velice podobný formát jako je SXW.

On se totiž formát StarOffice / OOo zásadně mění už podruhé. Dobře si vzpomínám na maratón konverze dokumentů z formátu StarOffice 5.1 do novějšího SXW v OOo 1.0. A též si vzpomínám na problémy s češtinou, rozhozeným formátováním, nabouranými tabulkami apod. Já jako programátor potřebu změny celkem chápu, ale vysvětlujte to BFU. Výsledkem dle mého mínění bude, že uživatelé se po této změně budou novým formátům vyhýbat a nastavovat defaultní formáty v OOo na DOC. Ten se alespoň tak často a od základu nemění.

Na druhou stranu se nám stálým uživatelům OOo nezbude než přizpůsobit a doufat, že k další "převratné" změně formátu v dohledné době nedojde.
user avatar Jarda
Odpovědět
Tak me tak napada, ze kdyz M$
9. 05. 2005, 19:33:22
Tak me tak napada, ze kdyz M$ implementuje novy oo.org format, ze by ho, jako obvykle, mohl implementovat tak nejak po svem, se vselijakymi chybami a rozsirenimi. BFU pak rekne, ze oo.org je na dve veci, protoze to pulku dokumentu neotevre a ze pouzivat se da jenom M$ Word, ktery otevre uplne vsechno. Takze by se mnoho zmenit nemuselo.
user avatar Michal
Odpovědět
Změna formátu souboru ve verzi 2.0
24. 03. 2010, 10:57:20
Ahoj, pěkný článek, kdyby jste někdy potřebovali něco vědět o dalších formátech nebo příponách souborů, tak jsem našel dobrou stránku na url file-extensions.org.

Přidat názor

 

Nejsou podporovány žádné značky, komentáře jsou jen čistě textové. Více o diskuzích najdete v nápovědě. Diskuzi můžete sledovat pomocí RSS kanálu.

 
Robert Vojta

Robert Vojta