Fyzická struktura dokumentu

Úvod
XML
Vývoj značkování
Struktura XML dokumentu
Fyzická struktura dokumentu
Logická struktura dokumentu
Dokument
Jmenné prostory v XML
XML versus SGML
Motivace XML

Counter

Každý XML dokument má nějakou fyzickou strukturu, tj. je nějak fyzicky zaznamenán (např. v jednom nebo více souborech na počítači). Tyto paměťové jednotky, ve kterých je dokument uložen se nazývají entity. Každá entita má nějaký obsah a nějaký identifikátor (např. URI). Jedna entita má mezi ostatními výjimečné postavení. Jedná se o tzv. entitu dokumentu (document entity), která je výchozím bodem při fyzickém rozčleňování dokumentu. Entity jsou vzájemně propojeny pomocí odkazů.

Existují dva základní typy fyzických entit. Jedná se o entity analyzované (parsed entities) a o entity neanalyzované (unparsed entities). Říkáme-li o entitě, že je analyzovaná, pak se na ní můžeme dívat jako na nedílnou součást entity dokumentu. Odkaz na analyzovanou entitu je nahrazen jejím obsahem. Analyzovaná entita musí být správně vytvořeným XML dokumentem. Oproti tomu neanalyzované entity obsahují data, která nejsou přímou součástí XML dokumentu. Jedná se např. o různé obrázky, textové soubory, hudbu, atp. Tyto entity nemusí splňovat požadavky na správně vytvořený XML dokument.

Entity jsou definovány v části DTD (kapitola ). Na analyzovanou entitu se odkazuje pomocí sekvence tvaru &nazev_entity;.