HTML til XML: Utvide Markup Language
Et stort flertall av mennesker som er i datanæringen vet hva HTML (Hypertext Markup Language) er. Det har eksistert i svært lang tid og har blitt brukt mye i websidedesign at selv om det allerede er sjelden å se nettsider skrevet utelukkende i HTML, regnes det som grunnleggende kunnskap i hele prosessen med å lage websider.
XML (Extensible Markup Language), derimot, er en nyere og mye mindre kjent teknologi sammenlignet med HTML. XML ble opprettet i 1996 av en gruppe på 11 personer som en tilpasning av SGML (Standard Generalized Markup Language) for bruk på World Wide Web. XML er et mer strukturert og strenge oppslagsspråk sammenlignet med HTML som tillot brukere å lage egne definisjoner og modulær kode. Det ble laget for å lage en standardisert spesifikasjon for å skape tilpassede markup-språk som nå er kjent som XML-dialekter. Det kan ikke være umiddelbart tydelig, men tilpassede oppslagsspråk som HTML, RSS og Atom ble alle bygget fra XML som en metode for å øke brukervennligheten på internett.
Siden XML ble tilpasset fra SGML, inneholder den mye kode og teknikker som opprinnelig var fra SGML som dens strenghet og en såkalt velformethet. Egenskaper som strekker seg til etterkommerne av XML. Visse regler bør alltid vurderes når du lager kode som er basert på XML. Det er enda en velformet erklæring med hvert dokument for å angi hvilken type dokument det er og hvilke regler bør behandlingen foregå på. Dette er veldig forskjellig i forhold til den veldig avslappede kodingen som brukes i HTML.
Når du behandler en HTML-side, vil du ha noen form for resultat uansett hva inngangen var. HTML-prosessoren forsøker å gi mening om hva som var i dokumentet og gjør en utgang som den mener best representerer inngangsdataene. Dette er ikke sant kommer til XML. XML benytter en feilhåndteringsmekanisme som regnes som "drakonisk". Når XML-prosessoren møter noe som den ikke kan forstå, oppretter den bare en feilrapport og avslutter behandlingen av filen. Det gir deg en feilboks og ikke noe resultat i det hele tatt ulikt i HTML.
For å sette det i perspektiv er HTML et oppslagsspråk som brukes til raskt og enkelt å vise noen form for utgang. Det går ikke med korrektheten av inngangen, og prøver bare å lage en utgang basert på inngangsfilen. XML er derimot et svært strenge oppslagsspråk som vanligvis ikke brukes til å lage innhold. Dens primære bruk er som et verktøy for å skape andre oppmerkningsspråk som skaper det nødvendige innholdet.