XML vs HTML
XML står for Eksternt Markup Language. Det er definert i XML 1.0 spesifikasjonen, som er utviklet av W3C (World Wide Web Consortium). XML gir en standard måte, som også er enkel, for å kode data og tekst slik at innholdet kan utveksles på tvers av driverens maskinvare, operativsystemer og applikasjoner med lite menneskelig innblanding. HyperText Markup Language, allment kjent som HTML, er også et ledende oppslagsspråk for nettsider. HTML er den grunnleggende byggestenen på nettsider. Webleser leser HTML-dokumentet og komponerer dem i visuelle eller hørbare nettsider.
XML
XML er et oppslagsspråk som brukes til å overføre data og tekst mellom driverens maskinvare, operativsystemer og applikasjoner med lite menneskelig inngrep. XML gir koder, attributter og elementstrukturer som kan brukes til å gi kontekstinformasjon. Denne kontekstinformasjonen kan brukes til å dekode innholdets betydning. Dette gjør det mulig å utvikle effektive søkemotorer og utføre datautvinning på dataene. Videre er tradisjonelle relasjonsdatabaser egnet som XML-data fordi de kunne organiseres i rader og kolonner, men XML gir mindre støtte for data med rikt innhold som lyd, video, komplekse dokumenter, etc. XML-databaser lagrer data i en strukturert, hierarkisk form som gjør at forespørsler kan behandles mer effektivt. XML-koder er ikke forhåndsdefinert, og brukerne kan definere nye koder og dokumentstrukturer. Også nye nett språk som RSS, Atom, SOAP og XHTM ble opprettet ved hjelp av XML.
HTML
HTML som nevnt tidligere er et oppslagsspråk som har et sett med mark-up-koder. HTML-merketiketter, som vanligvis kalles HTML-koder, brukes til å beskrive nettsider. Typiske HTML-dokumenter inneholder HTML-koder og vanlig tekst som kreves for innholdet på nettsider. HTML-koder kan identifiseres enkelt i et HTML-dokument, siden de er omgitt av vinkelbeslag (f.eks.). HTML-koder legges vanligvis inn i et dokument i par, der den første taggen er starttaggen (f.eks. ) og den andre taggen er sluttmerket (f.eks. ). Oppgaven til en nettleser (for eksempel Internet Explorer, Firefox, etc.) er å lese et HTML-dokument og vise det som en nettside. Nettleseren bruker HTML-kodene til å tolke innholdet på siden, men HTML-kodene selv vises ikke av nettleseren. HTML-sider kan legge inn bilder, objekter og skript skrevet på språk som JavaScript. Videre kan HTML brukes til å lage interaktive skjemaer.
Forskjellen mellom XML og HTML
Selv om XML og HTML er begge oppslagsspråk, er det noen grunnleggende forskjeller mellom dem. HTML består hovedsakelig av koder som definerer innholdet av innholdet, mens XML-koder generelt definerer strukturen og innholdet i dataene (og det faktiske utseendet er definert av et tilhørende stilark). For det andre er XML utvidbart, siden XML-koder kan defineres av brukeren for et bestemt program, mens HTML-koder er definert av W3C.