XHTML: Metatiedot 2008-01-01 02:35

Kuvaus:

Ennen sivun varsinaista sisältöä annetaan muutamia dokumenttia itseään koskevia metatietoja mm. sitä näyttävää selainta tai hakukoneita varten. Näitä ovat mm. käytetty merkkausstandardi, kieli ja merkistö.

Esimerkki

XHTML-dokumentin alku ennen sivun varsinaista sisältöä voisi näyttää vaikkapa tältä:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fi" lang="fi">
<head>
  <title>XHTML | Metatiedot</title>
  <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
  <meta name="description" content="XHTML-asiakirjan metatiedot." />
  <meta name="robots" content="index,follow" />
</head>

Metatietoja kertovat elementit ja niiden attribuutit saattavat aluksi vaikuttaa hiukan vaikeaselkoisilta, eikä niiden vaikutus välttämättä näy suoraan. Katsotaan merkintöjä rivi riviltä.

Dokumenttityyppi

Käytetty merkkausstandardi merkitään ensimmäiselle riville, aivan XHTML-dokumentin alkuun. Tässä oppaassa käytetty merkkausstandardi on XHTML 1.0 Transitional.

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

Oikeastaan tässä esitetty noudattaa yhtä poikkeusta (linkin avaaminen uuteen ikkunaan) lukuunottamatta XHTML 1.0 Strict -standardia.

Nimiavaruus ja asiakirjan kieli

Seuraavaksi kerrotaan asiakirjan merkkauksessa käytetty nimiavaruus ja asiakirjan kieli.

  • Nimiavaruus tarkoittaa asiakirjan kaikki elementit kuvaavan luettelon nimeä, se annetaan aloittavassa html-tunnisteessa xmlns-attribuutilla.
  • Asiakirjan kieli kerrotaan täydentämällä aloittavaa html-tunnistetta attribuuteilla xml:lang ja lang. (HTML-attribuutti lang annetaan taaksepäin yhteensopivuuden vuoksi.)
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fi" lang="fi">

Mikäli asiakirja sisältää myös pääkielestä poikkeavia osioita, voidaan muita kieliä sisältävät elementit merkitä niitä kuvaavilla kieliattribuuteilla.

Kielikoodeja: fi (suomi), sv (ruotsi), sv-FI (suomenruotsi), en (englanti), en-GB (brittienglanti), en-US (amerikanenglanti), fr (ranska), de (saksa), it (italia), nl (hollanti), el (kreikka), es (espanja), pt (portugali), ru (venäjä), ar (arabia), he (heprea), zh (kiina), ja (japani), hi (hindi), ur (urdu), sa (sanskriitti), la (latina).

Kielen merkkaaminen
Kielen merkitsemisestä, ja muutamien tavallisten kielten kielikoodit.
Code for the Representation of the Names of Languages. From ISO 639, revised 1989.
Kattava lista kielikoodeista.

head-elementti <head> ... </head>

head-elementtiin sisällytetään erilaisia sivun käsittelyyn liittyviä metatietoja: koodaus, css-tyylit jne. Nämä toimivat ohjeina mm. selaimille ja hakukoneille siitä kuinka sivuja tulee käsitellä.

Usein käytetään esimerkiksi meta-elementtiä johon voidaan liittää attribuutteja, kuten name kerrotaan kuvattavan metainformaation nimi, ja attribuutilla content annetaan varsinainen metainformaatio.

Otsikko <title>...</title>

Selaimen otsikkorivillä näkyvä sivun otsikko kerrotaan title-elementissä, joka tätyy sijoittaa head-elementissä ensimmäiseksi.

<head>
  <title>XHTML-elementit</title>
</head>

Merkistö <meta http-equiv="Content-Type" content="..." />

Että selain osaa näyttää sivun merkit oikein, on kerrottava mikä merkistö sivulla on käytössä. Skandinaaviset merkit sisältävä länsimainen merkistö ISO-8859-1 kerrotaan seuraavasti:

<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />

Periaatteesa kannattaisi käyttää kaikessa julkaisemisessa yksiselitteisesti UTF-8-merkistöä (joka sisältää periaatteessa kaikki eri merkistöt), mutta koska joissakin Windowsin perusohjelmissa tässä saattaa tulla turhia yllätyksiä, pitäydytään näissä ohjeissa ISO-8859-1:ssä.

The Definitive Guide to Web Character Encoding
ISO 8859-1 länsimaisille kielille, muille omansa ISO 8859-sarjasta, UTF-8 monikielisille.
Declaring The XHTML File Encoding
Oikea koodaus käytetyn merkistön mukaan.

MIME-tyyppi

Edellisessä esimerkissä oli yksi ongelmallinen kohta. Siinä annettiin merkistökoodauksen ohella asiakirjan MIME-tyypiksi 'text/html', eli asiakirja siirretään HTML:nä. Tarkalleen ottaen XHTML-asiakirja pitäisi siirtää XML:nä MIME-tyypillä 'application/xhtml+xml', mutta Internet Explorer 7 ei tätä tue. Toistaiseksi kannattaa käyttää esimerkin merkintätapaa, mutta asia on hyvä tiedostaa.

XHTML Media Types
Eri mediatyypit ja XHTML W3C:n suosituksissa.
Serving XHTML with the Right MIME Type588
XHTML:n oikea MIME-tyyppi.
XHTML media type test - results
MIME-tyyppien tuki eri selaimilla.
XHTML Frequently Answered Questions
Ks. kohta "Does Microsoft Internet Explorer accept the media type application/xhtml+xml?"

Hakukoneet <meta name="description" content="..." /> <meta name="robots" content="..." />

Hakukoneet indeksoivat sivuja mm. rakenteellisten elementtien sekä sivulle osoittavien linkkien perusteella. Aiemmin metatiedoissa annettiin avainsanoja ja kuvauksia, mutta väärinkäytöksien vuoksi hakukoneet eivät niitä enää juuri huomioi. Sivusta voidaan kuitenkin antaa lyhyt tiivistelmä joka toisinaan näytetään hakutuloksen yhteydessä.

<meta name="description" content="XHTML-asiakirjan metatiedot." />

Hakukoneille voidaan antaa ohjeet siitä, tuleeko niiden sisällyttää sivua tietokantaansa (index/noindex) jolloin se voi saada hakutuloksia, ja tuleeko hakukoneen seurata sivulla olevia linkkejä (follow/nofollow).

Indeksointi ja linkkien seuraaminen lienee oletus, mutta sen voi myös määrittää:

<meta name="robots" content="index,follow" />

Indeksointi ja linkkien seuraaminen estetään:

<meta name="robots" content="noindex,nofollow" />

Voidaan myöss määrittää voiko hakukone tallentaa välimuistiinsa kopion sivusta. Seuraava esimerkki kieltää sivun arkistoinnin välimuistiin, mutta antaa ohjeen sisällyttää sivu tietokantaan ja seurata sivulla olevia linkkejä.

<meta name="robots" content="noarchive,index,follow" />

robots.txt

Hakukoneita voi ohjeistaa myös juurihakemistoon sijoitettavalla robots.txt -tiedostolla.

Tyylitiedostot ja scriptit

head-elementtiin voidaan myös upottaa CSS:ää style-elementtiin, tai linkittää ulkoinen CSS-tyylitiedosto link-elementillä. JavaScriptiä voi kirjoittaa script-elementin sisälle. CSS:n lisäämistä käsitellään myöhemmin.

Luokka: »
Avainsanat:, , , , , , ,
http://raulihaverinen.fi/verkko-opas/?id=99