XHTML: Metatiedot 2008-01-01 02:35
| Kuvaus: | Ennen sivun varsinaista sisältöä annetaan muutamia dokumenttia itseään koskevia metatietoja mm. sitä näyttävää selainta tai hakukoneita varten. Näitä ovat mm. käytetty merkkausstandardi, kieli ja merkistö. EsimerkkiXHTML-dokumentin alku ennen sivun varsinaista sisältöä voisi näyttää vaikkapa tältä: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fi" lang="fi"> <head> <title>XHTML | Metatiedot</title> <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" /> <meta name="description" content="XHTML-asiakirjan metatiedot." /> <meta name="robots" content="index,follow" /> </head> Metatietoja kertovat elementit ja niiden attribuutit saattavat aluksi vaikuttaa hiukan vaikeaselkoisilta, eikä niiden vaikutus välttämättä näy suoraan. Katsotaan merkintöjä rivi riviltä. DokumenttityyppiKäytetty merkkausstandardi merkitään ensimmäiselle riville, aivan XHTML-dokumentin alkuun. Tässä oppaassa käytetty merkkausstandardi on XHTML 1.0 Transitional. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> Oikeastaan tässä esitetty noudattaa yhtä poikkeusta (linkin avaaminen uuteen ikkunaan) lukuunottamatta XHTML 1.0 Strict -standardia. Nimiavaruus ja asiakirjan kieliSeuraavaksi kerrotaan asiakirjan merkkauksessa käytetty nimiavaruus ja asiakirjan kieli.
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fi" lang="fi"> Mikäli asiakirja sisältää myös pääkielestä poikkeavia osioita, voidaan muita kieliä sisältävät elementit merkitä niitä kuvaavilla kieliattribuuteilla. Kielikoodeja: fi (suomi), sv (ruotsi), sv-FI (suomenruotsi), en (englanti), en-GB (brittienglanti), en-US (amerikanenglanti), fr (ranska), de (saksa), it (italia), nl (hollanti), el (kreikka), es (espanja), pt (portugali), ru (venäjä), ar (arabia), he (heprea), zh (kiina), ja (japani), hi (hindi), ur (urdu), sa (sanskriitti), la (latina).
head-elementti <head> ... </head>head-elementtiin sisällytetään erilaisia sivun käsittelyyn liittyviä metatietoja: koodaus, css-tyylit jne. Nämä toimivat ohjeina mm. selaimille ja hakukoneille siitä kuinka sivuja tulee käsitellä. Usein käytetään esimerkiksi meta-elementtiä johon voidaan liittää attribuutteja, kuten name kerrotaan kuvattavan metainformaation nimi, ja attribuutilla content annetaan varsinainen metainformaatio. Otsikko <title>...</title>Selaimen otsikkorivillä näkyvä sivun otsikko kerrotaan title-elementissä, joka tätyy sijoittaa head-elementissä ensimmäiseksi. <head> <title>XHTML-elementit</title> </head> Merkistö <meta http-equiv="Content-Type" content="..." />Että selain osaa näyttää sivun merkit oikein, on kerrottava mikä merkistö sivulla on käytössä. Skandinaaviset merkit sisältävä länsimainen merkistö ISO-8859-1 kerrotaan seuraavasti: <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" /> Periaatteesa kannattaisi käyttää kaikessa julkaisemisessa yksiselitteisesti UTF-8-merkistöä (joka sisältää periaatteessa kaikki eri merkistöt), mutta koska joissakin Windowsin perusohjelmissa tässä saattaa tulla turhia yllätyksiä, pitäydytään näissä ohjeissa ISO-8859-1:ssä.
MIME-tyyppiEdellisessä esimerkissä oli yksi ongelmallinen kohta. Siinä annettiin merkistökoodauksen ohella asiakirjan MIME-tyypiksi 'text/html', eli asiakirja siirretään HTML:nä. Tarkalleen ottaen XHTML-asiakirja pitäisi siirtää XML:nä MIME-tyypillä 'application/xhtml+xml', mutta Internet Explorer 7 ei tätä tue. Toistaiseksi kannattaa käyttää esimerkin merkintätapaa, mutta asia on hyvä tiedostaa.
Hakukoneet <meta name="description" content="..." /> <meta name="robots" content="..." />Hakukoneet indeksoivat sivuja mm. rakenteellisten elementtien sekä sivulle osoittavien linkkien perusteella. Aiemmin metatiedoissa annettiin avainsanoja ja kuvauksia, mutta väärinkäytöksien vuoksi hakukoneet eivät niitä enää juuri huomioi. Sivusta voidaan kuitenkin antaa lyhyt tiivistelmä joka toisinaan näytetään hakutuloksen yhteydessä. <meta name="description" content="XHTML-asiakirjan metatiedot." /> Hakukoneille voidaan antaa ohjeet siitä, tuleeko niiden sisällyttää sivua tietokantaansa (index/noindex) jolloin se voi saada hakutuloksia, ja tuleeko hakukoneen seurata sivulla olevia linkkejä (follow/nofollow). Indeksointi ja linkkien seuraaminen lienee oletus, mutta sen voi myös määrittää: <meta name="robots" content="index,follow" /> Indeksointi ja linkkien seuraaminen estetään: <meta name="robots" content="noindex,nofollow" /> Voidaan myöss määrittää voiko hakukone tallentaa välimuistiinsa kopion sivusta. Seuraava esimerkki kieltää sivun arkistoinnin välimuistiin, mutta antaa ohjeen sisällyttää sivu tietokantaan ja seurata sivulla olevia linkkejä. <meta name="robots" content="noarchive,index,follow" /> robots.txtHakukoneita voi ohjeistaa myös juurihakemistoon sijoitettavalla robots.txt -tiedostolla. Tyylitiedostot ja scriptithead-elementtiin voidaan myös upottaa CSS:ää style-elementtiin, tai linkittää ulkoinen CSS-tyylitiedosto link-elementillä. JavaScriptiä voi kirjoittaa script-elementin sisälle. CSS:n lisäämistä käsitellään myöhemmin. |
| Luokka: | web » xhtml |
| Avainsanat: | xhtml, meta, mime, merkistö, kieli, hakukone, SEO, Google |