Il formato Sitemap nel dettaglio



Per comprendere al meglio questa lezione è essenziale qualche nozione di base sul formato XML. Se siete completamente a digiuno consiglio la lettura di una guida all'XML prima di proseguire.

Sul sito ufficiale è disponibile una dettagliata panoramica della struttura XML del formato Sitemap. Vediamo comunque alcuni dettagli essenziali.

Esempio di una Sitemap XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

L'esempio sopra riportato rappresenta una sitemap contenente una sola URL. Vediamo gli elementi che la compongono. I tag opzionali sono formattati in italico.

Elementi di una sitemap

Dichiarazione XML

La stringa iniziale dichiara che si tratta di un documento XML con codifica dei caratteri UTF-8.

<urlset>

L'<urlset> è il nodo root della sitemap e rappresenta un tag obbligatorio. Al suo interno è incluso l'intero contenuto della sitemap.

<url>

Il tag <url> raggruppa le informazioni appartenenti ad una singola URL del sito. L'URL può rappresentare l'indirizzo di una pagina web, di un feed, di un video o una risorsa multimediale. Per ciascun indirizzo che si vuole segnalare ai motori di ricerca è necessario inserire un tag URL all'interno della sitemap, contenente un tag <loc>.

Di norma è consuetudine indicare le pagine web, i feed XML, eventualmente documenti e risorse multimediali.

<loc>

Il vero indirizzo della risorsa è indicato dal tag <loc>, figlio del nodo <url>. Si tratta di un tag obbligatorio e punta all'indirizzo completo della risorsa. Deve includere il protocollo e la sua lunghezza non può superare i 2048 caratteri.

Il tag <url> ammette, oltre a <loc>, tre tag opzionali.

<lastmod>

Rappresenta la data di ultima modifica della pagina, se conosciuta. Il formato è YYYY-MM-DD.

<changefreq>

Rappresenta la frequenza di modifica della pagina. I valori sono:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

<priority>

Rappresenta la priorità, ovvero l'importanza, di questa pagina rispetto al resto delle pagine all'interno del sito. Il valore è contenuto in un range tra 0.0 (importanza nulla) e 1.0 (importanza massima). Se non è specificato, di default, il valore assegnato è 0.5.

Esempio reale di una sitemap

Ora che conosciamo gli elementi essenziali di una sitemap, proviamo a costruirne una. Il nostro sito è molto semplice, offre essenzialmente 3 pagine:

  1. http://www.example.org/ - la homepage
  2. http://www.example.org/about - una pagina informativa
  3. http://www.example.org/subscribe - una pagina di iscrizione ad una newsletter

Tralasciamo per ora l'utilità che una sitemap può avere su un sito di questo genere. Considerando quanto appena indicato, la nostra sitemap si presenterà più o meno così:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.org/</loc>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.example.org/subscribe</loc>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.org/about</loc>
</url>
</urlset>

Il nostro è un sito di poche pretese, quindi la sitemap è molto semplice. Tuttavia, è sufficiente per fornirvi una indicazione basilare sulla sua struttura. Poiché non mi piace reinventare l'acqua calda, vi invito ad approfondire la lettura delle specifiche del formato sitemap direttamente sul sito ufficiale.

Sitemap = Consiglio

È importante ricordare che lo scopo della Sitemap è quello di suggerire le URL del vostro sito al motore di ricerca. Il crawler, comunque, agirà secondo propria iniziativa. Dunque, falsare un valore, ad esempio inserire un aggiornamento orario per una pagina statica, non produrrà alcun vantaggio.

Ultimi articoli Web marketing

Google Panda: cos'è, come difendersi

Tutto quello che c'è da sapere su Google Panda: cosa è, come viene...

Studio e monitoraggio delle SERP con Advanced Web Ranking

Un tool per monitorare keyword e risultati di nelle SERP e studiare...

Google Analytics nuova versione: i cambiamenti

Esploriamo la nuova versione di Google Analytics e vediamo i...

Caffeine e MayDay, cosa è cambiato nell'indice di Google?

Le novità introdotte nell'algoritmo di indicizzazione di Google

Mobile web advertising: i principali modelli

I principali modelli per veicolare pubblicità attraverso i telefoni...

Altri articoli

Guide Web marketing

Guida Google Analytics

Percorso pratico per la creazione e gestione di un account...

Guida Google AdWords

Guida alla piattaforma di advertising di Google. Per creare annunci...

Guida Google AdSense

Scopriamo le funzioni più importanti per guadagnare online, con il...

Altre guide

Newsletter @Web marketing e SEO

Ogni giovedì, direttamente nella tua e-mail: notizie e articoli sui motori di ricerca rivolte a SEO e Webmaster.

Iscriviti alla newsletter

Altre newsletter

Corsi in aula

Corso Google AdWords Base

25 Giugno 2012 a Milano
Disponibilità: 7 Posti

Corso Posizionamento Motori di Ricerca (SEO)

29 Giugno 2012 a Milano
Disponibilità: 5 Posti

Corso Google AdWords Base

05 Giugno 2012 a Roma
Disponibilità: 7 Posti

Corso Posizionamento Motori di Ricerca (SEO)

19 Giugno 2012 a Roma
Disponibilità: 6 Posti