Salve, sono Francesco Caccavella di HTML.it e oggi vi vorrei parlare di un sistema semplice ed efficace per segnalare ad un motore di ricerca tutte le pagine presenti in un sito. Sto parlando delle Sitemap, dei particolari tipi di file che consentono con il minimo sforzo possibile di migliorare l'indicizzazione di un sito Web.
Il concetto di Sitemap si avvicina molto al concetto della tradizionale mappa del sito che siamo abituati a visualizzare su molte pagine del Web. Si tratta infatti di un protocollo, ossia un set di istruzioni condivise, che elenca le pagine contenute nel sito per favorirne la ricerca e l'indicizzazione.
L'elenco è scritto in un formato che viene letto e interpretato dai principali motori di ricerca. Ma una sitemap fa anche qualcosa di più.
Una sitemap è in grado infatti di contenere diverse informazioni aggiuntive, chiamate metadati, su ogni singola pagina conservata nel sito: quando è stata aggiornata per l'ultima volta, quanto spesso si presume che essa cambi e quanto essa è importante all'interno della gerarchia del sito.
Generalmente queste informazioni sono inviate al motore per mezzo di semplici file XML, spesso generati automaticamente da script o applicazioni specifiche.
Il protocollo, le cui prime basi risalgono a diversi anni fa, è stato inizialmente promosso da Google, che per primo lo ha adottato nel giugno del 2005 all'interno dei suoi Webmaster Tools. Il protocollo è stato rilasciato con una licenza copyleft di tipo Creative Commons, cosa che ha consentito a tutti di poterlo utilizzare per i propri fini.
Sitemap è oggi supportato pienamente da Google, Yahoo, Live Search, il motore di Microsoft, e Ask.com: ciò significa che utilizzando un'unica Sitemap si avranno vantaggi su tutti i principali motori di ricerca del Web.
La Sitemap, è bene chiarirlo, non favorirà direttamente il raggiungimento di più alte posizioni all'interno della pagina dei risultati. L'uso di questo protocollo serve solamente a segnalare al motore le pagine presenti sul sito che, se accettate, verranno successivamente processate secondo i tradizionali algoritmi di indicizzazione.
È chiaro però che favorendo l'emersione sui motori di pagine nascoste o poco raggiungibili si migliora, e non poco, la visibilità globale del proprio sito.
Per utilizzare la Sitemap si deve in primo luogo crearne una utilizzando i molti servizi o software disponibili online. Il formato standard è l'XML. All'interno di un file XML andrà dunque inserito l'elenco delle pagine conservate nel sito e tutte le eventuali informazioni addizioni.
Il file XML così creato dovrà poi essere incluso all'interno della radice, la root, del proprio sito Web.
Per la creazione di una Sitemap esistono diversi strumenti online. Google stesso mette a disposizione un Sitemap Generator, un programma scritto in Python che è in grado di estrarre dai dati di log del Web Server tutte gli URL registrate e di convertirle nel formato Sitemap.
È facile inoltre trovare online diversi script Asp o Php che creano una Sitemap a partire da dati conservati in database mentre molti blog, forum o CMS hanno già a disposizione plug-in adatti allo stesso scopo. Si possono infine usare sia servizi online, sia software.
Dopo aver creato il file rimane un solo passaggio: segnalarne la presenza al motore. Il modo più semplice è inserire l'istruzione Sitemap: http://www.miosito.ext/sitemap.xml all'interno del file robots.txt, file che andrà successivamente incluso anch'esso nella radice del sito.
Google invece rende più semplice la segnalazione per mezzo del pannello di controllo incluso nei Webmaster Tools e stessa cosa fa Yahoo! con il Site Explorer.