Fai conoscere il tuo sito con le sitemap

Il posizionamento ottimale di un sito WEB passa molto spesso per la generazione e segnalazione della sitemap del proprio sito. Ma a cosa serve la “mappa di un sito”?

Secondo sitemap.org[…] sono un modo semplice per i webmaster per informare i motori di ricerca delle pagine dei propri siti disponibili per la scansione. Nella sua forma più semplice una sitemap è un file XML che lista gli URL di un sito, uniti a meta-dati addizionali per ognuno di essi (quando è stato aggiornato, ogni quanto cambia, quanto è importante relativamente agli altri) in modo tale che i motori di ricerca possano scansionare in modo più intelligente il sito.

Le sitemap quindi listano gli URL del sito, limitatamente a quelli significativi per l’utente, e contengono informazioni descrittive degli stessi in termini di frequenza di update: sono tipicamente dinamiche, ovvero vengono aggiornate in base a come varia il sito in termini di struttura e contenuti.

Le mappe possono essere anche generate con appositi tool (WordPress, Joomla!, Drupal ed i principali portali di e-commerce dispongono di moduli per generarle senza toccare una riga di codice), ed esistono inoltre delle applicazioni web gratuite che permettono di generare staticamente il contenuto di questi “file indice” in XML. Questo va solitamente bene per siti di piccole dimensioni (portali personali, landing-page promozionali), e meno bene per quelli che dispongono di contenuti molto variabili nel tempo (e-commerce). Come regola generale, comunque, è bene disporre di una procedura automatizzata per generarle, in modo tale che la copertura del crawler di Google sia sempre ottimizzata.

Un problema abbastanza diffuso in tali “aggeggi”, tuttavia, è la lentezza con cui gli URL vengono scansionati, motivo per cui si preferisce utilizzare direttamente i feed RSS, che producono uno standard XML pienamente compatibile con esse: si tenga presente pero’ che una singola sitemap non puo’ essere di taglia superiore ai 10 MB, e anche fornendo versioni compresse (.gz) non possono superare i 50.000 URL in un singolo file. Quando le sitemap crescono troppo si aggira il limite con le “sitemap index” che non sono altro che liste (sempre in XML) delle varie sitemap che compongono il sito. Drupal, ad esempio, dispone di un’ottimo modulo per siti di dimensioni grandi, che ha il vantaggio di non richiedere eccessive competenze per essere configurato.

Il vero problema rimane il fatto che la scansione è molto lenta e richiede notevoli risorse al server, per cui è preferibile sottoporre questo carico in momenti in cui il sito è poco visitato. Per chi fosse interessato il protocollo delle sitemap è ovviamente open ed è descritto in sitemap.org.

Si ringrazia cod_gabriel per aver concesso l’illustrazione in Creative Commons.

No Responses

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *