Sei qui: HOME PAGESpecialiWebmaster

Stampa questa pagina

HOME PAGE

I META TAG e il file ROBOTS.TXT


I Meta TAG

Il 95% delle persone guardano i primi 20 risultati di ricerca, è importante quindi la posizione nei motori.

Se si vuole evidenziare il proprio sito web bisogna saper scrivere correttamente i meta tag.

I meta tag vanno inseriti nella testa della pagina web, tra i codici < head > e < / head >.

Anche se i meta più importanti sono la Descrizione e le Parole chiavi tutti i codici hanno un significato e portano vantaggi se scritti correttamente; ecco cosa bisogna scrivere:

Titolo
il titolo della pagina web dovrebbe essere anche nella testa della pagina da indicizzare

esempio:< title>ComputerMania< / title > 

Descrizione 
è usato per dare una descrizione corta dei contenuti della Sua pagina web, è usato dai motori di ricerca nei risultati di ricerca come una descrizione di quello che contiene la pagina. Comunque, molti motori di ricerca esporranno solamente i primi 20 caratteri. 

esempio:<meta name="description" content="Il sito offre una selezione tra i migliori trucchi di informatica e le news più interessanti del panorama IT. Sono presenti inoltre collegamenti, informazioni sull'autore, servizi, files da scaricare e tanto altro.">

Parole chiavi
I motori trovano il sito web con un elenco di parole chiavi, separate da virgole. La maggior parte di motori di ricerca schederà i primi 64 caratteri di questo Meta.

esempio:<meta name="keywords" content="download, webmaster, provider, trucchi, tutorials, design, internet.">

Contenuto 
Questo è usato per dare alla pagina web una stima per l'appropriatezza ai bambini. Le stime sono, generale, maturo, limitato, e 14 anni.

esempio:<meta name="rating" content="GENERAL">

Autore
Questo è usato per identificare l'autore della pagina web.

esempio:<meta name="author" content="Vega79">

Diritti d'autore 
Questo identifica alcune informazioni sul diritto d'autore per la pagina web.

esempio:<meta name="copyright" content="e-mail@mail.xx">

Rivisitare dopo 
Il rivisitare-dopo è un meta tag utile per pagine dove contenti variano spesso e dice al motore di ricerca ogni quanti giorni rivisitare la pagina web.

esempio:<meta name="revisit-after" content="25 days">

Scadenza 
Questo meta è usato da webmaster responsabili per far sapere al motore di ricerca quando la pagina scade e può essere rimossa dall'elenco di motori di ricerca. 

esempio:< scade = "scade" content = "mai" >

Interesse o distribuzione 
Dice il motore di ricerca che la pagina è di interesse globale, locale, per regionali, per Uso Interno o altro.

esempio:<meta name="robots" content="ALL">
 

a

Robots.txt: la guida per i motori di ricerca

Il file robots.txt è un file di testo richiesto dalla quasi totalità degli spider o robot dei motori di ricerca per conoscere quali file o cartelle devono essere indicizzate e quali no. Tuttavia, non tutti gli spider seguono alla lettera le indicazioni presenti sul file robots.txt e indicizzano tutte le pagine e le cartelle presenti. Questi li definisco "spider cattivi" e possono essere esclusi bannando il loro ip.

Per capire come si deve compilare il file robots.txt continua a leggere questo articolo. Il file robots.txt deve essere inserito all'interno della stessa cartella che contiene la vostra home page, che è poi il posto dove lo spider si aspetta che sia.

Esempio di corretta compilazione del file robots.txt

User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Disallow: /group/

User-agent: msnbot Crawl-delay: 10

User-agent: Teoma Crawl-delay: 10

User-agent: Slurp Crawl-delay: 10

User-agent: aipbot Disallow: /

User-agent: BecomeBot Disallow: /

User-agent: psbot Disallow: /

Finde della compilazione del file robots.txt

Il file robots.txt deve essere salvato come semplice file di testo e deve essere sempre nominato così: robots.txt
Diamo ora un rapido sguardo a quello che c'è scritto nel file robots.txt.

La riga User-agent: * significa che il file robots.txt si rivolge a tutti gli spider. L'asterisco significa "Tutti". Scrivere Disallow: /cgi-bin/ significa dire a tutti gli spider di non indicizzare la cartella cgi-bin. Nota come il nome della cartella in questione deve essere inserita tra i caratteri //

Se avessi messo la seguente riga "Disallow: /" allora avrei detto a tutti gli spider di non indicizzare nulla. Mentre la riga "Crawl-delay: 10" si riferisce a quegli spider che richiedono di memorizzare troppe pagine contemporaneamente, rischiando di rallentare la visualizzazione del vostro sito agli ignari visitatori. Lo spider di Google non è uno di questi e non richiede le pagine del nostro sito un sito con una eccessiva frequenza. Il valore 10 sta ad indicare il tempo, espresso in secondi, tra la richiesta di una pagine e l'altra.

La riga User Agent: MSNbot si rivolge allo spider del motore di ricerca MSN.com, mentre Slurp è di Yahoo e Teoma e per AskJeeves. Gli altri in elenco sono quelli che chiamo "spider cattivi" che non servono a nessuno....

Per vedere il contenuto dei file robot.txt basta scrivere il nome di dominio di un sito ed aggiungere robot.txt. Se il file è presente allora verrà mostrato dal tuo browser. Clicca sul link che segue per vedere il file robots.txt di Amazon

Amazon robots.txt

Google e Yahoo memorizzano le pagine anche dei siti che non contengono il file robots.txt, mentre MSM sembra voler richiedere la presenza del file robots.txt prima di iniziare ad indicizzare un sito.

ATTENZIONE: il file in questione si deve chiamare robots.txt e NON robot.txt

Cos'è uno spider?

Lo spider (o ragno) è un piccolo software che un motore di ricerca utilizza per andare in giro per il web. Quando lo spider si imbatte in un nuovo sito, memorizza il contenuto delle varie pagine e cataloga i link che puntano in direzione di altri siti. Seguendo questi link lo spider continua il suo percorso dirigendosi verso altri siti.

Alcuni di questi spider leggono e catalogano tutto il contenuto delle pagine che visitano. Altri si limitano ad indicizzare solo un certo numero di pagine prima di dirigersi altrove. Questo in considerazione del fatto che il Web è divenuto così grande che sarebbe impraticabile indicizzare tutto il suo contenuto. Alcuni spider sono in grado di indicizzare anche un milione di documenti al giorno.

In questo modo i motori di ricerca aggiungono al loro database tutti i siti che riescono a censire. Così facendo il motore di ricerca aumenta, giorno dopo giorno, le informazioni che può fornire a chi fa delle ricerche. Più è grande il database del motore (quindi più è grande il numero dei siti recensiti) più è grande la possibilità di fornire, a chi effettua le ricerche, le risposte che cercava.

Per determinare quali documenti restituire a fronte di una determinata ricerca, ciascun motore utilizza uno specifico algoritmo di ranking, vale a dire l'insieme dei criteri che governano l'ordinamento dei documenti contenuti nell'indice.

Ciò che occorre sapere è che alcuni motori di ricerca utilizzano degli spider e che, prima o poi, uno di questi software visiterà il vostro sito. Quello che lo spider vedrà una volta giuntovi, determinerà come il sito stesso verrà inserito all'interno del relativo indice.

Nel tentativo di migliorare il servizio offerto agli utenti i motori di ricerca modificano periodicamente il loro algoritmo di ranking. Conseguentemente, tecniche oggi efficaci, potrebbero in futuro non essere più tali.

Maggiori informazione le potete trovare presso Spider Hunter

 

Fonte: http://www.fattitrovare.com/
 

Torna su

HOME PAGE