|
I Meta TAG
Il 95% delle persone guardano i primi 20 risultati di ricerca, è importante quindi la posizione nei motori.
Se si vuole evidenziare il proprio sito web bisogna saper scrivere correttamente i meta tag.
I meta tag vanno inseriti nella testa della pagina web, tra i codici < head > e < / head >.
Anche se i meta più importanti sono la Descrizione e le Parole chiavi tutti i codici hanno un significato e portano vantaggi se scritti correttamente; ecco cosa bisogna scrivere:
Titolo
il titolo della pagina web dovrebbe essere anche nella testa della pagina da indicizzare
esempio:< title>ComputerMania< / title >
Descrizione
è usato per dare una descrizione corta dei contenuti della Sua pagina web, è usato dai motori di ricerca nei risultati di ricerca come una descrizione di quello che contiene la pagina. Comunque, molti motori di ricerca esporranno solamente i primi 20 caratteri.
esempio:<meta name="description" content="Il sito offre una selezione tra i migliori trucchi di informatica e le news più interessanti del panorama IT. Sono presenti inoltre collegamenti, informazioni sull'autore, servizi, files da scaricare e tanto altro.">
Parole chiavi
I motori trovano il sito web con un elenco di parole chiavi, separate da virgole. La maggior parte di motori di ricerca schederà i primi 64 caratteri di questo Meta.
esempio:<meta name="keywords" content="download, webmaster,
provider, trucchi, tutorials, design, internet.">
Contenuto
Questo è usato per dare alla pagina web una stima per l'appropriatezza ai bambini. Le stime sono, generale, maturo, limitato, e 14 anni.
esempio:<meta name="rating" content="GENERAL">
Autore
Questo è usato per identificare l'autore della pagina web.
esempio:<meta name="author" content="Vega79">
Diritti d'autore
Questo identifica alcune informazioni sul diritto d'autore per la pagina web.
esempio:<meta name="copyright" content="e-mail@mail.xx">
Rivisitare dopo
Il rivisitare-dopo è un meta tag utile per pagine dove contenti variano spesso e dice al motore di ricerca ogni quanti giorni rivisitare la pagina web.
esempio:<meta name="revisit-after" content="25 days">
Scadenza
Questo meta è usato da webmaster responsabili per far sapere al motore di ricerca quando la pagina scade e può essere rimossa dall'elenco di motori di ricerca.
esempio:< scade = "scade" content = "mai" >
Interesse o distribuzione
Dice il motore di ricerca che la pagina è di interesse globale, locale, per regionali, per Uso Interno o altro.
esempio:<meta name="robots" content="ALL">
Robots.txt: la guida per i motori di
ricerca
Il file robots.txt è un file di testo richiesto
dalla quasi totalità degli spider o robot dei motori di ricerca per conoscere
quali file o cartelle devono essere indicizzate e quali no. Tuttavia, non tutti
gli spider seguono alla lettera le indicazioni presenti sul file robots.txt e
indicizzano tutte le pagine e le cartelle presenti. Questi li definisco "spider
cattivi" e possono essere esclusi bannando il loro ip.
Per capire come si deve compilare il file robots.txt
continua a leggere questo articolo. Il file robots.txt deve essere inserito
all'interno della stessa cartella che contiene la vostra home page, che è poi il
posto dove lo spider si aspetta che sia.
Esempio di corretta compilazione del file robots.txt
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Disallow: /group/
User-agent: msnbot Crawl-delay: 10
User-agent: Teoma Crawl-delay: 10
User-agent: Slurp Crawl-delay: 10
User-agent: aipbot Disallow: /
User-agent: BecomeBot Disallow: /
User-agent: psbot Disallow: /
Finde della compilazione del file robots.txt
Il file robots.txt deve essere salvato come semplice
file di testo e deve essere sempre nominato così: robots.txt
Diamo ora un rapido sguardo a quello che c'è scritto nel file robots.txt.
La riga User-agent: * significa che il file
robots.txt si rivolge a tutti gli spider. L'asterisco significa "Tutti".
Scrivere Disallow: /cgi-bin/ significa dire a tutti gli spider di non
indicizzare la cartella cgi-bin. Nota come il nome della cartella in questione
deve essere inserita tra i caratteri //
Se avessi messo la seguente riga "Disallow: /"
allora avrei detto a tutti gli spider di non indicizzare nulla. Mentre la riga "Crawl-delay:
10" si riferisce a quegli spider che richiedono di memorizzare troppe pagine
contemporaneamente, rischiando di rallentare la visualizzazione del vostro sito
agli ignari visitatori. Lo spider di Google non è uno di questi e non richiede
le pagine del nostro sito un sito con una eccessiva frequenza. Il valore 10 sta
ad indicare il tempo, espresso in secondi, tra la richiesta di una pagine e
l'altra.
La riga User Agent: MSNbot si rivolge allo spider
del motore di ricerca MSN.com, mentre Slurp è di Yahoo e Teoma e per AskJeeves.
Gli altri in elenco sono quelli che chiamo "spider cattivi" che non servono a
nessuno....
Per vedere il contenuto dei file robot.txt basta
scrivere il nome di dominio di un sito ed aggiungere robot.txt. Se il file è
presente allora verrà mostrato dal tuo browser. Clicca sul link che segue per
vedere il file robots.txt di Amazon
Amazon robots.txt
Google e Yahoo memorizzano le pagine anche dei siti
che non contengono il file robots.txt, mentre MSM sembra voler richiedere la
presenza del file robots.txt prima di iniziare ad indicizzare un sito.
ATTENZIONE: il file in questione si deve chiamare
robots.txt e NON robot.txt
Cos'è
uno spider?
Lo spider
(o ragno) è un piccolo software che un motore di ricerca
utilizza per andare in giro per il web. Quando lo spider si
imbatte in un nuovo sito, memorizza il contenuto delle varie
pagine e cataloga i link che puntano in direzione di altri siti.
Seguendo questi link lo spider continua il suo percorso
dirigendosi verso altri siti.
Alcuni di
questi spider leggono e catalogano tutto il contenuto delle
pagine che visitano. Altri si limitano ad indicizzare solo un
certo numero di pagine prima di dirigersi altrove. Questo in
considerazione del fatto che il Web è divenuto così grande che
sarebbe impraticabile indicizzare tutto il suo contenuto. Alcuni
spider sono in grado di indicizzare anche un milione di
documenti al giorno.
In questo
modo i motori di ricerca aggiungono al loro database tutti i
siti che riescono a censire. Così facendo il motore di ricerca
aumenta, giorno dopo giorno, le informazioni che può fornire a
chi fa delle ricerche. Più è grande il database del motore
(quindi più è grande il numero dei siti recensiti) più è grande
la possibilità di fornire, a chi effettua le ricerche, le
risposte che cercava.
Per
determinare quali documenti restituire a fronte di una
determinata ricerca, ciascun motore utilizza uno specifico
algoritmo di ranking, vale a dire l'insieme dei criteri che
governano l'ordinamento dei documenti contenuti nell'indice.
Ciò che
occorre sapere è che alcuni motori di ricerca utilizzano degli
spider e che, prima o poi, uno di questi software visiterà il
vostro sito. Quello che lo spider vedrà una volta giuntovi,
determinerà come il sito stesso verrà inserito all'interno del
relativo indice.
Nel
tentativo di migliorare il servizio offerto agli utenti i motori
di ricerca modificano periodicamente il loro algoritmo di
ranking. Conseguentemente, tecniche oggi efficaci, potrebbero in
futuro non essere più tali.
Maggiori informazione le potete trovare presso
Spider
Hunter
|
Fonte:
http://www.fattitrovare.com/
|