Archive for the ‘Search Engines’ Category

AdSense

Tuesday, October 20th, 2009

Con il programma AdSense di Google si pubblicano annunci pubblicitari nel proprio sito e si guadagna con i click dei visitatori sulle pubblicità. Gli annunci pubblicitari e gli incassi vengono gestiti da Google.

Ci sono diverse possibilità:

  • AdSense per i contenuti: i testi e le parole della pagina vengono scansionati e si presentano le pubblicità pertinenti.
  • AdSense per la ricerca: viene fornito un motore di ricerca da pubblicare sul proprio sito. Si guadagna sui click dell’utente su uno dei risultati ottenuti dalla pagina di ricerca.
  • AdSense per contenuti mobile: le pubblicità vengono inserite nelle pagine preparate per i dispositivi mobile.

Di seguito alcune regole per ottimizzare la pagina html con AdSense

  • Nella pagina degli annunci introdurre testo, in modo che il visitatore si fermi sulla pagina per leggere l’articolo. Evitare grandi immagini o animazioni su questa pagina. Piuttosto metterle su altre pagine senza annunci.
  • Dividere in modo pulito i contenuti della pagina, con titoli con tag H (Headline) e paragrafi con tag p.
  • Una pagina – un tema. I contenuti tematici devono essere divisi su pagine diverse per fare in modo che vengano presentati degli annunci più specifici per l’argomento trattato nella pagina.
  • Nelle pagine a tema utilizzare parole che potrebbero portare più guadagni. Qui bisogna sperimentare in quanto possono entrare in gioco diversi fattori tra i quali il periodo dell’anno, la situazione economica locale, nazionale o internazionale.
  • Scegliere delle parole complete quando si scrive il nome file della pagina. Piuttosto di scrivere: sw-ing.html scrivete software-ingegneri.html
  • Non piazzare gli annunci dove ci siano già altri annunci di altri programmi pubblicitari.
  • I singoli annunci possono essere presentati con diversi colori, sia di bordo che di sfondo che di scrittura. Fare attenzione che i colori si integrino nei colori del layout del sito, che questi non si discostino di molto.
  • Si possono presentare diversi colori per diversi formati o diverse campagne. Quindi si può sperimentare con diverse impostazioni per vederne i risultati. Naturalmente per questo ci vuole tempo e pazienza.
  • Non cliccare sui propri annunci e non cercare di aggirare il programma. Se ne rischia l’esclusione.

I publisher gestiscono gli annunci con il programma AdWords.

Cosa piace agli spider e ai roboter

Wednesday, October 14th, 2009

Il codice HTML della pagina deve essere pulito, i link e la scrittura devono essere corretti.

I roboter amano il testo.

Pagine intro con la quale si presenta una bella foto e si invita ad entrare nel sito, sono inutili sia per il motore di ricerca come per la maggior parte degli utenti.

Queste pagine non contengono alcun testo che sia interessante per il calcolo dell’indicizzazione. Se queste pagine poi presuppongono l’uso di Flash, Javascript o SVG-Viewer per la navigazione, è quasi inutile registrarsi nel motore di ricerca.

Il robot cerca un tema all’interno del nome domain, se il sito contiene più temi, sarebbe meglio chiedersi se non sia meglio spostare questi temi su altri nomi dominio.

Il nome dominio da solo ormai non gioca più un ruolo importante. Il robot cerca il tema principale del sito, poi guarda alla qualità e quindi confronta il sito con altri siti simili. E cosa molto importante: quante volte risulta la parola ricercata nella pagina?

Quindi bisogna ottimizzare la pagina con la parola nel titolo (tag title), ornarla con dei tag H (Headline) o b (bold). La frequenza della parola dovrebbe essere tra il 2% ed il massimo 7% sul totale delle parole complessive. Per Google vale dal 3% al 5%.

Ci deve essere una corrispondenza poi tra il nome della pagina (file e percorso), il titolo della pagina (tag title), le prime righe del body, le parole nei tag alt per le immagini, le descrizioni dei links dalle pagine esterne, e per i motori di ricerca che utilizzano ancora i meta-tags title, description e keywords.

Ed il tutto pagina per pagina.

Intorno alle parole poi i tag. Di questi 5 sono i principali:

  • Ogni pagina deve avere le parole più importanti nel (tag title).
  • Utilizzare strong, b o em all’interno del body.
  • Mettere le parole all’interno del tag H.
  • Testi nei link all’interno di a hanno preso molta importanza.

Ricerca Sub-Domains con Google

Wednesday, October 14th, 2009

Come ricercare quali Sub Domains sono registrati con un determinato nome dominio?

Con Google si può effettuare questa ricerca introducendo nel campo di ricerca:

site:nomedominio.com -site:www.nomedominio.com

Come risultato vengono riportate le pagine registrate dei diversi Sub Domains.

Registrazione del sito nei motori di ricerca

Wednesday, October 14th, 2009

Alcune regole interessanti per la registrazione del sito nei motori di ricerca:

  • Ca. il 90% del traffico dei motori di ricerca viene generato da Google, Live, Yahoo, Hotbot/Lycos. Una registrazione in centinaia di motori di ricerca può risultare quindi inutile.
  • Una presenza del sito su cataloghi come Yahoo e l’Open Directory Project potrebbe migliorare il ranking nei motori di ricerca.
  • Controllo regolare del ranking nei motori di ricerca in modo da poter intervenire subito nel caso di variazioni.
  • Controllo del ranking della concorrenza, studio delle loro parole chiave e del contenuto. Controllo sistematico delle pagine con posizione migliore.
  • Ricerca nei Logfiles del passaggio dei robots. Li si trova nel User Agent Header.
  • Ricerca nei Logfiles degli utenti che sono arrivati tramite un motore di ricerca. Controllo delle pagine visitate dall’utente. Da ciò si potrà dedurre se il motore di ricerca ha inviato gli utenti giusti per il sito.
  • Per i diversi punti e temi pricipali bisogna preparare pagine singole in directory separate.
  • Ripensare l’utilizzo di nomi domain ombra e pagine alternative apposite per il motore di ricerca. Vedere prima se non si possa raggiungere l’obiettivo con altri mezzi.
  • Testi con contenuto: è questo che interessa alla maggior parte degli utenti ed anche ai robots. Sicuramente ha un valore maggiore che qualsiasi trucco.

Quando si ottimizzano delle pagine per i motori di ricerca, bisogna cercare di evitare alcune cose tra cui:

  • Cercare di ottimizzare una pagina per tutte le keywords.
  • I meta tag non vengono ottimizzati per le singole pagine, ma si utilizzano gli stessi per tutte le pagine del sito (utilizzo di Template).
  • L’utilizzo inutile di Frames.
  • Pagine introdutive inutili e pagine in Flash senza senso.
  • L’utilizzo di keywords che non hanno a che fare con il testo della pagina.

La registrazione nei 15 motori di ricerca più utilizzati può bastare, non serve registrarsi in centinaia di motori per lo più sconosciuti. Meglio avere dei links esterni da altri siti con contenuto simile al proprio.

L’utilizzo di un Software o di un servizio on-line può sembrare il metodo più veloce e comodo, ma nello stesso momento non è molto specifico.

  • La registrazione manuale: non è che serva molto tempo registrarsi in una decina di motori di ricerca, forse 2 ore.
  • La registrazione on-line con tramite un modulo: è comodo, ma non sicuro. Il sito potrebbe chiudere, non si ha la conferma delle registrazioni.
  • Delega della registrazione ad una ditta specializzata: il metodo più costoso, in quanto la registrazione viene effettuata una volta sola, ma è il più sicuro, in quanto la registrazione viene effettivamente effettuata e così come va bene ai motori di ricerca.

Per vedere il sito presente nel motore di ricerca, può durare da poche ore ad alcuni giorni o settimane. Di regola almeno 1 mese.

Redirect indirizzo con www da .htaccess

Wednesday, October 14th, 2009

Siccome si ha la possibilità di aprire una pagina internet sia con che senza “www” nella barra dell’indirizzo del browser (dipende comunque dal tipo di server), per la registrazione della pagina nel motore di ricerca sarebbe meglio dare un indirizzo unico della pagina.

Esempio: www.nomedominio.com e nomedominio.com

Questi 2 indirizzi possono venire registrati 2 volte dal motore di ricerca, poichè questi due indirizzi sono considerati come 2 siti differenti.

Il problema si può risolvere editando il file .htaccess ed aggiungendo le seguenti righe:

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.nomedominio\.com$
RewriteRule ^(.*)$ http://www.nomedominio.com/$1 [L,R=301]

Con questa soluzione anche introducendo nomedominio.com al browser viene poi presentato l’indirizzo www.nomedominio.com.

Naturalmente il problema si può ripresentare con la pagina index: www.nomedominio.com/ e www.nomedominio.com/index.html

Anche questo problema può essere risolto con .htaccess, ma ancora non ho la soluzione.

Se sullo stesso indirizzo IP ci fossero registrati anche altri domini, questi vengono tutti “trasformati” in www.nomedominio.com. Però se si volesse dire ai programmi di ricerca che questi verrano cancellati, vedi anche questo articolo sui diversi nomi dominio sullo stesso sito.

Altre possibilità:

# Force www version
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www
RewriteRule (.*) http://www.%{HTTP_HOST}/$1 [L,R=301]
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.nomedominio\.com$
RewriteRule ^ http://www.nomedominio.com%{REQUEST_URI} [L,R=301,QSA]

Codice 301: Moved Permanently

Parametri:
[NC] = Non Case sensitive
F = Restituisci errore 403 (Forbidden)
L = Last rule, cioè non leggere oltre perché questa è l’ultima regola.

Ranking nel motore di ricerca

Wednesday, October 14th, 2009

I motori di ricerca vengono utilizzati come pagina di partenza da ca. l’80% degli utenti internet. I primi 10 risultati della ricerca sono i più importanti, i risultati oltre il 20 vengono letti in media dal 35% degli utenti, oltre il 21 da meno del 10%. Importante è il controllo del referrer nelle statistiche, per sapere da dove vengono gli utenti.

Una gran parte delle ricerche viene effettuata con una parola. Molti introducono una seconda o terza parola dopo la prima ricerca.

Dalle statistiche si deducono pure le parole che sono state più utilizzate nei programmi di ricerca. Queste parole devono venire quindi ripetute più volte nel contenuto delle pagine. I risultati non tarderanno a farsi vedere.

I motori di ricerca tornano ad indicizzare il 98% di tutte le pagine con intervalli da 4 a 8 settimane. La registrazione in corti intervalli di un sito viene interpretato dai motori di ricerca coma spam e si corre il rischio di venire cancellati dall’index piuttosto che salire nel ranking. Nel caso si paghi per essere introdotti nell’indice del motore di ricerca, le pagine vengono indicizzate ogni 2 giorni.

Lavorare insieme invece di lavorare contro. Con questo principio si rende più conosciuta la propria pagina in Internet. Seguendo le seguenti regole, si può fare in modo che la propria pagina sia indicizzata con un ranking migliore nei motori di ricerca.

  • Scambiate i contenuti: articoli, immagini, tools per il download, parole lessicali, accomunate le offerte ed i contenuti.
  • Installate un forum comune per aprire delle nuove Community con una base più ampia.
  • Nominatevi a vicenda nelle Mail e nelle Newsletter.
  • Fate pubblicità comune offline: preparate flyer e manifesti, presentatevi insieme sulle fiere ed altre manifestazioni.
  • Offrite sconti speciali ai clienti o a i lettori del rispettivo partner, offrite articoli alternativi.
  • Scambiatevi i dati dei clienti (fare attenzione però alla Privacy)

Quindi:

  1. Controllo regolare del Ranking nei motori di ricerca.
  2. Esaminare il Ranking dei concorrenti e controllare le parole chiave ed il contenuto.
  3. Analizzare le pagine che hanno una buona posizione.
  4. Guardare nel log file se ci sono tracce di robots.
  5. Guardare nel log file gli accessi di coloro che sono arrivati dai motori di ricerca ed utilizzare poi le parole di ricerca sulle pagine.
  6. Con ogni nome domio del sito concentrarsi sul tema del nome del sito, utilizzare nomi domini diversi per informazioni diverse.
  7. Contenuto e testo: come per le persone, anche per i motori di ricerca sono due punti estrememente importanti.
  8. Essere presenti in un catalogo come Open Directory Project o Yahoo sembra non sia più molto importante.
  9. Scrivere il titolo (tag title) e la descrizione (tag meta description) della pagina con parole e frasi che si riflettono poi sul contenuto, evitare abbreviazioni o testo che non ha niente a che fare con il contenuto (Theme Based Indexing).
  10. I meta tags non sono più così importanti come lo erano all’inizio, anzi, non vengono nemmeno più considerati da alcuni motori di ricerca, tra cui anche Google, non consiglio comunque di rinunciarci.
  11. Trovare alcune combinazioni di parole che caratterizzano il contenuto della pagina, le cosiddette Key-Phrases.
  12. Alcune parole che sono importanti per la ricerca devono essere presenti almeno tre o quattro volte nella pagina, comunque non esagerare.
  13. Importanti sono anche le parole che si trovano nel tag title e nel tag meta description della pagina.
  14. Anche i tag Headline (H1, H2, H3) sono da utilizzare, naturalmente variati con CSS.
  15. Importante è anche il testo che si trova all’interno del tag a href.
  16. Il testo importante si deve trovare in cima e non in fondo alla pagina.
  17. Suddividere in cartelle specifiche le pagine che trattano temi simili.
  18. Evitare: Doorway Pages, Cloaking, pagine dinamiche, pagine sviluppate con Flash, Frames e Javascript.
  19. E se ancora non dovesse funzionare, non rimane altro che comperare un Top-Ranking. Per esempio con Ad-Words di Google: si possono scegliere delle parole con le quali si viene trovati e si paga per ogni click.

La pagina ed il sito ricevono un buon ranking quando vengono pubblicati ed ottimizzati definitivamente. Si consiglia quindi di:

  1. Non aggiungere ai motori di ricerca una pagina o un sito che non siano ancora finiti.
  2. Non fare scoprire ai motori di ricerca una pagina o un sito che non siano ancora finiti.
  3. Cercare di non cambiare il nome file delle pagine successivamente ad una registrazione.

A volte succede che si pubblica il nuovo sito in una cartella transitoria per effettuare vari test. Magari si registra nei motori di ricerca il sito che si trova nella cartella transitoria per testarlo anche con le parole chiave. Successivamente si pubblica il sito nella cartella giusta. A questo punto si registra nuovamente il sito.

Questo non dovrebbe succedere, in quanto per lo stesso sito viene cambiato l’indirizzo in poco tempo e si rischia di venire esclusi dall’indice.

Pagine cancellate o rinominate sul server web

Wednesday, October 14th, 2009

Cosa succede ai risultati del motore di ricerca quando il nome di una pagina viene rinominato, o una pagina viene cancellata o spostata da una directory verso un’altra sul server? Oppure se si vuole cambiare il nome del dominio mantenendo la stessa struttura e nomi pagina?

Quando la pagina non viene trovata, esce un errore 404 e quindi la pagina viene cancellata dall’indice del motore di ricerca. Per evitare ciò, si potrebbe fare un redirect con il comando meta refresh, però alcuni metodi spam utilizzano lo stesso sistema. Cosa fare?

La soluzione sta nell’editare il file .htaccess e scrivere qui il redirect.

Redirect 301 significa “redirect permanente”, “/” (slash) indica che é tutto il dominio a trasferirsi (siccome il file .htaccess si trova nella root del domain.com la slash sta ad indicare http://www.domain.com).

Per esempio:

redirect 301 / http://www.domain.com
redirect 301 /oldpage.htm http://www.domain.com/newpage.htm
redirect 301 /olddir/oldpage.htm http://www.domain.com/newdir/newpage.htm
redirect 301 /page.html http://www.domain.com/page.php
redirect 301 /page.html http://www.domain.com/

In questo modo lo spider riceve il codice errore 301, con il quale si fa sapere allo spider che l’indirizzo della pagina non è più attuale e gli si fa sapere il nuovo indirizzo o nome della pagina nuova spostata. Il reindirizzamento di un intero dominio segue lo stesso metodo di quello utilizzato con una sola pagina. In quest’ultimo caso le pagine interne del nuovo nome dominio devono avere lo stesso identico nome e stare nella stessa directory delle pagine che erano sul dominio precedente.

Naturalmente per fare ciò bisogna poter editare il file .htaccess.

Parametri:
[NC] = Non Case sensitive
F = Restituisci errore 403 (Forbidden)
L = Last rule, cioè non leggere oltre perché questa è l’ultima regola.

mod_rewrite

Wednesday, October 14th, 2009

Con il comando mod_rewrite nel file .htaccess io ho scritto gli indirizzi in questo modo:

http://(www\.)?domain.com/.* [NC]
http://(www\.)?domain.com*$ [NC]

Ho notato però che gli indirizzi url possono anche essere scritti anche in questo modo:

http://([-a-z0-9]+\.)?domain\.com [NC]

Praticamente nelle prime due righe del primo esempio ho messo "www" tra parentesi e nel secondo esempio ho aggiunto le variabili di numeri e lettere (in altri esempi ho visto anche le lettere maiuscole oltre alle minuscole) e non ho messo gli slash o li ho messi nella posizione errata. Inoltre ho la variante del dominio 2 volte, una con il segno del $.

Ci sono quindi diversi metodi per fare interpretare il comando al server. In base alla regola potremo quindi usare un semplice www, oppure delle espressioni regolari che facciano comprendere sia le lettere dalla A alla Z che i numeri dallo 0 al 9.

Potrebbe essere molto piú semplice non usare nulla.

Questo è un esempio di ammissione per un Hotlink da un sito amico senza http nè www:

RewriteCond %{HTTP_REFERER} !domainesterno\.com [NC]
RewriteCond %{HTTP_REFERER} !domainesterno2\.com [NC]

Parametri:
[NC] = Non Case sensitive
F = Restituisci errore 403 (Forbidden)
L = Last rule, cioè non leggere oltre perché questa è l’ultima regola della singola condizione del Rewrite.

meta tag

Wednesday, October 14th, 2009

In molti articoli che trattano di motori di ricerca si dice che i meta tags keywords e description non siano più così importanti come lo erano qualche anno fa.

Però bisogna ugualmente tenere conto di questi meta tags in quanto:

  • Alcuni motori di ricerca riportano il testo del meta description nella lista dei risultati.
  • Alcuni motori di ricerca prendono le informazioni dai meta tags.
  • Nel tag meta description si introduce il tema trattato dalla pagina del sito, formulato in modo diverso. Oltre al tag title, H (Headline) e le prime righe del testo si ha così un quarto elemento per descrivere il contenuto.
  • Nel tag meta description si possono introdurre i primi 100 – 150 caratteri del testo della pagina. Meglio ancora se si introducesse un testo di descrizione completamente nuovo.
  • L’introduzione di alcune parole nel tag meta keywords può anche risultare positivo, anche se diversi motori di ricerca non le tengono più in considerazione.

Indice supplementare

Wednesday, October 14th, 2009

Per visualizzare i risultati di una ricerca Google utilizza il suo indice.
Sembra che esista anche un indice supplementare in cui vengono memorizzati gli indirizzi di cui Google si fida poco e verrebbero presentati solo nel caso che non ci siano altri risultati attinenti alla ricerca effettuata.

Ma come visualizzare le proprie pagine, o tutto il sito, che si trovano nell’indice supplementare? Nel campo di ricerca di Google introdurre:

site:www.nomedominio.com *** -view

oppure

site:dominio.it/&

Per fare uscire le pagine listate da questo indice supplementare bisogna ristrutturare meglio il loro codice html e soprattutto trovare loro alcuni link referenti.

Per visualizzare le pagine indicizzate regolarmente digitare nel campo di ricerca:

site:www.nomedominio.com