Articoli

Un corso di SEO è un contenitore esplicativo delle pratiche orientate alla promozione di un sito web. I moduli di un corso di Search Engine Optimization sviscerano gli aspetti che riguardano la SEO ovvero le tecniche di indicizzazione, ottimizzazione e posizionamento di un sito web. Leggi il resto dell’articolo per scoprire tutto quello che c’è da sapere sui corsi SEO.

corso seo

Continue reading “Corso SEO” »

Siamo arrivati alla 6 lezione del nostro corso seo gratuito nel quale stiamo imparando le basi per poter indicizzare un sito internet sui principali motori di ricerca.

Per la verità oggi scopriremo che questa mia ultima frase non è proprio corretta in quanto tra tutti i motori di ricerca ve ne è solamente uno che ci è realmente caro… Google.

Nelle lezioni precedenti abbiamo visto i vari aspetti della SEO, e investito molto tempo a capire quanto siano importanti i contenuti e le parole chiave.

La precedente lezione invece aveva per oggetto il page rank e la link popularity mentre oggi ci concentreremo su.. Google parlando di alcune delle sue funzionalità.

Google is king

Beh lasciami dire che il titolo Google is king è un adattamento del titolo “the contenti s king” che apparve in una delle precedenti lezioni. Il potere e l’autorità di Google è talmente evidente che ho deciso di sostituire il soggetto della frase e tenere il titolo.

Google è a tutti gli effetti il re dei motori di ricerca.

statistiche-uso-google-mondo
Sebbene fonti diverse attribuivano l’utilizzo di Google attorno al 65% da parte degli utenti di tutto il mondo, il dato che evidenzia SitoPerfetto.it, attraverso una tabella che mette a confronto l’uso dei motori di ricerca in Italia è decisamente diverso!
statistiche-uso-google-italia
Tra il 2009 e il 2011 Google è stato il motore di ricerca che ha fornito al 90% degli utenti in Italia le risposte a quello che cercavano e probabilmente è stato anche il motore di ricerca che ti ha permesso di ottenere oltre il 50% delle visite sul tuo sito.

statistiche-uso-google

 

In uno scenario come questo, i SEO non hanno un vero e particolare interesse a faticare per cercare di ottimizzare i propri siti e i siti dei loro clienti per Bing, Yahoo! & company.

Quindi anche noi concentreremo un po’ più tempo a parlare di posizionamento di siti web con riferimento al motore di ricerca Google!

Qualsiasi ricerca tu esegui su Google ottieni il numero di risultati e i secondi che google ci ha messo per darti questa risposta. Nel nostro caso 5 milioni e settecento ottanta mila risultati..

Significa che ci sono molte pagine che parlano dello stesso argomento e che posiazionarsi con quegli argomenti potrebbe essere complesso. (Ma ricorda le precedenti lezioni.. Oltre il 20% dipende da link building e popolarità)

funzionalita-google

Google inoltre mostra la preview del sito da un pannello a comparsa, e molti altre informazioni come il nome e la foto dell’autore se è previsto dal sito indicizzato. Riesce inoltre ad offrire uno snapshot dei file word e pdf.

Ma le funzionalità sono davvero tante.. vediamone alcune..

Query Expansion

La query expansion è un processo di riformulazione della query per cercare di ottenere risultati più rilevanti. Attraverso questo algoritmo Google ricerca sinonimi, parole morfologicamente simili, esegue un controllo sintattico per ottenere un ribilanciamento della query richiesta dall’utente.

 

Google I’m feeling lucky

In Italia viene tradotto con “Mi sento fortunato”.

Si tratta di un bottone nella home page di Google che data una determinata parola ti permette di raggiungere direttamente il sito che appare nella prima posizione del motore di ricerca.

Attenzione, se hai Google Instant abilitato non funziona mentre se premi il pulsante senza aver inserito nessuna parola vieni rediretto nella pagina dei loghi Google (Doodle)

 

Google Rich Snippet

A maggio 2009 Google annunciò che avrebbe cercato microformati nei documenti indicizzati e usato le meta-informazioni per popolare le SERP con quello che loro definiscono rich snippet, ovvero dei blocchi di informazioni aggiuntive estrapolate dalla pagina indicizzata.

In altre parole i Rich Snippet sono una vera innovazione. In primo luogo come abbiamo già avuto modo di vedere i microformati permettono di veicolare e fornire maggiori informazioni che difficilmente saremo riusciti a veicolare.

Inoltre Google è capace di rielaborare le informazioni permettendo una presentazione dei risultati più gradevole e ricca.

 

Altre funzionalità

Ma big G non si ferma qui e nel corso degli anni da vita a moltissime altre funzionalità come il Meteo, le quotazioni del mercato azionario, l’ora corrente, i punteggi sportivi, le conversionidi unità di misura, le conversioni monetarie, la calcolatrice, il dizionario.. e davvero molto altro ancora..

 

A questo punto immagino che ti starai chiedendo cosa ti possa servire avere queste informazioni da un punto di vista SEO. Be sebbene non direttamente correlato all’attività di posizionamento di siti web, le informazioni che ti ho fornito ci permettono di capire l’enorme capacità di trattare e archiviare le informazioni da parte di Google. Inoltre non puoi mai sapere quando e come il motore di ricerca più famoso al mondo deciderà di integrare i dati estrapolati da queste informazioni e cosa farne. Ma addentriamoci maggiormente nelle funzionalità legate all’aspetto di ricerca.

Google Web History

Google Web History è un servizio che ha permesso a Google di offrire risultati sempre più personalizzati.

Puoi trovare Google Web History a questo indirizzo https://history.google.com/history/

Tuttavia per poter utilizzare ed accedere alla cronologia delle tue ricerche è necessario autenticarsi con un account Google.

È possibile consultare lo storico delle proprie ricerche per web, immagini, news, shopping, annunci, video, mappe, blog, libri, ricerca visiva, viaggi e Google Finanza.

Con questa funzionalità attivata, ovvero se stiamo facendo ricerche con l’account Google attivo, i risultati potrebbero essere sfalsati, in quanto il motore di ricerca, conoscendo le nostre preferenze potrebbe offrirci dei risultati più inclini ai nostri gusti.

 

Google Caffeine

Google Caffeine è il cambio infrastrutturale della piattaforma di archiviazione di Google. Questo complesso aggiornamento aveva per obiettivo quello di offrire una maggiore velocità, indicizzazione di più contenuti, maggiore rilevanza dei risultati e offrire maggiori informazioni si tematiche recenti.

La piattaforma ha permesso di risolvere archiviazione dei contenuti di Twitter, l’archiviazione delle meta-informazioni dei video di YouTube, la capacità di archiviazione dei contenuti generati dagli utenti (UGC)

google-caffeine

Google MayDay

Con l’introduzione di Caffeine è stato rilasciato anche Google MayDay un algoritmo che penalizza i siti che fanno pratica di spam attraverso la metodologia di posizionamento con la long tail.

Per approfondire ti rimando a un interessante articolo di Michele Caivano.

http://www.fortunecat.it/2010/05/google-mayday/ (link non più funzionante)

Nuovo Link di Approfondimento > https://blog.tagliaerbe.com/2010/05/google-mayday-long-tail.html

 

Google Realtime Search

Google Realtime Search è una funzionalità che permetteva di avere in tempo reale i contenuti relativi a Twitter, Facebook e Blogs. È stato introdotto il 7 dicembre del 2009 ma una funzionalità simile era comunque già presente in Microsoft Bing Search Engine.

A Luglio del 2011, la Real Time Search divenne inaccessibile. Google ha da prima attribuito la causa all’imminente lancio di Google Plus e in un secondo momento ha dichiarato che la causa era la cessazione degli accordi sullaccesso di Google ai contenuti di Twitter.

Questo esempio mostra ancora oggi le enormi potenzialità dello strumento Google in termini di velocità e capacità di archiviazione .

 

Google Social Search

Con Google Social Search introduciamo un concetto concernente la popolarità.

Il termine si è diffuso tra il 2004 e il 2005 ma è solo nel 2009 che viene lanciata da Google.

Il servizio permette di estendere ed includere nei risultati di ricerca i contenuti scritti da autori appartenenti alle nostre comunità o contrassegnati da giudizi positivi da membri appartenente alle nostre cerchie.

Nel gennaio Google rilascia Search Plus Your World, un opt-out di Google+ sui risultati di google search.

 

Tra i principali vantaggi di Google Social Search abbiamo:

  • Diminuzione del valore del link derivante da siti (link building tradizionale)
  • Miglioramento della rilevanza dei contenuti perché ogni contenuto è contrassegnato da altri utenti
  • Basato sul concetto di affidabilità dell’individuo nel network
  • Introduzione del giudizio umano [+1]
  • Risultati più dinamici grazie all’aggiornamento dell’attività sociale

 

Mentre tra gli svantaggi ricordiamo il rischio di spam derivante dai profili social

Siamo arrivati alla lezione 5!

Siamo a metà del nostro percorso sul posizionamento di siti web sui motori di ricerca.

Siamo partiti parlando dei motori di ricerca e come essi ragionano e mostrano i risultati. Abbiamo affrontato la tematica delle parole chiave e parlato dei contenuti. Nell’ultima lezione abbiamo descritto la link popularity e il page rank introducendo anche l’argomento della 5 lezione: l’attività di link building.

 

Come forse ricorderai l’attività di link building influisce enormemente sul posizionamento di un sito web. Per questo motivo molte delle pratiche seo concepite fino ad oggi consistono nell’agire su questa variabile cercando di modificare la serp dei motori di ricerca.

corso-seo-gratis_fattori-indicizzazione

Attività di Link Building

L’attività di link building è appunto l’attività di costruzione dei link da siti esterni verso il nostro sito.

Le variabili che influiscono sul link building sono:

  • Il numero dei link in entrata
  • La qualità/autorità dei link

Come abbiamo già detto, avendo l’attività di link building, notevole importanza è sempre bene recuperare un link laddove sia possibile.

 

Teniamo però presente che i link sono influenti se provengono da fonti rilevanti per cui se sto cercando di fare attività di link building per un sito che parla di motivazione e riesco ad ottenere un link da un sito che parla di crescita personale, e un link da un sito che parla di giardinaggio, il link proveniente dal sito inerente al giardinaggio sarà ininfluente o poco influente.

fattori-link

Fake Link

Con il termine fake link, consideriamo quei link che sono messi attraverso degli accordi con soggetti terzi, ma che non sono segnalati come link nofollow.

Proprio nella lella scorsa lezione abbiamo parlato dell’anatomia di un link, descivendo le proprietà e gli attributi del “tag anchor”.

La proprietà “rel” può avere come attributo il valore “nofollow”. Questo attributo ci permette di dire al motore di ricerca di seguire di non seguire il link in quanto link pubblicitario.

Per il resto i fake link sono veri come tutti gli altri e si comportano come tali.

Link Interni

I link di navigazione sono quelli contenuti nel menu o che fanno parte della struttura di navigazione del nostro sito. Sono link che sono generalmente presenti in tutte le pagine.

I link interni permettono di aiutarci ad organizzare i contenuti facilitando il posizionamento delle pagine più importanti attraverso un sistema drill down.

webenjoy_stuttura

Abbiamo visto nella lezione dedicata all’importanza dei “contenuti in un progetto seo” che una struttura drill down favorisce l’indicizzazione dei contenuti del tuo sito web dando priorità alle pagine di primo livello rispetto alle altre.

Se per esempio abbiamo un sito che parla di “web” possiamo creare diverse categorie del tipo:

web design, web development, posizionamento siti web.

La categoria web design a sua volta potrebbe essere suddivisa in articoli che parlano della User Experience, contenuti che parlano di graphic design, contenuti che parlano di concept grafici.

La pagina web design godrà quindi della spinta delle sottosezioni ed esse delle sotto pagine..

 

Link Esterni

I link che provengono da altri siti e che puntano al nostro sito sono detti link esterni.

Ci sono diverse varietà di link esterni distinguibili dal tipo di canale da cui provengono e dalla tipologia come:

  • Link Provenienti da Directory;
  • Link Provenienti da socialnetwork;
  • Link Provenienti da altri siti;
  • Link provenienti da siti di press release;
  • Fake link (Link Farm, link Exchange, etc)

 

Directory

Le directory sono state tra le prime fonti di promozione e link building sul web.

Sono siti che contengono informazioni strutturare ad albero ed esistono directory dedicate a nicchie di mercato particolari.

Se il tuo business ha quindi valenza locale, è opportuno che sceglierai directory locali per recensire i tuoi servizi.

Inserendo il tuo sito in una directory avrai la possibilità di mettere un link verso di esso.

Reciprocal link o (sites cross linked)

I reciprocal link sono link che vengono messi in accordo tra due siti al fine di cercare di trarre vantaggio nel posizionamento di siti web.

Sono generalmente considerati negativamente o ininfluenti da Google e gli altri motori di ricerca.

I motori di ricerca possono scoprire con facilità se si utilizzano dei reciprocal link base.

Più complessi da trovare sono invece le forme più strutturate di Reciprocal Link

Tuttavia non si è penalizzati per attività di reciprocal link

reciprocal-link

Un reciprocal link complesso permette di organizzare i link in modo da sviare il motore di ricerca

 

Press Release

Con le press release parliamo di contenuti volti a promuovere il proprio brand o un proprio prodotto.

Si tratta di contenuti duplicati ma il motore di ricerca ne è consapevole e non penalizza i siti che pubblicano press release.

Esistono diversi servizi a cui rivolgervi per inoltrare le vostre press release sia gratis che a pagamento.

 

Article Marketing

L’article marketing è simile alla press release. La prima differenza che notiamo è che il contenuto è generalmente meno commerciale.

Sebbene in questo caso non abbiamo a che fare con contenuti duplicati, come nel caso delle press release, il tipo di contenuto dell’article marketing può essere distribuito attraverso canali syndacation.

La qualità è importante per fare in modo che molti utenti usino il nostro contenuto nel loro sito.

Lavorare con i blog

I blog offrono grandi opportunità per fare attività di link building.

Il guest posting ad esempio è un attività che mi sento di consigliare. È simile all’article marketing ma i contenuti scritti sono postati su blog di autori esterni che sono felici di pubblicarli per evitare di scrivere post in prima persona.

Con questa pratica possiamo generare link provenienti da molti siti e aumentare la nostra brand awareness.

Anche commentare i post di altri user è una pratica consigliabile perché ci permette di generare traffico sul nostro sito. Tuttavia i link dei commenti sono spesso nofollow proprio per evitare pratiche spam.

 

Nel caso decidessi di lavorare con i blog ti consiglio di crearti un piccolo schema riassuntivo dei blog con cui stai interagendo, il loro proprietario, l’email e la pagina dove hai svolto attività.

Un domani è possibile che questo strumento ti torni utile per controllare lo stato delle cose..

Link Bait

Il link bait è una delle migliori forme di link che si possono ottenere.

Si mettono contenuti interessanti sul proprio sito e si attende che gli utenti linkino alla nostra pagina. È possibile costruire guide, tutorial o distribuire informazioni.

Link Software

I linking Software sono degli strumenti che scandagliano la rete e cercno fonti dove poter piazzare I nostril link. Personalmente non li utilizzo. Da questo punto di vista preferisco continuare a fare attività di networking in modo tradizionale.

Fake Link

Trattiamo adesso la parte più scomoda relativa alla link building, ovvero tutte quelle attività illegali o border line.

Comprare Link

Difficilmente Google saprà mai se hai fatto accordi con altri blogger per la compravendita di link.

Più facilmente potrebbe scoprire che il tuo sito è linkato da site farm o siti riconosciuti e già penalizzati in quanto segnalati come siti che fanno uso di link a pagamento.

Tuttavia difficilmente Google penalizzerà un sito a cui puntano link a pagamento poichè in quel caso tutti comprerebbero link da puntare verso i nostri concorrenti.

Ricordiamoci che la qualità rimane sempre importante

Servizi Link a pagamento

Mi sento di dare solo un consiglio riguardo all’acquisto di link a pagamento. È una pratica che ha senso farla per operazioni di lungo termine.

Così come i risultati di una strategia SEO si vedono nel lungo termine, anche i link devono avere una vita lunga

In questa 4 lezione del corso seo gratis sul posizionamento di siti web affronteremo i concetti di link popularity e Page Rank.

Nelle precedenti lezioni hai avuto modo di scoprire le basi del posizionamento sui motori di ricerca affrontando da prima le tematiche delle keyword e successivamente della struttura delle informazioni di un sito web fino ad arrivare all’importanza dei contenuti.

In merito ai contenuti ti confermo che avremo un ulteriore lezione più avanti..

Ma come anticipato oggi parleremo di link popularity!

 

La Link Popularity

Navigando in questo sito, avrai forse notato una delle citazioni di Wendy Piersall

“Google ti ama solo quando tutti gli altri ti amano”

Si tratta di una legge che è valida anche in altre occasioni che si riferiscono al mondo del successo..

Ma questa frase riassume in poche parole l’essenza della SEO.

Se vuoi apparire nelle prime posizioni dei motori di ricerca devi fare in modo che gli altri ti referenzino. In altre parole devi ottenere dei link che puntano verso il tuo sito.

La link popularity è la misura di quanto il nostro sito è popolare in internet e su di essa influiscono diversi fattori come:

  • il numero di link che puntano verso il nostro sito;
  • l’importanza (authority) e la qualità della pagina da cui il link proviene;
  • L’anchor text del link (ovvero la parte cliccabile del link)
  • L’età del link (più vecchio è e più il suo valore aumenta)
  • La rilevanza del contenuto nella pagina rispetto alla pagina di destinazione.

Il termine popularity ci rimanda al concetto di popolare. Google da peso ai link che provengono da altri siti come noi diamo peso alle referenze di qualcuno su qualcosa.

Prova a pensare all’idea di andare in banca per chiedere un mutuo per la casa.

Se non hai capitali ti chiederanno delle referenze.

Se ti presenti quindi con noti poco di buono, non sarai credibile viceversa se ti presenterai con molti autorevoli e influenti uomini di successo, otterrai con facilità il tuo mutuo.

 

Come Funziona La link Popularity?

La filosofia che sta alla base della link popularity è che si dovrebbero creare link solamente verso siti per cui ha senso crearli, solamente i siti che lo meritano.

Per questo motivo Google non apprezza ma al contrario penalizza i siti che vendono link, poiché in questo modo viene meno il fattore di qualità quello che garantisce che la risorsa a cui stiamo puntando è di valore.

Come puoi notare dall’immagine qui sotto, la link popularity è un fattore predominante ed incide indicativamente per il 23% sull’indicizzazione di una pagina.
corso-seo-gratis_fattori-indicizzazione
Cerca di evitare di comprare e vendere link, di fare attività di scambio link, di ottenere molti link di basso valore o provenienti da fonti discutibili e ricordati di usare sempre l’attributo “nofollow” quando metti un link a una risorsa sponsorizzata.

 

Il Google Page Rank

Il Google Page Rank è un valore numerico variabile da 1 a 10 che Google assegna ai siti che ha nel suo archivio.

È un fattore che ha influenzato il posizionamento dei siti web e l’attività dei SEO. Il suo valore è stato (ed è tutt’ora) sovrastimato.

Nell’immagine qui sotto puoi vedere diversi domini e il Page Rank associato.

Come vedi nel periodo in cui questo articolo è scritto, Google.it ha un PR di 8, Facebook.it di 7, il sito italiano di Fiat vale 6, il sito della modella Megan Fox è a 3, e uno dei siti a cui ho contribuito a dare vita è a 2.

corso-seo-gratis_page-rank
Ma credimi, non sono per nulla preoccupato.

In primo luogo perché il Page Rank non è accurato, in secondo luogo perché il Page Rank è aggiornato solo poche volte all’anno e quindi io potrei essere a quota 3 o 4 senza saperlo ma soprattutto perché il mio obiettivo non è quello di avere un Page Rank di 10, bensì quello di portare visite qualificate sul mio sito.

 

Se però questo non fosse abbastanza per te, sappi che la scalata a un Page Rank di 10 è molto, molto ardua come puoi notare da questa immagine di Elliance che mostra il risultato del Page Rank in rapporto allo sforzo.

corso-seo-gratis_infografica-page-rank-elliance
Questa infografica a forma di montagna, suddivide i gruppi di Page Rank in 4 tipologie:

  • Sotto la media: per Page Rank che vanno da 0 a 2;
  • Nella media: per Page Rank che vanno da da 3 al 5;
  • Sopra la media per Page Rank che vanno da 6 a 7;
  • E Elite. I Page Rank 8, 9 e 10.

Noterai che la distanza tra le bandierine è esponenziale e quindi la distanza tra 5 e 6 è grossomodo quella che si ha tra 1 e 5.

 

La formula del Page Rank

Se ti interessa conoscere nel dettaglio informazioni relative alla formula del Page Rank, il posto da cui ti consiglio di partire è la pagina di Wikipedia.

È un po’ lunga e io l’ho sintetizzata per te come segue..

Il Page Rank di una determinata pagina è dato dalla somma dei Page Rank della pagina che la puntano diviso il numero dei link contenuti on quelle pagine e moltiplicato per il dumping factor.

Il dumping factor è una costante decisa da Google che nella documentazione originale era attribuito a 0,85.

Abbiamo pertanto…

corso-seo-gratis_formula-page-rank

 

Dove

  • d è il dumping factor;
  • PR(B) indica il Page Rank del sito B e rispettivamente C e D
  • L(B) indica il numero di link che esistono nella pagina che punta verso il sito A

 

Il numero di link che sono contenuti in una pagina si spartiscono il peso del Page Rank di quella pagina e trasmettono al sito a cui puntano parte del Page Rank. Per saperne di più, ti consiglio di leggere anche questo articolo che ho scritto per spiegare che cos’è il page rank..

Il Trust Rank

Non mi dilungherò molto sul Trust Rank. Diciamo che viene usato da Google per calcolare l’autorevolezza di un sito web. Google considera autorevoli i siti di grandi aziendequotate in borsa e di organizzazioni governative e ha assegnato ad esse un Trust Rank.

Queste aziende linkando altri siti trasmettono parte del loro Trust Rank.

Diciamo quindi che l’esempio che ho fatto in precedenza sulla richiesta di prestito in banca ricalca molto bene il concetto di Trust Rank. È inoltre opportuno ricordare che a differenza del Page Rank che si può conoscere attraverso la Google Tool Bar, non c’è modo di conoscere il valore del Trust Rank di un sito web.

 

Conoscere i Link

Per poter sfruttare a pieno il concetto di link popularity devi fare attività di link building. (Vedremo l’attività di link building nella prossima lezione)

L’attività di link building si basa nella creazione di link che che puntano verso il nostro sito.

Preferibilmente un link perfetto dovrebbe:

  • Essere testuale e non immagine;
  • Avere l’attributo “title” valorizzato con le chiavi da indicizzare;
  • Essere contenuto in un paragrafo di contenuto attinente alle chiavi a cui punta;
  • Provenire da una pagina già indicizzata;
  • Provenire da un sito Trusted;
  • Provenire da un sito con un PR elevato.

 

Ma veniamo al dunque cercando di capire cosa sono gli attributi.

Nel codice HTML gli attributi descrivono le proprietà di un elemento.

L’elemento Ancora dell’HTML è “A”

<a>

Gli elementi sono aperti per indicare dove cominciano e sono chiusi per indicare dove finiscono.

L’elemento di chiusura è simile all’elemento di apertura con una barra “slash”.

</a>

Un elemento ancora può avere diverse proprietà tra cui:

  • “Href” che serve per indicare il sito di destinazione
  • “Title” che indica il titolo del link, quello che leggiamo quando passiamo sopra con il mouse
  • “rel” che permette di specificare se il il sito a cui puntiamo deve essere seguito o meno dal motore di ricerca.

Nell’immagine che segue puoi notare come l’anchor text, sia racchiuso all’interno del tag “A”

L’anchor text è molto importante nell’attività di link building quindi cerca sempre di preferire anchor text che riportano la parola chiave che vuoi posizionare.
corso-seo-gratis_anatomia-di-un-link

Siamo arrivati alla 3 lezione del corso seo gratis sul posizionamento di siti web sui motori di ricerca.

Nelle precedenti lezioni hai avuto modo di scoprire cos’è la seo e il seo, cosa sono le keywords e perché sono molto importanti. Abbiamo dato informazioni sui contenuti e le strutture di un sito web.

Oggi in questa lezione sul posizionamento di siti web, ci addentreremo nei meandri del codice HTML, parleremo del processo di indicizzazione di siti web, dei fattori che possono limitare i processi di indicizzazione sui motori di ricerca e dei fattori di ottimizzazione di siti web.

 

Come ci vedono i motori di ricerca

I motori di ricerca non vedono i nostri siti esattamente come li vediamo noi con i nostri occhi.

Un sito web non è altro che un insieme di documenti scritti in linguaggio HTML. Il codice HTML permette di creare documenti e pagine web richiamando risorse, immagini che risiedono sul nostro server oppure in altri punti della rete.

 

Per vedere un documento HTML apri una qualsiasi pagina web e premi il pulsante destro del mouse, possibilmente in un punto vuoto della pagina.

Tra le varie voci puoi leggere qualcosa del tipo: “Visualizza sorgente pagina”.

Il sorgente pagina è proprio il codice HTML e come abbiamo già detto, è il codice che i motori di ricerca leggono per capire come una pagina viene renderizzata (visualizzata).

La renderizzazione invece, viene fatta per noi essere umani dal browser, il programma come abbiamo già avuto modo di vedere che serve per navigare in internet e per vedere le pagine web.

Esempi di browser sono: Internet Explorer, Firefox, Chrome.. ecc.

 

Quindi il codice HTML è acronimo di Hypertext Markup Language e ci indica come una pagina è strutturata, dove sono locate le risorse (immagini, video, etc, fogli di stile), che caratteri e dimensioni utilizziamo, dove puntano i link , che tecnologie vengono usate (Ajax, Javascript, Flash)

 

Quello che segue è un piccolo documento HTML. Se tu incollassi su un file di testo il codice che vedi e salvassi il file con estensione “.htm” diventerebbe una pagina html completamente bianca.

Questo perché un documento HTML è formato da 2 macro parti:

  • Head che contiene informazioni riguardanti il documento
  • Il BODY che contiene i contenuti del documento

html-semplice

Come puoi notare nel nostro caso nel tag body è presente un solo commento, ovvero del codice non visibile in fase di renderizzazione.

Indicizzazione

Adesso che hai un minimo di basi di HTML, possiamo addentrarci nelle questioni tecniche riguardanti il nostro corso seo per il posizionamento di siti web.

Indicizzazione è il processo che permette al SEO (l’operatore), di facilitare al motore di ricerca l’archiviazione dei contenuti di un sito web.

L’indicizzazione può avvenire per diversi motivi tra cui:

  • Il crawling da parte di spider del motore di ricerca
  • Il modulo di suggerimento URL
  • La fornitura di una mappa del nostro sito al motore di ricerca
  • I feed rss

Il Crawling e i Link

I motori di ricerca seguono i link, per cui se vuoi che una pagina sia indicizzata, un buon modo è quello di mettere un link verso quella pagina da una pagina web che è attualmente indicizzata.

Puoi sapere se una pagina web è indicizzata cercando su Google, o sul motore di ricerca dove vuoi apparire, la stringa contenente l’URL completo della tua pagina web.

Suggerisci sito

Molti anni fa, i motori di ricerca avevano un modulo chiamato suggerisci link.

Era possibile attraverso quel modulo, suggerire le pagine web che lo spider avrebbe dovuto visitare.

Con l’introduzione delle Xml Site Map, questo strumento è diventato del tutto inutile e molti motori di ricerca non lo mettono più a disposizione.

 

Le XML Site Map

Le site map sono dei file XML e sono state introdotte dai motori di ricerca per facilitare il processo di indicizzazione dei contenuti. Si tratta di un metodo molto efficace per suggerire i documenti che voliamo indicizzare al motore di ricerca

Feed RSS

RSS è acronimo di Really Simple Syndication ed è un formato nato per la distribuzione dei contenuti sotto forma di XML. In altre parole i contenuti del nostro sito vengono separati dalla grafica e trasmessi solamente come contenuto puro.

I lettori di RSS possono quindi ricevere aggiornamenti in tempo reale dei nostri contenuti. Google e gli altri motori di ricerca sono molto sensibili all’esigenza di indicizzare informazioni fresche e recenti. Per questo motivo è possibile che i nostri contenuti siano indicizzati dopo pochi minuti dalla generazione

 

Impedire l’indicizzazione con il file robots.txt

Così come possiamo cercare di fare in modo che i motori di ricerca indicizzino i nostri siti web, allo stesso modo possiamo cercare di scoraggiarli a archiviare le informazioni dei nostri contenuti.

Esistono diversi metodi per scoraggiare i motori di ricerca ad indicizzare le nostre pagine, e oggi ne segnalo 3.

Il file robots.txt è un protocollo nato nel 1993 dai membri della robots mailing list (robots-request@nexor.co.uk) ed è un protocollo che segnala le regole di comportamento che gli spider che visitano il nostro sito dovrebbero seguire. (Ho parlato degli spider nel post precedente l’importanza dei contenuti in un progetto seo, dicendo che sono dei software automatici che scandagliano la rete in cerca di informazioni..)

Il file robots.txt va posizionato nella directory principale del vostro sito web ed è molto utile per bloccare gli strumenti esterni di analisi dei link che vedremo nelle prossime lezioni.

La sintassi del file robots.txt è molto semplice

La stringa “User-agent” identifica il nome dello spider che visita il nostro sito

“Disallow” indica che lo spider non può accedere a determinate cartelle o file..

Es.:

User-agent: Majestic-12

Disallow: /

Stiamo dicendo che il robot di Majestic SEO che è un analizzatore di link non deve poter accedere al nostro sito. Infatti i link analizzati da Majestic Seo, potrebbero essere utili ai nostri concorrenti per cercare di superarci nel posizionamento web.

Ti consiglio di includere nel tuo robots.txt i seguenti codici:
robots_txt-nega-accesso

Impedire l’indicizzazione con il meta robots

Se non hai la possibilità di accedere alla directory principale del tuo sito puoi utilizzare un elemento del codice HTML posizionabile all’interno del tag HEAD.

Il meta name ROBOTS indica se la pagina può essere indicizzata oppure no dal motore di ricerca e se il motore di ricerca può seguire i link contenuti in quella pagina per indicizzare altre eventuali pagine.

<meta name=“robots” content=”index (oppure noindex), follow (oppure nofollow)” />

 

Impedire l’indicizzazione con il file .htaccess

Il file .htaccess è un file di configurazione di web server in ambienti Unix-like.

Se il tuo sito è hostato su una macchina linux, molto probabilmente il tuo web server sarà Apache e hai quindi la possibilità di utilizzare il file .htaccess per garantire autorizzazioni e accessi al tuo sito, gestire le pagine di errore personalizzate, riscrivere l’url (ti spiego meglio dopo..) e il controllo della cache (anche questo lo spiego nel dettaglio dopo..)

Al momento limitiamoci a dire che attraverso opportuni codici è possibile rendere dei contenuti inaccessibili.

Vedi l’esempio nell’immagine:

htaccess-nega-accesso

Possiamo tradurre come:

Se lo user agent è pippo oppure paperino rendi il sito inaccessibili. Ovvero ciò avviene grazie alla F che indica forbidden mentre “L” indica Last Rule

Qui puoi trovare un ottimo tutorial in inglese sulla sintassi dell’.htaccess

 

Contenuti duplicati e URL dinamici

Dopo aver visto come noi webmaster possiamo cercare di impedire a terzi di visualizzare il nostro sito web, o determinati contenuti, vediamo anche come e perché certi tipi di contenuti siano automaticamente resi inaccessibili dagli stessi motori di ricerca.

Quando abbiamo parlato dell’importanza dei contenuti abbiamo dato molto valore alla qualità dei contenuti, dicendo che devono essere originali e non copiati.

I contenuti copiati sono detti contenuti duplicati e i motori di ricerca, primo fra tutti Google, non li vede di buon occhio, tanto che penalizza i siti che pubblicano contenuti duplicati de indicizzando la pagina che contiene contenuti copiati oppure mettendola in una specie di “limbo” delle pagine con contenuti duplicati visualizzabili solamente quando l’utente che effettua la ricerca clicca su uno speciale link con l’anchor text “mostra i risultati omessi”.

Quindi i contenuti duplicati sono dannosi perché possono portare a penalizzazioni e alla de-indicizzazione delle pagine che li contengono.

Ma una forma di contenuti duplicati può anche essere generata attraverso gli url dinamici.

Ipotizza che la stringa http://miosito.com/?contenuto=1a potrebbe mostraci la home page di un sito. La logica interna di programmazione prende il valore “1a” del parametro “contenuto” e capisce che deve mostrare la home. È ovvio che solo il programmatore è consapevole di come si comporta il suo sito e che se l’utente chiedesse la pagina http://miosito.com/?contenuto=1a2 magari per via di qualche errore di programmazione possa essere rimostrata la pagina home.

Per i motori di ricerca però i due URL indicano 2 pagine diverse ma presentono lo stesso contenuto. Siamo di fronte nuovamente a dei contenuti duplicati.

Per ovviare a questo problema è necessario riscrivere l’URL e possiamo farlo dal file .htaccess.

 

Spostamento dei contenuti

L’.htaccess ci permette inoltre di gestire le pagine morte del nostro sito.

I contenuti hanno una posizione nel server dove sono locati e i motori di ricerca la conoscono e la presentano agli utenti attraverso la serp.

Se spostiamo un file da una posizione ad un’altra, il motore di ricerca continuerà ad indicare agli utenti la vecchia posizione che troveranno una pagina bianca oppure un errore 404 (Pagina non trovata).

Attraverso il Redirect 301 di tipo permanente e il Redirect 302 di tipo temporaneo possiamo dire ai motori di ricerca che la risorsa che hanno archiviato può essere visitata in un’altra location, e eventualmente se sia il caso di aggiornare il loro archivio dicendogli se il redirect ha carattere temporaneo o definitivo.

 

Fattori di ottimizzazione

Per ottimizzare una pagina web o un sito dobbiamo tenere in considerazione la velocità di download dei contenuti. Inoltre anche la quantità e il tipo di processori del server su cui il nostro sito è mantenuto, la memoria, la banda, la posizione geografica, la connessione internet, la  dimensione delle pagine, i tipi di risorse contenuti nelle pagine, influiscono sull’ottimizzazione di una pagina web.

Il Caching

Siti costruiti con i CMS (Content Management System), strumenti come WordPress e Joomla, eseguono centinaia di query verso i database interni.

Abilitare il caching permette di limitare il numero di query verso i DB e offrire una pagina alternativa di copia ai nostri utenti. In questo modo solo il primo utente che richiede la pagina deve attendere i tempi di ricerca sul database mentre per tutti gli altri la richiesta sarà più veloce.