Trusted WordPress tutorials, when you need them most.
Beginner’s Guide to WordPress
Coppa WPB
25 Million+
Websites using our plugins
16+
Years of WordPress experience
3000+
WordPress tutorials
by experts

Il problema del crawl budget di WordPress SEO e come risolverlo

Se avete problemi con il budget del crawl SEO di WordPress, non siete i soli.

Il crawl budget è sostanzialmente la frequenza con cui i motori di ricerca visitano ed esaminano il vostro sito. Se è troppo basso, le pagine potrebbero non essere indicizzate rapidamente, il che potrebbe danneggiare le classifiche SEO e ridurre il traffico.

Ecco perché la gestione del budget per il crawling importa se si vuole migliorare la visibilità e le prestazioni del sito.

Noi di WPBeginner, uno dei nostri approcci alla gestione del crawl budget consiste nel mantenere le sitemap XML aggiornate e prive di errori utilizzando il plugin AIOSEO. E quando si parla di AIOSEO, ci sono altre caratteristiche che si possono usare per correggere il problema del crawl budget.

In questo articolo, vedremo di buttare giù il problema del crawl budget di WordPress SEO e vi mostreremo dei semplici modi per correggerlo.

Fixing SEO crawl budget issues in WordPress

Poiché l’argomento è molto vasto, lo abbiamo giù suddiviso in sezioni di facile comprensione. Ecco i diversi elementi di cui ci occuperemo in questo articolo:

Pronti? Iniziamo a fare in modo che le vostre pagine ricevano l’attenzione che meritano.

Come funziona il crawling di ricerca?

I motori di ricerca come Google utilizzano sofisticati bot o programmi informatici per visitare i siti web su Internet. Questi bot cercano le modifiche apportate al vostro sito web WordPress e le confrontano con l’indice di ricerca principale.

Supponiamo che i motori di ricerca trovino nuovi contenuti sul vostro sito. In questo caso, lo aggiungeranno al loro indice. Se trovano contenuti già presenti nell’indice ma aggiornati, aggiornano l’indice con le nuove informazioni.

How search crawling works

I bot di ricerca seguono quindi tutti i link di una pagina e ripetono il processo per quelle pagine.

Ora, i bot si spostano da un link all’altro di una pagina, in modo simile a come i ragni reali strisciano sul web. Per questo motivo si usa il termine crawling per descrivere questa attività e a volte si vedono i bot referer come spider dei motori di ricerca.

Per una migliore SEO, dovrete assicurarvi che i motori di ricerca possano scansionare facilmente il vostro sito web.

Suggerimento: per saperne di più sulla SEO, consultate la nostra guida completa alla SEO di WordPress per principianti.

Che cos’è il SEO Crawl Budget?

Il crawl budget SEO è il numero di volte in cui i motori di ricerca come Google effettuano il crawling delle pagine del vostro sito web.

I bot di Google scansionano miliardi di pagine ogni giorno e decidono quante pagine scansionare su ogni sito WordPress per utilizzare le loro risorse in modo saggio. Questo numero non è corretto e cambia ogni giorno in base a vari fattori. Pertanto, non esiste una quantità fissa di pagine che il bot di Google scansionerà sul vostro sito o blog.

Detto questo, i siti web più grandi e con più contenuti hanno in genere un budget più elevato per il crawling, mentre i siti web più piccoli hanno un budget inferiore.

Anche altri fattori influenzano il crawl budget, come la popolarità di un URL, la freschezza, la frequenza degli aggiornamenti e altro ancora.

Si noti che si può perdere il budget di crawl su pagine non desiderate per diversi motivi.

Ad esempio, se il vostro blog WordPress non è ottimizzato correttamente, i motori di ricerca spenderanno il vostro budget per il crawling sulle parti meno significative del blog piuttosto che sui contenuti importanti.

Allo stesso modo, potreste bloccare accidentalmente i motori di ricerca dal crawling del vostro sito web. In questo caso, il vostro sito web potrebbe non utilizzare affatto il crawl budget.

Quali sono le cause dei problemi di crawl budget di WordPress SEO?

Il modo in cui WordPress genera gli URL e i contenuti duplicati può causare problemi di crawl budget.

Ad esempio, WordPress genera automaticamente feed RSS per diverse aree del sito web. Ci sono feed RSS per:

  • Il blog principale
  • Categorie e tag
  • Commenti su ogni pagina e post
  • Post type personalizzati con URL separati per i feed RSS e altro ancora.

I link a questi feed RSS vengono aggiunti al codice sorgente HTML del vostro sito web, rendendoli così individuabili dai motori di ricerca.

Ora i motori di ricerca sono abbastanza intelligenti da riconoscere e ignorare i contenuti duplicati. Tuttavia, continueranno a strisciarli e a spendere il vostro budget per le strisciate SEO.

Inoltre, i motori di ricerca effettuano il crawling di elementi meno importanti più del necessario. Ciò include pagine di archivio, tassonomie, archivi di autori e file PDF.

Anche i plugin di WordPress o altri strumenti di terze parti possono aggiungere parametri di query agli URL di WordPress. Gli spider di Google possono considerare questi parametri di query come una pagina diversa e quindi effettuare il crawling.

Ad esempio, i parametri UTM sono utilizzati per il tracciamento di Google Analytics e una pagina con o senza questi parametri di query avrebbe lo stesso aspetto.

Ecco un esempio: https: //yourdomain.com/landingpage/?utm_source=newsletter

Questo spreca il budget per le strisciate SEO su elementi meno importanti e diventa un problema.

Come si calcola il budget per il crawl SEO?

Il budget di crawl SEO non è un numero fisso di pagine. Varia molto e non esiste un modo affidabile per prevedere quante pagine Google effettuerà il crawling del vostro sito web in un determinato giorno.

Tuttavia, è possibile farsi un’idea abbastanza precisa basandosi sulle attività di crawling recenti per vedere come Google effettua il crawling del vostro sito web.

Se non l’avete ancora fatto, dovete prima aggiungere il vostro sito web a Google Search Console. Si tratta di uno strumento gratuito fornito da Google per aiutare i proprietari di siti web a scoprire come il loro sito web sta andando in Google Search.

È sufficiente navigare nella dashboard di “Search Console”. Quindi, passare al menu “Impostazioni” dalla colonna di sinistra e fare clic su “Apri report” accanto a “Statistiche di crawling”.

Open crawl stats report in Google Search Console

Il report “Crawl” mostra una panoramica delle richieste di crawl sul sito web nelle ultime settimane.

È possibile passare il mouse sul grafico per vedere quante pagine sono state richieste ogni giorno.

Crawl stats overview

Questo dà un’idea della velocità media di crawling del sito durante questo periodo.

Di seguito, è possibile vedere una ripartizione dell’attività di crawling per codice di risposta, tipi di file, scopo e tipo di bot di Google.

Crawl break down

Da qui si può vedere quanto il budget per il crawl viene speso per errori, syndication (feed RSS), JavaScript, CSS, immagini e altro ancora.

In questo modo si ottiene un’istantanea degli elementi che si possono ottimizzare per utilizzare in modo più efficiente il budget per le scansioni SEO. Ad esempio, se si verificano molti errori 404, è possibile utilizzare un plugin di reindirizzamento per garantire che i crawler arrivino su contenuti utili.

(Più avanti nell’articolo, mostreremo come reindirizzare gli errori di crawl passo dopo passo).

Perché dovreste preoccuparvi del SEO Crawl Budget?

I motori di ricerca devono effettuare il crawling del vostro sito web in modo efficiente per indicizzare i contenuti in tempo e in modo corretto. Tuttavia, se il budget per il crawling SEO viene sprecato, i contenuti più importanti e più recenti potrebbero non essere crawlati in tempo.

Potrebbero volerci settimane prima che i motori di ricerca notino gli aggiornamenti dei vostri vecchi articoli o scoprano nuovi contenuti.

Perderete traffico dai motori di ricerca, il vostro posizionamento SEO potrebbe non migliorare e perderete denaro dalle vendite o dagli introiti pubblicitari.

Come ottimizzare facilmente il bilancio delle strisciate SEO in WordPress

Il modo più semplice e sicuro per ottimizzare il budget di crawl SEO in WordPress è utilizzare All in One SEO for WordPress, o AIOSEO.

È il miglior plugin SEO per WordPress con uno strumento integrato di ottimizzazione del crawl SEO.

Per iniziare, installiamo e attiviamo innanzitutto il plugin All in One SEO for WordPress. Se non sapete come fare, potete consultare la nostra guida passo-passo su come installare un plugin per WordPress.

Nota: esiste anche una versione gratuita di All in One SEO, che include anche una caratteristica di pulizia del crawl. Vi consigliamo di utilizzare il piano PRO del plugin a pagamento, perché vi darà anche accesso allo strumento ‘Redirection Manager’ per correggere gli errori 404 sul vostro sito web.

Dopo l’attivazione, il plugin mostra una procedura di configurazione guidata. È sufficiente seguire le istruzioni sullo schermo per configurare il plugin.

All in One SEO wizard

Successivamente, è possibile accedere alla sezione All in One SEO ” Aspetto della ricerca dall’area di amministrazione di WordPress.

Quindi, passare alla scheda “Avanzate”.

Search Appearance - Advanced

Da qui, scorriamo verso il fondo della pagina fino a individuare l’opzione “Crawl Cleanup”.

Fare clic sulla levetta per abilitare la caratteristica “Crawl Cleanup”.

Crawl cleanup

Ora, la prima opzione che si vedrà nella pulizia del crawl è quella di rimuovere gli argomenti della query.

Di seguito, è possibile fornire un elenco di argomenti di query che si desidera consentire. Gli utenti avanzati possono utilizzare le espressioni regolari Regex.

Successivamente, si vedranno le opzioni per i Feed RSS di WordPress. All in One SEO vi mostrerà tutti i tipi di Feed RSS generati da WordPress e potrete disabilitare i Feed RSS meno importanti.

Disable RSS feeds

Ad esempio, se avete un blog con un solo autore, potete disabilitare la caratteristica “Feed degli autori”.

Una volta disattivati tutti i feed RSS indesiderati, non dimenticate di fare clic sul pulsante “Salva modifiche” per memorizzare le impostazioni.

Come impostare i reindirizzamenti per le pagine di errore

All in One SEO imposta automaticamente i reindirizzamenti per i feed che avete disabilitato. Ad esempio, un feed RSS di tag reindirizzerà gli utenti alla pagina dell’archivio dei tag.

È possibile accedere alla dashboard di Google Search Console e aprire il report delle statistiche di crawl. Qui verrà visualizzato un elenco delle pagine che hanno dato luogo a errori.

Find error pages

A questo punto, a seconda del codice di stato, è possibile impostare dei reindirizzamenti per quelle pagine.

Ad esempio, è possibile reindirizzare gli errori 404 a una pagina simile. È inoltre possibile controllare altre pagine con errori e impostare per esse dei reindirizzamenti.

All in One SEO rende molto semplice l’impostazione dei reindirizzamenti sul vostro sito web WordPress. Basta andare alla pagina All in One SEO ” Reindirizzamenti e aggiungere il vecchio URL nel campo “URL di origine” e il nuovo URL nel campo “URL di destinazione”.

Redirects manager

Fare clic sul pulsante “Add Redirect” per salvare le impostazioni.

In seguito, è sufficiente ripetere la procedura per impostare altri reindirizzamenti, se necessario. Per maggiori dettagli e metodi alternativi, consultate la nostra guida su come impostare i reindirizzamenti in WordPress.

Suggerimento bonus: Creare una Sitemap in WordPress

Una sitemap XML è un file speciale che elenca tutte le pagine del vostro sito web in un formato facilmente leggibile dai motori di ricerca come Google. Si tratta di una mappa che consente ai motori di ricerca di trovare e indicizzare i vostri contenuti.

La presenza di una sitemap XML non aumenta direttamente le classifiche di ricerca, ma aiuta i motori di ricerca a trovare e indicizzare una maggiore quantità di contenuti.

XML sitemap example

Questo è particolarmente utile per i nuovi siti web o blog senza molti backlink, in quanto aiuta i motori di ricerca a scoprire tutte le pagine. Anche per i siti consolidati, le sitemap evidenziano le pagine di ricerca importanti e la frequenza di aggiornamento, facilitando l’indicizzazione dei contenuti da parte dei motori di ricerca.

Per saperne di più su questo argomento, potete selezionare la nostra guida su cos’è una sitemap XML e come crearne una in WordPress.

Speriamo che questo articolo vi abbia aiutato a conoscere il problema del crawl budget SEO di WordPress e come correggerlo. Potreste anche voler consultare questi consigli degli esperti sull’utilizzo di Google Search Console per aumentare il traffico o vedere esempi pratici di come migliorare il tasso di clic organico in WordPress.

Se questo articolo vi è piaciuto, iscrivetevi al nostro canale YouTube per le esercitazioni video su WordPress. Potete trovarci anche su Twitter e Facebook.

Divulgazione: I nostri contenuti sono sostenuti dai lettori. Ciò significa che se cliccate su alcuni dei nostri link, potremmo guadagnare una commissione. Vedi come WPBeginner è finanziato , perché è importante e come puoi sostenerci. Ecco il nostro processo editoriale .

Avatar

Editorial Staff at WPBeginner is a team of WordPress experts led by Syed Balkhi with over 16 years of experience in WordPress, Web Hosting, eCommerce, SEO, and Marketing. Started in 2009, WPBeginner is now the largest free WordPress resource site in the industry and is often referred to as the Wikipedia for WordPress.

Il kit di strumenti WordPress definitivo

Ottenete l'accesso gratuito al nostro kit di strumenti - una raccolta di prodotti e risorse relative a WordPress che ogni professionista dovrebbe avere!

Reader Interactions

7 commentiLascia una risposta

  1. Jiří Vaněk

    I have a custom 404 page set up and here, in addition to apologizing to readers, I also have links to interesting content on the site that might interest them. Can this option also help?

    • WPBeginner Support

      A 404 page would not affect you SEO crawl budget.

      Admin

      • Jiří Vaněk

        Thank you for answer. I didn’t know that, so again I know something new thanks to you.

  2. Moinuddin Waheed

    This is completely new concept to and I have come to know about crawl budget and its importance.
    since crawl budget is given by Google itself and index web pages on its basis, what is the criteria for large and small websites and what are factors contributing to crawl budget?

    • WPBeginner Support

      For the moment that is not publicly shared information which is why we recommend taking a look at the Crawl report to get an idea of what you have for your site.

      Admin

  3. ASHIKUR RAHMAN

    how can i tell google to not crawl /feed/ links? most of our post is indexed. but same or more number of postlinks/feed/ is crawling by google. in gsc these links becomes duplicate link.

    • WPBeginner Support

      You would want to noindex your feed to prevent Google from crawling it, if you have a SEO plugin on your site, those would normally have settings to quickly noindex your feed.

      Admin

Lascia una risposta

Grazie per aver scelto di lasciare un commento. Tenga presente che tutti i commenti sono moderati in base alle nostre politica dei commenti e il suo indirizzo e-mail NON sarà pubblicato. Si prega di NON utilizzare parole chiave nel campo del nome. Avremo una conversazione personale e significativa.