Aquí en WPBeginner, hemos guiado a millones de usuarios sobre cómo optimizar sus sitios web para la búsqueda y aumentar su tráfico orgánico. Hemos encontrado que un aspecto de SEO que los principiantes a menudo pasan por alto es el archivo robots.txt que ayuda a los motores de búsqueda a descubrir, rastrear e indexar su sitio web.
Este sencillo archivo de texto actúa como un conjunto de instrucciones que orienta a los robots de los motores de búsqueda sobre las partes de su sitio a las que deben acceder y las que no.
Al optimizar su archivo robots.txt, puede asegurarse de que los motores de búsqueda se centran en rastrear e indexar su contenido más importante, evitando al mismo tiempo que malgasten recursos en áreas menos importantes de su sitio web.
Este artículo le mostrará algunos consejos sobre cómo crear un archivo robots.txt perfectamente optimizado para su sitio web WordPress, maximizando su potencial SEO.
¿Qué es un archivo Robots.txt?
Robots.txt es un archivo de texto que los propietarios de sitios web pueden crear para indicar a los robots de los motores de búsqueda cómo rastrear e indexar las páginas de sus sitios.
Normalmente se almacena en el directorio raíz (también conocido como la carpeta principal) de su sitio web. El formato básico de un archivo robots.txt es el siguiente:
User-agent: [user-agent name]
Disallow: [URL string not to be crawled]
User-agent: [user-agent name]
Allow: [URL string to be crawled]
Sitemap: [URL of your XML Sitemap]
Puede tener varias líneas de instrucciones para permitir o desautorizar URL específicas y añadir varios mapas del sitio. Si no desautoriza una URL, los robots de los motores de búsqueda supondrán que tienen permiso para rastrearla.
Este es el aspecto que puede tener un archivo robots.txt de ejemplo:
User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /wp-admin/
Sitemap: https://example.com/sitemap_index.xml
En el ejemplo anterior de robots.txt, hemos permitido a los motores de búsqueda rastrear e indexar archivos en nuestra carpeta de subidas de WordPress.
A continuación, impedimos que los robots de búsqueda rastreen e indexen los plugins y las carpetas de administrador de WordPress.
Por último, hemos proporcionado la URL de nuestro mapa del sitio XML.
¿Necesita un archivo Robots.txt para su sitio WordPress?
Si no tiene un archivo robots.txt, los motores de búsqueda rastrearán e indexarán su sitio web. Sin embargo, no podrá indicarles qué páginas o carpetas no deben rastrear.
Esto no tendrá mucho impacto cuando empieces un blog y no tengas mucho contenido.
Sin embargo, a medida que su sitio web crezca y añada más contenido, es probable que desee controlar mejor cómo se rastrea e indexa su sitio web.
He aquí por qué.
Los robots de búsqueda tienen una cuota de rastreo para cada sitio web.
Esto significa que rastrean un determinado número de páginas durante una sesión de rastreo. Si agotan su presupuesto de rastreo antes de terminar de rastrear todas las páginas de su sitio, volverán y reanudarán el rastreo en la siguiente sesión.
Esto puede ralentizar la tasa / tarifa de indexación de su sitio web.
Puede corregirlo impidiendo que los robots de búsqueda rastreen páginas innecesarias, como las páginas de administrador de WordPress, los archivos de plugins y la carpeta de temas.
Al no permitir páginas innecesarias, usted guarda su cuota de rastreo. Esto ayuda a los motores de búsqueda a rastrear aún más páginas de su sitio e indexarlas lo más rápidamente posible.
Otra buena razón para utilizar un archivo robots.txt es impedir que los motores de búsqueda indexen una entrada o página de su sitio web.
Esta no es la forma más segura de ocultar contenido al público en general, pero le ayudará a evitar que el contenido aparezca en los resultados de búsqueda.
¿Cómo es un archivo Robots.txt ideal?
Muchos blogs populares utilizan un archivo robots.txt muy sencillo. Su contenido puede variar en función de las necesidades del sitio específico:
User-agent: *
Disallow:
Sitemap: https://www.example.com/post-sitemap.xml
Sitemap: https://www.example.com/page-sitemap.xml
Este archivo robots.txt permite a todos los robots indexar todo el contenido y les enlaza con los mapas del sitio web en formato XML.
Para sitios WordPress, recomendamos las siguientes reglas en el archivo robots.txt:
User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-admin/
Disallow: /readme.html
Disallow: /refer/
Sitemap: https://www.example.com/post-sitemap.xml
Sitemap: https://www.example.com/page-sitemap.xml
Indica a los robots de búsqueda que indexen todas las imágenes y archivos de WordPress. Impide que los robots de búsqueda indexen el área de administrador de WordPress, el archivo readme y los enlaces de afiliados ocultos.
Si añade mapas del sitio al archivo robots.txt, facilitará a los robots de Google la búsqueda de todas las páginas de su sitio.
Ahora que ya sabe cómo es un archivo robots.txt ideal, veamos cómo crear un archivo robots.txt en WordPress.
Cómo crear un archivo Robots.txt en WordPress
Existen dos formas de crear un archivo robots.txt en WordPress. Puede elegir el método que más le convenga.
Método 1: Editar el archivo Robots.txt con All in One SEO
All in One SEO, también conocido como AIOSEO, es el mejor plugin SEO para WordPress del mercado, utilizado por más de 3 millones de sitios web. Es fácil de usar y viene con un generador de archivos robots.txt.
Para obtener más información, consulte nuestra reseña detallada de AIOSEO.
Si aún no tiene instalado el plugin AIOSEO, puede consultar nuestra guía paso a paso sobre cómo instalar un plugin de WordPress.
Nota: También existe una versión gratuita de AIOSEO que incorpora esta característica.
Una vez instalado y activado el plugin, puede utilizarlo para crear y editar su archivo robots.txt directamente desde su área de administrador de WordPress.
Simplemente vaya a All in One SEO ” Herramientas para editar su archivo robots.txt.
En primer lugar, deberá activar la opción de edición haciendo clic en el conmutador “Activar Robots.txt personalizados” en azul.
Con este conmutador activado, puede crear un archivo robots.txt personalizado en WordPress.
All in One SEO mostrará su archivo robots.txt existente en la sección “Vista previa de Robots.txt” en la parte inferior de su pantalla.
Esta versión mostrará las reglas por defecto que fueron añadidas por WordPress.
Estas reglas por defecto indican a los motores de búsqueda que no rastreen los archivos del núcleo de WordPress, permiten a los robots indexar todo el contenido y les proporcionan un enlace a los mapas del sitio XML de su sitio.
Ahora, puede añadir sus propias reglas personalizadas para mejorar su robots.txt para SEO.
Para añadir una regla, introduzca un agente de usuario en el campo “Agente de usuario”. Si utiliza *, la regla se aplicará a todos los agentes de usuario.
A continuación, seleccione si desea “Permitir” o “No permitir” que los motores de búsqueda rastreen.
A continuación, introduzca el nombre del archivo o la ruta del directorio en el campo “Ruta del directorio”.
La regla se aplicará automáticamente a su robots.txt. Para añadir otra regla, basta con hacer clic en el botón “Añadir regla”.
Recomendamos añadir reglas hasta crear el formato ideal de robots.txt que compartimos anteriormente.
Sus reglas personalizadas tendrán este aspecto.
Cuando hayas terminado, no olvides hacer clic en el botón “Guardar cambios” para guardar los cambios.
Método 2: Editar el archivo Robots.txt usando WPCode
WPCode es un potente plugin de fragmentos de código que te permite añadir código personalizado a tu sitio web de forma fácil y segura.
También incluye una práctica característica que le permite editar rápidamente el archivo robots.txt.
Nota: También existe un plugin gratuito de WPCode, pero no incluye la característica de editor de archivos.
Lo primero que tienes que hacer es instalar el plugin WPCode. Para obtener instrucciones paso a paso, consulte nuestra guía para principiantes sobre cómo instalar un plugin de WordPress.
Una vez activado, tienes que ir a la página WPCode ” Editor de archivos. Una vez allí, simplemente haga clic en la pestaña ‘robots.txt’ para editar el archivo.
Ahora, puede pegar o escribir el contenido del archivo robots.txt.
Una vez que haya terminado, asegúrese de hacer clic en el botón “Guardar cambios” situado en la parte inferior de la página para establecer los ajustes.
Método 3: Edición manual del archivo Robots.txt mediante FTP
Para este método, necesitará utilizar un cliente FTP para editar el archivo robots.txt. También puede utilizar el gestor de archivos de su alojamiento de WordPress.
Simplemente conéctese a los archivos de su sitio web WordPress utilizando un cliente FTP.
Una vez dentro, podrá ver el archivo robots.txt en la carpeta raíz de su sitio web.
Si no ve ninguno, es probable que no tenga un archivo robots.txt.
En ese caso, puedes seguir adelante y crear uno.
Robots.txt es un archivo de texto plano, lo que significa que puede descargarlo a su ordenador y editarlo con cualquier editor de texto plano como Notepad o TextEdit.
Tras guardar los cambios, puede volver a subir el archivo robots.txt a la carpeta raíz de su sitio web.
Cómo probar su archivo Robots.txt
Una vez que haya creado su archivo robots.txt, siempre es una buena idea probarlo utilizando una herramienta de comprobación de robots.txt.
Existen muchas herramientas de comprobación de robots.txt, pero te recomendamos que utilices la que se encuentra en Google Search Console.
En primer lugar, tendrás que enlazar tu sitio web con Google Search Console. Si aún no lo ha hecho, consulte nuestra guía sobre cómo añadir su sitio de WordPress a Google Search Console.
A continuación, puede utilizar la herramienta de comprobación de robots de Google Search Console.
Sólo tiene que seleccionar su propiedad en la lista desplegable.
La herramienta buscará automáticamente el archivo robots.txt de su sitio web y resaltará los errores y advertencias si encuentra alguno.
Reflexiones finales
El objetivo de optimizar su archivo robots.txt es evitar que los motores de búsqueda rastreen páginas que no están disponibles públicamente. Por ejemplo, páginas en su carpeta wp-plugins o páginas en su carpeta de administrador de WordPress.
Un mito común entre los expertos en SEO es que el bloqueo de categorías, etiquetas y páginas de archivo de WordPress mejorará la tasa de rastreo y dará lugar a una indexación más rápida y mejores clasificaciones.
Esto no es cierto. También va en contra de las directrices para webmasters de Google.
Le recomendamos que siga el formato robots.txt anterior para crear un archivo robots.txt para su sitio web.
Guías de expertos sobre el uso de Robots.txt en WordPress
Ahora que ya sabe cómo optimizar su archivo robots.txt, puede que le interese ver otros artículos relacionados con el uso de robots.txt en WordPress.
- Glosario Robots.txt
- Cómo ocultar una página de WordPress de Google
- Cómo impedir que los motores de búsqueda rastreen un sitio WordPress
- Cómo eliminar permanentemente un sitio WordPress de Internet
- Cómo ocultar (no indexar) fácilmente archivos PDF en WordPress
- Cómo solucionar el error “Googlebot no puede acceder a los archivos CSS y JS” en WordPress
- Cómo configurar correctamente All in One SEO para WordPress (Guía definitiva)
Esperamos que este artículo le haya ayudado a aprender a optimizar su archivo robots.txt de WordPress para SEO. Puede que también quieras ver nuestra guía definitiva de SEO para WordPress y nuestra selección de las mejores herramientas SEO para WordPress para hacer crecer tu sitio web.
If you liked this article, then please subscribe to our YouTube Channel for WordPress video tutorials. You can also find us on Twitter and Facebook.
Moinuddin Waheed
Thanks for this informative post about robots.txt file.
I didn’t know that websites should maintain this file in order to have a control over Google bots that how should they crawl over our pages and posts.
for beginner websites just starting out, is there a need to have robots.txt file or is there a way like plugin which can a make a robots.txt file for our website?
WPBeginner Support
Most SEO plugins help with setting up the robots.txt for a new site to prevent bots from scrolling sections they shouuldn’t.
Administrador
Jiří Vaněk
Thanks to this article, I checked the robots.txt file and added URL addresses with sitemaps. At the same time, I had other problematic lines there, which were revealed by the validator. I wasn’t familiar with sitemaps in robots.txt until now. Thanks.
WPBeginner Support
You’re welcome, glad our guide could help!
Administrador
Stéphane
Hi,
Thanks for that post, it becomes clearer how to use the robots.txt file. On most websites that you find while looking for some advice regarding the robots.txt file, you can see that the following folders are explicitly excluded from crawling (for WordPress):
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
I don’t really understand the reasons to exclude those folders (is there one actually?). What would be your take regarding that matter?
WPBeginner Support
It is mainly to prevent anything in those folders from showing as a result when a user searches for your site. As that is not your content it is not something most people would want to appear for the site’s results.
Administrador
zaid haris
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
GSC show the coverage error for “Disallow: /wp-admin/” Is this wrong?
WPBeginner Support
For most sites, you do not want anything from your wp-admin to appear as a search result so it is fine and expected to receive the coverage area when you deny Google the ability to scan your wp-admin.
Administrador
Hansini
I am creating my robots.txt manually as you instructed for my WordPress site.
I have one doubt. when I write User-Agent: * won’t it allow another spamming robot to access my site?
Should I write User-Agent: * or User-Agent: Googlebot.?
WPBeginner Support
The User-Agent line is setting the rules that all robots should follow on your site, if you specify a specific bot on that line it would be setting rules for that specific bot and none of the others.
Administrador
Nishant
What should we write to make google index my post?
WPBeginner Support
For having your site listed, you would want to take a look at our article below:
https://www.wpbeginner.com/beginners-guide/how-do-i-get-my-wordpress-site-listed-on-google-beginners-guide/
Administrador
Sanjeev Pandey
should we also disallow /wp-content/themes/ ?
It is appearing in the search result when I run the command site:abcdef.com in google search
WPBeginner Support
You would not want to worry about blocking your themes folder and as you write SEO-friendly content you should no longer see the themes as a search result.
Administrador
Salem
HI, What’s means ” Disallow: /readme.html & Disallow: /refer/ ” ?
WPBeginner Support
That means you’re telling search engines to not look at any referral links or the readme.html file.
Administrador
sean
Hi, what are the pros and cons of blocking wp-content/uploads
Thank you
WPBeginner Support
If you block your uploads folder then search engines would not normally crawl your uploaded content like images.
Administrador
Piyush
thanks for solve my problem
WPBeginner Support
You’re welcome
Administrador
Ravi kumar
Sir i m very confused about robot.txt many time i submitted site map in blogger but the after 3,4 days coming the same issue what is the exactly robot.txt.. & how submit that please guide me
WPBeginner Support
It would depend on your specific issue, you may want to take a look at our page below:
https://www.wpbeginner.com/glossary/robots-txt/
Administrador
Prem
If I no index a url or page using robots.txt file, does google shows any error in search console?
WPBeginner Support
No, Google will not list the page but if the page is listed it will not show an error.
Administrador
Bharat
Hi
I have a question
i receive google search console coverage issue warning for blocked by robots.txt
/wp-admin/widgets.php
My question is, can i allow for wp-admin/widgets.php to robots.txt and this is safe?
WPBeginner Support
IF you wanted to you can but that is not a file that Google needs to crawl.
Administrador
Anthony
Hi there, I’m wondering if you should allow: /wp-admin/admin-ajax.php?
WPBeginner Support
Normally, yes you should.
Administrador
Jaira
May I know why you should allow /wp-admin/admin-ajax.php?
WPBeginner Support
It is used by different themes and plugins to appear correctly for search engines.
Amila
Hello! I really like this article and as I’m a beginner with all this crawling stuff I would like to ask something in this regard. Recently, Google has crawled and indexed one of my websites on a really terrible way, showing the pages in search results which are deleted from the website. The website didn’t have discouraged search engine from indexing in the settings of WordPress at the beginning, but it did later after Google showed even 3 more pages in the search results (those pages also doesn’t exist) and I really don’t understand how it could happen with “discourage search engine from indexing” option on. So, can the Yoast method be helpful and make a solution for my website to Google index my website on the appropriate way this time? Thanks in advance!
WPBeginner Support
The Yoast plugin should be able to assist in ensuring the pages you have are indexed properly, there is a chance before you discouraged search engines from crawling your site your page was cached.
Administrador
Amila
Well yes and from all pages, it cached the once who doesn’t exist anymore. Anyway, as the current page is on “discourage” setting on, is it better to keep it like that for now or to uncheck the box and leave the Google to crawl and index it again with Yoast help? Thanks! With your articles, everything became easier!
WPBeginner Support
You would want to have Google recrawl your site once it is set up how you want.
Pradhuman Kumar
Hi I loved the article, very precise and perfect.
Just a small suggestion kindly update the image ROBOTS.txt tester, as Google Console is changed and it would be awesome if you add the link to check the robots.txt from Google.
WPBeginner Support
Thank you for the feedback, we’ll be sure to look into updating the article as soon as we are able.
Administrador
Kamaljeet Singh
My blog’s robots.txt file was:
User-Agent: *
crawl-delay: 10
After reading this post, I have changed it into your recommended robots.txt file. Is that okay that I removed crawl-delay
WPBeginner Support
It should be fine, crawl-delay tells search engines to slow down how quickly to crawl your site.
Administrador
reena
Very nicely described about robot.text, i am very happy
u r very good writer
WPBeginner Support
Thank you, glad you liked our article
Administrador
JJ
What is Disallow: /refer/ page ? I get a 404, is this a hidden wp file?
Editorial Staff
We use /refer/ to redirect to various affiliate links on our website. We don’t want those to be indexed since they’re just redirects and not actual content.
Administrador
Sagar Arakh
Thank you for sharing. This was really helpful for me to understand robots.txt
I have updated my robots.txt to the ideal one you suggested. i will wait for the results now
WPBeginner Support
You’re welcome, glad you’re willing to use our recommendations
Administrador
Akash Gogoi
Very helpful article. Thank you very much.
WPBeginner Support
Glad our article was helpful
Administrador
Zingylancer
Thanks for share this useful information about us.
WPBeginner Support
Glad we could share this information about the robots.txt file
Administrador
Jasper
thanks for update information for me. Your article was good for Robot txt. file. It gave me a piece of new information. thanks and keep me updating with new ideas.
WPBeginner Support
Glad our guide was helpful
Administrador
Imran
Thanks , I added robots.txt in WordPress .Very good article
WPBeginner Support
Thank you, glad our article was helpful
Administrador