¿Cómo agregar un archivo robots.txt personalizado en Blogger?

En un artículo anterior mío, hablé de la creación de etiquetas de encabezado de robot personalizadas para blogs.

Si ha leído este artículo, espero que sepa su importancia en los rankings de búsqueda.

Hoy, he vuelto con un término de blog muy útil, debes tener en cuenta que es Robots.txt.

En Blogger se lo conoce como Custom Robots.txt, lo que significa que ahora puede personalizar este archivo a su gusto.

En el tutorial de hoy, analizaremos este término en detalle y aprenderemos sobre sus usos y beneficios. También te diré cómo agregar un archivo robots.txt personalizado en Blogger.

Índice de contenidos
  1. ¿Qué es Robots.txt?
  2. Explicación
    1. User-agent: Mediapartners-Google
    2. User-agent: *
    3. Disallow: /search
    4. Disallow Particular Post
    5. Disallow Particular Page
    6. Sitemap: http://example.blogspot.com/feeds/posts/default?orderby=UPDATED
  3. Agregar Robots.Txt personalizado a Blogger
  4. ¿Cómo comprobar su archivo Robots.txt?

¿Qué es Robots.txt?

Robots.txt es un archivo de texto que contiene solo unas pocas líneas de código simple.

Se almacena en un sitio web o en un servidor de blogs, y el sitio web indica a los rastreadores web cómo indexar y rastrear el blog en los resultados de búsqueda.

Esto significa que puede restringir cualquier página web en su blog de los rastreadores web para que no se pueda indexar en motores de búsqueda como la página de etiquetas de su blog, la página de demostración o cualquier otra página cuya indexación no sea tan importante.

Recuerde siempre que los rastreadores de búsqueda escanean el archivo robot.txt antes de rastrear una página web.

Cada blog alojado por Blogger tiene su archivo robots.txt predeterminado, que se parece a esto:

User-agent: Mediapartners-Google

Disallow:

User-agent: *

Disallow: /search

Allow: /

Sitemap: http://example.blogspot.com/feeds/posts/default?orderby=UPDATED

Explicación

Este código se divide en tres secciones. Primero examinaremos cada uno de ellos y luego aprenderemos cómo agregar un archivo robots.txt personalizado en blogs de Blogspot.

User-agent: Mediapartners-Google

Este código es para el robot Google Adsense, que puede ayudarlo a poner mejores anuncios en su blog. ¿Está utilizando Google Adsense en su blog o no lo guarde?

User-agent: *

Esto se aplica a todos los robots que están marcados con un asterisco (*). En la configuración predeterminada, los enlaces de etiquetas de nuestro blog solo pueden ser indexados por rastreadores de búsqueda. Esto significa que los rastreadores web no indexarán los enlaces de nuestra página de etiquetas debido al siguiente código.

Disallow: /search

Esto significa que se ignorarán los enlaces cuya búsqueda por palabra clave se realice directamente en el nombre de dominio. Vea el siguiente ejemplo que tiene un enlace desde la página de etiquetas llamada SEO.

búsqueda http://www.miwebperfecta.com//label/SEO

Y si eliminamos Disallow: / search del código anterior, los rastreadores accederán a todo nuestro blog para indexar y rastrear todo su contenido y páginas web.

Aquí Allow: / significa la página de inicio, lo que significa que el rastreador web puede rastrear e indexar la página de inicio de nuestro blog.

Disallow Particular Post

Ahora suponga que si desea excluir publicaciones específicas del índice, puede agregar las siguientes líneas al código.

No permitir: /yyyy/mm/post-url.html

Aquí, AAAA y MM se refieren al año y mes del artículo. Por ejemplo, si lanzamos una versión de 2013 en marzo, debemos usar el siguiente formato.

No permitir: /2013/03/post-url.html

Para hacerlo más fácil, puede copiar la URL de la publicación y eliminar el nombre del blog desde el principio.

Disallow Particular Page

Si no necesitamos permitir una página en particular, podemos usar el mismo método que el anterior. Simplemente copie y pegue la URL de la página y elimine la dirección del blog que se parece a esto:

No permitir: /p/page-url.html

Sitemap: http://example.blogspot.com/feeds/posts/default?orderby=UPDATED

Este código se refiere al mapa del sitio de nuestro blog. Al agregar el enlace del mapa del sitio aquí, simplemente estamos optimizando la frecuencia de rastreo de nuestro blog.

Esto significa que cada vez que los rastreadores web escanean nuestro archivo robots.txt, encontrarán una ruta a nuestro mapa del sitio que tiene todos los enlaces de nuestras publicaciones publicadas.

Es fácil para los rastreadores web realizar un seguimiento de todos nuestros mensajes.

Por lo tanto, existe una mayor posibilidad de que los rastreadores web rastreen todas las publicaciones de nuestro blog sin ignorar una sola.

Nota: Este mapa del sitio solo informa a los rastreadores web sobre las últimas 25 publicaciones. Si desea aumentar la cantidad de enlaces en su mapa del sitio, reemplace el mapa del sitio predeterminado con lo siguiente. Funcionará para las 500 publicaciones más recientes.

Sitemap: http://example.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500

Si tiene más de 500 publicaciones en su blog, puede usar dos mapas de sitio como los siguientes:

Mapa del sitio: http://example.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500

Sitemap: http://example.blogspot.com/atom.xml?redirect=false&start-index=500&max-results=1000

Agregar Robots.Txt personalizado a Blogger

Ahora, la parte principal de este tutorial es cómo agregar un archivo robots.txt personalizado en Blogger. Entonces, aquí están los pasos para agregarlo.

  • Ve a tu blog de blogger.
  • Navegue a Configuración >> Índices y rastreadores  - Habilitar el contenido robots.txt personalizados.
  • Ahora pega tu código de archivo robots.txt en la caja.
  • Haga clic en el botón Guardar cambios.
  • ¡Ya terminaste!
AVvXsEiVT9qJ2caxKfOVQ3H4K3jukxKy7sA6 ry fpPlmuf2 HIkcZVqYkKawnsdHstt324Nqz4Uva8EtjJ1PWAMrEUFxN2Cpf yUI6JEoZ4182jCBVyVBR2t1SA TEfpjQrh8o2TWqeBgQxyGqaekynhLARKA RSSrZHP82oGRC5DdekF3ZpQsx7jzCpfd=w640 h200
Habilitar el contenido robots.txt personalizados

 

¿Cómo comprobar su archivo Robots.txt?

Puede consultar este archivo en su blog agregando /robots.txt al final de la URL de su blog en su navegador web. Por ejemplo:

  • http://www.yourblogurl.blogspot.com/robots.txt
  • Una vez que visite la URL del archivo robots.txt, verá el código completo que utilizará en su archivo robots.txt personalizado.

Vea la imagen de abajo.

AVvXsEgBUS5LFALPG9A2s8xcnv tFYkt0WEswSh64gljkAnbuyPJlSqvQ9xzid65ko2GQrTmTOYhkcpAMKKcDyMXtOD7PuPj4gsnQnSbgwKVQyX3gZ2LIdO1b2rOvyrzjwI Il8MIeV2ieOTy1F47pLhmt3GSZnujfamFvAQ3VCb8JmagNdx0XE9SvkWY5Kh=w640 h226

Este fue el tutorial completo de hoy sobre cómo agregar un archivo robots.txt personalizado en Blogger.

He hecho todo lo posible para que este tutorial sea lo más fácil e informativo posible. Si aún tiene alguna duda o pregunta, no dude en preguntarme en la sección de comentarios a continuación.

Asegúrese de no poner ningún código en su configuración personalizada de robots.txt sin saberlo. Solo pregúntame para resolver tus dudas. Te lo contaré todo en detalle.

Gracias por leer este tutorial. Si te gustó, ayúdame a difundir mis palabras compartiendo esta publicación en tus perfiles de redes sociales. Diviértete blogueando!

Felipe Arango

Siento pasión por el diseño web y las páginas web. Expreso mis ideas en miwebperfecta.com.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir