Cómo cambiar el archivo robots.txt en Joomla

Todos los motores de búsqueda populares de Internet han acordado utilizar un archivo de texto proporcionado por cada sitio web que les dice en qué parte del sitio web deben indexar y cuál no. Este archivo de texto se llama robots.txt.

En este artículo vamos a hablar específicamente sobre el archivo robots.txt de Joomla.

Que es robots.txt

El archivo robots.txt es un archivo que contiene un conjunto de reglas para los motores de búsqueda. Cada regla contiene una ruta de carpeta e indica si esa ruta de carpeta puede indexarse ​​o no.

Sin embargo, debe tener en cuenta que no todos los motores de búsqueda respetan este archivo. Así que tenga en cuenta que no debe utilizar este archivo para ocultar información.

¿Qué hay en un archivo robots.txt de Joomla?

Como puede ver en el código a continuación, un archivo robots.txt de Joomla contiene un conjunto bastante grande de carpetas que los motores de búsqueda no pueden indexar.

# If the Joomla site is installed within a folder 
# eg www.example.com/joomla/ then the robots.txt file 
# MUST be moved to the site root 
# eg www.example.com/robots.txt
# AND the joomla folder name MUST be prefixed to all of the
# paths. 
# eg the Disallow rule for the /administrator/ folder MUST 
# be changed to read 
# Disallow: /joomla/administrator/
#
# For more information about the robots.txt standard, see:
# http://www.robotstxt.org/orig.html
#
# For syntax checking, see:
# http://tool.motoricerca.info/robots-checker.phtml
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/

La línea User-agent: * básicamente dice que TODOS los motores de búsqueda deben seguir las siguientes reglas.

El conjunto de carpetas que no están permitidas son básicamente carpetas que contienen código Joomla y no tienen nada que ver con su contenido. Por lo tanto, de todos modos, no contienen información valiosa para los motores de búsqueda. Por eso es aconsejable negarles el acceso a todos y mantener los resultados del motor de búsqueda de su sitio web relevantes solo para su contenido.

Cómo cambiarlo de la configuración global de Joomla

La configuración global de Joomla contiene una forma de cambiar rápidamente la funcionalidad básica de su archivo robots.txt. Veamos qué hay disponible.

Primero debe acceder a la configuración global de Joomla como en la captura de pantalla a continuación

go-to-joomla-global-configuration.png

Luego, en la parte inferior de la pantalla, habrá una sección llamada Configuración de metadatos y un cuadro de selección llamado Robots como en la captura de pantalla a continuación.

joomla-configuration-robots.txt.png

Como puede ver, este cuadro de selección contiene 4 opciones que son básicamente todas las opciones combinadas de Índice / Sin índice y Seguir / No seguir.

El valor más común para esta opción es indexar, seguimiento que pide a los motores de búsqueda que rastreen todo el sitio web e indexen todo.

La pregunta es, ¿qué significa Index and Follow?

Índice: la indexación significa que el motor de búsqueda utilizará cualquier parte de su sitio web en sus resultados de búsqueda.

Seguir: Seguir significa que el motor de búsqueda utilizará cualquier enlace proporcionado por cualquier parte de su sitio web para rastrear aún más su sitio web y así crear una estructura de árbol del mismo.

En general, usaría No Seguir si su sitio web tuviera solo un nivel y no quisiera que un motor de búsqueda use enlaces en esa página que pueden o no conducir a un sitio web completamente diferente.

Finalmente, una vez que haya elegido la opción correcta para usted, continúe y ahorre.

save-joomla-global-configuration.png

Qué hacer si actualizó recientemente Joomla 3.3

Joomla 3.3 y versiones anteriores tenían un archivo robots.txt diferente que usaba un conjunto diferente de instrucciones. Después del lanzamiento de Joomla 3.4, estas instrucciones se han modificado para ajustarse a los últimos cambios en los motores de búsqueda y la estructura de carpetas de Joomla.

El problema es que el proceso de actualización automática no modifica el archivo robots.txt, por lo que tienes que tomar manualmente una nueva copia de un archivo robots.txt de la última versión de Joomla y usarla en su lugar.

Espero que te haya gustado  nuestra pequeña guía sobre como cambiar el archivo robots.txt  de Joomla, añadenos a tus favoritos o marcadores y comparte el artículo en tus redes sociales, eso nos ayudaría en gran medida, a cambio te prometemos nuevos contenidos con regularidad.


Comparte en redes sociales:

Share on facebook
Share on twitter
Share on linkedin
Share on email
Share on whatsapp
Share on telegram

Esta web utiliza cookies propias para su correcto funcionamiento. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de sus datos para estos propósitos. Más información
Privacidad