Descubre cómo Google indexa tu página web en su buscador
Glooglebot
El ‘rastreador’ más conocido es ‘Glooglebot’, a través del cual se pasa de un enlace a otro y se recopilan datos sobre las páginas, buscan enlaces a otras para visitarlas, prestando atención a los nuevos sitios, a los cambios de los actuales y a los enlaces inactivos.
Opciones para propietarios de webs
La mayoría de los sitios web no necesita establecer restricciones para rastrear, indexar o publicar contenido, por lo que sus páginas pueden aparecer en los resultados de búsquedas. Los propietarios de las webs tienen muchas opciones sobre cómo Google rastrea e indexa sus sitios a través de herramientas para webmaster y un archivo llamado ‘robots.txt’.
Cómo se organiza la información
La web, comentan desde la compañía de Mountain View, es como una biblioteca pública con miles de millones de libros y sin un sistema de archivo. Google recopila páginas durante el proceso de rastreo y, de forma posterior, crea un índice, por lo que los usuarios saben con exactitud dónde tienen que buscar.
De igual forma que el índice de un libro, el índice de Google incluye información acerca de las palabras y dónde aparecen. Al hacer una búsqueda, los algoritmos del buscador, localizan los términos de consulta en el índice para encontrar las páginas adecuadas.
¿En qué se fija Google?
El algoritmo comprueba la consulta y utiliza más de 200 variables para elegir las respuestas más relevantes entre millones de páginas y contenidos, para lo que tiene en cuenta:
• Actualidad del contenido de un sitio del sitio web
• Número de sitios web que dirigen a un sitio y origen de los enlaces
• Palabras de la página web
• Sinónimos de palabras clave buscadas
• Corrección ortográfica
• Calidad del contenido
• URL y título de la página web
• Tipo de resultado mejor (página web, imagen, vídeo, noticia, resultado personal, etc.)
• Personalización
• Recomendaciones de usuarios a los que se está conectado