Noindex es una directiva que instruye a los motores de búsqueda a excluir una página de su índice de búsqueda. Cuando un rastreador de motor de búsqueda encuentra una directiva noindex, procesa la página pero no la añade al índice, lo que significa que la página no aparecerá en los resultados de búsqueda. La directiva puede implementarse mediante una etiqueta meta en HTML o un encabezado HTTP X-Robots-Tag.
La directiva noindex es útil para páginas que deben ser accesibles para los usuarios pero no descubribles a través de motores de búsqueda. Los casos de uso comunes incluyen páginas de agradecimiento después de envíos de formularios, páginas de resultados de búsqueda interna, páginas de archivo paginadas, entornos de staging o vista previa y paneles administrativos. Los libros sobre SEO técnico en Amazon cubren estrategias de implementación.
Para los servicios de acortamiento de URL, noindex se aplica a las páginas de presentación, páginas de vista previa y páginas de enlaces protegidos con contraseña. Estas páginas cumplen un propósito funcional para los usuarios pero no deben aparecer en los resultados de búsqueda, ya que proporcionarían una experiencia de búsqueda deficiente.
Un matiz importante es que noindex no previene el rastreo. Los motores de búsqueda aún obtienen y procesan las páginas con noindex; simplemente no las añaden al índice. Para prevenir el rastreo por completo, deben usarse las directivas Disallow de robots.txt. Sin embargo, si una página está bloqueada por robots.txt, el motor de búsqueda no puede ver la etiqueta noindex, lo que puede llevar a que la página sea indexada basándose en señales externas. Los libros sobre desarrollo web y SEO en Amazon discuten estas interacciones.