NorfiPC
NorfiPC » Edición web » Enlaces rotos

Como buscar y encontrar enlaces rotos en mi blog o sitio web



Como saber los links que no funcionan en mis paginas usando el servicio Link Checker del W3C o WGET una aplicación gratis. Códigos y ejemplos para crear una lista detallada de todos los enlaces sin funcionar.
Como buscar y encontrar enlaces rotos en mi blog o sitio web
Es inevitable que con el paso del tiempo en las páginas de cualquier blog o sitio web algunos enlaces dejen de funcionar, debido al dinamismo de internet, donde constantemente sitios desaparecen o cambian las direcciones URL.
Estos enlaces rotos (broken links) o huérfanos que devuelven el famoso código de error 404 (archivo no encontrado), nos perjudican por dos razones, porque dejan insatisfechos a nuestros lectores y porque afectan el posicionamiento de las nuestras páginas en los buscadores.
Por esa razón todos los que publicamos en internet debemos dedicar una pequeña parte de nuestro tiempo a buscar los enlaces rotos y eliminarlos o modificarlos e insertarles la dirección correcta.



Como saber que enlaces no funcionan en mi sitio


Hay varias formas de encontrar los enlaces rotos.
Una de ellas es usar servicios de internet dedicados a esa tarea que escanean nuestro sitio y nos brindan un informe detallado.
La gran mayoría de ellos son de pago u ofrecen funciones limitadas.
El más famoso es la herramienta gratuita del W3C Link Checker (Comprobador de Links), pero que solo escanea 500 paginas, además es lento, aunque puede ser apropiado para sitios pequeños.
Otra opción es usar WGET para escanear nuestro sitio y mostrarnos un informe detallado.



Encontrar enlaces rotos con Link Checker del W3C


Para usar el buscador de enlaces rotos usando Link Checker (Comprobador de Links), carga la herramienta usando el siguiente enlace: https://validator.w3.org/checklink
Panel de Link Checker, herramienta del W3C para buscar y encontrar enlaces rotos.
Panel de Link Checker, herramienta del W3C para buscar y encontrar enlaces rotos
En el cuadro "Enter the address" introduce la dirección de una página específica, de un directorio o de un sitio.
Selecciona si es necesario algunas de las opciones.
- Summary only solo crea un resumen del resultado.
- Hide redirects no muestra las redirecciones.
- Don’t send header no envía los encabezados Accept-Languaje y Refer en las peticiones.
- Check linked recursively sigue los enlaces de forma recursiva.
Presiona el botón "Check".
Cuando finalice la tarea en la parte inferior de la página se pueden ver los resultados.
En la siguiente imagen se muestra el resultado del escaneo de una página de prueba subida a nuestro sitio, que posee 3 enlaces con direcciones que no existen.
Resultado de la prueba de enlaces rotos en una página con tres enlaces que devuelven el Error 404.
Resultado de la prueba de enlaces rotos en una página con tres enlaces que devuelven el Error 404
Lee más información sobre otras herramientas que ofrece W3C para tareas relacionadas con la publicación web.
Herramientas del W3C para desarrolladores y webmasters



Encontrar enlaces rotos con WGET


Para los que no conocen WGET diremos que es una sencilla pero maravillosa herramienta del software libre creada para la descarga de contenido desde servidores web.
Fue creada originalmente para Linux, pero existen versiones disponibles para Windows.
Entre sus muchas opciones WGET puede funcionar como una araña de un buscador de internet, mediante la opción "spider".
De esa forma escanea las páginas de un sitio, revisa los enlaces que contenga y sigue cada uno de ellos, escribiendo en un informe los enlaces rotos, además de otra información.



Como usar WGET


WGET funciona solo mediante la línea de comandos, pero su uso es sencillo, aunque no tengamos conocimiento alguno avanzados.
Solo necesitamos descargar la aplicación y situarla en el interior de la carpeta de Windows.
A continuación solo necesitamos abrir la Consola de comandos o Símbolo del sistema y escribir o pegar una línea de código.
También podemos crear para esa tarea un sencillo archivo batch (aplicación ejecutable) con el Blog de notas u otro editor de texto plano.
En otros artículos de nuestro sitio se puede encontrar información detallada sobre Wget y ejemplos prácticos de cómo usar la aplicación para descargar páginas, imágenes y cualquier contenido de internet de forma rápida.



Códigos para escanear con WGET en busca de enlaces rotos


Pega el siguiente código en la Consola de CMD o en un archivo batch.
Por supuesto sustituye la dirección de la página de nuestro sitio por otra página o por el sitio completo a comprobar.
wget.exe --spider -nd -nv -r -l2 http://norfipc.com/ -o log.txt 
Información sobre los parámetros usados:
-nd – No crea directorio para las páginas que Wget descarga y posteriormente elimina.
-nv – Información básica y elemental en el archivo con los resultados.
-r – Modo recursivo para poder escanear los enlaces.
-l2 – Profundidad del escaneo. Para usa sola página usa el valor 1, para todo un sitio 2 o 3 dependiendo de su estructura.
-o log.txt – Guardar el resultado en un archivo de texto de nombre log.txt.
Para sitios que usan SSL (https) se debe agregar el argumento --secure-protocol=auto --no-check-certificate
Para revisar archivos en directorios bloqueados con robots.txt se debe agregar: -e robots=off
En una prueba hecha con la dirección de una página de ejemplo subida a nuestro sitio web, la cual contiene tres enlaces a páginas que no existen, obtenemos el log con el resultado que se puede ver en la siguiente imagen.
Resultado de la prueba de enlaces rotos con WGET.
Resultado de la prueba de enlaces rotos con WGET



Descargar archivo bath de ejemplo


Descarga un archivo batch de ejemplo con el código anterior.
Solo se necesita editarlo y cambiar la dirección URL. Para eso solo arrástralo encima del Blog de notas, modifícalo y guarda los cambios.
Descomprime el archivo que descargues (Clic derecho > Extraer todo…) y ejecuta "encontrar-enlaces-rotos.cmd"
Asegúrate que "wget.exe" se haya copiado a la carpeta C:/Windows

Otras páginas relacionadas



Comparte esta página




Sígueme en las redes sociales


Sígueme en Google Plus Sígueme en Facebook Sígueme en Twitter Sígueme en Pinterest





 
Inicio | Mapa del sitio | Sobre mí | RSS | Buscar