NorfiPC
NorfiPC » Internet » Páginas no disponibles

Como recuperar páginas web que no funcionan y no están disponibles



Como entrar a páginas que devuelven un error 404, de sitios offline, desaparecidos o inaccesibles, usando el servicio Wayback Machine de Internet Archive. Ver copias guardadas o versiones anteriores de artículos. Como crear una copia de mi sitio para guardarla para la historia.
Como recuperar páginas web que no funcionan y no están disponibles en Internet Archive
Muchas veces al tratar de cargar páginas de internet recibimos un molesto mensaje de error 404 que indica que la página no existe o no está disponible.
La razón puede ser que ha sido eliminada o movida a otra ubicación.
Otras veces simplemente el sitio donde estaba ubicada la página no funciona, por errores en el servidor (errores 5XX) o porque dejo de funcionar de forma permanente.
Todo lo anterior se debe al dinamismo propio de internet, donde constantemente surgen nuevos sitios web y por diversas razones otros desaparecen o quedan inaccesibles.
No obstante todo no está perdido y es perfectamente posible obtener copias de páginas o sitios completos ya desaparecidos.
Ante cualquiera de estos conflictos, si necesitamos volver a cargar una página o un sitio que ya no funciona, siempre tenemos la opción de usar para eso el servicio Wayback Machine de Internet Archive.



¿Qué es Internet Archive?


Para preservar la memoria histórica de internet, hace muchos años surgió Internet Archive, un enorme archivo digital o almacén de páginas y contenidos de la web.
Es una organización sin ánimo de lucro que radica en San Francisco, California.
Internet Archive es uno de los sitios más importantes de internet, es como una enorme librería digital, poco conocida por la mayoría.
En este sitio podemos encontrar y descargar gratis todo tipo de contenido.

Archivos para descargar gratis desde Internet Archive


Todo el contenido multimedia y digital que se guarda en Internet Archive es libre de derechos y puede ser descargado y usado sin limitaciones.
Se puede explorar las siguientes secciones, ordenadas por la cantidad de archivos:
- Web o Wayback Machine (copias de páginas y sitios web)
- Texto (documentos, ebooks, libros digitales)
- Películas y videos (cine independiente, films clásicos y programas de televisión de dominio público)
- Archivos de audio (música, grabaciones)
- Software (programas, aplicaciones)
- Imágenes (fotografías, dibujos, ilustraciones, obras de arte digitalizadas)
- Conciertos grabados.
- Colecciones.
Para buscar en cualquiera de las secciones solo necesitamos cargar la página principal del servicio en https://archive.org/ y usar el cuadro de búsqueda o acceder directamente a cada sección o a las páginas de las colecciones.
Buscar cualquier archivo en el servicio de Internet Archive.
Buscar cualquier archivo en el servicio de Internet Archive
Al descargar archivos generalmente podemos escoger entre una gran variedad de formatos.
En la siguiente imagen de ejemplo se puede comprobar los formatos disponibles para descargar un libro específico.
Formatos disponibles al descargar un libro desde Archive.org.
Formatos disponibles al descargar un libro desde Archive.org
Si tenemos limitaciones con la conexión de internet, antes de seleccionar uno de los formatos podemos situar encima el cursor del ratón para conocer el tamaño del archivo a descargar.



Wayback Machine, volver atrás en el tiempo


Wayback Machine (en inglés Máquina del Tiempo), es un valioso servicio de Internet Archive que escanea y guarda copias regularmente, de los sitios de internet.
Allí podemos buscar y recuperar páginas de sitios que hace años no funcionan.
No solo eso, también se guardan copias de los sitios existentes, lo que permite ver como lucieron en distintos periodos y rescatar artículos que han sido modificados con el paso del tiempo.
En sus servidores se almacenan más de 400 billones de páginas web de internet.

Como buscar una página, un artículo o un sitio en Wayback Machine


Para buscar una copia de una página accede a Wayback Machine en https://archive.org/web/ y en el cuadro de búsqueda introduce la dirección URL de la página.
Buscar la copia guardada de una página web en el servicio de Wayback Machine.
Buscar la copia guardada de una página web en el servicio de Wayback Machine
Si la página esta guardada en el servicio, veremos un panel como en la siguiente imagen donde podremos comprobar la cantidad de copias existentes en distintos periodos.
Copias de páginas del sitio web NorfiPC guardadas en el servicio de Wayback Machine en Internet Archive.
Copias de páginas del sitio web NorfiPC guardadas en el servicio de Wayback Machine en Internet Archive
Solo necesitamos seleccionar el año y posteriormente la fecha, para cargar la copia de la página en el navegador.
La información que aparece sobre 72 veces que se han guardado copias, se refiere solo a la página índice del sitio.
Se puede comprobar que el servicio almacena datos de este sitio desde septiembre del año 2010, fecha de su creación.



Como guardar una copia de mi sitio en Wayback Machine


Otra de las opciones que brinda el servicio de Wayback Machine, es la de crear manualmente una copia de una página y guardarla inmediatamente.
Es una opción de mucha utilidad si queremos asegurarnos que páginas de nuestro interés sean guardadas y conservadas para nosotros o el resto de las personas.
También es muy práctico para los que poseen un blog o sitio y quieran asegurarse de tener una copia guardada después de efectuar cambios o modificaciones en su contenido.
En la siguiente imagen podemos ver como guardamos una copia de la página principal de nuestro sitio web.
Guardar una copia de una página de un sitio web en el servicio de de Wayback Machine en Internet Archive.
Guardar una copia de una página de un sitio web en el servicio de de Wayback Machine en Internet Archive



Guardar copias de sitios web completos en Internet Archive


Wayback Machine no ofrece opción alguna para descargar copias de páginas o sitios, su función es solo cargarlas usando el navegador.
Los que necesiten usar Internet Archive como un almacén o backup donde guardar y descargar copias completas digitales de sus sitios o de contenido multimedia, pueden usar un servicio auxiliar llamado Archive-It.
Es un servicio de suscripción.
Accede a: http://www.archive-it.org/



Como saber si existen copias de una página en Wayback Machine


Mediante una API pública que proporciona el servicio de Internet Archive, es posible saber rápidamente si existe una copia de una página de internet, guardada en el servicio de Wayback Machine.
Para eso solo necesitamos usar en el navegador web una dirección URL con el siguiente formato:
http://archive.org/wayback/available?url=http://pagina-web
Por ejemplo al hacer una consulta sobre una página de nuestro sitio de la siguiente forma:
http://archive.org/wayback/available?url=http://norfipc.com/internet/
Recibimos en el navegador la siguiente respuesta:
{"archived_snapshots":{"closest":{"available":true,"url":"http://web.archive.org/web/20150507110802/http://norfipc.com:80/internet/","timestamp":"20150507110802","status":"200"}}}
El campo "url" contiene la dirección de la página disponible en Internet Archive.
El campo "timestamp" contiene la fecha de la versión guardada más reciente, en este ejemplo corresponde al 7 de mayo del año 2015.



Bookmarklets y Marcadores para Wayback Machine


Para facilitar a los lectores tareas relacionadas con la búsqueda en Wayback Machine, hemos creado los siguientes Bookmarklets o Marcadores, que puedes guardar en tu navegador web.

Comprobar página
Permite conocer rápidamente si una página de internet posee copias en Internet Archive. Usa la API del servicio.

Comprobar página
Carga versiones guardadas de una página de internet en Wayback Machine

Buscar en Wayback Machine
Permite seleccionar texto en una página y buscar en Wayback Machine
En la página de error 404 que los lectores cargan cuando tratan de acceder a una página de este sitio que no existe o que ha sido eliminada, usamos un script para generar automáticamente el enlace de dicha página al servicio de WayBack Machine. En el siguiente artículo detallamos como hacerlo: Crear una página de Error 404 con enlace a Wayback Machine

Páginas relacionadas



Sígueme en las redes sociales




Buscar en este sitio

 
Inicio | Mapa del sitio | Sobre mí | RSS