Wayback Machine: El archivo de Internet a través de los años

votar
Wayback Machine es una base de datos gratuita y online, mantenida por Archive.org -una organzación sin ánimo de lucro-, que contiene réplicas de una gran cantidad de páginas de Internet de acceso público, es decir, páginas que no estaban protegidas por contraseña, ni tampoco por el archivo robots.txt.


Si por alguna razón algún sitio, página o artículo, no está disponible momentáneamente se puede consultar vía "Wayback machine". Basta con tener la dirección URL original e insertarla en esta herramienta. La parte más importante de este proyecto es que dichas páginas también se puede consultar como ha variado su aspecto y contenido a través de los años.

Características y funcionamiento

El funcionamiento de Wayback Machine es muy simple: escribiendo la dirección URL de una página se mostrará una barra y un calendario que se mantendrán durante los resultados de búsqueda. Seleccionando franjas de tiempo podremos ver como fue esa página en otro momento.

La WABAC Machine original

Esperan implementar un motor de búsqueda de texto completo en algún momento del futuro. El sitio sólo almacena el contenido html del código fuente y lo guarda, por eso algunas imágenes y otros elementos no pueden verse.

En 2006 contenía hasta 2 petabytes de información y crecía en torno a 20 terabytes por mes. Actualmente hay 390.000 millones (390 billones para los americanos) de páginas web guardadas.

Tu blog y WayBack Machine

El archivo de Wayback Machine no es visible desde Google. Esto quiere decir que el material allí alojado puede no estar presente en los resultados del buscador. Sin embargo copiar ese material no está permitido por los términos de uso.

Pero Wayback Machine sí está construido para ayudarte a encontrar información que ya no está disponible en ninguna otra parte de la red, y para además de consultar o estudiar podemos emplearla de las siguientes maneras:

  • Hacer referencia con enlaces desde cualquier sitio. Si encuentras una página que te gustaría enlazar en tu página web o en un artículo, puedes copiar la dirección URL. Se puede incluso utilizar la coincidencia de URL y la fecha de especificación.
  • Almacenar y preservar tu sitio allí. Desde la página principal (Save Page Now), aunque actualmente parece que da error, puedes enviar tus páginas al archivo. Esto puede servir como una especie de copia de seguridad del contenido pública. Aunque si crees que no te conviene aparecer allí, puedes evitar su indexación con el archivo robots.txt* (User-agent: ia_archiver Disallow: /).
  • Usar un script para manejar errores 404 muy práctico que redirija a tu última página alojada en Wayback Machine. Esto mejorará la experiencia de usuario; si alguna visita de tu web se encuentra con alguna página que por cualquier motivo no existe, puedes sugerir enviar a la misma página almacenada en Wayback Machine.
  • Los programadores pueden emplear diferentes APIs para recuperar información del archivo de WayBack Machine mediante las APIs JSON, Memento o CDX Server. Para nosotros, los Bloggers, puede que no tenga muchas utilidades a simple vista pero para directorios, agregadores y muchos otros sitios diría que muchas sí.


Yahoo cerró Geocities ¿qué pasó? El Archivo de Internet creó esta página para ayudar a las personas que tenía sus sitios personales en Geocities para su conservación. Sin duda una herramienta muy útil, Internet en estado puro. Si algún día cierra Blogger o tu plataforma de blogs ya sabes a donde ir.

¿Qué te ha parecido? ¿Conoces alguna herramienta similar?

No hay comentarios:

Publicar un comentario en la entrada

Tu comentario tiene valor, dedícale unos minutos y repásalo. Si tiene faltas de gramaticales o de ortografía lo borraré. Respondo a todos así que si tienes dudas no repares en preguntar.

Si esperas respuesta acuérdate de marcar el botón de 'Avisarme'.

Y RECUERDA: Para mantener las conversaciones legibles usa correctamente el botón COMENTAR o RESPONDER cuando proceda. Muchas gracias.

Más de 2000 suscriptores reciben las entradas en su correo

Vía FeedBurner. Introduce tu dirección de correo electrónico y confirma el mensaje que te llegue.