En el momento de escribir este artículo, en España el SEPE (Servicio Público de Empleo Estatal) ha sido objeto de un masivo ataque informático. La mayoría de su sistema de ordenadores, servidores e incluso teléfonos se han visto comprometidos. Esto ha provocado que miles de personas no puedan acceder a la plataforma para hacer cualquier tipo de operación (registrarse, pedir ayudas, renovar subvenciones, etc.). ¿Qué tiene que ver esto con el tema de la Wayback Machine?
El tema de la caída de la red SEPE tiene mucho que ver con el servicio Wayback Machine. Aparte de los problemas de la caída de una plataforma gubernamental tan importante, la gente se dio cuenta de un detalle que ha generado indignación, sorpresa e incluso muchas risas. La página principal de la Web del SEPE había sido cambiada por un antiguo archivo HTML sacado de la Web de Wayback Machine.
Básicamente, el SEPE había puesto una página Web estática sin enlaces a ninguna parte. Solo un mensaje escrito en el código HTML avisando del problema de seguridad que tenían. ¿Qué significa esto? Pues que estaban utilizando una página principal que habían utilizado muchos años atrás. Esto nos lleva al tema del artículo el cual es ¿Qué es Wayback Machine?
¿Qué es Wayback Machine?

En Internet hay millones de páginas Web y todos los días salen miles de sitios Web nuevos. Lo que ocurre es que estos sitios online cambian constantemente y es difícil saber como eran originalmente. Wayback Machine ayuda en este sentido, ya que hace pantallazos de los millones de sitios Web, y los archiva cada cierto tiempo.
Wayback Machine es un gigantesco almacén digital que guarda sitios Web y los preserva tal como eran en el momento de hacer la captura. De esta manera, siempre habrá una forma de recordar como eran estos sitios Web en el pasado. Incluso si una sitio Web ha desaparecido, esta librería de archivos guarda copias de cómo era anteriormente.
¿Por qué almacenar antiguas páginas Web en un directorio?
Lo cierto es que la idea de crear Wayback Machine no era nueva, ya que existía algo parecido llamado Internet Archive. Este “almacén” creado por Brewster Kahle y Bruce Gilliat guarda sitios Web, libros digitales y archivos de audio y video. Estos mismos emprendedores idearon Wayback Machine, lo cual es una rama de Internet Archive.
Wayback Machine comenzó a funcionar en el año 2001, aunque sus creadores llevaban guardando páginas Web desde los años noventa. Para conseguir “recuperar” los millones de sitios Web utilizan rastreadores. Básicamente es un software que se mueve por Internet y va haciendo capturas de los sitios que va encontrando. Google también usa el mismo sistema para detectar nuevos sitios Web.
¿Capturan los rastreadores todos los sitios Web que hay en Internet? Lo cierto es que la idea es hacer capturas de todo, pero la frecuencia con lo que se hace varía mucho. Por ejemplo la importancia del sitio Web es un factor para que los rastreadores hagan las capturas en poco tiempo. Tampoco hace capturas de todo el sitio Web completo, ya que suele hacer una copia de unas pocas. Hay que tener en cuenta que no es una plataforma de backups.
¿Cómo se puede usar Wayback Machine?

Usar Wayback Machine es algo muy fácil que puede hacer cualquiera. Posiblemente te hayas encontrado con enlaces rotos donde aparecen páginas de error en lugar de lo que queremos ver. Si queremos saber qué es lo que había antes en ese dominio, lo primero es ir a la Web de Wayback Machine.
En la ventana de búsqueda solo tenemos que teclear la Web que queremos encontrar, y nos dará varias fechas en forma de calendario. Solo tenemos que seleccionar la fecha para saber como era esa Web en ese momento exacto. En el mismo calendario veremos la frecuencia con la que se hacían las capturas de la Web.
Como hemos dicho al principio, el SEPE hizo una búsqueda de una antigua versión de su Web y la ha utilizado en la Web actual. Es una forma curiosa de usar Wayback Machine, pero nos muestra como nada se desaprovecha por muchos años que hayan pasado.
Hay otros usos que se le dan a Wayback Machine, y algunos muy eficientes cuando se trata de contenido Web. Como se ha dicho, muchos sitios Web desaparecen de Internet y por tanto los buscadores los desindexan. Esto significa que muchos artículos quedan disponibles de nuevo, y muchos se aprovechan de Wayback Machine para recuperarlos y usarlos en sus Webs propias.
Como se puede ver, esta útil herramienta de Internet sirve para más cosas de las que se puede pensar.