💾Wayback Machine: ¿Qué es?🗓

archive

Archivo de Internet es una biblioteca sin ánimo de lucro que, este año, celebra 25 años en la misión de dar “acceso universal a todo el conocimiento”. Es muy conocida por el proyecto Wayback Machine,  en el que se puede encontrar archivada gran parte de la web pública. Los administradores guardan páginas web a un ritmo de más de mil millones de direcciones URL diarias.

Miles de artículos han hecho referencia a dichos servicios. En la serie compilatoria de GIJN para el 2020, Mis herramientas favoritas, varios periodistas destacados la han reconocido como un pilar importante para su trabajo.

A continuación una introducción para personas interesadas en probar Wayback Machine en su próxima investigación.

Archivando direcciones URL 

Si publicas un artículo que hace referencia a un sitio web y los responsables eliminan páginas claves, o el sitio en sí mismo, se puede perder la información allí contenida si no han sido archivadas. ¡Si no quieres que eso te ocurra!

salvarDecenas de millones de direcciones URL son archivadas cada día por los usuarios con el servicio “guardar página ahora” de Wayback Machine. Cualquiera puede enviar una dirección URL y, si inicias sesión con una cuenta de archivo gratuita, también puedes solicitar archivar cualquier “enlace externo” – direcciones externas dentro de la página original que quieres capturar – y recibir un informe global de esta captura a tu correo electrónico.

He aquí cómo puedes hacerlo: si tienes una lista de direcciones URL que quieres archivar, añádelas a la “columna A” de una hoja de cálculo de Google y envíala a través del servicio de Google Sheets “guardar página ahora” que puedes encontrar aquí. Las columnas B, C y D serán completadas con un código de estado, una dirección URL archivada y un marcador si la dirección ha sido archivada por Wayback Machine antes.

batch

Otra opción es remitir una sola dirección URL, enviándola a “spn@archive.org” y, si añades “capture outlinks” (enlaces externos de captura) al asunto, estos también se conservarán. De nuevo, recibirás un correo de confirmación cuando el proceso se haya completado.

Finalmente, para los más preparados técnicamente, Wayback Machine proporciona una API (Application Programming Interface por sus siglas en inglés), o interfaz de programación, que permite la integración dentro del software de tus flujos de trabajo existentes, o al construir nuevas aplicaciones, para ayudarte a automatizar el trabajo.

🦆El Cambio Climático no espera a las Leyes

🏴Huelga General en la provincia de Cádiz el próximo 18 de junio, convocada por CGT contra el cierre de Airbus, en defensa del empleo y contra la precariedad laboral

helenos

Deja un comentario