Internet archive

Aunque se haya suprimido la página original, hay una manera de volver a encontrar su contenido, ya que algunas organizaciones crean imágenes de antiguos sitios web. Internet Archive es la solución. Con la ayuda de la tecnología moderna, recopilan continuamente instantáneas y las ponen a disposición de los usuarios de Internet de forma gratuita.

Way back Machine

El proyecto más famoso de este tipo es el Wayback Machine. Este servicio del Proyecto de Archivos de Internet archiva gran parte de la red mundial de acceso público, y lo ha hecho desde 1996. A continuación  explicaremos el principio de funcionamiento de la máquina Wayback y le presentaremos alternativas con las que también podrá ver las páginas web del pasado.

internet archive

¿Qué es Internet archive?

Brewster Kahle vendió su primera empresa propia, el servicio de búsqueda WAIS, a AOL en 1992 por 15 millones de dólares. Con este capital fundó una nueva compañía y una organización sin fines de lucro. La empresa era Alexa-Internet, que vendió a Amazon.com unos años después por unos impresionantes 250 millones de dólares. Como resultado, ahora tenía aún más recursos financieros a su disposición, varios millones de los cuales puso en su proyecto sin fines de lucro: el Archivo de Internet.

Como parte de este proyecto, también se desarrolló la llamada Way back Machine. Un archivo web en el que se pueden encontrar capturas de pantalla de páginas web antiguas de diferentes épocas. Casi nadie recuerda Thefacebook de 2004, pero bajo su nombre actual el sitio se convirtió en una de las redes sociales más grandes del mundo. Pero el Wayback Machine puede llevar a sitios web incluso más antiguos que los de 2004 – las primeras capturas de pantalla se remontan a 1996.

Origen

Como su nombre indica, el proyecto Archivos de Internet se originó como un archivo web. Cuando Brewster Kahle creó el archivo por primera vez en 1996, utilizó los datos de su proyecto Alexa Internet, que recogía las visitas a sitios web de dominios de Internet. Alexa ahora es ofrecida por Amazon como un servicio de análisis de marketing. Inicialmente, se dio prioridad a los sitios web populares para los archivos de Internet. Sin embargo, según un estudio de la revista Forbes de 2015, el número de instantáneas de un sitio web en archive.org (el sitio web del proyecto) no siempre se correlaciona con el rango de Alexa o la frecuencia de actualización de un dominio. Por lo tanto, por el momento no sabemos qué métodos de selección utiliza exactamente el proyecto.

Más que sólo sitios web del pasado

El Archivo de Internet ha logrado mucho en sus veinte años de historia. Se ha convertido en una enorme biblioteca virtual por derecho propio. Según su propia información, archive.org utilizó un enorme espacio de almacenamiento de 18,5 petabytes para contenido individual en 2015 (un total de 50 petabytes, es decir, 50 billones de bytes) y ha crecido en varios terabytes cada semana desde entonces. Según las últimas encuestas, se puede acceder a alrededor de 327.000 millones de versiones antiguas de sitios web a través de la Wayback Machine. Además, el proyecto recoge:

Textos y libros

Grabaciones de audio con unos 4,4 millones, incluidas 189.000 grabaciones en directo de conciertos. Videos y producciones de televisión, alrededor de 5,8 millones, de los cuales alrededor de 1,6 millones son récords de noticias.Imágenes alrededor de 3,1 millones. Programas informáticos unos 209.000.
Gran parte del contenido proviene de universidades, organizaciones gubernamentales como la NASA, de proyectos de digitalización de textos como el Proyecto Gutenberg o Arvix, y también de colecciones de cine y audio como la Colección Prelinger, o del archivo de música en vivo Etree.

Brewster Kahle es un activista de la red que no sólo está comprometido con una Internet libre, sino con el conocimiento de libre acceso. Fue uno de los opositores más populares de la llamada “ley de protección de mickey mouse” (el nombre real es “ley de extensión del término de derechos de autor”), que fue apoyada por Disney. Esta ley condujo a una extensión de la ley de derechos de autor en los Estados Unidos. A partir de ahora, las obras estarán protegidas por el derecho de autor hasta 70 años (y no – como antes – 50 años) después de la muerte de una persona.