El otro día estuve utilizando Wayback Machine, la herramienta disponible de Internet Archive (archive.org) que guarda copias de las páginas web (bueno, no son copias completas, sino que guarda el código html, así que las imágenes, css y js no se cargan si se ha modificado su ubicación). Lleva guardando copias desde 1996 y la herramienta está disponible desde 2001.
Ofrece una navegación temporal dando la opción de visualizar la página tal como era en el momento en que se creó la copia (snapshot). Os dejo el ejemplo de la evolución de la web del Ministerio de Educación y Cultura:
- 20 de junio 1997
https://web.archive.org/web/19970620072120/http://www.mec.es:80/educ.html - 21 de abril de 1999
https://web.archive.org/web/19990421161553/http://www.mec.es:80/ - 5 de junio de 2001
https://web.archive.org/web/20010605212324/http://www.mec.es:80/ - 31 de agosto de 2004
https://web.archive.org/web/20040831234353/http://wwwn.mec.es:80/index.html - 5 de enero de 2006
https://web.archive.org/web/20060105030656/http://www.mec.es:80/
En torno a esto, me surgen las siguientes preguntas y dudas ante la tarea de tratar archivísticamente las páginas web:
PREGUNTAS
Pregunta 1:
¿Alguien en su organización está archivando las versiones anteriores de la web?
Pregunta 2
¿Alguien lo está haciendo y es capaz de visualizarlas correctamente? Estoy pensando un entorno local (wamp, xamp ) para servir esas webs.
Pregunta 3
¿Alguien las ofrece a los usuarios como “material” consultable?
DUDAS SOBRE TRATAMIENTO ARCHIVÍSTICO
Duda1
¿Son documentos de archivo?
Las páginas web son dinámicas y su contenido cambiante. Si nos referimos exclusivamente al contenido público (intranets aparte, o gestiones que requieran usuarios registrados y autentificaciones), son documentos en formato electrónico que no incorporan elementos de validación como firmas o sellos. Si bien se supone que únicamente la entidad tiene la capacidad de editar el contenido, cualquier usuario puede descargar una copia completa de las páginas desde su navegador, editarla en su equipo y reutilizarla en otro dominio web.
Luego es el dominio web donde se aloja el que le da oficialidad al contenido. Los datos del registrante suelen ser públicos (datos del Whois, y datos publicados en nic.es para dominios.es). Los certificados SSL de Validación extendida (EV) (candado verde + nombre entidad) también respaldan la autoría del contenido.
Duda 2
En el caso de considerarlas documento de archivo, ¿cómo las tratarías?, ¿Tablón de anuncios?
Duda 3
En el caso de considerarlas documento de archivo ¿Que campos de descripción utilizaríais?
Esperando vuestras respuestas,
Samuel