La BNE lanza la tercera recolección masiva del dominio .es

En este foro los usuarios podrán subir las noticias que se vayan produciendo, sobre la temática de la web, y también se abrirá un hilo por cada noticia que se publique en la página principal.

Moderadores: Juan, Siu, cyclope, Moderadores

La BNE lanza la tercera recolección masiva del dominio .es

Notapor Vainaimoinen » Mar Abr 24, 2018 10:07 pm


Los sitios web son objeto de depósito legal y se consideran parte del patrimonio documental que la Biblioteca Nacional preserva


-24 de abril de 2018- La Biblioteca Nacional de España ha lanzado la tercera recolección masiva del dominio.es, que lleva a cabo con medios propios, para la consecución del depósito legal de las publicaciones en línea.


Desde la entrada en vigor de la Ley 23/2011, los sitios web son objeto de depósito legal y por tanto se consideran parte del patrimonio documental que la Biblioteca Nacional de España tiene el deber de preservar.


Como en los dos años precedentes, la Biblioteca usa el fichero de dominios que proporciona Red.es, entidad con la que tiene firmado un convenio de colaboración. Este fichero de dominios contiene este año más de 1.900.000, lo que supone un incremento de unos 50.000 por año desde 2016.


La recolección masiva se divide en 127 recolecciones (harvests) de 15.000 dominios cada una, que a su vez se dividen en trabajos (jobs), con lo que el proceso se desglosa en paquetes sobre los que trabajan las arañas (crawlers). La infraestructura de la BNE tiene configuradas para esta recolección masiva 71 arañas, que rastrean la web con un rendimiento de entre 300-350 Mb/sg.


Igual que el año pasado, el límite que se ha establecido por dominio es de 150 megabytes y se calcula que durará aproximadamente dos meses.


Este año se utiliza por primera vez la versión 5 de NetarchiveSuite (NAS), última versión del sistema de recolección web adoptado por la BNE y desarrollado en el grupo de usuarios de esta herramienta, en el que están también las bibliotecas nacionales de Dinamarca, Francia y Austria. Esta versión de NAS se adapta a la nueva arquitectura de la web y solventa varios problemas de recolección que se daban con la anterior versión.


Puesto que la exhaustividad en este campo está descartada, la BNE sigue, como muchas otras bibliotecas nacionales del mundo, un modelo mixto en el que se combinan recolecciones masivas (normalmente una vez al año), que ofrecen una visión muy amplia de la web, y recolecciones selectivas de carácter temático, de evento o del ámbito de las Comunidades Autónomas, más limitadas en número de semillas, pero seleccionadas y gestionadas de manera más detallada.


En julio del año pasado se habilitó un acceso a este archivo web para los usuarios de la BNE, así como para los de las bibliotecas autonómicas que lo han solicitado. Por los límites que establece la ley de la propiedad intelectual el acceso para los usuarios solo está disponible de momento en estos centros. La Biblioteca está trabajando para dar un acceso más abierto a esta información, tanto desde el punto de vista legal como buscando medidas tecnológicas que permitan compatibilizar la protección de los derechos de propiedad intelectual y el acceso a la información de los ciudadanos.



 


Para más información consulte:


Archivo de la web española


Preguntas frecuentes sobre archivado web


Depósito legal de las publicaciones en línea



 


www.bne.es/es/AreaPrensa/


@BNE_biblioteca Facebook BNE


 


Imagen

Avatar de Usuario
Vainaimoinen
Administrador
 
Mensajes: 5914
Registrado: Sab Dic 20, 2008 9:54 pm

Volver a NOTICIAS

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 2 invitados

cron