Završeno sedmo harvestiranje nacionalne domene

Objavljeno 10.1.2018.

Nacionalna i sveučilišna knjižnica u Zagrebu u suradnji sa Sveučilišnim računskim centrom Sveučilišta u Zagrebu (Srce) provela je od 14. do 31. prosinca 2017. godine sedmo harvestiranje hrvatskoga weba. Prikupljeni su i pohranjeni javno dostupni sadržaji svih mrežnih sjedišta na vršnoj .hr domeni, uključujući from.hr i .com.hr.

Ukupno je preuzeto u formatu WARC više od 67 933 607 milijuna datoteka veličine od više od 7,4 TB. Korišten je popis aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici u Zagrebu dostavila CARNet-ova DNS služba, a pobiranje je provedeno pomoću alata otvorenoga koda Heritrix. Robot koji je provodio harvestiranje predstavljao se kao Mozilla/5.0 (compatible; heritrix/1.14.4; +http://haw.nsk.hr/faq).

Sadržaj sedmoga harvestiranja .hr domene bit će uskoro dostupan na stranici Hrvatskoga arhiva weba, gdje se mogu pregledavati sadržaji pohranjeni u prethodnih šest harvestiranja, tematska harvestiranja, kao i sadržaji prikupljeni selektivnim pobiranjima.