Jak digitalizuje knihy městská knihovna

, 07. březen 2008 23:13 1 komentářů

Pero
Pražská městská knihovna otevřela začátkem února nové digitalizační pracoviště v Provaznické ulici. Probíhá tam digitalizace vzácných výtisků a historických dokumentů. Úkolem digitalizace je předejít poškození vzácných výtisků čtenáři. Na naše dotazy nám odpovídala Eva Měřínská z oddělení digitalizace.

Můžete nám popsat, jak přesně probíhá digitalizace knih z pohledu používaných technologií?

Předlohy (dokumenty) skenujeme face up skenery do formátu JPG s minimální kompresí na 600 dpi. Následně jsou zpracovávány v programu Sirius od společnosti Elsyst Engineering. To se týká ořezů a úprav obrázků, tvorby metadat, vyčítání OCR a exportu do XML. Závěrem jsou tvořena administrativní metadata. Výsledek se zpřístupňuje v digitální knihovně pomocí softwaru Kramerius, který dodává společnost Qbizm, a v budocnu online přes web.

Jaké byly náklady na pořízení?
Skenujeme do softwaru příslušného ke skenerům. Program na zpracování metadat a další řešení se jmenuje Sirius. Byl vybrán na základě výběrového řízení za cenu 1 400 000 Kč, Kramerius pro zpřístupňování je freeware.

Jak probíhalo zavádění tohoto softwaru?

Vzhledem k tomu, že s oběma softwary mají zkušenost Národní knihovna ČR a Knihovna Akademie věd ČR, se kterými především v technických otázkách spolupracujeme, proběhlo a probíhá zavedení SW celkem bez problémů. Dílčí problémy jsou konzultovány s dodavateli a výrobci.

Kde a jak skladujete digitalizované texty? Jak velký úložný prostor je pro tyto digitalizované knihy vyčleněn?

Digitalizujeme obrázky, které budou archivované na třech místech (tři servery 10 TB), texty z OCR fungují pro fulltext.

Jak probíhá samotné vyhledávání v již digitalizovaných knihách?

Dle metadat a fulltextem.


Komentáře

jmeno #1
jmeno 12. březen 2008 08:44

proc ztratovy jpeg a proc ne neztratovy jpeg2000?

RSS 

Komentujeme

Skutečně software pohltí svět?

Pavel Houser , 22. duben 2017 14:00
Pavel Houser

Výrok, podle něhož má software pojídat svět, jako první použil (zřejmě) Marc Andreessen v roce 2011 ...

Více





RSS 

Zprávičky

FabLab: brněnská dílna pro start-upy i technické nadšence

Pavel Houser , 23. duben 2017 09:00

3D dílna nabízí např. laserovou řezačku, 3D tiskárny a 3D skener. FabLab Brno je součástí celosvětov...

Více 0 komentářů

3 % Čechů již byla okradena při platbách online

Pavel Houser , 22. duben 2017 12:00

Ve většině případů šlo o částku do 5 000 Kč....

Více 0 komentářů

Senát zrušil plošné výjimky ze zveřejňování smluv v registru

ČTK , 22. duben 2017 10:00

Senát dnes schválil zrušení plošných výjimek ze zveřejňování smluv v jejich registru. Postavil se dn...

Více 0 komentářů

Starší zprávičky

Polovina českých měst prý uvažuje o využití IoT

ITBiz.cz , 21. duben 2017 14:00

Sedm procent českých měst a obcí už využívá internet věcí (IoT) pro efektivnější samosprávu, nejčast...

Více 0 komentářů

Asociace slovenských operátorů je proti vyřazení českých stanic

ČTK , 21. duben 2017 13:00

Za přehnaný označila asociace sdružující slovenské kabelové operátory (APKT) požadavek tamní soukrom...

Více 0 komentářů

Yoga A12, nový tablet do firem

Pavel Houser , 21. duben 2017 10:00

Společnost Lenovo představila další přírůstek do své rodiny zařízení s operačním systémem Android. ...

Více 1 komentářů

Policie eviduje sebepoškozování kvůli internetové hře

ČTK , 21. duben 2017 07:00

Policie zaznamenala několik případů sebepoškození pořezáním v rámci internetové hry Modrá velryba. N...

Více 2 komentářů