Jak digitalizuje knihy městská knihovna

, 07. březen 2008 23:13 1 komentářů

Pero
Pražská městská knihovna otevřela začátkem února nové digitalizační pracoviště v Provaznické ulici. Probíhá tam digitalizace vzácných výtisků a historických dokumentů. Úkolem digitalizace je předejít poškození vzácných výtisků čtenáři. Na naše dotazy nám odpovídala Eva Měřínská z oddělení digitalizace.

Můžete nám popsat, jak přesně probíhá digitalizace knih z pohledu používaných technologií?

Předlohy (dokumenty) skenujeme face up skenery do formátu JPG s minimální kompresí na 600 dpi. Následně jsou zpracovávány v programu Sirius od společnosti Elsyst Engineering. To se týká ořezů a úprav obrázků, tvorby metadat, vyčítání OCR a exportu do XML. Závěrem jsou tvořena administrativní metadata. Výsledek se zpřístupňuje v digitální knihovně pomocí softwaru Kramerius, který dodává společnost Qbizm, a v budocnu online přes web.

Jaké byly náklady na pořízení?
Skenujeme do softwaru příslušného ke skenerům. Program na zpracování metadat a další řešení se jmenuje Sirius. Byl vybrán na základě výběrového řízení za cenu 1 400 000 Kč, Kramerius pro zpřístupňování je freeware.

Jak probíhalo zavádění tohoto softwaru?

Vzhledem k tomu, že s oběma softwary mají zkušenost Národní knihovna ČR a Knihovna Akademie věd ČR, se kterými především v technických otázkách spolupracujeme, proběhlo a probíhá zavedení SW celkem bez problémů. Dílčí problémy jsou konzultovány s dodavateli a výrobci.

Kde a jak skladujete digitalizované texty? Jak velký úložný prostor je pro tyto digitalizované knihy vyčleněn?

Digitalizujeme obrázky, které budou archivované na třech místech (tři servery 10 TB), texty z OCR fungují pro fulltext.

Jak probíhá samotné vyhledávání v již digitalizovaných knihách?

Dle metadat a fulltextem.


Komentáře

jmeno #1
jmeno 12. březen 2008 08:44

proc ztratovy jpeg a proc ne neztratovy jpeg2000?


RSS 

Komentujeme

Chatbot mluví za mrtvého – od nápadu k realizaci

Pavel Houser , 30. listopad 2016 13:00
Pavel Houser

Na webu The Verge popsala Casey Newton příběh dvou přátel (Eugenia Kuyda a Roman Mazurenko). Peripet...

Více





Kalendář

RSS 

Zprávičky

Porozumění větám, konkurence pro Turingův test

Pavel Houser , 06. prosinec 2016 18:00

Konverzační roboti mají stále problémy pochopit věty, kde smysl nelze vyvodit ze samotné gramatické ...

Více 0 komentářů

Americká GoDaddy koupí evropský webhosting Host Europe

ČTK , 06. prosinec 2016 16:00

Americký registrátor internetových domén GoDaddy, který je ve svém oboru největší na světě, se dohod...

Více 0 komentářů

Ruská Centrální banka oznámila masivní útok hackerů

ČTK , 06. prosinec 2016 11:00

Do systému ruské Centrální banky se letos dostali hackeři a s pomocí zfalšovaných hesel se pokusili ...

Více 0 komentářů

Starší zprávičky

CETIN vydal dluhopisy za 25 miliard Kč

ČTK , 05. prosinec 2016 18:00

Česká telekomunikační infrastruktura (CETIN) upsala dluhopisy v eurech a korunách v celkovém objemu ...

Více 1 komentářů

Nahradí otisky prstů přístupová hesla?

ČTK , 05. prosinec 2016 14:30

Zní to jako skvělý nápad: zapomeňte na hesla a zamykejte telefon místo nich otiskem svého prstu. Je ...

Více 1 komentářů

Počítač a internet má na jižní Moravě více než 75 pct domácností

ČTK , 05. prosinec 2016 10:30

Počet jihomoravských domácností, které mají počítač a přístup k internetu, se loni přehoupl na jižní...

Více 0 komentářů

Vodafone zvýšil do září počet zákazníků na 3,54 milionu

ČTK , 04. prosinec 2016 18:00

Mobilní operátor Vodafone zvýšil do konce září počet zákazníků na českém trhu meziročně o 146.000 na...

Více 0 komentářů