zaterdag 15 januari 2011

Zinloos digitaliseren


Al jaren is men wereldwijd als een razende boeken aan het digitaliseren. De Verenigde Staten voorop natuurlijk. We kennen allemaal de activiteiten van Google en de samenwerking met Amerikaanse en Canadese bibliotheken. Allemaal mooie initiatieven waar ik zelf voor onderzoek al zeer veel profijt van heb gehad. Je hoeft voor veel dingen de deur niet meer uit omdat het online te vinden is.

Allemaal mooi en aardig maar hier wil ik het echter hebben over een minder nuttig verschijnsel: het zinloos digitaliseren. Het valt niet te ontkennen dan men zo hier en daar als een kip zonder kop maar alles door de digitaliseringsmolen maalt, zonder al te veel op kwaliteit te letten. Het lijkt meer om aantallen te gaan dan om bruikbaarheid. Ik ben al aardig wat curieuze werkjes tegengekomen. Het boven aan dit stukje afgebeelde werk "Exercier Reglement für die Grossherzoglich Hessische ..." spant wel de kroon. Het boek bevat in werkelijkheid uitsluitend uitklapbare pagina's maar bij het digitaliseren is dit niet gedaan. Resultaat is dat er GEEN ENKELE bruikbare, leesbare, zichtbare pagina is. Zelfs de titel staat er maar half. Digitised by Google en te vinden op
http://www.archive.org/details/texts
Wat moeten we hiermee? Het bedrijf dat de digitalisering heeft uitgevoerd heeft hem gewoon meegeteld bij het indienen van de rekening, de scanoperator heeft zijn schouders opgehaald en gedacht wat kan mij het schelen, het is toch bijna weekend, de opdrachtgever heeft geen controle uitgevoerd en het ook nog doodleuk op internet gezet, er zijn vooraf geen goede afspraken gemaakt over de behandeling van dit soort pagina's. Het is zowieso een ergerlijk verschijnsel dat opgevouwen kaarten en dergelijke nooit goed gescand worden. Elk boek waar uitklapkaarten in zitten, en dat zijn er nogal wat als het gaat over militaire geschiedenis en veldslagen, wordt onvolledig gescand. En deze kaarten en schema's zijn vaak onmisbaar voor het boek.
Een ander drama voltrekt zich bij de tekstherkenning. De Amerikanen proberen alles om te zetten naar doorzoekbare tekst, ook het oudduitse Frakturschrift. Dat heeft geen enkele zin en levert alleen maar geheimschrift op. Zie hier een willekeurig stukje uit de Gesammelte Schriften van Helmuth von Moltke:

S)er ^vXjalt biefeS SöanbeS nun bietet in feinen Beiträgen
jur 8eBen§gef(l§i(j^te »eitere ttjic^tige SSaufteine für ba§ itUn^^
unb ei^aralterbilb beS großen SKanneg. SSietteid^t ^ätte ein
längcrei^ Qntoatttn nod^ einige, freilid^ wol^I nur unbebeutenbe
©njel^eiten für biefe Aufgabe gu liefern »ermod^t, aber eS er*»
fc^ien nid^t angegeigt, auf eine geringe SBal^rfc^'cinKc^feit l^in
ben abfd^Iuß toeiter ]§inau§jufd^ieben, benn ba§ ©efammtbilb, toie
e§ fid^ ie|}t fd^on barfteöt, l^ätte baburd^ leine Äenberung erfal^ren,

Een andere goede bron voor onleesbare boeken is de site van de Franse bnf.
http://gallica.bnf.fr/

Hier krijg je aan het begin van de scan nog een waarschuwing voor slecht scanresultaat. Maar heel veel is gewoon het gevolg van slordig werken. Pagina's die gescand zijn precies op het moment dat de pagina wordt omgeslagen, handen in beeld, verkeerde formaatinstelling zodat het tekstgedeelte van de pagina ergens klein in een hoekje staat en de rest van de pagina leeg is, zwart-wit en kleur gescande pagina's door elkaar zonder aanwijsbare reden, doorgeslagen achterkant omdat er geen zwart papiertje achter gehouden is. Allemaal curieus, grappig maar soms ook tenenkrommend, als je precies het stuk informatie mist dat je zoekt en je weet dat het er met een beetje meer aandacht wel had kunnen staan.
Voorlopig sla ik dit soort vondsten op in een apart mapje op mijn computer, onder de naam "digitale curiosa". Kunnen we er later nog eens naar terugkijken en om lachen.



Aris de Bruijn
The Legermuseum Archives

Geen opmerkingen:

Een reactie plaatsen