Met je fototoestel en een PC kun je ook boeken scannen

Je kan een boek scannen met een digitale camera en de foto's daarna omzetten in PDF formaat. Vervolgens kun je met OCR software de beelden omzetten in leesbare tekst.

Fotograferen van pagina’s uit een boek met Sony-RX100-III 

Het scannen van pagina’s uit een boek is een tijdrovende zaak, tenzij je een speciaal scan-apparaat aanschaft in de orde van 4.000 tot 100.000 Euro.

Het kan ook met een (goed) fototoestel waarbij je foto’s schiet en daarna omzet in PDF formaat, waarop je een OCR bewerking uitvoert om de pixels te vertalen in letters. OCR staat voor Optical Character Recognition. Nu kun je op zoek gaan naar trefwoorden in je tekst. Dat kan heel handig zijn.

Is deze methode een snelle methode om je boek te digitaliseren? Nee, je zit vast aan een groot aantal handelingen zoals het juist positioneren van je boek en camera, en de bewerking van je vele beelden via software. De methode is echter wel een factor 3 tot 4 sneller dan het scannen van een boek via een eenvoudige printer/scanner. Ik heb drie uur tijd nodig om een boek van 260 bladzijden te digitaliseren. Vroeger was ik er 3 avonden mee bezig. Een boekje van 60 bladzijden kostte een uur tijd. Het is verstandig om eerst te onderzoeken of je het boek digitaal kunt bestellen, dat scheelt veel werk.

Op internet kon ik nauwelijks informatie vinden over de scan-methode via een camera, reden om zelf creatief aan de slag te gaan.

Waar let je op vanuit een fotografisch oogpunt?

Een aantal variabelen zijn belangrijk:

  • Uitlijning. Zorg dat je toestel goed uitgelijnd wordt en waterpas staat t.o.v. het boek dat ook waterpas moet staan. Hiermee voorkom je (radiale) vertekening/distorsie van je beeld. Het beeld van een bladzijde is dan niet meer rechthoekig. De waterpas-uitlijning is hier horizontaal in twee richtingen uitgevoerd waarbij de waterpas op de lens wordt gedrukt.
  • Goed lensbereik kiezen. Veel camera’s hebben een groothoek-zoomlens – ook de Sony RX-100 III – en die geeft redelijk veel vertekening/distorsie in de groothoekstand. Zorg dat je een beetje inzoomt en hiermee de groothoek-stand verlaat.
  • Scherptediepte. Zorg voor een redelijke scherptediepte, groter dan  f = 3,0.  Een opengeslagen bladzijde vertoont vaak een lichte bolling waardoor de letters aan de rand lager liggen dan de letters in het midden van de bladzijde.
  • Positionering boekbladzijde. Zorg dat je de boek-bladzijde redelijk goed platdrukt om onscherpte in de diepte te voorkomen. Ik gebruikte een plaat aluminium van ongeveer 400 g dat ik op de rand van de bladzijde legde. Je kunt het blad ook met je vinger platdrukken.
  • Pixelscherpte. Kies een ISO lager dan 800. Boven ISO-800 wordt de beeldpixels met de meeste camera’s meetbaar minder scherp.
  • Bewegings-onscherpte. Voorkom bewegings-onscherpte door een zelfontspanner te gebruiken. Bovendien gaat dit ook veel sneller. Met de zelfontspanner moet je ook kunnen scherpstellen via autofocus.
  • Belichting. Gebruik daglicht voor een betere en mooiere belichting.
  • Belichtings-compensatie. Het witte blad van het boek weerkaatst het daglicht beter dan gemiddeld naar de lens. Hierdoor “ziet” de lens teveel licht en wordt het diafragma te veel gesloten. Met het verhogen via een “lichtstop” compenseer je hiervoor. Proefondervindelijk heb ik een lichtstop van +1,4 gekozen, zodat het beeld een stuk lichter wordt. In de handleiding van mijn camera wordt het als “exposure compensation” aangeduid.
  • Schaduweffecten. Zet je statief aan de schaduwkant van het boek om schaduwen op je beeld te voorkomen.
  • Wit-balans. Stel je wit-balans goed in, op herfst- en winterse dagen stel ik hem in op “bewolkt” en dat geeft de beste resultaten op mijn camera.

Je kunt niet meer zonder software

Een rechthoekige bladzijde past niet in een ronde lens. Via software kun je een rechthoekige uitsnede maken. Het is belangrijk om technisch de foto zo goed mogelijk te maken, des te minder nabewerking heb je nodig. Nabewerking met software kost veel tijd.

Voor de rechthoekige uitsneden gebruik ik de gratis software van Irfanview. Met Irfanview doe ik de volgende taken:

  • Bekijken van de foto’s op de sd-card van mijn camera, je kunt snel door de foto’s scrollen;
  • Rechthoekige uitsnede maken van elke foto;
  • Opslaan als gecomprimeerde JPG (60%);
  • Logische File-naam geven met pagina-nummer en opslaan op harde schijf.

Ik gebruik het (oude) programma Adobe CS5 - 9 Pro  voor het vertalen van pixels naar letters (OCR) en bundelen van de foto-bestanden. Met dit programma doe ik de volgende taken:

  • Bundelen in de juiste volgorde van alle foto’s (in JPG).
  • OCR vertaling
  • Het draaien van foto’s liggend naar foto’s staand (portret mode)
  • Het opslaan van de foto’s in één bundel in PDF formaat.

Resultaten

Instellingen

  • Statief hoek naar de tafel: orde 12 graden
  • Afstand lens tot boek: 38 cm (circa) voor Sony RX100 III
  • Zoom stand op Sony RX100 III: 52 - 56 mm (circa)
  • ISO: 125 (circa) (bij raam in erker van voorkamer, november 2017, rond de middag, half bewolkt)
  • f: 4,5
  • Wit-balans: bewolkt
  • Lens camera: uitgelijnd via waterpas in twee richtingen door aanpassing met het statief
  • Boek scannen: eerst even pagina’s om steeds positioneren van het boek te voorkomen. Deze bestanden opslaan in aparte folder. Idem voor de oneven pagina’s.
  • Boekpagina plat krijgen: via mijn vinger op de hoek van de bladzijde te drukken.
  • Bijstellen: om de 20 bladzijden beeld controleren op camera, eventueel boek herpositioneren.
  • Beeld auto-focussen en afdrukken: via draad-zelfontspanner.
  • Ik heb gekozen voor het boek als testexemplaar: Uitwerkingen Chemie Overal 6 vwo (Noordhoff), 60 pagina’s.

Irfanview

  • Maak eerst via het operating system 2 folders aan: één voor de oneven pagina’s en één voor de even pagina’s.
  • Laadt het fotobestand
  • Maak een uitsnede via het maken van een kader met de muis
  • (of Edit – Crop Selection/Cut out)
  • (Save as) (60% JPG)  {geef naam met pagina-nr.} {In Folder “even” op hard-disk}
  • Adobe CS5 - 9 Pro 
  • Voeg via je operating system alle bestanden “even en oneven” bij elkaar in één folder.
  • Open Adobe
  • File – Combine – Merge Files into a Single PDF
  • [Add Files ˅] – [Add Folders] {Choose folder}
  • [Combine Files]                { Bestanden worden geladen in staande positie (portret)}
  • Document – OCR             { dit OCR-proces kost minuten }
  • File – Save as                  { save as PDF, geef een toepasbare naam …. }

Beelden van opstelling en resultaat

Boek digitaliseren

Figuur 1: Beeld van opstelling

Figuur 2: beeld van display Sony RX100 III

Figuur 3: Beeld resultaat van 2 pagina’s in programma Adobe

Conclusie

Je kunt met een degelijke aanpak en een redelijk goede camera uitstekend boeken scannen, of foto’s scannen. Je hebt een statief (orde 35 Euro) een draad-zelfontspannen (orde 10 Euro), een PC en software nodig. Het proces kost redelijk wat tijd en oplettendheid. Het proces is veel sneller dan met een huis-tuin-en-keuken-scanner, in de orde van een factor drie.  Daarnaast is het leuk om je fototoestel en je fotokennis creatief in te zetten. Uiteindelijk verkrijg je een digitaal boek waarin je via trefwoorden kunt zoeken.

Via Youtube heb ik andere geknutselde opstellingen kunnen vinden voor het fotograferen van boeken. Sommige zijn erg ingenieus zoals de ontworpen V-scanner, zie link. Met deze opstellingen worden bladzijden onder 45 graden geschoten met 2 camera’s.

Meer over dit onderwerp

Kunst en antiek
Kunst - antiek - schilderijen digitaliseren of fotograferen

Digitaliseren dia's
Dia's digitaliseren - dia's op DVD, usb, CD of harddisk zetten

Video digitaliseren
Video of film digitaliseren - VHS op DVD - dia scannen

Diascanner test
Diascanner: test digitaliseren van dia's met dia scanner

8mm film naar DVD
8mm film naar DVD digitaliseren - oude 8mm film digitaliseren

3D scanbeeldje
3D scan en 3D beeldje van jezelf of je kinderen

Smalfilm op DVD
8mm smalfilm op DVD - digitaliseren super 8mm film