Seite 1 von 2

ocr software

Verfasst: 25.07.2011, 17:34
von ocr
was empiehlt sich denn um alte, themenbezogene bücher einzuscannen?
wer hat das schon mal gemacht?

Re: otr software

Verfasst: 25.07.2011, 17:37
von Horizonzero
ich empfehle einen Scanner.

Re: otr software

Verfasst: 25.07.2011, 17:45
von Perma
Einen Flachbettscanner. Solltest du eine OCR-Software suchen, versuch's doch mal mit Omnipage.

Re: otr software

Verfasst: 25.07.2011, 17:49
von Amiga
Bücher was ist das ? Ach so ja diese Dinger mit Buchstaben drin,stimmt ja ! :lol:

Re: otr software

Verfasst: 25.07.2011, 17:52
von Luna
Perma hat geschrieben:Einen Flachbettscanner.

Luna steht voll auf Flachbrett :D

Re: otr software

Verfasst: 25.07.2011, 18:32
von Perma
Flach ist meistens nicht verkehrt.

Re: otr software

Verfasst: 25.07.2011, 18:36
von Amiga
Flach ist das beste !! :mrgreen:

Re: otr software

Verfasst: 25.07.2011, 18:38
von Windbeutel
Flach ist immer gut :D sei es nun scanner, flachmann, oder.... andere..

Re: otr software

Verfasst: 25.07.2011, 18:42
von Sandy
Vernehme ich hier das Wort "Flach"....?

Erinnert mich an....Flach-machen; Flach-legen; Flach-Dach; Flach-sein; Flach-atmen; Flach..........

Omnipage ist gut seit je her!

Re: otr software

Verfasst: 25.07.2011, 18:54
von Terra
Themenbezogene noch nicht unbedingt ... Bei den anderen war natürlich schon das Copyright abgelaufen :twisted:
Ansonsten wie hier schon mehrfach gesagt ein Flachbrustscanner. Am besten wäre natürlich ein Buchscanner. Das hängt von deinen Ansprüchen ab. Bei sehr dicken Büchern bekommst du am inneren Rand nach ner Weile Probleme weils schräg wird. Ist zwar nicht hübsch aber meist noch lesbar. Soweit ich weiß können auch manche Programme das teilweise beheben (Abby Finereader). Dafür ist dann eben der Buchscanner gut der das teilweise verhindert. Falls das Buch dir gehört kannst du es auch zerfleddern und jede Seite einzeln einscannen. Das Buch ist dann zwar hin und ein Fall für den Müll. Für den unmöglichen Fall das die Lolizei mal bei einem vorbeiguckt ist das aber nicht unbedingt von Nachteil. Nachteil vom Buchscanner ist eben der deutlich höhere Preis.
Alte themenrelevante Bücher gibts auch schon teilweise im Netz. Magst du evtl die Titel die dir vor Augen schwebten verraten?

Re: otr software

Verfasst: 25.07.2011, 23:06
von otr
oCr und nicht oTr :o) okay.

nun finde ich auch wieder etwas...
hat jemand schon eines der folgenden getestet und kann vergleichen?
OCRopus
GOCR
CuneiForm
Ocrad
Tesseract



Bei sehr dicken Büchern bekommst du am inneren Rand nach ner Weile Probleme weils schräg wird. Ist zwar nicht hübsch aber meist noch lesbar. Soweit ich weiß können auch manche Programme das teilweise beheben (Abby Finereader).
Ich erwarte keine Bilder, sondern reinsten Text! Da sollte das Problem ja nicht mehr bestehen...
Falls das Buch dir gehört kannst du es auch zerfleddern und jede Seite einzeln einscannen. Das Buch ist dann zwar hin und ein Fall für den Müll. Für den unmöglichen Fall das die Lolizei mal bei einem vorbeiguckt ist das aber nicht unbedingt von Nachteil.
Interessante Idee. Aber das meiste sind ja Sammlerstücke und die zu zerfleddern wäre Sünde. Wenn die Cops kommen, würde ich das bei der Verhandlung eher als Argument meiner weißen Seite vortragen.
Alte themenrelevante Bücher gibts auch schon teilweise im Netz. Magst du evtl die Titel die dir vor Augen schwebten verraten?
Da gibts bald (wenns so geht, wie ich wünsche) eine Adresse unter der man so einiges bekommt. Bei manchen (schon gescanten) besteht noch ein moralisches Copyright, einige sind wirklich frei verfügbar.
Ich will vorallem ein paar Artikel aus Fachzeitschriften scannen. Was Bücher angeht, will ich mit diesem beginnen. ISBN: B001DAYWYG

Link gelöscht. GLF-Moderation

Da nun editiort werden muss, kann das ganze Threadhijackig, was ich ja total nicht leiden kann, auch mal gelöscht werden. :p

Re: otr software

Verfasst: 25.07.2011, 23:14
von Mitleser
Ich habe in Sachen OCR-Programmen bisher nur Abby Fine Reader und Omnipage ausprobiert, das ging je nach Scanqualität recht gut. Mit Adobe Acrobat habe ich auch schon einmal gearbeitet, funktioniert ebenfalls recht brauchbar. Ob die Freeware-Tools etwas taugen, vermag ich nicht zu sagen, da solltest Du mal im Netz nach entsprechenden Erfahrungsberichten suchen. Ein Flachbettscanner ist vor allem für dickere Bücher nicht besonders gut geeignet, da wäre ein spezieller Buchscanner schon besser. Zur Not kann man sich ja mit einer Digitalkamera und einer entsprechenden (ggf. selbstkonstruierten) Halterung behelfen, das dürfte auch deutlich schneller gehen, als das Buch für jede Seite wieder vom Scanner zu nehmen und umzublättern. Anleitungen dafür finden man im Netz ebenfalls.

Re: otr software

Verfasst: 26.07.2011, 07:22
von Terra
Ich erwarte keine Bilder, sondern reinsten Text! Da sollte das Problem ja nicht mehr bestehen...
Hmm doch, wie gesagt hängt von der Dicke ab. Bei dicken Büchern musst du dann halt doch den Buchrücken etwas strapazieren, bzw sehr auf den Scanner aufdrücken was dieser nicht unbedingt gern hat (Erfahrungswerte). Ansonsten wirds dann halt in der Mitte dunkel (manchmal auch schwer lesbar) und die Ränder beim späteren bearbeiten (sofern du das vor hast) an der Innenseite recht kurz.
Wenn die Cops kommen, würde ich das bei der Verhandlung eher als Argument meiner weißen Seite vortragen.
Ansichtssache.
Wenn bei dir im Regal das Pädo Einmal Eins steht haben sie Blut geleckt und fühlen sich vielleicht genötigt noch etwas mehr zu suchen. Das ist wie wenn bei dir ein Bild von Osama bin Laden an der Wand hängen würde anstatt eines mit Naturlandschaft und einem röhrenden Hirsch.
Ich will vorallem ein paar Artikel aus Fachzeitschriften scannen.
Die es auch noch nicht online gibt?


Bei OCR Software würde ich mir einfach Abby Finereader besorgen. Das Programm eignet sich auch zum Scannen, Seiten bearbeiten usw. Besonders ältere Bücher machen teilweise Probleme bei der Texterkennung, theoretisch muss man da überall nochmal drüberlesen was allerdings ziemlich viel Arbeit ist.

Re: ocr software

Verfasst: 27.07.2011, 02:44
von ocr
"Zur Not kann man sich ja mit einer Digitalkamera und einer entsprechenden (ggf. selbstkonstruierten) Halterung behelfen"

Stativ solves ;)
Ist vielleicht sogar ne gute idee. Wenn ide Auflösung reichen würde, würd ich ein Video machen und die Frames extrahieren. Fehlt nur mehr der Legoroboter, der die seiten blättert :)



"sehr auf den Scanner aufdrücken was dieser nicht unbedingt gern hat (Erfahrungswerte)"

Du scannst also viel (und schon lange)?
Hast du nen Bücherscanner?




"Wenn bei dir im Regal das Pädo Einmal Eins steht haben sie Blut geleckt und fühlen sich vielleicht genötigt noch etwas mehr zu suchen."

Bei entsprechendem Beschluss, wissen sie um was es geht. Ob sie Bücher finden oder nicht. Soll ja hier auch Pedos geben, die ihr Zimmer voller Kinderbilder und Logos haben ;o)


"Die es auch noch nicht online gibt?"
Öhm... weiß ich doch nicht. :)

Die Konkret von 1980 zum Thema oder "DNP" 5.2011 zum Thema Antiandrogenegibt es wohl nicht online!


"theoretisch muss man da überall nochmal drüberlesen was allerdings ziemlich viel Arbeit ist"
zum glück hab ich das meiste noch nicht gelesen ;o)

Re: ocr software

Verfasst: 27.07.2011, 07:53
von Terra
Du scannst also viel (und schon lange)?
Hab vor ein paar Jahren mal diverse Bücher eingescannt und dann hin und wieder mal eins. Insgesamt sind es bis jetzt so 3000-3500 Seiten gewesen. Das dickste hatte so 1300 Seiten und da musste man schon etwas aufdrücken und dem Buch hat es sicher auch nicht gut getan. Es lebte aber noch als ich es zurückgab. Ein paar der Bücher sind auch im Netz gelandet die waren etwas besser bearbeitet allerdings ohne OCR. Irgendwo hab ich mal OCR mit Abby ausgetestet. Es tut zwar was es soll. Aber da die Sachen teilweise älter waren gabs trotzdem noch recht viele Fehler und mir war es zu doof das alles zu korrigieren. Da hab ich das mit dem OCR dann verworfen. Manches hab ich auch einfach nur eingescannt und dann ein pdf draus gemacht. Sieht nicht schön aus erfüllt aber seinen Zweck.
Hast du nen Bücherscanner?


Damals hatte ich nur nen normalen Flachbrettscanner. Der hat irgendwann ne Macke gekriegt und hat nur bis zur Hälfte gescannt bzw blieb ganz stecken. Ich schiebs immer aufs Aufdrücken, kann auch sonst normaler Verschleiß gewesen sein.