SharePointCommunity
Die deutschsprachige Community für SharePoint, Microsoft 365, Teams, Yammer und mit Azure

Sponsored by

Willkommen im Forum Archiv.
Einträge sind hier nicht mehr möglich, aber der Bestand von 12 Jahren SharePoint-Wissen ist hier recherchierbar.




Text indizierung bei gescanntem PDF-Dokument

Unbeantwortet Dieser Beitrag hat 5 Antworten

Ohne Rang
55 Beiträge
Christian H erstellt 25 Juli 2012 11:59
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Hallo Leute,

Hat jemand von euch Erfahrung mit der Indizierung von gescannten Dokumenten welche in PDF-Form digitalisiert wurden? Ist es möglich solche Dateien ähnlich wie eine .tif für den Crawler lesbar  zu machen? Bzw. kennt ihr einen PDF-IFilter der sowas kann?

Gruß Christian

Alle Antworten

Ohne Rang
19231 Beiträge
Andi Fandrich Als Antwort am 25 Juli 2012 12:36
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

[quote user="Christian H"]kennt ihr einen PDF-IFilter der sowas kann?[/quote]

Den mußt Du wohl selbst ergoogeln... Aber warum speichert Ihr die Scans nicht einfach als TIF? Das ist dafür gedacht und es wird per OCR indiziert.

Viele Grüße
Andi
af @ evocom de
Blog
Ohne Rang
55 Beiträge
Christian H Als Antwort am 25 Juli 2012 13:01
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

hat mit unserer Archivierung zu tun ; )... das mit TIF wäre mir persönlich auch lieber ist nur leider nicht machbar =/

hmm kann Foxit sowas?

Ohne Rang
300 Beiträge
Christian Müller Als Antwort am 25 Juli 2012 23:11
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Hallo Chriatian,

iFilter für PDF gibt es verschieden. Wenn es eine kostenloser sein soll dann nimm den von Adobe.

Foxit bietet natürlich auch einen der zwar etwass kostet aber dafür schneller die Dokumente Indizieren kann.

http://www.foxitsoftware.com/products/ifilter/performance.php

Was du dann nimmst hängt immer davon ab wieviel PDF Dokumentente Ihr Indizieren müsst. Wenn es sehr viel sind dann würde ich zu einen Kostenpflichtigen tendieren.

Gruß Chris

Website: http://www.coc-ag.de

Blog: http://rabbitshooter.wordpress.com/

Ohne Rang
634 Beiträge
Olaf Didszun Als Antwort am 25 Juli 2012 23:51
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Wenn ich Dich richtig verstehe, dann enthält das PDF keinen Text sondern eine Grafik. Dann brauchst Du irgendetwas, was die Grafik in indizierbaren Text umwandelt. Frag mal Google (oder Bing :-) ) nach "OCR PDF Converter".

Grüße

Olaf

Ohne Rang
55 Beiträge
Christian H Als Antwort am 23 Aug. 2012 17:46
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Hey Olaf,

Super vielen dank für den Tipp ich gucke mal ob ich da entsprechend was finde!!! =)

 

Gruß Christian