SharePointCommunity
Die deutschsprachige Community für SharePoint, Microsoft 365, Teams, Yammer und mit Azure

Sponsored by

Willkommen im Forum Archiv.
Einträge sind hier nicht mehr möglich, aber der Bestand von 12 Jahren SharePoint-Wissen ist hier recherchierbar.




Vollindexierte PDF Dateien werden teilweise nicht gefunden

Unbeantwortet Dieser Beitrag hat 4 Antworten

Ohne Rang
22 Beiträge
pianoman erstellt 23 Apr. 2013 16:57
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Hallo zusammen

Wir haben ein recht komisches Phänomen, das wir uns bisher nicht erklären können.
Wenn ich es hier mal kurz erläutern dürfte:

SharePoint 2007 (Enterprise) Farm, bestehend aus:
    1 DB Server SQL 2008
    1 Application Server
    1 Crawl Server
    2 WFEs

Als pdf iFilter verwendet der Kunde den Foxit iFilter, der im Prinzip sehr gut funktioniert.

Das Problem ist aber, dass es Wörter innerhalb PDF Dokumenten gibt, die mit der SharePoint Suche nicht gefunden werden!
Es sind auch keine zusammengesetzten Wörter, sondern einfache Wörter, nach denen auch gesucht wird. Sucht man nach dem Inhalt, der bspw. direkt daneben steht, wird das PDF Dokument angezeigt.
Das komische ist aber auch, dass der Volltext in den Suchresultaten dann auch angezeigt wird MIT diesem Wort, mit dem er das Dokument anscheinend nicht findet.

Im Crawl-Log wird das Dokument als "erfolgreich gecrawled" angezeigt.

Dieses Phänomen ist - wie könnte es auch anders sein - nur beim Kunde nachvollziehbar und nicht bei uns, obwohl wir die komplette Farm nachgebaut und die Kunden-Content-DB eingebunden haben.

Wer hat dafür eine Erklärung? Ich wäre sehr sehr dankbar!

Viele Grüsse

Alle Antworten

Ohne Rang
19231 Beiträge
Andi Fandrich Als Antwort am 25 Apr. 2013 08:58
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Die Searchengine ignoriert sogenannte Füllworte wie z.B. der, die, das, und, oder und viele mehr. Kann es sein, daß Ihr damit testet? Die Füllworte sind auch ein Problem, wenn man nach mehreren Worten in Anführungszeichen sucht. "Hund und Katze" wird also nie ein Ergebnis liefern, weil "und" nicht indiziert wurde. Wenn ich mich richtig erinnere, stehen diese Worte in irgendeiner XML-Datei und die wurde evtl. beim Kunden verändert/erweitert.

Übrigens: falls Ihr dem Kunden ein Upgrade nahebringen wollt, wäre das ein weiteres Argument, weil bei der FAST-Search von 2013 solche Einschränkungen nicht gelten.

Viele Grüße
Andi
af @ evocom de
Blog
Ohne Rang
22 Beiträge
pianoman Als Antwort am 26 Apr. 2013 09:31
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Das war auch mein erster Gedanke. Leider ist dies nicht der Fall, da die Wörter in anderen Dokumenten (auch PDFs) gefunden werden.
Ein Upgrade auf 2013 ist zwar irgendwann geplant, allerdings ist die Applikation sehr gross, weshalb die Migration noch ein paar Monate dauern wird und bis dahin möchte sich der Kunde natürlich auf die Suche verlassen können.


Ohne Rang
19231 Beiträge
Andi Fandrich Als Antwort am 26 Apr. 2013 10:00
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Sorry, aber dann habe ich auch keine Idee mehr. Es scheint ja an den Dateien selbst zu liegen, wenn die Worte in anderen Dateien gefunden werden. Der Foxit iFilter ist zwar sehr viel besser, als der von Adobe, hat aber manchmal auch Probleme.

Viele Grüße
Andi
af @ evocom de
Blog
Ohne Rang
22 Beiträge
pianoman Als Antwort am 29 Apr. 2013 13:57
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Ist denn bekannt, welche Probleme der Foxit iFilter macht?

Denn meine Vermutung ist eigentlich schon, dass der iFilter etwas Probleme macht, allerdings funktioniert das ganze ja mit unserer Farm obwohl wir ebenfalls die gleiche Version von Foxit einsetzen.