SharePointCommunity
Die deutschsprachige Community für SharePoint, Microsoft 365, Teams, Yammer und mit Azure

Sponsored by

Willkommen im Forum Archiv.
Einträge sind hier nicht mehr möglich, aber der Bestand von 12 Jahren SharePoint-Wissen ist hier recherchierbar.




Search Server 2010 - Durchforstung großer Dateien (> 16MB)

Geprüfte Antwort Dieser Beitrag hat 4 Antworten

Ohne Rang
101 Beiträge
Andy 2011 erstellt 27 Nov. 2012 09:31
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Nach der Durchforstung von Dateien (Dateifreigabe und UNC-Pfad)  gab es im Log viele Warungen mit der Meldung:

Die Datei hat die maximale Downloadgrenze erreicht. Überprüfen Sie, ob der Gesamte Text des Dokuments sinnvoll durchforstet werden kann.

Habe zum Thema folgendes gefunden: http://www.sharepointed.de/?p=53

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\14.0\Search\Global\Gathering Manager  >  Neuer Eintrag DWORD 'MaxDownloadSize' > Wert in MB

Muss man noch was beachten (oder machen) und wie groß sollte der Wert in MB maximal sein (wegen möglicher Nachteile, bzw. Probleme)?

Alle Antworten

Ohne Rang
101 Beiträge
Andy 2011 Als Antwort am 27 Nov. 2012 11:57
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Noch was Wichtiges zum Thema gefunden.

Programme->Sharepoint2010 Products->Sharepoint Verwaltungskonsole

$SSA = Get-SPEnterpriseSearchServiceApplication

$SSA.GetProperty(“MaxDownloadSize”)
$SSA.GetProperty("MaxGrowFactor")

$SSA.SetProperty(“MaxDownloadSize”, <size bigger than 16 for what you want to crawl>)
$SSA.SetProperty("MaxGrowFactor",
<size bigger than 4>)

$SSA.Update()

net stop osearch14
net start osearch14

Max download size for SP 2010 is 2GB!

Die Frage dich sich mir noch stellt, wie groß sollte man max. die Werte für MaxDownloadSize und MaxGrowFactor wählen (best practice).
Und was ist mit sehr großen Dateien (Filmdateien wie .mp4), die sogar einige GB groß sein können, aber auch im Index mit aufgenommen werden sollen, wobei bei diesen Dateien der Dateiname (evtl. noch Metadaten) reichen würde?

Generelle Frage: Lädt der SP-Crawler jede Datei auf den Server um sie zu durchsuchen? Was ist mit Dateien ohne Inhalte wie z.B. .mov, .mp4, .swf?

Ohne Rang
19231 Beiträge
Andi Fandrich Als Antwort am 27 Nov. 2012 12:59
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Ich denke, die für Euch besten Werte müßt Ihr selbst herausfinden (je nach Crawldauer, verfügbarer Hardware, usw.).

Ich bin mir nicht sicher, würde aber annehmen, daß der Crwaler nur Dateien herunterlädt, bei denen auch der Inhalt indiziert werden kann. Bei allen Filmdateien ist das standardmäßig nicht der Fall und es wird nur der Dateiname indiziert.

Viele Grüße
Andi
af @ evocom de
Blog
Ohne Rang
101 Beiträge
Andy 2011 Als Antwort am 27 Nov. 2012 13:15
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Du hast Recht mit der Indizierung des Dateinamen. Bei den Dateiendungen .wmv, .mov, MPEG-4 und .mp4 bekomme ich zwar auch die Warung

Die Datei hat die maximale Downloadgrenze erreicht. Überprüfen Sie, ob der gesamte Text des Dokuments sinnvoll durchforstet werden kann.

Allerdings wurden sie mit in den Index aufgenommen und es werden diese Dateien auch gefunden (im Suchergebnis angezeigt). :-)
Dann brauch ich MaxDownloadSize gar nicht so hoch setzen, es sei denn es handelt sich um sehr große PDF- oder Worddateien (mit eingebundenen Bildern). Ist doch korrekt oder?

Ohne Rang
19231 Beiträge
Andi Fandrich Als Antwort am 27 Nov. 2012 13:35
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

[quote user="Andy 2011"]Ist doch korrekt oder?[/quote]

Ja, wie Dein Test beweist :-)

Viele Grüße
Andi
af @ evocom de
Blog