Skip to main content

SharePoint Dev und ITPro Blog

Go Search
Home
Impressum
  


SharePoint Dev und ITPro Blog > Posts > Verbessern der MOSS/MSS Suche innerhalb von Webseiten
Verbessern der MOSS/MSS Suche innerhalb von Webseiten

In vielen Unternehmen wird die MOSS 2007 bzw. MSS Suche dazu genutzt, um eine komfortable Suchfunktion für die Webseiten von bestehenden Intranets anzubieten. Die Gründe für diese Vorgehensweise sind unterschiedlich und reichen von „bisher keine Suchfunktion vorhanden im bestehenden CMS System“ bis „Unternehmenssuche, die alle Intranet Inhalte durchsucht“. Oftmals sind die Ergebnisse allerdings auch mit MOSS/MSS sehr unbefriedigend. Durch teilweise einfache Massnahmen lässt sich jedoch die Qualität der Suchergebnisse erheblich steigern. Gerade wenn man die Content Erzeugung selbst steuern kann, lässt sich einiges verbessern. Nachfolgend sind einige dieser Massnahmen aufgeführt:

-         Verwendung von Indexdateien: Diese enthalten die Links auf die Seiten bzw. Dokumente, die vom MOSS/MSS Indexer indiziert werden sollen. Folgende Gründe sprechen für den Einsatz von Indexdateien

o   Durch Indexdateien lässt sich sehr einfach steuern, welche Inhalte indiziert werden sollen und welche nicht. Lässt man den Crawler selbst die Links finden, ist oft einiges an Fummelei und Tests notwendig, bis man die optimalen Einstellungen gefunden hat. Meistens sind auch mehrere Content-Sources und Crawl Regeln notwendig, bis die Suche ohne Nutzung von Indexdateien die besten Ergebnisse liefert.

o   In den Webseiten wird viel JavaScript verwendet, um z.B. die Verlinkung zu erzeugen. Dies wird vor allem bei der Menüführung oft genutzt. Der SharePoint Crawler kann allerdings mit diesen Links nichts anfangen, da diese erst auf dem Client verfügbar sind (Google geht es übrigens nicht anders).

o   Will man mehrsprachige Intranetauftritte indizieren, sollte für jede Sprache eine separate Indexdatei genutzt werden. In diesen Indexdateien sollten sich dann auch nur Links der jeweiligen Sprache befinden.

o   Für den Namen der Indexdatei sollten einfache URLs ohne Query Parameter genutzt werden (z.B. index.htm oder index-de.htm, index-en.htm usw.).

-         Aufbau der Indexdateien: Einige Hinweise sollten hier beachtet werden:

o   Die Indexdateien sollten möglichst aktuell und mit den Crawl Zeitplänen abgestimmt sein.

o   Wenn nicht gewollt ist, dass die Indexdatei selbst im Suchergebnis auftaucht (und das ist vermutlich der Normalfall), dann sollte das Metatag:
<meta name="robots" content="noindex,follow">
vorhanden sein. Es bewirkt, dass zwar die Links verfolgt werden, die Indexdatei selbst jedoch nicht in den Index aufgenommen wird.

o   Sinnvollerweise sollte in die Indexdatei auch das letzte Änderungsdatum als Metatag aufgenommen werden. Dann kann man sehr schnell erkennen, ob die Indexdatei aktuell ist. Dies unterstützt beim Troubleshooting enorm, falls man keine entsprechenden Treffer im  Suchergebnis erhält.

o   Der Head-Tag der Indexdatei sollte somit z.B. mindestens die folgenden Angaben enhalten:
<head>

<meta name="robots" content="noindex,follow">

<meta name="Date" content="2008-04-18T22:00:35+01:00">

</head>

o   Eindeutige URLs: SharePoint indiziert Inhalte einer bestimmten Url nur einmal. Dies ist sehr sinnvoll, bereitet aber gerade bei mehrsprachigen Auftritten oder bei Nutzung zentraler Ressourcen in verschiedenen Auftritten Probleme. Man ist in diesen Fällen nicht in der Lage, den gemeinsam genutzten Inhalt (z.B. Organigramm des Unternehmens) in mehreren Suchbereichen zu nutzen, da nur einmal indiziert wird. Umgehen lässt sich dies, wenn man den gemeinsamen Inhalt jeweils mit eindeutigen URLs verlinkt. Der Indexer von MOSS/MSS indiziert diesen Inhalt dann mehrfach und stellt ihn in den entsprechen Inhaltsquellen und somit in den Suchbereichen auch zur Verfügung. Z.B. könnte ein zentral genutztes Organigramm der Firma unter der URL http://<server-url>/central/orgchart.htm in verschiedenen Sprachauftritten mit den folgenden URLs verlinkt werden:
http://<server>/central/ orgchart.htm?lang=de
http://<server>/central / orgchart.htm?lang=en
http://<server>/central / orgchart.htm?lang=fr
http://<server>/central / orgchart.htm?lang=it

o   Bei den Links innerhalb der Indexdatei sollte es sich um die endgültigen Links handeln. Links die erst einen Redirect ausführen sollten vermieden werden.

-         Verwendung von Metatags:  MOSS/MSS können Standard Metatags in den Webseiten verwenden. 2 Metatags sind hier vor allem wichtig:

o   Author (z.B. <meta name="author"  content="Reiner Ganser">): Dieses Feld wird in der Treffermenge angezeigt.

o   Date (z.B. <meta name="Date" content="2008-04-17T16:12:35+01:00">): Dieses Datum wird in der Treffermenge als letztes Änderungsdatum angezeigt. Die Treffermenge kann anhand dieses Wertes nach Datum sortiert werden. Wenn dieser Wert fehlt, macht die Sortierung nach Datum meist keinen Sinn.

o   Der Head-Tag der Webseiten sollte somit z.B. mindestens die folgenden Angaben enhalten:
<head>

<meta name="Author" content="Reiner Ganser">

<meta name="Date" content="2008-04-17T16:12:35+01:00">

</head>

 

Durch die beschriebenen Massnahmen lässt sich die Qualität der Indizierung und somit der Suche innerhalb bestehender Webseiten im Unternehmen erheblich steigern. Gerade wenn man die Erzeugung dieser Webseiten selbst steuern kann, sind die beschriebenen Änderungen zumeist einfach durchzuführen bzw. einzubauen. In den meisten CMS Systeme bedeutet es wenig Aufwand, eine Indexdatei mit den verwendeten Seiten und Links auf Dokumenten automatisch zu erstellen.

Comments

There are no comments yet for this post.
Items on this list require content approval. Your submission will not appear in public views until approved by someone with proper rights. More information on content approval.

Title


Name (required) *


Body (required) *

SPAM Filter *


Bitte geben Sie hier die Nummer 4532 ein. Dadurch kann ich leichter SPAM unterbinden.
Attachments