stop Wörter in Sitecore

8

Wir verwenden Lucene für die Textsuche als Teil von Sitecore. Gibt es eine Methode, Stoppwörter (wie a, an, the ...) in der Sitecore-Suche zu ignorieren?

    
rahul 02.02.2011, 07:17
quelle

2 Antworten

14

Standardmäßig verwendet Sitecore den Lucene-Standardanalysator - Lucene.Net.Analysis.Standard.StandardAnalyzer . Sie können sehen, dass dies in /configuration/sitecore/search/analyzer element der Datei web.config definiert ist. Einer der Konstruktoren von StandardAnalyzer class akzeptiert das Array von Strings, das Stoppwörter berücksichtigt. Standardmäßig verwendet es die fest codierte Liste von Stoppwörtern, einschließlich:

  

"a", "an", "und", "sind", "as", "at",   "sein", "aber", "für", "für", "wenn", "in",   "in", "ist", "es", "nein", "nicht", "von",   "auf", "oder", "so", "das", "das",   "ihre", "dann", "dort", "diese",   "sie", "diese", "zu", "war", "wird",   "mit"

Wenn Sie dieses Verhalten überschreiben möchten, sollten Sie StandardAnalyzer erben und seinen Standardkonstruktor außer Kraft setzen, um die Stoppwörter von einer anderen Quelle anstelle des hartcodierten Arrays zu übernehmen. Sie haben verschiedene Möglichkeiten, sogar aus einer Textdatei zu lesen. Vergessen Sie nicht, die Standardklasse in web.config durch Ihre zu ersetzen.

Siehe weitere Konstruktoren von StandardAnalyzer class für weitere Details. .NET Reflector ist hier dein Freund.

    
Yan Sklyarenko 02.02.2011 12:51
quelle
4

Ein Beispiel für Yans Post:

%Vor%

Dies sollte in der web.config unter

registriert werden %Vor%

ein Beispiel für die Registrierung des Analysators    

%Vor%

Zuletzt müssen Sie Ihren Analysator nur in der Suchkonfiguration wie folgt registrieren

%Vor%     
Kenneth Jakobsen 17.10.2013 06:16
quelle

Tags und Links