Wie html-Tags in der Sql Server 2008 Volltextsuche ignoriert werden

8

Ich arbeite an einem Knowledge Base-Projekt mit SQL Server 2008 Volltext-Suchmaschine. Projekt in Artikeln und Dateien enthalten, wo jeder Artikel mehrere Dateien hat. In diesen Artikeln ist der gesamte Inhalt pure html .

Im Moment habe ich erfolgreich Volltextkatalog und -index für SQL Server 2008 erstellt und meine Datenbank ist mit Version 10 kompatibel.

Hier sind meine Fragen:

1) Ist es möglich, HTML-Tags zu ignorieren, klarer Texte, die in "& lt; ... & gt;" enthalten sind, während Sie in diesen Artikeln suchen, denn wenn ich nach div, Tabelle usw. suchen möchte, sollte es keine geben Ergebnis zurückgegeben?

2) Artikel werden jederzeit aktualisiert, so dass der Volltextindex aktualisiert werden muss, wenn ein neuer Datensatz eingefügt wird. Reicht es aus, nur "TRACK CHANGES AUTOMATIC" beim Erstellen des Volltextkatalogs festzulegen?

3) Wir können die FILESTREAM-Funktion im Folgenden verwenden, hat SQL Server 2008 eine gute Leistung bei Dateien mit Volltextindex? Welche spezifischen Dokumenttypen bietet SQL Server 2008 für die Indizierung?

Grüße

    
Myra 12.01.2010, 09:21
quelle

2 Antworten

-1

Bitte überprüfen Sie diese:

1) Im Volltext von SQL Server können wir Geräuschwörter / Stoppwörter definieren. Sie können die Noise-Weltdatei bearbeiten und anschließend den Katalog neu erstellen. So können Sie alle HTML-Tags als Rauschen setzen. Bitte überprüfen Sie

Ссылка

2) Bei Trackänderungen werden automatisch die Änderungen in der aktuellen Volltextsuche berücksichtigt, aber die Rangfolge dieser neu hinzugefügten Artikel wird gegenüber der vorherigen geändert. Also, bis und wenn Sie den Index des Masters synchronisiert haben, wird er mit dem Ranking aufgeben.

3) Soweit ich weiß, können wir benutzerdefinierte Filter, Stemmer und Worttrenner implementieren und in die SQL Server-Volltextsuche einbinden. Standardmäßig kennt ich die vollständige Liste vielleicht nicht, aber es gibt doc und pdf.

>

Weitere Informationen zur SQL Server-Volltextsuche 2008 finden Sie unter:

Ссылка

    
Nitin Midha 12.01.2010, 09:33
quelle
26

Es gibt einen Filter für .htm und .html Dateien.

um zu sehen, ob Sie den Filter installiert haben, führen Sie sql:

aus %Vor%

sollten Sie sehen:

%Vor%

Wenn Sie also Ihre articles-Spalte in varbinary (max) konvertieren können, können Sie einen Volltextindex hinzufügen und einen Dokumenttyp von ".html" angeben

Sobald der Index gefüllt ist, können Sie die Schlüsselwörter mit diesem sql:

überprüfen %Vor%     
DC. 17.06.2010 18:41
quelle