Wie man dynamisch diakritisch Arabisch entfernt Ich entwerfe ein E-Book "chm" und habe mehrere HTML-Seiten mit arabischem Text Aber irgendwann möchte die Suchmaschine einige von ihnen hervorheben Arabische Wörter, weil es so diakritisch ist, ist es beim Laden der Seite möglich, JavaScript-Funktionen zu verwenden, die den diakritischen arabischen Text streichen würden? aber muss Option wieder aktiviert haben, damit ich möchte es nicht physisch, sondern nur vorübergehend aus HTML entfernen,
Die Sache ist, ich weiß nicht, wo ich anfangen soll und was die richtige Funktion ist, um
zu verwendenvielen Dank:)
Zum Beispiel
%Vor%Versuchen Sie es
%Vor%Der Code ist C # nicht JavaScript. Ich versuche immer noch herauszufinden, wie man dies in Javascript erreichen kann
EDIT: Anscheinend ist es sehr einfach in Javascript. Die Diacratics werden als separate "Buchstaben" gespeichert und können ganz einfach entfernt werden.
%Vor%Bearbeiten: Hier ist eine weitere Möglichkeit, BuckData Ссылка
zu verwendenVorteile Buck braucht weniger Bandbreite In Javascript kann man durch suchen gesamter Buck Quran Text in 1 Schuss. intuitiv im Vergleich zur arabischen Suche Buck zu Arabisch und Arabisch zu Buck ist ein einfacher js Anruf. Spiele mit Live Probe hier: Ссылка Sie können alle Vokale ausziehen von Buck Text in wenigen Millisekunden. Warum das tun? Du kannst hinein suchen Javascript, ignoriert die taskheel Unterschiede (Fathah, Dammah, Kasrah). Was zu mehr Treffern führt. Regex + Buck Text kann dazu führen tolle Optimierungen. Alle Suchen können lokal ausgeführt werden. Ссылка Wie Daten generiert wurden? nur eins zu eins Mapping mit: Ссылка
Ich habe diese Funktion geschrieben, die Zeichenfolgen mit gemischten arabischen und englischen Zeichen behandelt, Sonderzeichen (einschließlich diakritische Zeichen) entfernt und einige arabische Zeichen wie das Konvertieren aller És in s normalisiert.
Hier ist ein JavaScript-Code, mit dem Sie fast immer die arabischen diakritischen Zeichen entfernen können.
%Vor%Hinweis: Sie können den arabischenNormChar nach Ihren eigenen Voreinstellungen überschreiben.
Diese Website enthält einige Routinen für die JavaScript-Unicode-Normalisierung, mit denen Sie das ausführen können, was Sie gerade versuchen. Wenn nichts anderes, könnte es einen guten Ausgangspunkt bieten.
Wenn Sie die Daten vorverarbeiten können, hat Python gute Unicode-Routinen, um diese Art von Transformationen einfach zu machen. Dies kann eine gute Option sein, wenn Sie Ihre CHM-Datei vorverarbeiten können, um eine separate Indexdatei zu erstellen, die dann in Ihr CHM eingefügt werden kann:
%Vor%Tags und Links javascript diacritics arabic