javascript + Entferne arabischen Text diakritisch dynamisch

8

Wie man dynamisch diakritisch Arabisch entfernt Ich entwerfe ein E-Book "chm" und habe mehrere HTML-Seiten mit arabischem Text Aber irgendwann möchte die Suchmaschine einige von ihnen hervorheben Arabische Wörter, weil es so diakritisch ist, ist es beim Laden der Seite möglich, JavaScript-Funktionen zu verwenden, die den diakritischen arabischen Text streichen würden? aber muss Option wieder aktiviert haben, damit ich möchte es nicht physisch, sondern nur vorübergehend aus HTML entfernen,

Die Sache ist, ich weiß nicht, wo ich anfangen soll und was die richtige Funktion ist, um

zu verwenden

vielen Dank:)

Zum Beispiel

%Vor%     
Jomart Mirza 07.03.2011, 19:30
quelle

5 Antworten

6

Versuchen Sie es

%Vor%

Ссылка

Der Code ist C # nicht JavaScript. Ich versuche immer noch herauszufinden, wie man dies in Javascript erreichen kann

EDIT: Anscheinend ist es sehr einfach in Javascript. Die Diacratics werden als separate "Buchstaben" gespeichert und können ganz einfach entfernt werden.

%Vor%

Bearbeiten: Hier ist eine weitere Möglichkeit, BuckData Ссылка

zu verwenden
  

Vorteile   Buck braucht weniger Bandbreite In Javascript kann man durch suchen   gesamter Buck Quran Text in 1 Schuss. intuitiv im Vergleich zur arabischen Suche   Buck zu Arabisch und Arabisch zu Buck ist ein einfacher js Anruf. Spiele mit Live   Probe hier: Ссылка Sie können alle Vokale ausziehen   von Buck Text in wenigen Millisekunden. Warum das tun? Du kannst hinein suchen   Javascript, ignoriert die taskheel Unterschiede (Fathah, Dammah,   Kasrah). Was zu mehr Treffern führt. Regex + Buck Text kann dazu führen   tolle Optimierungen. Alle Suchen können lokal ausgeführt werden.    Ссылка Wie Daten generiert wurden? nur eins zu eins   Mapping mit: Ссылка

    
Sameer 25.08.2011 16:06
quelle
2

Ich habe diese Funktion geschrieben, die Zeichenfolgen mit gemischten arabischen und englischen Zeichen behandelt, Sonderzeichen (einschließlich diakritische Zeichen) entfernt und einige arabische Zeichen wie das Konvertieren aller És in s normalisiert.

%Vor% %Vor%
    
Rashad Saleh 04.12.2016 14:17
quelle
1

Hier ist ein JavaScript-Code, mit dem Sie fast immer die arabischen diakritischen Zeichen entfernen können.

%Vor%
  

Hinweis: Sie können den arabischenNormChar nach Ihren eigenen Voreinstellungen überschreiben.

    
Sina Mansour L. 23.10.2016 22:24
quelle
0

Diese Website enthält einige Routinen für die JavaScript-Unicode-Normalisierung, mit denen Sie das ausführen können, was Sie gerade versuchen. Wenn nichts anderes, könnte es einen guten Ausgangspunkt bieten.

Wenn Sie die Daten vorverarbeiten können, hat Python gute Unicode-Routinen, um diese Art von Transformationen einfach zu machen. Dies kann eine gute Option sein, wenn Sie Ihre CHM-Datei vorverarbeiten können, um eine separate Indexdatei zu erstellen, die dann in Ihr CHM eingefügt werden kann:

%Vor%     
samplebias 07.03.2011 20:44
quelle
0

Benutze diese Regex um alle Tashkeel zu fangen

[-∞]

    
Yusuf 25.02.2017 17:04
quelle

Tags und Links