Zeigen Unicode-Zeichen bei der Konvertierung von HTML nach Pdf an

8

Ich verwende itextsharp dll, um HTML in PDF zu konvertieren.

Das HTML hat einige Unicode-Zeichen wie α, β ... wenn ich versuche, HTML in PDF zu konvertieren, werden Unicode-Zeichen nicht in PDF angezeigt.

Meine Funktion:

%Vor%     
NIlesh Lanke 26.04.2012, 08:36
quelle

3 Antworten

10

Beim Umgang mit Unicode-Zeichen und iTextSharp müssen Sie einige Dinge beachten. Die erste, die du schon gemacht hast und die eine Schriftart erhält, die deine Charaktere unterstützt. Die zweite Sache ist, dass Sie die Schriftart tatsächlich mit iTextSharp registrieren möchten, so dass sie davon Kenntnis hat.

%Vor%

Jetzt, da wir eine Schriftart haben, müssen wir ein Objekt StyleSheet erstellen, das iTextSharp sagt, wann und wie es benutzt wird.

%Vor%

Der eine Nicht-HTML-Teil, den Sie ebenfalls ausführen müssen, ist ein spezieller encoding -Parameter. Diese Codierung ist spezifisch für iTextSharp und in Ihrem Fall soll es Identity-H sein. Wenn Sie dies nicht festlegen, wird standardmäßig Cp1252 ( WINANSI ).

verwendet %Vor%

Zuletzt müssen wir unser Stylesheet an die Methode ParseToList übergeben:

%Vor%

Wenn Sie alles zusammenfügen, von offen bis geschlossen, hätten Sie:

%Vor%

BEARBEITEN

In Ihrem Kommentar zeigen Sie HTML an, das eine überschreibende Schriftart angibt. iTextSharp spidert das System nicht für Schriftarten und sein HTML-Parser verwendet keine Font-Fallback-Techniken. Alle in HTML / CSS angegebenen Schriften müssen manuell registriert werden.

%Vor%     
Chris Haas 26.04.2012, 15:26
quelle
16

Sie können auch den neuen XMLWorkerHelper (aus der Bibliothek itextsharp.xmlworker ) verwenden. Sie müssen jedoch die standardmäßige FontFactory-Implementierung überschreiben.

%Vor%     
Gregor Slavec 09.01.2013 12:16
quelle
-2

Hier sind die paar Schritte zum Anzeigen von Unicode-Zeichen beim Konvertieren von HTML in Pdf

  1. Erstellen Sie einen HTMLWorker
  2. Registrieren Sie eine Unicode-Schriftart und weisen Sie sie zu
  3. Erstellen Sie ein Stylesheet und stellen Sie die Codierung auf Identity-H
  4. ein
  5. Weisen Sie das Stylesheet dem HTML-Parser zu

Überprüfen Sie den folgenden Link für mehr Verständnis ....

Hindi, Türkisch und Sonderzeichen werden auch beim Konvertieren von HTML in PDF mit dieser Methode angezeigt. Überprüfen Sie das folgende Demobild.

    
Code Scratcher 23.12.2015 17:57
quelle

Tags und Links