Ich kann keine leere Seite in der PDF-Datei finden. Ich habe das Internet gesucht, konnte aber keine gute Lösung finden.
Mit Itextsharp versuchte ich mit Seitengröße, Xobjects. Aber sie nicht gib genaues Ergebnis.
Ich habe es versucht
%Vor%Aber maximale Zeit gibt es falsche Antwort zurück. Ich habe Itextsharp
verwendetDer Code ist unter ... Ich verwende Itextsharp Librabry
Für xObjekte
%Vor%Für Contentstream
%Vor%Für Textinhalte
%Vor% Eine sehr einfache Möglichkeit, leere Seiten zu finden, ist dies: Verwenden Sie eine Ghostscript-Befehlszeile, die das bbox
-Gerät aufruft.
Ghostscript bbox berechnet die Koordinaten dieses minimalen Rechtecks 'Begrenzungsbox' , das alle Punkte der Seite einschließt, auf denen ein Pixel gerendert würde:
%Vor%Unter Windows:
%Vor%Ergebnis:
%Vor%Wie Sie sehen können, war Seite 2 meines Eingabedokuments leer.
Ich vermute, Sie haben .Trim () auf Ihren Strings versucht, also werde ich das nicht selbst vorschlagen.
Was ist der tatsächliche Inhalt der 20+ Zeichenkettenlänge im Leerzeichen? Ich vermute, dass es nur neue Zeilenzeichen sind (was passiert, wenn Leute drücken und 10 Mal eingeben, nur um eine neue Seite zu bekommen, anstatt einen Seitenumbruch einzufügen), in welchem Fall:
%Vor%Lassen Sie uns wissen, was der Inhalt der Ausgabe danach ist.
Eine andere Möglichkeit ist, dass es leerer Text mit nicht-brechenden Leerzeichen und anderen Zeichen ist, die eigentlich keine Leerzeichen sind. Sie müssen diese manuell finden und ersetzen. An diesem Punkt würde ich stattdessen vorschlagen, dass Sie nur einen verwenden Regex-Übereinstimmung für [0-9, az, AZ] und verwenden Sie diese, um festzustellen, ob Ihre Seite leer ist oder nicht.
Es gibt eine Wrapper-Bibliothek für C # und VB.NET von einem mupdf c++ library
. Sie können damit Seiten in bmp
konvertieren (in verschiedenen Formaten tif
, jpg
, png
) und die Größe der Bitmap überprüfen.
Sie sollten prüfen, welche die minimale Größe mit den minimalen Zeichen einer Seite ist, die Sie als leer betrachten.
Tags und Links .net c# pdf itextsharp pdf-parsing