Wie konvertiere ich eine .docx in HTML mit asp.net?

8

Word 2007 speichert seine Dokumente im .docx-Format, das ist wirklich eine Zip-Datei mit einer Menge Zeug darin, einschließlich einer XML-Datei mit dem Dokument.

Ich möchte in der Lage sein, eine .docx-Datei in einen Ordner in meiner asp.net-Webanwendung zu kopieren und den Code die .docx-Datei öffnen zu lassen und den (xml-Teil des) Dokuments als Webseite darzustellen .

Ich habe im Internet nach weiteren Informationen zu diesem Thema gesucht, aber bisher noch nicht viel gefunden. Meine Fragen sind:

  1. Würden Sie (a) XSLT verwenden, um das XML in HTML umzuwandeln, oder (b) XML-Manipulationsbibliotheken in .net (wie XDocument und XElement in 3.5) verwenden, um sie in HTML oder (c) andere?
  2. Kennen Sie irgendwelche Open-Source-Bibliotheken / Projekte, die dies getan haben, die ich als Ausgangspunkt verwenden könnte?

Danke!

    
Guy 10.09.2008, 19:36
quelle

5 Antworten

4

Probieren Sie Beitrag ? Ich weiß es nicht, aber vielleicht ist es das, wonach du suchst.

    
Adam Lerman 10.09.2008, 19:37
quelle
3

Ich schrieb mammoth.js , eine JavaScript-Bibliothek, die docx-Dateien in HTML konvertiert. Wenn Sie das Rendering serverseitig in .NET durchführen möchten, gibt es auch eine .NET-Version von Mammoth , die auf NuGet verfügbar ist .

Mammoth versucht, sauberes HTML zu erzeugen, indem es semantische Informationen betrachtet - zum Beispiel Paragraph-Stile in Word (zB Heading 1 ) zu passenden Tags und Stilen in HTML / CSS (wie <h1> ) abbildet. Wenn Sie etwas wollen, das eine exakte visuelle Kopie erzeugt, dann ist Mammoth wahrscheinlich nicht für Sie. Wenn Sie etwas haben, das bereits gut strukturiert ist und das in ordentliches HTML umwandeln möchten, könnte Mammoth den Trick machen.

    
Michael Williamson 10.05.2015 16:27
quelle
2

Word 2007 verfügt über eine API, mit der Sie in HTML konvertieren können. Hier ist ein Beitrag, der darüber spricht Ссылка . Sie können Dokumentation über die API finden, aber ich erinnere mich, dass es eine Konvertierung in HTML-Funktion in der API gibt.

    
Vaibhav 10.09.2008 19:39
quelle
1

Dieser Code hilft dabei, .docx file in Text zu konvertieren

%Vor%     
raghava 04.09.2012 05:26
quelle
0

Ich benutze Interop. Es ist etwas problematisch, aber funktioniert in den meisten Fällen gut.

%Vor%

Dieser gibt die Liste der Pfade für HTML-konvertierte Dokumente zurück

%Vor%

Und dieses Dokument in HTML konvertieren.

%Vor%

Das Töten des Wortes macht keinen Spaß, aber kann es nicht hängen lassen und andere blockieren, oder?

Im Web / HTML rendere ich HTML zu einem iframe.

Es gibt eine Dropdown-Liste, die die Liste der Hilfedokumente enthält. Wert ist der Pfad zur HTML-Version und Text ist der Name des Dokuments.

%Vor%

Bei ausgewähltem Index wurde der Frame geändert

%Vor%     
messed-up 16.01.2015 13:45
quelle

Tags und Links