Vergleich DOCX-Dateien OOXML mit

8

Wie kann ich Wort für Wort (mit Stilen) aus einer docx-Datei lesen? Ich möchte zwei docx-Dateien Wort für Wort vergleichen und basierend auf den Unterschieden, die ich in eine andere docx-Datei schreiben muss (mit c # und OOXML). Ich habe versucht, dies zu erreichen, indem ich DocumentFormat.OpenXml.Extensions.dll , OpenXMLdiff.dll und ICSharpCode.SharpZipLib.dll benutze, aber nichts gibt mir die Option, Wort für Wort zu lesen (ICSharpCode.SharpZipLib gibt Wort für Wort, aber es gibt keinen Stil für dieses Wort).

Jede Hilfe dazu wird sehr nützlich sein.

    
user274223 16.02.2010, 09:40
quelle

2 Antworten

3

Dieser MSDN-Artikel zeigt, wie Sie den genauen Text eines Dokuments Absatz für Absatz zuverlässig abrufen können.

Ссылка

Gleichzeitig können Sie den Stil für jeden Absatz festlegen. Das ist ziemlich einfach. Der folgende Blogpost zeigt, wie Sie den Stil und den Text für jeden Absatz abrufen können:

Ссылка

Vergleichen Sie die beiden? Es hängt von Ihrer genauen gewünschten Semantik ab. Ein Ansatz wäre, ein XML-Dokument zu erstellen, das Absätze und Stile enthält, und dann die XML-Dokumente zu vergleichen. Das XML-Dokument könnte etwa so aussehen:

%Vor%     
Eric White 15.03.2011 05:53
quelle
0

Am einfachsten ist es, die DOCX-Datei mit Ihrer bevorzugten ZIP-Bibliothek zu entpacken und dann die Textdateien mit einer Datei-E / A-Bibliothek zu vergleichen.

    
Zian Choy 02.01.2011 21:00
quelle