Ich möchte eine Word-Import-Funktion zu unserem CMS hinzufügen, das einzige Problem, das ich nicht finden kann, eine gute Bibliothek zum Lesen von docx-Dateien (Word 2007) zu finden.
Hat jemand einige Empfehlungen, sollte die Bibliothek in der Lage sein, den Inhalt des Dokuments und grundlegende Stile wie kursiv, fett, hochgestellt zu extrahieren?
Danke für Ihre Hilfe
Oder, seit Sie eine Bibliothek angefordert haben, möchten Sie vielleicht in etwas wie Docvert schauen. Ich habe mich nur nach deiner Frage umgeschaut und es ist mein Favorit für PHP. Sie geben das Wort file location ein, es verwandelt es in etwas Einfaches mit den Attributen und dem ganzen guten Zeug.
docx
-Dateien sind eigentlich nur Container für das XML des Dokuments. Sie sollten in der Lage sein, die docx-Datei zu entpacken und dann zu dem Word-Ordner innerhalb und dann zu der document.xml zu gehen. Dies hat den eigentlichen Text. Aber Dinge wie die Schriften und Stile sind in anderen XML-Dateien im docx-Container enthalten, also wirst du wahrscheinlich ein bisschen herumspielen und herausfinden wollen, was was ist und wie man es anpasst (fang mit Namespaces an).
Aber ja, entpacken Sie die Datei und verwenden Sie dann simplexml, um sie in etwas umzuwandeln, mit dem Sie tatsächlich herumspielen können.
PHPDocX PRO enthält eine TransformDoc-Klasse, die .docx (zip) -Dateien lesen und daraus XHTML (oder PDF) generieren kann:
%Vor%Es gibt eine Bibliothek, um dies zu tun, aber es funktioniert mit Zend-Framework kann es Ihnen helfen Es heißt phpLiveDocx : Ссылка Die Bibliothek ist lizenziert unter New BCD
Ich habe gerade eine Bibliothek gefunden, die sowohl Lese- als auch Schreibunterstützung hat, sie auf der Codeplexschmiede Ссылка überprüfen und sie wird unter GPLv2 .
Konvertieren Sie ein DOCX-Dokument in ein ODT, indem Sie OpenOffice . Verwenden Sie dann eZ-Komponenten , um das Parsing und den Import durchzuführen. Sie verwenden den Import tatsächlich in ihrem CMZ eZ Publish .
Tags und Links php ms-word office-2007 import