liest docx (Office Open XML) in PHP

8

Ich möchte eine Word-Import-Funktion zu unserem CMS hinzufügen, das einzige Problem, das ich nicht finden kann, eine gute Bibliothek zum Lesen von docx-Dateien (Word 2007) zu finden.

Hat jemand einige Empfehlungen, sollte die Bibliothek in der Lage sein, den Inhalt des Dokuments und grundlegende Stile wie kursiv, fett, hochgestellt zu extrahieren?

Danke für Ihre Hilfe

    
RageZ 01.10.2009, 02:34
quelle

7 Antworten

2

Oder, seit Sie eine Bibliothek angefordert haben, möchten Sie vielleicht in etwas wie Docvert schauen. Ich habe mich nur nach deiner Frage umgeschaut und es ist mein Favorit für PHP. Sie geben das Wort file location ein, es verwandelt es in etwas Einfaches mit den Attributen und dem ganzen guten Zeug.

    
Anthony 01.10.2009, 03:11
quelle
11

docx -Dateien sind eigentlich nur Container für das XML des Dokuments. Sie sollten in der Lage sein, die docx-Datei zu entpacken und dann zu dem Word-Ordner innerhalb und dann zu der document.xml zu gehen. Dies hat den eigentlichen Text. Aber Dinge wie die Schriften und Stile sind in anderen XML-Dateien im docx-Container enthalten, also wirst du wahrscheinlich ein bisschen herumspielen und herausfinden wollen, was was ist und wie man es anpasst (fang mit Namespaces an).

Aber ja, entpacken Sie die Datei und verwenden Sie dann simplexml, um sie in etwas umzuwandeln, mit dem Sie tatsächlich herumspielen können.

    
Anthony 01.10.2009 03:02
quelle
4

PHPDocX PRO enthält eine TransformDoc-Klasse, die .docx (zip) -Dateien lesen und daraus XHTML (oder PDF) generieren kann:

%Vor%     
Scott Evernden 09.06.2011 18:00
quelle
4

Es gibt eine Bibliothek, um dies zu tun, aber es funktioniert mit Zend-Framework kann es Ihnen helfen Es heißt phpLiveDocx : Ссылка Die Bibliothek ist lizenziert unter New BCD

    
sohaibafifi 01.10.2009 07:19
quelle
3

Ich habe gerade eine Bibliothek gefunden, die sowohl Lese- als auch Schreibunterstützung hat, sie auf der Codeplexschmiede Ссылка überprüfen und sie wird unter GPLv2 .

    
sohaibafifi 02.10.2009 13:32
quelle
0

Konvertieren Sie ein DOCX-Dokument in ein ODT, indem Sie OpenOffice . Verwenden Sie dann eZ-Komponenten , um das Parsing und den Import durchzuführen. Sie verwenden den Import tatsächlich in ihrem CMZ eZ Publish .

    
DrDol 20.01.2010 11:20
quelle
0

Hier ist eine einfache Arbeitslösung, die ich gefunden habe

Ссылка

    
andrebruton 31.07.2012 11:14
quelle

Tags und Links