Java-Unterstützung für PMML

9

Ich bin neu in PMML: Predictive Model Markup Language ( www.dmg.org ) und ich habe mich gefragt, ob da etwas ist Java-Unterstützung (Open Source / Professional) zum Erstellen / Parsen von PMML-Dateien.

Zunächst denke ich nur an die Möglichkeit, PMML-Dateien programmatisch aus Java-Umgebungen zu erstellen / zu parsen.

Ich habe "gegoogelt" und ich habe mehrere Möglichkeiten gefunden:

Quelle öffnen:

Aus Java.

  • JDM . javax.datamining. Scheint es ein tot? Jemand hat mehr Informationen?

Professionell.

DIY

  • Verwenden Sie eine XML-Java-Bibliothek und erstellen Sie einen Parser / Writer von PMML-Dateien

Ich schätze all Ihre Meinungen.

Vielen Dank im Voraus

Oscar

    
Oscar 02.09.2011, 08:19
quelle

1 Antwort

1

Sie sollten wissen, dass die Antwort von dem MODEL-ELEMENT abhängen kann, mit dem Sie arbeiten möchten. Es ist auch sehr wahrscheinlich, dass Ihre besten Optionen zum Erstellen von PMML und zum Parsing von PMML aus verschiedenen Softwarepaketen stammen. Ich gehe davon aus, dass Sie unter "Erstellung von PMML" das Dokument und nicht das Modell verstehen. Ich habe noch nie von jemandem gehört, der die automatische Modellanpassung mit der Ausführung integriert, aber vielleicht existiert sie bereits. Natürlich könnte ein PMML-Modell mit SOAP übergeben werden.

Ich kann nicht mit den anderen Projekten sprechen, aber das von Zementis angebotene Produkt, genannt Adapa , wird nur für das verwendet > Ausführung von PMML. Bei diesem Produkt wird davon ausgegangen, dass es eine Modellanpassungs-Anwendung gibt, die das Erstellen durchführt, indem ein angepasstes Modell in PMML exportiert wird. Es gibt bereits eine Menge gut entwickelter Modellanpassungsanwendungen, also denke ich, dass dies eine vernünftige Annahme ist.

Die Version, die ich verwendet habe (3.6), war im Allgemeinen schnell, konnte aber keine Ensembles mit einer typischen zufälligen Waldgröße (500+ Bäume) ohne einen besonders großen Haufen bewältigen. Ich denke, dass sie das in neueren Versionen behoben haben. Obwohl es nicht angekündigt ist, scheint Zementis nicht einige der Modelle anzubieten, nämlich Textmodelle, Sequenzen, Baseline-Modelle oder Zeitreihen (für die der PMML-Standard derzeit ohnehin nur exponentielle Glättung aufweist). Meine Version hat auch keine K-Nearest Neighbors, aber ich höre, dass neuere Versionen dies tun.

Sofern Sie keine integrierte Anpassung und Ausführung in Betracht ziehen (in diesem Fall sollten Sie das Online-Lernen in Betracht ziehen), wäre es ratsam, diese Fragen der Reihe nach zu betrachten:

  1. Was ist der Modelltyp, an dem ich interessiert bin?
  2. In welcher Anwendung baue ich am liebsten Modelle?
  3. Und zuletzt, wie werde ich das umsetzen und welche Anforderungen habe ich diesbezüglich (Web-Services, Cloud, Performance etc.)?

Wenn Sie sich die Liste der Mitglieder der DMG-Gruppe ansehen, werden Sie viele kommerzielle Anbieter finden, die entweder auf der Angebotsseite (zB SAS, SPSS, Togaware, Rapid-I) oder die Nachfrageseite (so viele zu listen).

Auf Ihrer Liste haben Sie auch Weka nicht erwähnt, aber sie führen auch einige PMML-Modelle aus und es gibt R / Java-basierte Lösungen und so könnten Sie PMML- > R importiert (siehe fileToXMLNode) in einer Java-Umgebung (aber Sie könnten auch einfach R ausführen) / p>

Wenn Sie schließlich ein sehr spezifisches Modell im Kopf haben und verstehen, was es mathematisch bedeutet, es auszuführen, dann sollte es nicht zu schwierig sein, das zu bauen, was Sie selbst brauchen.

    
Meadowlark Bradsher 31.05.2014 20:35
quelle