Was ist in Weka beschnittener und ungeprüfter Baum?

7

Im Entscheidungsbaum J48 Beispiel, wenn wir Baum beschnitten oder ungeprüft sagen, was ist der Unterschied?

    
London guy 20.07.2012, 19:22
quelle

3 Antworten

14

Die ungeprüften Bäume sind größer. Was passiert, ist, dass der Baum im Grunde nach dem implementierten Algorithmus erstellt wird und, wenn das Beschneiden aktiviert ist, ein zusätzlicher Schritt darauf folgt, welche Knoten / Zweige entfernt werden können, ohne die Leistung zu sehr zu beeinträchtigen.

Die Idee hinter dem Beschneiden ist, dass Sie nicht nur den Baum leichter verständlich machen, sondern auch das Risiko einer Überanpassung an die Trainingsdaten reduzieren. Das heißt, in der Lage zu sein, die Trainingsdaten (fast) perfekt zu klassifizieren, aber nichts anderes, weil der Baum, anstatt das zugrundeliegende Konzept zu lernen, die intrinsischen und spezifischen Eigenschaften der Trainingsdaten gelernt hat.

    
Lars Kotthoff 20.07.2012, 19:26
quelle
5

Ich möchte im Folgenden Lars 'Antwort hinzufügen. Aus dem folgenden Link

entnommen
  

Viele Algorithmen versuchen, ihre Ergebnisse zu "beschneiden" oder zu vereinfachen. Beschneiden erzeugt weniger, leichter interpretierbare Ergebnisse. Noch wichtiger ist, dass das Beschneiden als ein Werkzeug verwendet werden kann, um eine mögliche Überanpassung zu korrigieren. ...

     

J48 verwendet zwei Beschneidungsmethoden.

     

Das erste wird als Teilbaumersatz bezeichnet. Dies bedeutet, dass Knoten in einem Entscheidungsbaum durch ein Blatt ersetzt werden können - wodurch die Anzahl der Tests entlang eines bestimmten Pfads reduziert wird. Dieser Prozess beginnt bei den Blättern des vollständig geformten Baums und wirkt rückwärts auf die Wurzel.

     

Die zweite Art des Beschneidens, die in J48 verwendet wird, wird als Unterbaum-Anhebung bezeichnet. In diesem Fall kann ein Knoten nach oben zum Stamm des Baums verschoben werden und andere Knoten auf dem Weg ersetzen. Das Subtree-Raising hat oft einen vernachlässigbaren Effekt auf Entscheidungsbaummodelle. Es gibt oft keine klare Möglichkeit, den Nutzen der Option vorherzusagen, obwohl es ratsam sein könnte, sie auszuschalten, wenn der Induktionsprozess lange dauert. Dies liegt an der Tatsache, dass die Unterbaumaufhebung etwas rechenintensiv sein kann.

    
Atilla Ozgur 31.07.2012 11:52
quelle
1

Wenn man bedenkt, dass Weka eine Machine-Learning-Suite ist, klingt das nach dem, worauf sie sich beziehen:

Ссылка

Kurz gesagt, scheint die Beschneidung eines Entscheidungsbaums die Beseitigung möglicher Entscheidungen zu sein, die keinen großen Nutzen bringen.

Allerdings habe ich Weka nicht benutzt und bin damit nicht vertraut. Auf andere Antworten verzichten und sehen, ob das, was sie sagen, zuerst Sinn ergibt.

    
Georges Oates Larsen 20.07.2012 19:28
quelle

Tags und Links