Skip to main content

2013 | OriginalPaper | Buchkapitel

A Novel Attributes Partition Method for Decision Tree

verfasst von : Zhen Li, Aili Han, Feilin Han

Erschienen in: Proceedings of The Eighth International Conference on Bio-Inspired Computing: Theories and Applications (BIC-TA), 2013

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In the decision tree’s making phase, it is frequent to find the optimal partition of elements with different values of a category attribute at a node. This needs to search over all the partitions for the one with the minimal impurity, which is exponential in n. We present a new heuristic search algorithm, SORT_DP, to find an effective partition, which is polynomial in n. The method uses the mapping from the class probability space to the sub-spaces and the technique of dynamic programming. By comparing the performance against other methods through experiments, we demonstrated the effectiveness of the new method.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Breiman L, Friedman JH, Olshen RA, Stone CJ (1984) Classification and regression trees. Wadsworth International Group, MontereyMATH Breiman L, Friedman JH, Olshen RA, Stone CJ (1984) Classification and regression trees. Wadsworth International Group, MontereyMATH
2.
Zurück zum Zitat Chou PA (1991) Optimal partitioning for classification and regression trees. IEEE Trans Pattern Anal Mach Intell 13(4):340–354CrossRef Chou PA (1991) Optimal partitioning for classification and regression trees. IEEE Trans Pattern Anal Mach Intell 13(4):340–354CrossRef
4.
Zurück zum Zitat Nadas A, Nahamoo D, Picheny MA, Powell J (1991) An iterative flip-flop approximation of the most informative split in the construction of decision trees. In: International conference on acoustics, speech, and signal processing. Toronto, pp 565–568 Nadas A, Nahamoo D, Picheny MA, Powell J (1991) An iterative flip-flop approximation of the most informative split in the construction of decision trees. In: International conference on acoustics, speech, and signal processing. Toronto, pp 565–568
5.
Zurück zum Zitat Mehta M, Agrawal R, Rissanen J (1996) SLIQ: a fast scalable classifier for data mining. In: Proceedings of the fifth international conference on extending database technology. Springer, Berlin, pp 18–33 Mehta M, Agrawal R, Rissanen J (1996) SLIQ: a fast scalable classifier for data mining. In: Proceedings of the fifth international conference on extending database technology. Springer, Berlin, pp 18–33
6.
Zurück zum Zitat NASA (1992) Introduction to IND Version 2.1, GA23-2475-02 edition. NASA Ames Research Center NASA (1992) Introduction to IND Version 2.1, GA23-2475-02 edition. NASA Ames Research Center
7.
Zurück zum Zitat Coppersmith D, Hong SJ, Hosking JRM (1999) Partitioning nominal attributes in decision trees. Data Min Knowl Disc 3(2):197–217CrossRef Coppersmith D, Hong SJ, Hosking JRM (1999) Partitioning nominal attributes in decision trees. Data Min Knowl Disc 3(2):197–217CrossRef
8.
Zurück zum Zitat Loh WY, Shih YS (1997) Split selection methods for classification trees. Statistica Sinica 7:815–840MathSciNetMATH Loh WY, Shih YS (1997) Split selection methods for classification trees. Statistica Sinica 7:815–840MathSciNetMATH
9.
Zurück zum Zitat Parsons l, Haque E, Liu H (2004) Subspace clustering for high dimensional data: a review. SIGKDD Explorations 6(1):90–105 Parsons l, Haque E, Liu H (2004) Subspace clustering for high dimensional data: a review. SIGKDD Explorations 6(1):90–105
Metadaten
Titel
A Novel Attributes Partition Method for Decision Tree
verfasst von
Zhen Li
Aili Han
Feilin Han
Copyright-Jahr
2013
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-642-37502-6_52

Premium Partner