Skip to main content
Erschienen in:
Buchtitelbild

2021 | OriginalPaper | Buchkapitel

PerioClust: A Simple Hierarchical Agglomerative Clustering Approach Including Constraints

verfasst von : Lise Bellanger, Arthur Coulon, Philippe Husi

Erschienen in: Data Analysis and Rationality in a Complex World

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

PerioClust is a hierarchical agglomerative clustering (HAC) method including temporal (resp. spatial) ordering constraints. This new semi-supervised learning algorithm is designed to consider two potentially error-prone sources of information associated with the same observations. One reflects dissimilarities in the “feature space” and the other the temporal (resp. spatial) constraint structure between the observations. A distance-based approach is adopted to modify the distance measure in the classical HAC algorithm using a convex combination to take into account the two initial dissimilarity matrices. The choice of the mixing parameter is, therefore, the key point. We define a criterion based on cophenetic distances, as well as a resampling procedure to ensure the good robustness of the proposed clustering method. The dendrogram associated with this HAC can be interpreted as the result of a compromise between each source of information analysed separately. We illustrate our clustering method on two real data sets: (i) an archaeological one containing temporal information, (ii) a socio-economical one containing geographical information.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Dissimilarity values are between 0 and 1.
 
3
In abbreviated form CA.
 
4
\(\mathbf {D}_{\alpha }\) is differently defined between PerioClust and hclustgeo with \(\alpha _{PerioClust}=1-\alpha _{hclustgeo}\). In the following, \(\alpha \) will always refer to \(\alpha _{PerioClust}\) that gives the direct importance of \(\mathbf {D}_1\) in \(\mathbf {D}_{\alpha }\).
 
Literatur
Zurück zum Zitat Aggarwal, C., Reddy, C.: Data Clustering: Algorithms and Applications. Chapman and Hall/CRC, Boca Raton (2014)CrossRef Aggarwal, C., Reddy, C.: Data Clustering: Algorithms and Applications. Chapman and Hall/CRC, Boca Raton (2014)CrossRef
Zurück zum Zitat Bellanger, L., Husi, P.: Statistical tool for dating and interpreting archaeological contexts using pottery. J. Archaeol. Sci. 39, 777–790 (2012)CrossRef Bellanger, L., Husi, P.: Statistical tool for dating and interpreting archaeological contexts using pottery. J. Archaeol. Sci. 39, 777–790 (2012)CrossRef
Zurück zum Zitat Chavent, M., Kuentz-Simonet, V., Labenne, A., Saracco, J.: ClustGeo: an R package for hierarchical clustering with spatial constraints. Computat. Stat. 33, 1799–1822 (2018)MathSciNetCrossRef Chavent, M., Kuentz-Simonet, V., Labenne, A., Saracco, J.: ClustGeo: an R package for hierarchical clustering with spatial constraints. Computat. Stat. 33, 1799–1822 (2018)MathSciNetCrossRef
Zurück zum Zitat Davidson, I., Basu, S.: A survey of clustering with instance level. ACM T Knowl. Discov. D. 77, 1–41 (2007) Davidson, I., Basu, S.: A survey of clustering with instance level. ACM T Knowl. Discov. D. 77, 1–41 (2007)
Zurück zum Zitat Efron, B., Tibshirani, R.: An Introduction to the Bootstrap. Chapman & Hall/CRC, New York (1993)CrossRef Efron, B., Tibshirani, R.: An Introduction to the Bootstrap. Chapman & Hall/CRC, New York (1993)CrossRef
Zurück zum Zitat Everitt, B., Landau, S., Morven, L.: Cluster Analysis, 4th edn. Oxford University Press Inc., Oxford (2001)MATH Everitt, B., Landau, S., Morven, L.: Cluster Analysis, 4th edn. Oxford University Press Inc., Oxford (2001)MATH
Zurück zum Zitat Gaucher, J.: Angkor Thom, une utopie réalisée?: structuration de l’espace et modèle indien d’urbanisme dans le Cambodge ancien. Arts Asiat. 59, 58–86 (2004)CrossRef Gaucher, J.: Angkor Thom, une utopie réalisée?: structuration de l’espace et modèle indien d’urbanisme dans le Cambodge ancien. Arts Asiat. 59, 58–86 (2004)CrossRef
Zurück zum Zitat Greenacre, M.: Correspondence Analysis in Practice. Chapman & Hall/CRC, Boca Raton (2016)MATH Greenacre, M.: Correspondence Analysis in Practice. Chapman & Hall/CRC, Boca Raton (2016)MATH
Zurück zum Zitat Harris, E.C.: Principles of Archaeological Stratigraphy, 2nd edn. Academic Press, London and San Diego (1989) Harris, E.C.: Principles of Archaeological Stratigraphy, 2nd edn. Academic Press, London and San Diego (1989)
Zurück zum Zitat Kaufman, L., Rousseeuw, P.: Finding Groups in Data: An Introduction to Cluster Analysis. Wiley-Interscience, New York (2005)MATH Kaufman, L., Rousseeuw, P.: Finding Groups in Data: An Introduction to Cluster Analysis. Wiley-Interscience, New York (2005)MATH
Zurück zum Zitat Legendre, P., Legendre, L.: Numerical Ecology, 3rd edn. Elsevier Science BV, Amsterdam (2012)MATH Legendre, P., Legendre, L.: Numerical Ecology, 3rd edn. Elsevier Science BV, Amsterdam (2012)MATH
Zurück zum Zitat Sokal, R.R., Rohlf, F.J.: The comparison of dendrograms by objective methods. Taxon 11, 33–40 (1962)CrossRef Sokal, R.R., Rohlf, F.J.: The comparison of dendrograms by objective methods. Taxon 11, 33–40 (1962)CrossRef
Metadaten
Titel
PerioClust: A Simple Hierarchical Agglomerative Clustering Approach Including Constraints
verfasst von
Lise Bellanger
Arthur Coulon
Philippe Husi
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-030-60104-1_1

Premium Partner