Skip to main content

2016 | OriginalPaper | Buchkapitel

6. Comparing Attributes by a Probabilistic and Statistical Association II

verfasst von : Israël César Lerman

Erschienen in: Foundations and Methods in Combinatorial and Statistical Data Analysis and Clustering

Verlag: Springer London

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The data is defined by the observation of a set \(\mathcal {A}\) of descriptive attributes on a set \(\mathcal {O}\) of elementary objects. As indicated in the introduction of the preceding chapter (see Sect. 5.​1 of Chap. 5) \(\mathcal {A}\) is constituted of attributes of a same type belonging to the general type II (see Sect. 3.​3 of Chap. 3). To fix ideas in this introduction, we may imagine \(\mathcal {A}\) as composed of nominal categorical attributes. The different comparison cases are listed at the beginning of the following Section (see Sect. 6.2). For this comparison, as expressed in the introductive Sect. 5.​1 of Chap. 5, the LLA approach will be emphasized. It leads, in a unified process, to a very rich family of probabilistic association coefficients between descriptive attributes of any type. On the other hand, the principle of this method enables several association coefficients to be mutually compared.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Albatineh, A.N., Niewiadomska-Bugaj, M.: Correcting jaccard and other similarity indices for chance agreement in cluster analysis. Adv. Data Anal. Class. 5, 179–200 (2011)MathSciNetCrossRefMATH Albatineh, A.N., Niewiadomska-Bugaj, M.: Correcting jaccard and other similarity indices for chance agreement in cluster analysis. Adv. Data Anal. Class. 5, 179–200 (2011)MathSciNetCrossRefMATH
2.
Zurück zum Zitat Albatineh, A.N., Niewiadomska-Bugaj, M., Mihalko, D.: On similarity indices and correction for chance agreement. J. Class. 23, 301–313 (2006)MathSciNetCrossRef Albatineh, A.N., Niewiadomska-Bugaj, M., Mihalko, D.: On similarity indices and correction for chance agreement. J. Class. 23, 301–313 (2006)MathSciNetCrossRef
3.
Zurück zum Zitat Booth, H.S., Maindonald, J.H., Wilson, S.R., Gready, J.E.: An efficient z-score algorithm for assessing sequence alignments. J. Comput. Biol. 11(4), 616–625 (2004)CrossRef Booth, H.S., Maindonald, J.H., Wilson, S.R., Gready, J.E.: An efficient z-score algorithm for assessing sequence alignments. J. Comput. Biol. 11(4), 616–625 (2004)CrossRef
4.
Zurück zum Zitat Cramer, H.: The Elements of Probability Theory and Some of Its Applications. Wiley, New York (1946) Cramer, H.: The Elements of Probability Theory and Some of Its Applications. Wiley, New York (1946)
5.
Zurück zum Zitat Daniels, H.E.: The relation between measures of correlation in the universe of sample permutations. Biometrika 33, 129–135 (1944)MathSciNetCrossRefMATH Daniels, H.E.: The relation between measures of correlation in the universe of sample permutations. Biometrika 33, 129–135 (1944)MathSciNetCrossRefMATH
6.
Zurück zum Zitat Daudé, F.: Analyse et justification de la notion de ressemblance entre variables qualitatives dans l’optique de la classification hiérarchique par \(AVL\). Ph.D. thesis, Université de Rennes 1, June 1992 Daudé, F.: Analyse et justification de la notion de ressemblance entre variables qualitatives dans l’optique de la classification hiérarchique par \(AVL\). Ph.D. thesis, Université de Rennes 1, June 1992
7.
Zurück zum Zitat Davis, J.A.: A partial coefficient for goodman and Kruskal’s gamma. J. Am. Stat. Assoc. 62(317), 189–193 (1967)CrossRef Davis, J.A.: A partial coefficient for goodman and Kruskal’s gamma. J. Am. Stat. Assoc. 62(317), 189–193 (1967)CrossRef
8.
Zurück zum Zitat Fowlkes, E.B., Mallows, C.L.: A method for comparing two hierarchical clusterings. J. Am. Stat. Assoc. 78, 553–569 (1983)CrossRefMATH Fowlkes, E.B., Mallows, C.L.: A method for comparing two hierarchical clusterings. J. Am. Stat. Assoc. 78, 553–569 (1983)CrossRefMATH
9.
Zurück zum Zitat Goodman, L.A., Kruskal, W.H.: Measures of association for cross classifications. J. Am. Stat. Assoc. 49, 732–764 (1954)MATH Goodman, L.A., Kruskal, W.H.: Measures of association for cross classifications. J. Am. Stat. Assoc. 49, 732–764 (1954)MATH
12.
13.
Zurück zum Zitat Hubert, L.J.: Inference procedures for the evaluation and comparison of proximity matrices. In: Felsenstein, J. (ed.) Numerical Taxonomy. Springer, Berlin (1983) Hubert, L.J.: Inference procedures for the evaluation and comparison of proximity matrices. In: Felsenstein, J. (ed.) Numerical Taxonomy. Springer, Berlin (1983)
14.
15.
Zurück zum Zitat Hubert, L.J.: Assignment methods in combinatorial data analysis. Numerical Taxonomy. Marcel Dekker, New York (1987) Hubert, L.J.: Assignment methods in combinatorial data analysis. Numerical Taxonomy. Marcel Dekker, New York (1987)
16.
Zurück zum Zitat Hulsen, T., de Vlieg, J., Leunissen, J., Groenen, P.: Testing statistical significance with structure similarity. BMC Bioinf. 7(444), 1 (2006). Online Hulsen, T., de Vlieg, J., Leunissen, J., Groenen, P.: Testing statistical significance with structure similarity. BMC Bioinf. 7(444), 1 (2006). Online
17.
Zurück zum Zitat Kendall, M.G.: Rank correlation methods. Charles Griffin, London (1970). First edition in 1948 Kendall, M.G.: Rank correlation methods. Charles Griffin, London (1970). First edition in 1948
18.
Zurück zum Zitat Lecalvé, G.: Un indice de similarité pour des variables de types quelconques. Statistique et Analyse des Données 01–02, 39–47 (1976) Lecalvé, G.: Un indice de similarité pour des variables de types quelconques. Statistique et Analyse des Données 01–02, 39–47 (1976)
19.
Zurück zum Zitat Lerman, I.C.: Étude distributionnelle de statistiques de proximité entre structures finies de même type; application à la classification automatique. Cahiers du Bureau Universitaire de Recherche Opérationnelle 19 1–52 (1973) Lerman, I.C.: Étude distributionnelle de statistiques de proximité entre structures finies de même type; application à la classification automatique. Cahiers du Bureau Universitaire de Recherche Opérationnelle 19 1–52 (1973)
20.
Zurück zum Zitat Lerman, I.C.: Formal analysis of a general notion of proximity between variables. In: Barra, J.R., et al. (eds.) Recent Developments in Statistics, pp. 787–795. North-Holland, New York (1977) Lerman, I.C.: Formal analysis of a general notion of proximity between variables. In: Barra, J.R., et al. (eds.) Recent Developments in Statistics, pp. 787–795. North-Holland, New York (1977)
22.
Zurück zum Zitat Lerman, I.C.: Indices d’association partielle entre variables qualitatives nominales. RAIRO série verte 17(3), 213–259 (1983) Lerman, I.C.: Indices d’association partielle entre variables qualitatives nominales. RAIRO série verte 17(3), 213–259 (1983)
23.
Zurück zum Zitat Lerman, I.C.: Indices d’association partielle entre variables qualitatives ordinales. Publications Institut de Statistique des Universités de Paris, (XXVIII, 1,2), 7–46 (1983) Lerman, I.C.: Indices d’association partielle entre variables qualitatives ordinales. Publications Institut de Statistique des Universités de Paris, (XXVIII, 1,2), 7–46 (1983)
24.
Zurück zum Zitat Lerman, I.C.: Justification et validité d’une échelle \([0, 1]\) de fréquence mathématique pour une structure de proximité sur un ensemble de variables observées. Publications de l’Institut de Statistique des Universités de Paris 29, 27–57 (1984)MathSciNetMATH Lerman, I.C.: Justification et validité d’une échelle \([0, 1]\) de fréquence mathématique pour une structure de proximité sur un ensemble de variables observées. Publications de l’Institut de Statistique des Universités de Paris 29, 27–57 (1984)MathSciNetMATH
25.
Zurück zum Zitat Lerman, I.C.: Maximisation de l’association entre deux variables qualitatives ordinales. Mathématiques et Sciences Humaines 100, 49–56 (1987)MathSciNetMATH Lerman, I.C.: Maximisation de l’association entre deux variables qualitatives ordinales. Mathématiques et Sciences Humaines 100, 49–56 (1987)MathSciNetMATH
26.
Zurück zum Zitat Lerman, I.C.: Comparing partitions (mathematical and statistical aspects). In: Bock, H.H. (ed.) Classification and Related Methods of Data Analysis, pp. 121–131. North-Holland, Amsterdam (1988) Lerman, I.C.: Comparing partitions (mathematical and statistical aspects). In: Bock, H.H. (ed.) Classification and Related Methods of Data Analysis, pp. 121–131. North-Holland, Amsterdam (1988)
27.
Zurück zum Zitat Lerman, I.C.: Conception et analyse de la forme limite d ’ une famille de coefficients statistiques d ’ association entre variables relationnelles, i. Revue Mathématique Informatique et Sciences Humaines 118, 35–52 (1992) Lerman, I.C.: Conception et analyse de la forme limite d ’ une famille de coefficients statistiques d ’ association entre variables relationnelles, i. Revue Mathématique Informatique et Sciences Humaines 118, 35–52 (1992)
28.
Zurück zum Zitat Lerman, I.C.: Conception et analyse de la forme limite d ’ une famille de coefficients statistiques d ’ association entre variables relationnelles, ii. Revue Mathématique Informatique et Sciences Humaines 119, 75–100 (1992) Lerman, I.C.: Conception et analyse de la forme limite d ’ une famille de coefficients statistiques d ’ association entre variables relationnelles, ii. Revue Mathématique Informatique et Sciences Humaines 119, 75–100 (1992)
29.
Zurück zum Zitat Lerman, I.C.: Comparing classification tree structures: a special case of comparing q-ary relations. RAIRO-Oper. Res. 33, 339–365 (1999)MathSciNetCrossRefMATH Lerman, I.C.: Comparing classification tree structures: a special case of comparing q-ary relations. RAIRO-Oper. Res. 33, 339–365 (1999)MathSciNetCrossRefMATH
30.
Zurück zum Zitat Lerman, I.C.: Comparing taxonomic data. Revue Mathématiques et Sciences Humaines 150, 37–51 (2000) Lerman, I.C.: Comparing taxonomic data. Revue Mathématiques et Sciences Humaines 150, 37–51 (2000)
31.
Zurück zum Zitat Lerman, I.C., Peter, P.: Structure maximale pour la somme des carrés d’une contingence aux marges fixées; une solution algorithmique programmée. Revue française d’automatique, d’informatique et de recherche opérationnelle 22(2), 83–136 (1988)MathSciNet Lerman, I.C., Peter, P.: Structure maximale pour la somme des carrés d’une contingence aux marges fixées; une solution algorithmique programmée. Revue française d’automatique, d’informatique et de recherche opérationnelle 22(2), 83–136 (1988)MathSciNet
32.
Zurück zum Zitat Lerman, I.C., Peter, P., Risler, J.L.: Matrices AVL pour la classification et l’alignement de séquences protéiques. Research Report 2466, IRISA-INRIA, September 1994 Lerman, I.C., Peter, P., Risler, J.L.: Matrices AVL pour la classification et l’alignement de séquences protéiques. Research Report 2466, IRISA-INRIA, September 1994
33.
Zurück zum Zitat Lerman, I.C., Rouxel, F.: Comparing classification tree structures: a special case of comparing q-ary relations ii. RAIRO-Oper. Res. 34, 251–281 (2000) Lerman, I.C., Rouxel, F.: Comparing classification tree structures: a special case of comparing q-ary relations ii. RAIRO-Oper. Res. 34, 251–281 (2000)
34.
Zurück zum Zitat Mantel, N.: Detection of disease clustering and a generalized approach. Cancer Res. 27(2), 209–220 (1967) Mantel, N.: Detection of disease clustering and a generalized approach. Cancer Res. 27(2), 209–220 (1967)
36.
Zurück zum Zitat Mielke, P.W.: On asymptotic non-normality of null distributions of MRPP statistics. In: Communications in Statistics, Theory and Methods, pp. A8:1541–1550 (1979) Mielke, P.W.: On asymptotic non-normality of null distributions of MRPP statistics. In: Communications in Statistics, Theory and Methods, pp. A8:1541–1550 (1979)
37.
Zurück zum Zitat Monjardet, B.: Concordance between two linear orders: The Spearman and Kendall coefficients revisited. J. Classif. 14, 269–295 (1997)MathSciNetCrossRefMATH Monjardet, B.: Concordance between two linear orders: The Spearman and Kendall coefficients revisited. J. Classif. 14, 269–295 (1997)MathSciNetCrossRefMATH
40.
Zurück zum Zitat Ouali-Allah, M.: Analyse en préordonnance des données qualitatives. Application aux données numériques et symboliques. Ph.D. thesis, Université de Rennes 1, Decembre 1991 Ouali-Allah, M.: Analyse en préordonnance des données qualitatives. Application aux données numériques et symboliques. Ph.D. thesis, Université de Rennes 1, Decembre 1991
41.
Zurück zum Zitat Pinto Da Costa, J.F., Roque, L.A.C.: Limit distribution for the weighted rank correlation coefficient, \(r_{W}\). REVSTAT - Stat. J. 3, 189–200 (2006)MathSciNetMATH Pinto Da Costa, J.F., Roque, L.A.C.: Limit distribution for the weighted rank correlation coefficient, \(r_{W}\). REVSTAT - Stat. J. 3, 189–200 (2006)MathSciNetMATH
42.
Zurück zum Zitat Somers, R.H.: Analysis of partial rank correlation measures based on the product-moment model: Part one. Social Forces 53(2), 229–246 (1974)CrossRef Somers, R.H.: Analysis of partial rank correlation measures based on the product-moment model: Part one. Social Forces 53(2), 229–246 (1974)CrossRef
43.
Zurück zum Zitat Spearman, C.: The proof and measurement of association between two things. Am. J. Psychol. 15(1), 72–101 (1904)CrossRef Spearman, C.: The proof and measurement of association between two things. Am. J. Psychol. 15(1), 72–101 (1904)CrossRef
44.
Zurück zum Zitat Steinley, D., Hendrickson, G., Brusco, M.J.: A note on maximizing the agreement between partitions: a stepwise optimal algorithm and some properties. J. Classif. 32, 114–126 (2015)MathSciNetCrossRefMATH Steinley, D., Hendrickson, G., Brusco, M.J.: A note on maximizing the agreement between partitions: a stepwise optimal algorithm and some properties. J. Classif. 32, 114–126 (2015)MathSciNetCrossRefMATH
45.
Zurück zum Zitat Tshuprow, A.A.: Principles of the Mathematical Theory of Correlation (trans: Kantorowitsch, M). W. Hodge and Co, London (1939) Tshuprow, A.A.: Principles of the Mathematical Theory of Correlation (trans: Kantorowitsch, M). W. Hodge and Co, London (1939)
46.
Zurück zum Zitat Villoing, P.: Classification ascendante hiérarchique et indices de similarité sur données qualitatives nominales selon l’algorithme de la vraisemblance de la vraisemblance du lien. Ph.D. thesis, Université de Rennes 1, December 1980 Villoing, P.: Classification ascendante hiérarchique et indices de similarité sur données qualitatives nominales selon l’algorithme de la vraisemblance de la vraisemblance du lien. Ph.D. thesis, Université de Rennes 1, December 1980
47.
48.
Zurück zum Zitat Wilson, E.B., Hilferty, MM: The distribution of chi-square. In: Proceedings of the National Academy of Sciences of the United States of America, vol. 17, pp. 684–688 (1931) Wilson, E.B., Hilferty, MM: The distribution of chi-square. In: Proceedings of the National Academy of Sciences of the United States of America, vol. 17, pp. 684–688 (1931)
Metadaten
Titel
Comparing Attributes by a Probabilistic and Statistical Association II
verfasst von
Israël César Lerman
Copyright-Jahr
2016
Verlag
Springer London
DOI
https://doi.org/10.1007/978-1-4471-6793-8_6