Skip to main content

2016 | OriginalPaper | Buchkapitel

5. Comparing Attributes by Probabilistic and Statistical Association I

verfasst von : Israël César Lerman

Erschienen in: Foundations and Methods in Combinatorial and Statistical Data Analysis and Clustering

Verlag: Springer London

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Data is defined by the observation of a set \(\mathcal {A}\) of descriptive attributes on a set \(\mathcal {O}\) of elementary objects or a set \(\Gamma \) of categories. In this and in the following chapters, we develop the construction of an association coefficient on \(\mathcal {A}\). For this purpose, Likelihood Linkage Analysis approach is emphasized. It leads, in a unified process, to a very rich family of probabilistic association coefficients between descriptive attributes of any type. On the other hand, the principle of this method enables several association coefficients to be mutually compared.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Achard, P.: Choix d’un indice de similarité. Qual. Quant. 2, 289–302 (1972) Achard, P.: Choix d’un indice de similarité. Qual. Quant. 2, 289–302 (1972)
2.
Zurück zum Zitat Anderson, T.W.: An Introduction to Multivariate Statistical Analysis. Wiley, New York (1958)MATH Anderson, T.W.: An Introduction to Multivariate Statistical Analysis. Wiley, New York (1958)MATH
3.
Zurück zum Zitat Anderson, T.W.: On the distribution of the two-sample Cramér- Von mises criterion. Ann. Math. Stat. 3, 1148–1159 (1962)CrossRefMATH Anderson, T.W.: On the distribution of the two-sample Cramér- Von mises criterion. Ann. Math. Stat. 3, 1148–1159 (1962)CrossRefMATH
4.
Zurück zum Zitat Benzécri, J.P.: L’analyse des données, tome II. Dunod, France (1973)MATH Benzécri, J.P.: L’analyse des données, tome II. Dunod, France (1973)MATH
5.
Zurück zum Zitat Cramer, H.: Mathematical Methods of Statistics. Princeton University Press, USA (1946)MATH Cramer, H.: Mathematical Methods of Statistics. Princeton University Press, USA (1946)MATH
6.
Zurück zum Zitat Daudé, F.: Analyse et justification de la notion de ressemblance entre variables qualitatives dans l’optique de la classification hiérarchique par AVL. Ph.D. thesis, Université de Rennes 1, June 1992 Daudé, F.: Analyse et justification de la notion de ressemblance entre variables qualitatives dans l’optique de la classification hiérarchique par AVL. Ph.D. thesis, Université de Rennes 1, June 1992
7.
Zurück zum Zitat Dice, L.R.: Measures of the amount of ecologic association between species. Ecology 26, 297–302 (1945)CrossRef Dice, L.R.: Measures of the amount of ecologic association between species. Ecology 26, 297–302 (1945)CrossRef
8.
Zurück zum Zitat Efron, B.: The Jacknife, the Boot-strap and other resampling plans. CBMS-NSF, Regional Conference series in Applied Mathematics (1994) Efron, B.: The Jacknife, the Boot-strap and other resampling plans. CBMS-NSF, Regional Conference series in Applied Mathematics (1994)
9.
Zurück zum Zitat Feller, W.: An Introduction to Probability Theory and Its Applications. Wiley, New York (1968)MATH Feller, W.: An Introduction to Probability Theory and Its Applications. Wiley, New York (1968)MATH
10.
Zurück zum Zitat Fraser, D.A.S.: Nonparametric Methods in Statistics. Wiley, New York (1959)MATH Fraser, D.A.S.: Nonparametric Methods in Statistics. Wiley, New York (1959)MATH
11.
Zurück zum Zitat Gras, R.: Contribution à l’étude expérimentale et à l’analyse de certaines acquisitions cognitives et de certains objectifs didactiques en mathématiques. Ph.D. thesis, Thèse de doctorat d’état, Université de Rennes 1 (1979) Gras, R.: Contribution à l’étude expérimentale et à l’analyse de certaines acquisitions cognitives et de certains objectifs didactiques en mathématiques. Ph.D. thesis, Thèse de doctorat d’état, Université de Rennes 1 (1979)
12.
Zurück zum Zitat Gras, R., Kuntz, P.: An overview of the statistical implicative analysis (SIA) development. In: Spagnolo, F., Suzuki, E., Gras, R., Guillet, F. (eds.) Statistical Implicative Analysis, Studies in Computational Intelligence, pp. 11–40. Springer, New York (2008)CrossRef Gras, R., Kuntz, P.: An overview of the statistical implicative analysis (SIA) development. In: Spagnolo, F., Suzuki, E., Gras, R., Guillet, F. (eds.) Statistical Implicative Analysis, Studies in Computational Intelligence, pp. 11–40. Springer, New York (2008)CrossRef
14.
16.
Zurück zum Zitat Hamann, V.: Merkmalbestand und verwandtschaftsbeziehungen der farinosae. Beitragzum System der Monokotyledonen 2, 639–768 (1961) Hamann, V.: Merkmalbestand und verwandtschaftsbeziehungen der farinosae. Beitragzum System der Monokotyledonen 2, 639–768 (1961)
17.
Zurück zum Zitat Jaccard, P.: Nouvelles recherches sur la distribution florale. Bulletin de la Société Vaudoise des Sciences Naturelles 44, 223–270 (1908) Jaccard, P.: Nouvelles recherches sur la distribution florale. Bulletin de la Société Vaudoise des Sciences Naturelles 44, 223–270 (1908)
18.
Zurück zum Zitat Kulczynski, S.: Die pflanzenassoziationen der pieninen [in polish, german summary]. Bull. Inter. Acad. Pol. Sci. Lett. Cl. Sci. Math.Nat. (Sci. Nat) (suppl. 2), 57–203 (1927) Kulczynski, S.: Die pflanzenassoziationen der pieninen [in polish, german summary]. Bull. Inter. Acad. Pol. Sci. Lett. Cl. Sci. Math.Nat. (Sci. Nat) (suppl. 2), 57–203 (1927)
19.
Zurück zum Zitat Lagrange, J.-B.: Analyse implicative d’un ensemble de variables numériques; application au traitement d’un questionnaire à réponses modales ordonnées. Revue de Statistique Appliquée 46(1), 71–93 (1998) Lagrange, J.-B.: Analyse implicative d’un ensemble de variables numériques; application au traitement d’un questionnaire à réponses modales ordonnées. Revue de Statistique Appliquée 46(1), 71–93 (1998)
20.
Zurück zum Zitat Lancaster, H.O.: The Chi-squared Distribution. John Wiley, New Jersey (1969)MATH Lancaster, H.O.: The Chi-squared Distribution. John Wiley, New Jersey (1969)MATH
21.
Zurück zum Zitat Lerman, I-C., Azé, J.: A new probabilistic measure of interestingness for association rules, based on the Likelihood of the Link. In: Guillet, F., Hamilton, H.J. (eds.) Quality Measures in Data Mining, Studies in Computational Intelligence, vol. 43, pp. 207–236. Springer, Heidelberg (2007) Lerman, I-C., Azé, J.: A new probabilistic measure of interestingness for association rules, based on the Likelihood of the Link. In: Guillet, F., Hamilton, H.J. (eds.) Quality Measures in Data Mining, Studies in Computational Intelligence, vol. 43, pp. 207–236. Springer, Heidelberg (2007)
22.
Zurück zum Zitat Lerman, I-C., Guillaume, S.: Comparing two discriminant probabilistic interestingness measures for association rules. In: Pinaud, B. (ed.) Advances in Knowledge Discovery and Management 3, pp. 59–83. Springer, New York (2013) Lerman, I-C., Guillaume, S.: Comparing two discriminant probabilistic interestingness measures for association rules. In: Pinaud, B. (ed.) Advances in Knowledge Discovery and Management 3, pp. 59–83. Springer, New York (2013)
23.
Zurück zum Zitat Lerman, I.C.: Sur l’analyse des données préalable à une classification automatique; proposition d’une nouvelle mesure de similarité. Mathématiques et Sciences Humaines 32, 5–15 (1970)MathSciNet Lerman, I.C.: Sur l’analyse des données préalable à une classification automatique; proposition d’une nouvelle mesure de similarité. Mathématiques et Sciences Humaines 32, 5–15 (1970)MathSciNet
24.
Zurück zum Zitat Lerman, I.C.: Étude distributionnelle de statistiques de proximité entre structures finies de même type; application à la classification automatique. Cahiers du Bureau Universitaire de Recherche Opérationnelle 19, 1–52 (1973) Lerman, I.C.: Étude distributionnelle de statistiques de proximité entre structures finies de même type; application à la classification automatique. Cahiers du Bureau Universitaire de Recherche Opérationnelle 19, 1–52 (1973)
25.
Zurück zum Zitat Lerman, I.C.: Introduction à une méthode de classification automatique illustrée par la recherche d’une typolologie des personnages enfants à travers la littérature enfantine. Revue de Statistique Appliquée XX I(3), 23–49 (1973) Lerman, I.C.: Introduction à une méthode de classification automatique illustrée par la recherche d’une typolologie des personnages enfants à travers la littérature enfantine. Revue de Statistique Appliquée XX I(3), 23–49 (1973)
26.
Zurück zum Zitat Lerman, I.C.: Formal analysis of a general notion of proximity between variables. In: Barra, J.R. et al., (ed.) Recent Developments in Statistics, pp. 787–795. North-Holland (1977) Lerman, I.C.: Formal analysis of a general notion of proximity between variables. In: Barra, J.R. et al., (ed.) Recent Developments in Statistics, pp. 787–795. North-Holland (1977)
28.
Zurück zum Zitat Lerman, I.C.: Indices d’association partielle entre variables qualitatives nominales. RAIRO série verte 17(3), 213–259 (1983)MathSciNetMATH Lerman, I.C.: Indices d’association partielle entre variables qualitatives nominales. RAIRO série verte 17(3), 213–259 (1983)MathSciNetMATH
29.
Zurück zum Zitat Lerman, I.C.: Indices d’association partielle entre variables qualitatives ordinales. Publications Institut de Statistique des Universités de Paris, XXVIII(1, 2), 7–46 (1983) Lerman, I.C.: Indices d’association partielle entre variables qualitatives ordinales. Publications Institut de Statistique des Universités de Paris, XXVIII(1, 2), 7–46 (1983)
30.
Zurück zum Zitat Lerman, I.C.: Interprétation non-linéaire d’un coefficient d’association entre modalités d’une juxtaposition de tables de contingences. Mathématiques et Sciences Humaines 83, 5–30 (1983)MathSciNetMATH Lerman, I.C.: Interprétation non-linéaire d’un coefficient d’association entre modalités d’une juxtaposition de tables de contingences. Mathématiques et Sciences Humaines 83, 5–30 (1983)MathSciNetMATH
31.
Zurück zum Zitat Lerman, I.C.: Justification et validité d’une échelle \([0,1]\) de fréquence mathématique pour une structure de proximité sur un ensemble de variables observées. Publications de l’Institut de Statistique des Universités de Paris 29, 27–57 (1984)MathSciNetMATH Lerman, I.C.: Justification et validité d’une échelle \([0,1]\) de fréquence mathématique pour une structure de proximité sur un ensemble de variables observées. Publications de l’Institut de Statistique des Universités de Paris 29, 27–57 (1984)MathSciNetMATH
32.
Zurück zum Zitat Lerman, I.C.: Rôle de l’inférence statistique dans une approche de l’analyse classificatoire des données. Journal de la Société de Statistique de Paris 127, 233–238 (1986) Lerman, I.C.: Rôle de l’inférence statistique dans une approche de l’analyse classificatoire des données. Journal de la Société de Statistique de Paris 127, 233–238 (1986)
33.
Zurück zum Zitat Lerman, I.C.: Conception et analyse de la forme limite d’ une famille de coefficients statistiques d ’ association entre variables relationnelles. i. Revue Mathématique Informatique et Sciences Humaines 118, 35–52 (1992) Lerman, I.C.: Conception et analyse de la forme limite d’ une famille de coefficients statistiques d ’ association entre variables relationnelles. i. Revue Mathématique Informatique et Sciences Humaines 118, 35–52 (1992)
34.
Zurück zum Zitat Lerman, I.C.: Conception et analyse de la forme limite d’ une famille de coefficients statistiques d’ association entre variables relationnelles. ii. Revue Mathématique Informatique et Sciences Humaines 119, 75–100 (1992) Lerman, I.C.: Conception et analyse de la forme limite d’ une famille de coefficients statistiques d’ association entre variables relationnelles. ii. Revue Mathématique Informatique et Sciences Humaines 119, 75–100 (1992)
35.
Zurück zum Zitat Lerman, I.C., Gras, R., Rostam, H.: Élaboration et évaluation d’un indice d’implication pour des données binaires i et ii. Revue Mathématique et Sciences Humaines, (74 et 75):5–35 et 5–47, 1981 Lerman, I.C., Gras, R., Rostam, H.: Élaboration et évaluation d’un indice d’implication pour des données binaires i et ii. Revue Mathématique et Sciences Humaines, (74 et 75):5–35 et 5–47, 1981
36.
Zurück zum Zitat Lerman, I.C., Guillaume, S.: Analyse comparative d’indices d’implication discriminants fondés sur une échelle de probabilité. Research Report 7187, IRISA-INRIA (2010) Lerman, I.C., Guillaume, S.: Analyse comparative d’indices d’implication discriminants fondés sur une échelle de probabilité. Research Report 7187, IRISA-INRIA (2010)
37.
Zurück zum Zitat Lerman, I.C., Tallur, B.: Classification des éléments constitutifs d’ une juxtaposition de tableaux de contingence. Revue de Statistique Appliquée 28, 5–28 (1980)MathSciNet Lerman, I.C., Tallur, B.: Classification des éléments constitutifs d’ une juxtaposition de tableaux de contingence. Revue de Statistique Appliquée 28, 5–28 (1980)MathSciNet
38.
Zurück zum Zitat Nicola\(\ddot{u}\), M.H.: Contribuiçò es ao estudo dos coefficientes de comparação em análise classificatoria. Ph.D. thesis, University of Lisboa (1981) Nicola\(\ddot{u}\), M.H.: Contribuiçò es ao estudo dos coefficientes de comparação em análise classificatoria. Ph.D. thesis, University of Lisboa (1981)
40.
Zurück zum Zitat Ochiai, A.: Zoogeographic studies on the soleoid fishes found in Japan and its neighbouring regions. Bull. Japan. Soc. Sci. Fish. 22, 526–530 (1957)CrossRef Ochiai, A.: Zoogeographic studies on the soleoid fishes found in Japan and its neighbouring regions. Bull. Japan. Soc. Sci. Fish. 22, 526–530 (1957)CrossRef
41.
42.
Zurück zum Zitat Puri, M.L., Sen, P.K.: Nonparametric Methods in Multivariate Analysis. Wiley, New Jersey (1971)MATH Puri, M.L., Sen, P.K.: Nonparametric Methods in Multivariate Analysis. Wiley, New Jersey (1971)MATH
43.
Zurück zum Zitat Rakotomalala, R., Morineau, A.: The TVpercent principle for the counter examples statistic. In: Spagnolo, F., Suzuki, E., Gras, R., Guillet, F. (eds.) Statistical Implicative Analysis, Studies in Computational Intelligence, pp. 449–462. Springer, New York (2008)CrossRef Rakotomalala, R., Morineau, A.: The TVpercent principle for the counter examples statistic. In: Spagnolo, F., Suzuki, E., Gras, R., Guillet, F. (eds.) Statistical Implicative Analysis, Studies in Computational Intelligence, pp. 449–462. Springer, New York (2008)CrossRef
44.
Zurück zum Zitat Rogers, D.J., Tanimoto, T.T.: A computer program for classifying plants. Science 132, 1115–1118 (1960)CrossRef Rogers, D.J., Tanimoto, T.T.: A computer program for classifying plants. Science 132, 1115–1118 (1960)CrossRef
45.
Zurück zum Zitat Russel, P.F., Rao, C.R.: On habitat and association of species of anopheline larvae in south-eastern madras. J. Malar. Inst. India T3, 153–178 (1940) Russel, P.F., Rao, C.R.: On habitat and association of species of anopheline larvae in south-eastern madras. J. Malar. Inst. India T3, 153–178 (1940)
46.
Zurück zum Zitat Smirnov, N.V.: Estimate of deviation between empirical distributrion functions in two independent samples (russian). Bulletin Moscow University, (2:2):3–16 (1939) Smirnov, N.V.: Estimate of deviation between empirical distributrion functions in two independent samples (russian). Bulletin Moscow University, (2:2):3–16 (1939)
47.
Zurück zum Zitat Sokal, R.R., Michener, C.: A statistical method for evaluating systematic relationships. Univ. Kans. Sci. Bull. 38, 1409–1438 (1958) Sokal, R.R., Michener, C.: A statistical method for evaluating systematic relationships. Univ. Kans. Sci. Bull. 38, 1409–1438 (1958)
48.
Zurück zum Zitat Sokal, R.R., Sneath, P.H.A.: Principles of Numerical Taxonomy. Freeman (1963) Sokal, R.R., Sneath, P.H.A.: Principles of Numerical Taxonomy. Freeman (1963)
49.
Zurück zum Zitat Tallur, B.: Contribution à l’analyse exploratoire de tableaux de contingence par la classification, Doctorat d’ État. Ph.D. thesis, Université de Rennes 1 (1988) Tallur, B.: Contribution à l’analyse exploratoire de tableaux de contingence par la classification, Doctorat d’ État. Ph.D. thesis, Université de Rennes 1 (1988)
50.
51.
Zurück zum Zitat Xiaobo, L., Dubes, R.C.: A probabilistic measure of similarity for binary data in pattern recognition. Pattern Recognit. 22, 397–409 (1989)CrossRef Xiaobo, L., Dubes, R.C.: A probabilistic measure of similarity for binary data in pattern recognition. Pattern Recognit. 22, 397–409 (1989)CrossRef
52.
Zurück zum Zitat Yule, G.U.: On measuring association between attributes. J. Royal Statist. Soc. 75, 579–642 (1912)CrossRef Yule, G.U.: On measuring association between attributes. J. Royal Statist. Soc. 75, 579–642 (1912)CrossRef
Metadaten
Titel
Comparing Attributes by Probabilistic and Statistical Association I
verfasst von
Israël César Lerman
Copyright-Jahr
2016
Verlag
Springer London
DOI
https://doi.org/10.1007/978-1-4471-6793-8_5