Skip to main content
main-content

Tipp

Weitere Artikel dieser Ausgabe durch Wischen aufrufen

01.12.2019 | Original Article | Ausgabe 1/2019

Network Modeling Analysis in Health Informatics and Bioinformatics 1/2019

Melanoma risk modeling from limited positive samples

Zeitschrift:
Network Modeling Analysis in Health Informatics and Bioinformatics > Ausgabe 1/2019
Autoren:
Aaron N. Richter, Taghi M. Khoshgoftaar
Wichtige Hinweise

Publisher's Note

Springer Nature remains neutral with regard to jurisdictional claims in published maps and institutional affiliations.

Abstract

The key to effective cancer treatment is early detection. Risk models built from routinely collected clinical data have the opportunity to improve early detection by identifying high-risk patients. In this study, we explored various machine learning techniques for building a melanoma skin cancer risk model. The dataset contains records of routine dermatology office visits from 9,531,408 patients spread throughout the United States. Of these patients, 17,246 (0.18%) developed melanoma. We conducted extensive experiments to effectively learn from this dataset with limited positive samples. We derived datasets with more severe class imbalance and tested several classifiers with different data sampling techniques to build the best possible model. Additionally, we explored various properties of the datasets to determine relationships between class distributions and model performance. We found that randomly removing negative cases from the training datasets significantly improved model performance. K-means clustering of different groups of instances shows that there is greater homogeneity in negative samples, and the model results reflect that removing these samples increases overall model performance. This experiment provides a reference framework for future risk models, since most datasets will have a plethora of healthy patients, but only a few key patients that are at high risk for developing a disease.

Bitte loggen Sie sich ein, um Zugang zu diesem Inhalt zu erhalten

Sie möchten Zugang zu diesem Inhalt erhalten? Dann informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 69.000 Bücher
  • über 500 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Umwelt
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe

Testen Sie jetzt 30 Tage kostenlos.

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 50.000 Bücher
  • über 380 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Umwelt
  • Maschinenbau + Werkstoffe​​​​​​​




Testen Sie jetzt 30 Tage kostenlos.

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 58.000 Bücher
  • über 300 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb




Testen Sie jetzt 30 Tage kostenlos.

Literatur
Über diesen Artikel

Weitere Artikel der Ausgabe 1/2019

Network Modeling Analysis in Health Informatics and Bioinformatics 1/2019 Zur Ausgabe

Premium Partner

    Bildnachweise