Skip to main content

2015 | OriginalPaper | Buchkapitel

Towards Order-Preserving SubMatrix Search and Indexing

verfasst von : Tao Jiang, Zhanhuai Li, Qun Chen, Kaiwen Li, Zhong Wang, Wei Pan

Erschienen in: Database Systems for Advanced Applications

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Order-Preserving SubMatrix

(OPSM) has been proved to be important in modelling biologically meaningful subspace cluster, capturing the general tendency of gene expressions across a subset of conditions. Given an OPSM query based on row or column keywords, it is desirable to retrieve OPSMs quickly from a large gene expression dataset or OPSM data via

indices

. However, the time of OPSM mining from gene expression dataset is long and the volume of OPSM data is huge. In this paper, we investigate the issues of indexing two datasets above and first present a naive solution

pfTree

by applying

p

re

f

ix-

Tree

. Due to it is not efficient to search the tree, we give an optimization indexing method

pIndex

. Different from

pfTree

,

pIndex

employs row and column header tables to traverse related branches in a

bottom-up

manner. Further, two pruning rules based on

number

and

order

of keywords are introduced. To reduce the number of column keyword candidates on fuzzy queries, we introduce a

F

irst

I

tem of keywords ro

T

ation method

FIT

, which reduces it from

$$n!$$

to

$$n$$

. We conduct extensive experiments with real datasets on a single machine, Hadoop and Hama, and the experimental results show the efficiency and scalability of the proposed techniques.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Metadaten
Titel
Towards Order-Preserving SubMatrix Search and Indexing
verfasst von
Tao Jiang
Zhanhuai Li
Qun Chen
Kaiwen Li
Zhong Wang
Wei Pan
Copyright-Jahr
2015
DOI
https://doi.org/10.1007/978-3-319-18123-3_19