知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
原著論文
許容範囲付きデータに対するハードクラスタリング
濱砂 幸裕遠藤 靖典宮本 定明長谷川 康
著者情報
ジャーナル フリー

2008 年 20 巻 3 号 p. 388-398

詳細
抄録

本稿では,データに伴う不確実性を,許容範囲という新たな概念を導入して,定式化した上で,許容範囲を持つデータに対する2つの新たなクラスタリングアルゴリズムを,代表的なクラスタリング手法であるハード c-平均法(HCM)と学習ベクトル量子化によるクラスタリング手法(LVQC)それぞれをもとにして構築する.許容範囲とは,データが持つ誤差・幅・属性の欠損などを包含したデータに伴う不確実性を表す概念である.従来のクラスタリング手法では,その対象がパターン空間上にマッピングされた点であるが,データがある種の不確実性を含む場合,データは点ではなく,集合として表される.既に提案されている手法では,集合間の類似度や非類似度は最短距離や最長距離などの測度を用いて定義される.しかし,それら別の測度を導入するよりは,それらを導入せずに同一の測度を用いて議論を展開するほうが自然であるし,論理的にも簡潔となる.そこで,不確実性を持つデータを最適化の枠組で扱うための新たな方法として,超直方体で定義された許容範囲を提案し,新たなアルゴリズムの構築を行う.また,提案手法による,いくつかの数値例を示し,その有効性を示す.

著者関連情報
© 2008 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top