汎用連想計算エンジン(GETA)

汎用連想計算エンジン(GETA: Generic Engine for Transposable Association)は、文書検索における頻度付き索引データ(どの文書に どの単語が何回出現するというような)を典型とする大規模かつ疎な行列 を対象として、行と行あるいは列と列(具体的には文書間および単語間) の類似度を内積型メジャーで高速計算するツールです。 連想検索をはじめ、文書分類、単語間類似度計算など、大規模文書 の分析に必要な要素技術をサポートすることを目的としています。

関連