論文の概要: eTREE: Learning Tree-structured Embeddings
- arxiv url: http://arxiv.org/abs/2012.10853v1
- Date: Sun, 20 Dec 2020 06:06:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 04:47:17.581627
- Title: eTREE: Learning Tree-structured Embeddings
- Title(参考訳): eTREE: ツリー構造化の埋め込みを学ぶ
- Authors: Faisal M. Almutairi, Yunlong Wang, Dong Wang, Emily Zhao, Nicholas D.
Sidiropoulos
- Abstract要約: マトリックスファクタリゼーション(MF)は、幅広い機械学習およびデータマイニングモデルにおいて重要な役割を果たしています。
mfはアイテムの埋め込みや特徴表現を得るためによく使われる。
組込みの品質を高めるために木構造を取り入れたモデル「eTREE」を提案します。
- 参考スコア(独自算出の注目度): 33.61635854505735
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Matrix factorization (MF) plays an important role in a wide range of machine
learning and data mining models. MF is commonly used to obtain item embeddings
and feature representations due to its ability to capture correlations and
higher-order statistical dependencies across dimensions. In many applications,
the categories of items exhibit a hierarchical tree structure. For instance,
human diseases can be divided into coarse categories, e.g., bacterial, and
viral. These categories can be further divided into finer categories, e.g.,
viral infections can be respiratory, gastrointestinal, and exanthematous viral
diseases. In e-commerce, products, movies, books, etc., are grouped into
hierarchical categories, e.g., clothing items are divided by gender, then by
type (formal, casual, etc.). While the tree structure and the categories of the
different items may be known in some applications, they have to be learned
together with the embeddings in many others. In this work, we propose eTREE, a
model that incorporates the (usually ignored) tree structure to enhance the
quality of the embeddings. We leverage the special uniqueness properties of
Nonnegative MF (NMF) to prove identifiability of eTREE. The proposed model not
only exploits the tree structure prior, but also learns the hierarchical
clustering in an unsupervised data-driven fashion. We derive an efficient
algorithmic solution and a scalable implementation of eTREE that exploits
parallel computing, computation caching, and warm start strategies. We showcase
the effectiveness of eTREE on real data from various application domains:
healthcare, recommender systems, and education. We also demonstrate the
meaningfulness of the tree obtained from eTREE by means of domain experts
interpretation.
- Abstract(参考訳): マトリックス分解(MF)は、幅広い機械学習とデータマイニングモデルにおいて重要な役割を果たす。
MFは、アイテムの埋め込みや特徴表現を得るのによく使われており、相関や次元間の高次統計的依存関係を捉えることができる。
多くのアプリケーションでは、アイテムのカテゴリは階層的なツリー構造を示す。
例えば、ヒトの疾患は、細菌やウイルスのような粗い分類に分類することができる。
これらの分類はさらに細分化され、例えば、ウイルス感染は呼吸器、消化器、および外来性ウイルス病である。
電子商取引では、商品、映画、書籍等を分類し、例えば、衣料品を性別別に分類し、型別(形式、カジュアル等)する。
ツリー構造と異なるアイテムのカテゴリは、いくつかのアプリケーションで知られているかもしれないが、それらは他の多くの組み込みとともに学ばなければならない。
本研究では,埋め込みの質を高めるために(通常無視される)木構造を組み込んだモデルであるetreeを提案する。
非負のMF(NMF)の特殊特異性を利用して、eTREEの識別可能性を証明する。
提案モデルは,木構造を事前に活用するだけでなく,教師なしのデータ駆動方式で階層クラスタリングを学習する。
我々は、並列コンピューティング、計算キャッシング、ウォームスタート戦略を利用する効率的なアルゴリズムソリューションとスケーラブルなetreeの実装を導出する。
医療,レコメンダシステム,教育など,さまざまなアプリケーション領域の実際のデータに対するeTREEの有効性を示す。
また, etree から得られた木は, ドメインエキスパートによる解釈によって有意性を示す。
関連論文リスト
- Beyond TreeSHAP: Efficient Computation of Any-Order Shapley Interactions
for Tree Ensembles [6.664930499708017]
シェープリー値(Shapley value, SV)は、予測の付加的特徴属性を定量化するための説明可能な人工知能(XAI)研究における概念である。
TreeSHAP-IQは木モデル予測のための任意の順序加法シャプリー相互作用を効率的に計算する手法である。
論文 参考訳(メタデータ) (2024-01-22T16:08:41Z) - Effective and Efficient Federated Tree Learning on Hybrid Data [80.31870543351918]
本稿では,ハイブリッドデータ上でのフェデレーションツリー学習を可能にする,新しいフェデレーション学習手法であるHybridTreeを提案する。
木に一貫した分割ルールが存在することを観察し、木の下層にパーティの知識を組み込むことができることを示す。
実験により,HybridTreeは計算および通信のオーバーヘッドが低い集中的な設定に匹敵する精度を達成できることを示した。
論文 参考訳(メタデータ) (2023-10-18T10:28:29Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Flexible Modeling and Multitask Learning using Differentiable Tree
Ensembles [6.037383467521294]
本稿では、任意の損失関数、欠落応答、マルチタスク学習をサポートするために、ツリーアンサンブルを学習するための柔軟なフレームワークを提案する。
我々のフレームワークは、一階述語法で訓練できる、微分可能なツリーアンサンブルの上に構築されている。
我々のフレームワークは、一般的なツールキットよりも100倍コンパクトで、表現力に富んだツリーアンサンブルを23%も得ることを示す。
論文 参考訳(メタデータ) (2022-05-19T17:30:49Z) - Learning Latent and Hierarchical Structures in Cognitive Diagnosis
Models [3.4646560112467037]
認知診断モデル(cdms)の重要な構成要素は、アイテムと潜在属性の間の依存構造を特徴づけるバイナリ$q$-matrixである。
本稿では,観測データからCDMの潜在構造と階層構造を共同学習する問題を検討する。
効率的な期待最大化アルゴリズムと潜在構造回復アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-04-05T20:33:02Z) - Exemplars can Reciprocate Principal Components [0.0]
Category Treesは、カテゴリタイプに分岐して機能しないツリー構造を生成するクラスタリングメソッドである。
この理論はポルトガル森林火災データセットをケーススタディとして用いたものである。
論文 参考訳(メタデータ) (2021-03-22T12:46:29Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - Hierarchical Graph Capsule Network [78.4325268572233]
ノード埋め込みを共同で学習し,グラフ階層を抽出できる階層型グラフカプセルネットワーク(HGCN)を提案する。
階層的表現を学ぶために、HGCNは下層カプセル(部分)と高層カプセル(全体)の間の部分的関係を特徴付ける。
論文 参考訳(メタデータ) (2020-12-16T04:13:26Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。