論文の概要: DMT-HI: MOE-based Hyperbolic Interpretable Deep Manifold Transformation for Unspervised Dimensionality Reduction
- arxiv url: http://arxiv.org/abs/2410.19504v1
- Date: Fri, 25 Oct 2024 12:11:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:37:34.973871
- Title: DMT-HI: MOE-based Hyperbolic Interpretable Deep Manifold Transformation for Unspervised Dimensionality Reduction
- Title(参考訳): DMT-HI:MOEに基づく非分割次元化のための双曲的解釈可能な深部マニフォールド変換
- Authors: Zelin Zang, Yuhao Wang, Jinlin Wu, Hong Liu, Yue Shen, Stan. Z Li, Zhen Lei,
- Abstract要約: データ工学や可視化など,さまざまな分野において,次元性低減(DR)が重要な役割を担っている。
DR精度と解釈可能性のバランスをとるという課題は、特に高次元データを扱うユーザにとって依然として重要である。
本研究は,MOEに基づくハイパーボリック・インタプリタブル・ディープ・マニフォールド変換(DMT-HI)を紹介する。
- 参考スコア(独自算出の注目度): 47.4136073281818
- License:
- Abstract: Dimensionality reduction (DR) plays a crucial role in various fields, including data engineering and visualization, by simplifying complex datasets while retaining essential information. However, the challenge of balancing DR accuracy and interpretability remains crucial, particularly for users dealing with high-dimensional data. Traditional DR methods often face a trade-off between precision and transparency, where optimizing for performance can lead to reduced interpretability, and vice versa. This limitation is especially prominent in real-world applications such as image, tabular, and text data analysis, where both accuracy and interpretability are critical. To address these challenges, this work introduces the MOE-based Hyperbolic Interpretable Deep Manifold Transformation (DMT-HI). The proposed approach combines hyperbolic embeddings, which effectively capture complex hierarchical structures, with Mixture of Experts (MOE) models, which dynamically allocate tasks based on input features. DMT-HI enhances DR accuracy by leveraging hyperbolic embeddings to represent the hierarchical nature of data, while also improving interpretability by explicitly linking input data, embedding outcomes, and key features through the MOE structure. Extensive experiments demonstrate that DMT-HI consistently achieves superior performance in both DR accuracy and model interpretability, making it a robust solution for complex data analysis. The code is available at \url{https://github.com/zangzelin/code_dmthi}.
- Abstract(参考訳): データ工学や可視化など、さまざまな分野において、複雑なデータセットを単純化し、重要な情報を保持しながら、次元性低減(DR)が重要な役割を果たす。
しかし、DR精度と解釈可能性のバランスをとるという課題は、特に高次元データを扱うユーザにとって依然として重要である。
従来のDR手法は、精度と透明性のトレードオフに直面し、パフォーマンスの最適化は解釈可能性の低下につながる。
この制限は、画像、表、テキストデータ分析のような現実世界のアプリケーションでは特に顕著であり、精度と解釈可能性の両方が重要である。
これらの課題に対処するため、この研究はMOEベースのHyperbolic Interpretable Deep Manifold Transformation (DMT-HI)を導入している。
提案手法は、複雑な階層構造を効果的に捉える双曲的埋め込みと、入力特徴に基づいてタスクを動的に割り当てるMixture of Experts(MOE)モデルを組み合わせる。
DMT-HIは、双曲埋め込みを利用してデータの階層性を表現するとともに、入力データ、埋め込み結果、重要な特徴をMOE構造を通じて明示的にリンクすることで解釈性を向上させることでDR精度を向上させる。
拡張実験により、DMT-HIはDR精度とモデル解釈性の両方において一貫して優れた性能を達成し、複雑なデータ解析のための堅牢な解であることが示された。
コードは \url{https://github.com/zangzelin/code_dmthi} で公開されている。
関連論文リスト
- Towards a Theoretical Understanding of Memorization in Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T13:17:06Z) - A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.51729152929413]
ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2024-08-05T23:20:32Z) - MDM: Advancing Multi-Domain Distribution Matching for Automatic Modulation Recognition Dataset Synthesis [35.07663680944459]
ディープラーニング技術は、AMR(Automatic Modulation Recognition)タスクにうまく導入されている。
ディープラーニングの成功はすべて、大規模なデータセットのトレーニングによるものだ。
大量のデータの問題を解決するため、一部の研究者はデータ蒸留法を提唱した。
論文 参考訳(メタデータ) (2024-08-05T14:16:54Z) - Discovering symbolic expressions with parallelized tree search [59.92040079807524]
記号回帰は、データから簡潔で解釈可能な数学的表現を発見する能力のおかげで、科学研究において重要な役割を果たす。
既存のアルゴリズムは、複雑性の問題に対処する際の精度と効率の重要なボトルネックに直面してきた。
本稿では,限定データから汎用数学的表現を効率的に抽出する並列木探索(PTS)モデルを提案する。
論文 参考訳(メタデータ) (2024-07-05T10:41:15Z) - Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文 参考訳(メタデータ) (2024-05-26T10:58:22Z) - Disentangled Representation Learning with Transmitted Information Bottleneck [57.22757813140418]
textbfDisTIB (textbfTransmitted textbfInformation textbfBottleneck for textbfDisd representation learning) は情報圧縮と保存のバランスを保った新しい目的である。
論文 参考訳(メタデータ) (2023-11-03T03:18:40Z) - Learning in latent spaces improves the predictive accuracy of deep
neural operators [0.0]
L-DeepONetは標準のDeepONetの拡張であり、高次元PDE入力の潜在表現と適切なオートエンコーダで識別される出力関数を利用する。
L-DeepONetは時間依存PDEの精度と計算効率の両面で標準手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-15T17:13:09Z) - DBT-DMAE: An Effective Multivariate Time Series Pre-Train Model under
Missing Data [16.589715330897906]
MTSはデータ不足に悩まされ、下流のタスクが劣化または崩壊する。
本稿では,MTSプレトレインモデルについて述べる。
-DMAE、上記の障害を克服する。
論文 参考訳(メタデータ) (2022-09-16T08:54:02Z) - Feature Learning for Dimensionality Reduction toward Maximal Extraction
of Hidden Patterns [25.558967594684056]
高次元データの視覚解析において,DRは重要な役割を担っている。
本稿では,非線形DRに最適化されたデータ投影セットを生成するための特徴学習フレームワークFEALMを提案する。
得られたDR結果の比較と各DR結果の解釈を支援するインタラクティブな可視化手法を開発した。
論文 参考訳(メタデータ) (2022-06-28T11:18:19Z) - Residual Dynamic Mode Decomposition: Robust and verified Koopmanism [0.0]
動的モード分解(DMD)は、より単純なコヒーレントな特徴の階層による複雑な動的プロセスを記述する。
本稿では,Residual Dynamic Mode Decomposition(ResDMD)を提案する。
ResDMDは一般的なクープマン作用素のスペクトルと擬似スペクトルを誤差制御で計算し、明示的な高階収束定理でスペクトル測度(連続スペクトルを含む)の滑らかな近似を計算する。
論文 参考訳(メタデータ) (2022-05-19T18:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。