論文の概要: Personalized Coupled Tensor Decomposition for Multimodal Data Fusion: Uniqueness and Algorithms
- arxiv url: http://arxiv.org/abs/2412.01102v2
- Date: Thu, 12 Dec 2024 13:08:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 17:00:43.906672
- Title: Personalized Coupled Tensor Decomposition for Multimodal Data Fusion: Uniqueness and Algorithms
- Title(参考訳): 多モードデータ融合のためのパーソナライズされた結合テンソル分解:特異性とアルゴリズム
- Authors: Ricardo Augusto Borsoi, Konstantin Usevich, David Brie, Tülay Adali,
- Abstract要約: データ融合の課題に対処するパーソナライズされたCTDフレームワークを提案する。
各データセットを2つのコンポーネントの和として表現するフレキシブルモデルが提案されている。
共通成分と異なる成分を計算するための2つのアルゴリズムが提案されている。
- 参考スコア(独自算出の注目度): 15.520496676392955
- License:
- Abstract: Coupled tensor decompositions (CTDs) perform data fusion by linking factors from different datasets. Although many CTDs have been already proposed, current works do not address important challenges of data fusion, where: 1) the datasets are often heterogeneous, constituting different "views" of a given phenomena (multimodality); and 2) each dataset can contain personalized or dataset-specific information, constituting distinct factors that are not coupled with other datasets. In this work, we introduce a personalized CTD framework tackling these challenges. A flexible model is proposed where each dataset is represented as the sum of two components, one related to a common tensor through a multilinear measurement model, and another specific to each dataset. Both the common and distinct components are assumed to admit a polyadic decomposition. This generalizes several existing CTD models. We provide conditions for specific and generic uniqueness of the decomposition that are easy to interpret. These conditions employ uni-mode uniqueness of different individual datasets and properties of the measurement model. Two algorithms are proposed to compute the common and distinct components: a semi-algebraic one and a coordinate-descent optimization method. Experimental results illustrate the advantage of the proposed framework compared with the state of the art approaches.
- Abstract(参考訳): 結合テンソル分解(CTD)は、異なるデータセットから因子をリンクすることでデータ融合を行う。
既に多くのCTDが提案されているが、現在の研究はデータ融合の重要な課題に対処していない。
1)データセットは、しばしば異質であり、与えられた現象(多重性)の異なる「ビュー」を構成する。
2) 各データセットにはパーソナライズされた、あるいはデータセット固有の情報が含まれ、他のデータセットと結合されていない異なる要因を構成する。
本研究では,これらの課題に対処するパーソナライズされたCTDフレームワークを提案する。
フレキシブルなモデルとして、各データセットを2つのコンポーネントの和として表現する。
共通成分と特異成分の両方がポリアディック分解を持つと仮定される。
これは既存のCTDモデルを一般化する。
我々は、解釈し易い分解の特異かつ汎用的な一意性に関する条件を提供する。
これらの条件は、異なる個々のデータセットの一様一様性と測定モデルの特性を用いる。
半代数的手法と座標偏光最適化法という2つのアルゴリズムを用いて,共通成分と独立成分の計算を行う。
実験により,提案手法の利点を最先端の手法と比較した。
関連論文リスト
- A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.51729152929413]
ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2024-08-05T23:20:32Z) - Entropic Optimal Transport Eigenmaps for Nonlinear Alignment and Joint Embedding of High-Dimensional Datasets [11.105392318582677]
本稿では,理論的保証付きデータセットの整列と共同埋め込みの原理的アプローチを提案する。
提案手法は,2つのデータセット間のEOT計画行列の先頭特異ベクトルを利用して,それらの共通基盤構造を抽出する。
EOT計画では,高次元状態において,潜伏変数の位置で評価されたカーネル関数を近似することにより,共有多様体構造を復元する。
論文 参考訳(メタデータ) (2024-07-01T18:48:55Z) - ComboStoc: Combinatorial Stochasticity for Diffusion Generative Models [65.82630283336051]
拡散生成モデルの既存のトレーニングスキームにより,次元と属性の組み合わせによって区切られた空間が十分に標本化されていないことを示す。
構造を完全に活用するプロセスを構築し,ComboStocという名前でこの問題に対処する。
論文 参考訳(メタデータ) (2024-05-22T15:23:10Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Personalized PCA: Decoupling Shared and Unique Features [4.976703689624386]
異種データセットから共有特徴とユニークな特徴を分離するパーソナライズされたPCA(PerPCA)を提案する。
穏やかな条件下では、一意的特徴と共有的特徴の両方を制約付き最適化問題によって識別し、復元できることが示される。
異種データセットから共有とユニークな機能を分離するための体系的なアプローチとして、PerPCAは、ビデオセグメンテーション、トピック抽出、フィーチャークラスタリングなど、いくつかのタスクにおけるアプリケーションを見つける。
論文 参考訳(メタデータ) (2022-07-17T00:09:47Z) - AVIDA: Alternating method for Visualizing and Integrating Data [1.6637373649145604]
AVIDAはデータアライメントと次元削減を同時に行うためのフレームワークである。
AVIDAは特徴のない高次元データセットを正しく整列することを示す。
一般の応用では、アライメントおよび次元減少加群に他の方法を用いることができる。
論文 参考訳(メタデータ) (2022-05-31T22:36:10Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - sJIVE: Supervised Joint and Individual Variation Explained [0.0]
同一対象データに対する複数ビューであるマルチソースデータの解析は, 生物医学研究においてますます一般的になっている。
本研究では,共有構造(共同)とソース固有構造(個別構造)を同時に識別する手法であるsjive(supervised joint and individual variation explained)を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:54:45Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。