論文の概要: Factor Analysis with Correlated Topic Model for Multi-Modal Data
- arxiv url: http://arxiv.org/abs/2504.18914v1
- Date: Sat, 26 Apr 2025 13:02:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.0439
- Title: Factor Analysis with Correlated Topic Model for Multi-Modal Data
- Title(参考訳): マルチモーダルデータに対する関連トピックモデルによる要因分析
- Authors: Małgorzata Łazęcka, Ewa Szczurek,
- Abstract要約: マルチモーダル因子分析(FA)は、単純なデータモダリティに基づく変動の共有軸を明らかにする。
FAは、テキストや単一セルシークエンシングデータのような構造化データモダリティには適していない。
本稿では,FAと相関するトピックモデリングを組み合わせた新しい多視点・多構造ベイズモデルであるFACTMを紹介し,変分推論を用いて最適化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Integrating various data modalities brings valuable insights into underlying phenomena. Multimodal factor analysis (FA) uncovers shared axes of variation underlying different simple data modalities, where each sample is represented by a vector of features. However, FA is not suited for structured data modalities, such as text or single cell sequencing data, where multiple data points are measured per each sample and exhibit a clustering structure. To overcome this challenge, we introduce FACTM, a novel, multi-view and multi-structure Bayesian model that combines FA with correlated topic modeling and is optimized using variational inference. Additionally, we introduce a method for rotating latent factors to enhance interpretability with respect to binary features. On text and video benchmarks as well as real-world music and COVID-19 datasets, we demonstrate that FACTM outperforms other methods in identifying clusters in structured data, and integrating them with simple modalities via the inference of shared, interpretable factors.
- Abstract(参考訳): 様々なデータモダリティを統合することは、基礎となる現象に関する貴重な洞察をもたらす。
マルチモーダル因子分析 (FA) は、各サンプルが特徴のベクトルで表されるような、異なる単純なデータモダリティに基づく変動の共有軸を明らかにする。
しかし、FAはテキストや単一セルシークエンシングデータのような構造化データモダリティには適していない。
この課題を克服するために、FAと関連するトピックモデリングを組み合わせた新しいマルチビュー・マルチ構造ベイズモデルであるFACTMを導入し、変動推論を用いて最適化する。
さらに,二元的特徴に対する解釈性を高めるために,潜在因子を回転させる手法を提案する。
テキストやビデオのベンチマークや、実世界の音楽や新型コロナウイルスのデータセットでは、FACTMは構造化データ内のクラスタを識別する他の方法よりも優れており、共有された解釈可能な要素の推論を通じて単純なモダリティと統合されていることを実証しています。
関連論文リスト
- Personalized Coupled Tensor Decomposition for Multimodal Data Fusion: Uniqueness and Algorithms [15.520496676392955]
データ融合の課題に対処するパーソナライズされたCTDフレームワークを提案する。
各データセットを2つのコンポーネントの和として表現するフレキシブルモデルが提案されている。
共通成分と異なる成分を計算するための2つのアルゴリズムが提案されている。
論文 参考訳(メタデータ) (2024-12-02T04:19:47Z) - A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.51729152929413]
ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2024-08-05T23:20:32Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - Flexible inference in heterogeneous and attributed multilayer networks [21.349513661012498]
我々は任意の種類の情報を持つ多層ネットワークで推論を行う確率的生成モデルを開発した。
インド農村部における社会支援ネットワークにおける様々なパターンを明らかにする能力を示す。
論文 参考訳(メタデータ) (2024-05-31T15:21:59Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Quantifying & Modeling Multimodal Interactions: An Information
Decomposition Framework [89.8609061423685]
本稿では,入力モーダル性と出力タスクを関連付けた冗長性,特異性,シナジーの度合いを定量化する情報理論手法を提案する。
PID推定を検証するために、PIDが知られている合成データセットと大規模マルチモーダルベンチマークの両方で広範な実験を行う。
本研究では,(1)マルチモーダルデータセット内の相互作用の定量化,(2)マルチモーダルモデルで捉えた相互作用の定量化,(3)モデル選択の原理的アプローチ,(4)実世界のケーススタディの3つにその有用性を示す。
論文 参考訳(メタデータ) (2023-02-23T18:59:05Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Encoding Domain Knowledge in Multi-view Latent Variable Models: A
Bayesian Approach with Structured Sparsity [7.811916700683125]
MuVI はドメインインフォームド・マルチビュー潜在変数モデルのための新しいアプローチである。
私たちのモデルは、機能セットの形でノイズの多いドメインの専門知識を統合することができることを実証しています。
論文 参考訳(メタデータ) (2022-04-13T08:22:31Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Learning Inter- and Intra-manifolds for Matrix Factorization-based
Multi-Aspect Data Clustering [3.756550107432323]
近年,マルチビューやマルチタイプリレーショナルデータなど,複数の側面を持つデータのクラスタリングが普及している。
我々は,データクラスタリングのための多種多様な多様体を学習するために,異なるデータ型(またはビュー)のデータポイントの距離情報を利用するNMFフレームワークに多様体を組み込むことを提案する。
いくつかのデータセットの結果から,提案手法は精度と効率の両面において,最先端のマルチアスペクトデータクラスタリング手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-09-07T02:21:08Z) - Group Heterogeneity Assessment for Multilevel Models [68.95633278540274]
多くのデータセットは固有のマルチレベル構造を含む。
この構造を考慮に入れることは、そのようなデータ上で行われた統計分析の正確性と校正にとって重要である。
本稿では,データ内のグループ化変数のレベルの違いを効率的に評価するフレキシブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-06T12:42:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。