論文の概要: Consistency-Aware Padding for Incomplete Multi-Modal Alignment Clustering Based on Self-Repellent Greedy Anchor Search
- arxiv url: http://arxiv.org/abs/2507.03917v1
- Date: Sat, 05 Jul 2025 06:43:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.93564
- Title: Consistency-Aware Padding for Incomplete Multi-Modal Alignment Clustering Based on Self-Repellent Greedy Anchor Search
- Title(参考訳): 自己反発型グリーディアンカー探索に基づく不完全多モードアライメントクラスタリングのための一貫性を考慮したパディング
- Authors: Shubin Ma, Liang Zhao, Mingdong Lu, Yifan Guo, Bo Xu,
- Abstract要約: マルチモーダル表現は、実世界のデータサンプルの特徴を記述するのに忠実であり、非常に効果的である。
既存の研究は、マルチビューデータが不均衡かつ不整合であるシナリオにおいて、欠落したデータを埋めることの問題を効果的に解決していない。
自己反発型グリーディアンカーサーチに基づく不完全なマルチモーダルアライメントクラスタリングのための一貫性パディングを提案する。
- 参考スコア(独自算出の注目度): 8.500604038628648
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal representation is faithful and highly effective in describing real-world data samples' characteristics by describing their complementary information. However, the collected data often exhibits incomplete and misaligned characteristics due to factors such as inconsistent sensor frequencies and device malfunctions. Existing research has not effectively addressed the issue of filling missing data in scenarios where multiview data are both imbalanced and misaligned. Instead, it relies on class-level alignment of the available data. Thus, it results in some data samples not being well-matched, thereby affecting the quality of data fusion. In this paper, we propose the Consistency-Aware Padding for Incomplete Multimodal Alignment Clustering Based on Self-Repellent Greedy Anchor Search(CAPIMAC) to tackle the problem of filling imbalanced and misaligned data in multimodal datasets. Specifically, we propose a self-repellent greedy anchor search module(SRGASM), which employs a self-repellent random walk combined with a greedy algorithm to identify anchor points for re-representing incomplete and misaligned multimodal data. Subsequently, based on noise-contrastive learning, we design a consistency-aware padding module (CAPM) to effectively interpolate and align imbalanced and misaligned data, thereby improving the quality of multimodal data fusion. Experimental results demonstrate the superiority of our method over benchmark datasets. The code will be publicly released at https://github.com/Autism-mm/CAPIMAC.git.
- Abstract(参考訳): マルチモーダル表現は実世界のデータサンプルの特徴を記述する上で忠実であり、その相補的な情報を記述することによって非常に効果的である。
しかし,センサ周波数や装置の故障などの要因により,収集したデータは不完全で不整合な特性を示すことが多い。
既存の研究は、マルチビューデータが不均衡かつ不整合であるシナリオにおいて、欠落したデータを埋めることの問題を効果的に解決していない。
代わりに、利用可能なデータのクラスレベルのアライメントに依存します。
したがって、いくつかのデータサンプルは十分に整合していないため、データ融合の品質に影響を及ぼす。
本稿では,不均衡データや不整合データをマルチモーダルデータセットに埋め込む問題に対処するために,自己反発型グレディアンカーサーチ(CAPIMAC)に基づく不完全マルチモーダルアライメントクラスタリングのための一貫性パディングを提案する。
具体的には,不完全かつ不整合なマルチモーダルデータを再表現するためのアンカーポイントを特定するために,自己反発型アンカーサーチモジュール(SRGASM)を提案する。
その後、ノイズコントラスト学習に基づき、不均衡データと不整合データを効果的に補間・整合させる整合性対応パディングモジュール(CAPM)を設計し、マルチモーダルデータ融合の品質を向上させる。
実験により,本手法がベンチマークデータセットよりも優れていることが示された。
コードはhttps://github.com/Autism-mm/CAPIMAC.gitで公開される。
関連論文リスト
- PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [76.95536611263356]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - PATH: A Discrete-sequence Dataset for Evaluating Online Unsupervised Anomaly Detection Approaches for Multivariate Time Series [0.01874930567916036]
多変量時系列に対する異常検出手法のベンチマークは、高品質なデータセットが不足しているため、難しい課題である。
我々は、最先端のシミュレーションツールによって生成される多種多様な、広範囲で、非自明なデータセットという解決策を提案する。
我々のデータセットは離散列問題を表しており、文献でこれまで提案されていた解には未適応のままである。
論文 参考訳(メタデータ) (2024-11-21T09:03:12Z) - TabDiff: a Mixed-type Diffusion Model for Tabular Data Generation [91.50296404732902]
グラフデータの混合型分布を1つのモデルでモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文 参考訳(メタデータ) (2024-10-27T22:58:47Z) - Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios [23.43319138048058]
実践シナリオにおけるマルチモーダル感情認識(MER)は、欠落したデータや不完全なデータの存在によって著しく困難である。
従来の手法では、データを捨てたり、データセグメントをゼロベクトルで置換することで、これらの不完全性を近似することが多い。
本稿では,雑音データから頑健なマルチモーダル関節表現を効果的に学習する新しいノイズローバストMERモデルを提案する。
論文 参考訳(メタデータ) (2023-09-21T10:49:02Z) - Scalable Incomplete Multi-View Clustering with Structure Alignment [71.62781659121092]
本稿では,新しいアンカーグラフ学習フレームワークを提案する。
ビュー固有のアンカーグラフを構築し、異なるビューから補完情報をキャプチャする。
提案したSIMVC-SAの時間と空間の複雑さはサンプル数と線形に相関していることが証明された。
論文 参考訳(メタデータ) (2023-08-31T08:30:26Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Semantic Invariant Multi-view Clustering with Fully Incomplete
Information [28.321343045226772]
不完全な情報を持つマルチビュークラスタリングのためのセマンティック不変性学習(SMILE)という新しいフレームワークを提案する。
具体的には、異なるビューにまたがる不変なセマンティックな分布が存在することを発見し、SMILEはビュー間の不一致を緩和する。
我々の手法は、NoisyMNISTのクラスタリング精度を19.3%/23.2%から82.7%/69.0%に改善する。
論文 参考訳(メタデータ) (2023-05-22T06:11:01Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。