論文の概要: Cohort-Based Active Modality Acquisition
- arxiv url: http://arxiv.org/abs/2505.16791v1
- Date: Thu, 22 May 2025 15:32:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.40163
- Title: Cohort-Based Active Modality Acquisition
- Title(参考訳): コホートに基づくアクティブモダリティ獲得
- Authors: Tillmann Rheude, Roland Eils, Benjamin Wild,
- Abstract要約: 本稿では,コホートに基づくアクティブモダリティ獲得 (CAMA) を導入し,追加のモダリティを受けるサンプルを選択する際の課題を定式化する。
生成的計算と識別的モデリングを組み合わせた獲得戦略を導出する。
共用マルチモーダルデータセットの実験により,提案手法が新たなサンプルの獲得をより効果的に導くことを示す。
- 参考スコア(独自算出の注目度): 0.27271717351505986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world machine learning applications often involve data from multiple modalities that must be integrated effectively to make robust predictions. However, in many practical settings, not all modalities are available for every sample, and acquiring additional modalities can be costly. This raises the question: which samples should be prioritized for additional modality acquisition when resources are limited? While prior work has explored individual-level acquisition strategies and training-time active learning paradigms, test-time and cohort-based acquisition remain underexplored despite their importance in many real-world settings. We introduce Cohort-based Active Modality Acquisition (CAMA), a novel test-time setting to formalize the challenge of selecting which samples should receive additional modalities. We derive acquisition strategies that leverage a combination of generative imputation and discriminative modeling to estimate the expected benefit of acquiring missing modalities based on common evaluation metrics. We also introduce upper-bound heuristics that provide performance ceilings to benchmark acquisition strategies. Experiments on common multimodal datasets demonstrate that our proposed imputation-based strategies can more effectively guide the acquisition of new samples in comparison to those relying solely on unimodal information, entropy guidance, and random selections. Our work provides an effective solution for optimizing modality acquisition at the cohort level, enabling better utilization of resources in constrained settings.
- Abstract(参考訳): 実世界の機械学習アプリケーションは、堅牢な予測を行うために効果的に統合する必要がある複数のモダリティからのデータを含むことが多い。
しかし、多くの実践的な環境では、すべてのモダリティが全てのサンプルで利用できるわけではなく、追加のモダリティを取得するのにコストがかかる。
リソースが制限された場合、追加のモダリティ取得のために、どのサンプルを優先順位付けすべきなのか?
これまでの研究では、個々のレベルの獲得戦略とトレーニングタイムのアクティブラーニングパラダイムを探求してきたが、テストタイムとコホートベースの買収は、現実の多くの設定において重要であるにもかかわらず、まだ探索が進んでいない。
本稿では,コホートをベースとしたアクティブモダリティ獲得(CAMA)について紹介する。
我々は、生成的計算と識別的モデリングの組み合わせを活用して、共通の評価基準に基づいて、欠落したモダリティを取得する利点を推定する獲得戦略を導出する。
また、ベンチマーク取得戦略に性能天井を提供する上界ヒューリスティックスも導入する。
共用マルチモーダルデータセットを用いた実験により,提案手法は,単調な情報,エントロピーガイダンス,ランダム選択のみに依存するものよりも,新しいサンプルの取得を効果的に導くことができることが示された。
我々の研究は、コホートレベルでのモダリティ獲得を最適化するための効果的なソリューションを提供し、制約された設定におけるリソースのより良い利用を可能にする。
関連論文リスト
- Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute [54.22256089592864]
本稿では,テスト時間計算のスケールアップによるLCM性能向上のための,シンプルで効果的で費用効率のよい手法を提案する。
当社の戦略は,複数のモデルを組み込んで,補完的な強みを活用するという,新たなツイストによって,繰り返しサンプリングされる投票フレームワークを基盤としています。
論文 参考訳(メタデータ) (2025-04-01T13:13:43Z) - Towards Modality Generalization: A Benchmark and Prospective Analysis [56.84045461854789]
本稿では,モダリティ・ジェネリゼーション(MG)について述べる。
マルチモーダルアルゴリズムを特徴とする包括的ベンチマークを提案し,一般化に着目した既存手法を適用した。
私たちの研究は、堅牢で適応可能なマルチモーダルモデルを進化させる基盤を提供し、現実的なシナリオで目に見えないモダリティを扱えるようにします。
論文 参考訳(メタデータ) (2024-12-24T08:38:35Z) - Model-Free Active Exploration in Reinforcement Learning [53.786439742572995]
強化学習における探索問題について検討し,新しいモデルフリーソリューションを提案する。
我々の戦略は、最先端の探査アプローチよりも高速に効率的な政策を特定できる。
論文 参考訳(メタデータ) (2024-06-30T19:00:49Z) - Diversified Batch Selection for Training Acceleration [68.67164304377732]
オンラインバッチ選択として知られる一般的な研究ラインでは、トレーニングプロセス中の情報サブセットの選択について検討している。
バニラ参照モデルフリーメソッドは、独立してデータをサンプリング的にスコア付けし、選択する。
DivBS(Diversified Batch Selection)を提案する。
論文 参考訳(メタデータ) (2024-06-07T12:12:20Z) - Borrowing Treasures from Neighbors: In-Context Learning for Multimodal Learning with Missing Modalities and Data Scarcity [9.811378971225727]
本稿では、欠落したモダリティに関する現在の研究を低データ体制に拡張する。
フルモダリティデータと十分なアノテートされたトレーニングサンプルを取得することは、しばしばコストがかかる。
本稿では,この2つの重要な問題に対処するために,検索強化したテキスト内学習を提案する。
論文 参考訳(メタデータ) (2024-03-14T14:19:48Z) - Towards Balanced Active Learning for Multimodal Classification [15.338417969382212]
マルチモーダルネットワークのトレーニングには、ユニモーダルネットワークと比較してパラメータ空間が大きいため、膨大な量のデータが必要である。
アクティブラーニングは、モデルの性能向上に寄与するサンプルのみを選択することで、データアノテーションコストを削減するために広く使われているテクニックである。
現在のアクティブラーニング戦略は、主に一助的なタスクのために設計されており、マルチモーダルデータに適用すると、支配的なモダリティからのサンプル選択にバイアスがかかることがしばしばある。
論文 参考訳(メタデータ) (2023-06-14T07:23:36Z) - Single-Modal Entropy based Active Learning for Visual Question Answering [75.1682163844354]
視覚質問応答(VQA)のマルチモーダル設定におけるアクティブラーニングに対処する
マルチモーダルな入力,画像,質問を考慮し,有効サンプル取得のための新しい手法を提案する。
私たちの新しいアイデアは、実装が簡単で、コスト効率が高く、他のマルチモーダルタスクにも容易に適応できます。
論文 参考訳(メタデータ) (2021-10-21T05:38:45Z) - Optimal Ensemble Construction for Multi-Study Prediction with
Applications to COVID-19 Excess Mortality Estimation [7.02598981483736]
マルチスタディ・アンサンブルは、研究固有のモデルに適合し、アンサンブル重みを別々に推定する2段階戦略を用いる。
このアプローチは、モデル適合段階でのアンサンブル特性を無視し、効率を損なう可能性がある。
パンデミックの開始前にはほとんどデータが入手できない場合、他の国のデータを活用することで、予測精度が大幅に向上することを示した。
論文 参考訳(メタデータ) (2021-09-19T16:52:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。