論文の概要: In-Context Multiple Instance Learning
- arxiv url: http://arxiv.org/abs/2606.06458v1
- Date: Thu, 04 Jun 2026 17:50:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:45.01207
- Title: In-Context Multiple Instance Learning
- Title(参考訳): In-Context Multiple Instance Learning
- Authors: Alexander Möllers, Marvin Sextro, Julius Hense, Gabriel Dernbach, Klaus-Robert Müller,
- Abstract要約: 合成データ上にPerceiverスタイルのアーキテクチャでコンテキスト内学習者の事前学習を行うことで、ラベル付きバッグから新しいタスクを解くことができるモデルが得られることを示す。
これらのジェネレータの混合で事前訓練されたモデルは、タスク毎の強度を継承し、12のMILベンチマークで最高の平均性能を達成する。
- 参考スコア(独自算出の注目度): 47.70525189635083
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiple Instance Learning (MIL) addresses problems where supervision is available at the level of bags of instances and has been successfully applied in fields ranging from computational pathology to satellite imagery. Nevertheless, existing algorithms struggle in the low-label regime that characterizes many real-world applications. Flexible models overfit and rigid ones fail to adapt to the task at hand. We show that pretraining an in-context learner with a Perceiver-style architecture on synthetic data yields a model that can solve new tasks from a handful of labeled bags. At inference time, classification happens in a single forward pass and requires no gradient updates. We propose and investigate different synthetic data generators for bag-structured data and find that they capture complementary inductive biases. A model pretrained on a mixture of these generators inherits their per-task strengths and achieves the best average performance across twelve MIL benchmarks, outperforming supervised baselines that require task-specific training.
- Abstract(参考訳): マルチインスタンスラーニング(MIL)は、インスタンスのバッグレベルでの監視が可能である問題に対処し、計算病理学から衛星画像まで幅広い分野に適用されている。
それでも、既存のアルゴリズムは、多くの現実世界の応用を特徴づける低ラベル方式で苦労している。
柔軟なモデルは過度に適合し、厳格なものは、手元にあるタスクに適応できない。
合成データ上にPerceiverスタイルのアーキテクチャでコンテキスト内学習者の事前学習を行うことで、ラベル付きバッグから新しいタスクを解くことができるモデルが得られることを示す。
推論時に、分類は単一のフォワードパスで行われ、勾配更新を必要としない。
袋構造データに対して異なる合成データ生成器を提案し, 相補的帰納バイアスを捉えていることを確認した。
これらのジェネレータの混合で事前訓練されたモデルは、タスク毎の強度を継承し、12のMILベンチマークで最高の平均性能を達成し、タスク固有のトレーニングを必要とする教師付きベースラインを上回っている。
関連論文リスト
- Bagging-Based Model Merging for Robust General Text Embeddings [73.51674133699196]
汎用テキスト埋め込みモデルは、幅広いNLPおよび情報検索アプリケーションを支える。
本稿では,データスケジューリングとモデルマージという2つの観点から,テキスト埋め込みのためのマルチタスク学習の体系的研究を行う。
本稿では,Baging ベースの rObust mOdel Merging (BOOM) を提案する。
論文 参考訳(メタデータ) (2026-02-05T15:45:08Z) - Mock Worlds, Real Skills: Building Small Agentic Language Models with Synthetic Tasks, Simulated Environments, and Rubric-Based Rewards [13.784988950752195]
既存のオープンソースエージェントトレーニングデータはタスクの多様性が狭く、容易に解決できる。
現実世界のAPIには多様性がなく、大規模な強化学習のロールアウトプロセスでは不安定である。
多様なツール使用トレーニングデータを共同で合成し,完全な環境をシミュレートするフレームワークであるSynTHAGENTで,これらの課題に対処する。
論文 参考訳(メタデータ) (2026-01-30T03:43:42Z) - Beyond the Proxy: Trajectory-Distilled Guidance for Offline GFlowNet Training [36.64849664688883]
Trajectory-Distilled GFlowNet(TD-GFN)は、新しいプロキシフリートレーニングフレームワークである。
逆強化学習を通じて、オフライン軌道から高密度で遷移レベルなエッジ報酬を学習する。
コンバージェンス速度と最終サンプル品質の両方において、既存のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2025-05-26T15:12:22Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research [96.53307645791179]
我々は,100以上の視覚的分類タスクのストリームからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
NEVIS'22は、タスクの規模と多様性のために、現在のシーケンシャルな学習アプローチに対して前例のない課題を提起している。
論文 参考訳(メタデータ) (2022-11-15T18:57:46Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Mixture of basis for interpretable continual learning with distribution
shifts [1.6114012813668934]
データ分散のシフトを伴う環境での継続的な学習は、いくつかの現実世界のアプリケーションでは難しい問題である。
本稿では,この問題設定に対処するために,ベイシモデル(MoB)の混合方式を提案する。
論文 参考訳(メタデータ) (2022-01-05T22:53:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。