論文の概要: Learning To Defer To A Population With Limited Demonstrations
- arxiv url: http://arxiv.org/abs/2510.19351v2
- Date: Thu, 23 Oct 2025 01:52:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.418377
- Title: Learning To Defer To A Population With Limited Demonstrations
- Title(参考訳): 限定的なデモで人口を減らそうとする学習
- Authors: Nilesh Ramgolam, Gustavo Carneiro, Hsiang-Ting Chen,
- Abstract要約: 本稿では,L2D(L2D)システムを人口に遅延させる学習の実践的展開を妨げる重要なデータ不足に対処する。
メタラーニングを用いて,少数のデモンストレーションから専門家固有の埋め込みを生成する,コンテキスト対応の半教師付きフレームワークを導入する。
- 参考スコア(独自算出の注目度): 13.40222956306532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the critical data scarcity that hinders the practical deployment of learning to defer (L2D) systems to the population. We introduce a context-aware, semi-supervised framework that uses meta-learning to generate expert-specific embeddings from only a few demonstrations. We demonstrate the efficacy of a dual-purpose mechanism, where these embeddings are used first to generate a large corpus of pseudo-labels for training, and subsequently to enable on-the-fly adaptation to new experts at test-time. The experiment results on three different datasets confirm that a model trained on these synthetic labels rapidly approaches oracle-level performance, validating the data efficiency of our approach. By resolving a key training bottleneck, this work makes adaptive L2D systems more practical and scalable, paving the way for human-AI collaboration in real-world environments. To facilitate reproducibility and address implementation details not covered in the main text, we provide our source code and training configurations at https://github.com/nil123532/learning-to-defer-to-a-population-with-limited-demonstrations.
- Abstract(参考訳): 本稿では,L2D(L2D)システムを人口に遅延させる学習の実践的展開を妨げる重要なデータ不足に対処する。
メタラーニングを用いて,少数のデモンストレーションから専門家固有の埋め込みを生成する,コンテキスト対応の半教師付きフレームワークを導入する。
両目的機構の有効性を実証し、まずこれらの埋め込みをトレーニング用擬似ラベルの大規模なコーパスの生成に利用し、その後、テスト時に新しい専門家にオンザフライで適応できるようにする。
実験結果は、3つの異なるデータセットで、これらの合成ラベルに基づいてトレーニングされたモデルが、オラクルレベルのパフォーマンスに迅速にアプローチし、我々のアプローチのデータ効率を検証していることを確認した。
重要なトレーニングボトルネックを解決することで、適応型L2Dシステムはより実用的でスケーラブルになり、現実の環境での人間とAIのコラボレーションの道を開くことができる。
メインテキストに書かれていない再現性や実装の詳細を明らかにするため、ソースコードとトレーニング設定をhttps://github.com/nil123532/learning-to-defer-to-a-population-with-limited-demonstrationsで提供します。
関連論文リスト
- FedVLA: Federated Vision-Language-Action Learning with Dual Gating Mixture-of-Experts for Robotic Manipulation [11.080979029271019]
視覚言語アクション(VLA)モデルは、ロボットがタスク実行のために言語命令を解釈できるようにすることにより、ロボット操作を大幅に進歩させた。
我々は、フェデレートVLA学習フレームワークであるFedVLAを提案し、パフォーマンスを損なうことなく、データのプライバシを保存する分散モデルトレーニングを可能にした。
論文 参考訳(メタデータ) (2025-08-04T08:39:43Z) - Enhancing User Sequence Modeling through Barlow Twins-based Self-Supervised Learning [17.299357794051797]
本稿では,最先端のSSL手法であるBarlow Twinsを,適切な拡張手法を取り入れたユーザシーケンスモデリングに適用することを提案する。
提案手法は,大規模な負のサンプルバッチの必要性を軽減し,より小さなバッチサイズと限られたラベル付きデータによる効果的な表現学習を実現することを目的としている。
論文 参考訳(メタデータ) (2025-05-02T02:04:52Z) - Underlying Semantic Diffusion for Effective and Efficient In-Context Learning [113.4003355229632]
Underlying Semantic Diffusion (US-Diffusion)は、セマンティック学習、計算効率、文脈内学習能力を高める拡張拡散モデルである。
本稿では,フィードバック信号を利用したフィードバック支援学習(FAL)フレームワークを提案する。
また,高雑音レベルの時間ステップで高密度サンプリングを行うためのプラグイン・アンド・プレイの効率的なサンプリング戦略(ESS)を提案する。
論文 参考訳(メタデータ) (2025-03-06T03:06:22Z) - Expert Routing with Synthetic Data for Continual Learning [46.01125098473039]
Generate to Discriminate (G2D) は、合成データを利用してドメイン識別器を訓練する連続学習手法である。
我々は、G2Dが視覚と言語の両方におけるタスクにおいて、競争力のあるドメイン・インクリメンタル・ラーニング手法より優れていることを観察する。
論文 参考訳(メタデータ) (2024-12-22T13:16:28Z) - Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery [47.28191501836041]
本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
論文 参考訳(メタデータ) (2023-08-26T07:55:32Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Unsupervised Multi-Modal Representation Learning for Affective Computing
with Multi-Corpus Wearable Data [16.457778420360537]
我々は、人間の監督への依存を減らすために、教師なしの枠組みを提案する。
提案フレームワークは2つの畳み込み自己エンコーダを用いて、ウェアラブル心電図(ECG)と電磁気放射能(EDA)信号から潜時表現を学習する。
提案手法は, 同一のデータセット上での覚醒検出を行ない, 現状の成果よりも優れていた。
論文 参考訳(メタデータ) (2020-08-24T22:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。