論文の概要: Expert-Agnostic Learning to Defer
- arxiv url: http://arxiv.org/abs/2502.10533v1
- Date: Fri, 14 Feb 2025 19:59:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 20:34:44.512741
- Title: Expert-Agnostic Learning to Defer
- Title(参考訳): 専門家に依存しないディフェンダーの学習
- Authors: Joshua Strong, Pramit Saha, Yasin Ibrahim, Cheng Ouyang, Alison Noble,
- Abstract要約: EA-L2D:Expert-Agnostic Learning to Deferを紹介します。
専門家が1~16%、未確認の専門家が4~28%、そして、専門家の多様性が高い環境では、パフォーマンスが向上するのを観察する。
- 参考スコア(独自算出の注目度): 4.171294900540735
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning to Defer (L2D) learns autonomous systems to independently manage straightforward cases, while deferring uncertain cases to human experts. Recent advancements in this field have introduced features enabling flexibility to unseen experts at test-time, but we find these approaches have significant limitations. To address these, we introduce EA-L2D: Expert-Agnostic Learning to Defer, a novel L2D framework that leverages a Bayesian approach to model expert behaviour in an expert-agnostic manner, facilitating optimal deferral decisions. EA-L2D offers several critical improvements over prior methods, including the ability to incorporate prior knowledge about experts, a reduced reliance on expert-annotated data, and robust performance when deferring to experts with expertise not seen during training. Evaluating on CIFAR-10, HAM10000, German Traffic Lights, Breast Ultrasound, Axial Organ Slices, and Blood Cell MNIST, we observe performance gains over the next state-of-the-art of 1-16\% for seen experts and 4-28\% for unseen experts in settings with high expert diversity.
- Abstract(参考訳): Learning to Defer (L2D)は、自律的なシステムを学習し、単純なケースを独立して管理し、不確実なケースを人間の専門家に委ねる。
この分野での最近の進歩は、テスト時に専門家を見ないような柔軟性を実現する機能を導入していますが、これらのアプローチには大きな制限があります。
EA-L2D(Expert-Agnostic Learning to Defer)は、ベイズ的アプローチを利用して専門家非依存の方法で専門家の振る舞いをモデル化し、最適な推論決定を容易にする新しいL2Dフレームワークである。
EA-L2Dは、専門家に関する事前の知識を組み込む機能、専門家による注釈付きデータへの依存の低減、トレーニング中に見えない専門知識を持つ専門家に委ねる際の堅牢なパフォーマンスなど、以前の方法よりもいくつかの重要な改善を提供する。
CIFAR-10, HAM10000, German Traffic Lights, Breast Ultrasound, Axial Organ Slices, Blood Cell MNISTでの評価を行い, 専門家の次の1~16倍, 専門家の多様性の高い環境では4~28倍の結果を得た。
関連論文リスト
- Unveiling Hidden Collaboration within Mixture-of-Experts in Large Language Models [5.211806751260724]
本稿では,専門家間の協調パターンを明らかにする階層型スパース辞書学習法を提案する。
また、コントリビューション・アウェア・エキスパート・プルーニング(CAEP)アルゴリズムを導入し、低コントリビューション・エキスパートを効果的に育成する。
論文 参考訳(メタデータ) (2025-04-16T04:06:15Z) - Domain-Specific Pruning of Large Mixture-of-Experts Models with Few-shot Demonstrations [48.890534958441016]
大規模MOEモデルにおける領域の特殊化と専門的冗長性について検討する。
本稿では,最も関係のある専門家のみを識別・保持するための簡易で効果的な刈取フレームワークであるEASY-EPを提案する。
提案手法は,DeepSeek-R1を完全かつ半分のエキスパートで,同じメモリ予算で同等の性能と2.99タイムのスループットを達成できる。
論文 参考訳(メタデータ) (2025-04-09T11:34:06Z) - Finding Fantastic Experts in MoEs: A Unified Study for Expert Dropping Strategies and Observations [86.90549830760513]
わずかに活性化されたMixture-of-Experts(SMoE)は、ニューラルネットワークの学習能力のスケールアップを約束している。
多様な視点から専門家の重要度を推定するためのベンチマークとして,MoE Experts Compression Suite (MC-Suite)を提案する。
我々は,SMoEsの指示追従能力が主に損なわれるという,実験的に検証された予想を提示する。
論文 参考訳(メタデータ) (2025-04-08T00:49:08Z) - Learning to Defer for Causal Discovery with Imperfect Experts [59.071731337922664]
L2D-CDは、専門家の推薦の正しさを測り、データ駆動因果発見結果と最適に組み合わせる手法である。
我々は,標準T"ubingenペアデータセット上でL2D-CDを評価し,因果探索法と分離に用いる専門家の双方と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2025-02-18T18:55:53Z) - Utilising Deep Learning to Elicit Expert Uncertainty [2.9686400658670578]
筆者らは, [14 ] で提案した手法を, 専門家が実際に使用する手法に応用するために, ディープラーニングアプローチを採用する方法を示す。
本稿では、専門家の意思決定を効果的にモデル化し、専門家の不確実性を捉えた分布を抽出する深層学習モデルの概要について述べる。
論文 参考訳(メタデータ) (2025-01-21T01:36:12Z) - Unveiling and Consulting Core Experts in Retrieval-Augmented MoE-based LLMs [64.9693406713216]
RAGシステムの有効性に寄与する内部メカニズムは未解明のままである。
実験の結果,複数のコアグループの専門家がRAG関連行動に主に関与していることが判明した。
本稿では,専門家の活性化を通じてRAGの効率性と有効性を高めるためのいくつかの戦略を提案する。
論文 参考訳(メタデータ) (2024-10-20T16:08:54Z) - Learning to Defer to a Population: A Meta-Learning Approach [4.64209268422757]
テスト時に目に見えない専門家に対処できるL2Dシステムを定式化します。
テストポイントに類似したコンテキストセット内のポイントを検索できるアテンションメカニズムを採用しています。
実験では,画像認識,交通標識検出,皮膚病変診断ベンチマークについて検討した。
論文 参考訳(メタデータ) (2024-03-05T06:10:28Z) - Defining Expertise: Applications to Treatment Effect Estimation [58.7977683502207]
専門知識(特にドメインの意思決定者が持つであろう専門知識の種類)は、治療効果の推定方法の設計と選択において有益である、と我々は主張する。
予測的および予測的2種類の専門知識を定義し,(i)ドメインにおける顕著な専門知識のタイプが治療効果推定における異なる手法の性能に大きく影響し,(ii)データセットに存在する専門知識のタイプを予測することが可能であることを実証的に示す。
論文 参考訳(メタデータ) (2024-03-01T17:30:49Z) - Inverse Reinforcement Learning with Sub-optimal Experts [56.553106680769474]
与えられた専門家の集合と互換性のある報酬関数のクラスの理論的性質について検討する。
以上の結果から,複数の準最適専門家の存在が,相反する報酬の集合を著しく減少させる可能性が示唆された。
我々は,最適なエージェントの1つに十分近い準最適専門家のパフォーマンスレベルが最適である場合に,最小限の最適化を行う一様サンプリングアルゴリズムを解析する。
論文 参考訳(メタデータ) (2024-01-08T12:39:25Z) - Learning to Defer with Limited Expert Predictions [0.0]
本稿では,アルゴリズムを遅延させる学習訓練に必要な専門家予測数を3段階に短縮する手法を提案する。
実験の結果,この手法により,人間専門家の予測が最小限に抑えられたアルゴリズムを,様々な学習の訓練で遅延させることができることがわかった。
論文 参考訳(メタデータ) (2023-04-14T09:22:34Z) - Decision Rule Elicitation for Domain Adaptation [93.02675868486932]
ヒトインザループ機械学習は、専門家からラベルを引き出すために人工知能(AI)で広く使用されています。
この作業では、専門家が意思決定を説明する決定ルールを作成できるようにします。
決定規則の適用はアルゴリズムのドメイン適応を改善し、専門家の知識をAIモデルに広めるのに役立つことを示す。
論文 参考訳(メタデータ) (2021-02-23T08:07:22Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。