論文の概要: Interactive Multi-Objective Probabilistic Preference Learning with Soft and Hard Bounds
- arxiv url: http://arxiv.org/abs/2506.21887v1
- Date: Fri, 27 Jun 2025 03:44:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:23.077394
- Title: Interactive Multi-Objective Probabilistic Preference Learning with Soft and Hard Bounds
- Title(参考訳): ソフトバウンドとハードバウンドを用いた対話型多目的確率予測学習
- Authors: Edward Chen, Sang T. Truong, Natalie Dullerud, Sanmi Koyejo, Carlos Guestrin,
- Abstract要約: ブラキセラピーでは、臨床医は腫瘍の最大範囲を、厳格な臓器投与制限とバランスさせなければならない。
現在の方法は、しばしばこれらの多面的嗜好構造を反復的に洗練するための体系的なアプローチを欠いている。
このプロセス用に設計されたインタラクティブなローカル・グローバル・フレームワークであるActive-MoSHを提案する。
- 参考スコア(独自算出の注目度): 20.97190146319937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-stakes decision-making involves navigating multiple competing objectives with expensive evaluations. For instance, in brachytherapy, clinicians must balance maximizing tumor coverage (e.g., an aspirational target or soft bound of >95% coverage) against strict organ dose limits (e.g., a non-negotiable hard bound of <601 cGy to the bladder), with each plan evaluation being resource-intensive. Selecting Pareto-optimal solutions that match implicit preferences is challenging, as exhaustive Pareto frontier exploration is computationally and cognitively prohibitive, necessitating interactive frameworks to guide users. While decision-makers (DMs) often possess domain knowledge to narrow the search via such soft-hard bounds, current methods often lack systematic approaches to iteratively refine these multi-faceted preference structures. Critically, DMs must trust their final decision, confident they haven't missed superior alternatives; this trust is paramount in high-consequence scenarios. We present Active-MoSH, an interactive local-global framework designed for this process. Its local component integrates soft-hard bounds with probabilistic preference learning, maintaining distributions over DM preferences and bounds for adaptive Pareto subset refinement. This is guided by an active sampling strategy optimizing exploration-exploitation while minimizing cognitive burden. To build DM trust, Active-MoSH's global component, T-MoSH, leverages multi-objective sensitivity analysis to identify potentially overlooked, high-value points beyond immediate feedback. We demonstrate Active-MoSH's performance benefits through diverse synthetic and real-world applications. A user study on AI-generated image selection further validates our hypotheses regarding the framework's ability to improve convergence, enhance DM trust, and provide expressive preference articulation, enabling more effective DMs.
- Abstract(参考訳): 高い意思決定は、高価な評価で競合する複数の目標をナビゲートすることを伴う。
例えば、ブラキセラピーにおいて、臨床医は、腫瘍の最大範囲(例えば、吸引目標または95%範囲)と、厳格な臓器投与制限(例えば、膀胱への601 cGyの非接触性硬度境界)のバランスをとらなければならない。
暗黙の好みに合うパレート最適ソリューションを選択することは困難であり、徹底的なパレートフロンティア探索は計算的かつ認知的に禁止され、ユーザーを導くために対話的なフレームワークが必要である。
意思決定者(DM)はしばしばそのようなソフトハード境界による探索を狭めるためのドメイン知識を持っているが、現在の手法は、これらの多面的嗜好構造を反復的に洗練するための体系的なアプローチを欠いていることが多い。
批判的に、DMは最終決定を信頼し、優れた選択肢を見逃していないと確信しなければならない。
このプロセス用に設計されたインタラクティブなローカル・グローバル・フレームワークであるActive-MoSHを提案する。
その局所成分はソフトハード境界と確率論的選好学習を統合し、DM選好上の分布を維持し、適応パレート部分集合の洗練のための境界を維持する。
これは、認知的負担を最小限に抑えつつ、探索・探索を最適化するアクティブサンプリング戦略によって導かれる。
DM信頼を構築するために、Active-MoSHのグローバルコンポーネントであるT-MoSHは、多目的感度分析を活用して、即時フィードバックを超えた潜在的に見落とされた高価値なポイントを特定する。
多様な合成および実世界のアプリケーションを通して、Active-MoSHのパフォーマンスの利点を実証する。
AI生成画像選択に関するユーザスタディでは、コンバージェンスを改善し、DM信頼を高め、表現的嗜好の表現を提供することで、より効果的なDMを可能にするフレームワークの能力に関する仮説をさらに検証している。
関連論文リスト
- Bounded Rationality for LLMs: Satisficing Alignment at Inference-Time [52.230936493691985]
本稿では,2次基準のしきい値に基づく制約を満たしつつ,主目的を最大化し,アライメントの多面性に対処する推論フレームワークSITAlignを提案する。
我々は、満足度に基づく推論アライメントアプローチの準最適境界を導出することで理論的洞察を提供する。
論文 参考訳(メタデータ) (2025-05-29T17:56:05Z) - RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning [60.84707424369494]
CoT(Chain-of-Thought)推論は、複雑なタスクにおける大規模言語モデル(LLM)の強化に有効であることが証明されている。
CoT 機能の計測可能なバウンダリの評価と最適化を行うフレームワークである Reasoning Boundary Framework++ (RBF++) を紹介する。
論文 参考訳(メタデータ) (2025-05-19T16:25:55Z) - Multi-Level Aware Preference Learning: Enhancing RLHF for Complex Multi-Instruction Tasks [81.44256822500257]
RLHFは、人工知能システムと人間の好みを結びつける主要なアプローチとして登場した。
RLHFは、複雑なマルチインストラクションタスクに直面すると、不十分なコンプライアンス機能を示す。
本稿では,マルチインストラクション能力を向上させる新しいMAPL(Multi-level Aware Preference Learning)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T08:33:11Z) - Uncertain Multi-Objective Recommendation via Orthogonal Meta-Learning Enhanced Bayesian Optimization [30.031396809114625]
本稿では,ルールベースの精度駆動システムから行動認識,不確実な多目的RSに至るまで,RSの自律性を5つの異なるレベルに分類する新しい枠組みを提案する。
個人の好みに基づいて複数の目的を動的に識別し、最適化し、より倫理的でインテリジェントなユーザー中心のレコメンデーションを促進するアプローチを提案する。
論文 参考訳(メタデータ) (2025-02-18T08:10:09Z) - MoSH: Modeling Multi-Objective Tradeoffs with Soft and Hard Bounds [29.347695311801864]
本稿では,ソフトハード関数 SHF を運用する新しい概念フレームワークを提案する。
SHFフレームワークに適合する多くの実践的問題を示し、多様なドメインに対する広範な実証的検証を提供する。
具体的には、ブラキセラピーでは、次の最良アプローチよりも3%以上のSHF定義ユーティリティを持つコンパクトな点集合を返す。
論文 参考訳(メタデータ) (2024-12-09T02:32:20Z) - Dynamic Detection of Relevant Objectives and Adaptation to Preference Drifts in Interactive Evolutionary Multi-Objective Optimization [2.4374097382908477]
意思決定過程を通じて進化し,目的の関連性に影響を与えるDM選好の動的性質について検討する。
このような変化が起こると、時代遅れや相反する好みを解消する手法を提案する。
実験により,提案手法は進化する嗜好を効果的に管理し,アルゴリズムが生成するソリューションの品質と望ましさを著しく向上することを示した。
論文 参考訳(メタデータ) (2024-11-07T09:09:06Z) - Human-in-the-Loop Policy Optimization for Preference-Based
Multi-Objective Reinforcement Learning [13.627087954965695]
好みに基づくMORLのためのHuman-in-the-loopポリシー最適化フレームワークを提案する。
本手法は,事前知識を必要とせずに,DMの暗黙の選好情報を積極的に学習する。
我々は従来の3つのMORLアルゴリズムと4つの最先端の選好に基づくMORLアルゴリズムに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-01-04T09:17:53Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - Learning Control Admissibility Models with Graph Neural Networks for
Multi-Agent Navigation [9.05607520128194]
制御適応モデル(CAM)は、任意の数のエージェントに対するオンライン推論のために簡単に構成され、使用することができる。
CAMモデルは少数のエージェントしか持たない環境で訓練でき、数百のエージェントで密集した環境に展開するために容易に構成でき、最先端の手法よりも優れた性能を実現することができる。
論文 参考訳(メタデータ) (2022-10-17T19:20:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。