論文の概要: Contextual Multi-Objective Optimization: Rethinking Objectives in Frontier AI Systems
- arxiv url: http://arxiv.org/abs/2605.03900v1
- Date: Tue, 05 May 2026 15:55:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:44.015897
- Title: Contextual Multi-Objective Optimization: Rethinking Objectives in Frontier AI Systems
- Title(参考訳): コンテキスト多目的最適化:フロンティアAIシステムにおける目的の再考
- Authors: Jie Zhou, Qin Chen, Liang He,
- Abstract要約: AIの失敗の多くは、単にスケールや能力の失敗ではなく、客観的な選択の失敗である、と私たちは主張する。
この問題を,文体多目的最適化として定式化する。
私たちのフレームワークは、候補アクション、客観的見積、アクティブ制約、利害関係者、不確実性、コンフリクト解決手順に対するコンテキスト依存の選択ルールとして、AIの振る舞いをモデル化します。
- 参考スコア(独自算出の注目度): 20.864964136537772
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Frontier AI systems perform best in settings with clear, stable, and verifiable objectives, such as code generation, mathematical reasoning, games, and unit-test-driven tasks. They remain less reliable in open-ended settings, including scientific assistance, long-horizon agents, high-stakes advice, personalization, and tool use, where the relevant objective is ambiguous, context-dependent, delayed, or only partially observable. We argue that many such failures are not merely failures of scale or capability, but failures of objective selection: the system optimizes a locally visible signal while missing which objectives should govern the interaction. We formulate this problem as \emph{contextual multi-objective optimization}. In this setting, systems must consider multiple, context-dependent objectives, such as helpfulness, truthfulness, safety, privacy, calibration, non-manipulation, user preference, reversibility, and stakeholder impact, while determining which objectives are active, which are soft preferences, and which must function as hard or quasi-hard constraints. These examples are not intended as an exhaustive taxonomy: different domains and deployment settings may activate different objective dimensions and different conflict-resolution procedures. Our framework models AI behavior as a context-dependent choice rule over candidate actions, objective estimates, active constraints, stakeholders, uncertainty, and conflict-resolution procedures. We outline an implementation pathway based on decomposed objective representations, context-to-objective routing, hierarchical constraints, deliberative policy reasoning, controlled personalization, tool-use control, diagnostic evaluation, auditing, and post-deployment revision.
- Abstract(参考訳): フロンティアAIシステムは、コード生成、数学的推論、ゲーム、単体テスト駆動タスクなど、明確で安定した、検証可能な目的を持った設定でベストに機能する。
科学的援助、長期のエージェント、高度なアドバイス、パーソナライゼーション、ツールの使用など、オープンエンドの環境では信頼性が低いままであり、関連する目的は曖昧で、文脈に依存し、遅れており、部分的に観察可能である。
このような障害の多くは、単にスケールや能力の失敗ではなく、客観的選択の失敗である、と我々は主張する。
この問題を 'emph{contextual multi-objective optimization} として定式化する。
この設定では、システムは、有用性、真実性、安全性、プライバシ、キャリブレーション、非操作性、ユーザの嗜好、可逆性、ステークホルダーの影響など、複数のコンテキスト依存の目的を考慮し、どの目的がアクティブか、ソフトな選好であり、ハードまたは準ハードな制約として機能するかを判断する必要がある。
異なるドメインとデプロイメント設定は、異なる客観的次元と異なるコンフリクト解決手順を活性化する可能性がある。
私たちのフレームワークは、候補アクション、客観的見積、アクティブ制約、利害関係者、不確実性、コンフリクト解決手順に対するコンテキスト依存の選択ルールとして、AIの振る舞いをモデル化します。
本稿では, 分割された客観的表現, コンテキストからオブジェクトへのルーティング, 階層的制約, 熟考的ポリシー推論, 制御されたパーソナライゼーション, ツール使用制御, 診断評価, 監査, デプロイ後のリビジョンに基づく実装経路について概説する。
関連論文リスト
- Subspace Control: Turning Constrained Model Steering into Controllable Spectral Optimization [27.280175507074322]
制約付きモデルトレーニングのためのサブスペース制御フレームワークを提案する。
SIFT (spectral interference-free training) は、すべてのタスクにおいて、実質的で堅牢なパフォーマンス改善を一貫して達成する。
論文 参考訳(メタデータ) (2026-04-05T19:27:24Z) - TAG: Target-Agnostic Guidance for Stable Object-Centric Inference in Vision-Language-Action Models [59.13964209628383]
VLA(Vision-Language-Action)ポリシーは、言語指示や視覚的な観察をロボット行動にマッピングする上で大きな進歩を見せている。
本稿では,VLA政策における乱れや外見に起因したバイアスを明示的に軽減する単純な推論時ガイダンス機構であるTAG(Target-Agnostic Guidance)を提案する。
我々は, LIBERO, LIBERO-Plus, VLABenchなどの標準操作ベンチマーク上でTAGを評価し, クラッタ下での堅牢性を一貫して改善し, ニアミスや不正なオブジェクト実行を減らす。
論文 参考訳(メタデータ) (2026-03-25T17:56:32Z) - AI Agent Systems: Architectures, Applications, and Evaluation [4.967019713320407]
AIエージェントは、基礎モデルと推論、計画、メモリ、ツールの使用を組み合わせる。
先行作業は、エージェントコンポーネントにまたがる統一された分類にまとめます。
レイテンシ対精度、自律性対可制御性、能力対信頼性といった重要な設計トレードオフについて論じます。
論文 参考訳(メタデータ) (2026-01-05T02:38:40Z) - Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - Controllable Preference Optimization: Toward Controllable Multi-Objective Alignment [103.12563033438715]
人工知能におけるアライメントは、モデル応答と人間の好みと値の一貫性を追求する。
既存のアライメント技術は、主に一方向であり、様々な目的に対して、最適以下のトレードオフと柔軟性の低下につながる。
制御可能な選好最適化(CPO)を導入し、異なる目的に対する選好スコアを明確に指定する。
論文 参考訳(メタデータ) (2024-02-29T12:12:30Z) - Optimization's Neglected Normative Commitments [3.3388234549922027]
潜在的に高い意思決定にアプローチするために使用されるパラダイムは、現実世界を決定(s)、目的(s)、制約(s)の集合に抽象化することに依存している。
本稿では,最適化に必須の規範的選択と仮定について述べる。
その後、無視される可能性のある6つの緊急問題を特定する。
論文 参考訳(メタデータ) (2023-05-27T12:43:15Z) - CACTUS: Detecting and Resolving Conflicts in Objective Functions [16.784454432715712]
多対象最適化において、矛盾する目的と制約は大きな関心事である。
本稿では,多目的目的関数を可視化する手法をプロトタイプ化して,この作業範囲を拡張する。
本手法は,分類タスクの潜在的な競合を解決することによって,ユーザが対話的に有意義な目的関数を特定できることを示す。
論文 参考訳(メタデータ) (2021-03-13T22:38:47Z) - Offline Contextual Bandits with Overparameterized Models [52.788628474552276]
オフラインの文脈的盗賊にも同じ現象が起こるかどうかを問う。
この相違は, 目的の強調安定性によるものであることを示す。
大規模なニューラルネットワークを用いた実験では、アクション安定な値ベース目標と不安定なポリシベース目標とのギャップは、大きなパフォーマンス差をもたらす。
論文 参考訳(メタデータ) (2020-06-27T13:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。