論文の概要: Balancing Optimality and Diversity: Human-Centered Decision Making through Generative Curation
- arxiv url: http://arxiv.org/abs/2409.11535v2
- Date: Tue, 05 Aug 2025 02:50:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.491764
- Title: Balancing Optimality and Diversity: Human-Centered Decision Making through Generative Curation
- Title(参考訳): 最適性と多様性のバランスをとる:生成的キュレーションによる人間中心の意思決定
- Authors: Michael Lingzhi Li, Shixiang Zhu,
- Abstract要約: 医療、物流、公共政策における運用上の決定には、候補ソリューションを推奨するアルゴリズムが関与する一方、最終的な選択は人間の意思決定者に任せる。
本稿では,可観測的目的と非可観測的質的考察の両方に依存する場合の推奨セットを最適に生成するフレームワークである生成的キュレーションを提案する。
私たちのフレームワークは、人間の判断を置き換えるのではなく、補完するアルゴリズムを設計する原則的な方法を提供する。
- 参考スコア(独自算出の注目度): 6.980546503227467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Operational decisions in healthcare, logistics, and public policy increasingly involve algorithms that recommend candidate solutions, such as treatment plans, delivery routes, or policy options, while leaving the final choice to human decision-makers. For instance, school districts use algorithms to design bus routes, but administrators make the final call given community feedback. In these settings, decision quality depends not on a single algorithmic ``optimum'', but on whether the portfolio of recommendations contains at least one option the human ultimately deems desirable. We propose generative curation, a framework that optimally generates recommendation sets when desirability depends on both observable objectives and unobserved qualitative considerations. Instead of a fixed solution, generative curation learns a distribution over solutions designed to maximize the expected desirability of the best option within a manageable portfolio. Our analysis identifies a trade-off between quantitative quality and qualitative diversity, formalized through a novel diversity metric derived from the reformulated objective. We implement the framework using a generative neural network and a sequential optimization method, and show in synthetic and real-world studies that it consistently reduces expected regret compared to existing benchmarks. Our framework provides decision-makers with a principled way to design algorithms that complement, rather than replace, human judgment. By generating portfolios of diverse yet high-quality options, decision-support tools can better accommodate unmodeled factors such as stakeholder preferences, political feasibility, or community acceptance. More broadly, the framework enables organizations to operationalize human-centered decision-making at scale, ensuring that algorithmic recommendations remain useful even when objectives are incomplete or evolving.
- Abstract(参考訳): 医療、物流、公共政策における運用上の決定には、治療計画、配送ルート、政策オプションなどの候補ソリューションを推奨するアルゴリズムがますます関与し、最終選択は人間の意思決定者に任せる。
例えば、教育学区はバス路線の設計にアルゴリズムを使用しているが、管理者はコミュニティからのフィードバックを受けて最終呼び出しを行う。
これらの設定では、決定の質は単一のアルゴリズムの‘最適化’ではなく、レコメンデーションのポートフォリオに少なくとも1つのオプションが含まれているかどうかにかかっている。
本稿では,可観測的目的と非可観測的質的考察の両方に依存する場合の推奨セットを最適に生成するフレームワークである生成的キュレーションを提案する。
生成的キュレーションは、固定された解の代わりに、管理可能なポートフォリオ内のベストオプションの期待できる望ましさを最大化するために設計されたソリューション上の分布を学習する。
本分析では, 定量的品質と質的多様性のトレードオフを, 改質された目的から派生した新しい多様性指標によって定式化した。
本稿では,生成ニューラルネットワークと逐次最適化手法を用いてフレームワークを実装し,既存のベンチマークと比較して期待された後悔を一貫して低減することを示す。
私たちのフレームワークは、人間の判断を置き換えるのではなく、補完するアルゴリズムを設計する原則的な方法を提供する。
多様な高品質な選択肢のポートフォリオを生成することで、意思決定支援ツールは、ステークホルダーの好み、政治的実現性、コミュニティの受け入れなど、非モデル化された要素をよりよく適合させることができる。
より広い範囲で、このフレームワークは組織が大規模に人間中心の意思決定を運用できるようにし、目標が不完全あるいは進化している場合でもアルゴリズムによる推奨が有用であることを保証します。
関連論文リスト
- Conformalized Decision Risk Assessment [5.391713612899277]
本稿では,任意の候補決定を定量化する新しいフレームワークCREDOを紹介し,その決定が最適以下である確率の分布自由上限について紹介する。
逆最適化幾何と共形予測と生成モデリングを組み合わせることで、CREDOは統計的に厳密で実用的な解釈が可能なリスク証明書を生成する。
論文 参考訳(メタデータ) (2025-05-19T15:24:38Z) - Pareto Optimal Algorithmic Recourse in Multi-cost Function [0.44938884406455726]
アルゴリズム的リコースは、個々の特徴を変更するために最小限のコストのアクションを識別することを目的としており、それによって望ましい結果が得られる。
現在のリコース機構のほとんどは、コスト関数が微分可能であると仮定する勾配に基づく手法を使用しており、現実のシナリオでは適用できないことが多い。
本研究では,非微分可能かつ離散的多コスト関数を扱うアルゴリズム的リコースフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-11T03:16:08Z) - Towards Robust Interpretable Surrogates for Optimization [0.0]
最適化モデルの実践的実装において重要な要素は、意図したユーザによる受け入れである。
本研究では,不確実性をモデル化するための異なる変種に基づく適切なモデルと解法を提案する。
論文 参考訳(メタデータ) (2024-12-02T08:31:48Z) - Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Illuminating the Diversity-Fitness Trade-Off in Black-Box Optimization [9.838618121102053]
現実世界のアプリケーションでは、ユーザーは1つの高品質なソリューションよりも構造的に多様な設計選択を好むことが多い。
本稿では, 所定のしきい値以上のペア距離を持つ一定数の解を同定する問題を考察する。
このトレードオフが、根底にある最適化問題の性質にどのように依存するかを分析する。
論文 参考訳(メタデータ) (2024-08-29T09:55:55Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - A new fuzzy multi-attribute group decision-making method based on TOPSIS
and optimization models [3.697049647195136]
区間値の直観的ファジィ集合における多属性群決定のための新しい手法を提案する。
全ての専門家の個人評価と全体整合性評価の差の和を最小化することにより、専門家の体重を決定するための新しい最適化モデルが確立される。
完全ファジィ多属性群決定アルゴリズムが定式化され、主観的および客観的重み付け法の利点を最大限に活用することができる。
論文 参考訳(メタデータ) (2023-11-27T15:41:30Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - Online POMDP Planning with Anytime Deterministic Optimality Guarantees [9.444784653236157]
近似解と最適解の間の離散POMDPに対する決定論的関係を導出する。
我々の導出は、新しいアルゴリズムセットの道を提供し、既存のアルゴリズムにアタッチできることを示します。
論文 参考訳(メタデータ) (2023-10-03T04:40:38Z) - Bayesian Quality-Diversity approaches for constrained optimization
problems with mixed continuous, discrete and categorical variables [0.3626013617212667]
シミュレーション予算の制限という観点から,混合変数に基づく新しい品質多様性手法を提案する。
提案手法は、複雑なシステム設計のための意思決定者にとって貴重なトレードオフを提供する。
論文 参考訳(メタデータ) (2023-09-11T14:29:47Z) - Robust Data-driven Prescriptiveness Optimization [4.792851066169871]
本稿では、古典的経験的リスク目標最小化に代えて、規範性の係数が代わる分布的ロバストな文脈最適化モデルを提案する。
サンプル外データセットが様々な分散シフトを受ける場合の代替手法に対する結果のロバスト性を評価する。
論文 参考訳(メタデータ) (2023-06-09T14:56:06Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - Off-Policy Evaluation with Policy-Dependent Optimization Response [90.28758112893054]
我々は,テキスト政治に依存した線形最適化応答を用いた非政治評価のための新しいフレームワークを開発した。
摂動法による政策依存推定のための非バイアス推定器を構築する。
因果介入を最適化するための一般的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-25T20:25:37Z) - Bayesian Persuasion for Algorithmic Recourse [28.586165301962485]
いくつかの状況では、根底にある予測モデルはゲームを避け、競争上の優位性を維持するために意図的に秘密にされている。
我々はベイズ的説得のゲームのような設定を捉え、意思決定者は、例えばアクションレコメンデーションのようなシグナルを、望ましい行動を取るためのインセンティブを与える決定対象に送信する。
本稿では,最適化問題として最適なベイズ的インセンティブ互換(BIC)行動推薦ポリシーを見出すという意思決定者の問題を定式化し,線形プログラムを用いて解を特徴づける。
論文 参考訳(メタデータ) (2021-12-12T17:18:54Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - On the Optimality of Batch Policy Optimization Algorithms [106.89498352537682]
バッチポリシー最適化は、環境と対話する前に既存のデータをポリシー構築に活用することを検討する。
信頼調整インデックスアルゴリズムは楽観的,悲観的,中立的いずれであってもミニマックス最適であることを示す。
最適値予測の本来の難易度を考慮した新しい重み付き最小値基準を提案する。
論文 参考訳(メタデータ) (2021-04-06T05:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。