論文の概要: Near-Optimal Dynamic Matching via Coarsening with Application to Heart Transplantation
- arxiv url: http://arxiv.org/abs/2602.04989v1
- Date: Wed, 04 Feb 2026 19:23:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.587258
- Title: Near-Optimal Dynamic Matching via Coarsening with Application to Heart Transplantation
- Title(参考訳): 粗大化による局所最適動的マッチングと心臓移植への応用
- Authors: Itai Zilberstein, Ioannis Anagnostides, Zachary W. Sollie, Arman Kilic, Tuomas Sandholm,
- Abstract要約: 我々は粗いアプローチに基づく新しいオンラインマッチングアルゴリズムを開発した。
オフラインノードを静電容量クラスタに集約することで、ほぼ最適理論的保証が得られることを示す。
- 参考スコア(独自算出の注目度): 45.83272225462161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online matching has been a mainstay in domains such as Internet advertising and organ allocation, but practical algorithms often lack strong theoretical guarantees. We take an important step toward addressing this by developing new online matching algorithms based on a coarsening approach. Although coarsening typically implies a loss of granularity, we show that, to the contrary, aggregating offline nodes into capacitated clusters can yield near-optimal theoretical guarantees. We apply our methodology to heart transplant allocation to develop theoretically grounded policies based on structural properties of historical data. In realistic simulations, our policy closely matches the performance of the omniscient benchmark. Our work bridges the gap between data-driven heuristics and pessimistic theoretical lower bounds, and provides rigorous justification for prior clustering-based approaches in organ allocation.
- Abstract(参考訳): オンラインマッチングはインターネット広告やオルガンアロケーションといった領域では主要な役割を担っているが、実用的なアルゴリズムは理論上の保証を欠いていることが多い。
我々は、粗いアプローチに基づいた新しいオンラインマッチングアルゴリズムを開発することで、この問題に対処するための重要な一歩を踏み出した。
粗大化は典型的には粒度の減少を意味するが、逆に、オフラインノードを静電容量クラスタに集約することで、ほぼ最適理論上の保証が得られることを示す。
本手法を心臓移植割当に適用し, 歴史的データの構造的特性に基づく理論的根拠を持つ政策を立案する。
現実的なシミュレーションでは、このポリシーは全能ベンチマークのパフォーマンスと密接に一致している。
我々の研究は、データ駆動ヒューリスティックと悲観的理論的下界のギャップを埋め、臓器アロケーションにおける事前クラスタリングに基づくアプローチの厳密な正当化を提供する。
関連論文リスト
- Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint [56.74058752955209]
本稿では,RLHFによる強化学習を用いた生成モデルのアライメント過程について検討する。
まず、オフラインPPOやオフラインDPOのような既存の一般的な手法の主な課題を、環境の戦略的探索に欠如していると認識する。
有限サンプル理論保証を用いた効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-18T18:58:42Z) - Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。
我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。
提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文 参考訳(メタデータ) (2022-06-11T18:03:26Z) - False Correlation Reduction for Offline Reinforcement Learning [115.11954432080749]
本稿では,実効的かつ理論的に証明可能なアルゴリズムであるオフラインRLに対するfalSe Correlation Reduction (SCORE)を提案する。
SCOREは、標準ベンチマーク(D4RL)において、様々なタスクにおいて3.1倍の高速化でSoTA性能を達成することを実証的に示す。
論文 参考訳(メタデータ) (2021-10-24T15:34:03Z) - Model-Free Learning of Optimal Deterministic Resource Allocations in
Wireless Systems via Action-Space Exploration [4.721069729610892]
本稿では,最適パラメータ化資源割り当てポリシーを効率的に学習するための,技術的基盤と拡張性のある2次元勾配法を提案する。
提案手法は, 深層ネットワークなどの一般的な普遍表現の勾配を効率よく活用するだけでなく, 低次元摂動により構築された関連するランダムネットワークサービスのゼロ階勾配近似を一貫したゼロ階勾配近似に頼っているため, 真のモデルフリーである。
論文 参考訳(メタデータ) (2021-08-23T18:26:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。