論文の概要: Budget-Constrained Coalition Strategies with Discounting
- arxiv url: http://arxiv.org/abs/2105.04692v1
- Date: Mon, 10 May 2021 22:21:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 13:49:37.167438
- Title: Budget-Constrained Coalition Strategies with Discounting
- Title(参考訳): 予算制約付き連立戦略と割引
- Authors: Lia Bozzone and Pavel Naumov
- Abstract要約: 将来のコストと報酬の割引は、会計、ゲーム理論、機械学習の一般的なプラクティスです。
本稿では,その意味論にディスカウントを組み込んだ,予算制約付き戦略能力の推論のための,健全かつ完全な論理システムを提案する。
- 参考スコア(独自算出の注目度): 15.076964620370266
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discounting future costs and rewards is a common practice in accounting, game
theory, and machine learning. In spite of this, existing logics for reasoning
about strategies with cost and resource constraints do not account for
discounting. The paper proposes a sound and complete logical system for
reasoning about budget-constrained strategic abilities that incorporates
discounting into its semantics.
- Abstract(参考訳): 将来のコストと報酬を計算することは、会計、ゲーム理論、機械学習において一般的な慣習である。
それにもかかわらず、コストとリソース制約のある戦略を推論する既存のロジックは割引を考慮しない。
本稿では,割引を意味に組み込んだ予算制約型戦略能力の推論のための,健全で完全な論理体系を提案する。
関連論文リスト
- Cost-Based Semantics for Querying Inconsistent Weighted Knowledge Bases [5.222978725954348]
我々は、公理とアサーションの両方が(おそらく無限の)重みを持つ重み付き知識基底を考える。
確実かつ可能な答えの2つの概念は、コストが与えられた境界を超えない解釈を考えることによって定義される。
我々の主な貢献は、有界コスト満足度と確実かつ可能な回答認識の組合せとデータ複雑さの包括的分析である。
論文 参考訳(メタデータ) (2024-07-30T11:56:02Z) - Reasoning in Token Economies: Budget-Aware Evaluation of LLM Reasoning Strategies [24.875748056926213]
本稿では,計算予算を評価に組み込む枠組みを提案する。
複雑な推論戦略は、アルゴリズムの創発性のため、純粋に単純なベースラインを超えないことが多い。
自己整合性とは異なり、マルチエージェントの議論やリフレクションのような特定の戦略は、より多くの計算予算が利用されれば悪化する可能性がある。
論文 参考訳(メタデータ) (2024-06-10T16:55:08Z) - A Note on an Inferentialist Approach to Resource Semantics [48.65926948745294]
「推論主義」とは、推論行動の観点で意味が与えられるという考え方である。
本稿では,「推論主義」が資源意味論の汎用的で表現力豊かな枠組みを実現する方法を示す。
論文 参考訳(メタデータ) (2024-05-10T14:13:21Z) - Learning Planning-based Reasoning by Trajectories Collection and Process Reward Synthesizing [61.98556945939045]
収集された軌道上でのDPO(Direct Preference Optimization)を通して計画に基づく推論を学習するフレームワークを提案する。
論理的推論ベンチマークの挑戦的な結果から,学習フレームワークの有効性が示された。
論文 参考訳(メタデータ) (2024-02-01T15:18:33Z) - The Logic of Doxastic Strategies [31.818269491041153]
本稿はこのような戦略について「ドクサスティック」という用語を紹介している。
主要な技術的貢献は、ドクサスティック戦略と信念のモダリティの間の相互作用を記述する健全で完全な論理体系である。
論文 参考訳(メタデータ) (2023-12-12T09:37:16Z) - How to Select Which Active Learning Strategy is Best Suited for Your
Specific Problem and Budget [17.62242617965356]
本稿では,予算の最適戦略を動的に識別する実用的な微分法を提案する。
次に,問題の特徴と利用可能な予算を考慮したAL戦略を動的に選択する手法を提案する。
その結果,様々な予算やコンピュータビジョンタスクにまたがるアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-06-06T09:44:56Z) - Quantization for decentralized learning under subspace constraints [61.59416703323886]
エージェントがサブスペース制約を最小化するために個々のコスト関数を持つ分散最適化問題を考察する。
本稿では,エージェントが確率化量子化器を用いて推定値を圧縮する適応分散型戦略を提案し,検討する。
この分析は、量子化ノイズのいくつかの一般的な条件下では、平均二乗誤差と平均ビットレートの両方で戦略が安定であることを示している。
論文 参考訳(メタデータ) (2022-09-16T09:38:38Z) - Active Learning on a Budget: Opposite Strategies Suit High and Low
Budgets [8.937905773981702]
予算が大きければ,非定型的な点が最善であるのに対して,典型的な点が低予算で問合せされるべきであることを示す。
低予算に適したディープラーニング戦略であるTypiClustを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:09:05Z) - On limitations of learning algorithms in competitive environments [77.34726150561087]
本稿では,競争環境における対戦目標を追求する汎用学習アルゴリズムの概念的限界について論じる。
これらの制限は、競争環境において一般的に存在する不透過性と関連している。
論文 参考訳(メタデータ) (2020-11-25T13:40:08Z) - Hierarchical Adaptive Contextual Bandits for Resource Constraint based
Recommendation [49.69139684065241]
コンテキスト多重武装バンディット(MAB)は、様々な問題において最先端のパフォーマンスを達成する。
本稿では,階層型適応型文脈帯域幅法(HATCH)を提案する。
論文 参考訳(メタデータ) (2020-04-02T17:04:52Z) - Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning [100.73223416589596]
深層強化学習を用いたコスト依存型ポートフォリオ選択手法を提案する。
具体的には、価格系列パターンと資産相関の両方を抽出するために、新しい2ストリームポートフォリオポリシーネットワークを考案した。
蓄積したリターンを最大化し、強化学習によるコストの両立を抑えるため、新たなコスト感受性報酬関数が開発された。
論文 参考訳(メタデータ) (2020-03-06T06:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。