論文の概要: Game-Theoretical Analysis of Reviewer Rewards in Peer-Review Journal
Systems: Analysis and Experimental Evaluation using Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2305.12088v1
- Date: Sat, 20 May 2023 04:13:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 00:45:31.870494
- Title: Game-Theoretical Analysis of Reviewer Rewards in Peer-Review Journal
Systems: Analysis and Experimental Evaluation using Deep Reinforcement
Learning
- Title(参考訳): ピアレビュージャーナルシステムにおけるレビュアー報酬のゲーム理論的分析:深層強化学習を用いた分析と実験評価
- Authors: Minhyeok Lee
- Abstract要約: 本稿では,Voucherをベースとしたリビューア報酬システムについて,2人プレイヤゲームとして概念化する。
我々は,このバイアスを緩和する目的で,代替報酬システムを提案し,数学的に定式化する。
- 参考スコア(独自算出の注目度): 2.458437232470188
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we navigate the intricate domain of reviewer rewards in
open-access academic publishing, leveraging the precision of mathematics and
the strategic acumen of game theory. We conceptualize the prevailing
voucher-based reviewer reward system as a two-player game, subsequently
identifying potential shortcomings that may incline reviewers towards binary
decisions. To address this issue, we propose and mathematically formalize an
alternative reward system with the objective of mitigating this bias and
promoting more comprehensive reviews. We engage in a detailed investigation of
the properties and outcomes of both systems, employing rigorous
game-theoretical analysis and deep reinforcement learning simulations. Our
results underscore a noteworthy divergence between the two systems, with our
proposed system demonstrating a more balanced decision distribution and
enhanced stability. This research not only augments the mathematical
understanding of reviewer reward systems, but it also provides valuable
insights for the formulation of policies within journal review system. Our
contribution to the mathematical community lies in providing a game-theoretical
perspective to a real-world problem and in the application of deep
reinforcement learning to simulate and understand this complex system.
- Abstract(参考訳): 本稿では,オープンアクセスの学術出版におけるレビュアー報酬の複雑な領域を,数学の精度とゲーム理論の戦略的累積を利用して探索する。
本稿では,2プレイヤーゲームとして広く普及しているVoucherベースのレビュアー報酬システムを概念化し,リビュアーが二者決定に傾注する可能性のある潜在的な欠点を特定する。
そこで我々は,このバイアスを緩和し,より包括的なレビューを促進することを目的として,代替報酬システムを提案し,数学的に定式化する。
我々は,厳密なゲーム理論解析と深層強化学習シミュレーションを用いて,両システムの特性と結果の詳細な調査を行う。
提案するシステムは,よりバランスの取れた意思決定分布を示し,安定性を高めた。
本研究は,レビュアー報酬システムの数学的理解を高めるだけでなく,ジャーナルレビューシステムにおけるポリシーの定式化にも有用な洞察を提供する。
我々の数学的コミュニティへの貢献は、現実世界の問題に対するゲーム理論的な視点を提供することと、この複雑なシステムをシミュレートし理解するための深層強化学習の適用である。
関連論文リスト
- Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques [65.55451717632317]
我々は,MARLHF(Multi-Agent Reinforcement Learning from Human Feedback)について検討し,理論的基礎と実証的検証の両方について検討した。
我々は,このタスクを,一般ゲームにおける嗜好のみのオフラインデータセットからナッシュ均衡を識別するものとして定義する。
本研究は,MARLHFの多面的アプローチを基礎として,効果的な嗜好に基づくマルチエージェントシステムの実現を目指している。
論文 参考訳(メタデータ) (2024-09-01T13:14:41Z) - Tractable Equilibrium Computation in Markov Games through Risk Aversion [12.980882140751895]
リスク-逆量子応答平衡(RQE)は,すべての$n$プレーヤ行列と有限ホリゾンマルコフゲームで計算可能であることを示す。
RQEは下層のゲーム構造とは独立であり、エージェントのリスク回避度と有界有理性にのみ依存する。
論文 参考訳(メタデータ) (2024-06-20T09:53:56Z) - Cooperation Dynamics in Multi-Agent Systems: Exploring Game-Theoretic Scenarios with Mean-Field Equilibria [0.0]
本稿では,ゲーム理論のシナリオ,すなわちIterated Prisoner's Dilemmaにおける協調を呼び起こす戦略について検討する。
既存の協調戦略は、繰り返しゲームにおけるグループ指向行動を促進する効果について分析する。
この研究は、指数関数的に増加するエージェント集団のシナリオにまで及んでいる。
論文 参考訳(メタデータ) (2023-09-28T08:57:01Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Retrieval Augmentation for Commonsense Reasoning: A Unified Approach [64.63071051375289]
検索強化コモンセンス推論(RACo)の統一的枠組みを提案する。
提案するRACoは,他の知識強化手法よりも優れる。
論文 参考訳(メタデータ) (2022-10-23T23:49:08Z) - A Ranking Game for Imitation Learning [22.028680861819215]
模倣を、$textitpolicy$と$textitreward$関数の間の2プレイヤーランキングベースのStackelbergゲームとして扱う。
このゲームは、オフラインの好みから学習する逆強化学習(IRL)法と方法の両方の多くのサブセットを含んでいる。
本研究では,均衡条件下での準最適模倣学習を容易にするために,政策性能のランク付けに使用される損失関数の要件を理論的に分析する。
論文 参考訳(メタデータ) (2022-02-07T19:38:22Z) - Learning Long-Term Reward Redistribution via Randomized Return
Decomposition [18.47810850195995]
軌跡フィードバックを用いたエピソード強化学習の問題点について考察する。
これは、エージェントが各軌道の終端で1つの報酬信号しか取得できないような、報酬信号の極端な遅延を指す。
本稿では,代償再分配アルゴリズムであるランダムリターン分解(RRD)を提案する。
論文 参考訳(メタデータ) (2021-11-26T13:23:36Z) - AR-LSAT: Investigating Analytical Reasoning of Text [57.1542673852013]
テキストの分析的推論の課題を研究し、1991年から2016年までのロースクール入学試験からの質問からなる新しいデータセットを紹介します。
我々は,この課題をうまくこなすために必要な知識理解と推論能力を分析する。
論文 参考訳(メタデータ) (2021-04-14T02:53:32Z) - Estimating and Improving Fairness with Adversarial Learning [65.99330614802388]
本研究では,深層学習に基づく医療画像解析システムにおけるバイアスの同時緩和と検出を目的としたマルチタスク・トレーニング戦略を提案する。
具体的には,バイアスに対する識別モジュールと,ベース分類モデルにおける不公平性を予測するクリティカルモジュールを追加することを提案する。
大規模で利用可能な皮膚病変データセットのフレームワークを評価します。
論文 参考訳(メタデータ) (2021-03-07T03:10:32Z) - Hindsight and Sequential Rationality of Correlated Play [18.176128899338433]
私たちは、修正された振る舞いで達成できたことに対して、強いパフォーマンスを後見で保証するアルゴリズムを検討します。
我々は,学習の隠れた枠組みを,逐次的な意思決定の場で開発し,提唱する。
本稿では,それぞれの平衡の強さと弱さを文献に示す例を示す。
論文 参考訳(メタデータ) (2020-12-10T18:30:21Z) - KompaRe: A Knowledge Graph Comparative Reasoning System [85.72488258453926]
本稿では,複数の手がかりに対する共通点と矛盾点の推測を目的とした知識グラフの比較推論を提案する。
我々は,大規模な知識グラフに対して比較推論機能を提供する,最初のプロトタイプシステムであるKompaReを開発した。
論文 参考訳(メタデータ) (2020-11-06T04:57:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。