論文の概要: The Search for Stability: Learning Dynamics of Strategic Publishers with Initial Documents
- arxiv url: http://arxiv.org/abs/2305.16695v5
- Date: Thu, 02 Jan 2025 11:29:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-03 14:32:58.207153
- Title: The Search for Stability: Learning Dynamics of Strategic Publishers with Initial Documents
- Title(参考訳): 安定の探索:初期文書を用いた戦略出版者の学習ダイナミクス
- Authors: Omer Madmon, Idan Pipano, Itamar Reinman, Moshe Tennenholtz,
- Abstract要約: 本稿では,戦略出版社が検索エンジンで最初にランク付けされる確率を最大化するゲーム理論情報検索モデルについて検討する。
一般に使用されている確率ランク付け原理(PRP)ランキングスキームは,ゲームが純粋なナッシュ均衡に達するのにしばしば失敗する不安定な環境をもたらすことを示す。
- 参考スコア(独自算出の注目度): 9.08198510616929
- License:
- Abstract: We study a game-theoretic information retrieval model in which strategic publishers aim to maximize their chances of being ranked first by the search engine while maintaining the integrity of their original documents. We show that the commonly used Probability Ranking Principle (PRP) ranking scheme results in an unstable environment where games often fail to reach pure Nash equilibrium. We propose two families of ranking functions that do not adhere to the PRP principle. We provide both theoretical and empirical evidence that these methods lead to a stable search ecosystem, by providing positive results on the learning dynamics convergence. We also define the publishers' and users' welfare, demonstrate a possible publisher-user trade-off, and provide means for a search system designer to control it. Finally, we show how instability harms long-term users' welfare.
- Abstract(参考訳): 本稿では,戦略出版社が原文書の完全性を維持しつつ,検索エンジンが優先的にランク付けする確率を最大化することを目的としたゲーム理論情報検索モデルについて検討する。
一般に使用されている確率ランク付け原理(PRP)ランキングスキームは,ゲームが純粋なナッシュ均衡に達するのにしばしば失敗する不安定な環境をもたらすことを示す。
PRPの原理に従わないランク関数の2つのファミリーを提案する。
我々は,これらの手法が,学習ダイナミクスの収束に関する肯定的な結果を提供することで,安定した探索エコシステムにつながるという理論的および実証的な証拠を提供する。
また,出版社と利用者の福祉を定義し,出版社とユーザとのトレードオフの可能性を実証し,検索システム設計者がそれを制御するための手段を提供する。
最後に,不安定性が長期的利用者の福祉にどのような影響を及ぼすかを示す。
関連論文リスト
- Putting Gale & Shapley to Work: Guaranteeing Stability Through Learning [14.448192914855674]
両面のマッチング市場は、市場の片側からの参加者が好みに応じて反対側からの参加者と一致しなければならない、一連の問題を記述している。
我々は安定解の構造を利用して、安定解を見つける可能性を改善するアルゴリズムを考案する。
論文 参考訳(メタデータ) (2024-10-06T06:47:53Z) - Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.57122943187086]
脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。
ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。
提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文 参考訳(メタデータ) (2024-07-02T03:31:21Z) - Full Stage Learning to Rank: A Unified Framework for Multi-Stage Systems [40.199257203898846]
我々は,多段階システム,すなわちGPRP(Generalized Probability Ranking Principle)のための改良されたランキング原理を提案する。
GPRPは、システムパイプラインの各ステージにおける選択バイアスと、ユーザの基本的な関心の両方を強調している。
我々の中核的な考え方は、まず次の段階における選択バイアスを推定し、次に下流モジュールの選択バイアスに最もよく適合するランキングモデルを学ぶことである。
論文 参考訳(メタデータ) (2024-05-08T06:35:04Z) - Learning Fair Ranking Policies via Differentiable Optimization of
Ordered Weighted Averages [55.04219793298687]
本稿では,学習からランクへの学習ループに,効率よく解ける公正ランキングモデルを組み込む方法について述べる。
特に,本論文は,OWA目標の制約された最適化を通じてバックプロパゲーションを行う方法を示す最初のものである。
論文 参考訳(メタデータ) (2024-02-07T20:53:53Z) - MERMAIDE: Learning to Align Learners using Model-Based Meta-Learning [62.065503126104126]
本研究では,先見のつかない学習エージェントの報酬を効率よく効果的に介入し,望ましい結果を導き出す方法について検討する。
これはオークションや課税のような現実世界の多くの設定に関係しており、プリンシパルは学習行動や実際の人々の報酬を知らないかもしれない。
モデルに基づくメタ学習フレームワークであるMERMAIDEを導入し,配布外エージェントに迅速に適応できるプリンシパルを訓練する。
論文 参考訳(メタデータ) (2023-04-10T15:44:50Z) - Whole Page Unbiased Learning to Rank [59.52040055543542]
アンバイアスド・ラーニング・トゥ・ランク(ULTR)アルゴリズムは、バイアスド・クリックデータを用いたアンバイアスド・ランキングモデルを学ぶために提案される。
本稿では,BALというアルゴリズムをランク付けするバイアス非依存学習を提案する。
実世界のデータセットによる実験結果から,BALの有効性が検証された。
論文 参考訳(メタデータ) (2022-10-19T16:53:08Z) - Solving Graph-based Public Good Games with Tree Search and Imitation
Learning [4.499055111059408]
我々は,自己関心エージェントのネットワークをグローバルに捉えた中心的プランナーの視点と,ベストショットの公共商品ゲームにおける所望の資産の最大化を目標とする。
この既知のNP完全問題に対する既存のアルゴリズムは、社会福祉以外の基準に最適化できない準最適解を見つける。
提案手法は,グラフの平衡と最大独立集合(mIS)構造特性の対応性を直接活用する。
論文 参考訳(メタデータ) (2021-06-12T12:46:44Z) - Catch Me if I Can: Detecting Strategic Behaviour in Peer Assessment [61.24399136715106]
我々は、試験やホームワークの査定や採用・昇進の査定など、様々な査定課題における戦略的行動の課題について考察する。
我々はこのような操作を検出する方法の設計に重点を置いている。
具体的には、エージェントがピアのサブセットを評価し、後に集約されたランキングを最終的な順序付けとして出力する設定について検討する。
論文 参考訳(メタデータ) (2020-10-08T15:08:40Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Controlling Fairness and Bias in Dynamic Learning-to-Rank [31.41843594914603]
暗黙のフィードバックデータからランキング関数を学習しながら、グループフェアネスの概念を確実にする学習アルゴリズムを提案する。
このアルゴリズムは、公平さと実用性の両方のために、偏見のない推定器を統合するコントローラの形をとっている。
厳密な理論基盤と収束保証に加えて、アルゴリズムが極めて実用的で堅牢であることが実証的に明らかになった。
論文 参考訳(メタデータ) (2020-05-29T17:57:56Z) - Multi-agent Reinforcement Learning for Decentralized Stable Matching [13.563394785448192]
現実の世界では、仕事、パートナー、ルームメイトなどを見つけるなど、人や個人は通常、独立して、自律的にマッチを見つけます。
このマッチングの検索は、環境に関する初期知識なしで始まる可能性がある。
本稿では,空間的に定式化された分散二面マッチング市場にマルチエージェント強化学習パラダイムを適用することを提案する。
論文 参考訳(メタデータ) (2020-05-03T15:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。