論文の概要: A Truthful Owner-Assisted Scoring Mechanism
- arxiv url: http://arxiv.org/abs/2206.08149v1
- Date: Tue, 14 Jun 2022 14:35:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-06-19 03:37:51.868190
- Title: A Truthful Owner-Assisted Scoring Mechanism
- Title(参考訳): 真の所有者支援スコアリング機構
- Authors: Weijie J. Su
- Abstract要約: そこで,Bob は真偽情報を用いた最適二乗誤差推定器が得られることを示す。
推定品目数は、品目数が大きく、生品目数が非常にうるさい場合には、生品目よりもかなり正確である。
- 参考スコア(独自算出の注目度): 28.364491520646084
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Alice (owner) has knowledge of the underlying quality of her items measured
in grades. Given the noisy grades provided by an independent party, can Bob
(appraiser) obtain accurate estimates of the ground-truth grades of the items
by asking Alice a question about the grades? We address this when the payoff to
Alice is additive convex utility over all her items. We establish that if Alice
has to truthfully answer the question so that her payoff is maximized, the
question must be formulated as pairwise comparisons between her items. Next, we
prove that if Alice is required to provide a ranking of her items, which is the
most fine-grained question via pairwise comparisons, she would be truthful. By
incorporating the ground-truth ranking, we show that Bob can obtain an
estimator with the optimal squared error in certain regimes based on any
possible way of truthful information elicitation. Moreover, the estimated
grades are substantially more accurate than the raw grades when the number of
items is large and the raw grades are very noisy. Finally, we conclude the
paper with several extensions and some refinements for practical
considerations.
- Abstract(参考訳): アリス(オーナー)は、グレードで測定された項目の根底にある品質について知識を持っている。
独立党によって提供される騒がしい格付けを考えると、ボブ(審査官)はアリスに格付けについて質問することで、アイテムの真下級の正確な見積もりを得ることができるか。
Aliceに対する支払いが、すべてのアイテムに対して付加的な凸ユーティリティである場合、この問題に対処します。
アリスが真に答えて支払いを最大化するのであれば、その質問はアイテム間のペア比較として定式化されなければならない。
次に、アリスが彼女の項目のランク付けを要求され、それはペア比較による最もきめ細かい質問であるなら、彼女は真実であるであろうことを証明します。
接地ランキングを組み込むことにより、ボブは、真理的な情報の導出のあらゆる方法に基づいて、特定のレジームにおいて最適な二乗誤差を持つ推定子を得ることができることを示す。
また, 推定等級は, 項目数が大きく, ノイズが大きい場合に, 生品数よりもかなり正確である。
最後に,本論文をいくつかの拡張と実践的考察によりまとめる。
関連論文リスト
- R-PRM: Reasoning-Driven Process Reward Modeling [53.06844294668382]
プロセス・リワード・モデル(Process Reward Models, PRM)は、各推論ステップを評価することによって、有望なソリューションとして登場した。
既存のPRMは評価スコアを直接出力し、学習効率と評価精度の両方を制限する。
推論駆動プロセスリワードモデリング(R-PRM)を提案する。
R-PRMは限られたアノテーションからシードデータを生成し、効果的にモデルの推論能力をブートストラップします。
論文 参考訳(メタデータ) (2025-03-27T09:23:08Z) - Analysis of the ICML 2023 Ranking Data: Can Authors' Opinions of Their Own Papers Assist Peer Review in Machine Learning? [52.00419656272129]
我々は2023年の国際機械学習会議(ICML)で実験を行った。
我々はそれぞれ2,592件の応募書を含む1,342件のランク付けを受けた。
著者によるランキングを用いて生のレビュースコアを校正するイソトニックメカニズムに注目した。
論文 参考訳(メタデータ) (2024-08-24T01:51:23Z) - Evaluating Human Alignment and Model Faithfulness of LLM Rationale [66.75309523854476]
大規模言語モデル(LLM)が,その世代を理論的にどのように説明するかを考察する。
提案手法は帰属に基づく説明よりも「偽り」が少ないことを示す。
論文 参考訳(メタデータ) (2024-06-28T20:06:30Z) - Eliciting Informative Text Evaluations with Large Language Models [14.176332393753906]
生成的ピア予測機構(GPPM)と生成的シンプシスピア予測機構(GSPPM)の2つのメカニズムを導入する。
我々は,この機構がベイズ・ナッシュ均衡(近似)として高い努力と真理を動機付けることができることを示した。
ICLRデータセットでは、人間によるレビュー、GPT-4生成レビュー、GPT-3.5生成レビューの3つの品質レベルを、期待されるスコアの観点から区別することが可能です。
論文 参考訳(メタデータ) (2024-05-23T21:56:12Z) - Additive-Effect Assisted Learning [17.408937094829007]
我々はエージェントAliceのための2段階学習アーキテクチャを開発し、別のエージェントBobの助けを求める。
最初の段階では、Alice が Bob のデータの有用性を決定するために、プライバシを意識した仮説テストベースのスクリーニング手法を提案する。
Alice は,理論的にも数値的にも,訓練が集中的なデータからであるかのように,オラクルのパフォーマンスを達成できることを示す。
論文 参考訳(メタデータ) (2024-05-13T23:24:25Z) - What Hides behind Unfairness? Exploring Dynamics Fairness in Reinforcement Learning [52.51430732904994]
強化学習問題では、エージェントはリターンを最大化しながら長期的な公正性を考慮する必要がある。
近年の研究では様々なフェアネスの概念が提案されているが、RL問題における不公平性がどのように生じるかは定かではない。
我々は、環境力学から生じる不平等を明示的に捉える、ダイナミックスフェアネスという新しい概念を導入する。
論文 参考訳(メタデータ) (2024-04-16T22:47:59Z) - Alignment for Honesty [105.72465407518325]
最近の研究は、大きな言語モデル(LLM)を有用性と無害性と整合させることに大きく貢献している。
本稿は,LLMが知識の欠如に積極的に回答を拒むことを確実にする,エンフォネストリーにおけるアライメントの重要性を論じる。
これらの課題に対処するために、まずは正確な問題定義を確立し、儒教の分析に触発された「誠実さ」を定義します。
論文 参考訳(メタデータ) (2023-12-12T06:10:42Z) - Eliciting Honest Information From Authors Using Sequential Review [13.424398627546788]
本稿では,著者からランキング情報を真に引き出すための逐次レビュー機構を提案する。
鍵となる考え方は、提供されたランキングに基づいて著者の論文をシーケンスでレビューし、前の論文のレビュースコアについて次の論文のレビューを条件付けることである。
論文 参考訳(メタデータ) (2023-11-24T17:27:39Z) - Faithful Knowledge Distillation [75.59907631395849]
i) 教師と学生は、正しく分類されたデータセットのサンプルに近い点で意見が一致しないか、(ii) 蒸留した学生は、データセットのサンプルに関する教師と同じくらい自信があるか、という2つの重要な質問に焦点をあてる。
これらは、安全クリティカルな設定の中で、堅牢な教師から訓練された小さな学生ネットワークを配置することを考えると、重要な問題である。
論文 参考訳(メタデータ) (2023-06-07T13:41:55Z) - Isotonic Mechanism for Exponential Family Estimation in Machine Learning Peer Review [28.06558596439521]
2023年、ICML(International Conference on Machine Learning)は、複数の投稿者に対して、認識された品質に基づいて応募をランク付けするよう要求した。
我々は、これらの著者特定ランキングを用いて、機械学習および人工知能会議におけるピアレビューを強化する。
著者特定ランキングに固執しながら、原譜と密接に一致した調整されたスコアを生成する。
論文 参考訳(メタデータ) (2023-04-21T17:59:08Z) - Adam: Dense Retrieval Distillation with Adaptive Dark Examples [104.01735794498767]
本稿では,教師が持つ暗黒知識を適応暗黒エクストリームで伝達する知識蒸留フレームワークであるADAMを提案する。
2つの広く利用されているベンチマークで実験を行い、本手法の有効性を検証する。
論文 参考訳(メタデータ) (2022-12-20T12:03:19Z) - ROSCOE: A Suite of Metrics for Scoring Step-by-Step Reasoning [63.77667876176978]
大規模言語モデルでは、最終回答を正当化するためにステップバイステップの推論を生成するように促された場合、ダウンストリームタスクの解釈可能性が改善されている。
これらの推論ステップは、モデルの解釈可能性と検証を大幅に改善するが、客観的にそれらの正確性を研究することは困難である。
本稿では、従来のテキスト生成評価指標を改善し拡張する、解釈可能な教師なし自動スコアのスイートであるROSを提案する。
論文 参考訳(メタデータ) (2022-12-15T15:52:39Z) - Identifying the value of a random variable unambiguously: Quantum versus classical approaches [44.99833362998488]
量子リソースは、古典的なリソースよりも有利である。
我々は、Refereeが仲介し、AliceとBobの間でプレイするゲームに基づいてそのようなタスクを構築する。
アリスが古典的情報を限られた量送った場合、ゲームに勝つには「古典的情報の限られた量」の量子アナログが十分であるのに対し、ゲームは勝てないことを示す。
論文 参考訳(メタデータ) (2022-11-16T20:28:49Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Simultaneous Measurement and Entanglement [0.0]
LOCCがAliceとBobに最適な2つの製品状態の区別を可能にすることを示す。
LOCCは、製品状態の区別のためのベルペアよりも、ほぼ常に有効であることがわかった。
論文 参考訳(メタデータ) (2022-01-25T23:11:29Z) - You Are the Best Reviewer of Your Own Papers: An Owner-Assisted Scoring
Mechanism [17.006003864727408]
イソトニックメカニズムは、所有者が提供にインセンティブを与えている特定の情報を活用することで、不正確な生のスコアを改善する。
凸最適化問題を解くことにより,各項目の調整点を報告する。
私は、この所有者支援機構によって提供される調整されたスコアが、レビュアーによって提供される生のスコアよりもかなり正確であることを証明します。
論文 参考訳(メタデータ) (2021-10-27T22:11:29Z) - Ranking Scientific Papers Using Preference Learning [48.78161994501516]
我々はこれをピアレビューテキストとレビュアースコアに基づく論文ランキング問題とみなした。
ピアレビューに基づいて最終決定を行うための,新しい多面的総合評価フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-02T19:41:47Z) - Linear Gaussian Quantum State Smoothing: Understanding the optimal
unravelings for Alice to estimate Bob's state [0.0]
量子状態平滑化(quantum state smoothing)は、特定の時間における量子状態の見積を構築する手法である。
アリスの平滑化の有効性に対するボブの測定選択の影響は、近年多くの論文で研究されている。
アリスの測度選択から最適な測度選択を近似できる簡単な仮説を考案する。
論文 参考訳(メタデータ) (2020-08-31T04:04:50Z) - Superadditivity of channel capacity through quantum fields [0.0]
本研究では,送信者のアリスが量子場における情報伝達障害を引き起こすシナリオについて検討する。
我々は、Aliceと受信機のBobの間のチャネル容量が、Bobが検出器を配置するだけでなく、Aliceの符号化操作の因果的未来にも及んでいることを発見した。
論文 参考訳(メタデータ) (2020-02-11T00:53:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。