Fugu-MT 論文翻訳(概要): Two-stage Conformal Risk Control with Application to Ranked Retrieval

論文の概要: Two-stage Conformal Risk Control with Application to Ranked Retrieval

arxiv url: http://arxiv.org/abs/2404.17769v2
Date: Sat, 02 Nov 2024 08:06:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:32.092045
Title: Two-stage Conformal Risk Control with Application to Ranked Retrieval
Title（参考訳）: 2段階コンフォーマルリスク制御とランク付き検索への応用
Authors: Yunpeng Xu, Mufang Ying, Wenge Guo, Zhi Wei,
Abstract要約: 2段階のランク付け検索は、機械学習システムにとって重要な課題である。両段階の閾値を共同で同定し,各段階のリスクを制御するための統合的アプローチを提案する。提案アルゴリズムは,全ての可能なしきい値に対して,重み付けされた予測セットサイズの組み合わせをさらに最適化することにより,より効率的な予測セットを実現する。
参考スコア（独自算出の注目度）: 1.8481458455172357
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Many practical machine learning systems, such as ranking and recommendation systems, consist of two concatenated stages: retrieval and ranking. These systems present significant challenges in accurately assessing and managing the uncertainty inherent in their predictions. To address these challenges, we extend the recently developed framework of conformal risk control, originally designed for single-stage problems, to accommodate the more complex two-stage setup. We first demonstrate that a straightforward application of conformal risk control, treating each stage independently, may fail to maintain risk at their pre-specified levels. Therefore, we propose an integrated approach that considers both stages simultaneously, devising algorithms to control the risk of each stage by jointly identifying thresholds for both stages. Our algorithm further optimizes for a weighted combination of prediction set sizes across all feasible thresholds, resulting in more effective prediction sets. Finally, we apply the proposed method to the critical task of two-stage ranked retrieval. We validate the efficacy of our method through extensive experiments on two large-scale public datasets, MSLR-WEB and MS MARCO, commonly used for ranked retrieval tasks.
Abstract（参考訳）: ランキングシステムやレコメンデーションシステムなど多くの実践的な機械学習システムは、検索とランキングという2つの統合段階から構成されている。これらのシステムは、予測に固有の不確かさを正確に評価し、管理する上で重要な課題となる。これらの課題に対処するため、我々は、より複雑な2段階設定に対応するために、もともとシングルステージ問題のために設計された共形リスク制御のフレームワークを拡張した。まず、各段階を個別に扱う共形リスクコントロールの簡単な適用は、事前に特定されたレベルにおいてリスクを維持できない可能性があることを実証する。そこで本稿では,両ステージを同時に検討し,両ステージのしきい値を共同同定することで,各ステージのリスクを制御するアルゴリズムを考案する。提案アルゴリズムは,全ての可能なしきい値に対して,重み付けされた予測セットサイズの組み合わせをさらに最適化し,より効率的な予測セットを実現する。最後に,提案手法を2段階のランク付け検索のクリティカルタスクに適用する。提案手法の有効性は,MSLR-WEBとMS MARCOの2つの大規模公開データセットを用いた広範囲な実験により検証した。

関連論文リスト

MultiRisk: Multiple Risk Control via Iterative Score Thresholding [40.193623095603265]
我々は、ユーザ定義の優先順位で複数のリスク制約を強制する問題を定式化する。このシーケンシャルな構造を利用する2つの効率的な動的プログラミングアルゴリズムを導入する。提案アルゴリズムは,個々のリスクを目標レベルに近いレベルで制御できることを示す。
論文参考訳（メタデータ） (2025-12-31T03:25:30Z)
RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.38705556267917]
大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。リスク概念空間を再構築する理論的枠組みを導入する。マルチエージェント協調評価フレームワークRADARを提案する。
論文参考訳（メタデータ） (2025-09-28T09:35:32Z)
Risk-averse Fair Multi-class Classification [0.42970700836450487]
我々は,コヒーレントリスク尺度とシステムリスクの理論に基づく新たな分類枠組みを開発する。提案手法は,データがノイズが多く,(問題の次元に対して)不足していて,ラベル付けが信頼性に欠ける場合に,複数のクラスに適している。
論文参考訳（メタデータ） (2025-09-06T16:54:00Z)
Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models [46.56041622514975]
リスク管理とアセスメントのための2段階のフレームワークであるTRONを紹介する。 TRONは、2つのユーザ特定リスクレベルに制限された所望のエラー率を達成する。重複予測セットは適応性を維持しつつ、異なるリスクレベルのリスク評価に対してより効率的で安定である。
論文参考訳（メタデータ） (2024-10-10T17:50:42Z)
Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning [62.81324245896717]
我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し、このアルゴリズムは(弱)勾配支配仮定の下でのグローバルな最終点収束を保証する。制約付き制御問題に対して,我々のアルゴリズムを数値的に検証し,それらを最先端のベースラインと比較する。
論文参考訳（メタデータ） (2024-07-15T14:54:57Z)
Conformal Risk Control for Ordinal Classification [2.0189665663352936]
我々は,多くの実問題に適用可能な順序分類タスクの予測における共形リスクの制御を模索する。そこで我々は,2種類の損失関数を特殊に設計し,各ケースの予測セットを決定するアルゴリズムを開発した。提案手法の有効性を実証し、3つの異なるデータセットにおける2種類のリスクの違いを分析した。
論文参考訳（メタデータ） (2024-05-01T09:55:31Z)
Benchmarking Actor-Critic Deep Reinforcement Learning Algorithms for Robotics Control with Action Constraints [9.293472255463454]
本研究では,行動制約付き強化学習(RL)アルゴリズムの評価のためのベンチマークを提案する。複数のロボット制御環境にまたがる既存のアルゴリズムとその新しい変種を評価する。
論文参考訳（メタデータ） (2023-04-18T05:45:09Z)
Learning Disturbances Online for Risk-Aware Control: Risk-Aware Flight with Less Than One Minute of Data [33.7789991023177]
安全クリティカルなリスク認識制御の最近の進歩は、システムが直面する可能性のある障害に関するアプリオリの知識に基づいている。本稿では,リスク認識型オンラインコンテキストにおいて,これらの障害を効果的に学習する手法を提案する。
論文参考訳（メタデータ） (2022-12-12T21:40:23Z)
Evaluating Model-free Reinforcement Learning toward Safety-critical Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文参考訳（メタデータ） (2022-12-12T06:30:17Z)
A Deep Reinforcement Learning Approach to Rare Event Estimation [30.670114229970526]
自律システムの設計における重要なステップは、失敗が起こる確率を評価することである。安全クリティカルな領域では、モンテカルロサンプリングによる政策の評価が非効率であるように、失敗確率は非常に小さい。逐次意思決定システムにおいて、稀な事象の確率を効率的に推定できる2つの適応的重要度サンプリングアルゴリズムを開発した。
論文参考訳（メタデータ） (2022-11-22T18:29:14Z)
Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文参考訳（メタデータ） (2022-08-23T05:02:09Z)
Deep Learning for Systemic Risk Measures [3.274367403737527]
本研究の目的は,システム的リスク対策のための新しい方法論の枠組みを検討することである。この新たな枠組みの下で、システム的リスク対策は、集約されたシステムを保護する最小限の現金として解釈できる。ディープラーニングは、金融モデリングやリスク管理においてますます注目を集めている。
論文参考訳（メタデータ） (2022-07-02T05:01:19Z)
Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文参考訳（メタデータ） (2022-05-13T21:09:41Z)
Sample-Based Bounds for Coherent Risk Measures: Applications to Policy Synthesis and Verification [32.9142708692264]
本稿では,リスク認識の検証と政策合成に関するいくつかの問題に対処することを目的とする。まず,確率変数分布のサブセットを評価するサンプルベース手法を提案する。第二に、決定空間の大部分を上回る問題に対する解を決定するロボットベースの手法を開発する。
論文参考訳（メタデータ） (2022-04-21T01:06:10Z)
TOPS: Transition-based VOlatility-controlled Policy Search and its Global Convergence [9.607937067646617]
本稿では,遷移型ボラティリティ制御ポリシサーチ(TOPS)を提案する。このアルゴリズムは、連続した軌道ではなく(おそらく非連続的な)遷移から学習することで、リスク-逆問題の解法である。理論的解析と実験結果の両方が、リスク・逆ポリシー探索手法の最先端レベルを示している。
論文参考訳（メタデータ） (2022-01-24T18:29:23Z)
Supervised Advantage Actor-Critic for Recommender Systems [76.7066594130961]
本稿では、RL成分を学習するための負のサンプリング戦略を提案し、それを教師付き逐次学習と組み合わせる。サンプル化された(負の)作用 (items) に基づいて、平均ケース上での正の作用の「アドバンテージ」を計算することができる。 SNQNとSA2Cを4つのシーケンシャルレコメンデーションモデルでインスタンス化し、2つの実世界のデータセットで実験を行う。
論文参考訳（メタデータ） (2021-11-05T12:51:15Z)
A Regret Minimization Approach to Iterative Learning Control [61.37088759497583]
我々は、標準的な不確実性の仮定を最悪の場合の後悔に置き換える新しいパフォーマンスメトリック、計画後悔を提案します。提案アルゴリズムがいくつかのベンチマークで既存の手法よりも優れているという理論的および実証的な証拠を提供します。
論文参考訳（メタデータ） (2021-02-26T13:48:49Z)
Towards Safe Policy Improvement for Non-Stationary MDPs [48.9966576179679]
多くの実世界の利害問題は非定常性を示し、利害関係が高ければ、偽の定常性仮定に関連するコストは受け入れがたい。我々は、スムーズに変化する非定常的な意思決定問題に対して、高い信頼性で安全性を確保するための第一歩を踏み出します。提案手法は,時系列解析を用いたモデルフリー強化学習の合成により,セルドンアルゴリズムと呼ばれる安全なアルゴリズムを拡張した。
論文参考訳（メタデータ） (2020-10-23T20:13:51Z)
Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文参考訳（メタデータ） (2020-09-01T16:52:51Z)
Combining Deep Learning and Optimization for Security-Constrained Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。 SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-14T12:38:21Z)
Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文参考訳（メタデータ） (2020-06-15T10:08:39Z)
Bottom-Up Temporal Action Localization with Mutual Regularization [107.39785866001868]
TALの最先端の解決策は、3つの行動指示相のフレームレベルの確率を評価することである。学習手順を相互に規則化するための2つの規則化用語を導入する。実験は2つの人気のTALデータセット、THUMOS14とActivityNet1.3で行われている。
論文参考訳（メタデータ） (2020-02-18T03:59:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。