論文の概要: Diversification as Risk Minimization
- arxiv url: http://arxiv.org/abs/2510.22681v1
- Date: Sun, 26 Oct 2025 13:51:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.323795
- Title: Diversification as Risk Minimization
- Title(参考訳): リスク最小化としての多様化
- Authors: Rikiya Takehi, Fernando Diaz, Tetsuya Sakai,
- Abstract要約: 分散化アルゴリズムは、単純な非分散化アルゴリズムほど堅牢ではないことを示す。
クエリにおいて、最小限の意図によって直面する期待されるリスクを計測するVRiskを導入する。
次に、証明可能な近似保証を備えた高速グリーディリランカであるVRiskerを提案する。
- 参考スコア(独自算出の注目度): 55.503117695676416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Users tend to remember failures of a search session more than its many successes. This observation has led to work on search robustness, where systems are penalized if they perform very poorly on some queries. However, this principle of robustness has been overlooked within a single query. An ambiguous or underspecified query (e.g., ``jaguar'') can have several user intents, where popular intents often dominate the ranking, leaving users with minority intents unsatisfied. Although the diversification literature has long recognized this issue, existing metrics only model the average relevance across intents and provide no robustness guarantees. More surprisingly, we show theoretically and empirically that many well-known diversification algorithms are no more robust than a naive, non-diversified algorithm. To address this critical gap, we propose to frame diversification as a risk-minimization problem. We introduce VRisk, which measures the expected risk faced by the least-served fraction of intents in a query. Optimizing VRisk produces a robust ranking, reducing the likelihood of poor user experiences. We then propose VRisker, a fast greedy re-ranker with provable approximation guarantees. Finally, experiments on NTCIR INTENT-2, TREC Web 2012, and MovieLens show the vulnerability of existing methods. VRisker reduces worst-case intent failures by up to 33% with a minimal 2% drop in average performance.
- Abstract(参考訳): ユーザは、多くの成功よりも、検索セッションの失敗を思い出す傾向があります。
この観察により、検索の堅牢性に取り組み、いくつかのクエリで非常にパフォーマンスが悪い場合、システムはペナル化される。
しかし、この堅牢性の原則は単一のクエリで見過ごされている。
曖昧で不明瞭なクエリ(例: `jaguar'')は、いくつかのユーザインテントを持ち、一般的なインテントがランキングを支配し、少数ユーザのインテントに不満を抱かせる。
多様化文学は長い間この問題を認識してきたが、既存のメトリクスは意図を越えた平均的な関係をモデル化し、堅牢性を保証するものではない。
より驚くべきことに、多くのよく知られた多様化アルゴリズムが、単純で非分散化されたアルゴリズムよりも頑丈でないことを理論的、実証的に示している。
この限界に対処するため,リスク最小化問題として多角化の枠組みを提案する。
クエリにおいて、最小限の意図によって直面する期待されるリスクを計測するVRiskを導入する。
VRiskの最適化はロバストなランキングを生み出し、ユーザー体験の低さを軽減します。
次に、証明可能な近似保証を備えた高速グリーディリランカであるVRiskerを提案する。
最後に、NTCIR INTENT-2、TREC Web 2012、MovieLensでの実験は、既存の方法の脆弱性を示している。
VRiskerは最悪の意図的な失敗を最大33%削減し、平均的なパフォーマンスは2%低下する。
関連論文リスト
- Sample Smart, Not Hard: Correctness-First Decoding for Better Reasoning in LLMs [72.82403830490084]
我々は、復号規則は正確さによって校正されるべきであり、自信だけではならないと論じている。
Greedy-Threshold はこの目標を達成するための単純な戦略を提案します。
この結果から,不確実性の下での復号化が問題視され,数学や一般推論のベンチマークで有意な差がみられた。
論文 参考訳(メタデータ) (2025-10-07T14:46:12Z) - Achievable distributional robustness when the robust risk is only partially identified [8.192907805418583]
安全クリティカルなアプリケーションでは、機械学習モデルは最悪の分散シフトの下でうまく一般化すべきである。
我々は、識別可能性に関係なく常に明確に定義された、ロバスト性の新しい尺度として、最悪のロバストリスクを導入します。
まず, 既存のロバストネス法が部分的に同定可能な場合において, 確実に準最適であることを示す。
論文 参考訳(メタデータ) (2025-02-04T20:42:47Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - FasterRisk: Fast and Accurate Interpretable Risk Scores [17.015744876065195]
リスクスコアは整数係数を持つ疎線形モデルである。
最近の研究では数理プログラミングが使われており、計算が遅くなっている。
データから得られた高品質なリスクスコアのコレクションを効率的に作成するためのアプローチを導入する。
論文 参考訳(メタデータ) (2022-10-12T00:36:01Z) - Tightening the Approximation Error of Adversarial Risk with Auto Loss
Function Search [12.263913626161155]
一般的な評価手法は、モデルの逆方向リスクをロバスト性指標として近似することである。
本稿では,エラーを厳格化するための損失関数を探索する最初の手法であるAutoLoss-ARを提案する。
その結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-11-09T11:47:43Z) - Online Sign Identification: Minimization of the Number of Errors in
Thresholding Bandits [27.09804256642197]
我々はFrank-Wolfeアルゴリズムにインスパイアされたアルゴリズム群を紹介する。
我々は幅広い問題に対して新しい明示的アルゴリズムを構築した。
我々はこの現象を洞察に富んだおもちゃの問題で説明する。
論文 参考訳(メタデータ) (2021-10-18T09:36:36Z) - Efficient First-Order Contextual Bandits: Prediction, Allocation, and
Triangular Discrimination [82.52105963476703]
統計的学習、オンライン学習、その他における繰り返しのテーマは、低騒音の問題に対してより速い収束率が可能であることである。
1次保証は統計的およびオンライン学習において比較的よく理解されている。
三角識別と呼ばれる対数損失と情報理論量が一階保証を得る上で基本的な役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-07-05T19:20:34Z) - Hidden Cost of Randomized Smoothing [72.93630656906599]
本稿では、現在のランダム化平滑化による副作用を指摘する。
具体的には,1)スムーズな分類器の決定境界が小さくなり,クラスレベルでの精度の相違が生じること,2)学習過程における雑音増強の適用は,一貫性のない学習目的による縮小問題を必ずしも解決しない,という2つの主要なポイントを具体化し,証明する。
論文 参考訳(メタデータ) (2020-03-02T23:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。