Fugu-MT 論文翻訳(概要): TRAC: Trustworthy Retrieval Augmented Chatbot

論文の概要: TRAC: Trustworthy Retrieval Augmented Chatbot

arxiv url: http://arxiv.org/abs/2307.04642v1
Date: Fri, 7 Jul 2023 02:42:06 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-11 12:30:58.971808
Title: TRAC: Trustworthy Retrieval Augmented Chatbot
Title（参考訳）: TRAC:信頼できる検索チャットボット
Authors: Shuo Li, Sangdon Park, Insup Lee, Osbert Bastani
Abstract要約: 本稿では,検索型質問応答システムに対する統計的保証を提供するフレームワークを提案する。本研究では,Natural Questionsデータセットを用いた実験結果から,提案手法が望まれるカバレッジ保証を提供することを示す。
参考スコア（独自算出の注目度）: 28.61937254015157
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Although conversational AIs have demonstrated fantastic performance, they often generate incorrect information, or hallucinations. Retrieval augmented generation has emerged as a promising solution to reduce these hallucinations. However, these techniques still cannot guarantee correctness. Focusing on question answering, we propose a framework that can provide statistical guarantees for the retrieval augmented question answering system by combining conformal prediction and global testing. In addition, we use Bayesian optimization to choose hyperparameters of the global test to maximize the performance of the system. Our empirical results on the Natural Questions dataset demonstrate that our method can provide the desired coverage guarantee while minimizing the average prediction set size.
Abstract（参考訳）: 会話AIは素晴らしいパフォーマンスを示しているが、しばしば誤った情報や幻覚を生成する。これらの幻覚を減らすための有望な解決策として、検索用拡張世代が出現している。しかし、これらの技法は依然として正確性を保証することはできない。質問応答に着目し,共形予測とグローバルテストを組み合わせて,質問応答システムにおける統計的保証を提供する枠組みを提案する。さらに、ベイズ最適化を用いて、システムの性能を最大化するために、グローバルテストのハイパーパラメータを選択する。本研究では,Natural Questionsデータセットにおける実験結果から,平均予測セットサイズを最小化しながら,所望のカバレッジ保証を提供できることを示す。

関連論文リスト

COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。 COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文参考訳（メタデータ） (2025-06-25T07:04:49Z)
Predicate-Conditional Conformalized Answer Sets for Knowledge Graph Embeddings [27.138935426612306]
CondKGCPは、コンパクトな予測セットを維持しながら、述語条件のカバレッジ保証を近似する。包括的評価により,CondKGCPの理論的保証を証明し,実証的な有効性を示す。
論文参考訳（メタデータ） (2025-05-22T16:33:20Z)
Improving the statistical efficiency of cross-conformal prediction [29.43493007296859]
Vovkは、予測セットの幅を改善するために設計された分割コンフォメーションの修正であるクロスコンフォーマル予測を導入した。後者の理論的保証を損なうことなく,より小さな予測セットを生成する手法を新たに提案する。
論文参考訳（メタデータ） (2025-03-03T13:07:28Z)
Conformal Prediction Sets with Improved Conditional Coverage using Trust Scores [52.92618442300405]
有限サンプルにおいて、正確に分布のない条件付きカバレッジを達成することは不可能である。本稿では,最も重要となる範囲を対象とするコンフォメーション予測アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-01-17T12:01:56Z)
Verifiably Robust Conformal Prediction [1.391198481393699]
本稿では、ニューラルネットワーク検証手法を利用して、敵攻撃時のカバレッジ保証を回復する新しいフレームワークであるVRCP(Verifiably Robust Conformal Prediction)を紹介する。私たちのメソッドは、回帰タスクだけでなく、$ell1$, $ell2$, $ellinfty$といった任意のノルムで束縛された摂動をサポートする最初の方法です。いずれの場合も、VRCPは名目上の範囲を達成し、SotAよりもはるかに効率的で情報的な予測領域が得られる。
論文参考訳（メタデータ） (2024-05-29T09:50:43Z)
Provably Robust Conformal Prediction with Improved Efficiency [29.70455766394585]
コンフォーマル予測は、保証されたカバレッジで不確実性セットを生成する強力なツールである。逆の例は、不正なカバレッジ率の予測セットを構築するために共形メソッドを操作することができる。本稿では,PTT(Post-Training Transformation)とRCT(Robust Conformal Training)という2つの新しい手法を提案する。
論文参考訳（メタデータ） (2024-04-30T15:49:01Z)
Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文参考訳（メタデータ） (2024-04-04T11:32:03Z)
Conformal Language Modeling [61.94417935386489]
生成言語モデル(LM)の共形予測のための新しい手法を提案する。標準共形予測は厳密で統計的に保証された予測セットを生成する。我々は,オープンドメイン質問応答,テキスト要約,ラジオロジーレポート生成において,複数のタスクに対するアプローチの約束を実証する。
論文参考訳（メタデータ） (2023-06-16T21:55:08Z)
Will My Robot Achieve My Goals? Predicting the Probability that an MDP Policy Reaches a User-Specified Behavior Target [56.99669411766284]
自律的なシステムがタスクを実行する場合、ユーザの目標を達成する確率のキャリブレーションされた見積もりを維持する必要がある。本稿では,ユーザの目標が目標間隔として指定される設定について検討する。我々は、共形予測を反転させて確率推定を計算する。
論文参考訳（メタデータ） (2022-11-29T18:41:20Z)
Almost Tight L0-norm Certified Robustness of Top-k Predictions against Adversarial Perturbations [78.23408201652984]
トップk予測は、マシンラーニング・アズ・ア・サービス、レコメンダ・システム、Web検索など、多くの現実世界のアプリケーションで使用されている。我々の研究はランダム化平滑化に基づいており、入力をランダム化することで、証明可能なロバストな分類器を構築する。例えば、攻撃者がテスト画像の5ピクセルを任意に摂動できる場合に、ImageNet上で69.2%の認定トップ3精度を達成する分類器を構築することができる。
論文参考訳（メタデータ） (2020-11-15T21:34:44Z)
Efficient Conformal Prediction via Cascaded Inference with Expanded Admission [43.596058175459746]
共形予測(CP)のための新しい手法を提案する。我々は、単一の予測の代わりに、予測候補のセットを特定することを目指している。この集合は、高い確率で正しい答えを含むことが保証される。
論文参考訳（メタデータ） (2020-07-06T23:13:07Z)
Sharp Statistical Guarantees for Adversarially Robust Gaussian Classification [54.22421582955454]
逆向きに頑健な分類の過剰リスクに対する最適ミニマックス保証の最初の結果を提供する。結果はAdvSNR(Adversarial Signal-to-Noise Ratio)の項で述べられており、これは標準的な線形分類と逆数設定との類似の考え方を一般化している。
論文参考訳（メタデータ） (2020-06-29T21:06:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。