Fugu-MT 論文翻訳(概要): Assessing Confidence with Assurance 2.0

論文の概要: Assessing Confidence with Assurance 2.0

arxiv url: http://arxiv.org/abs/2205.04522v1
Date: Tue, 3 May 2022 22:10:59 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-16 00:52:05.278155
Title: Assessing Confidence with Assurance 2.0
Title（参考訳）: Assurance 2.0による信頼性の評価
Authors: John Rushby and Robin Bloomfield
Abstract要約: 信頼は単一の属性や測定に還元できない、と我々は主張する。ポジティブ・パースペクティブ(Positive Perspectives)は、事件の証拠と全体論が一体化して肯定的な声明を下す程度を考察する。否定的な視点は、典型的には敗者として表されるこの事件に対する疑念と挑戦を記録している。 Residual Doubts: 世界は不確実であり、すべての潜在的な敗者を解決することはできない。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: An assurance case is intended to provide justifiable confidence in the truth of its top claim, which typically concerns safety or security. A natural question is then "how much" confidence does the case provide? We argue that confidence cannot be reduced to a single attribute or measurement. Instead, we suggest it should be based on attributes that draw on three different perspectives: positive, negative, and residual doubts. Positive Perspectives consider the extent to which the evidence and overall argument of the case combine to make a positive statement justifying belief in its claims. We set a high bar for justification, requiring it to be indefeasible. The primary positive measure for this is soundness, which interprets the argument as a logical proof. Confidence in evidence can be expressed probabilistically and we use confirmation measures to ensure that the "weight" of evidence crosses some threshold. In addition, probabilities can be aggregated from evidence through the steps of the argument using probability logics to yield what we call probabilistic valuations for the claims. Negative Perspectives record doubts and challenges to the case, typically expressed as defeaters, and their exploration and resolution. Assurance developers must guard against confirmation bias and should vigorously explore potential defeaters as they develop the case, and should record them and their resolution to avoid rework and to aid reviewers. Residual Doubts: the world is uncertain so not all potential defeaters can be resolved. We explore risks and may deem them acceptable or unavoidable. It is crucial however that these judgments are conscious ones and that they are recorded in the assurance case. This report examines the perspectives in detail and indicates how Clarissa, our prototype toolset for Assurance 2.0, assists in their evaluation.
Abstract（参考訳）: アシュアランス・ケースは、安全やセキュリティに関する主要な主張の真相を正当化できる信頼を提供するためのものである。自然な疑問は、このケースがどの程度の信頼を提供するのか、ということです。信頼は単一の属性や測定に還元できない、と我々は主張する。代わりに、それは3つの異なる視点、すなわち正、負、および残余の疑念に基づくべきだと提案する。ポジティブ・パースペクティブ(Positive Perspectives)は、事件の証拠と全体的な議論が組み合わさった範囲を、その主張に対する信念を正当化する肯定的な声明として考える。私たちは正当化のために高い基準を設定しました。これに対する第一の正の測度は音性であり、これは議論を論理的証明として解釈する。証拠の信頼は確率論的に表すことができ、証拠の「重み」がしきい値を超えたことを保証するための確認措置を用いる。さらに、確率論理を用いて議論のステップを通じて証拠から確率を集約して、我々がクレームの確率的評価と呼ぶものを得ることもできる。否定的な視点は、典型的には敗者として表現される事件に対する疑念と挑戦とその探索と解決を記録している。保証開発者は、確認バイアスを回避し、ケースを開発する際に、潜在的な敗者を探究し、再作業を避けてレビュアーを助けるために、それらとその解決を記録すべきである。 Residual Doubts: 世界は不確実であり、すべての潜在的な敗者を解決することはできない。リスクを探求し、受け入れがたい、あるいは避けられないと判断する。しかし、これらの判断は意識的なものであり、保証ケースに記録されていることは重要である。本報告では,アシュアランス2.0のプロトタイプツールセットであるClarissaがどのように評価を支援するか,その視点を詳細に検討する。

関連論文リスト

Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency [78.91846841708586]
完全な自己整合性で答えられた事実でさえ、軽微な文脈干渉の下で急速に崩壊することを示します。本研究では,概念的近傍における応答コヒーレンスを評価する信念の構造尺度であるNighbor-Consistency Belief(NCB)を提案する。また、文脈不変の信念構造を最適化し、長い知識の脆さを約30%低減する構造意識訓練(SAT)を提案する。
論文参考訳（メタデータ） (2026-01-09T16:23:21Z)
ADVICE: Answer-Dependent Verbalized Confidence Estimation [7.331438721730309]
言語的信頼の基盤となる力学を詳細に分析する。我々は、回答の独立性を重要な要因とみなし、モデルが自身の回答に自信を持てないことを前提としています。本稿では,回答基底の信頼度推定を容易にする微調整フレームワークを提案する。
論文参考訳（メタデータ） (2025-10-13T02:18:33Z)
Confidential Guardian: Cryptographically Prohibiting the Abuse of Model Abstention [65.47632669243657]
不正直な機関は、不確実性の観点からサービスを差別または不正に否定する機構を利用することができる。我々は、ミラージュと呼ばれる不確実性誘導攻撃を導入することで、この脅威の実践性を実証する。本研究では,参照データセット上のキャリブレーションメトリクスを分析し,人工的に抑制された信頼度を検出するフレームワークであるConfidential Guardianを提案する。
論文参考訳（メタデータ） (2025-05-29T19:47:50Z)
Read Your Own Mind: Reasoning Helps Surface Self-Confidence Signals in LLMs [3.2228025627337864]
質問応答(QA)タスクにおける自己報告された言語信頼度を分析して,DeepSeek R1-32Bの不確実性の原因について検討した。我々はDeepSeekに、最終回答の前に長い連鎖を強制することで、その分布を探求する予算を与えることで、その言語スコアの有効性を大幅に改善することを示します。
論文参考訳（メタデータ） (2025-05-28T17:01:30Z)
Is the Top Still Spinning? Evaluating Subjectivity in Narrative Understanding [50.94206345567363]
曖昧なクレームにバイナリラベルを強制すると、評価の信頼性が低下する。請求項のニュアンス評価を提供する方法として,LCM生成した要約の編集を紹介する。我々は,ARMが主張の忠実性に関するアノテータ合意において,絶対的な21%の改善をもたらすことを示す。
論文参考訳（メタデータ） (2025-04-01T19:08:24Z)
All You Need for Counterfactual Explainability Is Principled and Reliable Estimate of Aleatoric and Epistemic Uncertainty [27.344785490275864]
我々は透明性研究が人工知能の基本的な概念の多くを見落としていると主張している。本質的に透明なモデルは、人間中心の説明的洞察の恩恵を受けることができる。高度なレベルでは、人工知能の基礎を透明性研究に統合することは、より信頼性が高く、堅牢で、理解可能な予測モデルを生み出すことを約束する。
論文参考訳（メタデータ） (2025-02-24T09:38:31Z)
Correctness is not Faithfulness in RAG Attributions [47.48625339105129]
ソースドキュメントを明示的に引用することで、ユーザは生成されたレスポンスを検証し、信頼を高めることができる。先行研究は引用正当性(引用された文書が対応する文をサポートするかどうか)を概ね評価している。評価された回答に対する信頼を確立するためには、引用の正しさと引用の忠実さの両方を検討する必要がある。
論文参考訳（メタデータ） (2024-12-23T21:57:11Z)
Confidence in the Reasoning of Large Language Models [0.0]
信頼度は、再考を促す際に、答えを維持するための永続性の観点から測定される。信頼は、基礎となるトークンレベルの確率によってのみ部分的に説明される。
論文参考訳（メタデータ） (2024-12-19T10:04:29Z)
On the Robustness of Adversarial Training Against Uncertainty Attacks [9.180552487186485]
学習問題において、手元のタスクに固有のノイズは、ある程度の不確実性なく推論する可能性を妨げている。本研究は、敵の例、すなわち、誤分類を引き起こす注意深く摂動されたサンプルに対する防御が、より安全で信頼性の高い不確実性推定を保証していることを実証的および理論的に明らかにする。我々は,CIFAR-10およびImageNetデータセット上で,公開ベンチマークのRobustBenchから,複数の逆ロバストモデルを評価する。
論文参考訳（メタデータ） (2024-10-29T11:12:44Z)
Criticality and Safety Margins for Reinforcement Learning [53.10194953873209]
我々は,定量化基盤真理とユーザにとっての明確な意義の両面から,批判的枠組みを定めようとしている。エージェントがn連続的ランダム動作に対するポリシーから逸脱した場合の報酬の減少として真臨界を導入する。我々はまた、真の臨界と統計的に単調な関係を持つ低オーバーヘッド計量であるプロキシ臨界の概念も導入する。
論文参考訳（メタデータ） (2024-09-26T21:00:45Z)
Confidence in Assurance 2.0 Cases [0.0]
私たちは、アシュアランス2.0と呼ばれる厳格なアプローチで、いかに自信を評価できるかを考えます。私たちの目標は信頼を損なうことであり、それを4つの異なる視点からアプローチすることです。
論文参考訳（メタデータ） (2024-09-16T19:00:21Z)
Defeaters and Eliminative Argumentation in Assurance 2.0 [0.0]
本報告では、アシュアランス2.0において、敗者、および複数レベルの敗者がどのように表現され、評価されるべきかを述べる。このプロセスの有効な懸念は、人間の判断が誤認しやすく、偏見の確認が難しいことである。
論文参考訳（メタデータ） (2024-05-16T22:10:01Z)
Uncertainty-Based Abstention in LLMs Improves Safety and Reduces Hallucinations [63.330182403615886]
大きな言語モデル(LLM)の実践的デプロイに対する大きな障壁は、信頼性の欠如である。このことが特に顕著な3つの状況は、正しさ、未解決の質問に対する幻覚、安全性である。人間のように、不確実性を理解する能力があるため、私たちが知らない質問への答えを控えるべきです。
論文参考訳（メタデータ） (2024-04-16T23:56:38Z)
The Decisive Power of Indecision: Low-Variance Risk-Limiting Audits and Election Contestation via Marginal Mark Recording [51.82772358241505]
リスクリミット監査(リスクリミット監査、RLA)は、大規模な選挙の結果を検証する技術である。我々は、効率を改善し、統計力の進歩を提供する監査の新たなファミリーを定めている。新しい監査は、複数の可能なマーク解釈を宣言できるように、キャストボイトレコードの標準概念を再考することで実現される。
論文参考訳（メタデータ） (2024-02-09T16:23:54Z)
Did You Mean...? Confidence-based Trade-offs in Semantic Parsing [52.28988386710333]
タスク指向の構文解析において、キャリブレーションモデルが共通のトレードオフのバランスを取るのにどのように役立つかを示す。次に、信頼性スコアがユーザビリティと安全性のトレードオフを最適化する上で、どのように役立つかを検証します。
論文参考訳（メタデータ） (2023-03-29T17:07:26Z)
Uncertain Evidence in Probabilistic Models and Stochastic Simulators [80.40110074847527]
我々は、不確実性を伴う観測を伴う確率論的モデルにおいて、ベイズ的推論を行うという問題について考察する。我々は、不確実な証拠をどう解釈するかを探求し、潜伏変数の推論に関連する適切な解釈の重要性を拡大する。我々は、不確実な証拠を説明するための具体的なガイドラインを考案し、特に一貫性に関する新しい洞察を提供する。
論文参考訳（メタデータ） (2022-10-21T20:32:59Z)
Demonstrating Software Reliability using Possibly Correlated Tests: Insights from a Conservative Bayesian Approach [2.152298082788376]
我々は、実行が独立したことを「疑う」という非公式な概念を定式化する。我々は、独立仮定が、評価において保守主義を損なうことができる範囲を明らかにする技術を開発する。
論文参考訳（メタデータ） (2022-08-16T20:27:47Z)
Increasing Confidence in Adversarial Robustness Evaluations [53.2174171468716]
本稿では,弱い攻撃を識別し,防御評価を弱めるテストを提案する。本テストでは,各サンプルに対する逆例の存在を保証するため,ニューラルネットワークをわずかに修正した。これまでに公表された13の防衛のうち、11の防衛について、元の防衛評価は我々のテストに失敗し、これらの防衛を破る強力な攻撃はそれを通過する。
論文参考訳（メタデータ） (2022-06-28T13:28:13Z)
An Imprecise Probability Approach for Abstract Argumentation based on Credal Sets [1.3764085113103217]
我々は,議論の確率値が不正確であることを考慮し,拡張の不確かさの度合いを計算する問題に取り組む。クレーダル集合を用いて議論の不確かさをモデル化し、これらのクレーダル集合から拡張の上下境界を計算する。
論文参考訳（メタデータ） (2020-09-16T00:52:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。