論文の概要: Controlling Authority Retrieval: A Missing Retrieval Objective for Authority-Governed Knowledge
- arxiv url: http://arxiv.org/abs/2604.14488v2
- Date: Sun, 19 Apr 2026 10:40:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 13:51:31.118808
- Title: Controlling Authority Retrieval: A Missing Retrieval Objective for Authority-Governed Knowledge
- Title(参考訳): オーソリティ検索の制御:オーソリティが支配する知識を損なう検索対象
- Authors: Andre Bacellar,
- Abstract要約: 私たちはこれを CAR と呼び、セマンティックアンカー q、すなわち front(cl(A_k(q))) に対して現在アクティブな権限を取得する。
我々は、セキュリティアドバイザリ、SCOTUSオーバーラリングペア、FDA薬物記録の3つの実世界のデータセットを評価した。
GPT-4ominiの実験では、RAGは、パッチが存在するクエリの39%に対して、明示的な"パッチなし"のクレームを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In law, regulatory regimes for pharmaceuticals and software security, newer authorities can revoke older established ones even when semantically distant. We call this CAR: retrieving the currently active authority frontier for a semantic anchor q, that is, front(cl(A_k(q))). This differs from finding the most similar document by relevance score: argmax_d s(q, d). Theorem 4 characterizes when a set R truly covers the active authority set for q with TCA(R, q)=1, providing conditions necessary and sufficient for any retrieved set R: frontier inclusion (front(cl(A_k(q))) contained in R) and no-ignored-superseder (no superseding document exists in the corpus outside R). Proposition 2 shows that TCA@k <= phi(q) * R_anchor(q) in the worst case over any scope-indexed algorithm, proved by an adversarial permutation argument. We evaluated on three real-world datasets: security advisories (Dense TCA@5=0.270, two-stage 0.975), SCOTUS overruling pairs (Dense TCA=0.172, two-stage 0.926), and FDA drug records (Dense TCA=0.064, two-stage 0.774). A GPT-4o-mini experiment shows Dense RAG produces explicit "not patched" claims for 39% of queries where a patch exists; two-stage cuts this to 16%. Four benchmark datasets, domain adapters, and a single-command scorer are released at https://github.com/andremir/car-retrieval.
- Abstract(参考訳): 法律では、医薬品やソフトウェアセキュリティの規制体制において、新しい当局は、意味的に離れたところでも、古い確立したものを取り消すことができる。
私たちはこの CAR と呼んでいる: セマンティックアンカー q,すなわち front(cl(A_k(q))) に対して、現在アクティブなオーソリティフロンティアを取得する。
これは、関係スコア argmax_d s(q, d) によって最も類似した文書を見つけることと異なる。
定理4は、集合 R が真に q の活性権威集合を TCA(R, q)=1 でカバーし、任意の検索された集合 R に対して必要かつ十分な条件を与えるときに特徴づける:フロンティア包含 (front(cl(A_k(q))) と非無視上命題 (no-ignored-superseder) (R の外のコーパスには上述の文書は存在しない)。
命題2は、TA@k <= phi(q) * R_anchor(q) が任意のスコープインデックス付きアルゴリズムよりも最悪の場合において、逆置換論によって証明されることを示す。
セキュリティアドバイザリー(Dense TCA@5=0.270, two-stage 0.975),SCOTUS overruling pairs(Dense TCA=0.172, two-stage 0.926),FDA 薬物記録(Dense TCA=0.064, two-stage 0.774)の3つの実世界のデータセットについて検討した。
GPT-4o-mini実験では、Dense RAGはパッチが存在するクエリの39%に対して、明示的な“パッチなし”のクレームを生成する。
4つのベンチマークデータセット、ドメインアダプタ、シングルコマンドスコアラーがhttps://github.com/andremir/car-retrieval.comでリリースされた。
関連論文リスト
- Empirical Validation of the Classification-Verification Dichotomy for AI Safety Gates [0.0]
オラクルベースの安全ゲートは、AIシステムが数百回以上のイテレーションを改善するため、信頼できる監視を維持することはできない。
自己改善自体の安全性ではなく、分類に特有であることを示す。
論文 参考訳(メタデータ) (2026-03-31T13:54:36Z) - Distilling Deep Reinforcement Learning into Interpretable Fuzzy Rules: An Explainable AI Framework [1.9180507495574395]
深層強化学習(DRL)エージェントは、継続的な制御において顕著なパフォーマンスを達成するが、不透明なままであり、安全クリティカルなドメインへの展開を妨げる。
既存の説明可能性法は、局所的な洞察(SHAP、LIME)のみを提供するか、過度に単純化されたサロゲートを使用し、連続的なダイナミクスを捉えることができない。
本研究では、状態可読パーティショニングのためのK-Meansクラスタリングを通じて、ニューラルポリシーを人間可読IF-THENルールに蒸留するファジィシステム(FCS)を提案する。
説明焦点を測定するルール密度(FRAD)、語彙完全性を検証するファジィ集合被覆(FSC)、行動空間の粒度(Action Space Granularity)の3つの定量化指標が導入された。
論文 参考訳(メタデータ) (2026-02-24T23:53:01Z) - ACAR: Adaptive Complexity Routing for Multi-Model Ensembles with Auditable Decision Traces [3.151184728006369]
本稿では,聴覚条件下でのマルチモデルオーケストレーションのための測定フレームワークACARを提案する。
ACARは、N=3プローブサンプルから計算した自己整合分散(sigma)を使用して、単一モデル、2モデル、3モデル実行モードでタスクをルーティングする。
我々は4つのベンチマークにまたがる1,510のタスクに対してACARを評価し、7,550以上の監査可能な実行を生成した。
論文 参考訳(メタデータ) (2026-02-06T23:27:17Z) - Reinforcement Learning with Verifiable yet Noisy Rewards under Imperfect Verifiers [90.50039419576807]
RLVR(Reinforcement Learning with Verifiable Rewards)は、人為的なラベル付けを避けるために、自動検証に対するポリシーを訓練する。
認証ハッキングの脆弱性を軽減するため、多くのRLVRシステムはトレーニング中にバイナリ$0,1$の報酬を破棄する。
この選択にはコストがかかる:textitfalse negatives(正しい回答、FNを拒絶)とtextitfalse positives(間違った回答、FPを受け入れる)を導入する。
論文 参考訳(メタデータ) (2025-10-01T13:56:44Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Abduct, Act, Predict: Scaffolding Causal Inference for Automated Failure Attribution in Multi-Agent Systems [20.846301581161978]
マルチエージェントシステムにおける障害帰属は、批判的だが未解決の課題である。
現在の手法では、これを長い会話ログ上のパターン認識タスクとして扱う。
A2P Scaffoldingは、パターン認識から構造化因果推論タスクへの障害帰属を変換する。
論文 参考訳(メタデータ) (2025-09-12T16:51:15Z) - Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear
Contextual Bandits and Markov Decision Processes [59.61248760134937]
本稿では,$tildeO(sqrtT+zeta)$を後悔するアルゴリズムを提案する。
提案アルゴリズムは、最近開発された線形文脈帯域からの不確実性重み付き最小二乗回帰に依存する。
本稿では,提案アルゴリズムをエピソディックなMDP設定に一般化し,まず汚職レベル$zeta$への付加的依存を実現する。
論文 参考訳(メタデータ) (2022-12-12T15:04:56Z) - Linear Contextual Bandits with Adversarial Corruptions [91.38793800392108]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。
逆汚染レベルに適応する分散認識アルゴリズムをC$で提案する。
論文 参考訳(メタデータ) (2021-10-25T02:53:24Z) - Second-Order Provable Defenses against Adversarial Attacks [63.34032156196848]
ネットワークの固有値が有界であれば、凸最適化を用いて$l$ノルムの証明を効率的に計算できることを示す。
認証精度は5.78%,44.96%,43.19%であった。
論文 参考訳(メタデータ) (2020-06-01T05:55:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。