論文の概要: The Hidden Signal of Verifier Strictness: Controlling and Improving Step-Wise Verification via Selective Latent Steering
- arxiv url: http://arxiv.org/abs/2605.20745v1
- Date: Wed, 20 May 2026 05:48:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.506235
- Title: The Hidden Signal of Verifier Strictness: Controlling and Improving Step-Wise Verification via Selective Latent Steering
- Title(参考訳): 検証者の厳密さの隠れ信号:選択的潜時ステアリングによるステップワイズ検証の制御と改善
- Authors: Yefan Zhou, Yilun Zhou, Austin Xu, Soroush Vosoughi, Shafiq Joty, Jiang Gui,
- Abstract要約: 我々は,隠蔽状態の介入によって検証の厳密性を制御できるかどうかを検討した。
VerifySteerは、サンプルレベルのルーティングに潜時補正信号を使用し、段落境界に選択的に介入する。
- 参考スコア(独自算出の注目度): 67.8271652641864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative verifiers have emerged as a promising paradigm for step-wise verification, but their verification behavior is often poorly calibrated: they may be under-critical and miss erroneous steps, or over-critical and reject correct reasoning. We refer to this tendency to be overly lenient or overly critical as verifier strictness. In this work, we study whether verifier strictness can be controlled through hidden-state intervention. We uncover a verification-specific hidden-state signal: in step-wise verification, a verifier's tendency to accept or reject a solution step is encoded near the boundary of the corresponding verification paragraph. Exploiting this signal, we show that hidden-state steering can directly modulate verifier strictness without fine-tuning. However, uniform steering induces a trade-off between error detection and correctness certification. To address this, we propose VerifySteer, which exploits latent correctness signals for sample-level routing and selectively intervenes on paragraph boundaries. Experiments on ProcessBench and Hard2Verify show that VerifySteer outperforms prompt optimization and activation steering baselines, and is competitive with self-consistency while requiring 4-7x less inference compute. VerifySteer is also complementary to verification fine-tuning, providing further gains on top of fine-tuned verifiers. The code is available at https://github.com/YefanZhou/VerifySteer.
- Abstract(参考訳): 生成検証はステップワイドな検証のための有望なパラダイムとして現れてきたが、その検証動作は、過度に批判的であり、誤ったステップを見逃し、過度に批判的であり、正しい推論を拒否する、という、しばしば不適切な校正がなされている。
この傾向は、検証の厳密さとして過度に寛大か過度に批判的である。
本研究では,隠れ状態の介入によって検証者の厳密性を制御できるかどうかを検討する。
ステップワイドな検証では、検証者の解ステップを受理または拒否する傾向が、対応する検証段落の境界付近で符号化される。
この信号を実行すると、隠れ状態のステアリングが微調整をせずに直接検証精度を調節できることが示される。
しかし、均一なステアリングはエラー検出と正当性認証のトレードオフを引き起こす。
これを解決するために,サンプルレベルのルーティングに潜時補正信号を利用し,段落境界に選択的に介入するVerifySteerを提案する。
ProcessBenchとHard2Verifyの実験では、VerifySteerは最適化とアクティベーションステアリングベースラインに優れており、4-7倍の推論計算を必要としながら、自己整合性と競合している。
VerifySteerは、検証の微調整を補完するもので、微調整のバリデーションの上にさらなる利得を提供する。
コードはhttps://github.com/YefanZhou/VerifySteer.comで入手できる。
関連論文リスト
- Stress-Testing Neural Network Verifiers with Provably Robust Instances [10.017475431603389]
我々は,地中構造ラベルを用いた検証インスタンス生成のための再利用可能なフレームワークを提案する。
また、インスタンスの硬さの異なるソースを推定可能な量の集合であるDifficulty Profileについても紹介する。
我々のフレームワークとこれらのプロファイルを用いて、5つの最先端検証ツールを評価し、異なるインスタンスが検証パイプラインの異なる側面を強調していることを示す。
論文 参考訳(メタデータ) (2026-05-16T20:56:52Z) - Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs [34.168578803480116]
連鎖検証を学習するためのオンライン学習フレームワークを提案する。
学習した検証器は、弱い証明者の集合の精度を高めるためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2026-03-03T21:50:14Z) - When to Trust the Cheap Check: Weak and Strong Verification for Reasoning [26.38833436936642]
我々は、強い検証と弱い検証の間の緊張を形式化する。
最適ポリシは2つの閾値構造を持ち,キャリブレーションとシャープネスが弱い検証器の値を支配することを示す。
本研究では,クエリストリーム,言語モデル,弱検証器を仮定することなく,受入誤りや拒否誤りを確実に制御するオンラインアルゴリズムを開発した。
論文 参考訳(メタデータ) (2026-02-19T18:47:38Z) - Preventing the Collapse of Peer Review Requires Verification-First AI [49.995126139461085]
我々は、真理結合、すなわち、過度に科学的真理をトラックする場所のスコアの厳密さを提案する。
プロキシ・ソブリン評価に向けた相転移を駆動する2つの力の形式化を行う。
論文 参考訳(メタデータ) (2026-01-23T17:17:32Z) - Validating Solidity Code Defects using Symbolic and Concrete Execution powered by Large Language Models [0.0]
本稿では,Slither-based detectors, Large Language Models (LLMs), Kontrol, Forgeを統合した新しい検出パイプラインを提案する。
私たちのアプローチは、欠陥を確実に検出し、証明を生成するように設計されています。
論文 参考訳(メタデータ) (2025-09-16T12:46:11Z) - CertDW: Towards Certified Dataset Ownership Verification via Conformal Prediction [48.82467166657901]
本稿では,最初の認証データセット透かし(CertDW)とCertDWベースの認証データセットオーナシップ検証手法を提案する。
共形予測に触発されて,主確率 (PP) と透かし頑健性 (WR) の2つの統計指標を導入する。
我々は、不審モデルのWR値が、透かしのないデータセットでトレーニングされた良性モデルのPP値を大幅に上回る場合に、PPとWRの間に証明可能な低い境界が存在することを証明した。
論文 参考訳(メタデータ) (2025-06-16T07:17:23Z) - Latent Veracity Inference for Identifying Errors in Stepwise Reasoning [78.29317733206643]
本稿では、精度割当てに対する離散探索アルゴリズムであるVeracity Search(VS)を紹介する。
その他の方法では、後続の精度値よりも後続の分布において難解な推論を行う。
VSを一般化し、新しいコンテキストで正確なゼロショットの精度推論を可能にする。
論文 参考訳(メタデータ) (2025-05-17T04:16:36Z) - Conformance Checking with Uncertainty via SMT (Extended Version) [66.58864135810981]
データ認識参照プロセスに対する不確実なログの適合性を確認する方法を示す。
我々のアプローチはモジュラーであり、異なるタイプの不確実性に均質に適合する。
本研究は,概念実証によるアプローチの正しさと実現可能性を示す。
論文 参考訳(メタデータ) (2022-06-15T11:39:45Z) - Auditing AI models for Verified Deployment under Semantic Specifications [65.12401653917838]
AuditAIは、解釈可能な形式検証とスケーラビリティのギャップを埋める。
AuditAIは、画素空間の摂動のみを用いた検証の限界に対処しながら、検証と認定トレーニングのための制御されたバリエーションを得られるかを示す。
論文 参考訳(メタデータ) (2021-09-25T22:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。