論文の概要: KBF: Knowledge Boundary as Fingerprint for Language Model and Black-Box API Auditing
- arxiv url: http://arxiv.org/abs/2605.29524v1
- Date: Thu, 28 May 2026 07:40:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 00:00:30.949712
- Title: KBF: Knowledge Boundary as Fingerprint for Language Model and Black-Box API Auditing
- Title(参考訳): KBF:言語モデルとブラックボックスAPI監査のためのフィンガープリントとしての知識境界
- Authors: Yijia Fang, Yiqing Feng, Bingyu Li, Mingxun Zhou,
- Abstract要約: KBF指紋は知識境界付近で安定な数値リコールを用いたAPIをモデル化する。
発見: 6プラットフォームシャドウAPI監査における27のプラットフォームモデルセルのうち7つは、参照エンドポイントと統計的に矛盾しており、プレミアムなClaudeエンドポイントに集中している。
- 参考スコア(独自算出の注目度): 8.51962894711216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Relay and reseller APIs increasingly intermediate access to large language models (LLMs), but users have no direct way to verify that a claimed endpoint is actually serving the advertised model. We introduce KBF, a low-cost black-box auditing protocol that fingerprints model APIs using stable numerical recall near the knowledge boundary. Across 16 production LLM endpoints, KBF flags all 155 economically relevant substitutions without rejecting any same-model controls, remains stable under deployment variation, detects high-separation mixed-routing attacks when only 5-10% of traffic is substituted, and finds that 7 of 27 platform model cells in a six-platform shadow API audit are statistically inconsistent with their reference endpoints, with inconsistencies concentrated on premium Claude endpoints.
- Abstract(参考訳): 大規模な言語モデル(LLMs)へのAPIのリレーと再販はますます中間的になりつつありますが、ユーザが主張するエンドポイントが実際に宣伝されたモデルを提供していることを確認する直接的な方法はありません。
KBFは,知識境界付近の安定な数値リコールを用いて,指紋がAPIをモデル化する,低コストのブラックボックス監査プロトコルである。
16のプロダクションLCMエンドポイント全体で、KBFは、同じモデルコントロールを拒絶せずに155の経済的な代替品全てをフラグ付けし、配置のばらつきを保ち、トラフィックの5~10%しかトラフィックを置換していない場合、分離された混在する攻撃を検知し、6プラットフォームシャドウAPI監査における27のプラットフォームモデルセルのうち7つは、参照エンドポイントと統計的に一致せず、プレミアムクロードエンドポイントに集中している。
関連論文リスト
- The Path Matters: Learning a Token-Commitment Policy for Diffusion Language Models [52.93186090124315]
トークンのコミットメントは、再利用可能なトレースステートポリシとして学ぶことができる、と私たちは主張する。
凍結拡散言語モデルのためにこのポリシーをインスタンス化する軽量プラグインコントローラであるTraceLockを紹介する。
論文 参考訳(メタデータ) (2026-05-23T18:23:46Z) - Code-Centric Detection of Vulnerability-Fixing Commits: A Unified Benchmark and Empirical Study [4.512751676075442]
本稿では,統合フレームワークによる言語モデルに基づくVFC検出の包括的評価を行う。
コードの変更だけで、モデルが転送可能なセキュリティ関連コードを理解する証拠は見つからない。
グループ階層評価は、ランダムスプリットに比べて約17%のパフォーマンス低下を露呈する。
論文 参考訳(メタデータ) (2026-05-13T08:05:14Z) - PLUME: Building a Network-Native Foundation Model for Wireless Traces via Protocol-Aware Tokenization [0.9558392439655014]
Plumeは、構造化PDML切断から学ぶ802.11トレースのコンパクト基盤モデルである。
プロトコル対応トークン化器は、ディセクタフィールドツリーに沿って分割し、タイミングのギャップトークンを出力し、識別子を正規化し、BPEよりも6.2倍短いシーケンスを生成する。
論文 参考訳(メタデータ) (2026-03-13T23:14:43Z) - Real Money, Fake Models: Deceptive Model Claims in Shadow APIs [26.860718016839126]
サードパーティサービスは、間接アクセスによる地域制限なしに、公式のモデルサービスへのアクセスを提供すると主張している。
広く使われているにもかかわらず、シャドウAPIが公式APIと一貫性のあるアウトプットを提供するかどうかは不明だ。
これらのプラクティスは、科学的研究の妥当性を損なうとともに、シャドウAPI利用者の利益を損なうとともに、公式なモデル提供者の評判を損なう。
論文 参考訳(メタデータ) (2026-03-02T14:33:05Z) - IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation [49.796717294455796]
経済的なモチベーションのある逸脱を検出するための実践的な監査フレームワークIMMACULATEを提案する。
IMMACULATEは、検証可能な計算を用いて少数のリクエストを選択的に監査し、暗号オーバーヘッドを償却しながら強力な検出保証を達成する。
論文 参考訳(メタデータ) (2026-02-26T07:21:02Z) - CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文 参考訳(メタデータ) (2025-10-02T02:14:33Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - Do Large Language Model Benchmarks Test Reliability? [66.1783478365998]
モデル信頼性の定量化について検討する。
信頼性評価におけるこのギャップにより、我々はいわゆるプラチナベンチマークの概念を提案する。
我々は、これらのプラチナベンチマークにおいて、幅広いモデルを評価し、実際、フロンティアLSMは、単純なタスクで失敗を示す。
論文 参考訳(メタデータ) (2025-02-05T18:58:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。