論文の概要: Token-Efficient Change Detection in LLM APIs
- arxiv url: http://arxiv.org/abs/2602.11083v1
- Date: Wed, 11 Feb 2026 17:48:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:02.266907
- Title: Token-Efficient Change Detection in LLM APIs
- Title(参考訳): LLM APIにおけるToken-Efficient Change Detection
- Authors: Timothée Chauvin, Clément Lalanne, Erwan Le Merrer, Jean-Michel Loubes, François Taïani, Gilles Tredan,
- Abstract要約: 既存の方法は大規模にデプロイするには高すぎるか、モデルウェイトに対する初期ホワイトボックスアクセスが必要か、あるいはログの確率に対するグレイボックスアクセスが必要になる。
我々は,低コストかつ厳格なブラックボックス操作を実現することを目指しており,出力トークンのみを観察している。
私たちのアプローチは、Border Inputsと呼ばれる特定の入力に依存します。
- 参考スコア(独自算出の注目度): 8.484873526700978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote change detection in LLMs is a difficult problem. Existing methods are either too expensive for deployment at scale, or require initial white-box access to model weights or grey-box access to log probabilities. We aim to achieve both low cost and strict black-box operation, observing only output tokens. Our approach hinges on specific inputs we call Border Inputs, for which there exists more than one output top token. From a statistical perspective, optimal change detection depends on the model's Jacobian and the Fisher information of the output distribution. Analyzing these quantities in low-temperature regimes shows that border inputs enable powerful change detection tests. Building on this insight, we propose the Black-Box Border Input Tracking (B3IT) scheme. Extensive in-vivo and in-vitro experiments show that border inputs are easily found for non-reasoning tested endpoints, and achieve performance on par with the best available grey-box approaches. B3IT reduces costs by $30\times$ compared to existing methods, while operating in a strict black-box setting.
- Abstract(参考訳): LLMにおけるリモート変更検出は難しい問題である。
既存の方法は大規模にデプロイするには高すぎるか、モデルウェイトに対する初期ホワイトボックスアクセスが必要か、あるいはログの確率に対するグレイボックスアクセスが必要になる。
我々は,低コストかつ厳格なブラックボックス操作を実現することを目指しており,出力トークンのみを観察している。
私たちのアプローチは、Border Inputsと呼ばれる特定の入力に依存します。
統計的観点からは、最適変化検出はモデルのヤコビアンと出力分布のフィッシャー情報に依存する。
低温状態におけるこれらの量の分析は、境界入力が強力な変化検出テストを可能にすることを示している。
この知見に基づいて,ブラックボックス境界入力追跡(B3IT)方式を提案する。
広範囲にわたるin-vivoおよびin-vitro実験により、非推論テストエンドポイントではバウンダリ入力が容易に見つけることができ、最高のグレーボックスアプローチと同等のパフォーマンスを達成することが示されている。
B3ITは、厳格なブラックボックス設定で運用しながら、既存の方法と比較して、コストを30\times$に削減する。
関連論文リスト
- IOTA: Corrective Knowledge-Guided Prompt Learning via Black-White Box Framework [57.66924056568018]
我々は,事前学習したモデルを下流タスクに適応させるための新しいブラックホワイトbOxprompT leArningフレームワーク(IOTA)を提案する。
IOTAは、データ駆動のBlack Boxモジュールと知識駆動のWhite Boxモジュールを統合して、下流のタスク適応を行う。
論文 参考訳(メタデータ) (2026-01-28T12:03:48Z) - White-Box Sensitivity Auditing with Steering Vectors [14.807513989606647]
言語(LLM)のためのホワイトボックス感度監査フレームワークを提案する。
本手法は,タスクに対するモデルの意図する機能に関連する重要な概念を操作することで,内部感度試験を行う。
本手法は,モデル予測における保護属性へのかなりの依存を連続的に明らかにする。
論文 参考訳(メタデータ) (2026-01-23T02:03:20Z) - Visualizing token importance for black-box language models [48.747801442240565]
我々は,ブラックボックスの大規模言語モデル(LLM)を監査して,本運用環境にデプロイした場合に確実に動作させるという課題を考察する。
本稿では,各入力トークンに対する言語モデルの出力の感度を評価するために,分布ベース感性分析(DBSA)を提案する。
論文 参考訳(メタデータ) (2025-12-12T14:01:43Z) - CarBoN: Calibrated Best-of-N Sampling Improves Test-time Reasoning [62.56541355300587]
本稿では,高逆推論経路に向けてモデルを適応的に修正する一般的なテスト時間校正フレームワークを提案する。
本フレームワークでは,まず解空間を探索し,次にロジットの校正を学習する二相法であるCarBoNを提案する。
MATH-500とAIME-2024の実験では、CarBoNは効率を向上し、同じ精度に達するために最大4倍のロールアウトが可能である。
論文 参考訳(メタデータ) (2025-10-17T14:04:37Z) - Beyond Linear Probes: Dynamic Safety Monitoring for Language Models [67.15793594651609]
従来の安全モニタは、クエリ毎に同じ量の計算を必要とする。
動的アクティベーションモニタリングのための線形プローブの自然な拡張であるTrncated Polynomials (TPCs)を紹介する。
我々の重要な洞察は、TPCを段階的に、短期的に訓練し、評価できるということです。
論文 参考訳(メタデータ) (2025-09-30T13:32:59Z) - Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test [24.393978712663618]
APIプロバイダは、コスト削減やモデル動作の不正な変更のために、量子化または微調整の亜種を慎重に提供することができる。
そこで我々は,ブラックボックスLLMの挙動等式を局所的に展開した認証モデルに検証できるランクベース均一性試験を提案する。
我々は、量子化、有害な微調整、脱獄プロンプト、完全なモデル置換など、さまざまな脅威シナリオに対するアプローチを評価する。
論文 参考訳(メタデータ) (2025-06-08T03:00:31Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - Beyond Next Token Probabilities: Learnable, Fast Detection of Hallucinations and Data Contamination on LLM Output Distributions [60.43398881149664]
LLM出力シグナチャの効率的な符号化を訓練した軽量アテンションベースアーキテクチャであるLOS-Netを紹介する。
非常に低い検出レイテンシを維持しながら、さまざまなベンチマークやLLMで優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-18T09:04:37Z) - A Watermark for Black-Box Language Models [31.772364827073808]
LLMからシーケンスをサンプリングする機能のみを必要とする原則的な透かし方式を提案する。
性能保証を提供し、ホワイトボックスアクセスが利用可能である場合にどのように活用できるかを実証し、包括的実験によって既存のホワイトボックススキームよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-02T23:39:19Z) - Ten Words Only Still Help: Improving Black-Box AI-Generated Text
Detection via Proxy-Guided Efficient Re-Sampling [19.780068724002888]
POGERは、ブラックボックスAIGT検出のためのプロキシ誘導効率的な再サンプリング手法である。
マクロF1のすべてのベースラインをブラックボックス、部分的なホワイトボックス、アウト・オブ・ディストリビューション設定で上回る。
論文 参考訳(メタデータ) (2024-02-14T14:32:16Z) - Black-Box Tuning of Vision-Language Models with Effective Gradient
Approximation [71.21346469382821]
ブラックボックスモデルに対するテキストプロンプト最適化と出力特徴適応のための協調ブラックボックスチューニング(CBBT)を導入する。
CBBTは11のダウンストリームベンチマークで広範囲に評価され、既存のブラックボックスVL適応法と比較して顕著に改善されている。
論文 参考訳(メタデータ) (2023-12-26T06:31:28Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。