論文の概要: Token Inflation: How Dishonest Providers Can Overcharge for Large Language Model Usage
- arxiv url: http://arxiv.org/abs/2605.30040v1
- Date: Thu, 28 May 2026 14:57:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 00:00:30.957775
- Title: Token Inflation: How Dishonest Providers Can Overcharge for Large Language Model Usage
- Title(参考訳): Token Inflation: 大規模言語モデルの使用に対して,不名誉なプロバイダが過大評価できる方法
- Authors: Shahinul Hoque, Jinghuai Zhang, Jinyuan Sun, Fnu Suya,
- Abstract要約: トークン化の曖昧性だけでは,検出しきい値以下では50.85%のオーバーレポートが可能であることを示す。
正直な請求書の復元には、報告されたトークン数と、プロバイダが制御していない証拠との結びつきを検証する必要がある。
- 参考スコア(独自算出の注目度): 7.289452280566007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Per-token billing is now the standard pricing model for commercial large language models (LLMs), so the honesty of reported token counts directly affects what users pay. We show that this kind of billing is hard to audit by design: providers hide the model, the tokenizer, and the execution to protect their IP, mitigate jailbreaks, and preserve user privacy, which means an auditor can only inspect proofs the provider supplies. The audit therefore reduces to a consistency check on the provider's own reports. We call this a trust paradox: every audit must trust some artifact, but current frameworks trust exactly the ones a provider has the strongest reason to manipulate. We study three recent token auditing frameworks and show that a provider with ordinary commercial capabilities can systematically inflate billed token counts. In the most permissive setting, hidden reasoning usage can be inflated by 1,469% on average without detection. At current frontier reasoning prices, that turns a \$100 honest bill into roughly a \$1,569 bill on the same query. Even when the user can see the full reasoning string, tokenization ambiguity alone still allows 50.85% over-reporting below the detection threshold. These results suggest the problem is not in any specific auditor but in any audit whose evidence comes from the audited party. Restoring honest billing will require verification that ties reported token counts to evidence the provider does not control, such as trusted execution attestation, cryptographic proofs of inference, or third-party re-execution.
- Abstract(参考訳): トークン単位の請求は商用の大規模言語モデル(LLM)の標準価格モデルとなっているため、報告されたトークン数の正直さは、ユーザが支払うものに直接影響する。
プロバイダがモデルを隠蔽し、トークンライザと実行し、彼らのIPを保護し、ジェイルブレイクを軽減し、ユーザのプライバシを保護する。
したがって、監査はプロバイダ自身のレポートの一貫性チェックに還元される。
すべての監査はアーティファクトを信頼する必要がありますが、現在のフレームワークは、プロバイダが操作する最も強い理由を正確に信頼しています。
最近の3つのトークン監査フレームワークについて検討し、通常の商業能力を持つプロバイダが請求トークン数を体系的に増加させることができることを示す。
最も寛容な環境では、隠れた推論の使用は検出せずに平均1,469%膨らませることができる。
現在のフロンティアの推論価格では、100ドル相当の正直な請求書が、同じクエリで1,569ドルぐらいの請求書になる。
ユーザが完全な推論文字列を見ることができるとしても、トークン化の不明瞭さだけでは、検出しきい値以下で50.85%のオーバーレポートが可能である。
これらの結果から, 特定の監査人ではなく, 監査人から証拠が得られた監査人である可能性が示唆された。
正直な請求書の復元には、報告されたトークン数と、信頼できる実行証明、推論の暗号的証明、サードパーティの再実行など、プロバイダが制御していない証拠との結びつきの検証が必要である。
関連論文リスト
- Who Audits the Auditor? Tamper-Proof Fraud Detection with Blockchain-Anchored Explainable ML [3.556355987197792]
本稿では,ML予測とワークフロー実行の両方を,不変なブロックチェーン台帳にアンロックする不正検出システムを提案する。
ブロックチェーンを受動的ストレージとして使用するのではなく、スマートコントラクトを通じて承認プロセス全体を強制し、すべてのトランザクション、予測、説明がアトミックに記録され、遡及的に修正できないことを保証します。
論文 参考訳(メタデータ) (2026-04-23T22:00:45Z) - IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation [49.796717294455796]
経済的なモチベーションのある逸脱を検出するための実践的な監査フレームワークIMMACULATEを提案する。
IMMACULATEは、検証可能な計算を用いて少数のリクエストを選択的に監査し、暗号オーバーヘッドを償却しながら強力な検出保証を達成する。
論文 参考訳(メタデータ) (2026-02-26T07:21:02Z) - Critical or Compliant? The Double-Edged Sword of Reasoning in Chain-of-Thought Explanations [60.27156500679296]
系統的な推論連鎖の摂動とデリバリートーンの操作による道徳シナリオにおけるCoT(Chain-of-Thought)の説明の役割について検討した。
1) 利用者は, 根拠に欠陥がある場合でも, 信頼感を保ち, 結果合意を信頼する傾向がみられた。
これらの結果は、CoTの説明が同時に明確化と誤解を招き、視覚的信頼よりも精査と批判的思考を奨励する説明を提供するNLPシステムの必要性を強調している。
論文 参考訳(メタデータ) (2025-11-15T02:38:49Z) - Auditing Pay-Per-Token in Large Language Models [11.795056270534287]
トークンの誤レポートを検出するため,マーチンゲール理論に基づく監査フレームワークを開発した。
当社のフレームワークは,プロバイダの(ミス-)レポートポリシに関わらず,トークンの誤レポートを常に検出することが保証されています。
論文 参考訳(メタデータ) (2025-10-05T17:47:16Z) - Predictive Auditing of Hidden Tokens in LLM APIs via Reasoning Length Estimation [7.928002407828304]
商用のLLMサービスは内部の推論トレースを隠蔽し、生成したトークンごとにユーザを課金する。
PALACEは内部トレースにアクセスせずに、プロンプトと応答のペアから隠れた推論トークン数を推定する。
数学、コーディング、医学、一般的な推論のベンチマークの実験は、PALACEが低い相対誤差と強い予測精度を達成することを示している。
論文 参考訳(メタデータ) (2025-07-29T19:50:55Z) - CoIn: Counting the Invisible Reasoning Tokens in Commercial Opaque LLM APIs [13.31195673556853]
隠れトークンの量と意味的妥当性の両方を検査する検証フレームワークであるCoInを提案する。
実験では、信頼できる第三者監査官としてデプロイされたCoInが、成功率94.7%に達するトークン数インフレーションを効果的に検出できることが示されている。
論文 参考訳(メタデータ) (2025-05-19T23:39:23Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - Trustless Audits without Revealing Data or Models [49.23322187919369]
モデルプロバイダが(アーキテクチャではなく)モデルウェイトとデータシークレットを維持しながら、他のパーティがモデルとデータプロパティを信頼性のない監査を行うことが可能であることを示す。
私たちはZkAuditと呼ばれるプロトコルを設計し、モデルプロバイダがデータセットとモデルの重みの暗号的コミットメントを公開します。
論文 参考訳(メタデータ) (2024-04-06T04:43:06Z) - The Decisive Power of Indecision: Low-Variance Risk-Limiting Audits and Election Contestation via Marginal Mark Recording [51.82772358241505]
リスクリミット監査(リスクリミット監査、RLA)は、大規模な選挙の結果を検証する技術である。
我々は、効率を改善し、統計力の進歩を提供する監査の新たなファミリーを定めている。
新しい監査は、複数の可能なマーク解釈を宣言できるように、キャストボイトレコードの標準概念を再考することで実現される。
論文 参考訳(メタデータ) (2024-02-09T16:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。