論文の概要: Fingerprinting Inference Systems of Large Language Models
- arxiv url: http://arxiv.org/abs/2605.29979v1
- Date: Thu, 28 May 2026 14:16:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 00:00:30.956989
- Title: Fingerprinting Inference Systems of Large Language Models
- Title(参考訳): 大規模言語モデルのフィンガープリント推論システム
- Authors: Anna Wimbauer, Jonas Möller, Erik Imgrund, Konrad Rieck,
- Abstract要約: 推論システムのコンポーネントを識別するフィンガープリント手法を提案する。
ハードウェアとソフトウェアスタック間の数値的な違いを排除する必要があるため,指紋認証の防止は困難である。
- 参考スコア(独自算出の注目度): 4.383670998035156
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The behavior of LLMs does not depend solely on the model itself. Components of the inference system, such as the inference engine, attention backend, and hardware platform, subtly influence how inputs are processed. These components differ in their implementations and thereby induce small numerical deviations across systems when running the same model. While prior work has established the theoretical existence of such deviations, their security implications have remained unexplored. In this paper, we show that these deviations are characteristic of specific components and propagate to observable textual outputs, exposing the inference system to any party that can query the model. Building on this observation, we introduce a fingerprinting method that analyzes the prompt-response behavior of LLMs to identify components of the inference system. Our empirical evaluation demonstrates that the inference engine, attention backend, and underlying hardware platform can be identified reliably, even when the LLM is operated at non-zero temperature. We show that preventing fingerprinting is fundamentally hard, as it would require eliminating numerical differences between hardware and software stacks. We therefore propose partial mitigations and discuss their impact.
- Abstract(参考訳): LLMの振舞いはモデル自体にのみ依存するわけではない。
推論エンジン、アテンションバックエンド、ハードウェアプラットフォームなどの推論システムのコンポーネントは、入力の処理方法に微妙に影響を与えます。
これらのコンポーネントは実装が異なるため、同じモデルを実行する場合、システム間で小さな数値差が生じる。
以前の研究はそのような逸脱の理論的な存在を確立してきたが、そのセキュリティへの影響は未解明のままである。
本稿では、これらの偏差が特定の成分の特徴であり、観測可能なテキスト出力に伝播し、モデルに問い合わせ可能な任意の当事者に推論システムを公開することを示す。
そこで本研究では,LLMの迅速な応答動作を分析し,推論システムのコンポーネントを同定するフィンガープリント手法を提案する。
実験により,LLMが非ゼロ温度で動作する場合であっても,推論エンジン,アテンションバックエンド,基盤となるハードウェアプラットフォームを確実に識別できることが実証された。
ハードウェアとソフトウェアスタック間の数値的な違いを排除する必要があるため,指紋認証の防止は基本的に困難である。
そこで我々は部分緩和を提案し,その影響について論じる。
関連論文リスト
- D-REX: A Benchmark for Detecting Deceptive Reasoning in Large Language Models [62.83226685925107]
Deceptive Reasoning Exposure Suite (D-REX)は、モデルの内部推論プロセスと最終的な出力との相違を評価するために設計された、新しいデータセットである。
D-REXの各サンプルには、敵システムプロンプト、エンドユーザーのテストクエリ、モデルの一見無害な応答、そして重要なことに、モデルの内部チェーンが含まれている。
我々は、D-REXが既存のモデルと安全メカニズムに重大な課題をもたらすことを実証した。
論文 参考訳(メタデータ) (2025-09-22T15:59:40Z) - Position is Power: System Prompts as a Mechanism of Bias in Large Language Models (LLMs) [7.71667852309443]
大規模言語モデル(LLM)におけるシステムプロンプトは、モデル動作を導く事前定義された指示である。
LLMのデプロイでは、コンテキスト間の一貫性のあるレスポンスを保証するために、ますます使用されている。
システムプロンプトがより複雑になるにつれて、直接的または間接的に、副作用の未報告を導入することができる。
論文 参考訳(メタデータ) (2025-05-27T12:19:08Z) - Can LLMs Separate Instructions From Data? And What Do We Even Mean By That? [60.50127555651554]
大規模言語モデル(LLM)は、多くの実用的なアプリケーションにおいて印象的な結果を示すが、基本的な安全性機能は欠如している。
これにより、間接的なプロンプトインジェクションのような操作に脆弱になり、一般に安全クリティカルなタスクには適さない。
モデル出力から計算可能な命令データ分離の形式的尺度と経験的変量を導入する。
論文 参考訳(メタデータ) (2024-03-11T15:48:56Z) - SimLM: Can Language Models Infer Parameters of Physical Systems? [56.38608628187024]
物理系におけるパラメータ推論におけるLarge Language Models (LLM) の性能について検討する。
実験の結果,単純なシステムであっても,本課題には適していないことが示唆された。
物理シミュレータを用いてLLMのコンテキストを拡大する探索の有望な方向を提案する。
論文 参考訳(メタデータ) (2023-12-21T12:05:19Z) - On The Fairness Impacts of Hardware Selection in Machine Learning [47.64314140984432]
本稿では,ハードウェアがモデル性能と公平性の微妙なバランスに与える影響について検討する。
ハードウェアの選択が既存の格差を悪化させる可能性を示し、これらの相違は、異なる階層群間での勾配流と損失面の変化に起因することを示した。
論文 参考訳(メタデータ) (2023-12-06T20:24:17Z) - Fingerprint recognition with embedded presentation attacks detection:
are we ready? [6.0168714922994075]
セキュリティアプリケーションのための指紋認証システムの拡散は,ソフトウェアベースのプレゼンテーション攻撃アルゴリズム(PAD)をそのようなシステムに組み込むことを急ぐ。
現在の研究では、指紋認証システムに組み込む際の有効性についてはあまり言及されていない。
本稿では,PADと検証段階を逐次実施する場合の2つの個別システムの受信者動作特性(ROC)の関係を確率論的にモデル化した性能シミュレータを提案する。
論文 参考訳(メタデータ) (2021-10-20T13:53:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。