論文の概要: Invisible Traces: Using Hybrid Fingerprinting to identify underlying LLMs in GenAI Apps
- arxiv url: http://arxiv.org/abs/2501.18712v4
- Date: Fri, 07 Feb 2025 14:14:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:53:46.221549
- Title: Invisible Traces: Using Hybrid Fingerprinting to identify underlying LLMs in GenAI Apps
- Title(参考訳): Invisible Traces: GenAIアプリの基盤となるLCMを特定するためにハイブリッドフィンガープリントを使用する
- Authors: Devansh Bhardwaj, Naman Mishra,
- Abstract要約: 大規模言語モデル(LLM)のフィンガープリントは、AI統合アプリケーションのセキュリティと透明性を保証するために欠かせないものとなっている。
静的および動的フィンガープリント技術を統合することにより,これらの課題に対処する新しいフィンガープリントフレームワークを提案する。
提案手法は, 動的環境下でのLDMの高精度かつ堅牢なフィンガープリントを可能にするため, 建築特性と挙動特性を同定する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Fingerprinting refers to the process of identifying underlying Machine Learning (ML) models of AI Systemts, such as Large Language Models (LLMs), by analyzing their unique characteristics or patterns, much like a human fingerprint. The fingerprinting of Large Language Models (LLMs) has become essential for ensuring the security and transparency of AI-integrated applications. While existing methods primarily rely on access to direct interactions with the application to infer model identity, they often fail in real-world scenarios involving multi-agent systems, frequent model updates, and restricted access to model internals. In this paper, we introduce a novel fingerprinting framework designed to address these challenges by integrating static and dynamic fingerprinting techniques. Our approach identifies architectural features and behavioral traits, enabling accurate and robust fingerprinting of LLMs in dynamic environments. We also highlight new threat scenarios where traditional fingerprinting methods are ineffective, bridging the gap between theoretical techniques and practical application. To validate our framework, we present an extensive evaluation setup that simulates real-world conditions and demonstrate the effectiveness of our methods in identifying and monitoring LLMs in Gen-AI applications. Our results highlight the framework's adaptability to diverse and evolving deployment contexts.
- Abstract(参考訳): フィンガープリント(英: Fingerprinting)とは、Large Language Models (LLMs)のようなAIシステムの基本となる機械学習(ML)モデルを、人間の指紋のようにその特徴やパターンを分析することによって識別するプロセスを指す。
大規模言語モデル(LLM)のフィンガープリントは、AI統合アプリケーションのセキュリティと透明性を確保するために欠かせないものとなっている。
既存のメソッドは主にモデルアイデンティティを推論するためにアプリケーションと直接対話する手段に依存しているが、マルチエージェントシステム、頻繁なモデル更新、モデル内部へのアクセス制限といった現実的なシナリオでは失敗することが多い。
本稿では,静的および動的フィンガープリント技術を統合することで,これらの課題に対処する新しいフィンガープリントフレームワークを提案する。
提案手法は, 動的環境下でのLDMの高精度かつ堅牢なフィンガープリントを可能にするため, 建築特性と挙動特性を同定する。
また,従来のフィンガープリント手法が有効でない新たな脅威シナリオを強調し,理論的手法と実践的応用のギャップを埋める。
我々は,実環境をシミュレートし,Gen-AI アプリケーションにおける LLM の識別・監視における手法の有効性を実証する広範囲な評価手法を提案する。
私たちの結果は、多様で進化するデプロイメントコンテキストに対するフレームワークの適応性を強調します。
関連論文リスト
- DLBacktrace: A Model Agnostic Explainability for any Deep Learning Models [1.747623282473278]
ディープラーニングモデルは、意思決定プロセスにおける透明性が制限された不透明な'ブラックボックス'として機能する。
この研究は、AIシステムにおける解釈可能性の押し付けの必要性に対処し、信頼の育成、説明責任の確保、ミッションクリティカルな分野における責任あるデプロイメントの促進におけるその役割を強調した。
DLBacktraceは、AryaXAIチームが開発し、幅広い領域にわたるモデル決定を照らす革新的なテクニックです。
論文 参考訳(メタデータ) (2024-11-19T16:54:30Z) - Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。
CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。
本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-01T01:51:31Z) - Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation [82.61572106180705]
本稿では、視覚言語モデル(VLM)を用いて、様々な衣服カテゴリーにおけるキーポイント予測を改善する統一的なアプローチを提案する。
我々は、高度なシミュレーション技術を用いて大規模な合成データセットを作成し、大規模な実世界のデータを必要としないスケーラブルなトレーニングを可能にした。
実験結果から, VLM法はキーポイント検出精度とタスク成功率を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2024-09-26T17:26:16Z) - Science based AI model certification for new operational environments with application in traffic state estimation [1.2186759689780324]
さまざまなエンジニアリング領域における人工知能(AI)の役割の拡大は、AIモデルを新たな運用環境にデプロイする際の課題を強調している。
本稿では,新しい運用環境における事前学習型データ駆動モデルの適用可能性を評価するための,科学ベースの認証手法を提案する。
論文 参考訳(メタデータ) (2024-05-13T16:28:00Z) - LVLM-Interpret: An Interpretability Tool for Large Vision-Language Models [50.259006481656094]
本稿では,大規模視覚言語モデルの内部メカニズムの理解を目的とした対話型アプリケーションを提案する。
このインタフェースは, 画像パッチの解釈可能性を高めるために設計されており, 応答の生成に有効である。
本稿では,一般的な大規模マルチモーダルモデルであるLLaVAにおける障害機構の理解に,アプリケーションがどのように役立つかのケーススタディを示す。
論文 参考訳(メタデータ) (2024-04-03T23:57:34Z) - An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - MRA-GNN: Minutiae Relation-Aware Model over Graph Neural Network for
Fingerprint Embedding [4.5262471547727845]
グラフニューラルネットワーク(MRA-GNN)上でのMinutiae Relation-Awareモデルと呼ばれる,指紋埋め込みのための新しいパラダイムを提案する。
提案手法は,指紋のトポロジと相関を記述的特徴にエンコードするために,指紋埋め込みにGNNベースのフレームワークを組み込んだものである。
我々は,MRA-GNNにTRM(Topological Relation Reasoning Module)とCAM(Relation-Aware Module)を設け,これらのグラフから指紋の埋め込みをうまく学習する。
論文 参考訳(メタデータ) (2023-07-31T05:54:06Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Learning Robust Representations Of Generative Models Using Set-Based
Artificial Fingerprints [14.191129493685212]
既存の手法はサンプル分布を通してモデル間の距離を近似する。
我々は、生成モデルの表現として、ユニークな痕跡(いわゆる「人工指紋」)を考える。
セットエンコーディングとコントラスト学習に基づく新しい学習手法を提案する。
論文 参考訳(メタデータ) (2022-06-04T23:20:07Z) - Fingerprint recognition with embedded presentation attacks detection:
are we ready? [6.0168714922994075]
セキュリティアプリケーションのための指紋認証システムの拡散は,ソフトウェアベースのプレゼンテーション攻撃アルゴリズム(PAD)をそのようなシステムに組み込むことを急ぐ。
現在の研究では、指紋認証システムに組み込む際の有効性についてはあまり言及されていない。
本稿では,PADと検証段階を逐次実施する場合の2つの個別システムの受信者動作特性(ROC)の関係を確率論的にモデル化した性能シミュレータを提案する。
論文 参考訳(メタデータ) (2021-10-20T13:53:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。