論文の概要: Privacy Artifact ConnecTor (PACT): Embedding Enterprise Artifacts for Compliance AI Agents
- arxiv url: http://arxiv.org/abs/2507.21142v1
- Date: Wed, 23 Jul 2025 08:00:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:54.988971
- Title: Privacy Artifact ConnecTor (PACT): Embedding Enterprise Artifacts for Compliance AI Agents
- Title(参考訳): プライバシアーティファクトConnecTor(PACT) - コンプライアンスAIエージェントにエンタープライズアーティファクトを組み込む
- Authors: Chenhao Fang, Yanqing Peng, Rajeev Rao, Matt Sarmiento, Wendy Summer, Arya Pudota, Alex Goncalves, Jordi Mola, Hervé Robert,
- Abstract要約: 私たちは、さまざまなチームやプロジェクトによって生成された複数のアーティファクトタイプにまたがる数百万のアーティファクトをリンクする、埋め込み駆動のグラフであるPrivacy Artifact ConnecT(PACT)を紹介します。
PACTの微調整モデルではリコール@1が18%から53%に改善され、クエリマッチレートが9.6%から69.7%に、ヒットレート@1が25.7%から44.9%に改善された。
- 参考スコア(独自算出の注目度): 1.0669199995567555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enterprise environments contain a heterogeneous, rapidly growing collection of internal artifacts related to code, data, and many different tools. Critical information for assessing privacy risk and ensuring regulatory compliance is often embedded across these varied resources, each with their own arcane discovery and extraction techniques. Therefore, large-scale privacy compliance in adherence to governmental regulations requires systems to discern the interconnected nature of diverse artifacts in a common, shared universe. We present Privacy Artifact ConnecT or (PACT), an embeddings-driven graph that links millions of artifacts spanning multiple artifact types generated by a variety of teams and projects. Powered by the state-of-the-art DRAGON embedding model, PACT uses a contrastive learning objective with light fine-tuning to link artifacts via their textual components such as raw metadata, ownership specifics, and compliance context. Experimental results show that PACT's fine-tuned model improves recall@1 from 18% to 53%, the query match rate from 9.6% to 69.7% when paired with a baseline AI agent, and the hitrate@1 from 25.7% to 44.9% for candidate selection in a standard recommender system.
- Abstract(参考訳): エンタープライズ環境には、コード、データ、および多くの異なるツールに関連する、異質で急速に成長する内部アーティファクトのコレクションが含まれています。
プライバシーのリスクを評価し、規制のコンプライアンスを確保するための重要な情報は、これらのさまざまなリソースにしばしば埋め込まれ、それぞれに独自のアークネ発見と抽出技術が組み込まれている。
したがって、政府の規制に従うための大規模なプライバシコンプライアンスは、共通の共有宇宙における多様なアーティファクトの相互接続性を識別するシステムを必要とする。
私たちは、さまざまなチームやプロジェクトによって生成された複数のアーティファクトタイプにまたがる数百万のアーティファクトをリンクする、埋め込み駆動のグラフであるPrivacy Artifact ConnecT(PACT)を紹介します。
PACTは最先端のDRAGON埋め込みモデルによって駆動され、軽量な微調整による対照的な学習目標を使用して、生メタデータ、オーナシップ仕様、コンプライアンスコンテキストなどのテキストコンポーネントを介してアーティファクトをリンクする。
実験の結果、PACTの微調整モデルではリコール@1が18%から53%に改善され、クエリマッチレートが9.6%から69.7%に、ヒットレート@1が25.7%から44.9%に改善された。
関連論文リスト
- OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - IC-Custom: Diverse Image Customization via In-Context Learning [72.92059781700594]
IC-Customは、位置認識と位置自由な画像カスタマイズをシームレスに統合する統合フレームワークである。
試着、アクセサリ配置、家具の配置、創造的なIPカスタマイズなど、さまざまな産業アプリケーションをサポートしている。
アイデンティティの整合性、調和性、テキストアライメントの指標に対して、人間の嗜好が73%向上する一方で、オリジナルのモデルのパラメータの0.4%しかトレーニングしていない。
論文 参考訳(メタデータ) (2025-07-02T17:36:38Z) - Deepfake Forensic Analysis: Source Dataset Attribution and Legal Implications of Synthetic Media Manipulation [5.764826667785188]
Generative Adrial Networks (GANs) が生成する合成メディアは、認証の検証とデータセットの起源のトレースに課題を提起する。
本稿では,GAN生成画像のトレーニングデータセット(例えば CelebA や FFHQ)を解釈可能な特徴解析により識別する新しい法医学的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-16T10:47:18Z) - SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [46.55831783809377]
大規模言語モデル(LLM)の幻覚を緩和するための効果的なアプローチとして,検索拡張世代(RAG)がますます認識されている。
PruningRAGはマルチグラニュラリティ・プルーニング・ストラテジーを用いて,関連コンテキストをより効果的に統合し,誤った情報に対するネガティブな影響を軽減するためのプラグアンドプレイRAGフレームワークである。
論文 参考訳(メタデータ) (2024-09-03T03:31:37Z) - Privacy-preserving datasets by capturing feature distributions with Conditional VAEs [0.11999555634662634]
条件付き変分オートエンコーダ(CVAE)は、大きな事前学習された視覚基盤モデルから抽出された特徴ベクトルに基づいて訓練される。
本手法は, 医用領域と自然画像領域の両方において, 従来のアプローチよりも優れている。
結果は、データスカースおよびプライバシに敏感な環境におけるディープラーニングアプリケーションに大きな影響を与える生成モデルの可能性を強調している。
論文 参考訳(メタデータ) (2024-08-01T15:26:24Z) - Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.43709660948812]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。
ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。
BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文 参考訳(メタデータ) (2024-07-10T18:00:54Z) - TarGEN: Targeted Data Generation with Large Language Models [51.87504111286201]
TarGENは、高品質な合成データセットを生成するための、多段階のプロンプト戦略である。
我々は,LLMが不正確なラベル付きインスタンスを修正できるようにする自己補正法により,TarGENを増強する。
合成データセットを元のデータセットと比較した包括的な分析により、データセットの複雑さと多様性の類似または高いレベルが明らかになる。
論文 参考訳(メタデータ) (2023-10-27T03:32:17Z) - CIFAR-10-Warehouse: Broad and More Realistic Testbeds in Model
Generalization Analysis [37.34011895436337]
CIFAR-10-Warehouseは画像検索エンジンと拡散モデルによって収集された180個のデータセットから構成される。
本研究の目的は,様々なアウト・オブ・ディストリビューション環境における領域一般化とモデル精度予測という,2つの一般化タスクの理解を深めることである。
論文 参考訳(メタデータ) (2023-10-06T17:58:20Z) - Tool-Augmented Reward Modeling [58.381678612409]
本稿では,外部環境へのアクセスによるRMの強化により,制約に対処するツール拡張された嗜好モデリング手法であるThemisを提案する。
我々の研究は、外部ツールをRMに統合し、様々な外部ソースとの相互作用を可能にすることを目的としている。
人間の評価では、テミスで訓練されたRLHFはベースラインと比較して平均32%の勝利率を得る。
論文 参考訳(メタデータ) (2023-10-02T09:47:40Z) - Distributional Ground Truth: Non-Redundant Crowdsourcing Data Quality
Control in UI Labeling Tasks [0.0]
Web UIラベリングタスクにおけるクラウドワーカーの出力品質を予測する非冗長な手法を提案する。
信頼されたセットサイズが17-27%のUIでは、我々の「分布基底真理」モデルは0.8以上のR2を達成することができる。
論文 参考訳(メタデータ) (2020-12-25T09:06:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。