論文の概要: MuSimA: A Tool with Multi-modal Input for Generating Bespoke ABAC Datasets
- arxiv url: http://arxiv.org/abs/2604.10501v1
- Date: Sun, 12 Apr 2026 07:27:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.056334
- Title: MuSimA: A Tool with Multi-modal Input for Generating Bespoke ABAC Datasets
- Title(参考訳): MuSimA:Bespoke ABACデータセットを生成するためのマルチモーダル入力ツール
- Authors: Saket Jha, Karthikeya S. M. Yelisetty, Singabattu Sathya, Shamik Sural,
- Abstract要約: MuSimA は属性入力値の確率分布をユーザが指定した ABAC データセットを生成する Web ベースのツールである。
ABACに関連するアルゴリズムや手法のスケーラビリティを研究するために、さまざまなサイズや複雑さのデータを生成できる。
- 参考スコア(独自算出の注目度): 0.038180404292108366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in research on Attribute-based Access Control (ABAC) has led to the development of several ingenious methods for representing and enforcing organizational security policies. However, so far little effort has been spent towards building a tool for generating large-scale synthetic datasets that can be used to test the developed ABAC systems. In this paper, we address this shortcoming by building MuSimA - a web-based tool for generating ABAC datasets with user-specified probability distributions of attribute values. It supports multi-modal input, i.e., users can provide specifications either as a structured JSON file or as a combination of a minimal JSON along with hand-drawn distribution sketches. In the latter case, a Large Language Model is used to automatically extract appropriate distribution parameters from the sketches. The generated synthetic ABAC data matching the input specifications can be downloaded by the user. For studying scalability of algorithms and methods related to ABAC, data can be generated for varying sizes and complexities. We make MuSimA freely available for use by the research community.
- Abstract(参考訳): 近年のABAC(Attribute-based Access Control)研究の進展により、組織的セキュリティポリシーの表現と実施のための巧妙な方法が開発されている。
しかし、これまでのところ、ABACシステムをテストするために使用できる大規模な合成データセットを生成するツールの開発には、ほとんど労力がかからない。
本稿では,属性値の確率分布をユーザが指定したABACデータセットを生成する Web ベースのツール MuSimA を構築することで,この問題に対処する。
マルチモーダル入力、すなわち、構造化JSONファイルとして、あるいは手書きの配布スケッチとともに最小限のJSONの組み合わせとして、仕様を提供することができる。
後者の場合、スケッチから適切な分布パラメータを自動的に抽出するために、Large Language Modelが使用される。
入力仕様に適合する合成ABACデータは、ユーザがダウンロードすることができる。
ABACに関連するアルゴリズムや手法のスケーラビリティを研究するために、さまざまなサイズや複雑さのデータを生成できる。
MuSimAを研究コミュニティが自由に利用できるようにしています。
関連論文リスト
- Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents [85.02904078131682]
本稿では,エージェントデータセット間の"インターリングア"として機能する軽量表現言語であるエージェントデータプロトコル(ADP)を紹介する。
ADPはAPI/ツールの使用、ブラウジング、コーディング、ソフトウェアエンジニアリング、一般的なエージェントなど、さまざまなタスクを捉えるのに十分な表現力を持っている。
すべてのコードとデータが公開され、ADPが標準化され、スケーラブルで再現可能なエージェントトレーニングの障壁を低くすることを期待している。
論文 参考訳(メタデータ) (2025-10-28T17:53:13Z) - AI for Distributed Systems Design: Scalable Cloud Optimization Through Repeated LLMs Sampling And Simulators [3.1594665317979698]
大規模言語モデルからのコード生成と決定論的検証をドメイン固有シミュレータで組み合わせ,AI駆動型分散システムポリシー設計について検討する。
複数のモデル間のスループット改善に関する予備的な結果を報告する。
我々は、AIが新しいシミュレータのブートストラップを支援することで、この方法論のスケールアップに不可欠であると推測する。
論文 参考訳(メタデータ) (2025-10-20T16:10:24Z) - Comprehensive Evaluation of Prototype Neural Networks [0.6967006044904097]
プロトタイプモデルは、説明可能な人工知能(XAI)と解釈可能な機械学習の重要な方法である。
本稿では,ProtoPNet,ProtoPool,PIPNetなどの著名なプロトタイプモデルの詳細な分析を行う。
モデル解釈可能性の分析をさらに補完する新しい指標をいくつか提案する。
論文 参考訳(メタデータ) (2025-07-09T13:08:21Z) - What Limits Virtual Agent Application? OmniBench: A Scalable Multi-Dimensional Benchmark for Essential Virtual Agent Capabilities [56.646832992178105]
我々は、制御可能な複雑性のタスクを合成するための自動パイプラインを備えたクロスプラットフォームグラフベースのベンチマークであるOmniBenchを紹介した。
OmniEvalは、サブタスクレベルの評価、グラフベースのメトリクス、および10機能にわたる包括的なテストを含む多次元評価フレームワークである。
我々のデータセットには、20のシナリオにわたる36万のグラフ構造化タスクが含まれており、人間の受け入れ率は91%に達する。
論文 参考訳(メタデータ) (2025-06-10T15:59:38Z) - CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation [51.2289822267563]
本稿では,実行すべきタスクを実演する少数のユーザ記述型少数ショットを前提として,合成データセットを生成する手法を提案する。
我々は, CRAFTが生物, 医学, 常識質問応答(QA)の4つのタスクに対して, 大規模タスク特化学習データセットを効率的に生成できることを実証した。
実験の結果, CRAFT を用いたモデルでは, 一般 LLM をQA タスクで上回ったり, 一致させたりしていることがわかった。
論文 参考訳(メタデータ) (2024-09-03T17:54:40Z) - LAMBDA: A Large Model Based Data Agent [7.240586338370509]
本稿では,LArge Model Based Data Agent (LAMBDA)を紹介する。
LAMBDAは、データ駆動アプリケーションにおけるデータ分析の課題に対処するように設計されている。
それは、人間と人工知能をシームレスに統合することで、データ分析パラダイムを強化する可能性がある。
論文 参考訳(メタデータ) (2024-07-24T06:26:36Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。