論文の概要: Engineering a Governance-Aware AI Sandbox: Design, Implementation, and Lessons Learned
- arxiv url: http://arxiv.org/abs/2603.03394v1
- Date: Tue, 03 Mar 2026 11:01:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.0339
- Title: Engineering a Governance-Aware AI Sandbox: Design, Implementation, and Lessons Learned
- Title(参考訳): ガバナンスを意識したAIサンドボックスのエンジニアリング - 設計、実装、教訓を学ぶ
- Authors: Muhammad Waseem, Md Aidul Islam, Md Nasir Uddin Shuvo, Md Mahade Hasan, Kai-Kristian Kemell, Jussi Rasku, Mika Saari, Vilma Saari, Roope Pajasmaa, Markku Oivo, Pekka Abrahamsson,
- Abstract要約: 産業とアカデミックにおける共同AI実験は、迅速な試行をサポートする環境を必要とする。
この作業は、構造化実験をサポートするガバナンス対応のマルチテナントAIサンドボックスを設計し、運用する。
- 参考スコア(独自算出の注目度): 1.9718759627291416
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaborative AI experimentation in industry and academia requires environments that support rapid trials while maintaining controlled access, organisational isolation, and traceable workflows. Although interest in AI sandboxes is increasing, practical guidance on designing and building governance-aware experimentation platforms remains limited. This work designs and operationalizes a governance-aware, multi tenant AI sandbox that supports structured experimentation and produces reusable evaluation evidence across stakeholders. The sandbox was developed in an industry and academia ecosystem using iteratively validated requirements gathered from industrial partners. The solution adopts a layered reference architecture that separates a multi tenant presentation layer from a backend control plane and isolates execution and data management concerns into dedicated layers. The sandbox supports governed onboarding, project based collaboration, controlled access to AI services, and traceable experimentation through approval workflows and audit logging. By structuring experiment context and governance decisions as persistent records, the sandbox enables evaluation evidence to be reused and compared across projects and stakeholders. The development experience yields lessons learned and practical considerations that inform deployment and future evolution of governance-aware sandbox platforms.
- Abstract(参考訳): 産業とアカデミックにおける協調AI実験は、制御されたアクセス、組織隔離、トレース可能なワークフローを維持しながら、迅速なトライアルをサポートする環境を必要とする。
AIサンドボックスへの関心は高まっているが、ガバナンスを意識した実験プラットフォームの設計と構築に関する実践的なガイダンスは依然として限られている。
この作業は、構造化実験をサポートし、ステークホルダー間で再利用可能な評価エビデンスを生成する、ガバナンス対応のマルチテナントAIサンドボックスを設計し、運用する。
サンドボックスは、産業パートナーから収集された反復的検証された要求を使用して、産業と学術のエコシステムで開発された。
このソリューションでは、マルチテナントプレゼンテーション層をバックエンドコントロールプレーンから分離し、実行とデータ管理に関する懸念を専用のレイヤに分離するレイヤ化された参照アーキテクチャを採用している。
サンドボックスは、管理されたオンボーディング、プロジェクトベースのコラボレーション、AIサービスへのアクセス制御、承認ワークフローと監査ログによるトレーサブルな実験をサポートする。
実験コンテキストとガバナンスの決定を永続的な記録として構造化することで、サンドボックスは評価エビデンスを再利用し、プロジェクトやステークホルダ間で比較することが可能になります。
開発経験は、ガバナンスを意識したサンドボックスプラットフォームの展開と将来の進化を知らせる教訓と実践的な考察をもたらす。
関連論文リスト
- GenAI for Systems: Recurring Challenges and Design Principles from Software to Silicon [62.2138479061386]
ジェネレーティブAIは、コンピュータシステムの設計、最適化、構築方法を変えようとしているが、ソフトウェア、アーキテクチャ、チップデザインコミュニティの間で研究は断片化されている。
本稿では、ハードウェア設計空間探索からRTL合成、物理レイアウト、検証に至るまで、コード生成と分散ランタイムから生成モデルがどのように適用されているかを検討する。
論文 参考訳(メタデータ) (2026-02-16T22:45:33Z) - From Prompt-Response to Goal-Directed Systems: The Evolution of Agentic AI Software Architecture [0.0]
Agentic AIは、ステートレスでプロンプト駆動型生成モデルからゴール指向システムへのアーキテクチャ移行を表す。
本稿では、知的エージェント理論と現代のLCM中心のアプローチを結びつけることによって、この遷移を考察する。
この研究は、標準化されたエージェントループ、登録、監査可能な制御機構への収束を特定する。
論文 参考訳(メタデータ) (2026-02-11T03:34:48Z) - ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development [72.4729759618632]
本稿では,現実的かつ実行可能なワークフロー内でエージェントバックエンドコーディングを評価するベンチマークであるABC-Benchを紹介する。
オープンソースリポジトリから8つの言語と19のフレームワークにまたがる224の実践的なタスクをキュレートしました。
我々の評価は、最先端モデルでさえ、これらの総合的なタスクに対して信頼性の高いパフォーマンスを提供するのに苦労していることを示している。
論文 参考訳(メタデータ) (2026-01-16T08:23:52Z) - From SERPs to Agents: A Platform for Comparative Studies of Information Interaction [2.50369129460887]
本稿では、Webベースのユーザ学習のためのオープンソースのシステムUXLabを紹介する。
そのコアはWebベースのダッシュボードで、複雑な実験的な設計の完全なコード構成を可能にする。
ユーザ行動とRAGと自律エージェントを比較したマイクロケーススタディを通じてUXLabの価値を実証する。
論文 参考訳(メタデータ) (2026-01-14T23:47:57Z) - High-level reasoning while low-level actuation in Cyber-Physical Systems: How efficient is it? [6.40412293456886]
この研究は、C++、Java、Jade、Jason、そしてファジィなJason BDIと緩やかに結合された統合を比較します。
この研究は、エンジニアリングのワークロードと実行効率の具体的なトレードオフを強調している。
本研究は,産業情報化におけるソフトウェア技術選択のためのエビデンスに基づくガイダンスに貢献する。
論文 参考訳(メタデータ) (2025-11-16T10:37:37Z) - Empowering Real-World: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents [63.03252293761656]
本稿では,大規模言語モデル(LLM)に基づく産業エージェントの技術,応用,評価手法を体系的にレビューする。
エージェント能力の進歩を支える3つの重要な技術柱として,記憶,計画,ツール利用について検討する。
本稿では,デジタル工学,科学的発見,具体的インテリジェンス,協調ビジネス実行,複雑なシステムシミュレーションといった実世界の領域における産業エージェントの応用の概要について述べる。
論文 参考訳(メタデータ) (2025-10-20T12:46:55Z) - The Sandbox Configurator: A Framework to Support Technical Assessment in AI Regulatory Sandboxes [13.108419500875543]
EUの人工知能法は、AI規制サンドボックス(AIRS)を導入している。
評価メソッドは断片化され、テストは標準化が欠如し、開発者と規制当局の間のフィードバックループは弱い。
共有ライブラリからドメイン関連テストを選択し、ダッシュボードを統合したカスタマイズされたサンドボックス環境を生成することができる。
論文 参考訳(メタデータ) (2025-09-27T16:37:46Z) - Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文 参考訳(メタデータ) (2023-10-12T17:59:58Z) - Developing an AI-enabled IIoT platform -- Lessons learned from early use
case validation [47.37985501848305]
本稿では,このプラットフォームの設計について紹介し,AIによる視覚的品質検査の実証者の観点からの早期評価について述べる。
これは、この初期の評価活動で学んだ洞察と教訓によって補完される。
論文 参考訳(メタデータ) (2022-07-10T18:51:12Z) - Benchopt: Reproducible, efficient and collaborative optimization
benchmarks [67.29240500171532]
Benchoptは、機械学習で最適化ベンチマークを自動化、再生、公開するためのフレームワークである。
Benchoptは実験を実行、共有、拡張するための既製のツールを提供することで、コミュニティのベンチマークを簡単にする。
論文 参考訳(メタデータ) (2022-06-27T16:19:24Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z) - Collective Knowledge: organizing research projects as a database of
reusable components and portable workflows with common APIs [0.2538209532048866]
この記事では、集合的知識フレームワーク(CKまたはcKnowledge)のモチベーションと概要について述べる。
CKの概念は、研究プロジェクトを研究成果物をカプセル化した再利用可能なコンポーネントに分解することである。
長期的な目標は、研究者と実践者を結びつけて、すべての知識を共有し再利用することで、イノベーションを加速させることである。
論文 参考訳(メタデータ) (2020-11-02T17:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。