論文の概要: A Dual-Helix Governance Approach Towards Reliable Agentic AI for WebGIS Development
- arxiv url: http://arxiv.org/abs/2603.04390v1
- Date: Wed, 04 Mar 2026 18:53:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.463134
- Title: A Dual-Helix Governance Approach Towards Reliable Agentic AI for WebGIS Development
- Title(参考訳): WebGIS開発のための信頼性エージェントAIに向けたデュアルヘリックスガバナンスアプローチ
- Authors: Boyuan, Guan, Wencong Cui, Levente Juhasz,
- Abstract要約: WebGIS開発には厳格さが必要だが、エージェントAIは5つの大きな言語モデル(LLM)制限のために頻繁に失敗する。
我々は,これらの課題を,モデル能力だけで解決できない構造的ガバナンス問題として捉えた,二重ヘリックスのガバナンスフレームワークを提案する。
本フレームワークは,知識グラフ基板を用いた3トラックアーキテクチャ(知識,行動,スキル)として実装し,実行の安定化を図る。
- 参考スコア(独自算出の注目度): 4.146198197290144
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: WebGIS development requires rigor, yet agentic AI frequently fails due to five large language model (LLM) limitations: context constraints, cross-session forgetting, stochasticity, instruction failure, and adaptation rigidity. We propose a dual-helix governance framework reframing these challenges as structural governance problems that model capacity alone cannot resolve. We implement the framework as a 3-track architecture (Knowledge, Behavior, Skills) that uses a knowledge graph substrate to stabilize execution by externalizing domain facts and enforcing executable protocols, complemented by a self-learning cycle for autonomous knowledge growth. Applying this to the FutureShorelines WebGIS tool, a governed agent refactored a 2,265-line monolithic codebase into modular ES6 components. Results demonstrated a 51\% reduction in cyclomatic complexity and a 7-point increase in maintainability index. A comparative experiment against a zero-shot LLM confirms that externalized governance, not just model capability, drives operational reliability in geospatial engineering. This approach is implemented in the open-source AgentLoom governance toolkit.
- Abstract(参考訳): WebGIS開発には厳格性が必要だが、エージェントAIは5つの大きな言語モデル(LLM)の制限により頻繁に失敗する。
我々は,これらの課題を,モデル能力だけで解決できない構造的ガバナンス問題として捉えた,二重ヘリックスのガバナンスフレームワークを提案する。
本フレームワークは,知識グラフベースを用いた3トラックアーキテクチャ(知識,行動,スキル)として実装され,ドメイン事実の外部化や,自律的な知識成長のための自己学習サイクルによって補完される実行可能なプロトコルの実施によって実行を安定化する。
FutureShorelines WebGISツールにこれを適用すると、支配的なエージェントが2,265行のモノリシックなコードベースをモジュールES6コンポーネントにリファクタリングした。
その結果,サイクロマティックな複雑性が51倍に減少し,メンテナンス性指数が7ポイント増加した。
ゼロショットLLMに対する比較実験では、モデル能力だけでなく、外部化されたガバナンスが地理空間工学における運用上の信頼性を促進することが確認されている。
このアプローチはオープンソースのAgentLoomガバナンスツールキットで実装されている。
関連論文リスト
- REGAL: A Registry-Driven Architecture for Deterministic Grounding of Agentic AI in Enterprise Telemetry [0.0]
大規模言語モデル(LLM)は、エージェント自動化の新しい形態を可能にする。
本稿では,企業テレメトリにおけるエージェントAIシステムの決定論的基盤化のためのレジストリ駆動型アーキテクチャREGALを提案する。
論文 参考訳(メタデータ) (2026-03-03T14:13:39Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - A Lightweight Modular Framework for Constructing Autonomous Agents Driven by Large Language Models: Design, Implementation, and Applications in AgentForge [1.932555230783329]
LLM駆動の自律エージェントの構築を民主化するために設計された軽量でオープンソースのPythonフレームワーク。
AgentForgeは、(1)正式に定義された入出力契約できめ細かいタスク分解を可能にする構成可能なスキル抽象化、(2)クラウドベースのAPIとローカル推論エンジンのシームレスな切り替えをサポートする統一されたバックエンドインターフェース、(3)エージェントロジックと実装の詳細を分離する宣言型YAMLベースの構成システムである。
論文 参考訳(メタデータ) (2026-01-19T20:33:26Z) - Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。
問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。
BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文 参考訳(メタデータ) (2025-12-20T12:06:13Z) - Quantitative Analysis of Technical Debt and Pattern Violation in Large Language Model Architectures [0.0]
本研究では,AI合成システムにおける「建築エロージョン」と技術的負債の蓄積を計測する最初の経験的枠組みを提案する。
プロプライエタリなモデルは高いアーキテクチャ適合性を実現する一方で、オープンウェイトモデルは重要なばらつきを示す。
これらの結果から, システムスキャフォールディングに小型オープンウェイトモデルを用いることで, 構造的技術的負債の蓄積が促進されることが示唆された。
論文 参考訳(メタデータ) (2025-12-03T21:24:02Z) - Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文 参考訳(メタデータ) (2025-11-20T05:01:57Z) - An Agentic Framework with LLMs for Solving Complex Vehicle Routing Problems [66.60904891478687]
複雑な車両ルーティング問題を解決するために,LLM (AFL) を用いたエージェントフレームワークを提案する。
AFLは生の入力から知識を直接抽出し、自己完結型コード生成を可能にする。
AFLは、コード信頼性とソリューション実現性の両方において、既存のLCMベースのベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2025-10-19T03:59:25Z) - Automatic Building Code Review: A Case Study [6.530899637501737]
建設担当者は、プロジェクトのサイズと複雑さが増大するにつれて、労働集約的で、エラーを起こし、コストがかかる設計文書のレビューに直面します。
本研究では,BIMに基づくデータ抽出と自動検証を統合したエージェント駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-03T00:30:14Z) - VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use [78.29315418819074]
VerlToolは、体系的な設計原則を通じて制限に対処する統一的でモジュール化されたフレームワークです。
我々のフレームワークはARLTをマルチターントラジェクトリとして定式化し、マルチモード観測トークン(テキスト/画像/ビデオ)を単一ターンRLVRパラダイムを超えて拡張する。
モジュール化されたプラグインアーキテクチャは、軽量Python定義のみを必要とする迅速なツール統合を可能にする。
論文 参考訳(メタデータ) (2025-09-01T01:45:18Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。