論文の概要: A Pattern Language for Resilient Visual Agents
- arxiv url: http://arxiv.org/abs/2604.28001v1
- Date: Thu, 30 Apr 2026 15:24:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.163356
- Title: A Pattern Language for Resilient Visual Agents
- Title(参考訳): 回復力のある視覚エージェントのためのパターン言語
- Authors: Habtom Kahsay Gidey, Alexander Lenz, Alois Knoll,
- Abstract要約: 本稿では、高速で決定論的な反射を遅い確率論的監視から切り離す視覚エージェントのためのアーキテクチャパターン言語を提案する。
設計パターンは,(1)ハイブリッド・アクダクタンス・インテグレーション,(2)適応型ビジュアル・アンコリング,(3)視覚階層合成,(4)セマンティック・シーン・グラフの4つから構成される。
- 参考スコア(独自算出の注目度): 69.08074737002393
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Integrating multimodal foundation models into enterprise ecosystems presents a fundamental software architecture challenge. Architects must balance competing quality attributes: the high latency and non-determinism of vision language action (VLA) models versus the strict determinism and real-time performance required by enterprise control loops. In this study, we propose an architectural pattern language for visual agents that separates fast, deterministic reflexes from slow, probabilistic supervision. It consists of four architectural design patterns: (1) Hybrid Affordance Integration, (2) Adaptive Visual Anchoring, (3) Visual Hierarchy Synthesis, and (4) Semantic Scene Graph.
- Abstract(参考訳): マルチモーダル基盤モデルをエンタープライズエコシステムに統合することは、ソフトウェアアーキテクチャの根本的な課題である。
アーキテクトは競合する品質特性 – 高レイテンシと非決定性 ビジョン言語アクション(VLA)モデルと、エンタープライズコントロールループで要求される厳格な決定性とリアルタイムパフォーマンス – のバランスをとる必要があります。
本研究では,高速で決定論的な反射を遅い確率的監視から切り離す視覚エージェントのためのアーキテクチャパターン言語を提案する。
設計パターンは,(1)ハイブリッド・アクダクタンス・インテグレーション,(2)適応型ビジュアル・アンコリング,(3)視覚階層合成,(4)セマンティック・シーン・グラフの4つから構成される。
関連論文リスト
- Agentic Design Patterns: A System-Theoretic Framework [8.108572809924956]
エージェント設計パターンに対する既存の取り組みは、厳密なシステム理論の基礎を欠いていることが多い。
本稿では,エージェントAIシステムを5つのコアに分解し,機能的サブシステムと相互作用する新しいシステム理論フレームワークを提案する。
エージェント設計における繰り返し問題に対する再利用可能な構造的解決策を提供する12のエージェント設計パターンのコレクションを提示する。
論文 参考訳(メタデータ) (2026-01-27T16:14:08Z) - Uni4D-LLM: A Unified SpatioTemporal-Aware VLM for 4D Understanding and Generation [61.60600246983274]
既存の3Dおよび4Dアプローチは、通常、シーン幾何学を意味的理解とコンテンツ生成のための拡散モデルのための自己回帰モデルに組み込む。
我々は4次元シーン理解と生成のための時間的認識を備えた最初の統合VLMフレームワークであるUni4D-LLMを提案する。
論文 参考訳(メタデータ) (2025-09-28T12:06:54Z) - When Better Eyes Lead to Blindness: A Diagnostic Study of the Information Bottleneck in CNN-LSTM Image Captioning Models [0.0]
本稿では,基礎画像キャプションモデルの体系的かつ反復的な展開について述べる。
単純なCNN-LSTMエンコーダデコーダから、競合するアテンションベースのシステムへと進化する。
この実験は、アーキテクチャ拡張の影響をグラフ化し、古典的なCNN-LSTMパラダイムにおける重要な発見を実証する。
論文 参考訳(メタデータ) (2025-07-24T20:20:44Z) - Modeling and Visualization Reasoning for Stakeholders in Education and Industry Integration Systems: Research on Structured Synthetic Dialogue Data Generation Based on NIST Standards [3.5516803380598074]
本研究では,教育産業統合(EII)システムにおける利害関係者の相互作用の構造的複雑さと意味的あいまいさに対処する。
我々は,NIST(National Institute of Standards and Technology)合成データ品質フレームワークに基づく構造モデリングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-06-20T12:37:43Z) - Topological Structure Learning Should Be A Research Priority for LLM-Based Multi-Agent Systems [69.95482609893236]
大規模言語モデルに基づくマルチエージェントシステム(MAS)は、協調的な知性によって複雑なタスクに取り組むための強力なパラダイムとして登場した。
我々は,エージェント間相互作用の構造を明示的にモデル化し,動的に最適化する,エフェトロジーを意識したMASへのパラダイムシフトを求める。
論文 参考訳(メタデータ) (2025-05-28T15:20:09Z) - LLM-based Hierarchical Concept Decomposition for Interpretable Fine-Grained Image Classification [5.8754760054410955]
構造化概念解析によるモデル解釈可能性の向上を目的とした新しいフレームワークである textttHi-CoDecomposition を紹介する。
われわれのアプローチは、最先端のモデルの性能だけでなく、意思決定プロセスに対する明確な洞察を提供することで透明性を向上する。
論文 参考訳(メタデータ) (2024-05-29T00:36:56Z) - NPHardEval4V: Dynamic Evaluation of Large Vision-Language Models with Effects of Vision [64.83085920775316]
NPHardEval4Vは4つの古典的NPハード問題に基づくマルチモーダルベンチマークスイートである。
各タスクは、構造化された視覚レイアウトとテキストプロンプトを組み合わせることで、視覚言語的制約の下で推論を行うLVLMの能力を評価するように設計されている。
以上の結果から,これらのモデルは知覚に基づく入力に対して合理的に優れているが,グローバルな最適化,抽象化,制約満足度に苦慮していることが明らかとなった。
論文 参考訳(メタデータ) (2024-03-04T07:10:31Z) - Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models [73.40350756742231]
視覚条件付き言語モデル(VLM)は、視覚対話、シーン理解、ロボットタスク計画などのアプリケーションに採用されている。
新しいリリースの量は多いが、イメージ前処理、アーキテクチャ、最適化に関する重要な設計決定は未調査である。
論文 参考訳(メタデータ) (2024-02-12T18:21:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。