論文の概要: Goal-Directed Design Agents: Integrating Visual Imitation with One-Step
Lookahead Optimization for Generative Design
- arxiv url: http://arxiv.org/abs/2110.03223v1
- Date: Thu, 7 Oct 2021 07:13:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 15:46:28.234675
- Title: Goal-Directed Design Agents: Integrating Visual Imitation with One-Step
Lookahead Optimization for Generative Design
- Title(参考訳): ゴール指向設計エージェント:生成設計のためのワンステップルックアヘッド最適化と視覚模倣の統合
- Authors: Ayush Raina, Lucas Puentes, Jonathan Cagan, Christopher McComb
- Abstract要約: このノートは、設計を逐次生成するための学習戦略を強化することができる目標指向エージェントを開発するために、DLAgentsの上に構築されている。
ゴール指向のDLAgentは、データから学んだ人間の戦略と、目的関数の最適化を利用することができる。
これは、学習した設計戦略を強化するだけでなく、目に見えない設計問題にも適応できる、フィードバックを効率的に利用できるデザインエージェントフレームワークを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Engineering design problems often involve large state and action spaces along
with highly sparse rewards. Since an exhaustive search of those spaces is not
feasible, humans utilize relevant domain knowledge to condense the search
space. Previously, deep learning agents (DLAgents) were introduced to use
visual imitation learning to model design domain knowledge. This note builds on
DLAgents and integrates them with one-step lookahead search to develop
goal-directed agents capable of enhancing learned strategies for sequentially
generating designs. Goal-directed DLAgents can employ human strategies learned
from data along with optimizing an objective function. The visual imitation
network from DLAgents is composed of a convolutional encoder-decoder network,
acting as a rough planning step that is agnostic to feedback. Meanwhile, the
lookahead search identifies the fine-tuned design action guided by an
objective. These design agents are trained on an unconstrained truss design
problem that is modeled as a sequential, action-based configuration design
problem. The agents are then evaluated on two versions of the problem: the
original version used for training and an unseen constrained version with an
obstructed construction space. The goal-directed agents outperform the human
designers used to train the network as well as the previous objective-agnostic
versions of the agent in both scenarios. This illustrates a design agent
framework that can efficiently use feedback to not only enhance learned design
strategies but also adapt to unseen design problems.
- Abstract(参考訳): エンジニアリング設計の問題は、しばしば大きな状態とアクション空間と非常にまばらな報酬を含む。
これらの空間の徹底的な探索は不可能であるため、人間は関連する領域知識を利用して探索空間を凝縮する。
これまで、ビジュアル模倣学習を用いてドメイン知識をモデル化するために、ディープラーニングエージェント(DLAgents)が導入された。
このノートはdlagentsをベースとし、それらをワンステップのルックアヘッド検索と統合し、設計を逐次生成するための学習戦略を強化する目標指向エージェントを開発する。
ゴール指向のDLAgentは、データから学んだ人間の戦略と、目的関数の最適化を利用することができる。
DLAgentsの視覚模倣ネットワークは、畳み込みエンコーダ・デコーダネットワークで構成されており、フィードバックに依存しない粗い計画ステップとして機能する。
一方、lookahead検索は、目的によって導かれる微調整された設計アクションを識別する。
これらの設計エージェントは、シーケンシャルなアクションベースの構成設計問題としてモデル化された制約のないトラス設計問題に基づいて訓練される。
エージェントは2つのバージョンで評価される: トレーニングに使用されるオリジナルバージョンと、障害のある構成空間を持つ未確認の制約バージョンである。
目標指向エージェントは、ネットワークのトレーニングに使用した人間設計者や、両方のシナリオでエージェントの以前の客観的なバージョンよりも優れています。
これは、学習した設計戦略を強化するだけでなく、目に見えない設計問題にも適応できる、フィードバックを効率的に利用できるデザインエージェントフレームワークを示している。
関連論文リスト
- G-Designer: Architecting Multi-agent Communication Topologies via Graph Neural Networks [14.024988515071431]
G-Designerは,マルチエージェントデプロイメントのための適応的,効率的,堅牢なソリューションである。
G-Designerはタスク対応、カスタマイズされた通信トポロジを動的に設計する。
論文 参考訳(メタデータ) (2024-10-15T17:01:21Z) - AgentSquare: Automatic LLM Agent Search in Modular Design Space [16.659969168343082]
大規模言語モデル(LLM)は、幅広い複雑なタスクを処理できるエージェントシステムの急速な成長をもたらした。
Modularized LLM Agent Search (MoLAS) という新しい研究課題を紹介した。
論文 参考訳(メタデータ) (2024-10-08T15:52:42Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.94654815220404]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - Learning to design without prior data: Discovering generalizable design
strategies using deep learning and tree search [0.0]
独自に設計できるAIエージェントの構築は、1980年代から目標とされてきた。
ディープラーニングは、大規模なデータから学ぶ能力を示し、データ駆動設計の大幅な進歩を可能にした。
本稿では,任意の問題空間における自己学習型ハイパフォーマンスおよび一般化可能な問題解決行動のための枠組みを提案する。
論文 参考訳(メタデータ) (2022-11-28T05:00:58Z) - Multi-Agent Embodied Visual Semantic Navigation with Scene Prior
Knowledge [42.37872230561632]
視覚的セマンティックナビゲーションでは、ロボットは自我中心の視覚的観察を行い、目標のクラスラベルが与えられる。
既存のモデルのほとんどは単一エージェントナビゲーションにのみ有効であり、より複雑なタスクを完了すると、単一のエージェントは低効率でフォールトトレランスが低い。
本稿では,複数のエージェントが協調して複数の対象物を見つけるマルチエージェント視覚意味ナビゲーションを提案する。
論文 参考訳(メタデータ) (2021-09-20T13:31:03Z) - A Design Space Study for LISTA and Beyond [79.76740811464597]
近年では、反復アルゴリズムの展開による問題固有のディープネットワーク構築に大きな成功を収めている。
本稿では,深層ネットワークにおける設計アプローチとしてのアンローリングの役割について再考する。
スパースリカバリのためのlistaを代表例として,未ロールモデルに対する設計空間調査を初めて実施した。
論文 参考訳(メタデータ) (2021-04-08T23:01:52Z) - Deep Policy Networks for NPC Behaviors that Adapt to Changing Design
Parameters in Roguelike Games [137.86426963572214]
例えばRoguelikesのようなターンベースの戦略ゲームは、Deep Reinforcement Learning(DRL)にユニークな課題を提示する。
複雑なカテゴリ状態空間をより適切に処理し、設計決定によって強制的に再訓練する必要性を緩和する2つのネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-07T08:47:25Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。