論文の概要: Goal-Directed Design Agents: Integrating Visual Imitation with One-Step
Lookahead Optimization for Generative Design
- arxiv url: http://arxiv.org/abs/2110.03223v1
- Date: Thu, 7 Oct 2021 07:13:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 15:46:28.234675
- Title: Goal-Directed Design Agents: Integrating Visual Imitation with One-Step
Lookahead Optimization for Generative Design
- Title(参考訳): ゴール指向設計エージェント:生成設計のためのワンステップルックアヘッド最適化と視覚模倣の統合
- Authors: Ayush Raina, Lucas Puentes, Jonathan Cagan, Christopher McComb
- Abstract要約: このノートは、設計を逐次生成するための学習戦略を強化することができる目標指向エージェントを開発するために、DLAgentsの上に構築されている。
ゴール指向のDLAgentは、データから学んだ人間の戦略と、目的関数の最適化を利用することができる。
これは、学習した設計戦略を強化するだけでなく、目に見えない設計問題にも適応できる、フィードバックを効率的に利用できるデザインエージェントフレームワークを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Engineering design problems often involve large state and action spaces along
with highly sparse rewards. Since an exhaustive search of those spaces is not
feasible, humans utilize relevant domain knowledge to condense the search
space. Previously, deep learning agents (DLAgents) were introduced to use
visual imitation learning to model design domain knowledge. This note builds on
DLAgents and integrates them with one-step lookahead search to develop
goal-directed agents capable of enhancing learned strategies for sequentially
generating designs. Goal-directed DLAgents can employ human strategies learned
from data along with optimizing an objective function. The visual imitation
network from DLAgents is composed of a convolutional encoder-decoder network,
acting as a rough planning step that is agnostic to feedback. Meanwhile, the
lookahead search identifies the fine-tuned design action guided by an
objective. These design agents are trained on an unconstrained truss design
problem that is modeled as a sequential, action-based configuration design
problem. The agents are then evaluated on two versions of the problem: the
original version used for training and an unseen constrained version with an
obstructed construction space. The goal-directed agents outperform the human
designers used to train the network as well as the previous objective-agnostic
versions of the agent in both scenarios. This illustrates a design agent
framework that can efficiently use feedback to not only enhance learned design
strategies but also adapt to unseen design problems.
- Abstract(参考訳): エンジニアリング設計の問題は、しばしば大きな状態とアクション空間と非常にまばらな報酬を含む。
これらの空間の徹底的な探索は不可能であるため、人間は関連する領域知識を利用して探索空間を凝縮する。
これまで、ビジュアル模倣学習を用いてドメイン知識をモデル化するために、ディープラーニングエージェント(DLAgents)が導入された。
このノートはdlagentsをベースとし、それらをワンステップのルックアヘッド検索と統合し、設計を逐次生成するための学習戦略を強化する目標指向エージェントを開発する。
ゴール指向のDLAgentは、データから学んだ人間の戦略と、目的関数の最適化を利用することができる。
DLAgentsの視覚模倣ネットワークは、畳み込みエンコーダ・デコーダネットワークで構成されており、フィードバックに依存しない粗い計画ステップとして機能する。
一方、lookahead検索は、目的によって導かれる微調整された設計アクションを識別する。
これらの設計エージェントは、シーケンシャルなアクションベースの構成設計問題としてモデル化された制約のないトラス設計問題に基づいて訓練される。
エージェントは2つのバージョンで評価される: トレーニングに使用されるオリジナルバージョンと、障害のある構成空間を持つ未確認の制約バージョンである。
目標指向エージェントは、ネットワークのトレーニングに使用した人間設計者や、両方のシナリオでエージェントの以前の客観的なバージョンよりも優れています。
これは、学習した設計戦略を強化するだけでなく、目に見えない設計問題にも適応できる、フィードバックを効率的に利用できるデザインエージェントフレームワークを示している。
関連論文リスト
- Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - Learning to design without prior data: Discovering generalizable design
strategies using deep learning and tree search [0.0]
独自に設計できるAIエージェントの構築は、1980年代から目標とされてきた。
ディープラーニングは、大規模なデータから学ぶ能力を示し、データ駆動設計の大幅な進歩を可能にした。
本稿では,任意の問題空間における自己学習型ハイパフォーマンスおよび一般化可能な問題解決行動のための枠組みを提案する。
論文 参考訳(メタデータ) (2022-11-28T05:00:58Z) - Investigating Positive and Negative Qualities of Human-in-the-Loop
Optimization for Designing Interaction Techniques [55.492211642128446]
設計者は、与えられた目的の集合を最大化する設計パラメータの組み合わせを見つけるよう求められる設計最適化タスクに苦労すると言われている。
モデルベースの計算設計アルゴリズムは、設計中に設計例を生成することでデザイナを支援する。
一方、補助のためのブラックボックスメソッドは、あらゆる設計問題に対処できる。
論文 参考訳(メタデータ) (2022-04-15T20:40:43Z) - Transform2Act: Learning a Transform-and-Control Policy for Efficient
Agent Design [31.33251581287337]
エージェントの機能は、その設計、すなわち骨格構造と関節特性によって決定される。
与えられた関数に対する最適なエージェント設計を見つけることは、本質的に問題であり、設計空間が禁断に大きいため、非常に難しい。
これらの問題に対処するため、我々はエージェントの設計手順を意思決定プロセスに組み込むことを目標としています。
論文 参考訳(メタデータ) (2021-10-07T17:51:05Z) - Multi-Agent Embodied Visual Semantic Navigation with Scene Prior
Knowledge [42.37872230561632]
視覚的セマンティックナビゲーションでは、ロボットは自我中心の視覚的観察を行い、目標のクラスラベルが与えられる。
既存のモデルのほとんどは単一エージェントナビゲーションにのみ有効であり、より複雑なタスクを完了すると、単一のエージェントは低効率でフォールトトレランスが低い。
本稿では,複数のエージェントが協調して複数の対象物を見つけるマルチエージェント視覚意味ナビゲーションを提案する。
論文 参考訳(メタデータ) (2021-09-20T13:31:03Z) - A Design Space Study for LISTA and Beyond [79.76740811464597]
近年では、反復アルゴリズムの展開による問題固有のディープネットワーク構築に大きな成功を収めている。
本稿では,深層ネットワークにおける設計アプローチとしてのアンローリングの役割について再考する。
スパースリカバリのためのlistaを代表例として,未ロールモデルに対する設計空間調査を初めて実施した。
論文 参考訳(メタデータ) (2021-04-08T23:01:52Z) - Deep Policy Networks for NPC Behaviors that Adapt to Changing Design
Parameters in Roguelike Games [137.86426963572214]
例えばRoguelikesのようなターンベースの戦略ゲームは、Deep Reinforcement Learning(DRL)にユニークな課題を提示する。
複雑なカテゴリ状態空間をより適切に処理し、設計決定によって強制的に再訓練する必要性を緩和する2つのネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-07T08:47:25Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。