論文の概要: Learning to design without prior data: Discovering generalizable design
strategies using deep learning and tree search
- arxiv url: http://arxiv.org/abs/2211.15068v1
- Date: Mon, 28 Nov 2022 05:00:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 15:46:37.298778
- Title: Learning to design without prior data: Discovering generalizable design
strategies using deep learning and tree search
- Title(参考訳): 事前データのない設計への学習:ディープラーニングと木探索を用いた汎用設計戦略の発見
- Authors: Ayush Raina, Jonathan Cagan, Christopher McComb
- Abstract要約: 独自に設計できるAIエージェントの構築は、1980年代から目標とされてきた。
ディープラーニングは、大規模なデータから学ぶ能力を示し、データ駆動設計の大幅な進歩を可能にした。
本稿では,任意の問題空間における自己学習型ハイパフォーマンスおよび一般化可能な問題解決行動のための枠組みを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building an AI agent that can design on its own has been a goal since the
1980s. Recently, deep learning has shown the ability to learn from large-scale
data, enabling significant advances in data-driven design. However, learning
over prior data limits us only to solve problems that have been solved before
and biases data-driven learning towards existing solutions. The ultimate goal
for a design agent is the ability to learn generalizable design behavior in a
problem space without having seen it before. We introduce a self-learning agent
framework in this work that achieves this goal. This framework integrates a
deep policy network with a novel tree search algorithm, where the tree search
explores the problem space, and the deep policy network leverages
self-generated experience to guide the search further. This framework first
demonstrates an ability to discover high-performing generative strategies
without any prior data, and second, it illustrates a zero-shot generalization
of generative strategies across various unseen boundary conditions. This work
evaluates the effectiveness and versatility of the framework by solving
multiple versions of two engineering design problems without retraining.
Overall, this paper presents a methodology to self-learn high-performing and
generalizable problem-solving behavior in an arbitrary problem space,
circumventing the needs for expert data, existing solutions, and
problem-specific learning.
- Abstract(参考訳): 独自に設計できるAIエージェントの構築は1980年代から目標とされてきた。
近年、ディープラーニングは大規模データから学習する能力を示し、データ駆動設計の大幅な進歩を可能にしている。
しかし、事前のデータから学ぶことは、以前解決した問題を解決することのみを制限し、データ駆動学習を既存のソリューションに偏らせる。
設計エージェントの最終的な目標は、問題空間における一般的な設計動作を、これまで見たことのないまま学習する能力である。
本稿では,この目標を達成するための自己学習エージェントフレームワークを提案する。
このフレームワークは,木探索が問題空間を探索する新しい木探索アルゴリズムと深いポリシーネットワークを統合し,深いポリシーネットワークは自己生成した経験を活用して探索をさらに誘導する。
このフレームワークは、まず、先行データなしで高性能な生成戦略を発見する能力を示し、次に、未知の境界条件をまたいだ生成戦略のゼロショット一般化を示す。
本研究は,2つのエンジニアリング設計問題の複数バージョンを再訓練せずに解くことにより,フレームワークの有効性と汎用性を評価する。
本稿では,任意の問題空間における自己学習型ハイパフォーマンス・一般化可能な問題解決行動の方法論を提案し,専門家データ,既存ソリューション,問題固有学習の必要性を回避した。
関連論文リスト
- Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文 参考訳(メタデータ) (2024-11-18T16:15:17Z) - Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。
計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。
学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文 参考訳(メタデータ) (2024-07-01T16:53:00Z) - Coding for Intelligence from the Perspective of Category [66.14012258680992]
符号化の対象はデータの圧縮と再構成、インテリジェンスである。
最近の傾向は、これらの2つの分野の潜在的均一性を示している。
本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文 参考訳(メタデータ) (2024-07-01T07:05:44Z) - A Survey on State-of-the-art Deep Learning Applications and Challenges [0.0]
ディープラーニングモデルの構築は、アルゴリズムの複雑さと現実世界の問題の動的な性質のため、難しい。
本研究の目的は,コンピュータビジョン,自然言語処理,時系列解析,広範コンピューティングにおける最先端のディープラーニングモデルを網羅的にレビューすることである。
論文 参考訳(メタデータ) (2024-03-26T10:10:53Z) - When Meta-Learning Meets Online and Continual Learning: A Survey [39.53836535326121]
メタ学習は学習アルゴリズムを最適化するためのデータ駆動型アプローチである。
継続的な学習とオンライン学習はどちらも、ストリーミングデータでモデルを漸進的に更新する。
本稿では,一貫した用語と形式記述を用いて,様々な問題設定を整理する。
論文 参考訳(メタデータ) (2023-11-09T09:49:50Z) - A Survey on Knowledge Editing of Neural Networks [43.813073385305806]
最大の人工ニューラルネットワークでさえ間違いを犯し、世界が時間とともに進むにつれて、一度修正された予測が無効になる可能性がある。
知識編集は、訓練済みのターゲットモデルに対する信頼性、データ効率、迅速な変更の実現を目的とした、新しい研究分野として浮上している。
まず、ニューラルネットワークの編集の問題を紹介し、それを共通のフレームワークで形式化し、継続的学習のような悪名高い研究分野と区別する。
論文 参考訳(メタデータ) (2023-10-30T16:29:47Z) - Graph Reinforcement Learning for Network Control via Bi-Level
Optimization [37.00510744883984]
我々は、データ駆動戦略がこのプロセスを自動化し、最適性を損なうことなく効率的なアルゴリズムを学習できると主張している。
我々は、強化学習のレンズを通してネットワーク制御の問題を提示し、幅広い問題に対処するグラフネットワークベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-16T03:20:22Z) - Hierarchically Structured Task-Agnostic Continual Learning [0.0]
本研究では,連続学習のタスク非依存的な視点を取り入れ,階層的情報理論の最適性原理を考案する。
我々は,情報処理経路の集合を作成することで,忘れを緩和する,Mixture-of-Variational-Experts層と呼ばれるニューラルネットワーク層を提案する。
既存の連続学習アルゴリズムのようにタスク固有の知識を必要としない。
論文 参考訳(メタデータ) (2022-11-14T19:53:15Z) - A neural anisotropic view of underspecification in deep learning [60.119023683371736]
ニューラルネットが問題の未特定化を扱う方法が,データ表現に大きく依存していることを示す。
深層学習におけるアーキテクチャ的インダクティブバイアスの理解は,これらのシステムの公平性,堅牢性,一般化に対処する上で基本的であることを強調した。
論文 参考訳(メタデータ) (2021-04-29T14:31:09Z) - Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges [50.22269760171131]
過去10年間、データサイエンスと機械学習の実験的な革命が、ディープラーニングの手法によって生まれた。
このテキストは、統一幾何学的原理によって事前に定義された規則性を公開することに関するものである。
CNN、RNN、GNN、Transformersなど、最も成功したニューラルネットワークアーキテクチャを研究するための一般的な数学的フレームワークを提供する。
論文 参考訳(メタデータ) (2021-04-27T21:09:51Z) - A Design Space Study for LISTA and Beyond [79.76740811464597]
近年では、反復アルゴリズムの展開による問題固有のディープネットワーク構築に大きな成功を収めている。
本稿では,深層ネットワークにおける設計アプローチとしてのアンローリングの役割について再考する。
スパースリカバリのためのlistaを代表例として,未ロールモデルに対する設計空間調査を初めて実施した。
論文 参考訳(メタデータ) (2021-04-08T23:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。