論文の概要: Large Language and Text-to-3D Models for Engineering Design Optimization
- arxiv url: http://arxiv.org/abs/2307.01230v1
- Date: Mon, 3 Jul 2023 07:54:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 19:35:08.086640
- Title: Large Language and Text-to-3D Models for Engineering Design Optimization
- Title(参考訳): 工学設計最適化のための大規模言語とテキスト間3次元モデル
- Authors: Thiago Rios, Stefan Menzel, Bernhard Sendhoff (Honda Research
Institute Europe)
- Abstract要約: 工学領域における深層テキストから3Dモデルの可能性について検討する。
空力車両最適化の文脈において,OpenAIによるテキスト・ツー・3Dアセット・ネットワークであるShap-Eを用いる。
- 参考スコア(独自算出の注目度): 0.1740313383876245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The current advances in generative AI for learning large neural network
models with the capability to produce essays, images, music and even 3D assets
from text prompts create opportunities for a manifold of disciplines. In the
present paper, we study the potential of deep text-to-3D models in the
engineering domain, with focus on the chances and challenges when integrating
and interacting with 3D assets in computational simulation-based design
optimization. In contrast to traditional design optimization of 3D geometries
that often searches for the optimum designs using numerical representations,
such as B-Spline surface or deformation parameters in vehicle aerodynamic
optimization, natural language challenges the optimization framework by
requiring a different interpretation of variation operators while at the same
time may ease and motivate the human user interaction. Here, we propose and
realize a fully automated evolutionary design optimization framework using
Shap-E, a recently published text-to-3D asset network by OpenAI, in the context
of aerodynamic vehicle optimization. For representing text prompts in the
evolutionary optimization, we evaluate (a) a bag-of-words approach based on
prompt templates and Wordnet samples, and (b) a tokenisation approach based on
prompt templates and the byte pair encoding method from GPT4. Our main findings
from the optimizations indicate that, first, it is important to ensure that the
designs generated from prompts are within the object class of application, i.e.
diverse and novel designs need to be realistic, and, second, that more research
is required to develop methods where the strength of text prompt variations and
the resulting variations of the 3D designs share causal relations to some
degree to improve the optimization.
- Abstract(参考訳): 大規模なニューラルネットワークモデルを学ぶための生成AIの現在の進歩は、テキストからエッセイ、画像、音楽、さらには3Dアセットを生成する能力によって、さまざまな分野の機会を生み出している。
本稿では,工学領域における深いテキストから3dモデルの可能性について検討し,計算シミュレーションに基づく設計最適化における3dアセットの統合と相互作用の機会と課題について考察する。
車両空力最適化において、bスプライン面や変形パラメータといった数値表現を用いて最適な設計を求める3次元ジオメトリの従来の設計最適化とは対照的に、自然言語は、変動演算子の異なる解釈を必要とすると同時に、人間のユーザインタラクションを容易かつモチベーションにすることで最適化フレームワークに挑戦する。
本稿では,OpenAIが最近発表した3DアセットネットワークであるShap-Eを空力車両最適化の文脈において,完全に自動化された進化的設計最適化フレームワークを提案する。
進化最適化におけるテキストプロンプトの表現について
(a)プロンプトテンプレートとWordnetサンプルに基づく単語の袋のアプローチ
(b)gpt4からのプロンプトテンプレートとバイトペア符号化法に基づくトークン化アプローチ。
最適化から得られた主な知見は、まず、プロンプトから生成された設計が、対象のクラス内にあること、すなわち、多様で斬新な設計が現実的である必要があること、そして、テキストの強さと結果の3D設計のバリエーションが、最適化を改善するためにある程度の因果関係を共有する方法を開発するためには、さらなる研究が必要であることを示唆している。
関連論文リスト
- OrientDream: Streamlining Text-to-3D Generation with Explicit Orientation Control [66.03885917320189]
OrientDreamは、テキストプロンプトから効率よくマルチビューで一貫した3D生成のためのカメラ指向条件付きフレームワークである。
本戦略は,2次元テキスト・画像拡散モジュールの事前学習におけるカメラ配向条件付き機能の実装を強調する。
提案手法は,一貫したマルチビュー特性を持つ高品質なNeRFモデルを生成するだけでなく,既存手法よりも最適化速度が大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-06-14T13:16:18Z) - Generative AI-based Prompt Evolution Engineering Design Optimization With Vision-Language Model [22.535058343006828]
本稿では,車両設計シナリオでコンテキスト化された,迅速な進化設計最適化(PEDO)フレームワークを提案する。
生成車の設計において,物理に基づく解法と視覚言語モデルを用いて,実用的あるいは機能的な指導を行う。
自動車設計最適化問題に関する調査は,探索の初期段階に発生する潜在的な自動車設計の広範な普及を示唆している。
論文 参考訳(メタデータ) (2024-06-13T14:11:19Z) - Text2VP: Generative AI for Visual Programming and Parametric Modeling [6.531561475204309]
本研究は、GPT-4から派生したテキスト・ツー・ビジュアルプログラミング(Text2VP)GPTを利用して、パラメトリック・モデリングにおける生成AIの革新的な応用を創出し、研究する。
主な焦点は、AI生成スクリプトを通じてパラメータとパラメータ間のリンクを含むグラフベースのビジュアルプログラミングの自動生成である。
我々のテストでは、動作パラメトリックモデルを生成するText2VPの機能を示す。
論文 参考訳(メタデータ) (2024-06-09T02:22:20Z) - Position: Leverage Foundational Models for Black-Box Optimization [19.583955195098497]
大規模言語モデル(LLM)は、機械学習研究領域における驚くべきイノベーションの波をかき立てている。
基礎言語モデルが最適化に革命をもたらす最も有望な方法について論じる。
論文 参考訳(メタデータ) (2024-05-06T15:10:46Z) - Multimodal Large Language Model is a Human-Aligned Annotator for Text-to-Image Generation [87.50120181861362]
VisionPreferは高品質できめ細かい選好データセットで、複数の選好面をキャプチャする。
我々は、VisionPrefer上で報酬モデルVP-Scoreをトレーニングし、テキストから画像への生成モデルのトレーニングを指導し、VP-Scoreの嗜好予測精度は人間のアノテーションに匹敵する。
論文 参考訳(メタデータ) (2024-04-23T14:53:15Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - Guide3D: Create 3D Avatars from Text and Image Guidance [55.71306021041785]
Guide3Dは拡散モデルに基づく3Dアバター生成のためのテキスト・画像誘導生成モデルである。
我々のフレームワークは、トポロジカルかつ構造的に正しい幾何と高分解能なテクスチャを生成する。
論文 参考訳(メタデータ) (2023-08-18T17:55:47Z) - ATT3D: Amortized Text-to-3D Object Synthesis [78.96673650638365]
我々は、個別にではなく、統一されたモデルと同時に多くのプロンプトをトレーニングすることで、テキストプロンプトに対する最適化を保留する。
我々のフレームワークであるAmortized text-to-3D (ATT3D)は、プロンプト間の知識共有を可能にし、未知のセットアップに一般化し、新しいアセットのためのテキストと単純なアニメーション間のスムーズなスムーズさを実現する。
論文 参考訳(メタデータ) (2023-06-06T17:59:10Z) - T2TD: Text-3D Generation Model based on Prior Knowledge Guidance [74.32278935880018]
本稿では,3次元生成モデルの性能向上のための先行知識として,関連した形状やテキスト情報を導入した新しいテキスト3D生成モデル(T2TD)を提案する。
提案手法は,3次元モデル生成精度を大幅に向上し,text2shapeデータセット上でSOTA法よりも優れる。
論文 参考訳(メタデータ) (2023-05-25T06:05:52Z) - Early-Phase Performance-Driven Design using Generative Models [0.0]
本研究では,3次元モデリング環境において直接対話を行うことのできる,性能駆動型幾何生成手法を提案する。
この方法は機械学習技術を使って生成モデルをオフラインでトレーニングする。
生成モデルの潜在空間をナビゲートすることにより、所望の特性を持つ測地を迅速に生成することができる。
論文 参考訳(メタデータ) (2021-07-19T01:25:11Z) - Generative Design by Reinforcement Learning: Enhancing the Diversity of
Topology Optimization Designs [5.8010446129208155]
本研究では、トポロジ設計の多様性を最大化する報酬関数を備えた強化学習に基づく生成設計プロセスを提案する。
RLをベースとした生成設計は,GPUを完全自動で活用することにより,短時間で多数の多様な設計を生成できることを示す。
論文 参考訳(メタデータ) (2020-08-17T06:50:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。