論文の概要: Property-Informed Diffusion-Based Text-to-Microstructure Generation
- arxiv url: http://arxiv.org/abs/2606.08150v1
- Date: Sat, 06 Jun 2026 13:00:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.873891
- Title: Property-Informed Diffusion-Based Text-to-Microstructure Generation
- Title(参考訳): 特性インフォームド拡散に基づくテキスト-マイクロ構造生成
- Authors: Bingxuan Dai, Hongsong Wang, Jie Gui,
- Abstract要約: テキスト記述から直接3次元構造を生成できる特性インフォームド拡散型ネットワークを提案する。
本モデルは, 意味論的かつ物理的に妥当な構造を, 幅広い材料カテゴリにわたって生成できることを示す。
本手法は, 対話型マイクロ構造設計の可能性が高く, 言語ベースインタフェースと逆材料発見を併用するための新たな方向性を開拓する。
- 参考スコア(独自算出の注目度): 25.492080916045012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing 3D metamaterial microstructures that meet the intended functions remains a major challenge, as it typically requires domain expertise, iterative simulations, and extensive manual tuning. Existing work on inverse design that automatically generates microstructures based on desired target properties often suffers from limited design diversity and faces challenges in ensuring the physical feasibility of the generated structures. To address this issue, a property-informed diffusion-based network is proposed that enables the generation of 3D microstructures directly from textual descriptions. Unlike traditional property conditioning methods, our approach leverages rich guidance in terms of semantics and physical properties in the text input to support diverse structure synthesis. To enforce consistency between the generated structures and the target textual prompts, a dual alignment strategy is adopted, including contrastive text-structure alignment and test-time reward-guided alignment. Experimental results show that the model is capable of generating semantically meaningful and physically plausible structures across a wide range of material categories. Our approach has good potential for interactive microstructure design and opens up new directions for combining language-based interfaces with inverse material discovery. Code is available at: https://github.com/hongsong-wang/PropDiff-TMG
- Abstract(参考訳): 意図された機能を満たす3Dメタマテリアルのマイクロ構造を設計することは、通常、ドメインの専門知識、反復シミュレーション、広範囲なマニュアルチューニングを必要とするため、大きな課題である。
所望の目標特性に基づいて自動的にマイクロ構造を生成する逆設計に関する既存の研究は、設計の多様性の制限に悩まされ、生成された構造が物理的に実現可能であることを保証するための課題に直面していることが多い。
この問題に対処するために,テキスト記述から直接3次元微細構造を生成可能な特性インフォームド拡散型ネットワークを提案する。
従来のプロパティコンディショニング法とは異なり,本手法はテキスト入力のセマンティクスや物理特性の観点から豊富なガイダンスを利用して,多様な構造合成を支援する。
生成した構造と対象のテキストプロンプトとの整合性を確保するために、対照的なテキスト構造アライメントとテスト時間報酬誘導アライメントを含む二重アライメント戦略を採用する。
実験結果から,本モデルは多種多様な材料カテゴリにわたって意味論的かつ物理的に妥当な構造を生成することができることが示された。
本手法は, 対話型マイクロ構造設計の可能性が高く, 言語ベースインタフェースと逆材料発見を併用するための新たな方向性を開拓する。
https://github.com/hongsong-wang/PropDiff-TMG
関連論文リスト
- StructDiff: A Structure-Preserving and Spatially Controllable Diffusion Model for Single-Image Generation [72.84181869780627]
StructDiffは、単一画像生成のための単一スケール拡散モデルに基づく生成フレームワークである。
3次元位置符号化(PE)を空間的先行として組み込んでおり、生成されたオブジェクトの位置、スケール、局所的な詳細を柔軟に制御することができる。
また、テキスト誘導画像生成、画像編集、アウトペインティング、ペイント・ツー・イメージ合成など、下流タスクにも幅広い適用性を示す。
論文 参考訳(メタデータ) (2026-04-14T10:55:43Z) - StdGEN++: A Comprehensive System for Semantic-Decomposed 3D Character Generation [57.06461272772509]
StdGEN++は、多種多様な入力から高忠実で意味的に分解された3D文字を生成するための、新しく包括的なシステムである。
最先端の性能を達成し、幾何学的精度と意味的絡み合いにおいて既存の手法を著しく上回っている。
結果として、非破壊的な編集、物理学に準拠したアニメーション、視線追跡など、より進んだ下流の機能をアンロックする。
論文 参考訳(メタデータ) (2026-01-12T15:41:27Z) - OmniStruct: Universal Text-to-Structure Generation across Diverse Schemas [57.49565459553627]
OmniStructは、テキストから構造までのタスクにおいて、大規模言語モデルの能力を評価するためのベンチマークである。
我々は,効率的なテキスト・ツー・ストラクチャ・モデルの開発を容易にするために,合成タスク生成による高品質なトレーニングデータを収集する。
本実験は, 合成データのより小さなモデルから, 普遍構造生成モデルへの微調整の可能性を示すものである。
論文 参考訳(メタデータ) (2025-11-23T08:18:12Z) - Spatial Understanding from Videos: Structured Prompts Meet Simulation Data [89.77871049500546]
本稿では,事前学習された視覚言語モデルにおける3次元空間推論を,アーキテクチャを変更することなく拡張するための統一的なフレームワークを提案する。
このフレームワークは、複雑なシーンと質問を解釈可能な推論ステップに分解する構造化プロンプト戦略であるSpatialMindと、多様な3Dシミュレーションシーンから構築されたスケーラブルな質問応答データセットであるScanForgeQAを組み合わせる。
論文 参考訳(メタデータ) (2025-06-04T07:36:33Z) - NEXT: Multi-Grained Mixture of Experts via Text-Modulation for Multi-Modal Object Re-Identification [17.10113184019939]
ReID(Multi-modal object Re-Identification)は、不均一なモーダルをまたいだ正確な同一性を実現することを目的としている。
本稿では属性信頼度に基づく信頼性の高いキャプション生成パイプラインを提案する。
また,多様なIDパターンをモデル化するための新しいReIDフレームワークであるNEXTを提案する。
論文 参考訳(メタデータ) (2025-05-26T13:52:28Z) - MIND: Microstructure INverse Design with Generative Hybrid Neural Representation [25.55691106041371]
マイクロマテリアルの逆設計は、特定の標的となる物理的特性を持つメタマテリアルを最適化する上で重要な役割を担っている。
本稿では,幾何学的特性と物理的特性を同時に符号化した,高度なハイブリッドニューラル表現であるHoloplaneと潜時拡散を統合した新しい生成モデルを提案する。
提案手法は,複数クラスにまたがって一般化され,多種多様なタイル状構造の生成が可能となり,特性精度が大幅に向上し,幾何的妥当性の制御が強化された。
論文 参考訳(メタデータ) (2025-02-01T20:25:47Z) - A Large Language Model and Denoising Diffusion Framework for Targeted Design of Microstructures with Commands in Natural Language [0.0]
自然言語処理(NLP)、大言語モデル(LLM)、拡散確率モデル(DDPM)を統合したフレームワークを提案する。
我々のフレームワークは、事前訓練されたLLMによって駆動されるコンテキストデータ拡張を用いて、多様なマイクロ構造記述子のデータセットを生成し、拡張する。
再学習されたNERモデルは、ユーザが提供する自然言語入力から関連するマイクロ構造記述子を抽出し、DDPMによってターゲットとなる機械的特性とトポロジ的特徴を持つマイクロ構造を生成する。
論文 参考訳(メタデータ) (2024-09-22T14:45:22Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。