論文の概要: A Vision Language Model for Generating Procedural Plant Architecture Representations from Simulated Images
- arxiv url: http://arxiv.org/abs/2603.22622v1
- Date: Mon, 23 Mar 2026 22:50:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.210722
- Title: A Vision Language Model for Generating Procedural Plant Architecture Representations from Simulated Images
- Title(参考訳): シミュレーション画像から手続き型植物構造表現を生成するための視覚言語モデル
- Authors: Heesup Yun, Isaac Kazuo Uyehara, Ioannis Droutsas, Earl Ranario, Christine H. Diepenbrock, Brian N. Bailey, J. Mason Earles,
- Abstract要約: 植物構造と機能に関するシミュレーションに基づく研究のための重要なツールとして,3次元の手続き型植物アーキテクチャモデルが登場している。
画像から3Dプラントアーキテクチャを生成する新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 5.667915042172453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Three-dimensional (3D) procedural plant architecture models have emerged as an important tool for simulation-based studies of plant structure and function, extracting plant architectural parameters from field measurements, and for generating realistic plants in computer graphics. However, measuring the architectural parameters and nested structures for these models at the field scales remains prohibitively labor-intensive. We present a novel algorithm that generates a 3D plant architecture from an image, creating a functional structural plant model that reflects organ-level geometric and topological parameters and provides a more comprehensive representation of the plant's architecture. Instead of using 3D sensors or processing multi-view images with computer vision to obtain the 3D structure of plants, we proposed a method that generates token sequences that encode a procedural definition of plant architecture. This work used only synthetic images for training and testing, with exact architectural parameters known, allowing testing of the hypothesis that organ-level architectural parameters could be extracted from image data using a vision-language model (VLM). A synthetic dataset of cowpea plant images was generated using the Helios 3D plant simulator, with the detailed plant architecture encoded in XML files. We developed a plant architecture tokenizer for the XML file defining plant architecture, converting it into a token sequence that a language model can predict. The model achieved a token F1 score of 0.73 during teacher-forced training. Evaluation of the model was performed through autoregressive generation, achieving a BLEU-4 score of 94.00% and a ROUGE-L score of 0.5182. This led to the conclusion that such plant architecture model generation and parameter extraction were possible from synthetic images; thus, future work will extend the approach to real imagery data.
- Abstract(参考訳): 3次元の手続き型植物アーキテクチャモデルは、植物構造と機能のシミュレーションに基づく研究、フィールド計測から植物アーキテクチャパラメータの抽出、コンピュータグラフィックスにおける現実的な植物の生成において重要なツールとして登場した。
しかしながら、これらのモデルのフィールドスケールでのアーキテクチャパラメータとネスト構造の測定は、厳密な労働集約性を維持している。
画像から3Dプラントアーキテクチャを生成し,臓器レベルの幾何学的および位相的パラメータを反映した機能的構造的植物モデルを作成し,より包括的なプラントアーキテクチャ表現を提供する。
植物の3次元構造を3次元センサやコンピュータビジョンで処理する代わりに,植物アーキテクチャの手続き的定義を符号化したトークンシーケンスを生成する手法を提案する。
この研究は、トレーニングとテストにのみ合成画像を使用し、正確なアーキテクチャパラメータを知っており、視覚言語モデル(VLM)を用いて臓器レベルのアーキテクチャパラメータを画像データから抽出できるという仮説の検証を可能にした。
詳細な植物構造をXMLファイルにエンコードしたHelios 3Dプラントシミュレータを用いて,カボチャ植物画像の合成データセットを作成した。
我々は、植物アーキテクチャを定義するXMLファイル用の植物アーキテクチャトークン化器を開発し、それを言語モデルが予測できるトークンシーケンスに変換する。
このモデルは教師の訓練中にトークンF1スコアが0.73に達した。
モデルの評価は自己回帰生成により行われ、BLEU-4スコアは94.00%、ROUGE-Lスコアは0.5182となった。
この結果, 植物モデル生成やパラメータ抽出が合成画像から可能であるという結論が得られた。
関連論文リスト
- Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning [6.254251081017878]
本稿では,デジタル双生児の植物シミュレーションにおける視覚言語モデル(VLM)の性能を評価するためのベンチマークを提案する。
本稿では,最先端のオープンソースVLMを利用して,ドローンによるリモートセンシング画像からシミュレーションパラメータを直接生成する手法を提案する。
論文 参考訳(メタデータ) (2026-03-09T20:58:43Z) - FloraForge: LLM-Assisted Procedural Generation of Editable and Analysis-Ready 3D Plant Geometric Models For Agricultural Applications [13.923496304391044]
ドメインエキスパートが生物学的に正確でパラメトリックな3D植物モデルを作成できるLLM支援フレームワークであるFloraForgeについて紹介する。
我々のフレームワークは、LLM対応の共設計を利用して、パラメータ化された植物を階層的なB-スプライン表面表現として生成するPythonスクリプトを洗練する。
本研究では, トウモロコシ, 大豆, ムン豆について, 実証点クラウドデータに手続きモデルを適用した枠組みを実証する。
論文 参考訳(メタデータ) (2025-12-11T23:28:25Z) - DiffTex: Differentiable Texturing for Architectural Proxy Models [63.370581207280004]
非秩序な写真からテクセルレベルでアーキテクチャプロキシモデルのための現実的なテクスチャマップを自動生成する手法を提案する。
提案手法は,UVマップ上のテックセルと入力画像中のピクセルとの対応性を確立し,各テクセルの色を関連するピクセル値の重み付けとして計算する。
論文 参考訳(メタデータ) (2025-09-27T14:39:53Z) - Learning to Infer Parameterized Representations of Plants from 3D Scans [2.6774002558989705]
我々はL-systemsベースの手続きモデルを用いて仮想植物でニューラルネットワークを訓練する。
トレーニング後、このネットワークは入力された3Dポイントクラウドに基づいてパラメトリックツリーのような表現を推論することができる。
ケノポジウム・アルバム植物に対する我々のアプローチを,合成植物実験を用いて評価し,我々の統合されたフレームワークが様々なタスクを担っていることを示す。
論文 参考訳(メタデータ) (2025-05-28T13:23:48Z) - PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting [0.7937206070844555]
我々は3D合成プラント生成の新しいアプローチであるPlantDreamerを紹介した。
複雑な植物形状やテクスチャに対して、利用可能なテキストから3Dモデルよりも高いレベルのリアリズムを実現することができる。
我々は、その出力を最先端のテキスト・ツー・3Dモデルと比較することで、我々のアプローチを評価する。
論文 参考訳(メタデータ) (2025-05-21T13:51:57Z) - CropCraft: Inverse Procedural Modeling for 3D Reconstruction of Crop Plants [16.558411700996746]
逆手続きモデルによる植物形態のモデル最適化に基づく農作物の3次元再構築手法を提案する。
本手法を農業現場の実画像のデータセット上で検証し, 様々なモニタリング・シミュレーションに応用できることを実証する。
論文 参考訳(メタデータ) (2024-11-14T18:58:02Z) - DreamPolish: Domain Score Distillation With Progressive Geometry Generation [66.94803919328815]
本稿では,高精細な幾何学と高品質なテクスチャの創出に優れたテキスト・ツー・3D生成モデルであるDreamPolishを紹介する。
幾何構成フェーズでは, 合成過程の安定性を高めるために, 複数のニューラル表現を利用する。
テクスチャ生成フェーズでは、そのような領域に向けて神経表現を導くために、新しいスコア蒸留、すなわちドメインスコア蒸留(DSD)を導入する。
論文 参考訳(メタデータ) (2024-11-03T15:15:01Z) - Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - Learning to Generate 3D Representations of Building Roofs Using
Single-View Aerial Imagery [68.3565370706598]
本研究では,空撮画像から建物屋根メッシュの条件分布を学習するための新しいパイプラインを提案する。
同一物体の複数の画像を必要とする代替手法とは違って,本手法では,一つの画像のみを用いて予測を行う3次元屋根メッシュを推定できる。
論文 参考訳(メタデータ) (2023-03-20T15:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。