Fugu-MT 論文翻訳(概要): Wired Perspectives: Multi-View Wire Art Embraces Generative AI

論文の概要: Wired Perspectives: Multi-View Wire Art Embraces Generative AI

arxiv url: http://arxiv.org/abs/2311.15421v1
Date: Sun, 26 Nov 2023 21:09:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-28 17:41:17.861180
Title: Wired Perspectives: Multi-View Wire Art Embraces Generative AI
Title（参考訳）: Wired Perspectives:マルチビューのワイヤーアートが生成AIを取り入れる
Authors: Zhiyu Qu and Lan Yang and Honggang Zhang and Tao Xiang and Kaiyue Pang and Yi-Zhe Song
Abstract要約: 私たちは、誰もが簡単にMVWAを作れるAIシステムDreamWireを紹介します。ユーザーはテキストのプロンプトやスクリブルを通じてビジョンを表現し、複雑な3Dワイヤー組織から解放する。
参考スコア（独自算出の注目度）: 95.3563704223252
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Creating multi-view wire art (MVWA), a static 3D sculpture with diverse interpretations from different viewpoints, is a complex task even for skilled artists. In response, we present DreamWire, an AI system enabling everyone to craft MVWA easily. Users express their vision through text prompts or scribbles, freeing them from intricate 3D wire organisation. Our approach synergises 3D B\'ezier curves, Prim's algorithm, and knowledge distillation from diffusion models or their variants (e.g., ControlNet). This blend enables the system to represent 3D wire art, ensuring spatial continuity and overcoming data scarcity. Extensive evaluation and analysis are conducted to shed insight on the inner workings of the proposed system, including the trade-off between connectivity and visual aesthetics.
Abstract（参考訳）: 多視点ワイヤーアート(MVWA、Multi-view wire art)は、異なる視点から様々な解釈をすることができる静的な3D彫刻である。そこで我々は,MVWAを容易に作成できるAIシステムDreamWireを紹介する。ユーザーはテキストプロンプトやスクリブルを通じてビジョンを表現し、複雑な3dワイヤー組織から解放する。提案手法は,3次元b\'ezier曲線,prim'sアルゴリズム,および拡散モデルあるいはそれらの変種(例えば controlnet)からの知識蒸留を合成する。このブレンドにより、システムは3dワイヤアートを表現でき、空間的連続性とデータの不足を克服することができる。本システムの内部動作について,接続性と視覚美学のトレードオフを含む総合的な評価と分析を行った。

関連論文リスト

WonderFree: Enhancing Novel View Quality and Cross-View Consistency for 3D Scene Exploration [28.97217489759405]
現在の3D生成手法の主な課題は、探索可能性の制限である。我々は,任意の角度や方向から自由に3D世界を対話的に生成できるWonderFreeを提案する。
論文参考訳（メタデータ） (2025-06-25T16:28:40Z)
Visibility-Uncertainty-guided 3D Gaussian Inpainting via Scene Conceptional Learning [63.94919846010485]
3DGI)は、複数の入力ビューから補完的な視覚的・意味的手がかりを効果的に活用することが困難である。本稿では,異なる入力ビュー間での3Dポイントの視認性不確実性を計測し,それらを用いて3DGIを誘導する手法を提案する。 ViSibility-uncerTainty-guided 3DGIとシーンコンセプトAl学習を統合し,新しい3DGIフレームワークであるVISTAを構築した。
論文参考訳（メタデータ） (2025-04-23T06:21:11Z)
Ross3D: Reconstructive Visual Instruction Tuning with 3D-Awareness [73.72335146374543]
本稿では,3次元視覚指導を訓練手順に組み込んだ3次元視覚指導法(Ross3D)について紹介する。 Ross3Dは様々な3Dシーン理解ベンチマークで最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-04-02T16:59:55Z)
Enhancing Monocular 3D Scene Completion with Diffusion Model [20.81599069390756]
3Dシーンの再構築は、仮想現実、ロボティクス、自動運転の応用に不可欠である。従来の3Dガウススプラッティング技術は、最適な性能を達成するために複数の視点から撮影された画像に依存している。 1枚の画像から完全な3Dシーンを再構築するための新しいアプローチであるFlashDreamerを紹介する。
論文参考訳（メタデータ） (2025-03-02T04:36:57Z)
Illusion3D: 3D Multiview Illusion with 2D Diffusion Priors [19.58299058678772]
ユーザが提供するテキストプロンプトや画像に基づいて、3次元のマルチビューイリュージョンを作成するための,シンプルで効果的なアプローチを提案する。本手法は,事前学習したテキスト・画像拡散モデルを用いて,ニューラル3次元表現のテクスチャと形状を最適化する。我々は,生成した3次元マルチビューイリュージョンの品質を向上させるために,いくつかの手法を開発した。
論文参考訳（メタデータ） (2024-12-12T18:59:59Z)
ART3D: 3D Gaussian Splatting for Text-Guided Artistic Scenes Generation [18.699440994076003]
ART3Dは拡散モデルと3Dガウススプラッティング技術を組み合わせた新しいフレームワークである。深度情報と初期芸術画像を活用することにより,点雲マップを生成する。また、3Dシーンの整合性を高めるための奥行き整合性モジュールを提案する。
論文参考訳（メタデータ） (2024-05-17T03:19:36Z)
SUGAR: Pre-training 3D Visual Representations for Robotics [85.55534363501131]
ロボット工学のための新しい3D事前学習フレームワークSUGARを紹介した。 SUGARは3次元の点雲を通してオブジェクトの意味的、幾何学的、および余分な特性をキャプチャする。 SuGARの3D表現は最先端の2Dおよび3D表現よりも優れていることを示す。
論文参考訳（メタデータ） (2024-04-01T21:23:03Z)
HUGS: Holistic Urban 3D Scene Understanding via Gaussian Splatting [53.6394928681237]
RGB画像に基づく都市景観の全体的理解は、難しいが重要な問題である。我々の主な考え方は、静的な3Dガウスと動的なガウスの組合せを用いた幾何学、外観、意味論、運動の合同最適化である。提案手法は,2次元および3次元のセマンティック情報を高精度に生成し,新たな視点をリアルタイムに描画する機能を提供する。
論文参考訳（メタデータ） (2024-03-19T13:39:05Z)
Agent3D-Zero: An Agent for Zero-shot 3D Understanding [79.88440434836673]
Agent3D-Zeroは、3Dシーン理解に対処する革新的な3D対応エージェントフレームワークである。本稿では,3次元理解のための視点を積極的に選択し,分析することで,VLM(Large Visual Language Model)を利用する新しい手法を提案する。 Agent3D-Zeroの独特な利点は、新しい視覚的プロンプトの導入である。
論文参考訳（メタデータ） (2024-03-18T14:47:03Z)
Multiview Compressive Coding for 3D Reconstruction [77.95706553743626]
単一オブジェクトの3Dポイントやシーン全体で動作するシンプルなフレームワークを紹介します。我々のモデルであるMultiview Compressive Codingは、入力の外観と形状を圧縮して3次元構造を予測する。
論文参考訳（メタデータ） (2023-01-19T18:59:52Z)
3D-LatentMapper: View Agnostic Single-View Reconstruction of 3D Shapes [0.0]
視覚変換器(ViT)の中間潜時空間と共同画像テキスト表現モデル(CLIP)を高速かつ効率的なシングルビュー再構成(SVR)に活用する新しいフレームワークを提案する。本研究ではShapeNetV2データセットを用いてSOTA法との比較実験を行い,本手法の有効性を実証する。
論文参考訳（メタデータ） (2022-12-05T11:45:26Z)
Learning Ego 3D Representation as Ray Tracing [42.400505280851114]
我々は、制約のないカメラビューからエゴ3D表現学習のための新しいエンドツーエンドアーキテクチャを提案する。レイトレーシングの原理にインスパイアされた我々は、学習可能なエゴ3D表現として「虚視」の偏極格子を設計する。我々のモデルはすべての最先端の代替品を著しく上回ります。
論文参考訳（メタデータ） (2022-06-08T17:55:50Z)
3D Neural Scene Representations for Visuomotor Control [78.79583457239836]
我々は2次元視覚観測から動的3次元シーンのモデルを純粋に学習する。学習した表現空間上に構築された動的モデルにより,操作課題に対するビジュモータ制御が可能となる。
論文参考訳（メタデータ） (2021-07-08T17:49:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。