Fugu-MT 論文翻訳(概要): MROSS: Multi-Round Region-based Optimization for Scene Sketching

論文の概要: MROSS: Multi-Round Region-based Optimization for Scene Sketching

arxiv url: http://arxiv.org/abs/2410.04072v2
Date: Tue, 15 Apr 2025 11:44:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-25 07:29:27.6603
Title: MROSS: Multi-Round Region-based Optimization for Scene Sketching
Title（参考訳）: MROSS:マルチラウンド領域ベースのシーンスケッチ最適化
Authors: Yiqi Liang, Ying Liu, Dandan Long, Ruihui Li,
Abstract要約: シーンのスケッチには、シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。我々はスケッチをブエジエ曲線のいくつかの集合として定義する。新たなCLIPベースのセマンティックロスとVGGベースの特徴損失を利用して,多ラウンド最適化を導出する。
参考スコア（独自算出の注目度）: 7.281215486388827
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Scene sketching is to convert a scene into a simplified, abstract representation that captures the essential elements and composition of the original scene. It requires a semantic understanding of the scene and consideration of different regions within the scene. Since scenes often contain diverse visual information across various regions, such as foreground objects, background elements, and spatial divisions, dealing with these different regions poses unique difficulties. In this paper, we define a sketch as some sets of B\'ezier curves because of their smooth and versatile characteristics. We optimize different regions of input scene in multiple rounds. In each optimization round, the strokes sampled from the next region can seamlessly be integrated into the sketch generated in the previous optimization round. We propose an additional stroke initialization method to ensure the integrity of the scene and the convergence of optimization. A novel CLIP-based Semantic Loss and a VGG-based Feature Loss are utilized to guide our multi-round optimization. Extensive experimental results on the quality and quantity of the generated sketches confirm the effectiveness of our method.
Abstract（参考訳）: シーンスケッチ(Scene sketching)とは、シーンを単純化された抽象的な表現に変換し、元のシーンの本質的な要素と構成をキャプチャすることである。シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。前景、背景要素、空間分割など、様々な領域に多様な視覚情報を含む場合が多いため、これらの異なる領域を扱うのに特有の困難が生じる。本稿では,スケッチをB\'ezier曲線のいくつかの集合として定義する。入力シーンの異なる領域を複数ラウンドで最適化する。各最適化ラウンドでは、次の領域からサンプリングされたストロークを、前回の最適化ラウンドで生成されたスケッチにシームレスに統合することができる。本稿では,シーンの整合性と最適化の収束性を確保するために,追加のストローク初期化手法を提案する。新たなCLIPベースのセマンティックロスとVGGベースの特徴損失を利用して,多ラウンド最適化を導出する。生成したスケッチの品質と量に関する大規模な実験結果から,本手法の有効性が確認された。

関連論文リスト

Content-Aware Texturing for Gaussian Splatting [4.861240703958262]
我々は,テクスチャを用いて,可能な限り詳細な外観を表現することを提案する。我々の主な焦点は、ガウススプラッティング最適化中にシーンに適応する原初的テクスチャマップを組み込むことである。提案手法は, 画像の質やパラメータの総数において, 代替手法と比較して良好に動作することを示す。
論文参考訳（メタデータ） (2025-12-02T10:29:10Z)
MS-GS: Multi-Appearance Sparse-View 3D Gaussian Splatting in the Wild [47.52462219920857]
野生の写真コレクションは、しばしば限られた量の画像を含んでおり、複数の外観を示す。 3DGS を用いたスパースビューシナリオにおけるマルチアジュアンス機能を備えた新しいフレームワーク MS-GS を提案する。我々は,MS-GSが様々な難解な視界とマルチアジュアンス条件下でフォトリアリスティックレンダリングを実現することを実証した。
論文参考訳（メタデータ） (2025-09-19T03:06:49Z)
ZDySS -- Zero-Shot Dynamic Scene Stylization using Gaussian Splatting [41.678269742147066]
ゲーム映画製作や拡張現実、仮想現実など、様々な現実世界の応用において、模範的なイメージに基づくダイナミックなシーンのスタイリングが不可欠である。我々は動的シーンのためのゼロショットスタイリングフレームワークであるDySSを紹介した。本手法は,実世界の動的シーンにおけるテストにおける最先端のベースラインに対する性能とコヒーレンスを示す。
論文参考訳（メタデータ） (2025-01-07T15:39:02Z)
SplatLoc: 3D Gaussian Splatting-based Visual Localization for Augmented Reality [50.179377002092416]
より少ないパラメータで高品質なレンダリングが可能な効率的なビジュアルローカライズ手法を提案する。提案手法は,最先端の暗黙的視覚的ローカライゼーションアプローチに対して,より優れた,あるいは同等なレンダリングとローカライゼーション性能を実現する。
論文参考訳（メタデータ） (2024-09-21T08:46:16Z)
Efficient Scene Appearance Aggregation for Level-of-Detail Rendering [42.063285161104474]
本稿では,複雑なシーンの集合的な外観を表す新しいボリューム表現について述べる。ボクセル内の局所的な相関関係と,シーンの異なる部分におけるグローバルな相関関係を捉えるという課題に対処する。
論文参考訳（メタデータ） (2024-08-19T01:01:12Z)
Boosting Self-Supervision for Single-View Scene Completion via Knowledge Distillation [39.08243715525956]
Structure from Motionを通して画像からシーン幾何学を推定することは、コンピュータビジョンにおける長年の根本的問題である。ニューラルレイディアンス場(NeRF)の人気が高まり、暗黙の表現もシーン完了のために人気になった。本稿では,複数の画像からシーン再構成を融合させ,その知識をより正確な単一視点のシーン再構成に変換することを提案する。
論文参考訳（メタデータ） (2024-04-11T17:30:24Z)
SAMPLING: Scene-adaptive Hierarchical Multiplane Images Representation for Novel View Synthesis from a Single Image [60.52991173059486]
単一画像からの新規ビュー合成のためのシーン適応型階層型多面体画像表現であるSAMPlingを紹介する。提案手法は,KITTIデータセット上の単一画像を用いて,大規模非有界屋外シーンにおいてかなりの性能向上を示す。
論文参考訳（メタデータ） (2023-09-12T15:33:09Z)
Adaptive Region Selection for Active Learning in Whole Slide Image Semantic Segmentation [3.1392713791311766]
リージョンベースアクティブラーニング(AL)では、限られた数の注釈付き画像領域でモデルをトレーニングする。本稿では,このALハイパーパラメータに依存しないアノテーション領域を適応的に選択する手法を提案する。 CAMELYON16データセットを用いた乳癌セグメンテーションの課題を用いて本手法の評価を行った。
論文参考訳（メタデータ） (2023-07-14T05:34:13Z)
Differentiable Blocks World: Qualitative 3D Decomposition by Rendering Primitives [70.32817882783608]
本稿では,3次元プリミティブを用いて,シンプルでコンパクトで動作可能な3次元世界表現を実現する手法を提案する。既存の3次元入力データに依存するプリミティブ分解法とは異なり,本手法は画像を直接操作する。得られたテクスチャ化されたプリミティブは入力画像を忠実に再構成し、視覚的な3Dポイントを正確にモデル化する。
論文参考訳（メタデータ） (2023-07-11T17:58:31Z)
Partially Does It: Towards Scene-Level FG-SBIR with Partial Input [106.59164595640704]
シーンスケッチのかなりの部分は「部分的」であるそこで我々は,部分認識方式でクロスモーダル領域アソシエーションをモデル化するためのセットベースアプローチを提案する。提案手法はシーンスケッチ部分に対して頑健なだけでなく,既存のデータセット上での最先端の性能も向上する。
論文参考訳（メタデータ） (2022-03-28T14:44:45Z)
IBRNet: Learning Multi-View Image-Based Rendering [67.15887251196894]
本稿では,近接ビューの疎集合を補間することにより,複雑なシーンの新しいビューを合成する手法を提案する。レンダリング時にソースビューを描画することで、画像ベースのレンダリングに関する古典的な作業に戻ります。
論文参考訳（メタデータ） (2021-02-25T18:56:21Z)
Image Stitching Based on Planar Region Consensus [22.303750435673752]
本稿では,マッチングされた支配的な平面領域の集合をアライメントすることで,画像の縫合を行う新しい画像縫合法を提案する。我々は、RGB画像から直接リッチな意味情報を用いて、深層畳み込みニューラルネットワーク(CNN)を用いて平面画像領域を抽出する。我々の手法は、異なる状況に対処し、挑戦的な場面で最先端の技術を発揮できる。
論文参考訳（メタデータ） (2020-07-06T13:07:20Z)
Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文参考訳（メタデータ） (2020-03-18T17:22:11Z)
Depth Based Semantic Scene Completion with Position Importance Aware Loss [52.06051681324545]
PALNetはセマンティックシーン補完のための新しいハイブリッドネットワークである。詳細な深度情報を用いて,多段階から2次元特徴と3次元特徴の両方を抽出する。オブジェクトのバウンダリやシーンの隅といった重要な詳細を復元することは有益である。
論文参考訳（メタデータ） (2020-01-29T07:05:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。