論文の概要: MROSS: Multi-Round Region-based Optimization for Scene Sketching
- arxiv url: http://arxiv.org/abs/2410.04072v2
- Date: Tue, 15 Apr 2025 11:44:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:08:41.924257
- Title: MROSS: Multi-Round Region-based Optimization for Scene Sketching
- Title(参考訳): MROSS:マルチラウンド領域ベースのシーンスケッチ最適化
- Authors: Yiqi Liang, Ying Liu, Dandan Long, Ruihui Li,
- Abstract要約: シーンのスケッチには、シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。
我々はスケッチをブエジエ曲線のいくつかの集合として定義する。
新たなCLIPベースのセマンティックロスとVGGベースの特徴損失を利用して,多ラウンド最適化を導出する。
- 参考スコア(独自算出の注目度): 7.281215486388827
- License:
- Abstract: Scene sketching is to convert a scene into a simplified, abstract representation that captures the essential elements and composition of the original scene. It requires a semantic understanding of the scene and consideration of different regions within the scene. Since scenes often contain diverse visual information across various regions, such as foreground objects, background elements, and spatial divisions, dealing with these different regions poses unique difficulties. In this paper, we define a sketch as some sets of B\'ezier curves because of their smooth and versatile characteristics. We optimize different regions of input scene in multiple rounds. In each optimization round, the strokes sampled from the next region can seamlessly be integrated into the sketch generated in the previous optimization round. We propose an additional stroke initialization method to ensure the integrity of the scene and the convergence of optimization. A novel CLIP-based Semantic Loss and a VGG-based Feature Loss are utilized to guide our multi-round optimization. Extensive experimental results on the quality and quantity of the generated sketches confirm the effectiveness of our method.
- Abstract(参考訳): シーンスケッチ(Scene sketching)とは、シーンを単純化された抽象的な表現に変換し、元のシーンの本質的な要素と構成をキャプチャすることである。
シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。
前景、背景要素、空間分割など、様々な領域に多様な視覚情報を含む場合が多いため、これらの異なる領域を扱うのに特有の困難が生じる。
本稿では,スケッチをB\'ezier曲線のいくつかの集合として定義する。
入力シーンの異なる領域を複数ラウンドで最適化する。
各最適化ラウンドでは、次の領域からサンプリングされたストロークを、前回の最適化ラウンドで生成されたスケッチにシームレスに統合することができる。
本稿では,シーンの整合性と最適化の収束性を確保するために,追加のストローク初期化手法を提案する。
新たなCLIPベースのセマンティックロスとVGGベースの特徴損失を利用して,多ラウンド最適化を導出する。
生成したスケッチの品質と量に関する大規模な実験結果から,本手法の有効性が確認された。
関連論文リスト
- LinPrim: Linear Primitives for Differentiable Volumetric Rendering [53.780682194322225]
線形プリミティブ-オクタヘドラとテトラヘドラ-ボスに基づく2つの新しいシーン表現を導入する。
この定式化は、ダウンストリームアプリケーションのオーバーヘッドを最小限にする、標準メッシュベースのツールと自然に一致します。
再現精度を向上するためにプリミティブを減らしながら,最先端のボリューム手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2025-01-27T18:49:38Z) - Efficient Scene Appearance Aggregation for Level-of-Detail Rendering [42.063285161104474]
本稿では,複雑なシーンの集合的な外観を表す新しいボリューム表現について述べる。
ボクセル内の局所的な相関関係と,シーンの異なる部分におけるグローバルな相関関係を捉えるという課題に対処する。
論文 参考訳(メタデータ) (2024-08-19T01:01:12Z) - Boosting Self-Supervision for Single-View Scene Completion via Knowledge Distillation [39.08243715525956]
Structure from Motionを通して画像からシーン幾何学を推定することは、コンピュータビジョンにおける長年の根本的問題である。
ニューラルレイディアンス場(NeRF)の人気が高まり、暗黙の表現もシーン完了のために人気になった。
本稿では,複数の画像からシーン再構成を融合させ,その知識をより正確な単一視点のシーン再構成に変換することを提案する。
論文 参考訳(メタデータ) (2024-04-11T17:30:24Z) - Adaptive Region Selection for Active Learning in Whole Slide Image
Semantic Segmentation [3.1392713791311766]
リージョンベースアクティブラーニング(AL)では、限られた数の注釈付き画像領域でモデルをトレーニングする。
本稿では,このALハイパーパラメータに依存しないアノテーション領域を適応的に選択する手法を提案する。
CAMELYON16データセットを用いた乳癌セグメンテーションの課題を用いて本手法の評価を行った。
論文 参考訳(メタデータ) (2023-07-14T05:34:13Z) - Differentiable Blocks World: Qualitative 3D Decomposition by Rendering
Primitives [70.32817882783608]
本稿では,3次元プリミティブを用いて,シンプルでコンパクトで動作可能な3次元世界表現を実現する手法を提案する。
既存の3次元入力データに依存するプリミティブ分解法とは異なり,本手法は画像を直接操作する。
得られたテクスチャ化されたプリミティブは入力画像を忠実に再構成し、視覚的な3Dポイントを正確にモデル化する。
論文 参考訳(メタデータ) (2023-07-11T17:58:31Z) - Partially Does It: Towards Scene-Level FG-SBIR with Partial Input [106.59164595640704]
シーンスケッチのかなりの部分は「部分的」である
そこで我々は,部分認識方式でクロスモーダル領域アソシエーションをモデル化するためのセットベースアプローチを提案する。
提案手法はシーンスケッチ部分に対して頑健なだけでなく,既存のデータセット上での最先端の性能も向上する。
論文 参考訳(メタデータ) (2022-03-28T14:44:45Z) - IBRNet: Learning Multi-View Image-Based Rendering [67.15887251196894]
本稿では,近接ビューの疎集合を補間することにより,複雑なシーンの新しいビューを合成する手法を提案する。
レンダリング時にソースビューを描画することで、画像ベースのレンダリングに関する古典的な作業に戻ります。
論文 参考訳(メタデータ) (2021-02-25T18:56:21Z) - Image Stitching Based on Planar Region Consensus [22.303750435673752]
本稿では,マッチングされた支配的な平面領域の集合をアライメントすることで,画像の縫合を行う新しい画像縫合法を提案する。
我々は、RGB画像から直接リッチな意味情報を用いて、深層畳み込みニューラルネットワーク(CNN)を用いて平面画像領域を抽出する。
我々の手法は、異なる状況に対処し、挑戦的な場面で最先端の技術を発揮できる。
論文 参考訳(メタデータ) (2020-07-06T13:07:20Z) - Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。
提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。
本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文 参考訳(メタデータ) (2020-03-18T17:22:11Z) - Depth Based Semantic Scene Completion with Position Importance Aware
Loss [52.06051681324545]
PALNetはセマンティックシーン補完のための新しいハイブリッドネットワークである。
詳細な深度情報を用いて,多段階から2次元特徴と3次元特徴の両方を抽出する。
オブジェクトのバウンダリやシーンの隅といった重要な詳細を復元することは有益である。
論文 参考訳(メタデータ) (2020-01-29T07:05:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。