論文の概要: Multi-Round Region-Based Optimization for Scene Sketching
- arxiv url: http://arxiv.org/abs/2410.04072v1
- Date: Sat, 5 Oct 2024 08:04:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 14:20:57.467828
- Title: Multi-Round Region-Based Optimization for Scene Sketching
- Title(参考訳): シーンスケッチのためのマルチラウンド領域ベース最適化
- Authors: Yiqi Liang, Ying Liu, Dandan Long, Ruihui Li,
- Abstract要約: シーンのスケッチには、シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。
複数のラウンドで入力シーンの異なる領域を最適化する。
新たなCLIPに基づくセマンティック損失とVGGに基づく特徴損失を多ラウンド最適化のガイドに利用した。
- 参考スコア(独自算出の注目度): 7.281215486388827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene sketching is to convert a scene into a simplified, abstract representation that captures the essential elements and composition of the original scene. It requires semantic understanding of the scene and consideration of different regions within the scene. Since scenes often contain diverse visual information across various regions, such as foreground objects, background elements, and spatial divisions, dealing with these different regions poses unique difficulties. In this paper, we define a sketch as some sets of Bezier curves. We optimize the different regions of input scene in multiple rounds. In each round of optimization, strokes sampled from the next region can seamlessly be integrated into the sketch generated in the previous round of optimization. We propose additional stroke initialization method to ensure the integrity of the scene and the convergence of optimization. A novel CLIP-Based Semantic loss and a VGG-Based Feature loss are utilized to guide our multi-round optimization. Extensive experimental results on the quality and quantity of the generated sketches confirm the effectiveness of our method.
- Abstract(参考訳): シーンスケッチ(Scene sketching)とは、シーンを単純化された抽象的な表現に変換し、元のシーンの本質的な要素と構成をキャプチャすることである。
シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。
前景、背景要素、空間分割など、様々な領域に多様な視覚情報を含む場合が多いため、これらの異なる領域を扱うのに特有の困難が生じる。
本稿では,スケッチをベジエ曲線の集合として定義する。
複数のラウンドで入力シーンの異なる領域を最適化する。
最適化の各ラウンドでは、次のリージョンからサンプリングされたストロークを、前回の最適化ラウンドで生成されたスケッチにシームレスに統合することができる。
本稿では,シーンの整合性と最適化の収束性を確保するために,追加のストローク初期化手法を提案する。
新たなCLIPに基づくセマンティック損失とVGGに基づく特徴損失を多ラウンド最適化のガイドに利用した。
生成したスケッチの品質と量に関する大規模な実験結果から,本手法の有効性が確認された。
関連論文リスト
- LinPrim: Linear Primitives for Differentiable Volumetric Rendering [53.780682194322225]
線形プリミティブ-オクタヘドラとテトラヘドラ-ボスに基づく2つの新しいシーン表現を導入する。
この定式化は、ダウンストリームアプリケーションのオーバーヘッドを最小限にする、標準メッシュベースのツールと自然に一致します。
再現精度を向上するためにプリミティブを減らしながら,最先端のボリューム手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2025-01-27T18:49:38Z) - Efficient Scene Appearance Aggregation for Level-of-Detail Rendering [42.063285161104474]
本稿では,複雑なシーンの集合的な外観を表す新しいボリューム表現について述べる。
ボクセル内の局所的な相関関係と,シーンの異なる部分におけるグローバルな相関関係を捉えるという課題に対処する。
論文 参考訳(メタデータ) (2024-08-19T01:01:12Z) - Boosting Self-Supervision for Single-View Scene Completion via Knowledge Distillation [39.08243715525956]
Structure from Motionを通して画像からシーン幾何学を推定することは、コンピュータビジョンにおける長年の根本的問題である。
ニューラルレイディアンス場(NeRF)の人気が高まり、暗黙の表現もシーン完了のために人気になった。
本稿では,複数の画像からシーン再構成を融合させ,その知識をより正確な単一視点のシーン再構成に変換することを提案する。
論文 参考訳(メタデータ) (2024-04-11T17:30:24Z) - Adaptive Region Selection for Active Learning in Whole Slide Image
Semantic Segmentation [3.1392713791311766]
リージョンベースアクティブラーニング(AL)では、限られた数の注釈付き画像領域でモデルをトレーニングする。
本稿では,このALハイパーパラメータに依存しないアノテーション領域を適応的に選択する手法を提案する。
CAMELYON16データセットを用いた乳癌セグメンテーションの課題を用いて本手法の評価を行った。
論文 参考訳(メタデータ) (2023-07-14T05:34:13Z) - Differentiable Blocks World: Qualitative 3D Decomposition by Rendering
Primitives [70.32817882783608]
本稿では,3次元プリミティブを用いて,シンプルでコンパクトで動作可能な3次元世界表現を実現する手法を提案する。
既存の3次元入力データに依存するプリミティブ分解法とは異なり,本手法は画像を直接操作する。
得られたテクスチャ化されたプリミティブは入力画像を忠実に再構成し、視覚的な3Dポイントを正確にモデル化する。
論文 参考訳(メタデータ) (2023-07-11T17:58:31Z) - Partially Does It: Towards Scene-Level FG-SBIR with Partial Input [106.59164595640704]
シーンスケッチのかなりの部分は「部分的」である
そこで我々は,部分認識方式でクロスモーダル領域アソシエーションをモデル化するためのセットベースアプローチを提案する。
提案手法はシーンスケッチ部分に対して頑健なだけでなく,既存のデータセット上での最先端の性能も向上する。
論文 参考訳(メタデータ) (2022-03-28T14:44:45Z) - IBRNet: Learning Multi-View Image-Based Rendering [67.15887251196894]
本稿では,近接ビューの疎集合を補間することにより,複雑なシーンの新しいビューを合成する手法を提案する。
レンダリング時にソースビューを描画することで、画像ベースのレンダリングに関する古典的な作業に戻ります。
論文 参考訳(メタデータ) (2021-02-25T18:56:21Z) - Image Stitching Based on Planar Region Consensus [22.303750435673752]
本稿では,マッチングされた支配的な平面領域の集合をアライメントすることで,画像の縫合を行う新しい画像縫合法を提案する。
我々は、RGB画像から直接リッチな意味情報を用いて、深層畳み込みニューラルネットワーク(CNN)を用いて平面画像領域を抽出する。
我々の手法は、異なる状況に対処し、挑戦的な場面で最先端の技術を発揮できる。
論文 参考訳(メタデータ) (2020-07-06T13:07:20Z) - Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。
提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。
本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文 参考訳(メタデータ) (2020-03-18T17:22:11Z) - Depth Based Semantic Scene Completion with Position Importance Aware
Loss [52.06051681324545]
PALNetはセマンティックシーン補完のための新しいハイブリッドネットワークである。
詳細な深度情報を用いて,多段階から2次元特徴と3次元特徴の両方を抽出する。
オブジェクトのバウンダリやシーンの隅といった重要な詳細を復元することは有益である。
論文 参考訳(メタデータ) (2020-01-29T07:05:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。