Fugu-MT 論文翻訳(概要): Object-level Geometric Structure Preserving for Natural Image Stitching

論文の概要: Object-level Geometric Structure Preserving for Natural Image Stitching

arxiv url: http://arxiv.org/abs/2402.12677v3
Date: Fri, 9 Aug 2024 13:59:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-12 20:30:23.693954
Title: Object-level Geometric Structure Preserving for Natural Image Stitching
Title（参考訳）: 自然画像ストレッチのためのオブジェクトレベルの幾何構造
Authors: Wenxiao Cai, Wankou Yang,
Abstract要約: 我々はGlobal similarity Prior (OBJ-GSP)に基づく画像内のOBJectレベルの全体構造を保護すべく努力している。三角形メッシュは画像内のオブジェクト全体の形状を保護するために画像変換に使用される。我々はこれまでで最も包括的な画像縫合ベンチマークであるStitchBenchを提案する。
参考スコア（独自算出の注目度）: 11.884195814743249
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The topic of stitching images with globally natural structures holds paramount significance, with two main goals: alignment and distortion prevention. The existing approaches exhibit the ability to align well, yet fall short in maintaining object structures. In this paper, we endeavour to safeguard the overall OBJect-level structures within images based on Global Similarity Prior (OBJ-GSP), on the basis of good alignment performance. Our approach leverages semantic segmentation models like the family of Segment Anything Model to extract the contours of any objects in a scene. Triangular meshes are employed in image transformation to protect the overall shapes of objects within images. The balance between alignment and distortion prevention is achieved by allowing the object meshes to strike a balance between similarity and projective transformation. We also demonstrate the importance of segmentation in low-altitude aerial image stitching. Additionally, we propose StitchBench, the most comprehensive image stitching benchmark by far. Extensive experimental results demonstrate that OBJ-GSP outperforms existing methods in both alignment and shape preservation. Code and dataset is publicly available at \url{https://github.com/RussRobin/OBJ-GSP}.
Abstract（参考訳）: 世界規模の自然構造で画像を縫い合わせるという話題は、アライメントと歪み防止という2つの主要な目標において、最重要となる。既存のアプローチは、うまく整合する能力を示しているが、オブジェクト構造を維持するには不足している。本稿では,優れたアライメント性能に基づいて,グローバル類似性優先(OBJ-GSP)に基づく画像内のOBJectレベル構造全体の保護に努める。我々のアプローチはシーン内の任意のオブジェクトの輪郭を抽出するためにSegment Anything Modelのファミリーのようなセグメンテーションモデルを活用する。三角形メッシュは画像内のオブジェクト全体の形状を保護するために画像変換に使用される。アライメントと歪み防止のバランスは、オブジェクトメッシュが類似性と射影変換のバランスをとることによって達成される。また,低高度空中画像縫合におけるセグメンテーションの重要性も示した。さらに,これまでで最も包括的な画像縫合ベンチマークであるStitchBenchを提案する。 OBJ-GSPはアライメントと形状保存の両方において既存の手法よりも優れていた。コードとデータセットは \url{https://github.com/RussRobin/OBJ-GSP} で公開されている。

関連論文リスト

PoseGAM: Robust Unseen Object Pose Estimation via Geometry-Aware Multi-View Reasoning [49.66437612420291]
PoseGAMは、クエリ画像と複数のテンプレート画像からオブジェクトのポーズを直接予測する幾何学的なマルチビューフレームワークである。多様な環境条件下で190k以上のオブジェクトを含む大規模合成データセットを構築した。
論文参考訳（メタデータ） (2025-12-11T17:29:25Z)
Hierarchical Image-Guided 3D Point Cloud Segmentation in Industrial Scenes via Multi-View Bayesian Fusion [4.679314646805623]
3Dセグメンテーションは、高密度なレイアウトとマルチスケールオブジェクトを持つ複雑なシーンを理解するために重要である。既存の3Dポイントベースの手法はコストのかかるアノテーションを必要とするが、画像誘導方式はビュー間のセマンティックな不整合に悩まされることが多い。本稿では,階層的な画像誘導型3次元セグメンテーションフレームワークを提案する。
論文参考訳（メタデータ） (2025-12-07T15:15:52Z)
TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文参考訳（メタデータ） (2025-12-02T02:22:20Z)
SegMASt3R: Geometry Grounded Segment Matching [23.257530861472656]
我々は3次元基礎モデルの空間的理解を活用して,広義のセグメントマッチングに取り組む。本稿では,これら3次元基礎モデルの帰納バイアスを利用して,最大180度の視点変化回転で画像対間のセグメントをマッチングするアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-10-06T17:31:32Z)
Zero-shot Inexact CAD Model Alignment from a Single Image [53.37898107159792]
1つの画像から3Dシーン構造を推測する実践的なアプローチは、データベースから密に一致する3Dモデルを検索し、画像内のオブジェクトと整列させることである。既存のメソッドは、イメージによる教師付きトレーニングとアノテーションのポーズに依存しており、オブジェクトカテゴリの狭いセットに制限されている。ポーズアノテーションを必要とせず、未知のカテゴリに一般化する不正確な3次元モデルの弱い教師付き9-DoFアライメント法を提案する。
論文参考訳（メタデータ） (2025-07-04T04:46:59Z)
Refine Any Object in Any Scene [39.109559659959]
Refine Any Object In Any ScenE (RAISE) は、細粒度オブジェクトの形状と外観を失くしたビューで復元する新しい3D拡張フレームワークである。 RAISEは、各プロキシを7-DOFのポーズで劣化したプロキシにアライメントすることで、幾何やテクスチャを徐々に洗練する。挑戦的なベンチマーク実験により、RAISEは新しいビュー合成と幾何完成タスクの両方において最先端の手法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2025-06-30T13:26:21Z)
Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models [79.96917782423219]
オリエント・アプライシング(Orient Anything)は、1つの画像でオブジェクトの向きを推定するために設計された最初のエキスパートで基礎的なモデルである。 3Dオブジェクトの前面にアノテートするパイプラインを開発することで、正確な向きのアノテーションで2Mイメージを収集する。本モデルでは,レンダリング画像と実画像の両方において,最先端の向き推定精度を実現する。
論文参考訳（メタデータ） (2024-12-24T18:58:43Z)
SINGAPO: Single Image Controlled Generation of Articulated Parts in Objects [20.978091381109294]
本稿では,単一画像から音声オブジェクトを生成する手法を提案する。提案手法は,入力画像と視覚的に一致した音声オブジェクトを生成する。実験の結果,本手法は音声によるオブジェクト生成における最先端の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2024-10-21T20:41:32Z)
FoundPose: Unseen Object Pose Estimation with Foundation Features [11.32559845631345]
FoundPoseは、単一のRGB画像から見えないオブジェクトを6Dポーズで推定するモデルベースの手法である。この方法は、オブジェクトやタスク固有のトレーニングを必要とせずに、3Dモデルを使って、新しいオブジェクトを素早くオンボードできる。
論文参考訳（メタデータ） (2023-11-30T18:52:29Z)
Generative Category-Level Shape and Pose Estimation with Semantic Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文参考訳（メタデータ） (2022-10-03T17:51:54Z)
Learning Object Placement via Dual-path Graph Completion [28.346027247882354]
オブジェクト配置は、適切な位置とサイズで背景画像の上に前景オブジェクトを配置することを目的としている。本研究では,オブジェクト配置をグラフ補完問題として扱い,新しいグラフ補完モジュール(GCM)を提案する。前景オブジェクトは、このグラフの合理的な場所に挿入されるべき特別なノードとしてエンコードされる。
論文参考訳（メタデータ） (2022-07-23T08:39:39Z)
Towards Self-Supervised Category-Level Object Pose and Size Estimation [121.28537953301951]
本研究は,一深度画像からのカテゴリレベルのオブジェクトポーズとサイズ推定のための自己教師型フレームワークを提案する。我々は、同じ形状の点雲における幾何学的整合性を利用して自己超越する。
論文参考訳（メタデータ） (2022-03-06T06:02:30Z)
ELLIPSDF: Joint Object Pose and Shape Optimization with a Bi-level Ellipsoid and Signed Distance Function Description [9.734266860544663]
本稿では,関節オブジェクトのポーズと形状最適化のための表現的かつコンパクトなモデルを提案する。多視点RGB-Dカメラ観測からオブジェクトレベルのマップを推論する。提案手法は,大規模実世界のScanNetデータセットを用いて評価し,最先端の手法と比較する。
論文参考訳（メタデータ） (2021-08-01T03:07:31Z)
DONet: Learning Category-Level 6D Object Pose and Size Estimation from Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文参考訳（メタデータ） (2021-06-27T10:41:50Z)
Scene Graph to Image Generation with Contextualized Object Layout Refinement [92.85331019618332]
シーングラフから画像を生成する新しい手法を提案する。提案手法では,レイアウトのカバレッジを約20ポイント向上し,オブジェクトの重複量を無視できる量に削減する。
論文参考訳（メタデータ） (2020-09-23T06:27:54Z)
Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文参考訳（メタデータ） (2020-07-20T12:11:22Z)
Perspective Plane Program Induction from a Single Image [85.28956922100305]
本研究では,自然画像の全体像を推定する逆グラフ問題について検討する。我々は、この問題を、入力画像の最もよく記述されたカメラポーズとシーン構造を共同で発見するものとして定式化する。提案するフレームワークであるP3Iは,探索に基づくアルゴリズムと勾配に基づくアルゴリズムを組み合わせて効率よく問題を解く。
論文参考訳（メタデータ） (2020-06-25T21:18:58Z)
UCLID-Net: Single View Reconstruction in Object Space [60.046383053211215]
三次元潜在空間を保存する幾何学的空間の構築は,オブジェクト座標空間における大域的形状規則性と局所的推論を同時に学習する上で有効であることを示す。ベンチマーク目的でよく使用されるShapeNet合成画像と、我々のアプローチが最先端の画像より優れている実世界の画像の両方を実証する。
論文参考訳（メタデータ） (2020-06-06T09:15:56Z)
Object-Centric Image Generation from Layouts [93.10217725729468]
複数のオブジェクトを持つ複雑なシーンを生成するレイアウト・ツー・イメージ生成法を開発した。本手法は,シーン内のオブジェクト間の空間的関係の表現を学習し,レイアウトの忠実度の向上につながる。本稿では,Fr'echet Inception Distanceのオブジェクト中心適応であるSceneFIDを紹介する。
論文参考訳（メタデータ） (2020-03-16T21:40:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。