論文の概要: Co-PLNet: A Collaborative Point-Line Network for Prompt-Guided Wireframe Parsing
- arxiv url: http://arxiv.org/abs/2601.18252v1
- Date: Mon, 26 Jan 2026 08:16:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.73719
- Title: Co-PLNet: A Collaborative Point-Line Network for Prompt-Guided Wireframe Parsing
- Title(参考訳): Co-PLNet: Prompt-Guided Wireframe Parsingのための協調的なポイントラインネットワーク
- Authors: Chao Wang, Xuanying Li, Cheng Dai, Jinglei Feng, Yuxiang Luo, Yuqi Ouyang, Hao Qin,
- Abstract要約: 既存の手法では、ラインとジャンクションを別々に予測し、それらをポストホックで調整し、ミスマッチとロバストネスを低下させる。
本稿では,2つのタスク間で空間的手がかりを交換するポイントライン協調フレームワークであるCo-PLNetを提案する。
Wireframeと YorkUrbanの実験では、精度と堅牢性が一貫した改善と、良好なリアルタイム効率を示している。
- 参考スコア(独自算出の注目度): 5.175452394220525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wireframe parsing aims to recover line segments and their junctions to form a structured geometric representation useful for downstream tasks such as Simultaneous Localization and Mapping (SLAM). Existing methods predict lines and junctions separately and reconcile them post-hoc, causing mismatches and reduced robustness. We present Co-PLNet, a point-line collaborative framework that exchanges spatial cues between the two tasks, where early detections are converted into spatial prompts via a Point-Line Prompt Encoder (PLP-Encoder), which encodes geometric attributes into compact and spatially aligned maps. A Cross-Guidance Line Decoder (CGL-Decoder) then refines predictions with sparse attention conditioned on complementary prompts, enforcing point-line consistency and efficiency. Experiments on Wireframe and YorkUrban show consistent improvements in accuracy and robustness, together with favorable real-time efficiency, demonstrating our effectiveness for structured geometry perception.
- Abstract(参考訳): ワイヤーフレーム解析は、ラインセグメントとそのジャンクションを復元して、同時局所化やマッピング(SLAM)といった下流タスクに有用な構造的幾何学的表現を形成することを目的としている。
既存の手法では、ラインとジャンクションを別々に予測し、それらをポストホックで調整し、ミスマッチとロバストネスを低下させる。
Co-PLNetは2つのタスク間で空間的手がかりを交換し、初期検出を点線プロンプトエンコーダ(PLP-Encoder)を介して空間的プロンプトに変換し、幾何学的属性をコンパクトかつ空間的に整列したマップに符号化する。
CGLデコーダ (Cross-Guidance Line Decoder) は、補完的なプロンプトを条件に細かな注意で予測を洗練し、点線の一貫性と効率を強制する。
Wireframe と YorkUrban の実験では、精度とロバスト性に一貫した改善が見られ、実時間効率も良好に向上し、構造的幾何知覚の有効性が実証された。
関連論文リスト
- Enhancing point cloud analysis via neighbor aggregation correction based on cross-stage structure correlation [22.48120946682699]
ポイントクラウド分析は、ポイントクラウドデータの理解の基礎となるローカル構造を集約する多くの下流タスクの基盤となる。
本稿では,高次元空間における相関を利用してアグリゲーション中の特徴分布を補正する点分布集合抽象モジュール(PDSA)を提案する。
PDSAは、軽量なクロスステージ構造記述子に基づいて点相関を区別し、構造的均一性を高める。
論文 参考訳(メタデータ) (2025-06-18T06:08:17Z) - Hierarchical Attention Networks for Lossless Point Cloud Attribute Compression [22.234604407822673]
本稿では,点雲の属性圧縮のための階層的注意コンテキストモデルを提案する。
単純で効果的なレベル・オブ・ディーテール(LoD)構造を導入し、粗い粒度表現を生成する。
同じ改善レベル内の点は並列に符号化され、共通のコンテキストポイントグループを共有する。
論文 参考訳(メタデータ) (2025-04-01T07:14:10Z) - Fully-Geometric Cross-Attention for Point Cloud Registration [51.865371511201765]
ポイントクラウド登録のアプローチは、ノイズのあるポイント対応のため、ポイントクラウド間の重なりが低いときに失敗することが多い。
この問題に対処するTransformerベースのアーキテクチャに適した,新たなクロスアテンション機構を導入する。
我々はGromov-Wasserstein距離をクロスアテンションの定式化に統合し、異なる点雲間の点間距離を共同計算する。
点レベルでは,局所的な幾何学的構造情報を細かなマッチングのための点特徴に集約する自己認識機構も考案する。
論文 参考訳(メタデータ) (2025-02-12T10:44:36Z) - Local All-Pair Correspondence for Point Tracking [59.76186266230608]
ビデオシーケンス間の任意の点(TAP)を追跡するタスクのために設計された,高精度かつ効率的なモデルであるLocoTrackを紹介する。
LocoTrackは、すべてのTAP-Vidベンチマークで未整合の精度を実現し、現在の最先端の約6倍の速度で動作している。
論文 参考訳(メタデータ) (2024-07-22T06:49:56Z) - COMO: Compact Mapping and Odometry [17.71754144808295]
我々は3次元アンカー点のコンパクトな集合を通して密度幾何学を符号化する実時間単分子マッピングおよびオドメトリーシステムであるCOMOを提案する。
この表現は、カメラポーズと密な幾何学、本質的な3次元一貫性、効率的な2階推論の合同最適化を可能にする。
論文 参考訳(メタデータ) (2024-04-04T15:35:43Z) - ELSD: Efficient Line Segment Detector and Descriptor [9.64386089593887]
本稿では,ラインセグメントを同時に検出し,画像中のデクリプタを抽出する,ELSD(Efficient Line Segment Detector and Descriptor)を提案する。
ELSDはSLAMや画像マッチングなどの高レベルのタスクに不可欠なライン機能を提供します。
実験では,提案したELSDは,Wireframeデータセットと YorkUrbanデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-29T08:53:03Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Holistically-Attracted Wireframe Parsing [123.58263152571952]
本稿では,入力画像中のベクトル化ワイヤフレームを1つのフォワードパスで検出する高速で類似的な解析手法を提案する。
提案手法は, (i) ラインセグメントとジャンクション提案生成, (ii) ラインセグメントとジャンクションマッチング, (iii) ラインセグメントとジャンクション検証の3つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2020-03-03T17:43:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。