論文の概要: Point or Line? Using Line-based Representation for Panoptic Symbol Spotting in CAD Drawings
- arxiv url: http://arxiv.org/abs/2505.23395v1
- Date: Thu, 29 May 2025 12:33:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.849185
- Title: Point or Line? Using Line-based Representation for Panoptic Symbol Spotting in CAD Drawings
- Title(参考訳): ラインベース表現を用いたCAD描画におけるパノプティカルシンボルスポッティング
- Authors: Xingguang Wei, Haomin Wang, Shenglong Ye, Ruifeng Luo, Yanting Zhang, Lixin Gu, Jifeng Dai, Yu Qiao, Wenhai Wang, Hongjie Zhang,
- Abstract要約: ベクトルグラフィカルプリミティブからなるCAD図面におけるパノプティカルシンボルスポッティングの課題について検討する。
既存の手法は通常、画像化、グラフ構築、あるいは点ベースの表現に依存している。
本稿では,プリミティブの行ベースの表現を通じてこれらの課題に対処する新しい手法であるVecFormerを提案する。
- 参考スコア(独自算出の注目度): 45.116136045440584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the task of panoptic symbol spotting, which involves identifying both individual instances of countable things and the semantic regions of uncountable stuff in computer-aided design (CAD) drawings composed of vector graphical primitives. Existing methods typically rely on image rasterization, graph construction, or point-based representation, but these approaches often suffer from high computational costs, limited generality, and loss of geometric structural information. In this paper, we propose VecFormer, a novel method that addresses these challenges through line-based representation of primitives. This design preserves the geometric continuity of the original primitive, enabling more accurate shape representation while maintaining a computation-friendly structure, making it well-suited for vector graphic understanding tasks. To further enhance prediction reliability, we introduce a Branch Fusion Refinement module that effectively integrates instance and semantic predictions, resolving their inconsistencies for more coherent panoptic outputs. Extensive experiments demonstrate that our method establishes a new state-of-the-art, achieving 91.1 PQ, with Stuff-PQ improved by 9.6 and 21.2 points over the second-best results under settings with and without prior information, respectively, highlighting the strong potential of line-based representation as a foundation for vector graphic understanding.
- Abstract(参考訳): 本稿では,コンピュータ支援設計(CAD)における可算物の個々のインスタンスと,ベクトル的グラフィカルプリミティブで構成された未可算物のセマンティック領域の両方を識別するパノプティカルシンボルスポッティングの課題について検討する。
既存の手法は通常、画像のラスタ化、グラフの構成、あるいは点ベースの表現に依存しているが、これらの手法は高い計算コスト、限られた一般性、幾何学的構造情報の喪失に悩まされることが多い。
本稿では,プリミティブの行ベースの表現を通じてこれらの課題に対処する新しい手法であるVecFormerを提案する。
この設計は、元のプリミティブの幾何学的連続性を保ち、計算に親しみやすい構造を維持しながらより正確な形状表現を可能にし、ベクトル図形理解タスクに適している。
予測信頼性をさらに高めるため、より一貫性のあるパン光学出力に対して、インスタンスとセマンティックな予測を効果的に統合し、それらの不整合を解消するブランチ・フュージョン・リファインメント・モジュールを導入する。
大規模な実験により,本手法は91.1 PQを達成し,Stuff-PQを9.6点,21.2点に改善した。
関連論文リスト
- "Principal Components" Enable A New Language of Images [79.45806370905775]
証明可能なPCAのような構造を潜在トークン空間に組み込む新しい視覚トークン化フレームワークを導入する。
提案手法は、最先端の再構築性能を実現し、人間の視覚システムとの整合性を向上する。
論文 参考訳(メタデータ) (2025-03-11T17:59:41Z) - Enhancing Polygonal Building Segmentation via Oriented Corners [0.3749861135832072]
本稿では,入力画像から直接ポリゴンを抽出する,OriCornerNetという新しいディープ畳み込みニューラルネットワークを提案する。
我々のアプローチは、隣接する角への方向を示すフットプリントマスク、コーナー、配向ベクトルを予測できる深いモデルを含む。
SpaceNet VegasとCrowdAIの小さなデータセットで行った性能評価は、我々のアプローチの競争力を示すものである。
論文 参考訳(メタデータ) (2024-07-17T01:59:06Z) - Graph-level Representation Learning with Joint-Embedding Predictive Architectures [43.89120279424267]
JEPA(Joint-Embedding Predictive Architectures)は、自己指導型表現学習の斬新で強力な技術である。
グラフ結合埋め込み予測アーキテクチャ(Graph-JEPA)を提案することにより、このパラダイムを用いてグラフレベルの表現を効果的にモデル化できることを示す。
特に、マスク付きモデリングを採用し、コンテキストサブグラフの潜時表現から始まるマスク付きサブグラフの潜時表現を予測することに焦点をあてる。
論文 参考訳(メタデータ) (2023-09-27T20:42:02Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - Template based Graph Neural Network with Optimal Transport Distances [11.56532171513328]
現在のグラフニューラルネットワーク(GNN)アーキテクチャは、2つの重要なコンポーネントに依存している。
本稿では,学習可能なグラフテンプレートとの距離をグラフ表現のコアに配置する新しい視点を提案する。
この距離埋め込みは、Fused Gromov-Wasserstein (FGW) 距離という最適な輸送距離によって構築される。
論文 参考訳(メタデータ) (2022-05-31T12:24:01Z) - Harnessing spectral representations for subgraph alignment [15.86857474914914]
本稿では,コンパクトで計算が容易で,トポロジ的変化に頑健で,既存のパイプラインに差し込むのが容易で,特に部分グラフアライメント問題に有効である地図のスペクトル表現を提案する。
サブグラフアライメントタスクで生じる部分性がマップ係数の特別な構造として表される驚くべき現象を初めて報告する。
論文 参考訳(メタデータ) (2022-05-30T09:03:28Z) - GAT-CADNet: Graph Attention Network for Panoptic Symbol Spotting in CAD
Drawings [0.0]
コンピュータ支援設計(CAD)図面からグラフィカルシンボルを抽出することは、多くの産業アプリケーションにとって不可欠である。
本稿では,各CAD描画をグラフとして扱うことにより,新しいグラフ注意ネットワークGAT-CADNetを提案する。
提案したGAT-CADNetは直感的だが有効であり, 一つの統合ネットワークにおける汎視的シンボルスポッティング問題の解決に成功している。
論文 参考訳(メタデータ) (2022-01-03T13:08:28Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Primal-Dual Mesh Convolutional Neural Networks [62.165239866312334]
本稿では,グラフ・ニューラル・ネットワークの文献からトライアングル・メッシュへ引き起こされた原始双対のフレームワークを提案する。
提案手法は,3次元メッシュのエッジと顔の両方を入力として特徴付け,動的に集約する。
メッシュ単純化の文献から得られたツールを用いて、我々のアプローチに関する理論的知見を提供する。
論文 参考訳(メタデータ) (2020-10-23T14:49:02Z) - Quiver Signal Processing (QSP) [145.6921439353007]
キーバー表現に関する信号処理フレームワークの基礎を述べる。
ネットワークにおける異種多次元情報を扱うための信号処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-22T08:40:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。