論文の概要: SymPoint Revolutionized: Boosting Panoptic Symbol Spotting with Layer Feature Enhancement
- arxiv url: http://arxiv.org/abs/2407.01928v1
- Date: Tue, 2 Jul 2024 03:45:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-03 16:43:59.678422
- Title: SymPoint Revolutionized: Boosting Panoptic Symbol Spotting with Layer Feature Enhancement
- Title(参考訳): SymPoint 革命: レイヤ機能強化によるパノプティカルシンボルスポッティングの強化
- Authors: Wenlong Liu, Tianyu Yang, Qizhi Yu, Lei Zhang,
- Abstract要約: 新規な合理化設計を特徴とする,堅牢で効率的なソリューションであるSymPoint-V2を紹介する。
まず、グラフィカルなレイヤ情報をプリミティブな機能にエンコードするためのレイヤ機能拡張モジュール(LFE)を提案する。
また、位置ガイド訓練法(PGT)を設計し、学習を容易にする。
- 参考スコア(独自算出の注目度): 17.31015810761487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: SymPoint is an initial attempt that utilizes point set representation to solve the panoptic symbol spotting task on CAD drawing. Despite its considerable success, it overlooks graphical layer information and suffers from prohibitively slow training convergence. To tackle this issue, we introduce SymPoint-V2, a robust and efficient solution featuring novel, streamlined designs that overcome these limitations. In particular, we first propose a Layer Feature-Enhanced module (LFE) to encode the graphical layer information into the primitive feature, which significantly boosts the performance. We also design a Position-Guided Training (PGT) method to make it easier to learn, which accelerates the convergence of the model in the early stages and further promotes performance. Extensive experiments show that our model achieves better performance and faster convergence than its predecessor SymPoint on the public benchmark. Our code and trained models are available at https://github.com/nicehuster/SymPointV2.
- Abstract(参考訳): SymPointは、CAD描画におけるパノプティカルシンボルスポッティングタスクを解決するために、点集合表現を利用した最初の試みである。
かなりの成功を収めたものの、グラフィカルなレイヤ情報を見落としており、トレーニングの収束が著しく遅くなっている。
この問題に対処するために、これらの制限を克服する新しい合理化設計を特徴とする、堅牢で効率的なソリューションであるSymPoint-V2を導入する。
特に,我々はまず,グラフィカルレイヤ情報をプリミティブ機能にエンコードするレイヤ機能拡張モジュール(LFE)を提案する。
また,早期にモデルの収束を加速し,性能の向上を図るために,位置ガイド訓練(PGT)法を設計する。
大規模な実験により、我々のモデルは、前任のSymPointの公開ベンチマークよりも優れた性能と高速な収束を実現していることが示された。
私たちのコードとトレーニングされたモデルはhttps://github.com/nicehuster/SymPointV2.orgで公開されています。
関連論文リスト
- CODE-CL: COnceptor-Based Gradient Projection for DEep Continual Learning [7.573297026523597]
我々は,Deep Continual Learning (CODE-CL) のためのConceptor-based gradient projectionを導入する。
CODE-CLは、過去のタスクの入力空間における方向的重要性を符号化し、新しい知識統合を1-S$で変調する。
概念に基づく表現を用いてタスク重複を分析し,高い相関性を持つタスクを同定する。
論文 参考訳(メタデータ) (2024-11-21T22:31:06Z) - SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - Pose-Guided Self-Training with Two-Stage Clustering for Unsupervised Landmark Discovery [17.455841673719625]
オブジェクトカテゴリの教師なしランドマーク発見(ULD)は、コンピュータビジョンの問題である。
堅牢な ULD フレームワークの開発を追求するために,拡散モデルとして知られる,近年の自己教師型学習アルゴリズムの可能性を探る。
提案手法は, AFLW, MAFL, CatHeads, LS3Dの4つの挑戦的ベンチマークにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-03-24T15:24:04Z) - Symbol as Points: Panoptic Symbol Spotting via Point-based
Representation [18.61469313164712]
本研究は,コンピュータ支援設計(CAD)図面におけるパノプティカルシンボルスポッティングの問題について考察する。
我々は、グラフィックプリミティブを局所的に連結された2D点の集合として扱う別のアプローチをとる。
具体的には、点変換器を用いて原始的な特徴を抽出し、マスク2フォルマーのようなスポッティングヘッドを付加して最終的な出力を予測する。
論文 参考訳(メタデータ) (2024-01-19T08:44:52Z) - P2P: Tuning Pre-trained Image Models for Point Cloud Analysis with
Point-to-Pixel Prompting [94.11915008006483]
本稿では,ポイントクラウド解析のための新しいポイント・ツー・Pixelを提案する。
ScanObjectNNの最も難しい設定では,89.3%の精度が得られる。
また,本フレームワークは,ModelNet分類とShapeNet Part Codeで非常に競争力のある性能を示す。
論文 参考訳(メタデータ) (2022-08-04T17:59:03Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Progressive Encoding for Neural Optimization [92.55503085245304]
メッシュ転送におけるppe層の能力と,そのアドバンテージを,現代の表面マッピング技術と比較した。
最も重要な点は, パラメタライズフリーな手法であり, 様々な対象形状表現に適用可能であることである。
論文 参考訳(メタデータ) (2021-04-19T08:22:55Z) - Weakly Supervised Video Salient Object Detection [79.51227350937721]
本稿では,relabeled relabeled "fixation guided scribble annotations" に基づく最初の弱教師付きビデオサリエント物体検出モデルを提案する。
効果的なマルチモーダル学習と長期時間文脈モデリングを実現するために,「アプレンス・モーション・フュージョン・モジュール」と双方向のConvLSTMベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-06T09:48:38Z) - EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。
実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文 参考訳(メタデータ) (2020-12-24T04:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。