論文の概要: SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition
- arxiv url: http://arxiv.org/abs/2603.07521v1
- Date: Sun, 08 Mar 2026 08:18:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.71055
- Title: SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition
- Title(参考訳): SketchGraphNet: 大規模スケッチコーパス認識のためのメモリ効率の良いハイブリッドグラフ変換器
- Authors: Shilong Chen, Mingyuan Li, Zhaoyang Wang, Zhonglin Ye, Haixing Zhao,
- Abstract要約: ローカルメッセージパッシングとメモリ効率のよいグローバルアテンション機構を統合した,ハイブリッドグラフニューラルアーキテクチャであるSketchGraphNetを提案する。
システム評価を支援するため,344のカテゴリにわたる344万のグラフ構造化スケッチからなる大規模ベンチマークであるSketchGraphを構築した。
- 参考スコア(独自算出の注目度): 5.072189947670439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work investigates large-scale sketch recognition from a graph-native perspective, where free-hand sketches are directly modeled as structured graphs rather than raster images or stroke sequences. We propose SketchGraphNet, a hybrid graph neural architecture that integrates local message passing with a memory-efficient global attention mechanism, without relying on auxiliary positional or structural encodings. To support systematic evaluation, we construct SketchGraph, a large-scale benchmark comprising 3.44 million graph-structured sketches across 344 categories, with two variants (A and R) to reflect different noise conditions. Each sketch is represented as a spatiotemporal graph with normalized stroke-order attributes. On SketchGraph-A and SketchGraph-R, SketchGraphNet achieves Top-1 accuracies of 83.62% and 87.61%, respectively, under a unified training configuration. MemEffAttn further reduces peak GPU memory by over 40% and training time by more than 30% compared with Performer-based global attention, while maintaining comparable accuracy.
- Abstract(参考訳): 本研究では、ラスタ画像やストロークシーケンスではなく、構造化グラフとして自由手スケッチを直接モデル化するグラフネイティブの観点から、大規模なスケッチ認識について検討する。
本研究では,局所的メッセージパッシングとメモリ効率のよいグローバルアテンション機構を統合するハイブリッドグラフニューラルネットワークSketchGraphNetを提案する。
SketchGraphは344のカテゴリにまたがる344万のグラフ構造化スケッチで構成され、異なるノイズ条件を反映する2つの変種(AとR)からなる大規模なベンチマークである。
各スケッチは、正規化されたストロークオーダー属性を持つ時空間グラフとして表現される。
SketchGraph-AとSketchGraph-Rでは、SketchGraphNetは、それぞれ83.62%と87.61%のTop-1アキュラシーを、統一的なトレーニング設定で達成している。
MemEffAttnはさらに、ピークGPUメモリを40%以上削減し、トレーニング時間を、Performerベースのグローバルアテンションと比較して30%以上削減すると同時に、同等の精度を維持している。
関連論文リスト
- SketchAgent: Generating Structured Diagrams from Hand-Drawn Sketches [54.06877048295693]
SketchAgentは手描きスケッチの構造化図への変換を自動化するシステムである。
SketchAgentは、スケッチ認識、シンボリック推論、反復検証を統合し、セマンティックコヒーレントで構造的に正確な図を生成する。
ダイアグラム生成プロセスの合理化によって、SketchAgentはデザイン、教育、エンジニアリングの分野で大きな可能性を秘めています。
論文 参考訳(メタデータ) (2025-08-02T07:22:51Z) - Plexus: Taming Billion-edge Graphs with 3D Parallel Full-graph GNN Training [5.1420473428862605]
グラフニューラルネットワーク(GNN)は、実世界のグラフの接続性と構造を利用して、ノード間の複雑な特性と関係を学習する。
多くの実世界のグラフはGPUのメモリ容量を超えており、そのようなグラフ上でのGNNのトレーニングには、スケールするためにミニバッチサンプリングのような技術が必要である。
本稿では、これらの問題に対処し、数十億のエッジグラフにスケールするフルグラフトレーニングのための3次元並列アプローチを提案する。
論文 参考訳(メタデータ) (2025-05-07T02:49:52Z) - Faster Optimization in S-Graphs Exploiting Hierarchy [8.17925295907622]
冗長なロボットのポーズを余剰にすることでグラフサイズを削減するため,階層構造を利用したSグラフの改良版を提案する。
ベースラインに対する計算時間を39.81%削減しながら,ベースラインと同等の精度を示す。
論文 参考訳(メタデータ) (2023-08-22T07:35:15Z) - SSR-GNNs: Stroke-based Sketch Representation with Graph Neural Networks [34.759306840182205]
本稿では,スケッチにおけるストローク情報,すなわちスケッチの一部が頂点にエンコードされ,エッジ上のストローク間情報であるスケッチのグラフ表現について検討する。
結果のグラフ表現は、分類タスクのためのグラフニューラルネットワークのトレーニングを容易にする。
提案した表現は,既存のデータセットから分離可能ながら,構造的に類似した斬新なスケッチの生成を可能にする。
論文 参考訳(メタデータ) (2022-04-27T19:18:01Z) - Scaling R-GCN Training with Graph Summarization [71.06855946732296]
リレーショナルグラフ畳み込みネットワーク(R-GCN)のトレーニングは、グラフのサイズに合わない。
本研究では,グラフの要約手法を用いてグラフを圧縮する実験を行った。
AIFB, MUTAG, AMデータセットについて妥当な結果を得た。
論文 参考訳(メタデータ) (2022-03-05T00:28:43Z) - GraphDCA -- a Framework for Node Distribution Comparison in Real and
Synthetic Graphs [72.51835626235368]
2つのグラフを比較するとき、ノード構造的特徴の分布は、グローバルグラフ統計よりも有益である、と我々は主張する。
本稿では,各ノード表現セットのアライメントに基づいてグラフ間の類似性を評価するフレームワークGraphDCAを提案する。
論文 参考訳(メタデータ) (2022-02-08T14:19:19Z) - Towards Graph Self-Supervised Learning with Contrastive Adjusted Zooming [48.99614465020678]
本稿では,グラフコントラスト適応ズームによる自己教師付きグラフ表現学習アルゴリズムを提案する。
このメカニズムにより、G-Zoomはグラフから複数のスケールから自己超越信号を探索して抽出することができる。
我々は,実世界のデータセットに関する広範な実験を行い,提案したモデルが常に最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-11-20T22:45:53Z) - Multilevel Graph Matching Networks for Deep Graph Similarity Learning [79.3213351477689]
グラフ構造オブジェクト間のグラフ類似性を計算するためのマルチレベルグラフマッチングネットワーク(MGMN)フレームワークを提案する。
標準ベンチマークデータセットの欠如を補うため、グラフグラフ分類とグラフグラフ回帰タスクの両方のためのデータセットセットを作成し、収集した。
総合的な実験により、MGMNはグラフグラフ分類とグラフグラフ回帰タスクの両方において、最先端のベースラインモデルより一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-07-08T19:48:19Z) - SketchGNN: Semantic Sketch Segmentation with Graph Neural Networks [40.32629073485205]
自由手ベクトルスケッチのセマンティックセグメンテーションとラベル付けのための畳み込みグラフニューラルネットワークであるSketchGNNを紹介する。
ノードごとのラベルを予測するために、SketchGNNはグラフ畳み込みと静的な分岐ネットワークアーキテクチャを使用している。
論文 参考訳(メタデータ) (2020-03-02T05:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。