論文の概要: Square Superpixel Generation and Representation Learning via Granular Ball Computing
- arxiv url: http://arxiv.org/abs/2603.29460v1
- Date: Tue, 31 Mar 2026 09:06:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.436621
- Title: Square Superpixel Generation and Representation Learning via Granular Ball Computing
- Title(参考訳): グラニュラーボールコンピューティングによる正方形スーパーピクセルの生成と表現学習
- Authors: Shuyin Xia, Meng Yang, Dawei Dai, Fan Chen, Shilin Zhao, Junwei Han, Xinbo Gao, Guoyin Wang, Wen Lu,
- Abstract要約: スーパーピクセルは、オブジェクト境界と局所構造を保存する、コンパクトな領域ベースの表現を提供する。
既存のスーパーピクセルアルゴリズムの多くは不規則な形状の領域を生成しており、畳み込みのような通常の演算子とうまく一致しない。
グラニュラル・ボール・コンピューティングの適応表現とカバレッジ特性に動機付けられて,正方形スーパーピクセル・ジェネレーション・アプローチを開発した。
- 参考スコア(独自算出の注目度): 97.99956628286243
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Superpixels provide a compact region-based representation that preserves object boundaries and local structures, and have therefore been widely used in a variety of vision tasks to reduce computational cost. However, most existing superpixel algorithms produce irregularly shaped regions, which are not well aligned with regular operators such as convolutions. Consequently, superpixels are often treated as an offline preprocessing step, limiting parallel implementation and hindering end-to-end optimization within deep learning pipelines. Motivated by the adaptive representation and coverage property of granular-ball computing, we develop a square superpixel generation approach. Specifically, we approximate superpixels using multi-scale square blocks to avoid the computational and implementation difficulties induced by irregular shapes, enabling efficient parallel processing and learnable feature extraction. For each block, a purity score is computed based on pixel-intensity similarity, and high-quality blocks are selected accordingly. The resulting square superpixels can be readily integrated as graph nodes in graph neural networks (GNNs) or as tokens in Vision Transformers (ViTs), facilitating multi-scale information aggregation and structured visual representation. Experimental results on downstream tasks demonstrate consistent performance improvements, validating the effectiveness of the proposed method.
- Abstract(参考訳): スーパーピクセルは、オブジェクト境界と局所構造を保存するコンパクトな領域ベースの表現を提供するため、計算コストを削減するために様々な視覚タスクで広く使われてきた。
しかし、既存のほとんどのスーパーピクセルアルゴリズムは不規則な形状の領域を生成しており、畳み込みのような正規作用素とうまく一致しない。
その結果、スーパーピクセルはオフラインの事前処理ステップとして扱われ、並列実装が制限され、ディープラーニングパイプライン内のエンドツーエンドの最適化が妨げられる。
グラニュラル・ボール・コンピューティングの適応表現とカバレッジ特性に動機付けられて,正方形スーパーピクセル・ジェネレーション・アプローチを開発した。
具体的には、マルチスケールの2乗ブロックを用いて、不規則な形状によって引き起こされる計算や実装の困難を回避し、効率的な並列処理と学習可能な特徴抽出を可能にする。
各ブロックについて、画素強度類似度に基づいて純度スコアが算出され、それに応じて高品質なブロックが選択される。
結果として得られる正方形のスーパーピクセルは、グラフニューラルネットワーク(GNN)のグラフノードや、ViT(Vision Transformers)のトークンとして簡単に統合することができ、マルチスケールの情報集約と構造化された視覚表現を容易にする。
下流タスクにおける実験結果から,一貫した性能向上が示され,提案手法の有効性が検証された。
関連論文リスト
- Superpixel Integrated Grids for Fast Image Segmentation [0.07639235704257864]
セグメンテーションタスクにおけるフル解像度画像の代替として,新しいスーパーピクセルベースデータ構造SIGRIDを導入する。
SIGRIDは、古典的な形状記述子を活用することにより、入力寸法を著しく減少させながら、スーパーピクセルの色情報と形状情報を符号化する。
論文 参考訳(メタデータ) (2025-10-07T22:02:48Z) - Graph-Weighted Contrastive Learning for Semi-Supervised Hyperspectral Image Classification [9.640130509216629]
本稿では,超画素分割を回避し,ニューラルネットワークを用いてハイパースペクトル画像表現を学習するグラフ重み付きコントラスト学習手法を提案する。
提案手法は,ノードのサブセットのみを一度に処理することで,計算複雑性を低減し,未確認ノードへの一般化を改善することによるミニバッチトレーニングを支援する。
論文 参考訳(メタデータ) (2025-03-19T22:55:52Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - SuperpixelGraph: Semi-automatic generation of building footprint through
semantic-sensitive superpixel and neural graph networks [21.523846989009886]
ほとんどの都市アプリケーションは、鋭い境界を持つ簡潔なベクトルグラフィックスの形で、フットプリントを構築する必要がある。
本稿では,意味に敏感なスーパーピクセルとニューラルグラフネットワークによるフットプリント抽出のための半自動手法を提案する。
論文 参考訳(メタデータ) (2023-04-12T07:39:20Z) - Implicit Integration of Superpixel Segmentation into Fully Convolutional
Networks [11.696069523681178]
スーパーピクセル方式をCNNに暗黙的に統合する方法を提案する。
提案手法では,下地層に画素を階層的にグループ化し,スーパーピクセルを生成する。
本手法は,セマンティックセグメンテーション,スーパーピクセルセグメンテーション,モノクル深度推定などのタスクで評価する。
論文 参考訳(メタデータ) (2021-03-05T02:20:26Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Superpixel Segmentation Based on Spatially Constrained Subspace
Clustering [57.76302397774641]
独立意味情報を持つ各代表領域を部分空間とみなし,部分空間クラスタリング問題としてスーパーピクセルセグメンテーションを定式化する。
従来のサブスペースクラスタリングとスーパーピクセルセグメンテーションの簡単な統合は,画素の空間相関のために効果的に機能しないことを示す。
本稿では,空間隣接画素に類似の属性を付加してスーパーピクセルにクラスタリング可能な,凸局所性制約付きサブスペースクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2020-12-11T06:18:36Z) - Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。
私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。
私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文 参考訳(メタデータ) (2020-12-05T10:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。