論文の概要: Heterogeneous Grid Convolution for Adaptive, Efficient, and Controllable
Computation
- arxiv url: http://arxiv.org/abs/2104.11176v1
- Date: Thu, 22 Apr 2021 17:02:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-23 13:51:50.737357
- Title: Heterogeneous Grid Convolution for Adaptive, Efficient, and Controllable
Computation
- Title(参考訳): 適応的・効率的・制御可能な計算のための不均一グリッド畳み込み
- Authors: Ryuhei Hamaguchi, Yasutaka Furukawa, Masaki Onishi, Ken Sakurada
- Abstract要約: 本稿では,グラフに基づく画像表現を構築する新しい異種グリッド畳み込みを提案する。
開発したモジュールを用いて,異種グリッド畳み込みネットワークを提案する。
提案手法は, 4つの画像理解タスク, セマンティックセグメンテーション, オブジェクトローカライゼーション, 道路抽出について評価した。
- 参考スコア(独自算出の注目度): 32.952421387247234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel heterogeneous grid convolution that builds a
graph-based image representation by exploiting heterogeneity in the image
content, enabling adaptive, efficient, and controllable computations in a
convolutional architecture. More concretely, the approach builds a
data-adaptive graph structure from a convolutional layer by a differentiable
clustering method, pools features to the graph, performs a novel
direction-aware graph convolution, and unpool features back to the
convolutional layer. By using the developed module, the paper proposes
heterogeneous grid convolutional networks, highly efficient yet strong
extension of existing architectures. We have evaluated the proposed approach on
four image understanding tasks, semantic segmentation, object localization,
road extraction, and salient object detection. The proposed method is effective
on three of the four tasks. Especially, the method outperforms a strong
baseline with more than 90% reduction in floating-point operations for semantic
segmentation, and achieves the state-of-the-art result for road extraction. We
will share our code, model, and data.
- Abstract(参考訳): 本稿では,画像コンテンツの多様性を利用して,畳み込みアーキテクチャにおける適応的,効率的,制御可能な計算を可能にする,グラフベースの画像表現を構築する新しい不均質なグリッド畳み込みを提案する。
より具体的には、このアプローチは、微分可能なクラスタリングによって畳み込み層からデータ適応グラフ構造を構築し、特徴をグラフにプールし、新しい方向対応グラフ畳み込みを実行し、畳み込み層に戻す。
開発したモジュールを用いて,既存アーキテクチャの高効率かつ強力な拡張である異種グリッド畳み込みネットワークを提案する。
提案手法は, 4つの画像理解タスク, セマンティックセグメンテーション, オブジェクトの局所化, 道路抽出, 健全な物体検出において評価された。
提案手法は4つの課題のうち3つに有効である。
特に、セマンティクスセグメンテーションのための浮動小数点演算を90%以上削減した強力なベースラインを上回り、道路抽出のための最先端の結果を得る。
コード、モデル、データを共有します。
関連論文リスト
- GIMS: Image Matching System Based on Adaptive Graph Construction and Graph Neural Network [7.711922592226936]
本稿では,距離と動的しきい値の類似性に基づくフィルタリング機構を利用する,革新的な適応グラフ構築手法を提案する。
また、トランスフォーマーのグローバルな認識能力を組み合わせて、グラフ構造の表現を強化する。
システム全体のマッチング性能は平均3.8x-40.3x向上した。
論文 参考訳(メタデータ) (2024-12-24T07:05:55Z) - A Structure-Aware Framework for Learning Device Placements on Computation Graphs [15.282882425920064]
我々は,OpenVINOツールキットから抽出したより小さな計算グラフに頼って,デバイス配置作業のための新しいフレームワークを提案する。
このフレームワークは、グラフの粗大化、ノード表現学習、ポリシー最適化を含む5つのステップで構成されている。
フレームワーク全体をトレーニングするために,配置の実行時間を用いた強化学習を報奨として使用する。
論文 参考訳(メタデータ) (2024-05-23T05:29:29Z) - Ensemble Quadratic Assignment Network for Graph Matching [52.20001802006391]
グラフマッチングはコンピュータビジョンやパターン認識において一般的に用いられる技法である。
最近のデータ駆動型アプローチは、グラフマッチングの精度を著しく改善した。
データ駆動手法と従来の手法の利点を組み合わせたグラフニューラルネットワーク(GNN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-03-11T06:34:05Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Quaternion-Based Graph Convolution Network for Recommendation [45.005089037955536]
Graph Convolution Network (GCN) はリコメンデータシステムで広く利用されている。
GCNは実世界でよく見られるノイズや不完全グラフに弱い。
本稿では,Queternion-based Graph Convolution Network (QGCN)レコメンデーションモデルを提案する。
論文 参考訳(メタデータ) (2021-11-20T07:42:18Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Primal-Dual Mesh Convolutional Neural Networks [62.165239866312334]
本稿では,グラフ・ニューラル・ネットワークの文献からトライアングル・メッシュへ引き起こされた原始双対のフレームワークを提案する。
提案手法は,3次元メッシュのエッジと顔の両方を入力として特徴付け,動的に集約する。
メッシュ単純化の文献から得られたツールを用いて、我々のアプローチに関する理論的知見を提供する。
論文 参考訳(メタデータ) (2020-10-23T14:49:02Z) - Graph Fairing Convolutional Networks for Anomaly Detection [7.070726553564701]
半教師付き異常検出のためのスキップ接続付きグラフ畳み込みネットワークを提案する。
本モデルの有効性は,5つのベンチマークデータセットに対する広範な実験によって実証された。
論文 参考訳(メタデータ) (2020-10-20T13:45:47Z) - Progressive Graph Convolutional Networks for Semi-Supervised Node
Classification [97.14064057840089]
グラフ畳み込みネットワークは、半教師付きノード分類のようなグラフベースのタスクに対処することに成功した。
本稿では,コンパクトかつタスク固有のグラフ畳み込みネットワークを自動構築する手法を提案する。
論文 参考訳(メタデータ) (2020-03-27T08:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。