論文の概要: Split GCN: Effective Interactive Annotation for Segmentation of
Disconnected Instance
- arxiv url: http://arxiv.org/abs/2112.06454v1
- Date: Mon, 13 Dec 2021 07:17:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 15:10:34.583052
- Title: Split GCN: Effective Interactive Annotation for Segmentation of
Disconnected Instance
- Title(参考訳): Split GCN: 切断インスタンスのセグメンテーションに有効なインタラクティブアノテーション
- Authors: Namgil Kim and Barom Kang and Yeonok Cho
- Abstract要約: Split-GCNはポリゴンアプローチと自己認識機構に基づく新しいアーキテクチャである。
我々のモデルは、初期位相を変換することで、オブジェクトの切断されたコンポーネントをうまく予測する。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Annotating object boundaries by humans demands high costs. Recently,
polygon-based annotation methods with human interaction have shown successful
performance. However, given the connected vertex topology, these methods
exhibit difficulty predicting the disconnected components in an object. This
paper introduces Split-GCN, a novel architecture based on the polygon approach
and self-attention mechanism. By offering the direction information, Split-GCN
enables the polygon vertices to move more precisely to the object boundary. Our
model successfully predicts disconnected components of an object by
transforming the initial topology using the context exchange about the
dependencies of vertices. Split-GCN demonstrates competitive performance with
the state-of-the-art models on Cityscapes and even higher performance with the
baseline models. On four cross-domain datasets, we confirm our model's
generalization ability.
- Abstract(参考訳): 人間によるオブジェクト境界への注釈は高いコストを必要とする。
近年,人間インタラクションを用いた多角形アノテーション手法が成功している。
しかし、連結頂点トポロジーを考えると、これらの手法は物体内の不連結成分を予測するのが困難である。
本稿では,ポリゴンアプローチと自己認識機構に基づく新しいアーキテクチャであるSplit-GCNを紹介する。
方向情報を提供することで、Split-GCNはポリゴン頂点をオブジェクト境界へより正確に移動させることができる。
我々のモデルは,頂点の依存関係に関するコンテキスト交換を用いて初期トポロジを変換することにより,オブジェクトの非連結成分をうまく予測する。
Split-GCNは、Cityscapesの最先端モデルと競合する性能を示し、ベースラインモデルよりも高性能である。
4つのクロスドメインデータセット上で、モデルの一般化能力を確認する。
関連論文リスト
- Segmenting objects with Bayesian fusion of active contour models and convnet priors [0.729597981661727]
本稿では,自然資源モニタリング(NRM)画像を対象とした新しい事例分割手法を提案する。
我々は、個々の物体の輪郭を学習する際に、形状、位置、位置の先行を組み込むベイズ最大値後部推論として問題を定式化する。
実験では、個々の枯木樹冠と正確な輪郭を分割する、挑戦的で現実的な問題に取り組む。
論文 参考訳(メタデータ) (2024-10-09T20:36:43Z) - Str-L Pose: Integrating Point and Structured Line for Relative Pose Estimation in Dual-Graph [45.115555973941255]
ロボットや自律運転など、さまざまなコンピュータビジョンアプリケーションにおいて、相対的なポーズ推定が不可欠である。
本稿では,余分な構造線セグメントと点特徴を統合した幾何対応グラフニューラルネットワークを提案する。
この整合点と線分の統合は、幾何学的制約をさらに活用し、異なる環境におけるモデル性能を向上させる。
論文 参考訳(メタデータ) (2024-08-28T12:33:26Z) - Multi-Scene Generalized Trajectory Global Graph Solver with Composite
Nodes for Multiple Object Tracking [61.69892497726235]
複合ノードメッセージパッシングネットワーク(CoNo-Link)は、超長いフレーム情報を関連付けるためのフレームワークである。
オブジェクトをノードとして扱う従来の方法に加えて、このネットワークは情報インタラクションのためのノードとしてオブジェクトトラジェクトリを革新的に扱う。
我々のモデルは、合成ノードを追加することで、より長い時間スケールでより良い予測を学習することができる。
論文 参考訳(メタデータ) (2023-12-14T14:00:30Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - DepGraph: Towards Any Structural Pruning [68.40343338847664]
我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。
本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。
本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文 参考訳(メタデータ) (2023-01-30T14:02:33Z) - Hierarchically Decomposed Graph Convolutional Networks for
Skeleton-Based Action Recognition [7.0650174975392925]
階層的に分解されたグラフ畳み込みネットワーク(HD-GCN)アーキテクチャを提案する。
提案モデルは,4つの大規模で一般的なデータセットに対して,最先端の性能を評価・達成する。
論文 参考訳(メタデータ) (2022-08-23T05:27:32Z) - Segmenting Moving Objects via an Object-Centric Layered Representation [100.26138772664811]
深層表現を用いたオブジェクト中心セグメンテーションモデルを提案する。
複数のオブジェクトで合成トレーニングデータを生成するスケーラブルなパイプラインを導入する。
標準的なビデオセグメンテーションベンチマークでモデルを評価する。
論文 参考訳(メタデータ) (2022-07-05T17:59:43Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - Object-Centric Image Generation from Layouts [93.10217725729468]
複数のオブジェクトを持つ複雑なシーンを生成するレイアウト・ツー・イメージ生成法を開発した。
本手法は,シーン内のオブジェクト間の空間的関係の表現を学習し,レイアウトの忠実度の向上につながる。
本稿では,Fr'echet Inception Distanceのオブジェクト中心適応であるSceneFIDを紹介する。
論文 参考訳(メタデータ) (2020-03-16T21:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。