論文の概要: Model-based inexact graph matching on top of CNNs for semantic scene
understanding
- arxiv url: http://arxiv.org/abs/2301.07468v1
- Date: Wed, 18 Jan 2023 12:23:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-19 16:09:08.264966
- Title: Model-based inexact graph matching on top of CNNs for semantic scene
understanding
- Title(参考訳): セマンティックシーン理解のためのCNN上のモデルベース不正確なグラフマッチング
- Authors: J\'er\'emy Chopin and Jean-Baptiste Fasquel and Harold Mouch\`ere and
Rozenn Dahyot and Isabelle Bloch
- Abstract要約: セマンティックセグメンテーションのためのディープラーニングパイプラインは、トレーニングに使用される注釈付きイメージで利用できる構造情報を無視することが多い。
本稿では,関心対象の構造的知識を付加した新しい後処理モジュールを提案し,セグメンテーション結果を改善する。
私たちのアプローチは、ディープラーニングメソッドのパフォーマンスを制限している小さなトレーニングデータセットに耐性があることが示されています。
- 参考スコア(独自算出の注目度): 6.106023882846558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning based pipelines for semantic segmentation often ignore
structural information available on annotated images used for training. We
propose a novel post-processing module enforcing structural knowledge about the
objects of interest to improve segmentation results provided by deep learning.
This module corresponds to a "many-to-one-or-none" inexact graph matching
approach, and is formulated as a quadratic assignment problem. Our approach is
compared to a CNN-based segmentation (for various CNN backbones) on two public
datasets, one for face segmentation from 2D RGB images (FASSEG), and the other
for brain segmentation from 3D MRIs (IBSR). Evaluations are performed using two
types of structural information (distances and directional relations, , this
choice being a hyper-parameter of our generic framework). On FASSEG data,
results show that our module improves accuracy of the CNN by about 6.3% (the
Hausdorff distance decreases from 22.11 to 20.71). On IBSR data, the
improvement is of 51% (the Hausdorff distance decreases from 11.01 to 5.4). In
addition, our approach is shown to be resilient to small training datasets that
often limit the performance of deep learning methods: the improvement increases
as the size of the training dataset decreases.
- Abstract(参考訳): セマンティックセグメンテーションのためのディープラーニングベースのパイプラインは、トレーニングに使用される注釈付きイメージで利用できる構造情報を無視することが多い。
本稿では,興味対象の構造知識を強制する新しい後処理モジュールを提案し,ディープラーニングによるセグメンテーション結果を改善する。
この加群は "many-to-one-or-none" グラフマッチングアプローチに対応し、二次代入問題として定式化される。
提案手法は,2次元RGB画像(FASSEG)の顔分割と3次元MRI(IBSR)の脳分割の2つの公開データセット上のCNNベースセグメンテーション(各種CNNバックボーン)と比較した。
評価は2種類の構造情報(距離と方向の関係、この選択は我々の汎用フレームワークのハイパーパラメータ)を用いて行われる。
FASSEGデータから、我々のモジュールはCNNの精度を約6.3%向上させる(ハウスドルフ距離は22.11から20.71に減少する)。
IBSRのデータでは、改善率は51%(ハウスドルフ距離は11.01から5.4に減少)である。
さらに,我々のアプローチは,深層学習手法の性能をしばしば制限する小さなトレーニングデータセットに弾力性があることが示されている。
関連論文リスト
- Prompt Tuning for Parameter-efficient Medical Image Segmentation [79.09285179181225]
2つの医用画像データセットのセマンティックセグメンテーションにパラメータ効率が良いが効果的な適応を実現するために,いくつかのコントリビューションを提案し,検討する。
我々はこのアーキテクチャを、オンライン生成プロトタイプへの割り当てに基づく専用密集型セルフスーパービジョンスキームで事前訓練する。
得られたニューラルネットワークモデルにより、完全に微調整されたモデルとパラメータに適応したモデルとのギャップを緩和できることを実証する。
論文 参考訳(メタデータ) (2022-11-16T21:55:05Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - Automated airway segmentation by learning graphical structure [0.76146285961466]
我々は,既存の畳み込みニューラルネットワーク(CNN)とグラフニューラルネットワーク(GNN)に基づく気道セグメンテーションの高度な手法を提唱した。
提案モデルにより,CNN法とGNN法を併用した場合,胸部CTスキャンの気管支をほとんどの症例で検出できることが示唆された。
論文 参考訳(メタデータ) (2021-09-30T01:37:31Z) - Residual Moment Loss for Medical Image Segmentation [56.72261489147506]
位置情報は,対象物体の多様体構造を捉えた深層学習モデルに有効であることが証明された。
既存のほとんどの手法は、ネットワークが学習するために、位置情報を暗黙的にエンコードする。
セグメント化対象の位置情報を明示的に埋め込むために,新しい損失関数,すなわち残差モーメント(RM)損失を提案する。
論文 参考訳(メタデータ) (2021-06-27T09:31:49Z) - Scaling Semantic Segmentation Beyond 1K Classes on a Single GPU [87.48110331544885]
既存のセマンティックセグメンテーションモデルのトレーニングとスケールアップのための新しいトレーニング手法を提案する。
我々は、LVISとCOCOアノテーションからブートストラップした1284クラスのデータセットに対するアプローチの明確な利点を示し、DeeplabV3+モデルの3倍のmIoUを実現した。
論文 参考訳(メタデータ) (2020-12-14T13:12:38Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Unsupervised Learning Consensus Model for Dynamic Texture Videos
Segmentation [12.462608802359936]
動的テクスチャのセグメンテーションのための効果的な教師なし学習コンセンサスモデルを提案する。
提案モデルでは,分類対象画素の周辺部における再量子化局所2値パターン(LBP)ヒストグラムの値の集合を特徴として用いた。
挑戦的なSynthDBデータセットで実施された実験は、ULCMが大幅に高速で、コーディングが簡単で、単純で、パラメータが限られていることを示している。
論文 参考訳(メタデータ) (2020-06-29T16:40:59Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z) - On the Texture Bias for Few-Shot CNN Segmentation [21.349705243254423]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクを実行するために形状によって駆動される。
最近の証拠は、CNNのテクスチャバイアスが、大きなラベル付きトレーニングデータセットで学習するときに、より高いパフォーマンスのモデルを提供することを示している。
本稿では,特徴空間内の高周波局所成分を減衰させるために,ガウス差分(DoG)の集合を統合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-09T11:55:47Z) - Convolutional Embedding for Edit Distance [24.65097766064397]
CNN-EDは、編集距離をユークリッド距離に埋め込み、高速な近似類似性探索を行う。
CNN-EDは、正確性と効率の両面で、データ非依存のCGK埋め込みとRNNベースのGRU埋め込みを上回っている。
論文 参考訳(メタデータ) (2020-01-31T07:53:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。