論文の概要: Is the U-Net Directional-Relationship Aware?
- arxiv url: http://arxiv.org/abs/2207.02574v1
- Date: Wed, 6 Jul 2022 10:40:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 13:54:44.639651
- Title: Is the U-Net Directional-Relationship Aware?
- Title(参考訳): u-netの方向関係は認識されているか?
- Authors: Mateus Riva, Pietro Gori, Florian Yger, Isabelle Bloch
- Abstract要約: CNNはしばしば、その受容領域内で異なるオブジェクト(方向関係など)に関するコンテキスト情報を使用することができると仮定される。
セグメンテーションのためのクロスエントロピー損失関数を最適化するために訓練された標準U-Netを用いて、特定の種類の関係を探索する。
- 参考スコア(独自算出の注目度): 9.965579957584316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: CNNs are often assumed to be capable of using contextual information about
distinct objects (such as their directional relations) inside their receptive
field. However, the nature and limits of this capacity has never been explored
in full. We explore a specific type of relationship~-- directional~-- using a
standard U-Net trained to optimize a cross-entropy loss function for
segmentation. We train this network on a pretext segmentation task requiring
directional relation reasoning for success and state that, with enough data and
a sufficiently large receptive field, it succeeds to learn the proposed task.
We further explore what the network has learned by analysing scenarios where
the directional relationships are perturbed, and show that the network has
learned to reason using these relationships.
- Abstract(参考訳): CNNはしばしば、その受容領域内で異なるオブジェクト(方向関係など)に関するコンテキスト情報を使用することができると仮定される。
しかし、この能力の性質と限界は、完全には探求されていない。
セグメンテーションのためのクロスエントロピー損失関数を最適化するために訓練された標準U-Netを用いて、特定の種類の関係~-方向〜-を探索する。
我々は,このネットワークを,十分なデータと十分大きな受容野を持つ場合,提案するタスクを学習するのに成功することを示す,方向関係推論を必要とするプリテキストセグメンテーションタスクにトレーニングする。
さらに、方向性関係が摂動するシナリオを分析し、ネットワークが何を学んだかを考察し、ネットワークがこれらの関係を利用する理由を学習したことを示す。
関連論文リスト
- Temporal-Spatial Object Relations Modeling for Vision-and-Language Navigation [11.372544701050044]
VLN(Vision-and-Language Navigation)は、エージェントが視覚観察を通して記述された自然言語にナビゲートする必要がある課題である。
エージェントのナビゲーション能力は、通常内部オブジェクトまたは外部データセットを使用して学習されるオブジェクト間の関係によって強化することができる。
論文 参考訳(メタデータ) (2024-03-23T02:44:43Z) - RSG-Net: Towards Rich Sematic Relationship Prediction for Intelligent
Vehicle in Complex Environments [72.04891523115535]
本稿では,オブジェクトの提案から潜在的意味関係を予測するグラフ畳み込みネットワークRSG-Netを提案する。
実験の結果、このネットワークはロードシーングラフデータセットに基づいてトレーニングされており、エゴ車両周辺のオブジェクト間の潜在的な意味関係を効率的に予測できることがわかった。
論文 参考訳(メタデータ) (2022-07-16T12:40:17Z) - Detecting Owner-member Relationship with Graph Convolution Network in
Fisheye Camera System [9.665475078766017]
我々は,グラフ畳み込みネットワーク(GCN)を設計して,革新的な関係予測手法であるDeepWORDを提案する。
実験の結果,提案手法が最先端の精度と実時間性能を達成できることが判明した。
論文 参考訳(メタデータ) (2022-01-28T13:12:27Z) - DIAL: Deep Interactive and Active Learning for Semantic Segmentation in
Remote Sensing [34.209686918341475]
我々は、ディープニューラルネットワークと人間のループでの協調を構築することを提案する。
簡単に言うと、エージェントはネットワークと反復的に対話して、当初欠陥があった予測を修正する。
本研究では,不確実性推定に基づくアクティブラーニングにより,ユーザを迅速に誤りに導くことができることを示す。
論文 参考訳(メタデータ) (2022-01-04T09:11:58Z) - CI-Net: Contextual Information for Joint Semantic Segmentation and Depth
Estimation [2.8785764686013837]
本稿では,その問題を解決するために,文脈情報(CI-Net)を注入したネットワークを提案する。
セマンティックラベルの監督により、ネットワークにはコンテキスト情報が埋め込まれており、シーンをよりよく理解することができる。
提案したCI-NetをNYU-Depth-v2およびSUN-RGBDデータセット上で評価する。
論文 参考訳(メタデータ) (2021-07-29T07:58:25Z) - A neural anisotropic view of underspecification in deep learning [60.119023683371736]
ニューラルネットが問題の未特定化を扱う方法が,データ表現に大きく依存していることを示す。
深層学習におけるアーキテクチャ的インダクティブバイアスの理解は,これらのシステムの公平性,堅牢性,一般化に対処する上で基本的であることを強調した。
論文 参考訳(メタデータ) (2021-04-29T14:31:09Z) - GDDR: GNN-based Data-Driven Routing [0.0]
グラフニューラルネットワーク(GNN)を用いたアプローチは、多層パーセプトロンアーキテクチャを用いた以前の作業と同様に、少なくとも実行できることを示した。
GNNには、トレーニングされたエージェントを、余分な作業なしで異なるネットワークトポロジに一般化できるというメリットが加えられている。
論文 参考訳(メタデータ) (2021-04-20T12:12:17Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - NetReAct: Interactive Learning for Network Summarization [60.18513812680714]
本論文では,テキストコーポラによる感覚生成のネットワーク可視化を支援する,新しいインタラクティブネットワーク要約アルゴリズムであるNetReActを提案する。
netreactが、他の非自明なベースラインよりも、隠れたパターンを明らかにする高品質な要約や視覚化の生成に成功していることを示す。
論文 参考訳(メタデータ) (2020-12-22T03:56:26Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Learning Connectivity of Neural Networks from a Topological Perspective [80.35103711638548]
本稿では,ネットワークを解析のための完全なグラフに表現するためのトポロジ的視点を提案する。
接続の規模を反映したエッジに学習可能なパラメータを割り当てることにより、学習プロセスを異なる方法で行うことができる。
この学習プロセスは既存のネットワークと互換性があり、より大きな検索空間と異なるタスクへの適応性を持っている。
論文 参考訳(メタデータ) (2020-08-19T04:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。