論文の概要: DIAL: Deep Interactive and Active Learning for Semantic Segmentation in
Remote Sensing
- arxiv url: http://arxiv.org/abs/2201.01047v1
- Date: Tue, 4 Jan 2022 09:11:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 19:35:58.114708
- Title: DIAL: Deep Interactive and Active Learning for Semantic Segmentation in
Remote Sensing
- Title(参考訳): DIAL:リモートセンシングにおけるセマンティックセグメンテーションのためのインタラクティブでアクティブな学習
- Authors: Gaston Lenczner, Adrien Chan-Hon-Tong, Bertrand Le Saux, Nicola
Luminari, Guy Le Besnerais
- Abstract要約: 我々は、ディープニューラルネットワークと人間のループでの協調を構築することを提案する。
簡単に言うと、エージェントはネットワークと反復的に対話して、当初欠陥があった予測を修正する。
本研究では,不確実性推定に基づくアクティブラーニングにより,ユーザを迅速に誤りに導くことができることを示す。
- 参考スコア(独自算出の注目度): 34.209686918341475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose in this article to build up a collaboration between a deep neural
network and a human in the loop to swiftly obtain accurate segmentation maps of
remote sensing images. In a nutshell, the agent iteratively interacts with the
network to correct its initially flawed predictions. Concretely, these
interactions are annotations representing the semantic labels. Our
methodological contribution is twofold. First, we propose two interactive
learning schemes to integrate user inputs into deep neural networks. The first
one concatenates the annotations with the other network's inputs. The second
one uses the annotations as a sparse ground-truth to retrain the network.
Second, we propose an active learning strategy to guide the user towards the
most relevant areas to annotate. To this purpose, we compare different
state-of-the-art acquisition functions to evaluate the neural network
uncertainty such as ConfidNet, entropy or ODIN. Through experiments on three
remote sensing datasets, we show the effectiveness of the proposed methods.
Notably, we show that active learning based on uncertainty estimation enables
to quickly lead the user towards mistakes and that it is thus relevant to guide
the user interventions.
- Abstract(参考訳): 本稿では,深層ニューラルネットワークとループ内の人間との協調関係を構築し,リモートセンシング画像の正確なセグメンテーションマップを迅速に取得することを提案する。
一言で言えば、エージェントはネットワークと反復的にやり取りし、最初の欠陥のある予測を修正する。
具体的には、これらの相互作用は意味ラベルを表すアノテーションである。
我々の方法論的な貢献は2つある。
まず,深層ニューラルネットワークにユーザ入力を統合する2つの対話型学習手法を提案する。
1つ目は、アノテーションを他のネットワークの入力と結合する。
2つめは、アノテーションをスパースな基盤として使用し、ネットワークを再トレーニングする。
第2に,アノテートする最も関連性の高い領域にユーザを誘導する,アクティブな学習戦略を提案する。
この目的のために、異なる最先端の取得関数を比較して、confidnet、entropy、odinといったニューラルネットワークの不確実性を評価する。
3つのリモートセンシングデータセットを用いた実験により,提案手法の有効性を示す。
特に,不確実性推定に基づくアクティブラーニングは,ユーザを素早くミスへと導くことが可能であり,ユーザ介入の指導に関係していることを示す。
関連論文リスト
- Identifying Sub-networks in Neural Networks via Functionally Similar Representations [41.028797971427124]
我々は、異なるサブネットワークの存在を調査し、ネットワークの理解を自動化するための一歩を踏み出した。
我々のアプローチは、人間と計算コストを最小限に抑えたニューラルネットワークの振る舞いに関する有意義な洞察を提供する。
論文 参考訳(メタデータ) (2024-10-21T20:19:00Z) - Deception Detection from Linguistic and Physiological Data Streams Using Bimodal Convolutional Neural Networks [19.639533220155965]
本稿では,畳み込み型ニューラルネットワークのマルチモーダルな騙し検出への応用について検討する。
2つのトピックについて104人の被験者にインタビューして構築したデータセットを使用します。
論文 参考訳(メタデータ) (2023-11-18T02:44:33Z) - DeepSI: Interactive Deep Learning for Semantic Interaction [5.188825486231326]
本稿では,深層学習をループ内対話型感触パイプラインに統合するフレームワークを提案する。
ディープラーニングは生データから意味のある表現を抽出し、意味的相互作用推論を改善する。
意味的相互作用を利用して深層学習表現を微調整し、意味的相互作用推論を改善する。
論文 参考訳(メタデータ) (2023-05-26T18:05:57Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Introspective Learning : A Two-Stage Approach for Inference in Neural
Networks [18.32369721322249]
我々は、ニューラルネットワークの意思決定プロセスの2つの段階を提唱する。
ひとつは、既存のフィードフォワード推論フレームワークで、与えられたデータのパターンを検知し、以前に学習したパターンと関連付ける。
2つ目は、利用可能なすべての選択肢を考慮し、評価することで、フィードフォワードの決定を反映するようにネットワークに要求する、遅いリフレクションステージである。
論文 参考訳(メタデータ) (2022-09-17T23:31:03Z) - X-Distill: Improving Self-Supervised Monocular Depth via Cross-Task
Distillation [69.9604394044652]
そこで本研究では,クロスタスク知識蒸留による単眼深度の自己指導的訓練を改善する手法を提案する。
トレーニングでは,事前訓練されたセマンティックセグメンテーション教師ネットワークを使用し,そのセマンティック知識を深度ネットワークに転送する。
提案手法の有効性をKITTIベンチマークで評価し,最新技術と比較した。
論文 参考訳(メタデータ) (2021-10-24T19:47:14Z) - Variational Structured Attention Networks for Deep Visual Representation
Learning [49.80498066480928]
空間的注意マップとチャネル的注意の両方を原則的に共同学習するための統合的深層フレームワークを提案する。
具体的には,確率的表現学習フレームワークに注目度の推定と相互作用を統合する。
ニューラルネットワーク内で推論ルールを実装し,確率パラメータとcnnフロントエンドパラメータのエンドツーエンド学習を可能にする。
論文 参考訳(メタデータ) (2021-03-05T07:37:24Z) - Bridging the gap between Human Action Recognition and Online Action
Detection [0.456877715768796]
行動認識、早期予測、オンライン行動検出は、しばしば独立して研究される補完的な分野です。
前述の分野間で教師と学生のフレームワークでタスク固有の機能抽出に取り組みます。
当社のネットワークは、オンライン早期予測とオンライン時間セグメント提案を並行して組み込みます。
論文 参考訳(メタデータ) (2021-01-21T21:01:46Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。