論文の概要: Multi-Task Learning by a Top-Down Control Network
- arxiv url: http://arxiv.org/abs/2002.03335v3
- Date: Thu, 29 Oct 2020 19:53:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 14:06:44.505711
- Title: Multi-Task Learning by a Top-Down Control Network
- Title(参考訳): トップダウン制御ネットワークによるマルチタスク学習
- Authors: Hila Levi, Shimon Ullman
- Abstract要約: 本稿では,専用のトップダウン制御ネットワークを用いて,主認識ネットワーク内のすべてのユニットのアクティベーションを変更する新しいアーキテクチャを提案する。
提案手法の有効性は,4つのデータセットに対する代替的最先端手法よりも有意に向上した。
- 参考スコア(独自算出の注目度): 7.1577508803778045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the range of tasks performed by a general vision system expands, executing
multiple tasks accurately and efficiently in a single network has become an
important and still open problem. Recent computer vision approaches address
this problem by branching networks, or by a channel-wise modulation of the
network feature-maps with task specific vectors. We present a novel
architecture that uses a dedicated top-down control network to modify the
activation of all the units in the main recognition network in a manner that
depends on the selected task, image content, and spatial location. We show the
effectiveness of our scheme by achieving significantly better results than
alternative state-of-the-art approaches on four datasets. We further
demonstrate our advantages in terms of task selectivity, scaling the number of
tasks and interpretability.
- Abstract(参考訳): 汎用ビジョンシステムによって実行されるタスクの範囲が拡大するにつれて、単一ネットワーク上で複数のタスクを正確かつ効率的に実行することが重要かつ未解決の課題となっている。
最近のコンピュータビジョンのアプローチでは、ネットワークの分岐や、タスク固有ベクトルによるネットワーク特徴マップのチャネルワイズ変調によってこの問題に対処している。
本稿では,専用トップダウン制御ネットワークを用いて,選択したタスクや画像内容,空間位置に依存する方法で,主認識ネットワーク内の全ユニットのアクティベーションを変更する新しいアーキテクチャを提案する。
提案手法の有効性は,4つのデータセットに対する代替的最先端手法よりも有意に向上した。
さらに,タスク選択性,タスク数の拡大,解釈可能性という面でのメリットを実証する。
関連論文リスト
- A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - Video Task Decathlon: Unifying Image and Video Tasks in Autonomous
Driving [85.62076860189116]
Video Task Decathlon (VTD)には、分類、セグメンテーション、ローカライゼーション、オブジェクトとピクセルの関連にまたがる10の代表的な画像とビデオタスクが含まれている。
我々は、単一の構造と10タスクすべてに一組の重みを持つ統合ネットワークVTDNetを開発した。
論文 参考訳(メタデータ) (2023-09-08T16:33:27Z) - A Dynamic Feature Interaction Framework for Multi-task Visual Perception [100.98434079696268]
複数の共通認識課題を解決するための効率的な統合フレームワークを考案する。
これらのタスクには、インスタンスセグメンテーション、セマンティックセグメンテーション、モノクル3D検出、深さ推定が含まれる。
提案するフレームワークはD2BNetと呼ばれ,マルチタスク認識のためのパラメータ効率予測に一意なアプローチを示す。
論文 参考訳(メタデータ) (2023-06-08T09:24:46Z) - Dynamic Neural Network for Multi-Task Learning Searching across Diverse
Network Topologies [14.574399133024594]
多様なグラフトポロジを持つ複数のタスクに対して最適化された構造を探索する新しいMTLフレームワークを提案する。
我々は、トポロジ的に多様なタスク適応構造を構築するために、読み出し/読み出し層を備えたDAGベースの制限付き中央ネットワークを設計する。
論文 参考訳(メタデータ) (2023-03-13T05:01:50Z) - Learning Good Features to Transfer Across Tasks and Domains [16.05821129333396]
まず、与えられたドメイン内のタスク固有の深い機能間のマッピングを学習することで、タスク間でそのような知識を共有できることを示します。
そして、ニューラルネットワークによって実装されたこのマッピング関数が、新しい未知の領域に一般化可能であることを示す。
論文 参考訳(メタデータ) (2023-01-26T18:49:39Z) - Counting with Adaptive Auxiliary Learning [23.715818463425503]
本稿では,オブジェクトカウント問題に対する適応型補助的タスク学習に基づくアプローチを提案する。
本研究では,タスク共有とタスクカスタマイズの両機能学習を実現するために,アダプティブ・アダプティブ・アダプティブ・共有バックボーンネットワークを開発した。
本手法は,現在最先端のタスク学習に基づくカウント手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-08T13:10:17Z) - Multi-Task Learning with Sequence-Conditioned Transporter Networks [67.57293592529517]
シーケンスコンディショニングと重み付きサンプリングのレンズによるマルチタスク学習の実現を目指している。
合成タスクを対象とした新しいベンチマークであるMultiRavensを提案する。
次に,視覚に基づくエンドツーエンドシステムアーキテクチャであるSequence-Conditioned Transporter Networksを提案する。
論文 参考訳(メタデータ) (2021-09-15T21:19:11Z) - Unsupervised Domain-adaptive Hash for Networks [81.49184987430333]
ドメイン適応型ハッシュ学習はコンピュータビジョンコミュニティでかなりの成功を収めた。
UDAHと呼ばれるネットワークのための教師なしドメイン適応型ハッシュ学習手法を開発した。
論文 参考訳(メタデータ) (2021-08-20T12:09:38Z) - Graph-Based Neural Network Models with Multiple Self-Supervised
Auxiliary Tasks [79.28094304325116]
グラフ畳み込みネットワークは、構造化されたデータポイント間の関係をキャプチャするための最も有望なアプローチである。
マルチタスク方式でグラフベースニューラルネットワークモデルを学習するための3つの新しい自己教師付き補助タスクを提案する。
論文 参考訳(メタデータ) (2020-11-14T11:09:51Z) - NeurAll: Towards a Unified Visual Perception Model for Automated Driving [8.49826472556323]
本稿では,複数のタスクを同時に学習するためのマルチタスクネットワーク設計を提案する。
自動運転システムの主なボトルネックは、デプロイメントハードウェアで利用可能な限られた処理能力である。
論文 参考訳(メタデータ) (2019-02-10T12:45:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。