論文の概要: Box for Mask and Mask for Box: weak losses for multi-task partially supervised learning
- arxiv url: http://arxiv.org/abs/2411.17536v1
- Date: Tue, 26 Nov 2024 15:51:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-27 13:34:44.308393
- Title: Box for Mask and Mask for Box: weak losses for multi-task partially supervised learning
- Title(参考訳): Box for Mask and Mask for Box : マルチタスク部分教師付き学習における弱点
- Authors: Hoàng-Ân Lê, Paul Berg, Minh-Tan Pham,
- Abstract要約: 1つのタスクの情報を使ってもう1つのタスクをトレーニングすることは、マルチタスクの部分的に教師付き学習にとって有益である。
Box-for-MaskとMask-for-Boxの戦略は、1つのタスクアノテーションから必要な情報を排除し、もう1つのタスクをトレーニングするために提案されている。
- 参考スコア(独自算出の注目度): 2.7719338074999538
- License:
- Abstract: Object detection and semantic segmentation are both scene understanding tasks yet they differ in data structure and information level. Object detection requires box coordinates for object instances while semantic segmentation requires pixel-wise class labels. Making use of one task's information to train the other would be beneficial for multi-task partially supervised learning where each training example is annotated only for a single task, having the potential to expand training sets with different-task datasets. This paper studies various weak losses for partially annotated data in combination with existing supervised losses. We propose Box-for-Mask and Mask-for-Box strategies, and their combination BoMBo, to distil necessary information from one task annotations to train the other. Ablation studies and experimental results on VOC and COCO datasets show favorable results for the proposed idea. Source code and data splits can be found at https://github.com/lhoangan/multas.
- Abstract(参考訳): オブジェクト検出とセマンティックセグメンテーションはどちらもシーン理解のタスクであるが、データ構造と情報レベルが異なる。
オブジェクト検出にはオブジェクトインスタンスのボックス座標が必要ですが、セマンティックセグメンテーションにはピクセル単位のクラスラベルが必要です。
1つのタスクの情報を使ってもう1つのタスクをトレーニングすることは、各トレーニングサンプルが1つのタスクにのみアノテートされ、異なるタスクデータセットでトレーニングセットを拡張する可能性がある、マルチタスク部分的な学習にとって有益である。
本稿では,有意なアノテートデータに対する各種の弱い損失と既存の教師付き損失について検討する。
一方のタスクアノテーションから必要な情報を排除して他方のトレーニングを行うために,Box-for-MaskとMask-for-Boxの戦略と,その組み合わせであるBoMBoを提案する。
VOCおよびCOCOデータセットのアブレーション研究と実験結果から,提案したアイデアに好意的な結果が得られた。
ソースコードとデータ分割はhttps://github.com/lhoangan/multas.comで見ることができる。
関連論文リスト
- Leveraging knowledge distillation for partial multi-task learning from multiple remote sensing datasets [2.1178416840822023]
ターゲットタスクの1つにトレーニング例をアノテートする部分的マルチタスク学習は、リモートセンシングにおいて有望なアイデアである。
本稿では, 知識蒸留を用いて, 代替課題における基礎的真理の必要性を代替し, その性能を向上させることを提案する。
論文 参考訳(メタデータ) (2024-05-24T09:48:50Z) - Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Data exploitation: multi-task learning of object detection and semantic
segmentation on partially annotated data [4.9914667450658925]
本稿では,物体検出とセマンティックセグメンテーションの併用学習について検討する。
本稿では,共同タスク最適化の活用を目的とした知識蒸留手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T14:49:54Z) - AIMS: All-Inclusive Multi-Level Segmentation [93.5041381700744]
視覚領域を3つのレベル(パート、エンティティ、リレーション)に分割するタスクであるAll-Inclusive Multi-Level(AIMS)を提案する。
また、アノテーションの不整合とタスク相関の2つの大きな課題に対処するために、マルチデータセットのマルチタスクトレーニングを通じて統合されたAIMSモデルを構築します。
論文 参考訳(メタデータ) (2023-05-28T16:28:49Z) - A Simple Framework for Open-Vocabulary Segmentation and Detection [85.21641508535679]
我々は,異なるセグメンテーションと検出データセットから共同で学習する,シンプルなオープン語彙検出フレームワークOpenSeeDを提案する。
まず、事前学習されたテキストエンコーダを導入し、視覚概念を2つのタスクにエンコードし、それらの共通意味空間を学習する。
プレトレーニング後,本モデルでは,セグメンテーションと検出の両方において,競争力あるいは強いゼロショット転送性を示す。
論文 参考訳(メタデータ) (2023-03-14T17:58:34Z) - Semi-supervised Multi-task Learning for Semantics and Depth [88.77716991603252]
MTL(Multi-Task Learning)は、関連するタスク間で表現を共有することで、モデル一般化を強化することを目的としている。
そこで本研究では,異なるデータセットから利用可能な監視信号を活用するために,半教師付きマルチタスク学習(MTL)手法を提案する。
本稿では,データセット間の整合性の問題を軽減するために,様々なアライメントの定式化を施したドメイン認識識別器構造を提案する。
論文 参考訳(メタデータ) (2021-10-14T07:43:39Z) - Weakly Supervised Multi-Object Tracking and Segmentation [21.7184457265122]
本稿では,マルチオブジェクト追跡と弱教師付きトラッキングの問題について紹介する。
ジョイントの弱い監督インスタンスセグメンテーションとマルチオブジェクトトラッキング。
そこで我々は,マルチタスク学習を活用した新たなシナジートレーニング戦略を考案する。
本研究では,本タスクの代表的なベンチマークであるKITTI MOTSの手法を評価し,車と歩行者の12%と12.7%に,完全監督と弱監督のアプローチによるMOTSPメトリックのパフォーマンスギャップを小さくした。
論文 参考訳(メタデータ) (2021-01-03T17:06:43Z) - Adaptive Task Sampling for Meta-Learning [79.61146834134459]
数ショットの分類のためのメタラーニングの鍵となるアイデアは、テスト時に直面した数ショットの状況を模倣することである。
一般化性能を向上させるための適応型タスクサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T03:15:53Z) - Task-Adaptive Clustering for Semi-Supervised Few-Shot Classification [23.913195015484696]
未確認のタスクを、少量の新しいトレーニングデータだけで処理することを目的としている。
しかし、数ショットの学習者が準備(メタトレーニング)する際には、大量のラベル付きデータが必要である。
そこで本研究では,トレーニングデータの大部分がラベル付けされていない半教師付き環境下で動作可能な,数発の学習者を提案する。
論文 参考訳(メタデータ) (2020-03-18T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。