Fugu-MT 論文翻訳(概要): Region-aware Distribution Contrast: A Novel Approach to Multi-Task Partially Supervised Learning

論文の概要: Region-aware Distribution Contrast: A Novel Approach to Multi-Task Partially Supervised Learning

arxiv url: http://arxiv.org/abs/2403.10252v1
Date: Fri, 15 Mar 2024 12:41:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-18 17:20:54.815377
Title: Region-aware Distribution Contrast: A Novel Approach to Multi-Task Partially Supervised Learning
Title（参考訳）: 地域対応型分散コントラスト:マルチタスク部分教師付き学習への新しいアプローチ
Authors: Meixuan Li, Tianyu Li, Guoqing Wang, Peng Wang, Yang Yang, Heng Tao Shen,
Abstract要約: マルチタスク密度予測にはセマンティックセグメンテーション、深さ推定、表面正規推定が含まれる。既存のソリューションは通常、グローバルなクロスタスク画像マッチングのためのグローバルなイメージ表現の学習に依存している。本提案では,ガウス分布を用いた地域表現をモデル化する。
参考スコア（独自算出の注目度）: 50.88504784466931
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this study, we address the intricate challenge of multi-task dense prediction, encompassing tasks such as semantic segmentation, depth estimation, and surface normal estimation, particularly when dealing with partially annotated data (MTPSL). The complexity arises from the absence of complete task labels for each training image. Given the inter-related nature of these pixel-wise dense tasks, our focus is on mining and capturing cross-task relationships. Existing solutions typically rely on learning global image representations for global cross-task image matching, imposing constraints that, unfortunately, sacrifice the finer structures within the images. Attempting local matching as a remedy faces hurdles due to the lack of precise region supervision, making local alignment a challenging endeavor. The introduction of Segment Anything Model (SAM) sheds light on addressing local alignment challenges by providing free and high-quality solutions for region detection. Leveraging SAM-detected regions, the subsequent challenge lies in aligning the representations within these regions. Diverging from conventional methods that directly learn a monolithic image representation, our proposal involves modeling region-wise representations using Gaussian Distributions. Aligning these distributions between corresponding regions from different tasks imparts higher flexibility and capacity to capture intra-region structures, accommodating a broader range of tasks. This innovative approach significantly enhances our ability to effectively capture cross-task relationships, resulting in improved overall performance in partially supervised multi-task dense prediction scenarios. Extensive experiments conducted on two widely used benchmarks underscore the superior effectiveness of our proposed method, showcasing state-of-the-art performance even when compared to fully supervised methods.
Abstract（参考訳）: 本研究では,意味的セグメンテーション,深度推定,表面正規推定といったタスクを包含するマルチタスク密度予測の複雑な課題,特に部分的に注釈付きデータ(MTPSL)を扱う場合の課題に対処する。複雑さは、トレーニングイメージごとに完全なタスクラベルがないことから生じます。ピクセル単位の高密度なタスクの関連性を考えると、私たちはマイニングとタスク間の関係の取得に重点を置いています。既存のソリューションは通常、グローバルなクロスタスク画像マッチングのためのグローバルなイメージ表現の学習に依存しており、残念ながら、画像内のより微細な構造を犠牲にする制約を課している。治療としての局所的マッチングの試みは、正確な地域監督の欠如によりハードルに直面し、局所的なアライメントが困難な作業となる。 Segment Anything Model (SAM)の導入は、地域検出のための自由で高品質なソリューションを提供することによって、局所的なアライメントの問題に対処することに光を当てている。 SAM検出された領域を活用することで、その後の課題は、これらの領域内の表現の整合性にある。本提案では,モノリシック画像表現を直接学習する従来の手法と異なり,ガウス分布を用いた領域表現をモデル化する。異なるタスクから対応する領域間の分散を調整することは、より柔軟性と領域内構造を捕捉する能力を与え、幅広いタスクを収容する。この革新的なアプローチは、クロスタスク関係を効果的にキャプチャする能力を大幅に向上させ、部分的に教師付きマルチタスクの高密度予測シナリオにおける全体的なパフォーマンスを向上させる。広範に使用されている2つのベンチマーク実験により,提案手法の有効性を実証し,完全教師付き手法と比較しても最先端性能を示す。

関連論文リスト

Hybrid Global-Local Representation with Augmented Spatial Guidance for Zero-Shot Referring Image Segmentation [30.213330400785747]
本研究では,周辺地域の文脈情報と詳細なマスク特化特徴を統合した,訓練不要でハイブリッドなグローバルな特徴抽出手法を提案する。標準RISベンチマーク実験により,本手法は既存のゼロショットRISモデルよりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2025-04-01T02:13:39Z)
Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models [44.437693135170576]
我々は、高度化タスク付きLMM、局所画像圧縮、グローバルエキスパートの混合(SliME)を提案する。我々は,異なるタスクにおいて異なるアダプタが優れているという観察に基づいて,アダプタの混合を用いてグローバルビューからコンテキスト情報を抽出する。提案手法は,200万のトレーニングデータのみを用いて,様々なベンチマークにおいて先行的な性能を実現する。
論文参考訳（メタデータ） (2024-06-12T17:59:49Z)
BLADE: Box-Level Supervised Amodal Segmentation through Directed Expansion [10.57956193654977]
Boxレベルの教師付きアモーダルセグメンテーションは、この課題に対処する。可視マスクから対応するアモーダルマスクへの指向性拡張アプローチを導入することで,新しい解を提案する。このアプローチでは、オーバーラップする領域 – 異なるインスタンスが交わる領域 – に基づいた、ハイブリッドなエンドツーエンドネットワークが関係しています。
論文参考訳（メタデータ） (2024-01-03T09:37:03Z)
Distribution Matching for Multi-Task Learning of Classification Tasks: a Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。 MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文参考訳（メタデータ） (2024-01-02T14:18:11Z)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (2023-12-19T08:14:14Z)
Progressive Feature Self-reinforcement for Weakly Supervised Semantic Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文参考訳（メタデータ） (2023-12-14T13:21:52Z)
Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (2022-02-19T17:46:02Z)
Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文参考訳（メタデータ） (2022-02-09T18:56:41Z)
Empirical Study of Multi-Task Hourglass Model for Semantic Segmentation Task [0.7614628596146599]
エッジ検出, 意味輪郭, 距離変換タスクを用いて, セマンティックセグメンテーションタスクを補完するマルチタスク手法を提案する。本研究では,Cityscapes,CamVid,Freiburg Forestの各データセットにおける時間ガラスモデルのマルチタスク環境における学習の有効性を示す。
論文参考訳（メタデータ） (2021-05-28T01:08:10Z)
Spatially Consistent Representation Learning [12.120041613482558]
本研究では,空間的に一貫した表現学習アルゴリズム(SCRL)を提案する。ランダムに切り抜かれた局所領域のコヒーレントな空間表現を作ろうとする新しい自己教師付き目的を考案する。ベンチマークデータセットを用いた下流のローカライゼーションタスクでは、提案したSCRLは大幅な性能改善を示す。
論文参考訳（メタデータ） (2021-03-10T15:23:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。