論文の概要: 1st Place Solution for the UVO Challenge on Image-based Open-World
Segmentation 2021
- arxiv url: http://arxiv.org/abs/2110.10239v1
- Date: Tue, 19 Oct 2021 20:19:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-24 08:47:35.307190
- Title: 1st Place Solution for the UVO Challenge on Image-based Open-World
Segmentation 2021
- Title(参考訳): 画像に基づくオープンワールドセグメンテーション2021におけるuvoチャレンジの1位
- Authors: Yuming Du, Wen Guo, Yang Xiao, Vincent Lepetit
- Abstract要約: チャレンジで競うために使用する2段階のインスタンスセグメンテーションフレームワークについて説明します。
われわれのアプローチは、UVOイメージベースのOpen-World 2021 Challengeの初歩を達成している。
- 参考スコア(独自算出の注目度): 37.07929663247443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe our two-stage instance segmentation framework we use to compete
in the challenge. The first stage of our framework consists of an object
detector, which generates object proposals in the format of bounding boxes.
Then, the images and the detected bounding boxes are fed to the second stage,
where a segmentation network is applied to segment the objects in the bounding
boxes. We train all our networks in a class-agnostic way. Our approach achieves
the first place in the UVO 2021 Image-based Open-World Segmentation Challenge.
- Abstract(参考訳): チャレンジで競うために使用する2段階のインスタンスセグメンテーションフレームワークについて説明します。
フレームワークの第1段階はオブジェクト検出器で構成されており、バウンディングボックスの形式でオブジェクト提案を生成する。
次に、画像及び検出された境界ボックスを第2ステージに供給し、境界ボックス内のオブジェクトを分割するためにセグメンテーションネットワークを適用する。
すべてのネットワークをクラスに依存しない方法でトレーニングします。
提案手法は, UVO 2021 Image-based Open-World Segmentation Challengeにおける第1位を達成している。
関連論文リスト
- USE: Universal Segment Embeddings for Open-Vocabulary Image Segmentation [33.11010205890195]
オープン語彙のイメージセグメンテーションにおける大きな課題は、これらのセグメンテーションをテキスト定義カテゴリに正確に分類することにある。
この課題に対処するために、Universal Segment Embedding(USE)フレームワークを紹介します。
本フレームワークは,1)大量のセグメントテキストペアを様々な粒度で効率的にキュレートするように設計されたデータパイプライン,2)テキスト定義のカテゴリに精度の高いセグメント分類を可能にする普遍的なセグメント埋め込みモデルからなる。
論文 参考訳(メタデータ) (2024-06-07T21:41:18Z) - Enhancing Weakly Supervised Semantic Segmentation with Multi-modal Foundation Models: An End-to-End Approach [7.012760526318993]
Weakly-Supervised Semantic (WSSS)は、広範囲なラベリングに対してコスト効率のよい回避手段を提供する。
既存のWSSSメソッドは、セグメンテーション結果の低さにつながるオブジェクトの境界を理解するのに苦労しています。
本稿では,境界ボックス内の視覚的基盤モデルを活用することにより,これらの問題に対処する,新しい効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-10T16:42:25Z) - ZJU ReLER Submission for EPIC-KITCHEN Challenge 2023: TREK-150 Single
Object Tracking [62.98078087018469]
マルチ機能スケールでトランスフォーマーを組み込んだAOTフレームワークの派生版であるMSDeAOTを紹介する。
MSDeAOTは16と8の2つの特徴尺度を用いて、以前のフレームから現在のフレームへ効率的にオブジェクトマスクを伝搬する。
設計の有効性の証明として,EPIC-KITCHENS TREK-150 Object Tracking Challengeで1位を獲得した。
論文 参考訳(メタデータ) (2023-07-05T03:50:58Z) - A Simple Framework for Open-Vocabulary Segmentation and Detection [85.21641508535679]
我々は,異なるセグメンテーションと検出データセットから共同で学習する,シンプルなオープン語彙検出フレームワークOpenSeeDを提案する。
まず、事前学習されたテキストエンコーダを導入し、視覚概念を2つのタスクにエンコードし、それらの共通意味空間を学習する。
プレトレーニング後,本モデルでは,セグメンテーションと検出の両方において,競争力あるいは強いゼロショット転送性を示す。
論文 参考訳(メタデータ) (2023-03-14T17:58:34Z) - The Second Place Solution for The 4th Large-scale Video Object
Segmentation Challenge--Track 3: Referring Video Object Segmentation [18.630453674396534]
ReferFormerは、すべてのビデオフレームで言語表現によって参照される所定のビデオでオブジェクトインスタンスをセグメントすることを目的としている。
本研究は, 循環学習率, 半教師付きアプローチ, テスト時間拡張推論など, さらなる向上策を提案する。
改良されたReferFormerはCVPR2022 Referring Youtube-VOS Challengeで2位にランクインした。
論文 参考訳(メタデータ) (2022-06-24T02:15:06Z) - 1st Place Solution for the UVO Challenge on Video-based Open-World
Segmentation 2021 [37.07929663247443]
本稿では,2段階の"detect-then-match"ビデオインスタンスセグメンテーション手法を提案する。
UVO 2021ビデオベースのオープンワールドチャレンジでは,このアプローチが初となる。
論文 参考訳(メタデータ) (2021-10-22T08:39:02Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z) - Interactive Video Object Segmentation Using Global and Local Transfer
Modules [51.93009196085043]
我々はアノテーションネットワーク(A-Net)と転送ネットワーク(T-Net)からなるディープニューラルネットワークを開発する。
A-Netは、フレーム上のユーザ記述を前提として、エンコーダ-デコーダアーキテクチャに基づいたセグメンテーション結果を生成する。
ユーザスクリブルをエミュレートし,補助的な損失を生かして,ネットワーク全体を2段階に分けてトレーニングする。
論文 参考訳(メタデータ) (2020-07-16T06:49:07Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。