論文の概要: Evaluation for Weakly Supervised Object Localization: Protocol, Metrics,
and Datasets
- arxiv url: http://arxiv.org/abs/2007.04178v2
- Date: Tue, 7 Dec 2021 05:21:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 13:25:15.659723
- Title: Evaluation for Weakly Supervised Object Localization: Protocol, Metrics,
and Datasets
- Title(参考訳): 弱教師付きオブジェクトローカライゼーションの評価:プロトコル、メトリクス、データセット
- Authors: Junsuk Choe, Seong Joon Oh, Sanghyuk Chun, Seungho Lee, Zeynep Akata,
Hyunjung Shim
- Abstract要約: 我々は、弱教師付きオブジェクトローカライゼーション(WSOL)タスクは、画像レベルのラベルだけでは不十分であると主張している。
本稿では,テストセットと重複しない小さなホールトアウトセットにのみ,完全な監視が制限される新しい評価プロトコルを提案する。
- 参考スコア(独自算出の注目度): 65.73451960585571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly-supervised object localization (WSOL) has gained popularity over the
last years for its promise to train localization models with only image-level
labels. Since the seminal WSOL work of class activation mapping (CAM), the
field has focused on how to expand the attention regions to cover objects more
broadly and localize them better. However, these strategies rely on full
localization supervision for validating hyperparameters and model selection,
which is in principle prohibited under the WSOL setup. In this paper, we argue
that WSOL task is ill-posed with only image-level labels, and propose a new
evaluation protocol where full supervision is limited to only a small held-out
set not overlapping with the test set. We observe that, under our protocol, the
five most recent WSOL methods have not made a major improvement over the CAM
baseline. Moreover, we report that existing WSOL methods have not reached the
few-shot learning baseline, where the full-supervision at validation time is
used for model training instead. Based on our findings, we discuss some future
directions for WSOL.
- Abstract(参考訳): 画像レベルのラベルだけでローカライズモデルをトレーニングすることを約束するWSOL(Weakly-supervised Object Localization)が近年人気を集めている。
The seminal WSOL work of class activation mapping (CAM) 以来、この分野はより広範に対象をカバーし、よりローカライズするために注意領域を拡張する方法に焦点を当ててきた。
しかし、これらの戦略は、WSOL設定で原則的に禁止されているハイパーパラメータとモデル選択を検証するための完全なローカライズ管理に依存している。
本稿では,WSOLタスクはイメージレベルのラベルだけでは不十分であるとの論じ,テストセットと重複しない小さな保持セットにのみ完全な監督が制限される新たな評価プロトコルを提案する。
我々は、我々のプロトコルの下で、最新の5つのWSOLメソッドがCAMベースラインを大きく改善していないことを観察した。
さらに,検証時の全スーパービジョンをモデルトレーニングに使用する場合,既存のwsol手法がマイナショット学習ベースラインに達していないことも報告した。
そこで本研究では,WSOLの今後の方向性について述べる。
関連論文リスト
- ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Open-Vocabulary Spatio-Temporal Action Detection [59.91046192096296]
OV-STAD (Open-vocabulary-temporal action detection) は,ビデオ理解において重要な課題である。
OV-STADは、ボックスとラベルを監督する限定されたベースクラスでモデルをトレーニングする必要がある。
局所的なビデオ領域とテキストのペアに対して、細かなアクション検出タスクに対して、より精巧なVLMを適用するために、慎重に微調整を行う。
論文 参考訳(メタデータ) (2024-05-17T14:52:47Z) - Bagging Regional Classification Activation Maps for Weakly Supervised
Object Localization [11.25759292976175]
BagCAMsは、ローカライゼーションタスクのためのよく訓練された分類器をより良く投影するためのプラグアンドプレイ機構である。
我々のBagCAMは、地域ローカライザの集合を定義するために、提案した地域ローカライザ生成戦略を採用する。
実験により,提案したBagCAMを用いることで,ベースラインWSOL法の性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-07-16T03:03:01Z) - Weakly Supervised Object Localization as Domain Adaption [19.854125742336688]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクの監督のみでオブジェクトをローカライズすることに焦点を当てる。
従来のWSOL手法の多くは、MIL(Multi-instance Learning)機構を用いて分類構造に基づいてオブジェクトをローカライズする分類活性化マップ(CAM)に従っている。
この研究は、WSOLをドメイン適応(DA)タスクとしてモデル化する、新しい視点を提供する。そこでは、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメイン上でテストされ、オブジェクトを見つける。
論文 参考訳(メタデータ) (2022-03-03T13:50:22Z) - Shallow Feature Matters for Weakly Supervised Object Localization [35.478997006168484]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルのみを利用してオブジェクトをローカライズすることを目的としている。
以前のCAMベースの手法では、WSOLが重要であったにもかかわらず、浅い特徴を十分に活用できなかった。
本稿では,Shallow機能を考慮したPseudo supervised Object Localization (SPOL) モデルを提案する。
論文 参考訳(メタデータ) (2021-08-02T13:16:48Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z) - Rethinking the Route Towards Weakly Supervised Object Localization [28.90792512056726]
弱教師付きオブジェクトローカライゼーションは、クラスに依存しないオブジェクトローカライゼーションとオブジェクト分類の2つの部分に分けられるべきである。
クラス非依存のオブジェクトローカライゼーションでは、クラス非依存のメソッドを使用してノイズの多い擬似アノテーションを生成し、クラスラベルなしで境界ボックスのレグレッションを実行する必要がある。
我々のPSOLモデルは、微調整なしで異なるデータセット間で良好な転送性を持つ。
論文 参考訳(メタデータ) (2020-02-26T08:54:20Z) - Evaluating Weakly Supervised Object Localization Methods Right [65.73451960585571]
我々は、弱教師付きオブジェクトローカライゼーション(WSOL)タスクは、画像レベルのラベルだけでは不十分であると主張している。
本稿では,テストセットと重複しない小さなホールトアウトセットにのみ,完全な監視が制限される新しい評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-01-21T10:50:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。