論文の概要: Detecting Human-Object Interaction with Mixed Supervision
- arxiv url: http://arxiv.org/abs/2011.04971v2
- Date: Thu, 12 Nov 2020 14:14:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 07:41:08.371334
- Title: Detecting Human-Object Interaction with Mixed Supervision
- Title(参考訳): 混合監督による物体間相互作用の検出
- Authors: Suresh Kirthi Kumaraswamy (1), Miaojing Shi (2) and Ewa Kijak (3) ((1)
Univ Le Mans, CNRS, IRISA, (2) Kings College London, (3) Univ Rennes, Inria,
CNRS, IRISA)
- Abstract要約: 人間の物体の相互作用(HOI)検出は、画像の理解と推論において重要な課題である。
本稿では,モーメント非依存学習の特定の設計のおかげで,混合教師付きHOI検出パイプラインを提案する。
本手法は,挑戦的なHICO-DETデータセットを用いて評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Human object interaction (HOI) detection is an important task in image
understanding and reasoning. It is in a form of HOI triplet <human; verb;
object>, requiring bounding boxes for human and object, and action between them
for the task completion. In other words, this task requires strong supervision
for training that is however hard to procure. A natural solution to overcome
this is to pursue weakly-supervised learning, where we only know the presence
of certain HOI triplets in images but their exact location is unknown. Most
weakly-supervised learning methods do not make provision for leveraging data
with strong supervision, when they are available; and indeed a na\"ive
combination of this two paradigms in HOI detection fails to make contributions
to each other. In this regard we propose a mixed-supervised HOI detection
pipeline: thanks to a specific design of momentum-independent learning that
learns seamlessly across these two types of supervision. Moreover, in light of
the annotation insufficiency in mixed supervision, we introduce an HOI element
swapping technique to synthesize diverse and hard negatives across images and
improve the robustness of the model. Our method is evaluated on the challenging
HICO-DET dataset. It performs close to or even better than many
fully-supervised methods by using a mixed amount of strong and weak
annotations; furthermore, it outperforms representative state of the art weakly
and fully-supervised methods under the same supervision.
- Abstract(参考訳): 人間の物体相互作用(HOI)検出は画像理解と推論において重要な課題である。
これは hoi triplet <human; verb; object> の形式で、人間とオブジェクトのバウンディングボックスを必要とし、タスク完了のためにそれらの間のアクションである。
言い換えれば、このタスクは、取得が難しいトレーニングに対して、強い監督を必要とする。
これを克服するための自然な解決策は、弱い教師付き学習を追求することであり、画像中の特定のHOI三つ子の存在しか分かっていないが、正確な位置は不明である。
ほとんどの弱い教師付き学習手法は、利用可能なときにデータを強力な監視力で活用するためのプロビジョニングを行なわず、実際、HOI検出におけるこの2つのパラダイムの「自然な組み合わせ」は、互いに貢献することができない。
本稿では,これら2種類の教師をシームレスに学習する運動量非依存学習の設計のおかげで,混在型HOI検出パイプラインを提案する。
さらに, 混在監視におけるアノテーションの欠如を考慮し, HOI要素スワッピング技術を導入し, 画像間の多種多様・硬質な負を合成し, モデルの堅牢性を向上させる。
本手法はHICO-DETデータセットを用いて評価する。
強いアノテーションと弱いアノテーションを混在させることで、多くの完全に監督された手法に近づき、さらに同じ監督の下では、芸術の代表的状態を弱く、完全に監督された手法よりも優れている。
関連論文リスト
- Joint Salient Object Detection and Camouflaged Object Detection via
Uncertainty-aware Learning [47.253370009231645]
本稿では,SOD と Camouflaged Object Detection (COD) の矛盾する情報を探るため,不確実性を考慮した学習パイプラインを提案する。
我々の解決策は、最先端の性能と情報的不確実性の推定の両方につながる。
論文 参考訳(メタデータ) (2023-07-10T15:49:37Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - Weakly-supervised HOI Detection via Prior-guided Bi-level Representation
Learning [66.00600682711995]
ヒューマンオブジェクトインタラクション(HOI)検出は、人間中心のシーン理解において重要な役割を担い、多くの視覚タスクの基本的なビルディングブロックとして機能する。
HOI検出のための汎用的でスケーラブルな戦略の1つは、画像レベルのアノテーションからのみ学習する弱い監視を使用することである。
これは、不明瞭な人間と物体の関連、HOIを検出する大きな探索空間、非常にノイズの多い訓練信号によって本質的に困難である。
画像レベルとHOIインスタンスレベルの両方で事前の知識を組み込むことができるCLIP誘導HOI表現を開発し、不正な人間とオブジェクトの関連性を実証するために自己学習機構を採用する。
論文 参考訳(メタデータ) (2023-03-02T14:41:31Z) - Imitation from Observation With Bootstrapped Contrastive Learning [12.048166025000976]
IfO(IfO)は、マルコフ決定プロセスにおいて自律エージェントを訓練する学習パラダイムである。
本稿では,OfOアルゴリズムであるBootIfOLについて紹介する。
我々は,限られた数の実証軌道を用いて効果的な政策を訓練できることを示す,様々な制御タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-02-13T17:32:17Z) - Decoupled Adversarial Contrastive Learning for Self-supervised
Adversarial Robustness [69.39073806630583]
頑健な表現学習のための対人訓練(AT)と教師なし表現学習のための自己教師型学習(SSL)は2つの活発な研究分野である。
Decoupled Adversarial Contrastive Learning (DeACL) と呼ばれる2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-22T06:30:44Z) - On Higher Adversarial Susceptibility of Contrastive Self-Supervised
Learning [104.00264962878956]
コントラスト型自己教師学習(CSL)は,画像と映像の分類において,教師あり学習のパフォーマンスに適合するか上回っている。
2つの学習パラダイムによって誘導される表現の性質が似ているかどうかは、いまだに不明である。
我々は,CSL表現空間における単位超球面上のデータ表現の均一分布を,この現象の鍵となる要因として同定する。
CSLトレーニングでモデルロバスト性を改善するのにシンプルだが有効である戦略を考案する。
論文 参考訳(メタデータ) (2022-07-22T03:49:50Z) - CGUA: Context-Guided and Unpaired-Assisted Weakly Supervised Person
Search [54.106662998673514]
本稿では,コンテキストガイドとアンペア支援(CGUA)を弱教師付き人物検索フレームワークとして導入する。
具体的には、クラスタリングプロセスにおけるコンテキスト情報を活用する新しいコンテキストガイドクラスタ(CGC)アルゴリズムを提案する。
本手法は,より多様なラベル付きデータを活用することにより,最先端の教師付き手法に匹敵する,あるいは優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-27T13:57:30Z) - Unsupervised Clustering Active Learning for Person Re-identification [5.705895028045853]
教師なしのre-idメソッドは、モデルをトレーニングするためにラベルのないデータに依存します。
本稿では,Unsupervised Clustering Active Learning (UCAL) Re-id Deep Learningアプローチを提案する。
代表的なセントロイドペアを漸進的に発見することができる。
論文 参考訳(メタデータ) (2021-12-26T02:54:35Z) - Combining Self-Training and Self-Supervised Learning for Unsupervised
Disfluency Detection [80.68446022994492]
本研究では,未ラベルテキストコーパスを扱える教師なし学習パラダイムについて検討する。
我々のモデルは、自己学習の考え方を拡張する半教師あり学習アプローチである、雑音学習(Noisy Student Training)に関する最近の研究に基づいている。
論文 参考訳(メタデータ) (2020-10-29T05:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。