論文の概要: Detecting Object States vs Detecting Objects: A New Dataset and a
Quantitative Experimental Study
- arxiv url: http://arxiv.org/abs/2112.08281v1
- Date: Wed, 15 Dec 2021 17:19:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 15:35:59.634196
- Title: Detecting Object States vs Detecting Objects: A New Dataset and a
Quantitative Experimental Study
- Title(参考訳): 物体の状態検出と物体検出:新しいデータセットと定量的実験
- Authors: Filippos Gouidis, Theodoris Patkos, Antonis Argyros and Dimitris
Plexousakis
- Abstract要約: 画像中の物体状態の検出(状態検出 - SD)は理論的および実用的重要性の両方の問題である。
その重要性にもかかわらず、これまでこの問題の研究は限られてきた。
我々は18のオブジェクトカテゴリと9のステートクラスに対する19,000以上のアノテーションからなる新しい公開データセットであるオブジェクト状態検出データセット(OSDD)を紹介した。
- 参考スコア(独自算出の注目度): 0.2752817022620644
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The detection of object states in images (State Detection - SD) is a problem
of both theoretical and practical importance and it is tightly interwoven with
other important computer vision problems, such as action recognition and
affordance detection. It is also highly relevant to any entity that needs to
reason and act in dynamic domains, such as robotic systems and intelligent
agents. Despite its importance, up to now, the research on this problem has
been limited. In this paper, we attempt a systematic study of the SD problem.
First, we introduce the Object State Detection Dataset (OSDD), a new publicly
available dataset consisting of more than 19,000 annotations for 18 object
categories and 9 state classes. Second, using a standard deep learning
framework used for Object Detection (OD), we conduct a number of appropriately
designed experiments, towards an in-depth study of the behavior of the SD
problem. This study enables the setup of a baseline on the performance of SD,
as well as its relative performance in comparison to OD, in a variety of
scenarios. Overall, the experimental outcomes confirm that SD is harder than OD
and that tailored SD methods need to be developed for addressing effectively
this significant problem.
- Abstract(参考訳): 画像中の物体状態の検出(状態検出 - SD)は理論的および実用的重要性の問題であり、アクション認識やアベイランス検出といった他の重要なコンピュータビジョン問題と密接に関連している。
また、ロボットシステムやインテリジェントエージェントなど、動的ドメインにおける推論と行動を必要とするあらゆるエンティティにも高い関連性がある。
その重要性にもかかわらず、これまでこの問題の研究は限られてきた。
本稿では,SD問題に関する系統的研究を試みる。
まず、オブジェクトの18のカテゴリと9のステートクラスに対する19,000以上のアノテーションからなる新しい公開データセットであるObject State Detection Dataset(OSDD)を紹介します。
第二に、オブジェクト検出(OD)に使用される標準的なディープラーニングフレームワークを用いて、SD問題の振る舞いの詳細な研究に向けて、多数の適切な設計実験を行う。
本研究は,様々なシナリオにおいて,sdの性能に関するベースラインの設定と,odと比較しての相対的な性能の設定を可能にする。
全体として、実験の結果、sdはodよりも困難であり、この重大な問題を解決するために、調整済みsdメソッドを開発する必要があることが確認された。
関連論文リスト
- Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - Beyond Few-shot Object Detection: A Detailed Survey [25.465534270637523]
研究者たちは、数発の学習とオブジェクト検出の原則を融合させる、数発のオブジェクト検出(FSOD)アプローチを導入した。
これらのアプローチは、広範なラベル付きデータセットへの依存を減らす上で重要な役割を果たす。
本研究の目的は,上記の数ショット設定を包括的に理解し,各FSODタスクの方法論を探索することである。
論文 参考訳(メタデータ) (2024-08-26T13:09:23Z) - Run-time Introspection of 2D Object Detection in Automated Driving
Systems Using Learning Representations [13.529124221397822]
ディープニューラルネットワーク(DNN)に基づく2次元物体検出のための新しいイントロスペクションソリューションを提案する。
KITTIとBDDのデータセットで評価された1段階および2段階のオブジェクト検出器を用いて,2次元オブジェクト検出におけるエラー検出のためのSOTAイントロスペクション機構を実装した。
性能評価の結果,提案手法はSOTA法より優れており,BDDデータセットのエラー率を9%から17%まで絶対的に削減できることがわかった。
論文 参考訳(メタデータ) (2024-03-02T10:56:14Z) - Joint Salient Object Detection and Camouflaged Object Detection via
Uncertainty-aware Learning [47.253370009231645]
本稿では,SOD と Camouflaged Object Detection (COD) の矛盾する情報を探るため,不確実性を考慮した学習パイプラインを提案する。
我々の解決策は、最先端の性能と情報的不確実性の推定の両方につながる。
論文 参考訳(メタデータ) (2023-07-10T15:49:37Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - A Guide to Image and Video based Small Object Detection using Deep
Learning : Case Study of Maritime Surveillance [38.88995659233979]
光画像やビデオにおける小さな物体検出は難しい問題である。
最先端のジェネリックオブジェクト検出方法でさえ、そのようなオブジェクトの正確なローカライズと識別に失敗する。
本稿では,既存の文献を要約し,現在の研究の全体像を示す分類法を提案する。
論文 参考訳(メタデータ) (2022-07-26T14:28:38Z) - One-Shot Object Affordance Detection in the Wild [76.46484684007706]
Affordance Detectionは、画像内のオブジェクトの潜在的なアクション可能性を特定することを指す。
我々は、人間の行動目的を推定し、それを転送して、すべての候補画像から共通価格を検出するワンショットアフォーダンス検出ネットワーク(OSAD-Net)を考案する。
複雑なシーンと豊富なアノテーションによって、当社のPADv2データセットは、アベイランス検出メソッドをベンチマークするためのテストベッドとして使用することができます。
論文 参考訳(メタデータ) (2021-08-08T14:53:10Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z) - Progressive Object Transfer Detection [84.48927705173494]
本稿では,新しいプログレッシブオブジェクト転送検出(POTD)フレームワークを提案する。
第一に、POTDは様々なドメインの様々なオブジェクトを効果的にプログレッシブな検出手順に活用することができる。
第2に、POTDは2つの微妙な転送段階、すなわち、LSTD(low-Shot Transfer Detection)とWSTD(Weakly Supervised Transfer Detection)から構成される。
論文 参考訳(メタデータ) (2020-02-12T00:16:24Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。