Fugu-MT 論文翻訳(概要): A Neuromorphic Dataset for Object Segmentation in Indoor Cluttered Environment

論文の概要: A Neuromorphic Dataset for Object Segmentation in Indoor Cluttered Environment

arxiv url: http://arxiv.org/abs/2302.06301v1
Date: Mon, 13 Feb 2023 12:02:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-14 15:37:33.802377
Title: A Neuromorphic Dataset for Object Segmentation in Indoor Cluttered Environment
Title（参考訳）: 室内クラッタ環境におけるオブジェクトセグメンテーションのためのニューロモルフィックデータセット
Authors: Xiaoqian Huang, Kachole Sanket, Abdulla Ayyad, Fariborz Baghaei Naeini, Dimitrios Makris, Yahya Zweir
Abstract要約: 本稿では,屋内環境におけるオブジェクトセグメンテーションのためのイベントベースESDデータセットを提案する。提案するデータセットは,145のシーケンスと14,166のRGBフレームから構成される。ステレオグラフィック構成で2つのイベントベースのカメラから2188万と2080万のイベントが収集されている。
参考スコア（独自算出の注目度）: 3.6047642906482142
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Taking advantage of an event-based camera, the issues of motion blur, low dynamic range and low time sampling of standard cameras can all be addressed. However, there is a lack of event-based datasets dedicated to the benchmarking of segmentation algorithms, especially those that provide depth information which is critical for segmentation in occluded scenes. This paper proposes a new Event-based Segmentation Dataset (ESD), a high-quality 3D spatial and temporal dataset for object segmentation in an indoor cluttered environment. Our proposed dataset ESD comprises 145 sequences with 14,166 RGB frames that are manually annotated with instance masks. Overall 21.88 million and 20.80 million events from two event-based cameras in a stereo-graphic configuration are collected, respectively. To the best of our knowledge, this densely annotated and 3D spatial-temporal event-based segmentation benchmark of tabletop objects is the first of its kind. By releasing ESD, we expect to provide the community with a challenging segmentation benchmark with high quality.
Abstract（参考訳）: イベントベースのカメラを利用すると、動きのぼやけ、ダイナミックレンジの低さ、標準カメラの低時間サンプリングといった問題に対処できる。しかし、セグメンテーションアルゴリズムのベンチマークに特化したイベントベースのデータセットが不足している。本稿では,室内クラッタ環境におけるオブジェクトセグメンテーションのための高品質な3d空間および時間データセットであるイベントベースセグメンテーションデータセット(esd)を提案する。提案するデータセットESDは,145のシーケンスと14,166のRGBフレームから構成される。ステレオグラフィック構成の2つのイベントベースのカメラから、合計2188万と2080万のイベントがそれぞれ収集されている。我々の知る限りでは、この高密度で3次元の時空間事象に基づくテーブルトップオブジェクトのセグメンテーションベンチマークは、その種の最初のものである。 ESDをリリースすることによって、私たちはコミュニティに高品質なセグメンテーションベンチマークを提供することを期待しています。

関連論文リスト

MUVOD: A Novel Multi-view Video Object Segmentation Dataset and A Benchmark for 3D Segmentation [3.229267555477331]
MUVODは、再構成現実シナリオにおけるオブジェクトセグメンテーションのトレーニングと評価のための、新しいマルチビュービデオデータセットである。各シーンは最低9ビュー、最大46ビューを含む。 7830枚のRGB画像に対応するセグメンテーションマスクを4Dモーションで表示し、シーンへの関心の対象は、あるビューの時間的フレームや、同じカメラリグに属する異なるビューにまたがって追跡することができる。
論文参考訳（メタデータ） (2025-07-10T08:07:59Z)
Event-based Tiny Object Detection: A Benchmark Dataset and Baseline [37.60578568397082]
アンチUAVタスクにおける小さな物体検出(SOD)は、UAVの小さいサイズと複雑な背景のために難しい問題である。イベントカメラは、マイクロ秒の時間分解能と高いダイナミックレンジを持ち、より効果的なSODソリューションを提供する。既存のイベントベースのオブジェクト検出データセットは、スケールが制限され、大きなターゲットサイズが特徴であり、バックグラウンドの多様性が欠如しているため、SODベンチマークには適さない。本稿では,イベントベーススモールオブジェクト検出(EVSOD)データセット(EV-UAV)を紹介する。
論文参考訳（メタデータ） (2025-06-30T07:28:50Z)
3D-Aware Instance Segmentation and Tracking in Egocentric Videos [107.10661490652822]
エゴセントリックなビデオは、3Dシーンの理解にユニークな課題を提示する。本稿では,一対一のビデオにおけるインスタンスのセグメンテーションとトラッキングに対する新しいアプローチを提案する。空間的および時間的手がかりを取り入れることで、最先端の2D手法と比較して優れた性能が得られる。
論文参考訳（メタデータ） (2024-08-19T10:08:25Z)
Finding Meaning in Points: Weakly Supervised Semantic Segmentation for Event Cameras [45.063747874243276]
本稿では,イベントベースセマンティックセマンティックセグメンテーションのための新しい弱教師付きアプローチEV-WSSSを提案する。提案フレームワークは,(1)前向きのイベントデータと(2)逆向きのイベントデータとの間に非対称な二重学習を行う。提案手法は,画素レベルの高密度地下真実に頼らずとも,かなりのセグメンテーション結果が得られることを示す。
論文参考訳（メタデータ） (2024-07-15T20:00:50Z)
DailyDVS-200: A Comprehensive Benchmark Dataset for Event-Based Action Recognition [51.96660522869841]
DailyDVS-200は、イベントベースのアクション認識コミュニティに適したベンチマークデータセットである。実世界のシナリオで200のアクションカテゴリをカバーし、47人の参加者によって記録され、22,000以上のイベントシーケンスで構成されている。 DailyDVS-200には14の属性がアノテートされており、記録されたアクションの詳細なキャラクタリゼーションが保証されている。
論文参考訳（メタデータ） (2024-07-06T15:25:10Z)
PACE: A Large-Scale Dataset with Pose Annotations in Cluttered Environments [50.79058028754952]
PACE(Pose s in Cluttered Environments)は、散在シナリオにおけるポーズ推定手法の大規模ベンチマークである。ベンチマークは55Kフレームで構成され、300の動画に258Kのアノテーションがあり、43のカテゴリから238のオブジェクトをカバーしている。 PACE-Simには、931オブジェクトにわたる2.4Mアノテーションを備えた100Kのフォトリアリスティックシミュレートフレームが含まれている。
論文参考訳（メタデータ） (2023-12-23T01:38:41Z)
Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文参考訳（メタデータ） (2023-06-07T17:57:45Z)
SupeRGB-D: Zero-shot Instance Segmentation in Cluttered Indoor Environments [67.34330257205525]
本研究では,RGB-Dデータからゼロショットのインスタンスセグメンテーション(ZSIS)を探索し,意味的カテゴリに依存しない方法で未知のオブジェクトを識別する。本稿では,注釈付きオブジェクトを用いて画素のオブジェクト性」を学習し,乱雑な屋内環境における未知のオブジェクトカテゴリに一般化する手法を提案する。
論文参考訳（メタデータ） (2022-12-22T17:59:48Z)
EVIMO2: An Event Camera Dataset for Motion Segmentation, Optical Flow, Structure from Motion, and Visual Inertial Odometry in Indoor Scenes with Monocular or Stereo Algorithms [10.058432912712396]
データセットは640$times$480のイベントカメラから41分のデータと、2080$times$1552のクラシックカラーカメラで構成されている。データセットの173のシーケンスは3つのカテゴリに分けられる。いくつかのシーケンスは、従来のカメラが故障した低照度環境で記録された。
論文参考訳（メタデータ） (2022-05-06T20:09:18Z)
Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文参考訳（メタデータ） (2021-05-07T03:49:26Z)
Learning to Detect Objects with a 1 Megapixel Event Camera [14.949946376335305]
イベントカメラは、高時間精度、低データレート、高ダイナミックレンジで視覚情報を符号化する。フィールドの新規性のため、多くのビジョンタスクにおけるイベントベースのシステムの性能は、従来のフレームベースのソリューションに比べて依然として低い。
論文参考訳（メタデータ） (2020-09-28T16:03:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。