論文の概要: Enhancing Egocentric Object Detection in Static Environments using Graph-based Spatial Anomaly Detection and Correction
- arxiv url: http://arxiv.org/abs/2508.07624v1
- Date: Mon, 11 Aug 2025 05:08:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.948346
- Title: Enhancing Egocentric Object Detection in Static Environments using Graph-based Spatial Anomaly Detection and Correction
- Title(参考訳): グラフに基づく空間異常検出と補正による静的環境における自己中心的物体検出の促進
- Authors: Vishakha Lall, Yisi Liu,
- Abstract要約: 本稿では,物体間の空間的関係を明示的にモデル化し,自己中心型フレームにおける異常検出を補正するグラフベースの後処理パイプラインを提案する。
手動でアノテートされたデータに基づいてトレーニングされたグラフニューラルネットワーク(GNN)を用いて、無効なオブジェクトクラスラベルを特定し、近隣のコンテキストに基づいて修正されたクラスラベルを予測する。
実験では、この空間推論を組み込むことで検出性能が大幅に向上し、mAP@50は最大4%向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In many real-world applications involving static environments, the spatial layout of objects remains consistent across instances. However, state-of-the-art object detection models often fail to leverage this spatial prior, resulting in inconsistent predictions, missed detections, or misclassifications, particularly in cluttered or occluded scenes. In this work, we propose a graph-based post-processing pipeline that explicitly models the spatial relationships between objects to correct detection anomalies in egocentric frames. Using a graph neural network (GNN) trained on manually annotated data, our model identifies invalid object class labels and predicts corrected class labels based on their neighbourhood context. We evaluate our approach both as a standalone anomaly detection and correction framework and as a post-processing module for standard object detectors such as YOLOv7 and RT-DETR. Experiments demonstrate that incorporating this spatial reasoning significantly improves detection performance, with mAP@50 gains of up to 4%. This method highlights the potential of leveraging the environment's spatial structure to improve reliability in object detection systems.
- Abstract(参考訳): 静的環境を含む現実世界の多くのアプリケーションでは、オブジェクトの空間的レイアウトはインスタンス間で一貫しています。
しかし、最先端のオブジェクト検出モデルは、しばしばこの空間的事前の活用に失敗し、不整合予測、発見の欠如、誤分類、特に散らばったシーンや閉ざされたシーンにおいてである。
本研究では,物体間の空間的関係を明示的にモデル化し,自己中心型フレームにおける異常検出を補正するグラフベースの後処理パイプラインを提案する。
手動でアノテートされたデータに基づいてトレーニングされたグラフニューラルネットワーク(GNN)を用いて、無効なオブジェクトクラスラベルを特定し、近隣のコンテキストに基づいて修正されたクラスラベルを予測する。
本手法は, YOLOv7 や RT-DETR などの標準オブジェクト検出のための処理後モジュールとして, スタンドアロンの異常検出・修正フレームワークとして評価する。
実験では、この空間推論を組み込むことで検出性能が大幅に向上し、mAP@50は最大4%向上した。
本手法は,物体検出システムの信頼性を向上させるため,環境空間構造を活用する可能性を強調する。
関連論文リスト
- Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Vision Foundation Model Embedding-Based Semantic Anomaly Detection [12.940376547110509]
この研究は、最先端のビジョン基盤モデルのセマンティックな先行性を活用することによって、意味的異常の検出を探索する。
本稿では,ランタイム画像からの局所的な視覚埋め込みと,自律システムの安全性と性能を考慮に入れた,名目上のシナリオのデータベースを比較するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-12T19:00:29Z) - View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis [0.0]
我々は、教師なし、画素ワイドな異常位置検出のタスクとして、シーン異常検出(Scene Anomaly Detection, Scene AD)を導入し、フォーマル化する。
ToyCityは,最初のマルチオブジェクト・マルチビューリアルタイム画像データセットである。
実験の結果,OmniADは拡張ビューで使用すると,逆蒸留よりも64.33%の画素幅(F_1)のスコアが増大することがわかった。
論文 参考訳(メタデータ) (2024-06-26T01:54:10Z) - Geo-Localization Based on Dynamically Weighted Factor-Graph [74.75763142610717]
特徴に基づくジオローカライゼーションは、航空画像から抽出された特徴と車両のセンサーによって検出された特徴とを関連付けることに依存する。
これにより、ランドマークの種類は両方のソースから観測できなければならない。
車両軌道推定のための動的重み付き因子グラフモデルを提案する。
論文 参考訳(メタデータ) (2023-11-13T12:44:14Z) - Object recognition in atmospheric turbulence scenes [2.657505380055164]
乱流環境におけるオブジェクトの型を検知・分類するための歪み特徴を学習する新しいフレームワークを提案する。
具体的には、変形可能な畳み込みを利用して空間変位を処理する。
提案手法は平均精度(mAP)が30%を超えるベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-25T20:21:25Z) - Robust Change Detection Based on Neural Descriptor Fields [53.111397800478294]
我々は、部分的に重なり合う観測結果とノイズのある局所化結果に頑健なオブジェクトレベルのオンライン変化検出手法を開発した。
形状符号の類似性を利用して物体を連想させ, 局所的な物体近傍の空間配置を比較することにより, 観測重複や局所雑音に対する頑健性を示す。
論文 参考訳(メタデータ) (2022-08-01T17:45:36Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Learning-based Localizability Estimation for Robust LiDAR Localization [13.298113481670038]
LiDARベースのローカライゼーションとマッピングは、多くの現代のロボットシステムにおける中核的なコンポーネントの1つである。
本研究では,ロボット動作中の(非)局所性を検出するニューラルネットワークに基づく推定手法を提案する。
論文 参考訳(メタデータ) (2022-03-11T01:12:00Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。