論文の概要: A Universal Railway Obstacle Detection System based on Semi-supervised Segmentation And Optical Flow
- arxiv url: http://arxiv.org/abs/2406.18908v1
- Date: Thu, 27 Jun 2024 05:48:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-28 15:06:48.880675
- Title: A Universal Railway Obstacle Detection System based on Semi-supervised Segmentation And Optical Flow
- Title(参考訳): 半教師付きセグメンテーション・オプティカルフローに基づくユニバーサル鉄道障害物検出システム
- Authors: Qiushi Guo,
- Abstract要約: 従来のオブジェクト検出手法ではなく,バイナリ分割問題としてタスクを再構築する。
データ不足を軽減するため,Segment Anything (SAM) とYOLOを用いて,高度にリアルな合成画像を生成する。
我々は、事前知識として光学フローを活用してモデルを効果的に訓練する。
- 参考スコア(独自算出の注目度): 1.450405446885067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting obstacles in railway scenarios is both crucial and challenging due to the wide range of obstacle categories and varying ambient conditions such as weather and light. Given the impossibility of encompassing all obstacle categories during the training stage, we address this out-of-distribution (OOD) issue with a semi-supervised segmentation approach guided by optical flow clues. We reformulate the task as a binary segmentation problem instead of the traditional object detection approach. To mitigate data shortages, we generate highly realistic synthetic images using Segment Anything (SAM) and YOLO, eliminating the need for manual annotation to produce abundant pixel-level annotations. Additionally, we leverage optical flow as prior knowledge to train the model effectively. Several experiments are conducted, demonstrating the feasibility and effectiveness of our approach.
- Abstract(参考訳): 鉄道シナリオにおける障害物の検出は、幅広い障害物カテゴリーと、気象や光など環境条件の異なるため、極めて重要かつ困難である。
トレーニング段階において,すべての障害カテゴリを包含することができないことを考慮し,光学的フロー手がかりによる半教師付きセグメンテーション手法を用いて,このアウト・オブ・ディストリビューション(OOD)問題に対処する。
従来のオブジェクト検出手法ではなく,バイナリ分割問題としてタスクを再構築する。
データ不足を軽減するため,Segment Anything (SAM) と YOLO を用いてリアルな合成画像を生成する。
さらに、事前知識として光学フローを活用してモデルを効果的に訓練する。
提案手法の有効性と有効性を示すいくつかの実験を行った。
関連論文リスト
- FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation [11.689335986823098]
異常セグメンテーション(英: Anomaly segmentation)は、予期せぬ事象を認識する必要がある安全クリティカルなアプリケーションにとって貴重なコンピュータビジョンタスクである。
現在の最先端の異常セグメンテーションアプローチは、トレーニング中に様々な不適切なクラスラベルに依存しており、ラベルなしおよび事前訓練された視覚エンコーダを活用する能力を制限する。
視覚基盤モデルを用いてリッチな特徴を抽出し,密度分布の学習に正規化フローネットワークを利用する,新たな自己教師型フレームワークであるFlowCLASを紹介する。
論文 参考訳(メタデータ) (2024-11-29T17:53:41Z) - The Impact of Semi-Supervised Learning on Line Segment Detection [11.636855122196323]
本稿では,半教師付きフレームワークを用いた画像中の線分検出手法を提案する。
完全教師付き手法に匹敵する結果を示す。
本手法は,半教師付き学習のための近代的最先端手法を用いて,まず線検出を目標とすることを目的としている。
論文 参考訳(メタデータ) (2024-11-07T10:28:11Z) - Generalizable Non-Line-of-Sight Imaging with Learnable Physical Priors [52.195637608631955]
非視線画像(NLOS)は、その潜在的な応用により注目されている。
既存のNLOS再構成アプローチは、経験的物理的前提に依存して制約される。
本稿では,Learningable Path Compensation(LPC)とAdaptive Phasor Field(APF)の2つの主要な設計を含む,学習に基づく新しいソリューションを提案する。
論文 参考訳(メタデータ) (2024-09-21T04:39:45Z) - Dense Monocular Motion Segmentation Using Optical Flow and Pseudo Depth Map: A Zero-Shot Approach [6.805017878728801]
トレーニングを必要とせずに高密度な動きセグメンテーションを実現するための革新的なハイブリッド手法を提案する。
本手法は,基礎モデルを用いて各フレームのオブジェクト提案を自動的に生成することにより開始する。
最先端のモノクル深度推定モデルから得られた深度マップの統合は、光学的流れによって提供される運動キューを著しく向上させる。
論文 参考訳(メタデータ) (2024-06-27T02:11:33Z) - Spatial-wise Dynamic Distillation for MLP-like Efficient Visual Fault
Detection of Freight Trains [11.13191969085042]
貨物列車の故障検出のための多層パーセプトロン(MLP)に基づく動的蒸留フレームワークを提案する。
学生モデルとのセマンティックな相違を効果的に解消する動的教師を提案する。
提案手法は現在の最先端検出器より優れており,より少ない計算コストでリアルタイム検出を行うことができる。
論文 参考訳(メタデータ) (2023-12-10T09:18:24Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Generalizing Event-Based Motion Deblurring in Real-World Scenarios [62.995994797897424]
イベントベースの動作遅延は、低レイテンシイベントを活用することで、有望な結果を示している。
本研究では,フレキシブルな入力空間スケールを実現するとともに,時間スケールの異なる動きのぼかしから学習できるスケール対応ネットワークを提案する。
次に,実世界のデータ分布に適合する2段階の自己教師型学習手法を開発した。
論文 参考訳(メタデータ) (2023-08-11T04:27:29Z) - Local and Global Information in Obstacle Detection on Railway Tracks [30.90745722512406]
鉄道画像から線路分割を学習するための浅層ネットワークの利用を提案する。
ネットワークの受容領域は、過信の予測を防ぐ。
本手法は, 人工的な障害物を有する鉄道画像を含むカスタムデータセット上で評価する。
論文 参考訳(メタデータ) (2023-07-28T11:07:34Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Optical Flow Estimation from a Single Motion-blurred Image [66.2061278123057]
画像内の動きのぼかしは、基本的なコンピュータビジョンの問題に実用的な関心を持つ可能性があります。
本研究では,単一動画像からの光流れをエンドツーエンドで推定する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T12:45:18Z) - Learning to See Through Obstructions [117.77024641706451]
本稿では,移動カメラで撮影した短い画像列から不要な障害物を除去するための学習に基づくアプローチを提案する。
本手法は背景要素と障害物要素の運動差を利用して両方の層を復元する。
合成データ転送のトレーニングは実画像に対して良好であることを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。