論文の概要: Prompt-Driven Lightweight Foundation Model for Instance Segmentation-Based Fault Detection in Freight Trains
- arxiv url: http://arxiv.org/abs/2603.12624v1
- Date: Fri, 13 Mar 2026 03:56:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:11.886983
- Title: Prompt-Driven Lightweight Foundation Model for Instance Segmentation-Based Fault Detection in Freight Trains
- Title(参考訳): 貨物列車のインスタンスセグメンテーションに基づく故障検出のためのプロンプト駆動軽量ファンデーションモデル
- Authors: Guodong Sun, Qihang Liang, Xingyu Pan, Moyun Liu, Yang Zhang,
- Abstract要約: 本稿では,貨物列車の故障検出に適した軽量なインスタンスセグメント化フレームワークを提案する。
本手法は,タスク固有のプロンプトを自動生成する自己プロンプト生成モジュールを導入することで,セグメンテーションモデルを活用する。
さらに、Tiny Vision Transformerのバックボーンを採用して計算コストを削減し、鉄道監視システムにおけるエッジデバイスへのリアルタイム展開に適したフレームワークを実現する。
- 参考スコア(独自算出の注目度): 6.6492664858930475
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate visual fault detection in freight trains remains a critical challenge for intelligent transportation system maintenance, due to complex operational environments, structurally repetitive components, and frequent occlusions or contaminations in safety-critical regions. Conventional instance segmentation methods based on convolutional neural networks and Transformers often suffer from poor generalization and limited boundary accuracy under such conditions. To address these challenges, we propose a lightweight self-prompted instance segmentation framework tailored for freight train fault detection. Our method leverages the Segment Anything Model by introducing a self-prompt generation module that automatically produces task-specific prompts, enabling effective knowledge transfer from foundation models to domain-specific inspection tasks. In addition, we adopt a Tiny Vision Transformer backbone to reduce computational cost, making the framework suitable for real-time deployment on edge devices in railway monitoring systems. We construct a domain-specific dataset collected from real-world freight inspection stations and conduct extensive evaluations. Experimental results show that our method achieves 74.6 $AP^{\text{box}}$ and 74.2 $AP^{\text{mask}}$ on the dataset, outperforming existing state-of-the-art methods in both accuracy and robustness while maintaining low computational overhead. This work offers a deployable and efficient vision solution for automated freight train inspection, demonstrating the potential of foundation model adaptation in industrial-scale fault diagnosis scenarios. Project page: https://github.com/MVME-HBUT/SAM_FTI-FDet.git
- Abstract(参考訳): 貨物列車の正確な視覚的故障検出は、複雑な運用環境、構造的に反復的なコンポーネント、安全クリティカルな地域での頻繁な閉塞や汚染のために、インテリジェントな輸送システムの保守にとって重要な課題である。
畳み込みニューラルネットワークとトランスフォーマーに基づく従来型のインスタンス分割法は、そのような条件下での一般化や限界精度の低下に悩まされることが多い。
これらの課題に対処するために,貨物列車の故障検出に適した軽量な自己プロンプト型インスタンスセグメンテーションフレームワークを提案する。
本手法は,タスク固有のプロンプトを自動生成する自己プロンプト生成モジュールを導入し,基礎モデルからドメイン固有のインスペクションタスクへの効果的な知識伝達を可能にする。
さらに、Tiny Vision Transformerのバックボーンを採用して計算コストを削減し、鉄道監視システムにおけるエッジデバイスへのリアルタイム展開に適したフレームワークを実現する。
実世界の貨物検査所から収集したドメイン固有データセットを構築し,広範囲な評価を行った。
実験結果から,本手法はデータセット上で74.6 $AP^{\text{box}}$および74.2 $AP^{\text{mask}}$を達成し,計算オーバーヘッドを低く保ちながら,既存の最先端の手法よりも精度と堅牢性が高いことがわかった。
この研究は、自動貨物列車検査のための展開可能で効率的なビジョンソリューションを提供し、産業規模の故障診断シナリオにおける基礎モデル適用の可能性を示す。
プロジェクトページ:https://github.com/MVME-HBUT/SAM_FTI-FDet.git
関連論文リスト
- Axle Sensor Fusion for Online Continual Wheel Fault Detection in Wayside Railway Monitoring [1.1199585259018456]
本研究は,鉄道断層診断のためのセマンティック・アウェア,ラベル効率のよい連続学習フレームワークを提案する。
このモデルは、フラットやポリゴン化による小さな欠陥を検出しながら、進化する運用条件に適応する。
論文 参考訳(メタデータ) (2026-02-18T00:14:18Z) - Edge-Optimized Vision-Language Models for Underground Infrastructure Assessment [1.5124107808802705]
本稿では,地下欠陥のエンドツーエンド要約のための新しい2段階パイプラインを提案する。
私たちの軽量なRAPID-SCANセグメンテーションモデルと、エッジコンピューティングプラットフォームにデプロイされた微調整されたビジョンランゲージモデルを組み合わせています。
この結果から,自動欠陥検出とインフラストラクチャ保守のための実用的な洞察とのギャップを埋めるために,エッジデプロイ可能な統合AIシステムの可能性が示唆された。
論文 参考訳(メタデータ) (2026-02-03T17:03:46Z) - Learning local and global prototypes with optimal transport for unsupervised anomaly detection and localization [0.28647133890966986]
教師なし異常検出は、トレーニング中に正常なデータ、すなわち欠陥のない一連のデータにアクセスすることで、サンプルの欠陥部分を検出することを目的としている。
本稿では,プロトタイプ学習に基づく新しいUAD手法を提案する。
論文 参考訳(メタデータ) (2025-08-18T13:51:36Z) - SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - Reshaping the Online Data Buffering and Organizing Mechanism for Continual Test-Time Adaptation [49.53202761595912]
継続的なテスト時間適応は、訓練済みのソースモデルを適用して、教師なしのターゲットドメインを継続的に変更する。
我々は、オンライン環境、教師なしの自然、エラー蓄積や破滅的な忘れのリスクなど、このタスクの課題を分析する。
教師なしシングルパスデータストリームから重要サンプルを高い確実性で識別・集約する不確実性を考慮したバッファリング手法を提案する。
論文 参考訳(メタデータ) (2024-07-12T15:48:40Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z) - A Lightweight NMS-free Framework for Real-time Visual Fault Detection
System of Freight Trains [11.195801283133994]
貨物列車のリアルタイム視覚に基づく故障検出システム(RVBS-FD)は、鉄道交通の安全確保に不可欠である。
既存の視覚ベースの手法の多くは、畳み込みニューラルネットワークに基づく計算コストが高い。
リアルタイム検出と高精度を同時に実現する軽量NMSフリーフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-25T03:07:48Z) - Automatic Detection of Rail Components via A Deep Convolutional
Transformer Network [7.557470133155959]
レール,クリップ,ボルトを含む多種鉄道部品を検出するための深層畳み込み変圧器ネットワーク方式を提案する。
提案手法は,アンカーボックス,アスペクト比,デフォルト座標,後処理などの事前設定を不要にすることで,検出パイプラインを単純化する。
総合的な計算結果から,提案手法は既存の最先端手法よりも大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2021-08-05T07:38:04Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。