論文の概要: Real-Time Beach Litter Detection and Counting: A Comparative Analysis of RT-DETR Model Variants
- arxiv url: http://arxiv.org/abs/2508.13101v2
- Date: Thu, 21 Aug 2025 15:47:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:45.992254
- Title: Real-Time Beach Litter Detection and Counting: A Comparative Analysis of RT-DETR Model Variants
- Title(参考訳): リアルタイムビーチリッター検出とカウント:RT-DETRモデル変数の比較解析
- Authors: Miftahul Huda, Arsyiah Azahra, Putri Maulida Chairani, Dimas Rizky Ramadhani, Nabila Azhari, Ade Lailani,
- Abstract要約: 沿岸汚染は世界的な環境問題であり、監視と管理のためにスケーラブルで自動化されたソリューションを必要とする。
本研究では, リアルタイム検出変換器(RT-DETR)の海浜ゴミの自動検出・計数への応用について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coastal pollution is a pressing global environmental issue, necessitating scalable and automated solutions for monitoring and management. This study investigates the efficacy of the Real-Time Detection Transformer (RT-DETR), a state-of-the-art, end-to-end object detection model, for the automated detection and counting of beach litter. A rigorous comparative analysis is conducted between two model variants, RT-DETR-Large (RT-DETR-L) and RT-DETR-Extra-Large (RT-DETR-X), trained on a publicly available dataset of coastal debris. The evaluation reveals that the RT-DETR-X model achieves marginally superior accuracy, with a mean Average Precision at 50\% IoU (mAP@50) of 0.816 and a mAP@50-95 of 0.612, compared to the RT-DETR-L model's 0.810 and 0.606, respectively. However, this minor performance gain is realized at a significant computational cost; the RT-DETR-L model demonstrates a substantially faster inference time of 20.1 ms versus 34.5 ms for the RT-DETR-X. The findings suggest that the RT-DETR-L model offers a more practical and efficient solution for real-time, in-field deployment due to its superior balance of processing speed and detection accuracy. This research provides valuable insights into the application of advanced Transformer-based detectors for environmental conservation, highlighting the critical trade-offs between model complexity and operational viability.
- Abstract(参考訳): 沿岸汚染は世界的な環境問題であり、監視と管理のためにスケーラブルで自動化されたソリューションを必要とする。
本研究では,リアルタイム検出変換器(RT-DETR,Real-Time Detection Transformer,RT-DETR)の有効性について検討した。
RT-DETR-Rarge (RT-DETR-L) とRT-DETR-Extra-Large (RT-DETR-X) の2つのモデルで厳密な比較分析を行った。
RT-DETR-Xモデルの平均精度は0.816の50\% IoU(mAP@50)、0.612のmAP@50-95は0.810と0.606である。
RT-DETR-LモデルはRT-DETR-Xでは20.1msと34.5msと大幅に高速な推論時間を示す。
この結果から,RT-DETR-Lモデルは,処理速度と検出精度のバランスが優れているため,リアルタイム,フィールド内展開において,より実用的で効率的なソリューションを提供する可能性が示唆された。
本研究は, トランスフォーマーを用いた環境保全技術の適用に関する貴重な知見を提供し, モデル複雑性と運用可能性との間の重要なトレードオフを浮き彫りにした。
関連論文リスト
- Le-DETR: Revisiting Real-Time Detection Transformer with Efficient Encoder Design [72.55935017828891]
我々は Le-DETR (textbfLow- Cost and textbfEfficient textbfDEtection textbfTRansformer) を提案する。
ImageNet1KとCOCO 2017トレーニングデータセットのみを使用して、リアルタイム検出で新しいtextbfSOTAを実現する。
YOLOv12-L/X を textbf+0.6/-0.1 mAP で上回り、同様の速度と textbf+20% のスピードアップを実現している。
論文 参考訳(メタデータ) (2026-02-24T15:29:55Z) - LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - RT-DETRv4: Painlessly Furthering Real-Time Object Detection with Vision Foundation Models [48.91205564876609]
軽量物体検出器の高効率化を目的とした,コスト効率・高適合性蒸留フレームワークを提案する。
当社のアプローチは、さまざまなDETRベースのモデルに対して、目立って一貫したパフォーマンス向上を実現しています。
我々の新しいモデルファミリーRT-DETRv4はCOCOの最先端結果を達成し、APスコアは49.7/53.5/55.4/57.0で、対応する速度は273/169/124/78 FPSである。
論文 参考訳(メタデータ) (2025-10-29T08:13:17Z) - Enhancing Maritime Object Detection in Real-Time with RT-DETR and Data Augmentation [0.0]
リアルタイムオブジェクト検出は、ラベル付き実RGBデータのターゲットサイズと制限が小さいため、重要な課題に直面している。
本稿では,RT-DETRに基づくリアルタイム物体検出システムを提案する。
論文 参考訳(メタデータ) (2025-10-07T20:45:14Z) - YOLOatr : Deep Learning Based Automatic Target Detection and Localization in Thermal Infrared Imagery [0.0]
そこで我々は, YOLOatrと呼ばれるアンカー型単段検出器を改良し, 検出ヘッドを最適に修正し, 首の核融合, カスタム拡張プロファイルを提案する。
相関テストプロトコルと非相関テストプロトコルの両方を用いたリアルタイムATRのための総合的DSIAC MWIRデータセットの性能評価を行った。
論文 参考訳(メタデータ) (2025-07-15T12:41:01Z) - Object Detection for Medical Image Analysis: Insights from the RT-DETR Model [40.593685087097995]
本稿では,RT-DETRモデルに基づく複雑な画像データ解析のための新しい検出フレームワークの適用について述べる。
RT-DETRモデルはTransformerベースのアーキテクチャ上に構築され,高次元かつ複雑な視覚データ処理に優れ,堅牢性と精度が向上した。
論文 参考訳(メタデータ) (2025-01-27T20:02:53Z) - ResFlow: Fine-tuning Residual Optical Flow for Event-based High Temporal Resolution Motion Estimation [50.80115710105251]
イベントカメラは、高時間分解能(HTR)モーション推定に重要な可能性を秘めている。
イベントデータを用いてHTR光流を推定するための残差に基づくパラダイムを提案する。
論文 参考訳(メタデータ) (2024-12-12T09:35:47Z) - RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer [2.1186155813156926]
RT-DETRv2は以前の最先端のリアルタイム検出器RT-DETR上に構築されている。
柔軟性を向上させるために,異なるスケールの特徴に対して,異なる数のサンプリングポイントを設定することを提案する。
実用性を高めるため, Grid_sample演算子を置き換えるために,任意の離散サンプリング演算子を提案する。
論文 参考訳(メタデータ) (2024-07-24T10:20:19Z) - GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning [48.71952325015267]
PEFT法を改良型Retrieval-Enhanced Transformer (RETRO) およびベースラインGPTモデルに適用する。
本稿では、RETROモデルが、独自の事前学習プロセスにより、ゼロショット設定でGPTモデルより優れていることを示す。
本研究は, GPTモデルとRETROモデルの両方に適用された各種PEFT法をRAGと統合した最初の包括的比較である。
論文 参考訳(メタデータ) (2024-07-05T14:16:47Z) - DETRs Beat YOLOs on Real-time Object Detection [5.426236055184119]
YOLOシリーズは、速度と精度のトレードオフにより、リアルタイムオブジェクト検出の最も一般的なフレームワークとなっている。
近年、エンドツーエンドのTransformer-based detector (DETR) は、NMSを除去する代替手段を提供している。
本稿では,初のリアルタイム終端物体検出装置であるリアルタイム検出TRansformer(RT-DETR)を提案する。
論文 参考訳(メタデータ) (2023-04-17T08:30:02Z) - Q-DETR: An Efficient Low-Bit Quantized Detection Transformer [50.00784028552792]
Q-DETRのボトルネックは、我々の経験的分析によるクエリ情報の歪みから生じる。
情報ボトルネック(IB)の原理をQ-DETRの学習に一般化することで導出できる2レベル最適化問題としてDRDを定式化する。
本研究では,教師情報を蒸留所要の機能に効果的に転送し,条件情報エントロピーを最小化する,フォアグラウンド対応クエリマッチング手法を提案する。
論文 参考訳(メタデータ) (2023-04-01T08:05:14Z) - Recurrent Glimpse-based Decoder for Detection with Transformer [85.64521612986456]
本稿では,Recurrent Glimpse-based deoder (REGO)について紹介する。
特に、REGOは多段階のリカレント処理構造を用いて、DETRの注目が徐々に前景オブジェクトに焦点を合わせるのを助ける。
REGOは、異なるDETR検出器の性能を最大7%向上させる。
論文 参考訳(メタデータ) (2021-12-09T00:29:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。