論文の概要: Benchmarking ResNet Backbones in RT-DETR: Impact of Depth and Regularization under environmental conditions
- arxiv url: http://arxiv.org/abs/2605.08136v1
- Date: Fri, 01 May 2026 20:57:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.735179
- Title: Benchmarking ResNet Backbones in RT-DETR: Impact of Depth and Regularization under environmental conditions
- Title(参考訳): RT-DETRにおけるResNetバックボーンのベンチマーク:環境条件下における深さと正規化の影響
- Authors: Pamela Barboza, Víctor Castelli, Belén Pereira, Ricardo Grando, Bruna de Vargas, Augusto Calfani,
- Abstract要約: 本研究は,競争ロボティクスに関連する環境条件下でのラウンドオブジェクト検出のためのRT-DETRの比較評価を行った。
4つのResNetバックボーンをドロップアウトレートで比較し、信頼性と精度への影響を分析した。
その結果、最適アーキテクチャは環境変動の種類に依存し、中間深度モデルは性能と効率の最良のバランスを提供することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual perception plays a central role in competitive robotics, where environmental variations can directly affect real-time detection performance. The related literature on transformer-based detectors lack information regarding the impact of backbone scale and environmental settings on model performance. This work presents a comparative evaluation of RT-DETR for detecting round objects under environmental and hyperparameter variations relevant to competitive robotics. Four ResNet backbones (ResNet18, ResNet34, ResNet50, and ResNet101) were compared using dropout rates, analyzing their effect on confidence and accuracy. All models were trained under the same configuration and evaluated under changes in lighting and background contrast. Environmental conditions primarily impact prediction confidence, while inference latency remains largely unaffected and classification accuracy stays consistently high, approaching or above 1.00 in most cases. Two distinct behaviors were observed. Under illumination variation, ResNet50 achieves the best trade-off, combining near-perfect accuracy, confidence values up to approximately 0.869 and latency around 0.058-0.059 ms. Under background variation, ResNet34 provides the most balanced performance, reaching near-perfect accuracy and higher confidence values up to approximately 0.887. These results indicate that the optimal architecture depends on the type of environmental variation, with intermediate-depth models offering the best balance between performance and efficiency.
- Abstract(参考訳): 視覚知覚は、環境変動がリアルタイム検出性能に直接影響を与える、競争力のあるロボティクスにおいて中心的な役割を果たす。
トランスをベースとした検出器に関する関連する文献は、バックボーンスケールと環境設定がモデル性能に与える影響に関する情報を欠いている。
本研究は, 環境・ハイパーパラメータ変動下でのラウンドオブジェクト検出のためのRT-DETRの比較評価を行った。
4つのResNetバックボーン(ResNet18、ResNet34、ResNet50、ResNet101)をドロップアウトレートで比較し、信頼性と精度への影響を分析した。
全てのモデルは同じ構成で訓練され、照明と背景コントラストの変化で評価された。
環境条件は主として予測の信頼性に影響を与えるが、推論遅延は影響を受けないままであり、分類精度は、ほとんどの場合1.00以上である。
2つの異なる行動が観察された。
照度変化の下では、ResNet50は、ほぼ完全な精度、信頼性値が約0.869、レイテンシが約0.058-0.059msの最良のトレードオフを実現している。
これらの結果から, 最適アーキテクチャは環境変動の種類に依存し, 性能と効率の最適なバランスを提供する中間深度モデルであることが示唆された。
関連論文リスト
- TornadoNet: Real-Time Building Damage Detection with Ordinal Supervision [1.5908682346602052]
TornadoNetは、道路レベルの建物の自動損傷評価のベンチマークである。
現実的な災害後の状況下で、現代のリアルタイムオブジェクト検出アーキテクチャと常用監視戦略がどのように機能するかを評価する。
論文 参考訳(メタデータ) (2026-03-12T05:22:55Z) - AgentNoiseBench: Benchmarking Robustness of Tool-Using LLM Agents Under Noisy Condition [72.24180896265192]
本稿では,騒音環境下でのエージェントモデルのロバスト性を評価するためのフレームワークであるAgentNoiseBenchを紹介する。
まず、実世界のシナリオにおけるバイアスと不確実性の詳細な分析を行う。
次に,環境騒音をユーザノイズとツールノイズの2つの主要なタイプに分類する。
この分析に基づいて,既存のエージェント中心ベンチマークに制御可能なノイズを注入する自動パイプラインを開発した。
論文 参考訳(メタデータ) (2026-02-11T20:33:10Z) - Real-Time Beach Litter Detection and Counting: A Comparative Analysis of RT-DETR Model Variants [0.0]
沿岸汚染は世界的な環境問題であり、監視と管理のためにスケーラブルで自動化されたソリューションを必要とする。
本研究では, リアルタイム検出変換器(RT-DETR)の海浜ゴミの自動検出・計数への応用について検討した。
論文 参考訳(メタデータ) (2025-08-18T17:10:04Z) - Grasp-HGN: Grasping the Unexpected [1.2174549154334797]
現在の把握モデルは、目に見えないオブジェクトに対して性能が悪く、ユーザの独立性と生活の質に悪影響を及ぼす。
本研究では,Grasp視覚言語モデルであるGrasp-LLaVAを提案する。
最後に,エッジを高速に把握できるエッジクラウドデプロイメントインフラストラクチャであるHybrid Grasp Network(HGN)を提案する。
論文 参考訳(メタデータ) (2025-08-11T05:58:28Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - From Sound Representation to Model Robustness [82.21746840893658]
本研究では, 環境音の標準的な表現(スペクトログラム)が, 被害者の残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
3つの環境音響データセットの様々な実験から、ResNet-18モデルは、他のディープラーニングアーキテクチャよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-27T17:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。