論文の概要: Control Distance IoU and Control Distance IoU Loss Function for Better
Bounding Box Regression
- arxiv url: http://arxiv.org/abs/2103.11696v1
- Date: Mon, 22 Mar 2021 09:57:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 03:11:41.517093
- Title: Control Distance IoU and Control Distance IoU Loss Function for Better
Bounding Box Regression
- Title(参考訳): より良いバウンディングボックス回帰のための制御距離IoUと制御距離IoU損失関数
- Authors: Dong Chen and Duoqian Miao
- Abstract要約: まず,評価システムとフィードバック機構から構成される評価フィードバックモジュールを提案する。
最後に、評価システムとフィードバック機構の両方に焦点を当て、制御距離IoUと制御距離IoU損失関数を提案します。
- 参考スコア(独自算出の注目度): 11.916482804759479
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Numerous improvements for feedback mechanisms have contributed to the great
progress in object detection. In this paper, we first present an
evaluation-feedback module, which is proposed to consist of evaluation system
and feedback mechanism. Then we analyze and summarize the disadvantages and
improvements of traditional evaluation-feedback module. Finally, we focus on
both the evaluation system and the feedback mechanism, and propose Control
Distance IoU and Control Distance IoU loss function (or CDIoU and CDIoU loss
for short) without increasing parameters or FLOPs in models, which show
different significant enhancements on several classical and emerging models.
Some experiments and comparative tests show that coordinated
evaluation-feedback module can effectively improve model performance. CDIoU and
CDIoU loss have different excellent performances in several models such as
Faster R-CNN, YOLOv4, RetinaNet and ATSS. There is a maximum AP improvement of
1.9% and an average AP of 0.8% improvement on MS COCO dataset, compared to
traditional evaluation-feedback modules.
- Abstract(参考訳): フィードバック機構の多くの改善がオブジェクト検出の大きな進歩に寄与している。
本稿ではまず,評価システムとフィードバック機構から構成される評価フィードバックモジュールを提案する。
次に、従来の評価フィードバックモジュールの欠点と改善を分析し、要約する。
最後に,評価システムとフィードバック機構の両方に注目し,モデルにおけるパラメータやフラップを増加させることなく,制御距離iouと制御距離iou損失関数(略してcdiouとcdiou損失)を提案する。
いくつかの実験と比較試験により、協調評価フィードバックモジュールはモデル性能を効果的に改善できることが示された。
CDIoUとCDIoUの損失は、Faster R-CNN、YOLOv4、RetinaNet、ATSSなどいくつかのモデルで異なる優れた性能を持つ。
ms cocoデータセットでは、従来の評価-フィードバックモジュールと比較して最大apが1.9%、平均apが0.8%改善されている。
関連論文リスト
- VLFeedback: A Large-Scale AI Feedback Dataset for Large Vision-Language Models Alignment [55.7956150385255]
本稿では,視覚言語モデルの整合性向上のためのAIフィードバックの有効性について検討する。
最初の大規模視覚言語フィードバックデータセットであるVLFeedbackを紹介する。
我々は、VLFeedback上で直接選好最適化によって微調整されたLVLMであるSilkieを訓練する。
論文 参考訳(メタデータ) (2024-10-12T07:56:47Z) - Improved Unet brain tumor image segmentation based on GSConv module and ECA attention mechanism [0.0]
U-Netアーキテクチャに基づく深層学習アルゴリズムである脳腫瘍に対する医用画像分割法の改良モデルについて述べる。
従来のU-Netに基づいて,医療画像分割作業におけるモデルの性能向上を目的としたGSConvモジュールとECAアテンション機構を導入する。
論文 参考訳(メタデータ) (2024-09-20T16:35:19Z) - Improved Unet model for brain tumor image segmentation based on ASPP-coordinate attention mechanism [9.496880456126709]
脳腫瘍画像分割のための改良されたUnetモデルを提案する。
座標注意機構とASPPモジュールを組み合わせてセグメンテーション効果を改善する。
従来のUnetと比較して、拡張モデルはセグメンテーションとエッジ精度が優れている。
論文 参考訳(メタデータ) (2024-09-13T07:08:48Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Unified-IoU: For High-Quality Object Detection [1.62877896907106]
そこで我々は,異なる品質予測ボックス間の重み付けをより重視する,Unified-IoU (UIoU) と呼ばれる新しいIoU損失関数を提案する。
提案手法は,複数のデータセット,特にIoU閾値が高い場合において,より優れた性能を実現する。
論文 参考訳(メタデータ) (2024-08-13T04:56:45Z) - Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.88747330066049]
きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。
粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。
きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文 参考訳(メタデータ) (2024-06-24T17:19:34Z) - YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。
非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。
YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文 参考訳(メタデータ) (2024-05-23T11:44:29Z) - Autonomous Evaluation and Refinement of Digital Agents [57.12281122337407]
ドメイン汎用自動評価器は,Webナビゲーションやデバイス制御のためのエージェントの性能を大幅に向上させることができることを示す。
我々は、これらのモデルの性能をいくつかの一般的なデジタルエージェントのベンチマークで検証し、オラクル評価指標との74.4から92.9%の一致を見出した。
論文 参考訳(メタデータ) (2024-04-09T17:25:47Z) - Reinforcement Learning from Delayed Observations via World Models [10.298219828693489]
強化学習環境では、エージェントはそれらを取るとすぐに行動の効果についてのフィードバックを受ける。
実際には、この仮定は物理的制約のために当てはまらない可能性があり、学習アルゴリズムの性能に大きな影響を及ぼす可能性がある。
本稿では、過去の観測と学習のダイナミクスを統合することに成功している世界モデルを活用して、観測遅延を処理することを提案する。
論文 参考訳(メタデータ) (2024-03-18T23:18:27Z) - Systematic Architectural Design of Scale Transformed Attention Condenser
DNNs via Multi-Scale Class Representational Response Similarity Analysis [93.0013343535411]
マルチスケールクラス表現応答類似性分析(ClassRepSim)と呼ばれる新しいタイプの分析法を提案する。
ResNetスタイルのアーキテクチャにSTACモジュールを追加すると、最大1.6%の精度が向上することを示す。
ClassRepSim分析の結果は、STACモジュールの効果的なパラメータ化を選択するために利用することができ、競争性能が向上する。
論文 参考訳(メタデータ) (2023-06-16T18:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。