Fugu-MT 論文翻訳(概要): DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors

論文の概要: DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors

arxiv url: http://arxiv.org/abs/2311.17098v3
Date: Thu, 14 Mar 2024 13:22:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-16 02:02:44.527477
Title: DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors
Title（参考訳）: DyRA:既存の検出器のためのポータブル動的分解能調整ネットワーク
Authors: Daeun Seo, Hoeseok Yang, Hyungshin Kim,
Abstract要約: 本稿では,既存の検出器に画像特異的なスケールファクタを提供する動的解像度調整ネットワークDyRAを紹介する。ロス関数は、スケールのための異なるサイズのオブジェクトの異なる目的に対する精度低下を最小限に抑えるために考案された。
参考スコア（独自算出の注目度）: 0.669087470775851
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Achieving constant accuracy in object detection is challenging due to the inherent variability of object sizes. One effective approach to this problem involves optimizing input resolution, referred to as a multi-resolution strategy. Previous approaches to resolution optimization have often been based on pre-defined resolutions with manual selection. However, there is a lack of study on run-time resolution optimization for existing architectures. This paper introduces DyRA, a dynamic resolution adjustment network providing an image-specific scale factor for existing detectors. This network is co-trained with detectors utilizing specially designed loss functions, namely ParetoScaleLoss and BalanceLoss. ParetoScaleLoss determines an adaptive scale factor for robustness, while BalanceLoss optimizes overall scale factors according to the localization performance of the detector. The loss function is devised to minimize the accuracy drop across contrasting objectives of different-sized objects for scaling. Our proposed network can improve accuracy across various models, including RetinaNet, Faster-RCNN, FCOS, DINO, and H-Deformable-DETR. The code is available at https://github.com/DaEunFullGrace/DyRA.git.
Abstract（参考訳）: 物体検出における一定の精度を達成することは、物体の大きさの固有の変動性のために困難である。この問題に対する効果的なアプローチの1つは、マルチレゾリューション戦略と呼ばれる入力分解能の最適化である。従来の解決最適化のアプローチは、しばしば手動選択による事前定義された解決に基づいている。しかし、既存のアーキテクチャのランタイム解像度最適化に関する研究は不十分である。本稿では,既存の検出器に画像特異的なスケールファクタを提供する動的解像度調整ネットワークDyRAを紹介する。このネットワークは、パレートスケールロス(ParetoScaleLoss)とバランスロス( BalanceLoss)と呼ばれる特別な設計の損失関数を利用する検出器と共同で訓練されている。 ParetoScaleLossはロバストネスの適応スケールファクタを決定するが、Ba balanceLossは検出器のローカライゼーション性能に応じて全体的なスケールファクタを最適化する。損失関数は、スケールのための異なるサイズのオブジェクトの対照的な目的に対する精度低下を最小限に抑えるために考案された。提案するネットワークは,RetinaNet, Faster-RCNN, FCOS, DINO, H-Deformable-DETRなど,様々なモデルの精度を向上させることができる。コードはhttps://github.com/DaEunFullGrace/DyRA.gitで入手できる。

関連論文リスト

RARE-UNet: Resolution-Aligned Routing Entry for Adaptive Medical Image Segmentation [0.0]
本稿では,入力の空間分解能にその推論経路を適応させる,分解能を考慮したマルチスケールセグメンテーションアーキテクチャを提案する。 RARE-UNetは、海馬と腫瘍のセグメンテーションのための2つのベンチマーク脳イメージングタスクでテストされている。本モデルでは,高精細度における平均Diceスコアが0.84と0.65であり,一貫した性能を維持しつつ,低精細度での推論時間を著しく短縮する。
論文参考訳（メタデータ） (2025-07-21T11:49:20Z)
DPNet: Dynamic Pooling Network for Tiny Object Detection [12.331699924062196]
画像の縮小は、特に小さなオブジェクトにおいて、検出精度を改善するための一般的な戦略である。本稿では,これらの問題を緩和する小型物体検出のための動的プールネットワーク(DPNet)を提案する。 TinyCOCOとTinyPersonのデータセットの実験では、DPNetはそれぞれ35%と25%のGFLOPを節約できる。
論文参考訳（メタデータ） (2025-05-05T17:13:35Z)
RE-POSE: Synergizing Reinforcement Learning-Based Partitioning and Offloading for Edge Object Detection [3.2805151494259563]
エッジデバイス上でのリアルタイムオブジェクト検出は、その限られた計算リソースと、ディープニューラルネットワーク(DNN)ベースの検出モデルの高要求により、大きな課題を呈している。本稿では,リソース制約のあるエッジ環境における精度-遅延トレードオフを最適化するフレームワークであるRE-POSEを紹介する。
論文参考訳（メタデータ） (2025-01-16T10:56:45Z)
Elastic-DETR: Making Image Resolution Learnable with Content-Specific Network Prediction [0.612477318852572]
我々は,複数の画像解像度の弾性利用を可能にする,Elastic-DETRと呼ばれる学習可能な解像度のための新しい戦略を導入する。我々のネットワークは、コンパクトなスケール予測モジュールを用いて、画像の内容に基づいて適応的なスケールファクタを提供する。解像度の柔軟性を活用することで、精度と計算複雑性のトレードオフを様々に示す様々なモデルを実演することができる。
論文参考訳（メタデータ） (2024-12-09T09:46:21Z)
Adaptive Resolution Residual Networks -- Generalizing Across Resolutions Easily and Efficiently [7.087237546722617]
適応分解能残留ネットワーク(ARRN)について紹介する。 ARRNは適応分解能法と固定分解能法の利点を継承する。我々はARRNが、柔軟性、堅牢性、計算効率を向上した多様な解像度によって引き起こされる課題を受け入れていることを示す。
論文参考訳（メタデータ） (2024-12-09T04:25:37Z)
Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-29T19:02:54Z)
Scale-Invariant Object Detection by Adaptive Convolution with Unified Global-Local Context [3.061662434597098]
本稿では,効率的なDetモデルに基づくSAC-Net(Switchable Atrous Convolutional Network)を用いたオブジェクト検出モデルを提案する。提案したSAC-Netは,マルチスケールオブジェクト検出タスクの性能向上を実現するために,低レベル機能と高レベル機能の両方の利点をカプセル化している。ベンチマークデータセットを用いた実験により,提案したSAC-Netは,精度の点で最先端モデルよりも優れた性能を示した。
論文参考訳（メタデータ） (2024-09-17T10:08:37Z)
Depth Estimation using Weighted-loss and Transfer Learning [2.428301619698667]
転送学習と最適化された損失関数を用いた深度推定精度の向上のための簡易かつ適応的なアプローチを提案する。本研究では,移動学習と最適損失関数を用いた深度推定精度向上のための簡易かつ適応的な手法を提案する。 EfficientNetが最も成功したアーキテクチャである。
論文参考訳（メタデータ） (2024-04-11T12:25:54Z)
Global Context Aggregation Network for Lightweight Saliency Detection of Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。 3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文参考訳（メタデータ） (2023-09-22T06:19:11Z)
Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。 LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文参考訳（メタデータ） (2022-09-26T22:22:30Z)
Exploring Resolution and Degradation Clues as Self-supervised Signal for Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文参考訳（メタデータ） (2022-08-05T09:36:13Z)
Pyramid Grafting Network for One-Stage High Resolution Saliency Detection [29.013012579688347]
我々は、異なる解像度画像から特徴を独立して抽出する、Praamid Grafting Network (PGNet) と呼ばれるワンステージフレームワークを提案する。 CNNブランチが壊れた詳細情報をよりホモロジーに組み合わせられるように、アテンションベースのクロスモデルグラフティングモジュール (CMGM) が提案されている。我々は,4K-8K解像度で5,920個の画像を含む超高分解能塩度検出データセットUHRSDを新たに提供した。
論文参考訳（メタデータ） (2022-04-11T12:22:21Z)
You Better Look Twice: a new perspective for designing accurate detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文参考訳（メタデータ） (2021-07-21T12:39:51Z)
Dynamic Resolution Network [40.64164953983429]
現代のCNNの入力解像度の冗長性については、完全には研究されていない。本稿では,各サンプルに基づいて動的に分解能を決定できる新しい動的分解能ネットワーク(DRNet)を提案する。 DRNetは34%の精度で同様の性能を実現しているが、ImageNetのResNet-50に比べて10%の精度で1.4%の精度向上を実現している。
論文参考訳（メタデータ） (2021-06-05T13:48:33Z)
Resolution Switchable Networks for Runtime Efficient Image Recognition [46.09537029831355]
本稿では,推論時に画像解像度を切り替えることのできる,単一の畳み込みニューラルネットワークを訓練する一般的な手法を提案する。提案手法でトレーニングしたネットワークは、Resolvation Switchable Networks (RS-Nets) と呼ばれる。
論文参考訳（メタデータ） (2020-07-19T02:12:59Z)
Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。 RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文参考訳（メタデータ） (2020-03-16T16:54:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。