論文の概要: DiffusionDet: Diffusion Model for Object Detection
- arxiv url: http://arxiv.org/abs/2211.09788v1
- Date: Thu, 17 Nov 2022 18:56:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 16:36:53.080848
- Title: DiffusionDet: Diffusion Model for Object Detection
- Title(参考訳): DiffusionDet:オブジェクト検出のための拡散モデル
- Authors: Shoufa Chen, Peize Sun, Yibing Song, Ping Luo
- Abstract要約: DiffusionDetは、オブジェクト検出をノイズボックスからオブジェクトボックスへの遅延拡散プロセスとして定式化する新しいフレームワークである。
トレーニング段階では、オブジェクトボックスは接地木箱からランダムな分布へと拡散し、モデルはこのノイズ発生過程を逆転することを学ぶ。
推論において、モデルはランダムに生成されたボックスの集合をプログレッシブな方法で出力に洗練する。
- 参考スコア(独自算出の注目度): 39.656656094277515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose DiffusionDet, a new framework that formulates object detection as
a denoising diffusion process from noisy boxes to object boxes. During training
stage, object boxes diffuse from ground-truth boxes to random distribution, and
the model learns to reverse this noising process. In inference, the model
refines a set of randomly generated boxes to the output results in a
progressive way. The extensive evaluations on the standard benchmarks,
including MS-COCO and LVIS, show that DiffusionDet achieves favorable
performance compared to previous well-established detectors. Our work brings
two important findings in object detection. First, random boxes, although
drastically different from pre-defined anchors or learned queries, are also
effective object candidates. Second, object detection, one of the
representative perception tasks, can be solved by a generative way. Our code is
available at https://github.com/ShoufaChen/DiffusionDet.
- Abstract(参考訳): ノイズボックスからオブジェクトボックスへの拡散プロセスとしてオブジェクト検出を定式化する新しいフレームワークであるDiffusionDetを提案する。
トレーニングステージでは、オブジェクトボックスが接地箱からランダムな分布に拡散し、モデルがこのノイズ処理を逆転することを学習する。
推論において、モデルはランダムに生成されたボックスの集合をプログレッシブな方法で出力に洗練する。
MS-COCO や LVIS など標準ベンチマークの広範な評価は、DiffusionDet が従来確立されていた検出器と比較して良好な性能を発揮することを示している。
我々の研究は2つの重要な発見をもたらす。
まず、ランダムボックスは、事前定義されたアンカーや学習クエリとは大きく異なるが、効果的なオブジェクト候補でもある。
第二に、代表的な知覚課題の一つである物体検出は、生成的な方法で解決できる。
私たちのコードはhttps://github.com/shoufachen/diffusiondetで入手できます。
関連論文リスト
- Diffusion Rejection Sampling [13.945372555871414]
Diffusion Rejection Sampling (DiffRS) は、サンプリングされたトランジションカーネルを各タイムステップで真のカーネルと整列するリジェクションサンプリングスキームである。
提案手法は, 各中間段階における試料の品質を評価し, 試料に応じて異なる作業で精製する機構とみなすことができる。
実験により,ベンチマークデータセット上でのDiffRSの最先端性能と高速拡散サンプリングおよび大規模テキスト・画像拡散モデルに対するDiffRSの有効性を実証した。
論文 参考訳(メタデータ) (2024-05-28T07:00:28Z) - Consistent Diffusion Meets Tweedie: Training Exact Ambient Diffusion Models with Noisy Data [74.2507346810066]
アンビエント拡散(アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散
本稿では,ノイズの多い学習データのみを考慮し,故障のない分布から確実にサンプルを採取する拡散モデルのトレーニングのための最初のフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-20T14:22:12Z) - Diffusion-SS3D: Diffusion Model for Semi-supervised 3D Object Detection [77.23918785277404]
半教師付き3次元物体検出のための拡散モデルを用いて,擬似ラベルの品質向上に向けた新たな視点であるDiffusion-SS3Dを提案する。
具体的には、劣化した3Dオブジェクトサイズとクラスラベル、分布を生成し、拡散モデルをデノナイズプロセスとして利用し、バウンディングボックス出力を得る。
我々は,ScanNetとSUN RGB-Dベンチマークデータセットの実験を行い,既存手法に対する最先端性能の実現を実証した。
論文 参考訳(メタデータ) (2023-12-05T18:54:03Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - Towards Controllable Diffusion Models via Reward-Guided Exploration [15.857464051475294]
強化学習(RL)による拡散モデルの学習段階を導く新しい枠組みを提案する。
RLは、政策そのものではなく、指数スケールの報酬に比例したペイオフ分布からのサンプルによる政策勾配を計算することができる。
3次元形状と分子生成タスクの実験は、既存の条件拡散モデルよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-04-14T13:51:26Z) - DiffusionRet: Generative Text-Video Retrieval with Diffusion Model [56.03464169048182]
既存のテキストビデオ検索ソリューションは、条件付き可能性、すなわちp(candidates|query)の最大化に焦点を当てている。
我々は、このタスクを生成的視点から創造的に取り組み、テキストとビデオの相関関係を共同確率p(candidates,query)としてモデル化する。
これは拡散に基づくテキストビデオ検索フレームワーク(DiffusionRet)によって実現され、ノイズから徐々に関節分布を生成するプロセスとして検索タスクをモデル化する。
論文 参考訳(メタデータ) (2023-03-17T10:07:19Z) - DiffusionInst: Diffusion Model for Instance Segmentation [15.438504077368936]
DiffusionInstはインスタンスをインスタンス認識フィルタとして表現する新しいフレームワークである。
RPNからの誘導バイアスを伴わずに、ノイズの多い基底構造を逆転するように訓練されている。
既存のインスタンスセグメンテーションモデルと比較して、競争力のあるパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-12-06T05:52:12Z) - OCD: Learning to Overfit with Conditional Diffusion Models [95.1828574518325]
入力サンプルxに重みを条件付けした動的モデルを提案する。
基本モデルを x とそのラベル y 上で微調整することで得られる重みに一致することを学習する。
論文 参考訳(メタデータ) (2022-10-02T09:42:47Z) - Improving Diffusion Model Efficiency Through Patching [0.0]
単純なViTスタイルのパッチ変換を追加することで,拡散モデルのサンプリング時間とメモリ使用量を大幅に削減できることがわかった。
我々は,拡散モデル対象の分析とLSUN教会, ImageNet 256, FFHQ 1024における実証実験を通じてアプローチを正当化する。
論文 参考訳(メタデータ) (2022-07-09T18:21:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。