論文の概要: Fast Object Placement Assessment
- arxiv url: http://arxiv.org/abs/2205.14280v1
- Date: Sat, 28 May 2022 00:28:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-05 02:02:10.616321
- Title: Fast Object Placement Assessment
- Title(参考訳): 高速物体配置評価
- Authors: Li Niu, Qingyang Liu, Zhenchen Liu, Jiangtong Li
- Abstract要約: オブジェクト配置評価(OPA)は、挿入された前景オブジェクトの配置の観点から、合成画像の合理性スコアを予測することを目的としている。
既存のOPAモデルは、背景にある各場所に前景を配置し、得られた合成画像をモデルに1回ずつ渡す必要がある。
我々は、遅いOPAモデルと高速OPAモデルの間の性能ギャップを埋めるために、いくつかの革新を伴う高速OPAモデルを先駆的に提案する。
- 参考スコア(独自算出の注目度): 14.793523978854061
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Object placement assessment (OPA) aims to predict the rationality score of a
composite image in terms of the placement (e.g., scale, location) of inserted
foreground object. However, given a pair of scaled foreground and background,
to enumerate all the reasonable locations, existing OPA model needs to place
the foreground at each location on the background and pass the obtained
composite image through the model one at a time, which is very time-consuming.
In this work, we investigate a new task named as fast OPA. Specifically,
provided with a scaled foreground and a background, we only pass them through
the model once and predict the rationality scores for all locations. To
accomplish this task, we propose a pioneering fast OPA model with several
innovations (i.e., foreground dynamic filter, background prior transfer, and
composite feature mimicking) to bridge the performance gap between slow OPA
model and fast OPA model. Extensive experiments on OPA dataset show that our
proposed fast OPA model performs on par with slow OPA model but runs
significantly faster.
- Abstract(参考訳): オブジェクト配置評価(OPA)は、挿入された前景オブジェクトの配置(スケール、位置など)の観点から合成画像の合理性スコアを予測することを目的としている。
しかし、すべての合理的な位置を列挙するために、一対のスケールされた前景と背景が与えられた場合、既存のOPAモデルは、その前景を背景のそれぞれの場所に配置し、得られた合成画像をモデルに1回ずつ渡す必要がある。
本研究では,高速OPAと呼ばれる新しいタスクについて検討する。
具体的には、前景と背景をスケールして、モデルを一度だけ通過し、すべての場所の合理性スコアを予測します。
そこで本研究では, 高速OPAモデルと低速OPAモデルの性能ギャップを埋めるため, いくつかの革新(前景動的フィルタ, バックグラウンド事前転送, 複合機能模倣)を生かした高速OPAモデルを提案する。
OPAデータセットの大規模な実験は、提案した高速OPAモデルが遅いOPAモデルと同等に動作するが、はるかに高速に動作することを示す。
関連論文リスト
- Few-shot Object Localization [37.347898735345574]
本稿では,Few-Shot Object Localization (FSOL) という新しいタスクを定義する。
限られたサンプルで正確な位置決めを実現することを目的としている。
本課題は、少数のラベル付きサポートサンプルを利用して、対応する画像内のオブジェクトの位置情報をクエリすることで、一般化されたオブジェクトのローカライゼーションを実現する。
実験の結果,FSOLタスクにおけるアプローチの大幅な性能向上が示され,さらなる研究のための効率的なベンチマークが確立された。
論文 参考訳(メタデータ) (2024-03-19T05:50:48Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - OnePose++: Keypoint-Free One-Shot Object Pose Estimation without CAD
Models [51.68715543630427]
OnePoseは繰り返し可能なイメージキーポイントの検出に依存しているので、低テクスチャオブジェクトで失敗する傾向がある。
繰り返し可能なキーポイント検出の必要性を取り除くために,キーポイントフリーポーズ推定パイプラインを提案する。
2D-3Dマッチングネットワークは、クエリ画像と再構成されたポイントクラウドモデルとの間の2D-3D対応を直接確立する。
論文 参考訳(メタデータ) (2023-01-18T17:47:13Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Fast Pixel-Matching for Video Object Segmentation [14.79639149658596]
我々は,マスクプロパゲーションと非局所的手法に基づいて,前景オブジェクトを直接ローカライズするNPMCA-netというモデルを提案する。
提案手法は,同時に高速に新しい最先端性能を実現することができることを示す。
論文 参考訳(メタデータ) (2021-07-09T07:46:46Z) - A Systematic Evaluation of Object Detection Networks for Scientific
Plots [17.882932963813985]
PlotQAデータセット上で、様々なSOTAオブジェクト検出ネットワークの精度をトレーニングし比較する。
0.5の標準IOU設定では、ほとんどのネットワークはプロット内の比較的単純な物体を検出する場合、mAPスコアが80%以上である。
しかし、パフォーマンスは0.9のより厳格なIOUで評価されると大幅に低下し、最高のモデルでmAPは35.70%となった。
論文 参考訳(メタデータ) (2020-07-05T05:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。