論文の概要: Benchmarking Domain Randomisation for Visual Sim-to-Real Transfer
- arxiv url: http://arxiv.org/abs/2011.07112v3
- Date: Fri, 21 May 2021 12:22:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 00:38:09.942210
- Title: Benchmarking Domain Randomisation for Visual Sim-to-Real Transfer
- Title(参考訳): Visual Sim-to-Real Transferのためのベンチマークドメインランダム化
- Authors: Raghad Alghonaim and Edward Johns
- Abstract要約: ドメイン・ランダム化(Domain randomization)は、ロボット工学における視覚的シミュレートと現実的移動の一般的な方法である。
レンダリング品質について検討し、少数の高品質画像が多数の低品質画像よりも優れていることを確認する。
第二に、ランダム化のタイプについて検討し、新しい環境への一般化において、気晴らしとテクスチャの両方が重要であることを見出した。
- 参考スコア(独自算出の注目度): 19.82341644530165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain randomisation is a very popular method for visual sim-to-real transfer
in robotics, due to its simplicity and ability to achieve transfer without any
real-world images at all. Nonetheless, a number of design choices must be made
to achieve optimal transfer. In this paper, we perform a comprehensive
benchmarking study on these different choices, with two key experiments
evaluated on a real-world object pose estimation task. First, we study the
rendering quality, and find that a small number of high-quality images is
superior to a large number of low-quality images. Second, we study the type of
randomisation, and find that both distractors and textures are important for
generalisation to novel environments.
- Abstract(参考訳): ドメインランダム化(Domain randomization)は、ロボット工学における視覚的なシミュレート(sim-to-real transfer)の方法として非常に一般的な方法である。
それでも、最適な転送を実現するためには、多くの設計選択をしなければならない。
本稿では,現実のオブジェクトのポーズ推定タスクで評価された2つの重要な実験を用いて,これらの選択に関する総合的なベンチマーク研究を行う。
まず、レンダリング品質について検討し、少数の高品質画像が多数の低品質画像よりも優れていることを確認する。
第2に,ランダム化のタイプについて検討し,新しい環境への一般化において,気晴らしとテクスチャの両方が重要であることを発見した。
関連論文リスト
- Real-world Instance-specific Image Goal Navigation: Bridging Domain Gaps via Contrastive Learning [5.904490311837063]
この課題は、移動ロボットが観察する低品質画像と、ユーザが提供した高品質なクエリ画像との間の領域ギャップにある。
クロスクオリティのインスタンスブルウェア適応(CrossIA)は、高画質画像と高画質画像の間に特徴を整合させるために、インスタンスとの対比学習を採用している。
本手法は,タスク成功率をベースラインに比べて最大3倍向上させる。
論文 参考訳(メタデータ) (2024-04-15T10:24:32Z) - Text-to-Image Diffusion Models are Great Sketch-Photo Matchmakers [120.49126407479717]
本稿では,ゼロショットスケッチに基づく画像検索(ZS-SBIR)のためのテキスト・画像拡散モデルについて検討する。
スケッチと写真の間のギャップをシームレスに埋めるテキストと画像の拡散モデルの能力。
論文 参考訳(メタデータ) (2024-03-12T00:02:03Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - VMRF: View Matching Neural Radiance Fields [57.93631771072756]
VMRFは、カメラポーズやカメラポーズの分布に関する事前知識を必要とせずに、効果的なNeRFトレーニングを可能にする、革新的な視野マッチングNeRFである。
VMRFは、不均衡な最適輸送を利用するビューマッチングスキームを導入し、レンダリングされた画像をランダムにカメラのポーズで対応する実画像にマッピングする特徴輸送計画を生成する。
特徴伝達プランをガイダンスとして、レンダリング画像と実画像の相対的なポーズを予測することにより、初期ランダム化されたカメラポーズを補正する新しいポーズキャリブレーション手法を設計する。
論文 参考訳(メタデータ) (2022-07-06T12:26:40Z) - MSTRIQ: No Reference Image Quality Assessment Based on Swin Transformer
with Multi-Stage Fusion [8.338999282303755]
本稿では,Swin Transformerに基づく新しいアルゴリズムを提案する。
ローカル機能とグローバル機能の両方から情報を集約して、品質をより正確に予測する。
NTIRE 2022 Perceptual Image Quality Assessment Challengeのノーレファレンストラックで2位。
論文 参考訳(メタデータ) (2022-05-20T11:34:35Z) - A Systematic Evaluation of Domain Adaptation in Facial Expression
Recognition [0.0]
本稿では,表情認識における領域適応の体系的評価について述べる。
我々は、最先端のトランスファー学習技術と、6つの一般的な顔表情データセットを使用する。
その結果,移動学習の精度は高くなく,目的のデータセットと慣用的に異なることがわかった。
論文 参考訳(メタデータ) (2021-06-29T14:41:19Z) - IMAGINE: Image Synthesis by Image-Guided Model Inversion [79.4691654458141]
IMGE-Guided Model INvErsion (IMAGINE) と呼ばれるインバージョンベースの手法を導入し、高品質で多様な画像を生成します。
我々は,事前学習した分類器から画像意味論の知識を活用し,妥当な世代を実現する。
IMAGINEは,1)合成中の意味的特異性制約を同時に実施し,2)ジェネレータトレーニングなしでリアルな画像を生成し,3)生成過程を直感的に制御する。
論文 参考訳(メタデータ) (2021-04-13T02:00:24Z) - Transferring Experience from Simulation to the Real World for Precise
Pick-And-Place Tasks in Highly Cluttered Scenes [6.816222782335256]
乱れ場面における既知の剛体物体を把握し,深度画像に基づいて正確に配置するための,学習に基づく新しいアプローチを提案する。
当社のPQ-Net(Placement Quality Network)は、ニューラルネットワークのシングルフォワードパスで、複数のオブジェクトのオブジェクトポーズと自動生成されたつかみポーズの品質を92fpsで同時に推定します。
全ての把握と配置の試行は物理シミュレーションで実行され、得られた経験はドメインランダム化を用いて実世界に移される。
論文 参考訳(メタデータ) (2021-01-12T22:16:47Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z) - Informative Sample Mining Network for Multi-Domain Image-to-Image
Translation [101.01649070998532]
本稿では,画像から画像への翻訳作業において,サンプル選択戦略の改善が有効であることを示す。
本稿では,サンプルの硬さを抑えつつ,サンプルの硬さを抑えるための新しい多段階サンプルトレーニング手法を提案する。
論文 参考訳(メタデータ) (2020-01-05T05:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。