Fugu-MT 論文翻訳(概要): Partially fake it till you make it: mixing real and fake thermal images for improved object detection

論文の概要: Partially fake it till you make it: mixing real and fake thermal images for improved object detection

arxiv url: http://arxiv.org/abs/2106.13603v1
Date: Fri, 25 Jun 2021 12:56:09 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-28 18:08:21.363925
Title: Partially fake it till you make it: mixing real and fake thermal images for improved object detection
Title（参考訳）: 本物の熱画像と偽の熱画像を混ぜて、オブジェクト検出を改善する
Authors: Francesco Bongini, Lorenzo Berlincioni, Marco Bertini, Alberto Del Bimbo
Abstract要約: 熱画像における物体検出の文脈における提案システムの性能について述べる。我々の単一モード検出器はFLIR ADASデータセットの最先端結果を達成する。
参考スコア（独自算出の注目度）: 29.13557322147509
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In this paper we propose a novel data augmentation approach for visual content domains that have scarce training datasets, compositing synthetic 3D objects within real scenes. We show the performance of the proposed system in the context of object detection in thermal videos, a domain where 1) training datasets are very limited compared to visible spectrum datasets and 2) creating full realistic synthetic scenes is extremely cumbersome and expensive due to the difficulty in modeling the thermal properties of the materials of the scene. We compare different augmentation strategies, including state of the art approaches obtained through RL techniques, the injection of simulated data and the employment of a generative model, and study how to best combine our proposed augmentation with these other techniques.Experimental results demonstrate the effectiveness of our approach, and our single-modality detector achieves state-of-the-art results on the FLIR ADAS dataset.
Abstract（参考訳）: 本稿では,学習データセットが乏しい視覚コンテンツ領域に対して,実シーンで合成された3Dオブジェクトを合成する新しいデータ拡張手法を提案する。熱画像における物体検出の文脈において, 提案システムの性能を示す。1) トレーニングデータセットは可視スペクトルデータセットと比較して非常に限られた領域であり, 2) シーンの素材の熱特性のモデル化が困難であるため, 完全なリアルな合成シーンの作成は非常に困難で費用がかかる。我々は,RL法を用いて得られた技術アプローチの状況,シミュレーションデータの注入,生成モデルの活用など,さまざまな拡張戦略を比較し,提案手法と他の手法を最大限に組み合わせる方法について検討する。実験結果から,我々のアプローチの有効性が示され,我々の単一モード検出装置はFLIR ADASデータセット上で最先端の成果を達成できる。

関連論文リスト

Mirage2Matter: A Physically Grounded Gaussian World Model from Video [87.9732484393686]
我々は、グラフィック駆動の世界モデリングおよびシミュレーションフレームワークであるSimulate Anythingを紹介する。実世界の環境を3次元ガウススプレイティング(3DGS)による写実的シーン表現に再構築する。次に、生成モデルを利用して、物理的に現実的な表現を復元し、精度校正ターゲットを介してシミュレーション環境に統合する。
論文参考訳（メタデータ） (2026-01-24T07:43:57Z)
Computer vision training dataset generation for robotic environments using Gaussian splatting [0.0]
本稿では,ロボット環境におけるコンピュータビジョンタスクのための大規模かつ現実的で,自動的にラベル付けされたデータセットを生成するための新しいパイプラインを提案する。我々は3Dガウススプラッティング(3DGS)を利用して、運用環境とオブジェクトの光リアル表現を作成する。新たな2パスレンダリング技術は、スプレートのリアリズムと、プロキシメッシュから生成されたシャドウマップを組み合わせる。画素完全セグメンテーションマスクは自動的に生成され、YOLOのようなオブジェクト検出モデルで直接使用するためにフォーマットされる。
論文参考訳（メタデータ） (2025-12-15T15:00:17Z)
Deep Diffusion Models and Unsupervised Hyperspectral Unmixing for Realistic Abundance Map Synthesis [0.2812395851874055]
我々のフレームワークは、ブラインド線形ハイパースペクトルアンミックスと最先端拡散モデルを統合し、合成アブリダンスマップの現実性と多様性を高める。我々は、地球観測のためのPRISMA宇宙ミッションの実際のハイパースペクトル画像を用いて、我々のアプローチを検証する。
論文参考訳（メタデータ） (2025-06-16T13:42:51Z)
Contrastive Learning-Enhanced Trajectory Matching for Small-Scale Dataset Distillation [0.7560883489000576]
画像合成におけるコントラスト学習を統合した新しいデータセット蒸留法を提案する。提案手法は,データセットのサイズが著しく制約された場合でも,より情報的かつ多様な合成サンプルを生成する。
論文参考訳（メタデータ） (2025-05-21T08:46:29Z)
Realistic Surgical Image Dataset Generation Based On 3D Gaussian Splatting [3.5351922399745166]
本研究は, 合成外科用データセットを生成するために3次元ガウススプラッティングを用いた新しい手法を提案する。手術現場でツールやカメラのポーズとともに画像を取得することのできるデータ記録システムを開発した。このポーズデータを用いて、シーンを合成的に再現し、合成画像の品質を直接比較できるようにする。
論文参考訳（メタデータ） (2024-07-20T11:20:07Z)
Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文参考訳（メタデータ） (2024-06-17T07:43:53Z)
Mixed Diffusion for 3D Indoor Scene Synthesis [55.94569112629208]
混合離散連続拡散モデルアーキテクチャであるMiDiffusionを提案する。シーンレイアウトを2次元のフロアプランとオブジェクトの集合で表現し、それぞれがそのカテゴリ、場所、サイズ、方向で定義する。実験により,MiDiffusionは床条件下での3次元シーン合成において,最先端の自己回帰モデルや拡散モデルよりもかなり優れていることが示された。
論文参考訳（メタデータ） (2024-05-31T17:54:52Z)
Hardness-Aware Scene Synthesis for Semi-Supervised 3D Object Detection [59.33188668341604]
3次元物体検出は、自律運転知覚の基本的なタスクとして機能する。ポイントクラウドデータのための高品質なアノテーションを得るためには、コストがかかる。本稿では,適応型合成シーンを生成するために,ハードネス対応シーン合成(HASS)手法を提案する。
論文参考訳（メタデータ） (2024-05-27T17:59:23Z)
Training Deep Learning Models with Hybrid Datasets for Robust Automatic Target Detection on real SAR images [0.13194391758295113]
そこで本研究では,MOCEMシミュレータを用いて合成目標シグネチャを用いたATDモデルの学習手法を提案する。我々は、合成データと実データの間の領域ギャップを埋めるために特別に調整されたATDモデルを訓練する。我々のアプローチは、トレーニングに人工目標のみを使用しながら、実データ上で平均精度の90%に達することができる。
論文参考訳（メタデータ） (2024-05-15T09:26:24Z)
Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文参考訳（メタデータ） (2024-03-23T22:32:06Z)
Augmented Reality based Simulated Data (ARSim) with multi-view consistency for AV perception networks [47.07188762367792]
ARSimは3次元合成オブジェクトを用いた実写多視点画像データの拡張を目的としたフレームワークである。実データを用いて簡易な仮想シーンを構築し,その内部に戦略的に3D合成資産を配置する。結果として得られたマルチビュー一貫性のあるデータセットは、自動運転車のためのマルチカメラ知覚ネットワークのトレーニングに使用される。
論文参考訳（メタデータ） (2024-03-22T17:49:11Z)
Learning from Synthetic Data for Visual Grounding [55.21937116752679]
そこで本研究では,SynGroundが市販のビジョン・アンド・ランゲージモデルのローカライズ能力を向上できることを示す。 SynGroundで生成されたデータは、事前訓練されたALBEFモデルとBLIPモデルのポインティングゲーム精度をそれぞれ4.81%、絶対パーセンテージポイント17.11%向上させる。
論文参考訳（メタデータ） (2024-03-20T17:59:43Z)
DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文参考訳（メタデータ） (2023-11-30T21:34:44Z)
WinSyn: A High Resolution Testbed for Synthetic Data [41.11481327112564]
我々は、手続き的モデリング技術を用いて高品質な合成データを作成するためのユニークなデータセットとテストベッドであるWinSynを紹介する。このデータセットには、世界中の場所から選抜された高解像度の窓の写真が含まれており、89,318の個々の窓作物は、多様な幾何学的特徴と材料的特性を示している。合成画像と実画像の両方で意味的セグメンテーションネットワークを訓練し、実画像の共有テストセットでそれらの性能を比較することによって、手続きモデルを評価する。
論文参考訳（メタデータ） (2023-10-09T20:18:10Z)
TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文参考訳（メタデータ） (2022-08-16T20:46:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。