論文の概要: Training Lightweight CNNs for Human-Nanodrone Proximity Interaction from
Small Datasets using Background Randomization
- arxiv url: http://arxiv.org/abs/2110.14491v1
- Date: Wed, 27 Oct 2021 15:07:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-28 12:30:41.317674
- Title: Training Lightweight CNNs for Human-Nanodrone Proximity Interaction from
Small Datasets using Background Randomization
- Title(参考訳): 背景ランダム化を用いた小型データセットからの人-ナノドメイン近接相互作用のための軽量CNNの訓練
- Authors: Marco Ferri (1), Dario Mantegazza (1), Elia Cereda (1), Nicky
Zimmerman (1 and 2), Luca M. Gambardella (1), Daniele Palossi (1 and 3),
J\'er\^ome Guzzi (1), Alessandro Giusti (1) ((1) Dalle Molle Institute for
Artificial Intelligence (IDSIA), USI-SUPSI, Lugano, Switzerland, (2)
University of Bonn, (3) Integrated Systems Laboratory (IIS), ETH Z\"urich,
Switzerland)
- Abstract要約: 本研究では,近くのナノドローンが取得した画像から人間のポーズを視覚的に推定する作業について考察する。
そこで本研究では,合成背景置換に基づくデータ拡張手法を提案し,実世界の小さなトレーニングセットから軽量CNNモデルを学習する。
- 参考スコア(独自算出の注目度): 38.98439939494304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the task of visually estimating the pose of a human from images
acquired by a nearby nano-drone; in this context, we propose a data
augmentation approach based on synthetic background substitution to learn a
lightweight CNN model from a small real-world training set. Experimental
results on data from two different labs proves that the approach improves
generalization to unseen environments.
- Abstract(参考訳): 本研究では,近接ナノドローンが取得した画像から人間のポーズを視覚的に推定するタスクについて検討する。この文脈では,合成背景置換に基づくデータ拡張アプローチを提案し,小型実世界のトレーニングセットから軽量なcnnモデルを学ぶ。
2つの異なる研究所のデータによる実験結果は、このアプローチが未知の環境への一般化を改善することを証明している。
関連論文リスト
- DeepONet as a Multi-Operator Extrapolation Model: Distributed Pretraining with Physics-Informed Fine-Tuning [6.635683993472882]
マルチオペレータ学習を実現するためのファインチューニング手法を提案する。
本手法は,事前学習における各種演算子からのデータを分散学習と組み合わせ,物理インフォームド手法によりゼロショット微調整が可能となる。
論文 参考訳(メタデータ) (2024-11-11T18:58:46Z) - RTify: Aligning Deep Neural Networks with Human Behavioral Decisions [10.510746720313303]
霊長類視覚の現在のニューラルネットワークモデルは、行動精度の全体的なレベルを複製することに焦点を当てている。
我々は、リカレントニューラルネットワークの時間的ダイナミクスを人間の反応時間(RT)に合わせることを学ぶことによって、人間の行動選択のダイナミクスをモデル化する新しい計算フレームワークを導入する。
本稿では,この近似を用いて「理想オブザーバ」RNNモデルを最適化し,人間データなしで速度と精度の最適なトレードオフを実現できることを示す。
論文 参考訳(メタデータ) (2024-11-06T03:04:05Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - Improving 2D Human Pose Estimation in Rare Camera Views with Synthetic Data [24.63316659365843]
本稿では、ポーズとビューを包括的に制御した合成ヒトを生成するためのSMPLベースの手法であるRePoGenを紹介する。
トップビューデータセットの実験と、さまざまなポーズを持つ実画像の新しいデータセットにより、COCOデータセットにRePoGenデータを追加することは、以前のアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-07-13T13:17:50Z) - GM-NeRF: Learning Generalizable Model-based Neural Radiance Fields from
Multi-view Images [79.39247661907397]
本稿では,自由視点画像の合成に有効なフレームワークであるGeneralizable Model-based Neural Radiance Fieldsを提案する。
具体的には、多視点2D画像からの出現コードを幾何学的プロキシに登録するための幾何学誘導型アテンション機構を提案する。
論文 参考訳(メタデータ) (2023-03-24T03:32:02Z) - TT-NF: Tensor Train Neural Fields [88.49847274083365]
そこで本研究では,Train Neural Fields (TT-NF) と呼ばれる新しい低ランク表現を導入した。
ダウンストリームタスク品質指標に対する低ランク圧縮の影響を解析する。
論文 参考訳(メタデータ) (2022-09-30T15:17:39Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - Cut and Continuous Paste towards Real-time Deep Fall Detection [12.15584530151789]
本稿では,単一かつ小型の畳み込みニューラルネットワークを通じてフォールを検出するための,シンプルで効率的なフレームワークを提案する。
まず,人間の動きを1フレームで表現する画像合成手法を提案する。
推論ステップでは、入力フレームの平均値を推定することにより、実際の人間の動きを1つの画像で表現する。
論文 参考訳(メタデータ) (2022-02-22T06:07:16Z) - Retrieval Augmentation to Improve Robustness and Interpretability of
Deep Neural Networks [3.0410237490041805]
本研究では,深層ニューラルネットワークの堅牢性と解釈性を改善するために,トレーニングデータを積極的に活用する。
具体的には、LSTMモデルのメモリ状態を初期化したり、注意機構を誘導するために、最も近い入力例のターゲットを用いる。
その結果,Flickr8 と IMDB の2つのタスクに対して提案したモデルの有効性が示された。
論文 参考訳(メタデータ) (2021-02-25T17:38:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。