論文の概要: DeeSCo: Deep heterogeneous ensemble with Stochastic Combinatory loss for
gaze estimation
- arxiv url: http://arxiv.org/abs/2004.07098v1
- Date: Wed, 15 Apr 2020 14:06:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 03:39:25.591489
- Title: DeeSCo: Deep heterogeneous ensemble with Stochastic Combinatory loss for
gaze estimation
- Title(参考訳): DeeSCo:視線推定のためのStochastic Combinatoryの損失を伴う深い異種アンサンブル
- Authors: Edouard Yvinec, Arnaud Dapogny, and K\'evin Bailly
- Abstract要約: 本研究では,2D/3D視線推定のためのヒートマップに基づく弱い予測器を,エンドツーエンドで訓練可能なアンサンブルとして導入する。
我々は,複数のデータセット上での2D/3D視線推定における最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 7.09232719022402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: From medical research to gaming applications, gaze estimation is becoming a
valuable tool. While there exists a number of hardware-based solutions, recent
deep learning-based approaches, coupled with the availability of large-scale
databases, have allowed to provide a precise gaze estimate using only consumer
sensors. However, there remains a number of questions, regarding the problem
formulation, architectural choices and learning paradigms for designing gaze
estimation systems in order to bridge the gap between geometry-based systems
involving specific hardware and approaches using consumer sensors only. In this
paper, we introduce a deep, end-to-end trainable ensemble of heatmap-based weak
predictors for 2D/3D gaze estimation. We show that, through heterogeneous
architectural design of these weak predictors, we can improve the decorrelation
between the latter predictors to design more robust deep ensemble models.
Furthermore, we propose a stochastic combinatory loss that consists in randomly
sampling combinations of weak predictors at train time. This allows to train
better individual weak predictors, with lower correlation between them. This,
in turns, allows to significantly enhance the performance of the deep ensemble.
We show that our Deep heterogeneous ensemble with Stochastic Combinatory loss
(DeeSCo) outperforms state-of-the-art approaches for 2D/3D gaze estimation on
multiple datasets.
- Abstract(参考訳): 医学研究からゲームアプリケーションまで、視線推定は貴重なツールになりつつある。
ハードウェアベースのソリューションは数多く存在するが、最近のディープラーニングベースのアプローチと大規模データベースの可用性が相まって、コンシューマセンサーのみを使用して正確な視線推定が可能になる。
しかし、特定のハードウェアを含む幾何学ベースのシステムと消費者センサのみを用いたアプローチとのギャップを埋めるため、視線推定システムを設計するための問題定式化、アーキテクチャの選択、学習パラダイムに関して、多くの疑問が残る。
本稿では,2次元/3次元視線推定のためのヒートマップ型弱予測器の,エンドツーエンドの訓練可能な深層アンサンブルを提案する。
これらの弱い予測器の異種アーキテクチャ設計により、より強固な深層アンサンブルモデルを設計するために、後者の予測器間の相関を改善することができる。
さらに,列車時弱予測器の組み合わせをランダムにサンプリングした確率的組合せ損失を提案する。
これにより、より弱い予測器を訓練し、それらの相関を低くすることができる。
これにより、ディープアンサンブルの性能を大幅に向上させることができる。
我々は,Stochastic Combinatory Losy (DeeSCo) を用いた深部異種アンサンブルが,複数のデータセットにおける2D/3D視線推定の最先端手法より優れていることを示す。
関連論文リスト
- PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Robust Two-View Geometry Estimation with Implicit Differentiation [2.048226951354646]
本稿では,新しい2次元幾何推定フレームワークを提案する。
これは微分可能なロバスト損失関数のフィッティングに基づいている。
本研究では,屋外シナリオと屋内シナリオの両方において,カメラポーズ推定タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-23T15:51:33Z) - Occlusion Handling in 3D Human Pose Estimation with Perturbed Positional Encoding [15.834419910916933]
固有基底から一貫した正規成分を抽出する新しい位置符号化手法PerturbPEを提案する。
実験結果では,Human3.6Mデータセットで最大12%のパフォーマンス向上が観測された。
我々の新しいアプローチは、2つのエッジが欠落しているシナリオのパフォーマンスを大幅に向上させ、最先端のベンチマークを新たに設定する。
論文 参考訳(メタデータ) (2024-05-27T17:48:54Z) - Depth-agnostic Single Image Dehazing [12.51359372069387]
本研究では, 深度に依存しないデータセット(DA-HAZE)を生成することで, ヘイズ密度とシーン深度の関係を分離する, 単純かつ斬新な合成法を提案する。
実験によると、DA-HAZEでトレーニングされたモデルは、SOTSとDA-SOTSの相違が少なく、実世界のベンチマークで大幅に改善されている。
我々は、専用に設計されたブロックが組み込まれているデハジングのために、U-Netベースのアーキテクチャを再考する。
論文 参考訳(メタデータ) (2024-01-14T06:33:11Z) - Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - DualRefine: Self-Supervised Depth and Pose Estimation Through Iterative Epipolar Sampling and Refinement Toward Equilibrium [11.78276690882616]
自己教師付き多フレーム深度推定は,隣接フレーム間の画素対応のマッチングコストの計算により高い精度を実現する。
本稿では,フィードバックループを通した深度とポーズを密に結合するDualモデルを提案する。
我々の新しい更新パイプラインは、奥行き推定と特徴マップの隠れ状態を反復的に洗練するために、深い平衡モデルフレームワークを使用します。
論文 参考訳(メタデータ) (2023-04-07T09:46:29Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。