論文の概要: State-of-the-Art in Human Scanpath Prediction
- arxiv url: http://arxiv.org/abs/2102.12239v1
- Date: Wed, 24 Feb 2021 12:01:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 13:28:59.230980
- Title: State-of-the-Art in Human Scanpath Prediction
- Title(参考訳): ヒトScanpath予測の現状と課題
- Authors: Matthias K\"ummerer, Matthias Bethge
- Abstract要約: 過去のスキャンパス履歴から,スキャンパスにおける各固定の精度をモデルとして評価した。
これにより、モデル評価は、下層スキャンパス生成と考えられる生物学的プロセスと密接に整合する。
MIT1003, MIT300, CAT2000, CAT200のデータセット上でのスキャンパス予測の多くの既存モデルを評価する。
- 参考スコア(独自算出の注目度): 22.030889583780514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The last years have seen a surge in models predicting the scanpaths of
fixations made by humans when viewing images. However, the field is lacking a
principled comparison of those models with respect to their predictive power.
In the past, models have usually been evaluated based on comparing human
scanpaths to scanpaths generated from the model. Here, instead we evaluate
models based on how well they predict each fixation in a scanpath given the
previous scanpath history. This makes model evaluation closely aligned with the
biological processes thought to underly scanpath generation and allows to apply
established saliency metrics like AUC and NSS in an intuitive and interpretable
way. We evaluate many existing models of scanpath prediction on the datasets
MIT1003, MIT300, CAT2000 train and CAT200 test, for the first time giving a
detailed picture of the current state of the art of human scanpath prediction.
We also show that the discussed method of model benchmarking allows for more
detailed analyses leading to interesting insights about where and when models
fail to predict human behaviour. The MIT/Tuebingen Saliency Benchmark will
implement the evaluation of scanpath models as detailed here, allowing
researchers to score their models on the established benchmark datasets MIT300
and CAT2000.
- Abstract(参考訳): 近年、画像を見る際に人間が行う固定のスキャンパスを予測するモデルが急増しています。
しかし、この分野は予測力に関してそれらのモデルの原則的な比較を欠いている。
過去、モデルは通常、モデルから生成されたスキャンパスと人間のスキャンパスを比較することに基づいて評価されています。
ここでは,前回のスキャンパス履歴に基づいて,スキャンパス内の各固定をどの程度正確に予測するかに基づいてモデルを評価する。
これにより、モデル評価は、下層スキャンパス生成と考えられる生物学的プロセスと密接に整合し、直感的かつ解釈可能な方法でAUCやNSSなどの確立されたサリエンシーメトリクスを適用することができます。
MIT1003, MIT300, CAT2000, CAT200のデータセット上でのスキャンパス予測の多くの既存のモデルを評価し、人間のスキャンパス予測技術の現状を初めて詳細に説明します。
また, モデルベンチマーク手法により, より詳細な分析が可能となり, モデルが人間の行動を予測できない場所や時期に関する興味深い知見が得られた。
MIT/Tuebingen Saliency Benchmarkは、ここで詳述したスキャンパスモデルの評価を実装し、研究者が確立されたベンチマークデータセットMIT300とCAT2000でモデルを評価できるようにする。
関連論文リスト
- Unified Dynamic Scanpath Predictors Outperform Individually Trained Neural Models [18.327960366321655]
本研究では,ビデオ中のスキャンパスを予測するために,ディープラーニングに基づくソーシャルキュー統合モデルを構築した。
我々は,自由視聴条件下で観察された動的な社会シーンの視線に対するアプローチを評価した。
結果は、すべての観察者のスキャンパスに基づいて訓練された単一の統一モデルが、個別に訓練されたモデルよりも同等以上のパフォーマンスを示すことを示している。
論文 参考訳(メタデータ) (2024-05-05T13:15:11Z) - EyeFormer: Predicting Personalized Scanpaths with Transformer-Guided Reinforcement Learning [31.583764158565916]
視覚的ユーザインタフェースにおけるスキャンパスを予測する機械学習モデルであるEyeFormerを提案する。
我々のモデルは、いくつかのユーザ・スキャンパス・サンプルが与えられたとき、パーソナライズされた予測を生成するユニークな能力を持っている。
固定位置や持続時間を含む全スキャンパス情報を個人や様々な刺激タイプで予測することができる。
論文 参考訳(メタデータ) (2024-04-15T22:26:27Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - Scanpath Prediction in Panoramic Videos via Expected Code Length
Minimization [27.06179638588126]
損失データ圧縮の原理に基づくスキャンパス予測のための新しい基準を提案する。
この基準は、トレーニングセットにおける量子化されたスキャンパスのコード長を最小化することを示唆している。
また、現実的な人間のようなスキャンパスを生成するために、PID(Paldical-Integrated-Integrated-Divative)コントローラベースのサンプリングも導入する。
論文 参考訳(メタデータ) (2023-05-04T04:10:47Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - Zero-shot Model Diagnosis [80.36063332820568]
ディープラーニングモデルを評価するための一般的なアプローチは、興味のある属性を持つラベル付きテストセットを構築し、そのパフォーマンスを評価することである。
本稿では,ゼロショットモデル診断(ZOOM)がテストセットやラベル付けを必要とせずに可能であることを論じる。
論文 参考訳(メタデータ) (2023-03-27T17:59:33Z) - TempSAL -- Uncovering Temporal Information for Deep Saliency Prediction [64.63645677568384]
本稿では,逐次時間間隔でサリエンシマップを出力する新たなサリエンシ予測モデルを提案する。
提案手法は,学習した時間マップを組み合わせることで,サリエンシ予測を局所的に調整する。
私たちのコードはGitHubで公開されます。
論文 参考訳(メタデータ) (2023-01-05T22:10:16Z) - MRCLens: an MRC Dataset Bias Detection Toolkit [82.44296974850639]
MRCLensは,ユーザがフルモデルをトレーニングする前に,バイアスが存在するかどうかを検出するツールキットである。
ツールキットの導入の便宜のために,MDCにおける共通バイアスの分類も提供する。
論文 参考訳(メタデータ) (2022-07-18T21:05:39Z) - A Probabilistic Time-Evolving Approach to Scanpath Prediction [8.669748138523758]
ベイズ深層学習に基づくスキャンパス予測のための確率論的時間進化手法を提案する。
我々のモデルは、現在の最先端のアプローチよりも優れており、ほぼ人間のベースラインに匹敵する結果をもたらす。
論文 参考訳(メタデータ) (2022-04-20T11:50:29Z) - A Simple and efficient deep Scanpath Prediction [6.294759639481189]
我々は、単純な完全な畳み込み回帰的な方法で、共通のディープラーニングアーキテクチャーを使用することの効率について検討する。
これらのモデルが2つのデータセットのスキャンパスをいかに予測できるかを実験する。
また、実験におけるパフォーマンスに基づいて、異なるレバレッジされたバックボーンアーキテクチャを比較して、どのアーキテクチャがタスクに最も適しているかを推定する。
論文 参考訳(メタデータ) (2021-12-08T22:43:45Z) - LoopReg: Self-supervised Learning of Implicit Surface Correspondences,
Pose and Shape for 3D Human Mesh Registration [123.62341095156611]
LoopRegは、スキャンのコーパスを一般的な3Dモデルに登録するエンドツーエンドの学習フレームワークである。
ニューラルネットワークによってパラメータ化された後方マップは、スキャンポイント毎から人間のモデルの表面への対応を予測する。
人間のモデルによってパラメータ化されたフォワードマップは、モデルパラメータ(目的と形状)に基づいて対応するポイントをスキャンに変換する。
論文 参考訳(メタデータ) (2020-10-23T14:39:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。