Fugu-MT 論文翻訳(概要): An Inter-observer consistent deep adversarial training for visual scanpath prediction

論文の概要: An Inter-observer consistent deep adversarial training for visual scanpath prediction

arxiv url: http://arxiv.org/abs/2211.07336v2
Date: Tue, 11 Jul 2023 09:01:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-12 19:19:37.824394
Title: An Inter-observer consistent deep adversarial training for visual scanpath prediction
Title（参考訳）: 視覚スキャンパス予測のためのobserver間一貫性のあるディープ・コンバーサル・トレーニング
Authors: Mohamed Amine Kerkouri, Marouane Tliba, Aladine Chetouani, Alessandro Bruno
Abstract要約: 本稿では,軽量なディープニューラルネットワークによるスキャンパス予測のための,サーバ間一貫した対向トレーニング手法を提案する。我々は、最先端の手法に関して、我々のアプローチの競争力を示す。
参考スコア（独自算出の注目度）: 66.46953851227454
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The visual scanpath is a sequence of points through which the human gaze moves while exploring a scene. It represents the fundamental concepts upon which visual attention research is based. As a result, the ability to predict them has emerged as an important task in recent years. In this paper, we propose an inter-observer consistent adversarial training approach for scanpath prediction through a lightweight deep neural network. The adversarial method employs a discriminative neural network as a dynamic loss that is better suited to model the natural stochastic phenomenon while maintaining consistency between the distributions related to the subjective nature of scanpaths traversed by different observers. Through extensive testing, we show the competitiveness of our approach in regard to state-of-the-art methods.
Abstract（参考訳）: 視覚スキャンパス(visual scanpath)は、シーンを探索しながら人間の視線が動く点のシーケンスである。視覚的注意研究の基盤となる基本的な概念である。その結果,近年,これらの予測能力が重要な課題となっている。本稿では,軽量深層ニューラルネットワークによるスキャニングパス予測のための,オブザーバ間の一貫性のある逆向学習手法を提案する。本手法は、異なる観測者によって横断される走査パスの主観的性質に関する分布間の整合性を維持しつつ、自然な確率現象をモデル化するのに適した動的損失として識別ニューラルネットワークを用いる。広範なテストを通じて、最先端の手法に対する我々のアプローチの競争力を示す。

関連論文リスト

Identifying Sub-networks in Neural Networks via Functionally Similar Representations [41.028797971427124]
我々は、異なるサブネットワークの存在を調査し、ネットワークの理解を自動化するための一歩を踏み出した。我々のアプローチは、人間と計算コストを最小限に抑えたニューラルネットワークの振る舞いに関する有意義な洞察を提供する。
論文参考訳（メタデータ） (2024-10-21T20:19:00Z)
GazeXplain: Learning to Predict Natural Language Explanations of Visual Scanpaths [20.384132849805003]
本稿では,視覚スキャンパス予測と説明の新しい研究であるGazeXplainを紹介する。これには、視線追跡データセットにまたがる修正のための自然言語の説明が注釈付けされる。多様な視線追跡データセットの実験は、スキャンパス予測と説明の両方においてGazeXplainの有効性を示す。
論文参考訳（メタデータ） (2024-08-05T19:11:46Z)
Disentangled Interaction Representation for One-Stage Human-Object Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文参考訳（メタデータ） (2023-12-04T08:02:59Z)
Simulating Human Gaze with Neural Visual Attention [44.65733084492857]
我々は、下流の視覚課題のガイダンスをアテンション・モデリングに統合するニューラル・ビジュアル・アテンション(NeVA)アルゴリズムを提案する。我々は、生物学的に制約されたニューラルネットワークが、この目的のために訓練されることなく、人間の様のスキャンパスを生成することを観察する。
論文参考訳（メタデータ） (2022-11-22T09:02:09Z)
A Probabilistic Time-Evolving Approach to Scanpath Prediction [8.669748138523758]
ベイズ深層学習に基づくスキャンパス予測のための確率論的時間進化手法を提案する。我々のモデルは、現在の最先端のアプローチよりも優れており、ほぼ人間のベースラインに匹敵する結果をもたらす。
論文参考訳（メタデータ） (2022-04-20T11:50:29Z)
Behind the Machine's Gaze: Biologically Constrained Neural Networks Exhibit Human-like Visual Attention [40.878963450471026]
トップダウン方式でビジュアル・スキャンパスを生成するニューラル・ビジュアル・アテンション(NeVA)アルゴリズムを提案する。提案手法は,人間の走査パスと類似性の観点から,最先端の非監視的注意モデルより優れていることを示す。
論文参考訳（メタデータ） (2022-04-19T18:57:47Z)
Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文参考訳（メタデータ） (2022-02-01T17:11:13Z)
Understanding Character Recognition using Visual Explanations Derived from the Human Visual System and Deep Networks [6.734853055176694]
深層ニューラルネットワークの情報収集戦略における合同性,あるいはその欠如について検討する。深層学習モデルは、人間が正しく分類された文字に対して固定した文字の類似した領域を考慮に入れた。本稿では、視線追跡実験から得られた視覚的固定マップを、モデルが関連する文字領域に焦点を合わせるための監督入力として用いることを提案する。
論文参考訳（メタデータ） (2021-08-10T10:09:37Z)
Learning Dynamics via Graph Neural Networks for Human Pose Estimation and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。 PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文参考訳（メタデータ） (2021-06-07T16:36:50Z)
Towards Interaction Detection Using Topological Analysis on Neural Networks [55.74562391439507]
ニューラルネットワークでは、あらゆる相互作用する特徴は共通の隠蔽ユニットとの強い重み付けの接続に従う必要がある。本稿では, 永続的ホモロジーの理論に基づいて, 相互作用強度を定量化するための新しい尺度を提案する。 PID(Persistence Interaction Detection)アルゴリズムを開発した。
論文参考訳（メタデータ） (2020-10-25T02:15:24Z)
Continuous Emotion Recognition via Deep Convolutional Autoencoder and Support Vector Regressor [70.2226417364135]
マシンはユーザの感情状態を高い精度で認識できることが不可欠である。ディープニューラルネットワークは感情を認識する上で大きな成功を収めている。表情認識に基づく連続的感情認識のための新しいモデルを提案する。
論文参考訳（メタデータ） (2020-01-31T17:47:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。