論文の概要: Few-shot Personalized Saliency Prediction Based on Inter-personnel Gaze
Patterns
- arxiv url: http://arxiv.org/abs/2307.02799v2
- Date: Wed, 13 Sep 2023 05:46:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 17:41:00.987689
- Title: Few-shot Personalized Saliency Prediction Based on Inter-personnel Gaze
Patterns
- Title(参考訳): 対人視線パターンに基づく数発パーソナライズされた塩分予測
- Authors: Yuya Moroto, Keisuke Maeda, Takahiro Ogawa and Miki Haseyama
- Abstract要約: 本稿では,対人的視線パターンに基づく個人性予測について述べる。
本稿では、視線追跡データを取得するための画像の選択と、他者のPSMの構造情報の保存に焦点をあてる。
- 参考スコア(独自算出の注目度): 44.93809931272093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents few-shot personalized saliency prediction based on
inter-personnel gaze patterns. In contrast to a general saliency map, a
personalized saliecny map (PSM) has been great potential since its map
indicates the person-specific visual attention that is useful for obtaining
individual visual preferences from heterogeneity of gazed areas. The PSM
prediction is needed for acquiring the PSM for the unseen image, but its
prediction is still a challenging task due to the complexity of individual gaze
patterns. For modeling individual gaze patterns for various images, although
the eye-tracking data obtained from each person is necessary to construct PSMs,
it is difficult to acquire the massive amounts of such data. Here, one solution
for efficient PSM prediction from the limited amount of data can be the
effective use of eye-tracking data obtained from other persons. In this paper,
to effectively treat the PSMs of other persons, we focus on the effective
selection of images to acquire eye-tracking data and the preservation of
structural information of PSMs of other persons. In the experimental results,
we confirm that the above two focuses are effective for the PSM prediction with
the limited amount of eye-tracking data.
- Abstract(参考訳): 本稿では,対人的視線パターンに基づく個人性予測について述べる。
一般的なサリエンシーマップとは対照的に、パーソナライズされたサリエンシーマップ(psm)は、注視領域の多様性から個々の視覚嗜好を得るのに役立つ人物特有の視覚的注意を示すため、大きな可能性を秘めている。
PSM予測は、見えない画像のPSMを取得するために必要であるが、個々の視線パターンの複雑さのため、その予測は依然として難しい課題である。
様々な画像の個々の視線パターンをモデル化するには,各人物から得られた視線追跡データがpsmを構成する必要があるが,膨大な量のデータを取得することは困難である。
ここでは、限られた量のデータから効率的なPSM予測を行う方法の一つが、他人から得られた視線追跡データの有効利用である。
本稿では,他者のpsmを効果的に扱うために,視線追跡データを取得するための画像の効果的な選択と,他者のpsmの構造情報の保存に焦点を当てる。
実験の結果,上記の2つの焦点が眼球追跡データの限られた量でPSM予測に有効であることが確認された。
関連論文リスト
- GFM4MPM: Towards Geospatial Foundation Models for Mineral Prospectivity Mapping [2.7998963147546148]
本研究では,ラベルのない地理空間データのみを用いて,バックボーンニューラルネットワークを自己教師型で学習する自己教師型アプローチを提案する。
以上の結果から,自己超越が学習特徴の堅牢性を促進し,予測精度が向上することが示唆された。
我々は、説明可能な人工知能技術を利用して、個々の予測が地質学的観点から解釈できることを実証する。
論文 参考訳(メタデータ) (2024-06-18T16:24:28Z) - MIMIC: Mask Image Pre-training with Mix Contrastive Fine-tuning for
Facial Expression Recognition [11.820043444385432]
Mix Contrastive Fine-tuning (MIMIC) を用いた Mask Image pre-training という新しいFERトレーニングパラダイムを導入する。
初期段階では、一般画像のマスク画像再構成により、ViTを事前訓練する。
微調整段階において、より広範囲の正のサンプルを用いてモデルを強化する混合教師付きコントラスト学習プロセスを導入する。
論文 参考訳(メタデータ) (2024-01-14T10:30:32Z) - HAP: Structure-Aware Masked Image Modeling for Human-Centric Perception [97.55089867970874]
本稿では,この課題に対する事前学習手法として,マスク付き画像モデリング(MIM)を導入する。
この知見に触発され、人間の前部である直感的な人体構造を事前学習に組み込む。
これにより、モデルが事前トレーニング中に身体構造情報に集中し、さまざまな人間中心の知覚タスクに実質的な利益をもたらす。
論文 参考訳(メタデータ) (2023-10-31T17:56:11Z) - Improving saliency models' predictions of the next fixation with humans'
intrinsic cost of gaze shifts [6.315366433343492]
我々は,次の視線目標を予測し,視線に対する人的コストを実証的に測定するための原則的枠組みを開発する。
我々は、人間の視線嗜好の実装を提供する。これは、人間の次の視線目標に対する任意の正当性モデルの予測を改善するために使用できる。
論文 参考訳(メタデータ) (2022-07-09T11:21:13Z) - Contextualize differential privacy in image database: a lightweight
image differential privacy approach based on principle component analysis
inverse [35.06571163816982]
差分プライバシー(DP)は、データベース内のプライバシーに敏感な情報を保存するためのデファクトスタンダードである。
DPの統合によるプライバシ・精度のトレードオフは、差分プライベート画像データベースの文脈では不十分である。
本研究の目的は、概念微分プライバシーと画像の統合を明示的かつ直感的に示すことによって、画像中のDPを文脈化することである。
論文 参考訳(メタデータ) (2022-02-16T19:36:49Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - An Adversarial Human Pose Estimation Network Injected with Graph
Structure [75.08618278188209]
本稿では,いくつかの関節が見えない場合に,可視関節の局所化精度を向上させるために,新しいGAN(Generative Adversarial Network)を設計する。
ネットワークは、2つのシンプルで効率的なモジュール、カスケード機能ネットワーク(CFN)とグラフ構造ネットワーク(GSN)で構成されています。
論文 参考訳(メタデータ) (2021-03-29T12:07:08Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z) - An Unsupervised Information-Theoretic Perceptual Quality Metric [7.887535787216618]
我々は,最近のBAPPS画像品質評価データセットにおいて,PIMは教師付きメトリクスと競合することを示す。
また、ImageNet-Cデータセットを用いて定性的な実験を行い、アーキテクチャの詳細に関してPIMが堅牢であることを示す。
論文 参考訳(メタデータ) (2020-06-11T19:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。