論文の概要: Few-Shot Personalized Saliency Prediction Using Tensor Regression for
Preserving Structural Global Information
- arxiv url: http://arxiv.org/abs/2307.02799v1
- Date: Thu, 6 Jul 2023 06:17:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 15:06:46.753779
- Title: Few-Shot Personalized Saliency Prediction Using Tensor Regression for
Preserving Structural Global Information
- Title(参考訳): テンソル回帰を用いた構造的グローバル情報保存のためのFew-ShotパーソナライズSaliency予測
- Authors: Yuya Moroto, Keisuke Maeda, Takahiro Ogawa and Miki Haseyama
- Abstract要約: 本稿では,パーソナライズされたサリエンシマップ(PSM)の構造的グローバル情報を保存するために,テンソル・ツー・マトリクス回帰を用いた数ショットのパーソナライズされたサリエンシ予測を提案する。
視線追跡データの限られた量から、個々の視線パターンを認識するために、従来の方法では、人の視線傾向の類似性を採用している。
本稿では,PSMの構造情報を保存するテンソルベース回帰モデルに着目し,予測精度の向上を実現する。
- 参考スコア(独自算出の注目度): 41.35916408638724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a few-shot personalized saliency prediction using
tensor-to-matrix regression for preserving the structural global information of
personalized saliency maps (PSMs). In contrast to a general saliency map, a PSM
has been great potential since its map indicates the person-specific visual
attention that is useful for obtaining individual visual preferences from
heterogeneity of gazed areas. The PSM prediction is needed for acquiring the
PSM for the unseen image, but its prediction is still a challenging task due to
the complexity of individual gaze patterns. For recognizing individual gaze
patterns from the limited amount of eye-tracking data, the previous methods
adopt the similarity of gaze tendency between persons. However, in the previous
methods, the PSMs are vectorized for the prediction model. In this way, the
structural global information of the PSMs corresponding to the image is
ignored. For automatically revealing the relationship between PSMs, we focus on
the tensor-based regression model that can preserve the structural information
of PSMs, and realize the improvement of the prediction accuracy. In the
experimental results, we confirm the proposed method including the tensor-based
regression outperforms the comparative methods.
- Abstract(参考訳): 本稿では,psms(パーソナライズ・サリエンシー・マップ)の構造的グローバル情報を保存するために,テンソル・ツー・マトリックス回帰を用いた数ショットのパーソナライズ・サリエンシー予測を提案する。
一般のサルマンシーマップとは対照的に、psmは、注視領域の多様性から個々の視覚嗜好を得るのに有用な人物特有の視覚注意を示すので、大きな可能性を秘めている。
PSM予測は、見えない画像のPSMを取得するために必要であるが、個々の視線パターンの複雑さのため、その予測は依然として難しい課題である。
視線追跡データの限られた量から個々の視線パターンを認識するために、従来の方法は人の視線傾向の類似性を採用する。
しかし、従来の手法では、予測モデルに対してPSMはベクトル化される。
このようにして、画像に対応するPSMの構造的グローバル情報を無視する。
psm間の関係を自動的に明らかにするために,psmの構造情報を保存できるテンソルに基づく回帰モデルに着目し,予測精度の向上を実現する。
実験の結果,テンソルベース回帰を含む提案手法が比較法より優れていることを確認した。
関連論文リスト
- GFM4MPM: Towards Geospatial Foundation Models for Mineral Prospectivity Mapping [2.7998963147546148]
本研究では,ラベルのない地理空間データのみを用いて,バックボーンニューラルネットワークを自己教師型で学習する自己教師型アプローチを提案する。
以上の結果から,自己超越が学習特徴の堅牢性を促進し,予測精度が向上することが示唆された。
我々は、説明可能な人工知能技術を利用して、個々の予測が地質学的観点から解釈できることを実証する。
論文 参考訳(メタデータ) (2024-06-18T16:24:28Z) - MIMIC: Mask Image Pre-training with Mix Contrastive Fine-tuning for
Facial Expression Recognition [11.820043444385432]
Mix Contrastive Fine-tuning (MIMIC) を用いた Mask Image pre-training という新しいFERトレーニングパラダイムを導入する。
初期段階では、一般画像のマスク画像再構成により、ViTを事前訓練する。
微調整段階において、より広範囲の正のサンプルを用いてモデルを強化する混合教師付きコントラスト学習プロセスを導入する。
論文 参考訳(メタデータ) (2024-01-14T10:30:32Z) - HAP: Structure-Aware Masked Image Modeling for Human-Centric Perception [97.55089867970874]
本稿では,この課題に対する事前学習手法として,マスク付き画像モデリング(MIM)を導入する。
この知見に触発され、人間の前部である直感的な人体構造を事前学習に組み込む。
これにより、モデルが事前トレーニング中に身体構造情報に集中し、さまざまな人間中心の知覚タスクに実質的な利益をもたらす。
論文 参考訳(メタデータ) (2023-10-31T17:56:11Z) - Improving saliency models' predictions of the next fixation with humans'
intrinsic cost of gaze shifts [6.315366433343492]
我々は,次の視線目標を予測し,視線に対する人的コストを実証的に測定するための原則的枠組みを開発する。
我々は、人間の視線嗜好の実装を提供する。これは、人間の次の視線目標に対する任意の正当性モデルの予測を改善するために使用できる。
論文 参考訳(メタデータ) (2022-07-09T11:21:13Z) - Contextualize differential privacy in image database: a lightweight
image differential privacy approach based on principle component analysis
inverse [35.06571163816982]
差分プライバシー(DP)は、データベース内のプライバシーに敏感な情報を保存するためのデファクトスタンダードである。
DPの統合によるプライバシ・精度のトレードオフは、差分プライベート画像データベースの文脈では不十分である。
本研究の目的は、概念微分プライバシーと画像の統合を明示的かつ直感的に示すことによって、画像中のDPを文脈化することである。
論文 参考訳(メタデータ) (2022-02-16T19:36:49Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - An Adversarial Human Pose Estimation Network Injected with Graph
Structure [75.08618278188209]
本稿では,いくつかの関節が見えない場合に,可視関節の局所化精度を向上させるために,新しいGAN(Generative Adversarial Network)を設計する。
ネットワークは、2つのシンプルで効率的なモジュール、カスケード機能ネットワーク(CFN)とグラフ構造ネットワーク(GSN)で構成されています。
論文 参考訳(メタデータ) (2021-03-29T12:07:08Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z) - An Unsupervised Information-Theoretic Perceptual Quality Metric [7.887535787216618]
我々は,最近のBAPPS画像品質評価データセットにおいて,PIMは教師付きメトリクスと競合することを示す。
また、ImageNet-Cデータセットを用いて定性的な実験を行い、アーキテクチャの詳細に関してPIMが堅牢であることを示す。
論文 参考訳(メタデータ) (2020-06-11T19:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。