論文の概要: Few-Shot Personalized Saliency Prediction Using Tensor Regression for
Preserving Structural Global Information
- arxiv url: http://arxiv.org/abs/2307.02799v1
- Date: Thu, 6 Jul 2023 06:17:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-07-07 15:06:46.753779
- Title: Few-Shot Personalized Saliency Prediction Using Tensor Regression for
Preserving Structural Global Information
- Title(参考訳): テンソル回帰を用いた構造的グローバル情報保存のためのFew-ShotパーソナライズSaliency予測
- Authors: Yuya Moroto, Keisuke Maeda, Takahiro Ogawa and Miki Haseyama
- Abstract要約: 本稿では,パーソナライズされたサリエンシマップ(PSM)の構造的グローバル情報を保存するために,テンソル・ツー・マトリクス回帰を用いた数ショットのパーソナライズされたサリエンシ予測を提案する。
視線追跡データの限られた量から、個々の視線パターンを認識するために、従来の方法では、人の視線傾向の類似性を採用している。
本稿では,PSMの構造情報を保存するテンソルベース回帰モデルに着目し,予測精度の向上を実現する。
- 参考スコア(独自算出の注目度): 41.35916408638724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a few-shot personalized saliency prediction using
tensor-to-matrix regression for preserving the structural global information of
personalized saliency maps (PSMs). In contrast to a general saliency map, a PSM
has been great potential since its map indicates the person-specific visual
attention that is useful for obtaining individual visual preferences from
heterogeneity of gazed areas. The PSM prediction is needed for acquiring the
PSM for the unseen image, but its prediction is still a challenging task due to
the complexity of individual gaze patterns. For recognizing individual gaze
patterns from the limited amount of eye-tracking data, the previous methods
adopt the similarity of gaze tendency between persons. However, in the previous
methods, the PSMs are vectorized for the prediction model. In this way, the
structural global information of the PSMs corresponding to the image is
ignored. For automatically revealing the relationship between PSMs, we focus on
the tensor-based regression model that can preserve the structural information
of PSMs, and realize the improvement of the prediction accuracy. In the
experimental results, we confirm the proposed method including the tensor-based
regression outperforms the comparative methods.
- Abstract(参考訳): 本稿では,psms(パーソナライズ・サリエンシー・マップ)の構造的グローバル情報を保存するために,テンソル・ツー・マトリックス回帰を用いた数ショットのパーソナライズ・サリエンシー予測を提案する。
一般のサルマンシーマップとは対照的に、psmは、注視領域の多様性から個々の視覚嗜好を得るのに有用な人物特有の視覚注意を示すので、大きな可能性を秘めている。
PSM予測は、見えない画像のPSMを取得するために必要であるが、個々の視線パターンの複雑さのため、その予測は依然として難しい課題である。
視線追跡データの限られた量から個々の視線パターンを認識するために、従来の方法は人の視線傾向の類似性を採用する。
しかし、従来の手法では、予測モデルに対してPSMはベクトル化される。
このようにして、画像に対応するPSMの構造的グローバル情報を無視する。
psm間の関係を自動的に明らかにするために,psmの構造情報を保存できるテンソルに基づく回帰モデルに着目し,予測精度の向上を実現する。
実験の結果,テンソルベース回帰を含む提案手法が比較法より優れていることを確認した。
関連論文リスト
- Revisiting Salient Object Detection from an Observer-Centric Perspective [48.99721284788945]
そこで我々は,視覚的手がかりだけでなく,その嗜好や意図など,観察者固有の要因を考慮し,有意な領域を予測できるオブザーバ中心の有意物体検出(OC-SOD)を提案する。
結果として、この定式化は本質的なあいまいさと人間の知覚の多様性を捉え、パーソナライズされ、文脈に合ったサリエンシの予測を可能にする。
論文 参考訳(メタデータ) (2026-02-06T03:53:01Z) - MAPS: Masked Attribution-based Probing of Strategies- A computational framework to align human and model explanations [13.217369717733222]
人工ニューラルネットワーク(ANN)から導かれる説明が人間の視覚にも応用できるかどうかを調べるためのツールであるMAPS(Masked Attribution-based Probing of Strategies)を提案する。
MAPSは、属性マップを説明マスク付き画像(EMI)に変換し、これらの最小画像上の画像毎の精度と、全刺激に対する精度の限られたピクセル予算を比較する。
ヒトとマカクに応用すると、MAPSはANN-Explanationの組合せを識別し、その説明は生物学的ビジョンと最も密接に一致し、より少ない行動試験を必要としながら、バブルマスクの行動妥当性を達成する。
論文 参考訳(メタデータ) (2025-10-14T04:40:23Z) - PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction [14.053830475673031]
対象的パーソナライズド・アテンション・フォー・ビデオ(Personive Personalized Attention for... Videos)は、年齢や性別によって4,500人以上の参加者の視線行動を486ビデオで捉えた大規模マルチモーダル・データセットである。
本稿では,MLLM上に構築され,多属性ユーザプロファイルによるポイント予測を導出する,強化学習最適化眼球追跡によるパーソナライズド視覚の相違を特徴付ける新しいアイトラッキング・サリエンシ・モデルであるPre-MAPを提案する。
論文 参考訳(メタデータ) (2025-07-25T12:32:29Z) - A Comparative Study of Scanpath Models in Graph-Based Visualization [7.592272924252313]
アイトラッキング(ET)データは、コスト、プライバシ、スケーラビリティに関する課題を提示する。
本研究では,40名の参加者を対象に,グラフ解析を行ったET実験を行った。
我々は,DeepGaze,UMSS,Gazeformerなどのモデルで生成したヒトスキャンパスと合成パスを比較した。
論文 参考訳(メタデータ) (2025-03-31T14:43:42Z) - GFM4MPM: Towards Geospatial Foundation Models for Mineral Prospectivity Mapping [2.7998963147546148]
本研究では,ラベルのない地理空間データのみを用いて,バックボーンニューラルネットワークを自己教師型で学習する自己教師型アプローチを提案する。
以上の結果から,自己超越が学習特徴の堅牢性を促進し,予測精度が向上することが示唆された。
我々は、説明可能な人工知能技術を利用して、個々の予測が地質学的観点から解釈できることを実証する。
論文 参考訳(メタデータ) (2024-06-18T16:24:28Z) - MIMIC: Mask Image Pre-training with Mix Contrastive Fine-tuning for
Facial Expression Recognition [11.820043444385432]
Mix Contrastive Fine-tuning (MIMIC) を用いた Mask Image pre-training という新しいFERトレーニングパラダイムを導入する。
初期段階では、一般画像のマスク画像再構成により、ViTを事前訓練する。
微調整段階において、より広範囲の正のサンプルを用いてモデルを強化する混合教師付きコントラスト学習プロセスを導入する。
論文 参考訳(メタデータ) (2024-01-14T10:30:32Z) - HAP: Structure-Aware Masked Image Modeling for Human-Centric Perception [97.55089867970874]
本稿では,この課題に対する事前学習手法として,マスク付き画像モデリング(MIM)を導入する。
この知見に触発され、人間の前部である直感的な人体構造を事前学習に組み込む。
これにより、モデルが事前トレーニング中に身体構造情報に集中し、さまざまな人間中心の知覚タスクに実質的な利益をもたらす。
論文 参考訳(メタデータ) (2023-10-31T17:56:11Z) - Independent Distribution Regularization for Private Graph Embedding [55.24441467292359]
グラフ埋め込みは属性推論攻撃の影響を受けやすいため、攻撃者は学習したグラフ埋め込みからプライベートノード属性を推測することができる。
これらの懸念に対処するため、プライバシ保護グラフ埋め込み手法が登場した。
独立分散ペナルティを正規化項として支援し, PVGAE(Private Variational Graph AutoEncoders)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-16T13:32:43Z) - Privacy-Preserved Neural Graph Similarity Learning [99.78599103903777]
本稿では,グラフ類似性学習のためのプライバシ保存型ニューラルグラフマッチングネットワークモデルPPGMを提案する。
再構成攻撃を防ぐため、提案モデルではデバイス間でノードレベルの表現を通信しない。
グラフプロパティに対する攻撃を軽減するため、両方のベクトルの情報を含む難読化機能は通信される。
論文 参考訳(メタデータ) (2022-10-21T04:38:25Z) - Improving saliency models' predictions of the next fixation with humans'
intrinsic cost of gaze shifts [6.315366433343492]
我々は,次の視線目標を予測し,視線に対する人的コストを実証的に測定するための原則的枠組みを開発する。
我々は、人間の視線嗜好の実装を提供する。これは、人間の次の視線目標に対する任意の正当性モデルの予測を改善するために使用できる。
論文 参考訳(メタデータ) (2022-07-09T11:21:13Z) - Contextualize differential privacy in image database: a lightweight
image differential privacy approach based on principle component analysis
inverse [35.06571163816982]
差分プライバシー(DP)は、データベース内のプライバシーに敏感な情報を保存するためのデファクトスタンダードである。
DPの統合によるプライバシ・精度のトレードオフは、差分プライベート画像データベースの文脈では不十分である。
本研究の目的は、概念微分プライバシーと画像の統合を明示的かつ直感的に示すことによって、画像中のDPを文脈化することである。
論文 参考訳(メタデータ) (2022-02-16T19:36:49Z) - Myope Models -- Are face presentation attack detection models
short-sighted? [3.4376560669160394]
プレゼンテーション攻撃は生体認証システムへの繰り返しの脅威であり、インポスタはこれらのシステムをバイパスしようとする。
本研究は,作物と無作為の顔提示攻撃検出(PAD)モデルの比較研究である。
その結果,画像に背景が存在する場合,その性能は一貫して良好であることがわかった。
論文 参考訳(メタデータ) (2021-11-22T11:28:44Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - An Adversarial Human Pose Estimation Network Injected with Graph
Structure [75.08618278188209]
本稿では,いくつかの関節が見えない場合に,可視関節の局所化精度を向上させるために,新しいGAN(Generative Adversarial Network)を設計する。
ネットワークは、2つのシンプルで効率的なモジュール、カスケード機能ネットワーク(CFN)とグラフ構造ネットワーク(GSN)で構成されています。
論文 参考訳(メタデータ) (2021-03-29T12:07:08Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z) - An Unsupervised Information-Theoretic Perceptual Quality Metric [7.887535787216618]
我々は,最近のBAPPS画像品質評価データセットにおいて,PIMは教師付きメトリクスと競合することを示す。
また、ImageNet-Cデータセットを用いて定性的な実験を行い、アーキテクチャの詳細に関してPIMが堅牢であることを示す。
論文 参考訳(メタデータ) (2020-06-11T19:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。