論文の概要: Deep semantic gaze embedding and scanpath comparison for expertise
classification during OPT viewing
- arxiv url: http://arxiv.org/abs/2003.13987v1
- Date: Tue, 31 Mar 2020 07:00:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 00:30:37.249144
- Title: Deep semantic gaze embedding and scanpath comparison for expertise
classification during OPT viewing
- Title(参考訳): 視聴覚における専門知識分類のための深い意味的視線埋め込みとスカンパス比較
- Authors: Nora Castner, Thomas K\"ubler, Katharina Scheiter, Juilane Richter,
Th\'er\'ese Eder, Fabian H\"uttig, Constanze Keutel, Enkelejda Kasneci
- Abstract要約: 本稿では,畳み込みニューラルネットワーク(CNN)を用いた視線スキャンパス比較手法を提案する。
筆者らのアプローチでは,画像意味論を取り入れたまま,93%の精度で初級者から専門家を識別することができた。
- 参考スコア(独自算出の注目度): 6.700983301090583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling eye movement indicative of expertise behavior is decisive in user
evaluation. However, it is indisputable that task semantics affect gaze
behavior. We present a novel approach to gaze scanpath comparison that
incorporates convolutional neural networks (CNN) to process scene information
at the fixation level. Image patches linked to respective fixations are used as
input for a CNN and the resulting feature vectors provide the temporal and
spatial gaze information necessary for scanpath similarity comparison.We
evaluated our proposed approach on gaze data from expert and novice dentists
interpreting dental radiographs using a local alignment similarity score. Our
approach was capable of distinguishing experts from novices with 93% accuracy
while incorporating the image semantics. Moreover, our scanpath comparison
using image patch features has the potential to incorporate task semantics from
a variety of tasks
- Abstract(参考訳): 専門的行動を示す眼球運動のモデル化はユーザ評価において決定的である。
しかし,タスク意味論が視線行動に影響を及ぼすことは疑いようがない。
本稿では,畳み込みニューラルネットワーク(CNN)を組み込んで,シーン情報を固定レベルで処理する手法を提案する。
それぞれの固定に関連付けられた画像パッチをCNNの入力として使用し,得られた特徴ベクトルは,スキャンパス類似度比較に必要な時間的および空間的視線情報を提供する。
画像意味論を取り入れつつ、93%の精度で専門家と初心者を区別する手法を開発した。
さらに、画像パッチ機能を用いたスキャンパス比較では、様々なタスクからタスクセマンティクスを組み込む可能性がある。
関連論文リスト
- Graph Self-Supervised Learning for Endoscopic Image Matching [1.8275108630751844]
鍵点間の空間関係をモデル化するために,局所的な視覚的外観を捉える畳み込みニューラルネットワークと注目に基づくグラフニューラルネットワークを組み合わせた,新たな自己教師型アプローチを提案する。
我々のアプローチはラベル付きデータを必要とせず、完全に自己管理されたスキームで訓練されている。
提案手法は,最先端の手工法と深層学習法より優れ,精度(1)とマッチングスコア(99.3%)で優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-19T19:53:41Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - An Inter-observer consistent deep adversarial training for visual
scanpath prediction [66.46953851227454]
本稿では,軽量なディープニューラルネットワークによるスキャンパス予測のための,サーバ間一貫した対向トレーニング手法を提案する。
我々は、最先端の手法に関して、我々のアプローチの競争力を示す。
論文 参考訳(メタデータ) (2022-11-14T13:22:29Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Weakly supervised semantic segmentation of tomographic images in the
diagnosis of stroke [0.0]
本稿では,非コントラスト計算トモグラフィ脳画像上での急性脳梗塞による領域分割の自動アルゴリズムを提案する。
提案アルゴリズムは,いくつかの画像が正確にラベル付けされ,いくつかの画像が不正確なラベル付けされた場合に,弱教師付きシナリオで学習するために設計されている。
論文 参考訳(メタデータ) (2021-09-04T15:24:38Z) - Scene Graph Embeddings Using Relative Similarity Supervision [4.137464623395376]
グラフ畳み込みネットワークを用いて,シーングラフの構造を活用し,意味的画像検索に有用な画像埋め込みを生成する。
本稿では,類似画像と類似画像の対で動作し,それらの間の相対順序を埋め込み空間に課す新しい損失関数を提案する。
このランキング損失と直感的なトリプルサンプリング戦略が、検索タスクでよく知られたコントラスト損失を上回った堅牢な表現につながることを実証します。
論文 参考訳(メタデータ) (2021-04-06T09:13:05Z) - Content-Based Detection of Temporal Metadata Manipulation [91.34308819261905]
画像の撮像時間とその内容と地理的位置とが一致しているかどうかを検証するためのエンドツーエンドのアプローチを提案する。
中心となる考え方は、画像の内容、キャプチャ時間、地理的位置が一致する確率を予測するための教師付き一貫性検証の利用である。
我々のアプローチは、大規模なベンチマークデータセットの以前の作業により改善され、分類精度が59.03%から81.07%に向上した。
論文 参考訳(メタデータ) (2021-03-08T13:16:19Z) - Geography-Aware Self-Supervised Learning [79.4009241781968]
異なる特徴により、標準ベンチマークにおけるコントラスト学習と教師あり学習の間には、非自明なギャップが持続していることが示される。
本稿では,リモートセンシングデータの空間的整合性を利用した新しいトレーニング手法を提案する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションにおけるコントラスト学習と教師あり学習のギャップを埋めるものである。
論文 参考訳(メタデータ) (2020-11-19T17:29:13Z) - Graph Neural Networks for UnsupervisedDomain Adaptation of
Histopathological ImageAnalytics [22.04114134677181]
組織像解析のための教師なし領域適応のための新しい手法を提案する。
特徴空間に画像を埋め込むバックボーンと、ラベルで画像の監視信号をプロパゲートするグラフニューラルネットワーク層に基づいている。
実験では、4つの公開データセット上での最先端のパフォーマンスを評価する。
論文 参考訳(メタデータ) (2020-08-21T04:53:44Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z) - Relevance Prediction from Eye-movements Using Semi-interpretable
Convolutional Neural Networks [9.007191808968242]
眼球運動からテキスト文書の認識関連性を予測するための画像分類手法を提案する。
視線追跡調査では、参加者は短いニュース記事を読み、引き金の質問に答えるために関連性または無関係であると評価した。
参加者の眼球運動スキャンパスを画像としてエンコードし、これらのスキャンパス画像を用いて畳み込みニューラルネットワーク分類器を訓練する。
論文 参考訳(メタデータ) (2020-01-15T07:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。