論文の概要: Getting the Most from Eye-Tracking: User-Interaction Based Reading
Region Estimation Dataset and Models
- arxiv url: http://arxiv.org/abs/2306.07455v1
- Date: Mon, 12 Jun 2023 23:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 15:39:08.183671
- Title: Getting the Most from Eye-Tracking: User-Interaction Based Reading
Region Estimation Dataset and Models
- Title(参考訳): 視線追跡から最も多くを得る: ユーザインタラクションに基づく読み出し領域推定データセットとモデル
- Authors: Ruoyan Kong, Ruixuan Sun, Charles Chuankai Zhang, Chen Chen, Sneha
Patri, Gayathri Gajjela, and Joseph A. Konstan
- Abstract要約: ブラウザ追跡データに基づいて,地域ごとの読み出し時間を予測するモデルを構築した。
ユーザインタラクションに基づいて、メッセージレベルの読み込み時間を予測するために、マシンラーニングとディープラーニングモデルをトレーニングしました。
- 参考スコア(独自算出の注目度): 2.9531082052924233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A single digital newsletter usually contains many messages (regions). Users'
reading time spent on, and read level (skip/skim/read-in-detail) of each
message is important for platforms to understand their users' interests,
personalize their contents, and make recommendations. Based on accurate but
expensive-to-collect eyetracker-recorded data, we built models that predict
per-region reading time based on easy-to-collect Javascript browser tracking
data.
With eye-tracking, we collected 200k ground-truth datapoints on participants
reading news on browsers. Then we trained machine learning and deep learning
models to predict message-level reading time based on user interactions like
mouse position, scrolling, and clicking. We reached 27\% percentage error in
reading time estimation with a two-tower neural network based on user
interactions only, against the eye-tracking ground truth data, while the
heuristic baselines have around 46\% percentage error. We also discovered the
benefits of replacing per-session models with per-timestamp models, and adding
user pattern features. We concluded with suggestions on developing
message-level reading estimation techniques based on available data.
- Abstract(参考訳): 単一のデジタルニュースレターは通常、多くのメッセージ(リージョン)を含む。
ユーザの興味を理解し、コンテンツをパーソナライズし、レコメンデーションを行うプラットフォームにとって、各メッセージの読み込み時間と読み出し時間(スキップ/スキム/詳細)が重要である。
正確で高価なeyetracker記録データに基づいて,javascriptブラウザのトラッキングデータに基づいて,地域毎の読み込み時間を予測するモデルを構築した。
視線追跡では、ブラウザでニュースを読む参加者に200万の地上データポイントを収集しました。
そして、マウスの位置、スクロール、クリックといったユーザインタラクションに基づいて、メッセージレベルの読み込み時間を予測するために、機械学習とディープラーニングモデルをトレーニングしました。
ユーザのインタラクションのみに基づく2層ニューラルネットワークによる読解時間推定では,視線追跡の事実データに対して27-%の誤差が得られたが,ヒューリスティックベースラインの誤差は約46-%であった。
また、セッション毎のモデルをタイムスタンプ毎のモデルに置き換え、ユーザパターン機能を追加するメリットも見つけました。
最後に,利用可能なデータに基づくメッセージレベルの読書推定手法の開発について提案する。
関連論文リスト
- Reading ability detection using eye-tracking data with LSTM-based few-shot learning [0.27309692684728615]
提案手法は,Long Short Time Memory(LSTM)と軽量ニューラルネットワークを組み合わせることで,スコア予測のための回帰モデルを構築した。
実験により, 提案手法は, 数発の学習戦略により, 読み出し能力の検出における従来のスコア予測法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2024-09-13T13:06:01Z) - Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - Pre-trained Language Model with Prompts for Temporal Knowledge Graph
Completion [30.50032335014021]
我々は、新しいTKGCモデル、すなわち、TKGC(PPT)のための Prompts 付き事前学習言語モデルを提案する。
サンプルの四重項を事前訓練した言語モデル入力に変換し、タイムスタンプ間の間隔を異なるプロンプトに変換することで、暗黙的な意味情報を持つ一貫性のある文を生成する。
我々のモデルは、時間的知識グラフからの情報を言語モデルに効果的に組み込むことができる。
論文 参考訳(メタデータ) (2023-05-13T12:53:11Z) - WebQAmGaze: A Multilingual Webcam Eye-Tracking-While-Reading Dataset [42.431350136679704]
WebQAmGazeは、多言語で低コストなアイトラッキング対応データセットである。
WebQAmGazeには、英語、ドイツ語、スペイン語、トルコ語のテキストを自然に読む幅広い年齢層の600人の参加者によるWebカメラによるアイトラッキングデータが含まれている。
論文 参考訳(メタデータ) (2023-03-31T08:18:30Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - VLSNR:Vision-Linguistics Coordination Time Sequence-aware News
Recommendation [0.0]
マルチモーダルセマンティクスは、ユーザの時間的および長期的関心の理解を高めるのに有用である。
本研究では,視覚言語による時系列ニュースレコメンデーションを提案する。
また,大規模なマルチモーダルニュースレコメンデーションデータセットV-MINDを構築した。
論文 参考訳(メタデータ) (2022-10-06T14:27:37Z) - Private Federated Submodel Learning with Sparsification [60.77488903537807]
フェデレーション付きサブモデル学習(FSL)におけるプライベートリード更新書き込み(PRUW)の問題について検討する。
本稿では、サブモデルインデックス、更新値、スパース更新の座標をデータベースに公開することなく、任意のサブモデルの任意のパラメータからプライベートに読み書きする新しいスキームを提案する。
論文 参考訳(メタデータ) (2022-05-31T17:51:41Z) - Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。
近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。
知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文 参考訳(メタデータ) (2021-10-27T12:19:56Z) - Visualising Deep Network's Time-Series Representations [93.73198973454944]
機械学習モデルの普及にもかかわらず、多くの場合、モデルの内部で起きていることに関する洞察のないブラックボックスとして運用される。
本稿では,多次元時系列データの可視化に着目し,この問題に対処する手法を提案する。
高周波在庫市場データセットの実験は、この方法が迅速かつ識別可能な可視化を提供することを示しています。
論文 参考訳(メタデータ) (2021-03-12T09:53:34Z) - Towards End-to-end Video-based Eye-Tracking [50.0630362419371]
画像のみから視線を推定することは、観察不可能な人固有の要因のために難しい課題である。
本稿では,これらの意味的関係と時間的関係を明確に学習することを目的とした,新しいデータセットとアタッチメント手法を提案する。
視覚刺激からの情報と視線画像の融合が,文献に記録された人物と同じような性能を達成することにつながることを実証した。
論文 参考訳(メタデータ) (2020-07-26T12:39:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。