論文の概要: Synthesizing Human Gaze Feedback for Improved NLP Performance
- arxiv url: http://arxiv.org/abs/2302.05721v1
- Date: Sat, 11 Feb 2023 15:34:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 19:01:29.723701
- Title: Synthesizing Human Gaze Feedback for Improved NLP Performance
- Title(参考訳): NLP性能向上のためのヒューマン・ゲイズフィードバックの合成
- Authors: Varun Khurana, Yaman Kumar Singla, Nora Hollenstein, Rajesh Kumar,
Balaji Krishnamurthy
- Abstract要約: ScanTextGANは、テキスト上で人間のスキャンパスを生成するための新しいモデルである。
ScanTextGANにより生成されたスキャンパスは、人間の視線パターンにおいて有意な認知信号に近似できることを示す。
- 参考スコア(独自算出の注目度): 20.837790838762036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Integrating human feedback in models can improve the performance of natural
language processing (NLP) models. Feedback can be either explicit (e.g. ranking
used in training language models) or implicit (e.g. using human cognitive
signals in the form of eyetracking). Prior eye tracking and NLP research reveal
that cognitive processes, such as human scanpaths, gleaned from human gaze
patterns aid in the understanding and performance of NLP models. However, the
collection of real eyetracking data for NLP tasks is challenging due to the
requirement of expensive and precise equipment coupled with privacy invasion
issues. To address this challenge, we propose ScanTextGAN, a novel model for
generating human scanpaths over text. We show that ScanTextGAN-generated
scanpaths can approximate meaningful cognitive signals in human gaze patterns.
We include synthetically generated scanpaths in four popular NLP tasks spanning
six different datasets as proof of concept and show that the models augmented
with generated scanpaths improve the performance of all downstream NLP tasks.
- Abstract(参考訳): モデルに人間のフィードバックを統合することで、自然言語処理(NLP)モデルの性能を向上させることができる。
フィードバックは明示的(例えば、訓練言語モデルで使用されるランク)または暗黙的(例えば、目追跡の形で人間の認知信号を使用する)でもよい。
視線追跡とNLP研究は、人間の視線パターンから切り離された人間のスキャンパスのような認知過程が、NLPモデルの理解と性能に役立つことを明らかにしている。
しかし,NLPタスクの実際の視線追跡データの収集は,プライバシ侵害問題に伴う高価で正確な機器を必要とするため困難である。
この課題に対処するために,テキスト上で人間のスキャンパスを生成する新しいモデルであるScanTextGANを提案する。
ScanTextGANにより生成されたスキャンパスは、人間の視線パターンにおいて有意な認知信号に近似できることを示す。
6つの異なるデータセットにまたがる4つの一般的なNLPタスクに合成生成されたスキャンパスを概念実証として含み、生成されたスキャンパスで拡張されたモデルが、下流のNLPタスクの性能を向上させることを示す。
関連論文リスト
- Caption-Driven Explorations: Aligning Image and Text Embeddings through Human-Inspired Foveated Vision [3.3295510777293837]
本稿では,キャプションタスク中の人間の注意力を調べるために,キャプションとクリックコンセント画像探索を備えたデータセットであるCapMIT1003を紹介する。
また、NevaClipは、CLIPモデルとNeVAアルゴリズムを組み合わせることで、視覚スキャンパスを予測するゼロショット方式である。
論文 参考訳(メタデータ) (2024-08-19T12:41:46Z) - Neural Sign Actors: A diffusion model for 3D sign language production from text [51.81647203840081]
手話 (SL) は難聴者および難聴者コミュニティの主要なコミュニケーション手段である。
この研究は、現実的なニューラルサインアバターに向けて重要な一歩を踏み出し、聴覚と聴覚のコミュニティ間のコミュニケーションギャップを埋める。
論文 参考訳(メタデータ) (2023-12-05T12:04:34Z) - Generative Input: Towards Next-Generation Input Methods Paradigm [49.98958865125018]
我々はGeneInputという新しい生成入力パラダイムを提案する。
すべての入力シナリオと他のインテリジェントな補助入力関数を処理するためにプロンプトを使用し、ユーザーフィードバックでモデルを最適化し、パーソナライズされた結果を提供する。
その結果,FK2C(Full-mode Key-sequence to Characters)タスクにおいて,最先端のパフォーマンスを初めて達成したことを示す。
論文 参考訳(メタデータ) (2023-11-02T12:01:29Z) - ScanDL: A Diffusion Model for Generating Synthetic Scanpaths on Texts [0.5520145204626482]
読書における眼球運動は精神言語研究において重要な役割を担っている。
眼球運動データの不足とアプリケーション時の利用不可能は、この研究のラインにとって大きな課題となっている。
ScanDLはテキスト上で合成スキャンパスを生成する新しい離散シーケンス対シーケンス拡散モデルである。
論文 参考訳(メタデータ) (2023-10-24T07:52:19Z) - Pre-Trained Language Models Augmented with Synthetic Scanpaths for
Natural Language Understanding [3.6498648388765513]
我々は,合成スカンパス生成とスカンパス拡張言語モデルを統合するモデルを開発した。
提案手法は,基礎となる言語モデルより優れるだけでなく,実際の人間の視線データを付加した言語モデルに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2023-10-23T08:15:38Z) - Contrastive Language-Image Pretrained Models are Zero-Shot Human
Scanpath Predictors [2.524526956420465]
CapMIT1003は、キャプションタスク中に収集されたキャプションとクリックコンテンツ画像のデータベースである。
NevaClipは、視覚スキャンパスを予測する新しいゼロショット手法である。
論文 参考訳(メタデータ) (2023-05-21T07:24:50Z) - Artificial Text Detection via Examining the Topology of Attention Maps [58.46367297712477]
トポロジカルデータ分析(TDA)に基づく3種類の解釈可能なトポロジカル特徴を提案する。
BERTモデルから派生した特徴が3つの共通データセットにおいて、カウントベースとニューラルベースベースラインを最大10%上回っていることを実証的に示す。
特徴の探索解析は表面に対する感度と構文的性質を明らかにしている。
論文 参考訳(メタデータ) (2021-09-10T12:13:45Z) - Graph Neural Networks for Natural Language Processing: A Survey [64.36633422999905]
本稿では,自然言語処理のためのグラフニューラルネットワーク(GNN)について概観する。
我々は,グラフ構築,グラフ表現学習,グラフベースエンコーダ・デコーダモデルという3つの軸に沿って,NLP用GNNの既存の研究を組織する,NLP用GNNの新しい分類法を提案する。
論文 参考訳(メタデータ) (2021-06-10T23:59:26Z) - CogAlign: Learning to Align Textual Neural Representations to Cognitive
Language Processing Signals [60.921888445317705]
自然言語処理モデルに認知言語処理信号を統合するためのCogAlignアプローチを提案する。
我々は、CogAlignが、パブリックデータセット上の最先端モデルよりも、複数の認知機能で大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-06-10T07:10:25Z) - Word Shape Matters: Robust Machine Translation with Visual Embedding [78.96234298075389]
文字レベルNLPモデルの入力シンボルを新たに符号化する。
文字が印刷されたときの画像を通して各文字の形状をエンコードする。
我々はこの新たな戦略を視覚的埋め込みと呼び、NLPモデルの堅牢性を向上させることが期待されている。
論文 参考訳(メタデータ) (2020-10-20T04:08:03Z) - Improving Natural Language Processing Tasks with Human Gaze-Guided
Neural Attention [14.940723222424749]
コーパスの欠如は、人間の視線データを神経的注意機構の監視信号として統合する上で、これまで限られた進歩を遂げてきた。
本稿では,読解の認知モデルと人間の視線監督を併用したハイブリッドテキスト・サリエンシ・モデルを提案する。
我々の研究は、データ駆動型モデルと認知モデルの間のブリッジングのための実践的なアプローチを導入し、人間の視線誘導型ニューラルアテンションをNLPタスクに統合する新しい方法を示す。
論文 参考訳(メタデータ) (2020-10-15T17:14:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。