論文の概要: Longer Fixations, More Computation: Gaze-Guided Recurrent Neural
Networks
- arxiv url: http://arxiv.org/abs/2311.00159v1
- Date: Tue, 31 Oct 2023 21:32:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 15:48:01.272498
- Title: Longer Fixations, More Computation: Gaze-Guided Recurrent Neural
Networks
- Title(参考訳): より長い修正、より計算: Gaze-Guided Recurrent Neural Networks
- Authors: Xinting Huang, Jiajing Wan, Ioannis Kritikos, Nora Hollenstein
- Abstract要約: 人間はさまざまなペースでテキストを読み、機械学習モデルはそれぞれのトークンを同じように扱う。
本稿では,この直感を固定誘導並列RNNやレイヤを用いた新しいモデルに変換する。
興味深いことに、ニューラルネットワークによって予測される固定期間は、人間の固定と多少似ている。
- 参考スコア(独自算出の注目度): 12.57650361978445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans read texts at a varying pace, while machine learning models treat each
token in the same way in terms of a computational process. Therefore, we ask,
does it help to make models act more like humans? In this paper, we convert
this intuition into a set of novel models with fixation-guided parallel RNNs or
layers and conduct various experiments on language modeling and sentiment
analysis tasks to test their effectiveness, thus providing empirical validation
for this intuition. Our proposed models achieve good performance on the
language modeling task, considerably surpassing the baseline model. In
addition, we find that, interestingly, the fixation duration predicted by
neural networks bears some resemblance to humans' fixation. Without any
explicit guidance, the model makes similar choices to humans. We also
investigate the reasons for the differences between them, which explain why
"model fixations" are often more suitable than human fixations, when used to
guide language models.
- Abstract(参考訳): 人間はさまざまなペースでテキストを読み、機械学習モデルは計算プロセスの観点から、それぞれのトークンを同じように扱う。
したがって、モデルをより人間らしく振る舞うのに役立つのだろうか?
本稿では,この直観を固定誘導並列RNNやレイヤを用いた新しいモデルに変換し,言語モデリングおよび感情分析タスクの様々な実験を行い,その有効性を検証することにより,この直観に対する実証的検証を行う。
提案するモデルは言語モデリングタスクにおいて、ベースラインモデルを大幅に上回る優れた性能を達成します。
さらに、興味深いことに、ニューラルネットワークによって予測される固定期間は、人間の固定に類似している。
明確なガイダンスがなければ、モデルも人間と同じような選択をする。
また、これらの違いの原因についても検討し、言語モデルの指導に使用する場合、「モデル修正」が人間の固定よりも適している理由を説明する。
関連論文リスト
- Reverse-Engineering the Reader [43.26660964074272]
本稿では,線形回帰器のパラメータを暗黙的に最適化するために,言語モデルを微調整する新しいアライメント手法を提案する。
単語をテストケースとして使用し、複数のモデルサイズとデータセットにわたる手法を評価する。
ダウンストリームNLPタスクにおける心理測定パワーとモデルの性能の逆関係と、ホールドアウトテストデータにおけるその難易度を見出した。
論文 参考訳(メタデータ) (2024-10-16T23:05:01Z) - DevBench: A multimodal developmental benchmark for language learning [0.34129029452670606]
タスクと行動データに基づいて視覚言語モデルを評価するベンチマークであるDevBenchを紹介する。
DevBenchは、モデルを人間の言語開発と比較するためのベンチマークを提供する。
これらの比較は、モデルと人間の言語学習プロセスの分岐方法を強調する。
論文 参考訳(メタデータ) (2024-06-14T17:49:41Z) - On Modifying a Neural Network's Perception [3.42658286826597]
本研究では,人間の定義した概念に対して,人工ニューラルネットワークが知覚しているものを修正する手法を提案する。
提案手法を異なるモデルで検証し、実行された操作がモデルによって適切に解釈されているかどうかを評価し、それらに対してどのように反応するかを解析する。
論文 参考訳(メタデータ) (2023-03-05T12:09:37Z) - What do Large Language Models Learn beyond Language? [10.9650651784511]
事前学習モデルは、非事前学習ニューラルモデルに匹敵する性能を著しく上回っていることがわかった。
実験により、多言語テキストやコンピュータコードで事前学習しても、事前学習の効果が持続することが明らかとなった。
その結果,言語モデルの事前学習能力と帰納学習能力との間には,未解明の深い関係があることが示唆された。
論文 参考訳(メタデータ) (2022-10-21T23:43:13Z) - Dependency-based Mixture Language Models [53.152011258252315]
依存性に基づく混合言語モデルを紹介する。
より詳しくは、依存関係モデリングの新たな目的により、まずニューラルネットワークモデルを訓練する。
次に、前回の依存性モデリング確率分布と自己意図を混合することにより、次の確率を定式化する。
論文 参考訳(メタデータ) (2022-03-19T06:28:30Z) - Interpreting Language Models with Contrastive Explanations [99.7035899290924]
言語モデルは、音声、数字、時制、意味論など、トークンを予測するための様々な特徴を考慮しなければならない。
既存の説明手法は、これらの特徴の証拠を1つの説明に分割するが、人間の理解には理解できない。
比較的な説明は、主要な文法現象の検証において、非対照的な説明よりも定量的に優れていることを示す。
論文 参考訳(メタデータ) (2022-02-21T18:32:24Z) - Unnatural Language Inference [48.45003475966808]
我々は、RoBERTaやBARTのような最先端のNLIモデルは、ランダムに並べ替えられた単語の例に不変であり、時にはよりよく機能することさえあります。
我々の発見は、自然言語理解モデルと、その進捗を測定するために使われるタスクが、本当に人間のような構文理解を必要とするという考えに疑問を投げかけている。
論文 参考訳(メタデータ) (2020-12-30T20:40:48Z) - To what extent do human explanations of model behavior align with actual
model behavior? [91.67905128825402]
モデル推論決定の人間による説明が、モデルが実際にこれらの決定を下す方法と一致する程度を調べた。
自然言語の人間の説明が入力語に対するモデル感度とどのように一致するかを定量化する2つのアライメント指標を定義した。
モデルと人間の説明との整合は、NLI上のモデルの精度によって予測されないことが判明した。
論文 参考訳(メタデータ) (2020-12-24T17:40:06Z) - Interpreting convolutional networks trained on textual data [0.0]
我々は,テキストデータに基づく畳み込みモデルを訓練し,そのフィルタ値を用いてモデルのグローバル論理を解析する。
モデルロジックのコーパスで最も重要な単語を見つけ、残りの単語を取り除きます。
5%以上の重要な単語でトレーニングされた新しいモデルは、トレーニング時間を半分以上削減しながら、オリジナルのモデルと同じパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2020-10-20T20:12:05Z) - Multi-timescale Representation Learning in LSTM Language Models [69.98840820213937]
言語モデルは、非常に短いから非常に長いまでの時間スケールで単語間の統計的依存関係を捉えなければならない。
我々は、長期記憶言語モデルにおけるメモリゲーティング機構が、パワーローの減衰を捉えることができるかの理論を導出した。
実験の結果,自然言語で学習したLSTM言語モデルは,この理論分布を近似することがわかった。
論文 参考訳(メタデータ) (2020-09-27T02:13:38Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。