論文の概要: How to Query Language Models?
- arxiv url: http://arxiv.org/abs/2108.01928v1
- Date: Wed, 4 Aug 2021 09:38:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-05 19:27:15.588131
- Title: How to Query Language Models?
- Title(参考訳): 言語モデルをクエリする方法?
- Authors: Leonard Adolphs, Shehzaad Dhuliawala, Thomas Hofmann
- Abstract要約: 大規模事前学習言語モデル (LM) は言語的、事実的、常識的な知識を回復することができる。
マスクベースのLMに格納されている知識にアクセスするには、クローゼスタイルの質問を使用して、モデルに空白を埋めることができます。
質問を曖昧にするために人間の行動にインスパイアされた我々は、例によってLMを問うことを提案する。
- 参考スコア(独自算出の注目度): 27.28516729683645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large pre-trained language models (LMs) are capable of not only recovering
linguistic but also factual and commonsense knowledge. To access the knowledge
stored in mask-based LMs, we can use cloze-style questions and let the model
fill in the blank. The flexibility advantage over structured knowledge bases
comes with the drawback of finding the right query for a certain information
need. Inspired by human behavior to disambiguate a question, we propose to
query LMs by example. To clarify the ambivalent question "Who does Neuer play
for?", a successful strategy is to demonstrate the relation using another
subject, e.g., "Ronaldo plays for Portugal. Who does Neuer play for?". We apply
this approach of querying by example to the LAMA probe and obtain substantial
improvements of up to 37.8% for BERT-large on the T-REx data when providing
only 10 demonstrations--even outperforming a baseline that queries the model
with up to 40 paraphrases of the question. The examples are provided through
the model's context and thus require neither fine-tuning nor an additional
forward pass. This suggests that LMs contain more factual and commonsense
knowledge than previously assumed--if we query the model in the right way.
- Abstract(参考訳): 大規模な事前学習言語モデル(LM)は言語だけでなく、事実や常識の知識を回復することができる。
マスクベースのlmsに格納されている知識にアクセスするには、clozeスタイルの質問を使って、モデルに空白を埋め込ませることができます。
構造化知識ベースに対する柔軟性の優位性は、特定の情報を必要とする適切なクエリを見つけるのに欠点がある。
質問を曖昧にするために人間の行動にインスパイアされた我々は、例によってLMを問うことを提案する。
neuerは誰のためにプレーするのか?
「『ロナルド・プレイズ・フォー・ポルトガル』など他の主題を用いてその関係を示す戦略が成功した。」
原題は「Who do Neuer play for?
この手法をLAMAプローブに適用し,T-RExデータに対するBERTの最大37.8%の改善を実現した。
例はモデルのコンテキストを通じて提供され、微調整も追加のフォワードパスも必要としない。
これは、lmsが以前想定されていたよりも事実的で常識的な知識を持っていることを示唆している。
関連論文リスト
- Crafting Interpretable Embeddings by Asking LLMs Questions [89.49960984640363]
大規模言語モデル(LLM)は、自然言語処理タスクの増大に対して、テキスト埋め込みを急速に改善した。
質問応答埋め込み (QA-Emb) を導入し, 各特徴がLLMに対して質問された質問に対する回答を表す。
我々はQA-Embを用いて、言語刺激に対するfMRIボクセル応答を予測するための解釈可能なモデルを柔軟に生成する。
論文 参考訳(メタデータ) (2024-05-26T22:30:29Z) - Where is the answer? Investigating Positional Bias in Language Model Knowledge Extraction [36.40833517478628]
大規模な言語モデルでは、更新を最新状態に保つか、あるいは新しいドメインに適応する必要がある。
1つの鍵は、記憶された情報がクエリプロンプトで抽出可能な方法で最新の情報を記憶することである。
微調整中に文書の難易度を最小化しているにもかかわらず、LLMはプロンプト文を通して情報を取り出すのに苦労している。
論文 参考訳(メタデータ) (2024-02-16T06:29:16Z) - Self-Knowledge Guided Retrieval Augmentation for Large Language Models [59.771098292611846]
大規模言語モデル(LLM)はタスク固有の微調整なしで優れた性能を示す。
検索に基づく手法は、非パラメトリックな世界知識を提供し、質問応答のようなタスクのパフォーマンスを向上させることができる。
SKR(Self-Knowledge guided Retrieval augmentation)は、LLMがこれまで遭遇した質問を参照できるようにする、シンプルで効果的な方法である。
論文 参考訳(メタデータ) (2023-10-08T04:22:33Z) - FreshLLMs: Refreshing Large Language Models with Search Engine
Augmentation [92.43001160060376]
本研究では,現在の世界知識をテストする質問に答える文脈において,大規模言語モデル(LLM)の事実性について検討する。
多様な質問や回答のタイプを含む新しい動的QAベンチマークであるFreshQAを紹介する。
我々は,2モード評価法により,閉じたLLMとオープンソースのLLMの多種多様な配列をベンチマークし,その正しさと幻覚の両面を計測する。
これらの結果に触発されたFreshPromptは、FreshQA上でのLLMの性能を大幅に向上させる単純な数ショットプロンプトである。
論文 参考訳(メタデータ) (2023-10-05T00:04:12Z) - Knowledge-Augmented Language Model Prompting for Zero-Shot Knowledge
Graph Question Answering [7.888547093390469]
大言語モデル(LLM)は、ゼロショットのクローズドブック質問応答タスクを実行することができる。
我々は,LSMの入力において,その知識を直接拡張することを提案する。
我々のフレームワークであるKAPING(Knowledge-Augmented Language Model Prompting)は、モデルトレーニングを必要としないため、完全にゼロショットである。
論文 参考訳(メタデータ) (2023-06-07T04:15:21Z) - When Not to Trust Language Models: Investigating Effectiveness of
Parametric and Non-Parametric Memories [58.3421305091187]
本稿では,事実知識を記憶する上でのLMの強みと限界を理解することを目的とする。
LMは、あまり一般的でない事実知識に苦しむと同時に、長期にわたる事実知識の記憶力向上に失敗する。
我々は、必要時にのみ非パラメトリックメモリを検索する、強力かつ効率的な検索拡張LMの簡易かつ効果的な手法を考案する。
論文 参考訳(メタデータ) (2022-12-20T18:30:15Z) - Empowering Language Models with Knowledge Graph Reasoning for Question
Answering [117.79170629640525]
我々はknOwledge ReasOning empowered Language Model (OREO-LM)を提案する。
OREO-LMは、既存のTransformerベースのLMに柔軟に接続できる新しい知識相互作用層で構成されている。
クローズド・ブック・セッティングにおいて,最先端の成果が得られ,性能が著しく向上した。
論文 参考訳(メタデータ) (2022-11-15T18:26:26Z) - Recitation-Augmented Language Models [85.30591349383849]
知識集約型NLPタスクにおいて,RECITEは強力なパラダイムであることを示す。
具体的には、リサイクリングを中間ステップとして活用することにより、新しい最先端性能を実現することができることを示す。
論文 参考訳(メタデータ) (2022-10-04T00:49:20Z) - Structured Knowledge Grounding for Question Answering [0.23068481501673416]
本稿では,知識に基づく質問応答の柔軟性,範囲の広さ,構造的推論に言語と知識を活用することを提案する。
具体的には,動的ホップを用いて関連するコンテキストを検索する知識構築手法を考案する。
そして、言語と知識の間のボトルネックを交換する情報を橋渡しする深層融合機構を考案する。
論文 参考訳(メタデータ) (2022-09-17T08:48:50Z) - Explaining Question Answering Models through Text Generation [42.36596190720944]
大規模な事前学習言語モデル(LM)は、常識と世界知識を必要とするタスクを微調整するときに驚くほどうまく機能することが示されている。
エンドツーエンドのアーキテクチャで正しい予測ができるような、LMの知識が何であるかを説明するのは難しい。
エンド・ツー・エンドのアーキテクチャに匹敵するパフォーマンスに達するタスクをいくつか示します。
論文 参考訳(メタデータ) (2020-04-12T09:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。