Fugu-MT 論文翻訳(概要): Do Large Language Models Know What They Don't Know?

論文の概要: Do Large Language Models Know What They Don't Know?

arxiv url: http://arxiv.org/abs/2305.18153v2
Date: Tue, 30 May 2023 15:14:06 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-31 11:24:34.347577
Title: Do Large Language Models Know What They Don't Know?
Title（参考訳）: 大きな言語モデルは、彼らが知らないことを知っていますか?
Authors: Zhangyue Yin, Qiushi Sun, Qipeng Guo, Jiawen Wu, Xipeng Qiu, Xuanjing Huang
Abstract要約: 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクに優れた知識を持つ。膨大な知識にもかかわらず、LLMはそれらが適合し理解できる情報の量によって制限されている。本研究の目的は,LLMの自己理解能力を評価することである。
参考スコア（独自算出の注目度）: 74.65014158544011
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models (LLMs) have a wealth of knowledge that allows them to excel in various Natural Language Processing (NLP) tasks. Current research focuses on enhancing their performance within their existing knowledge. Despite their vast knowledge, LLMs are still limited by the amount of information they can accommodate and comprehend. Therefore, the ability to understand their own limitations on the unknows, referred to as self-knowledge, is of paramount importance. This study aims to evaluate LLMs' self-knowledge by assessing their ability to identify unanswerable or unknowable questions. We introduce an automated methodology to detect uncertainty in the responses of these models, providing a novel measure of their self-knowledge. We further introduce a unique dataset, SelfAware, consisting of unanswerable questions from five diverse categories and their answerable counterparts. Our extensive analysis, involving 20 LLMs including GPT-3, InstructGPT, and LLaMA, discovering an intrinsic capacity for self-knowledge within these models. Moreover, we demonstrate that in-context learning and instruction tuning can further enhance this self-knowledge. Despite this promising insight, our findings also highlight a considerable gap between the capabilities of these models and human proficiency in recognizing the limits of their knowledge.
Abstract（参考訳）: 大規模言語モデル(llm)には豊富な知識があり、様々な自然言語処理(nlp)タスクにおいて優れている。現在の研究は、彼らの既存の知識におけるパフォーマンスの向上に焦点を当てている。膨大な知識にもかかわらず、LLMはそれらが適合し理解できる情報の量によって制限されている。したがって、自己知識と呼ばれる無知における自身の限界を理解する能力は、最重要事項である。本研究は,llmsの自己認識能力を評価することを目的としている。我々は,これらのモデルの応答の不確実性を検出するための自動化手法を導入し,その自己認識の新たな尺度を提供する。さらに,5つのカテゴリと回答可能なカテゴリから回答できない質問からなる,ユニークなデータセットであるSelfAwareを導入する。 GPT-3, InstructGPT, LLaMAを含む20個のLLMを対象とし, これらのモデルに内在する自己認識能力について検討した。さらに,インコンテキスト学習と命令チューニングが,この自己認識をさらに強化できることを実証する。この有望な洞察にもかかわらず、我々の研究結果は、これらのモデルの能力と人間の知識の限界を認識する能力の間にかなりのギャップがあることも示している。

関連論文リスト

Introspective Growth: Automatically Advancing LLM Expertise in Technology Judgment [0.0]
大きな言語モデル(LLM)は、概念的理解の兆候をますます示している。彼らの内部知識の多くは、潜伏し、ゆるやかに構造化され、アクセスや評価が難しいままである。 LLMの理解を改善するための軽量でスケーラブルな戦略として,自己問合せを提案する。
論文参考訳（メタデータ） (2025-05-18T15:04:02Z)
Line of Duty: Evaluating LLM Self-Knowledge via Consistency in Feasibility Boundaries [0.0]
本研究は,新たな手法を用いて,異なるタイプのLDM自己知識に関する本質的な洞察を得ることを目的とする。 GPT-4oやMistral Largeのようなフロンティアモデルでさえ、その80%以上の能力を確信していないことが分かりました。
論文参考訳（メタデータ） (2025-03-14T10:07:07Z)
Do Large Language Models Know How Much They Know? [15.558423196651995]
大規模言語モデル (LLM) は高機能なシステムとして登場した。インテリジェントシステムの望ましい属性は、自身の知識の範囲を認識する能力である。このベンチマークは、モデルが過度の、不十分な、あるいは正確な量の情報をリコールするかどうかを評価する。
論文参考訳（メタデータ） (2025-02-26T21:33:06Z)
WisdomBot: Tuning Large Language Models with Artificial Intelligence Knowledge [17.74988145184004]
大規模言語モデル(LLM)は自然言語処理(NLP)の強力なツールとして登場した。本稿では,LLMの力と教育理論を組み合わせた,WisdomBotという教育用LLMについて述べる。本稿では,推論中の2つの重要な拡張,すなわち,ローカル知識ベース検索の強化と,推論中の検索エンジン検索の強化を紹介する。
論文参考訳（メタデータ） (2025-01-22T13:36:46Z)
KaLM: Knowledge-aligned Autoregressive Language Modeling via Dual-view Knowledge Graph Contrastive Learning [74.21524111840652]
本稿では、textitKnowledge-aligned Language Modeling アプローチである textbfKaLM を提案する。明示的な知識アライメントと暗黙的な知識アライメントという共同目的を通じて、KG知識と整合するように、自己回帰的な大規模言語モデルを微調整する。特に,本手法は知識駆動型タスクの評価において顕著な性能向上を実現している。
論文参考訳（メタデータ） (2024-12-06T11:08:24Z)
Large Language Models are Limited in Out-of-Context Knowledge Reasoning [65.72847298578071]
大規模言語モデル (LLMs) は、文脈内推論の実行において広範な知識と強力な能力を持っている。本稿では、複数の知識を組み合わせて新しい知識を推論する、文脈外知識推論(OCKR)という、文脈外推論の重要な側面に焦点を当てる。
論文参考訳（メタデータ） (2024-06-11T15:58:59Z)
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models [83.5849717262019]
本研究では,LLMの微粒で粗粒な知識認識を改善するための知識認識ファインタニング(KnowTuning)手法を提案する。 KnowTuningは、きめ細かい事実評価の下で、より少ない事実エラー率で多くの事実を生成する。
論文参考訳（メタデータ） (2024-02-17T02:54:32Z)
Into the Unknown: Self-Learning Large Language Models [0.0]
モデルに未知の原子知識を特定するために,未知の点 (PiU) という概念を導入する。 LLMの自己学習能力を評価するための評価指標を開発した。
論文参考訳（メタデータ） (2024-02-14T12:56:58Z)
RECALL: A Benchmark for LLMs Robustness against External Counterfactual Knowledge [69.79676144482792]
本研究の目的は,LLMが外部知識から信頼できる情報を識別する能力を評価することである。本ベンチマークは,質問応答とテキスト生成という2つのタスクから構成される。
論文参考訳（メタデータ） (2023-11-14T13:24:19Z)
Learn to Refuse: Making Large Language Models More Controllable and Reliable through Knowledge Scope Limitation and Refusal Mechanism [0.0]
大規模言語モデル(LLM)は印象的な言語理解と生成能力を示している。これらのモデルは欠陥がなく、しばしばエラーや誤報を含む応答を生成する。本稿では,LLMに対して,誤りを避けるために,難解な質問への回答を拒否するように指示する拒絶機構を提案する。
論文参考訳（メタデータ） (2023-11-02T07:20:49Z)
Exploring the Cognitive Knowledge Structure of Large Language Models: An Educational Diagnostic Assessment Approach [50.125704610228254]
大規模言語モデル(LLM)は、様々なタスクにまたがる例外的なパフォーマンスを示すだけでなく、知性の火花も示している。近年の研究では、人間の試験における能力の評価に焦点が当てられ、異なる領域における彼らの印象的な能力を明らかにしている。ブルーム分類に基づく人体検査データセットであるMoocRadarを用いて評価を行った。
論文参考訳（メタデータ） (2023-10-12T09:55:45Z)
Self-Knowledge Guided Retrieval Augmentation for Large Language Models [59.771098292611846]
大規模言語モデル(LLM)はタスク固有の微調整なしで優れた性能を示す。検索に基づく手法は、非パラメトリックな世界知識を提供し、質問応答のようなタスクのパフォーマンスを向上させることができる。 SKR(Self-Knowledge guided Retrieval augmentation)は、LLMがこれまで遭遇した質問を参照できるようにする、シンプルで効果的な方法である。
論文参考訳（メタデータ） (2023-10-08T04:22:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。