論文の概要: Model Editing Can Hurt General Abilities of Large Language Models
- arxiv url: http://arxiv.org/abs/2401.04700v2
- Date: Sun, 4 Feb 2024 19:04:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 03:17:32.165483
- Title: Model Editing Can Hurt General Abilities of Large Language Models
- Title(参考訳): モデル編集は大規模言語モデルの一般的な能力を傷つける
- Authors: Jia-Chen Gu, Hao-Xiang Xu, Jun-Yu Ma, Pan Lu, Zhen-Hua Ling, Kai-Wei
Chang, Nanyun Peng
- Abstract要約: LLaMA-1 (7B) の編集に特定の方法を用いることで、単一の編集だけで選択された全てのタスクにおいて、大幅な性能低下が0に近づいた。
LLaMA-1 (7B) の編集に特定の方法を用いることで、単一の編集だけで選択された全てのタスクにおいて、大幅な性能低下が0に近づいた。
- 参考スコア(独自算出の注目度): 128.32797540883507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One critical challenge that has emerged is the presence of hallucinations in
the output of large language models (LLMs) due to false or outdated knowledge.
Since retraining LLMs with updated information is resource-intensive, there has
been a growing interest in model editing. However, current model editing
methods, while effective in improving editing performance in various scenarios,
often overlook potential side effects on the general abilities of LLMs. In this
paper, we raise concerns that model editing inherently improves the factuality
of the model, but may come at the cost of a significant degradation of these
general abilities. Systematically, we analyze side effects by evaluating four
popular editing methods on three LLMs across eight representative task
categories. Extensive empirical research reveals that current model editing
methods are difficult to couple well with LLMs to simultaneously improve the
factuality and maintain the general abilities such as reasoning, question
answering, etc. Strikingly, the use of a specific method to edit LLaMA-1 (7B)
resulted in a drastic performance degradation to nearly 0 on all selected tasks
with just a single edit. Therefore, we advocate for more research efforts to
minimize the loss of general abilities acquired during LLM pre-training and to
ultimately preserve them during model editing.
- Abstract(参考訳): 重要な課題の1つは、嘘や時代遅れの知識によって大きな言語モデル(LLM)の出力に幻覚が存在することである。
更新情報によるLLMの再学習は資源集約的であるため,モデル編集への関心が高まっている。
しかし、現在のモデル編集手法は様々なシナリオにおける編集性能の改善に有効であるが、LLMの一般的な能力に対する潜在的な副作用を見落としていることが多い。
本稿では、モデル編集が本質的にモデルの事実性を改善するという懸念を提起するが、これらの一般的な能力を著しく劣化させるコストがかかる可能性がある。
システム的には,8つのタスクカテゴリにまたがる3つのLSMに対して,4つの一般的な編集方法を評価することで副作用を分析する。
広範な実証研究により、現在のモデル編集手法とllmをうまく組み合わせることで事実性が向上し、推論や質問応答などの一般的な能力を維持することが困難であることが判明した。
興味深いことに、LLaMA-1 (7B) の編集に特定のメソッドを使用することで、選択されたすべてのタスクにおいて、1つの編集だけで大幅にパフォーマンスが低下した。
そこで,本研究では,LLM事前学習時に得られる一般能力の喪失を最小化し,モデル編集時に最終的に保存する研究の取り組みをさらに進める。
関連論文リスト
- The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models Collapse [58.0132400208411]
単一の編集でさえモデル崩壊を引き起こし、様々なベンチマークタスクで大幅なパフォーマンス低下を示す。
編集後の大規模言語モデルのベンチマークは、過激な時間とリソース集約である。
提案手法は,下流タスク性能と強い相関を示す広範な実験により検証され,サロゲート指標としてパープレキシティを用いる。
論文 参考訳(メタデータ) (2024-02-15T01:50:38Z) - Model Editing at Scale leads to Gradual and Catastrophic Forgetting [2.887477629420772]
本稿では,ROMEとMEMITの2つの手法に焦点をあてて,現在のモデル編集手法を大規模に評価する。
モデルが複数の事実と逐次的に編集されるにつれて、以前編集された事実と下流タスクの実行能力を常に忘れていることがわかった。
論文 参考訳(メタデータ) (2024-01-15T03:57:15Z) - Teaching Language Models to Self-Improve through Interactive
Demonstrations [90.05698053752806]
大規模言語モデルの自己改善能力は欠如しており、より小さなモデルで学ぶことは困難である。
このような自己改善能力を持つ小型モデルのトレーニングアルゴリズムであるTriPosTを導入する。
我々は,LLaMA-7bの算数および推論タスクの性能を最大7.13%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-10-20T14:11:04Z) - MedEdit: Model Editing for Medical Question Answering with External
Knowledge Bases [47.32393367707529]
大規模言語モデル(LLM)は、医療質問応答(QA)のようなドメイン固有のタスクでよく機能しないことが多い。
本稿では,医学的事実を外部知識ベースから抽出するための総合的検索手法を提案し,それらをLCMのクエリプロンプトに組み込む。
編集したVicunaモデルでは44.46%から48.54%に精度が向上した。
論文 参考訳(メタデータ) (2023-09-27T21:26:03Z) - Automatically Correcting Large Language Models: Surveying the landscape
of diverse self-correction strategies [104.32199881187607]
大規模言語モデル(LLM)は、幅広いNLPタスクで顕著な性能を示した。
これらの欠陥を正すための有望なアプローチは自己補正であり、LLM自体が自身の出力で問題を修正するために誘導される。
本稿では,この新技術について概観する。
論文 参考訳(メタデータ) (2023-08-06T18:38:52Z) - Editing Large Language Models: Problems, Methods, and Opportunities [51.903537096207]
本稿では, LLMのモデル編集に関わる問題, 方法, 機会を深く探究する。
本稿では,モデル編集に関わるタスク定義と課題の概観と,現在処理中の最も進歩的な手法の詳細な実証分析について述べる。
本研究の目的は,各編集手法の有効性と実現可能性に関する貴重な知見を提供することであり,特定のタスクやコンテキストに対して,最も適切な方法の選択に関する情報決定を行う上で,コミュニティを支援することである。
論文 参考訳(メタデータ) (2023-05-22T16:00:00Z) - Edit at your own risk: evaluating the robustness of edited models to
distribution shifts [0.0]
モデル編集がモデルの一般的なロバスト性や、編集対象の特定の動作のロバスト性にどのように影響するかを検討する。
編集は一般的な堅牢性を低下させる傾向があるが、劣化の程度は編集アルゴリズムと選択した層に依存している。
これらの観測によって動機付けられた新しいモデル編集アルゴリズムである1-層 (1-LI) を導入し、重み空間を用いて編集タスクの精度と一般的なロバスト性の間のトレードオフをナビゲートする。
論文 参考訳(メタデータ) (2023-02-28T19:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。