Fugu-MT 論文翻訳(概要): SWEA: Updating Factual Knowledge in Large Language Models via Subject Word Embedding Altering

論文の概要: SWEA: Updating Factual Knowledge in Large Language Models via Subject Word Embedding Altering

arxiv url: http://arxiv.org/abs/2401.17809v3
Date: Tue, 23 Apr 2024 01:08:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-24 19:16:06.706814
Title: SWEA: Updating Factual Knowledge in Large Language Models via Subject Word Embedding Altering
Title（参考訳）: SWEA:主語埋め込みによる大規模言語モデルにおけるファクチュアル知識の更新
Authors: Xiaopeng Li, Shasha Li, Shezheng Song, Huijun Liu, Bin Ji, Xi Wang, Jun Ma, Jie Yu, Xiaodong Liu, Jing Wang, Weimin Zhang,
Abstract要約: 最近のモデル編集は、大規模言語モデル(LLM)の少量の知識を効率的に更新するための有望な手法である本稿では,トークンレベルのマッチングによる埋め込みの編集を行うSWEAフレームワークを提案する。我々は、textscCounterFactおよびzsREデータセット上でSWEA$oplus$OSのSOTA(State-of-the-art)パフォーマンスを実証する。
参考スコア（独自算出の注目度）: 17.20346072074533
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The general capabilities of large language models (LLMs) make them the infrastructure for various AI applications, but updating their inner knowledge requires significant resources. Recent model editing is a promising technique for efficiently updating a small amount of knowledge of LLMs and has attracted much attention. In particular, local editing methods, which directly update model parameters, are more suitable for updating a small amount of knowledge. Local editing methods update weights by computing least squares closed-form solutions and identify edited knowledge by vector-level matching in inference, which achieve promising results. However, these methods still require a lot of time and resources to complete the computation. Moreover, vector-level matching lacks reliability, and such updates disrupt the original organization of the model's parameters. To address these issues, we propose an detachable and expandable Subject Word Embedding Altering (SWEA) framework, which finds the editing embeddings through token-level matching and adds them to the subject word embeddings in Transformer input. To get these editing embeddings, we propose optimizing then suppressing fusion method, which first optimizes learnable embedding vectors for the editing target and then suppresses the Knowledge Embedding Dimensions (KEDs) to obtain final editing embeddings. We thus propose SWEA$\oplus$OS method for editing factual knowledge in LLMs. We demonstrate the overall state-of-the-art (SOTA) performance of SWEA$\oplus$OS on the \textsc{CounterFact} and zsRE datasets. To further validate the reasoning ability of SWEA$\oplus$OS in editing knowledge, we evaluate it on the more complex \textsc{RippleEdits} benchmark. The results demonstrate that SWEA$\oplus$OS possesses SOTA reasoning ability.
Abstract（参考訳）: 大規模言語モデル(LLM)の一般的な機能により、さまざまなAIアプリケーションの基盤となるが、内部知識の更新にはかなりのリソースが必要になる。近年のモデル編集は,LLMの少数の知識を効率的に更新する上で有望な手法であり,注目を集めている。特に、モデルパラメータを直接更新するローカル編集手法は、少量の知識を更新するのにより適している。局所的な編集手法は最小二乗閉形式解を計算して重みを更新し、ベクトルレベルの推論による編集知識を同定し、有望な結果を得る。しかし、これらの手法は計算を完了するのに多くの時間とリソースを必要とする。さらに、ベクトルレベルのマッチングは信頼性に欠けており、そのような更新はモデルのパラメータの本来の構成を阻害する。これらの問題に対処するために、トークンレベルのマッチングによる編集の埋め込みを見つけ、Transformer 入力にサブジェクトワードの埋め込みを追加する、分離可能で拡張可能なサブジェクトワード埋め込み(SWEA)フレームワークを提案する。編集対象に対する学習可能な埋め込みベクトルを最適化し、次に知識埋め込み次元(KED)を抑圧し、最終的な編集埋め込みを得る。そこで我々は,LSMにおける事実知識を編集するためのSWEA$\oplus$OS法を提案する。 SWEA$\oplus$OSのSOTA(State-of-the-art)パフォーマンスを,textsc{CounterFact} および zsRE データセット上で示す。 SWEA$\oplus$OSの編集知識の推論能力を更に検証するため、より複雑な \textsc{RippleEdits} ベンチマークで評価した。その結果,SWEA$\oplus$OSはSOTA推論能力を有することがわかった。

関連論文リスト

Latent Knowledge Scalpel: Precise and Massive Knowledge Editing for Large Language Models [3.834827405473377]
大規模言語モデル(LLM)は、しばしば事前学習から不正確な情報や時代遅れの情報を保持し、推論中に誤った予測や偏りのある出力をもたらす。我々はLLMエディタであるLatent Knowledge Scalpel(LKS)を紹介し、軽量なハイパーネットワークを用いて特定のエンティティの潜在知識を操作し、正確かつ大規模な編集を可能にする。 Llama-2とMistralで行った実験では、同時編集数が10,000に達したとしても、LKSは編集されたLLMの一般的な能力を保ちながら知識編集を効果的に行う。
論文参考訳（メタデータ） (2025-08-01T03:51:43Z)
InComeS: Integrating Compression and Selection Mechanisms into LLMs for Efficient Model Editing [77.47790551485721]
In-context Learningは、コンテキストエンコーディングを通じて編集情報を解釈することで、有望な編集方法である。この方法は、大きな言語モデルの限られたコンテキストウィンドウによって制約される。編集コンテキストの処理能力を向上させるフレキシブルなフレームワークであるInComeSを提案する。
論文参考訳（メタデータ） (2025-05-28T09:20:18Z)
Knowledge Updating? No More Model Editing! Just Selective Contextual Reasoning [38.018263569983226]
信頼性,一般化,局所性,可搬性という4次元の10種類のモデル編集手法の評価を行った。次に、知識更新のためのSCR(Selective Contextual Reasoning)という簡単な手法を提案する。
論文参考訳（メタデータ） (2025-03-07T08:04:25Z)
K-Edit: Language Model Editing with Contextual Knowledge Awareness [71.73747181407323]
知識に基づくモデル編集は、大きな言語モデルの重みを正確に修正することを可能にする。我々は、文脈的に一貫した知識編集を生成するための効果的なアプローチであるK-Editを提案する。
論文参考訳（メタデータ） (2025-02-15T01:35:13Z)
AnyEdit: Edit Any Knowledge Encoded in Language Models [69.30638272162267]
大規模言語モデル(LLM)のための新しい自動回帰編集パラダイムであるAnyEditを提案する。長い形式の知識を逐次チャンクに分解し、各チャンク内のキートークンを反復的に編集し、一貫性と正確な出力を保証する。 UnKEBench、AKEW、そして我々の長文の多様な知識のための新しいEditEverythingデータセットを含むベンチマークでは、強いベースラインを21.5%上回っている。
論文参考訳（メタデータ） (2025-02-08T16:18:37Z)
StruEdit: Structured Outputs Enable the Fast and Accurate Knowledge Editing for Large Language Models [41.45831411548188]
StruEditは、他の知識編集方法と比較して、レイテンシの低い最高の精度を提供する。結果,StruEditは,他の知識編集手法と比較して,低レイテンシで常に高い精度を提供することがわかった。
論文参考訳（メタデータ） (2024-09-16T09:48:56Z)
Enhance Lifelong Model Editing with Continuous Data-Adapter Association [55.697627106315004]
大規模言語モデル(LLM)は、特定の知識を効率的に更新し、事実の誤りを避けるためにモデル編集を必要とする。現在のアプローチでは、元のパラメータを凍結し、知識修正毎に新しいアダプタを割り当てることで、シーケンシャルな編集を管理している。 ELDER, textbfEnhancing textbfLifelong motextbfDel textbfEditing with mixtutextbfRe of Low-Rank Adapter (LoRA)を提案する。
論文参考訳（メタデータ） (2024-08-19T02:27:00Z)
Detecting Edited Knowledge in Language Models [5.260519479124422]
知識編集手法(KEs)は、事前学習から学んだ言語モデルの古いまたは不正確な知識を更新することができる。生成されたアウトプットが編集された知識に基づいているか、あるいは事前学習からのファーストハンド知識に基づいているかを知ることは、生成モデルに対するユーザの信頼を高めることができる。本稿では,言語モデルにおける編集された知識を検出する新しい課題を提案する。
論文参考訳（メタデータ） (2024-05-04T22:02:24Z)
Robust and Scalable Model Editing for Large Language Models [75.95623066605259]
LLM編集のスケーラビリティと堅牢性を向上させるため,EREN(Reading Notesによる編集モデル)を提案する。既存の技術とは異なり、複数の編集から知識を統合することができ、構文的に類似しているが意味的に無関係な入力に正しく反応する。
論文参考訳（メタデータ） (2024-03-26T06:57:23Z)
VLKEB: A Large Vision-Language Model Knowledge Editing Benchmark [53.091690659399234]
大規模言語モデル(LLM)の知識編集は注目されている。 3つのメトリクス(信頼性、局所性、一般性)からなる既存のLVLM編集ベンチマークは、合成された評価画像の品質が不足している。我々は、新しいLarge $textbfV$ision-$textbfL$anguage Modelを構築するために、より信頼性の高いデータ収集手法を使用します。
論文参考訳（メタデータ） (2024-03-12T06:16:33Z)
Editing Conceptual Knowledge for Large Language Models [65.38231526537476]
本稿では,Large Language Models(LLMs)における概念知識の編集の先駆者となる。本研究では,新しいベンチマークデータセットConceptEditを構築し,評価のための新しいメトリクスセットを確立する。実験の結果,既存の編集手法は概念レベルの定義をある程度効率的に修正できるが,関連する瞬間的知識を歪ませる可能性も示された。
論文参考訳（メタデータ） (2024-03-10T16:57:10Z)
Knowledge Graph Enhanced Large Language Model Editing [37.6721061644483]
大規模言語モデル(LLM)は、自然言語処理(NLP)タスクの進行において重要な要素である。既存の編集方法は、編集に関連する知識の変化を追跡し、組み込むのに苦労する。知識グラフを利用した新しいモデル編集手法を提案し,LLM編集の強化,すなわちGLAMEを提案する。
論文参考訳（メタデータ） (2024-02-21T07:52:26Z)
On the Robustness of Editing Large Language Models [57.477943944826904]
大型言語モデル(LLM)はコミュニケーションAIの構築において重要な役割を担っているが、効率的な更新の課題に直面している。この研究は、編集方法の長所と短所を理解し、コミュニケーション型AIの実践的応用を促進することを目的としている。
論文参考訳（メタデータ） (2024-02-08T17:06:45Z)
Editing Factual Knowledge in Language Models [51.947280241185]
本稿では,この知識を編集する手法であるKnowledgeEditorを提案する。 knowledgeeditorは計算効率が高いだけでなく、lm事前トレーニングの修正も必要としない。 2つの一般的なアーキテクチャと知識集約型タスクで、KnowledgeEditorの有効性を示します。
論文参考訳（メタデータ） (2021-04-16T15:24:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。