論文の概要: Trace and Edit Relation Associations in GPT
- arxiv url: http://arxiv.org/abs/2401.02976v1
- Date: Sat, 30 Dec 2023 21:04:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 09:32:28.821490
- Title: Trace and Edit Relation Associations in GPT
- Title(参考訳): GPTにおけるトレースと編集関係
- Authors: Jiahang Li, Taoyu Chen, Yuanli Wang
- Abstract要約: 本研究では,関係判断に対する言語モデル計算の影響を理解するための関係追跡手法を開発した。
提案手法は,新しいデータセット上でROMEに対して試験を行い,特異性と一般化のバランスが向上したことを示す。
- 参考スコア(独自算出の注目度): 1.3742950928229078
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study introduces a novel approach for analyzing and modifying entity
relationships in GPT models, diverging from ROME's entity-focused methods. We
develop a relation tracing technique to understand the influence of language
model computations on relationship judgments. Using the FewRel dataset, we
identify key roles of MLP modules and attention mechanisms in processing
relationship information. Our method, tested against ROME on a new dataset,
shows improved balance in specificity and generalization, underscoring the
potential of manipulating early-layer modules for enhanced model understanding
and accuracy.
- Abstract(参考訳): 本研究では,GPTモデルにおけるエンティティ関係を解析・修正するための新しいアプローチを提案する。
言語モデル計算が関係判断に与える影響を理解するための関係追跡手法を開発した。
FewRelデータセットを用いて,MLPモジュールの主要な役割と,関連情報処理におけるアテンション機構を同定する。
提案手法は, ROMEに対して新しいデータセットを用いて実験を行い, モデル理解と精度を高めるために, 初期層モジュールを操作する可能性を示す。
関連論文リスト
- A Survey of Model Architectures in Information Retrieval [64.75808744228067]
機能抽出のためのバックボーンモデルと、関連性推定のためのエンドツーエンドシステムアーキテクチャの2つの重要な側面に焦点を当てる。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
我々は、パフォーマンスとスケーラビリティのアーキテクチャ最適化、マルチモーダル、マルチランガルデータの処理、従来の検索パラダイムを超えた新しいアプリケーションドメインへの適応など、新たな課題と今後の方向性について議論することで結論付けた。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - A Plug-and-Play Method for Rare Human-Object Interactions Detection by Bridging Domain Gap [50.079224604394]
textbfContext-textbfEnhanced textbfFeature textbfAment (CEFA) と呼ばれる新しいモデルに依存しないフレームワークを提案する。
CEFAは機能アライメントモジュールとコンテキスト拡張モジュールで構成される。
本手法は, 稀なカテゴリにおけるHOIモデルの検出性能を向上させるために, プラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T08:42:48Z) - Revisiting Spurious Correlation in Domain Generalization [12.745076668687748]
データ生成プロセスにおける因果関係を記述するために,構造因果モデル(SCM)を構築した。
さらに、スプリアス相関に基づくメカニズムを徹底的に分析する。
そこで本研究では,OOD一般化における共起バイアスの制御について,相対性スコア重み付き推定器を導入して提案する。
論文 参考訳(メタデータ) (2024-06-17T13:22:00Z) - Personalized Federated Learning with Contextual Modulation and
Meta-Learning [2.7716102039510564]
フェデレーション学習は、分散データソース上で機械学習モデルをトレーニングするための有望なアプローチとして登場した。
本稿では,フェデレートラーニングとメタラーニングを併用して,効率性と一般化能力を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-23T08:18:22Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - A Mechanistic Interpretation of Arithmetic Reasoning in Language Models
using Causal Mediation Analysis [128.0532113800092]
算数問題に対するトランスフォーマーに基づくLMの機械的解釈を提案する。
これにより、算術に関連する情報がLMによってどのように処理されるかについての洞察が得られる。
論文 参考訳(メタデータ) (2023-05-24T11:43:47Z) - SARF: Aliasing Relation Assisted Self-Supervised Learning for Few-shot
Relation Reasoning [43.59319243928048]
知識グラフ (FS-KGR) に基づく一括関係推論は, 長期データと不適切な関係を推定することを目的としている。
本稿では, Aliasing Relations を利用して, SARF と呼ばれる FS-KGR を支援する新しい自己教師付き学習モデルを提案する。
論文 参考訳(メタデータ) (2023-04-20T13:24:59Z) - Knowledge Relation Rank Enhanced Heterogeneous Learning Interaction
Modeling for Neural Graph Forgetting Knowledge Tracing [1.0152838128195467]
知識追跡モデルは 教育データマイニングに応用されています
ニューラルネットワークを用いた知識追跡(NGFKT)のための知識関係ランク強化不均質学習相互作用モデリングを提案する。
NGFKTモデルは、AUC、ACC、パフォーマンス安定性(PS)の観点から、すべてのベースラインモデルより優れていることを示す。
論文 参考訳(メタデータ) (2023-04-08T07:29:53Z) - Federated Learning Aggregation: New Robust Algorithms with Guarantees [63.96013144017572]
エッジでの分散モデルトレーニングのために、フェデレートラーニングが最近提案されている。
本稿では,連合学習フレームワークにおける集約戦略を評価するために,完全な数学的収束解析を提案する。
損失の値に応じてクライアントのコントリビューションを差別化することで、モデルアーキテクチャを変更できる新しい集約アルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-05-22T16:37:53Z) - Influence Tuning: Demoting Spurious Correlations via Instance
Attribution and Instance-Driven Updates [26.527311287924995]
インフルエンスチューニングは、データの急激なパターンからモデルを分解するのに役立ちます。
制御された設定では、インフルエンスチューニングは、データの急激なパターンからモデルを分解するのに役立ちます。
論文 参考訳(メタデータ) (2021-10-07T06:59:46Z) - Transforming Feature Space to Interpret Machine Learning Models [91.62936410696409]
この貢献は、特徴空間変換のレンズを通して機械学習モデルを解釈する新しいアプローチを提案する。
非条件的および条件付きポストホック診断ツールの拡張に使用できる。
提案手法の可能性を実証するために,46特徴のリモートセンシング土地被覆分類の事例研究を行った。
論文 参考訳(メタデータ) (2021-04-09T10:48:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。