Fugu-MT 論文翻訳(概要): MeMo: Towards Language Models with Associative Memory Mechanisms

論文の概要: MeMo: Towards Language Models with Associative Memory Mechanisms

arxiv url: http://arxiv.org/abs/2502.12851v1
Date: Tue, 18 Feb 2025 13:39:22 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-19 20:12:08.96923
Title: MeMo: Towards Language Models with Associative Memory Mechanisms
Title（参考訳）: MeMo: 連想記憶機構を備えた言語モデルを目指して
Authors: Fabio Massimo Zanzotto, Elena Sofia Ruzzetti, Giancarlo A. Xompero, Leonardo Ranaldi, Davide Venditti, Federico Ranaldi, Cristina Giannone, Andrea Favalli, Raniero Romagnoli,
Abstract要約: 本稿では,階層化連想記憶におけるトークン列を明示的に記憶する言語モデリングの新しいアーキテクチャであるMeMoを紹介する。 MeMoは透過性と、テキストの忘れを含むモデル編集の可能性を提供する。
参考スコア（独自算出の注目度）: 1.5091666314973797
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Memorization is a fundamental ability of Transformer-based Large Language Models, achieved through learning. In this paper, we propose a paradigm shift by designing an architecture to memorize text directly, bearing in mind the principle that memorization precedes learning. We introduce MeMo, a novel architecture for language modeling that explicitly memorizes sequences of tokens in layered associative memories. By design, MeMo offers transparency and the possibility of model editing, including forgetting texts. We experimented with the MeMo architecture, showing the memorization power of the one-layer and the multi-layer configurations.
Abstract（参考訳）: 記憶は、学習を通じて達成されるトランスフォーマーベースの大規模言語モデルの基本能力である。本稿では,テキストを直接記憶するアーキテクチャを設計し,記憶が学習に先行する原則を念頭に置いてパラダイムシフトを提案する。本稿では,階層化連想記憶におけるトークン列を明示的に記憶する言語モデリングの新しいアーキテクチャであるMeMoを紹介する。デザインによって、MeMoは透明性と、テキストを忘れることを含むモデル編集の可能性を提供する。我々は,MeMoアーキテクチャを実験し,一層および多層構成の記憶力を示した。

関連論文リスト

The AI Hippocampus: How Far are We From Human Memory? [77.04745635827278]
インプリシットメモリは、事前訓練されたトランスフォーマーの内部パラメータに埋め込まれた知識を指す。明示メモリは、動的でクエリ可能な知識表現でモデル出力を増大させるように設計された外部ストレージと検索コンポーネントを含んでいる。エージェントメモリは、自律エージェント内に永続的、時間的に拡張されたメモリ構造を導入する。
論文参考訳（メタデータ） (2026-01-14T03:24:08Z)
CAM: A Constructivist View of Agentic Memory for LLM-Based Reading Comprehension [55.29309306566238]
現在のLarge Language Models (LLM) は、長文文書を解釈する際に圧倒的な情報量に直面している。この課題は、バニラLSMを自律的な読み出しエージェントに高めることができる凝集性メモリモジュールの必須性を高める。我々はジャン・ピアジェの構成主義理論(Constructivist Theory)からインスピレーションを得て、エージェントメモリの3つの特性(構造化スキーマ、フレキシブルな同化、動的調節)を表現した。
論文参考訳（メタデータ） (2025-10-07T02:16:30Z)
MemoryKT: An Integrative Memory-and-Forgetting Method for Knowledge Tracing [7.096160553754792]
学生の記憶状態をシミュレーションすることは、知識追跡モデルの性能と解釈可能性の両方を高めるための有望なアプローチである。メモリは、エンコーディング、ストレージ、検索の3つの基本的なプロセスから構成される。本稿では,新しい時間変動オートエンコーダに基づく知識追跡モデルであるMemoryKTを提案する。
論文参考訳（メタデータ） (2025-08-11T15:59:59Z)
Modern Methods in Associative Memory [22.436758411803233]
連想記憶(Associative Memories)は、完全なリカレントニューラルネットワークを記述するためのエレガントなモデルである。このチュートリアルはAssociative Memoriesの親しみやすい紹介を提供し、この研究領域で使われている現代言語と手法を強調している。
論文参考訳（メタデータ） (2025-07-08T17:40:39Z)
Interpretable Mnemonic Generation for Kanji Learning via Expectation-Maximization [51.26060172682443]
本稿では,共通ルールの集合によって駆動されるメニーモニックな構築過程を明示的にモデル化する生成フレームワークを提案する。提案手法は潜在構造と構成規則を学習し,解釈可能な,系統的な調波生成を可能にする。
論文参考訳（メタデータ） (2025-07-07T15:49:23Z)
B'MOJO: Hybrid State Space Realizations of Foundation Models with Eidetic and Fading Memory [91.81390121042192]
我々はB'MOJOと呼ばれるモデル群を開発し、構成可能なモジュール内で理想的メモリと暗黙的メモリをシームレスに結合する。 B'MOJOのイデオティックメモリとフェードメモリを変調する能力は、32Kトークンまでテストされた長いシーケンスの推論をより良くする。
論文参考訳（メタデータ） (2024-07-08T18:41:01Z)
Concept Formation and Alignment in Language Models: Bridging Statistical Patterns in Latent Space to Concept Taxonomy [11.232704182001253]
本稿では,言語モデル(LM)の領域における概念形成とアライメントについて考察する。様々なLMで学習した意味表現において,概念とその階層構造を識別する機構を提案する。
論文参考訳（メタデータ） (2024-06-08T01:27:19Z)
Is Modularity Transferable? A Case Study through the Lens of Knowledge Distillation [59.37775534633868]
同族PLM間で事前訓練されたタスク固有のPEFTモジュールを転送するための極めて簡単なアプローチを提案する。また,不整合性PLM間のモジュールの移動を,推論複雑性の変化を伴わずに行う方法を提案する。
論文参考訳（メタデータ） (2024-03-27T17:50:00Z)
MEMORYLLM: Towards Self-Updatable Large Language Models [101.3777486749529]
既存のLarge Language Models (LLM) は通常、デプロイ後も静的のままである。本稿では,変圧器と固定サイズのメモリプールを備えたモデルMEMORYLLMを紹介する。 MEMORYLLMは、テキスト知識を自己更新し、早期に注入された知識を記憶することができる。
論文参考訳（メタデータ） (2024-02-07T07:14:11Z)
Empowering Working Memory for Large Language Model Agents [9.83467478231344]
本稿では,認知心理学のワーキングメモリフレームワークを大規模言語モデル(LLM)に適用する可能性について検討する。エピソード間の記憶を維持するために、集中型ワーキングメモリハブとエピソディックバッファアクセスを取り入れた革新的なモデルが提案されている。このアーキテクチャは、複雑なタスクと協調シナリオの間のニュアンス付きコンテキスト推論に対して、より継続的なものを提供することを目的としている。
論文参考訳（メタデータ） (2023-12-22T05:59:00Z)
SoK: Memorization in General-Purpose Large Language Models [25.448127387943053]
大規模言語モデル(LLM)は、無数のアプリケーションが開発中で、目覚ましいペースで進んでいる。 LLMはトレーニングデータの短い秘密を記憶できるだけでなく、さまざまな方法でテキストで表現できる事実や書体スタイルといった概念を記憶することもできる。本稿では,文章,事実,アイデア,アルゴリズム,書式,分布特性,アライメント目標を網羅したLLMにおける記憶のための分類法を提案する。
論文参考訳（メタデータ） (2023-10-24T14:25:53Z)
FILM: How can Few-Shot Image Classification Benefit from Pre-Trained Language Models? [14.582209994281374]
少数のサンプルしか持たない新しいクラスに一般化可能なモデルをトレーニングすることを目的としている。コントラスト学習に基づく事前学習言語モデルを用いた新しい数発学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-07-09T08:07:43Z)
On decoder-only architecture for speech-to-text and large language model integration [59.49886892602309]
Speech-LLaMAは、音声情報をテキストベースの大規模言語モデルに効果的に組み込む新しいアプローチである。我々は多言語音声からテキストへの翻訳タスクの実験を行い、強いベースラインよりも大幅に改善されたことを示す。
論文参考訳（メタデータ） (2023-07-08T06:47:58Z)
RET-LLM: Towards a General Read-Write Memory for Large Language Models [53.288356721954514]
RET-LLMは、大規模な言語モデルに一般的な読み書きメモリユニットを装備する新しいフレームワークである。デビッドソンのセマンティクス理論に触発され、三重項の形で知識を抽出し保存する。本フレームワークは,時間に基づく質問応答タスクの処理において,堅牢な性能を示す。
論文参考訳（メタデータ） (2023-05-23T17:53:38Z)
Training Language Models with Memory Augmentation [28.4608705738799]
本稿では,メモリ拡張による言語モデル学習のための新しいトレーニング手法を提案する。当社のアプローチでは、バッチ内のサンプルをアクセス可能なメモリとして直接取り込むトレーニング目標を用いています。従来のメモリ拡張アプローチよりも大幅に向上したことを示す。
論文参考訳（メタデータ） (2022-05-25T11:37:29Z)
Memorization Without Overfitting: Analyzing the Training Dynamics of Large Language Models [64.22311189896888]
因果的および仮面的言語モデリング、モデルサイズ、およびトレーニングプロセス全体における正確な記憶について検討する。驚くべきことに、大きなモデルは過度に適合する前にデータの大部分を記憶し、トレーニングプロセスを通して忘れる傾向にある。
論文参考訳（メタデータ） (2022-05-22T07:43:50Z)
Learning Associative Inference Using Fast Weight Memory [12.239487954915646]
FWM(Fast Weight Memory)と呼ばれる連想メモリによるLSTMモデルの拡張我々のモデルは勾配降下法によりエンドツーエンドに訓練され、合成言語推論問題において優れた性能が得られる。
論文参考訳（メタデータ） (2020-11-16T10:01:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。