Fugu-MT 論文翻訳(概要): CoLLEGe: Concept Embedding Generation for Large Language Models

論文の概要: CoLLEGe: Concept Embedding Generation for Large Language Models

arxiv url: http://arxiv.org/abs/2403.15362v2
Date: Wed, 16 Oct 2024 19:57:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:31.518924
Title: CoLLEGe: Concept Embedding Generation for Large Language Models
Title（参考訳）: CoLLEGe: 大規模言語モデルのための概念埋め込み生成
Authors: Ryan Teehan, Brenden Lake, Mengye Ren,
Abstract要約: CoLLEGeは、新しい概念のための柔軟な埋め込みを生成することができるメタ学習フレームワークである。我々は,現実のシナリオに挑戦する上で,新しい概念学習をテストするための一連のタスクを設計する。
参考スコア（独自算出の注目度）: 12.812113254812028
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Current language models are unable to quickly learn new concepts on the fly, often requiring a more involved finetuning process to learn robustly. Prompting in-context is not robust to context distractions, and often fails to confer much information about the new concepts. Classic methods for few-shot word learning in NLP, relying on global word vectors, are less applicable to large language models. In this paper, we introduce a novel approach named CoLLEGe (Concept Learning with Language Embedding Generation) to modernize few-shot concept learning. CoLLEGe is a meta-learning framework capable of generating flexible embeddings for new concepts using a small number of example sentences or definitions. Our primary meta-learning objective is simply to facilitate a language model to make next word predictions in forthcoming sentences, making it compatible with language model pretraining. We design a series of tasks to test new concept learning in challenging real-world scenarios, including new word acquisition, definition inference, and verbal reasoning, and demonstrate that our method succeeds in each setting without task-specific training. Code and data for our project can be found at https://college-concept-learning.github.io/
Abstract（参考訳）: 現在の言語モデルは、すぐに新しい概念を学習することができず、しばしば堅牢に学習するためにより複雑な微調整プロセスを必要とします。コンテキスト内でのプロンプティングはコンテキストの混乱に対して堅牢ではなく、新しい概念に関する多くの情報を提供するのに失敗することが多い。グローバルなワードベクトルに依存するNLPにおける数ショットワード学習の古典的手法は、大規模言語モデルには適用できない。本稿では,CoLLEGe(Concept Learning with Language Embedding Generation)という新しいアプローチを導入する。 CoLLEGeはメタラーニングフレームワークであり、少数の例文や定義を使って新しい概念の柔軟な埋め込みを生成することができる。我々の主なメタ学習目的は、単に言語モデルが次の文で次の単語を予測できるようにし、言語モデル事前学習と互換性を持たせることである。我々は,新しい単語獲得,定義推論,言語推論など,現実のシナリオに挑戦する上で,新しい概念学習をテストするための一連のタスクを設計し,タスク固有のトレーニングを使わずに各設定でメソッドが成功することを示す。プロジェクトのコードとデータはhttps://college-concept-learning.github.io/にある。

関連論文リスト

Neologism Learning for Controllability and Self-Verbalization [23.932433693726182]
モデルをよりよく理解し、制御するために、新しい単語を導入するというアイデアを探求する。本手法では、新しい単語を埋め込み、その概念を示す例で訓練することにより、新しい単語を導入する。新しい単語を追加することで、フラットリー、誤った回答、テキストの長さ、AxBenchのより複雑な概念などの概念を制御できることを示す。
論文参考訳（メタデータ） (2025-10-09T17:41:57Z)
Rapid Word Learning Through Meta In-Context Learning [29.29775111160227]
In-context learNing Of Words(Minnow)のためのメタトレーニング手法を提案する。この方法は、いくつかの文脈内例から単語の使用例を生成するために言語モデルを訓練する。 Minnowでスクラッチからトレーニングするモデルは、人間のスケールの子供指向言語で、強力な数発の単語学習を可能にしている。
論文参考訳（メタデータ） (2025-02-20T18:11:38Z)
Large Concept Models: Language Modeling in a Sentence Representation Space [62.73366944266477]
本稿では,概念を命名した明示的な高レベルな意味表現に基づくアーキテクチャの試みを行う。概念は言語とモダリティに依存しないものであり、フローにおけるより高いレベルの考えや行動を表している。本モデルでは,多くの言語に対して,ゼロショットの一般化性能が顕著であることを示す。
論文参考訳（メタデータ） (2024-12-11T23:36:20Z)
Collapsed Language Models Promote Fairness [88.48232731113306]
偏りのある言語モデルはトークン表現と単語埋め込みの間に崩壊したアライメントを示す。我々は,幅広い脱バイアス法において,公平性を効果的に向上する原理的な微調整法を設計する。
論文参考訳（メタデータ） (2024-10-06T13:09:48Z)
FILM: How can Few-Shot Image Classification Benefit from Pre-Trained Language Models? [14.582209994281374]
少数のサンプルしか持たない新しいクラスに一般化可能なモデルをトレーニングすることを目的としている。コントラスト学習に基づく事前学習言語モデルを用いた新しい数発学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-07-09T08:07:43Z)
Pre-Training to Learn in Context [138.0745138788142]
言語モデルが文脈で学習するために明示的に訓練されていないため、コンテキスト内学習の能力は十分に活用されていない。 In-Context Learning のための PICL (Pre-training for In-Context Learning) を提案する。実験の結果,PICLはベースラインよりも効率が高く,タスクの汎用性が高く,約4倍のパラメータを持つ言語モデルよりも優れていた。
論文参考訳（メタデータ） (2023-05-16T03:38:06Z)
Meta Learning to Bridge Vision and Language Models for Multimodal Few-Shot Learning [38.37682598345653]
視覚モデルと言語モデルとのギャップを埋めるために,マルチモーダルなメタ学習手法を導入する。我々は,凍結した大規模視覚と言語モデルを効率的にブリッジするためにメタラーナーとして機能するメタマッパーネットワークを定義する。我々は,最近提案されたマルチモーダル・スショット・ベンチマークに対するアプローチを評価し,新しい視覚概念を単語に結合する速度を計測した。
論文参考訳（メタデータ） (2023-02-28T17:46:18Z)
Efficient Induction of Language Models Via Probabilistic Concept Formation [13.632454840363916]
コーパスから言語モデルを取得するための新しいアプローチを提案する。このフレームワークは、確率論的概念の分類学的階層を構築するための初期のシステムであるCobweb上に構築されている。 Cobwebの3つの新しい拡張(Word、Leaf、Pathの亜種)について調べる。
論文参考訳（メタデータ） (2022-12-22T18:16:58Z)
ConceptX: A Framework for Latent Concept Analysis [21.760620298330235]
本稿では,言語モデル(pLM)における潜在表現空間の解釈と注釈付けを行うための,ループ型ヒューマン・イン・ザ・ループ・フレームワークであるConceptXを提案する。我々は、教師なしの手法を用いて、これらのモデルで学んだ概念を発見し、人間が概念の説明を生成するためのグラフィカルインターフェースを実現する。
論文参考訳（メタデータ） (2022-11-12T11:31:09Z)
Language Model Pre-Training with Sparse Latent Typing [66.75786739499604]
そこで本研究では,多種多様な潜在型を持つ文レベルのキーワードを疎に抽出することのできる,事前学習対象Sparse Latent Typingを提案する。実験結果から,本モデルは外部知識を使わずに,自己教師型で解釈可能な潜在型カテゴリを学習できることが示唆された。
論文参考訳（メタデータ） (2022-10-23T00:37:08Z)
CoLLIE: Continual Learning of Language Grounding from Language-Image Embeddings [2.8478710949588284]
CoLLIEは、言語がどのように視覚に根ざされているかの継続的な学習のモデルである。新しい言語の使用に対応するために必要な言語埋め込みを調整する変換関数を学習する。ごく少数の例から,CoLLIEが効率的に学習し,一般化できることが示される。
論文参考訳（メタデータ） (2021-11-15T18:54:58Z)
Grounded Compositional Outputs for Adaptive Language Modeling [59.02706635250856]
言語モデルの語彙$-$典型的にはトレーニング前に選択され、後で永久に固定される$-$は、そのサイズに影響します。言語モデルのための完全合成出力埋め込み層を提案する。我々の知る限り、この結果はトレーニング語彙に依存しないサイズを持つ最初の単語レベル言語モデルである。
論文参考訳（メタデータ） (2020-09-24T07:21:14Z)
InfoXLM: An Information-Theoretic Framework for Cross-Lingual Language Model Pre-Training [135.12061144759517]
本稿では,言語間言語モデルの事前学習を定式化する情報理論フレームワークを提案する。コントラスト学習に基づく新しい事前学習課題を提案する。単言語コーパスと並列コーパスの両方を活用することで、事前訓練されたモデルの言語間変換性を向上させるために、プレテキストを共同で訓練する。
論文参考訳（メタデータ） (2020-07-15T16:58:01Z)
Concept Learners for Few-Shot Learning [76.08585517480807]
本研究では,人間の解釈可能な概念次元に沿って学習することで,一般化能力を向上させるメタ学習手法であるCOMETを提案する。我々は,細粒度画像分類,文書分類,セルタイプアノテーションなど,さまざまな領域からの少数ショットタスクによるモデルの評価を行った。
論文参考訳（メタデータ） (2020-07-14T22:04:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。