Fugu-MT 論文翻訳(概要): Foundations of Large Language Models

論文の概要: Foundations of Large Language Models

arxiv url: http://arxiv.org/abs/2501.09223v1
Date: Thu, 16 Jan 2025 01:03:56 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-17 16:36:32.117234
Title: Foundations of Large Language Models
Title（参考訳）: 大規模言語モデルの基礎
Authors: Tong Xiao, Jingbo Zhu,
Abstract要約: 本書は4つの主要な章で構成されており、それぞれが事前学習、生成モデル、プロンプト技術、アライメント方法という重要な領域を探求している。自然言語処理や関連分野の大学生、専門家、実践者を対象としている。
参考スコア（独自算出の注目度）: 49.962594581024376
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This is a book about large language models. As indicated by the title, it primarily focuses on foundational concepts rather than comprehensive coverage of all cutting-edge technologies. The book is structured into four main chapters, each exploring a key area: pre-training, generative models, prompting techniques, and alignment methods. It is intended for college students, professionals, and practitioners in natural language processing and related fields, and can serve as a reference for anyone interested in large language models.
Abstract（参考訳）: これは大きな言語モデルに関する本です。タイトルが示すように、これはすべての最先端技術の包括的カバレッジではなく、基礎概念に重点を置いている。本書は4つの主要な章で構成されており、それぞれが事前学習、生成モデル、プロンプト技術、アライメント方法という重要な領域を探求している。これは、自然言語処理や関連分野の大学生、専門家、実践者を対象としており、大きな言語モデルに関心のある人なら誰でも参考にすることができる。

関連論文リスト

Efficiently Building a Domain-Specific Large Language Model from Scratch: A Case Study of a Classical Chinese Large Language Model [22.60356156315889]
本稿では,古典中国語の理解と生成に特化して設計された,大規模言語モデルであるAI Taiyanを開発する。実験によると、合理的なモデル設計、データ処理、基礎的なトレーニング、微調整により、わずか18億のパラメータで満足な結果が得られる。本研究は、専門分野固有の大規模言語モデルの効率的な構築の参考となる。
論文参考訳（メタデータ） (2025-05-17T03:43:16Z)
On The Landscape of Spoken Language Models: A Comprehensive Survey [144.11278973534203]
音声言語モデル(SLM)は、普遍的な音声処理システムとして機能する。この領域での作業は非常に多様であり、様々な用語と評価設定がある。
論文参考訳（メタデータ） (2025-04-11T13:40:53Z)
The Sociolinguistic Foundations of Language Modeling [34.02231580843069]
我々は、大きな言語モデルは本質的に言語の多様性のモデルであると主張する。この視点が言語モデリングにおける5つの基本的な課題にどのように対処できるかについて議論する。
論文参考訳（メタデータ） (2024-07-12T13:12:55Z)
Visually Grounded Language Learning: a review of language games, datasets, tasks, and models [60.2604624857992]
多くのVision+Language (V+L)タスクは、視覚的モダリティでシンボルをグラウンドできるモデルを作成することを目的として定義されている。本稿では,V+L分野において提案されるいくつかの課題とモデルについて,系統的な文献レビューを行う。
論文参考訳（メタデータ） (2023-12-05T02:17:29Z)
Revisiting Topic-Guided Language Models [20.21486464604549]
4つのトピック誘導言語モデルと2つのベースラインについて検討し、4つのコーパス上で各モデルの保留予測性能を評価する。これらの手法はいずれも標準のLSTM言語モデルのベースラインを上回りません。
論文参考訳（メタデータ） (2023-12-04T20:33:24Z)
Formal Aspects of Language Modeling [74.16212987886013]
大規模言語モデルは最も一般的なNLP発明の1つとなっている。これらのノートは、ETH Z "urich course on large language model" の理論的部分の伴奏である。
論文参考訳（メタデータ） (2023-11-07T20:21:42Z)
GujiBERT and GujiGPT: Construction of Intelligent Information Processing Foundation Language Models for Ancient Texts [11.289265479095956]
GujiBERTとGujiGPT言語モデルは、古代のテキストの知的情報処理に特化した基礎モデルである。これらのモデルは、単純化された漢字と伝統的な漢字の両方を含む広範なデータセットで訓練されている。これらのモデルは、公開データセットを使用して、さまざまなバリデーションタスクで例外的なパフォーマンスを示しています。
論文参考訳（メタデータ） (2023-07-11T15:44:01Z)
Exploring Large Language Models for Classical Philology [17.856304057963776]
我々は古代ギリシア語のための4つの言語モデルを作成し、2つの次元に沿って異なる。補題化を含む形態的および構文的タスクに関する全てのモデルを評価する。その結果、私たちのモデルはSoTAよりも大幅に改善されていることがわかった。
論文参考訳（メタデータ） (2023-05-23T05:21:02Z)
Foundation Models for Natural Language Processing -- Pre-trained Language Models Integrating Media [0.0]
ファンデーションモデルは自然言語処理のための事前訓練された言語モデルである。画像処理やビデオ処理からロボット制御学習まで、幅広いメディアや問題領域に適用することができる。本書は、ファンデーションモデルの研究および応用における技術の現状を概観する。
論文参考訳（メタデータ） (2023-02-16T20:42:04Z)
Language Models are General-Purpose Interfaces [109.45478241369655]
本稿では,様々な基礎モデルに対する汎用インタフェースとして言語モデルを提案する。事前訓練されたエンコーダのコレクションは、様々なモダリティ(ビジョンや言語など)を知覚するインタフェースとモジュールエンコーダを協調的に事前学習するための半因果言語モデリング手法を提案する。
論文参考訳（メタデータ） (2022-06-13T17:34:22Z)
Pre-training Language Model Incorporating Domain-specific Heterogeneous Knowledge into A Unified Representation [49.89831914386982]
本研究では, 構造化されていないテキスト, 半構造化されたテキスト, 十分に構造化されたテキストを含む, あらゆる形式のテキストに対して, 統一された事前学習言語モデル (PLM) を提案する。提案手法は,データの1/4のみを用いて,プレーンテキストの事前学習に優れる。
論文参考訳（メタデータ） (2021-09-02T16:05:24Z)
Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。類型的に多様な訓練言語のサンプルからこの分布を推測する。我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文参考訳（メタデータ） (2021-08-06T23:49:18Z)
Multi-Sense Language Modelling [19.396806939258806]
我々は,次の単語を予測できるだけでなく,文脈における意味を予測できる言語モデルを提案する。この高い予測粒度は、補助的な記述のようなエンドタスクに有用である。感覚予測には,定義や単語感覚の例を符号化したグラフ注意ネットワークを利用する。
論文参考訳（メタデータ） (2020-12-10T16:06:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。