論文の概要: From Tokens To Agents: A Researcher's Guide To Understanding Large Language Models
- arxiv url: http://arxiv.org/abs/2603.19269v1
- Date: Fri, 27 Feb 2026 08:57:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.812076
- Title: From Tokens To Agents: A Researcher's Guide To Understanding Large Language Models
- Title(参考訳): Tokensからエージェントへ:大規模言語モデルを理解する研究者ガイド
- Authors: Daniele Barolo,
- Abstract要約: この章は、技術的な専門知識を必要とせずに、大きな言語モデルを理解できるようにする。
データ事前トレーニング、トークン化と埋め込み、トランスフォーマーアーキテクチャ、確率生成、アライメント、エージェント機能という6つの重要なコンポーネントを分解する。
この章は、規範的なガイダンスではなく、LLMが特定の研究ニーズにどのように適合するかを批判的に推論するためのフレームワークを開発する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Researchers face a critical choice: how to use -- or not use -- large language models in their work. Using them well requires understanding the mechanisms that shape what LLMs can and cannot do. This chapter makes LLMs comprehensible without requiring technical expertise, breaking down six essential components: pre-training data, tokenization and embeddings, transformer architecture, probabilistic generation, alignment, and agentic capabilities. Each component is analyzed through both technical foundations and research implications, identifying specific affordances and limitations. Rather than prescriptive guidance, the chapter develops a framework for reasoning critically about whether and how LLMs fit specific research needs, finally illustrated through an extended case study on simulating social media dynamics with LLM-based agents.
- Abstract(参考訳): 研究者は、仕事において、どのように -- あるいは使用しない -- 大規模な言語モデルを使用するかという、重要な選択に直面します。
それらをうまく使うには、LSMができることとできないことを形作るメカニズムを理解する必要がある。
データの事前トレーニング、トークン化と埋め込み、トランスフォーマーアーキテクチャ、確率生成、アライメント、エージェント機能である。
各コンポーネントは、技術的基盤と研究上の意味の両方を通して分析され、特定の余裕と限界を特定する。
この章では、規範的なガイダンスではなく、LLMが特定の研究ニーズに適合するかどうかを批判的に推論するためのフレームワークを開発し、最終的にLLMベースのエージェントでソーシャルメディアのダイナミクスをシミュレートする拡張ケーススタディで説明されている。
関連論文リスト
- LLM Enhancement with Domain Expert Mental Model to Reduce LLM Hallucination with Causal Prompt Engineering [0.3437656066916039]
本稿では,人間の機械対話とモノトーンブールとk値関数を最適化した技術を用いて,意思決定の計算処理可能なパーソナルエキスパート精神モデル(EMM)を探索する手法を提案する。
LLMプロンプトエンジニアリングのためのEMMアルゴリズムには,因子同定,(2)因子の階層的構造化,(3)一般化された専門家精神モデル仕様の生成,(4)その仕様から詳細な専門家精神モデルを生成する4つのステップがある。
論文 参考訳(メタデータ) (2025-09-13T14:35:51Z) - How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective [64.00022624183781]
大規模言語モデル(LLM)は、関連性を評価し、情報検索(IR)タスクをサポートする。
メカニスティック・インタプリタビリティのレンズを用いて,異なるLLMモジュールが関係判断にどのように寄与するかを検討する。
論文 参考訳(メタデータ) (2025-04-10T16:14:55Z) - Review of Case-Based Reasoning for LLM Agents: Theoretical Foundations, Architectural Components, and Cognitive Integration [0.0]
ケースベース推論(CBR)は、過去の経験を参照することによって、新しい問題を解決する戦略である。
本稿では、過去の経験を参照して新しい問題を解決する戦略であるケースベース推論(CBR)を大規模言語モデルに組み込む方法について考察する。
論文 参考訳(メタデータ) (2025-04-09T14:51:02Z) - A Survey on Large Language Models with some Insights on their Capabilities and Limitations [0.3222802562733786]
大規模言語モデル(LLM)は、様々な言語関連タスクで顕著なパフォーマンスを示す。
LLMは、そのコア機能を超えて、創発的な能力を示す。
本稿では,これらの機能を実現する基盤となるコンポーネント,スケーリング機構,アーキテクチャ戦略について検討する。
論文 参考訳(メタデータ) (2025-01-03T21:04:49Z) - LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文 参考訳(メタデータ) (2024-02-26T07:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。