論文の概要: Using Games to Learn How Large Language Models Work
- arxiv url: http://arxiv.org/abs/2603.28374v1
- Date: Mon, 30 Mar 2026 12:40:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.396238
- Title: Using Games to Learn How Large Language Models Work
- Title(参考訳): ゲームを使って大規模言語モデルがどのように機能するかを学ぶ
- Authors: Allison Chen, Isabella Pu,
- Abstract要約: 大規模言語モデル(LLM)の動作とデータ利用の原理を実証する2つのゲームを提案する。
最初のゲームであるLearning Like an LLMは、LLMが特定のデータセットに基づいてテキストのシーケンスを予測するように訓練されていることを伝えようとしている。
第2のゲームであるTag-Team Text Generationは、LLMが予測されたデータの確率とランダム性の両方を用いて、一度に1ワードのテキストを生成することを教えることに焦点を当てている。
- 参考スコア(独自算出の注目度): 1.3750624267664158
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While artificial intelligence (AI) technology is becoming increasingly popular, its underlying mechanisms tend to remain opaque to most people. To address this gap, the field of AI literacy aims to develop various resources to teach people how AI systems function. Here we contribute to this line of work by proposing two games that demonstrate principles behind how large language models (LLMs) work and use data. The first game, Learn Like an LLM, aims to convey that LLMs are trained to predict sequences of text based on a particular dataset. The second game, Tag-Team Text Generation, focuses on teaching that LLMs generate text one word at a time, using both predicted probabilities of the data and randomness. While the games proposed are still in early stages and would benefit greatly from further discussion, we hope they can contribute to using game-based learning to teach about complex AI systems like LLMs.
- Abstract(参考訳): 人工知能(AI)技術はますます普及しつつあるが、その基盤となるメカニズムは殆どの人にとって不透明である。
このギャップに対処するため、AIリテラシーの分野は、AIシステムがどのように機能するかを教える様々なリソースの開発を目指している。
ここでは、大規模な言語モデル(LLM)の動作とデータ利用の背景にある原則を実証する2つのゲームを提案することで、この一連の作業に貢献します。
最初のゲームであるLearning Like an LLMは、LLMが特定のデータセットに基づいてテキストのシーケンスを予測するように訓練されていることを伝えようとしている。
第2のゲームであるTag-Team Text Generationは、LLMが予測されたデータの確率とランダム性の両方を用いて、一度に1ワードのテキストを生成することを教えることに焦点を当てている。
提案されたゲームはまだ初期段階であり、さらなる議論から大きな恩恵を受けるだろうが、LLMのような複雑なAIシステムを教えるためにゲームベースの学習を使うことに貢献できることを願っている。
関連論文リスト
- Learning to Play Like Humans: A Framework for LLM Adaptation in Interactive Fiction Games [8.06073345741722]
インタラクティブ・フィクションゲーム(Interactive Fiction Game、IFゲーム)は、プレイヤーが自然言語で操作するゲームである。
この研究は認知にインスパイアされたフレームワークを示し、Large Language Models (LLM) を体系的にIFゲームを学び、プレイする。
論文 参考訳(メタデータ) (2025-05-18T14:21:56Z) - Towards Anthropomorphic Conversational AI Part I: A Practical Framework [49.62013440962072]
会話に関わる人間の知性の重要な側面を再現するために設計されたマルチモジュールフレームワークを導入する。
アプローチの第2段階では、これらの会話データは、フィルタリングとラベル付けの後に、強化学習のためのトレーニングおよびテストデータとして機能する。
論文 参考訳(メタデータ) (2025-02-28T03:18:39Z) - Grammar-based Game Description Generation using Large Language Models [12.329521804287259]
Game Description Language (GDL) は、様々なゲームを機械可読形式で表現するための標準化された方法を提供する。
本稿では,Large Language Models(LLM)を利用して,自然言語から文法的に正確なゲーム記述を生成する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-24T16:36:02Z) - LLaRA: Supercharging Robot Learning Data for Vision-Language Policy [56.505551117094534]
我々はLLaRA: Large Language and Robotics Assistantを紹介した。
まず、既存の行動クローニングデータセットからロボットのための会話スタイルの指導データを生成する自動パイプラインを提案する。
このようなデータセットを限定的に微調整したVLMは、ロボット制御において有意義な行動決定を導出できることを示す。
論文 参考訳(メタデータ) (2024-06-28T17:59:12Z) - A Complete Survey on LLM-based AI Chatbots [46.18523139094807]
過去数十年間、データの増加を目撃し、データ収集、学習ベースのAI技術の基礎を築いた。
AIチャットボットと呼ばれる会話エージェントは、大きな言語モデル(LLM)をトレーニングし、ユーザのプロンプトに応じて新しいコンテンツ(知識)を生成するために、そのようなデータに大きく依存している。
本稿では,様々な分野におけるLLMベースのチャットボットの進化と展開に関する完全な調査を行う。
論文 参考訳(メタデータ) (2024-06-17T09:39:34Z) - Enhance Reasoning for Large Language Models in the Game Werewolf [15.730860371636336]
本稿では,Large Language Models(LLM)を外部のThinkerモジュールと統合する革新的なフレームワークを提案する。
本フレームワークは,マルチシステム推論を必要とする9人プレイヤのWerewolfゲームを用いて提案する。
実験では, 帰納的推論, 音声生成, オンラインゲーム評価におけるフレームワークの有効性を示す。
論文 参考訳(メタデータ) (2024-02-04T03:47:10Z) - LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language
Models [56.25156596019168]
本稿では,LMRL-Gymベンチマークを用いて,大規模言語モデル(LLM)のマルチターンRLの評価を行う。
我々のベンチマークは8つの異なる言語タスクで構成されており、複数ラウンドの言語相互作用が必要であり、オープンエンド対話やテキストゲームにおける様々なタスクをカバーする。
論文 参考訳(メタデータ) (2023-11-30T03:59:31Z) - Robotic Skill Acquisition via Instruction Augmentation with
Vision-Language Models [70.82705830137708]
言語条件制御のためのデータ駆動型インストラクション拡張(DIAL)について紹介する。
我々は,CLIPのセマンティック理解を利用したセミ言語ラベルを用いて,未知の実演データの大規模なデータセットに知識を伝達する。
DIALは、模倣学習ポリシーによって、新しい能力を獲得し、元のデータセットにない60の新しい命令を一般化することができる。
論文 参考訳(メタデータ) (2022-11-21T18:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。