Fugu-MT 論文翻訳(概要): Simulation Streams: A Programming Paradigm for Controlling Large Language Models and Building Complex Systems with Generative AI

論文の概要: Simulation Streams: A Programming Paradigm for Controlling Large Language Models and Building Complex Systems with Generative AI

arxiv url: http://arxiv.org/abs/2501.18668v1
Date: Thu, 30 Jan 2025 16:38:03 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-03 22:46:12.802511
Title: Simulation Streams: A Programming Paradigm for Controlling Large Language Models and Building Complex Systems with Generative AI
Title（参考訳）: シミュレーションストリーム: 大規模言語モデルの制御と生成AIによる複雑なシステム構築のためのプログラミングパラダイム
Authors: Peter Sunehag, Joel Z. Leibo,
Abstract要約: Simulation Streamsは、LLM(Large Language Models)を効率的に制御し活用するために設計されたプログラミングパラダイムである。私たちの一番の目標は、一貫性を維持するための制限に対処しながら、LLMのエージェント能力を活用するフレームワークを作ることです。
参考スコア（独自算出の注目度）: 3.3126968968429407
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce Simulation Streams, a programming paradigm designed to efficiently control and leverage Large Language Models (LLMs) for complex, dynamic simulations and agentic workflows. Our primary goal is to create a minimally interfering framework that harnesses the agentic abilities of LLMs while addressing their limitations in maintaining consistency, selectively ignoring/including information, and enforcing strict world rules. Simulation Streams achieves this through a state-based approach where variables are modified in sequential steps by "operators," producing output on a recurring format and adhering to consistent rules for state variables. This approach focus the LLMs on defined tasks, while aiming to have the context stream remain "in-distribution". The approach incorporates an Entity-Component-System (ECS) architecture to write programs in a more intuitive manner, facilitating reuse of workflows across different components and entities. This ECS approach enhances the modularity of the output stream, allowing for complex, multi-entity simulations while maintaining format consistency, information control, and rule enforcement. It is supported by a custom editor that aids in creating, running, and analyzing simulations. We demonstrate the versatility of simulation streams through an illustrative example of an ongoing market economy simulation, a social simulation of three characters playing a game of catch in a park and a suite of classical reinforcement learning benchmark tasks. These examples showcase Simulation Streams' ability to handle complex, evolving scenarios over 100s-1000s of iterations, facilitate comparisons between different agent workflows and models, and maintain consistency and continued interesting developments in LLM-driven simulations.
Abstract（参考訳）: 複雑な動的シミュレーションやエージェントワークフローのために,LLM(Large Language Models)を効率的に制御し,活用するためのプログラミングパラダイムであるSimulation Streamsを紹介する。我々の第一の目的は、LLMのエージェント能力を活用する最小限の干渉フレームワークを作ることであり、一貫性の維持、情報を選択的に無視/含むこと、厳格な世界ルールの強制といった制限に対処することです。 Simulation Streamsは、変数を"演算子"によって逐次的なステップで修正し、繰り返しフォーマットで出力を生成し、状態変数の一貫性のあるルールに固執する状態ベースのアプローチによってこれを実現します。このアプローチでは、LLMが定義されたタスクに焦点を合わせながら、コンテキストストリームを"in-distriion"のままにすることを目指している。このアプローチにはエンティティ・コンポーネント・システム(ECS)アーキテクチャが組み込まれており、プログラムをより直感的に記述し、さまざまなコンポーネントやエンティティにわたるワークフローの再利用を容易にする。このECSアプローチは出力ストリームのモジュラリティを高め、フォーマットの整合性、情報制御、ルール強制を維持しながら複雑なマルチエンタリティシミュレーションを可能にする。シミュレーションの作成、実行、分析を支援するカスタムエディタがサポートされている。本研究では,現在進行中の市場経済シミュレーションの実証例,公園でキャッチゲームを行う3人のキャラクターの社会的シミュレーション,古典的強化学習ベンチマークのスイートを通じて,シミュレーションストリームの汎用性を実証する。これらの例は、シミュレーションストリームの複雑なシナリオを100～1000回のイテレーションで処理し、異なるエージェントワークフローとモデルの比較を容易にし、一貫性を維持し、LLM駆動のシミュレーションにおける興味深い開発を継続する能力を示している。

関連論文リスト

LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation [94.84458417662404]
LangTrajは、トラフィックシナリオにおけるすべてのエージェントの共同動作をシミュレートする、言語条件のシーン拡散モデルである。自然言語入力を条件付けすることで、LangTrajはインタラクティブな振る舞いを柔軟かつ直感的に制御できる。 LangTraj氏は、リアリズム、言語制御性、言語条件の安全クリティカルなシミュレーションにおいて、強力なパフォーマンスを示している。
論文参考訳（メタデータ） (2025-04-15T17:14:06Z)
Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorFBenchを紹介する。また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorFEvalを提案する。我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することができることを観察する。
論文参考訳（メタデータ） (2024-10-10T12:41:19Z)
CaLMFlow: Volterra Flow Matching using Causal Language Models [14.035963716966787]
CaLMFlowはVolterra積分方程式(VIE)としてフローマッチングをキャストするフレームワークである本手法は,空間と時間にまたがるトークン化を実現し,これらの領域上でVIEを解く。単一セル摂動応答予測を含む合成および実世界のデータに対するCaLMFlowの有効性を実証する。
論文参考訳（メタデータ） (2024-10-03T05:07:41Z)
FactorSim: Generative Simulation via Factorized Representation [14.849320460718591]
本稿では,エージェントの訓練に使用できる言語入力から,コード中のフルシミュレーションを生成するFACTORSIMを提案する。評価のために、我々は、強化学習環境におけるゼロショット転送を容易にするため、生成したシミュレーションコードの精度と有効性を評価できる生成シミュレーションベンチマークを導入する。その結果、FACTORSIMは、即時アライメント(例えば、精度)、ゼロショット転送能力、人的評価に関するシミュレーションを生成する上で、既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-09-26T09:00:30Z)
LangSuitE: Planning, Controlling and Interacting with Large Language Models in Embodied Text Environments [70.91258869156353]
テキストエンボディの世界における6つの代表的具体的タスクを特徴とする多目的・シミュレーション不要なテストベッドであるLangSuitEを紹介する。以前のLLMベースのテストベッドと比較すると、LangSuitEは複数のシミュレーションエンジンを使わずに、多様な環境への適応性を提供する。具体化された状態の履歴情報を要約した新しいチェーン・オブ・ソート(CoT)スキーマであるEmMemを考案する。
論文参考訳（メタデータ） (2024-06-24T03:36:29Z)
Model Composition for Multimodal Large Language Models [71.5729418523411]
本稿では,既存のMLLMのモデル構成による新しいパラダイムを提案する。我々の基本的な実装であるNaiveMCは、モダリティエンコーダを再利用し、LLMパラメータをマージすることで、このパラダイムの有効性を実証する。
論文参考訳（メタデータ） (2024-02-20T06:38:10Z)
SymbolicAI: A framework for logic-based approaches combining generative models and solvers [9.841285581456722]
生成過程における概念学習とフロー管理に論理的アプローチを取り入れた,汎用的でモジュール化されたフレームワークであるSybolicAIを紹介する。我々は,大規模言語モデル(LLM)を,自然言語命令と形式言語命令の両方に基づいてタスクを実行する意味的解決器として扱う。
論文参考訳（メタデータ） (2024-02-01T18:50:50Z)
Code Simulation Challenges for Large Language Models [6.970495767499435]
この研究は、LLM(Large Language Models)がいかにコーディングやアルゴリズムのタスクをシミュレートできるかを研究する。我々は、直線プログラムのベンチマーク、クリティカルパスを含むコード、近似命令および冗長命令を導入する。本稿では,コンパイラのパターンを行/フォローすることで,LLMにコード実行行をシミュレートするように指示する,OFFプロンプト手法であるChain of Simulation(CoSm)を提案する。
論文参考訳（メタデータ） (2024-01-17T09:23:59Z)
In Situ Framework for Coupling Simulation and Machine Learning with Application to CFD [51.04126395480625]
近年、流体力学計算を容易にする機械学習(ML)の多くの成功例が報告されている。シミュレーションが大きくなるにつれて、従来のオフライン学習のための新しいトレーニングデータセットの生成は、I/Oとストレージのボトルネックを生み出します。この作業は、この結合を単純化し、異種クラスタでのその場トレーニングと推論を可能にするソリューションを提供する。
論文参考訳（メタデータ） (2023-06-22T14:07:54Z)
A Modular Framework for Reinforcement Learning Optimal Execution [68.8204255655161]
我々は、最適貿易実行問題への強化学習の適用のためのモジュラーフレームワークを開発する。このフレームワークは、異なるシミュレーション設定の実装を容易にするために、柔軟性を念頭に設計されている。
論文参考訳（メタデータ） (2022-08-11T09:40:42Z)
DagSim: Combining DAG-based model structure with unconstrained data types and relations for flexible, transparent, and modularized data simulation [2.685173014586162]
DAGベースのデータシミュレーションのためのPythonベースのフレームワークであるDagSimについて,変数型や関数関係に制約を加えることなく紹介する。シミュレーションモデル構造を定義するための簡潔なYAMLフォーマットは透明性を促進する。メタデータ変数が画像の形状を制御したり、バイオシーケンスのパターンを制御したりするユースケースを通して、DagSimの能力について説明する。
論文参考訳（メタデータ） (2022-05-06T17:43:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。