論文の概要: The Token Not Taken: Sampling, State, and the Variability of AI Agent Outputs
- arxiv url: http://arxiv.org/abs/2606.08998v1
- Date: Mon, 08 Jun 2026 03:53:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.68818
- Title: The Token Not Taken: Sampling, State, and the Variability of AI Agent Outputs
- Title(参考訳): AIエージェントのアウトプットのサンプリング、状態、変数
- Authors: Muhammad Zia Hydari, Raja Iqbal,
- Abstract要約: エージェントAIシステムは実行毎に異なる動作をすることができる。
可変性は、しばしば混ざり合ったいくつかの層から生じます。
この原稿は、一致した条件下でそのような変動を再現できる場合に、エージェントAIシステムと呼ぶ意味を明確にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic AI systems can behave differently across runs: the same request may produce a different plan, a different tool call, a different code edit, or a different final answer. Such variability arises from several layers that are often conflated. A foundation model is a large pretrained model, usually adaptable to many downstream tasks, that maps an input context to predictions over outputs. In many current agents, that model is embedded in an orchestration loop that plans, calls tools, observes results, and updates state. One explicit intrinsic source of variability in such systems is token generation: the model computes scores over possible next tokens, the scores are converted into probabilities, and a decoder may sample tokens using a pseudo-random number generator. A small sampled token difference can then propagate upward into a different tool call, code path, search query, or agent state. Other sources of variability are extrinsic to token sampling, including changing environments, live data, serving infrastructure, batch effects, and numerical details. By separating these layers, the manuscript clarifies what it means to call agentic AI systems stochastic, when such variability can be reproduced under matched conditions, and why deterministic execution need not imply identical behavior in deployed settings.
- Abstract(参考訳): 同じリクエストが別のプラン、異なるツールコール、異なるコード編集、あるいは別の最終回答を生成する可能性がある。
このような変動は、しばしば膨らませられるいくつかの層から生じる。
基礎モデルは大きな事前訓練されたモデルであり、通常多くの下流タスクに適応し、入力コンテキストを出力上の予測にマッピングする。
多くのエージェントでは、そのモデルをオーケストレーションループに埋め込んで、ツールの計画、呼び出し、結果の監視、状態の更新を行います。
モデルは次のトークンに対してスコアを計算し、スコアは確率に変換し、デコーダは擬似ランダム数生成器を使用してトークンをサンプリングする。
その後、小さなサンプルトークンの差分が別のツールコール、コードパス、検索クエリ、エージェントステートに伝播する。
その他の変数源としては、環境の変更、ライブデータ、サービスインフラストラクチャ、バッチ効果、数値的な詳細など、トークンサンプリングに固有のものがある。
これらの層を分離することにより、原稿はエージェントAIシステムと呼ぶ意味を明確化し、そのような変動が一致した条件下で再現できる場合、そしてなぜ決定論的実行がデプロイされた設定で同一の振る舞いを示さなくてもよいのかを明らかにする。
関連論文リスト
- Conditional Attribute Estimation with Autoregressive Sequence Models [2.956641142618867]
Conditional Attribute Transformersは、次のトークン選択の確率と属性の値を共同で推定する新しい方法である。
提案手法は,スパース報酬タスクにおけるアートパフォーマンスの状態を達成し,属性確率をサンプリングよりも桁違いに高速に推定し,多言語タスクにおける自己回帰シーケンスモデルの復号化を導出する。
論文 参考訳(メタデータ) (2026-05-13T18:11:16Z) - AutoStan: Autonomous Bayesian Model Improvement via Predictive Feedback [0.38073142980733005]
AutoStanは、コマンドラインインターフェイス(CLI)コーディングエージェントが自律的に構築し、Stanで書かれたベイズモデルを反復的に改善するフレームワークである。
多様なモデリング構造を持つ5つのデータセット上でAutoStanを評価する。
論文 参考訳(メタデータ) (2026-03-29T16:58:46Z) - Deep Multivariate Models with Parametric Conditionals [47.20275199636936]
確率変数の不均一な集合に対する深層多変量モデルについて考察する。
本稿では,各変数群に対する条件付き確率分布を用いて,共同確率分布を表現することを提案する。
それらの学習は、その制限分布のデータ確率を最大化することにより、パラメトリドマルコフ連鎖カーネルのトレーニングとしてアプローチすることができる。
論文 参考訳(メタデータ) (2026-02-02T11:01:48Z) - Zonkey: A Hierarchical Diffusion Language Model with Differentiable Tokenization and Probabilistic Attention [0.0]
Zonkeyは階層的な拡散モデルであり、生文字から文書レベルの表現まで、完全にトレーニング可能なパイプラインを通じて制限に対処する。
コアとなるのは、確率的開始順序(BOS)決定を学習する、差別化可能なトークンである。
Zonkeyは、ノイズからコヒーレントで可変長のテキストを生成し、創発的な階層を示す。
論文 参考訳(メタデータ) (2026-01-29T14:17:37Z) - Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - Multi-Candidate Speculative Decoding [82.05519287513444]
大規模な言語モデルは、様々なNLPタスクで印象的な機能を示してきたが、その生成は自動回帰的に時間を要する。
これは高速なドラフトモデルから候補セグメントを生成し、ターゲットモデルによって並列に検証する。
本稿では,複数の候補をドラフトモデルから抽出し,検証のためにバッチにまとめる手法を提案する。
対象モデルの分布を維持しつつ,効率的な多候補検証のためのアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-01-12T17:15:23Z) - CREATED: Generating Viable Counterfactual Sequences for Predictive
Process Analytics [0.30586855806896046]
本稿では,進化的手法を用いて逆実数列を生成する汎用フレームワークを提案する。
我々のフレームワークはドメイン知識を必要としない。代わりに、生成した反事実列の実現可能性を計算するためにマルコフモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2023-03-28T09:35:25Z) - IOT: Instance-wise Layer Reordering for Transformer Structures [173.39918590438245]
トランスフォーマの固定層順序の仮定を分解し,モデル構造にインスタンス単位の層順序変更を導入する。
当社の手法はTransformer以外のアーキテクチャにも適用可能です。
論文 参考訳(メタデータ) (2021-03-05T03:44:42Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。