論文の概要: Closing the Loop: A Software Framework for AI to Support Business Decision Making
- arxiv url: http://arxiv.org/abs/2604.24116v1
- Date: Mon, 27 Apr 2026 07:11:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.782559
- Title: Closing the Loop: A Software Framework for AI to Support Business Decision Making
- Title(参考訳): ループを閉じる - ビジネス意思決定を支援するAIのためのソフトウェアフレームワーク
- Authors: Jeffrey Wong, Antoine Creux,
- Abstract要約: 我々は,AIエージェントの迅速な反復と学習速度を実現するソフトウェアフレームワークを開発した。
我々は不均一な効果、政策アルゴリズム、媒介分析、効果予測による因果解析を充実させる。
実験分析における様々な目的に対するアプローチの評価を行い,バニラエージェントによって構築されたベースライン解析よりも,フレームワークがコードの正確性を改善し,コード行数を削減し,性能が高いことを示す。
- 参考スコア(独自算出の注目度): 0.07519872646378833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Create an idea, prototype it, evaluate if users like it, then learn. It is the circle of business. If AI can operate in all parts of the circle, it will enable rapid iteration and learning speeds for businesses. Experiment platforms that deploy experiments to evaluate return on investment for businesses are abundant, but systems that help businesses learn personalization, mechanisms, and what to ideate next, are rare. Among technologies that do exist, they cannot be well orchestrated in a single software interface that can be safely and efficiently leveraged by an AI agent. These challenges make it difficult to teach an AI agent how to learn within a robust experimentation framework, and difficult for an AI agent to operate and iterate for the business. We offer a two part solution: one half that is rooted in mathematical reductions to contain complexity, and one half that is rooted in software design to optimize for orchestration, software safety, and multiplicity. Our solution, a software framework, moves beyond the simple treatment effect computed as a difference in means. To create a better understanding of a business and its customers, we enrich causal analysis with heterogeneous effects, policy algorithms, mediation analysis, and forecasts of effects. To have an AI complete the iteration cycle faster, we further enrich the analysis with variance reduction and anytime valid inference. The enrichments are made compatible across different types of experiments, and are presented in a single software interface that is usable in an AI agent. We evaluate the approach on various objectives in experiment analysis, and show that the framework improves code correctness, reduces lines of code, and is more performant than a baseline analysis constructed by a vanilla agent.
- Abstract(参考訳): アイデアを作り、プロトタイプを作り、ユーザーが気に入ったかどうかを評価し、学びます。
それはビジネスの輪です。
AIが円のすべての部分で運用できれば、企業にとって迅速なイテレーションと学習のスピードが実現される。
企業への投資のリターンを評価する実験を展開できる実験プラットフォームは多いが、企業がパーソナライズやメカニズム、次に何を思いつくかを学ぶのを助けるシステムは稀である。
存在する技術の中で、AIエージェントが安全かつ効率的に活用できる単一のソフトウェアインターフェースで適切にオーケストレーションすることはできない。
これらの課題は、堅牢な実験フレームワーク内で学習する方法をAIエージェントに教えることが難しく、ビジネスのためにAIエージェントが操作し、反復することが難しい。
半分は複雑性を含む数学的削減に根ざし、半分はソフトウェア設計に根ざして、オーケストレーション、ソフトウェア安全性、マルチプライオリティに最適化しています。
私たちのソリューションは、ソフトウェアフレームワークであり、手段の違いとして計算される単純な処理効果を超えています。
企業とその顧客をよりよく理解するために、異種効果、政策アルゴリズム、仲介分析、効果予測による因果分析を充実させます。
AIがイテレーションサイクルを高速に完了するためには、分散還元と任意の有効推論で分析をさらに強化する。
エンリッチメントはさまざまな種類の実験で互換性があり、AIエージェントで使用可能な単一のソフトウェアインターフェースで提示される。
実験分析における様々な目的に対するアプローチの評価を行い,バニラエージェントによって構築されたベースライン解析よりも,フレームワークがコードの正確性を改善し,コード行数を削減し,性能が高いことを示す。
関連論文リスト
- Simple Agents Outperform Experts in Biomedical Imaging Workflow Optimization [69.36509281190662]
生産レベルのコンピュータビジョンツールを科学データセットに適応させることは、重要な"ラストマイル"ボトルネックである。
我々は、AIエージェントを使ってこの手動コーディングを自動化し、最適なエージェント設計のオープンな問題に焦点を当てる。
簡単なエージェントフレームワークが、人間-専門家のソリューションよりも優れた適応コードを生成することを実証する。
論文 参考訳(メタデータ) (2025-12-02T18:42:26Z) - Barbarians at the Gate: How AI is Upending Systems Research [58.95406995634148]
システム研究は、新しいパフォーマンス指向アルゴリズムの設計と評価に長年注力してきたが、AI駆動のソリューション発見には特に適している、と私たちは主張する。
このアプローチをAI駆動システム研究(ADRS)と呼び、ソリューションを反復的に生成し、評価し、洗練する。
我々の研究結果は、AI時代のシステム研究の実践に急激な適応の必要性と破壊的な可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-10-07T17:49:24Z) - Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [60.04362496037186]
本研究は,コーディングエージェントと開発者インタラクションを制御した最初の研究である。
我々は,2つの主要な協調型およびエージェント型符号化アシスタントの評価を行った。
結果から,エージェントはコピロトを超える方法で開発者を支援することができることがわかった。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - Scalable, Symbiotic, AI and Non-AI Agent Based Parallel Discrete Event Simulations [0.0]
本稿では,複数のAIエージェントと非AIエージェントを組み合わせた並列離散イベントシミュレーション(PDES)手法を提案する。
我々は、4つの異なるドメインから4つの問題を解き、その結果をAIモデルだけで比較することで、我々のアプローチを評価する。
その結果,バニラモデルの精度が23%未満であるため,アプローチ全体の精度は68%であった。
論文 参考訳(メタデータ) (2025-05-28T17:50:01Z) - Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications of Agentic AI [0.36868085124383626]
レビューでは、AI支援ソフトウェア開発の新たなパラダイムとして、バイブコーディングとエージェントコーディングの2つを包括的に分析している。
Vibeのコーディングは、インプットベースで対話的なインタラクションを通じて、直感的で、ループ内の人間間インタラクションを強調する。
エージェントコーディングは、最小限の介入でタスクを計画、実行、テスト、反復できる目標駆動エージェントを通じて、自律的なソフトウェア開発を可能にする。
論文 参考訳(メタデータ) (2025-05-26T03:00:21Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。