論文の概要: Absorbing Complexity: An Interaction-Native Knowledge Harness for Financial LLM Agents
- arxiv url: http://arxiv.org/abs/2606.01886v1
- Date: Mon, 01 Jun 2026 08:31:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.615152
- Title: Absorbing Complexity: An Interaction-Native Knowledge Harness for Financial LLM Agents
- Title(参考訳): 吸収複雑性:金融LLMエージェントのための相互作用依存的知識ハーネス
- Authors: Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Maksym Chikita, Dmytro Kyrylenko, Sofiia Pidturkina, Julia Stadnyk,
- Abstract要約: 金融AIエージェントのためのインタラクションネイティブ知識ハーネス(InKH)を提案する。
InKHはユーザ、市場、ポートフォリオ、ツールイベントを構造化された運用知識に変換する。
レイテンシを82.95パーセント、トークンコストを82.29パーセント、スタイル知識の使用を96.58パーセント削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Financial AI agents often fail for a simple reason: they make users carry the complexity. A user must repeatedly restate goals, risk preferences, portfolio context, past judgments, and shifting market assumptions, while the agent answers, retrieves, acts, and forgets. In finance, this is not just inconvenient. In tasks such as market analysis, copy-trading review, and trade preparation, forgotten context and stale memory can create latency, repeated errors, weak auditability, and unsafe decisions. We propose the interaction-native knowledge harness (InKH), an architecture for financial LLM agents that absorbs complexity into the system. InKH converts user, market, portfolio, and tool events into structured operational knowledge. It uses passive knowledge injection to assemble a bounded working context buffer before the main model step, temporal graph memory for low-latency retrieval, a wiki audit surface for human-readable governance, and background extraction with maturity, decay, and write-time invalidation. We evaluate InKH on a reproducible controlled synthetic benchmark with 24 random seeds, 4 rounds, 80 episodes per round, and 6 baselines, producing 46,080 baseline-conditioned evaluations. InKH achieves mean task quality of 0.815 at 900 ms latency. Compared with agent-driven wiki-walk memory, it reduces latency by 82.95 percent, token cost by 82.29 percent, and stale-knowledge usage by 96.58 percent, while improving quality by 0.108 and traceability by 0.461. Compared with a temporal-graph system without invalidation, it improves quality by 0.050 and reduces stale-memory usage by 96.58 percent with comparable serving cost. The results support a design thesis for financial AI: adoption happens when complexity is absorbed by the system rather than transferred to the user. The benchmark validates architecture-level behavior, not live trading performance.
- Abstract(参考訳): 金融AIエージェントは単純な理由で失敗することが多い。
ユーザは、目標、リスクの選好、ポートフォリオコンテキスト、過去の判断、市場の仮定のシフトを繰り返し、エージェントは答え、検索、行動、そして忘れる必要があります。
金融では、これは単なる不便ではない。
市場分析、コピートレーディングレビュー、貿易準備といったタスクでは、忘れられたコンテキストと古いメモリが遅延、繰り返しエラー、監査容易性の弱さ、安全でない決定を引き起こす可能性がある。
システムに複雑性を吸収する金融LLMエージェントのためのアーキテクチャであるインタラクションネイティブ知識ハーネス(InKH)を提案する。
InKHはユーザ、市場、ポートフォリオ、ツールイベントを構造化された運用知識に変換する。
受動的知識注入を使用して、メインモデルステップの前に境界付けられた作業コンテキストバッファを組み立て、低レイテンシ検索のための時間グラフメモリ、可読性ガバナンスのためのwiki監査サーフェス、成熟度、崩壊、書き込み時の無効化を含むバックグラウンド抽出を行う。
InKHを24個のランダムシード,4ラウンド,80回毎のラウンド,6つのベースラインで再現可能な制御された合成ベンチマークで評価し,46,080のベースライン条件で評価した。
InKHは平均タスク品質を 0.815 at 900 ms で達成する。
エージェント駆動のwikiウォークメモリと比較すると、レイテンシが82.95パーセント、トークンコストが82.29パーセント、スタイル知識の使用が96.58パーセント、品質が0.108、トレーサビリティが0.461である。
無効化のない時間グラフシステムと比較すると、品質は0.050向上し、安定したメモリ使用量を96.8%削減する。
採用は、ユーザへの転送ではなく、システムによって複雑性が吸収された場合に行われる。
ベンチマークでは、ライブトレーディングのパフォーマンスではなく、アーキテクチャレベルの振る舞いを検証する。
関連論文リスト
- Medication-Aware Financial Exploitation Detection for Alzheimer's Patients Using Edge-Aware Interaction Risk Modeling [0.0]
経済的搾取はアルツハイマー病の人々の関心が高まっている。
本稿では,薬物の付着とトランザクションレベルのモニタリングを同期する薬剤認識フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-30T10:59:24Z) - Scaling Laws for Agent Harnesses via Effective Feedback Compute [53.68149869349268]
emphEffective Feedback Compute (EFC)は、情報的、有効、非冗長な場合にのみフィードバックを信用し、その後の決定のために保持するトレースレベルのスケーリング座標である。
EFCベースの座標は、生の計算ベースラインよりも失敗率を常に予測する。
論文 参考訳(メタデータ) (2026-05-28T09:45:47Z) - LLM Readiness Harness: Evaluation, Observability, and CI Gates for LLM/RAG Applications [51.56484100374058]
評価をデプロイメント決定ワークフローに変換するLLMおよびRAGアプリケーションのための準備性ハーネスを提案する。
このシステムは、最小限のAPI契約の下で、自動ベンチマーク、OpenTelemetryオブザーバビリティ、CI品質ゲートを組み合わせる。
チケットルーティングとBEIRタスクのハーネスを、完全なAzureマトリックスカバレッジで評価する。
論文 参考訳(メタデータ) (2026-03-28T18:03:32Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - An Effective and Cost-Efficient Agentic Framework for Ethereum Smart Contract Auditing [8.735899453872966]
Heimdallrは,4つのコアイノベーションを通じてハードルを克服するために設計された,自動監査エージェントだ。
重要なビジネスロジックを保持しながら、コンテキストオーバーヘッドを最小限にします。
複雑な脆弱性を検出し、機能的なエクスプロイトを自動的にチェーンする。
論文 参考訳(メタデータ) (2026-01-25T13:28:37Z) - ZIP-RC: Optimizing Test-Time Compute via Zero-Overhead Joint Reward-Cost Prediction [57.799425838564]
ZIP-RCは、モデルに報酬とコストのゼロオーバーヘッド推論時間予測を持たせる適応推論手法である。
ZIP-RCは、同じまたはより低い平均コストで過半数投票よりも最大12%精度が向上する。
論文 参考訳(メタデータ) (2025-12-01T09:44:31Z) - Confidence-Based Response Abstinence: Improving LLM Trustworthiness via Activation-Based Uncertainty Estimation [7.3923284353934875]
本稿では,大規模言語モデル(LLM)出力の正しさと密接に一致したRAGシステムにおける信頼度推定手法を提案する。
提案手法は、生のフィードフォワードネットワーク(FFN)を自己回帰信号として活用することにより、事前の不確実性定量化手法を拡張した。
我々の結果は、アクティベーションに基づく信頼度モデリングが、信頼性の高いRAGデプロイメントへのスケーラブルでアーキテクチャを意識したパスを提供することを示した。
論文 参考訳(メタデータ) (2025-10-15T16:55:56Z) - When Hallucination Costs Millions: Benchmarking AI Agents in High-Stakes Adversarial Financial Markets [0.3069921776214295]
AI評価において重要な盲点を明らかにするベンチマークであるCAIAを提示する。
我々は178の時間短縮タスクに対して17のモデルを評価し,真理と操作の区別をエージェントに要求した。
ツールがなければ、フロンティアモデルでさえ、ジュニアアナリストが日常的に扱うタスクにおいて28%の精度しか達成できません。
論文 参考訳(メタデータ) (2025-09-30T22:39:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。