論文の概要: DeXposure-Claw: An Agentic System for DeFi Risk Supervision
- arxiv url: http://arxiv.org/abs/2606.19501v1
- Date: Wed, 17 Jun 2026 18:40:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.487654
- Title: DeXposure-Claw: An Agentic System for DeFi Risk Supervision
- Title(参考訳): DeXposure-Claw:DeFiリスク監視のためのエージェントシステム
- Authors: Aijie Shu, Bowei Chen, Wenbin Wu, Cathy Yi-Hsuan Chen, Fengxiang He,
- Abstract要約: 汎用LLM剤はこの設定に適さない。
既存の評価では、結果として生じる誤報を測定するための規制に整合した手段は提供されていない。
予測型エージェント監視システムであるDeXposure-Clawを紹介する。
- 参考スコア(独自算出の注目度): 18.719297847519552
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decentralized finance exposes supervisors to fast-moving, networked credit risks. General-purpose LLM agents fit this setting poorly: they over-read weak evidence and recommend high-stakes interventions, while existing evaluations offer no regulator-aligned way to measure the resulting false alarms. We introduce DeXposure-Claw, a forecast-grounded agentic supervision system that routes LLM decisions through structured evidence: (1) DeXposure-FM, a graph time-series foundation model, forecasts future exposure networks; (2) deterministic monitors and stress scenarios then turn those forecasts into typed alerts, attribution signals, and scenario evidence; and (3) data-health and confidence gates constrain escalation before DeXposure-Claw emits auditable supervisory tickets with rationales. We further develop DeXposure-Bench, a six-axis evaluation harness, whose decision axis scores tickets against a regulator-aligned absolute-loss ground truth and an explicit false-intervention rate. Experiments on five years of weekly real data fully support our system. Code is at https://github.com/EVIEHub/DeXposure-Claw.
- Abstract(参考訳): 分散ファイナンスにより、監督者は高速でネットワーク化された信用リスクに晒される。
汎用LLMエージェントは、弱い証拠を過度に読み上げ、高い投資介入を推奨する一方で、既存の評価では、結果として生じる誤報を測定するための規制に整合した手段を提供していない。
1)グラフ時系列基盤モデルであるDeXposure-FM, 将来の露出ネットワークの予測, (2) 決定論的監視とストレスシナリオ, そして, それらの予測を型付きアラート, 帰属信号, シナリオエビデンスに変換する, (3) データヘルスと信頼ゲートは, デXposure-Clawが有理性を持つ監査チケットを発行する前にエスカレーションを制約する, という構造的証拠によってLCMの意思決定をルーティングする, エージェント監視システムであるDeXposure-Clawを紹介する。
さらに,6軸評価ハーネスであるDeXposure-Benchを開発した。
5年間の週ごとの実データによる実験は、我々のシステムを完全にサポートしています。
コードはhttps://github.com/EVIEHub/DeXposure-Clawにある。
関連論文リスト
- Detecting Is Not Resolving: The Monitoring Control Gap in Retrieval Augmented LLMs [20.59321114618083]
単一ターン診断はRAGの安全性を体系的に過大評価し、矛盾は安全な解決法とは無関係であり、普遍的な即時修正は存在しないことを示した。
モデルが認識するものと何をするかのギャップは、検索強化されたシステムが高レベルな設定で信頼される前に測定され、クローズされなければならない。
論文 参考訳(メタデータ) (2026-05-26T15:18:43Z) - Time to REFLECT: Can We Trust LLM Judges for Evidence-based Research Agents? [61.49434544687523]
本稿では,エージェント環境におけるきめ細かい故障検出を目的としたメタ評価ベンチマークREFLECTを紹介する。
REFLECTはプロセスレベルの障害モードと結果レベルの障害モードの詳細な分類を定義し、制御および局所的な介入を実行することでインスタンス化する。
私たちの実験では、最高のパフォーマンスモデルでさえ、推論、ツール使用、レポート品質の失敗に対して、全体的なアキュラシーを55%以下に達成しています。
論文 参考訳(メタデータ) (2026-05-18T23:55:08Z) - Label-Free Detection of Governance Evidence Degradation in Risk Decision Systems [0.0]
不正検出・信用スコアリングにおけるリスク決定システムは、構造ラベルが存在しない状態で運用される。
既存のフレームワークは、ドリフト検出とガバナンスエビデンス評価と運用対応を統合していません。
本稿では,ガバナンスドリフトツールキットのラベルフリーガバナンス監視拡張について述べる。
論文 参考訳(メタデータ) (2026-04-20T05:46:15Z) - LLM-Grounded Explainable AI for Supply Chain Risk Early Warning via Temporal Graph Attention Networks [0.5653106385738822]
重要な物流ノードの破壊は、世界的なサプライチェーンに深刻なリスクをもたらす。
本稿では,ボトルネック予測と忠実な自然言語リスク説明を共同で行うエビデンス基盤フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-05T05:07:40Z) - DeXposure-FM: A Time-series, Graph Foundation Model for Credit Exposures and Stability on Decentralized Financial Networks [19.267203167142505]
分散ファイナンス(DeFi)の信用露出は暗黙的でトークンを介し、プロトコール間の依存関係の密集したWebを作ることが多い。
本稿では,最初の時系列グラフ基盤モデルであるDeXposure-FMについて紹介する。
論文 参考訳(メタデータ) (2026-02-03T20:10:11Z) - Conformal Thinking: Risk Control for Reasoning on a Compute Budget [60.65072883773352]
大規模言語モデル(LLM)の推論により、トークンの予算が増加するにつれて、データセットレベルの精度が向上する。
我々は、予算設定問題をリスクコントロールとして再設定し、計算を最小化しながらエラー率を制限する。
我々のフレームワークは、モデルが自信のあるときに推論を停止する上位しきい値と、未解決のインスタンスを事前に停止させる新しい下位しきい値を導入する。
論文 参考訳(メタデータ) (2026-02-03T18:17:22Z) - Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.5533899503582]
大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文 参考訳(メタデータ) (2026-01-21T06:07:43Z) - LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems [95.35293543918762]
大規模言語モデル(LLM)はしばしば信頼できない答えを生成するが、不確実性のある手法は誤った予測と完全に区別することができない。
我々は、この問題を、偽発見率(FDR)制御のレンズを通して解決し、全ての許容された予測のうち、エラーの割合が目標のリスクレベルを超えないことを保証する。
本稿では,線形期待制約を強制することで,選択予測を制約付き決定問題として再解釈するLECを提案する。
論文 参考訳(メタデータ) (2025-12-01T11:27:09Z) - AT-CXR: Uncertainty-Aware Agentic Triage for Chest X-rays [12.843444405498404]
胸部X線に対する不確実性認識剤AT-CXRについて紹介する。
システムは、ケースごとの信頼度と分散適合度を推定し、次に、自動決定を発行するための段階的なポリシーに従う。
同一の入力と動作を共有する2つのルータの設計を評価する。
論文 参考訳(メタデータ) (2025-08-26T14:33:09Z) - Free Lunch for Generating Effective Outlier Supervision [46.37464572099351]
本稿では, ほぼ現実的な外乱監視を実現するための超効率的な手法を提案する。
提案したtextttBayesAug は,従来の方式に比べて偽陽性率を 12.50% 以上削減する。
論文 参考訳(メタデータ) (2023-01-17T01:46:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。