論文の概要: An Agentic Retrieval Framework for Autonomous Context-Aware Data Quality Assessment
- arxiv url: http://arxiv.org/abs/2606.13692v1
- Date: Fri, 15 May 2026 11:24:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-21 20:00:42.725473
- Title: An Agentic Retrieval Framework for Autonomous Context-Aware Data Quality Assessment
- Title(参考訳): 自律的文脈認識データ品質評価のためのエージェント検索フレームワーク
- Authors: Hadi Fadlallah, Ibrahim Dhaini, Fatima Mubarak, Rima Kilany,
- Abstract要約: 本稿では,自律型文脈認識データ品質評価のための統合型エージェント・検索フレームワークを提案する。
このフレームワークは、意図したデータ使用の自然言語記述を解釈し、コンテキスト対応評価戦略を導出し、実行可能な検証ロジックを生成する。
提案するフレームワークをエンドツーエンドのプロトタイプとして実装し、同じデータセットに適用された複数のユースケースで評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data quality assessment is a critical prerequisite for effective data analytics and data-driven decision-making, yet it remains a challenging task due to the inherently context-dependent nature of data quality. Existing approaches often rely on static rules or manual assessment strategies, limiting their adaptability to diverse usage scenarios and constraining automation at scale. Recent advances in artificial intelligence, particularly large language models, offer new opportunities for automating data quality assessment, but raise concerns related to reliability, grounding, and execution safety. In this paper, we propose a unified agentic-retrieval framework for autonomous context-aware data quality assessment. The framework interprets natural-language descriptions of intended data usage, derives context-aware assessment strategies, and generates executable validation logic through a multi-agent workflow. To ensure operational reliability, the framework introduces a feasibility validation stage that evaluates the realism and executability of generated assessment specifications before execution, enabling iterative refinement when necessary. Accepted validation logic is executed deterministically to guarantee reproducible and auditable results. We implement the proposed framework as an end-to-end prototype and evaluate it across multiple usage scenarios applied to the same dataset. The results demonstrate that assessment outcomes adapt meaningfully to different intended uses, while feasibility-gated execution reduces unrealistic or non-executable rule generation. The proposed approach provides a practical foundation for deploying autonomous yet controlled data quality assessment in modern data-driven environments.
- Abstract(参考訳): データ品質評価は、効果的なデータ分析とデータ駆動型意思決定のための重要な前提条件であるが、本質的にコンテキストに依存したデータ品質の性質のため、依然として難しい課題である。
既存のアプローチは静的なルールや手動のアセスメント戦略に依存しており、さまざまな利用シナリオへの適応性を制限し、大規模に自動化を制限している。
近年の人工知能、特に大規模言語モデルの進歩は、データ品質評価を自動化する新たな機会を提供するが、信頼性、接地、実行安全性に関する懸念を提起する。
本稿では,自律型文脈認識データ品質評価のための統合型エージェント検索フレームワークを提案する。
このフレームワークは、意図したデータ使用の自然言語記述を解釈し、コンテキスト認識評価戦略を導出し、マルチエージェントワークフローを通じて実行可能な検証ロジックを生成する。
運用上の信頼性を確保するため、フレームワークは実行前に生成された評価仕様の現実性と実行性を評価し、必要に応じて反復的な改善を可能にする実現可能性検証ステージを導入する。
承認された検証ロジックは、再現性と監査可能な結果を保証するために決定的に実行される。
提案するフレームワークをエンドツーエンドのプロトタイプとして実装し、同じデータセットに適用された複数のユースケースで評価する。
その結果、評価結果は異なる目的の用途に有意に適応する一方で、実行可能性に制限された実行は非現実的または実行不可能なルール生成を減少させることが示された。
提案手法は、現代のデータ駆動環境において、自律的で制御されたデータ品質アセスメントをデプロイするための実践的な基盤を提供する。
関連論文リスト
- Model Validation of Agentic AI Systems: A POMDP-Based Framework for Belief-State, Forecast, and Policy Validation [0.0]
本稿では,部分観測可能なマルコフ決定プロセス(POMDP)に基づくエージェントAIのモデル検証フレームワークを提案する。
このフレームワークは、自律的な意思決定を情報、信念、予測、行動、ユーティリティに分解し、各コンポーネントを独立して検証できるようにする。
この論文の主な貢献は、確立されたモデルリスク管理概念を自律型AIシステムに拡張するための実践的なフレームワークである。
論文 参考訳(メタデータ) (2026-06-16T00:40:55Z) - Evaluating Supervised Machine Learning Models: Principles, Pitfalls, and Metric Selection [5.015895904388096]
本稿では,教師付き学習アルゴリズムの評価に関わる原則,課題,実践的考察について検討する。
評価結果は,データセットの特徴,検証設計,クラス不均衡,非対称なエラーコスト,パフォーマンス指標の選択にどのように影響するかを論じる。
論文 参考訳(メタデータ) (2026-04-15T13:44:35Z) - Statistical Confidence in Functional Correctness: An Approach for AI Product Functional Correctness Evaluation [1.4521584395164622]
本稿では,機能的正確性(SCFC)における統計的信頼度について提案し,評価する。
アプローチは4つのステップから構成される: 量的仕様の限界を定義し、階層化および確率的サンプリングを行い、ブートストラップを適用してパフォーマンス指標の信頼区間を推定し、最終的な指標としての能力指数を計算する。
提案手法は,機能的正当性の評価を,点推定値から統計的信頼性のステートメントに移動させる,実現可能かつ価値のある方法である,と結論付けている。
論文 参考訳(メタデータ) (2026-02-20T17:06:38Z) - Cost-Optimal Active AI Model Evaluation [71.2069549142394]
生成AIシステムの開発には、継続的な評価、データ取得、アノテーションが必要である。
我々は、安価だがしばしば不正確で弱いレーダの使用を積極的にバランスさせる新しいコスト認識手法を開発した。
我々は、弱者と強者の間で所定のアノテーション予算を割り当てるためのコスト最適化政策のファミリーを導出する。
論文 参考訳(メタデータ) (2025-06-09T17:14:41Z) - Towards Explainable Automated Data Quality Enhancement without Domain Knowledge [0.0]
我々は,任意のデータセットにおけるデータ品質問題を自動的に評価し,修正するための包括的フレームワークを提案する。
私たちの主な目的は、欠如、冗長性、不整合という3つの基本的な欠陥に対処することです。
統計的手法と機械学習アルゴリズムを統合するハイブリッドアプローチを採用する。
論文 参考訳(メタデータ) (2024-09-16T10:08:05Z) - Adaptive Data Quality Scoring Operations Framework using Drift-Aware Mechanism for Industrial Applications [0.0]
本稿では,産業データストリームの動的品質次元がもたらす課題に対処する新しい枠組みを提案する。
このフレームワークは動的変更検出機構を統合し、データ品質の変化を積極的に監視し、適応する。
実験結果は、予測性能と効率的な処理時間を示し、実用的な品質駆動型AIアプリケーションにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2024-08-13T08:32:06Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。