論文の概要: Search-Based Risk Feature Discovery in Document Structure Spaces under a Constrained Budget
- arxiv url: http://arxiv.org/abs/2601.21608v1
- Date: Thu, 29 Jan 2026 12:14:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.793499
- Title: Search-Based Risk Feature Discovery in Document Structure Spaces under a Constrained Budget
- Title(参考訳): 制約予算下における文書構造空間における検索に基づくリスク特徴発見
- Authors: Saisubramaniam Gopalakrishnan, Harikrishnan P M, Dagnachew Birru,
- Abstract要約: 限られた予算の下での早期のシステム検証は、多様な障害メカニズムを明らかにすることを義務付けている。
我々はこの課題を検索ベースソフトウェアテスト(SBST)問題として定式化する。
提案手法は文書構成の空間上で動作し,実際の故障条件を誘発する構造的アンフィスクな特徴のインスタンスを描画する。
- 参考スコア(独自算出の注目度): 1.2507839249605703
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Enterprise-grade Intelligent Document Processing (IDP) systems support high-stakes workflows across finance, insurance, and healthcare. Early-phase system validation under limited budgets mandates uncovering diverse failure mechanisms, rather than identifying a single worst-case document. We formalize this challenge as a Search-Based Software Testing (SBST) problem, aiming to identify complex interactions between document variables, with the objective to maximize the number of distinct failure types discovered within a fixed evaluation budget. Our methodology operates on a combinatorial space of document configurations, rendering instances of structural \emph{risk features} to induce realistic failure conditions. We benchmark a diverse portfolio of search strategies spanning evolutionary, swarm-based, quality-diversity, learning-based, and quantum under identical budget constraints. Through configuration-level exclusivity, win-rate, and cross-temporal overlap analyses, we show that different solvers consistently uncover failure modes that remain undiscovered by specific alternatives at comparable budgets. Crucially, cross-temporal analysis reveals persistent solver-specific discoveries across all evaluated budgets, with no single strategy exhibiting absolute dominance. While the union of all solvers eventually recovers the observed failure space, reliance on any individual method systematically delays the discovery of important risks. These results demonstrate intrinsic solver complementarity and motivate portfolio-based SBST strategies for robust industrial IDP validation.
- Abstract(参考訳): エンタープライズグレードのインテリジェントドキュメント処理(IDP)システムは、財務、保険、医療の高度なワークフローをサポートする。
限られた予算の下での早期段階のシステム検証は、単一の最悪のケース文書を特定するのではなく、多様な障害メカニズムを明らかにすることを義務付けている。
我々は,この課題を,文書変数間の複雑な相互作用を特定することを目的とした検索ベースソフトウェアテスト(SBST)問題として定式化し,固定評価予算内で見いだされる個別の障害の種類数を最大化することを目的とする。
提案手法は文書構成の組合せ空間上で動作し,構造的 \emph{risk features} のインスタンスをレンダリングすることで,現実的な故障条件を誘導する。
我々は、進化的、スワムベース、品質多様性、学習ベース、および同じ予算制約の下で量子にまたがる多様な検索戦略のポートフォリオをベンチマークする。
構成レベルの排他性、勝利率、時間的重複分析を通じて、異なる解法が相反する予算で特定の代替手段によって発見されない障害モードを常に発見することを示します。
重要な点として、時間的横断分析は、絶対的な優位性を示す単一の戦略が存在しない全ての評価予算において、解決者固有の発見を持続的に示す。
すべての解決者の結合は最終的に観測された失敗空間を回復するが、個々の手法に依存すると、重要なリスクの発見が体系的に遅延する。
これらの結果は、本質的な解決法を補完し、ロバストな産業IDP検証のためのポートフォリオベースのSBST戦略を動機づけるものである。
関連論文リスト
- Heterogeneous Uncertainty-Guided Composed Image Retrieval with Fine-Grained Probabilistic Learning [49.28548464288051]
Composed Image Retrieval (CIR)は、参照画像と修正テキストを組み合わせることで、画像検索を可能にする。
CIR三重項の内在ノイズは内在的不確実性を引き起こし、モデルの堅牢性を脅かす。
本稿では,これらの制約を克服するための不確実性誘導(HUG)パラダイムを提案する。
論文 参考訳(メタデータ) (2026-01-16T16:05:49Z) - Theory and Algorithms for Learning with Multi-Class Abstention and Multi-Expert Deferral [20.76255397215973]
大規模言語モデル(LLM)は目覚ましい性能を達成したが、幻覚や高い推論コストといった重要な課題に直面している。
より有能な専門家に不確実なインプットを延期することで、信頼性が向上する。
この論文は、強い一貫性の保証によって支持される、この問題と、それに関連する禁断学習の問題を包括的に研究している。
論文 参考訳(メタデータ) (2025-12-28T11:33:39Z) - LLM-Centric RAG with Multi-Granular Indexing and Confidence Constraints [5.2604064919135896]
本稿では,複雑な知識環境下での検索強化生成において,不十分なカバレッジ,不安定な結果,信頼性の制限といった問題に対処する。
複数粒度メモリインデックスと不確実性推定を統合した信頼度制御法を提案する。
提案手法は,QA精度,検索リコール,ランキング品質,事実整合性において,既存モデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2025-10-30T23:48:37Z) - ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search [69.60882125603133]
本稿では,検索した文書の信頼性情報を明確に活用する,敵対的堅牢性のためのフレームワークであるReliabilityRAGを提案する。
我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。
論文 参考訳(メタデータ) (2025-09-27T22:36:42Z) - Hierarchical Budget Policy Optimization for Adaptive Reasoning [49.621779447691665]
階層的予算政策最適化(Hierarchical Budget Policy Optimization, HBPO)は、モデルが問題固有の推論深度を犠牲にすることなく学習できる強化学習フレームワークである。
HBPOは、探索空間を予算制約付き階層(512-2560トークン)に分割する。
大規模な実験により、HBPOは平均トークン使用量を最大60.6%削減し、4つの推論ベンチマークで精度を3.14%改善した。
論文 参考訳(メタデータ) (2025-07-21T17:52:34Z) - Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - An Efficient Approach for Solving Expensive Constrained Multiobjective Optimization Problems [0.0]
効率的な確率的選択に基づく制約付き多目的EAをPSCMOEAと呼ぶ。
a) 評価された解の実現可能性と収束状態に基づく適応探索境界同定スキームのような新しい要素を含む。
ECMOPを模擬する低評価予算を用いて, 幅広い制約付き問題に対して, 数値実験を行った。
論文 参考訳(メタデータ) (2024-05-22T02:32:58Z) - Bandit Pareto Set Identification: the Fixed Budget Setting [10.967572582187014]
マルチアームバンディットモデルにおける純粋探索問題について検討する。
目的は、平均値が他の分布よりも均一に悪くない分布を特定することである。
論文 参考訳(メタデータ) (2023-11-07T13:43:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。