論文の概要: A Review of Validation and Verification of Neural Network-based Policies
for Sequential Decision Making
- arxiv url: http://arxiv.org/abs/2312.09680v1
- Date: Fri, 15 Dec 2023 10:52:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 16:14:35.793446
- Title: A Review of Validation and Verification of Neural Network-based Policies
for Sequential Decision Making
- Title(参考訳): 逐次意思決定のためのニューラルネットワークに基づくポリシーの検証と検証のレビュー
- Authors: Q. Mazouni, H. Spieker, A. Gotlieb and M. Acher
- Abstract要約: シーケンシャルな意思決定では、ニューラルネットワーク(NN)がエージェントのポリシーを表現し、学習するために一般的に使用される。
シーケンシャルな意思決定のために、これらの手法をNNベースのポリシーに適応する新たなアプローチが出現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In sequential decision making, neural networks (NNs) are nowadays commonly
used to represent and learn the agent's policy. This area of application has
implied new software quality assessment challenges that traditional validation
and verification practises are not able to handle. Subsequently, novel
approaches have emerged to adapt those techniques to NN-based policies for
sequential decision making. This survey paper aims at summarising these novel
contributions and proposing future research directions. We conducted a
literature review of recent research papers (from 2018 to beginning of 2023),
whose topics cover aspects of the test or verification of NN-based policies.
The selection has been enriched by a snowballing process from the previously
selected papers, in order to relax the scope of the study and provide the
reader with insight into similar verification challenges and their recent
solutions. 18 papers have been finally selected. Our results show evidence of
increasing interest for this subject. They highlight the diversity of both the
exact problems considered and the techniques used to tackle them.
- Abstract(参考訳): 逐次意思決定では、ニューラルネットワーク(nn)がエージェントのポリシーを表現し学習するために一般的に使用される。
この適用領域は、従来の検証と検証のプラクティスでは処理できない新しいソフトウェア品質評価の課題を暗示している。
その後、これらの手法をnnベースの政策に順次決定するための新しいアプローチが登場している。
本稿では,これらの新たな貢献を要約し,今後の研究の方向性を提案する。
我々は最近の研究論文(2018年から2023年初頭)の文献レビューを行い、その内容はnnベースの政策の検証や検証の側面を取り上げている。
この選択は、研究の範囲を緩和し、同様の検証課題とその最近の解決策に関する洞察を読者に提供するため、以前に選択した論文からの雪球プロセスによって強化されている。
最終的に18の論文が選ばれた。
以上の結果から,本研究への関心が高まっていることを示す。
彼らは、考慮された問題とそれらに取り組むのに使用されるテクニックの両方の多様性を強調している。
関連論文リスト
- A Survey on Neural Question Generation: Methods, Applications, and Prospects [56.97451350691765]
調査は、NQGの背景の概要から始まり、タスクの問題を定式化している。
その後、NQGアプローチを構造化NQG、非構造化NQG、ハイブリッドNQGの3つの主要なカテゴリに分類する。
この調査は、NQGの軌跡を前方視し、創発的な研究動向と今後の発展の道筋を見極めている。
論文 参考訳(メタデータ) (2024-02-28T11:57:12Z) - Fact-checking based fake news detection: a review [27.016249665465544]
本論文は,事実に基づく偽ニュース検出の課題定義と課題を体系的に解説する。
本稿では,アルゴリズムの原理に基づく既存の検出手法について要約する。
論文 参考訳(メタデータ) (2024-01-03T12:47:02Z) - A Comprehensive Survey on Relation Extraction: Recent Advances and New Frontiers [76.51245425667845]
関係抽出(RE)は、基礎となるコンテンツからエンティティ間の関係を識別する。
ディープニューラルネットワークはREの分野を支配しており、顕著な進歩を遂げている。
この調査は、現実世界のREシステムの課題に対処するための研究者の協力的な取り組みを促進することが期待されている。
論文 参考訳(メタデータ) (2023-06-03T08:39:25Z) - Backward Reachability Analysis of Neural Feedback Loops: Techniques for
Linear and Nonlinear Systems [59.57462129637796]
本稿では,ニューラルネットワークを用いた閉ループシステムの安全性検証のための後方到達性アプローチを提案する。
フィードバックループにおけるNNの存在は、その活性化関数の非線形性や、NNモデルは一般に可逆的ではないため、ユニークな問題セットを示す。
フィードフォワードNNで表される制御ポリシを持つ線形系と非線形系のBP過近似を計算するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T13:17:28Z) - A Survey of Neural Trees [34.073451014924345]
ニューラルネットワーク(NN)と決定木(DT)はどちらも、マシンラーニングの一般的なモデルである。
2つの世界を最大限に活用するために、NNとDTを明示的にあるいは暗黙的に統合する様々なアプローチが提案されている。
本調査は,NTの包括的レビューと,モデル解釈可能性の向上方法の検証を目的としている。
論文 参考訳(メタデータ) (2022-09-07T18:33:45Z) - Recent Few-Shot Object Detection Algorithms: A Survey with Performance
Comparison [54.357707168883024]
Few-Shot Object Detection (FSOD)は、人間の学習能力を模倣する。
FSODは、学習した汎用オブジェクトの知識を共通のヘビーテールから新しいロングテールオブジェクトクラスにインテリジェントに転送する。
本稿では,問題定義,共通データセット,評価プロトコルなどを含むFSODの概要を紹介する。
論文 参考訳(メタデータ) (2022-03-27T04:11:28Z) - A Systematic Review on the Detection of Fake News Articles [0.0]
偽ニュースや偽情報の拡散は世界中の社会に脅威をもたらすと論じられている。
この脅威に対処するため、自然言語処理(NLP)アプローチが開発されている。
本稿は,最も性能の高い偽ニュース検出手法の定式化,既存手法による制約の特定,緩和手法の提案を目的とする。
論文 参考訳(メタデータ) (2021-10-18T21:29:11Z) - A Review of Uncertainty Quantification in Deep Learning: Techniques,
Applications and Challenges [76.20963684020145]
不確実性定量化(UQ)は、最適化と意思決定プロセスの両方において不確実性の低減に重要な役割を果たしている。
ビザレ近似とアンサンブル学習技術は、文学において最も広く使われている2つのUQ手法である。
本研究は, 深層学習におけるUQ手法の最近の進歩を概観し, 強化学習におけるこれらの手法の適用について検討する。
論文 参考訳(メタデータ) (2020-11-12T06:41:05Z) - A Survey of Active Learning for Text Classification using Deep Neural
Networks [1.2310316230437004]
自然言語処理(NLP)とニューラルネットワーク(NN)はどちらも近年大きく変化している。
しかし、アクティブラーニング(AL)の目的のために、NNは、現在の人気にもかかわらず、あまり使われていない。
論文 参考訳(メタデータ) (2020-08-17T12:53:20Z) - Novel Policy Seeking with Constrained Optimization [131.67409598529287]
本稿では,強化学習課題における新しい政策作成の問題を再考する。
まず、政策間の差異を評価するための新しい指標を導入し、2つの実用的な政策生成手法を設計する。
The Constrained Task Novel Bisector (CTNB) and the internal Policy Differentiation (IPD) is derived from the fiable direction method and the interior point method known in the constrained optimization literature。
論文 参考訳(メタデータ) (2020-05-21T14:39:14Z) - Text-based Question Answering from Information Retrieval and Deep Neural
Network Perspectives: A Survey [0.0]
テキストベースの質問回答(QA)は,ユーザの質問に対する簡潔な回答を見つけることを目的とした課題である。
本論文の主な焦点であるディープラーニングアプローチは,複数のレイヤの表現と質問とテキスト間の相互作用を学習する強力な技術を提供する。
論文 参考訳(メタデータ) (2020-02-16T16:24:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。