論文の概要: A New Score for Adaptive Tests in Bayesian and Credal Networks
- arxiv url: http://arxiv.org/abs/2105.12205v1
- Date: Tue, 25 May 2021 20:35:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-28 06:55:48.642118
- Title: A New Score for Adaptive Tests in Bayesian and Credal Networks
- Title(参考訳): ベイズおよびクレダルネットワークにおける適応テストのための新しいスコア
- Authors: Alessandro Antonucci and Francesca Mangili and Claudio Bonesana and
Giorgia Adorni
- Abstract要約: テストは、そのシークエンスと質問数とが、テイカーの推定スキルに基づいて動的に調整されるときに適応する。
後部確率のモードに基づいて、別のスコアの族を提示するので、説明し易い。
- 参考スコア(独自算出の注目度): 64.80185026979883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A test is adaptive when its sequence and number of questions is dynamically
tuned on the basis of the estimated skills of the taker. Graphical models, such
as Bayesian networks, are used for adaptive tests as they allow to model the
uncertainty about the questions and the skills in an explainable fashion,
especially when coping with multiple skills. A better elicitation of the
uncertainty in the question/skills relations can be achieved by interval
probabilities. This turns the model into a credal network, thus making more
challenging the inferential complexity of the queries required to select
questions. This is especially the case for the information theoretic quantities
used as scores to drive the adaptive mechanism. We present an alternative
family of scores, based on the mode of the posterior probabilities, and hence
easier to explain. This makes considerably simpler the evaluation in the credal
case, without significantly affecting the quality of the adaptive process.
Numerical tests on synthetic and real-world data are used to support this
claim.
- Abstract(参考訳): テストは、そのシークエンスと質問数とが、テイカーの推定スキルに基づいて動的に調整されるときに適応する。
ベイジアンネットワークのようなグラフィカルモデルは、特に複数のスキルを扱う際に、質問やスキルに関する不確実性を説明可能な方法でモデル化できるため、適応テストに使用される。
質問/スキル関係における不確実性のより良い推論は、間隔確率によって達成できる。
これにより、モデルがクレーダルネットワークになるため、質問を選択するのに必要なクエリの推測的な複雑さが難しくなります。
これは特に、適応機構を駆動するためにスコアとして使われる情報理論量の場合である。
我々は,後方確率のモードに基づくスコアの代替系を示し,それゆえ説明が容易である。
これにより, 適応過程の品質に悪影響を及ぼすことなく, クレーダルケースの評価を大幅に単純化する。
合成および実世界のデータに関する数値実験は、この主張を支持するために用いられる。
関連論文リスト
- Adaptive Data-Free Quantization [44.00726062583708]
データフリー量子化(DFQ)は、元のデータなしで量子化されたネットワーク(Q)の性能を回復する。
DFQは、全精度ネットワークから学習して、ジェネレータ(G)を介して偽サンプルを生成する(P)。
ゼロサムゲームの観点からDFQを再検討するAdaptive Data-Free Quantization (AdaDFQ)法を提案する。
論文 参考訳(メタデータ) (2023-03-13T05:37:40Z) - Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。
また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文 参考訳(メタデータ) (2022-04-06T06:39:40Z) - Logically Consistent Loss for Visual Question Answering [66.83963844316561]
ニューラルネットワークに基づく視覚質問応答(VQA)の現在の進歩は、同じ分布(すなわち、d)の仮定による一貫性を保証することができない。
マルチタスク学習フレームワークにおける論理的一貫した損失を定式化することにより,この問題に対処するための新しいモデルに依存しない論理制約を提案する。
実験により、提案された損失公式とハイブリッドバッチの導入により、一貫性が向上し、性能が向上することを確認した。
論文 参考訳(メタデータ) (2020-11-19T20:31:05Z) - On the Robustness of Active Learning [0.7340017786387767]
Active Learningは、機械学習アルゴリズムをトレーニングする上で最も有用なサンプルを特定する方法に関するものだ。
十分な注意とドメイン知識を持っていないことがよくあります。
そこで本研究では,Simpson の多様性指標に基づく新たな "Sum of Squared Logits" 手法を提案する。
論文 参考訳(メタデータ) (2020-06-18T09:07:23Z) - Selective Question Answering under Domain Shift [90.021577320085]
モデルがドメイン外の入力に対して過度に信頼されているため、モデルのソフトマックス確率のみに基づくアテンションポリシーは不適切である。
キャリブレータをトレーニングして、QAモデルがアースする入力を識別し、エラーを予測した場合に停止する。
提案手法は,80%の精度を維持しながら56%の質問に回答するが,それに対してモデルの確率を直接使用する場合,80%の精度で48%しか回答しない。
論文 参考訳(メタデータ) (2020-06-16T19:13:21Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z) - Manifold-based Test Generation for Image Classifiers [7.226144684379191]
画像分類ニューラルネットワークをテストするには、信頼を刺激するのに十分な現実的なテストデータを取得する必要がある。
本稿では,これらの課題に対処するための新しい枠組みを提案する。
実験により、この手法により、十分に訓練されたモデルであっても、何千もの現実的かつフォールトレベリングなテストケースを効率的に生成できることが示された。
論文 参考訳(メタデータ) (2020-02-15T07:53:34Z) - ManyModalQA: Modality Disambiguation and QA over Diverse Inputs [73.93607719921945]
本稿では, エージェントが3つの異なるモダリティを考慮し, 質問に答えなければならない, マルチモーダルな質問応答課題, ManyModalQAを提案する。
われわれはウィキペディアをスクラップしてデータを収集し、クラウドソーシングを利用して質問と回答のペアを収集する。
論文 参考訳(メタデータ) (2020-01-22T14:39:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。