論文の概要: Encoding Explanatory Knowledge for Zero-shot Science Question Answering
- arxiv url: http://arxiv.org/abs/2105.05737v1
- Date: Wed, 12 May 2021 15:42:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 12:32:47.420094
- Title: Encoding Explanatory Knowledge for Zero-shot Science Question Answering
- Title(参考訳): ゼロショット科学質問応答のための説明知識の符号化
- Authors: Zili Zhou, Marco Valentino, Donal Landers, Andre Freitas
- Abstract要約: N-XKTは科学質問回答(QA)の精度と一般化を向上する
N-XKTモデルはゼロショットQAの明確な改善を示している。
N-XKTモデルの性能を定量的に分析する系統解析を行う。
- 参考スコア(独自算出の注目度): 0.755972004983746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes N-XKT (Neural encoding based on eXplanatory Knowledge
Transfer), a novel method for the automatic transfer of explanatory knowledge
through neural encoding mechanisms. We demonstrate that N-XKT is able to
improve accuracy and generalization on science Question Answering (QA).
Specifically, by leveraging facts from background explanatory knowledge
corpora, the N-XKT model shows a clear improvement on zero-shot QA.
Furthermore, we show that N-XKT can be fine-tuned on a target QA dataset,
enabling faster convergence and more accurate results. A systematic analysis is
conducted to quantitatively analyze the performance of the N-XKT model and the
impact of different categories of knowledge on the zero-shot generalization
task.
- Abstract(参考訳): 本稿では,N-XKT (Neural encoding based on eXplanatory Knowledge Transfer)について述べる。
我々は,N-XKTが科学質問回答(QA)の精度と一般化を向上できることを実証した。
具体的には、背景説明知識コーパスから事実を活用することにより、N-XKTモデルはゼロショットQAに対して明確な改善を示す。
さらに,N-XKTをターゲットQAデータセット上で微調整し,より高速な収束とより正確な結果が得られることを示す。
N-XKTモデルの性能と異なるカテゴリの知識がゼロショット一般化タスクに与える影響を定量的に解析する。
関連論文リスト
- Modeling Quantum Machine Learning for Genomic Data Analysis [12.248184406275405]
量子機械学習(QML)は進化を続け、多様なアプリケーションに新たな機会を開放している。
ゲノム配列データのバイナリ分類におけるQMLモデルの適用性について,様々な特徴マッピング手法を用いて検討・評価する。
ベンチマークゲノミクスデータセット上で実験を行うために,オープンソースで独立したQiskitベースの実装を提案する。
論文 参考訳(メタデータ) (2025-01-14T15:14:26Z) - CDS: Data Synthesis Method Guided by Cognitive Diagnosis Theory [38.32540433374892]
本研究では,認知診断理論(CDT)を用いた大規模言語モデル(LLM)の精度評価と目標拡張を目的とした認知診断合成(CDS)手法を提案する。
複雑なタスクを個別の知識ポイントに分解することで、CDSはモデルの弱点をターゲットとするデータを正確に識別し、合成し、モデルの性能を向上させる。
このフレームワークは、知識点評価、合成、データ拡張、フィルタリングによって駆動される包括的なパイプラインを提案し、最適なシナリオにおいて最大11.12%の改善を達成し、モデルの数学的およびコーディング能力を大幅に改善する。
論文 参考訳(メタデータ) (2025-01-13T20:13:59Z) - Advanced Knowledge Transfer: Refined Feature Distillation for Zero-Shot Quantization in Edge Computing [1.8067835669244101]
AKT(Advanced Knowledge Transfer)は、低ビット量子化(Q)モデルのトレーニング能力を高める新しい手法である。
低ビットQモデルの基本勾配爆発問題に対処する。
論文 参考訳(メタデータ) (2024-12-26T08:52:27Z) - Automated Knowledge Concept Annotation and Question Representation Learning for Knowledge Tracing [59.480951050911436]
自動知識概念アノテーションと質問表現学習のためのフレームワークであるKCQRLを提案する。
実世界の2つの学習データセット上で、15KTアルゴリズムにまたがるKCQRLの有効性を実証する。
論文 参考訳(メタデータ) (2024-10-02T16:37:19Z) - Analytic Convolutional Layer: A Step to Analytic Neural Network [15.596391258983463]
ACL(Analytic Convolutional Layer)は、分析的畳み込みカーネル(ACK)と従来の畳み込みカーネルのモザイクである。
ACLはニューラルネットワーク解釈の手段を提供するので、ニューラルネットワークの固有の解釈可能性の道を開くことができる。
論文 参考訳(メタデータ) (2024-07-03T07:10:54Z) - Characterizing out-of-distribution generalization of neural networks: application to the disordered Su-Schrieffer-Heeger model [38.79241114146971]
本稿では、量子位相の分類を訓練したニューラルネットワークの予測において、解釈可能性の手法が信頼を高める方法を示す。
特に, 複雑な分類問題において, 分配外分布の一般化を確実にできることを示す。
この研究は,解釈可能性手法の体系的利用が,科学的問題におけるNNの性能をいかに向上させるかを示す一例である。
論文 参考訳(メタデータ) (2024-06-14T13:24:32Z) - QADYNAMICS: Training Dynamics-Driven Synthetic QA Diagnostic for
Zero-Shot Commonsense Question Answering [48.25449258017601]
State-of-the-artはCommonSense Knowledge Basesから構築されたQAペア上での微調整言語モデルにアプローチする。
本稿では,QA診断と改善のためのトレーニング動的フレームワークQADYNAMICSを提案する。
論文 参考訳(メタデータ) (2023-10-17T14:27:34Z) - Pre-training Tensor-Train Networks Facilitates Machine Learning with Variational Quantum Circuits [70.97518416003358]
変分量子回路(VQC)は、ノイズの多い中間スケール量子(NISQ)デバイス上での量子機械学習を約束する。
テンソルトレインネットワーク(TTN)はVQC表現と一般化を向上させることができるが、結果として得られるハイブリッドモデルであるTTN-VQCは、Polyak-Lojasiewicz(PL)条件による最適化の課題に直面している。
この課題を軽減するために,プレトレーニングTTNモデルとVQCを組み合わせたPre+TTN-VQCを導入する。
論文 参考訳(メタデータ) (2023-05-18T03:08:18Z) - Normalizing Flow-based Neural Process for Few-Shot Knowledge Graph
Completion [69.55700751102376]
FKGC (Few-shot Knowledge Graph completion) は、失明した事実を、無意味な関連のある事実で予測することを目的としている。
既存のFKGC手法はメートル法学習やメタラーニングに基づいており、しばしば分布外や過度に適合する問題に悩まされる。
本稿では,数ショット知識グラフ補完(NP-FKGC)のためのフローベースニューラルプロセスの正規化を提案する。
論文 参考訳(メタデータ) (2023-04-17T11:42:28Z) - Great Truths are Always Simple: A Rather Simple Knowledge Encoder for
Enhancing the Commonsense Reasoning Capacity of Pre-Trained Models [89.98762327725112]
自然言語における常識推論は、人工知能システムの望ましい能力である。
複雑なコモンセンス推論タスクを解決するための典型的な解決策は、知識対応グラフニューラルネットワーク(GNN)エンコーダで事前訓練された言語モデル(PTM)を強化することである。
有効性にもかかわらず、これらのアプローチは重いアーキテクチャ上に構築されており、外部知識リソースがPTMの推論能力をどのように改善するかを明確に説明できない。
論文 参考訳(メタデータ) (2022-05-04T01:27:36Z) - Neural Networks Enhancement with Logical Knowledge [83.9217787335878]
関係データに対するKENNの拡張を提案する。
その結果、KENNは、存在関係データにおいても、基礎となるニューラルネットワークの性能を高めることができることがわかった。
論文 参考訳(メタデータ) (2020-09-13T21:12:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。