論文の概要: KCS: Diversify Multi-hop Question Generation with Knowledge Composition Sampling
- arxiv url: http://arxiv.org/abs/2508.20567v1
- Date: Thu, 28 Aug 2025 09:06:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:02.257229
- Title: KCS: Diversify Multi-hop Question Generation with Knowledge Composition Sampling
- Title(参考訳): KCS:知識構成サンプリングによるマルチホップ質問生成の多様化
- Authors: Yangfan Wang, Jie Liu, Chen Tang, Lian Yan, Jingchi Jiang,
- Abstract要約: マルチホップ質問応答は、データ空間の分散によって重大な課題に直面しており、言語モデルが急激なパターンになる可能性が高まる。
本稿では,生成したマルチホップ質問の多様性を拡大する革新的なフレームワークである知識構成サンプリング(KCS)を紹介する。
競合ベースラインと比較すると,知識構成選択の全体的な精度は3.9%向上し,そのデータ拡張への応用によりHotpotQAと2WikiMultihopQAデータセットの精度が向上する。
- 参考スコア(独自算出の注目度): 15.773531942712845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-hop question answering faces substantial challenges due to data sparsity, which increases the likelihood of language models learning spurious patterns. To address this issue, prior research has focused on diversifying question generation through content planning and varied expression. However, these approaches often emphasize generating simple questions and neglect the integration of essential knowledge, such as relevant sentences within documents. This paper introduces the Knowledge Composition Sampling (KCS), an innovative framework designed to expand the diversity of generated multi-hop questions by sampling varied knowledge compositions within a given context. KCS models the knowledge composition selection as a sentence-level conditional prediction task and utilizes a probabilistic contrastive loss to predict the next most relevant piece of knowledge. During inference, we employ a stochastic decoding strategy to effectively balance accuracy and diversity. Compared to competitive baselines, our KCS improves the overall accuracy of knowledge composition selection by 3.9%, and its application for data augmentation yields improvements on HotpotQA and 2WikiMultihopQA datasets. Our code is available at: https://github.com/yangfanww/kcs.
- Abstract(参考訳): マルチホップ質問応答は、データ空間の分散によって重大な課題に直面し、言語モデルが素早いパターンを学習する可能性を高める。
この問題に対処するために、先行研究はコンテンツ計画と多様な表現による質問生成の多様化に重点を置いてきた。
しかし、これらのアプローチは単純な疑問を生み出すことを強調することが多く、文書内の関連文のような本質的な知識の統合を無視する。
本稿では,与えられた文脈内で様々な知識組成を抽出することにより,生成した多項目質問の多様性を拡大する革新的なフレームワークである知識構成サンプリング(KCS)を紹介する。
KCSは、知識構成の選択を文レベルの条件付き予測タスクとしてモデル化し、確率論的コントラスト損失を利用して次の最も関連する知識を予測する。
推論では,確率的復号法を用いて精度と多様性を効果的にバランスさせる。
競合ベースラインと比較すると,知識構成選択の全体的な精度は3.9%向上し,そのデータ拡張への応用によりHotpotQAと2WikiMultihopQAデータセットの精度が向上する。
私たちのコードは、https://github.com/yangfanww/kcs.comで利用可能です。
関連論文リスト
- PGDA-KGQA: A Prompt-Guided Generative Framework with Multiple Data Augmentation Strategies for Knowledge Graph Question Answering [3.8623708225544755]
知識グラフ質問回答(KGQA)は自然言語処理において重要な課題である。
PGDA-KGQA は,KGQA のための複数のデータ拡張戦略を備えた,プロンプト誘導型生成フレームワークである。
実験により、PGDA-KGQAは標準KGQAの最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-06-11T05:56:03Z) - Information-Theoretic Complementary Prompts for Improved Continual Text Classification [34.30189210224955]
本稿では,連続テキスト分類のための情報理論補完プロンプト(InfoComp)を紹介する。
InfoComp は P(rivate)-Prompt と S(hared)-Prompt という二つの異なるプロンプト空間を明示的に学習する。
本枠組みでは,(1)P-Promptにおけるタスク固有の知識の蓄積を強化すること,(2)S-Promptにおけるタスク固有の知識の保持を強化すること,(2)フォワード知識伝達を改善すること,の2つの新しい損失関数を設計する。
論文 参考訳(メタデータ) (2025-05-27T09:22:14Z) - Multi-granular Training Strategies for Robust Multi-hop Reasoning Over Noisy and Heterogeneous Knowledge Sources [0.0]
マルチソースマルチホップ質問応答(QA)は自然言語処理における課題である。
既存の手法は、しばしばカスケードエラー、知識衝突の処理が不十分なこと、計算の非効率さに悩まされる。
パラメトリックおよび検索された知識を動的に融合する適応多元的知識指向推論(AMKOR)を提案する。
論文 参考訳(メタデータ) (2025-02-09T16:06:43Z) - Diversify Question Generation with Retrieval-Augmented Style Transfer [68.00794669873196]
本稿では,検索型スタイル転送のためのフレームワーク RAST を提案する。
本研究の目的は,多様なテンプレートのスタイルを質問生成に活用することである。
多様性報酬と一貫性報酬の重み付けを最大化する新しい強化学習(RL)ベースのアプローチを開発する。
論文 参考訳(メタデータ) (2023-10-23T02:27:31Z) - How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition [64.86360698067764]
本研究は, 教師付き微調整における数学的推論, コード生成, 一般人適応能力間のデータ合成の相互作用に着目した。
我々の実験では、異なる能力のスケールが異なり、より大きなモデルでは、通常、同じ量のデータで優れたパフォーマンスを示す。
その結果, 合成データの量は, 合成比よりも性能に影響を及ぼすことが示唆された。
論文 参考訳(メタデータ) (2023-10-09T07:56:16Z) - Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset
and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。
提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。
画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:58:25Z) - KAT: A Knowledge Augmented Transformer for Vision-and-Language [56.716531169609915]
我々は、OK-VQAのオープンドメインマルチモーダルタスクにおいて、最先端の強力な結果をもたらす新しいモデルである知識拡張トランスフォーマー(KAT)を提案する。
提案手法は,エンド・ツー・エンドのエンコーダ・デコーダアーキテクチャにおいて暗黙的かつ明示的な知識を統合しつつ,回答生成時に両知識源を共同で推論する。
我々の分析では、モデル予測の解釈可能性の向上に、明示的な知識統合のさらなる利点が見られる。
論文 参考訳(メタデータ) (2021-12-16T04:37:10Z) - Contextualized Knowledge-aware Attentive Neural Network: Enhancing
Answer Selection with Knowledge [77.77684299758494]
ナレッジグラフ(KG)による外部知識による回答選択モデル向上のアプローチを幅広く検討しています。
まず、KGの外部知識とテキスト情報との密接な相互作用を考慮し、QA文表現を学習するコンテキスト知識相互作用学習フレームワークであるナレッジアウェアニューラルネットワーク(KNN)を紹介します。
KG情報の多様性と複雑性に対処するために, カスタマイズされたグラフ畳み込みネットワーク (GCN) を介して構造情報を用いた知識表現学習を改善し, コンテキストベースおよび知識ベースの文表現を総合的に学習する コンテキスト型知識認識型アテンシブニューラルネットワーク (CKANN) を提案する。
論文 参考訳(メタデータ) (2021-04-12T05:52:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。