論文の概要: Pairing Analogy-Augmented Generation with Procedural Memory for Procedural Q&A
- arxiv url: http://arxiv.org/abs/2409.01344v1
- Date: Mon, 2 Sep 2024 15:58:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 06:25:12.740938
- Title: Pairing Analogy-Augmented Generation with Procedural Memory for Procedural Q&A
- Title(参考訳): Pairing Analogy-Augmented Generation with Procedural Memory for Procedural Q&A
- Authors: K Roth, Rushil Gupta, Simon Halle, Bang Liu,
- Abstract要約: テキストベースの手続きを操作するための新しい形式と構造を導入する。
我々は従来のRAGシステムを拡張して、アナログ増強世代(AAG)と呼ばれる新しいシステムを提案する。
AAGは、人間の類推的推論と、過去の経験を同化して目に見えない問題を解決する能力からインスピレーションを得ている。
- 参考スコア(独自算出の注目度): 18.509344327269776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While LLMs in the RAG paradigm have shown remarkable performance on a variety of tasks, they still under-perform on unseen domains, especially on complex tasks like procedural question answering. In this work, we introduce a novel formalism and structure for manipulating text-based procedures. Based on this formalism, we further present a novel dataset called LCStep, scraped from the LangChain Python docs. Moreover, we extend the traditional RAG system to propose a novel system called analogy-augmented generation (AAG), that draws inspiration from human analogical reasoning and ability to assimilate past experiences to solve unseen problems. The proposed method uses a frozen language model with a custom procedure memory store to adapt to specialized knowledge. We demonstrate that AAG outperforms few-shot and RAG baselines on LCStep, RecipeNLG, and CHAMP datasets under a pairwise LLM-based evaluation, corroborated by human evaluation in the case of RecipeNLG.
- Abstract(参考訳): RAGパラダイムのLLMは、様々なタスクにおいて顕著なパフォーマンスを示しているが、まだ目に見えない領域、特に手続き的質問応答のような複雑なタスクではパフォーマンスが低い。
本研究では,テキストベースの手続きを操作するための新しい形式と構造を導入する。
このフォーマリズムに基づいて、LangChain Pythonドキュメントから取り除かれたLCStepと呼ばれる新しいデータセットも提示する。
さらに、従来のRAGシステムを拡張して、人間の類推的推論からインスピレーションを得て、過去の経験を同化して、目に見えない問題を解決する新しいシステムAg(analytic-augmented Generation)を提案する。
提案手法は,特殊な知識に適応するために,カスタムプロシージャメモリストアを備えたフリーズ言語モデルを用いている。
本研究では,LCStep,RecipeNLG,CHAMPデータセットにおいて,LCStep,RecipeNLG,ChAMPの2つのLLMに基づく評価において,AAGが数ショットベースライン,RAGベースラインよりも優れており,RecipeNLGの場合は人間による評価で相関していることを示す。
関連論文リスト
- Bridging Domain Knowledge and Process Discovery Using Large Language Models [0.0]
本稿では,Large Language Models(LLM)を利用して,ドメイン知識を直接プロセス発見に統合する。
LLMから派生したルールを使用して、モデル構築をガイドし、ドメイン知識と実際のプロセス実行の整合性を確保します。
論文 参考訳(メタデータ) (2024-08-30T14:23:40Z) - Cognitive LLMs: Towards Integrating Cognitive Architectures and Large Language Models for Manufacturing Decision-making [51.737762570776006]
LLM-ACTRは、ヒトに適応し、多目的な意思決定を提供する新しいニューロシンボリックアーキテクチャである。
我々のフレームワークは、ACT-Rの内部決定過程の知識を潜在神経表現として抽出し、組み込む。
デザイン・フォー・マニュファクチャリング・タスクに関する我々の実験は、タスク性能の向上と基礎的意思決定能力の向上を両立させたものである。
論文 参考訳(メタデータ) (2024-08-17T11:49:53Z) - Automatic Discovery of Multi-perspective Process Model using
Reinforcement Learning [7.5989847759545155]
深層Q-Learningに基づく多視点プロセスモデルの自動発見フレームワークを提案する。
我々のDual Experience Replay with Experience Distribution(DERED)アプローチは、プロセスモデル発見ステップ、適合チェックステップ、拡張ステップを自動的に実行できます。
ポートロジスティクス、鉄鋼製造、金融、IT、政府管理で収集された6つの実世界のイベントデータセットを用いて、我々のアプローチを検証する。
論文 参考訳(メタデータ) (2022-11-30T02:18:29Z) - Neuro-Symbolic Causal Language Planning with Commonsense Prompting [67.06667162430118]
言語プランニングは、より単純な低レベルステップに分解することで、複雑な高レベルな目標を実装することを目的としている。
以前の手法では、大規模な言語モデルからそのような能力を得るために、手動の例えか注釈付きプログラムが必要である。
本稿では,LLMからの手続き的知識をコモンセンス・インフュージョン・プロンプトにより引き起こすニューロシンボリック因果言語プランナー(CLAP)を提案する。
論文 参考訳(メタデータ) (2022-06-06T22:09:52Z) - Improving Meta-learning for Low-resource Text Classification and
Generation via Memory Imitation [87.98063273826702]
本稿では,メモリ模倣メタラーニング(MemIML)手法を提案する。
本手法の有効性を証明するために理論的解析を行った。
論文 参考訳(メタデータ) (2022-03-22T12:41:55Z) - Procedures as Programs: Hierarchical Control of Situated Agents through
Natural Language [81.73820295186727]
エージェント命令と制御のための階層的な手続き的知識を表現する強力な手法である,プログラムとしての手続きの形式化を提案する。
NL命令に対するIQAおよびALFREDデータセット上で、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2021-09-16T20:36:21Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - Automatic Business Process Structure Discovery using Ordered Neurons
LSTM: A Preliminary Study [6.6599132213053185]
本稿では,ニューラルネットワークの構築により,ビジネスプロセス文書に存在する潜在意味階層構造を検索する。
我々は,実践的なロボットプロセス自動化(RPA)プロジェクトから提案したプロセス記述文書(PDD)のデータセットに対するアプローチを検証した。
論文 参考訳(メタデータ) (2020-01-05T14:19:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。