論文の概要: Learning Open Domain Multi-hop Search Using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2205.15281v1
- Date: Mon, 30 May 2022 17:44:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 14:36:45.733086
- Title: Learning Open Domain Multi-hop Search Using Reinforcement Learning
- Title(参考訳): 強化学習を用いたオープンドメインマルチホップ探索の学習
- Authors: Enrique Noriega-Atala, Mihai Surdeanu, Clayton T. Morrison
- Abstract要約: 我々は、オープンドメイン内のエンティティ間の関係のマルチホップパスの探索方法を学ぶために、自動エージェントを教える。
本手法をアクター・クリティカルな強化学習アルゴリズムに実装し,英語ウィキペディアのサブセットから抽出した探索問題のデータセット上で評価する。
- 参考スコア(独自算出の注目度): 20.078330789576256
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a method to teach an automated agent to learn how to search for
multi-hop paths of relations between entities in an open domain. The method
learns a policy for directing existing information retrieval and machine
reading resources to focus on relevant regions of a corpus. The approach
formulates the learning problem as a Markov decision process with a state
representation that encodes the dynamics of the search process and a reward
structure that minimizes the number of documents that must be processed while
still finding multi-hop paths. We implement the method in an actor-critic
reinforcement learning algorithm and evaluate it on a dataset of search
problems derived from a subset of English Wikipedia. The algorithm finds a
family of policies that succeeds in extracting the desired information while
processing fewer documents compared to several baseline heuristic algorithms.
- Abstract(参考訳): 本稿では,オープンドメイン内のエンティティ間の関係のマルチホップパスの探索方法を学ぶための,自動エージェントの指導方法を提案する。
本方法は、コーパスの関連領域に集中するように、既存の情報検索及び機械読取リソースを指示するポリシーを学習する。
このアプローチは、探索プロセスのダイナミクスをエンコードする状態表現と、マルチホップパスを見つけながら処理しなければならない文書の数を最小化する報酬構造を備えたマルコフ決定プロセスとして学習問題を定式化する。
本手法をアクタ-クリティック強化学習アルゴリズムで実装し,英語wikipediaのサブセットから派生した検索問題のデータセット上で評価する。
このアルゴリズムは、複数のベースラインヒューリスティックアルゴリズムと比較して少ない文書を処理しながら、望ましい情報を抽出するのに成功するポリシーのファミリーを見つける。
関連論文リスト
- Query-oriented Data Augmentation for Session Search [71.84678750612754]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文 参考訳(メタデータ) (2024-07-04T08:08:33Z) - Relation-aware Ensemble Learning for Knowledge Graph Embedding [68.94900786314666]
我々は,既存の手法を関係性に配慮した方法で活用し,アンサンブルを学習することを提案する。
関係認識アンサンブルを用いてこれらのセマンティクスを探索すると、一般的なアンサンブル法よりもはるかに大きな検索空間が得られる。
本稿では,リレーショナルなアンサンブル重みを独立に検索する分割探索合成アルゴリズムRelEns-DSCを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:40:12Z) - Algorithm of Thoughts: Enhancing Exploration of Ideas in Large Language Models [17.059322033670124]
本稿では,アルゴリズム的推論経路を通じて大規模言語モデルを促進する新しい手法を提案する。
この結果から,LLMをアルゴリズムを用いて指導すると,アルゴリズム自体よりも性能が向上する可能性が示唆された。
論文 参考訳(メタデータ) (2023-08-20T22:36:23Z) - Unified Functional Hashing in Automatic Machine Learning [58.77232199682271]
高速に統一された関数型ハッシュを用いることで,大きな効率向上が得られることを示す。
私たちのハッシュは"機能的"であり、表現やコードが異なる場合でも同等の候補を識別します。
ニューラルアーキテクチャ検索やアルゴリズム発見など、複数のAutoMLドメインで劇的な改善がなされている。
論文 参考訳(メタデータ) (2023-02-10T18:50:37Z) - Fast Line Search for Multi-Task Learning [0.0]
マルチタスク学習における行探索アルゴリズムの新しいアイデアを提案する。
この考え方は、ステップサイズを見つけるためにパラメータ空間の代わりに潜在表現空間を使用することである。
本稿では,MNIST,CIFAR-10,Cityscapesタスクの学習速度を一定とする古典的バックトラック法と勾配法を比較した。
論文 参考訳(メタデータ) (2021-10-02T21:02:29Z) - Meta Navigator: Search for a Good Adaptation Policy for Few-shot
Learning [113.05118113697111]
少ないショット学習は、ラベル付きデータしか持たない新しいタスクに、以前のタスクから学んだ知識を適応させることを目的としている。
少数ショット学習に関する研究文献は、大きな多様性を示し、異なるアルゴリズムは、しばしば異なる少数ショット学習シナリオで優れている。
本稿では,メタナビゲータ(Meta Navigator)について紹介する。
論文 参考訳(メタデータ) (2021-09-13T07:20:01Z) - Memory Augmented Sequential Paragraph Retrieval for Multi-hop Question
Answering [32.69969157825044]
本稿では,段落を逐次データとしてモデル化し,マルチホップ情報検索をシーケンスラベリングタスクの一種とみなす新しいアーキテクチャを提案する。
本手法は,公開テキストマルチホップQAデータセットであるHotpotQAのフルwikiとイントラクタサブタスクの両方で評価する。
論文 参考訳(メタデータ) (2021-02-07T08:15:51Z) - Information Theoretic Meta Learning with Gaussian Processes [74.54485310507336]
情報理論の概念,すなわち相互情報と情報のボトルネックを用いてメタ学習を定式化する。
相互情報に対する変分近似を用いることで、メタ学習のための汎用的かつトラクタブルな枠組みを導出する。
論文 参考訳(メタデータ) (2020-09-07T16:47:30Z) - Discovering Reinforcement Learning Algorithms [53.72358280495428]
強化学習アルゴリズムは、いくつかのルールの1つに従ってエージェントのパラメータを更新する。
本稿では,更新ルール全体を検出するメタラーニング手法を提案する。
これには、一連の環境と対話することで、"何を予測するか"(例えば、値関数)と"どのように学習するか"の両方が含まれている。
論文 参考訳(メタデータ) (2020-07-17T07:38:39Z) - Text Detection on Roughly Placed Books by Leveraging a Learning-based
Model Trained with Another Domain Data [0.30458514384586394]
本稿では,本書におけるテキスト領域の把握に適したバウンディングボックスの生成方法に焦点をあてる。
我々は,学習に基づく手法の結果を改善し,活用することで,境界ボックスを構築するアルゴリズムを開発した。
我々のアルゴリズムは、異なる学習に基づくアプローチを用いてシーンテキストを検出することができる。
論文 参考訳(メタデータ) (2020-06-26T05:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。