論文の概要: Learning to Navigate Wikipedia by Taking Random Walks
- arxiv url: http://arxiv.org/abs/2211.00177v1
- Date: Mon, 31 Oct 2022 22:40:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 15:13:43.522531
- Title: Learning to Navigate Wikipedia by Taking Random Walks
- Title(参考訳): ランダムウォークによるwikipediaのナビゲートの学習
- Authors: Manzil Zaheer, Kenneth Marino, Will Grathwohl, John Schultz, Wendy
Shang, Sheila Babayan, Arun Ahuja, Ishita Dasgupta, Christine Kaeser-Chen,
Rob Fergus
- Abstract要約: ランダムにサンプリングされた軌道の行動的クローニングは、効果的なリンク選択ポリシーを学ぶのに十分であることを示す。
我々は,3800万のノードと387万のエッジを持つウィキペディアのグラフバージョンに対するアプローチを実証する。
次に、結果の埋め込みとポリシーを下流の事実検証と質問応答タスクに使用します。
- 参考スコア(独自算出の注目度): 40.26808946240421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A fundamental ability of an intelligent web-based agent is seeking out and
acquiring new information. Internet search engines reliably find the correct
vicinity but the top results may be a few links away from the desired target. A
complementary approach is navigation via hyperlinks, employing a policy that
comprehends local content and selects a link that moves it closer to the
target. In this paper, we show that behavioral cloning of randomly sampled
trajectories is sufficient to learn an effective link selection policy. We
demonstrate the approach on a graph version of Wikipedia with 38M nodes and
387M edges. The model is able to efficiently navigate between nodes 5 and 20
steps apart 96% and 92% of the time, respectively. We then use the resulting
embeddings and policy in downstream fact verification and question answering
tasks where, in combination with basic TF-IDF search and ranking methods, they
are competitive results to the state-of-the-art methods.
- Abstract(参考訳): インテリジェントなwebベースのエージェントの基本的な能力は、新しい情報を探し、獲得することです。
インターネット検索エンジンは正しい位置を確実に見つけるが、上位の検索結果は所望のターゲットから少し離れているかもしれない。
補完的なアプローチはハイパーリンクによるナビゲーションであり、ローカルコンテンツを理解し、ターゲットに近づくリンクを選択するポリシーを採用している。
本稿では,ランダムにサンプリングされた軌跡のクローニングが有効なリンク選択方針を学習するには十分であることを示す。
我々は、38mノードと387mエッジを持つwikipediaのグラフ版でこのアプローチを実証する。
このモデルは、それぞれ96%と92%の時間を、ノード5と20ステップ間で効率的にナビゲートすることができる。
次に、結果の埋め込みとポリシーを下流の事実検証と質問応答タスクに使用し、基本的なtf-idf検索とランキング手法と組み合わせて、最先端のメソッドと競合する結果となる。
関連論文リスト
- IPPON: Common Sense Guided Informative Path Planning for Object Goal Navigation [33.979481250363584]
本稿では,新しい情報経路計画法と3次元オブジェクト確率マッピング手法を提案する。
マッピングモジュールはセマンティックセグメンテーションとベイズフィルタによって関心対象の確率を計算する。
我々のプランナーはゼロショットアプローチに従っているが、2023年のHabitat ObjectNav Challengeにおいて、Path Length(SPL)とSoft SPLが重み付けしたSuccessによって測定された最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-10-25T17:11:33Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - Node Representation Learning in Graph via Node-to-Neighbourhood Mutual
Information Maximization [27.701736055800314]
グラフにおける情報ノード表現の学習の鍵は、近隣からコンテキスト情報を得る方法にある。
本稿では,ノードの隠蔽表現と周辺領域の相互情報を直接的に最大化することで,自己教師付きノード表現学習戦略を提案する。
我々のフレームワークは、表現学習の質と効率を裏付ける正の選択が相反する比較的損失によって最適化されている。
論文 参考訳(メタデータ) (2022-03-23T08:21:10Z) - Auto-Transfer: Learning to Route Transferrable Representations [77.30427535329571]
本稿では,適切なターゲット表現にソース表現をルートする方法を自動学習する,新しい対向型マルチアームバンディット手法を提案する。
最先端の知識伝達手法と比較すると,5%以上の精度向上が期待できる。
論文 参考訳(メタデータ) (2022-02-02T13:09:27Z) - C-Planning: An Automatic Curriculum for Learning Goal-Reaching Tasks [133.40619754674066]
ゴール条件強化学習は、ナビゲーションや操作を含む幅広い領域のタスクを解決できる。
本研究では,学習時間における探索を用いて,中間状態を自動生成する遠隔目標獲得タスクを提案する。
E-stepはグラフ検索を用いて最適な経路点列を計画することに対応し、M-stepはそれらの経路点に到達するための目標条件付きポリシーを学習することを目的としている。
論文 参考訳(メタデータ) (2021-10-22T22:05:31Z) - MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven
Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。
正規化最大度(NML)分布の計算法を提案する。
得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文 参考訳(メタデータ) (2021-07-15T08:19:57Z) - A Preference Random Walk Algorithm for Link Prediction through Mutual
Influence Nodes in Complex Networks [1.345669927504424]
局所ランダムウォークは準局所的手法のカテゴリで最もよく知られたアルゴリズムの1つであると考えられている。
ほとんどのデータセットでは、この手法は著しく類似したノードを正確に評価することができない。
より強い影響を持つノードへのランダムウォーキングを奨励し,局所的ランダムウォーキングを改善するための効率的な手法を提案する。
論文 参考訳(メタデータ) (2021-05-20T03:35:38Z) - OVANet: One-vs-All Network for Universal Domain Adaptation [78.86047802107025]
既存のメソッドは、検証または未知のサンプルの事前定義された比率に基づいて未知のサンプルを拒否するしきい値を手動で設定します。
本稿では,ソースサンプルを用いて閾値を学習し,対象領域に適応する手法を提案する。
私たちの考えは、ソースドメインの最小クラス間距離は、ターゲットの既知のか未知かを決定するための良いしきい値であるべきです。
論文 参考訳(メタデータ) (2021-04-07T18:36:31Z) - DiffMG: Differentiable Meta Graph Search for Heterogeneous Graph Neural
Networks [45.075163625895286]
我々はメタグラフを探索し、メタパスよりも複雑なセマンティック関係をキャプチャし、グラフニューラルネットワークが異なるタイプのエッジに沿ってメッセージを伝播する方法を決定する。
我々は、HINの候補メタグラフを表すために、有向非巡回グラフ(DAG)の形式で表現型検索空間を設計する。
本稿では,1回のGNNトレーニングに匹敵する検索コストを1対1に抑えるための,新しい効率的な探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-07T08:09:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。