論文の概要: FLIN: A Flexible Natural Language Interface for Web Navigation
- arxiv url: http://arxiv.org/abs/2010.12844v2
- Date: Tue, 13 Apr 2021 23:39:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 12:00:48.153152
- Title: FLIN: A Flexible Natural Language Interface for Web Navigation
- Title(参考訳): flin: webナビゲーションのための柔軟な自然言語インターフェース
- Authors: Sahisnu Mazumder, Oriana Riva
- Abstract要約: FLINは、ユーザコマンドを概念レベルのアクションにマッピングする、Webナビゲーションのための自然言語インターフェースである。
ユーザコマンドとWebページが与えられた場合、FLINは最も関連するナビゲーション命令を得点することを学ぶ。
その結果,FLINはドメイン内の新しいWebサイトに適応できることがわかった。
- 参考スコア(独自算出の注目度): 16.593544815769466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI assistants can now carry out tasks for users by directly interacting with
website UIs. Current semantic parsing and slot-filling techniques cannot
flexibly adapt to many different websites without being constantly re-trained.
We propose FLIN, a natural language interface for web navigation that maps user
commands to concept-level actions (rather than low-level UI actions), thus
being able to flexibly adapt to different websites and handle their transient
nature. We frame this as a ranking problem: given a user command and a webpage,
FLIN learns to score the most relevant navigation instruction (involving action
and parameter values). To train and evaluate FLIN, we collect a dataset using
nine popular websites from three domains. Our results show that FLIN was able
to adapt to new websites in a given domain.
- Abstract(参考訳): AIアシスタントは、WebサイトのUIと直接対話することで、ユーザのタスクを実行することができる。
現在のセマンティックパーシングとスロットフィル技術は、絶えず再訓練されることなく、多くの異なるウェブサイトに柔軟に対応できない。
本稿では,ユーザコマンドを(低レベルのuiアクションではなく)概念レベルのアクションにマッピングする,webナビゲーションのための自然言語インターフェースであるflinを提案する。
ユーザコマンドとWebページが与えられた場合、FLINは最も関連するナビゲーション命令(アクションとパラメータ値を含む)を得点することを学ぶ。
FLINをトレーニングし評価するために、我々は3つのドメインから9つの人気のあるウェブサイトを使ってデータセットを収集した。
その結果,FLINはドメイン内の新しいWebサイトに適応できることがわかった。
関連論文リスト
- On the Multi-turn Instruction Following for Conversational Web Agents [83.51251174629084]
本稿では,ユーザと環境の両方で複数回にまたがる高度なインタラクションを必要とする,対話型Webナビゲーションの新たなタスクを紹介する。
本稿では,メモリ利用と自己回帰技術を用いた自己反射型メモリ拡張計画(Self-MAP)を提案する。
論文 参考訳(メタデータ) (2024-02-23T02:18:12Z) - WebVLN: Vision-and-Language Navigation on Websites [15.90203799238092]
Vision-and-Language Navigation (VLN)タスクは、AIエージェントが自然言語命令を正確に理解し、追跡できるようにすることを目的としている。
本稿ではWebVLN(Vision-and-Language Navigation on Websites)という新しいタスクを提案する。
質問ベースのインストラクションを使ってエージェントを訓練し、ユーザがWebサイトを自然に閲覧する方法をエミュレートする。
論文 参考訳(メタデータ) (2023-12-25T22:13:26Z) - AllTogether: Investigating the Efficacy of Spliced Prompt for Web
Navigation using Large Language Models [2.234037966956278]
タスクコンテキスト表現を強化する標準化されたプロンプトテンプレートであるAllTogetherを紹介する。
我々は,オープンソースのLlama-2とAPIアクセス可能なGPTモデルに基づいて,素早い学習と指導の微調整により,このアプローチの有効性を評価する。
論文 参考訳(メタデータ) (2023-10-20T11:10:14Z) - WebIE: Faithful and Robust Information Extraction on the Web [7.361265860494963]
We present WebIE, a first large-scale, entity-linked closed IE dataset with 1.6M sentences。
WebIEには否定的な例、すなわち事実の3倍の文が含まれており、ウェブ上のデータをよく反映している。
生成IEモデルのドメイン内, ドメイン内, ドメイン内, ゼロショットの言語間性能を評価し, WebIE で訓練されたモデルの方がより汎用性が高いことを示す。
論文 参考訳(メタデータ) (2023-05-23T17:37:53Z) - $m^4Adapter$: Multilingual Multi-Domain Adaptation for Machine
Translation with a Meta-Adapter [128.69723410769586]
多言語ニューラルネットワーク翻訳モデル(MNMT)は、ドメインと言語ペアのデータに基づいて評価すると、最先端の性能が得られる。
ドメインシフトや新しい言語ペアへの変換にMNMTモデルを使用すると、パフォーマンスが劇的に低下する。
我々はメタラーニングとアダプタを用いたドメイン知識と言語知識を組み合わせた$m4Adapter$を提案する。
論文 参考訳(メタデータ) (2022-10-21T12:25:05Z) - AVLEN: Audio-Visual-Language Embodied Navigation in 3D Environments [60.98664330268192]
AVLEN(Audio-Visual-Language Embodied Navigationの対話型エージェント)を提案する。
AVLENの目標は、3Dビジュアルワールドをナビゲートすることでオーディオイベントをローカライズすることである。
これらの能力を実現するために、AVLENはマルチモーダル階層的な強化学習バックボーンを使用する。
論文 参考訳(メタデータ) (2022-10-14T16:35:06Z) - LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language,
Vision, and Action [76.71101507291473]
本稿では,無注釈の大規模軌跡データに対するトレーニングの恩恵を享受するロボットナビゲーションシステムLM-Navを提案する。
本研究では,ナビゲーション(ViNG),画像言語アソシエーション(CLIP),言語モデリング(GPT-3)の事前学習モデルから構築可能なシステムについて述べる。
論文 参考訳(メタデータ) (2022-07-10T10:41:50Z) - Multilingual Domain Adaptation for NMT: Decoupling Language and Domain
Information with Adapters [66.7986513246294]
機械翻訳の文脈における言語とドメインアダプタの構成性について検討する。
部分的なリソースのシナリオでは、ドメイン固有のアダプタと言語固有のアダプタの組み合わせは、しばしば欠落した言語を破滅的に忘れてしまう。
論文 参考訳(メタデータ) (2021-10-18T18:55:23Z) - ActionBert: Leveraging User Actions for Semantic Understanding of User
Interfaces [12.52699475631247]
ActionBertと呼ばれる新しいトレーニング済みのUI表現モデルを紹介します。
本手法は,ユーザインタラクショントレースにおける視覚的,言語的,ドメイン特有の特徴を活用し,uiとそのコンポーネントの汎用的な特徴表現を事前学習するように設計されている。
実験により、提案するactionbertモデルは、下流タスク全体のマルチモーダルベースラインを最大15.5%上回ることがわかった。
論文 参考訳(メタデータ) (2020-12-22T20:49:52Z) - Learning Adaptive Language Interfaces through Decomposition [89.21937539950966]
本稿では,分解による新しいハイレベルな抽象化を学習するニューラルセマンティック解析システムを提案する。
ユーザは、新しい振る舞いを記述する高レベルな発話を低レベルなステップに分解することで、対話的にシステムを教える。
論文 参考訳(メタデータ) (2020-10-11T08:27:07Z) - Automatic Generation of Chatbots for Conversational Web Browsing [4.994942792036863]
シンプルなボット固有のアノテーションを備えたウェブサイトからボットを生成する基盤について述べる。
目標は、ユーザーがキーボードとマウスを使ってグラフィカルなUIを操作するのではなく、”Webサイトに話しかける”ことによって、レンダリングされたUIを通じてアクセス可能なコンテンツや機能を使用できるようにすることだ。
論文 参考訳(メタデータ) (2020-08-19T18:10:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。