論文の概要: Masader Plus: A New Interface for Exploring +500 Arabic NLP Datasets
- arxiv url: http://arxiv.org/abs/2208.00932v1
- Date: Mon, 1 Aug 2022 15:31:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:36:14.779137
- Title: Masader Plus: A New Interface for Exploring +500 Arabic NLP Datasets
- Title(参考訳): Masader Plus:500以上のアラビアのNLPデータセットを探索するインターフェース
- Authors: Yousef Altaher, Ali Fadel, Mazen Alotaibi, Mazen Alyazidi, Mishari
Al-Mutairi, Mutlaq Aldhbuiub, Abdulrahman Mosaibah, Abdelrahman Rezk,
Abdulrazzaq Alhendi, Mazen Abo Shal, Emad A. Alghamdi, Maged S. Alshaibani,
Jezia Zakraoui, Wafaa Mohammed, Kamel Gaanoun, Khalid N. Elmadani, Mustafa
Ghaleb, Nouamane Tazi, Raed Alharbi, Maraim Masoud and Zaid Alyafeai
- Abstract要約: Masader Plus は、ユーザーが Masader を閲覧するためのウェブインターフェースである。
データ探索、フィルタリング、バックエンドからデータセットを調べるためのシンプルなAPIをデモします。
- 参考スコア(独自算出の注目度): 5.00866464989489
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Masader (Alyafeai et al., 2021) created a metadata structure to be used for
cataloguing Arabic NLP datasets. However, developing an easy way to explore
such a catalogue is a challenging task. In order to give the optimal experience
for users and researchers exploring the catalogue, several design and user
experience challenges must be resolved. Furthermore, user interactions with the
website may provide an easy approach to improve the catalogue. In this paper,
we introduce Masader Plus, a web interface for users to browse Masader. We
demonstrate data exploration, filtration, and a simple API that allows users to
examine datasets from the backend. Masader Plus can be explored using this link
https://arbml.github.io/masader. A video recording explaining the interface can
be found here https://www.youtube.com/watch?v=SEtdlSeqchk.
- Abstract(参考訳): masader (alyafeai et al., 2021) はアラビア語のnlpデータセットのカタログ作成に使用されるメタデータ構造を作成した。
しかし、そのようなカタログを探索する簡単な方法の開発は難しい課題である。
このカタログを探索するユーザや研究者に最適な体験を与えるためには、いくつかの設計とユーザエクスペリエンスの課題を解決する必要がある。
さらに、Webサイトとのユーザインタラクションは、カタログを改善するための簡単なアプローチを提供するかもしれない。
本稿では,Masder Plusを紹介し,Masderを閲覧するためのWebインターフェースを提案する。
データ探索、フィルタリング、バックエンドからデータセットを調べるためのシンプルなAPIをデモします。
Masader Plus は https://arbml.github.io/masader というリンクで調べることができる。
インターフェースを説明するビデオ録画は、https://www.youtube.com/watch?
v=SEtdlSeqchk。
関連論文リスト
- Interfacing Foundation Models' Embeddings [136.93591492633607]
FINDはファウンデーションモデルの埋め込みを調整するための汎用インターフェースである。
これは、同じアーキテクチャと重みの下で、検索、セグメンテーション、textitetc.にまたがる様々なタスクに適用される。
インターリーブされた埋め込み空間を考慮して,COCOデータセットに新たなトレーニングと評価アノテーションを導入したFIND-Benchを導入する。
論文 参考訳(メタデータ) (2023-12-12T18:58:02Z) - Knowledge-Augmented Large Language Models for Personalized Contextual
Query Suggestion [16.563311988191636]
我々は,Web上での検索と閲覧活動に基づいて,各ユーザを対象としたエンティティ中心の知識ストアを構築した。
この知識ストアは、公的な知識グラフ上の興味と知識のユーザ固有の集約予測のみを生成するため、軽量である。
論文 参考訳(メタデータ) (2023-11-10T01:18:47Z) - Natural Language Interfaces for Tabular Data Querying and Visualization:
A Survey [31.995783935364706]
大規模言語モデル(LLM)の台頭はこの分野をさらに進歩させ、自然言語処理技術のための新たな道を開いた。
本稿では,これらのインターフェースの基礎となる基本概念と技術を紹介し,セマンティック解析に特に重点を置いている。
この中には、LSMの影響を深く掘り下げ、その強み、制限、将来の改善の可能性を強調している。
論文 参考訳(メタデータ) (2023-10-27T05:01:20Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - Using Large Language Models to Generate, Validate, and Apply User Intent
Taxonomies [23.057240991673375]
大規模言語モデル(LLM)を用いた新しい解法を提案する。
LLMは、リッチで関連する概念、記述、ユーザ意図の例を生成することができる。
本稿では,LLMとHuman-in-the-loopを併用したエンドツーエンドパイプラインを用いて,ログデータにおけるユーザ意図分析のためのラベルの生成,精細化,適用を行う。
論文 参考訳(メタデータ) (2023-09-14T20:46:48Z) - Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for
Recommendation and Text Generation [127.35910314813854]
Amazon Multi-locale Shopping Sessionデータセット、すなわちAmazon-M2を提示します。
6つの異なるローカライズされた数百万のユーザセッションからなる、最初の多言語データセットである。
注目すべきは、データセットがパーソナライズとユーザの好みの理解を高めるのに役立つことだ。
論文 参考訳(メタデータ) (2023-07-19T00:08:49Z) - DataFinder: Scientific Dataset Recommendation from Natural Language
Descriptions [100.52917027038369]
我々は、短い自然言語記述を与えられたデータセットを推奨するタスクを運用する。
この作業を容易にするために、我々は、より大規模な自動構築トレーニングセットと、より少ない専門家によるアノテート評価セットからなるDataFinderデータセットを構築した。
このシステムは、DataFinderデータセットに基づいてトレーニングされ、既存のサードパーティのデータセット検索エンジンよりも関連性の高い検索結果を見つける。
論文 参考訳(メタデータ) (2023-05-26T05:22:36Z) - Spacerini: Plug-and-play Search Engines with Pyserini and Hugging Face [104.50540009132662]
Spaceriniはインタラクティブ検索アプリケーションの構築とデプロイのためのモジュラーフレームワークである。
大規模研究データセットの質的分析を容易にするように設計されている。
論文 参考訳(メタデータ) (2023-02-28T12:44:10Z) - MEGAnno: Exploratory Labeling for NLP in Computational Notebooks [9.462926987075122]
本稿では,NLP実践者と研究者を対象とした新しいアノテーションフレームワークMEGAnnoを紹介する。
MEGAnnoを使えば、ユーザーは高度な検索機能と対話型提案機能を通じてデータを探索できる。
我々は,MEGAnnoのフレキシブル,探索的,効率的,シームレスなラベル付け体験を感情分析のユースケースを通じて実証する。
論文 参考訳(メタデータ) (2023-01-08T19:16:22Z) - Learn to Explore: on Bootstrapping Interactive Data Exploration with
Meta-learning [8.92180350317399]
本稿ではメタ学習に基づく学習から発見までのフレームワークを提案し,メタタスクを自動生成した分類器の学習方法を学習する。
提案手法は,精度と効率の点で既存探索法よりも優れている。
論文 参考訳(メタデータ) (2022-12-07T03:12:41Z) - COOKIE: A Dataset for Conversational Recommendation over Knowledge
Graphs in E-commerce [64.95907840457471]
我々は,COOKIEと呼ばれる電子商取引プラットフォームにおける知識グラフに対する対話的推薦のための新しいデータセットを提案する。
データセットはAmazonのレビューコーパスから構築され、ユーザエージェント対話とカスタムナレッジグラフを統合してレコメンデーションする。
論文 参考訳(メタデータ) (2020-08-21T00:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。