論文の概要: Dynatask: A Framework for Creating Dynamic AI Benchmark Tasks
- arxiv url: http://arxiv.org/abs/2204.01906v1
- Date: Tue, 5 Apr 2022 00:32:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 23:10:34.372886
- Title: Dynatask: A Framework for Creating Dynamic AI Benchmark Tasks
- Title(参考訳): Dynatask: 動的AIベンチマークタスク作成のためのフレームワーク
- Authors: Tristan Thrush, Kushal Tirumala, Anmol Gupta, Max Bartolo, Pedro
Rodriguez, Tariq Kane, William Gaviria Rojas, Peter Mattson, Adina Williams,
Douwe Kiela
- Abstract要約: Dynataskは、カスタムNLPタスクを設定するためのオープンソースのシステムである。
AIのベンチマークを再考する研究プラットフォームであるDynabenchと統合されている。
- 参考スコア(独自算出の注目度): 31.460091555017197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Dynatask: an open source system for setting up custom NLP tasks
that aims to greatly lower the technical knowledge and effort required for
hosting and evaluating state-of-the-art NLP models, as well as for conducting
model in the loop data collection with crowdworkers. Dynatask is integrated
with Dynabench, a research platform for rethinking benchmarking in AI that
facilitates human and model in the loop data collection and evaluation. To
create a task, users only need to write a short task configuration file from
which the relevant web interfaces and model hosting infrastructure are
automatically generated. The system is available at https://dynabench.org/ and
the full library can be found at https://github.com/facebookresearch/dynabench.
- Abstract(参考訳): 我々はdynataskを紹介する。dynataskは,最先端nlpモデルのホスティングと評価に必要な技術知識と労力を大幅に削減することを目的とした,カスタムnlpタスクをセットアップするオープンソースシステムである。
dynataskは、ループデータ収集と評価で人間とモデルを促進するaiのベンチマークを再考する研究プラットフォームであるdynabenchと統合されている。
タスクを作成するには、関連するWebインターフェースとモデルホスティングインフラストラクチャが自動的に生成される短いタスク設定ファイルを記述するだけでよい。
システムはhttps://dynabench.org/で利用可能で、完全なライブラリはhttps://github.com/facebookresearch/dynabenchで見ることができる。
関連論文リスト
- Chain-of-Skills: A Configurable Model for Open-domain Question Answering [79.8644260578301]
検索モデルは、現実世界の知識集約的なタスクに欠かせない要素である。
最近の研究はカスタマイズされたメソッドに焦点を合わせ、モデルの転送可能性とスケーラビリティを制限している。
本稿では,各モジュールがデータセット間で再利用可能なキースキルに対応するモジュールレトリバーを提案する。
論文 参考訳(メタデータ) (2023-05-04T20:19:39Z) - TaskMatrix.AI: Completing Tasks by Connecting Foundation Models with
Millions of APIs [71.7495056818522]
私たちは、基礎モデルと数百万のAPIを結合してタスク補完を行う、新しいAIエコシステムとしてTaskMatrix.AIを紹介します。
このようなエコシステムを構築するためのビジョンを示し、それぞれの重要なコンポーネントを説明し、このビジョンの実現可能性と次に取り組むべき主な課題の両方を説明するために研究ケースを使用します。
論文 参考訳(メタデータ) (2023-03-29T03:30:38Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Dynabench: Rethinking Benchmarking in NLP [82.26699038776812]
動的データセットの作成とモデルベンチマークのためのオープンソースプラットフォームであるdynabenchを紹介する。
DynabenchはWebブラウザで動作し、ループ内の人間とモデルデータセットの作成をサポートする。
私たちは、これらの概念を図示し、プラットフォームの約束を強調する4つの初期のNLPタスクを報告します。
論文 参考訳(メタデータ) (2021-04-07T17:49:17Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z) - MTL-NAS: Task-Agnostic Neural Architecture Search towards
General-Purpose Multi-Task Learning [71.90902837008278]
汎用マルチタスク学習(GP-MTL)にニューラルアーキテクチャサーチ(NAS)を導入することを提案する。
異なるタスクの組み合わせに対応するため、GP-MTLネットワークを単一タスクのバックボーンに分割する。
また,探索されたアーキテクチャ間の性能ギャップを埋める単一ショット勾配に基づく探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-31T09:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。