論文の概要: Mephisto: A Framework for Portable, Reproducible, and Iterative
Crowdsourcing
- arxiv url: http://arxiv.org/abs/2301.05154v1
- Date: Thu, 12 Jan 2023 17:14:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 15:02:29.844273
- Title: Mephisto: A Framework for Portable, Reproducible, and Iterative
Crowdsourcing
- Title(参考訳): mephisto: 可搬性,再現性,反復的なクラウドソーシングのためのフレームワーク
- Authors: Jack Urbanek and Pratik Ringshia
- Abstract要約: 私たちは、研究のためのクラウドソーシングをより再現可能で透明で協力的なフレームワークであるMephistoを紹介します。
Mephistoは幅広いタスク設計とデータ収集をカバーする抽象化を提供し、ベストプラクティスを簡単にデフォルトにするためのシンプルなユーザエクスペリエンスを提供する。
- 参考スコア(独自算出の注目度): 9.145761713343303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Mephisto, a framework to make crowdsourcing for research more
reproducible, transparent, and collaborative. Mephisto provides abstractions
that cover a broad set of task designs and data collection workflows, and
provides a simple user experience to make best-practices easy defaults. In this
whitepaper we discuss the current state of data collection and annotation in ML
research, establish the motivation for building a shared framework to enable
researchers to create and open-source data collection and annotation tools as
part of their publication, and outline a set of suggested requirements for a
system to facilitate these goals. We then step through our resolution in
Mephisto, explaining the abstractions we use, our design decisions around the
user experience, and share implementation details and where they align with the
original motivations. We also discuss current limitations, as well as future
work towards continuing to deliver on the framework's initial goals. Mephisto
is available as an open source project, and its documentation can be found at
www.mephisto.ai.
- Abstract(参考訳): 私たちは、研究のためのクラウドソーシングをより再現可能で透明で協力的なフレームワークであるMephistoを紹介します。
Mephistoは幅広いタスク設計とデータ収集ワークフローをカバーする抽象化を提供し、ベストプラクティスを簡単にデフォルトにするためのシンプルなユーザエクスペリエンスを提供する。
本稿では、ML研究におけるデータ収集とアノテーションの現状について論じ、研究者が出版物の一部としてオープンソースデータ収集とアノテーションツールを作成・作成するための共有フレームワークを構築する動機を確立し、これらの目標を促進するためのシステムに提案された一連の要件を概説する。
次に、私たちはmephistoの解決に踏み切り、使用する抽象化、ユーザエクスペリエンスに関する設計判断を説明し、実装の詳細とそれらが元の動機とどのように一致しているかを共有します。
フレームワークの初期目標達成に向けた今後の取り組みと同様に、現在の制限についても議論する。
Mephistoはオープンソースプロジェクトとして利用可能であり、ドキュメントはwww.mephisto.aiにある。
関連論文リスト
- GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
コンテンツ対応のテキストロゴレイアウトを生成するVLMベースのフレームワークを提案する。
本稿では,複数のグリフ画像の同時処理における計算量を削減するための2つのモデル手法を提案する。
アウトモデルのインストラクションチューニングを支援するために,既存の公開データセットよりも5倍大きい2つの拡張テキストロゴデータセットを構築した。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - A Personalized Reinforcement Learning Summarization Service for Learning
Structure from Unstructured Data [4.082216579462796]
要約は階層的パーソナライズされた概念ベースの要約アプローチである。
文書を簡潔な階層的な概念マップに合成し、ユーザの好みを学習し、適応することによって、積極的にユーザと対話する。
論文 参考訳(メタデータ) (2023-07-09T01:19:08Z) - Visual Information Extraction in the Wild: Practical Dataset and
End-to-end Solution [48.693941280097974]
視覚情報抽出(VIE)のためのカメラ画像からなる大規模データセットを提案する。
我々は,OCRの段階と情報抽出をエンド・ツー・エンドの学習方式で組み合わせた,エンド・ツー・エンドVIEのための新しいフレームワークを提案する。
提案したデータセット上で既存のVIEのエンド・ツー・エンド手法を評価し,これらの手法の性能がSROIEから提案したデータセットに相違があることを観察した。
論文 参考訳(メタデータ) (2023-05-12T14:11:47Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - iFacetSum: Coreference-based Interactive Faceted Summarization for
Multi-Document Exploration [63.272359227081836]
iFacetSumは、インタラクティブな要約と顔検索を統合している。
微粒なファセットは、クロスドキュメントのコア参照パイプラインに基づいて自動的に生成される。
論文 参考訳(メタデータ) (2021-09-23T20:01:11Z) - Multimodal Entity Linking for Tweets [6.439761523935613]
マルチモーダル・エンティティ・リンク(MEL)は、知識ベース(KB)のエンティティへの曖昧な言及をマッピングするためにテキストと視覚情報を使用する新興の研究分野である。
我々は,MEL のための完全注釈付き Twitter データセットを構築する方法を提案し,エンティティは Twitter KB で定義されている。
次に,テキストと視覚の文脈から言及と実体の両方の表現を共同学習するモデルを提案する。
論文 参考訳(メタデータ) (2021-04-07T16:40:23Z) - DOC2PPT: Automatic Presentation Slides Generation from Scientific
Documents [76.19748112897177]
文書・スライド生成のための新しい課題とアプローチを提案する。
エンドツーエンドでタスクに取り組むための階層的なシーケンス・ツー・シーケンスアプローチを提案する。
提案手法では,文書やスライド内の固有構造を利用して,パラフレーズとレイアウト予測モジュールを組み込んでスライドを生成する。
論文 参考訳(メタデータ) (2021-01-28T03:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。