論文の概要: StreamSide: A Fully-Customizable Open-Source Toolkit for Efficient
Annotation of Meaning Representations
- arxiv url: http://arxiv.org/abs/2109.09853v1
- Date: Mon, 20 Sep 2021 21:36:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 01:26:27.806337
- Title: StreamSide: A Fully-Customizable Open-Source Toolkit for Efficient
Annotation of Meaning Representations
- Title(参考訳): StreamSide: 意味表現の効率的なアノテーションのための、完全にカスタマイズ可能なオープンソースツールキット
- Authors: Jinho D. Choi and Gregor Williamson
- Abstract要約: StreamSideは、複数の種類の意味表現をアノテートするためのオープンソースのツールキットである。
フレームベースおよびフレームレスアノテーションスキームをサポートする。
StreamSideはApache 2.0ライセンスでリリースされている。
- 参考スコア(独自算出の注目度): 17.74208462902158
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This demonstration paper presents StreamSide, an open-source toolkit for
annotating multiple kinds of meaning representations. StreamSide supports
frame-based annotation schemes e.g., Abstract Meaning Representation (AMR) and
frameless annotation schemes e.g., Widely Interpretable Semantic Representation
(WISeR). Moreover, it supports both sentence-level and document-level
annotation by allowing annotators to create multi-rooted graphs for input text.
It can open and automatically convert between several types of input formats
including plain text, Penman notation, and its own JSON format enabling richer
annotation. It features reference frames for AMR predicate argument structures,
and also concept-to-text alignment. StreamSide is released under the Apache 2.0
license, and is completely open-source so that it can be customized to annotate
enriched meaning representations in different languages (e.g., Uniform Meaning
Representations). All StreamSide resources are publicly distributed through our
open source project at: https://github.com/emorynlp/StreamSide.
- Abstract(参考訳): 本稿では,複数種類の意味表現をアノテートするオープンソースのツールキットStreamSideを提案する。
StreamSideは、AMR(Abstract Meaning Representation)やWISeR(Widely Interpretable Semantic Representation)といったフレームベースのアノテーションスキームをサポートしている。
さらに、アノテータが入力テキスト用のマルチルートグラフを作成することで、文レベルと文書レベルのアノテーションの両方をサポートする。
プレーンテキスト、ペンマン表記、そしてよりリッチなアノテーションを可能にする独自のjsonフォーマットを含む、いくつかの入力形式をオープンかつ自動的に変換できる。
AMR述語引数構造のための参照フレームと、概念とテキストのアライメントを備えている。
StreamSideはApache 2.0ライセンスでリリースされており、完全にオープンソースであるため、様々な言語(例えば、Uniform Meaning Representations)でアノテーションを付けるようにカスタマイズできる。
ストリームサイドのリソースはすべて,オープンソースプロジェクトを通じて公開されています。 https://github.com/emorynlp/streamside.com/。
関連論文リスト
- OVMR: Open-Vocabulary Recognition with Multi-Modal References [96.21248144937627]
既存の研究では、モデルにカテゴリキューを埋め込む方法がいくつか提案されている。
本稿では,テキスト記述と模範画像からなるマルチモーダル手がかりを参考に,異なる視点からオープン語彙認識に取り組む。
提案したOVMRはプラグイン・アンド・プレイモジュールであり、インターネットからランダムにクロールされた典型的な画像とうまく機能する。
論文 参考訳(メタデータ) (2024-06-07T06:45:28Z) - Thresh: A Unified, Customizable and Deployable Platform for Fine-Grained
Text Evaluation [11.690442820401453]
Threshは、きめ細かい評価のための統一的でカスタマイズ可能な、デプロイ可能なプラットフォームです。
Threshはコミュニティハブを提供する。コミュニティによって作成され、収集される、きめ細かいフレームワークとそれに対応するアノテーションのコレクションをホストする。
Threshは、小さな手動検査から大規模なクラウドソーシングまで、あらゆる規模のアノテーションプロジェクトに対して、複数のオプションを提供している。
論文 参考訳(メタデータ) (2023-08-14T06:09:51Z) - Text Descriptions are Compressive and Invariant Representations for
Visual Learning [63.3464863723631]
本研究では,クラスごとの複数の視覚的特徴に対する人間の理解に則って,頑健な数ショット学習環境では魅力的な性能が得られることを示す。
特に,SLR-AVD (Sparse Logistic Regression using Augmented Visual Descriptors) という新しい手法を導入する。
このメソッドはまず、まず大きな言語モデル(LLM)を介して各クラスの複数の視覚的記述を自動生成し、次にVLMを使用してこれらの記述を各画像の視覚的特徴埋め込みに変換し、最後に、これらの特徴の関連するサブセットを選択するためにスパースロジスティック回帰を使用する。
論文 参考訳(メタデータ) (2023-07-10T03:06:45Z) - Incorporating Graph Information in Transformer-based AMR Parsing [34.461828101932184]
LeakDistillはTransformerアーキテクチャの変更を探求するモデルとメソッドである。
トレーニング時に,単語とノードのアライメントを用いてグラフ構造情報をエンコーダに埋め込むことで,最先端のAMR解析が得られることを示す。
論文 参考訳(メタデータ) (2023-06-23T12:12:08Z) - Gloss-Free End-to-End Sign Language Translation [59.28829048788345]
我々はGloFE(Gloss-Free End-to-end手話翻訳フレームワーク)を設計する。
本手法は,信号の共通意味と対応する音声翻訳を利用して,光沢のない環境下でのSLTの性能を向上させる。
OpenASLやHow2Signなど,大規模データセットの最先端結果を得た。
論文 参考訳(メタデータ) (2023-05-22T09:57:43Z) - Adapting the LodView RDF Browser for Navigation over the Multilingual
Linguistic Linked Open Data Cloud [77.34726150561087]
この論文は、多言語Linked Open Dataクラウド上のナビゲーションにLodViewを使うことに特化している。
LodViewが属するPubbyライクなツールのクラスを定義し、このクラスと再認識ツール、RDFブラウザ、LOD視覚化ツールのクラスとの関係を明らかにする。
論文 参考訳(メタデータ) (2022-08-28T21:47:59Z) - Generalized Funnelling: Ensemble Learning and Heterogeneous Document
Embeddings for Cross-Lingual Text Classification [78.83284164605473]
emphFunnelling (Fun)は、最近提案された言語間テキスト分類手法である。
Emph Generalized Funnelling (gFun) はFunの一般化である。
gFunは、Funや最先端のベースラインよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-09-17T23:33:04Z) - PAWLS: PDF Annotation With Labels and Structure [4.984601297028257]
PDF文書フォーマットのための新しいアノテーションツールであるラベルと構造(PAWLS)付きPDFを提示します。
PAWLSはスパンベースのテキストアノテーション、N-aryリレーション、Freeform、非テキストバウンディングボックスをサポートしている。
読み取り専用PAWLSサーバはhttps://pawls.apps.allenai.org/で入手できる。
論文 参考訳(メタデータ) (2021-01-25T18:02:43Z) - DART: Open-Domain Structured Data Record to Text Generation [91.23798751437835]
82k以上のインスタンス(DART)を持つオープンドメイン構造化DAta Record to Text生成データセットであるDARTを提案する。
本稿では,テーブルヘッダとテーブルタイトル間の意味的依存関係を利用して,その構造を符号化するテーブルから意味的三重項を抽出する手法を提案する。
我々のデータセット構築フレームワークは、オープンドメイン意味解析と対話行動に基づく意味表現タスクからヘテロジニアスソースを効果的に統合する。
論文 参考訳(メタデータ) (2020-07-06T16:35:30Z) - Building a Hebrew Semantic Role Labeling Lexical Resource from Parallel
Movie Subtitles [4.089055556130724]
本稿では,英語からのアノテーション投影によって半自動構築されたヘブライ語における意味的役割のラベル付け資源を提案する。
このコーパスは多言語OpenSubtitlesデータセットから派生し、短い非公式文を含む。
FrameNetとPropBankの両スタイルで、形態解析、依存性の構文、セマンティックロールのラベル付けを含む、完全に注釈付けされたデータを提供する。
我々は、このヘブライ語リソース上で、事前訓練された多言語BERTトランスフォーマーモデルを利用して、ニューラルネットワークSRLモデルをトレーニングし、基準点として、Hebrew SRLの最初のベースラインモデルを提供する。
論文 参考訳(メタデータ) (2020-05-17T10:03:42Z) - Introduction of Quantification in Frame Semantics [0.0]
このマスターレポートでは、サブFSを包み込み、ノードとして扱う方法としてラップを紹介している。
FSとの高階リレーションのための、動作可能でトラクタブルなツールを提供する。
論文 参考訳(メタデータ) (2020-01-25T15:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。