論文の概要: Overview of GUA-SPA at IberLEF 2023: Guarani-Spanish Code Switching
Analysis
- arxiv url: http://arxiv.org/abs/2309.06163v1
- Date: Tue, 12 Sep 2023 12:18:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 13:09:54.267460
- Title: Overview of GUA-SPA at IberLEF 2023: Guarani-Spanish Code Switching
Analysis
- Title(参考訳): IberleF 2023におけるGUA-SPAの概要:グアラニ・スペインのコードスイッチング分析
- Authors: Luis Chiruzzo, Marvin Ag\"uero-Torales, Gustavo Gim\'enez-Lugo, Aldo
Alvarez, Yliana Rodr\'iguez, Santiago G\'ongora, Thamar Solorio
- Abstract要約: IberLEF 2023において、グアラニとスペイン語でコードスイッチングを検出し、分析するための最初の共有タスクであるGUA-SPAについて述べる。
この課題は3つのタスクで構成された。トークンの言語、NER、コードスイッチングのコンテキストでスペイン語のスパンの使用方法を分類する新しいタスクである。
- 参考スコア(独自算出の注目度): 5.262834474543783
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the first shared task for detecting and analyzing code-switching
in Guarani and Spanish, GUA-SPA at IberLEF 2023. The challenge consisted of
three tasks: identifying the language of a token, NER, and a novel task of
classifying the way a Spanish span is used in the code-switched context. We
annotated a corpus of 1500 texts extracted from news articles and tweets,
around 25 thousand tokens, with the information for the tasks. Three teams took
part in the evaluation phase, obtaining in general good results for Task 1, and
more mixed results for Tasks 2 and 3.
- Abstract(参考訳): IberLEF 2023において、グアラニとスペイン語でコードスイッチングを検出し解析するための最初の共有タスク、GUA-SPAを提案する。
この課題は3つのタスクで構成された。トークンの言語、NER、コードスイッチングのコンテキストでスペイン語のスパンの使い方を分類する新しいタスクである。
我々は,ニュース記事やつぶやきから抽出した1500のテキストのコーパス,約25万のトークン,タスクに関する情報を注釈付けした。
3つのチームが評価フェーズに参加し、タスク1の一般的な良い結果とタスク2とタスク3のより複雑な結果を得た。
関連論文リスト
- GenAI Content Detection Task 1: English and Multilingual Machine-Generated Text Detection: AI vs. Human [71.42669028683741]
我々は,Coling 2025におけるGenAIワークショップの一環として,バイナリマシン生成テキスト検出における共有タスクを提案する。
このタスクは、モノリンガル(英: Monolingual)とマルチリンガル(英: Multilingual)の2つのサブタスクから構成される。
本稿では,データの包括的概要,結果の概要,参加システムの詳細な説明,提出内容の詳細な分析について述べる。
論文 参考訳(メタデータ) (2025-01-19T11:11:55Z) - USTCCTSU at SemEval-2024 Task 1: Reducing Anisotropy for Cross-lingual Semantic Textual Relatedness Task [17.905282052666333]
言語間セマンティックテキスト関連性タスクは,言語間コミュニケーションやテキスト理解における課題に対処する重要な研究課題である。
これは、機械翻訳、多言語情報検索、言語間テキスト理解といった下流タスクに不可欠な、異なる言語間のセマンティックな接続を確立するのに役立つ。
当社のアプローチでは、スペインで2位、インドネシアで3位、そしてトップ10の複数のエントリーが、コンペティションのトラックCで行われます。
論文 参考訳(メタデータ) (2024-11-28T08:40:14Z) - SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - Overview of AuTexTification at IberLEF 2023: Detection and Attribution
of Machine-Generated Text in Multiple Domains [6.44756483013808]
本稿では,IberleF 2023 Workshop in Iberian Languages Evaluation Forumの一環として,AuTexTificationタスクの概要を紹介する。
AuTexTificationデータセットには、2つの言語(英語とスペイン語)と5つのドメイン(ツイート、レビュー、ニュース、法律、ハウツー記事)に160万以上のテキストが含まれています。
合計114チームが参加し、うち36チームが175回、20チームがワークノートを送付した。
論文 参考訳(メタデータ) (2023-09-20T13:10:06Z) - ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich
Document Images [198.35937007558078]
大会は2022年12月30日に開かれ、2023年3月24日に閉幕した。
トラック1には35人の参加者と91人の有効な応募があり、トラック2には15人の参加者と26人の応募がある。
提案手法の性能によると, 複雑なシナリオやゼロショットシナリオにおいて, 期待される情報抽出性能にはまだ大きなギャップがあると考えられる。
論文 参考訳(メタデータ) (2023-06-05T22:20:52Z) - Enhancing Translation for Indigenous Languages: Experiments with
Multilingual Models [57.10972566048735]
本稿では,3つの方法のシステム記述について述べる。
M2M-100とmBART50という2つの多言語モデルと1つのバイリンガル(1対1)-ヘルシンキNLPスペイン語翻訳モデルを使いました。
アメリカから11の言語を実験し、使用したセットアップと、達成した成果を報告しました。
論文 参考訳(メタデータ) (2023-05-27T08:10:40Z) - Advancing Multilingual Pre-training: TRIP Triangular Document-level
Pre-training for Multilingual Language Models [107.83158521848372]
我々は,従来のモノリンガルおよびバイリンガルの目的を,グラフト法と呼ばれる新しい手法で三言語的目的に加速する分野において,最初のテキストbfTriangular Document-level textbfPre-training(textbfTRIP)を提案する。
TRIPは、3つの多言語文書レベルの機械翻訳ベンチマークと1つの言語間抽象的な要約ベンチマークで、最大3.11d-BLEU点と8.9ROUGE-L点の一貫性のある改善を含む、強力なSOTAスコアを達成している。
論文 参考訳(メタデータ) (2022-12-15T12:14:25Z) - LSCDiscovery: A shared task on semantic change discovery and detection
in Spanish [12.85253662018234]
スペイン語で意味変化の発見と検出に関する最初の共有タスクを提示する。
我々は、DURelフレームワークを使用して、意味変化のために手動でアノテートされたスペイン語単語の最初のデータセットを作成する。
競合するチームが開発したシステムについて述べ、特に有用であったテクニックを強調し、これらのアプローチの限界について議論する。
論文 参考訳(メタデータ) (2022-05-13T14:52:18Z) - Bridging Cross-Lingual Gaps During Leveraging the Multilingual
Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。
提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文 参考訳(メタデータ) (2022-04-16T16:08:38Z) - Handshakes AI Research at CASE 2021 Task 1: Exploring different
approaches for multilingual tasks [0.22940141855172036]
ケース2021共有タスク1の目的は,多言語環境下での社会・政治・危機事象情報の検出と分類である。
提案書にはすべてのサブタスクのエントリが含まれており,得られたスコアが調査結果の妥当性を検証した。
論文 参考訳(メタデータ) (2021-10-29T07:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。