Fugu-MT 論文翻訳(概要): Overview of GUA-SPA at IberLEF 2023: Guarani-Spanish Code Switching Analysis

論文の概要: Overview of GUA-SPA at IberLEF 2023: Guarani-Spanish Code Switching Analysis

arxiv url: http://arxiv.org/abs/2309.06163v1
Date: Tue, 12 Sep 2023 12:18:18 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-13 13:09:54.267460
Title: Overview of GUA-SPA at IberLEF 2023: Guarani-Spanish Code Switching Analysis
Title（参考訳）: IberleF 2023におけるGUA-SPAの概要:グアラニ・スペインのコードスイッチング分析
Authors: Luis Chiruzzo, Marvin Ag\"uero-Torales, Gustavo Gim\'enez-Lugo, Aldo Alvarez, Yliana Rodr\'iguez, Santiago G\'ongora, Thamar Solorio
Abstract要約: IberLEF 2023において、グアラニとスペイン語でコードスイッチングを検出し、分析するための最初の共有タスクであるGUA-SPAについて述べる。この課題は3つのタスクで構成された。トークンの言語、NER、コードスイッチングのコンテキストでスペイン語のスパンの使用方法を分類する新しいタスクである。
参考スコア（独自算出の注目度）: 5.262834474543783
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present the first shared task for detecting and analyzing code-switching in Guarani and Spanish, GUA-SPA at IberLEF 2023. The challenge consisted of three tasks: identifying the language of a token, NER, and a novel task of classifying the way a Spanish span is used in the code-switched context. We annotated a corpus of 1500 texts extracted from news articles and tweets, around 25 thousand tokens, with the information for the tasks. Three teams took part in the evaluation phase, obtaining in general good results for Task 1, and more mixed results for Tasks 2 and 3.
Abstract（参考訳）: IberLEF 2023において、グアラニとスペイン語でコードスイッチングを検出し解析するための最初の共有タスク、GUA-SPAを提案する。この課題は3つのタスクで構成された。トークンの言語、NER、コードスイッチングのコンテキストでスペイン語のスパンの使い方を分類する新しいタスクである。我々は,ニュース記事やつぶやきから抽出した1500のテキストのコーパス,約25万のトークン,タスクに関する情報を注釈付けした。 3つのチームが評価フェーズに参加し、タスク1の一般的な良い結果とタスク2とタスク3のより複雑な結果を得た。

関連論文リスト

SLRTP2025 Sign Language Production Challenge: Methodology, Results, and Future Work [87.9341538630949]
第1回手話生産チャレンジはCVPR 2025で第3回SLRTPワークショップの一環として開催された。コンペティションの目的は、音声言語文からスケルトンポーズのシーケンスに変換するアーキテクチャを評価することである。本稿では,挑戦設計と入賞方法について述べる。
論文参考訳（メタデータ） (2025-08-09T11:57:33Z)
CardiffNLP at CLEARS-2025: Prompting Large Language Models for Plain Language and Easy-to-Read Text Rewriting [49.4237054647147]
本稿では、CardiffNLPチームのCLEARS共有タスクへの貢献について詳述する。多数の急激なバリエーション、例、実験結果について詳述する。
論文参考訳（メタデータ） (2025-08-05T09:16:19Z)
MSA at SemEval-2025 Task 3: High Quality Weak Labeling and LLM Ensemble Verification for Multilingual Hallucination Detection [0.0]
本稿では,SemEval-2025 Task 3: Mu-SHROOM, The Multilingual Shared-task on Hallucinations and Related Observable Overgeneration misstakesについて述べる。このタスクは、複数の言語にまたがる命令チューニングされた大規模言語モデル(LLM)によって生成されたテキスト中の幻覚的スパンを検出することを含む。我々のシステムはアラビア語とバスク語で第1位、ドイツ語、スウェーデン語、フィンランド語で第2位、チェコ語、ファルシ語、フランス語で第3位にランクインした。
論文参考訳（メタデータ） (2025-05-27T08:26:17Z)
SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detection [76.18321723846616]
タスクは7つの異なる言語ファミリーから30以上の言語をカバーしている。データインスタンスは6つの感情クラスでマルチラベルされており、感情の強さに注釈を付けた11言語にデータセットが追加されている。参加者は, (a) マルチラベル感情検出, (b) 感情強度スコア検出, (c) 言語間感情検出の3つのトラックでラベルの予測を依頼された。
論文参考訳（メタデータ） (2025-03-10T12:49:31Z)
GenAI Content Detection Task 1: English and Multilingual Machine-Generated Text Detection: AI vs. Human [71.42669028683741]
我々は,Coling 2025におけるGenAIワークショップの一環として,バイナリマシン生成テキスト検出における共有タスクを提案する。このタスクは、モノリンガル(英: Monolingual)とマルチリンガル(英: Multilingual)の2つのサブタスクから構成される。本稿では,データの包括的概要,結果の概要,参加システムの詳細な説明,提出内容の詳細な分析について述べる。
論文参考訳（メタデータ） (2025-01-19T11:11:55Z)
USTCCTSU at SemEval-2024 Task 1: Reducing Anisotropy for Cross-lingual Semantic Textual Relatedness Task [17.905282052666333]
言語間セマンティックテキスト関連性タスクは,言語間コミュニケーションやテキスト理解における課題に対処する重要な研究課題である。これは、機械翻訳、多言語情報検索、言語間テキスト理解といった下流タスクに不可欠な、異なる言語間のセマンティックな接続を確立するのに役立つ。当社のアプローチでは、スペインで2位、インドネシアで3位、そしてトップ10の複数のエントリーが、コンペティションのトラックCで行われます。
論文参考訳（メタデータ） (2024-11-28T08:40:14Z)
SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。 Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文参考訳（メタデータ） (2024-04-22T13:56:07Z)
Overview of AuTexTification at IberLEF 2023: Detection and Attribution of Machine-Generated Text in Multiple Domains [6.44756483013808]
本稿では,IberleF 2023 Workshop in Iberian Languages Evaluation Forumの一環として,AuTexTificationタスクの概要を紹介する。 AuTexTificationデータセットには、2つの言語(英語とスペイン語)と5つのドメイン(ツイート、レビュー、ニュース、法律、ハウツー記事)に160万以上のテキストが含まれています。合計114チームが参加し、うち36チームが175回、20チームがワークノートを送付した。
論文参考訳（メタデータ） (2023-09-20T13:10:06Z)
UPB at IberLEF-2023 AuTexTification: Detection of Machine-Generated Text using Transformer Ensembles [0.5324802812881543]
本稿では, UPB チームによる AuTexTification 共有タスクへのソリューションとして, IberleF-2023 の一部として紹介する。我々の最高のパフォーマンスモデルは、英語データセットで66.63%、スペイン語データセットで67.10%のマクロF1スコアを達成した。
論文参考訳（メタデータ） (2023-08-02T20:08:59Z)
ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich Document Images [198.35937007558078]
大会は2022年12月30日に開かれ、2023年3月24日に閉幕した。トラック1には35人の参加者と91人の有効な応募があり、トラック2には15人の参加者と26人の応募がある。提案手法の性能によると, 複雑なシナリオやゼロショットシナリオにおいて, 期待される情報抽出性能にはまだ大きなギャップがあると考えられる。
論文参考訳（メタデータ） (2023-06-05T22:20:52Z)
Enhancing Translation for Indigenous Languages: Experiments with Multilingual Models [57.10972566048735]
本稿では,3つの方法のシステム記述について述べる。 M2M-100とmBART50という2つの多言語モデルと1つのバイリンガル(1対1)-ヘルシンキNLPスペイン語翻訳モデルを使いました。アメリカから11の言語を実験し、使用したセットアップと、達成した成果を報告しました。
論文参考訳（メタデータ） (2023-05-27T08:10:40Z)
Advancing Multilingual Pre-training: TRIP Triangular Document-level Pre-training for Multilingual Language Models [107.83158521848372]
我々は,従来のモノリンガルおよびバイリンガルの目的を,グラフト法と呼ばれる新しい手法で三言語的目的に加速する分野において,最初のテキストbfTriangular Document-level textbfPre-training(textbfTRIP)を提案する。 TRIPは、3つの多言語文書レベルの機械翻訳ベンチマークと1つの言語間抽象的な要約ベンチマークで、最大3.11d-BLEU点と8.9ROUGE-L点の一貫性のある改善を含む、強力なSOTAスコアを達成している。
論文参考訳（メタデータ） (2022-12-15T12:14:25Z)
LSCDiscovery: A shared task on semantic change discovery and detection in Spanish [12.85253662018234]
スペイン語で意味変化の発見と検出に関する最初の共有タスクを提示する。我々は、DURelフレームワークを使用して、意味変化のために手動でアノテートされたスペイン語単語の最初のデータセットを作成する。競合するチームが開発したシステムについて述べ、特に有用であったテクニックを強調し、これらのアプローチの限界について議論する。
論文参考訳（メタデータ） (2022-05-13T14:52:18Z)
Bridging Cross-Lingual Gaps During Leveraging the Multilingual Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文参考訳（メタデータ） (2022-04-16T16:08:38Z)
Overview of ADoBo 2021: Automatic Detection of Unassimilated Borrowings in the Spanish Press [8.950918531231158]
本稿では、IberLef 2021の文脈で提案された、ADoBo 2021共有タスクの主な成果を要約する。本課題では,スペイン語ニュースワイヤテキスト中の語彙借用(主に英語からの引用)を検出するために参加者を招待した。参加者に、トレーニング、開発、テスト分割に分割した語彙借入の注釈付きコーパスを提供した。
論文参考訳（メタデータ） (2021-10-29T11:07:59Z)
Handshakes AI Research at CASE 2021 Task 1: Exploring different approaches for multilingual tasks [0.22940141855172036]
ケース2021共有タスク1の目的は,多言語環境下での社会・政治・危機事象情報の検出と分類である。提案書にはすべてのサブタスクのエントリが含まれており,得られたスコアが調査結果の妥当性を検証した。
論文参考訳（メタデータ） (2021-10-29T07:58:49Z)
ESPnet-ST IWSLT 2021 Offline Speech Translation System [56.83606198051871]
本稿では,ESPnet-STグループによる音声翻訳トラックにおけるIWSLT 2021の提出について述べる。今年は、データ、アーキテクチャ、オーディオセグメンテーションのトレーニングにさまざまな取り組みを行いました。私たちの最高のE2Eシステムは、すべてのテクニックをモデルアンサンブルと組み合わせ、31.4BLEUを達成しました。
論文参考訳（メタデータ） (2021-07-01T17:49:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。