Fugu-MT 論文翻訳(概要): Automatic Discourse Segmentation: an evaluation in French

論文の概要: Automatic Discourse Segmentation: an evaluation in French

arxiv url: http://arxiv.org/abs/2002.04095v2
Date: Thu, 11 Jun 2020 20:27:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-02 08:47:46.557652
Title: Automatic Discourse Segmentation: an evaluation in French
Title（参考訳）: 自動談話セグメンテーション:フランス語における評価
Authors: R\'emy Saksik, Alejandro Molina-Villegas, Andr\'ea Carneiro Linhares, Juan-Manuel Torres-Moreno
Abstract要約: 本稿では, 部分分割法と, 部分分割品質の予備評価について述べる。我々は,マーカーリストと統計POSラベリングという,複数の言語で同時に利用可能なリソースのみに基づく3つのモデルを開発した。
参考スコア（独自算出の注目度）: 65.00134288222509
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this article, we describe some discursive segmentation methods as well as a preliminary evaluation of the segmentation quality. Although our experiment were carried for documents in French, we have developed three discursive segmentation models solely based on resources simultaneously available in several languages: marker lists and a statistic POS labeling. We have also carried out automatic evaluations of these systems against the Annodis corpus, which is a manually annotated reference. The results obtained are very encouraging.
Abstract（参考訳）: 本稿では,いくつかの非帰的セグメンテーション手法と,そのセグメンテーション品質の予備評価について述べる。本実験はフランス語の文書に対して行われたが,複数の言語で同時に利用可能なリソースに基づく3つの非帰的セグメンテーションモデル(マーカリストと統計POSラベリング)を開発した。また,手作業による注釈付き参照である Annodis corpus に対して,これらのシステムの自動評価を行った。得られた結果は大いに励まされる。

関連論文リスト

Towards Multi-dimensional Evaluation of LLM Summarization across Domains and Languages [17.028968054304947]
MSumBenchは、英語と中国語の要約の多次元多領域評価である。 8つの現代的な要約モデルを評価することにより、ドメインや言語間で異なるパフォーマンスパターンが見つかる。
論文参考訳（メタデータ） (2025-05-31T13:12:35Z)
Segmentation en phrases : ouvrez les guillemets sans perdre le fil [0.08192907805418582]
本稿ではXML文書の文セグメンテーションのためのグラフカスケードを提案する。本提案では,引用マークやハイフンによって導入された症例について,文中の文を提示すると共に,括弧による切開や,大腸で導入されたリストに特に注意を払っている。
論文参考訳（メタデータ） (2024-07-29T09:02:38Z)
Evaluating D-MERIT of Partial-annotation on Information Retrieval [77.44452769932676]
検索モデルは、部分的に注釈付けされたデータセットでしばしば評価される。部分的に注釈付けされたデータセットを評価に用いると歪んだ絵が描けることを示す。
論文参考訳（メタデータ） (2024-06-23T08:24:08Z)
Evaluating the IWSLT2023 Speech Translation Tasks: Human Annotations, Automatic Metrics, and Segmentation [50.60733773088296]
音声言語翻訳国際ワークショップ(IWSLT 2023)における共有タスクの結果を総合的に評価する。本稿では,セグメントコンテキストによる自動回帰と直接評価に基づく効果的な評価戦略を提案する。分析の結果,1) 提案した評価戦略は頑健であり,他の種類の人的判断とよく相関している,2) 自動測定基準は通常,必ずしも直接評価スコアとよく関連しているわけではない,3) COMET は chrF よりもわずかに強い自動測定基準である,といった結果を得た。
論文参考訳（メタデータ） (2024-06-06T09:18:42Z)
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity [3.3162484539136416]
本稿では,SemScoreと呼ばれる簡易な評価尺度を提案する。意味的テキスト類似度(STS)を用いたモデル出力とゴールドターゲット応答の比較提案したSemScore測定基準は,人間の評価と相関する点において,より複雑な評価指標よりも優れていることが判明した。
論文参考訳（メタデータ） (2024-01-30T14:52:50Z)
Rethinking Evaluation Metrics of Open-Vocabulary Segmentaion [78.76867266561537]
評価プロセスは、予測された真理のカテゴリと基底的真理のカテゴリの類似性を考慮せずに、クローズドセットのメトリクスに大きく依存している。この問題に対処するため、まず2つのカテゴリー語間の11の類似度の測定を行った。我々は,3つのオープン語彙セグメンテーションタスクに適した,オープンmIoU,オープンAP,オープンPQという新しい評価指標を設計した。
論文参考訳（メタデータ） (2023-11-06T18:59:01Z)
FRMT: A Benchmark for Few-Shot Region-Aware Machine Translation [64.9546787488337]
本稿では、Few-shot Region-aware Machine Translationのための新しいデータセットと評価ベンチマークFRMTを提案する。このデータセットは、英語からポルトガル語と中国語の2つの地域変種へのプロの翻訳で構成されている。
論文参考訳（メタデータ） (2022-10-01T05:02:04Z)
Evaluating the Efficacy of Summarization Evaluation across Languages [33.46519116869276]
我々は8つの異なる言語に対する要約コーパスを取り、フォーカス(精度)とカバレッジ(リコール)のために手動で生成された要約を注釈付けする。 BERTScoreにおける多言語BERTの使用は、英語よりも高いレベルにおいて、すべての言語でうまく機能することがわかった。
論文参考訳（メタデータ） (2021-06-02T21:28:01Z)
Curious Case of Language Generation Evaluation Metrics: A Cautionary Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文参考訳（メタデータ） (2020-10-26T13:57:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。