論文の概要: Abstractive Summary Generation for the Urdu Language
- arxiv url: http://arxiv.org/abs/2305.16195v1
- Date: Thu, 25 May 2023 15:55:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 14:12:39.751429
- Title: Abstractive Summary Generation for the Urdu Language
- Title(参考訳): Urdu言語のための抽象的概要生成
- Authors: Ali Raza, Hadia Sultan Raja, Usman Maratib
- Abstract要約: 我々は、自己認識機構を利用して入力テキストを符号化し、要約を生成するトランスフォーマーベースのモデルを用いる。
実験の結果,我々のモデルは文法的に正し,意味的に意味のある要約を生成できることがわかった。
- 参考スコア(独自算出の注目度): 1.9594639581421422
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Abstractive summary generation is a challenging task that requires the model
to comprehend the source text and generate a concise and coherent summary that
captures the essential information. In this paper, we explore the use of an
encoder/decoder approach for abstractive summary generation in the Urdu
language. We employ a transformer-based model that utilizes self-attention
mechanisms to encode the input text and generate a summary. Our experiments
show that our model can produce summaries that are grammatically correct and
semantically meaningful. We evaluate our model on a publicly available dataset
and achieve state-of-the-art results in terms of Rouge scores. We also conduct
a qualitative analysis of our model's output to assess its effectiveness and
limitations. Our findings suggest that the encoder/decoder approach is a
promising method for abstractive summary generation in Urdu and can be extended
to other languages with suitable modifications.
- Abstract(参考訳): 抽象的な要約生成は、モデルがソースコードを理解し、重要な情報をキャプチャする簡潔で一貫性のある要約を生成することを必要とする難しいタスクである。
本稿では,ウルドゥー語における抽象的要約生成のためのエンコーダ/デコーダアプローチについて検討する。
我々は、自己認識機構を利用して入力テキストを符号化し、要約を生成するトランスフォーマーモデルを用いる。
実験の結果,我々のモデルは文法的に正確で意味のある要約を生成できることがわかった。
我々は,公開データセット上でモデルを評価し,ルージュスコアを用いて最先端の結果を得る。
また,モデルの出力を定性的に分析し,その有効性と限界を評価する。
以上の結果から,エンコーダ/デコーダアプローチはurduの抽象要約生成に有望な手法であり,適切な修正を加えることで他の言語にも拡張できることが示唆された。
関連論文リスト
- From News to Summaries: Building a Hungarian Corpus for Extractive and Abstractive Summarization [0.19107347888374507]
HunSum-2は、抽象的および抽出的要約モデルのトレーニングに適したオープンソースのハンガリー語コーパスである。
データセットは、徹底的なクリーニングを行うCommon Crawlコーパスのセグメントから組み立てられる。
論文 参考訳(メタデータ) (2024-04-04T16:07:06Z) - mFACE: Multilingual Summarization with Factual Consistency Evaluation [79.60172087719356]
抽象的な要約は、事前訓練された言語モデルと大規模データセットの可用性のおかげで、近年で新たな関心を集めている。
有望な結果にもかかわらず、現在のモデルはいまだに現実的に矛盾した要約を生み出すことに苦しむ。
事実整合性評価モデルを利用して、多言語要約を改善する。
論文 参考訳(メタデータ) (2022-12-20T19:52:41Z) - Evaluation of Abstractive Summarisation Models with Machine Translation
in Deliberative Processes [23.249742737907905]
このデータセットは、主に文法的品質の低い複数の物語を単一のテキストで組み合わせることの難しさを反映している。
本稿では,市販機械翻訳モデルと組み合わせて,多種多様な抽象的要約モデルを広範囲に評価する。
生成した要約の流布,一貫性,関連性について有望な結果を得た。
論文 参考訳(メタデータ) (2021-10-12T09:23:57Z) - StreamHover: Livestream Transcript Summarization and Annotation [54.41877742041611]
ライブストリームの書き起こしを注釈付けして要約するフレームワークであるStreamHoverを紹介します。
合計500時間以上のビデオに抽出的要約と抽象的要約を併用したベンチマークデータセットは,既存の注釈付きコーパスよりもはるかに大きい。
我々のモデルはより一般化され、強力なベースラインよりも性能が向上することを示す。
論文 参考訳(メタデータ) (2021-09-11T02:19:37Z) - Neural Abstractive Text Summarizer for Telugu Language [0.0]
提案手法は注意機構を有するエンコーダ・デコーダシーケンシャルモデルに基づく。
我々は、このモデルを手作業で作成したデータセットに適用し、ソーステキストの1文要約を生成する。
論文 参考訳(メタデータ) (2021-01-18T15:22:50Z) - Unsupervised Opinion Summarization with Content Planning [58.5308638148329]
要約モデルにコンテンツプランニングを明示的に組み込むことで、より高い品質のアウトプットが得られることを示す。
また、より自然な合成データセットを作成し、実世界の文書と要約のペアに似ている。
当社のアプローチは,情報的,一貫性,流動的な要約を生成する上で,競争モデルよりも優れています。
論文 参考訳(メタデータ) (2020-12-14T18:41:58Z) - Bengali Abstractive News Summarization(BANS): A Neural Attention
Approach [0.8793721044482612]
本稿では,エンコーダ・デコーダに着目したSeq2seqベースのLong Short-Term Memory(LSTM)ネットワークモデルを提案する。
提案システムでは,単語の長い列を人文や人文で生成する,局所的な注意に基づくモデルを構築している。
また,Bangla.bdnews24.com1から収集した19k以上の記事とそれに対応する人文要約のデータセットも作成した。
論文 参考訳(メタデータ) (2020-12-03T08:17:31Z) - Exemplar-Controllable Paraphrasing and Translation using Bitext [57.92051459102902]
私たちは、バイリンガルテキスト(bitext)からのみ学ぶことができるように、以前の作業からモデルを適用する。
提案した1つのモデルでは、両言語で制御されたパラフレーズ生成と、両言語で制御された機械翻訳の4つのタスクを実行することができる。
論文 参考訳(メタデータ) (2020-10-12T17:02:50Z) - Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven
Cloze Reward [42.925345819778656]
本稿では,グラフ拡張と意味駆動型RewarDによる抽象要約のための新しいフレームワークであるASGARDを紹介する。
本稿では,2つのエンコーダ(シーケンシャル文書エンコーダ)とグラフ構造化エンコーダ(グラフ構造化エンコーダ)の利用を提案する。
その結果、我々のモデルは、New York TimesとCNN/Daily Mailのデータセットからの入力として、知識グラフのない変種よりもはるかに高いROUGEスコアを生成することがわかった。
論文 参考訳(メタデータ) (2020-05-03T18:23:06Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z) - Unsupervised Opinion Summarization with Noising and Denoising [85.49169453434554]
ユーザレビューのコーパスから合成データセットを作成し、レビューをサンプリングし、要約のふりをして、ノイズのあるバージョンを生成します。
テスト時に、モデルは本物のレビューを受け入れ、健全な意見を含む要約を生成し、合意に達しないものをノイズとして扱います。
論文 参考訳(メタデータ) (2020-04-21T16:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。