論文の概要: Abstractive Text Summarization for Contemporary Sanskrit Prose: Issues and Challenges
- arxiv url: http://arxiv.org/abs/2501.01933v1
- Date: Fri, 03 Jan 2025 18:12:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-06 15:12:28.858768
- Title: Abstractive Text Summarization for Contemporary Sanskrit Prose: Issues and Challenges
- Title(参考訳): 現代サンスクリット文の抽象テキスト要約 : 課題と課題
- Authors: Shagun Sinha,
- Abstract要約: この論文は、現代サンスクリット文の抽象テキスト要約モデルを示す。
この論文が研究する鍵となる疑問は、サンスクリットの抽象的TSを開発する上での課題である。
この作品では、4つの異なるテーマに基づくサブクエストが提案されている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This thesis presents Abstractive Text Summarization models for contemporary Sanskrit prose. The first chapter, titled Introduction, presents the motivation behind this work, the research questions, and the conceptual framework. Sanskrit is a low-resource inflectional language. The key research question that this thesis investigates is what the challenges in developing an abstractive TS for Sanskrit. To answer the key research questions, sub-questions based on four different themes have been posed in this work. The second chapter, Literature Review, surveys the previous works done. The third chapter, data preparation, answers the remaining three questions from the third theme. It reports the data collection and preprocessing challenges for both language model and summarization model trainings. The fourth chapter reports the training and inference of models and the results obtained therein. This research has initiated a pipeline for Sanskrit abstractive text summarization and has reported the challenges faced at every stage of the development. The research questions based on every theme have been answered to answer the key research question.
- Abstract(参考訳): この論文は、現代サンスクリット文の抽象テキスト要約モデルを示す。
第1章「序文」では、この研究の背景にあるモチベーション、研究課題、概念的枠組みが紹介されている。
サンスクリットは低リソースの屈折言語である。
この論文が研究する鍵となる疑問は、サンスクリットの抽象的TSを開発する上での課題である。
主要な研究課題に答えるために、4つの異なるテーマに基づくサブクエストが提案されている。
第2章では、以前の作品について調査している。
第3章はデータ準備であり、第3章から残る3つの質問に答える。
言語モデルと要約モデルトレーニングの両方において、データ収集と事前処理の課題を報告している。
第4章では、モデルのトレーニングと推論と結果が報告されている。
この研究はサンスクリットの抽象的なテキスト要約のためのパイプラインを開始し、開発の各段階で直面する課題を報告した。
各テーマに基づく研究質問は、主要な研究質問に答えるために答えられた。
関連論文リスト
- Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges [7.140449861888235]
このレビューでは、テキスト生成の作業を5つの主要なタスクに分類する。
各タスクについて、関連する特徴、サブタスク、および特定の課題についてレビューする。
近年のテキスト生成論文では,タスクやサブタスクに共通する9つの顕著な課題が報告されている。
論文 参考訳(メタデータ) (2024-05-24T14:38:11Z) - Linguistically-Informed Neural Architectures for Lexical, Syntactic and
Semantic Tasks in Sanskrit [1.184066113335041]
この論文は、サンスクリット写本を自然言語技術を通じてエンドユーザーにとってよりアクセスしやすくすることを目的としている。
サンスクリットの形態的豊かさ、複合性、自由語順性、低リソース性は、ディープラーニングソリューションを開発する上で重要な課題となっている。
我々は,サンスクリットの堅牢なNLP技術開発に不可欠な4つの基本課題を特定した。
論文 参考訳(メタデータ) (2023-08-17T06:33:33Z) - Challenges in Domain-Specific Abstractive Summarization and How to
Overcome them [0.6021787236982659]
大規模言語モデルは、ドメイン固有の抽象的テキスト要約のようなタスクに使用される際のいくつかの制限を示す。
本稿では,これら3つの制約を抽象的テキスト要約の文脈における研究問題として挙げる。
論文 参考訳(メタデータ) (2023-07-03T12:26:44Z) - Recent Advances in Direct Speech-to-text Translation [58.692782919570845]
我々は、既存の研究成果を、モデリングの負担、データの不足、アプリケーション問題という3つの課題に基づいて分類する。
データ不足の課題に対して、最近の研究は、データ強化、事前学習、知識蒸留、多言語モデリングなど、多くの高度な技術を活用している。
我々は、リアルタイム、セグメンテーション、名前付きエンティティ、性別バイアス、コードスイッチングなど、アプリケーションの問題を分析して要約する。
論文 参考訳(メタデータ) (2023-06-20T16:14:27Z) - Reasoning with Language Model Prompting: A Survey [86.96133788869092]
推論は複雑な問題解決に不可欠な能力であり、様々な現実世界のアプリケーションに対するバックエンドサポートを提供することができる。
本稿では,言語モデルによる推論に関する最先端の研究を包括的に調査する。
論文 参考訳(メタデータ) (2022-12-19T16:32:42Z) - Survey of Hallucination in Natural Language Generation [69.9926849848132]
近年,シーケンス間深層学習技術の発展により,自然言語生成(NLG)は指数関数的に向上している。
深層学習に基づく生成は意図しないテキストを幻覚させる傾向があるため、システム性能は低下する。
この調査は、NLGにおける幻覚テキストの課題に取り組む研究者の協力活動を促進するのに役立つ。
論文 参考訳(メタデータ) (2022-02-08T03:55:01Z) - Language bias in Visual Question Answering: A Survey and Taxonomy [0.0]
われわれはこの分野の総合的なレビューと分析を初めて実施する。
既存の手法を視覚情報の改善を含む3つのカテゴリに分類する。
言語バイアスの原因は明らかにされ、分類される。
論文 参考訳(メタデータ) (2021-11-16T15:01:24Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。