論文の概要: Improving Zero-shot Sentence Decontextualisation with Content Selection and Planning
- arxiv url: http://arxiv.org/abs/2509.17921v1
- Date: Mon, 22 Sep 2025 15:47:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.473408
- Title: Improving Zero-shot Sentence Decontextualisation with Content Selection and Planning
- Title(参考訳): コンテンツ選択と計画によるゼロショット文の非コンテクスト化の改善
- Authors: Zhenyun Deng, Yulong Chen, Andreas Vlachos,
- Abstract要約: 提案するゼロショット・デコンテクスト化フレームワークは,どの内容に言及すべきか,どの順序で文を文脈から理解すべきかを判断する。
我々は、与えられた文から潜在的に曖昧な単位を識別し、それらの言説関係に基づいて文脈から関連する単位を抽出する。
最後に,各曖昧な単位を関連単位に富ませることで文の書き直しを行うコンテンツプランを生成する。
- 参考スコア(独自算出の注目度): 15.992477600061166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting individual sentences from a document as evidence or reasoning steps is commonly done in many NLP tasks. However, extracted sentences often lack context necessary to make them understood, e.g., coreference and background information. To this end, we propose a content selection and planning framework for zero-shot decontextualisation, which determines what content should be mentioned and in what order for a sentence to be understood out of context. Specifically, given a potentially ambiguous sentence and its context, we first segment it into basic semantically-independent units. We then identify potentially ambiguous units from the given sentence, and extract relevant units from the context based on their discourse relations. Finally, we generate a content plan to rewrite the sentence by enriching each ambiguous unit with its relevant units. Experimental results demonstrate that our approach is competitive for sentence decontextualisation, producing sentences that exhibit better semantic integrity and discourse coherence, outperforming existing methods.
- Abstract(参考訳): 文書から個々の文章を証拠や推論ステップとして抽出することは、多くのNLPタスクで一般的に行われている。
しかし、抽出された文は、例えば、コア参照や背景情報など、理解するのに必要なコンテキストを欠いていることが多い。
この目的のために,ゼロショット・デコンテクスト化のためのコンテンツ選択計画フレームワークを提案し,どのコンテンツに言及すべきか,どの順序で文を文脈から理解すべきかを判断する。
具体的には、潜在的に曖昧な文とその文脈を考慮し、まず基本的な意味論的非依存単位に分類する。
次に、与えられた文から潜在的に曖昧な単位を特定し、その言説関係に基づいて文脈から関連する単位を抽出する。
最後に、各曖昧な単位を関連単位に富み、文を書き換えるコンテンツプランを作成する。
実験の結果,提案手法は文の非テクスチャ化に競争力があり,意味的整合性や談話の一貫性が向上し,既存の手法よりも優れた文を生成することがわかった。
関連論文リスト
- Natural Language Decompositions of Implicit Content Enable Better Text Representations [52.992875653864076]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - A General Contextualized Rewriting Framework for Text Summarization [15.311467109946571]
抽出文は比較的焦点が当てられているが、背景知識や談話の文脈が失われる可能性がある。
コンテントベースのアドレッシングによって抽出文を識別し、グループタグアライメントを施したSeq2seqとしてコンテクスト化された書き直しを形式化する。
その結果,本手法は強化学習を必要とせず,非コンテクスチュアライズされた書き換えシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-13T03:55:57Z) - Decontextualization: Making Sentences Stand-Alone [13.465459751619818]
質問応答、対話エージェント、要約のモデルは、しばしばリッチな文脈で文の意味を解釈する。
キーピースはローカルウィンドウで明示されない可能性があるため、テキストの抜粋を取ることは問題となる可能性がある。
文の非文脈化(decontextualization)の問題は、文を文脈とともに取り、文脈から解釈できるように書き換えることである。
論文 参考訳(メタデータ) (2021-02-09T22:52:37Z) - Paragraph-level Commonsense Transformers with Recurrent Memory [77.4133779538797]
物語からコヒーレントなコモンセンス推論を生成するために,段落レベルの情報を含む談話認識モデルを訓練する。
以上の結果から,PARA-COMETは文レベルのベースライン,特にコヒーレントかつ新規な推論に優れていた。
論文 参考訳(メタデータ) (2020-10-04T05:24:12Z) - Understanding Points of Correspondence between Sentences for Abstractive
Summarization [39.7404761923196]
本稿では,文書から引き出された文の融合について,対応点の概念を導入して検討する。
我々は、文書、ソースおよび融合文、および文間の対応点の人間のアノテーションを含むデータセットを作成する。
論文 参考訳(メタデータ) (2020-06-10T02:42:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。