論文の概要: Structured Summarization: Unified Text Segmentation and Segment Labeling
as a Generation Task
- arxiv url: http://arxiv.org/abs/2209.13759v1
- Date: Wed, 28 Sep 2022 01:08:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 16:47:12.561041
- Title: Structured Summarization: Unified Text Segmentation and Segment Labeling
as a Generation Task
- Title(参考訳): 構造化要約:生成タスクとしての統一テキストセグメンテーションとセグメントラベリング
- Authors: Hakan Inan, Rashi Rungta, Yashar Mehdad
- Abstract要約: 長い文書や会話を処理できる1つのエンコーダ・デコーダニューラルネットワークを提案する。
我々は、組み合わせたタスクを純粋な生成タスクとして解決する方法をうまく示す。
本結果は,テキストのセグメンテーションとセグメントラベリングを全体として検討する上で,強力なケースを確立した。
- 参考スコア(独自算出の注目度): 16.155438404910043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text segmentation aims to divide text into contiguous, semantically coherent
segments, while segment labeling deals with producing labels for each segment.
Past work has shown success in tackling segmentation and labeling for documents
and conversations. This has been possible with a combination of task-specific
pipelines, supervised and unsupervised learning objectives. In this work, we
propose a single encoder-decoder neural network that can handle long documents
and conversations, trained simultaneously for both segmentation and segment
labeling using only standard supervision. We successfully show a way to solve
the combined task as a pure generation task, which we refer to as structured
summarization. We apply the same technique to both document and conversational
data, and we show state of the art performance across datasets for both
segmentation and labeling, under both high- and low-resource settings. Our
results establish a strong case for considering text segmentation and segment
labeling as a whole, and moving towards general-purpose techniques that don't
depend on domain expertise or task-specific components.
- Abstract(参考訳): テキストセグメンテーションは、テキストを連続的に意味的に一貫性のあるセグメントに分割することを目的としている。
過去の研究は、文書や会話のセグメンテーションやラベル付けに成功している。
これはタスク固有のパイプライン、教師なしと教師なしの学習目標の組み合わせで可能になった。
本研究では,1つのエンコーダ・デコーダ・ニューラルネットワークを提案する。このニューラルネットワークは長い文書や会話を処理し,標準監督のみを用いてセグメント化とセグメントラベリングを同時に訓練する。
我々は、結合したタスクを純粋な生成タスクとして解く方法を示し、これを構造化要約と呼ぶ。
我々は、文書データと会話データの両方に同じ手法を適用し、ハイリソースとローリソースの両方の設定で、セグメンテーションとラベル付けのためのデータセット全体のアートパフォーマンスの状態を示す。
本研究は,テキストセグメンテーションとセグメントラベリング全体を考慮し,ドメインの専門知識やタスク固有のコンポーネントに依存しない汎用技術に移行するための強固なケースである。
関連論文リスト
- LESS: Label-Efficient and Single-Stage Referring 3D Segmentation [55.06002976797879]
参照3Dは、クエリの文で記述された3Dポイントクラウドから、指定されたオブジェクトのすべてのポイントをセグメントする視覚言語タスクである。
本稿では,LESSと呼ばれるレファレンス3次元パイプラインを提案する。
ScanReferデータセット上での最先端のパフォーマンスは、バイナリラベルのみを使用して、以前の3.7% mIoUの手法を上回ります。
論文 参考訳(メタデータ) (2024-10-17T07:47:41Z) - Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.74296438621836]
Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。
弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。
Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-08-22T15:29:08Z) - USE: Universal Segment Embeddings for Open-Vocabulary Image Segmentation [33.11010205890195]
オープン語彙のイメージセグメンテーションにおける大きな課題は、これらのセグメンテーションをテキスト定義カテゴリに正確に分類することにある。
この課題に対処するために、Universal Segment Embedding(USE)フレームワークを紹介します。
本フレームワークは,1)大量のセグメントテキストペアを様々な粒度で効率的にキュレートするように設計されたデータパイプライン,2)テキスト定義のカテゴリに精度の高いセグメント分類を可能にする普遍的なセグメント埋め込みモデルからなる。
論文 参考訳(メタデータ) (2024-06-07T21:41:18Z) - From Text Segmentation to Smart Chaptering: A Novel Benchmark for
Structuring Video Transcriptions [63.11097464396147]
音声コンテンツに焦点をあてた新しいベンチマークYTSegを導入し、その内容は本質的に非構造的であり、トポロジと構造的にも多様である。
また,高効率な階層分割モデルMiniSegを導入する。
論文 参考訳(メタデータ) (2024-02-27T15:59:37Z) - Segmenting Messy Text: Detecting Boundaries in Text Derived from
Historical Newspaper Images [0.0]
新聞の結婚発表リストを1つの発表単位に分けるという,困難なテキストセグメンテーションの課題について考察する。
多くの場合、情報は文に構造化されず、隣接するセグメントは互いに位相的に区別されない。
本稿では,このようなテキストをセグメント化するための新しいディープラーニングモデルを提案する。
論文 参考訳(メタデータ) (2023-12-20T05:17:06Z) - Segment Everything Everywhere All at Once [124.90835636901096]
画像中のすべてのものを同時にセグメント化するための,迅速かつインタラクティブなモデルであるSEEMを提案する。
そこで本研究では,あらゆるタイプのセグメンテーションタスクに対して,多様なプロンプトを可能にする新しい復号化機構を提案する。
多様なセグメンテーションタスクにおけるSEEMの有効性を検証するための総合的な実証的研究を行った。
論文 参考訳(メタデータ) (2023-04-13T17:59:40Z) - SegGPT: Segmenting Everything In Context [98.98487097934067]
コンテキスト内ですべてをセグメント化するモデルであるSegGPTを提示する。
様々なセグメンテーションタスクを汎用的なインコンテキスト学習フレームワークに統合する。
SegGPTは、コンテクスト内推論を通じて、画像やビデオの任意のセグメンテーションタスクを実行することができる。
論文 参考訳(メタデータ) (2023-04-06T17:59:57Z) - Open-world Semantic Segmentation via Contrasting and Clustering
Vision-Language Embedding [95.78002228538841]
本研究では,様々なオープンワールドカテゴリのセマンティックオブジェクトを高密度アノテーションを使わずにセマンティックオブジェクトのセマンティックオブジェクトのセマンティック化を学習するための,新しいオープンワールドセマンティックセマンティックセマンティックセマンティクスパイプラインを提案する。
提案手法は任意のカテゴリのオブジェクトを直接分割し、3つのベンチマークデータセット上でデータラベリングを必要とするゼロショットセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2022-07-18T09:20:04Z) - Learning Panoptic Segmentation from Instance Contours [9.347742071428918]
Panopticpixel は、背景 (stuff) とオブジェクト (things) のインスタンスをピクセルレベルで理解することを目的としている。
セマンティックセグメンテーション(レベル分類)とインスタンスセグメンテーションの別々のタスクを組み合わせて、単一の統合されたシーン理解タスクを構築する。
セマンティックセグメンテーションとインスタンス輪郭からインスタンスセグメンテーションを学習する完全畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-16T03:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。