論文の概要: DiscSense: Automated Semantic Analysis of Discourse Markers
- arxiv url: http://arxiv.org/abs/2006.01603v1
- Date: Tue, 2 Jun 2020 13:39:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 00:30:50.495885
- Title: DiscSense: Automated Semantic Analysis of Discourse Markers
- Title(参考訳): DiscSense: 談話マーカーの自動意味解析
- Authors: Damien Sileo, Tim Van de Cruys, Camille Pradel, Philippe Muller
- Abstract要約: 分類データセットにアノテートされた談話マーカーと意味的関係との関係について検討する。
既存の意味的注釈付きデータセットに対する自動修正手法を用いることで、英語における談話マーカーのボトムアップ的特徴付けを提供する。
- 参考スコア(独自算出の注目度): 9.272765183222967
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Discourse markers ({\it by contrast}, {\it happily}, etc.) are words or
phrases that are used to signal semantic and/or pragmatic relationships between
clauses or sentences. Recent work has fruitfully explored the prediction of
discourse markers between sentence pairs in order to learn accurate sentence
representations, that are useful in various classification tasks. In this work,
we take another perspective: using a model trained to predict discourse markers
between sentence pairs, we predict plausible markers between sentence pairs
with a known semantic relation (provided by existing classification datasets).
These predictions allow us to study the link between discourse markers and the
semantic relations annotated in classification datasets. Handcrafted mappings
have been proposed between markers and discourse relations on a limited set of
markers and a limited set of categories, but there exist hundreds of discourse
markers expressing a wide variety of relations, and there is no consensus on
the taxonomy of relations between competing discourse theories (which are
largely built in a top-down fashion). By using an automatic rediction method
over existing semantically annotated datasets, we provide a bottom-up
characterization of discourse markers in English. The resulting dataset, named
DiscSense, is publicly available.
- Abstract(参考訳): 談話マーカー(コントラストによって行われる、喜んで行われるなど)
は、節や文間の意味的および/または実践的な関係を示すのに使用される単語または句である。
最近の研究は、様々な分類タスクで有用な正確な文表現を学ぶために、文ペア間の談話マーカーの予測を実りあるように研究している。
そこで本研究では,文ペア間の談話マーカーを予測するために訓練されたモデルを用いて,文ペア間の有意なマーカーと既知の意味的関係(既存の分類データセットから得られる)を予測する。
これらの予測により、談話マーカーと分類データセットに注釈付けされた意味関係との関係を研究できる。
限定されたマーカー群と限定されたカテゴリ群について、マーカーと談話関係の間で手作りのマッピングが提案されているが、幅広い関係を表現した数百の談話マーカーが存在し、競合する談話理論(主にトップダウン方式で構築されている)の関係の分類についてのコンセンサスはない。
既存の意味的にアノテートされたデータセットに対する自動再帰法を用いて,英語における談話マーカーのボトムアップ特性を示す。
DiscSenseという名前のデータセットが公開されている。
関連論文リスト
- Multi-Label Classification for Implicit Discourse Relation Recognition [10.280148603465697]
暗黙的な談話関係認識のための多言語分類フレームワークについて検討する。
本研究では,複数ラベルの分類手法が単一ラベルの予測性能を低下させないことを示す。
論文 参考訳(メタデータ) (2024-06-06T19:37:25Z) - Distributed Marker Representation for Ambiguous Discourse Markers and
Entangled Relations [50.31129784616845]
我々は、無制限の談話マーカーデータと潜在談話感覚を利用して分散マーカ表現(DMR)を学習する。
提案手法は,対話マーカー間の複雑なあいまいさや絡み合いや,手動で定義した談話関係を理解する上でも有用である。
論文 参考訳(メタデータ) (2023-06-19T00:49:51Z) - Cross-Genre Argument Mining: Can Language Models Automatically Fill in
Missing Discourse Markers? [17.610382230820395]
本稿では,すべての関係が明示的に示されるような談話マーカーで与えられたテキストを自動的に拡張することを提案する。
我々の分析では、このタスクで人気のある言語モデルが失敗することが明らかになっている。
異なるコーパスで評価したArgument Miningダウンストリームタスクに対するアプローチの効果を実演する。
論文 参考訳(メタデータ) (2023-06-07T10:19:50Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Active Learning and Multi-label Classification for Ellipsis and
Coreference Detection in Conversational Question-Answering [5.984693203400407]
エリプシスとコアは、一般的に発生する言語現象である。
DistilBERTに基づくマルチラベル分類器を提案する。
これらの手法は,手動ラベル付きデータセット上で,これらの現象を検出するための分類器の性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2022-07-07T08:14:54Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Discourse Parsing of Contentious, Non-Convergent Online Discussions [0.16311150636417257]
対話論のバフティニア理論に着想を得て,新しい理論と計算の枠組みを提案する。
我々は,分散戦略の階層を反映する新しい談話アノテーションスキーマを開発した。
議論のないオンライン議論の最初のラベル付きデータセットを共有します。
論文 参考訳(メタデータ) (2020-12-08T17:36:39Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。