論文の概要: Distributed Marker Representation for Ambiguous Discourse Markers and
Entangled Relations
- arxiv url: http://arxiv.org/abs/2306.10658v1
- Date: Mon, 19 Jun 2023 00:49:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 19:27:36.816375
- Title: Distributed Marker Representation for Ambiguous Discourse Markers and
Entangled Relations
- Title(参考訳): あいまいな談話マーカーと絡み合った関係に対する分散マーカー表現
- Authors: Dongyu Ru, Lin Qiu, Xipeng Qiu, Yue Zhang, Zheng Zhang
- Abstract要約: 我々は、無制限の談話マーカーデータと潜在談話感覚を利用して分散マーカ表現(DMR)を学習する。
提案手法は,対話マーカー間の複雑なあいまいさや絡み合いや,手動で定義した談話関係を理解する上でも有用である。
- 参考スコア(独自算出の注目度): 50.31129784616845
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Discourse analysis is an important task because it models intrinsic semantic
structures between sentences in a document. Discourse markers are natural
representations of discourse in our daily language. One challenge is that the
markers as well as pre-defined and human-labeled discourse relations can be
ambiguous when describing the semantics between sentences. We believe that a
better approach is to use a contextual-dependent distribution over the markers
to express discourse information. In this work, we propose to learn a
Distributed Marker Representation (DMR) by utilizing the (potentially)
unlimited discourse marker data with a latent discourse sense, thereby bridging
markers with sentence pairs. Such representations can be learned automatically
from data without supervision, and in turn provide insights into the data
itself. Experiments show the SOTA performance of our DMR on the implicit
discourse relation recognition task and strong interpretability. Our method
also offers a valuable tool to understand complex ambiguity and entanglement
among discourse markers and manually defined discourse relations.
- Abstract(参考訳): 談話分析は文書中の文間の内在的な意味構造をモデル化するため、重要なタスクである。
談話マーカーは日常言語における談話の自然な表現である。
1つの課題は、マーカーと事前定義された人ラベルの談話関係が文間の意味論を記述する際に曖昧であることである。
より優れたアプローチは、マーカー上の文脈依存分布を用いて談話情報を表現することであると信じている。
本研究では,(潜在的に)無限の言論マーカーデータを潜在言論感覚で活用し,文対でマーカーをブリッジすることで,分散マーカ表現(DMR)を学習することを提案する。
このような表現は、監視なしでデータから自動的に学習することができ、データ自体への洞察を提供する。
暗黙的談話関係認識タスクにおけるDMRのSOTA性能と強い解釈可能性を示す実験を行った。
提案手法は,対話マーカー間の複雑なあいまいさや絡み合いや,手動で定義した談話関係を理解する上でも有用である。
関連論文リスト
- Self-Supervised Representation Learning with Spatial-Temporal Consistency for Sign Language Recognition [96.62264528407863]
本研究では,空間的時間的整合性を通じてリッチな文脈を探索する自己教師付きコントラスト学習フレームワークを提案する。
動きと関節のモーダル性の相補性に着想を得て,手話モデルに一階動作情報を導入する。
提案手法は,4つの公開ベンチマークの広範な実験により評価され,新しい最先端性能と顕著なマージンを実現している。
論文 参考訳(メタデータ) (2024-06-15T04:50:19Z) - Label Aware Speech Representation Learning For Language Identification [49.197215416945596]
本稿では,自己指導型表現学習と事前学習タスクのための言語ラベル情報を組み合わせた新しいフレームワークを提案する。
このフレームワークは、ラベル認識音声表現(LASR)学習と呼ばれ、三重項に基づく目的関数を使用して、言語ラベルと自己教師付き損失関数を組み込む。
論文 参考訳(メタデータ) (2023-06-07T12:14:16Z) - Cross-Genre Argument Mining: Can Language Models Automatically Fill in
Missing Discourse Markers? [17.610382230820395]
本稿では,すべての関係が明示的に示されるような談話マーカーで与えられたテキストを自動的に拡張することを提案する。
我々の分析では、このタスクで人気のある言語モデルが失敗することが明らかになっている。
異なるコーパスで評価したArgument Miningダウンストリームタスクに対するアプローチの効果を実演する。
論文 参考訳(メタデータ) (2023-06-07T10:19:50Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Saliency Map Verbalization: Comparing Feature Importance Representations
from Model-free and Instruction-based Methods [6.018950511093273]
サージェンシマップは、重要な入力特徴を特定することによって、ニューラルネットワークの予測を説明することができる。
我々は,サリエンシマップを自然言語に翻訳する未調査課題を定式化する。
本研究では,従来の特徴強調表現と比較した2つの新手法(検索ベースおよび命令ベース言語化)を比較した。
論文 参考訳(メタデータ) (2022-10-13T17:48:15Z) - Transition-based Abstract Meaning Representation Parsing with Contextual
Embeddings [0.0]
本研究では,意味解析のタスクにおいて,言語モデルと記号意味論の定式化という,言語の意味への最も成功したルートを2つ組み合わせる手法について検討する。
本稿では,事前学習した文脈認識単語の埋め込み(BERTやRoBERTaなど)を解析問題に組み込むことの有用性について検討する。
論文 参考訳(メタデータ) (2022-06-13T15:05:24Z) - Context Matters: Self-Attention for Sign Language Recognition [1.005130974691351]
本稿では,継続的署名言語認識の課題に対する注目ネットワークを提案する。
符号言語のモダリティをモデル化するために、データの共依存ストリームを利用する。
モデルが支配的な手と顔の領域の周りを回転する重要な手話コンポーネントを識別することができることがわかります。
論文 参考訳(メタデータ) (2021-01-12T17:40:19Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Paragraph-level Commonsense Transformers with Recurrent Memory [77.4133779538797]
物語からコヒーレントなコモンセンス推論を生成するために,段落レベルの情報を含む談話認識モデルを訓練する。
以上の結果から,PARA-COMETは文レベルのベースライン,特にコヒーレントかつ新規な推論に優れていた。
論文 参考訳(メタデータ) (2020-10-04T05:24:12Z) - DiscSense: Automated Semantic Analysis of Discourse Markers [9.272765183222967]
分類データセットにアノテートされた談話マーカーと意味的関係との関係について検討する。
既存の意味的注釈付きデータセットに対する自動修正手法を用いることで、英語における談話マーカーのボトムアップ的特徴付けを提供する。
論文 参考訳(メタデータ) (2020-06-02T13:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。