論文の概要: Investigating the Role of Centering Theory in the Context of Neural
Coreference Resolution Systems
- arxiv url: http://arxiv.org/abs/2210.14678v1
- Date: Wed, 26 Oct 2022 12:55:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 14:31:22.651146
- Title: Investigating the Role of Centering Theory in the Context of Neural
Coreference Resolution Systems
- Title(参考訳): ニューラルコアレゾリューションシステムにおける中心理論の役割の検討
- Authors: Yuchen Eleanor Jiang, Ryan Cotterell, Mrinmaya Sachan
- Abstract要約: 中心化理論と現代のコア参照分解システムとの関係について検討する。
高品質なニューラルコア参照リゾルバは、中心となるアイデアを明示的にモデル化することの恩恵を受けない可能性がある。
また, 再発をモデルとしたCTのバージョンを定式化し, バニラCTよりも良質なコア参照情報を取得することを示した。
- 参考スコア(独自算出の注目度): 71.57556446474486
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Centering theory (CT; Grosz et al., 1995) provides a linguistic analysis of
the structure of discourse. According to the theory, local coherence of
discourse arises from the manner and extent to which successive utterances make
reference to the same entities. In this paper, we investigate the connection
between centering theory and modern coreference resolution systems. We provide
an operationalization of centering and systematically investigate if neural
coreference resolvers adhere to the rules of centering theory by defining
various discourse metrics and developing a search-based methodology. Our
information-theoretic analysis reveals a positive dependence between
coreference and centering; but also shows that high-quality neural coreference
resolvers may not benefit much from explicitly modeling centering ideas. Our
analysis further shows that contextualized embeddings contain much of the
coherence information, which helps explain why CT can only provide little gains
to modern neural coreference resolvers which make use of pretrained
representations. Finally, we discuss factors that contribute to coreference
which are not modeled by CT such as world knowledge and recency bias. We
formulate a version of CT that also models recency and show that it captures
coreference information better compared to vanilla CT.
- Abstract(参考訳): 中心理論 (ct; grosz et al., 1995) は言論の構造に関する言語学的分析を提供する。
この理論によれば、会話の局所的な一貫性は、連続する発話が同一の実体を参照する方法と範囲から生じる。
本稿では,中心理論と現代のコア参照分解システムとの関係について検討する。
本稿では,様々な談話指標を定義し,探索に基づく方法論を開発することにより,ニューラルコア参照レゾルバが中心理論の規則に準拠しているかどうかを運用し,体系的に検討する。
情報理論的な分析により、コリファレンスとセンタリングの正の依存性が明らかになると同時に、高品質なニューラルネットワークコリファレンスリゾルバは、アイデア中心の明示的なモデリングからはあまり利益が得られないことも示されている。
さらに,コンテクスト化された埋め込みはコヒーレンス情報を多く含んでいることを示し,事前学習された表現を用いた現代的ニューラルネットワークコリファレンスリゾルバに対して,ctがほとんど利益を得られない理由を説明する。
最後に,世界知識や正規バイアスといったctでモデル化されていないコリファレンスに寄与する要因について論じる。
また, 再発をモデルとしたCTのバージョンを定式化し, バニラCTよりも良質なコア参照情報を取得することを示した。
関連論文リスト
- Understanding Distributed Representations of Concepts in Deep Neural
Networks without Supervision [25.449397570387802]
本稿では,ニューロンの主部分集合を選択することによって,概念の分散表現を発見する教師なし手法を提案する。
我々の経験から、類似のニューロン活性化状態のインスタンスはコヒーレントな概念を共有する傾向があることが示されている。
データ内のラベルなしサブクラスを特定し、誤分類の原因を検出するために利用することができる。
論文 参考訳(メタデータ) (2023-12-28T07:33:51Z) - Modeling Hierarchical Reasoning Chains by Linking Discourse Units and
Key Phrases for Reading Comprehension [80.99865844249106]
本稿では,論理的推論の基盤として,対話レベルと単語レベルの両方の文脈を扱う総合グラフネットワーク(HGN)を提案する。
具体的には、ノードレベルの関係とタイプレベルの関係は、推論過程におけるブリッジと解釈できるが、階層的な相互作用機構によってモデル化される。
論文 参考訳(メタデータ) (2023-06-21T07:34:27Z) - Networked Communication for Decentralised Agents in Mean-Field Games [59.01527054553122]
平均フィールドゲームフレームワークにネットワーク通信を導入する。
私たちのアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを示しています。
さらに、ネットワーク化されたアプローチには、中央集権型と独立型の両方の選択肢よりも大きなアドバンテージがあることも示します。
論文 参考訳(メタデータ) (2023-06-05T10:45:39Z) - Learning a Structural Causal Model for Intuition Reasoning in
Conversation [20.243323155177766]
NLP研究の重要な側面である推論は、一般的なモデルによって適切に対処されていない。
我々は、各発話がどのように情報チャネルを受信し、活性化するかを説明する会話認知モデル(CCM)を開発した。
変分推論を利用することで、暗黙的な原因の代用を探索し、その観測不可能性の問題に対処し、証拠の低い境界を通して発話の因果表現を再構築する。
論文 参考訳(メタデータ) (2023-05-28T13:54:09Z) - Understanding Imbalanced Semantic Segmentation Through Neural Collapse [81.89121711426951]
セマンティックセグメンテーションは自然に文脈的相関とクラス間の不均衡分布をもたらすことを示す。
機能中心にレギュレータを導入し、ネットワークが魅力ある構造に近い機能を学ぶことを奨励する。
我々の手法は、ScanNet200テストリーダーボードで1位にランクインし、新しい記録を樹立する。
論文 参考訳(メタデータ) (2023-01-03T13:51:51Z) - Biologically-informed deep learning models for cancer: fundamental
trends for encoding and interpreting oncology data [0.0]
本稿では,癌生物学における推論を支援するために用いられる深層学習(DL)モデルに着目した構造化文献解析を行う。
この研究は、既存のモデルが、先行知識、生物学的妥当性、解釈可能性とのより良い対話の必要性にどのように対処するかに焦点を当てている。
論文 参考訳(メタデータ) (2022-07-02T12:11:35Z) - Using Causal Analysis for Conceptual Deep Learning Explanation [11.552000005640203]
理想的な説明はドメインエキスパートの意思決定プロセスに似ている。
胸部X線像を伴って放射線検査を行い,概念を定義した。
我々は、発見されたすべての概念を簡単な決定規則に変換するために、低深度決定木を構築します。
論文 参考訳(メタデータ) (2021-07-10T00:01:45Z) - Developing Constrained Neural Units Over Time [81.19349325749037]
本稿では,既存のアプローチと異なるニューラルネットワークの定義方法に焦点をあてる。
ニューラルネットワークの構造は、データとの相互作用にも拡張される制約の特別なクラスによって定義される。
提案した理論は時間領域にキャストされ, データを順序づけられた方法でネットワークに提示する。
論文 参考訳(メタデータ) (2020-09-01T09:07:25Z) - A Chain Graph Interpretation of Real-World Neural Networks [58.78692706974121]
本稿では,NNを連鎖グラフ(CG)、フィードフォワードを近似推論手法として識別する別の解釈を提案する。
CG解釈は、確率的グラフィカルモデルのリッチな理論的枠組みの中で、各NNコンポーネントの性質を規定する。
我々は,CG解釈が様々なNN技術に対する新しい理論的支援と洞察を提供することを示す具体例を実例で示す。
論文 参考訳(メタデータ) (2020-06-30T14:46:08Z) - Expressiveness and machine processability of Knowledge Organization
Systems (KOS): An analysis of concepts and relations [0.0]
各知識組織システムの表現性と機械処理性の両方の可能性は、その構造規則によって広範囲に規制されている。
オントロジーは多種多様な関係を明示的に定義し、その性質上機械処理可能である。
論文 参考訳(メタデータ) (2020-03-11T12:35:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。