論文の概要: Unsupervised Word Segmentation with Bi-directional Neural Language Model
- arxiv url: http://arxiv.org/abs/2103.01421v1
- Date: Tue, 2 Mar 2021 02:21:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 02:53:24.792751
- Title: Unsupervised Word Segmentation with Bi-directional Neural Language Model
- Title(参考訳): 双方向ニューラル言語モデルを用いた教師なし単語分割
- Authors: Lihao Wang, Zongyi Li, Xiaoqing Zheng
- Abstract要約: 学習目的が文の生成確率を最大化することを目的とした教師なしワードセグメンテーションモデルを提案する。
長期および短期の依存関係をよりよく捉えるために,双方向ニューラルネットワークモデルの利用を提案する。
2つの復号アルゴリズムは、両方の方向からのコンテキスト特徴を組み合わせて最終セグメンテーションを生成する。
- 参考スコア(独自算出の注目度): 11.269066294359138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an unsupervised word segmentation model, in which the learning
objective is to maximize the generation probability of a sentence given its all
possible segmentation. Such generation probability can be factorized into the
likelihood of each possible segment given the context in a recursive way. In
order to better capture the long- and short-term dependencies, we propose to
use bi-directional neural language models to better capture the features of
segment's context. Two decoding algorithms are also described to combine the
context features from both directions to generate the final segmentation, which
helps to reconcile word boundary ambiguities. Experimental results showed that
our context-sensitive unsupervised segmentation model achieved state-of-the-art
at different evaluation settings on various data sets for Chinese, and the
comparable result for Thai.
- Abstract(参考訳): 本稿では,教師なし単語分割モデルを提案する。学習目的は,そのすべてのセグメント化を考慮した文の生成確率を最大化することである。
そのような生成確率は、文脈が再帰的に与えられる各可能なセグメントの確率に分解できる。
長期的および短期的な依存関係をよりよく捉えるために、セグメントのコンテキストの特徴をよりよく捉えるために双方向のニューラル言語モデルを提案する。
2つの復号アルゴリズムは、単語境界の曖昧さを和らげる最後のセグメンテーションを生成するために、両方の方向からのコンテキスト特徴を組み合わせるために記述される。
実験結果から,中国語のさまざまなデータセットの異なる評価設定において,文脈に敏感な教師なしセグメンテーションモデルを達成し,タイ語に匹敵する結果を得た。
関連論文リスト
- Explainable Metric Learning for Deflating Data Bias [2.977255700811213]
本稿では,画像の階層的なセマンティックセマンティックセマンティクスを構築し,解釈性を向上させるための説明可能なメトリクス学習フレームワークを提案する。
提案手法により,2つの画像間のセマンティックセグメントに基づくより人間的に理解可能な類似度測定が可能となる。
論文 参考訳(メタデータ) (2024-07-05T21:07:27Z) - Activity Grammars for Temporal Action Segmentation [71.03141719666972]
時間的アクションセグメンテーションは、トリミングされていないアクティビティビデオを一連のアクションセグメンテーションに変換することを目的としている。
本稿では,時間的行動セグメンテーションのための神経予測を導くための効果的な活動文法を提案する。
実験の結果,提案手法は時間的動作のセグメンテーションを性能と解釈性の両方の観点から著しく改善することが示された。
論文 参考訳(メタデータ) (2023-12-07T12:45:33Z) - Universal Segmentation at Arbitrary Granularity with Language
Instruction [59.76130089644841]
言語命令のガイダンスを用いて任意の意味レベルでセグメンテーションを行うことができるユニバーサルセグメンテーションモデルUniLSegを提案する。
UniLSegをトレーニングするために、元の多様な分布から統一されたデータ形式にタスク群を再構成し、セグメンテーションターゲットを入力として記述したテキストと対応するマスクを出力する。
論文 参考訳(メタデータ) (2023-12-04T04:47:48Z) - Unsupervised Chunking with Hierarchical RNN [62.15060807493364]
本稿では,非階層的手法で単語をグループ化する構文的タスクであるチャンキングに対する教師なしアプローチを紹介する。
本稿では,単語-チャンク・チャンク-文合成をモデル化した2層階層型階層型リカレントニューラルネットワーク(HRNN)を提案する。
CoNLL-2000データセットの実験では、既存の教師なし手法よりも顕著な改善が見られ、フレーズF1スコアが最大6ポイント向上した。
論文 参考訳(メタデータ) (2023-09-10T02:55:12Z) - Constructing Word-Context-Coupled Space Aligned with Associative
Knowledge Relations for Interpretable Language Modeling [0.0]
事前訓練された言語モデルにおけるディープニューラルネットワークのブラックボックス構造は、言語モデリングプロセスの解釈可能性を大幅に制限する。
解釈不能なニューラル表現と解釈不能な統計論理のアライメント処理を導入することで,ワードコンテキスト結合空間(W2CSpace)を提案する。
我々の言語モデルは,関連する最先端手法と比較して,優れた性能と信頼性の高い解釈能力を実現することができる。
論文 参考訳(メタデータ) (2023-05-19T09:26:02Z) - Associating Spatially-Consistent Grouping with Text-supervised Semantic
Segmentation [117.36746226803993]
テキスト教師付きセマンティックセグメンテーションを用いた自己教師付き空間一貫性グループ化を提案する。
部分的なグループ化結果を考えると、さらに画像レベルから領域レベルへのテキスト教師付きモデルを適用する。
59.2% mIoU と 32.4% mIoU を Pascal VOC および Pascal Context ベンチマークで達成した。
論文 参考訳(メタデータ) (2023-04-03T16:24:39Z) - Open-world Semantic Segmentation via Contrasting and Clustering
Vision-Language Embedding [95.78002228538841]
本研究では,様々なオープンワールドカテゴリのセマンティックオブジェクトを高密度アノテーションを使わずにセマンティックオブジェクトのセマンティックオブジェクトのセマンティック化を学習するための,新しいオープンワールドセマンティックセマンティックセマンティックセマンティクスパイプラインを提案する。
提案手法は任意のカテゴリのオブジェクトを直接分割し、3つのベンチマークデータセット上でデータラベリングを必要とするゼロショットセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2022-07-18T09:20:04Z) - Single Model Ensemble for Subword Regularized Models in Low-Resource
Machine Translation [25.04086897886412]
サブワード正規化は、トレーニング中に複数のサブワードセグメンテーションを使用して、ニューラルネットワーク翻訳モデルの堅牢性を改善する。
この矛盾に対処するための推論戦略を提案する。
実験結果から,提案手法はサブワード正規化を訓練したモデルの性能を向上させることが示された。
論文 参考訳(メタデータ) (2022-03-25T09:25:47Z) - Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文 参考訳(メタデータ) (2021-05-14T06:58:44Z) - Neural Sequence Segmentation as Determining the Leftmost Segments [25.378188980430256]
自然言語文をセグメントレベルで段階的に分割する新しい枠組みを提案する。
セグメンテーションのすべてのステップにおいて、残りのシーケンスの一番左のセグメントを認識する。
3つのデータセットにまたがる構文的チャンキングと中国語のパート・オブ・スパイチ・タギングに関する広範な実験を行った。
論文 参考訳(メタデータ) (2021-04-15T03:35:03Z) - Two-Level Transformer and Auxiliary Coherence Modeling for Improved Text
Segmentation [9.416757363901295]
単純だが明示的なコヒーレンスモデリングを用いたテキストセグメンテーションのための新しい教師付きモデルを提案する。
我々のモデルは、2つの階層的に連結されたトランスフォーマーネットワークからなるニューラルネットワークであり、文レベルのセグメンテーション目標と、正しい文列と腐敗した文列を区別するコヒーレンス目標を結合するマルチタスク学習モデルである。
論文 参考訳(メタデータ) (2020-01-03T17:06:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。