Fugu-MT 論文翻訳(概要): Addressing Segmentation Ambiguity in Neural Linguistic Steganography

論文の概要: Addressing Segmentation Ambiguity in Neural Linguistic Steganography

arxiv url: http://arxiv.org/abs/2211.06662v1
Date: Sat, 12 Nov 2022 13:42:49 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-15 17:20:20.750962
Title: Addressing Segmentation Ambiguity in Neural Linguistic Steganography
Title（参考訳）: ニューラル言語ステレオグラフィーにおけるセグメンテーションの曖昧さ
Authors: Jumon Nozaki, Yugo Murawaki
Abstract要約: セグメンテーションの曖昧さは、レシーバ側で時々デコード障害を引き起こすことを示す。単語境界のない言語にも適用可能な,この問題を克服するための簡単な手法を提案する。
参考スコア（独自算出の注目度）: 5.402010079932967
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Previous studies on neural linguistic steganography, except Ueoka et al. (2021), overlook the fact that the sender must detokenize cover texts to avoid arousing the eavesdropper's suspicion. In this paper, we demonstrate that segmentation ambiguity indeed causes occasional decoding failures at the receiver's side. With the near-ubiquity of subwords, this problem now affects any language. We propose simple tricks to overcome this problem, which are even applicable to languages without explicit word boundaries.
Abstract（参考訳）: ueoka et al. (2021)を除いて、神経言語学的ステガノグラフィーに関する以前の研究は、送り手が盗聴者の疑念を喚起するのを避けるためにカバーテキストを遠ざけなければならないという事実を見逃していた。本稿では,セグメンテーションの曖昧さが,受信側において時折デコード障害を引き起こすことを実証する。サブワードの近さにより、この問題は今やどんな言語にも影響を及ぼす。単語境界のない言語にも適用可能な,この問題を克服するための簡単な手法を提案する。

関連論文リスト

Trick or Neat: Adversarial Ambiguity and Language Model Evaluation [42.62991342963119]
我々は,言語モデルのあいまいさに対する感度を,敵対的あいまいさデータセットを導入することによって評価する。モデル表現で訓練された線形プローブは、曖昧さを高精度に復号できるのに対し、直接的プロンプトは曖昧さを確実に識別できないことを示す。
論文参考訳（メタデータ） (2025-06-01T22:50:06Z)
Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文参考訳（メタデータ） (2025-05-26T07:21:20Z)
Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。 SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文参考訳（メタデータ） (2024-03-26T09:25:57Z)
Initial Decoding with Minimally Augmented Language Model for Improved Lattice Rescoring in Low Resource ASR [0.532018200832244]
本稿では,低リソース言語における格子再構成による音声認識精度向上の問題に対処する。対象言語のより大きなテキストコーパスに存在するが、ベースラインには存在しない単語ユニグラム数でベースライン言語モデルを最小化する。提案手法を用いて,21.8% (Telugu) と41.8% (Kannada) の単語誤りを削減した。
論文参考訳（メタデータ） (2024-03-16T14:34:31Z)
Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文参考訳（メタデータ） (2024-02-13T02:46:45Z)
Audio-Visual Neural Syntax Acquisition [91.14892278795892]
視覚的音声からの句構造誘導について検討する。本稿では,音声を聴いたり,画像を見たりすることでフレーズ構造を学習するAV-NSL(Audio-Visual Neural Syntax Learner)について述べる。
論文参考訳（メタデータ） (2023-10-11T16:54:57Z)
Disambiguatory Signals are Stronger in Word-initial Positions [48.18148856974974]
単語の初期と後期のセグメントの情報を比較するための既存の手法の相違点を指摘する。何百もの言語にまたがって、言葉で情報を読み込むという言語横断的な傾向があるという証拠が見つかりました。
論文参考訳（メタデータ） (2021-02-03T18:19:16Z)
Enhancing Sindhi Word Segmentation using Subword Representation Learning and Position-aware Self-attention [19.520840812910357]
シンディー語のセグメンテーションは、宇宙の欠落と挿入の問題のために難しい課題である。既存のシンディー語のセグメンテーション手法は手作りの機能の設計と組み合わせに依存している。本稿では,単語分割をシーケンスラベリングタスクとして扱うサブワードガイド型ニューラルワードセグメンタ(SGNWS)を提案する。
論文参考訳（メタデータ） (2020-12-30T08:31:31Z)
Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文参考訳（メタデータ） (2020-10-05T17:19:10Z)
Near-imperceptible Neural Linguistic Steganography via Self-Adjusting Arithmetic Coding [88.31226340759892]
本稿では,ニューラルネットワークモデルに基づく自己調整型算術符号を用いた秘密メッセージを符号化する新しい言語ステガノグラフィー手法を提案する。人間の評価によると、生成されたカバーテキストの51%は、実際に盗聴器を騙すことができる。
論文参考訳（メタデータ） (2020-10-01T20:40:23Z)
Investigating Language Impact in Bilingual Approaches for Computational Language Documentation [28.838960956506018]
本稿では,翻訳言語の選択が後続文書作業に与える影響について検討する。我々は56対のバイリンガルペアを作成し、低リソースの教師なし単語分割とアライメントのタスクに適用する。この結果から,ニューラルネットワークの入力表現に手がかりを取り入れることで,翻訳品質とアライメント品質が向上することが示唆された。
論文参考訳（メタデータ） (2020-03-30T10:30:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。