論文の概要: Generating Prototypes for Contradiction Detection Using Large Language
Models and Linguistic Rules
- arxiv url: http://arxiv.org/abs/2310.14732v1
- Date: Mon, 23 Oct 2023 09:07:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 21:06:21.086949
- Title: Generating Prototypes for Contradiction Detection Using Large Language
Models and Linguistic Rules
- Title(参考訳): 大規模言語モデルと言語規則を用いた矛盾検出のためのプロトタイプの作成
- Authors: Maren Pielka, Svetlana Schmidt, Rafet Sifa
- Abstract要約: 矛盾検出のための新しいデータ生成手法を提案する。
我々は生成モデルに、特定の矛盾型の記述に関して矛盾するステートメントを作成するよう指示する。
補助的なアプローチとして、単純な矛盾を構築するために言語規則を用いる。
- 参考スコア(独自算出の注目度): 1.6497679785422956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a novel data generation method for contradiction detection,
which leverages the generative power of large language models as well as
linguistic rules. Our vision is to provide a condensed corpus of prototypical
contradictions, allowing for in-depth linguistic analysis as well as efficient
language model fine-tuning. To this end, we instruct the generative models to
create contradicting statements with respect to descriptions of specific
contradiction types. In addition, the model is also instructed to come up with
completely new contradiction typologies. As an auxiliary approach, we use
linguistic rules to construct simple contradictions such as those arising from
negation, antonymy and numeric mismatch. We find that our methods yield
promising results in terms of coherence and variety of the data. Further
studies, as well as manual refinement are necessary to make use of this data in
a machine learning setup.
- Abstract(参考訳): 本稿では,大言語モデルの生成能力と言語規則を活用する,矛盾検出のための新しいデータ生成手法を提案する。
我々のビジョンは、原型矛盾の縮合したコーパスを提供することであり、より深い言語分析と効率的な言語モデル微調整を可能にする。
この目的のために、特定の矛盾型の記述に関して矛盾するステートメントを作成するように生成モデルに指示する。
さらに、このモデルは完全に新しい矛盾の類型を思いつくよう指示されている。
補助的アプローチとして,否定や反逆,数値ミスマッチなどの単純な矛盾を,言語規則を用いて構築する。
我々の手法はデータの一貫性と多様性の観点から有望な結果をもたらす。
機械学習のセットアップでこのデータを利用するには、さらに研究と手作業による改良が必要である。
関連論文リスト
- Learning Phonotactics from Linguistic Informants [54.086544221761486]
本モデルでは,情報理論的なポリシーの1つに従って,データポイントを反復的に選択または合成する。
提案モデルでは,情報提供者を問う項目の選択に使用する情報理論のポリシーが,完全教師付きアプローチに匹敵する,あるいはそれ以上の効率性が得られることがわかった。
論文 参考訳(メタデータ) (2024-05-08T00:18:56Z) - A Generative Adversarial Attack for Multilingual Text Classifiers [10.993289209465129]
そこで本稿では,多言語パラフレーズモデルに逆方向の目的を付与する手法を提案する。
トレーニングの目的は、テキストの品質と言語の一貫性を保証するために、事前訓練されたモデルのセットを含む。
2つの多言語データセットと5つの言語に対する実験的な検証により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-01-16T10:14:27Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Interpreting Language Models with Contrastive Explanations [99.7035899290924]
言語モデルは、音声、数字、時制、意味論など、トークンを予測するための様々な特徴を考慮しなければならない。
既存の説明手法は、これらの特徴の証拠を1つの説明に分割するが、人間の理解には理解できない。
比較的な説明は、主要な文法現象の検証において、非対照的な説明よりも定量的に優れていることを示す。
論文 参考訳(メタデータ) (2022-02-21T18:32:24Z) - I like fish, especially dolphins: Addressing Contradictions in Dialogue
Modeling [104.09033240889106]
DialoguE Contradiction Detection Task(DECODE)と、人間とロボットの矛盾した対話の両方を含む新しい会話データセットを紹介します。
次に、事前学習したトランスフォーマーモデルを用いて、定型的非構造的アプローチと矛盾検出を行う構造的発話に基づくアプローチを比較する。
論文 参考訳(メタデータ) (2020-12-24T18:47:49Z) - Detecting Word Sense Disambiguation Biases in Machine Translation for
Model-Agnostic Adversarial Attacks [84.61578555312288]
本稿では,統計的データ特性に基づく曖昧な誤りの予測手法を提案する。
我々は,曖昧な誤りを生じさせるため,文の摂動を最小限に抑える,単純な敵攻撃戦略を開発する。
以上の結果から,曖昧さの堅牢性はドメイン間で大きく異なり,同一データ上でトレーニングされた異なるモデルが異なる攻撃に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2020-11-03T17:01:44Z) - Recurrent Neural Network Language Models Always Learn English-Like
Relative Clause Attachment [17.995905582226463]
英語とスペイン語のモデル性能を比較し,RNN LMにおける非言語的バイアスが英語の構文構造と有利に重なることを示す。
英語モデルは人間に似た構文的嗜好を習得しているように見えるが、スペイン語で訓練されたモデルは、同等の人間的な嗜好を取得できない。
論文 参考訳(メタデータ) (2020-05-01T01:21:47Z) - Limits of Detecting Text Generated by Large-Scale Language Models [65.46403462928319]
誤情報キャンペーンで使用される可能性があるため、長く一貫性のあるテキストを生成できる大規模な言語モデルが危険であると考える者もいる。
ここでは、仮説テスト問題として大規模言語モデル出力検出を定式化し、テキストを真あるいは生成されたものと分類する。
論文 参考訳(メタデータ) (2020-02-09T19:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。