論文の概要: Investigating the detection of Tortured Phrases in Scientific Literature
- arxiv url: http://arxiv.org/abs/2210.13024v1
- Date: Mon, 24 Oct 2022 08:15:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 17:54:44.028037
- Title: Investigating the detection of Tortured Phrases in Scientific Literature
- Title(参考訳): 科学文献における拷問語の検出に関する研究
- Authors: Puthineath Lay, Martin Lentschat and Cyril Labb\'e
- Abstract要約: 最近の研究では、固定表現の代わりに現れる予期せぬ奇妙なフレーズである「ねじれ句」の概念が紹介されている。
本研究の目的は,未記載の拷問句を自動的に検出する方法について検討することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the help of online tools, unscrupulous authors can today generate a
pseudo-scientific article and attempt to publish it. Some of these tools work
by replacing or paraphrasing existing texts to produce new content, but they
have a tendency to generate nonsensical expressions. A recent study introduced
the concept of 'tortured phrase', an unexpected odd phrase that appears instead
of the fixed expression. E.g. counterfeit consciousness instead of artificial
intelligence. The present study aims at investigating how tortured phrases,
that are not yet listed, can be detected automatically. We conducted several
experiments, including non-neural binary classification, neural binary
classification and cosine similarity comparison of the phrase tokens, yielding
noticeable results.
- Abstract(参考訳): オンラインツールの助けを借りて、不条理な著者は今日、疑似科学的な記事を生成して公開しようとすることができる。
これらのツールのいくつかは、既存のテキストを置き換えたりパラフレッシュしたりして新しいコンテンツを生成するが、非センセーショナルな表現を生成する傾向がある。
最近の研究では、固定表現の代わりに現れる予期せぬ奇妙なフレーズである「ねじれ句」の概念が紹介されている。
例えば、人工知能の代わりに偽造意識です。
本研究の目的は,未記載の拷問句を自動的に検出する方法について検討することである。
非神経二分分類、ニューラル二分分類、コサイン類似性比較など、いくつかの実験を行い、顕著な結果を得た。
関連論文リスト
- Detection of tortured phrases in scientific literature [0.0]
本稿では,科学的論文からいわゆる拷問句を抽出する様々な自動検出手法を提案する。
87のリコール値と.61の精度で、検証のためにドメインの専門家に提出される新しい拷問句を検索することができる。
論文 参考訳(メタデータ) (2024-02-02T08:15:43Z) - Towards Effective Paraphrasing for Information Disguise [13.356934367660811]
著者の執筆したオンラインコミュニケーションがセンシティブなドメインに関連する場合,ID(Information Disguise)の研究が重要となる。
著者の投稿から与えられた文に対して,パラフレージングの方向に文の反復摂動を行う枠組みを提案する。
本研究は, パープレキシティスコアを用いたフレーズ重要度ランキングの新たな手法を導入し, ビームサーチによる複数レベルのフレーズ置換を行う。
論文 参考訳(メタデータ) (2023-11-08T21:12:59Z) - Verifying the Robustness of Automatic Credibility Assessment [79.08422736721764]
テキスト分類法は信頼性の低い内容を検出する手段として広く研究されている。
入力テキストの無意味な変更は、モデルを誤解させることがある。
偽情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAを紹介する。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - What artificial intelligence might teach us about the origin of human
language [91.3755431537592]
本研究は、人工知能と音の象徴性を組み合わせた研究から生まれたパターンを探索する。
機械学習アルゴリズムは、音のシンボリズムの効率的な学習者であるが、あるカテゴリーを他方に偏りがちである。
論文 参考訳(メタデータ) (2023-01-15T23:25:29Z) - Generative or Contrastive? Phrase Reconstruction for Better Sentence
Representation Learning [86.01683892956144]
句再構成に基づく新たな自己教師型学習目標を提案する。
我々の生成学習は、十分強力な文表現をもたらし、コントラスト学習と同等の文文類似性タスクで性能を達成することができる。
論文 参考訳(メタデータ) (2022-04-20T10:00:46Z) - Studying word order through iterative shuffling [14.530986799844873]
NLPベンチマークタスクの実行には,単語順序エンコードが不可欠であることを示す。
我々は、固定言語モデルの下で最も高い確率を持つ単語の袋を注文する、新しい効率的な手続きであるBISを使用する。
IBISのような推論手順のシャッフルが言語モデリングや制約付き生成にどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-09-10T13:27:06Z) - Extracting Grammars from a Neural Network Parser for Anomaly Detection
in Unknown Formats [79.6676793507792]
強化学習は、ある未知のフォーマットで文を解析するために、人工知能を訓練する技術として、最近約束されている。
本稿では、ニューラルネットワークから生成規則を抽出し、これらの規則を用いて、ある文が名目か異常かを決定する手順を提案する。
論文 参考訳(メタデータ) (2021-07-30T23:10:24Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - From Solving a Problem Boldly to Cutting the Gordian Knot: Idiomatic
Text Generation [14.360808219541752]
テキスト生成のための新しいアプリケーション、慣用文生成について研究する。
与えられたリテラル文に対して適切なイディオムを求める,このタスクに対する新しいアプローチを提案する。
得られたイディオムと残りの文を組み合わせるために,ニューラルモデルを用いて慣用文を生成する。
論文 参考訳(メタデータ) (2021-04-13T22:57:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。