論文の概要: Investigating the detection of Tortured Phrases in Scientific Literature
- arxiv url: http://arxiv.org/abs/2210.13024v1
- Date: Mon, 24 Oct 2022 08:15:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 17:54:44.028037
- Title: Investigating the detection of Tortured Phrases in Scientific Literature
- Title(参考訳): 科学文献における拷問語の検出に関する研究
- Authors: Puthineath Lay, Martin Lentschat and Cyril Labb\'e
- Abstract要約: 最近の研究では、固定表現の代わりに現れる予期せぬ奇妙なフレーズである「ねじれ句」の概念が紹介されている。
本研究の目的は,未記載の拷問句を自動的に検出する方法について検討することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the help of online tools, unscrupulous authors can today generate a
pseudo-scientific article and attempt to publish it. Some of these tools work
by replacing or paraphrasing existing texts to produce new content, but they
have a tendency to generate nonsensical expressions. A recent study introduced
the concept of 'tortured phrase', an unexpected odd phrase that appears instead
of the fixed expression. E.g. counterfeit consciousness instead of artificial
intelligence. The present study aims at investigating how tortured phrases,
that are not yet listed, can be detected automatically. We conducted several
experiments, including non-neural binary classification, neural binary
classification and cosine similarity comparison of the phrase tokens, yielding
noticeable results.
- Abstract(参考訳): オンラインツールの助けを借りて、不条理な著者は今日、疑似科学的な記事を生成して公開しようとすることができる。
これらのツールのいくつかは、既存のテキストを置き換えたりパラフレッシュしたりして新しいコンテンツを生成するが、非センセーショナルな表現を生成する傾向がある。
最近の研究では、固定表現の代わりに現れる予期せぬ奇妙なフレーズである「ねじれ句」の概念が紹介されている。
例えば、人工知能の代わりに偽造意識です。
本研究の目的は,未記載の拷問句を自動的に検出する方法について検討することである。
非神経二分分類、ニューラル二分分類、コサイン類似性比較など、いくつかの実験を行い、顕著な結果を得た。
関連論文リスト
- An Analysis of BPE Vocabulary Trimming in Neural Machine Translation [56.383793805299234]
語彙トリミング(vocabulary trimming)は、まれなサブワードをコンポーネントサブワードに置き換える後処理のステップである。
ボキャブラリトリミングは性能向上に失敗し,さらに大きな劣化を招きやすいことを示す。
論文 参考訳(メタデータ) (2024-03-30T15:29:49Z) - Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.72682366640554]
著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文 参考訳(メタデータ) (2024-03-17T16:36:26Z) - Detection of tortured phrases in scientific literature [0.0]
本稿では,科学的論文からいわゆる拷問句を抽出する様々な自動検出手法を提案する。
87のリコール値と.61の精度で、検証のためにドメインの専門家に提出される新しい拷問句を検索することができる。
論文 参考訳(メタデータ) (2024-02-02T08:15:43Z) - Towards Effective Paraphrasing for Information Disguise [13.356934367660811]
著者の執筆したオンラインコミュニケーションがセンシティブなドメインに関連する場合,ID(Information Disguise)の研究が重要となる。
著者の投稿から与えられた文に対して,パラフレージングの方向に文の反復摂動を行う枠組みを提案する。
本研究は, パープレキシティスコアを用いたフレーズ重要度ランキングの新たな手法を導入し, ビームサーチによる複数レベルのフレーズ置換を行う。
論文 参考訳(メタデータ) (2023-11-08T21:12:59Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - What artificial intelligence might teach us about the origin of human
language [91.3755431537592]
本研究は、人工知能と音の象徴性を組み合わせた研究から生まれたパターンを探索する。
機械学習アルゴリズムは、音のシンボリズムの効率的な学習者であるが、あるカテゴリーを他方に偏りがちである。
論文 参考訳(メタデータ) (2023-01-15T23:25:29Z) - Paraphrase Identification with Deep Learning: A Review of Datasets and Methods [1.4325734372991794]
一般的なデータセットにおける特定のパラフレーズ型の表現不足が,盗作を検知する能力にどのように影響するかを検討する。
パラフレーズのための新しいタイポロジーを導入し、検証する。
我々は、AIに基づくパラフレーズ検出を強化するために、将来の研究とデータセット開発のための新しい方向を提案する。
論文 参考訳(メタデータ) (2022-12-13T23:06:20Z) - Studying word order through iterative shuffling [14.530986799844873]
NLPベンチマークタスクの実行には,単語順序エンコードが不可欠であることを示す。
我々は、固定言語モデルの下で最も高い確率を持つ単語の袋を注文する、新しい効率的な手続きであるBISを使用する。
IBISのような推論手順のシャッフルが言語モデリングや制約付き生成にどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-09-10T13:27:06Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。