論文の概要: AIpom at SemEval-2024 Task 8: Detecting AI-produced Outputs in M4
- arxiv url: http://arxiv.org/abs/2403.19354v1
- Date: Thu, 28 Mar 2024 12:10:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-29 16:24:00.690506
- Title: AIpom at SemEval-2024 Task 8: Detecting AI-produced Outputs in M4
- Title(参考訳): SemEval-2024 Task 8におけるAIpom: M4におけるAI生成出力の検出
- Authors: Alexander Shirnin, Nikita Andreev, Vladislav Mikhailov, Ekaterina Artemova,
- Abstract要約: AIpomは人書きテキストと機械生成テキストの境界を検出するように設計されている。
命令調整されたデコーダのみのモデルとシーケンスタグの予測を組み合わせた2段階パイプラインを提案する。
- 参考スコア(独自算出の注目度): 44.81938418483273
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes AIpom, a system designed to detect a boundary between human-written and machine-generated text (SemEval-2024 Task 8, Subtask C: Human-Machine Mixed Text Detection). We propose a two-stage pipeline combining predictions from an instruction-tuned decoder-only model and encoder-only sequence taggers. AIpom is ranked second on the leaderboard while achieving a Mean Absolute Error of 15.94. Ablation studies confirm the benefits of pipelining encoder and decoder models, particularly in terms of improved performance.
- Abstract(参考訳): 本稿では、AIpomについて述べる。AIpomは、人書きテキストと機械生成テキストの境界を検出するように設計されているシステムである(SemEval-2024 Task 8, Subtask C: Human-Machine Mixed Text Detection)。
命令調整されたデコーダのみのモデルとエンコーダのみのシーケンスタグからの予測を組み合わせた2段階パイプラインを提案する。
AIpomはリーダーボードで2位、平均絶対誤差は15.94である。
アブレーション研究は、特に性能改善の観点から、パイプライニングエンコーダとデコーダモデルの利点を確認している。
関連論文リスト
- Mast Kalandar at SemEval-2024 Task 8: On the Trail of Textual Origins: RoBERTa-BiLSTM Approach to Detect AI-Generated Text [7.959800630494841]
SemEval 2024は、マルチジェネレータ、マルチドメイン、マルチ言語ブラックボックスマシン生成テキスト検出のタスクを導入している。
本稿では,テキストをAI生成か人間かの2つのカテゴリに分類するために,RoBERTa-BiLSTMに基づく分類器を提案する。
私たちのアーキテクチャは、125の内、80.83の正確さで、公式のリーダーボードで46位でした。
論文 参考訳(メタデータ) (2024-07-03T10:22:23Z) - Nullpointer at ArAIEval Shared Task: Arabic Propagandist Technique Detection with Token-to-Word Mapping in Sequence Tagging [0.0]
本稿では、ArAIEval共有タスク1から、ツイートやニュース節を含むアラビア語テキストにおけるプロパガンダ技術検出の最適化について検討する。
実験結果から,単語の最初のトークンをテクニック予測に頼っていると,最高の性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-07-01T15:15:24Z) - AISPACE at SemEval-2024 task 8: A Class-balanced Soft-voting System for Detecting Multi-generator Machine-generated Text [0.0]
SemEval-2024 Task 8は、人書きテキストと機械生成テキストを検出するための課題を提供する。
本稿では,主にSubtask Bを扱うシステムを提案する。
これは、与えられた全文が人間によって書かれたか、あるいは、実際にはマルチクラスのテキスト分類タスクである特定のLarge Language Model (LLM)によって生成されるかを検出することを目的としている。
論文 参考訳(メタデータ) (2024-04-01T06:25:47Z) - MasonTigers at SemEval-2024 Task 8: Performance Analysis of Transformer-based Models on Machine-Generated Text Detection [0.0]
タスクは、バイナリ人文対マシン生成テキスト分類(トラックA)、マルチウェイマシン生成テキスト分類(トラックB)、ヒューマン・マシン混合テキスト検出(トラックC)を含む。
本稿では,主に識別器変換器モデルのアンサンブルと,特定の事例における文変換器と統計的機械学習のアプローチを利用する。
論文 参考訳(メタデータ) (2024-03-22T06:47:28Z) - UnitY: Two-pass Direct Speech-to-speech Translation with Discrete Units [64.61596752343837]
本稿では,まずテキスト表現を生成し,離散音響単位を予測する2パス直接S2STアーキテクチャであるUnitYを提案する。
第1パスデコーダのサブワード予測によりモデル性能を向上させる。
提案手法は,第2パスのスペクトルを予測しても性能が向上することを示す。
論文 参考訳(メタデータ) (2022-12-15T18:58:28Z) - SdAE: Self-distillated Masked Autoencoder [95.3684955370897]
本稿では,自己蒸留マスク付きオートエンコーダネットワークSdAEを提案する。
300エポックの事前トレーニングで、バニラViT-BaseモデルはImageNet-1k分類において84.1%の微調整精度を達成する。
論文 参考訳(メタデータ) (2022-07-31T15:07:25Z) - Wav2Seq: Pre-training Speech-to-Text Encoder-Decoder Models Using Pseudo
Languages [58.43299730989809]
本稿では,音声データに対するエンコーダ・デコーダモデルの両部分を事前学習するための,最初の自己教師型アプローチであるWav2Seqを紹介する。
我々は、コンパクトな離散表現として擬似言語を誘導し、自己教師付き擬似音声認識タスクを定式化する。
このプロセスは独自のものであり、低コストの第2段階のトレーニングとして適用することができる。
論文 参考訳(メタデータ) (2022-05-02T17:59:02Z) - Pre-Training Transformer Decoder for End-to-End ASR Model with Unpaired
Speech Data [145.95460945321253]
本稿では,音響単位,すなわち擬似符号を用いたエンコーダ・デコーダネットワークのための2つの事前学習タスクを提案する。
提案したSpeech2Cは,デコーダを事前学習することなく,単語誤り率(WER)を19.2%削減できる。
論文 参考訳(メタデータ) (2022-03-31T15:33:56Z) - SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。
1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2022-03-02T04:24:05Z) - ID-Conditioned Auto-Encoder for Unsupervised Anomaly Detection [0.0]
教師なし異常検出のためのID-Conditioned Auto-Encoderを導入する。
本手法は,オープンセット認識のために設計されたC2AE(Class-Conditioned Auto-Encoder)の適応である。
我々は,DCASE 2020 Challenge Task 2のToyADMOSおよびMIMIIデータセットについて検討した。
論文 参考訳(メタデータ) (2020-07-10T11:24:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。