論文の概要: Chinese Morph Resolution in E-commerce Live Streaming Scenarios
- arxiv url: http://arxiv.org/abs/2512.23280v1
- Date: Mon, 29 Dec 2025 08:04:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.437755
- Title: Chinese Morph Resolution in E-commerce Live Streaming Scenarios
- Title(参考訳): 電子商取引のライブストリーミングシナリオで中国のモルフ解決
- Authors: Jiahao Zhu, Jipeng Qiang, Ran Bai, Chenyu Liu, Xiaoye Ouyang,
- Abstract要約: 中国におけるeコマースのライブストリーミングは、主要なセールスチャネルとなっているが、ホストはしばしば、調査を避け、偽の広告に従事している。
本研究では,このような違反を検出するためにLive Auditory Morph Resolution (LiveAMR)タスクを導入する。
86,790個のサンプルを用いて最初のLiveAMRデータセットを構築し,タスクをテキストからテキストへ変換する手法を開発した。
- 参考スコア(独自算出の注目度): 20.47765314118053
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: E-commerce live streaming in China, particularly on platforms like Douyin, has become a major sales channel, but hosts often use morphs to evade scrutiny and engage in false advertising. This study introduces the Live Auditory Morph Resolution (LiveAMR) task to detect such violations. Unlike previous morph research focused on text-based evasion in social media and underground industries, LiveAMR targets pronunciation-based evasion in health and medical live streams. We constructed the first LiveAMR dataset with 86,790 samples and developed a method to transform the task into a text-to-text generation problem. By leveraging large language models (LLMs) to generate additional training data, we improved performance and demonstrated that morph resolution significantly enhances live streaming regulation.
- Abstract(参考訳): 中国におけるEコマースのライブストリーミング、特にDouyinのようなプラットフォームは、主要な販売チャネルとなっているが、ホストはしばしば、調査を避け、偽広告に従事している。
本研究では,このような違反を検出するためにLive Auditory Morph Resolution (LiveAMR)タスクを導入する。
ソーシャルメディアや地下産業におけるテキストベースの回避に焦点を当てた以前の形態研究とは異なり、LiveAMRは健康と医療のライブストリームにおける発音ベースの回避をターゲットにしている。
86,790個のサンプルを用いて最初のLiveAMRデータセットを構築し,タスクをテキストからテキストへ変換する手法を開発した。
大規模言語モデル(LLM)を利用して追加のトレーニングデータを生成することにより、性能を改善し、形態分解能がライブストリーミングの規制を大幅に強化することを示した。
関連論文リスト
- UALM: Unified Audio Language Model for Understanding, Generation and Reasoning [124.19449187588832]
統一音声言語モデル (Unified Audio Language Model, UALM) は、音声理解、テキスト音声生成、マルチモーダル推論を単一モデルで統一することを目的としている。
最初にUALM-Genを提示する。これは音声トークンを直接予測し,最先端の拡散モデルに匹敵する言語モデルである。
UALM-Reasonは、テキストと音声の両方を中間的思考ステップで活用し、複雑な生成作業を容易にするマルチモーダル推論モデルである。
論文 参考訳(メタデータ) (2025-10-13T22:55:01Z) - Rethinking Hate Speech Detection on Social Media: Can LLMs Replace Traditional Models? [3.611706857555358]
現代ソーシャルメディアにおけるヘイトスピーチの検出は、言語的多様性とオンライン談話の非公式な性質により、独特な課題を呈している。
これらの課題は、コードミキシング、翻訳、文化的ニュアンス表現を含む設定でさらに増幅される。
近年の大規模言語モデル (LLM) は, それらを上回るだけでなく, ヘイトスピーチ検出の環境をより広範に再定義している。
論文 参考訳(メタデータ) (2025-06-15T06:48:47Z) - SUTA-LM: Bridging Test-Time Adaptation and Language Model Rescoring for Robust ASR [58.31068047426522]
テスト時間適応(TTA)は、推論中にモデルを調整することで緩和することを目的としている。
最近の研究は、ビーム探索再構成や生成誤り訂正といった手法を用いて、TTAと外部言語モデルの組み合わせについて検討している。
本稿では,SUTAの簡易かつ効果的な拡張であるSUTA-LMを提案する。
18種類のASRデータセットの実験により、SUTA-LMは幅広い領域で堅牢な結果が得られることが示された。
論文 参考訳(メタデータ) (2025-06-10T02:50:20Z) - Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think [72.48325960659822]
生成のための大規模拡散モデルの訓練における主要なボトルネックは、これらの表現を効果的に学習することにある。
本稿では,RePresentation Alignment (REPA) と呼ばれる単純な正規化を導入し,ノイズの多い入力隠れ状態の投影を,外部の事前学習された視覚エンコーダから得られるクリーンな画像表現と整合させる手法を提案する。
我々の単純な戦略は、一般的な拡散やDiTsやSiTsといったフローベースのトランスフォーマーに適用した場合、トレーニング効率と生成品質の両方に大きな改善をもたらす。
論文 参考訳(メタデータ) (2024-10-09T14:34:53Z) - Catching Chameleons: Detecting Evolving Disinformation Generated using Large Language Models [16.408611714514976]
我々は,事前学習した言語モデルの一般的な事実チェック機能と協調的に活用するパラメータ効率の高いDLD(Detecting Evolving LLM-Generative Disinformation)を提案する。
実験の結果, TextitDELD は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-06-26T00:21:39Z) - Large Language Models Suffer From Their Own Output: An Analysis of the Self-Consuming Training Loop [0.8602553195689513]
本稿では,Large Language Models (LLM) の自己消費学習ループについて検討する。
本稿では,LLM生成コンテンツの正確性を明確に検証できる論理式に基づく新しい手法を提案する。
自己消費学習ループは正しい出力を生成するが、使用データの割合によって出力の多様性は低下する。
論文 参考訳(メタデータ) (2023-11-28T14:36:43Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。