Fugu-MT 論文翻訳(概要): Seeking Help, Facing Harm: Auditing TikTok's Mental Health Recommendations

論文の概要: Seeking Help, Facing Harm: Auditing TikTok's Mental Health Recommendations

arxiv url: http://arxiv.org/abs/2604.14832v1
Date: Thu, 16 Apr 2026 10:10:03 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-17 21:29:31.834723
Title: Seeking Help, Facing Harm: Auditing TikTok's Mental Health Recommendations
Title（参考訳）: TikTokのメンタルヘルスレコメンデーション(動画)
Authors: Pooriya Jamie, Amir Ghasemian, Homa Hosseinmardi,
Abstract要約: 我々はTikTokの「For You」ページの7日間の監査を行い、30の新規アカウントとLLM誘導エージェントを使用します。 8,727本以上の推奨ビデオでは、インタラクションの振る舞いが露呈結果を支配している。これらの結果から,TikTok推奨のユーザ意図信号に対する感度の制限が示唆された。
参考スコア（独自算出の注目度）: 1.2744523252873352
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recommender systems on social media increasingly mediate how users encounter mental health content, yet it remains unclear whether they distinguish help-seeking from distress expression. We conduct a controlled 7-day audit of TikTok's "For You" page using 30 fresh accounts and LLM-guided agents that vary initial search framing (distress- vs. help-initiated) and interaction strategy (engaged, avoidant, passive). Across 8,727 recommended videos, interaction behavior dominates exposure outcomes: engagement rapidly saturates feeds with mental health content (~45% of daily recommendations), while avoidance and passive viewing reduce but do not eliminate exposure (~11-20%). Search framing mainly shifts composition rather than volume--help-initiated searches yield more potentially supportive material, yet potentially harmful content persists at low but non-zero levels, including content in the Suicide/Self-Harm category. These findings suggest limited sensitivity to user intent signals in TikTok's recommendations and motivate context-aware safeguards for sensitive topics.
Abstract（参考訳）: ソーシャルメディア上のレコメンダシステムは、ユーザーがメンタルヘルスコンテンツにどのように遭遇するかを仲介する傾向にある。我々は、TikTokの"For You"ページのコントロールされた7日間の監査を行い、30の新規アカウントとLLM誘導エージェントを使用して、初期検索フレーミング(distress- vs. help-initiated)とインタラクション戦略(engaged, avoidant, passive)を変化させる。エンゲージメントはメンタルヘルスコンテンツを急速に飽和させ(毎日のレコメンデーションの約45%)、回避と受動的視聴は減少するが、露出を排除しない(約11-20%)。探索フレーミングは、主に容積ではなく構成をシフトする-ヘルプ開始による探索は、より潜在的に支持的な材料をもたらすが、潜在的に有害な内容は、自殺/自己ハームのカテゴリーのコンテンツを含む、低でも非ゼロのレベルで持続する。これらの結果は、TikTokの推奨事項におけるユーザ意図信号に対する感度の制限と、センシティブなトピックに対するコンテキスト対応の保護のモチベーションを示唆している。

関連論文リスト

Attention at Rest Stays at Rest: Breaking Visual Inertia for Cognitive Hallucination Mitigation [50.51650162235191]
本稿では,認知的推論を視覚的注意の動的応答性としてモデル化することにより,この慣性パターンを破る訓練のない慣性認識型視覚興奮(IVE)法を提案する。 IVEは様々な基礎MLLMと複数の幻覚ベンチマーク、特に認知幻覚に有効である。
論文参考訳（メタデータ） (2026-04-02T12:51:07Z)
Disentangling Prompt Element Level Risk Factors for Hallucinations and Omissions in Mental Health LLM Responses [11.099638001699276]
精神的な健康上の懸念は、高密度の助けを求めることを含め、しばしば臨床の外で表現される。我々は, 系統的ストレステストのための4つの制御可能な要素として調査を表現する, 即時構築フレームワークUTCOを紹介する。幻覚は6.5%の反応と欠落の13.2%で発生し、失効は危機と自殺の発端に集中した。
論文参考訳（メタデータ） (2026-03-10T17:40:24Z)
Evaluating the Sensitivity of LLMs to Harmful Contents in Long Input [53.19281984086319]
大規模言語モデル (LLM) は、文書処理から検索拡張生成まで、拡張コンテキストに依存したアプリケーションをサポートするようになった。我々は,LLMの有害な内容に対する感受性を,拡張されたコンテキスト,異なるタイプ(明示的対暗黙的),位置(傾向,中間,端),有病率(プロンプトの0.01～0.50),文脈長(600～6000トークン)で評価した。我々は同様のパターンを観察する: 適度な有害な有病率(0.25)でパフォーマンスピークがピークに達するが、内容が非常に疎い場合や支配的な場合の減少、文脈長の増大に伴うリコールの減少、初期有害な文は一般的により確実に検出され、明示的な内容は暗黙よりも一貫して認識される。
論文参考訳（メタデータ） (2025-10-07T12:33:21Z)
Attention Hijackers: Detect and Disentangle Attention Hijacking in LVLMs for Hallucination Mitigation [123.54980913741828]
LVLM(Large Vision-Language Models)は幻覚に弱い。 AID(Attention HIjackers Detection and Disentanglement)と呼ばれる新しい非トレーニング型戦略を提案する。 AIDは、命令駆動の視覚的サリエンスを計算することによって、意図的ヒジャッカーを特定する。次に、これらの特定されたヒジャッカーの視覚的注意を隠蔽するために注意散らし機構を提案する。 Re-Disentanglementは、過剰なマスキング効果を避けるために、命令駆動と画像駆動の視覚的サリエンスの間のバランスを再計算する。
論文参考訳（メタデータ） (2025-03-11T09:35:55Z)
YouTube Recommendations Reinforce Negative Emotions: Auditing Algorithmic Bias with Emotionally-Agentic Sock Puppets [0.624709220163167]
本研究では、感情的嗜好を認識し、強化するYouTubeの能力について検討する。以上の結果から,YouTubeは怒りや悲しみなどの否定的な感情を増幅し,レコメンデーションの頻度と優位性を高めていることが明らかとなった。発見は、アルゴリズムがユーザーのバイアスを増幅し、感情的なフィルターバブルに寄与し、ユーザーの幸福と社会的影響に対する懸念を高めることを示唆している。
論文参考訳（メタデータ） (2025-01-25T03:04:53Z)
Online posting effects: Unveiling the non-linear journeys of users in depression communities on Reddit [0.12564343689544843]
2年間にわたって対話する303kユーザからオンラインダイナミクスを再構築するデータインフォームドフレームワークを導入する。利用者は、友人の感情的・感情的コンテンツへのオンライン露出後、別の心理的状態に移行することができる。心理学的文献から解釈すると,オンラインソーシャルインタラクションのタイプとレイアウトが,うつ病を投稿する際のユーザの「ジャーニー」に影響を及ぼす証拠となる。
論文参考訳（メタデータ） (2023-11-29T14:45:11Z)
Critical Behavioral Traits Foster Peer Engagement in Online Mental Health Communities [28.17719749654601]
10,118件以上の投稿と、21のメンタルヘルス固有のサブレディットからの58,279件のコメントからなる、ピアカウンセリングデータセットであるBeCOPEを紹介した。分析の結果, 「自己批判」は, ヘルプシーカーが表現する批判の最も一般的な形態であり, 相互作用の43%を占めることが明らかとなった。本稿では, 高い可読性は, 追従支援を受ける確率を効果的に2倍にすることを示す。
論文参考訳（メタデータ） (2023-09-04T14:00:12Z)
Learning Language and Multimodal Privacy-Preserving Markers of Mood from Mobile Data [74.60507696087966]
精神状態は、先進医療に共通する国でも診断されていない。人間の行動を監視するための有望なデータソースのひとつは、日々のスマートフォンの利用だ。本研究では,自殺行動のリスクが高い青少年集団の移動行動のデータセットを用いて,日常生活の行動マーカーについて検討した。
論文参考訳（メタデータ） (2021-06-24T17:46:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。