論文の概要: SocialQuotes: Learning Contextual Roles of Social Media Quotes on the Web
- arxiv url: http://arxiv.org/abs/2407.16007v1
- Date: Mon, 22 Jul 2024 19:21:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-24 19:25:20.612953
- Title: SocialQuotes: Learning Contextual Roles of Social Media Quotes on the Web
- Title(参考訳): SocialQuotes: Web上でのソーシャルメディア記事の文脈的役割の学習
- Authors: John Palowitch, Hamidreza Alvari, Mehran Kazemi, Tanvir Amin, Filip Radlinski,
- Abstract要約: 我々は、ソーシャルメディアの埋め込みを引用に例え、ページコンテキストを構造化された自然言語信号として形式化し、ページコンテキスト内の引用に対する役割の分類を識別する。
われわれはSocialQuotesをリリースした。SocialQuotesは3200万以上のソーシャル引用と8.3kのクラウドソースによる引用アノテーションからなるCommon Crawlから構築された新しいデータセットだ。
- 参考スコア(独自算出の注目度): 9.130915550141337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Web authors frequently embed social media to support and enrich their content, creating the potential to derive web-based, cross-platform social media representations that can enable more effective social media retrieval systems and richer scientific analyses. As step toward such capabilities, we introduce a novel language modeling framework that enables automatic annotation of roles that social media entities play in their embedded web context. Using related communication theory, we liken social media embeddings to quotes, formalize the page context as structured natural language signals, and identify a taxonomy of roles for quotes within the page context. We release SocialQuotes, a new data set built from the Common Crawl of over 32 million social quotes, 8.3k of them with crowdsourced quote annotations. Using SocialQuotes and the accompanying annotations, we provide a role classification case study, showing reasonable performance with modern-day LLMs, and exposing explainable aspects of our framework via page content ablations. We also classify a large batch of un-annotated quotes, revealing interesting cross-domain, cross-platform role distributions on the web.
- Abstract(参考訳): Webの作者は、しばしばソーシャルメディアを埋め込んでコンテンツをサポートし、豊かにするため、より効果的なソーシャルメディア検索システムとより豊かな科学的分析を可能にする、Webベースのクロスプラットフォームなソーシャルメディア表現を導出する可能性を生み出している。
そこで本稿では,ソーシャルメディアが組み込みWebコンテキストで果たす役割の自動アノテーションを可能にする,新たな言語モデリングフレームワークを提案する。
関連するコミュニケーション理論を用いて、ソーシャルメディアの埋め込みを引用に用い、ページコンテキストを構造化された自然言語信号として形式化し、ページコンテキスト内の引用に対する役割の分類を同定する。
われわれはSocialQuotesをリリースした。SocialQuotesは3200万以上のソーシャル引用と8.3kのクラウドソースによる引用アノテーションからなるCommon Crawlから構築された新しいデータセットだ。
SocialQuotesとそれに伴うアノテーションを用いて、ロール分類ケーススタディを提供し、現代のLLMで合理的なパフォーマンスを示し、ページコンテンツアブリゲーションを通じてフレームワークの説明可能な側面を明らかにする。
また、アノテーションのない大量の引用を分類し、Web上の興味深いクロスドメイン、クロスプラットフォームロールの分布を明らかにします。
関連論文リスト
- FLASH: Federated Learning-Based LLMs for Advanced Query Processing in Social Networks through RAG [5.5997926295092295]
このシステムは、多様なソーシャルメディアデータソースをシームレスに集約し、キュレートするように設計されている。
GPTモデルは、プライバシとセキュリティを確保するために、分散データソースに基づいてトレーニングされている。
論文 参考訳(メタデータ) (2024-08-06T22:28:13Z) - From a Social Cognitive Perspective: Context-aware Visual Social Relationship Recognition [59.57095498284501]
我々は,textbfContextual textbfSocial textbfRelationships (textbfConSoR) を社会的認知の観点から認識する新しいアプローチを提案する。
画像ごとの社会的関係を考慮した社会認識記述言語プロンプトを構築した。
印象的なことに、ConSoRは従来の手法を上回り、Person-in-Social-Context(PISC)データセットでは12.2%、Person-in-Photo-Album(PIPA)ベンチマークでは9.8%向上している。
論文 参考訳(メタデータ) (2024-06-12T16:02:28Z) - SoMeLVLM: A Large Vision Language Model for Social Media Processing [78.47310657638567]
ソーシャルメディア処理のための大規模ビジョン言語モデル(SoMeLVLM)を提案する。
SoMeLVLMは、知識と理解、応用、分析、評価、作成を含む5つの重要な機能を備えた認知フレームワークである。
実験により,複数のソーシャルメディアタスクにおいて,SoMeLVLMが最先端のパフォーマンスを達成できることが実証された。
論文 参考訳(メタデータ) (2024-02-20T14:02:45Z) - URL-BERT: Training Webpage Representations via Social Media Engagements [31.6455614291821]
LMを適応させてURLやWebページを理解するための,新たな事前学習目標を提案する。
提案するフレームワークは,(1) ソーシャルメディア上のユーザエンゲージメントに基づいて,URLの浅い表現を学習するためのスケーラブルなグラフ埋め込みである。
当社の継続的な事前学習アプローチは、さまざまなタスクやTwitterの内部および外部ベンチマークにおけるWebページ理解を改善することを実験的に実証した。
論文 参考訳(メタデータ) (2023-10-25T02:22:50Z) - Exploring Embeddings for Measuring Text Relatedness: Unveiling
Sentiments and Relationships in Online Comments [1.7230140898679147]
本稿では,様々なソーシャルメディアプラットフォームにおけるコメント間の感情的・意味的関係について検討する。
単語の埋め込みを使って文や文書のコンポーネントを分析する。
我々の分析は、オンラインコメントの相互接続性をより深く理解し、大きな相互接続脳として機能するインターネットの概念を調査する。
論文 参考訳(メタデータ) (2023-09-15T04:57:23Z) - TweetNLP: Cutting-Edge Natural Language Processing for Social Media [22.6980150693332]
TweetNLPは、ソーシャルメディアにおける自然言語処理(NLP)の統合プラットフォームである。
感情分析や名前付きエンティティ認識といった汎用的な焦点領域を含む、多様なNLPタスク群をサポートする。
システムは、ソーシャルメディアのテキストに特化した、合理的な大きさのTransformerベースの言語モデルを利用している。
論文 参考訳(メタデータ) (2022-06-29T17:16:58Z) - Can You be More Social? Injecting Politeness and Positivity into
Task-Oriented Conversational Agents [60.27066549589362]
人間エージェントが使用する社会言語は、ユーザーの応答性の向上とタスク完了に関連しています。
このモデルは、ソーシャル言語理解要素で拡張されたシーケンスからシーケンスまでのディープラーニングアーキテクチャを使用する。
人的判断と自動言語尺度の両方を用いたコンテンツ保存と社会言語レベルの評価は,エージェントがより社会的に適切な方法でユーザの問題に対処できる応答を生成できることを示している。
論文 参考訳(メタデータ) (2020-12-29T08:22:48Z) - SoMin.ai: Personality-Driven Content Generation Platform [60.49416044866648]
世界初のパーソナリティ駆動型マーケティングコンテンツ生成プラットフォームであるSoMin.aiを紹介します。
このプラットフォームは、ディープ・マルチビュー・パーソナリティ・プロファイリング・フレームワークと、スタイル・ジェネレーティブ・敵ネットワークを組み合わせている。
ソーシャルネットワーキングのユーザエクスペリエンスの向上や、コンテンツマーケティングのルーチンに使用できる。
論文 参考訳(メタデータ) (2020-11-30T08:33:39Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - AMUSED: An Annotation Framework of Multi-modal Social Media Data [0.0]
このフレームワークは、ソーシャルメディアデータの収集と注釈付けの問題を緩和するために設計されている。
AMUSEDは複数のアプリケーションドメインに適用可能で、ユースケースとして、新型コロナウイルスの誤情報収集のためのフレームワークを実装した。
論文 参考訳(メタデータ) (2020-10-01T15:50:41Z) - I Know Where You Are Coming From: On the Impact of Social Media Sources
on AI Model Performance [79.05613148641018]
我々は、異なるソーシャルネットワークのマルチモーダルデータから学習する際、異なる機械学習モデルの性能について検討する。
最初の実験結果から,ソーシャルネットワークの選択がパフォーマンスに影響を及ぼすことが明らかとなった。
論文 参考訳(メタデータ) (2020-02-05T11:10:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。