論文の概要: No Keyword is an Island: In search of covert associations
- arxiv url: http://arxiv.org/abs/2103.17114v1
- Date: Wed, 31 Mar 2021 14:33:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 22:04:35.567508
- Title: No Keyword is an Island: In search of covert associations
- Title(参考訳): No Keyword is an Island: In Search of covert associations
- Authors: V\'aclav Cvr\v{c}ek, Masako Ueda Fidler
- Abstract要約: 市場バスケット分析(mba)は、ショッピングカート内のアイテム間の一貫した関連を明らかにすることができる。
移動に関するパイロット研究は、反システムと中右チェコのインターネットメディアの対比で行われた。
その結果,MBAはアンチシステムニュースポータルの主流戦略を特定するのに有用であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper describes how corpus-assisted discourse analysis based on keyword
(KW) identification and interpretation can benefit from employing Market basket
analysis (MBA) after KW extraction. MBA is a data mining technique used
originally in marketing that can reveal consistent associations between items
in a shopping cart, but also between keywords in a corpus of many texts. By
identifying recurring associations between KWs we can compensate for the lack
of wider context which is a major issue impeding the interpretation of isolated
KWs (esp. when analyzing large data). To showcase the advantages of MBA in
"re-contextualizing" keywords within the discourse, a pilot study on the topic
of migration was conducted contrasting anti-system and center-right Czech
internet media. was conducted. The results show that MBA is useful in
identifying the dominant strategy of anti-system news portals: to weave in a
confounding ideological undercurrent and connect the concept of migrants to a
multitude of other topics (i.e., flooding the discourse).
- Abstract(参考訳): 本稿では,キーワード(KW)の識別と解釈に基づくコーパス支援談話分析が,KW抽出後の市場バスケット分析(MBA)の活用のメリットについて述べる。
MBAは、もともとマーケティングで使用されるデータマイニング技術で、ショッピングカート内のアイテム間の一貫性のある関連を明らかにするだけでなく、多くのテキストのコーパス内のキーワード間の関連を明らかにすることができる。
KW間の連続的な関連を同定することにより、孤立KWの解釈を妨げる主要な問題であるより広い文脈の欠如を補うことができる(esp)。
大きなデータを分析するとき)
リコンテクスト化(re-contextualizing)”というキーワードでmbaの利点を示すために,反システムと中右チェコのインターネットメディアを対比して,マイグレーションのトピックに関するパイロット研究を行った。
実行されました
その結果、mbaは反システムニュースポータルの支配的な戦略を特定するのに有用であることが明らかとなった: 根底にあるイデオロギー的下流に織り込み、移民の概念と多くのトピック(つまり、言論を洪水させる)を結びつける。
関連論文リスト
- The Imperative of Conversation Analysis in the Era of LLMs: A Survey of Tasks, Techniques, and Trends [64.99423243200296]
会話分析(CA)は、会話データから重要な情報を発見し分析する。
本稿では,CAタスクの徹底的なレビューとシステム化を行い,既存の業務を要約する。
会話シーンの再構築,奥行きの属性分析,ターゲットトレーニングの実行,会話の生成から,CAの4つの重要なステップを導出した。
論文 参考訳(メタデータ) (2024-09-21T16:52:43Z) - Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.75567341513897]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。
Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文 参考訳(メタデータ) (2024-09-05T09:10:38Z) - WisdoM: Improving Multimodal Sentiment Analysis by Fusing Contextual
World Knowledge [73.76722241704488]
大規模視覚言語モデル(LVLM)から引き起こされる文脈的世界知識を利用してマルチモーダル感情分析を行うプラグインフレームワークWisdoMを提案する。
我々の手法は、いくつかの最先端手法よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-01-12T16:08:07Z) - Explore Spurious Correlations at the Concept Level in Language Models for Text Classification [28.832684088975622]
言語モデル(LM)は多くのNLPタスクで顕著な成功を収めた。
トレーニングデータやICLの実践者の不均衡なラベル分布から生じる急激な相関による堅牢性の問題に直面している。
本稿では,2つの主なコントリビューションを紹介する。まず,概念ラベルをテキストに割り当てるためにChatGPTを用い,テストデータ上での微調整時のモデルにおける概念バイアスやICLを評価する。
第2に,ChatGPT生成した反ファクトデータを組み込んだデータ再バランス手法を導入し,ラベル分布のバランスを保ち,突発的相関を緩和する。
論文 参考訳(メタデータ) (2023-11-15T01:58:54Z) - How Can Context Help? Exploring Joint Retrieval of Passage and
Personalized Context [39.334509280777425]
コンテキスト認識型文書地下会話システムの概念に触発され,コンテキスト認識型文節検索の課題が紹介される。
本稿では,パーソナライズド・コンテクスト・アウェア・サーチ(PCAS)を提案する。
論文 参考訳(メタデータ) (2023-08-26T04:49:46Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - SOCIOFILLMORE: A Tool for Discovering Perspectives [10.189255026322996]
SOCIOFILLMOREは、テキストがイベントを描写する際に表現する視点をフォアに導くのに役立つツールである。
我々のツールは、人間の判断を大量に集めることで、理論的にはフレームのセマンティクスと認知言語学に基礎を置いています。
論文 参考訳(メタデータ) (2022-03-07T14:42:22Z) - More Than Words: Collocation Tokenization for Latent Dirichlet
Allocation Models [71.42030830910227]
モデルが異なる環境でクラスタリングの品質を測定するための新しい指標を提案する。
マージトークンでトレーニングされたトピックは、マージされていないモデルよりも、より明確で、一貫性があり、トピックを区別する効果が高いトピックキーをもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-24T14:08:19Z) - Explaining Outcomes of Multi-Party Dialogues using Causal Learning [6.212955085775758]
マルチパーティの対話は、技術や非技術トピックに関する企業ソーシャルメディアで一般的である。
対立分析の観点から、なぜ対話が特定の感情で終わるのかを分析することが重要である。
解析のための説明可能な時系列マイニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-05-03T15:18:53Z) - Vocabulary-based Method for Quantifying Controversy in Social Media [0.0]
本研究では,ソーシャルメディアのコミュニティで主に使用されているジャーゴンに基づく論争検出手法を開発した。
本手法はドメイン固有知識の使用を不要とし,言語に依存しない,効率的で,適用が容易な手法である。
論文 参考訳(メタデータ) (2020-01-14T17:43:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。