論文の概要: Classification of Consumer Belief Statements From Social Media
- arxiv url: http://arxiv.org/abs/2106.15498v2
- Date: Mon, 24 Jul 2023 20:08:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 22:10:57.291620
- Title: Classification of Consumer Belief Statements From Social Media
- Title(参考訳): ソーシャルメディアからの消費者信念文の分類
- Authors: Gerhard Johann Hagerer and Wenbin Le and Hannah Danner and Georg Groh
- Abstract要約: 複雑な専門家アノテーションがいかにして分類に有効に活用できるかを考察する。
自動クラス抽象化アプローチは、テキスト分類タスクのドメインエキスパートベースラインに対して極めてよく機能することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social media offer plenty of information to perform market research in order
to meet the requirements of customers. One way how this research is conducted
is that a domain expert gathers and categorizes user-generated content into a
complex and fine-grained class structure. In many of such cases, little data
meets complex annotations. It is not yet fully understood how this can be
leveraged successfully for classification. We examine the classification
accuracy of expert labels when used with a) many fine-grained classes and b)
few abstract classes. For scenario b) we compare abstract class labels given by
the domain expert as baseline and by automatic hierarchical clustering. We
compare this to another baseline where the entire class structure is given by a
completely unsupervised clustering approach. By doing so, this work can serve
as an example of how complex expert annotations are potentially beneficial and
can be utilized in the most optimal way for opinion mining in highly specific
domains. By exploring across a range of techniques and experiments, we find
that automated class abstraction approaches in particular the unsupervised
approach performs remarkably well against domain expert baseline on text
classification tasks. This has the potential to inspire opinion mining
applications in order to support market researchers in practice and to inspire
fine-grained automated content analysis on a large scale.
- Abstract(参考訳): ソーシャルメディアは、顧客の要求を満たすために市場調査を行うための多くの情報を提供している。
この研究の方法の1つは、ドメインの専門家がユーザ生成したコンテンツを複雑できめ細かいクラス構造にまとめて分類することです。
そのような場合、ほとんどデータが複雑なアノテーションを満たさない。
分類にどのように活用できるかは、まだ完全には分かっていない。
専門家ラベルを用いた分類精度について検討する。
a)多くのきめ細かいクラスと
b) 抽象クラスが少ない。
シナリオとして
b) ドメインエキスパートによる抽象クラスラベルをベースラインとして、および自動階層クラスタリングによって比較する。
これを、クラス構造全体が完全に教師なしのクラスタリングアプローチによって与えられる別のベースラインと比較する。
そうすることで、この研究は、専門家のアノテーションがいかに複雑で有益であるかの例となり、非常に特定のドメインにおける意見マイニングにおいて最も最適な方法で利用することができる。
様々な技術や実験を探索することにより、自動化されたクラス抽象化アプローチ、特に教師なしアプローチが、テキスト分類タスクのドメインエキスパートベースラインに対して著しく優れていることが分かる。
これは、市場研究者を実際に支援し、大規模できめ細かい自動コンテンツ分析を刺激するために、意見マイニングアプリケーションを促進する可能性がある。
関連論文リスト
- SelEx: Self-Expertise in Fine-Grained Generalized Category Discovery [55.72840638180451]
Generalized Category Discoveryは、新しいカテゴリーを同時に発見し、既知のカテゴリを正確に分類することを目的としている。
自己超越と対照的な学習に強く依存する伝統的な手法は、細かなカテゴリーを区別する場合にしばしば不足する。
モデルが微妙な違いを認識し、未知のカテゴリを明らかにする能力を高める。
論文 参考訳(メタデータ) (2024-08-26T15:53:50Z) - Hierarchical Query Classification in E-commerce Search [38.67034103433015]
電子商取引プラットフォームは通常、製品情報と検索データを階層構造に保存し、構造化する。
ユーザ検索クエリを同様の階層構造に効果的に分類することは,eコマースプラットフォーム上でのユーザエクスペリエンスの向上,ニュースキュレーションや学術研究において最重要である。
階層的問合せ分類の本質的な複雑さは,(1)支配的カテゴリに傾倒する顕著なクラス不均衡,(2)正確な分類を妨げる検索クエリの本質的簡潔さとあいまいさの2つの課題によって複雑化されている。
論文 参考訳(メタデータ) (2024-03-09T21:55:55Z) - Harnessing the Power of Beta Scoring in Deep Active Learning for
Multi-Label Text Classification [6.662167018900634]
本研究は,期待損失削減フレームワーク内の適切なスコアリングルールのベータファミリを活かした,新たなアクティブな学習戦略を提案する。
これはBeta Scoring Rulesを使って期待されるスコアの増加を計算し、次にサンプルベクトル表現に変換する。
合成データセットと実データセットの総合的な評価により,複数ラベルのテキスト分類において,確立された取得技術を上回る性能が得られた。
論文 参考訳(メタデータ) (2024-01-15T00:06:24Z) - ExpNet: A unified network for Expert-Level Classification [40.109357254623085]
本稿では,エキスパートレベル分類におけるユニークな課題に,統一ネットワークを通じて対処する専門家ネットワーク(ExpNet)を提案する。
ExpNetでは、部分とコンテキストの特徴を階層的に分離し、Gaze-Shiftと呼ばれる新しい注意機構を使って個別に処理します。
本研究は、FGVC、疾患分類、アートワーク属性分類の3つの代表的な専門家レベル分類タスクについて、実験を行った。
論文 参考訳(メタデータ) (2022-11-29T12:20:25Z) - Providing Insights for Open-Response Surveys via End-to-End
Context-Aware Clustering [2.6094411360258185]
本研究では,オープンレスポンスサーベイデータ中の組込み意味パターンを抽出し,集約し,省略する,エンド・ツー・エンドのコンテキスト認識フレームワークを提案する。
我々のフレームワークは、テキストデータを意味ベクトルにエンコードするために、事前訓練された自然言語モデルに依存している。
本フレームワークは,調査データから最も洞察に富んだ情報を抽出するプロセスを自動化することで,大規模化のコストを削減する。
論文 参考訳(メタデータ) (2022-03-02T18:24:10Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Learning a Domain Classifier Bank for Unsupervised Adaptive Object
Detection [48.19258721979389]
本稿では,ディープネットワークに基づく物体検出のための細粒度領域アライメント手法を提案する。
そこで我々は,適応検出器として細粒度領域アライメント機構を備えた素物体検出器を開発した。
3つの一般的な転送ベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-07-06T09:12:46Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z) - Exploring Category-Agnostic Clusters for Open-Set Domain Adaptation [138.29273453811945]
本稿では、カテゴリ非依存クラスタ(SE-CC)を対象ドメインのカテゴリ非依存クラスタと組み合わせた、新たなアーキテクチャを提案する。
クラスタリングは、対象ドメイン特有の基盤となるデータ空間構造を明らかにするカテゴリ非依存クラスタを得るために、ラベルなしのターゲットサンプルすべてにわたって実行される。
論文 参考訳(メタデータ) (2020-06-11T16:19:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。