論文の概要: Limiting Tags Fosters Efficiency
- arxiv url: http://arxiv.org/abs/2104.01028v1
- Date: Fri, 2 Apr 2021 12:58:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 19:49:42.997675
- Title: Limiting Tags Fosters Efficiency
- Title(参考訳): 制限タグは効率を高める
- Authors: Tiago Santos, Keith Burghardt, Kristina Lerman, Denis Helic
- Abstract要約: 情報理論を用いてStack Overflow上のタグの記述と検索の効率を追跡する。
タグ付け効率は時間とともに安定するが,タグの内容と記述性は共に増大する。
我々の研究は、オンラインコミュニティにおける情報組織と検索を改善するための政策に関する洞察を提供する。
- 参考スコア(独自算出の注目度): 2.6143568807090696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tagging facilitates information retrieval in social media and other online
communities by allowing users to organize and describe online content.
Researchers found that the efficiency of tagging systems steadily decreases
over time, because tags become less precise in identifying specific documents,
i.e., they lose their descriptiveness. However, previous works did not answer
how or even whether community managers can improve the efficiency of tags. In
this work, we use information-theoretic measures to track the descriptive and
retrieval efficiency of tags on Stack Overflow, a question-answering system
that strictly limits the number of tags users can specify per question. We
observe that tagging efficiency stabilizes over time, while tag content and
descriptiveness both increase. To explain this observation, we hypothesize that
limiting the number of tags fosters novelty and diversity in tag usage, two
properties which are both beneficial for tagging efficiency. To provide
qualitative evidence supporting our hypothesis, we present a statistical model
of tagging that demonstrates how novelty and diversity lead to greater tag
efficiency in the long run. Our work offers insights into policies to improve
information organization and retrieval in online communities.
- Abstract(参考訳): タグ付けは、ユーザーがオンラインコンテンツを整理し記述できるようにすることで、ソーシャルメディアや他のオンラインコミュニティにおける情報検索を促進する。
研究者らは、タグが特定の文書、すなわち記述性の欠如を識別する精度が低下するため、タグシステムの効率は時間とともに着実に低下することを発見した。
しかし、以前の作業では、コミュニティマネージャがタグの効率を向上できるか、あるいは改善できるかは答えられなかった。
本研究では,ユーザが質問毎に指定できるタグの数を厳密に制限する質問応答システムstack overflow上で,タグの記述と検索効率を追跡するために情報理論的な手法を用いる。
タグ付け効率は時間とともに安定し,タグの内容も記述性も増大する。
そこで本研究では,タグ数を制限することにより,タグ利用の新規性と多様性が促進されるという仮説を立てた。
この仮説を裏付ける定性的な証拠を提供するために, タグの統計的モデルを提示し, 長期的には新規性と多様性がタグ効率を向上させることを示す。
我々の研究は、オンラインコミュニティにおける情報組織と検索を改善するための政策に関する洞察を提供する。
関連論文リスト
- Using a negative spatial auto-correlation index to evaluate and improve intrinsic TagMap's multi-scale visualization capabilities [1.829179623372777]
タグマップの既存の方法論は、主に特定のスケールでのタグレイアウトに焦点を当てている。
負の空間自己相関指数をタグマップに組み込んで,タグサイズ分布の均一性を評価する。
この強化には、候補タグを反復的にフィルタリングし、定義されたインデックス基準を満たす最適なタグを選択することが含まれる。
論文 参考訳(メタデータ) (2024-08-08T08:52:27Z) - Modeling Tag Prediction based on Question Tagging Behavior Analysis of
CommunityQA Platform Users [10.816557776555078]
我々は、各質問に対して人気のあるタグとより粒度の細かいタグの両方を予測するフレキシブルなニューラルタグ予測アーキテクチャを開発する。
実験結果と得られた性能から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2023-07-04T01:24:26Z) - Cross Encoding as Augmentation: Towards Effective Educational Text
Classification [9.786833703453741]
本稿では,教育用テキスト分類における効果的な学習を支援する新しい検索手法CEAAを提案する。
主な貢献は次の通りである: 1) 質問応答データセットからの移動学習を活用し、2) 単純だが効果的なデータ拡張法を提案する。
論文 参考訳(メタデータ) (2023-05-30T12:19:30Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Graph-Based Recommendation System Enhanced with Community Detection [7.436429318051602]
ユーザーのタグを調べることで、興味を持ち、レコメンデーションの精度を高めることができる。
ユーザ定義タグは自由かつ制限なく選択されるため、タグの正確な意味と類似性を決定する際に問題が発生する。
本稿では,語彙類似性と共起タグの解を求めるために,数学的および統計的手法を用いる。
論文 参考訳(メタデータ) (2022-01-10T20:08:40Z) - Exploiting Context for Robustness to Label Noise in Active Learning [47.341705184013804]
本稿では,どのラベルが間違っているのかをシステムがどのように識別するか,ラベルノイズの負の影響を最小限に抑えるために,マルチクラスアクティブラーニングシステムをどのように適用できるか,といった課題に対処する。
我々は、これらの関係を符号化し、ノイズラベルが利用できる場合にグラフ上の新しい信念を得るために、ラベルなしデータのグラフィカルな表現を構築した。
これはシーン分類、アクティビティ分類、文書分類の3つの異なる応用で実証されている。
論文 参考訳(メタデータ) (2020-10-18T18:59:44Z) - Adaptive Self-training for Few-shot Neural Sequence Labeling [55.43109437200101]
ニューラルシークエンスラベリングモデルにおけるラベル不足問題に対処する手法を開発した。
自己学習は、大量のラベルのないデータから学ぶための効果的なメカニズムとして機能する。
メタラーニングは、適応的なサンプル再重み付けにおいて、ノイズのある擬似ラベルからのエラー伝播を軽減するのに役立つ。
論文 参考訳(メタデータ) (2020-10-07T22:29:05Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z) - Adversarial Learning for Personalized Tag Recommendation [61.76193196463919]
大規模データセットでトレーニング可能なエンドツーエンドのディープネットワークを提案する。
ユーザの嗜好と視覚的エンコーディングの合同トレーニングにより、ネットワークは視覚的嗜好をタグ付け行動と効率的に統合することができる。
本稿では,提案モデルの有効性を2つの大規模および公開データセットで示す。
論文 参考訳(メタデータ) (2020-04-01T20:41:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。