論文の概要: Fine-Tuning Topics through Weighting Aspect Keywords
- arxiv url: http://arxiv.org/abs/2502.08496v2
- Date: Thu, 28 Aug 2025 03:17:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 13:55:30.837761
- Title: Fine-Tuning Topics through Weighting Aspect Keywords
- Title(参考訳): アスペクトキーワードの重み付けによる微調整
- Authors: Ali Nazari, Michael Weiss,
- Abstract要約: 従来のトピックモデリング技術は通常静的で教師なしであり、量子暗号のような急速に進化する分野には適さない。
我々は、専門家インフォームドインプットに基づくアスペクトの重み付けによりトピックモデリングを強化するフレームワークを作成するために、デザインサイエンス研究方法論を採用している。
本研究は、専門家が指導するアスペクト重み付きトピックモデリングが解釈可能性と適応性を高めることを示す。
- 参考スコア(独自算出の注目度): 0.8665758002017515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Organizations face growing challenges in deriving meaningful insights from vast amounts of specialized text data. Conventional topic modeling techniques are typically static and unsupervised, making them ill-suited for fast-evolving fields like quantum cryptography. These models lack contextual awareness and cannot easily incorporate emerging expert knowledge or subtle shifts in subdomains. Moreover, they often overlook rare but meaningful terms, limiting their ability to surface early signals or align with expert-driven insights essential for strategic understanding. To tackle these gaps, we employ design science research methodology to create a framework that enhances topic modeling by weighting aspects based on expert-informed input. It combines expert-curated keywords with topic distributions iteratively to improve topic relevance and document alignment accuracy in specialized research areas. The framework comprises four phases, including (1) initial topic modeling, (2) expert aspect definition, (3) supervised document alignment using cosine similarity, and (4) iterative refinement until convergence. Applied to quantum communication research, this method improved the visibility of critical but low-frequency terms. It also enhanced topic coherence and aligned topics with the cryptographic priorities identified by experts. Compared to the baseline model, this framework increased intra-cluster similarity. It reclassified a substantial portion of documents into more thematically accurate clusters. Evaluating QCrypt 2023 and 2024 conference papers showed that the model adapts well to changing discussions, marking a shift from theoretical foundations to implementation challenges. This study illustrates that expert-guided, aspect-weighted topic modeling boosts interpretability and adaptability.
- Abstract(参考訳): 組織は、大量の専門的なテキストデータから有意義な洞察を得る上で、ますます難しい課題に直面しています。
従来のトピックモデリング技術は通常静的で教師なしであり、量子暗号のような急速に進化する分野には適さない。
これらのモデルは文脈認識に欠けており、新たな専門家の知識や微妙な変化をサブドメインに組み込むことはできない。
さらに、彼らはしばしば稀だが意味のある言葉を見落とし、初期のシグナルを表面化したり、戦略的理解に不可欠な専門家主導の洞察と整合する能力を制限する。
これらのギャップに対処するために,我々は,専門家インフォームドインプットに基づくアスペクトの重み付けによりトピックモデリングを強化するフレームワークを構築するために,デザインサイエンス研究手法を採用している。
専門研究分野のトピック関連性や文書のアライメント精度を向上させるため、専門家によるキーワードとトピック分布を反復的に組み合わせる。
本フレームワークは,(1)初期トピックモデリング,(2)専門家のアスペクト定義,(3)コサイン類似性を用いたドキュメントアライメント,(4)収束までの反復的洗練の4段階からなる。
この手法は量子通信研究に応用され、臨界項と低周波項の可視性を改善した。
また、専門家が特定した暗号的優先順位とトピックの一貫性と整合性も強化した。
ベースラインモデルと比較して、このフレームワークはクラスタ内の類似性を高めた。
これは文書のかなりの部分をより数学的に正確なクラスタに再分類した。
QCrypt 2023と2024カンファレンスの評価では、このモデルが議論の変化に順応し、理論的基礎から実装上の課題へのシフトを示している。
本研究は、専門家が指導するアスペクト重み付きトピックモデリングが解釈可能性と適応性を高めることを示す。
関連論文リスト
- Agentic Adversarial QA for Improving Domain-Specific LLMs [53.00642389531106]
大規模言語モデル(LLM)は、しばしば専門分野に効果的に対応するのに苦労する。
本稿では,意味論的課題の集合をコンパクトに生成する逆問題生成フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-20T10:53:09Z) - A Multiscale Geometric Method for Capturing Relational Topic Alignment [0.0]
解釈可能なトピックモデリングは、共同著者コミュニティ内で研究の利益がどのように進化するかを追跡するのに不可欠である。
本稿では,階層的なトピックデンドログラムを構築するために,Hellinger 距離と Ward リンクを用いたマルチモーダルテキストと共著者ネットワークデータを統合する手法を提案する。
本手法は, レアトピック構造を効果的に同定し, 時間とともにスムーズなトピックドリフトを可視化する。
論文 参考訳(メタデータ) (2025-11-21T22:45:16Z) - Exploring the Technology Landscape through Topic Modeling, Expert Involvement, and Reinforcement Learning [0.48342038441006807]
本研究では、トピックモデリング、エキスパート知識入力、強化学習(RL)を組み合わせて、技術的変化の検出を強化する手法を提案する。
結果は、専門家の入力と一致する傾向を特定し、ランク付けし、追跡する手法の有効性を示す。
論文 参考訳(メタデータ) (2025-01-22T22:18:50Z) - Prompting Large Language Models for Topic Modeling [10.31712610860913]
大規模言語モデル(LLM)の高度な言語理解を活用する新しいトピックモデリング手法であるPromptTopicを提案する。
個々の文書から文章レベルでトピックを抽出し、これらのトピックを事前定義された量に集約して凝縮し、最終的に様々な長さのテキストに対して一貫性のあるトピックを提供する。
PromptTopicを3つの非常に多様なデータセットの最先端のベースラインに対してベンチマークし、意味のあるトピックを発見する能力を確立しました。
論文 参考訳(メタデータ) (2023-12-15T11:15:05Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - TopicGPT: A Prompt-based Topic Modeling Framework [77.72072691307811]
TopicGPTは,大規模言語モデルを用いてテキストコレクション内の潜在トピックを明らかにするプロンプトベースのフレームワークである。
競合する手法と比較して、人間の分類とよく一致したトピックを生成する。
そのトピックもまた解釈可能であり、自然言語ラベルと関連する自由形式の記述を含むトピックを好んで、曖昧な言葉の袋を除いた。
論文 参考訳(メタデータ) (2023-11-02T17:57:10Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Enhance Topics Analysis based on Keywords Properties [0.0]
本稿では,最も情報性の高いトピックを選択可能なキーワード特性に基づく特異度スコアを示す。
実験では,最近の文献におけるコヒーレンススコアに基づいて,様々な要因のトピックモデリング結果を,解よりもはるかに低い情報損失で圧縮できることを示した。
論文 参考訳(メタデータ) (2022-03-09T15:10:12Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Keyword Assisted Topic Models [0.0]
少数のキーワードを提供することで,話題モデルの計測性能を大幅に向上させることができることを示す。
KeyATMは、より解釈可能な結果を提供し、文書分類性能が向上し、標準トピックモデルよりもトピックの数に敏感でない。
論文 参考訳(メタデータ) (2020-04-13T14:35:28Z) - Keyword-based Topic Modeling and Keyword Selection [21.686391911424355]
将来的な文書の収集に使用されるキーワードのサブセットを選択するキーワードベースのトピックモデルを開発する。
モデルは変分下界と勾配の最適化を用いて訓練される。
トピックモデルと組み合わせたツイートのバイラル予測を用いて,キーワードトピックモデルとベンチマークモデルを比較した。
論文 参考訳(メタデータ) (2020-01-22T03:41:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。