論文の概要: Business Entity Entropy
- arxiv url: http://arxiv.org/abs/2504.07106v1
- Date: Sun, 16 Mar 2025 18:48:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-13 07:22:37.452157
- Title: Business Entity Entropy
- Title(参考訳): ビジネスエンティティのエントロピー
- Authors: Adam McCabe, Matthew H. Chequers,
- Abstract要約: 大規模企業コーパスの実証分析により, エントロピー分布の重みが明らかになった。
本稿では,文書間でのエンティティの知識の分布を定量化するために,エンティティエントロピーの尺度を提案する。
より効率的な知識検索システムの設計を導くための実践的含意と理論モデルについて議論する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Organizations generate vast amounts of interconnected content across various platforms. While language models enable sophisticated reasoning for use in business applications, retrieving and contextualizing information from organizational memory remains challenging. We explore this challenge through the lens of entropy, proposing a measure of entity entropy to quantify the distribution of an entity's knowledge across documents as well as a novel generative model inspired by diffusion models in order to provide an explanation for observed behaviours. Empirical analysis on a large-scale enterprise corpus reveals heavy-tailed entropy distributions, a correlation between entity size and entropy, and category-specific entropy patterns. These findings suggest that not all entities are equally retrievable, motivating the need for entity-centric retrieval or pre-processing strategies for a subset of, but not all, entities. We discuss practical implications and theoretical models to guide the design of more efficient knowledge retrieval systems.
- Abstract(参考訳): 組織は様々なプラットフォームにまたがって大量の相互接続コンテンツを生成します。
言語モデルはビジネスアプリケーションで使用するための洗練された推論を可能にするが、組織記憶から情報を検索し、コンテキスト化することは依然として困難である。
エントロピーのレンズを通してこの課題を探求し、実体のエントロピーの尺度を提案し、文書間でのエンティティの知識の分布を定量化し、また、観察された振る舞いを説明するために拡散モデルにインスパイアされた新しい生成モデルを提案する。
大規模エンタープライズコーパスにおける実証分析により, エントロピー分布, 実体サイズとエントロピーの相関, カテゴリー固有のエントロピーパターンが明らかになった。
これらの結果は、全てのエンティティが等しく検索可能であるわけではないことを示唆し、すべてのエンティティのサブセットに対して、エンティティ中心の検索や前処理戦略の必要性を動機付けている。
より効率的な知識検索システムの設計を導くための実践的含意と理論モデルについて議論する。
関連論文リスト
- Dynamic Feature Fusion: Combining Global Graph Structures and Local Semantics for Blockchain Fraud Detection [0.7510165488300369]
本稿では,グラフに基づく表現学習と意味的特徴抽出を組み合わせた動的特徴融合モデルを提案する。
我々は,グラフ構築,時間的特徴強調,テキスト前処理を含む包括的データ処理パイプラインを開発する。
大規模な実世界のブロックチェーンデータセットの実験結果は、我々の手法が既存のベンチマークを精度、F1スコア、リコールメトリクスで上回っていることを示している。
論文 参考訳(メタデータ) (2025-01-03T09:04:43Z) - Learning Discrete Concepts in Latent Hierarchical Models [73.01229236386148]
自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。
我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。
我々は、理論的な主張を合成データ実験で裏付ける。
論文 参考訳(メタデータ) (2024-06-01T18:01:03Z) - Tokenization, Fusion, and Augmentation: Towards Fine-grained Multi-modal Entity Representation [51.80447197290866]
マルチモーダル知識グラフ補完(MMKGC)は、与えられた知識グラフから観測されていない知識を発見することを目的としている。
既存のMMKGCメソッドは通常、事前訓練されたモデルでマルチモーダルな特徴を抽出する。
エンティティの微細なマルチモーダル表現をトークン化し、融合し、拡張する新しいフレームワークであるMyGOを紹介します。
論文 参考訳(メタデータ) (2024-04-15T05:40:41Z) - Corpus Considerations for Annotator Modeling and Scaling [9.263562546969695]
一般的に使われているユーザトークンモデルは、より複雑なモデルよりも一貫して優れています。
以上の結果から,コーパス統計とアノテータモデリング性能の関係が明らかになった。
論文 参考訳(メタデータ) (2024-04-02T22:27:24Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Exploring the Trade-off between Plausibility, Change Intensity and
Adversarial Power in Counterfactual Explanations using Multi-objective
Optimization [73.89239820192894]
自動対物生成は、生成した対物インスタンスのいくつかの側面を考慮すべきである。
本稿では, 対実例生成のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-20T15:02:53Z) - End-to-End Hierarchical Relation Extraction for Generic Form
Understanding [0.6299766708197884]
本稿では,エンティティ検出とリンク予測を併用する新しいディープニューラルネットワークを提案する。
本モデルでは,複数段階の意図的U-Netアーキテクチャを拡張し,リンク予測のための部分強度場と部分連想場を拡張した。
本稿では,ノイズの多い文書データセットの形式理解におけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2021-06-02T06:51:35Z) - Extracting Semantic Concepts and Relations from Scientific Publications
by Using Deep Learning [0.0]
本研究の目的は,学術出版物から意味概念と関係を自動的に抽出する提案を行うことである。
本稿では,意味関係の新たなタイプを提案するとともに,意味関係抽出に深層学習(DL)モデルを用いる点を指摘する。
論文 参考訳(メタデータ) (2020-09-01T10:19:18Z) - Generalization Properties of Optimal Transport GANs with Latent
Distribution Learning [52.25145141639159]
本研究では,潜伏分布とプッシュフォワードマップの複雑さの相互作用が性能に与える影響について検討する。
我々の分析に感銘を受けて、我々はGANパラダイム内での潜伏分布とプッシュフォワードマップの学習を提唱した。
論文 参考訳(メタデータ) (2020-07-29T07:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。