論文の概要: AutoSUM: Automating Feature Extraction and Multi-user Preference
Simulation for Entity Summarization
- arxiv url: http://arxiv.org/abs/2005.11888v1
- Date: Mon, 25 May 2020 02:20:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 06:12:51.279203
- Title: AutoSUM: Automating Feature Extraction and Multi-user Preference
Simulation for Entity Summarization
- Title(参考訳): AutoSUM:エンティティ要約のための特徴抽出とマルチユーザ予測シミュレーション
- Authors: Dongjun Wei and Yaxin Liu and Fuqing Zhu and Liangjun Zang and Wei
Zhou and Yijun Lu and Songlin Hu
- Abstract要約: 自動特徴抽出とマルチユーザ選好シミュレーションのためにAutoSUMを提案する。
広く使われている2つのデータセット上で、最先端のパフォーマンスを生成する。
- 参考スコア(独自算出の注目度): 24.005308273174755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Withthegrowthofknowledgegraphs, entity descriptions are becoming extremely
lengthy. Entity summarization task, aiming to generate diverse, comprehensive,
and representative summaries for entities, has received increasing interest
recently. In most previous methods, features are usually extracted by the
handcrafted templates. Then the feature selection and multi-user preference
simulation take place, depending too much on human expertise. In this paper, a
novel integration method called AutoSUM is proposed for automatic feature
extraction and multi-user preference simulation to overcome the drawbacks of
previous methods. There are two modules in AutoSUM: extractor and simulator.
The extractor module operates automatic feature extraction based on a BiLSTM
with a combined input representation including word embeddings and graph
embeddings. Meanwhile, the simulator module automates multi-user preference
simulation based on a well-designed two-phase attention mechanism (i.e.,
entity-phase attention and user-phase attention). Experimental results
demonstrate that AutoSUM produces state-of-the-art performance on two widely
used datasets (i.e., DBpedia and LinkedMDB) in both F-measure and MAP.
- Abstract(参考訳): the growthofknowledgegraphsでは、エンティティの記述が非常に長くなっています。
エンティティの多様性,包括性,代表的要約の生成を目的としたエンティティ要約タスクが最近,注目を集めている。
これまでのほとんどの方法では、特徴は通常手作りテンプレートによって抽出される。
そして、機能選択とマルチユーザー選好のシミュレーションが行われ、人間の専門知識に大きく依存する。
本稿では,先行手法の欠点を克服するために,自動特徴抽出とマルチユーザ嗜好シミュレーションのためのautosumと呼ばれる新しい統合手法を提案する。
AutoSUMには抽出器とシミュレータの2つのモジュールがある。
抽出モジュールは、単語埋め込みとグラフ埋め込みを含む入力表現を組み合わせたBiLSTMに基づく自動特徴抽出を実行する。
一方、シミュレータモジュールは、よく設計された二相注意機構(すなわち、エンティティフェーズ注意とユーザフェーズ注意)に基づいて、マルチユーザ嗜好シミュレーションを自動化する。
実験の結果、AutoSUMはF測定とMAPの両方で広く使われている2つのデータセット(DBpediaとLinkedMDB)上で、最先端のパフォーマンスを実現することがわかった。
関連論文リスト
- AUTOACT: Automatic Agent Learning from Scratch via Self-Planning [56.81725335882185]
AutoActは、大規模アノテートデータやクローズドソースモデルからの合成軌跡に依存しない自動エージェント学習フレームワークである。
我々は異なるLLMを用いて総合的な実験を行い、AutoActは様々な強力なベースラインと比較して優れた性能または並列性能が得られることを示した。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - Automatic Componentwise Boosting: An Interpretable AutoML System [1.1709030738577393]
本稿では,高度にスケーラブルなコンポーネントワイドブースティングアルゴリズムを用いて適用可能な,解釈可能な付加モデルを構築するAutoMLシステムを提案する。
我々のシステムは、部分的な効果やペアの相互作用を可視化するなど、簡単なモデル解釈のためのツールを提供する。
解釈可能なモデル空間に制限があるにもかかわらず、我々のシステムは、ほとんどのデータセットにおける予測性能の点で競争力がある。
論文 参考訳(メタデータ) (2021-09-12T18:34:33Z) - Document-level Entity-based Extraction as Template Generation [13.110360825201044]
本稿では2つの文書レベルEEタスクのための生成フレームワークを提案する: 役割充足者エンティティ抽出(REE)と関係抽出(RE)である。
まず、テンプレート生成問題として定式化し、モデルが依存性を効率的にキャプチャできるようにする。
キー情報の識別能力を高めるために、新しいクロスアテンションガイド付きコピー機構であるTopK Copyを事前訓練されたシーケンス・ツー・シーケンスモデルに組み込む。
論文 参考訳(メタデータ) (2021-09-10T14:18:22Z) - Multimodal End-to-End Sparse Model for Emotion Recognition [40.71488291980002]
2つのフェーズを繋ぐ完全エンドツーエンドのモデルを開発し、それらを共同で最適化します。
また、エンドツーエンドのトレーニングを可能にするために、現在のデータセットを再構成します。
実験結果から,我々の完全エンドツーエンドモデルは現在の最先端モデルを大きく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-03-17T14:05:05Z) - Data Augmentation for Abstractive Query-Focused Multi-Document
Summarization [129.96147867496205]
2つのQMDSトレーニングデータセットを提示し,2つのデータ拡張手法を用いて構築する。
これらの2つのデータセットは相補的な性質を持ち、すなわちQMDSCNNは実際のサマリを持つが、クエリはシミュレートされる。
組み合わせたデータセット上にエンドツーエンドのニューラルネットワークモデルを構築し、DUCデータセットに最新の転送結果をもたらします。
論文 参考訳(メタデータ) (2021-03-02T16:57:01Z) - AutoDis: Automatic Discretization for Embedding Numerical Features in
CTR Prediction [45.69943728028556]
高度な機能相互作用の学習は、レコメンデータシステムにおけるClick-Through Rate(CTR)予測に不可欠である。
様々な深いCTRモデルは、埋め込みとフィーチャーインタラクションのパラダイムに従います。
数値フィールドの特徴を自動的に識別し、エンドツーエンドでCTRモデルに最適化するフレームワークであるAutoDisを提案します。
論文 参考訳(メタデータ) (2020-12-16T14:31:31Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Fast, Accurate, and Simple Models for Tabular Data via Augmented
Distillation [97.42894942391575]
本研究では、FAST-DADを用いて、任意の複雑なアンサンブル予測を、高木、無作為林、深層ネットワークなどの個々のモデルに抽出する。
我々の個々の蒸留モデルは、H2O/AutoSklearnのようなAutoMLツールが生成するアンサンブル予測よりも10倍高速で精度が高い。
論文 参考訳(メタデータ) (2020-06-25T09:57:47Z) - AutoFIS: Automatic Feature Interaction Selection in Factorization Models
for Click-Through Rate Prediction [75.16836697734995]
自動特徴相互作用選択(AutoFIS)と呼ばれる2段階のアルゴリズムを提案する。
AutoFISは、目標モデルを収束させるためにトレーニングするのと同等の計算コストで、因子化モデルに対する重要な特徴的相互作用を自動的に識別することができる。
AutoFISはHuawei App Storeレコメンデーションサービスのトレーニングプラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2020-03-25T06:53:54Z) - ARDA: Automatic Relational Data Augmentation for Machine Learning [23.570173866941612]
本稿では,データセットとデータレポジトリを入力とし,拡張データセットを出力するエンド・ツー・エンドシステムを提案する。
本システムは,(1)入力の様々な属性に基づいて,入力データとデータを検索し結合するフレームワークと,(2)入力データからノイズや不適切な特徴を抽出する効率的な特徴選択アルゴリズムの2つの特徴を有する。
論文 参考訳(メタデータ) (2020-03-21T21:55:22Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。