論文の概要: Automatic Construction of Multiple Classification Dimensions for Managing Approaches in Scientific Papers
- arxiv url: http://arxiv.org/abs/2505.23252v1
- Date: Thu, 29 May 2025 08:57:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.771777
- Title: Automatic Construction of Multiple Classification Dimensions for Managing Approaches in Scientific Papers
- Title(参考訳): 科学論文管理のための複数分類次元の自動構築
- Authors: Bing Ma, Hai Zhuge,
- Abstract要約: 本稿では、トップダウン方式を用いてアプローチパターンを特定し、4つの異なる言語レベルを通してパターンを精査する。
科学的論文のアプローチは、アプローチパターンに基づいて抽出される。
これらのパターンを用いて、アプローチを分類する5つの次元を同定する。
- 参考スコア(独自算出の注目度): 2.790757012827162
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Approaches form the foundation for conducting scientific research. Querying approaches from a vast body of scientific papers is extremely time-consuming, and without a well-organized management framework, researchers may face significant challenges in querying and utilizing relevant approaches. Constructing multiple dimensions on approaches and managing them from these dimensions can provide an efficient solution. Firstly, this paper identifies approach patterns using a top-down way, refining the patterns through four distinct linguistic levels: semantic level, discourse level, syntactic level, and lexical level. Approaches in scientific papers are extracted based on approach patterns. Additionally, five dimensions for categorizing approaches are identified using these patterns. This paper proposes using tree structure to represent step and measuring the similarity between different steps with a tree-structure-based similarity measure that focuses on syntactic-level similarities. A collection similarity measure is proposed to compute the similarity between approaches. A bottom-up clustering algorithm is proposed to construct class trees for approach components within each dimension by merging each approach component or class with its most similar approach component or class in each iteration. The class labels generated during the clustering process indicate the common semantics of the step components within the approach components in each class and are used to manage the approaches within the class. The class trees of the five dimensions collectively form a multi-dimensional approach space. The application of approach queries on the multi-dimensional approach space demonstrates that querying within this space ensures strong relevance between user queries and results and rapidly reduces search space through a class-based query mechanism.
- Abstract(参考訳): 科学的研究の根幹を成す。
大量の科学論文からアプローチをクエリするのは非常に時間がかかり、十分に組織化された管理フレームワークがなければ、研究者は関連するアプローチのクエリと利用において重大な課題に直面する可能性がある。
アプローチ上の複数の次元を構築し、これらの次元からそれらを管理すれば、効率的なソリューションが得られます。
まず、トップダウン方式を用いて、意味レベル、談話レベル、構文レベル、語彙レベルという4つの異なる言語レベルを通してパターンを精製するアプローチパターンを同定する。
科学的論文のアプローチは、アプローチパターンに基づいて抽出される。
さらに、これらのパターンを用いてアプローチを分類する5つの次元を同定する。
本稿では,ステップの表現に木構造を用い,異なるステップ間の類似度を,構文レベルの類似度に着目した木構造に基づく類似度尺度を用いて測定する。
アプローチ間の類似性を計算するために,コレクション類似度尺度を提案する。
ボトムアップクラスタリングアルゴリズムは、各イテレーションにおいて、各アプローチコンポーネントまたはクラスに最もよく似たアプローチコンポーネントまたはクラスをマージすることにより、各次元内のアプローチコンポーネントのためのクラスツリーを構築する。
クラスタリングプロセスで生成されたクラスラベルは、各クラスのアプローチコンポーネント内のステップコンポーネントの共通セマンティクスを示し、クラス内のアプローチを管理するために使用される。
5次元の類木は集合的に多次元アプローチ空間を形成する。
多次元のアプローチ空間におけるアプローチクエリの適用により、この領域におけるクエリは、ユーザクエリと結果の強い関連性を確保し、クラスベースのクエリ機構による検索スペースの高速化を図っている。
関連論文リスト
- Semantic Correspondence: Unified Benchmarking and a Strong Baseline [14.012377730820342]
本研究は,意味対応手法の大規模調査である。
我々は、様々なベンチマークの文献におけるメソッドの結果を統合比較表に集約し、要約する。
複数のベンチマークで最先端のパフォーマンスを実現するための,シンプルで効果的なベースラインを提案する。
論文 参考訳(メタデータ) (2025-05-23T16:07:16Z) - Towards a Unified View of Preference Learning for Large Language Models: A Survey [88.66719962576005]
大きな言語モデル(LLM)は、非常に強力な能力を示す。
成功するための重要な要因の1つは、LLMの出力を人間の好みに合わせることである。
選好学習のすべての戦略を、モデル、データ、フィードバック、アルゴリズムの4つの構成要素に分解する。
論文 参考訳(メタデータ) (2024-09-04T15:11:55Z) - Ontology Matching Through Absolute Orientation of Embedding Spaces [1.5169370091868053]
Ontologyは、インターオペラビリティとリンクされたオープンデータセットを作成する際の中核的なタスクである。
本稿では,知識グラフの埋め込みに基づく構造に基づくマッピング手法を提案する。
合成データを用いた実験では、このアプローチが同様に構造化されたデータセットで非常にうまく機能することがわかった。
論文 参考訳(メタデータ) (2022-04-08T12:59:31Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Leveraging Class Hierarchies with Metric-Guided Prototype Learning [5.070542698701158]
多くの分類タスクでは、ターゲットクラスのセットは階層に分類できる。
この構造はクラス間の意味的距離を誘導し、コスト行列の形で要約することができる。
本稿では,この指標を原型ネットワークの監視に組み込むことにより,階層型クラス構造をモデル化することを提案する。
論文 参考訳(メタデータ) (2020-07-06T20:22:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。