論文の概要: Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging
- arxiv url: http://arxiv.org/abs/2504.21474v1
- Date: Wed, 30 Apr 2025 09:52:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 19:26:24.217751
- Title: Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging
- Title(参考訳): SemEval-2025 Task 5: OntoAligner による主題タグ作成のためのライブラリレコードの調整
- Authors: Hadi Bayrami Asl Tekanlou, Jafar Razmara, Mahsa Sanaei, Mostafa Rahgouy, Hamed Babaei Giglou,
- Abstract要約: 本稿では,SemEval-2025 Task 5: Subject TaggingのためのHomaについて述べる。
GND(Gemeinsame Normdatei)分類を用いて、TIBKATの技術的記録に主題ラベルを自動的に割り当てることに焦点を当てている。
提案手法では,対象のタグ付け問題をアライメントタスクとして定式化し,意味的類似性に基づいたカテゴリにレコードをマッチングする。
- 参考スコア(独自算出の注目度): 1.2582887633807602
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper presents our system, Homa, for SemEval-2025 Task 5: Subject Tagging, which focuses on automatically assigning subject labels to technical records from TIBKAT using the Gemeinsame Normdatei (GND) taxonomy. We leverage OntoAligner, a modular ontology alignment toolkit, to address this task by integrating retrieval-augmented generation (RAG) techniques. Our approach formulates the subject tagging problem as an alignment task, where records are matched to GND categories based on semantic similarity. We evaluate OntoAligner's adaptability for subject indexing and analyze its effectiveness in handling multilingual records. Experimental results demonstrate the strengths and limitations of this method, highlighting the potential of alignment techniques for improving subject tagging in digital libraries.
- Abstract(参考訳): 本稿では,本システムであるHoma for SemEval-2025 Task 5: Subject Taggingについて述べる。
我々は,モジュール型オントロジーアライメントツールキットであるOntoAlignerを利用して,検索拡張生成(RAG)技術を統合することで,この問題に対処する。
提案手法では,主観的タグ付け問題をアライメントタスクとして定式化し,意味的類似性に基づいてレコードをGNDカテゴリにマッチングする。
OntoAlignerの主観的索引付けへの適応性を評価し,その多言語レコード処理における有効性を分析した。
実験により,本手法の長所と短所が示され,デジタル図書館における被写体タグ付け改善のためのアライメント手法の可能性が示された。
関連論文リスト
- DNB-AI-Project at SemEval-2025 Task 5: An LLM-Ensemble Approach for Automated Subject Indexing [0.0]
我々のシステムは、知的注釈付きレコードの様々な例でLLMの選択を促すことに依存している。
生成したキーワードをターゲット語彙にマップし、結果の主題語をアンサンブル投票に集約し、レコードとの関連性についてランク付けする。
本システムは,全対象トラックにおける定量的ランキングでは4位であるが,主観的索引付けの専門家による質的ランキングでは最もよい結果が得られた。
論文 参考訳(メタデータ) (2025-04-30T12:47:09Z) - TartuNLP at SemEval-2025 Task 5: Subject Tagging as Two-Stage Information Retrieval [0.21485350418225246]
我々はSemEval-2025のタスク5に提出する。
本課題は,図書館の図書館記録に被写体タグを割り当てる際の図書館員の支援を目的として,当該文書に関連性のあるタグのリストを作成することである。
2種類のエンコーダモデルを用いて2段階情報検索システムを構築する。
論文 参考訳(メタデータ) (2025-04-30T11:44:08Z) - Annif at SemEval-2025 Task 5: Traditional XMTC augmented by LLMs [0.0]
本稿では,SemEval-2025タスク5(LLM)におけるAnnifシステムについて述べる。
大規模言語モデルを用いた主観的索引付けに重点を置いている。
我々のアプローチは、従来の自然言語処理と機械学習技術を組み合わせています。
論文 参考訳(メタデータ) (2025-04-28T11:04:23Z) - The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - HiGen: Hierarchy-Aware Sequence Generation for Hierarchical Text
Classification [19.12354692458442]
階層的テキスト分類 (HTC) は、マルチラベルテキスト分類における複雑なサブタスクである。
動的テキスト表現を符号化する言語モデルを利用したテキスト生成フレームワークHiGenを提案する。
論文 参考訳(メタデータ) (2024-01-24T04:44:42Z) - Association Graph Learning for Multi-Task Classification with Category
Shifts [68.58829338426712]
関連する分類タスクが同じラベル空間を共有し、同時に学習されるマルチタスク分類に焦点を当てる。
我々は、不足クラスのためのタスク間で知識を伝達する関連グラフを学習する。
我々の手法は代表的基準よりも一貫して性能が良い。
論文 参考訳(メタデータ) (2022-10-10T12:37:41Z) - TagRec++: Hierarchical Label Aware Attention Network for Question
Categorization [0.3683202928838613]
オンライン学習システムは、階層的な性質の明確に定義された分類に従ってコンテンツを整理する。
階層ラベルへの入力を分類するタスクは通常、フラットな多クラス分類問題として扱われる。
各コンテンツに対して適切な階層ラベルを検索するために,タスクを高密度検索問題として定式化する。
論文 参考訳(メタデータ) (2022-08-10T05:08:37Z) - Your Classifier can Secretly Suffice Multi-Source Domain Adaptation [72.47706604261992]
マルチソースドメイン適応(MSDA)は、複数のラベル付きソースドメインからラベルなしターゲットドメインへのタスク知識の転送を扱う。
ラベル管理下のドメインを暗黙的に整列させる深層モデルが観察されるMSDAに対して、異なる視点を提示する。
論文 参考訳(メタデータ) (2021-03-20T12:44:13Z) - Multitask Learning for Class-Imbalanced Discourse Classification [74.41900374452472]
マルチタスクアプローチは,現在のベンチマークで7%のマイクロf1コアを改善できることを示す。
また,NLPにおける資源不足問題に対処するための追加手法の比較検討を行った。
論文 参考訳(メタデータ) (2021-01-02T07:13:41Z) - Adaptive Self-training for Few-shot Neural Sequence Labeling [55.43109437200101]
ニューラルシークエンスラベリングモデルにおけるラベル不足問題に対処する手法を開発した。
自己学習は、大量のラベルのないデータから学ぶための効果的なメカニズムとして機能する。
メタラーニングは、適応的なサンプル再重み付けにおいて、ノイズのある擬似ラベルからのエラー伝播を軽減するのに役立つ。
論文 参考訳(メタデータ) (2020-10-07T22:29:05Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。