論文の概要: A Skill-Based AI Agentic Pipeline for Library of Congress Subject Indexing
- arxiv url: http://arxiv.org/abs/2605.03537v1
- Date: Tue, 05 May 2026 09:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.862423
- Title: A Skill-Based AI Agentic Pipeline for Library of Congress Subject Indexing
- Title(参考訳): 国会議事典索引作成のためのスキルベースAIエージェントパイプライン
- Authors: Eric H. C. Chow,
- Abstract要約: 本稿では、LCSHによる対象インデックス作成を自動化するためのモジュール型AIスキルパイプラインを提案する。
主題索引付けは、作品の話題を分析し、制御された語彙語を選択し、それらをMARC21主題アクセスフィールドとしてエンコードするプロセスである。
このプロセスは、概念分析、定量的フィルタリング、権威検証、MARCフィールド合成の4つの個別に実行されるエージェントスキルに分解される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper presents a modular AI agentic skill pipeline for automating subject indexing with Library of Congress Subject Headings (LCSH). Subject indexing - the process of analyzing a work's aboutness, selecting controlled vocabulary terms, and encoding them as MARC21 subject access fields - is one of the most time-consuming components of library cataloging. The system decomposes this process into four discrete, sequentially executed agent skills: conceptual analysis, quantitative filtering, authority validation, and MARC field synthesis. Each skill encodes domain knowledge drawn directly from Library of Congress Subject Headings Manual (SHM) instruction sheets and subject analysis theory. The pipeline was evaluated against a corpus of ten titles whose existing subject headings were captured from the Harvard Library bibliographic dataset (a snapshot of their Alma ILS). Results demonstrate strong conceptual alignment with professional subject indexing practice, with notable differences in specificity, subdivision practice, and the agent's adherence to the 2026 LC policy discontinuing form subdivisions in favor of LCGFT 655 fields.
- Abstract(参考訳): 本稿では,LCSH(Library of Congress Subject Headings)による対象インデックス作成を自動化するための,モジュール型AIエージェントスキルパイプラインを提案する。
主題索引付け - 作業の話題を分析し、制御された語彙語を選択し、それらをMARC21主題アクセスフィールドとしてエンコードするプロセスは、ライブラリカタログの最も時間を要するコンポーネントの1つである。
このプロセスは、概念分析、定量的フィルタリング、権威検証、MARCフィールド合成の4つの個別に実行されるエージェントスキルに分解される。
各スキルは、議会図書館の教科表(SHM)命令シートと対象分析理論から直接引き出されたドメイン知識を符号化する。
パイプラインは、ハーバード図書館の書誌データセット(Alma ILSのスナップショット)から、既存の主題の見出しをキャプチャした10のタイトルのコーパスに対して評価された。
その結果, プロの主観的索引付け実践と強い概念的整合性を示し, 具体性, 分節的実践, 2026 LC 政策の順応性に顕著な違いがあり, LCGFT 655 フィールドが好まれる。
関連論文リスト
- DeepRead: Document Structure-Aware Reasoning to Enhance Agentic Search [23.447631421934847]
DeepReadは、ドキュメントネイティブな構造的事前を動作可能な推論機能に運用するために設計された、構造対応のドキュメント推論エージェントである。
DeepReadは、従来の検索手法に固有のコンテキストの断片化を効果的に軽減する、人間のような位置読み取りの推論パラダイムを提供する。
論文 参考訳(メタデータ) (2026-02-04T20:03:28Z) - MMESGBench: Pioneering Multimodal Understanding and Complex Reasoning Benchmark for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。
MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。
MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文 参考訳(メタデータ) (2025-07-25T03:58:07Z) - Better Recommendations: Validating AI-generated Subject Terms Through LOC Linked Data Service [6.998883625312534]
本稿では、AI生成した主題語をライブラリカタログに統合し、議会図書館リンクデータサービスによる検証に焦点を当てる。
生成AIはカタログ作成の迅速化において有望であるが、研究はAIが指定する課題の精度に重大な制限があることを明らかにしている。
本稿では,ライブラリカタログにおけるメタデータ生成の精度,効率,全体的な品質の向上を目的とした,LOC Linked Data ServiceによるAI技術と人間による検証を組み合わせたハイブリッドアプローチを提案する。
論文 参考訳(メタデータ) (2025-07-18T18:55:57Z) - DNB-AI-Project at SemEval-2025 Task 5: An LLM-Ensemble Approach for Automated Subject Indexing [0.0]
我々のシステムは、知的注釈付きレコードの様々な例でLLMの選択を促すことに依存している。
生成したキーワードをターゲット語彙にマップし、結果の主題語をアンサンブル投票に集約し、レコードとの関連性についてランク付けする。
本システムは,全対象トラックにおける定量的ランキングでは4位であるが,主観的索引付けの専門家による質的ランキングでは最もよい結果が得られた。
論文 参考訳(メタデータ) (2025-04-30T12:47:09Z) - Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging [1.2582887633807602]
本稿では,SemEval-2025 Task 5: Subject TaggingのためのHomaについて述べる。
GND(Gemeinsame Normdatei)分類を用いて、TIBKATの技術的記録に主題ラベルを自動的に割り当てることに焦点を当てている。
提案手法では,対象のタグ付け問題をアライメントタスクとして定式化し,意味的類似性に基づいたカテゴリにレコードをマッチングする。
論文 参考訳(メタデータ) (2025-04-30T09:52:51Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。