論文の概要: Beyond Text: Characterizing Domain Expert Needs in Document Research
- arxiv url: http://arxiv.org/abs/2504.12495v1
- Date: Wed, 16 Apr 2025 21:24:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 14:39:25.910640
- Title: Beyond Text: Characterizing Domain Expert Needs in Document Research
- Title(参考訳): テキストを超えて: ドキュメント研究におけるドメインエキスパートのニーズを特徴づける
- Authors: Sireesh Gururaja, Nupoor Gandhi, Jeremiah Milbauer, Emma Strubell,
- Abstract要約: 文書研究のプロセスを理解するために、2つのドメインにまたがる16のドメインエキスパートに頼みます。
参加者のプロセスは、慣用的で反復的で、文書の社会的文脈に大きく依存していることが分かりました。
我々はNLPコミュニティに、有用なツールを構築する上でのドキュメントの役割をより慎重に検討するよう呼びかける。
- 参考スコア(独自算出の注目度): 10.98467955215441
- License:
- Abstract: Working with documents is a key part of almost any knowledge work, from contextualizing research in a literature review to reviewing legal precedent. Recently, as their capabilities have expanded, primarily text-based NLP systems have often been billed as able to assist or even automate this kind of work. But to what extent are these systems able to model these tasks as experts conceptualize and perform them now? In this study, we interview sixteen domain experts across two domains to understand their processes of document research, and compare it to the current state of NLP systems. We find that our participants processes are idiosyncratic, iterative, and rely extensively on the social context of a document in addition its content; existing approaches in NLP and adjacent fields that explicitly center the document as an object, rather than as merely a container for text, tend to better reflect our participants' priorities, though they are often less accessible outside their research communities. We call on the NLP community to more carefully consider the role of the document in building useful tools that are accessible, personalizable, iterative, and socially aware.
- Abstract(参考訳): ドキュメントを扱うことは、文献レビューにおける研究の文脈化から法的な前例のレビューに至るまで、ほとんどすべての知識作業の鍵となる部分である。
最近、その能力が拡大するにつれて、主にテキストベースのNLPシステムは、この種の作業を支援したり、自動化したりできるものとして、しばしば請求されてきた。
しかし、これらのシステムはどの程度まで、これらのタスクを概念化して実行する専門家としてモデル化できるのだろうか?
本研究では,文書研究のプロセスを理解するために2つの領域にわたる16のドメインエキスパートにインタビューを行い,NLPシステムの現状と比較した。
我々の参加者のプロセスは、その内容に加えて、ドキュメントの社会的コンテキストに大きく依存していることがわかりました。NLPや隣接分野における既存のアプローチは、単にテキストのコンテナとしてではなく、文書をオブジェクトとして明示的に中心するものであり、研究コミュニティ以外ではアクセスできないことが多いものの、参加者の優先順位を反映する傾向があります。
我々はNLPコミュニティに、アクセスしやすく、パーソナライズ可能で、反復的で、社会的に認識された有用なツールを構築する上で、ドキュメントの役割をより慎重に検討するよう呼びかける。
関連論文リスト
- Judgement Citation Retrieval using Contextual Similarity [0.0]
本稿では,自然言語処理(NLP)と機械学習技術を組み合わせて,訴訟記述の組織化と活用を促進する手法を提案する。
提案手法は,教師なしクラスタリングと教師付き引用検索の2つの主要な目的に対処する。
我々の手法は90.9%という驚くべき精度を達成した。
論文 参考訳(メタデータ) (2024-05-28T04:22:28Z) - Knowledge-Driven Cross-Document Relation Extraction [3.868708275322908]
関係抽出(RE)はよく知られたNLPアプリケーションであり、文レベルや文書レベルのタスクとして扱われる。
本稿では,文書横断REのための入力テキストにエンティティのドメイン知識を組み込む新しい手法KXDocREを提案する。
論文 参考訳(メタデータ) (2024-05-22T11:30:59Z) - What Can Natural Language Processing Do for Peer Review? [173.8912784451817]
現代の科学ではピアレビューが広く使われているが、それは難しく、時間がかかり、エラーを起こしやすい。
ピアレビューに関わるアーティファクトは大部分がテキストベースであるため、自然言語処理はレビューを改善する大きな可能性を秘めている。
筆者らは、原稿提出からカメラ対応リビジョンまでの各工程について詳述し、NLP支援の課題と機会について論じる。
論文 参考訳(メタデータ) (2024-05-10T16:06:43Z) - Understanding Archives: Towards New Research Interfaces Relying on the Semantic Annotation of Documents [0.2302001830524133]
本稿では,研究資料のコーパスのテキスト内容の意味的アノテーションが,その活用と評価を促進する方法を示す。
まず,テキスト・セマンティクスに基づく新しいインタフェース構築のための方法論的枠組みを提案する。
論文 参考訳(メタデータ) (2024-03-28T07:55:29Z) - The Use of NLP-Based Text Representation Techniques to Support
Requirement Engineering Tasks: A Systematic Mapping Review [1.5469452301122177]
研究の方向性は、語彙的・構文的特徴の使用から高度な埋め込み技術の使用へと変化した。
既存の文献の4つのギャップ、それらが問題となる理由、そして今後の研究がそれらにどう対処し始めるかを特定する。
論文 参考訳(メタデータ) (2022-05-17T02:47:26Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - A Survey of Deep Learning Approaches for OCR and Document Understanding [68.65995739708525]
我々は、英語で書かれた文書の文書理解のための様々な手法をレビューする。
文献に現れる方法論を集約し,この領域を探索する研究者の跳躍点として機能させる。
論文 参考訳(メタデータ) (2020-11-27T03:05:59Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z) - Conversations with Documents. An Exploration of Document-Centered
Assistance [55.60379539074692]
例えば、個人が文書をすばやくレビューするのを助けるドキュメント中心の支援は、あまり進歩していない。
我々は,文書中心の支援の空間と,人々がこのシナリオで期待する能力を理解するための調査を行う。
a) 文書中心の質問を正確に検出でき、(b) そうした質問に答えるために合理的に正確なモデルを構築することができることを示す。
論文 参考訳(メタデータ) (2020-01-27T17:10:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。