論文の概要: ESG Accountability Made Easy: DocQA at Your Service
- arxiv url: http://arxiv.org/abs/2311.18481v1
- Date: Thu, 30 Nov 2023 11:47:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-01 16:57:27.309267
- Title: ESG Accountability Made Easy: DocQA at Your Service
- Title(参考訳): ESGのアカウンタビリティは簡単:サービスにおけるDocQA
- Authors: Lokesh Mishra, Cesar Berrospi, Kasper Dinkla, Diego Antognini,
Francesco Fusco, Benedikt Bothur, Maksym Lysak, Nikolaos Livathinos, Ahmed
Nassar, Panagiotis Vagenas, Lucas Morin, Christoph Auer, Michele Dolfi, Peter
Staar
- Abstract要約: 本アプリケーションは,質問応答型会話アシスタントによる文書からの情報抽出を可能にする。
このシステムは、文書変換から機械可読フォーマットを含む、さまざまなAI分野のいくつかの技術を統合する。
ユーザーは2000以上の企業から1万以上の環境、社会、ガバナンス(ESG)の開示を調査することができる。
- 参考スコア(独自算出の注目度): 14.478186976244048
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present Deep Search DocQA. This application enables information extraction
from documents via a question-answering conversational assistant. The system
integrates several technologies from different AI disciplines consisting of
document conversion to machine-readable format (via computer vision), finding
relevant data (via natural language processing), and formulating an eloquent
response (via large language models). Users can explore over 10,000
Environmental, Social, and Governance (ESG) disclosure reports from over 2000
corporations. The Deep Search platform can be accessed at:
https://ds4sd.github.io.
- Abstract(参考訳): 本稿ではDeep Search DocQAを紹介する。
本アプリケーションは,質問応答型会話アシスタントによる文書からの情報抽出を可能にする。
このシステムは、文書変換から(コンピュータビジョンによる)機械可読フォーマットへの変換、(自然言語処理による)関連するデータの検出、(大規模言語モデルによる)雄弁な応答の定式化など、さまざまなAI分野の技術を統合している。
ユーザは2000以上の企業から1万以上の環境、社会、ガバナンス(esg)の開示レポートを調査できる。
ディープ検索プラットフォームは、https://ds4sd.github.ioでアクセスできる。
関連論文リスト
- Docs2KG: Unified Knowledge Graph Construction from Heterogeneous Documents Assisted by Large Language Models [11.959445364035734]
エンタープライズデータの80%は非構造化ファイルに格納され、不均一なフォーマットに対応するデータレイクに格納される。
多様な異種文書からマルチモーダル情報を抽出する新しいフレームワークであるDocs2KGを紹介する。
Docs2KGは、抽出されたキー情報を表す統一知識グラフを生成する。
論文 参考訳(メタデータ) (2024-06-05T05:35:59Z) - DocReLM: Mastering Document Retrieval with Language Model [49.847369507694154]
本研究では,大規模言語モデルを利用することで,文書検索システムが高度な意味理解能力を実現することを実証する。
我々のアプローチは、大規模言語モデルによって生成されたドメイン固有データを用いて、検索者と再ランカを訓練することである。
我々は、量子物理学とコンピュータビジョンの分野の研究者によって注釈付けされたテストセットを使用して、システムの性能を評価する。
論文 参考訳(メタデータ) (2024-05-19T06:30:22Z) - DocTrack: A Visually-Rich Document Dataset Really Aligned with Human Eye
Movement for Machine Reading [20.479196838849937]
我々は、視線追跡技術を用いて人間の眼球運動情報と本当に一致したVRDデータセットであるtextscDocTrackを紹介した。
文書理解作業における人間の読解順序の影響について検討し,機械が人間と同じ順序で読解した場合に何が起こるかを検討する。
私たちの結果は、Document AIモデルは大きな進歩を遂げているが、人間のように正確に、継続的に、柔軟にVRDを読むことができるまでには、まだまだ長い道のりがあることを示唆している。
論文 参考訳(メタデータ) (2023-10-23T10:58:09Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z) - Logic Mill -- A Knowledge Navigation System [0.16785092703248325]
Logic Millは、セマンティックに類似した文書を識別するスケーラブルでオープンにアクセスできるソフトウェアシステムである。
高度な自然言語処理(NLP)技術を用いて、文書の数値表現を生成する。
このシステムは、科学出版物や特許文書に焦点を合わせ、2億以上の文書を含んでいる。
論文 参考訳(メタデータ) (2022-12-31T13:46:50Z) - Doc2Bot: Accessing Heterogeneous Documents via Conversational Bots [103.54897676954091]
Doc2Botは、ユーザーが会話を通じて情報を求めるのを助けるマシンを構築するためのデータセットである。
われわれのデータセットには、5つのドメインの中国の文書に基づく10万回以上のターンが含まれている。
論文 参考訳(メタデータ) (2022-10-20T07:33:05Z) - Detect, Retrieve, Comprehend: A Flexible Framework for Zero-Shot
Document-Level Question Answering [6.224211330728391]
研究者は貴重な技術知識を含む何千もの学術文書を作成した。
文書レベルの質問応答(QA)は、人間の提案する質問を適応して多様な知識を抽出できる柔軟なフレームワークを提供する。
本稿では,PDFからテキストを抽出する3段階の文書QAアプローチ,抽出したテキストからエビデンスを抽出して適切な文脈を形成する方法,文脈から知識を抽出して高品質な回答を返すためのQAを提案する。
論文 参考訳(メタデータ) (2022-10-04T23:33:52Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - UKP-SQUARE: An Online Platform for Question Answering Research [50.35348764297317]
我々は、研究者向けのオンラインQAプラットフォームであるUKP-SQUAREを紹介した。
UKP-SQUAREでは、ユーザフレンドリーなWebインターフェースと統合テストを通じて、モダンスキルの大規模なコレクションをクエリし、分析することができる。
論文 参考訳(メタデータ) (2022-03-25T15:00:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。