論文の概要: Tender Notice Extraction from E-papers Using Neural Network
- arxiv url: http://arxiv.org/abs/2312.10437v1
- Date: Sat, 16 Dec 2023 12:54:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 16:27:45.302667
- Title: Tender Notice Extraction from E-papers Using Neural Network
- Title(参考訳): ニューラルネットワークを用いた電子ペーパーからのテンダー通知抽出
- Authors: Ashmin Bhattarai, Anuj Sedhai, Devraj Neupane, Manish Khadka and Rama
Bastola
- Abstract要約: ネパールでは、テンダー通知は通常全国紙や地方紙で発行される。
興味のある入札者は、新聞のすべての関連する入札通知を検索すべきである。
このプロジェクトは、手動で手動で通知を検索する、この面倒な作業を解決するために作られています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tender notices are usually sought by most of the companies at regular
intervals as a means for obtaining the contracts of various projects. These
notices consist of all the required information like description of the work,
period of construction, estimated amount of project, etc. In the context of
Nepal, tender notices are usually published in national as well as local
newspapers. The interested bidders should search all the related tender notices
in newspapers. However, it is very tedious for these companies to manually
search tender notices in every newspaper and figure out which bid is best
suited for them. This project is built with the purpose of solving this tedious
task of manually searching the tender notices. Initially, the newspapers are
downloaded in PDF format using the selenium library of python. After
downloading the newspapers, the e-papers are scanned and tender notices are
automatically extracted using a neural network. For extraction purposes,
different architectures of CNN namely ResNet, GoogleNet and Xception are used
and a model with highest performance has been implemented. Finally, these
extracted notices are then published on the website and are accessible to the
users. This project is helpful for construction companies as well as
contractors assuring quality and efficiency. This project has great application
in the field of competitive bidding as well as managing them in a systematic
manner.
- Abstract(参考訳): テンダー通知は通常、様々なプロジェクトの契約を得る手段として、定期的に多くの企業が求めている。
これらの通知は、作業の説明、建設期間、見積もりのプロジェクト数など、必要なすべての情報から構成される。
ネパールの文脈では、テンダー通知は通常地元新聞だけでなく全国で発行される。
興味のある入札者は、新聞の関連情報をすべて検索する必要がある。
しかし、これらの企業がどの新聞にも手動で通知を検索し、どの入札に最も適しているかを判断するのは非常に面倒である。
このプロジェクトは,手作業で通知を検索する,この面倒な作業を解決するために構築されている。
当初、新聞はpythonのseleniumライブラリを使ってpdf形式でダウンロードできる。
新聞をダウンロードした後、eペーパーをスキャンし、ニューラルネットワークを用いてテンダー通知を自動的に抽出する。
抽出のために、ResNet、GoogleNet、XceptionというCNNの異なるアーキテクチャが使用され、高いパフォーマンスのモデルが実装されている。
最後に、抽出された通知はWebサイトに公開され、ユーザはアクセスできる。
このプロジェクトは建設会社や請負業者が品質と効率を確保するのに役立つ。
このプロジェクトは競争入札の分野で大きな応用があり、体系的な方法でそれらを管理しています。
関連論文リスト
- FineFake: A Knowledge-Enriched Dataset for Fine-Grained Multi-Domain Fake News Detection [54.37159298632628]
FineFakeは、フェイクニュース検出のためのマルチドメイン知識強化ベンチマークである。
FineFakeは6つのセマンティックトピックと8つのプラットフォームにまたがる16,909のデータサンプルを含んでいる。
FineFakeプロジェクト全体がオープンソースリポジトリとして公開されている。
論文 参考訳(メタデータ) (2024-03-30T14:39:09Z) - Fundus: A Simple-to-Use News Scraper Optimized for High Quality Extractions [2.2863439039616127]
Fundusはユーザーフレンドリーなニューススクレイパーで、ユーザーはほんの数行のコードで何百万もの高品質なニュース記事を入手できる。
既存のニューススクレイパーとは異なり、手作業で作り上げたコンテンツ抽出機を使っています。
私たちのフレームワークは、クローリング(Webや大規模なWebアーカイブからHTMLを取得する)とコンテンツ抽出を1つのパイプラインに組み合わせています。
論文 参考訳(メタデータ) (2024-03-22T15:22:06Z) - Leveraging Contextual Information for Effective Entity Salience Detection [21.30389576465761]
クロスエンコーダアーキテクチャを用いた中規模言語モデルの微調整により,機能工学的アプローチよりも優れた性能が得られることを示す。
また、命令調整言語モデルのゼロショットプロンプトは、タスクの特異性と複雑さを示す劣った結果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-09-14T19:04:40Z) - Identifying Informational Sources in News Articles [109.70475599552523]
我々は、ニュース執筆に使用される情報ソースの、最大かつ最も広範囲にアノテートされたデータセットを構築した。
本稿では,ニュース記事中のソースの構成性を研究するための新しいタスクであるソース予測を導入する。
論文 参考訳(メタデータ) (2023-05-24T08:56:35Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - FETA: Towards Specializing Foundation Models for Expert Task
Applications [49.57393504125937]
ファンデーションモデル(FM)は、ゼロショット学習、高忠実度データ合成、ドメインの一般化など、前例のない機能を示した。
この論文では、FMは、まだ専門家のタスクにおいて、出来の悪いパフォーマンスを保っていることを示します。
本稿では,FMに技術資料の理解を促すことを目的として,その第1のFETAベンチマークを提案する。
論文 参考訳(メタデータ) (2022-09-08T08:47:57Z) - Efficient Document Image Classification Using Region-Based Graph Neural
Network [4.147346416230273]
文書画像分類は、様々な産業にまたがる多くの企業アプリケーションで商業化が可能であるため、依然としてポピュラーな研究分野である。
大規模な事前学習されたコンピュータビジョンと言語モデル、グラフニューラルネットワークの最近の進歩は、ドキュメントイメージの分類に多くのツールを提供している。
本稿では,グラフ畳み込みニューラルネットワークを用いた効率的な文書画像分類フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-25T17:57:04Z) - Soft Gazetteers for Low-Resource Named Entity Recognition [78.00856159473393]
本稿では、英語知識ベースからユビキタスに利用可能な情報をニューラル名付きエンティティ認識モデルに組み込む「ソフトガゼッタ」を提案する。
4つの低リソース言語に対する実験により,F1得点の4点の平均的改善が示された。
論文 参考訳(メタデータ) (2020-05-04T21:58:02Z) - Transfer Learning for Information Extraction with Limited Data [2.201264358342234]
本稿では,詳細な情報抽出への実践的アプローチを提案する。
まずBERTを利用して、実際のシナリオにおけるトレーニングデータの制限に対処します。
次に、BERTを畳み込みニューラルネットワークで積み重ねて、分類のための隠れ表現を学習する。
論文 参考訳(メタデータ) (2020-03-06T08:08:20Z) - S-APIR: News-based Business Sentiment Index [0.9137554315375919]
我々は、与えられたテキストのビジネス感情を予測するために、Gated Recurrent Unitsを備えたリカレントニューラルネットワーク(RNN)を採用する。
RNNは最初、Economic Watchers Surveyで訓練され、その後、ドメイン適応のためのニューステキストで微調整される。
ビジネス感情に関係のないと考えられるテキストをフィルタリングするために、一級サポートベクタマシンを適用する。
論文 参考訳(メタデータ) (2020-03-06T00:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。