論文の概要: Improving Trip Mode Choice Modeling Using Ensemble Synthesizer (ENSY)
- arxiv url: http://arxiv.org/abs/2407.01769v1
- Date: Mon, 1 Jul 2024 19:59:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-03 19:23:01.142608
- Title: Improving Trip Mode Choice Modeling Using Ensemble Synthesizer (ENSY)
- Title(参考訳): Ensemble Synthesizer (ENSY) を用いたトリプモード選択モデルの改良
- Authors: Amirhossein Parsi, Melina Jafari, Sina Sabzekar, Zahra Amini,
- Abstract要約: Ensemble Synthesizer (ENSY)は、モード選択データセットの分類精度を高めるために特別に設計された、新しいデータモデルである。
ENSYは、マイノリティクラスのF1スコアをほぼ4倍にし、全体的な分類精度を3%近く改善することで、顕著な効果を示す。
- 参考スコア(独自算出の注目度): 2.5799044614524664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate classification of mode choice datasets is crucial for transportation planning and decision-making processes. However, conventional classification models often struggle to adequately capture the nuanced patterns of minority classes within these datasets, leading to sub-optimal accuracy. In response to this challenge, we present Ensemble Synthesizer (ENSY) which leverages probability distribution for data augmentation, a novel data model tailored specifically for enhancing classification accuracy in mode choice datasets. In our study, ENSY demonstrates remarkable efficacy by nearly quadrupling the F1 score of minority classes and improving overall classification accuracy by nearly 3%. To assess its performance comprehensively, we compare ENSY against various augmentation techniques including Random Oversampling, SMOTE-NC, and CTGAN. Through experimentation, ENSY consistently outperforms these methods across various scenarios, underscoring its robustness and effectiveness
- Abstract(参考訳): モード選択データセットの正確な分類は、交通計画と意思決定プロセスに不可欠である。
しかし、従来の分類モデルは、これらのデータセット内の少数クラスのニュアンスパターンを適切に捉えるのに苦労することが多く、亜最適精度をもたらす。
この課題に対応するために、モード選択データセットの分類精度を高めるために特別に設計された新しいデータモデルであるデータ拡張のための確率分布を利用するEnsemble Synthesizer (ENSY)を提案する。
本研究は,少数クラスのF1スコアをほぼ4倍にし,全体の分類精度を3%近く向上させることにより,顕著な有効性を示した。
本研究では,その性能を総合的に評価するために,ランダムオーバーサンプリング,SMOTE-NC,CTGANなど,様々な拡張手法との比較を行った。
実験を通じて、ENSYはこれらの手法を様々なシナリオで一貫して上回り、その堅牢性と有効性を強調している。
関連論文リスト
- A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.46695086779598]
実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T03:00:58Z) - Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models [38.39395973523944]
本稿では,データ選択のための3段階のスキームを提案し,既存の作品のレビューを行う。
データ特化ラベルとモデル特化ラベルを併用したよりターゲット的な手法の方が効率が良いことが判明した。
論文 参考訳(メタデータ) (2024-06-20T08:58:58Z) - DiTMoS: Delving into Diverse Tiny-Model Selection on Microcontrollers [34.282971510732736]
我々は、セレクタ分類器アーキテクチャを備えた新しいDNNトレーニングおよび推論フレームワークであるDiTMoSを紹介する。
弱いモデルの合成は高い多様性を示すことができ、それらの結合は精度の上限を大幅に高めることができる。
我々は,Nucleo STM32F767ZIボード上にDiTMoSをデプロイし,人間の活動認識,キーワードスポッティング,感情認識のための時系列データセットに基づいて評価する。
論文 参考訳(メタデータ) (2024-03-14T02:11:38Z) - Bag of Tricks for Fully Test-Time Adaptation [21.295590695946753]
本稿では, バッチ正規化, ストリームリバランシング, 信頼性サンプル選択, ネットワーク信頼度校正など, 選択したTTA手法の分類について述べる。
我々は、精度、計算能力、複雑さの間のテクニックによって引き起こされるトレードオフに光を当てた。
また、技術を組み合わせる際に生じる相乗効果を明らかにし、新しい最先端の結果を確立することができる。
論文 参考訳(メタデータ) (2023-10-03T20:28:09Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Synthetic Sample Selection for Generalized Zero-Shot Learning [4.264192013842096]
Generalized Zero-Shot Learning (GZSL) はコンピュータビジョンにおいて重要な研究領域となっている。
本稿では,強化学習を用いた合成特徴選択のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-06T03:22:43Z) - Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。