Learning From Mistakes Makes LLM Better Reasoner [112.8] 大規模言語モデル(LLM)は、最近数学の問題を解く際、顕著な推論能力を示した。
この研究は、LLMが人間の学習プロセスに似たMistAkes(LEMA)から学習できるかどうかを探求する。
GPT-4を「訂正者」として用い、誤りの理由を説明し、誤りを訂正し、最終的な答えを生成する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:13:39 GMT)
Image Fusion via Vision-Language Model [94.1] 本稿では, VIsion-Language Model (FILM) による画像融合という新しい融合パラダイムを初めて紹介する。
FILMでは、入力画像を処理してセマンティックプロンプトを生成し、それをChatGPTに入力してリッチなテキスト記述を得る。
これらの記述はテキスト領域で融合され、ソース画像からの重要な視覚的特徴の抽出を相互注意を通して導く。
このパラダイムは、赤外線可視、医療、マルチ露光、マルチフォーカス画像融合の4つの画像融合タスクにおいて満足な結果を得る。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 18:36:39 GMT)
System-Level Natural Language Feedback [83.2] システムレベルの設計決定を人為的なループプロセスで形式化する上で,フィードバックの活用方法を示す。
検索クエリと対話応答生成を改善するために,本手法のケーススタディを2つ実施する。
システムレベルのフィードバックとインスタンスレベルのフィードバックの組み合わせは、さらなる利益をもたらします。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:24:11 GMT)
GliDe with a CaPE: A Low-Hassle Method to Accelerate Speculative
Decoding [81.0] GliDe と CaPE を導入し,バニラ投機復号への2つの低ハードル修正を行った。
GliDeは、ターゲットのLLMからキャッシュされたキーと値を再利用する、修正されたドラフトモデルアーキテクチャである。
コード、データ、トレーニング済みのドラフトモデルをリリースします。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:44:11 GMT)
Zero-shot Sentiment Analysis in Low-Resource Languages Using a
Multilingual Sentiment Lexicon [78.1] 私たちは、34の言語にまたがるゼロショットの感情分析タスクに重点を置いています。
文レベルの感情データを使用しない多言語語彙を用いた事前学習は、英語の感情データセットに微調整されたモデルと比較して、ゼロショット性能が優れていることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:41:05 GMT)
Distributional GFlowNets with Quantile Flows [73.7] Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。
本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。
GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:31:14 GMT)
Self-Debiasing Large Language Models: Zero-Shot Recognition and
Reduction of Stereotypes [73.1] ステレオタイピングを減らすために,大規模言語モデルのゼロショット機能を活用している。
自己嫌悪は、9つの異なる社会集団におけるステレオタイピングの度合いを著しく低下させることが示される。
この研究が、バイアス軽減のための他のゼロショット技術に関する調査をオープンにすることを願っている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:40:11 GMT)
LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuning [70.3] LLMには、微調整なしで長いコンテキストを処理できる固有の能力がある、と我々は主張する。
バイレベルアテンション情報を構築することで,LLMのコンテキストウィンドウを拡張するためのSelfExtendを提案する。
複数のベンチマークで包括的な実験を行い、その結果、既存のLLMのコンテキストウィンドウ長を効果的に拡張できることが示されている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:13:20 GMT)
Federated Learning with New Knowledge: Fundamentals, Advances, and
Futures [69.9] 本稿では,フェデレートラーニング(FL)における新しい知識の源泉を体系的に定義する。
本研究は,新たな知識の到来時期と形態が定式化過程に及ぼす影響について検討する。
シナリオの設定,効率,セキュリティなど,さまざまな要因を考慮し,FLの今後の方向性を新たな知識で論じる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 21:29:31 GMT)
BYOM: Building Your Own Multi-Task Model For Free [69.6] BYOM-FFTは完全微調整モデルのマージ用であり、BYOM-LoRAはLoRA微調整モデルのマージ用である。
コンピュータビジョンと自然言語処理タスクの実験により、提案手法は既存のマージ手法よりも大きなマージ率で優れていることが示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:22:33 GMT)
Understanding and Mitigating Spurious Correlations in Text
Classification with Neighborhood Analysis [69.1] 機械学習モデルは、トレーニングセットに存在するが一般的な状況では当てはまらない急激な相関を利用する傾向にある。
本稿では, 周辺分析と呼ばれる新しい視点から, 突発的相関がもたらす意味について考察する。
本稿では,テキスト分類における素早い相関を緩和する正規化手法であるNFL(doN't Forget your Language)を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:44:36 GMT)
Adaptive Multi-source Predictor for Zero-shot Video Object Segmentation [68.6] ゼロショットビデオオブジェクトセグメンテーション(ZVOS)のための新しい適応型マルチソース予測器を提案する。
静的オブジェクト予測器では、RGBソースは、同時に深度および静注ソースに変換される。
実験の結果,提案モデルは3つのZVOSベンチマークにおいて最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:04:44 GMT)
Risk-Sensitive Diffusion: Learning the Underlying Distribution from
Noisy Samples [66.0] 拡散モデルはノイズのあるサンプルの存在に対して脆弱であることを示す。
ノイズサンプルの分布を調整するために,リスク感応性SDEを導入する。
本モデルでは,ノイズのあるサンプルからクリーンなデータ分布を効果的に回収することを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:41:51 GMT)
Are Large Language Models Good Prompt Optimizers? [65.5] 我々は,LLMに基づくPrompt Optimizationの実際のメカニズムを明らかにするために研究を行っている。
以上の結果から, LLMは, 反射中の誤差の真の原因を特定するのに苦慮し, 自己の事前知識に偏っていることが明らかとなった。
我々は、より制御可能な方法でターゲットモデルの振舞いを直接最適化する新しい「自動振舞い最適化」パラダイムを導入する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:48:54 GMT)
How Can We Train Deep Learning Models Across Clouds and Continents? An
Experimental Study [63.3] 代表的なCV, NLP, ASRモデルに対して, 異なるゾーン, 大陸, 雲におけるトレーニングの費用とスループットについて検討した。
スポット価格を活用することで、複数の安価なインスタンスでモデルをトレーニングし、より集中的かつ強力なハードウェアと、競争力のある価格でオンデマンドのクラウド製品の両方を台無しにする、新たなコスト効率の方法が実現されることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:19:08 GMT)
Adversarial Examples Are Not Real Features [60.7] citetilyas 2019adversarialのよく知られた理論は、データの観点から敵の脆弱性を説明する。
我々は、複数の学習パラダイムを取り入れることで、理論をより大きな文脈から再検討する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:35:39 GMT)
TCI-Former: Thermal Conduction-Inspired Transformer for Infrared Small
Target Detection [58.0] 赤外線小目標検出(ISTD)は国家安全保障に重要であり、軍事分野で広く応用されている。
ほとんどの ISTD ネットワークは特徴抽出ブロックや特徴融合モジュールの設計に重点を置いているが、特徴写像の進化の観点から ISTD プロセスを記述することは稀である。
熱伝導理論に基づく熱伝導型変圧器(TCI-Former)を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:51:22 GMT)
Neural Scaling Laws on Graphs [57.7] モデルおよびデータの観点から,グラフ上のニューラルスケーリング法則について検討する。
モデルスケーリングでは,スケール法が崩壊する現象を調査し,オーバーフィッティングを潜在的な理由として同定する。
データスケーリングについては、グラフのサイズが極めて不規則であるため、スケーリング法則においてグラフデータのボリュームを効果的に測定することはできないことを示唆する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:17:21 GMT)
The Bigger the Better? Rethinking the Effective Model Scale in Long-term
Time Series Forecasting [57.0] 時系列予測は時系列分析において重要なフロンティアである。
階層的な分解で拡張された軽量トランスフォーマーであるHDformerを紹介する。
HDformerは既存のLTSFモデルよりも優れており、パラメータは99%以上少ない。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:24:06 GMT)
Feasibility of Identifying Factors Related to Alzheimer's Disease and
Related Dementia in Real-World Data [56.7] 537例から10項目で477の危険因子を抽出した。
AD/ADRDの遺伝子検査は、まだ一般的ではなく、構造化EHRと非構造化EHRの両方で文書化されていない。
AD/ADRDリスクファクタに関する継続的な研究を考えると、NLP法による文献マイニングは、私たちの知識マップを自動的に更新するソリューションを提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 18:17:19 GMT)
Graph Foundation Models [56.2] Graph Foundation Model (GFM)は、グラフ領域における新しいトレンド研究トピックである。
グラフ語彙の提唱によるGFM開発のための新しい視点」を提案する。
我々は、ネットワーク分析、理論的基礎、安定性など、基本的な側面からグラフ語彙の構築を基礎にしている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:24:36 GMT)
DCS-Net: Pioneering Leakage-Free Point Cloud Pretraining Framework with
Global Insights [55.1] 微分可能中心サンプリングネットワーク(DCS-Net)と呼ばれる新しいソリューションを導入する。
グローバルな特徴再構成とローカルな特徴再構成の両方を非自明なプロキシタスクとして組み込むことで,情報漏洩問題に対処する。
実験により,本手法は既存の点雲モデルの表現能力を向上することを示した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:58:23 GMT)
Improving Diffusion Models for Inverse Problems Using Optimal Posterior
Covariance [54.7] 最近の拡散モデルは、ノイズのある線形逆問題に対する有望なゼロショット解を提供する。
既存のゼロショット法に対する最初の統一的解釈を提案する。
近年の手法は, 等方性ガウス近似を導出可能な後部分布に置き換えることと等価であることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:35:39 GMT)
A Closer Look at the Limitations of Instruction Tuning [54.6] インストラクションチューニング(IT)は,大規模言語モデル(LLM)における知識やスキルの向上に失敗することを示す。
また、一般的なIT改善手法は、シンプルなLoRA微調整モデルよりも性能改善につながるものではないことも示している。
この結果から,事前学習した知識のみから生成した応答は,オープンソースデータセット上でITから新たな知識を学習するモデルによって,一貫した応答性能が向上することが判明した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:45:25 GMT)
Revisiting the Markov Property for Machine Translation [54.4] 我々は,Markov Autoregressive Transformer(MAT)を設計し,その性能を4つのWMTベンチマークで総合的に評価する。
以上の結果から,MATは従来の自己回帰変換器と同等の品質の翻訳を生成できることが示唆された。
さらに,高次MATを利用する利点は,より長い文の翻訳に特に寄与しないことがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:50:50 GMT)
Analyzing Neural Network-Based Generative Diffusion Models through
Convex Optimization [54.0] 拡散モデルは画像、ビデオ、オーディオ生成に広く使われている。
スコアベース拡散モデルでは,入力データ分布のスコア関数を推定する必要がある。
この研究は、ニューラルネットワークベースの拡散モデルが漸近的でない環境で何を学ぶかを理解するのに寄与する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:20:25 GMT)
Deep Reinforcement Learning for Image-to-Image Translation [52.5] 画像から画像への変換(I2IT)手法は,ディープラーニング(DL)モデルの単一実行時に画像を生成する。
深部強化学習(DRL)によるステップワイド意思決定問題としてI2ITを再構成する。
RLベースのI2IT(RL-I2IT)を実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:40:46 GMT)
Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.5] 会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:42:36 GMT)
Distributional Reduction: Unifying Dimensionality Reduction and
Clustering with Gromov-Wasserstein Projection [50.5] 教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
伝統的に、これは次元還元法を用いて解釈可能な空間にデータを投影したり、意味のあるクラスタにポイントを整理する。
私たちは新しい視点 – 流通の視点 – を提供しています。
我々はクラスタリングと次元還元を分散還元と呼ばれる単一のフレームワークに統合する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:00:19 GMT)
Hypergraph-Transformer (HGT) for Interactive Event Prediction in
Laparoscopic and Robotic Surgery [50.3] 腹腔内ビデオから外科的ワークフローの重要なインタラクティブな側面を理解し,予測できる予測型ニューラルネットワークを提案する。
我々は,既存の手術用データセットとアプリケーションに対するアプローチを検証し,アクション・トリプレットの検出と予測を行った。
この結果は、非構造的な代替案と比較して、我々のアプローチの優位性を示している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:58:05 GMT)
DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and
Authentication [50.0] DiffVeinは、静脈分割と認証タスクを同時に処理する統合拡散モデルベースのフレームワークである。
これら2つのブランチ間の機能相互作用を改善するために,2つの特別なモジュールを導入する。
このようにして、我々のフレームワークは拡散とセグメンテーションの埋め込みの間の動的相互作用を可能にする。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:49:42 GMT)
GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross
Appearance-Edge Learning [49.9] フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:13:50 GMT)
Data Poisoning for In-context Learning [49.8] In-context Learning (ICL)は、新しいタスクに適応する革新的な能力として認識されている。
本論文は、ICLのデータ中毒に対する感受性の重大な問題について述べる。
ICLの学習メカニズムを活用するために考案された特殊攻撃フレームワークであるICLPoisonを紹介する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:20:20 GMT)
Future Directions in Foundations of Graph Machine Learning [49.0] グラフ上の機械学習、特にグラフニューラルネットワーク(GNN)を用いた場合、関心が急増している。
その実用的成功にもかかわらず、GNNの特性に関する理論的理解は非常に不完全である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:55:31 GMT)
MLIP: Enhancing Medical Visual Representation with Divergence Encoder
and Knowledge-guided Contrastive Learning [49.0] 本稿では、画像テキストのコントラスト学習を通じて、言語情報を視覚領域に統合するための案内信号として、ドメイン固有の医療知識を活用する新しいフレームワークを提案する。
我々のモデルには、設計した分散エンコーダによるグローバルコントラスト学習、局所トークン・知識・パッチアライメントコントラスト学習、知識誘導型カテゴリレベルのコントラスト学習、エキスパートナレッジによるコントラスト学習が含まれる。
特に、MLIPは、限られた注釈付きデータであっても最先端の手法を超越し、医療表現学習の進歩におけるマルチモーダル事前学習の可能性を強調している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:48:50 GMT)
BVI-Lowlight: Fully Registered Benchmark Dataset for Low-Light Video
Enhancement [47.4] 本稿では,2つの低照度条件下での様々な動きシナリオにおける40のシーンからなる,新しい低照度映像データセットを提案する。
我々は、プログラム可能な電動ドリーを用いて、通常の光で捉えた完全に登録された地上真実データを提供する。
画像ベースのポストプロセッシングによりそれらを洗練し、異なる光レベルにおけるフレームの画素ワイドアライメントを保証する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:40:22 GMT)
A Theory of Non-Linear Feature Learning with One Gradient Step in
Two-Layer Neural Networks [47.3] 特定の条件下での2層完全連結ニューラルネットワークでは、第1層への降下の1ステップと第2層への尾根回帰が特徴学習につながる。
一定の勾配降下ステップサイズで、このスパイクは対象関数の線形成分からの情報のみを伝達する。
サンプルサイズとともに成長する学習率によって、このようなトレーニングが実際に複数のランクオンコンポーネントを導入していることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 21:18:10 GMT)
CoFiNet: Unveiling Camouflaged Objects with Multi-Scale Finesse [46.8] 本稿では,CoFiNetというカモフラージュ物体検出手法を提案する。
提案手法は,マルチスケールな特徴融合と抽出に重点を置いており,特にモデルのセグメンテーションの有効性に注目している。
CoFiNetは、すべてのデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:24:55 GMT)
MixedNUTS: Training-Free Accuracy-Robustness Balance via Nonlinearly
Mixed Classifiers [45.4] MixedNUTSは、ロバストな分類器の出力ロジットを3つのパラメータしか持たない非線形変換で処理する訓練不要の手法である。
MixedNUTSは変換されたロジットを確率に変換し、それらを全体の出力として混合する。
CIFAR-10、CIFAR-100、ImageNetデータセットでは、MixedNUTSの精度とほぼSOTAの堅牢性を大幅に改善した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 21:12:36 GMT)
Comparative study of quantum error correction strategies for the
heavy-hexagonal lattice [45.0] トポロジカル量子誤差補正は、量子コンピュータのスケーリングロードマップにおけるマイルストーンである。
四角い格子面のコードは、この問題に対処するための作業場となっている。
しかし、一部のプラットフォームではゲートエラーを最小限に抑えるために接続性はさらに低く保たれている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:28:27 GMT)
D\'ej\`a Vu Memorization in Vision-Language Models [44.4] 視覚言語モデル(VLM)における記憶量測定のための新しい手法を提案する。
モデルでは、相関や画像キャプションから推測できる範囲を超えて、トレーニング画像中の個々のオブジェクトに関する情報が実際に保持されていることを示す。
サンプルおよび集団レベルでのd'eja vuメモリ化を評価し,最大5000万枚の画像キャプチャーペアで訓練したOpenCLIPにとって重要であることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:55:35 GMT)
Local and Global Trend Bayesian Exponential Smoothing Models [44.4] 本稿では、加法的および乗法的指数的平滑化モデルの一般化とみなすことができる季節・ノンシーズン時系列モデルのファミリーについて述べる。
我々のモデルは、加法から乗法へのスムーズな変化が可能な大域的な傾向を持ち、線形局所的傾向と組み合わせられる。
我々は、標準的な指数的滑らか化モデルよりも複雑で柔軟なこれらのモデルを正確に適合させるために、最先端のベイズフィッティング技術を活用している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:45:43 GMT)
DE$^3$-BERT: Distance-Enhanced Early Exiting for BERT based on
Prototypical Networks [44.0] BERT(DE$3$-BERT)のための新しい遠隔拡張早期実行フレームワークを提案する。
我々は,古典的エントロピーに基づく地域情報と距離に基づくグローバル情報とを補完するハイブリッドエグジット戦略を実装した。
GLUEベンチマークの実験では、De$3$-BERTが最先端モデルより一貫して優れていることが示されている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:51:17 GMT)
ScribFormer: Transformer Makes CNN Work Better for Scribble-based
Medical Image Segmentation [43.2] 本稿では,ScribFormerと呼ばれるスクリブル制御型医用画像分割のためのCNN-Transformerハイブリッドソリューションを提案する。
提案したScribFormerモデルはトリプルブランチ構造、すなわちCNNブランチとTransformerブランチのハイブリッド、注意誘導型クラスアクティベーションマップ(ACAM)ブランチを備えている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:55:22 GMT)
A Data Generation Perspective to the Mechanism of In-Context Learning [42.7] In-Context Learning (ICL)は、大規模言語モデル(LLM)にコンテキストで学習する能力を与える。
経験的成功を奨励するにもかかわらず、ICLの基盤となるメカニズムは未だ不明である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:13:03 GMT)
A Reparameterized Discrete Diffusion Model for Text Generation [42.6] 本研究は, 離散拡散確率モデルと自然言語生成への応用に関する研究である。
離散拡散過程からサンプリングの代替的かつ等価な定式化を導出する。
本研究では,既存の拡散モデルに対して,テキスト生成能力を評価するための広範囲な実験を行った。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:59:26 GMT)
Safety Fine-Tuning at (Almost) No Cost: A Baseline for Vision Large
Language Models [42.4] 現在の視覚大言語モデル(VLLM)は、有害なコンテンツを生成する傾向があり、ジェイルブレイク攻撃に弱い。
最初の分析では、視覚言語指導の微調整中に有害なデータが存在することが原因であることが判明した。
この問題に対処するために、まず、様々な有害なカテゴリをカバーする視覚言語安全な命令追従データセットVLGuardをキュレートする。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:43:42 GMT)
Towards Engineering Fair and Equitable Software Systems for Managing
Low-Altitude Airspace Authorizations [40.0] 小型無人航空機システム (SUAS) は様々な用途に広く採用されている。
FAA(連邦航空局)は、そのミッションを安全に完了させるSUASの予測能力に基づいて、空域へのアクセスを制御するUAS Traffic Management(UTM)システムを開発している。
本稿では,自動システムにおいて考慮すべき要因について,利害関係者の視点を考察する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:55:07 GMT)
Probing Critical Learning Dynamics of PLMs for Hate Speech Detection [40.0] 広く採用されているにもかかわらず、事前訓練された言語モデルにおける様々な重要な側面がヘイトスピーチ検出におけるパフォーマンスにどのように影響するかは研究されていない。
我々は、さまざまな事前学習モデルの比較、種子の堅牢性、微調整設定、事前学習データ収集時間の影響について深く掘り下げる。
本分析では, プレトレーニング中の下流タスクの早期ピーク, より最近のプレトレーニングコーパスの採用による限られたメリット, 微調整時の特定のレイヤの重要性を明らかにした。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:23:51 GMT)
GPT-4V with Emotion: A Zero-shot Benchmark for Generalized Emotion
Recognition [39.9] GPT-4 with Vision (GPT-4V) は、様々なタスクにおいて顕著な視覚能力を示すが、その感情認識性能は十分に評価されていない。
5つのタスクをカバーする19のベンチマークデータセットに対して,GPT-4Vの定量的評価結果を示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:08:49 GMT)
Data Quality Matters: Suicide Intention Detection on Social Media Posts
Using a RoBERTa-CNN Model [39.1] 本稿では,最先端のRoBERTa-CNNモデルを用いた自殺検出手法を提案する。
RoBERTa-CNNは標準偏差0.0009で98%の平均精度を達成する。
また、平均AUC値は97.5%を超え、STDは0.0013である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:58:09 GMT)
Improving Multimodal Classification of Social Media Posts by Leveraging
Image-Text Auxiliary Tasks [38.9] 微調整型マルチモーダルモデルにおいて,主課題と協調して2つの補助的損失を用いることの有効性について検討した。
第一に、画像テキストコントラスト(ITC)は、投稿内の画像テキスト表現間の距離を最小化するように設計されている。
第2に、画像テキストマッチング(ITM)は、画像とテキスト間の意味的関係を理解するモデルの能力を高める。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:42:29 GMT)
Learning General Parameterized Policies for Infinite Horizon Average
Reward Constrained MDPs via Primal-Dual Policy Gradient Algorithm [38.9] 本稿では, 制約を適切に管理し, グローバルな最適政策の実現に向けて, 後悔の少ない保証を確実にする主元的二元的ポリシー勾配アルゴリズムを提案する。
具体的には,提案アルゴリズムが目的的後悔と制約違反境界を$tildemathcalO(T3/4)$で達成できることを実証する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:35:58 GMT)
Controlling Posterior Collapse by an Inverse Lipschitz Constraint on the
Decoder Network [37.4] 変分オートエンコーダ(VAE)は、過去数十年にわたって大きな成功を収めてきた深層生成モデルの1つである。
VAEは後部崩壊と呼ばれる問題に悩まされ、エンコーダが故障した時に発生する。
逆リプシッツニューラルネットワークをデコーダに導入し、このアーキテクチャに基づいて、後方崩壊の度合いをシンプルで明確な方法で制御できる新しい方法を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:21:36 GMT)
AnthroScore: A Computational Linguistic Measure of Anthropomorphism [37.3] 擬人化とは、人間のような特徴が非人間的存在に寄与することである。
言語における暗黙的擬人化の自動尺度である AnthroScore を提示する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:36:11 GMT)
Multiple-Crop Human Mesh Recovery with Contrastive Learning and Camera
Consistency in A Single Image [37.0] シングルイメージヒューマンメッシュリカバリ(HMR)の課題に取り組む
本稿では,シングルクロップHMRを新しいマルチクロップHMRパラダイムにシフトする。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:51:47 GMT)
Universal Post-Training Reverse-Engineering Defense Against Backdoors in
Deep Neural Networks [35.3] ユニバーサルメソッドは、攻撃者が使用する組み込みメカニズムに関係なく、バックドアを確実に検出および/または緩和しようとする。
本稿では,防衛されたDNNの内部特徴マップを利用してバックドアの検出とリバースエンジニアリングを行う新しい検出器について述べる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:15:19 GMT)
DeCoF: Generated Video Detection via Frame Consistency [34.3] 生成したビデオ検出のための,最初のオープンソースデータセットを明示的に構築する。
ビデオフレームの一貫性の原理に基づいて, 単純かつ効果的な検出モデル(DeCoF)を導入する。
ビデオ生成モデルが生成するビデオの検出におけるDeCoFの有効性を実験により実証した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:52:06 GMT)
Unlearnable Examples For Time Series [33.8] 未学習の例(UEs)とは、Deep Neural Networks(DNN)に学習できないように修正されたトレーニングサンプルを指す。
DNNによる不正なトレーニングから時系列データを保護するための最初のUE生成手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:48:47 GMT)
Predicting positive transfer for improved low-resource speech
recognition using acoustic pseudo-tokens [31.8] 我々は、ターゲット言語を、類似の高リソースの「ドナー」言語からのデータで補うことが役立つことを示す。
例えば、60時間ドナーのヒンディーが補充された低リソースのパンジャービの10時間のみの事前訓練は、70時間ドナーのパンジャービの70時間ドナーのほぼ同程度である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:54:03 GMT)
Characterization of the Distortion-Perception Tradeoff for Finite
Channels with Arbitrary Metrics [31.4] 有限アルファベットチャネル上の歪み知覚トレードオフについて検討する。
DP関数と最適再構成の計算は,一連の線形プログラミング問題の解法と等価であることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 21:17:15 GMT)
Human-Centered Privacy Research in the Age of Large Language Models [31.4] このSIGは、使用可能なセキュリティとプライバシ、人間とAIのコラボレーション、NLP、その他の関連するドメインの背景を持つ研究者を集めて、この問題に対する見解と経験を共有することを目的としている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:32:45 GMT)
Context-Former: Stitching via Latent Conditioned Sequence Modeling [30.9] 決定変換器(DT)は、決定をシーケンスモデリングとして抽象化し、オフラインのRLベンチマークで競合性能を示す。
本稿では,文脈情報に基づく模倣学習(IL)とシーケンスモデリングを統合したContextFormerを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:45:58 GMT)
MLIC++: Linear Complexity Attention-based Multi-Reference Entropy
Modeling for Learned Image Compression [30.7] 我々はMEM++を導入し、潜在表現に固有の様々な相関関係をキャプチャする。
MEM++は最先端のパフォーマンスを実現し、PSNRのVTM-17.0と比較して、KodakデータセットのBDレートを13.39%削減した。
MLIC++はリニアGPUメモリを解像度で表示し、高解像度の画像符号化に非常に適している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:12:10 GMT)
Agnostic Sample Compression Schemes for Regression [30.5] 他のすべての$ell_p$損失に対して、$pin (1,infty)$に対して、有界サイズの正確な圧縮スキームは存在しないことを示す。
$ell$ロスの場合、すべての関数クラスは、脂肪散乱次元における大きさの近似的な圧縮スキームを許容するだろうか?
論文参考訳(メタデータ) (Sat, 3 Feb 2024 21:49:19 GMT)
Talk2Care: Facilitating Asynchronous Patient-Provider Communication with
Large-Language-Model [30.0] LLMを利用したコミュニケーションシステムTalk2Careを,高齢者と医療提供者向けに開発した。
高齢者に対しては,音声アシスタント(VA)の利便性とアクセシビリティを活用し,効果的な情報収集のためのLLMを利用したVAインタフェースを構築した。
その結果,Talk2Careはコミュニケーションプロセスを促進し,高齢者の健康情報を充実させ,提供者の努力と時間を著しく節約できることがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:32:56 GMT)
Data Contamination Quiz: A Tool to Detect and Estimate Contamination in
Large Language Models [29.6] 大規模言語モデル(LLM)におけるデータ汚染を簡易かつ効果的に検出する手法を提案する。
データの汚染検出を複数項目の質問としてフレーム化し、各データセットインスタンスの3つの摂動バージョンを作成するクイズフォーマットを考案する。
生成された摂動バージョンは、元のインスタンスとともにDCQのオプションを形成し、提供された選択が正しくない可能性を調整した追加オプションを提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 18:31:30 GMT)
Exploring the Robustness of Task-oriented Dialogue Systems for
Colloquial German Varieties [29.0] 我々は、意図認識とスロット充足のための共同モデルを英語で訓練し、それを他の言語に適用する。
英語の品種に関する先行研究に触発されて、ドイツ語の文を口語形式に変換する摂動規則を手作業で作成し、評価する。
ToDシステムでは,口語品種に適用した場合,意図認識性能を維持し,平均精度で6%(4.62ポイント)の精度が低下することが実証された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:16:43 GMT)
RobustTSF: Towards Theory and Design of Robust Time Series Forecasting
with Anomalies [28.6] 汚染データからロバストな予測モデルを自動的に学習する手法を開発した。
そこで本研究では,ロバストな予測モデルを学習するための単純かつ効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:13:09 GMT)
Break the Sequential Dependency of LLM Inference Using Lookahead
Decoding [27.9] Lookahead decodingは、大規模言語モデル(LLM)のための正確な並列デコーディングアルゴリズムである。
実装により,MT-benchでは1.8倍,コード補完タスクでは4倍まで高速に自動回帰復号を行うことができる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:37:50 GMT)
Learning Causal Representations from General Environments:
Identifiability and Intrinsic Ambiguity [27.6] 一般的な環境から得られたデータに基づいて,最初の識別可能性を示す。
線形因果モデルでは、因果グラフは完全復元可能であるが、潜伏変数は閉ノード曖昧性(SNA)までしか識別できないことを示す。
また,SNAまでの地下構造モデルを確実に復元するアルゴリズムである texttLiNGCReL を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:56:00 GMT)
Graph Neural Networks with a Distribution of Parametrized Graphs [27.4] 複数のグラフをパラメータ化して生成するために潜在変数を導入する。
予測最大化フレームワークにおいて,ネットワークパラメータの最大推定値を得る。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:45:45 GMT)
LLIC: Large Receptive Field Transform Coding with Adaptive Weights for
Learned Image Compression [27.0] 学習画像圧縮(LLIC)のための適応重み付き大規模受容場変換符号化を提案する。
学習した画像圧縮コミュニティではじめて、控えめな複雑さを維持しながら冗長性を高めるために、カーネルベースの奥行きに関する大規模な畳み込みを導入しました。
また,大規模カーネルの潜在能力を十分に活用するために,改良されたトレーニング手法についても検討した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:13:07 GMT)
Translation Errors Significantly Impact Low-Resource Languages in
Cross-Lingual Learning [26.5] 本研究では,翻訳の不整合が存在し,XNLIの低リソース言語に不均等に影響を及ぼすことを示す。
このような矛盾を識別するために,人間翻訳テキストと機械翻訳ターゲットテキストにおけるゼロショット評価の差を計測する手法を提案する。
また,Hindi と Urdu という2つの言語に対して,人間が翻訳したテストインスタンスを手動で再注釈することで,翻訳エラーが存在することも確認した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:22:51 GMT)
Deep Semantic-Visual Alignment for Zero-Shot Remote Sensing Image Scene
Classification [26.3] ゼロショット学習(ZSL)は、トレーニング中に見えない新しいクラスを識別する。
以前のZSLモデルは、主に言語モデルから抽出された手作業でラベル付けされた属性や単語の埋め込みに依存し、見受けられるクラスから新しいクラスに知識を伝達する。
本稿では,視覚的に検出可能な属性を自動的に収集することを提案する。属性と画像のセマンティック・視覚的類似性を記述することで,クラスごとの属性を予測する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:18:49 GMT)
Rendering Graphs for Graph Reasoning in Multimodal Large Language Models [25.8] 本稿では,視覚情報をグラフ推論タスクに組み込む第一歩として,新しいベンチマークGITQAを提案する。
我々は、最先端のマルチモーダルLLMを用いて、GITQAベンチマークで広範な実験を行う。
その結果,テキスト情報と視覚情報の組み合わせは,一つのモダリティを単独で使用するよりも優れていた。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 12:19:47 GMT)
Robust Multi-Task Learning with Excess Risks [25.8] マルチタスク学習(MTL)は、全てのタスク損失の凸結合を最適化することにより、複数のタスクのジョイントモデルを学ぶことを検討する。
既存の方法は適応的な重み更新方式を用いており、各損失に基づいてタスク重みを動的に調整し、困難なタスクを優先順位付けする。
本稿では,過度リスクに基づくタスクバランス手法であるMulti-Task Learning with Excess Risks (ExcessMTL)を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:46:14 GMT)
GPT-4V as Traffic Assistant: An In-depth Look at Vision Language Model
on Complex Traffic Events [25.5] 交通事故、特に交通事故の認識と理解は、インテリジェントな交通システムと車両の領域における最重要課題である。
GPT-4Vのような大規模視覚言語モデル(VLM)の出現により、この問題に対処するための革新的なアプローチが導入された。
我々は,GPT-4Vが,ある種の古典的交通イベントにおいて,顕著な認知,推論,意思決定能力を示すことを観察した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:38:25 GMT)
Precise Knowledge Transfer via Flow Matching [24.8] 我々はこのフレームワークをフローマッチングを用いた知識伝達(FM-KT)と呼ぶ。
FM-KTは任意の形態(バニラKD、DKD、PKD、DISTなど)のメートル法に基づく蒸留法と統合することができる。
提案手法のスケーラビリティと最先端性能を,関連する比較手法で実証的に検証した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:59:51 GMT)
Unsupervised Contrast-Consistent Ranking with Language Models [24.7] 言語モデルはランキングベースの知識を含み、コンテキスト内ランキングタスクの強力な解法である。
我々は、言語モデルのランキング知識を引き出すために、ペアワイズ、ポイントワイズ、リストワイズの各テクニックを比較した。
注意深いキャリブレーションと制約付きデコーディングであっても、プロンプトベースのテクニックは、必ずしもそれらが生成するランキングにおいて自己整合であるとは限らない。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:52:02 GMT)
Quality and Trust in LLM-generated Code [24.4] コード生成モデルの正確性を評価するためのフレームワークを開発する。
私たちのコントリビューションは、言語モデルによって生成された現在のコードの使用において、より良いキャリブレーションの意思決定につながるでしょう。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:52:28 GMT)
Rethinking the Starting Point: Enhancing Performance and Fairness of
Federated Learning via Collaborative Pre-Training [23.9] 本稿では,コラボレーティブな事前学習手法であるCoPreFLを提案する。
我々の事前学習アルゴリズムのキーとなるアイデアは、下流の分散シナリオを模倣し、予期せぬFLタスクに適応できるメタラーニング手順である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:58:43 GMT)
Low-Tubal-Rank Tensor Recovery via Factorized Gradient Descent [22.8] 本稿では,Burer-Monteiro法に類似した因子分解法に基づく効率的かつ効果的な低ツバルテンソル回収法を提案する。
我々は,FGDのノイズフリーおよび雑音条件下での収束を確保するために,厳密な理論的解析を行う。
提案手法は,より高速な計算速度とより小さい収束誤差の観点から,複数のシナリオにおいて優れた性能を示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:47:42 GMT)
S-NeRF++: Autonomous Driving Simulation via Neural Reconstruction and
Generation [22.6] S-NeRF++は神経再構成に基づく革新的な自律運転シミュレーションシステムである。
S-NeRF++は、nuScenesやradianceなど、広く使われている自動運転データセットでトレーニングされている。
システムは、ノイズとスパースLiDARデータを効果的に利用して、トレーニングを洗練し、奥行きの外れ値に対処する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:35:42 GMT)
Discovering Symmetry Breaking in Physical Systems with Relaxed Group
Convolution [22.6] 我々は、リラックスしたグループ畳み込みを用いてデータの非対称性を学習することに集中する。
我々は、様々な物理系において解釈可能で物理的に意味のある様々な対称性を破る要因を明らかにする。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:48:50 GMT)
Nonlinear subspace clustering by functional link neural networks [22.5] フィードフォワードニューラルネットワークに基づくサブスペースクラスタリングは、いくつかの高度なサブスペースクラスタリングアルゴリズムよりも優れたクラスタリング精度を提供することを示した。
我々は,データサンプルを非線形領域に変換するために,関数型リンクニューラルネットワークを用いる。
本稿では,線形サブスペースクラスタリング手法と関数型リンクニューラルネットワークサブスペースクラスタリング手法を組み合わせた凸結合サブスペースクラスタリング手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:01:21 GMT)
Off-Policy Evaluation of Slate Bandit Policies via Optimizing
Abstraction [22.2] 政策がスレートとして知られる多次元動作を選択する場合のスレート・コンテクスト・バンドイットの問題について検討する。
Inverse Propensity Scoring (IPS) の典型的な推定器は、大きな作用空間のためにかなりのばらつきに悩まされる。
我々は,低次元スレート抽象空間における重み付けを規定するラテントIPS (LIPS) と呼ばれる,スレート包帯のOPEの新しい推定器を開発した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:38:09 GMT)
RIDERS: Radar-Infrared Depth Estimation for Robust Sensing [22.1] 逆気象条件は正確な深度推定に重大な課題をもたらす。
本研究では,ミリ波レーダと単眼赤外線サーマルカメラを融合させて,ロバストな距離推定手法を提案する。
本手法は、曖昧さと不一致の課題に対処することにより、異常な視覚的品質と正確な計量推定を実現する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:14:43 GMT)
SASSL: Enhancing Self-Supervised Learning via Neural Style Transfer [22.0] SASSL: 自己監視学習のためのスタイル拡張は、ニューラルスタイル転送に基づく新しい拡張技術である。
提案手法は,既存の自己教師型手法と比較して,ImageNet上のトップ1分類精度を最大2$%向上させる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:10:16 GMT)
Realizable Learning is All You Need [21.3] 実現可能かつ不可知的な学習可能性の同値性は、学習理論における基本的な現象である。
実現可能かつ不可知な学習可能性の同値性を説明する最初のモデルに依存しないフレームワークを提示する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:55:16 GMT)
Seeing is not always believing: The Space of Harmless Perturbations [21.1] 深層ニューラルネットワークの文脈では、無害な摂動空間の存在を示し、摂動はネットワークの出力を完全に変更しない。
プライバシー保護データ利用における無害摂動の適用について検討する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:22:07 GMT)
Do Moral Judgment and Reasoning Capability of LLMs Change with Language?
A Study using the Multilingual Defining Issues Test [21.1] 我々は英語を超えて5つの新しい言語(中国語、ヒンディー語、ロシア語、スペイン語、スワヒリ語)に拡張する。
本研究は, ヒンディー語, スワヒリ語, スペイン語, ロシア語, 中国語, 英語に比較して, すべてのモデルに対する道徳的推論能力は, ヒンディー語, スワヒリ語に比較して有意に劣っていることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 12:52:36 GMT)
SemPool: Simple, robust, and interpretable KG pooling for enhancing
language models [21.1] 知識グラフ(KG)の有用な意味を学習する簡単なグラフプーリング手法を提案する。
SemPoolと呼ばれるこの手法は、事前訓練されたLMを用いてKGの事実を表現し、それらの意味情報を収集し、LMの異なる層で融合する。
実験の結果,回答情報がKGから欠落している場合,SemPoolは最先端のGNNベースの手法を平均2.27%上回ることがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:03:51 GMT)
DrawTalking: Building Interactive Worlds by Sketching and Speaking [20.8] 我々はDrawTalkingを紹介した。DrawTalkingは、ユーザがスケッチや講演によってインタラクティブな世界を構築することを可能にするための、プロトタイプシステムである。
このアプローチはユーザコントロールと柔軟性を強調し、コードを必要としないプログラミングのような機能を提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:23:01 GMT)
Relabeling Minimal Training Subset to Flip a Prediction [20.7] トレーニングポイントの2%未満を許容することは、常に予測を覆すことができる。
我々は,$|mathcalS_t|$がトレーニングセットの雑音比と高い相関を示し,$|mathcalS_t|$は予測確率と相関するが相補的であることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:28:51 GMT)
Experimentally ruling out joint reality based on operational
completeness [20.6] 本報告では, 単一2レベルシステムにおける2つの観測装置の連立現実が, 操作完全性の仮定と相容れないことを確認するためのデバイス非依存の実験を報告する。
我々の結果は、量子古典的境界線を規定する基本的な限界を押し上げ、他のシナリオで関連する問題を探索する方法を舗装する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:00:09 GMT)
Revisiting Generative Adversarial Networks for Binary Semantic
Segmentation on Imbalanced Datasets [20.5] 異常な舗装面条件検出は、舗装画像上の異常状態を表す画素を自動的に検出することを目的としている。
画素レベルでの舗装画像の異常領域検出のための条件付き生成適応ネットワークに基づくディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:24:40 GMT)
Query-decision Regression between Shortest Path and Minimum Steiner Tree [20.1] 本稿では,最短経路問題とSteiner木問題に焦点をあてる。
我々は、スコアリングモデルを構築するための実現可能な仮説空間の設計に関する理論的知見を提供する。
実験により,そのような問題を統計的に有意な程度に解決できることが示唆された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:05:01 GMT)
Panacea: Pareto Alignment via Preference Adaptation for LLMs [20.0] Panaceaは、多次元の選好最適化問題としてアライメントを再構築する革新的なアプローチである。
主要な課題は、モデルの振舞いを導くために低次元の嗜好ベクトルを使うことである。
パナセアは特異値分解(SVD)に基づく低ランク適応を使用するように設計されている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:01:04 GMT)
Don't Label Twice: Quantity Beats Quality when Comparing Binary
Classifiers on a Budget [19.9] 特定のデータポイントの複数のノイズラベルを、過半数の投票でよりノイズの少ないラベルに集約するのは、一般的なプラクティスです。
従来の知恵に反する定理を証明します。
機械学習ベンチマークの設計における研究の意義について論じる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:40:41 GMT)
Multi-Level Feature Aggregation and Recursive Alignment Network for
Real-Time Semantic Segmentation [19.8] 我々は,MFARANet(Multi-level Feature Aggregation and Recursive Alignment Network)を提案する。
MFARANetは、リアルタイム推論速度で高いセグメンテーション精度を達成することを目的としている。
特に、CityscapesとCamVidデータセットの最先端のリアルタイム手法よりも、スピードと精度のバランスが良くなっています。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:51:17 GMT)
Polyp-DAM: Polyp segmentation via depth anything model [18.8] 本稿では,ポリプセグメンテーションモデルに先立って深度を提供するためにDAM(Depth Anything Model)を活用することで,ポリプセグメンテーションモデリングの新しい視点を開拓する。
入力されたポリプ画像は、最初に凍結されたDAMを通過して深度マップを生成する。
深度マップと入力されたポリプ画像は、マルチスケールの畳み込みニューラルネットワークに入力され、セグメント化された画像を生成する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:19:54 GMT)
Causal Bayesian Optimization via Exogenous Distribution Learning [18.7] 本稿では,内因性変数の分布を学習するための新しい手法を提案する。
代理モデルにおける構造的因果モデルの近似精度を向上させる。
異なるデータセットとアプリケーションの実験により,提案手法の利点が示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:14:54 GMT)
On the Inherent Privacy Properties of Discrete Denoising Diffusion
Models [18.7] 本稿では、離散拡散モデルに固有のプライバシー保護の先駆的な理論的探索について述べる。
我々のフレームワークは、トレーニングデータセット内の各データポイントの潜在的なプライバシー漏洩を解明する。
当社のバウンダリは、$$$サイズのデータポイントによるトレーニングが、プライバシー漏洩の急増につながっていることも示しています。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:24:38 GMT)
Collaborative Agents for Software Engineering [18.4] コードレビューのための新しいマルチエージェントベースのシステムであるCodeAgentを紹介する。
CodeAgentは自律的で、マルチエージェントで、大規模言語モデル駆動である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:43:14 GMT)
Beyond the Limits: A Survey of Techniques to Extend the Context Length
in Large Language Models [18.3] 大規模言語モデル(LLM)は、コンテキストの理解、論理的推論への関与、応答の生成など、優れた機能を示している。
本調査は,LLMの配列長を拡張するために考案された最近の手法と手法の包括的レビューを提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:20:02 GMT)
Interpreting Graph Neural Networks with In-Distributed Proxies [18.3] GNNの説明可能性のための一般的なパラダイムは、ラベルを元のグラフと比較することで説明可能な部分グラフを特定することである。
この課題は、トレーニングセットの元のグラフから説明可能なサブグラフのセットへの相当な分布シフトのため、難しい。
本稿では,学習データの分布を示す説明可能な部分グラフのプロキシグラフを生成する手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:19:02 GMT)
How well do LLMs cite relevant medical references? An evaluation
framework and analyses [18.2] 大規模言語モデル(LLM)は現在、様々な臨床領域の医療的問題に答えるために使用されている。
本稿では、LCMが生成するソースは、実際にそれらが生成するクレームをサポートしますか?
GPT-4は, 医師会の88%の時間と一致し, 情報源の妥当性を高い精度で検証できることを実証した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:44:57 GMT)
Eliminating Information Leakage in Hard Concept Bottleneck Models with
Supervised, Hierarchical Concept Learning [18.0] 概念ボトルネックモデル(Concept Bottleneck Models、CBM)は、人間の理解できない概念で特徴やラベルをブリッジすることで、解釈可能で介入可能な予測を提供することを目的としている。
CBMは情報漏洩に悩まされ、概念以外の意図しない情報がその後のラベル予測にリークされる。
本稿では,CBMの新たなパラダイム,すなわちSupCBMを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:50:58 GMT)
Predictable Reinforcement Learning Dynamics through Entropy Rate
Minimization [17.8] 強化学習(RL)では、エージェントは予測可能な行動を示すインセンティブを持たない。
予測可能性を考慮したRL(Predictability-Aware RL)と呼ばれるRLエージェントの予測可能な振る舞いを誘導する新しい手法を提案する。
平均報酬目標としてエントロピー率を定式化する方法を示し,そのエントロピー報酬関数は政策依存であるため,アクション依存のサロゲートエントロピーを導入する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 12:25:29 GMT)
Zero-Shot End-to-End Spoken Language Understanding via Cross-Modal
Selective Self-Training [17.8] 音声と音声のペアを使わずにエンドツーエンドの言語理解を学習するテクスツロショットE2E SLUを提案する。
CMSSTは3つのモード(音声、テキスト、セマンティクス)の結合空間にクラスタリングすることで不均衡に取り組み、選択ネットワークでラベルノイズを処理する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:24:46 GMT)
More Agents Is All You Need [17.6] 単にサンプリング・アンド・投票方式によって,大規模言語モデル(LLM)の性能は,エージェントの数がインスタンス化されるに従ってスケールすることがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:55:24 GMT)
From Synthetic to Real: Unveiling the Power of Synthetic Data for Video
Person Re-ID [15.8] クロスドメインビデオに基づく人物再識別(Re-ID)の新たな課題について検討する。
合成ビデオデータセットをトレーニングのソースドメインとし、実世界のビデオを使ってテストする。
クロスドメイン設定における実際のデータよりも、合成データがより優れていることに驚きます。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:19:21 GMT)
Generative Visual Compression: A Review [15.8] 生成的視覚圧縮の最近の進歩を概観し、大きな可能性と有望な応用について述べる。
特に、深層生成モデルを用いた視覚データ圧縮手法を概観し、コンパクトな表現と高忠実度再構成をいかに実現できるかを概観する。
我々は、機械ビジョンとインテリジェント分析のための関連生成圧縮技術を一般化する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:08:39 GMT)
Frequency Explains the Inverse Correlation of Large Language Models'
Size, Training Data Amount, and Surprisal's Fit to Reading Times [15.7] 近年の研究では、トランスフォーマーに基づく言語モデルが大きくなり、非常に大量のデータで訓練されているため、その推定結果が自然主義的な人間の読解時間に適合していることが示されている。
本稿では,これら2つの傾向の根底にある説明要因として,単語頻度が重要であることを示す一連の分析結果を示す。
その結果,トランスフォーマーをベースとした言語モデルによる推定は,稀な単語を予測するために学習する超人的に複雑な関連性から,人間の期待から逸脱していることがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:22:54 GMT)
Parameter-Efficient Fine-Tuning for Pre-Trained Vision Models: A Survey [15.6] パラメータ効率のよい微調整(PEFT)を研究中
PEFTは最小パラメータ修正による完全微調整の性能を上回ることを目指している。
本調査は視覚的PEFTの総合的概要と今後の方向性を提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:12:20 GMT)
Trustworthiness of $\mathbb{X}$ Users: A One-Class Classification
Approach [15.2] 本稿では,$mathbbX$ユーザ分類のためのサブスペース学習方式を提案する。
サブスペースサポートベクトルデータ記述のための新しい正規化用語も導入する。
実験結果から,SSVDDの導入した正規化項の性能は,ベースラインモデルと比較して優れていた。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:14:33 GMT)
Context-aware Adversarial Attack on Named Entity Recognition [15.0] 本研究では,文脈対応型対向攻撃法について検討し,モデルのロバスト性について検討する。
具体的には、エンティティを認識するために最も情報に富む単語を摂動し、敵の例を作成することを提案する。
実験と分析により,本手法は強いベースラインよりも間違った予測を下すのに有効であることが示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:11:11 GMT)
A Survey on Graph Condensation [14.9] グラフ凝縮(GC)は、グラフデータのエスカレーション量から生じる課題に対処するソリューションとして登場した。
GCをより深く理解し、他の関連するトピックと区別するために、GCの正式な定義を示し、分類を確立します。
我々は、課題と限界に対処し、今後の方向性を概説し、この分野における今後の研究を促すための簡潔なガイドラインを提供することで、結論付けます。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:50:51 GMT)
Emergency Computing: An Adaptive Collaborative Inference Method Based on
Hierarchical Reinforcement Learning [14.9] センシング,通信,計算,キャッシュ,インテリジェンスを備えた緊急ネットワーク(E-SC3I)を提案する。
このフレームワークには、緊急コンピューティング、キャッシュ、統合通信とセンシング、インテリジェンス強化のためのメカニズムが含まれている。
本稿では,特に緊急コンピューティングに焦点をあて,階層的強化学習に基づく適応型協調推論手法(ACIM)を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:28:35 GMT)
Metric Space Magnitude for Evaluating the Diversity of Latent
Representations [14.5] 我々は,潜伏表現の内在的多様性の等級に基づく尺度群を開発する。
異なる領域とタスクからなる実験スイートにおいて,提案手法の有用性と優れた性能を示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:13:50 GMT)
EffiBench: Benchmarking the Efficiency of Automatically Generated Code [13.9] GPT-4-turboは最も効率的なコードを生成し、Palm-2-chat-bison、Claude-instant-1、Gemini-pro、GPT-4、GPT-3.5を著しく上回っている。
GPT-4-turbo生成コードの平均実行時間は、標準解の1.69倍と45.49倍である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:24:39 GMT)
Understanding Time Series Anomaly State Detection through One-Class
Classification [13.8] 本稿では,一級分類(OCC)による時系列異常検出問題の再検討と定義を試みる。
まず、プロセスと仮説テストを用いて「時系列異常状態検出問題」とその対応する異常を厳密に定義する。
そして、時系列分類データセットを用いて、問題に対応する人工データセットを構築する。
我々は38個の異常検出アルゴリズムをコンパイルし、いくつかのアルゴリズムを修正してこの問題に対処する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:43:04 GMT)
DocChecker: Bootstrapping Code Large Language Model for Detecting and
Resolving Code-Comment Inconsistencies [13.8] DocCheckerは、コードとそれに伴うコメントの違いを検出し、修正するツールである。
コードとコメントの不一致を識別する能力があり、合成されたコメントを生成することもできる。
Inconsistency Code-Comment Detectionタスクでは72.3%の精度で、最先端の新たな結果が得られる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:36:33 GMT)
Unveiling Latent Causal Rules: A Temporal Point Process Approach for
Abnormal Event Explanation [13.7] 本稿では,観測事象を説明するために,「if-then」論理規則を探索する自動手法を提案する。
我々はこれを達成するために期待最大化(EM)アルゴリズムを用いる。
提案手法は,ルールの発見と根本原因の同定の両方において,正確な性能を示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:21:33 GMT)
SOCIALITE-LLAMA: An Instruction-Tuned Model for Social Scientific Tasks [13.6] オープンソースでインストラクションをチューニングしたLlamaであるSocialite-Llamaを紹介します。
20種類の社会科学タスクにおいて、Socialite-LlamaはLlamaのパフォーマンスを改善し、最先端のマルチタスク微調整モデルのパフォーマンスをマッチまたは改善する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:33:16 GMT)
One Graph Model for Cross-domain Dynamic Link Prediction [13.1] DyExpertはクロスドメインリンク予測のための動的グラフモデルである。
特定の下流グラフの進化パターンを学ぶために、歴史的に進化したプロセスを明示的にモデル化することができる。
DyExpertは多様なドメインにわたる広範な動的グラフによって訓練されている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:29:01 GMT)
Analyzing the Evaluation of Cross-Lingual Knowledge Transfer in
Multilingual Language Models [12.7] その結果,多言語モデルの高性能化は,実際の言語知識の伝達を必要としない要因が主な原因であることが示唆された。
具体的には、特に低リソース言語において、言語間で転送されたものは、主にデータアーチファクトとバイアスです。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:41:52 GMT)
Enhancing Complex Question Answering over Knowledge Graphs through
Evidence Pattern Retrieval [12.6] 証拠事実間の構造的依存関係の重要性を過小評価する。
本稿では,部分グラフ抽出時の構造的依存関係を明示的にモデル化するEvidence Pattern Retrievalを提案する。
実験結果から, IR-KGQA法において, EPRに基づくアプローチによりF1スコアが大幅に向上したことが明らかとなった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:54:13 GMT)
Position Paper: The Landscape and Challenges of HPC Research and LLMs [12.6] 大規模言語モデル(LLM)はディープラーニングの分野に革命をもたらした。
エンコーダデコーダモデルとプロンプトベースのテクニックは、自然言語処理とコードベースのタスクにとって大きな可能性を示している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:21:07 GMT)
Multimodal Co-orchestration for Exploring Structure-Property
Relationships in Combinatorial Libraries via Multi-Task Bayesian Optimization [12.4] 本稿では,スペクトルや画像などの複雑な可観測物を用いて測定を行うための協調手法を提案し,実装する。
この手法は,変分オートエンコーダによる次元性低減と,潜在空間構造制御のための表現学習の組み合わせに依存する。
提案したフレームワークは、測定された信号の複数の測定モードと任意の寸法に拡張することができる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:03:17 GMT)
Long-range Meta-path Search on Large-scale Heterogeneous Graphs [12.3] Long-range Meta-path Search through Progressive Smpling (LMSPS) は異種グラフへの長距離依存性を利用するための自動フレームワークである。
対象ノードタイプに関連する全てのメタパスを持つ検索空間を開発する。
プログレッシブサンプリングアルゴリズムを用いることで、LMSPSはホップに依存しない時間複雑さで探索空間を動的に縮小する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:14:48 GMT)
Composite Active Learning: Towards Multi-Domain Active Learning with
Theoretical Guarantees [12.3] アクティブラーニング(AL)は、ラベルに最も有用なデータポイントを選択することで、固定されたラベル付け予算内でのモデルパフォーマンスを改善することを目的としている。
マルチドメインALのための合成能動学習(CAL)と呼ばれる最初の一般手法を提案する。
理論解析により,本手法は現在のAL法よりも優れた誤差境界が得られることが示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:22:18 GMT)
SynthDST: Synthetic Data is All You Need for Few-Shot Dialog State
Tracking [12.3] ダイアログ状態追跡(DST)研究の有望な進路として,Large Language Models (LLMs) を用いたインコンテキスト学習が登場している。
LLM を利用した DST に適したデータ生成フレームワークである DST を提案する。
提案手法では,DSTアノテーションを用いた自然な,一貫性のある,自由な対話を合成するために,対話スキーマと手作りの対話テンプレートのみを必要とする。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:49:00 GMT)
Causal Strategic Learning with Competitive Selection [10.2] 複数の意思決定者の下で因果戦略学習におけるエージェント選択の問題について検討する。
最適な選択規則は、最適なエージェントを選択することと、エージェントの改善を最大化するためのインセンティブを提供することの間のトレードオフであることを示す。
我々は、真の因果パラメータを回復するために、すべての意思決定者がまとめて採用しなければならない協調プロトコルを提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:44:45 GMT)
Teacher-Student Learning based Low Complexity Relay Selection in
Wireless Powered Communications [10.2] 本稿では,マルチソース・マルチリレーRF-EHネットワークにおける連系選択,スケジューリング,電力制御問題について検討する。
まず、与えられたリレー選択に対するスケジューリングと電力制御の問題に対する最適解を得る。
次に、リレー選択問題を分類問題として定式化し、2つの畳み込みニューラルネットワーク(CNN)に基づくアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:22:41 GMT)
A Plug-in Tiny AI Module for Intelligent and Selective Sensor Data
Transmission [10.2] 本稿では、インテリジェントなデータ伝送機能を備えたセンシングフレームワークを実現するための新しいセンシングモジュールを提案する。
センサの近くに置かれる高効率機械学習モデルを統合する。
このモデルは,無関係な情報を破棄しながら,貴重なデータのみを送信するセンサシステムに対して,迅速なフィードバックを提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:41:39 GMT)
DRAGON: A Dialogue-Based Robot for Assistive Navigation with Visual
Language Grounding [10.0] DRAGONは対話システムと環境と自然言語を関連付ける能力を備えた誘導ロボットである。
ユーザからのコマンドを理解することで、DRAGONはユーザを地図上の望ましいランドマークに誘導し、環境を記述し、視覚的な観察から質問に答えることができる。
本研究は,DRAGONがユーザと円滑にコミュニケーションし,優れたガイド体験を提供し,ユーザと周囲環境を直感的に接続できることを実証するものである。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 21:06:44 GMT)
A Review and Comparison of AI Enhanced Side Channel Analysis [10.0] サイドチャネル分析(SCA)は、現代のコンピューティングシステムにおいて、プライバシーとセキュリティに対する明らかな脅威である。
我々は、サイドチャネル分析のための最新の最先端ディープラーニング技術、それらの背後にある理論、その実施方法について検討する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:33:24 GMT)
Knowledge Graph Driven Recommendation System Algorithm [10.0] KGLNと呼ばれる新しいグラフニューラルネットワークに基づくレコメンデーションモデルを提案する。
まず、グラフ内の個々のノード特徴をマージし、隣り合うエンティティの集約重みを調整するために、単層ニューラルネットワークを使用します。
モデルは、イテレーションを通じて単一のレイヤから複数のレイヤへと進化し、エンティティが広範囲にわたるマルチオーダー関連エンティティ情報にアクセスできるようにする。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:14:46 GMT)
An Efficient Knowledge Transfer Strategy for Spiking Neural Networks
from Static to Event Domain [9.9] スパイキングニューラルネットワーク(SNN)は時間的ダイナミクスが豊富であり、イベントベースのニューロモルフィックデータを処理するのに適している。
しかしながら、イベントベースのデータセットは通常、静的データセット以下である。
この小さなデータスケールにより、SNNはパフォーマンスを過度に調整し、制限する傾向にある。
本稿では,静的画像入力を確率的にイベントデータに置き換えるスライディングトレーニング戦略を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 11:34:05 GMT)
Towards Optimal Adversarial Robust Q-learning with Bellman
Infinity-error [9.9] 最近の研究は、国家の敵対的ロバスト性を探究し、最適ロバスト政策(ORP)の潜在的な欠如を示唆している。
我々はベルマン最適政策に適合する決定論的かつ定常なORPの存在を証明した。
この発見は、ベルマン・インフィニティ・エラーのサロゲートを最小限にして、一貫性のある敵対的ロバスト深度Q-Network(CAR-DQN)を訓練する動機となる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:25:33 GMT)
Zero-shot sketch-based remote sensing image retrieval based on
multi-level and attention-guided tokenization [9.9] 本研究では,マルチレベル・アテンション誘導トークン化を利用したゼロショット・スケッチに基づくリモートセンシング画像検索手法を提案する。
本手法は,既存のスケッチベースリモートセンシング画像検索技術よりも精度が高いことを示す。
より広範なアクセシビリティと研究のファシリテーションのために、この研究で使用されるコードとデータセットをオンラインで公開しました。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:11:14 GMT)
Simulation-Enhanced Data Augmentation for Machine Learning Pathloss
Prediction [9.7] 本稿では,機械学習パスロス予測のための新しいシミュレーション強化データ拡張手法を提案する。
本手法は,細胞被覆シミュレータから生成した合成データと,独立して収集した実世界のデータセットを統合する。
合成データの統合は、異なる環境におけるモデルの一般化可能性を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:38:08 GMT)
Cross-Lingual Transfer from Related Languages: Treating Low-Resource
Maltese as Multilingual Code-Switching [9.4] 我々は、アラビア語、イタリア語、英語からかなりの影響を受け、特にラテン語の文字で書かれたマルタ語に焦点を当てている。
単語レベルの語源を付加した新しいデータセットを提案する。
単語の語源に基づく条件翻訳は,非選択的なパイプラインで処理されたマルタ語やマルタ語による微調整よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:26:47 GMT)
Self-attention Networks Localize When QK-eigenspectrum Concentrates [9.4] 自己認識メカニズムは、現代の機械学習で一般的である。
2つの議論が、モデルのパフォーマンスに注意を向けるローカライゼーションを結び付けている。
我々は,小さな固有スペクトルの分散が注意を局所化させることを示した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:35:53 GMT)
XTSFormer: Cross-Temporal-Scale Transformer for Irregular Time Event
Prediction [9.2] イベント予測は、過去のイベントシーケンスに基づいて、将来のイベントの時間とタイプを予測することを目的としている。
その重要性にもかかわらず、連続するイベント間の時間間隔の不規則性、サイクルの存在、周期性、マルチスケールのイベント相互作用など、いくつかの課題が存在する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:33:39 GMT)
No Need to Look Back: An Efficient and Scalable Approach for Temporal
Network Representation Learning [9.2] 本稿では、新しい効率的なTGRLフレームワーク、No-Looking-Back(NLB)を紹介する。
NLBは「前向きの最近のサンプリング」戦略を採用しており、歴史的相互作用のバックトラックの必要性を回避している。
経験的評価は、NLBがリンク予測とノード分類の精度において最先端の手法と一致するか、あるいは超えていることを示している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:12:36 GMT)
ContactGen: Contact-Guided Interactive 3D Human Generation for Partners [9.1] 物理的接触の観点から3次元ヒューマンジェネレーションの新たな課題を導入する。
与えられたパートナーヒトは、相互作用の種類に応じて多様なポーズと異なる接触領域を持つことができる。
そこで本研究では,対話型3次元人間を,ガイド付き拡散フレームワークに基づいて生成する手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:22:40 GMT)
Heterogeneous Directed Hypergraph Neural Network over abstract syntax
tree (AST) for Code Classification [9.0] 我々は、ASTをヘテロジニアス指向ハイパーグラフ(HDHG)として表現し、コード分類のためのヘテロジニアス指向ハイパーグラフニューラルネットワーク(HDHGN)によるグラフ処理を提案する。
提案手法は, コード理解を改善し, 対の相互作用を超えた高次データ相関を表現できる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:15:20 GMT)
Investigating Content Planning for Navigating Trade-offs in
Knowledge-Grounded Dialogue [9.0] 応答生成の前に明確なコンテンツプランニングは、モデルがこの課題に対処するのに役立ちますか?
コンテンツプランニングは有望であることを示しているが、このトレードオフを実際にナビゲートできるかどうかについては、結果がまちまちだ。
自動測度への過度な適合と、これらの測度を人間の判断に向け、よりよく校正する必要があることから、これがどのように引き起こされるかについて議論する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:16:39 GMT)
Data Distribution Dynamics in Real-World WiFi-Based Patient Activity
Monitoring for Home Healthcare [8.9] 本稿では,在宅医療における日常活動のリアルタイムモニタリングにおけるWiFi信号の適用について検討する。
それは、高齢者介護のための堅牢でコンテキスト対応のWiFiセンシングシステムの現実的な開発を導くことを目的としている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:58:53 GMT)
Wavelet-Decoupling Contrastive Enhancement Network for Fine-Grained
Skeleton-Based Action Recognition [8.7] 本稿ではウェーブレット・アテンション・デカップリング(WAD)モジュールを提案する。
また,コントラスト学習によるトラジェクティブ特徴に対する注意を高めるために,FCEモジュールを提案する。
提案手法は最先端の手法と競合して動作し,微粒な動作を適切に識別することができる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:51:04 GMT)
SudokuSens: Enhancing Deep Learning Robustness for IoT Sensing
Applications using a Generative Approach [8.6] 本稿では、機械学習ベースのIoT(Internet-of-Things)アプリケーションにおいて、トレーニングデータの自動生成のための生成フレームワークであるSudokuSensを紹介する。
このフレームワークは、結果のディープラーニングモデルの堅牢性を改善し、データ収集が高価であるIoTアプリケーションを対象としている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:08:11 GMT)
RecNet: An Invertible Point Cloud Encoding through Range Image
Embeddings for Multi-Robot Map Sharing and Reconstruction [8.6] RecNetは深度画像に3Dポイントクラウドを投影し、エンコーダデコーダフレームワークを使用して圧縮し、その後レンジイメージを再構成する。
このユニークなアプローチは、同等の場所認識結果を達成するだけでなく、コンパクトな表現も維持する。
RecNetは、ナビゲーション、ローカライゼーション、マップマージ、その他の関連ミッションにおけるユーザビリティを探求するための画期的な方法である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:43:50 GMT)
Digital Video Manipulation Detection Technique Based on Compression Algorithms [8.3] 本稿では,H.264符号化における圧縮アルゴリズムの解析による法医学的手法を提案する。
Vector Support Machineは、ビデオが圧縮されたかどうかを正確に検出するモデルを作成するために使用される。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:05:27 GMT)
On the Trade-off between the Number of Nodes and the Number of Trees in
a Random Forest [8.3] 我々は、$n$変数の多数関数は、$n-T$が定数であれば、それぞれ大きさで$T$$$(n$)決定ツリーのバッグで表現できることを示した。
k$-out-of-n$関数に関する関連する結果も提示される。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 11:26:49 GMT)
Machine Unlearning in Large Language Models [8.1] 本稿では,大規模言語モデルに新しい機械学習フレームワークを導入する。
我々の目標は、LSMが有害、幻覚、あるいはプライバシーを侵害する応答を生じさせないようにすることです。
実験結果から,本手法はモデル性能を実質的に損なうことなく,学習対象を効果的に満たすことが示唆された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:14:56 GMT)
Benchmark for CEC 2024 Competition on Multiparty Multiobjective
Optimization [7.8] 競争は多人数多目的最適化問題(MPMOP)に焦点を当てている
その重要性にもかかわらず、MPMOPは従来の多目的最適化と比較してまだ検討されていない。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:14:03 GMT)
Memoria: Resolving Fateful Forgetting Problem through Human-Inspired
Memory Architecture [7.0] Memoriaは人工ニューラルネットワークのためのメモリシステムで、人間からインスピレーションを得ている。
従来の手法を超越したソートや言語モデリングといったタスクにおいて,メモリの有効性を実証した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:52:45 GMT)
A Novel Generator with Auxiliary Branch for Improving GAN Performance [7.0] 本稿では、2つの異なるブランチから得られた特徴を組み合わせることで、画像を生成する新しいジェネレータアーキテクチャを紹介する。
メインブランチの目標は、複数の残留ブロックを通り抜けて画像を生成することであり、補助ブランチは、前のレイヤの粗い情報を後層に伝達することである。
提案手法の優位性を証明するため, 各種標準データセットを用いた広範囲な実験を行った。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:27:44 GMT)
High-Dimensional Bayesian Optimization via Semi-Supervised Learning with
Optimized Unlabeled Data Sampling [6.9] $texttTSBO$には、教師モデル、ラベルなしデータサンプルラー、学生モデルが含まれている。
学生は、教師が予測した擬似ラベルを用いて、サンプリング者が生成したラベルなしのデータロケーションを訓練する。
$texttTSBO$は、厳格なラベル付きデータ予算の下で、いくつかのグローバル最適化タスクにおいて、サンプル効率が大幅に改善されたことを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:23:06 GMT)
Specious Sites: Tracking the Spread and Sway of Spurious News Stories at
Scale [6.9] 我々は1,334件の信頼できないニュースサイトで52,036件の物語を識別する。
本稿では,信頼できないニュースサイトから新たな物語を検出するために,我々のシステムをいかに活用できるかを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:14:57 GMT)
Prototypical Contrastive Learning through Alignment and Uniformity for
Recommendation [6.8] 提案するアンダーライン・アライメントとアンダーライン・ユニフォーマル性によるインダーライン型コントラスト学習について述べる。
具体的には、まず、原点グラフから異なる拡張点間の整合性を確保するために、潜時空間としてプロトタイプを提案する。
明示的な負の欠如は、インスタンスとプロトタイプ間の整合性損失を直接最適化することで、次元的な崩壊の問題が容易に生じることを意味する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:19:26 GMT)
Online Transfer Learning for RSV Case Detection [6.8] PVAW(Predictive Volume-Adaptive Weighting)は,新しいオンライン多元移動学習手法である。
PVAWはアンサンブルモデル内に動的重み付け機構を実装し、重みの自動調整を可能にする。
ピッツバーグ大学メディカルセンターで複数シーズンにわたって収集されたRSV(Respiratory Syncytial Virus)データを解析し,PVAWの有効性を実証した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:13:08 GMT)
PresAIse, An Enterprises Prescriptive AI Solution [6.5] 本稿は、IBM Researchのイニシアチブの概要であり、一連の規範的AIソリューションを提供することによって、これらの課題のいくつかに対処することを目的としている。
ソリューションスイートには、スケーラブルな因果推論方法、解釈可能な意思決定アプローチ、大規模言語モデルの統合が含まれている。
概念実証であるPresAIseは、非MLの専門家が自然言語インターフェースを介して規範的なAIモデルと対話できるようにすることで、ソリューションの可能性を示している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:23:08 GMT)
Vanilla Bayesian Optimization Performs Great in High Dimension [6.5] 高次元問題はベイズ最適化アルゴリズムのアキレスのヒールと見なされてきた。
既存のアルゴリズムが、モデルの複雑さを下げるレンズを通して、これらの退化にどのように対処しているかを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 18:19:46 GMT)
3D Rotation and Translation for Hyperbolic Knowledge Graph Embedding [6.5] 本研究では,3H-TH(ハイパーボリック空間における3次元回転と変換)と呼ばれる関係パターンを同時に捉える新しいモデルを提案する。
実験結果から, このモデルでは, 低次元空間における既存の最先端モデルよりも精度, 階層性, その他の関係パターンが優れていることが示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:35:31 GMT)
Bridging the Gaps: Learning Verifiable Model-Free Quadratic Programming
Controllers Inspired by Model Predictive Control [6.4] モデル予測制御(MPC)からインスピレーションを得た新しいパラメータ化コントローラを導入する。
コントローラは線形MPC問題の擬似プログラミング(QP)解法に似ており、コントローラのパラメータはDeep Reinforcement Learning(DRL)を介して訓練される。
提案したコントローラは, MPCに比べて計算効率が優れ, コントローラよりも学習するパラメータが少ない。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 11:32:26 GMT)
MasonPerplexity at Multimodal Hate Speech Event Detection 2024: Hate
Speech and Target Detection Using Transformer Ensembles [6.3] 本稿では,EACL 2024のケース2024におけるマルチモーダル・ヘイト・スピーチ・イベント検出における共有タスクに対するMasonPerplexityの提出について述べる。
サブタスクAにはXLM-roBERTa-largeモデル、サブタスクBにはXLM-roBERTa-base、BERTweet-large、BERT-baseを組み合わせたアンサンブルアプローチを用いる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:23:36 GMT)
MSPM: A Multi-Site Physiological Monitoring Dataset for Remote Pulse,
Respiration, and Blood Pressure Estimation [6.2] マルチサイト生理モニタリングデータセットについて述べる。
これは、カメラによる身体上のバイタルサインを同時に推定する研究を支援するために収集された最初のデータセットである。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:50:18 GMT)
SAMM (Segment Any Medical Model): A 3D Slicer Integration to SAM [6.2] 3次元スライダにおけるSAMの拡張であるSegment Any Medical Model (SAMM)を紹介する。
SAMMは完全なサイクルの0.6秒のレイテンシを実現し、ほぼリアルタイムで画像マスクを推測できる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:37:26 GMT)
Tackling Interference Induced by Data Training Loops in A/B Tests: A
Weighted Training Approach [6.0] 重み付けトレーニングと呼ばれる新しいアプローチを導入する。
このアプローチでは、治療データと制御データの両方に現れる各データポイントの確率を予測するために、モデルをトレーニングする必要がある。
本手法は, トレーニング分布の変化を起こさない全ての推定器において, 最小分散を達成できることを実証する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:44:15 GMT)
NeuV-SLAM: Fast Neural Multiresolution Voxel Optimization for RGBD Dense
SLAM [5.7] ニュートラルV-SLAMは,ニュートラル多分解能ボクセルをベースとした,新しい局所化とマッピングパイプラインである。
NeuV-SLAMは超高速収束とインクリメンタル展開機能によって特徴付けられる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:26:35 GMT)
GenFormer: A Deep-Learning-Based Approach for Generating Multivariate
Stochastic Processes [5.7] 本稿では,マルコフ状態列と時系列値のマッピングを学習するトランスフォーマーに基づくディープラーニングモデルを提案する。
GenFormerモデルを用いて,フロリダ州各地の風速データをシミュレーションし,リスク管理のための超越確率を計算する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 03:50:18 GMT)
Recommendations on Statistical Randomness Test Batteries for Cryptographic Purposes [5.5] 異なるアプリケーションのセキュリティは、そのような目的で生成されたシーケンスの良さと密接に関連している。
本研究は, 主試験電池の長所と短所を示すとともに, 使用指針を提示するものである。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:00:23 GMT)
Accelerating Look-ahead in Bayesian Optimization: Multilevel Monte Carlo
is All you Need [5.3] マルチレベルモンテカルロ(MLMC)を利用して、マルチステップルックアヘッド最適化法を改善する。
理論的研究は、1段階と2段階のルックアヘッド獲得関数の改善に焦点を当てている。
このアプローチはBOの文脈を超えて、様々な方法で一般化可能である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:24:30 GMT)
Decomposition-based and Interference Perception for Infrared and Visible
Image Fusion in Complex Scenes [4.9] 本稿では,分解に基づく干渉知覚画像融合法を提案する。
可視画像の画素を光透過の散乱度から分類し,画像の細部とエネルギー情報を分離する。
この洗練された分解により、複雑なシーンにあるより干渉するピクセルを識別するモデルが提案される。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:27:33 GMT)
AI in ESG for Financial Institutions: An Industrial Survey [4.9] 本稿では,ESGフレームワークの活性化におけるAIの必要性と影響を明らかにするために,産業環境を調査した。
調査では、分析能力、リスク評価、顧客エンゲージメント、報告精度など、ESGの主要な3つの柱にまたがるAIアプリケーションを分類した。
この論文は、ESG関連の銀行プロセスにおけるAI展開の倫理的側面を強調し、責任と持続可能なAIの衝動についても論じている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:14:47 GMT)
Physical Perception Network and an All-weather Multi-modality Benchmark
for Adverse Weather Image Fusion [4.4] マルチモーダル画像融合(MMIF)は、異なるモーダル画像からの補完情報を統合し、シーンの包括的かつ客観的な解釈を提供する。
既存のMMIF法には、現実のシナリオで異なる気象干渉に抵抗する能力がない。
我々は,極度気象条件下でのMMIF研究のベンチマークを確立した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:02:46 GMT)
Learning Structure-Aware Representations of Dependent Types [4.2] 我々は、さまざまな機械学習アプリケーションをサポートするのに十分な精巧で広範なAgdaプログラムプロテクションのデータセットを導入してリリースする。
本稿では,基本原理ではなく構造に基づく依存型プログラムを忠実に表現することを目的とした,新しいニューラルアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:56:37 GMT)
Bosehedral: Compiler Optimization for Bosonic Quantum Computing [4.2] Bosehedralは、Bosonic量子ハードウェア上の(ガウス)ボーソンサンプリングのための効率的なコンパイラ最適化フレームワークである。
プログラム解析と最適化をすべて高いアルゴリズムレベルで行うことにより、無限次元のクモードゲート行列を扱うという課題を克服する。
評価の結果,Bosehedral はプログラムサイズを大幅に削減できるが,高い近似精度を保ち,エンドツーエンドのアプリケーションの性能向上に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:29:41 GMT)
Position Paper: Why the Shooting in the Dark Method Dominates
Recommender Systems Practice; A Call to Abandon Anti-Utopian Thinking [4.1] テストするB'を見つけるためのベストプラクティスは、パフォーマンスを明示的にターゲットするのではなく、プロキシ尺度をターゲットにしている。
あるプロキシが他のオフラインよりも優れているかどうかを特定するための原則は存在しません。
本稿では,ディープラーニングスタックの非標準利用が,報酬最適化の推奨を解放する可能性を持っていることを論じる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:46:28 GMT)
Multimodal-Enhanced Objectness Learner for Corner Case Detection in
Autonomous Driving [4.0] 本稿では,未知クラスと未知クラスとの差を減らし,マルチモーダル・エンハンスド・オブジェクトネスの概念を導入する方法を提案する。
コーナケース検出のためのMENOL(Multimodal-Enhanced Objectness Learner)アプローチは,トレーニングコストの低い新しい授業のリコールを大幅に改善する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:47:03 GMT)
New dimensionless pseudo-spin pointer based on weak measurement: a
cost-effective scheme for precision measurement [4.0] 弱測定に基づく新しい次元無次元擬似スピンポインターを提案する。
光パラメータ推定の文脈において、パラメトリック分布のモーメントが実験的に得られることを示す。
実験費用の解約に加えて、光子計数に基づくポインターは弱い信号の検出に適している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:47:08 GMT)
Three-body scattering area for particles with infinite or zero
scattering length in two dimensions [4.0] 有限領域相互作用を持つゼロ温度希薄ボース気体の粒子あたりの基底状態エネルギーは、約$frachbar2 D 6mrho2$である。
我々は,多ボソン系の3体組換え率定数を$D$の虚部から導出した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:24:40 GMT)
Online Uniform Risk Times Sampling: First Approximation Algorithms,
Learning Augmentation with Full Confidence Interval Integration [3.9] デジタルヘルスにおいて、限られた治療予算を利用可能なリスク時間に割り当てる戦略は、ユーザの疲労を軽減するために不可欠である。
本稿では,近似アルゴリズムフレームワーク内でのオンライン一様リスク時間サンプリング問題について,初めて紹介する。
本稿では,この問題に対する2つのオンライン近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:36:59 GMT)
MorphPiece : A Linguistic Tokenizer for Large Language Models [3.8] 基礎となるテキストの形態的セグメンテーションにもとづく言語的に動機付けられたトークン化スキームであるMorphPieceを提案する。
このトークン化器(MorphGPTと呼ばれる)で訓練されたGPTスタイルの因果言語モデルは、様々な教師付きおよび教師なしのNLPタスクにおいて同等または優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:42:54 GMT)
CCSPNet-Joint: Efficient Joint Training Method for Traffic Sign
Detection Under Extreme Conditions [3.6] CCSPNetはContextual TransformerとCNNをベースにした効率的な特徴抽出モジュールである。
データ効率と一般化を改善するための共同トレーニングモデルCCSPNet-Jointを提案する。
実験により,CCSPNetは極端条件下での交通標識検出において最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:06:59 GMT)
Denoising Diffusion-Based Control of Nonlinear Systems [3.5] 本稿では,非線形力学系を制御するために,拡散確率モデル(DDPM)に基づく新しい手法を提案する。
DDPMは様々なサンプリングタスクで成功を収めた生成モデルの最先端技術である。
様々な非線形システムに対する我々のアプローチを数値的に研究し、理論的結果を検証する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:19:26 GMT)
Bringing order into the realm of Transformer-based language models for
artificial intelligence and law [3.2] トランスフォーマーベース言語モデル(TLM)は最先端技術として広く認識されている。
本稿は、法的領域におけるAI駆動問題とタスクに対するTLMベースの手法に関する最初の体系的な概要を提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:54:51 GMT)
TSIS: A Supplementary Algorithm to t-SMILES for Fragment-based Molecular
Representation [3.0] 本研究では t-SMILES ファミリーに補足アルゴリズム TSIS を導入する。
TSIS は t-SMILES で定義されたツリーを基盤データ構造として使用し続けており、SAFE モデルとは分離されている。
TSISモデルの性能はSAFEモデルよりも優れており、t-SMILESファミリーのツリー構造がいくつかの利点をもたらすことを示している。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:24:21 GMT)
Towards the Human Digital Twin: Definition and Design -- A survey [2.7] Human Digital Twins (HDTs) は、医療からスポーツまで幅広い分野において大きな可能性を持つ、急速に発展する技術である。
この調査は、HDTの分野における最近の進歩をまとめて、将来の開発者をガイドする。
本手法では,HDTの特性に基づく最初のクロスドメイン定義と,11つの重要な設計上の考慮事項を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:33:05 GMT)
On the Pauli Spectrum of QAC0 [2.6] 我々は、$mathsfQAC0$のパウリスペクトルが低度濃度を満たすと推測する。
我々はこの予想を、少なくとも$nO(1/d)$補助量子ビットを持つ深さ-d$,-size $mathsfQAC0$回路のクラスで証明する。
我々は新しい回路の低境界と学習結果を応用として得る。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:39:32 GMT)
Supervised and Unsupervised Deep Learning Approaches for EEG Seizure
Prediction [2.3] てんかんは世界中で5000万人以上の人に影響を与えており、世界でも有数の神経疾患の1つとなっている。
てんかん発作の発生を予測する能力は、てんかんの顔を持つ人のリスクやストレスを軽減する可能性がある。
入射前発作の前兆として, 正常脳波(preictal, pre-seizure)を検出する問題を定式化する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:20:19 GMT)
Feature Selection using the concept of Peafowl Mating in IDS [2.2] クラウドコンピューティングはインフラストラクチャベース、プラットフォームベース、ソフトウェアベースのサービスを提供します。
この技術の人気は、パフォーマンス、高いレベルのコンピューティング能力、低コストのサービス、スケーラビリティ、可用性、柔軟性にある。
クラウド環境におけるデータの入手性とオープン性は、サイバー攻撃の世界に対して脆弱である。
侵入検知システムを用いて攻撃を検知し、情報セキュリティを確保する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:04:49 GMT)
Automating SBOM Generation with Zero-Shot Semantic Similarity [2.2] Software-Bill-of-Materials (SBOM)は、ソフトウェアアプリケーションのコンポーネントと依存関係を詳述した総合的なインベントリである。
本稿では,破壊的なサプライチェーン攻撃を防止するため,SBOMを自動生成する手法を提案する。
テスト結果は説得力があり、ゼロショット分類タスクにおけるモデルの性能を示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 18:14:13 GMT)
Handling Delayed Feedback in Distributed Online Optimization : A
Projection-Free Approach [2.0] 大量のデータが局所的に連続的に生成されるように、エッジでの学習はますます重要になっている。
本稿では,B が遅延の和である O(sqrtB) の後悔境界を達成するために慎重に設計された,集中的および分散的設定のための2つのプロジェクションフリーアルゴリズムを提案する。
本研究では,実世界の問題において,既存の問題と比較することにより,アルゴリズムの性能を実験的に検証する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:43:22 GMT)
Analyzing Sentiment Polarity Reduction in News Presentation through
Contextual Perturbation and Large Language Models [1.9] 本稿では,ニュースコンテンツにおける潜在感情の極性を減らし,この問題に対処する新たなアプローチを提案する。
我々は、中核的な意味を保ちながら文を変更するために変換制約を用いる。
実験と人体評価は、最小限の修正で感情極性を減らすために、これらの2つのモデルの有効性を実証した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:27:32 GMT)
Transfer Learning in ECG Diagnosis: Is It Effective? [1.8] 本研究は,心電図分類における転帰学習の有効性に関する実証的研究である。
我々は、さまざまなECGデータセットとディープニューラルネットワークをカバーする、スクラッチからのトレーニングと微調整性能を比較した。
伝達学習は、再帰的なニューラルネットワークよりも畳み込みニューラルネットワークとの整合性が高いことがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 04:27:26 GMT)
Change Point Detection with Copula Entropy based Two-Sample Test [1.7] 変更点検出は、時系列の変化を見つけることを目的とした典型的なタスクであり、2サンプルテストに対処できる。
コピュラエントロピー(Copula Entropy)は、統計的な独立性を測定する数学的概念であり、最近導入された2サンプルテストである。
本研究では,コプラエントロピーに基づく2サンプル検定による多変点検出のための非パラメトリック多変量法を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:36:48 GMT)
Vi(E)va LLM! A Conceptual Stack for Evaluating and Interpreting
Generative AI-based Visualizations [1.7] 大規模言語モデル(LLM)は、可視化に関連する生成タスクをサポートするための興味深い選択肢となっている。
本稿では,LLMを用いて生成した可視化の評価をモデル化する問題に対処する。
本稿では,原子部品の評価を分解する理論評価スタックEvaLLMを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:28:55 GMT)
Evaluating the Robustness of Off-Road Autonomous Driving Segmentation
against Adversarial Attacks: A Dataset-Centric analysis [1.7] 本研究では,逆入力摂動に対するセマンティックセグメンテーションモデルの脆弱性について検討する。
異なるセグメンテーションネットワークアーキテクチャに対する敵攻撃の効果を比較する。
この研究は、オフロード非構造環境における自律ロボットUnimog U5023の安全なナビゲーションに寄与する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:48:57 GMT)
Upper bound hierarchies for noncommutative polynomial optimization [1.6] この研究は、有限個の非可換制約に対する非可換の固有値の最小化に焦点を当てている。
コンパクト集合を最小化するためのラッサール問題による上界の収束階層を導出する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 11:53:57 GMT)
Iterative Hierarchy and Ranking Process (IHRP): A Novel Effective
Hierarchy Method for Densely Connected Systems and Case Study in Student
Performance Assessment [1.6] 解釈構造モデリング(ISM)は、専門家の意見に基づいて要素間影響をマイニングする階層構築手法として広く用いられている。
本稿では,従来のISM法の主な欠点の一つとして,その要因が密接な関係にあるシステムについて論じる。
本稿では,このような高密度システムにおいて効果的に機能する「Iterative Hierarchy and Ranking Process」(IHRP)と呼ばれる,新しい反復的階層構築手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:10:54 GMT)
Machine Intelligence in Africa: a survey [1.5] 本稿では,アフリカにおける機械知能の最近の発展を多層多層的・文化的倫理的視点から要約する。
アフリカ54か国でMIのユースケースが紹介され、MIの研究、産業、政府の行動、芸術、音楽、非公式経済、アフリカにおける中小企業などに関する400の記事が紹介されている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:27:14 GMT)
A Novel Hyperdimensional Computing Framework for Online Time Series
Forecasting on the Edge [1.4] オフラインのディープラーニング予測モデルは、時系列データの変化に効果的に適応できない。
オンラインの深層予測モデルは高価であり、複雑な訓練手順を持つことが多い。
本稿では,オンライン非線形時系列予測問題を線形超次元時系列予測の1つとして再構成する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 02:42:53 GMT)
Developing A Multi-Agent and Self-Adaptive Framework with Deep
Reinforcement Learning for Dynamic Portfolio Risk Management [1.4] ポートフォリオ全体のリターンと潜在的なリスクの間のトレードオフのバランスをとるために,マルチエージェント強化学習(RL)アプローチを提案する。
得られた実験結果から,提案したMASAフレームワークの有効性が明らかとなった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:11:23 GMT)
Cross-lingual Editing in Multilingual Language Models [1.3] 本稿では,言語間モデル編集(textbfXME)パラダイムを紹介し,事実を一つの言語で編集し,その後の更新伝搬を他の言語で観察する。
その結果,言語が2つの異なるスクリプトファミリーに属している場合を中心に,XME設定下での最先端のMETの性能制限が顕著に示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:59:49 GMT)
A Survey on Context-Aware Multi-Agent Systems: Techniques, Challenges
and Future Directions [1.1] 自律型エージェントに対する研究の関心が高まっている。
課題は、これらのエージェントが動的環境における不確実性を学び、推論し、ナビゲートできるようにすることである。
コンテキスト認識は、マルチエージェントシステムの強化において重要な要素として現れる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:27:22 GMT)
Implicit Neural Representation of Tileable Material Textures [1.1] 周期的なタイル状テクスチャを表現するために,正弦波ニューラルネットワークを探索する。
正弦波層の合成が周期$P$の整数周波数のみを生成することを証明した。
提案するニューラル暗黙表現はコンパクトであり,高分解能なテクスチャの効率的な再構築を可能にする。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:44:25 GMT)
Combining T-learning and DR-learning: a framework for oracle-efficient
estimation of causal contrasts [1.1] 異種因果コントラスト推定のための新しいフレームワークである効率的なプラグイン学習(EP)を導入する。
条件付き平均治療と条件付き相対リスクのEP学習者は、最先端の競争相手よりも優れている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:47:50 GMT)
Improving the Learning of Code Review Successive Tasks with Cross-Task
Knowledge Distillation [1.1] 本研究では,これらのタスクを同時に処理するために,クロスタスク知識蒸留を利用した新しいディープラーニングアーキテクチャdisCOREVを紹介する。
提案手法は, BLEUスコアによる評価値と, CodeBLEUスコアによるより正確なコード修正値から, より良いレビューコメントを生成する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:02:22 GMT)
$\textit{A Contrario}$ Paradigm for YOLO-based Infrared Small Target
Detection [0.9] YOLO検出器のトレーニングに$textita contrario$ decision criterionを導入する。
後者は、textitunexpectedness$の小さなターゲットを利用して、それらを複雑な背景から識別する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:02:02 GMT)
Federated Learning with Differential Privacy [0.9] フェデレートラーニング(FL)は、クライアントのプライベートデータを異なるパーティ間で共有することを防ぐ能力を持つ。
プライベート情報は、クライアントからアップロードされたパラメータの重みを分析することで、いまだに拡散することができる。
この結果から,非i.dおよび小データセットは,分散および微分プライベートな設定において,最も性能が低下していることが示唆された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 18:21:38 GMT)
Continuous Tensor Relaxation for Finding Diverse Solutions in
Combinatorial Optimization Problems [0.8] 本研究では,教師なし学習に基づくCOソルバのための連続緩和アニーリング(CTRA)を提案する。
CTRAは、離散決定変数を連続テンソルに変換する連続緩和アプローチを拡張して、様々な問題に同時に対処する。
数値実験により、CTRAにより、ULベースの解法は既存のULベースの解法よりもはるかに高速に不均一でペナルティに分散した解を見つけることができることが示された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:31:05 GMT)
Enhancing Graph Transformers with Hierarchical Distance Structural
Encoding [0.8] 本稿では,グラフ内のノード距離をモデル化するための階層的距離構造(HDSE)手法を提案する。
本稿では,既存のグラフ変換器の注意機構にHDSEをシームレスに統合する新しいフレームワークを提案する。
我々は,HDSEを用いたグラフトランスフォーマーがグラフ分類,7つのグラフレベルのデータセットの回帰,12の大規模グラフのノード分類において優れていることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:23:09 GMT)
Encoding Temporal Statistical-space Priors via Augmented Representation [0.7] 我々は,時系列データモデリングにおける課題を克服するために,単純な表現拡張手法を利用する。
統計的空間拡張表現(SSAR)は,各ステップで符号化される前の統計空間として機能する。
私たちのアプローチは、最新の5つのベースラインを大きく上回っています。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:03:53 GMT)
An explainable machine learning-based approach for analyzing customers'
online data to identify the importance of product attributes [0.6] 本稿では,製品開発におけるデザインの包括的意味を抽出するゲーム理論機械学習(ML)手法を提案する。
提案手法をKaggleの実際のラップトップのデータセットに適用し,結果に基づいて設計上の意味を導出する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:50:48 GMT)
Diabetes detection using deep learning techniques with oversampling and
feature augmentation [0.4] 糖尿病は慢性の病理であり、ここ数年でますます多くの人に影響を与えている。
毎年多数の死者が出ている。
この病気を患っている多くの人々は、健康状態の深刻さを十分に理解していない。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:30:20 GMT)
Detecting Respiratory Pathologies Using Convolutional Neural Networks
and Variational Autoencoders for Unbalancing Data [0.4] このデータセットは920音で構成され、そのうち810音は慢性疾患、75音は非慢性疾患、35音は健常者のみである。
CNN(Convolutional Neural Network)は、呼吸音を健康、慢性、非慢性の病気に分類するために用いられる。
その結果,3ラベル分類では0.993 F-Score,6クラス分類では0.990 F-Scoreとなった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:17:32 GMT)
An Ontology-Based multi-domain model in Social Network Analysis:
Experimental validation and case study [0.4] 本研究では,データを自動的に収集し,異なるソーシャルネットワーク分析を行うマルチドメイン知識モデルを提案する。
このモデルはOntoSNAQAと呼ばれるオントロジーで表現され、クラス、プロパティ、ルールで構成されている。
OntoSNAQAを用いて知識ベースシステムを作成し,本手法の利点を示すために実ケーススタディに適用した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:11:19 GMT)
Grammar-based evolutionary approach for automated workflow composition
with domain-specific operators and ensemble diversity [0.4] 本稿では,自動ワークフロー合成(AWC)のための文法に基づく進化的アプローチであるEvoFlowを紹介する。
EvoFlowはワークフロー構造を設計する際の柔軟性を強化し、実践者が自身の要求に最も適したアルゴリズムを選択することを可能にする。
以上の結果から,EvoFlowの遺伝的演算子と更新機構が,現在の先行手法よりも大幅に優れていることが示唆された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 11:29:14 GMT)
Sentiment analysis in non-fixed length audios using a Fully
Convolutional Neural Network [0.3] 任意の長さの音声を事前に固定することなく受信できる感情分析手法を提案する。
音声記述法としてMel SpectrogramとMel Frequency Cepstral Coefficientsを用いる。
完全畳み込みニューラルネットワークアーキテクチャを分類器として提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:26:28 GMT)
BoAT v2 -- A Web-Based Dependency Annotation Tool with Focus on
Agglutinative Languages [0.1] BoAT v1 は依存性関係のアノテーションとして開発され、その後手動で BOUN Treebank (UD_Turkish-BOUN) を作成した。
BoAT v2はマルチユーザおよびWebベースの依存性アノテーションツールで、アノテータのユーザエクスペリエンスを重視して設計され、有効なアノテーションを提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:22:49 GMT)
Wireguard: An Efficient Solution for Securing IoT Device Connectivity [0.0] 脆弱なIoT(Internet-of-Things)デバイスの普及により、大規模なサイバー攻撃が可能になった。
この研究は、新しいVPNプロトコルであるWireguardが、リソース制約のあるIoTシステムに適した効率的なセキュリティを提供できるかどうかを評価する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:11:11 GMT)
Using Deep Ensemble Forest for High Resolution Mapping of PM2.5 from
MODIS MAIAC AOD in Tehran, Iran [0.0] AODデータからPM2.5濃度を推定するための深層アンサンブル林法の可能性を評価した。
深層アンサンブルフォレストアルゴリズムを用いたPM2.5の推定値と地上データを用いてPM2.5の高分解能マップを作成した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 13:01:39 GMT)
Unveiling Human Factors and Message Attributes in a Smishing Study [0.0] 214名の被験者を対象に,スマイシング検出に関するオンライン調査を行った。
我々は16のSMSスクリーンショットを提示し、異なる要因がスマイシング検出における意思決定プロセスに与える影響を評価した。
その結果, 注意行動スコアとセキュリティ行動スコアは, スマイシングメッセージの同定における参加者の精度に有意な影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 17:36:05 GMT)
Training Implicit Networks for Image Deblurring using Jacobian-Free
Backpropagation [0.0] ヤコビアンフリーバックプロパゲーション (Jacobian-free Backproagation, JFB) は、画像劣化問題(英語版)の文脈でそのような計算を回避するバックプロパゲーションスキームである。
この結果から,JFBは最適化手法の微調整,SOTA(State-of-the-art)フィードフォワードネットワーク,既存の暗黙ネットワークに比較して計算コストを削減できることがわかった。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 07:10:12 GMT)
The multipartite entanglement classes of a multiport beam-splitter [0.0] ビームスプリッターで発生する多粒子交絡状態の異なるクラスについて検討する。
一つは、多部交絡クラスが総数階層に従うシナリオであり、もう一つは、様々なクラスが非古典的次数階層に従うシナリオであり、もうひとつは、前の2つの組み合わせである第3のシナリオである。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:54:17 GMT)
The Harmonic Oscillator Potential Perturbed by a Combination of Linear
and Non-linear Dirac Delta Interactions with Application to Bose-Einstein
Condensation [0.0] シュラー・オーディンガー方程式の1次元非線形バージョンの境界状態解析について検討する。
ボース気体の多体相互作用は、シュル・オーディンガー方程式の非線形項によって効果的に説明できる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:33:29 GMT)
Sample-Efficient Clustering and Conquer Procedures for Parallel
Large-Scale Ranking and Selection [0.0] 並列コンピューティング環境では、相関ベースのクラスタリングは$mathcalO(p)$サンプル複雑性低減率を達成することができる。
ニューラルアーキテクチャ検索のような大規模AIアプリケーションでは、スクリーニングなしバージョンの手順が、サンプル効率の点で完全に順序づけられたベンチマークを驚くほど上回っている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:56:03 GMT)
Robust atom-photon gate for quantum information processing [0.0] 原子-光子ゲートのセットアップは、空洞とマッハ-ツェンダー干渉計と2重縮退した地面と、原子-光相互作用を媒介する励起状態エネルギーレベルから構成される。
本稿では,光子と空洞間の空間モードミスマッチ,自然放出,空洞損失,変形,空洞パラメータと周波数のランダム変動など,ゲートの誤差解析と重要な誤差のモデル化を行う。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:10:20 GMT)
Recent Advances in Digital Image and Video Forensics, Anti-forensics and Counter Anti-forensics [0.0] 画像とビデオの鑑定は、最近、操作された画像やビデオの拡散により、注目を集めている。
本調査では,操作したデジタルメディアと生成メディアの両方をカバーする画像と映像の識別と偽造検出について検討する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:01:34 GMT)
Quantum-walk search in motion [0.0] 量子ウォーク探索アルゴリズム(quantum walk search algorithm)は、グラフ内の固定されたノードを探索するために設計されている。
我々は、マークされたノードにラベルをつけるために追加の量子状態を導入し、そのアルゴリズムを拡張して2次元表面上で動く粒子を追跡する。
このコンセプトは、リアルタイムオブジェクトトラッキングからネットワーク管理やルーティングまで、さまざまなアプリケーションに対して約束されている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:07:29 GMT)
Promoting the transition to quantum thinking: development of a secondary
school course for addressing knowledge revision, organization, and
epistemological challenges [0.0] 本稿では,古典的知識の改訂に伴う課題に対処するために,中等教育における量子力学のコースの開発について述べる。
このコースは、古典力学から量子力学への遷移における解析に依存する概念的変化に対する体系的なアプローチに基づいている。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:37:26 GMT)
Preserving the Hermiticity of the One-Body Density Matrix for a
Non-Interacting Fermi Gas [0.0] 任意の$dgeq 1$-次元に対して、それぞれの方法が真に同一であり、エルミート的であり、等等式であることを示す。
我々の研究は、$dgeq 1$-dimensional Grammaticos と Voros ODM の最初の明示的な導出も提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:41:50 GMT)
Optimized Task Assignment and Predictive Maintenance for Industrial
Machines using Markov Decision Process [0.0] 本稿では,タスク割り当てと条件に基づく機械の健康維持のための分散意思決定手法について考察する。
マルコフ決定プロセスに基づく意思決定エージェントの設計を提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:17:07 GMT)
Open dynamics of entanglement in mesoscopic bosonic systems [0.0] ボソン数相関に基づく開進化中のボソン系のメソスコピックな記述を提案する。
我々の記述は、場の形式主義の縮小状態の一般化に寄与する。
4モードの励起真空状態とビームスプリット単一光子に対する低温減衰に対する絡み合いの堅牢性を示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:45:31 GMT)
On the Exploitation of DCT-Traces in the Generative-AI Domain [0.0] 生成モデルは、既存のディープフェイク検出器の一般化限界を改善するために利用される合成データにユニークな痕跡を残している。
本稿では、離散コサイン変換(DCT)のβ-AC係数を詳細に検討し、周波数領域のディープフェイク画像を解析した。
この結果から, 生成モデルが残した痕跡の分析を改善するために, β-AC係数の特定の組み合わせを用いることの有意な可能性を明らかにした。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:45:31 GMT)
Multiplexed quantum repeaters based on single-photon interference with
mild stabilization [0.0] 位相安定化の難しさを低減した単一光子干渉を利用した量子リピータ方式を提案する。
具体的条件下では,本手法は既存方式と比較して,終端ノード間の絡み合い分布率が高いことを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:17:53 GMT)
MasonPerplexity at ClimateActivism 2024: Integrating Advanced Ensemble
Techniques and Data Augmentation for Climate Activism Stance and Hate Event
Identification [0.0] ソーシャルメディア、特に気候活動とヘイトイベントの検出に関する世論を識別するタスクが重要な研究領域として浮上している。
私たちのチームであるMasonPerplexityは、この問題に焦点を当てた重要な研究イニシアチブに参加します。
本研究の具体的な構成要素は,各サブタスクで5位,1位,6位にランクインした。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 01:06:33 GMT)
Language Writ Large: LLMs, ChatGPT, Grounding, Meaning and Understanding [0.0] 私は、ChatGPTが予想よりずっと良いことをしてくれるかもしれない良心的な偏見について、いくつかの悩みを提起します。
これらのバイアスはLLMスケールで言語自体の性質に固有のものであり、ChatGPTが欠如していることと密接に関連している。
これらの収束バイアスは、(1)直接感触的接地に基づく間接的言語接地(indirect verbal grounding)の寄生、(2)言語定義の円形性、(3)言語生成と理解のミラー化、(4)LLMスケールでの命題における象徴性、(5)ニューラルネットによるカテゴリー学習における人間のカテゴリー認識の計算的相違、および(6)a)
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:19:34 GMT)
InceptionCapsule: Inception-Resnet and CapsuleNet with self-attention
for medical image Classification [0.0] InceptionCapsuleアプローチは、ImageNetから初期重みを取る重みのランダムな選択を避ける。
抽出ベクターは、注目技術を備えた学習用カプセルネットワークに与えられる。
このモデルは5クラスで97.62の精度、Kvasirで8クラスで94.30の精度を達成した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 22:04:22 GMT)
Improving Large-Scale k-Nearest Neighbor Text Categorization with Label
Autoencoders [0.0] 本稿では,大規模文書コレクションの自動セマンティックインデックス処理を扱うために,多ラベル遅延学習手法を提案する。
提案手法は従来のk-Nearest Neighborsアルゴリズムの進化である。
我々は,MEDLINEバイオメディカル文書コレクションの大部分において提案提案を評価した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 00:11:29 GMT)
Goodness-of-Fit and Clustering of Spherical Data: the QuadratiK package
in R and Python [0.0] QuadratiKパッケージは、カーネルベースの二次距離を用いた適合性テストとクラスタリングの包括的なセットを提供する。
本ソフトウェアは, 適合性評価のための1, 2, kサンプルテストを実装し, 確率分布の適合性を評価するための, 効率的かつ数学的に健全な方法を提供する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:04:32 GMT)
Generalized transmon Hamiltonian for Andreev spin qubits [0.0] 電荷エネルギーが有限である2つの超伝導体間のジョセフソン接合に埋め込まれた相互作用量子ドットの問題を解く。
このアプローチはリチャードソンモデルのフラットバンド近似に基づいており、これはヒルベルト空間を正確な対角化が可能である点まで減少させる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 10:58:08 GMT)
Exact universal bounds on quantum dynamics and fast scrambling [0.0] スペクトル形状因子は、任意に長い時間にわたって初期状態の完全な集合の量子力学に普遍的な状態依存的境界を設定できることを示す。
この結果を用いて、多体システム間の相互作用において情報のばらつきを抑える。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 21:47:37 GMT)
ExTTNet: A Deep Learning Algorithm for Extracting Table Texts from
Invoice Images [0.0] 本研究では, 請求書内の製品表を, ExTTNet という深層学習モデルを用いて自律的に取得する。
光文字認識(OCR)技術を用いた請求書画像からテキストを得る。
特徴抽出法を用いて既存の特徴量を増やし、精度を高める。
OCRの結果得られた各テキストがテーブル要素であるか否かに応じてラベル処理を行う。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 19:24:45 GMT)
Enhancing crop classification accuracy by synthetic SAR-Optical data
generation using deep learning [0.0] 農業地域では、優占作物は典型的には1種または2種であり、他の作物は少ない。
農作物の地図を作成するためにトレーニングサンプルを集める際には、支配的な作物からのサンプルが多数存在し、多数派を形成している。
提案手法は, マイノリティクラスにおけるサンプル数を大幅に増加させることができる, 高品質な合成データを生成することを実証した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 11:07:50 GMT)
Engineering A Large Language Model From Scratch [0.0] AtinukeはTransformerベースのニューラルネットワークで、さまざまな言語タスクのパフォーマンスを最適化する。
特徴を抽出し、複雑なマッピングを学習することで、人間のような言語をエミュレートすることができる。
システムは、解釈可能で堅牢なまま、自然言語タスクの最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:34:46 GMT)
Emotion Classification In Software Engineering Texts: A Comparative
Analysis of Pre-trained Transformers Language Models [0.0] 本稿では、GitHubとStack Overflowのベンチマークデータセットの2つの詳細な感情分類のために、最先端の事前訓練言語モデル(PTM)の比較分析を行う。
我々は、現在最高のパフォーマンスツールであるSEntiMojiに対して、BERT、RoBERTa、ALBERT、DeBERTa、CodeBERT、GraphCodeBERTの6つのトランスフォーマーモデルを評価する。
私たちの研究は、ソフトウェアエンジニアリングの文脈において、Anger、Love、Fear、Joy、Sadness、Surpriseといったニュアンスな感情を認識する上で、PTMがもたらす進歩の強力な証拠を提供します。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 06:54:12 GMT)
EEG-GPT: Exploring Capabilities of Large Language Models for EEG
Classification and Interpretation [0.0] 大規模言語モデル(LLM)の進歩を利用する脳波分類の一元化手法である脳波-GPTを提案する。
脳波-GPTは、トレーニングデータの2%しか利用していない数ショットの学習パラダイムにおいて、異常脳波から正常を分類する最先端のディープラーニング手法に匹敵する優れた性能を達成する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 23:32:08 GMT)
Controlling Continuous Relaxation for Combinatorial Optimization [0.0] CO問題に対する教師なし学習(UL)に基づく解法が提案されている。
これらの解法は、CO目標を直接最適化することで解を出力するニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 15:42:34 GMT)
Collaboration of Digital Twins through Linked Open Data: Architecture
with FIWARE as Enabling Technology [0.0] 現実世界と仮想世界(Digital Twins)のコラボレーションは、多くのユースケースの成功と共にトレンドになりつつある。
最も重要な問題のひとつは、Digital Twinsの標準化の欠如によるコラボレーションの難しさである。
本稿では,デジタル双生児のコミュニケーションを促進するメカニズムとしてLinked Open Dataを提案する。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 20:06:46 GMT)
Bloated Disclosures: Can ChatGPT Help Investors Process Information? [0.0] ChatGPTのような生成AIツールは、投資家が情報を処理する方法を根本的に変えることができる。
我々は、これらのツールが、株式市場を実験室として利用した複雑な企業情報開示を要約する上での経済的有用性について検討する。
肥大化した開示は、価格効率の低下や情報非対称性の上昇など、資本市場の悪影響と関連していることを示す。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 16:33:10 GMT)
Benchmarking the algorithmic performance of near-term neutral atom
processors [0.0] デバイスシミュレーションによるRydberg原子量子コンピュータのアルゴリズム性能の評価を行った。
我々は、量子ビット接続とマルチキュービットゲートを動的に更新する能力を利用して、3つの異なる量子アルゴリズム関連のテストを検討する。
以上の結果から,Rydberg atom プロセッサは,さらなる拡張可能性に支えられ,有用な量子計算への道を開くことができる,競争の激しい短期プラットフォームであることが示唆された。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 11:55:02 GMT)
Addressing some common objections to generalized noncontextuality [0.0] 我々は、一般化された非文脈性の定義と、それを実験的にテストする可能性に対する批判に答える。
1つの反論は、実験の各実行中に実験の手順が実際に実行された古典的な記録の存在は、非文脈性の失敗の証明の必要な要素である操作等価関係が保持されないことを意味するということである。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 08:45:16 GMT)
Adapting Newton's Method to Neural Networks through a Summary of
Higher-Order Derivatives [0.0] 関数 $boldsymboltheta$ に適用した勾配に基づく最適化法を考える。
このフレームワークは、勾配降下によるニューラルネットワークのトレーニングなど、多くの一般的なユースケースを含んでいる。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 09:00:08 GMT)
A Bayesian cluster validity index [0.0] 既存の指標に基づくベイズクラスタ妥当性指数(BCVI)を導入する。
BCVIはWiroonsri index(WI)とWiroonsri-Preedasawakul index(WP)に基づいてテストされている。
提案したBCVIは,最終的なクラスタ数の予測範囲をユーザが指定可能な場合に,CVIの使用に有効である。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 14:23:36 GMT)
$\alpha$-Divergence Loss Function for Neural Density Ratio Estimation [0.0] 本稿では、簡潔な実装と安定な最適化を提供する$alpha$-divergence損失関数($alpha$-Div)を提案する。
提案した損失関数の安定性を実証的に検証し,DREタスクの推定精度について検討した。
論文参考訳(メタデータ) (Sat, 3 Feb 2024 05:33:01 GMT)