MICDrop: Masking Image and Depth Features via Complementary Dropout for Domain-Adaptive Semantic Segmentation [155.1] Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインとラベルなしターゲットドメインの間のドメインギャップを埋めるタスクである。
深度不連続性はしばしばセグメンテーション境界と一致するため、幾何学的情報、すなわち深度予測を活用することを提案する。
提案手法は, 様々な UDA 手法にプラグインし, 標準 UDA ベンチマークで連続的に結果を改善することができることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:15:10 GMT)
COIN: Control-Inpainting Diffusion Prior for Human and Camera Motion Estimation [98.1] COINは、人間の動きとカメラの動きを細粒度に制御できる、コントロール・インパインティング・モーション拡散である。
COINは、グローバルな人間の動き推定とカメラの動き推定という観点から、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:36:29 GMT)
DiffiT: Diffusion Vision Transformers for Image Generation [88.1] ViT(Vision Transformer)は、特に認識タスクにおいて、強力なモデリング機能とスケーラビリティを実証している。
拡散型生成学習におけるViTの有効性について検討し、拡散ビジョン変換器(DiffiT)と呼ばれる新しいモデルを提案する。
DiffiTはパラメータ効率が大幅に向上した高忠実度画像を生成するのに驚くほど効果的である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:09:40 GMT)
SAM2Point: Segment Any 3D as Videos in Zero-shot and Promptable Manners [87.8] SAM2Pointは,Segment Anything Model 2 (SAM2) に適応した予備的な探索手法である。
本フレームワークは3Dポイントやボックス,マスクなど,さまざまなプロンプトタイプをサポートし,3Dオブジェクトや屋内シーン,疎外環境,生のLiDARなど,さまざまなシナリオを一般化することができる。
我々の知る限り、SAMの3Dにおける最も忠実な実装は、3Dセグメンテーションにおける将来の研究の出発点となるかもしれない。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:59:45 GMT)
Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.4] 本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:22:22 GMT)
P2P-Bridge: Diffusion Bridges for 3D Point Cloud Denoising [81.9] 私たちは、Diffusion Schr"odingerブリッジをポイントクラウドに適応させる新しいフレームワークを通じて、ポイントクラウドを飾るタスクに取り組みます。
オブジェクトデータセットの実験では、P2P-Bridgeは既存のメソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:00:07 GMT)
OmniRe: Omni Urban Scene Reconstruction [79.0] デバイス上でのログから高忠実度な都市景観を効率的に再構築するための総合的アプローチであるOmniReを紹介する。
我々はOmniReという名前のシーンを駆動するための総合的な3DGSフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:56:33 GMT)
Semantics-Oriented Multitask Learning for DeepFake Detection: A Joint Embedding Approach [77.7] 本稿ではセマンティクス指向のDeepFake検出タスクをサポートするための自動データセット拡張手法を提案する。
また,顔画像とそれに対応するラベルを併用して予測を行う。
提案手法は,DeepFake検出の一般化性を向上し,人間の理解可能な説明を提供することで,ある程度のモデル解釈を行う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:11:50 GMT)
GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models [75.0] 開集合におけるバイアスを特定し,定量化し,説明するための枠組みを提案する。
このパイプラインはLarge Language Model (LLM)を活用して、一連のキャプションから始まるバイアスを提案する。
このフレームワークには、OpenBiasとGradBiasの2つのバリエーションがあります。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:51:07 GMT)
PartFormer: Awakening Latent Diverse Representation from Vision Transformer for Object Re-Identification [73.6] Vision Transformer (ViT) は、ほとんどの異なる訓練データ領域に過度に適合する傾向にあり、その一般化性と全体的対象特徴への注意が制限される。
本稿では、オブジェクトRe-IDタスクの制限を克服するために設計された、ViTの革新的な適応であるPartFormerを紹介する。
我々のフレームワークは、最も困難なMSMT17データセットにおいて、最先端の2.4%のmAPスコアを著しく上回る。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:31:05 GMT)
Adaptive Log-Euclidean Metrics for SPD Matrix Learning [73.1] 広く使われているログユークリッド計量(LEM)を拡張した適応ログユークリッド計量(ALEM)を提案する。
実験および理論的結果から,SPDニューラルネットワークの性能向上における提案手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:20:14 GMT)
Mitigating Label Noise on Graph via Topological Sample Selection [72.9] トポロジ情報を活用することで,グラフ内の情報的サンプル選択プロセスを促進できる$textitTopological Sample Selection$ (TSS)法を提案する。
提案手法は,対象のクリーン分布下での予測されるリスク上限の上限を最小化し,最先端のベースラインと比較して,提案手法の優位性を実験的に示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:48:42 GMT)
FilFL: Client Filtering for Optimized Client Participation in Federated Learning [71.5] フェデレートラーニングは、クライアントがローカルデータを交換することなく、協調的にモデルをトレーニングすることを可能にする。
トレーニングプロセスに参加するクライアントは、収束率、学習効率、モデル一般化に大きな影響を与えます。
本稿では,モデル一般化を改善し,クライアント参加とトレーニングを最適化する新しい手法であるクライアントフィルタリングを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:31:26 GMT)
The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning [70.2] 常識の因果関係を理解することは、人々が現実世界の原理をよりよく理解するのに役立ちます。
その重要性にもかかわらず、このトピックの体系的な探索は特に欠落している。
本研究の目的は、体系的な概要の提供、最近の進歩に関する学者の更新、初心者のための実践的なガイドを提供することである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:51:34 GMT)
Improving Deep Representation Learning via Auxiliary Learnable Target Coding [69.8] 本稿では,深層表現学習の補助的正規化として,新たな学習対象符号化を提案する。
具体的には、より差別的な表現を促進するために、マージンベースの三重項損失と、提案した目標符号上の相関整合損失を設計する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:22:08 GMT)
CogVLM2: Visual Language Models for Image and Video Understanding [69.4] 画像と映像の理解のための新しいビジュアル言語モデルであるCagVLM2ファミリを提案する。
イメージ理解モデルとして、CogVLM2は、トレーニング前とトレーニング後の両方でトレーニングレシピを改善したビジュアルエキスパートアーキテクチャを継承する。
ビデオ理解モデルとして、CogVLM2-Videoはマルチフレーム入力とタイムスタンプを統合し、時間的グラウンドの自動構築を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:59:12 GMT)
PsychoGAT: A Novel Psychological Measurement Paradigm through Interactive Fiction Games with LLM Agents [68.5] 心理的な測定は、精神健康、自己理解、そして個人の発達に不可欠である。
心理学ゲームAgenT(サイコガト)は、信頼性、収束妥当性、差別的妥当性などの心理学的指標において統計的に有意な卓越性を達成している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:27:27 GMT)
Discriminative Spatial-Semantic VOS Solution: 1st Place Solution for 6th LSVOS [68.5] ビデオオブジェクトセグメンテーション(VOS)はコンピュータビジョンにおいて重要な課題である。
現在のVOS法は複雑なシーンと長い物体の動きに苦しむ。
本報告では,空間時空間VOSモデルについて述べる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:47:17 GMT)
Fast Text-to-3D-Aware Face Generation and Manipulation via Direct Cross-modal Mapping and Geometric Regularization [67.6] テキストから3D対応顔(T3D Face)の生成と操作は、機械学習における新たなホットスポットである。
E3$-FaceNetと呼ばれる高速かつ高精度なT3D顔生成と操作のためのエンド・ツー・エンド・エンド・エフェクト・ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:27:12 GMT)
Targeted Cause Discovery with Data-Driven Learning [66.9] 本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。
我々は、シミュレートされたデータの教師あり学習を通じて因果関係を特定するために訓練されたニューラルネットワークを用いる。
大規模遺伝子制御ネットワークにおける因果関係の同定における本手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:21:11 GMT)
OpticalRS-4M: Scaling Efficient Masked Autoencoder Learning on Large Remote Sensing Dataset [66.2] 本稿では、大規模RSデータセットの作成とMIMの効率的なアプローチを特徴とする、RSモデルのための新しい事前学習パイプラインを提案する。
我々は、公開可能なRSデータセットを収集し、排除、スライシング、復号化によってそれらを処理することで、OptoRS-4Mという高品質なデータセットをキュレートした。
実験により,OCR-4Mは分類,検出,セグメンテーション性能を著しく向上し,SelectiveMAEは2回以上のトレーニング効率を向上させることが示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:16:13 GMT)
VideoLLM-MoD: Efficient Video-Language Streaming with Mixture-of-Depths Vision Computation [66.0] 我々は、視覚トークンの数を減らさずに、冗長な視覚トークンを「スキップ層」として活用することで、視覚計算を減らし、新しいアプローチを導入する。
提案手法であるVideoLLM-MoDは深度混合LLMにインスパイアされ,長期・ストリーミングビデオにおける多数の視覚トークンの課題に対処する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:21:58 GMT)
WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling [64.5] 言語モデルの重要な構成要素は、高次元の自然信号を低次元の離散トークンに圧縮するトークン化器である。
本稿では,従来の音響領域におけるSOTA音響モデルよりもいくつかの利点があるWavTokenizerを紹介する。
WavTokenizerは、優れたUTMOSスコアを持つ最先端の再構築品質を実現し、本質的によりリッチなセマンティック情報を含んでいる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:43:36 GMT)
A Gradient Analysis Framework for Rewarding Good and Penalizing Bad Examples in Language Models [63.9] 本稿では,損失関数の勾配解析の特異な角度について述べる。
ExMATEはMLEの優れたサロゲートであり,DPOとMLEの代わりにExMATEを組み合わせることで,統計的(5-7%)と生成的(+18%)の性能が向上することがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:46:18 GMT)
Towards Modality-agnostic Label-efficient Segmentation with Entropy-Regularized Distribution Alignment [62.7] この話題は、3次元の点雲のセグメンテーションで広く研究されている。
近年まで、擬似ラベルは、限られた地道ラベルによる訓練を容易にするために広く用いられてきた。
既存の擬似ラベリングアプローチは、重複しないデータのノイズやバリエーションに悩まされる可能性がある。
本研究では,学習用擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭める学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:31:15 GMT)
Pre-training on Synthetic Driving Data for Trajectory Prediction [61.5] 軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:35:21 GMT)
S3C2 Summit 2023-11: Industry Secure Supply Chain Summit [60.0] 本稿は2023年11月16日に開催された産業安全供給チェーンサミットを要約する。
このサミットの目的は、オープンな議論、相互共有を可能にし、ソフトウェアサプライチェーンの確保において、実践経験のある業界実践者が直面する共通の課題に光を当てることだった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:40:06 GMT)
Enhancing Sound Source Localization via False Negative Elimination [58.9] 音源のローカライゼーションは、視覚的なシーンで音を発する物体をローカライズすることを目的としている。
印象的な結果を得る最近の研究は、典型的には対照的な学習に依存している。
本稿では,2つの個別学習方式を取り入れた新しい音声視覚学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:24:51 GMT)
A Simple and Generalist Approach for Panoptic Segmentation [57.9] 汎用的なビジョンモデルは、様々なビジョンタスクのための1つの同じアーキテクチャを目指している。
このような共有アーキテクチャは魅力的に思えるかもしれないが、ジェネラリストモデルは、その好奇心に満ちたモデルよりも優れている傾向にある。
一般モデルの望ましい性質を損なうことなく、2つの重要なコントリビューションを導入することでこの問題に対処する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:02:12 GMT)
Verification of Geometric Robustness of Neural Networks via Piecewise Linear Approximation and Lipschitz Optimisation [57.1] 我々は、回転、スケーリング、せん断、翻訳を含む入力画像の幾何学的変換に対するニューラルネットワークの検証の問題に対処する。
提案手法は, 分枝・分枝リプシッツと組み合わせたサンプリングおよび線形近似を用いて, 画素値に対する楽音線形制約を求める。
提案手法では,既存の手法よりも最大32%の検証ケースが解決されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:31:35 GMT)
Anchored Preference Optimization and Contrastive Revisions: Addressing Underspecification in Alignment [57.0] 大規模言語モデル(LLM)は、しばしばコントラスト的なアライメント目標と選好ペアデータセットを使用してアライメントされる。
これについて検討し、基礎となる応答が対照的な場合、嗜好データがより良い学習信号を与えることを示した。
我々は、よりコントラスト的な選好ペアを生み出すデータ生成手法である、AI Revisions (CLAIR) からのコントラスト学習を紹介する。
我々の最良のモデルは、APOで32K CLAIRの選好に基づいて訓練され、Llama-3-8B-Instructを7.65%改善し、GPT4-turboとのギャップを45%短縮しました。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:26:19 GMT)
360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.8] 既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:44:27 GMT)
MelHuBERT: A simplified HuBERT on Mel spectrograms [55.6] 我々は、高度に成功した自己教師型モデルである HuBERT のトレーニングを再考する。
我々は、損失関数、入力表現、複数の段階におけるトレーニングなど、いくつかの重要なコンポーネントを改善し、単純化する。
我々のモデルであるMelHuBERTは、音声認識、話者識別、自動音声認識において良好な性能を達成することができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:25:59 GMT)
DAISY: Data Adaptive Self-Supervised Early Exit for Speech Representation Models [55.6] 本稿では,データ適応型自己監督早期退避(DAISY)を導入する。
DAISYの適応性に関する分析では、ノイズの多いデータ上で(より多くのレイヤを使用して)遅い時間に、クリーンデータ上で(より少ないレイヤを使用して)モデルが早期に(より少ないレイヤを使用して)終了することを示しています。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:30:55 GMT)
PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.1] PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:58:38 GMT)
A Distance Similarity-based Genetic Optimization Algorithm for Satellite Ground Network Planning Considering Feeding Mode [53.7] 衛星データ中継ミッションの送信効率の低さは、現在システムの構築を制約している問題となっている。
タスク間の状態特性を考慮した距離類似性に基づく遺伝的最適化アルゴリズム(DSGA)を提案する。
シミュレーション実験の結果,DSGAはSGNPFM問題を効果的に解くことができることがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:57:45 GMT)
No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.1] 非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューション・タスクに対して堅牢であることを保証するため、近年注目されている。
これらの手法が、現実のロボット工学の問題に強くインスパイアされた、新しい設定に適用された場合、どの程度堅牢であるかを問う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:20:44 GMT)
Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.4] 本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:37:38 GMT)
Semantic Communication for Cooperative Perception using HARQ [51.1] 我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:53:26 GMT)
UV-free Texture Generation with Denoising and Geodesic Heat Diffusions [50.6] メッシュの標準的なUVベースの処理機構の最も顕著な課題は、シーム、無駄なUV空間、および表面上の様々な解像度である。
本稿では,3次元メッシュの表面上での操作に制約された拡散モデルを用いて,テクスチャを色分けした点雲色として表現することを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:57:05 GMT)
ReMamba: Equip Mamba with Effective Long-Sequence Modeling [50.5] 本研究では,長い文脈の理解能力を高めるReMambaを提案する。
ReMambaは2段階のプロセスで選択的圧縮と適応のテクニックを取り入れている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:35:52 GMT)
Adapting Vision-Language Models to Open Classes via Test-Time Prompt Tuning [50.3] 学習済みのモデルをオープンクラスに適応させることは、機械学習において難しい問題である。
本稿では,両者の利点を組み合わせたテスト時プロンプトチューニング手法を提案する。
提案手法は,基本クラスと新クラスの両方を考慮し,すべての比較手法を平均的に上回る結果を得た。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:34:01 GMT)
Beyond Uncertainty: Evidential Deep Learning for Robust Video Temporal Grounding [50.0] 既存のビデオ時間グラウンド(VTG)モデルは精度は優れているが、オープン語彙クエリや未トリミングビデオによって引き起こされるオープンワールドの課題を見落としていることが多い。
2段階のクロスモーダルアライメントタスクの恩恵を受ける頑健なネットワークモジュールを導入する。
Deep Evidential Regression (DER)を統合して、トレーニング中の不確実性を明確かつ徹底的に定量化する。
これに対し,我々は,不確実性学習フレームワークをゼロから強化する簡易かつ効果的なGeom-regularizerを開発した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:32:03 GMT)
Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.9] 我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:44:20 GMT)
Policy Adaptation via Language Optimization: Decomposing Tasks for Few-Shot Imitation [49.4] 本稿では,タスク分解のセマンティック理解を生かした,未確認タスクへの数発適応のための新しいアプローチを提案する。
我々の手法であるPALO(Policy Adaptation via Language Optimization)は,タスクのいくつかの実演と,提案する言語分解とを組み合わせる。
PALOは、実世界の長期・多層的なタスクを一貫して完了することができ、事前訓練されたジェネラリスト政策の状況よりも優れています。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:03:35 GMT)
Space3D-Bench: Spatial 3D Question Answering Benchmark [49.3] Space3D-Benchは、Replicaデータセットのシーンに関連する1000の一般的な空間的質問と回答の集合である。
本研究では,事前定義された接地真実解に基づいて,自然言語応答を評価評価するシステムを提案する。
最後に,基礎モデルの世界理解をリッチな文脈検索と統合したRAG3D-Chatというベースラインを導入する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:05:22 GMT)
Entanglement of Disjoint Intervals in Dual-Unitary Circuits: Exact Results [49.2] 量子クエンチ後の解離部分系と補体の絡み合いの増大は、動的カオス指標と見なされる。
ほぼ全ての二重ユニタリ回路において、絡み合いのダイナミクスはカオスシステムに期待されるものと一致することを示す。
多くの保存電荷を持つにもかかわらず、電荷保存二重単位回路は一般にヤン・バクスター積分とはならない。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:45:27 GMT)
Critic-CoT: Boosting the reasoning abilities of large language model via Chain-of-thoughts Critic [48.9] Critic-CoTは、ステップワイズCoT推論フォーマットと遠方のスーパービジョンデータ構築を通じて、LLMをSystem-2のような批判能力にプッシュするフレームワークである。
GSM8KとMATHの実験により,改良されたモデルによりタスク解決性能が向上し,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:02:09 GMT)
Physics of Language Models: Part 2.2, How to Learn From Mistakes on Grade-School Math Problems [47.8] 我々は、事前訓練段階に直接「エラー訂正」データを組み込むことの有用性を理解することに注力する。
このデータは、即座に修正された誤った解ステップで構成されている。
このタイプの事前学習データにより、言語モデルの推論精度の向上が期待できる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:49:20 GMT)
Efficient Transfer Learning Framework for Cross-Domain Click-Through Rate Prediction [47.7] クロスドメインクリックスルーレート予測(E-CDCTR)のための効率的な伝達学習フレームワーク
鍵となる3つの要素:Tiny Pre-Traning Model (TPM)、Complete Pre-Traning Model (CPM)、そして—CTR Model (A-CTR)
TPMは、CPMとA-CTRの両方に対して、ユーザとアイテムのよりリッチな表現を提供し、日々の更新に固有の問題を効果的に軽減します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:34:39 GMT)
Fluent and Accurate Image Captioning with a Self-Trained Reward Model [47.2] 本稿では,自己生成陰性に基づく学習可能な報酬モデルに基づくキャプション手法であるSelf-Capを提案する。
我々の識別器は、字幕の正しさを促進するために訓練された微調整されたコントラスト画像テキストモデルである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:00:03 GMT)
Manipulate-Anything: Automating Real-World Robots using Vision-Language Models [47.2] 実世界のロボット操作のためのスケーラブルな自動生成手法であるManipulate-Anythingを提案する。
Manipulate-Anythingは、特権のある状態情報や手書きのスキルなしで現実世界の環境で動作でき、静的オブジェクトを操作できる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:07:30 GMT)
MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale [46.4] マルチエージェントパスフィンディング(Multi-agent pathfinding)は、共有環境における複数のエージェントの衝突のないパスを見つけることを必要とする、難しい計算問題である。
我々はMAPF-GPTと呼ばれるMAPF問題の基盤モデルを構築した。
擬似学習を用いて、部分観測可能性の条件下での行動を生成するための準最適専門家軌道のセットに関する政策を訓練した。
MAPF-GPTは、様々な問題インスタンスにおいて、現在最も優れた学習可能なMAPF解法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:55:10 GMT)
TF-Attack: Transferable and Fast Adversarial Attacks on Large Language Models [46.3] 従来の敵攻撃法は、大きな言語モデル(LLM)に適用した場合、限られた転送可能性を示し、特に非効率である。
LLMに対するTransferableおよびFast攻撃のための新しいスキームTF-Attackを導入する。
提案手法は従来手法を常に上回り,従来の攻撃戦略の最大20倍の速度向上を実現している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:40:12 GMT)
United in Diversity? Contextual Biases in LLM-Based Predictions of the 2024 European Parliament Elections [45.8] 大規模言語モデル(LLM)は、社会科学研究に革命をもたらす可能性があると認識されている。
本研究では,LLMに基づく世論の予測が文脈依存バイアスを示す程度について検討した。
我々は2024年の欧州議会選挙における投票行動について、最先端のLDMを用いて予測する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:01:06 GMT)
Enhancing AI-Driven Psychological Consultation: Layered Prompts with Large Language Models [45.0] 我々は, GPT-4 のような大規模言語モデル (LLM) を用いて, 心理的コンサルテーションサービスの強化について検討する。
提案手法では,ユーザ入力に動的に適応する新しい階層型プロンプトシステムを提案する。
また,LLMの感情的インテリジェンスを高めるために,共感とシナリオに基づくプロンプトを開発する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:47:14 GMT)
Addressing Information Asymmetry in Legal Disputes through Data-Driven Law Firm Rankings [43.0] 我々はブラッドリー・テリーモデルを一般化したアルゴリズムを適用し、法律事務所の有効性を評価する。
結果に基づくランキングシステムでは,従来の評価に基づくランキングよりも,今後のパフォーマンスを考慮すべきであることがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:04:45 GMT)
How Far Can Cantonese NLP Go? Benchmarking Cantonese Capabilities of Large Language Models [42.8] 8500万人以上の人々が話していた カントン語のような表現不足言語は 著しい発展のギャップに直面しています
広範に使われているにもかかわらず、カントン語はNLP研究において、特に同様の発展途上国の他の言語と比較して、スカンプト表現を持っている。
我々は、現在のカントンNLP法の概要と、実数生成、数学的論理、複素推論、およびカントンにおける一般知識におけるLLMの性能を評価するために設計された新しいベンチマークを紹介する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:54:14 GMT)
RLCP: A Reinforcement Learning-based Copyright Protection Method for Text-to-Image Diffusion Model [42.8] テキスト・画像拡散モデルのための強化学習に基づく著作権保護(RLCP)手法を提案する。
提案手法は,モデル生成データセットの品質を維持しつつ,著作権侵害コンテンツの生成を最小限に抑える。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:39:33 GMT)
Attribute Graphs Underlying Molecular Generative Models: Path to Learning with Limited Data [42.5] 本研究では,事前学習された生成オートエンコーダの潜伏符号の摂動実験を頼りに属性グラフを探索するアルゴリズムを提案する。
潜在符号間の構造方程式モデルをモデル化する有効なグラフィカルモデルに適合することを示す。
小分子の大きなデータセットで訓練された事前学習された生成オートエンコーダを用いて、グラフィカルモデルを用いて特定の特性を予測できることを実証する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:27:49 GMT)
LLMs generate structurally realistic social networks but overestimate political homophily [42.2] ネットワーク生成のための3つのプロンプト手法を開発し、生成されたネットワークと実際のソーシャルネットワークを比較した。
より現実的なネットワークは、LLMが1つのペルソナの関係を1度に構築する"ローカル"な手法で生成される。
また, 生成したネットワークは, 密度, クラスタリング, コミュニティ構造, 程度など, 様々な特性で実ネットワークと一致していることがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:36:52 GMT)
ResVG: Enhancing Relation and Semantic Understanding in Multiple Instances for Visual Grounding [42.1] ビジュアルグラウンドティングは、自然言語クエリに基づいて画像に参照されるオブジェクトをローカライズすることを目的としている。
既存の手法では、画像に複数の障害がある場合、大幅な性能低下を示す。
本稿では,Relation and Semantic-sensitive Visual Grounding (ResVG)モデルを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:32:01 GMT)
Quantum thermodynamics of the spin-boson model using the principle of minimal dissipation [41.9] 本研究では, 環境が作業量, 熱量, エントロピー生産量に与える影響について検討した。
その結果, 弱い結合形態の作業, 熱, エントロピー生産に有意な差が認められた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:15:03 GMT)
Recording and Describing Poker Hands [40.4] ポーカーは、人間が様々な種類のポーカーハンドを文書化するのに使える一貫したフォーマットを欠いている。
本稿では,手書き履歴の簡潔な可読性表現を提供するPHHフォーマットを提案する。
補足では、PHHフォーマットの11種類の変種をカバーする10,088個の手を提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:13:37 GMT)
Can Synthetic Audio From Generative Foundation Models Assist Audio Recognition and Speech Modeling? [40.4] 本研究の目的は,学習データとして使用することの有効性を検証し,音質を評価することである。
具体的には,音声認識における合成音声の利用について検討する。
また、音声関連モデリングにおいて、合成音声がデータ拡張の資源となるかどうかについても検討する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:27:45 GMT)
Maven: A Multimodal Foundation Model for Supernova Science [40.2] 超新星科学の最初の基盤モデルであるMavenを紹介します。
まず、0.5Mの合成超新星からの光度測定と分光を合わせるために、我々のモデルを事前訓練する。
そして、Zwicky Transient Facilityから観測された4,702個の超新星の模型を微調整した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:00:05 GMT)
Gradient-free variational learning with conditional mixture networks [39.8] 条件付き混合ネットワーク(CMN)は、高速で勾配のない推論に適しており、複雑な分類タスクを解くことができる。
UCIレポジトリから標準ベンチマークで2層CMNをトレーニングすることで、このアプローチを検証する。
提案手法であるCAVI-CMNは,バックプロパゲーションを伴う最大推定値(MLE)と比較して,競合的かつしばしば優れた予測精度を実現する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:43:55 GMT)
MaskMoE: Boosting Token-Level Learning via Routing Mask in Mixture-of-Experts [38.2] MaskMoEは、より包括的なトレーニングを行いながら、表現の多様性を維持することができる。
提案手法は,従来のMixture-of-Expertsモデルよりも,パープレキシティ(PPL)とダウンストリームタスク性能の両方で優れていた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:45:58 GMT)
Learning to Prompt Your Domain for Vision-Language Models [38.1] ADAPTはドメイン認識のプロンプト学習アプローチであり、フェデレートされた参加者間でドメイン内およびドメイン間プロンプトを促進する。
私たちのADAPTは、DomainNetデータセットの6つのドメインの平均精度68.4%に達し、14.8%の大きなマージンでオリジナルのCLIPを改善しています。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:24:20 GMT)
GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM [37.9] キーバリュー(KV)キャッシングは,大規模言語モデル(LLM)推論における生成速度を高速化するデファクトとなっている。
既存の方法は、重要でないトークンをドロップしたり、全てのエントリを均一に定量化することに依存している。
本稿では,高速なKVキャッシュ圧縮フレームワークであるGEARを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:48:58 GMT)
Theoretical Insights into Overparameterized Models in Multi-Task and Replay-Based Continual Learning [37.7] マルチタスク学習(MTL)は,複数のタスクを同時に学習することで,複数のタスクにおけるモデルの一般化性能を向上させることを目的としている。
連続学習(CL)は、以前取得した知識を忘れずに、時間とともに新しい逐次到着タスクに適応する。
MTL設定におけるモデルの性能に及ぼす各種システムパラメータの影響を理論的に記述する。
その結果,バッファサイズとモデルキャパシティがCLセットアップの記憶率に及ぼす影響を明らかにし,最先端のCL手法のいくつかに光を当てるのに役立つことがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:22:40 GMT)
Unified Convergence Theory of Stochastic and Variance-Reduced Cubic Newton Methods [37.2] 我々はヘルパーフレームワークと呼ばれる新しいフレームワークを提案する。
グローバルな複雑性保証を備えた分散アルゴリズムと二階アルゴリズムの統一的なビューを提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:31:58 GMT)
GRAB: A Challenging GRaph Analysis Benchmark for Large Multimodal Models [36.8] グラフ解析のベンチマークであるGRABを現在および将来のLMMに適用する。
私たちのベンチマークは完全に総合的で、高品質でノイズフリーな質問を確実にします。
GRAB上で20のLMMを評価し、21.7%のスコアで最高のパフォーマンスのモデルで、挑戦的なベンチマークであることが判明した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:47:47 GMT)
Bootstrap Segmentation Foundation Model under Distribution Shift via Object-Centric Learning [36.8] 本稿では,オブジェクト中心の表現を生成するために,エンコーダの機能を自己教師付きで再構築する手法であるSlotSAMを紹介する。
これらの表現はファンデーションモデルに統合され、オブジェクトレベルの知覚能力を強化します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:16:28 GMT)
Trajectory Forecasting through Low-Rank Adaptation of Discrete Latent Codes [36.1] トラジェクトリ予測は、一連のエージェントの将来の動きを予測できるため、ビデオ監視分析に不可欠である。
本稿では,離散潜在空間を用いたベクトル量子変分オートエンコーダ(VQ-VAEs)を導入し,後方崩壊問題に対処する。
このような2段階のフレームワークは、インスタンスレベルの離散化によって強化され、正確で多様な予測につながることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:31:58 GMT)
OpenFGL: A Comprehensive Benchmarks for Federated Graph Learning [36.0] Federated Graph Learning(FGL)は、直接データ共有なしで複数のローカルシステムにまたがるグラフニューラルネットワークのための、有望な分散トレーニングパラダイムとして登場した。
FGLの普及にもかかわらず、様々な研究背景と実験環境にまたがる実践的応用からの多様なモチベーションは、公正な評価に重大な課題をもたらす。
本稿では,主要なFGLシナリオであるGraph-FLとSubgraph-FLのための統一ベンチマークOpenFGLを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:40:01 GMT)
What to Preserve and What to Transfer: Faithful, Identity-Preserving Diffusion-based Hairstyle Transfer [35.8] 既存のヘアスタイルのトランスファーアプローチは、トリミングされた顔画像とアライメントされた顔画像に基づいて事前訓練されたStyleGANに依存している。
本稿では,現実のシナリオに適用可能な一段階のヘアスタイル転移拡散モデルであるHairFusionを提案する。
本手法は, ヘアスタイルと周辺特性の整合性を維持する既存手法と比較して, 最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:30:21 GMT)
Adversarial Network Optimization under Bandit Feedback: Maximizing Utility in Non-Stationary Multi-Hop Networks [35.8] 古典的なSNOアルゴリズムでは、ネットワーク条件は時間とともに定常である必要がある。
これらの問題に触発され、我々は帯域幅のフィードバックの下でAdversarial Network Optimization (ANO) を検討する。
提案するUMO2アルゴリズムは,ネットワークの安定性を保証し,また,「微妙に変化する」参照ポリシーの実用性に適合する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:18:28 GMT)
MQM-Chat: Multidimensional Quality Metrics for Chat Translation [35.7] 本研究は, チャット翻訳のための多次元品質指標(MQM-Chat)を提案する。
各モデルが何らかの根本的な誤りを発生させるのに対し,各モデルには欠落,曖昧なソース内容の過度な修正,バズワード問題といった欠点がある。
本研究は,チャット翻訳評価におけるMQM-Chatの有効性を実証し,今後の研究における文体化コンテンツの重要性と対話の整合性を強調した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:52:01 GMT)
Examination of Code generated by Large Language Models [35.5] 大規模言語モデル(LLM)は、コード生成を自動化することでソフトウェア開発を変革している。
高品質のコード生成におけるLCMの現状を評価するため,ChatGPTとCopilotを用いた制御実験を行った。
言語間, アルゴリズムとテストコード間, 時間とともに, LLM間で有意な差異が認められた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:12:16 GMT)
TEncDM: Understanding the Properties of Diffusion Model in the Space of Language Model Encodings [35.2] TEncDMは、事前訓練された言語モデルエンコーディングの空間で動作する拡散モデリングの新しいアプローチである。
このアプローチでは,トークン予測プロセスにコンテキストを組み込むように設計されたトランスフォーマーベースのデコーダも採用しています。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:35:24 GMT)
FastForensics: Efficient Two-Stream Design for Real-Time Image Manipulation Detection [35.1] 本稿では,リアルタイム画像操作検出のための効率的な2ストリームアーキテクチャについて述べる。
本手法は,認知的視点と検査的視点を対象とする2流分枝から構成される。
提案手法は軽量($8M)だが,他の多くの手法と比較して競争性能が向上する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:48:00 GMT)
Law of Vision Representation in MLLMs [34.6] マルチモーダル大言語モデル(MLLM)における「視覚表現の法」について述べる。
クロスモーダルアライメント, 視覚表現の対応, MLLM性能の組合せは強い相関関係を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:56:48 GMT)
Advances and Open Challenges in Federated Foundation Models [34.4] ファウンデーションモデル(FM)とフェデレートラーニング(FL)の統合は、人工知能(AI)における変革的パラダイムを提示する
本稿では,フェデレーション・ファンデーション・モデル(FedFM)の新興分野に関する包括的調査を行う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:03:57 GMT)
Benchmarking Japanese Speech Recognition on ASR-LLM Setups with Multi-Pass Augmented Generative Error Correction [34.3] 自動音声認識(ASR)のための生成誤り訂正(GER)は、ASRの誤りに対処するための意味的および音声学的改善を提供することを目的としている。
本研究では,LLMをベースとしたGERが日本語処理能力の強化と拡張を実現し,0.9-2.6kテキスト発声による日本語ASRのGERベンチマークを初めて提示する。
また、入力側で複数のシステム仮説を統合し、出力側で複数のLSMを補正し、それらをマージすることで、新しいマルチパス拡張生成誤差補正(MPA GER)を導入する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:18:12 GMT)
A Best-of-Both-Worlds Algorithm for Constrained MDPs with Long-Term Constraints [34.2] マルコフ決定過程(CMDP)におけるオンライン学習の研究
我々は,長期制約のあるCMDPに対して,初めてのベスト・オブ・ワールドズ・アルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:17:11 GMT)
Revisiting 360 Depth Estimation with PanoGabor: A New Fusion Perspective [33.9] 本稿では,これらの課題に対処するため,指向性歪みを考慮したGabor Fusionフレームワーク(PGFuse)を提案する。
再帰的歪みに対処するために、線形緯度対応の歪み表現法を設計し、カスタマイズされた歪み対応ガボルフィルタを生成する。
ガボル変換の配向感度を考慮すると、この感度を安定させるために球面勾配制約を導入する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:58:35 GMT)
A Preference-driven Paradigm for Enhanced Translation with Large Language Models [33.5] 大規模言語モデル(LLM)は,少数の並列データのみを用いて,優れた翻訳性能を実現する。
SFTは単にトークンレベルで参照翻訳を模倣するようにモデルに指示し、参照に存在するノイズに弱い。
この高原を克服するために、Planet-Luceモデルに基づく嗜好に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:10:55 GMT)
Identifying Terrain Physical Parameters from Vision -- Towards Physical-Parameter-Aware Locomotion and Navigation [33.1] 視覚に基づく環境パラメータ推定のためのクロスモーダルな自己教師型学習フレームワークを提案する。
我々は物理デコーダをシミュレーションで訓練し、マルチモーダル入力から摩擦と剛性を予測した。
トレーニングされたネットワークは、物理的なパラメータを持つ現実世界のイメージのラベル付けを可能にし、デプロイ中にビジュアルネットワークをさらにトレーニングする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:35:14 GMT)
See or Guess: Counterfactually Regularized Image Captioning [32.8] 本稿では、因果推論を利用して、既存のモデルを介入作業に役立てる汎用画像キャプションフレームワークを提案する。
本手法は幻覚を効果的に低減し,画像への忠実さを向上し,小型および大規模の画像・テキスト・モデル間で高い可搬性を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:59:57 GMT)
A Survey for Large Language Models in Biomedicine [31.7] このレビューは、PubMed、Web of Science、arXivなどのデータベースから得られた484の出版物の分析に基づいている。
我々は、診断支援、薬物発見、パーソナライズドメディカル医療を含む幅広いバイオメディカル・タスクにおいて、ゼロショット学習におけるLLMの能力について検討する。
データプライバシの懸念、限定されたモデル解釈可能性、データセットの品質の問題、倫理など、LLMがバイオメディシック領域で直面する課題について論じる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:39:16 GMT)
HoneyComb: A Flexible LLM-Based Agent System for Materials Science [31.2] HoneyCombは材料科学に特化した最初の大規模言語モデルシステムである。
MatSciKBは、信頼できる文献に基づいた、キュレートされた構造化された知識収集である。
ToolHubはインダクティブツール構築法を使用して、材料科学のためのAPIツールを生成し、分解し、洗練する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:38:40 GMT)
Enhancing Data-Limited Graph Neural Networks by Actively Distilling Knowledge from Large Language Models [30.9] グラフニューラルネットワーク(GNN)は、グラフの基本課題であるノード分類において優れた能力を持つ。
本稿では,Large Language Models(LLM)とGNNを統合する新しい手法を提案する。
我々のモデルでは,ラベル付きデータによるノード分類精度を著しく向上し,最先端のベースラインをかなりのマージンで超えた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:17:51 GMT)
Conan-embedding: General Text Embedding with More and Better Negative Samples [30.6] より高品質な負例の利用を最大化するコナン埋め込みモデルを提案する。
当社のアプローチは,現在,Massiveテキスト埋め込みベンチマークの中国リーダーボードにランクインしている,埋め込みモデルの能力を効果的に向上させる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:47:37 GMT)
Summaries, Highlights, and Action items: Design, implementation and evaluation of an LLM-powered meeting recap system [30.4] 対話要約のための大規模言語モデル(LLM)は、ミーティングの体験を改善する可能性がある。
この可能性にもかかわらず、長い書き起こしと、ユーザのコンテキストに基づいて多様なリキャップニーズをキャプチャできないため、技術的な制限に直面している。
本研究では,対話要約による表現をビルディングブロックとして運用するシステムを開発した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:32:15 GMT)
A Survey on Evaluating Large Language Models in Code Generation Tasks [30.3] 本稿では,コード生成タスクにおけるLarge Language Models (LLMs) の性能評価に使用される現在の手法と指標について概説する。
自動ソフトウェア開発の需要が急速に増加し、LLMはコード生成の分野で大きな可能性を示してきた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:56:06 GMT)
Neighborhood and Global Perturbations Supported SAM in Federated Learning: From Local Tweaks To Global Awareness [29.7] フェデレートラーニング(FL)は、中央サーバのオーケストレーションの下で調整して、プライバシ保護モデルを構築することができる。
本稿では,最小限のアップリンク通信オーバヘッドを維持しつつ,一般化目標を考慮した新しいFLアルゴリズムであるFedTOGAを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:27:26 GMT)
Entropic Distribution Matching in Supervised Fine-tuning of LLMs: Less Overfitting and Better Diversity [29.0] クロスエントロピー(CE)損失はスーパーバイザードファインチューニング(SFT)におけるデファクト選択である
本稿では,最大エントロピー原理を導入することで,これらの問題に対処することを目的とする。
我々は,逆Kulback-Leibler分散最小化を解くGEMと呼ばれる新しい分布マッチング法を開発した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:21:00 GMT)
WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks [29.0] 攻撃者がモデルをクローンすると,既存のE透かしをパラフレーズで除去できることを示す。
埋め込みを線形に変換する新しい透かし手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:59:56 GMT)
FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning [28.5] 擬似学習は、与えられた下流タスクに対するポリシーを効率的に適応するために、少数のタスク固有のデモンストレーションにのみ依存する。
本稿では,従来のデータから目標タスクに類似した動作を抽出するために,光フロー表現を利用するFlowRetrievalを提案する。
その結果,FlowRetrievalは,シミュレーションや実世界のドメイン間で,従来の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:48:08 GMT)
VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation [28.1] VGBenchは、ベクトルグラフィックスを扱うためのLLM(Large Language Models)の包括的なベンチマークである。
LLMは両面に強い能力を示し、低レベルフォーマット(SVG)では望ましい性能は低い。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:55:52 GMT)
Learned Image Transmission with Hierarchical Variational Autoencoder [28.1] 画像伝送のための革新的階層型ジョイントソースチャネル符号化(HJSCC)フレームワークを提案する。
提案手法では,送信側のボトムアップパスとトップダウンパスの組み合わせを利用して,元の画像の複数の階層表現を自動回帰的に生成する。
我々はこのフレームワークをフィードバックリンク付きシナリオに拡張し、確率的サンプリングプロセスとしてノイズチャネル上での送信をモデル化する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:23:57 GMT)
Enhancing Adaptive Deep Networks for Image Classification via Uncertainty-aware Decision Fusion [27.1] 本稿では,適応型深層ネットワークの推論性能を高めるために,CDM(Collaborative Decision Making)モジュールを導入する。
CDMは、第1のc-1分類器からの信頼性(不確かさ値)を利用する、明らかな深層学習(EDL)に基づく不確実性認識融合手法を取り入れている。
また、CDMの核融合品質を改善するために、EDL制約による核融合飽和度と不公平性の問題を低減するバランス項を設計する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:08:54 GMT)
Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form [26.0] 本稿では,頑健な制約付きMDP(RCMDP)における準最適ポリシーを同定できる最初のアルゴリズムを提案する。
最適ポリシーは、一連の環境における最悪のシナリオにおける制約を満たしながら累積コストを最小化する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:37:16 GMT)
VLM-KD: Knowledge Distillation from VLM for Long-Tail Visual Recognition [25.9] 市販の視覚言語モデル(VLM)から知識を抽出する効果的な方法を提案する。
我々は、新しいテキストの監督を生成し、自由形式のテキストを視覚エンコーダに蒸留するフレームワークを開発する。
我々の知る限り、本研究は、市販のVLMによって生成されたテキスト管理を初めて活用し、無作為な視覚エンコーダに適用するものである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:13:29 GMT)
Inverse-Q*: Token Level Reinforcement Learning for Aligning Large Language Models Without Preference Data [25.8] Inverse-Q*はトークンレベルの強化学習を最適化することで従来のRL手法を超越する革新的なフレームワークである。
この結果から,Inverse-Q*は従来のRLHFアプローチに代わる実用的で堅牢な代替手段であることがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:49:40 GMT)
SegVol: Universal and Interactive Volumetric Medical Image Segmentation [25.3] 本稿では,汎用的,インタラクティブな医用画像セグメンテーションを支援する3D基盤セグメンテーションモデルSegVolを提案する。
トレーニングデータを90Kの未ラベルCTボリュームと6Kのラベル付きCTボリュームにスケールアップすることにより、この基礎モデルは200以上の解剖学的カテゴリのセグメンテーションをサポートする。
22の解剖学的セグメンテーションタスクの実験では、SegVolは19のタスクで競合より優れており、ランナアップメソッドと比較して37.24%改善されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:11:14 GMT)
CityLight: A Universal Model for Coordinated Traffic Signal Control in City-scale Heterogeneous Intersections [23.6] CityLightは、交差点の状態表現を整列し、狭い相対的な交通関係型を符号化して、近隣の交差点を均一な相対的な交通影響空間に投影する普遍的な表現モジュールである。
数百から数万の交差点での実験では、CityLightの驚くべき有効性と一般化性が確認され、全体的なパフォーマンスは11.68%、スループットにおける転送シナリオは22.59%向上した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:00:25 GMT)
Passenger hazard perception based on EEG signals for highly automated driving vehicles [23.3] 本研究は,乗用車間相互作用の神経機構を解明し,乗用車認知モデル(PCM)と乗用車脳波復号戦略(PEDS)の開発に繋がるものである。
Central to PEDSは、空間的および時間的脳波データパターンをキャプチャする新しい畳み込みリカレントニューラルネットワーク(CRNN)である。
我々の研究は、事前観測された脳波データの予測能力、危険シナリオの検出の強化、より安全な自動運転車のためのネットワーク駆動型フレームワークの提供を強調した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:32:30 GMT)
Learning from Heterogeneity: A Dynamic Learning Framework for Hypergraphs [22.6] 本稿では,動的ハイパーエッジ構築と注意深い埋め込み更新が可能なLFHというハイパーグラフ学習フレームワークを提案する。
提案手法の有効性を評価するため,いくつかの一般的なデータセットを対象とした総合的な実験を行った。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:45:14 GMT)
Multi-source Domain Adaptation for Panoramic Semantic Segmentation [22.4] パノラマ的セマンティックセグメンテーションのためのマルチソースドメイン適応のための新しいタスクを提案する。
本研究の目的は, 実際のピンホール合成パノラマ画像の両方をソース領域で活用することであり, セグメンテーションモデルが未ラベルの実際のパノラマ画像に対して良好に動作できるようにすることである。
DTA4PASSはソースドメインのすべてのピンホール画像をパノラマのようなイメージに変換し、変換されたソースドメインをターゲットドメインに整列させる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:00:11 GMT)
GRPose: Learning Graph Relations for Human Image Generation with Pose Priors [22.0] 人間の画像生成のための制御情報を提供するために,ポーズ前のグラフ関係を探索するフレームワークを提案する。
提案モデルでは,最新のベンチマークモデルと比較して,ポーズ平均精度が9.98%向上した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:58:34 GMT)
HDRTransDC: High Dynamic Range Image Reconstruction with Transformer Deformation Convolution [21.9] 高ダイナミックレンジ(CAM)画像は、多露光低ダイナミックレンジ(LDR)画像を融合させることで、現実的な細部を持つ人工物のないHDR画像を生成することを目的としている。
融合歪みの除去を目的としたDWFBを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:57:39 GMT)
Short-Term Electricity-Load Forecasting by Deep Learning: A Comprehensive Survey [21.8] 短期電力需要予測は、電力システムの即時需要(今後数時間から数日)を予測することを指す。
気象の変化や新しい電力消費シナリオの出現など、さまざまな外部要因が電力需要に影響を与える可能性がある。
深層学習はSTELFに適用され、高精度な電力需要のモデル化と予測を行っている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:47:09 GMT)
CNIMA: A Universal Evaluation Framework and Automated Approach for Assessing Second Language Dialogues [21.3] CNIMAは10K対話による中国語と中国語のラベル付きデータセットである。
マイクロレベルの特徴を評価する評価フレームワークを用いてCNIMAに注釈を付ける。
評価の自動化と性能向上のためのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:28:52 GMT)
Seeking the Sufficiency and Necessity Causal Features in Multimodal Representation Learning [21.3] PNS(Necessary and Sufficient Causes)の確率が高い学習表現は、深層学習モデルの能力を高めることが示されている。
本稿では,モダリティ不変成分とモダリティ固有成分からなるマルチモーダル表現の概念化を提案する。
次に,各コンポーネントのPSS識別性を解析し,非自明なPSS推定を確実にする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:43:42 GMT)
Next Level Message-Passing with Hierarchical Support Graphs [20.7] 階層型サポートグラフ(Hierarchical Support Graph, HSG)は、特定のMPNN層に依存しない、グラフ内の情報フローを強化するフレームワークである。
本稿では, HSGの理論的解析を行い, その経験的性能について検討し, 仮想ノードで拡張した他の手法よりもHSGの方が優れていることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:28:42 GMT)
Learning from Negative Samples in Generative Biomedical Entity Linking [20.7] 陰性サンプルを用いて生成BioELモデルをトレーニングする最初のフレームワークであるANGELを紹介する。
ANGELで微調整したモデルでは,5つのベンチマークで平均1.4%の精度で,従来の最良ベースラインモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:44:01 GMT)
Internal Consistency and Self-Feedback in Large Language Models: A Survey [20.3] 大型言語モデル(LLM)は、しばしば欠点のある推論や幻覚を生成する。
これらの問題に対処するため、自己整合性、自己改善性、自己改善性などの「自己-」の研究が開始されている。
本稿では,障害と幻覚を推論するための理論的枠組みである内部整合性(internal Consistency)を要約する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:24:42 GMT)
ElasticAI: Creating and Deploying Energy-Efficient Deep Learning Accelerator for Pervasive Computing [19.8] 組み込みデバイス上でのディープラーニング(DL)は、普及するコンピューティングのホットなトレンドである。
FPGAは組み込みデバイス向けにDLアクセラレータをデプロイするのに適しているが、FPGA上でエネルギー効率の良いDLアクセラレータを開発するのは容易ではない。
本稿では,組込みFPGA上でハードウェアアクセラレータとしてDLモデルを作成,デプロイすることを目的としたElasticAI-Workflowを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:39:44 GMT)
Alignment is All You Need: A Training-free Augmentation Strategy for Pose-guided Video Generation [19.4] 生成された映像シーケンスが参照画像の微妙さを確実に保持する訓練不要のフレームワークを導入する。
我々は、骨格と動きの先行情報をポーズ情報から切り離し、アニメーション生成の正確な制御を可能にする。
提案手法は,大規模なデータセットや高価な計算資源を必要とせず,映像生成の質を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:08:12 GMT)
SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization [19.2] XMSMO (Extreme Multimodal Summarization with Multimodal Output) は魅力的な要約手法である。
既存のメソッドは、マルチモーダルデータが関連のない情報を含むことが多い問題を見落としている。
極多モード要約のための共有情報誘導変換器SITransformerを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:16:02 GMT)
Subspace Representation Learning for Sparse Linear Arrays to Localize More Sources than Sensors: A Deep Learning Methodology [19.1] 我々はスパース線形アレイ(SLA)のサンプル共分散からコアレイ部分空間を推定する新しい手法を開発した。
このような表現を学習するために、所望部分空間と推定部分空間との分離を測る損失関数を提案する。
異なる次元の学習部分空間の計算は、新しいバッチサンプリング戦略によって高速化される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:14:52 GMT)
CSGO: Content-Style Composition in Text-to-Image Generation [18.7] 本稿では,スタイリングされたデータトレーレットを自動生成し,自動的にクリーニングするコンテントスタイルのイメージトレーレットのためのデータ構築パイプラインを提案する。
このパイプラインに基づいて、210kの画像トリプレットを含む最初の大規模スタイル転送データセットであるIMAGStyleを構築した。
本稿では,コンテンツとスタイルの機能を明確に分離した,エンドツーエンドのトレーニングに基づくスタイル転送モデルCSGOを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:59:30 GMT)
STEREO: Towards Adversarially Robust Concept Erasing from Text-to-Image Generation Models [18.6] 2つの異なる段階を含む STEREO という手法を提案する。
第1段階は、CEMから消去された概念を再生できる強力な、多様な敵のプロンプトを徹底的に探索する。
第2段では,1回目で目標概念を確実に消去するアンカー概念に基づく構成目的を導入する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:29:26 GMT)
PromptSmooth: Certifying Robustness of Medical Vision-Language Models via Prompt Learning [18.6] 近年の研究では、医療ビジョン言語モデル(Med-VLMs)の敵対的攻撃に対する感受性が強調されている。
本稿では,PmptSmoothを提案し,即時学習の概念を活用することで,Med-VLMの効率よく信頼性の高いロバスト性を実現する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:59:45 GMT)
A More Unified Theory of Transfer Learning [18.5] 連続性の基本的なモジュライを$delta$で表すと、多くの古典的関連性尺度の根元に現れる。
我々は、学習者がソースデータとターゲットデータの両方にアクセス可能な一般的な状況に特に関心を持っている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:02:40 GMT)
Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling [18.2] 強力な言語モデル(LM)を用いた高品質な合成データの学習は、LMの推論性能を向上させるための一般的な戦略である。
より強力なSEモデルと弱いが安価なWCモデルによる合成データ生成のトレードオフについて検討する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:32:35 GMT)
Coverage Analysis of Multi-Environment Q-Learning Algorithms for Wireless Network Optimization [18.0] 最近の進歩には、アンサンブルマルチ環境ハイブリッドQ-ラーニングアルゴリズムが含まれる。
提案アルゴリズムは,現状の強化学習アルゴリズムよりも,ポリシエラーの50パーセント,実行時複雑性の40パーセントを達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:09:20 GMT)
Embodiment: Self-Supervised Depth Estimation Based on Camera Models [17.9] 自己監督法はラベル付けコストを伴わないため、大きな可能性を秘めている。
しかし, 自己指導型学習は, 3次元再構成と深度推定性能において, 教師あり学習と大きなギャップがある。
カメラの物理的特性をモデルに埋め込むことで、地上領域と地上に接続された領域の深さ先を計算できる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:32:17 GMT)
LLaVA-Chef: A Multi-modal Generative Model for Food Recipes [17.7] 大規模言語モデル(LLM)は、自然言語処理アプローチにより、食品関連のタスクをより深く掘り下げる道を開いた。
この研究は、多様なレシピプロンプトのキュレートされたデータセットに基づいて訓練された新しいモデルであるLLaVA-Chefを提案する。
詳細な質的分析により、LLaVA-Chefはより詳細なレシピを生成し、正確な成分が記述されていることが明らかになった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:20:49 GMT)
Incremental Context-free Grammar Inference in Black Box Settings [17.6] ブラックボックスの文脈自由文法推論は多くの実践的な設定において重要な課題である。
そこで本研究では,サンプル文字列をより小さな単位に分割し,文法を漸進的に推論する手法を提案する。
我々の手法であるKedavraは、より優れた文法品質(精度とリコールの強化)、より高速な実行、経験的比較による可読性の向上を実証した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:00:38 GMT)
Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides [17.6] そこで本研究では,まず物理前処理をブリッジマッチングに組み込んだ実力誘導型ブリッジマッチングモデルFBMを提案する。
我々のよく設計された中間力場の誘導により、FBMは余分なステップなしで直接推論によりボルツマン様の分布を目標にすることができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:21:26 GMT)
Dissecting Out-of-Distribution Detection and Open-Set Recognition: A Critical Analysis of Methods and Benchmarks [17.5] 我々は,コミュニティ内の2つの大きなサブフィールドの総合的なビュー – アウト・オブ・ディストリビューション(OOD)検出とオープンセット認識(OSR) – を提供することを目指している。
我々は,OOD検出における最先端手法とOSR設定との厳密な相互評価を行い,それらの手法の性能の強い相関関係を同定する。
我々は,OOD検出とOSRによって取り組まれている問題を解消する,より大規模なベンチマーク設定を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:55:07 GMT)
Long-Range $ZZ$ Interaction via Resonator-Induced Phase in Superconducting Qubits [17.3] 共振器誘起位相ゲートに基づく3つの共振器と1次マイクロ波で駆動される3つの共振器を用いた新しい多モード結合方式を提案し、量子ビット間の相互作用距離を$Z$に拡張する。
我々は、フリースペクトル範囲(FSR)1.3GHzにおいて、CZゲートの忠実度が160ns以内の99.9%を超えることを示すとともに、駆動パルスの最適化により、残りの光子を0.2GHzのFSRで100ns以内の10~3$に削減する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:24:08 GMT)
Analyzing Inference Privacy Risks Through Gradients in Machine Learning [17.3] 本稿では,属性,プロパティ,配布,ユーザ開示など幅広い攻撃を対象とするゲームベースの統合フレームワークを提案する。
本結果は,分散学習における推論攻撃に対するプライバシを実現するために,データ集約のみを頼りにすることの有効性を示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:21:53 GMT)
LaMAGIC: Language-Model-based Topology Generation for Analog Integrated Circuits [17.0] 先駆的な言語モデルに基づくトポロジ生成モデルであるLaMAGICを紹介する。
LaMAGICは、カスタム仕様から最適化された回路設計を単一のパスで効率的に生成できる。
LaMAGICは0.01の厳格な許容条件で最大96%の成功率を達成した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:07:43 GMT)
Evaluating Time-Series Training Dataset through Lens of Spectrum in Deep State Space Models [17.0] 本稿では,システム識別に使用されるデータ評価手法について紹介する。
我々は、深部SSM内の信号の上位Kスペクトルの和であるKスペクトル計量を提案する。
実験の結果,Kスペクトルは相関係数の絶対値が大きいことがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 04:46:49 GMT)
PSE-Net: Channel Pruning for Convolutional Neural Networks with Parallel-subnets Estimator [16.7] PSE-Net(英語版)は、効率的なチャネルプルーニングのための新しい並列サブネット推定器である。
提案アルゴリズムは,スーパーネットトレーニングの効率化を実現する。
本研究では,従来の進化探索の性能を高めるために,事前分散型サンプリングアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:20:43 GMT)
LV-UNet: A Lightweight and Vanilla Model for Medical Image Segmentation [16.6] 本稿では,事前学習したMobileNetv3-Largeモデルを効果的に活用し,推論モジュールを導入するLV-ColonUNetという軽量でバニラモデルを提案する。
実験はISIC 2016、BUSI、CVC-CricDB、CVC-SEGデータセットで行われ、最先端技術モデルや古典モデルと比較してパフォーマンスが向上している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:19:10 GMT)
Single-Loop Deterministic and Stochastic Interior-Point Algorithms for Nonlinearly Constrained Optimization [16.4] 客観的に制約された連続最適化問題の解法として,内点アルゴリズムを提案し,解析し,検証した。
アルゴリズムは、いつ段階的な設定を意図し、見積もりが利用可能で、場所勾配で使われ、目的関数値が適用されない場合に使用される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:50:35 GMT)
ReconX: Reconstruct Any Scene from Sparse Views with Video Diffusion Model [16.1] ReconXは、時間生成タスクとして曖昧な再構築課題を再編成する、新しい3Dシーン再構築パラダイムである。
提案したReconXはまずグローバルポイントクラウドを構築し、3D構造条件としてコンテキスト空間にエンコードする。
この条件に導かれ、ビデオ拡散モデルは、ディテール保存され、高い3D一貫性を示すビデオフレームを合成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:59:40 GMT)
GameIR: A Large-Scale Synthesized Ground-Truth Dataset for Image Restoration over Gaming Content [16.1] 我々は,空白を埋めるために,大規模コンピュータ合成地上トラスデータセットであるGameIRを開発した。
我々は,このタスクのために720pと1440pでレンダリングされた640本のビデオから,19200本のLR-HR対の地上構造フレームを提供する。
2つ目は、新しいビュー合成(NVS)であり、マルチビューフレームの一部をレンダリングおよび転送し、クライアント側で残りのフレームを生成するマルチビューゲーミングソリューションをサポートする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:11:46 GMT)
Non-Stationary Bandit Learning via Predictive Sampling [15.9] 非定常環境ではトンプソンサンプリングが不十分であることを示す。
本稿では,有効性を急速に失う情報を優先的に抽出するアルゴリズムである予測サンプリングを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:38:57 GMT)
Optimizing Automated Picking Systems in Warehouse Robots Using Machine Learning [15.6] 本研究は、ディープラーニングと強化学習技術を活用した倉庫における自動ピッキングシステムに焦点を当てた。
ロボットのピッキング性能と複雑な環境への適応性を向上する上で,これらの技術の有効性を実証する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:39:12 GMT)
An Adaptive Latent Factorization of Tensors Model for Embedding Dynamic Communication Network [15.6] Dynamic Communication Network (DCN) は、様々な通信ノード間の時間的相互作用を記述する。
本稿では,適応時間依存型低ランク表現モデル(ATT)を提案する。
実世界のDCN4つの実験結果から,提案したATTモデルは予測誤差と収束ラウンドの両方において,最先端のモデルを著しく上回っていることが示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:40:32 GMT)
CooTest: An Automated Testing Approach for V2X Communication Systems [15.6] 我々は,V2X指向の協調認識モジュールの最初の自動テストツールであるCooTestを設計,実装した。
CooTestは、様々なV2X指向の運転条件下での誤動作を効果的に検出できる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:01:21 GMT)
On the Efficacy of Text-Based Input Modalities for Action Anticipation [15.6] 本稿では,アクションやオブジェクトのマルチモーダルな特徴やテキスト記述から学習するビデオトランスフォーマーアーキテクチャを提案する。
EpicKitchensデータセットの従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:11:29 GMT)
Large Language Multimodal Models for 5-Year Chronic Disease Cohort Prediction Using EHR Data [15.5] 糖尿病などの慢性疾患が世界中で致死率と死亡率の主な原因となっている。
我々は,慢性疾患リスクの予測にマルチモーダルデータを組み込んだLarge Language Multimodal Models (LLMMs) フレームワークを提案する。
本手法では, テキスト埋め込みエンコーダとマルチヘッドアテンション層を組み合わせて, 深層ニューラルネットワーク(DNN)モジュールを用いて, 血液の特徴と慢性疾患のセマンティクスを潜在空間にマージする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:18:08 GMT)
RIDE: Boosting 3D Object Detection for LiDAR Point Clouds via Rotation-Invariant Analysis [15.4] RIDEは3D LiDAR-point-based object DEtectorの回転不変性の先駆的な探索である。
回転に敏感ではあるが幾何をよく保持できる2機能抽出器と、幾何情報をある程度失うが回転に頑健な回転不変特徴を抽出する。
我々のRIDEは互換性があり、既存の1段と2段の3D検出器に簡単に接続でき、検出性能と回転ロバスト性の両方を高めることができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:47:04 GMT)
The Unreasonable Ineffectiveness of Nucleus Sampling on Mitigating Text Memorization [15.3] 大規模言語モデル(LLM)の核サンプリング時のテキスト記憶挙動を解析した。
核の大きさが大きくなると、記憶力は緩やかに低下する。
モデルが"ハード"メモリ化に関与していない場合でも、"ソフト"メモリ化を表示できる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:30:33 GMT)
LightSLH: Provable and Low-Overhead Spectre v1 Mitigation through Targeted Instruction Hardening [15.0] 我々は、Spectre脆弱性の脅威にさらされている場合にのみ、このオーバーヘッドを軽減するためのLightSLHを提案する。
LightSLHは抽象解釈に基づくプログラム解析技術を活用し、Spectreの脆弱性につながる可能性のあるすべての命令を特定し、証明可能な保護を提供する。
我々は、LightSLHのセキュリティ保証を実証し、OpenSSLの暗号化アルゴリズム実装の性能を評価する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:31:28 GMT)
Adaptive Reinforcement Learning Planning: Harnessing Large Language Models for Complex Information Extraction [15.0] 大規模言語モデル(LLM)に関する既存の研究は、多段階計画により情報抽出タスクを解くことができることを示している。
複雑な抽出タスクを分解して段階的に抽出することで,LLMの性能を効果的に向上させることができる。
本稿では,LLMに基づく情報抽出のための2段階多段階手法を提案し,多段階計画を実行するためにRLフレームワークを採用する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:48:10 GMT)
Enabling Local Editing in Diffusion Models by Joint and Individual Component Analysis [14.9] 拡散モデル(DM)の潜伏空間は、GAN(Generative Adversarial Networks)ほど理解されていない。
最近の研究は、DMの潜在領域における教師なし意味発見に焦点を当てている。
本稿では,事前学習したDMの認知ネットワークから学習した潜在意味論を分解する教師なし手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:21:50 GMT)
Generic Objects as Pose Probes for Few-Shot View Synthesis [14.8] NeRFや3D Gaussianなどの放射場は、高忠実なレンダリングやシーン再構成において大きな可能性を示している。
COLMAPはポーズを推定する前処理によく使用される。
我々は,3~6面のシーン画像のみを用いて,少数視点のNeRF再構成を実現することを目的としている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:37:58 GMT)
Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference [14.0] textbfSparse-Tuningは、画像やビデオの情報冗長性を考慮に入れた新しいPEFTメソッドである。
Sparse-Tuningは各層で処理されるトークンの量を最小限に抑え、計算とメモリのオーバーヘッドを2次的に削減する。
我々のSparse-TuningはGFLOPsを62%-70%に削減し,最先端性能を実現した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:44:53 GMT)
Learning Multi-agent Multi-machine Tending by Mobile Robots [13.8] 本稿では,MARL(Multi-agent Reinforcement Learning)技術に基づく移動ロボットによるマルチエージェント型マルチマシン学習フレームワークを提案する。
マルチエージェント・プロキシ・ポリシー・オプティマイゼーション(MAPPO)アルゴリズムにアテンションベースの符号化機構を開発し,その性能を高める。
我々のモデル (AB-MAPPO) は, タスク成功, 安全性, 資源利用の観点から, MAPPO よりも優れていた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:57:52 GMT)
GSTAM: Efficient Graph Distillation with Structural Attention-Matching [13.7] 本稿では,グラフ分類データセットを凝縮する新しい手法であるGSTAM(Graph Distillation with Structure Attention Matching)を紹介する。
GSTAMは、GNNの注意マップを利用して、元のデータセットから合成グラフに構造情報を抽出する。
総合的な実験では、GSTAMは既存の方法よりも優れており、極端な凝縮比では0.45%から6.5%の性能が向上している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:40:04 GMT)
Dynamical Transition due to Feedback-induced Skin Effect [13.6] オープン境界条件下での条件フィードバックを連続監視した自由フェルミオン系における多体ダイナミクスについて検討する。
エントロピーの対数的スケーリングから,時間発展に伴う領域内スケーリングへの新たな動的移行を見出した。
さらに、準不規則あるいは障害は定常状態の遷移を駆動できないが、時間進化中に最大エンタングルメントエントロピーの遷移が起こる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:47:48 GMT)
An Exploratory Deep Learning Approach for Predicting Subsequent Suicidal Acts in Chinese Psychological Support Hotlines [13.6] 自殺リスク評価のためのスケールベースの予測手法の精度は、オペレーターの専門性によって大きく異なる可能性がある。
本研究は,中国における自殺リスクを予測するために,長期音声データにディープラーニングを適用した最初の事例である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:51:41 GMT)
LMT-GP: Combined Latent Mean-Teacher and Gaussian Process for Semi-supervised Low-light Image Enhancement [13.4] そこで我々は,LMT-GP という潜在平均教師とガウス過程に基づく半教師付き手法を提案する。
実験結果から,本手法は高い一般化性能と画質を実現することが示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:23:51 GMT)
SFR-GNN: Simple and Fast Robust GNNs against Structural Attacks [13.3] グラフニューラルネットワーク(GNN)は,グラフ構造化データに対する可換性を示す。
GNNはグラフトポロジーに依存するため、しばしば敵対的な構造攻撃に対して脆弱である。
本稿では,SFR-GNN (Simple and Fast Robust Graph Neural Network) と呼ばれる,相互情報理論をサポートする効率的な防御手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:52:28 GMT)
Spatio-Temporal Context Prompting for Zero-Shot Action Detection [13.2] 本稿では,視覚言語モデルの豊富な知識を効果的に活用し,対人インタラクションを実現する手法を提案する。
同時に複数の人物による異なる行動を認識するという課題に対処するために,興味あるトークンスポッティング機構を設計する。
提案手法は,従来の手法に比べて優れた結果を得ることができ,さらにマルチアクションビデオに拡張することができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:54:11 GMT)
The Application of Machine Learning in Tidal Evolution Simulation of Star-Planet Systems [13.1] 進化曲線を生成する速度は、モデル生成曲線を4桁以上上回る。
我々の研究は、重要な計算資源と時間を最小限の精度で節約する効率的な方法を提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:09:19 GMT)
Text-Enhanced Zero-Shot Action Recognition: A training-free approach [13.1] ゼロショット映像行動認識のためのテキスト強調行動認識(TEAR)を提案する。
TEARはトレーニングフリーであり、トレーニングデータや広範な計算資源の可用性を必要としない。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:20:05 GMT)
Self-Alignment: Improving Alignment of Cultural Values in LLMs via In-Context Learning [13.0] In-context Learning(ICL)とヒューマンサーベイデータを組み合わせた簡易で安価な手法を提案する。
本手法は、英語以外のテスト言語で有用であることが証明され、文化的に多種多様な国に対応する文化的価値との整合性を向上させることができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:18:04 GMT)
A Catalog of Fairness-Aware Practices in Machine Learning Engineering [13.0] 機械学習は意思決定プロセスに広く採用されているため、公平性に対する懸念が高まる。
マシンラーニングライフサイクル全体を通じて、エンジニアリングフェアネスに関するプラクティスの理解と分類には、依然としてギャップがあります。
本稿では,体系的マッピング研究から得られた機械学習における公平性に対処するための新しいプラクティスカタログを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:28:43 GMT)
Ig3D: Integrating 3D Face Representations in Facial Expression Inference [13.0] 本研究の目的は,表情推論タスクに3次元表現を統合することの影響を検討することである。
まず、FEIタスクにおける2つの3次元顔表現(どちらも3次元形態素モデル、FLAMEに基づく)の性能を評価する。
次に、既存の2D推論フレームワークと3D顔表現を統合するために、中間融合と後期融合という2つの融合アーキテクチャについて検討する。
提案手法は,最先端のAffectNet VA推定とRAF-DB分類タスクより優れている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:08:07 GMT)
Real-Time Energy Pricing in New Zealand: An Evolving Stream Analysis [12.7] 本稿では,ニュージーランドにおけるリアルタイム時系列とエネルギー価格のストリーミングデータを表す新しいデータセット群を紹介する。
データセットは、回帰学習タスクをストリーミングするための適切なデータセットの不足に対処することを意図している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:53:21 GMT)
BEYOND DIALOGUE: A Profile-Dialogue Alignment Framework Towards General Role-Playing Language Model [12.6] 大規模言語モデル(LLM)の急速な進歩はロールプレイングに革命をもたらし、一般的なロールプレイングモデルの開発を可能にした。
現在のロールプレイングトレーニングには2つの大きな問題がある: (I) 特定のシナリオに対する対話トレーニングを促すために事前に定義されたロールプロファイルを使用することで、対話とプロファイルの間に矛盾や矛盾が生じ、トレーニングバイアスが生じる。
我々はこれらのハードルを克服するために、DIALOGUEと呼ばれるシンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:38:05 GMT)
Self-Improving Diffusion Models with Synthetic Data [12.6] シンセティックデータを用いた自己IM拡散モデル(SIMS)は、拡散モデルのための新しい訓練概念である。
SIMSは自己合成データを使用して生成プロセス中に負のガイダンスを提供する。
MADを使わずに、自己生成合成データに対して反復的に訓練できる、最初の予防的生成AIアルゴリズムである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:12:18 GMT)
Evolution of two-magnon bound states in a higher-spin ferromagnetic chain with single-ion anisotropy: A complete solution [12.6] 2つの単一イオン境界状態が共存する狭い領域を見つける。
我々は,境界状態の進化を,与えられたパラメータに対する代表点の直線運動に再スケールした位相図でマッピングする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:38:55 GMT)
IKUN for WMT24 General MT Task: LLMs Are here for Multilingual Machine Translation [12.3] 本稿では,WMT24における汎用機械翻訳タスクのために開発された2つの多言語システム,IKUNとIKUN-Cを紹介する。
IKUNとIKUN-Cは、それぞれLlama-3-8bとMistral-7B-v0.3上に構築されたオープンシステムと制約されたシステムを表している。
どちらのシステムも、単一のモデルを使用して11の言語方向を処理するように設計されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:25:14 GMT)
Transformers Meet ACT-R: Repeat-Aware and Sequential Listening Session Recommendation [12.3] PISAは,音楽ストリーミングサービスのセッションレベルのシーケンシャルレコメンデーションシステムである。
PISAは、リスニングセッションとユーザの埋め込み表現を学習するTransformerアーキテクチャを採用している。
我々は、Last.fmの公開リスニングデータとDeezerのプロプライエタリデータの両方を用いて、PISAの実証的妥当性を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:44:12 GMT)
DriveGenVLM: Real-world Video Generation for Vision Language Model based Autonomous Driving [12.0] 視覚言語モデル(VLM)は、自律運転に影響を与える大きな可能性を持つ革命的ツールとして出現している。
本稿では,駆動ビデオを生成するためのDriveGenVLMフレームワークを提案し,それらを理解するためにVLMを使用する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:52:56 GMT)
Do Graph Neural Networks Work for High Entropy Alloys? [12.0] 高エントロピー合金(HEA)は化学的な長距離秩序を欠き、現在のグラフ表現の適用性を制限する。
本稿では,HEA特性予測のための正確かつ解釈可能なGNNであるLESets機械学習モデルを紹介する。
第四紀HEAの力学特性のモデル化におけるLESetsの精度を実証する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:20:02 GMT)
On Convergence of Average-Reward Q-Learning in Weakly Communicating Markov Decision Processes [11.9] 本稿では,マルコフ決定過程(MDP)の強化学習(RL)アルゴリズムを,平均回帰基準の下で解析する。
本稿では,MDPを弱通信する反復RVI法のモデル自由集合であるRVI(Rexent Value)に基づくQ-learningアルゴリズムに着目した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 04:57:44 GMT)
Iterated Energy-based Flow Matching for Sampling from Boltzmann Densities [11.9] 非正規化密度から連続正規化フロー(CNF)モデルをトレーニングするための反復エネルギーベースフローマッチング(iEFM)を提案する。
以上の結果から,iEFMは既存の手法よりも優れており,効率的でスケーラブルな確率的モデリングの可能性を示している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 04:06:34 GMT)
Towards Infusing Auxiliary Knowledge for Distracted Driver Detection [11.8] 引き離された運転は世界中の道路事故の主要な原因である。
シーン内のエンティティ間の意味的関係とドライバのポーズの構造的構成に関する補助的知識を注入することで,運転者検出(DDD)の新たな手法であるKiD3を提案する。
具体的には、シーングラフを統合した統合フレームワークを構築し、ドライバが映像フレーム内の視覚的手がかりと情報を合成し、ドライバの行動の全体像を作成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:28:42 GMT)
LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs [11.7] LlamaDuo"は、サービス指向の大規模言語モデルから、より小さく、ローカルに管理可能なモデルに移行するためのパイプラインである。
当社のパイプラインは,運用上の障害や厳格なプライバシポリシ,あるいはオフライン要件の存在下でのサービス継続性の確保に不可欠です。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:54:27 GMT)
Mirror contrastive loss based sliding window transformer for subject-independent motor imagery based EEG signal recognition [11.5] 左右運動の精神像は、脳の対側感覚運動野における事象関連脱同期を誘導する。
本研究では,MCL-SWT(Miror Contrastive Loss based Sliding Window Transformer)を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:38:36 GMT)
Shot Segmentation Based on Von Neumann Entropy for Key Frame Extraction [11.5] Von Neumannエントロピーを用いたショットセグメンテーションに基づくビデオ鍵フレーム抽出アルゴリズムを提案する。
抽出されたキーフレームは、繰り返しフレーム数を最小化しつつ、元のビデオ内容を完全にかつ正確に表現することができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:08:21 GMT)
Variational Mode-Driven Graph Convolutional Network for Spatiotemporal Traffic Forecasting [11.4] 本稿では,変分モード分解(VMD)法を用いてSTデータをモードに分解するフレームワークを提案する。
我々のフレームワークは最先端の手法よりも優れた結果をもたらす。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:09:30 GMT)
Joint Optimization of Piecewise Linear Ensembles [11.3] ツリーアンサンブルは多くの予測タスクで最先端のパフォーマンスを達成する。
我々は$textbfJ$oint $textbfO$ptimization of $textbfL$inear $textbfEn$sembles (JOPLEn)を提案する。
JOPLEnは、スパーシティ・プロモーティングや部分空間ノルムを含むいくつかの一般的な罰則を非線形予測に適用することを許している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:21:07 GMT)
Iterative Methods for Vecchia-Laplace Approximations for Latent Gaussian Process Models [11.1] 本稿では,いくつかのプレコンディショナーを導入,解析し,新しい収束結果の導出を行い,予測分散を正確に近似する新しい手法を提案する。
特に、Coleskyベースの計算と比較すると、桁違いの高速化が得られる。
すべてのメソッドは、ハイレベルなPythonとRパッケージを備えたフリーのC++ソフトウェアライブラリで実装されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:40:44 GMT)
Optimal Parallelization of Boosting [11.0] Boostingの並列複雑性に関する最近の研究は、トレーニングラウンド数$p$とラウンドあたりの並列処理総数$t$とのトレードオフに関して、強い低い境界を確立している。
これらの進歩にもかかわらず、理論的な下界とこれらのアルゴリズムのトレードオフ空間の多くにおける性能の間には大きなギャップが残っている。
本研究では,弱強学習者の並列的複雑性に対する改善された下位境界と,これらの境界値が対数係数までの範囲で比較可能な並列ブースティングアルゴリズムの両方を提供することで,このギャップを解消する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:56:22 GMT)
VideoMambaPro: A Leap Forward for Mamba in Video Understanding [11.0] ビデオ理解には豊かな時間的表現の抽出が必要であり、トランスフォーマーモデルは自己認識によって達成される。
NLPでは、Mambaはトランスモデルの効率的な代替品として浮上している。
VideoMambaProは、トランスフォーマーモデルと比較して最先端のビデオアクション認識性能を示している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:23:45 GMT)
Comparative Analysis of Transfer Learning Models for Breast Cancer Classification [10.7] 本研究は, 病理組織学的スライドにおいて, 浸潤性直腸癌 (IDC) と非IDCを区別する深層学習モデルの効率について検討した。
ResNet-50, DenseNet-121, ResNeXt-50, Vision Transformer (ViT), GoogLeNet (Inception v3), EfficientNet, MobileNet, SqueezeNet。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:49:32 GMT)
A Guide to Feature Importance Methods for Scientific Inference [10.3] 特徴重要度(FI)法はデータ生成過程(DGP)に有用な洞察を与える
本稿では,グローバルFI手法の解釈の理解を支援するための包括的ガイドとして機能する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:18:16 GMT)
Longitudinal Modularity, a Modularity for Link Streams [10.3] 時間ネットワークは、一般に実生活現象をモデル化するために使用される。
本稿では、ストリームをリンクするためによく知られたモジュラリティ品質関数の最初の適応を紹介します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:58:46 GMT)
Loop Copilot: Conducting AI Ensembles for Music Generation and Iterative Editing [10.2] Loop Copilotはインタラクティブな多ラウンド対話インタフェースを通じてユーザが音楽を生成し、反復的に洗練することを可能にする新しいシステムである。
このシステムは、大きな言語モデルを使用して、ユーザの意図を解釈し、タスク実行に適切なAIモデルを選択する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:08:54 GMT)
UDD: Dataset Distillation via Mining Underutilized Regions [10.0] 合成画像中の未利用領域を特定し,活用するための新しいアプローチであるUDDを提案する。
本稿では,未利用地域を識別・活用し,情報化・識別するための新しいアプローチであるUDDを提案する。
提案手法は, 合成データセットの利用性を向上し, 各種データセット上での最先端手法よりも優れる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:13:01 GMT)
TiCoSS: Tightening the Coupling between Semantic Segmentation and Stereo Matching within A Joint Learning Framework [10.0] TiCoSSは、セマンティックセグメンテーションとステレオマッチングを同時に扱う最先端のジョイントラーニングフレームワークである。
本研究は,(1)密結合型ゲート型特徴融合戦略,(2)階層型深層監視戦略,(3)結合密化損失関数の3つの新しい特徴を紹介する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:05:04 GMT)
LLaVA-SG: Leveraging Scene Graphs as Visual Semantic Expression in Vision-Language Models [9.9] 大規模視覚言語モデル(VLM)におけるシーングラフ表現(SGE)モジュールについて紹介する。
SGEモジュールは、画像内の複雑な意味情報を抽出し、構造的に表現する。
SGEモジュールの統合は視覚言語タスクにおけるVLMの性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:43:20 GMT)
Illuminating the Diversity-Fitness Trade-Off in Black-Box Optimization [9.8] 現実世界のアプリケーションでは、ユーザーは1つの高品質なソリューションよりも構造的に多様な設計選択を好むことが多い。
本稿では, この課題に対する新たな視点として, 与えられたしきい値を超えるペア距離の一定数の解を同定する問題を考察する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:55:55 GMT)
Outside the Comfort Zone: Analysing LLM Capabilities in Software Vulnerability Detection [9.7] 本稿では,ソースコードの脆弱性検出における大規模言語モデルの機能について,徹底的に解析する。
我々は6つの汎用LCMに対して脆弱性検出を特別に訓練した6つのオープンソースモデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:00:57 GMT)
InstructERC: Reforming Emotion Recognition in Conversation with Multi-task Retrieval-Augmented Large Language Models [9.6] 本稿では,識別的枠組みから大規模言語モデル(LLM)に基づく生成的枠組みへ,感情認識タスクを再構築するための新しいアプローチであるインストラクタCを提案する。
InstructERCは、3つの重要な貢献をしている:(1)モデルがマルチグラニュラリティ対話監視情報を明示的に統合するのに役立つ単純で効果的なテンプレートモジュール、(2)話者識別と感情予測タスクという2つの追加の感情アライメントタスクを導入し、会話における対話の役割の関係と将来の感情傾向を暗黙的にモデル化する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:14:36 GMT)
A Flying Bird Object Detection Method for Surveillance Video [9.6] 本稿では,FBOD-SV(Flying Bird Object Detection for Surveillance Video)を提案する。
FBOD-SVは、トラクション・サブステーション監視ビデオにおいて、飛行する鳥の物体の実験的データセットを用いて検証されている。
実験結果から,FBOD-SVは監視ビデオにおいて飛来する鳥の物体の検出性能を効果的に向上することが示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:52:40 GMT)
Mismatched: Evaluating the Limits of Image Matching Approaches and Benchmarks [9.4] 2次元画像からの3次元3次元再構成はコンピュータビジョンにおける活発な研究分野である。
伝統的にこの作業にはパラメトリック技術が用いられてきた。
近年の進歩は、学習ベースの方法にシフトしている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:16:34 GMT)
CGRA4ML: A Framework to Implement Modern Neural Networks for Scientific Edge Computing [9.4] CGRA4MLは、ニューラルネットワークモデルの複雑さと極端なパフォーマンス要件の間のギャップを埋めるために設計された、オープンソースのモジュラーフレームワークである。
HLS4MLとは異なり、CGRA4MLはSystemVerilog RTLを生成しており、ASICやFPGAの設計フローをターゲットにするのに適している。
CGRA4MLのPython API、SystemVerilogハードウェア、Tclツールフロー、Cランタイムの最小限のモジュラーインフラストラクチャは、統合と実験を容易にする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:26:50 GMT)
Fine-grained Classification of Port Wine Stains Using Optical Coherence Tomography Angiography [9.4] ポートワイン染色(Port wine stains, PWS)は、出生時に発生する血管奇形である。
皮膚外見に基づくPWSの分類法は,PWS病変の血管病理学的多様性を反映することが稀である。
本研究はOCTとOCTAの両方を用いたPWSの新しい分類手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:56:34 GMT)
SAU: A Dual-Branch Network to Enhance Long-Tailed Recognition via Generative Models [9.3] 画像認識における長い尾の分布は、いくつかの支配階級間の深刻な不均衡のため、大きな課題となる。
近年,画像分類のための合成データ作成に大規模な生成モデルが用いられている。
本稿では,データ不均衡の影響を解消するために,長い尾のデータセットを補完する合成データを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:33:59 GMT)
Eigen-Cluster VIS: Improving Weakly-supervised Video Instance Segmentation by Leveraging Spatio-temporal Consistency [9.1] この研究は、Eigen-cluster VISと呼ばれる新しい弱教師付き手法を導入する。
マスクアノテーションを必要とせずに、他のVISアプローチと比較して、競争精度が向上する。
YouTube-VIS21とOVIS 2019/20データセットで評価されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:05:05 GMT)
A Computational Framework for Modeling Emergence of Color Vision in the Human Brain [9.1] 脳がどのようにして色覚を受信した視神経信号から純粋にデコードするかは謎である。
眼と大脳皮質の両方をシミュレートすることで、人間の色覚の出現をモデル化するための計算フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:27:06 GMT)
Dual-Domain CLIP-Assisted Residual Optimization Perception Model for Metal Artifact Reduction [9.0] CT(Computed tomography)画像における金属遺物は,正確な臨床診断に重要な課題である。
深層学習に基づくアプローチ、特に生成モデルは、金属人工物還元(MAR)のために提案されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:11:13 GMT)
MSDiagnosis: An EMR-based Dataset for Clinical Multi-Step Diagnosis [9.0] 我々は多段階診断タスクを提案し、臨床診断データセット(MSDiagnosis)に注釈を付ける。
本データセットは、一次診断、鑑別診断、最終診断質問を含む。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:21:54 GMT)
A GREAT Architecture for Edge-Based Graph Problems Like TSP [8.9] グラフニューラルネットワーク(GNN)は、ルーティング問題などの高密度グラフを操作するには適していない。
グラフエッジ注意ネットワーク(GREAT)と呼ばれる新しいGNN関連エッジベースニューラルモデルを提案する。
GREATは最適エッジの大部分を維持しながらスパースグラフを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:07:43 GMT)
EaDeblur-GS: Event assisted 3D Deblur Reconstruction with Gaussian Splatting [8.8] ガウススプラッティング(EaDeblur-GS)を用いたイベント支援3次元デブロア再構成について述べる。
イベントカメラデータを統合して、3DGSの動作のぼかしに対する堅牢性を高める。
高速な3D再構成をリアルタイムで実現し、最先端の手法に匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:52:46 GMT)
Gradient Descent Fails to Learn High-frequency Functions and Modular Arithmetic [8.8] 本稿では,勾配に基づく学習手法を用いて,限界と課題の数学的解析を行う。
我々は、周波数または素基底$p$が大きい場合、両方の場合において勾配のばらつきが無視できるほど小さいことを強調する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:58:47 GMT)
3D Whole-body Grasp Synthesis with Directional Controllability [8.7] 物体をリアルに把握する3次元体全体を合成するCWGraspを提案する。
CWGraspは「遅すぎる」ではなく「早期オン」という幾何学に基づく推論を行い、推論のためのリッチな「制御」信号を提供する。
GRABとReplicaGraspのデータセットを評価した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:59:54 GMT)
Uni-3DAD: GAN-Inversion Aided Universal 3D Anomaly Detection on Model-free Products [8.7] モデルフリー製品におけるあらゆる種類の欠陥を識別できる,統一された,教師なしの3次元異常検出フレームワークを提案する。
本手法では,特徴に基づく検出モジュールと再構成に基づく検出モジュールの2つの検出モジュールを統合する。
その結果,提案手法は不完全形状の同定において最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:46:37 GMT)
Unconditionally separating noisy $\mathsf{QNC}^0$ from bounded polynomial threshold circuits of constant depth [8.7] 制限しきい値関数を演算する境界を持つ定数深さ回路のクラスについて検討する。
十分大きな$mathsfbPTFC0[k]$の場合、$mathsfbPTFC0[k]は$mathsfTC0[k]を含む。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:40:55 GMT)
Towards Efficient Modelling of String Dynamics: A Comparison of State Space and Koopman based Deep Learning Methods [8.7] State Space Models (SSM) と Koopman に基づくディープラーニング手法は、線形および非線形の剛弦の力学をモデル化する。
以上の結果から,提案したクープマンモデルが,長周期モデリングにおける非線形ケースにおいて,他の既存手法と同等以上の性能を示すことが示唆された。
本研究は、これらの手法と過去の手法の比較概要を提供し、モデル改善のための革新的な戦略を導入することにより、力学系の物理モデリングに関する洞察を貢献する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:55:27 GMT)
The Dark Side of Function Calling: Pathways to Jailbreaking Large Language Models [8.4] 本稿では,大規模言語モデル(LLM)の関数呼び出しプロセスにおける重大な脆弱性を明らかにする。
本稿では,アライメントの相違,ユーザ強制,厳密な安全フィルタの欠如を生かした,新しい"jailbreak function"攻撃手法を提案する。
本研究は,LLMの機能呼び出し機能において,緊急のセキュリティ対策の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:58:46 GMT)
DroneWiS: Automated Simulation Testing of small Unmanned Aerial Systems in Realistic Windy Conditions [8.3] DroneWiSは、sUAS開発者が現実的な風の条件を自動的にシミュレートし、sUASの風に対するレジリエンスをテストすることを可能にする。
ガゼボやAirSimのような現在の最先端のシミュレーションツールとは異なり、DroneWiSは計算流体力学(CFD)を利用してユニークな風速を計算する。
このシミュレーション機能は、困難で現実的な風の条件下でのsUASのナビゲーション能力について、開発者に深い洞察を提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:25:11 GMT)
Spurfies: Sparse Surface Reconstruction using Local Geometry Priors [8.3] 我々はスパースビュー表面再構成の新しい手法であるSpurfiesを紹介した。
それは、合成データに基づいて訓練された局所幾何学的先行情報を利用するために、外観と幾何学的情報を切り離す。
提案手法をDTUデータセット上で検証し,従来技術よりも表面品質が35%向上したことを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:02:47 GMT)
Not (yet) the whole story: Evaluating Visual Storytelling Requires More than Measuring Coherence, Grounding, and Repetition [8.1] 人間の類似性の観点から,物語の質を計測する新しい手法を提案する。
次に、この手法を用いて、複数のモデルによって生成されたストーリーを評価する。
TAPMのビジュアルコンポーネントと言語コンポーネントをアップグレードすると、競合するパフォーマンスをもたらすモデルが得られる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:58:09 GMT)
Batched Stochastic Bandit for Nondegenerate Functions [8.0] 本稿では,非退化関数に対するバッチ帯域学習問題について検討する。
本稿では,非退化関数に対するバッチバンドイット問題をほぼ最適に解くアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:58:35 GMT)
EvLight++: Low-Light Video Enhancement with an Event Camera: A Large-Scale Real-World Dataset, Novel Method, and More [8.0] EvLight++は、現実のシナリオで堅牢なパフォーマンスのために設計された、イベント誘導型低照度ビデオ拡張アプローチである。
EvLight++は1.37dBと3.71dBの2つのイメージベースとビデオベースの両方で大幅に性能が向上した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 04:30:31 GMT)
DetectBERT: Towards Full App-Level Representation Learning to Detect Android Malware [7.8] 本稿では,Android マルウェアの高次元性と可変性を扱うために,相関型多重インスタンス学習 (c-MIL) と DexBERT を統合した DetectBERT を提案する。
評価の結果,T DetectBERT は既存の最先端検出手法に勝るだけでなく,マルウェアの脅威の進展にも適応していることがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:47:25 GMT)
DeepSPoC: A Deep Learning-Based PDE Solver Governed by Sequential Propagation of Chaos [7.8] カオスの逐次伝播(SPoC)は,最近開発された平均場微分方程式の解法である。
本稿では,SPoCの相互作用粒子系と深層学習を組み合わせた新しい手法(deepSPoC)を提案する。
高次元問題に対しては、深部SPoCの精度と効率をさらに向上するために空間適応法が設計されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:02:29 GMT)
SurveySum: A Dataset for Summarizing Multiple Scientific Articles into a Survey Section [7.4] 本稿では,複数の学術論文を要約した新しいデータセットについて紹介する。
筆者らの貢献は,(1)ドメイン固有の要約ツールのギャップに対処する新しいデータセットであるサーベイサム,(2)科学論文を1つのセクションにまとめる2つの特定のパイプライン,(3)これらのパイプラインの評価を複数の指標を用いて比較することである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:13:23 GMT)
ECC Analyzer: Extract Trading Signal from Earnings Conference Calls using Large Language Model for Stock Performance Prediction [7.4] 本研究は, 大規模言語モデル(LLM)を用いてECCからよりリッチで予測性の高いコンテンツを抽出する, textbfECC Analyzer という新しいフレームワークを紹介する。
我々は、事前訓練された大規模モデルを用いて、ECCからテキストや音声の特徴を抽出し、階層的な情報抽出戦略を実装し、よりきめ細かい情報を抽出する。
実験により,本モデルが従来の分析ベンチマークより優れていることが示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:13:56 GMT)
Statistical and Geometrical properties of regularized Kernel Kullback-Leibler divergence [7.3] Bach [2022] が導入したカーネル共分散作用素によるクルバック・リーブラ発散の統計的および幾何学的性質について検討する。
密度比を含む古典的なクルバック・リーブラー(KL)の発散とは異なり、KKLは再現可能なカーネルヒルベルト空間(RKHS)における共分散作用素(埋め込み)による確率分布を比較する。
この斬新な発散は、確率分布と最大平均誤差のようなカーネル埋め込みメトリクスの間の標準のクルバック・リーバーと平行だが異なる側面を共有する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:01:30 GMT)
Manipulating OpenFlow Link Discovery Packet Forwarding for Topology Poisoning [7.2] トポロジ情報を変更するために OpenFlow リンクフォワードを操作する新しいトポロジ中毒技術である Marionette を紹介する。
我々のアプローチは見過ごされているが、広範囲にわたる攻撃ベクトルを露呈する。
Marionetteは5つのオープンソースコントローラと9つのOpenFlowベースのディスカバリプロトコルをうまく攻撃する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:30:36 GMT)
Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges [7.1] このレビューでは、テキスト生成の作業を5つの主要なタスクに分類する。
各タスクについて、関連する特徴、サブタスク、および特定の課題についてレビューする。
近年のテキスト生成論文では,タスクやサブタスクに共通する9つの顕著な課題が報告されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:05:27 GMT)
OP-Align: Object-level and Part-level Alignment for Self-supervised Category-level Articulated Object Pose Estimation [7.0] カテゴリーレベルの調音オブジェクトのポーズ推定は、既知のカテゴリ内の未知の調音オブジェクトのポーズ推定に焦点を当てる。
本稿では,この課題を解決するために,単一フレームの点群を利用した新たな自己教師型アプローチを提案する。
我々のモデルは、入力対象全体に対する標準ポーズとジョイントステートを連続的に生成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:10:14 GMT)
HYGENE: A Diffusion-based Hypergraph Generation Method [7.0] 本稿では, 局所展開の進展による課題に対処する拡散型ハイパーグラフ生成(HYGENE)手法を提案する。
実験では、ハイジェネの有効性を示し、ハイパーグラフの様々な特性を忠実に模倣する能力を示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:45:01 GMT)
TinyTNAS: GPU-Free, Time-Bound, Hardware-Aware Neural Architecture Search for TinyML Time Series Classification [7.0] TinyTNASは,TinyML時系列分類に特化して設計された,ハードウェア対応の多目的ニューラルアーキテクチャ検索(NAS)ツールである。
GPU機能に依存する従来のNASメソッドとは異なり、TinyTNASはCPU上で効率的に動作し、幅広いアプリケーションにアクセスできる。
TinyTNASは、RAM、FLASH、MAC使用率、レイテンシを大幅に削減した最先端の精度を示している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:50:08 GMT)
Scalable Variational Causal Discovery Unconstrained by Acyclicity [7.0] 観測データから得られた因果グラフ上の後部分布を学習するために,スケーラブルなベイズ的手法を提案する。
有効な非巡回因果グラフを生成することができる新しい微分可能なDAGサンプリング手法を提案する。
連続領域上の単純な変分分布を用いて因果グラフ上の後部分布をモデル化することができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:40:05 GMT)
Enabling Causal Discovery in Post-Nonlinear Models with Normalizing Flows [7.0] 非線形後因果モデル(PNL)は因果関係をモデル化するための汎用的で適応可能なフレームワークとして際立っている。
CAF-PoNoを導入し、正規化フローアーキテクチャのパワーを活用し、PNLモデルにおいて重要な可逆性制約を強制する。
本手法は,原因-影響同定において重要な役割を担う隠れ雑音を正確に再構成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:34:59 GMT)
Easy, Interpretable, Effective: openSMILE for voice deepfake detection [6.9] 音声攻撃を驚くほど正確に識別するために, 簡易な特徴が有効であることを示す。
これらの機能のいくつかの一般化機能は、攻撃間で効果的に転送される。
この発見は、音声のアンチスプーフィングが、部分的には個々のTSシステムの署名や指紋を識別し記憶する問題であることを示しているかもしれない。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:58:35 GMT)
Generalization of Hamiltonian algorithms [6.8] 本稿では,学習アルゴリズムのクラスに対する一般化結果を示す。
この方法はアルゴリズムが任意のa-プリオリ測度に対して絶対連続分布を生成するときに適用される。
Gibbsアルゴリズムと安定した決定論的アルゴリズムのランダム化、およびデータ依存の先行値を持つPAC-Bayesian境界に対する応用である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:41:52 GMT)
Emerging Vulnerabilities in Frontier Models: Multi-Turn Jailbreak Attacks [6.8] この作業では、Jailbreakのデータセットを導入し、各サンプルを1つまたは複数ターンのフォーマットで入力できる。
コンテンツでは同等だが、ジェイルブレイクの成功では同等ではない。ある構造に対する防御は、他方に対する防御を保証するものではない。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:30:05 GMT)
Enhancing Autism Spectrum Disorder Early Detection with the Parent-Child Dyads Block-Play Protocol and an Attention-enhanced GCN-xLSTM Hybrid Deep Learning Framework [6.8] 本研究は,ASDと発達幼児を区別する行動パターンを識別するための,親子ダイズブロックプレイ(PCB)プロトコルを提案する。
40人のASDと89人のTD幼児が親とのブロックプレイに従事している。
このデータセットは、参加者の規模と個々のセッションの長さの両方に関する以前の取り組みを上回る。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:53:01 GMT)
A Score-Based Density Formula, with Applications in Diffusion Generative Models [6.8] スコアベース生成モデル(SGM)は、生成モデリングの分野に革命をもたらし、現実的で多様なコンテンツを生成するのに前例のない成功を収めた。
実験的な進歩にもかかわらず、ログライクリッド上でのエビデンスローバウンド(ELBO)の最適化がDDPMなどの拡散生成モデルの訓練に有効である理由に関する理論的根拠はほとんど未解明のままである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:59:07 GMT)
Comparing quantum and classical Monte Carlo algorithms for estimating Betti numbers of clique complexes [6.7] クリプト錯体上のベッチ数推定(BNE)のための量子および古典モンテカルロアルゴリズムが最近提案されている。
我々はこれらのアルゴリズムをレビューし、新しいモジュラーフレームワーク内で共通のモンテカルロ構造を強調した。
異なるモジュールを再結合することにより、サンプルの複雑さに指数関数的に改善された依存を持つ新しい量子アルゴリズムを作成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:35:50 GMT)
Coalitions of AI-based Methods Predict 15-Year Risks of Breast Cancer Metastasis Using Real-World Clinical Data with AUC up to 0.9 [6.7] 乳がんは女性の死亡率が最も高い2つのがんのうちの1つで、米国では毎年約4万2000人が死亡している。
現在の予後指標は、局所治療後に治癒したと思われる5人の女性のうち4人にはほとんど効果がない。
我々は、既存のデータのみを用いて、ROC分析において最大0.9のAUCを示すアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 04:35:36 GMT)
Learning to Detect and Segment for Open Vocabulary Object Detection [6.7] オープン語彙設定のためのボックス回帰とマスクセグメンテーションをより一般化する,原理的動的ネットワーク設計を提案する。
CondHeadは2つのネットワークヘッド、動的に集約されたヘッドと動的に生成されたヘッドで構成されている。
提案手法は,非常に少ないオーバーヘッドで,最先端のオープン語彙オブジェクト検出手法に大幅な改善をもたらす。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:08:14 GMT)
Conformal Performance Range Prediction for Segmentation Output Quality Control [6.5] 提案手法は,ユーザの特定確率に基底真理を含ませることの統計的保証を伴って,性能範囲を予測する新しい手法である。
FIVES網膜血管セグメンテーションデータセットへのアプローチを実証し、5つの一般的なサンプリングベース不確実性推定手法を比較した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:12:39 GMT)
Anchor-Controlled Generative Adversarial Network for High-Fidelity Electromagnetic and Structurally Diverse Metasurface Design [6.5] 本稿では、AcGAN(Anchor- controlled Generative Adversarial Network)という新しい生成フレームワークを紹介する。
AcGANは、構造的に多様な準曲面を作るための1対多の課題を効果的にナビゲートしながら、電磁忠実度を優先する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:11:55 GMT)
Improving Diffusion-based Data Augmentation with Inversion Spherical Interpolation [6.4] 拡散に基づくDA法は,高品質なサンプルを生成する上で重要な2つの鍵である忠実さと多様性の両方を考慮できない。
本稿では,新しいインバージョン補間DA法Diff-IIを提案する。
複数の画像分類タスクの実験は、Diff-IIが最先端拡散に基づくDA法に対して有効であることを示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:05:02 GMT)
Revisit Micro-batch Clipping: Adaptive Data Pruning via Gradient Manipulation [6.4] 勾配クリッピング法であるマイクロバッチクリッピングは,最近,自動音声認識(ASR)モデルの性能向上の可能性が示された。
本稿では,この現象を説明するための最初の試みを行う。
また、視覚モデルや言語モデルにおける音声モデル以外のマイクロバッチクリッピングの有効性を検証するとともに、これらの領域において有望な性能向上を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:50:13 GMT)
Conditional score-based diffusion models for solving inverse problems in mechanics [6.3] 条件付きスコアベース拡散モデルを用いてベイズ推定を行う枠組みを提案する。
条件付きスコアベース拡散モデルは条件分布のスコア関数を近似する生成モデルである。
メカニクスにおける高次元逆問題に対して提案手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:47:18 GMT)
Super-Resolution works for coastal simulations [6.3] 高解像度のシミュレーションは、特に津波や暴風雨による洪水を予測するために、多くのプロセスの理解を深めるために必要である。
本稿では,高分解能数値解を効率的に学習するための超解法拡張のためのDeep Networkを提案する。
提案手法は,最先端の手法と比較して,高精細度で高速な計算が可能である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:16:13 GMT)
Sparse Signal Reconstruction for Overdispersed Low-photon Count Biomedical Imaging Using $\ell_p$ Total Variation [6.2] 負二項統計モデルの枠組みにおける等方的および異方的$ell_p$テレビ準セミノルムについて検討する。
この問題を最適化問題として定式化することができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:31:43 GMT)
Follow-up Attention: An Empirical Study of Developer and Neural Model Code Exploration [6.1] OpenAI CodexやAlphaCodeといった最近のコードニューラルモデルは、コード生成において顕著な習熟性を示している。
しかしながら、モデルが実際にどのようにコードを処理しているか、その理由や注意機構がどのようにコードをスキャンするかが開発者のパターンとどのように一致しているかは、よくわからない。
この研究は、CodeGen、InCoder、GPT-Jの3つのオープンな言語モデルの処理された注意信号が、開発者がどのようにコードを見て探索するかにどのように一致するかを研究する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:36:20 GMT)
Understanding Privacy Norms through Web Forms [6.0] 11,500の人気のあるWebサイト上で、Webフォームを見つけるための特殊なクローラーを構築します。
11,500のWebサイトで運用し、293KのWebフォームのデータセットを作成します。
注釈付きデータセットを解析することにより、データ収集プラクティスの一般的なパターンを明らかにする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:11:09 GMT)
A Minibatch-SGD-Based Learning Meta-Policy for Inventory Systems with Myopic Optimal Policy [5.9] 勾配降下(SGD)は多くの在庫管理問題を需要学習で解くのに有効であることが証明されている。
本稿では,新しいミニバッチSGDに基づくメタ政治を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 00:36:34 GMT)
Post-processing fairness with minimal changes [5.9] 本稿では,モデルに依存しない新しいポストプロセッシングアルゴリズムを提案する。
我々のアルゴリズムは偏りのある予測と偏りのある予測の間の最小限の変化を強制するように設計されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:59:13 GMT)
Toward Robust Early Detection of Alzheimer's Disease via an Integrated Multimodal Learning Approach [5.9] アルツハイマー病(英: Alzheimer's Disease、AD)は、記憶障害、執行機能障害、性格変化を特徴とする複雑な神経変性疾患である。
本研究では,臨床,認知,神経画像,脳波データを統合した高度なマルチモーダル分類モデルを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:26:00 GMT)
On Feasibility of Intent Obfuscating Attacks [5.9] 本稿では,物体検出器の逆例を生成するために意図難読化法を提案する。
別の重複しないオブジェクトを摂動してターゲットオブジェクトを妨害することで、攻撃者は意図したターゲットを隠す。
対象物体の信頼度や摂動物体の大きさなど,意図的難読化攻撃を特徴付ける成功要因を解析する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:29:36 GMT)
Probabilistic Decomposed Linear Dynamical Systems for Robust Discovery of Latent Neural Dynamics [5.8] 時間変化線形状態空間モデルは、ニューラルネットワークの数学的解釈可能な表現を得るための強力なツールである。
潜在変数推定のための既存の手法は、動的ノイズやシステムの非線形性に対して堅牢ではない。
本稿では,動的雑音に対するロバスト性を改善するために,分解モデルにおける潜在変数推定に対する確率的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:58:39 GMT)
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever [5.7] ColBERTの遅延相互作用評価は、クロスエンコーダに見られる共同クエリ文書の注意を近似する。
我々の新しいモデルであるJina-ColBERT-v2は、英語および多言語検索タスクで高い性能を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:21:00 GMT)
A Prototype Model of Zero-Trust Architecture Blockchain with EigenTrust-Based Practical Byzantine Fault Tolerance Protocol to Manage Decentralized Clinical Trials [5.6] 本稿では,DCT手術管理における患者生成臨床試験データを統合するためのZero-Trust Architecture(z-TAB)の試作モデルを提案する。
IoT(Internet of Things)はブロックチェーンプラットフォーム内の利害関係者間でのデータ処理を合理化するために統合されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:18:00 GMT)
sEMG-Driven Physics-Informed Gated Recurrent Networks for Modeling Upper Limb Multi-Joint Movement Dynamics [5.5] 本研究では,多関節トルク予測のための物理インフォームドGated Recurrent Network(PiGRN)を提案する。
PiGRNモデルは10個の不慣れな運動に対する関節トルクを正確に予測した。
これらの知見は、PiGRNのリアルタイム外骨格およびリハビリテーションへの応用の可能性を示している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:09:04 GMT)
Chain-of-Experts (CoE): Reverse Engineering Software Bills of Materials for JavaScript Application Bundles through Code Clone Search [5.5] ソフトウェア・ビル・オブ・マテリアル(Software Bill of Materials, SBOM)は、ソフトウェアアーティファクトに含まれるすべてのコンポーネント、ライブラリ、モジュールの詳細な在庫である。
JavaScriptアプリケーションバンドルは、デプロイ用に統合され、シンボルストラップされ、最適化されたコードのアセンブリである。
JavaScriptアプリケーションバンドルからリバースエンジニアリングプロセスを通じてSBoMを生成することで、サプライヤのソフトウェアリリースの整合性、セキュリティ、コンプライアンスが保証される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:32:49 GMT)
3D Pose-Based Temporal Action Segmentation for Figure Skating: A Fine-Grained and Jump Procedure-Aware Annotation Approach [5.5] フィギュアスケートでは、スケーターの3D動作を見て技術判断を行い、その判断手順の一部が時間行動(TAS)課題とみなすことができる。
3Dポーズデータを必要とするTASタスクには、データセットの欠如と効果的な方法がある。
本研究では,光学マーカーレスモーションキャプチャーを用いて,複雑なフィギュアスケートジャンプと動的フィギュアスケートジャンプのFS-Jump3Dデータセットを初めて作成した。
また,TASモデルでジャンプ手順を学習可能な,詳細なフィギュアスケートジャンプTASデータセットアノテーション手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:42:06 GMT)
CReMa: Crisis Response through Computational Identification and Matching of Cross-Lingual Requests and Offers Shared on Social Media [5.4] 危機の時代には、ソーシャルメディアプラットフォームはコミュニケーションの促進と資源の調整において重要な役割を担っている。
本稿では,CReMa(Crisis Response Matcher)を提案する。
16言語でヘルプ検索をシミュレートし,ソーシャルメディアに支援を提供する新しい多言語データセットを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:45:48 GMT)
Physics-Informed Neural Networks and Extensions [5.2] 本稿では,科学機械学習の柱となった新しい物理情報ニューラルネットワーク(PINN)について概説する。
本稿では、近年の実践的拡張について述べるとともに、データ駆動型微分方程式の発見の具体例を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:00:42 GMT)
ChatSUMO: Large Language Model for Automating Traffic Scenario Generation in Simulation of Urban MObility [5.1] 大規模言語モデル(LLM)は、テキスト、音声、画像、ビデオなどのマルチモーダルな入力と出力を扱うことができる。
本稿では,言語処理スキルを統合し,抽象的および実世界のシミュレーションシナリオを生成するLLMベースのエージェントChatSUMOを提案する。
シミュレーション生成のために,オールバニ市における実世界のシミュレーションを96%の精度で作成した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:59:11 GMT)
Text-Region Matching for Multi-Label Image Recognition with Missing Labels [5.1] TRM-MLは意味のあるクロスモーダルマッチングを強化する新しい手法である。
カテゴリ内およびカテゴリ間セマンティックな関係を利用して未知のラベルを推定するカテゴリプロトタイプを提案する。
提案手法は最先端の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:52:45 GMT)
How Do Java Developers Reuse StackOverflow Answers in Their GitHub Projects? [5.1] StackOverflow (SO)は、ソフトウェア開発者およびコンピュータ科学者のための広く使われているQ&A(Q&A)ウェブサイトである。
GitHubは、ソフトウェアプロジェクトの保存、追跡、コラボレーションに使用されるオンライン開発プラットフォームである。
私たちは、GitHubで利用可能なJavaプロジェクトで再利用されたSOの回答をマイニングして、実証的研究を行いました。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:53:26 GMT)
PolarBEVDet: Exploring Polar Representation for Multi-View 3D Object Detection in Bird's-Eye-View [5.0] カルテシアンBEV表現の代替として極性BEV表現を用いることを提案する。
nuScenesの実験では、PolarBEVDetは優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:42:38 GMT)
DLFormer: Enhancing Explainability in Multivariate Time Series Forecasting using Distributed Lag Embedding [5.0] 本研究では,分散ラグ埋め込みと統合されたアテンションベースのアーキテクチャであるDLFormerを紹介する。
既存の注目ベースのハイパフォーマンスモデルと比較して、優れたパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:39:54 GMT)
Measuring the Accuracy of Automatic Speech Recognition Solutions [5.0] 音声認識(ASR)は現在、多くの一般的なアプリケーションの一部となっている。
高等教育講座の講義記録を用いて,11種類の一般的なASRサービスの性能を測定した。
以上の結果から,ベンダー間および個々のオーディオサンプルに対して,精度が広範囲に及んでいることが示唆された。
また,ライブイベントに使用されるASRのストリーミング品質も著しく低下した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:38:55 GMT)
The Illusion of Randomness: An Empirical Analysis of Address Space Layout Randomization Implementations [4.9] アドレス空間レイアウトランダム化の現実の実装は不完全であり、攻撃者が悪用できる弱点を負う。
この研究は、LinuxやWindowsを含む主要なデスクトッププラットフォームにおけるASLRの有効性を評価する。
我々は,Linux 5.18以降のライブラリのエントロピーの大幅なエントロピー削減と,攻撃者が利用複雑性を著しく低減するために活用できる相関パスの同定を行う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:47:41 GMT)
KeyMatchNet: Zero-Shot Pose Estimation in 3D Point Clouds by Generalized Keypoint Matching [4.8] KeyMatchNetは、3Dポイントクラウドにおけるゼロショットポーズ推定のための新しいネットワークである。
本手法は深度情報のみを用いており,多くの産業用途に適用可能である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:56:45 GMT)
Novel Long Distance Free Space Quantum Secure Direct Communication for Web 3.0 Networks [4.8] 本稿では、量子および古典的文脈におけるセキュリティ侵害の防止方法として、我々の新しい長距離自由空間量子セキュアダイレクト通信(LF QSDC)を紹介する。
本研究の焦点は、LF QSDCのWeb 3.0ネットワークインフラストラクチャへの技術設計と導入であり、拡張範囲通信の有効性を強調している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:07:59 GMT)
Category-Theoretical and Topos-Theoretical Frameworks in Machine Learning: A Survey [4.7] カテゴリー理論に基づく機械学習を4つの主流視点から概観する。
最初の3つのトピックについて、主に過去5年間の調査をレビューし、以前の調査を更新し、拡張しました。
第4のトピックは、高次圏論、特にトポス理論を論じるもので、この論文で初めて調査される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:04:57 GMT)
Can LLMs perform structured graph reasoning? [4.7] LLM(Pretrained Large Language Models)は、言語ベースのプロンプトだけで様々な推論能力を示す。
本稿では,半構造化タスクのプロキシとして,様々なグラフ推論タスクを設計する。
上記の課題に対して,5種類のインストラクト微細化LDM (GPT-4, GPT-3.5, Claude-2, Llama-2, Palm-2) をベンチマークした。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:05:44 GMT)
Enhanced Control for Diffusion Bridge in Image Restoration [4.5] 特殊な拡散ブリッジモデルにより、画像復元がより進んだ結果が得られた。
本稿では,低画質画像を条件として拡散ブリッジの制御性を向上させるECDBモデルを提案する。
実験結果から,多くの画像復元作業においてECDBモデルが最先端の結果を得たことが証明された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:09:33 GMT)
H-SGANet: Hybrid Sparse Graph Attention Network for Deformable Medical Image Registration [4.5] 医用画像登録のための軽量ハイブリッドスパースグラフアテンションネットワーク(H-SGANet)を提案する。
H-SGANetは、所定の解剖学的接続を持つビジョングラフニューラルネットワーク(ViG)に基づいて、SGA(Sparse Graph Attention)という中心的なメカニズムを組み込んでいる。
同様のパラメータ数を持つモデルであるVoxelMorphと比較して、H-SGANetはDiceスコアの3.5%と1.5%の大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:11:38 GMT)
Communication Optimization for Distributed Training: Architecture, Advances, and Opportunities [4.4] 分散ディープニューラルネットワークトレーニングの一般的なアーキテクチャを導入し、並列化戦略、集合通信ライブラリ、ネットワーク間の関係を分析する。
現在の3層パラダイムのレイヤは比較的独立しており、分散トレーニングシナリオにおいて、層間協調最適化のためのリッチな設計スペースがあることに気付きました。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:37:03 GMT)
CanCal: Towards Real-time and Lightweight Ransomware Detection and Response in Industrial Environments [4.4] CanCalはリアルタイムかつ軽量なランサムウェア検出システムである。
CanCalは商用製品に統合され、1年以上にわたって332万のエンドポイントにデプロイされた。
2023年3月から2024年4月まで、CanCalは61のランサムウェア攻撃を検出し、阻止した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:26:26 GMT)
Enhancing MOTION2NX for Efficient, Scalable and Secure Image Inference using Convolutional Neural Networks [4.4] この研究は、効率的でスケーラブルなオープンソースSecure Multi-Party Computationプロトコルの開発に寄与する。
我々は,C++ベースのMOTION2NXフレームワーク上に実装されたABY2.0 SMPCプロトコルを用いて,半正直なセキュリティを備えたセキュア畳み込みニューラルネットワーク(CNN)推論アプリケーションを開発した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:50:21 GMT)
GenRec: Generative Sequential Recommendation with Large Language Models [4.4] 我々はGenerative Recommendation(GenRec)という新しいモデルを提案する。
GenRecは軽量で、低リソース環境で効果的にトレーニングするのに数時間しか必要としない。
我々の実験は、GenRecが様々な公開現実世界のデータセットを一般化することを実証した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:27:19 GMT)
Reconsidering the energy efficiency of spiking neural networks [4.4] スパイキングニューラルネットワーク(SNN)は乗算を使わないため、一般的にエネルギー効率が高いと考えられている。
ハードウェアの観点から,ニューラルネットワーク(ANN)とSNNのエネルギー消費の比較を行った。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:00:35 GMT)
SympGNNs: Symplectic Graph Neural Networks for identifiying high-dimensional Hamiltonian systems and node classification [4.3] シンプレクティックグラフニューラルネットワーク(SympGNN)は、高次元ハミルトニアンのシステム同定を効果的に処理できる。
我々はSympGNNがグラフニューラルネットワークの分野における2つの重要な課題である、過度にスムースでヘテロフィな問題を克服できることを示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:47:58 GMT)
How to avoid machine learning pitfalls: a guide for academic researchers [4.2] このガイドでは、マシンラーニングの使用時に発生する一般的なミスと、それを避けるためにできることを概説する。
モデル構築前に何をすべきか、モデルを確実に構築する方法、モデルを堅牢に評価する方法、モデルを公平に比較する方法、結果を報告する方法である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:12:35 GMT)
A comparison between humans and AI at recognizing objects in unusual poses [4.2] 物体が異常なポーズで見えるような難解な画像のギャップについて検討する。
人間はそのようなポーズで物体を認識するのが得意である。
視覚のための深いネットワークは、異常なポーズで体系的に不安定である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:09:58 GMT)
Standardized Interpretable Fairness Measures for Continuous Risk Scores [4.2] 本稿では、ワッサーシュタイン距離に基づく合理的な解釈を伴う連続的なスコアに対する公正度尺度の標準化版を提案する。
我々の測度は計算が容易で、グループ格差の強さを定量化し、解釈するのにも適しており、異なるモデル、データセット、タイムポイントのバイアスを比較するのにも適しています。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:45:26 GMT)
Latent-EnSF: A Latent Ensemble Score Filter for High-Dimensional Data Assimilation with Sparse Observation Data [4.0] 本研究では,非線形ベイズフィルタの観測における高次元化と高空間化の課題に対処するため,新しいデータ同化手法であるLatent-EnSFを提案する。
本研究では,浅波伝搬と中距離気象予報の複雑なモデルを用いた2つの難題に対して,Latent-EnSFの高精度,高速収束,高効率性を実証した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 04:43:20 GMT)
Generalist Segmentation Algorithm for Photoreceptors Analysis in Adaptive Optics Imaging [3.9] 共焦点適応光学スキャニング光眼鏡(AOSLO)イメージングにより、導波路光受容体の反射から円錐を可視化することができる。
本稿では,AOSLO画像中のコーンの検出とセグメンテーションを行うための,ディープラーニング(DL)に基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:38:22 GMT)
Smart Multi-Modal Search: Contextual Sparse and Dense Embedding Integration in Adobe Express [3.9] スケーラブルなマルチモーダル検索システムを構築するには、いくつかのコンポーネントを微調整する必要がある。
埋め込みモデル選択、マッチングとランク付けにおける埋め込みの役割、密着と疎着のバランス等について考察する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:14:48 GMT)
Fourier Spectral Physics Informed Neural Network: An Efficient and Low-Memory PINN [3.9] 本稿では、微分演算子を乗法で置き換えるスペクトルベースニューラルネットワークを提案する。
PINNと比較して、我々のアプローチはメモリの削減とトレーニング時間の短縮を必要とする。
我々は、スペクトル情報を用いてネットワークを訓練する2つの戦略を提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:21:00 GMT)
BiomedBench: A benchmark suite of TinyML biomedical applications for low-power wearables [3.8] 本稿では,ウェアラブルデバイスを用いた患者のリアルタイムモニタリングのための,エンド・ツー・エンドのTinyMLバイオメディカル・アプリケーションからなる新しいベンチマークスイートを提案する。
エネルギー効率の観点から5つの最先端低消費電力プラットフォームの評価を行ったところ,現代のプラットフォームはあらゆる種類のバイオメディカル応用を効果的にターゲットできないことがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:11:21 GMT)
A Kernel-Based Conditional Two-Sample Test Using Nearest Neighbors (with Applications to Calibration, Regression Curves, and Simulation-Based Inference) [3.6] 本稿では,2つの条件分布の違いを検出するカーネルベースの尺度を提案する。
2つの条件分布が同じである場合、推定はガウス極限を持ち、その分散はデータから容易に推定できる単純な形式を持つ。
また、条件付き適合性問題に適用可能な推定値を用いた再サンプリングベースのテストも提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:06:07 GMT)
1 From the Pursuit of Universal AGI Architecture to Systematic Approach to Heterogenous AGI: Addressing Alignment, Energy, & AGI Grand Challenges [3.6] AIは、エナジーウォール、アライメント問題、ナローAIからAGIへの移行という三大課題に直面している。
AIからAGIへの飛躍は、システムアーキテクチャを必要とするバランスの取れた方法で運用される複数の機能サブシステムを必要とする。
本稿では,AGIアーキテクチャを一意的に構築するのではなく,設計固有の経路を多元的に組み合わせることで,人工知能が実現可能であることを主張する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:32:45 GMT)
TempoKGAT: A Novel Graph Attention Network Approach for Temporal Graph Analysis [3.6] 本稿では,時間遅延重みと空間領域上の選択的な隣接集約機構を組み合わせた新しいタイプのグラフアテンションネットワークであるTempoKGATを提案する。
我々は、時間的データを含む交通、エネルギー、健康セクターから複数のデータセットに対するアプローチを評価する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:54:46 GMT)
DuoSpaceNet: Leveraging Both Bird's-Eye-View and Perspective View Representations for 3D Object Detection [3.5] 本稿では,2次元空間(BEVとPV)の3次元認識フレームワークを,いくつかの有用な2次元空間融合戦略とともに提案する。
提案手法であるDuoSpaceNetは,2つの異なる特徴空間を最初に利用し,最先端の3Dオブジェクト検出と,nuScenesデータセット上のBEVマップセグメンテーション結果を実現する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:09:11 GMT)
A small footprint travelling-wave parametric amplifier with a high Signal-to-Noise Ratio improvement in a wide band [3.5] 小型フットプリント走行波パラメトリック増幅器(TWPA)の特性について検討する。
200個のユニットセルと1.1mm2の物理フットプリントを持つが、3GHz帯で平均19dBのパラメトリックゲインを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:23:46 GMT)
BEVal: A Cross-dataset Evaluation Study of BEV Segmentation Models for Autononomous Driving [3.4] 我々は最先端のBEVセグメンテーションモデルの包括的クロスデータセット評価を行う。
本稿では,カメラやLiDARなどの各種センサがモデルの一般化能力に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:49:31 GMT)
LRP4RAG: Detecting Hallucinations in Retrieval-Augmented Generation via Layer-wise Relevance Propagation [3.4] 本稿では,大規模言語モデル(LLM)における幻覚検出手法であるLPP4RAGを提案する。
我々の知る限り、RAG幻覚の検出にLPPを用いたのは今回が初めてです。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:45:30 GMT)
A longitudinal sentiment analysis of Sinophobia during COVID-19 using large language models [3.4] 新型コロナウイルス(COVID-19)のパンデミックにより、キセノフォビア、特にシナフォビアが悪化し、中国系個人に対する差別が広まりつつある。
新型コロナウイルスのパンデミック時にX(Twitter)で表現されたSinophobic sentimentsの縦断的感情分析にLLMを用いた感情分析フレームワークを提案する。
その結果, SinophobicTweets, Sinophobic sentiments, surges in COVID-19 case, it is a significant correlation between the spikes in Sinophobic tweetss, Sinophobic sentiments and surges in COVID-19 case, showed that the evolution of the spread of public sentiment and the prevalence of Sinophobic discourse。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:39:11 GMT)
Convolutional Neural Network Compression Based on Low-Rank Decomposition [3.3] 本稿では,変分ベイズ行列分解を組み込んだモデル圧縮法を提案する。
VBMFは各層における重みテンソルのランクを推定するために用いられる。
その結果, 高圧縮比と低圧縮比では, 圧縮モデルの性能が向上することがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:40:34 GMT)
Improving Ontology Requirements Engineering with OntoChat and Participatory Prompting [3.3] OREは主に、ドメインの専門家からユーザ要求を集めるために、インタビューや共同フォーラムのような手動の手法に依存しています。
Current OntoChatは,大規模な言語モデル(LLM)を使用してプロセスを合理化するための,ORE用のフレームワークを提供する。
本研究は,ユーザストーリのペルソナ,目標,シナリオ,サンプルデータ,データリソースの作成と精錬に重点を置いた,ユーザクエリに基づく事前定義されたプロンプトテンプレートを生成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:34:48 GMT)
TG-PhyNN: An Enhanced Physically-Aware Graph Neural Network framework for forecasting Spatio-Temporal Data [3.3] この研究は、新しいテンポラルグラフ物理インフォームドニューラルネットワークフレームワークであるTG-PhyNNを提示する。
TG-PhyNNは、グラフベースのモデリングにGNNのパワーを活用しながら、トレーニング中に物理的な制約を指針原理として組み込む。
以上の結果から,TG-PhyNNは従来の予測モデルよりも有意に優れていた。
TG-PhyNNは、物理プロセスがデータのダイナミクスを制御しているさまざまな領域において、より信頼性が高く正確な予測を提供するために、効果的に活用する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:41:17 GMT)
SODAWideNet++: Combining Attention and Convolutions for Salient Object Detection [3.3] 本稿では,Salient Object Detectionのために設計されたSODAWideNet++と呼ばれる新しいエンコーダ・デコーダ型ニューラルネットワークを提案する。
視覚変換器が初期からグローバルな受容場を得る能力に触発されて、注意誘導長距離特徴抽出(AGLRFE)モジュールを導入する。
ImageNet事前トレーニングの現在のパラダイムとは対照的に、提案したモデルエンドツーエンドの事前トレーニングのためにアノテーションをバイナライズすることで、COCOセマンティックセグメンテーションデータセットから118Kの注釈付き画像を修正します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:51:06 GMT)
Content Significance Distribution of Sub-Text Blocks in Articles and Its Application to Article-Organization Assessment [3.2] サブテキストブロックのコンテンツ重要度分布(CSD)の概念を定式化する。
特に,Hugging FaceのSentence Transformerを利用して文脈文の埋め込みを生成する。
近似 CSD-1 は正確な CSD-1 とほぼ同一であることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:25:04 GMT)
Quantum Advantage via Efficient Post-processing on Qudit Shadow tomography [3.2] 我々は、この計算を、広い行列のクラスに対して$O(textpoly(log d))$ timeで行うために、量子的優位性を活用することを検討する。
本稿では,Dense Dual Baseへのランダム射影計測を利用した任意の$d$次元システムに対するシャドウトモグラフィー手法を提案する。
このスキームは量子情報科学以上の大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:56:16 GMT)
XCSP3: An Integrated Format for Benchmarking Combinatorial Constrained Problems [3.1] 新しいフォーマットはコンパクトで、可読性が高く、パースも比較的容易である。
XCSP3は、ほとんどすべての制約を包含している。
ユーザは、非常に正確な基準からインスタンスを選択するための洗練されたクエリを作成できる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:26:01 GMT)
XCSP3-core: A Format for Representing Constraint Satisfaction/Optimization Problems [3.1] XCSP3-coreはXCSP3のサブセットであり、制約満足度/最適化問題を表現することができる。
JavaとC++で書かれた(関数を使って)XCSP3コアコールバック
制約解決器の比較(競合)のコアフォーマットを定義すること。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:54:04 GMT)
Coherent Information Phase Transition in a Noisy Quantum Circuit [3.1] ノイズの多い監視量子回路に量子強調演算を導入する。
この遷移は、ノイズと量子化演算の相対周波数によって変調される。
この位相遷移を特徴付けるための資源効率の高いプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:09:35 GMT)
Enhancing Intrusion Detection in IoT Environments: An Advanced Ensemble Approach Using Kolmogorov-Arnold Networks [3.1] 本稿では,KAN(Kolmogorov-Arnold Networks)とXGBoostアルゴリズムを組み合わせたハイブリッド侵入検知システムを提案する。
提案したIDSは,学習可能なアクティベーション関数を用いてデータ内の複雑な関係をモデル化し,XGBoostの強力なアンサンブル学習手法と併用する。
実験により,我々のハイブリッドIDSは,良性行動と悪意行動の区別において,99%以上の精度で検出できることがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:54:31 GMT)
Android Malware Detection Based on RGB Images and Multi-feature Fusion [3.1] 本稿では,RGB画像と多機能融合に基づくエンドツーエンドのAndroidマルウェア検出手法を提案する。
実験の結果,提案手法はAndroidのマルウェア特性を効果的に把握し,97.25%の精度を実現している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:18:54 GMT)
Optimal Trace Distance and Fidelity Estimations for Pure Quantum States [3.1] 本稿では,純状態から加法誤差の範囲内におけるトレース距離と(平方根)忠実度の両方を推定する最適量子アルゴリズムを開発する。
我々の構築の中心は、よく知られた量子振幅推定を一般化する量子平方根振幅推定のアルゴリズムツールである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:59:55 GMT)
Multi-Reference UCCSD Variational Quantum Algorithm for Molecular Ground State Energies [3.0] 本稿では,Multi-Reference Unitary Coupled Cluster Singles and Doubles (MR-UCCSD)モデルを実装した。
MR-UCCSD法は, より優れたMR状態の利益として, 10$-5$ Hartree 以下の事前定義された誤差を系統的に満足する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:35:58 GMT)
ReXamine-Global: A Framework for Uncovering Inconsistencies in Radiology Report Generation Metrics [3.0] ReXamine-Globalは、さまざまな書き込みスタイルと患者集団のメトリクスをテストするフレームワークである。
本研究では,ReXamine-Globalを7つの確立されたレポート評価指標に適用し,その一般化可能性の重大なギャップを明らかにする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:03:05 GMT)
Do Recommender Systems Promote Local Music? A Reproducibility Study Using Music Streaming Data [3.0] 本稿では,レコメンデータシステムによるローカル音楽表現への影響について検討する。
以前の研究では、異なるレコメンデーターシステムは、音楽の消費をローカルなコンテンツにシフトさせるアルゴリズム的バイアスを示すと主張した。
本研究の結論の堅牢性を評価するため,グローバル音楽ストリーミングサービスの独自リスニングデータを用いて比較分析を行った。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:44:59 GMT)
MSLIQA: Enhancing Learning Representations for Image Quality Assessment through Multi-Scale Learning [2.9] 我々は,新しい拡張戦略を導入することにより,汎用軽量NR-IQAモデルの性能を向上させる。
この拡張戦略により、ズームインおよびアウトにより、画像の様々な部分における異なる歪みをネットワークがよりよく識別することができる。
テスト時間の拡張はパフォーマンスをさらに向上させ、私たちの軽量ネットワークの結果は現在の最先端モデルに匹敵するものになる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:05:02 GMT)
Turbulence Strength $C_n^2$ Estimation from Video using Physics-based Deep Learning [2.9] 長距離から撮影した画像は、ランダムな温度の空気セルの乱流によるダイナミックな画像歪みに悩まされている。
画像ダンスとして知られるこの現象は、その屈折率-指数構造定数$C_n2$を乱流強度の尺度として特徴付ける。
本稿では、C_n2$推定のための古典的画像勾配法と畳み込みニューラルネットワークを利用した現代のディープラーニングに基づく手法の比較分析を行う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:31:51 GMT)
LoraMap: Harnessing the Power of LoRA Connections [2.9] 本稿では,ローランド適応(LoRA)モデル間の接続を確立する手法について検討する。
ファクトチェックと微調整の個々のLoRAに適した3つの推論データセットを作成します。
それらの間の接続をマップするアプローチであるLoraMapを紹介します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:02:52 GMT)
Large-Scale Multi-omic Biosequence Transformers for Modeling Peptide-Nucleotide Interactions [2.8] 本研究は,最初のマルチオミックヌクレオチド-ペプチド基盤モデルについて述べる。
これらのマルチオミクスモデルは、様々な単一オミクス分布間の結合表現を学習可能であることを示す。
また,MOMはペプチド-ヌクレオチド相互作用タスクにおける最先端の結果を得るために微調整できることを示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:56:40 GMT)
Exploiting temporal information to detect conversational groups in videos and predict the next speaker [2.8] 本稿では,ビデオシーケンス中のF生成を検出し,グループ会話における次の話者を予測することを目的とする。
私たちは、グループに属する人のエンゲージメントレベルを測定することに依存しています。
MatchNMingleデータセットの実験では、グループ検出では85%正の正が、次の話者の予測では98%の精度が得られた。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:41:36 GMT)
LLMs vs Established Text Augmentation Techniques for Classification: When do the Benefits Outweight the Costs? [2.8] 近年のLLM拡張法と確立された手法を6つのデータセット,3つの分類器,2つの微調整方法に比較した。
LLM法は, ごく少数の種子を用いる場合にのみ, 展開に有用であることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:01:42 GMT)
MST-KD: Multiple Specialized Teachers Knowledge Distillation for Fair Face Recognition [2.8] 我々は4人の教師を1つの特定の民族で訓練し、4人の高度に専門的で偏見のある教師に導いた。
我々の戦略は、これらの4人の教師のプロジェクトを共通の空間に学習し、その情報を学生ネットワークに蒸留する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:30:45 GMT)
JINet: easy and secure private data analysis for everyone [2.8] JINetは、先進的な臨床およびゲノムデータ解析ソフトウェアへのアクセスを民主化するためのWebブラウザベースのプラットフォームである。
データはマシンを離れることなく、各ユーザのWebブラウザの安全で実行される多数のデータ分析アプリケーションをホストしている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:01:45 GMT)
Efficient Topology-aware Data Augmentation for High-Degree Graph Neural Networks [2.8] 高次グラフ(HDG)上のグラフニューラルネットワーク(GNN)のための効率的かつ効果的なフロントマウントデータ拡張フレームワークであるTADを提案する。
内部では、(i)構造埋め込みによる機能拡張と(ii)トポロジと属性対応グラフのスパース化という、2つの重要なモジュールが含まれている。
TADAは、ノード分類の観点から8つの実ホモ親和性/ヘテロ親和性HDG上でのメインストリームGNNモデルの予測性能を大幅に改善する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:46:46 GMT)
Creating a Segmented Pointcloud of Grapevines by Combining Multiple Viewpoints Through Visual Odometry [2.7] グレーペビン・ウィンター・プルーニング(Grapevine winter pruning)は、ブドウの収穫量と品質に影響を与える労働集約的かつ反復的なプロセスである。
この拡張抽象化は、プロジェクトVinumで採用されているコンピュータビジョンパイプラインを、セグメンテーションネットワークとしてSentron2を使用し、キーポイントビジュアルオドメトリーを使用して、異なる観察をインフォームドプルーニング決定に使用する単一のポイントクラウドにマージする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:04:03 GMT)
Engineering of Hyperentangled Complex Quantum Networks [2.7] 本稿では,原子ハイパーアンタングルクラスタとリンググラフ状態のキャビティQED技術を実現するための,新しい実現可能な手法を提案する。
これらの状態は外部量子化モータ状態と中性原子のエネルギー準位の両方を用いて、非共鳴および共鳴の原子ブラッグ回折法の下で設計される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:58:03 GMT)
Secure Integration of 5G in Industrial Networks: State of the Art, Challenges and Opportunities [2.7] 産業ネットワークへの5Gのセキュアな統合に関する,最先端かつ導出的な勧告について述べる。
セキュリティをさらに強化し、残る課題を示すために5Gを利用する機会を特定します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:00:17 GMT)
VFLIP: A Backdoor Defense for Vertical Federated Learning via Identification and Purification [2.6] VFLIP (Vertical Federated Learning) を専門とする最初のバックドアディフェンスについて紹介する。
VFLIPは推論段階で動作する識別と浄化技術を採用し、バックドア攻撃に対する堅牢性を大幅に向上させる。
我々は, CIFAR10, CINIC10, Imagenette, NUS-WIDE, BankMarketingで広範囲にわたる実験を行い, VFLIPがVFLのバックドア攻撃を効果的に軽減できることを実証した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:01:56 GMT)
HyPA-RAG: A Hybrid Parameter Adaptive Retrieval-Augmented Generation System for AI Legal and Policy Applications [2.5] 本稿ではハイブリッドについて紹介する。
アダプティブRAG(Adaptive RAG, HyPA-RAG)は、AIの法と政策に合わせたシステムである。
パラメータを動的に調整することにより、HyPA-RAGは検索精度と応答忠実度を大幅に改善する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:11:20 GMT)
Estimating Dynamic Flow Features in Groups of Tracked Objects [2.4] 本研究の目的は,不完全なトレーサを持つ複雑な特徴豊富な画像列を特徴とする,勾配に基づく動的システム解析を実世界のアプリケーションに拡張することである。
提案手法は,2つの異なる対象クラスの1つの画像列における動作解析を含む高度な研究を可能にする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:06:51 GMT)
DLM-VMTL:A Double Layer Mapper for heterogeneous data video Multi-task prompt learning [2.4] マルチタスク学習は、視覚的なタスクが、共同トレーニング中に他のタスクから豊富な共有可能な知識を取得するようにする。
上記の問題に対処するために, Heterogenous data video multi-task prompt learning (VMTL) 法を提案する。
Double-Layers Mapper(DLM)は、共有可能な知識を視覚的プロンプトSに抽出し、プライマリタスクの表現と整合させる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:25:36 GMT)
CorMulT: A Semi-supervised Modality Correlation-aware Multimodal Transformer for Sentiment Analysis [2.4] 相関対応マルチモーダルトランス(CorMulT)と呼ばれる2段階半教師付きモデルを提案する。
事前学習段階では、モーダリティ相関比較学習モジュールは、異なるモーダリティ間のモーダリティ相関係数を効率的に学習するように設計されている。
予測段階では、学習された相関係数にモダリティ表現を融合させて感情予測を行う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:15:55 GMT)
AI-driven Reverse Engineering of QML Models [2.3] 最も差し迫ったリスクの1つは、悪意のあるアクターによるリバースエンジニアリング(RE)の可能性である。
我々は、信頼できないサードパーティベンダーにデプロイされたトランスパイルされたQMLモデルからパラメータを抽出するオートエンコーダベースのアプローチを導入する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:08:07 GMT)
Safe Bayesian Optimization for High-Dimensional Control Systems via Additive Gaussian Processes [2.3] 本稿では,複数コントローラを同時に安全に最適化するために,加法ガウス法に基づく高次元安全なベイズ最適化法を提案する。
永久磁石同期モータ (PMSM) の実験結果から, 安全性を確保しつつ, 最適パラメータをより効率的に取得できることが確認された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:12:37 GMT)
Rethinking Sparse Lexical Representations for Image Retrieval in the Age of Rising Multi-Modal Large Language Models [2.3] 視覚的プロンプトをサポートするマルチモーダル大言語モデル(M-LLM)を利用することで,画像の特徴を抽出し,テキストデータに変換する。
従来の視覚言語モデルを用いた手法と比較して,画像検索手法の精度とリコール性能が優れていることを示す。
また,検索クエリにキーワードを反復的に組み込むことにより,検索性能が向上することを示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:54:03 GMT)
Methods for Recovering Conditional Independence Graphs: A Survey [2.3] 条件付き独立グラフ(CIグラフ)は、機能関係に関する洞察を得るために使用される。
異なる手法をリストアップし、CIグラフを復元する手法の進歩について研究する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:38:24 GMT)
Experimental measurement and a physical interpretation of quantum shadow enumerators [2.3] 量子量列挙子の直接測定のための厳密な枠組みを開発する。
トラップイオン量子コンピュータ上での重み列挙器の直接測定の可能性について実験的に検証した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:25:56 GMT)
Demonstrating two-particle interference with a one-dimensional delta potential well [2.3] 本稿では1次元デルタ電位とビームスプリッタを用いた2粒子干渉モデルについて述べる。
ボソン、フェルミオンおよび識別可能な粒子の干渉過程を詳細に示し、比較した。
ここで提示される方法は具体的であり、可視化が容易であり、波動関数の交換対称性から生じる影響をよりよく理解するのに役立ちます。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:55:33 GMT)
The Star Geometry of Critic-Based Regularizer Learning [2.3] 変分正規化は統計的推論タスクと逆問題の解法である。
近年の課題依存型レギュレータの学習は, 測定値と地上データとを統合して行われている。
このプロセスを通して学んだ正規化器の構造と、それが2つのデータ分布とどのように関係するかについては、ほとんど理論がない。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:34:59 GMT)
Web Service QoS Prediction via Extended Canonical Polyadic-based Tensor Network [2.2] Canonical Polyadic (CP)ベースのテンソルネットワークモデルは動的データの予測に効率的であることが証明されている。
現在のCPベースのテンソルネットワークモデルは、低次元の潜在特徴空間におけるユーザとサービスの相関を考慮していない。
本稿では,予測精度を向上させるために,拡張ポリエイドネットワーク(ECTN)モデルを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:56:35 GMT)
High-Dimensional Sparse Data Low-rank Representation via Accelerated Asynchronous Parallel Stochastic Gradient Descent [2.2] 低ランク表現は高次元スパース(HDS)データを低次元特徴空間にマッピングすることができる。
既存のLRモデルの最適化アルゴリズムは計算的に非効率であり、大規模データセット上で徐々に収束する。
A2PSGDは、HDSデータLRの既存の最適化アルゴリズムを精度とトレーニング時間の両方で上回る。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:55:33 GMT)
Use of a Structured Knowledge Base Enhances Metadata Curation by Large Language Models [2.2] メタデータは、データセットの発見可能性、アクセシビリティ、相互運用性、再利用性を保証する上で重要な役割を果たす。
本稿では,メタデータ標準への準拠性を改善するため,大規模言語モデル (LLM) の可能性について検討する。
NCBI BioSampleレポジトリの肺がん関連サンプルを無作為に記録した200データについて実験を行った。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:34:22 GMT)
Event Extraction for Portuguese: A QA-driven Approach using ACE-2005 [2.2] 本稿では,ポルトガルの文書中の事象を識別・分類するために,分離されたBERTベースの2つのモデルを微調整した枠組みを提案する。
ポルトガル語におけるイベントアノテートコーパスの欠如を踏まえ,ACE-2005データセットの原版をポルトガル語に翻訳し,ポルトガル語イベント抽出のための新しいコーパスを作成した。
提案手法では,64.4のF1マークをトリガー分類用,46.7の引数分類用とすることで,ポルトガル語におけるこれらのタスクに対する新たな最先端参照を実現する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:14:21 GMT)
Estimation Enhancing in Optoelectronic Property: A Novel Approach Using Orbital Interaction Parameters and Tight-Binding [2.0] 本稿では、量子構造の光電子特性を推定するための革新的なアプローチを提唱する。
軌道相互作用パラメータ(OIP)とTight-Binding(TB)理論を用いた3つの異なる位相を含む方法論を提案する。
本研究は, 予測光電子特性の精度に関する有望な結果を示すものである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:06:37 GMT)
ACE-2005-PT: Corpus for Event Extraction in Portuguese [2.0] ACE-2005はこの分野で標準コーパスとして広く認識されている。
本稿では,ACE-2005をポルトガル語に翻訳したコーパスであるACE-2005-PTを紹介する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:05:08 GMT)
High-fidelity and robust controlled-Z gates implemented with Rydberg atoms via echoing rapid adiabatic passage [2.0] 我々は中性原子Rydbergプラットフォーム上で高忠実性制御Z(CZ)ゲートを実現するための高速断熱経路スキームを提案する。
アルカリ原子パラメータを用いて0.9995以上の忠実度を有するCZゲートと0.999を超える忠実度を有するCCZゲートを予測した。
提案手法は、駆動磁場の変動や現実的なデコヒーレンス効果に非常に頑健であり、将来の量子情報処理応用の可能性を秘めている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:34:34 GMT)
Enhanced forecasting of stock prices based on variational mode decomposition, PatchTST, and adaptive scale-weighted layer [2.0] 本研究では、変分モード分解(VMD)、PatchTST、適応スケール重み付け層(ASWL)を統合した新しい複合予測フレームワークを提案する。
VMD-PatchTST-ASWLフレームワークは従来のモデルに比べて予測精度が大幅に向上している。
この革新的なアプローチは、さまざまな財務分析や投資決定の文脈における潜在的な応用を含む、株価指数の価格予測のための強力なツールを提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:00:47 GMT)
Locally Grouped and Scale-Guided Attention for Dense Pest Counting [2.0] 本研究は,デジタルトラップによって捕獲された密集した害虫を予測するための,新たな密集した害虫計数問題を提案する。
これらの問題に対処するためには、局所的な注意機構を組み込むことが不可欠である。
本研究では,局所的なグループ化とスケール誘導による注意をマルチスケールのCenterNetフレームワークに統合する新しい設計を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:02:01 GMT)
A mathematical framework of intelligence and consciousness based on Riemannian Geometry [2.0] 知性を理解することは神経科学、認知科学、人工知能の中心的な研究である。
幾何解析の最近の進歩は、高次元情報表現と組織に対する新たな洞察を明らかにしている。
この写本は、知性と意識の構造とダイナミクスを記述する数学的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:38:23 GMT)
Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping [1.9] GoogleのSolar APIは、航空画像から太陽ポテンシャルを推定する。
本稿では,衛星画像を用いたAPIのリーチ拡大を提案する。
我々のモデルは、衛星と空中のデータセットに基づいて訓練され、25cmのDSMと屋根のセグメントを生成します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:37:38 GMT)
IBO: Inpainting-Based Occlusion to Enhance Explainable Artificial Intelligence Evaluation in Histopathology [1.9] Inpainting-Based Occlusion (IBO) は,Denoising Diffusion Probabilistic Model を利用した新しい手法である。
まず,学習された知覚的イメージパッチ類似度(LPIPS)測定値を用いて知覚的類似性を評価するとともに,AUC分析によるモデル予測への影響を定量化する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:57:55 GMT)
Revising Multimodal VAEs with Diffusion Decoders [1.9] マルチモーダルVAEは、しばしば高品質な出力を生成するのに苦労する。
中心的な問題は、潜在空間の制限された合同表現にある。
フィードフォワードデコーダは必然的にジョイント潜在空間を制約し、他のモダリティの品質も低下させる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:12:01 GMT)
PyCSP3: Modeling Combinatorial Constrained Problems in Python [1.9] PyCSP$3$はPythonライブラリで、制約された問題のモデルを宣言的な方法で記述できます。
このドキュメントでは、50以上のイラストレーションモデルを持つPyCSP$3$について知っておく必要があるすべてのものを見つけることができます。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:12:28 GMT)
HLogformer: A Hierarchical Transformer for Representing Log Data [1.9] HLogformerは、ログデータ用に特別に設計された新しい階層型トランスフォーマーフレームワークである。
ログデータをフラットなシーケンスとして扱う従来のモデルとは異なり、当社のフレームワークはログエントリを、その固有の階層的な組織を尊重する方法で処理します。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:08:41 GMT)
AdapShare: An RL-Based Dynamic Spectrum Sharing Solution for O-RAN [1.9] AdapShareは、インテントベースのスペクトル管理に強化学習を活用する、ORAN互換のソリューションである。
RLエージェントを採用することで、AdapShareはインテリジェントにネットワーク要求パターンを学び、リソースを割り当てる。
AdapShareは、長期ネットワーク需要統計に基づく準静的リソース割り当て方式より優れている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:10:36 GMT)
Enhancing Dialogue Generation in Werewolf Game Through Situation Analysis and Persuasion Strategies [1.8] 本稿では,LLMをベースとしたWerewolf Game AIを提案する。
様々な説得戦略が採用され、他のプレイヤーを効果的にその行動に合わせるように説得する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:49:13 GMT)
jscefr: A Framework to Evaluate the Code Proficiency for JavaScript [1.7] jscefr(Jes-cee-fer)は、JavaScript(JS)言語のさまざまな要素の使用を検出するツールである。
jscefrはJSコードを6つのレベルに分類する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:37:49 GMT)
Plausible-Parrots @ MSP2023: Enhancing Semantic Plausibility Modeling using Entity and Event Knowledge [1.6] 外部知識ベースから抽出した詳細なエンティティタイプ、イベントタイプおよびそれらの定義を用いて、大型言語モデル(LLM)を強化する。
実験結果から,事象の意味的妥当性のモデル化におけるインジェクト知識の有効性が示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:13:45 GMT)
Assessing Large Language Models for Online Extremism Research: Identification, Explanation, and New Knowledge [1.6] 米国では暴力的過激主義が著しく増加しており、オンラインの過激主義イデオロギーを検知し制限する自動化ツールの必要性が高まっている。
本研究は、オンライン・エクストリーム・ポストの検出・分類における、BERTとGPTの双方向表現の有効性を評価する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:43:03 GMT)
Efficient Transonic Aeroelastic Model Reduction Using Optimized Sparse Multi-Input Polynomial Functionals [1.5] 本稿では,コンパクトなマルチインプットボルテラ級数同定のための新しい定式化を提案する。
このフレームワークは、Benchmark Super critical Wingを使って、強制応答、フラッター、リミットサイクルの発振を考慮して例示されている。
単純かつ効率的なOSM-ROM(Optimal Sparsity Multi-Input ROM)フレームワークは,全次エアロ弾性モデルと比較して高精度に動作する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:36:10 GMT)
A Causal Model for Quantifying Multipartite Classical and Quantum Correlations [1.5] 我々は、与えられた複数の古典的あるいは量子的相関の中で情報理論資源の操作的定義を与える。
我々は、古典的な機密性以外にも、分散コンピューティング問題のセキュリティに有用な追加のリソースが存在すると論じている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:32:10 GMT)
A global AI community requires language-diverse publishing [1.5] 我々は、英語の出版要件が、AIにおける幅広い抽出の体制を支え、強化していると論じる。
我々は3つのテーマを中心に組織されたより健康な出版文化のための代替的未来を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:50:33 GMT)
Helmsman of the Masses? Evaluate the Opinion Leadership of Large Language Models in the Werewolf Game [1.5] Werewolfのゲームをシミュレーションプラットフォームとして使用して,大規模言語モデル(LLM)の意見リーダーシップを評価する。
ゲームには保安官の役割が含まれ、議論を要約し、決定オプションを推奨する。
我々は、意見リーダーの批判的特徴に基づいて、2つの新しい指標を考案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:49:14 GMT)
Digital stabilization of an IQ modulator in the carrier suppressed single side-band (CS-SSB) mode for atom interferometry [1.5] キャリア抑制シングルサイドバンド変調のための電気光学I/Q変調器における位相バイアスを安定化する全ディジタル方式を提案する。
我々は、位相バイアスの回避不能なクロスカップリングを考慮に入れ、エラー信号を正確にゼロにロックするマルチインプット・マルチ出力積分フィードバックコントローラを実装した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:26:17 GMT)
Realization of geometric phase topology induced by multiple exceptional points [1.4] マイクロキャビティでは、3つのモードの5つのクラスが3つの例外点で現れることを示す。
本結果は,現実的な物理システムにおいて,複数の例外点によって引き起こされる幾何学的位相関連トポロジーの広範な記述を提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:08:32 GMT)
PACiM: A Sparsity-Centric Hybrid Compute-in-Memory Architecture via Probabilistic Approximation [1.3] 本稿では,従来の手法に比べて近似誤差を4倍に削減する新しい確率近似計算法を提案する。
PACは、複雑なMACベクトル計算をスカラー計算に単純化することにより、計算インメモリ(CiM)システムにおける効率の良いスペーサ性ベースの計算を可能にする。
PACiMは、スペーサをフル活用してビットシリアルサイクルを81%削減し、65nmCMOSで14.63TOPS/Wのピーク8b/8b効率を実現する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:58:19 GMT)
Minimising changes to audit when updating decision trees [1.3] そこで,本研究では,人間が監査しなければならない木の変化数を最小化しながら,決定木を更新するアルゴリズムを提案する。
目的関数の一部としてツリーの変更数を組み込んだ,欲求的なアプローチでこれを実現する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:48:55 GMT)
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation [1.2] 多くのVision-and-Language Navigation (VLN)アルゴリズムは、視覚的常識の欠如と推論能力の不足により、決定を下す傾向にある。
本稿では,階層的空間近接の知識基盤構築を支援するために,階層的空間近接推論(HSPR)手法を提案する。
我々は、REVERIE、SOON、R2R、R4Rなどの公開データセットで実験を行い、我々のアプローチを検証する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:13:09 GMT)
Automating Semantic Analysis of System Assurance Cases using Goal-directed ASP [1.2] 本稿では, セマンティックルールに基づく分析機能を備えた Assurance 2.0 の拡張手法を提案する。
本稿では, 論理的整合性, 妥当性, 不整合性など, 保証事例のユニークな意味的側面について考察する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:52:51 GMT)
NeRF-CA: Dynamic Reconstruction of X-ray Coronary Angiography with Extremely Sparse-views [1.2] 2次元X線冠動脈造影(CA)による動的3次元再建(4D)は重要な臨床的問題である。
本報告では4次元CA再建法の第1段階であるNeRF-CAについて紹介する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:51:25 GMT)
Mens Sana In Corpore Sano: Sound Firmware Corpora for Vulnerability Research [1.1] 本稿では,問題空間を解析し,その研究への影響について検討する。
我々は、コーパスの複製性や代表性を育成するのに役立つガイドラインを導出する。
我々はガイドラインの実現可能性を示し、Linuxファームウェアの大規模解析のための新しいレプリカブルコーパスLFwCを構築した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:24:52 GMT)
Flexible framework for generating synthetic electrocardiograms and photoplethysmograms [1.0] 心電図 (ECG) と光麻痺 (mography) の2つの信号モダリティのための合成生体信号モデルを開発した。
このモデルは、呼吸調節や身体的ストレスによる心拍の変化などの生理的効果を考慮に入れた現実的な信号を生成する。
我々は,MIT-BIH arrythmia セットと新しいジェネレータの実際の心電図信号を用いて,心電図Rピークを検出するLSTMを訓練した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:48:07 GMT)
Wasserstein Gradient Boosting: A Framework for Distribution-Valued Supervised Learning [1.0] Wasserstein Gragient boostingは、新しい弱い学習者を各イテレーションで擬似残差に適合させるシーケンシャルアンサンブル法である。
Wassersteinグラデーション強化の主な応用は木に基づく明らかな学習であり、各入力に対する応答パラメータの分布推定を返す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:06:52 GMT)
Instruction-tuned Large Language Models for Machine Translation in the Medical Domain [1.0] 大規模言語モデル(LLM)は、高リソース言語ペアとドメインに対する機械翻訳において有望な結果を示している。
本研究では,医学領域におけるベースラインLLMと命令調整LLMのパフォーマンスを比較した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:05:54 GMT)
A Proactive Decoy Selection Scheme for Cyber Deception using MITRE ATT&CK [1.0] サイバー詐欺は、攻撃者の戦術、技術、手順(TTP)に対する守備隊の遅さを補うことができる。
本研究では,実世界の攻撃者の経験的観察に基づく敵モデルにより支援されたデコイ選択方式を設計する。
その結果,提案手法は最小のデコイを用いた攻撃経路のインターセプション率が最も高いことがわかった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:43:46 GMT)
ART: Actually Robust Training [1.0] Artは、ディープラーニングパイプラインを開発しながら、ルールと標準を自動的に強制するように設計されたPythonライブラリである。
アートは、モデル開発を複雑さを増大させる一連の小さなステップに分割し、それぞれがプロセスの解釈可能性と堅牢性を改善する検証チェックで結論付けます。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:30:23 GMT)
GANs Conditioning Methods: A Survey [1.0] GAN(Generative Adversarial Networks)は、様々な分野で広く普及している。
多くの実用的な応用では、生成した出力を正確に制御する必要があるため、条件付きGAN(cGAN)の開発につながっている。
本稿では,GANの条件付け手法を概説し,各手法の特徴を探求し,その特異なメカニズムと理論的基礎を明らかにする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:47:38 GMT)
Fostering Creative Visualisation Skills Through Data-Art Exhibitions [0.9] 本稿では,3年制の学生を対象に,コンピュータカリキュラムにおけるデータアートエキシビションの実施について紹介する。
学生は選択したデータセットからアートベースの可視化を作成し、公開展示会で作品を展示する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:16:13 GMT)
Are Small Language Models Ready to Compete with Large Language Models for Practical Applications? [0.9] 本研究は,小規模かつオープンなLMを実用的に評価する枠組みを提案する。
また、特定のアプリケーション要件に応じて、最高のLMとプロンプトスタイルを特定するために、10個のオープンなLMの詳細な比較を行う。
また、適切に選択すれば、DeepSeek-v2, GPT-4o-mini, Gemini-1.5-ProなどのSOTA LLMを上回り、GPT-4oと競合することを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:24:29 GMT)
Embedded Complexity and Quantum Circuit Volume [0.9] システム拡張と測定の両方を考慮に入れた組込み複雑性の概念を導入する。
本研究では,その相補性を測った後,サブシステムにおける投影状態の複雑さについて検討する。
ランダムゲートテレポーテーション手法により,回路体積をサブシステムに集中させる時空変換を実演する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:12:33 GMT)
Blending Low and High-Level Semantics of Time Series for Better Masked Time Series Generation [0.9] NC-VQVAEと呼ばれる新しいフレームワークを導入し、時系列生成アプローチに自己教師付き学習を統合する。
NC-VQVAEは, 合成試料の品質を著しく向上させることを示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:20:17 GMT)
FRRI: a novel algorithm for fuzzy-rough rule induction [0.9] ファジィラフルール誘導(FRRI)と呼ばれる新しいルール誘導アルゴリズムを導入する。
アルゴリズムの背景と動作を説明します。
私たちのアルゴリズムは、小さなルールセットを作成しながら、より正確であることに気付きました。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:28:10 GMT)
Misam: Using ML in Dataflow Selection of Sparse-Sparse Matrix Multiplication [0.8] スパース行列行列行列乗法(SpGEMM)は、科学計算、グラフ解析、ディープラーニングにおいて重要な演算である。
従来のハードウェアアクセラレータは、固定されたデータフロースキームを備えた特定のスパーシティパターン用に調整されている。
本稿では,SpGEMMタスクに最適なデータフロースキームを適応的に選択するための機械学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:44:17 GMT)
Cyber Risk Assessment for Cyber-Physical Systems: A Review of Methodologies and Recommendations for Improved Assessment Effectiveness [0.8] 本稿では,CPSのサイバーリスク評価への学術的貢献についてレビューする。
評価の有効性を制限するギャップを特定し、サイバーセキュリティインシデントからのリアルタイム学習を推奨する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:07:38 GMT)
Evaluating the Predictive Features of Person-Centric Knowledge Graph Embeddings: Unfolding Ablation Studies [0.8] そこで本研究では,MIMIC-IIIデータセットから得られた構造化情報と非構造化情報を用いて学習したGNNモデルの結果を体系的に検証する手法を提案する。
本研究は,PKGにおける読み出し予測の課題に対する予測的特徴の同定におけるこのアプローチの堅牢性を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:43:04 GMT)
Distributed quantum machine learning via classical communication [0.7] 本稿では,古典的通信を通じて量子プロセッサユニットを統合する実験的な分散量子機械学習手法を提案する。
その結果,古典的コミュニケーションを取り入れることで,コミュニケーションのないスキームに比べて分類精度が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:05:57 GMT)
Machine Learning-Based Research on the Adaptability of Adolescents to Online Education [0.7] 本研究は、青年期のオンライン学習適応性に影響を与える要因を分析するために、5つの機械学習アルゴリズムを実装した。
オンライン学習環境において,授業の期間,家族の経済的地位,年齢が学生の適応性に影響を与える主要な要因である。
予測モデルのうち、ランダムフォレスト、XGBoost、CatBoostアルゴリズムは優れた予測能力を示している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:27:32 GMT)
Evaluation Framework for Feedback Generation Methods in Skeletal Movement Assessment [0.7] 本稿では,フィードバック生成ソリューションの分類,評価,比較のための用語と基準を提案する。
我々の知る限り、骨格運動評価においてフィードバック生成を定式化した最初の作品である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:21:27 GMT)
Integrating Features for Recognizing Human Activities through Optimized Parameters in Graph Convolutional Networks and Transformer Architectures [0.6] 本研究は,特徴融合が行動認識の精度に与える影響を強調した。
2つのディープラーニングモデル、特にTransformerモデルとGraph Convolutional Network(PO-GCN)の精度とF1スコアを評価した。
PO-GCNは活動認識において標準モデルより優れている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:07:48 GMT)
FA-YOLO: Research On Efficient Feature Selection YOLO Improved Algorithm Based On FMDS and AGMF Modules [0.6] 本稿では,FMDSモジュールと適応Gated Multi-branch Focus Fusion Module (AGMFモジュール)を提案する。
FMDSモジュールは、より効率的な動的特徴選択と融合法を、より微細なマルチスケール特徴写像に適用する。
AGMFモジュールは、複数の並列ブランチを使用して、ゲートユニットブランチ、FMDSモジュールブランチ、トリプルトブランチによってキャプチャされた様々な機能の補完的な融合を実行する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:22:16 GMT)
Statistical Analysis of the Impact of Quaternion Components in Convolutional Neural Networks [0.6] 本稿では,画像分類問題に対する既存成分の性能を比較するため,実験データを用いて統計的解析を行った。
モデル性能を改善するために四元数代数のユニークな性質を利用する新しい四元数ReLUアクティベーション関数を導入する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:13:20 GMT)
The $μ\mathcal{G}$ Language for Programming Graph Neural Networks [0.5] $mumathcalG$は、グラフニューラルネットワーク仕様のためのドメイン固有言語である。
我々は、最も人気のあるグラフニューラルネットワークモデルを定義するために、$mumathcalG$をどのように使用できるかを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:52:58 GMT)
CrisperWhisper: Accurate Timestamps on Verbatim Speech Transcriptions [0.5] より冗長な音声の書き起こしを生成するために、モデルを微調整する。
複数の話者に対する頑健さと背景雑音を高めるために,我々はいくつかの手法を採用している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:52:42 GMT)
Corner Charge Fluctuation as an Observable for Quantum Geometry and Entanglement in Two-dimensional Insulators [0.5] 粒子数のような保存電荷の2部ゆらぎを測定することは、量子系を理解するための強力なアプローチである。
ここでは、非相互作用電子の一般格子系に対して、角電荷のゆらぎが量子幾何学に直接関係していることを確立する。
自由フェルミオンに対しては、角絡みエントロピーのレンズを通して量子幾何学と量子情報の間の顕著な接続を明らかにする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:34:57 GMT)
CAST: Cluster-Aware Self-Training for Tabular Data via Reliable Confidence [0.5] 自己学習は、誤った自信によって引き起こされるノイズの多い擬似ラベルに対して脆弱である。
CAST(Cluster-Aware Self-Training)は、既存の自己学習アルゴリズムを無視可能なコストで強化する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:59:24 GMT)
Normalized mutual information is a biased measure for classification and community detection [0.5] 我々は、正規化された相互情報によって返される結果は2つの理由により偏りがあると主張している。
本稿では,どのアルゴリズムが最適かという結論が,従来の相互情報のバイアスに大きく影響されていることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:13:20 GMT)
Estimating Direct and Indirect Causal Effects of Spatiotemporal Interventions in Presence of Spatial Interference [0.5] まず, 空間干渉の概念を, 未測定条件を仮定して拡張することで, 時間変化による治療結果に対する空間干渉の概念を拡張した。
次に、時間的因果推論のための深層学習に基づく潜在的結果モデルを提案する。
U-Netアーキテクチャのパワーを利用して、時間とともに空間的干渉を捉えながら、時間変化による干渉を低減するために潜時因子モデリングを利用する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:21:03 GMT)
3D Topological Modeling and Multi-Agent Movement Simulation for Viral Infection Risk Analysis [0.4] 本稿では,コンピュータ支援モデル,マルチエージェント移動シミュレーション,空中ウイルス感染モデルを統合する。
トポロジカルな空間設計と解析ソフトウェアは、屋内環境をモデル化し、空間を接続し、ナビゲーショングラフを構築するために使用される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:22:51 GMT)
Different Victims, Same Layout: Email Visual Similarity Detection for Enhanced Email Protection [0.4] 我々は,電子メール脅威防御システムの検知能力を向上させるために,Pisco という名の電子メール視覚類似性検出手法を提案する。
以上の結果から,Eメールキットは広範囲に再利用され,視覚的に類似したメールが,さまざまな時間間隔で当社の顧客に送信されていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:51:51 GMT)
Data Quality Monitoring through Transfer Learning on Anomaly Detection for the Hadron Calorimeters [0.4] トランスファーラーニング(TL)メカニズムは、新しいタスクに事前訓練されたモデルを利用することで、データのスパーシリティとモデルの複雑さを軽減することを約束する。
CERNにおけるコンパクト・ムーン・ソレノイド実験におけるハドロン・カロリメータの異常検出におけるTLの可能性について述べる。
実験の結果,TLは対象のサブ検出器上でのモデル学習精度を効果的に向上することが示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:19:06 GMT)
Improving 3D deep learning segmentation with biophysically motivated cell synthesis [0.4] 本稿では,現実的な細胞形状とアライメントのための生体物理モデリングを統合した3Dトレーニングデータを生成する新しいフレームワークを提案する。
提案手法により,コヒーレント膜と核信号のシリコ生成が可能となり,セグメンテーションモデルの訓練が可能となった。
さらに、画像データだけでなく、マッチングラベルも生成する新しいGANトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:01:23 GMT)
UAV-Based Human Body Detector Selection and Fusion for Geolocated Saliency Map Generation [0.2] 無人航空機(UAV)を用いた探索・救助など多くの応用分野において、ソフトリアルタイムの異なるクラスの物体を確実に検出・位置決めする問題は不可欠である。
本研究は、システムコンテキストの視覚に基づく検出器の選択、割り当て、実行の相補的な問題に対処する。
検出結果は,新しいセンサモデルを利用して,正と負の両方の観測を視覚ベースで検出する,有意な位置の地図を構築する手法を用いて融合される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:00:37 GMT)
Unlocking the Potential of Photoexcited Molecular Electron Spins for Room Temperature Quantum Information Processing [0.2] 将来の量子メモリデバイスのような情報処理技術は、量子コンピューティングとネットワークを可能にするために量子状態の保存と転送を行う可能性がある。
ここでは、O-テルフェニルホストにドープされた有機ラジカルである$alpha$,$gamma$-bisdiphenylene-$beta$-phenylallyl(BDPA)を用いて、マイクロ波ベースの量子アプリケーションにおいて、チューニング性および高性能な分子媒体を使用する可能性を探る。
このラジカル系は、室温でミリ秒のスピン格子緩和とマイクロ秒の位相記憶時間を示すと同時に、生成能力も有することを示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:36:30 GMT)
Making the Most of your Model: Methods for Finetuning and Applying Pretrained Transformers [0.2] この論文は、この目標を前進させるモデルの方法と分析を提供する。
使用するモデルに新たな機能を追加する2つの新しいファインタニング手法を導入する。
モデルライクリフと出力品質のばらつきに関する理論的および実証的な知見を提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:50:24 GMT)
Predictability maximization and the origins of word order harmony [0.2] シーケンスの予測可能性を最大化するヘッドの配置を最適に検討する。
提案手法では,頭部の延期が予測可能性の最大化のための最適戦略であると同時に,依存者の予測可能性の最大化のための最適戦略であることを示す。
以上の結果から,実言語で採用した頭部の配置や,異なる種類の実験で出現した頭部の配置が明らかになった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:37:05 GMT)
Quantum Programming Without the Quantum Physics [0.1] 量子プログラミングのパラダイムとして,すべてのデータが古典的データに親しみやすい量子プログラミングパラダイムを提案する。
古典的でない唯一の要素は、負の確率で結果を返す乱数生成器である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:21:08 GMT)
Quantifying Geospatial in the Common Crawl Corpus [0.1] 本稿では,最近のCommon Crawlリリースにおける地理空間データの有効性について,強力な言語モデルであるGemini 1.5を用いて検討する。
CC の Web ドキュメントの 18.7% には座標やアドレスなどの地理空間情報が含まれていると見積もっている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:49:29 GMT)
CC-GPX: Extracting High-Quality Annotated Geospatial Data from Common Crawl [0.1] Common Crawl (CC) コーパスは2008年以来9.5ペタバイト以上のデータを含む最大のオープンウェブクローリングデータセットである。
本稿では,CC内のGPXファイルから注釈付きユーザ生成トラックを抽出する効率的なパイプラインを提案する。
得られたマルチモーダルデータセットには、人間による記述の1,416ペアと、最新のCCリリース6つのMultiLineStringベクターデータが含まれている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:57:38 GMT)
Guided Reasoning: A Non-Technical Introduction [0.1] マルチエージェントシステム(マルチエージェントシステム、英: multi-agent system)とは、1つのエージェント(ガイド)が推論品質を改善するために主に他のエージェントと相互作用するガイド推論システムである。
非技術的用語で、Logikonのデフォルト実装である Guided Reasoningについて説明する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:08:37 GMT)
Variational approach to atom-membrane dynamics [0.0] フォノン生成による低温原子の気体を有限温度で弾性膜に吸着する場合に適用する。
ラプラス変換法を用いてシステム状態の時間依存性を解析的に算出し、遷移率の閉形式式を求める。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:55:25 GMT)
Using Texture to Classify Forests Separately from Vegetation [0.0] 本稿では,衛星画像データ中の森林領域を同定する静的アルゴリズムプロセスの初期提案について述べる。
そこで本研究では,分類および検証プロセスの精度向上のための次のステップについて述べる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:38:54 GMT)
Topological zero modes and bounded modes at smooth domain walls: exact solutions and dualities [0.0] トポロジーは、トポロジカル絶縁体と超伝導体のトポロジ的非等価相の間の領域壁におけるソリトニックゼロエネルギーモードの存在を規定している。
ここでは、滑らかで指数関数的に定義されたドメインウォールを仮定して、これらの零モードの分析解を求める。
我々は、ゼロモードのバルク励起ギャップ、崩壊速度、振動運動量の間の普遍的な関係を確立する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:55:13 GMT)
Topological rejection of noise by quantum skyrmions [0.0] 量子スカイミオンとその非局所的トポロジカルオブザーバブルは、典型的な絡み合いの証人や状態崩壊の測度のように、ノイズに耐性があることが示される。
これにより、新しい離散トポロジカル量子オブザーバブルに基づく量子情報のデジタル化の概念を導入することができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:19:31 GMT)
Tiny-Toxic-Detector: A compact transformer-based model for toxic content detection [0.0] 本稿では, 有害なコンテンツ検出を目的とした小型トランスモデルTiny-toxic-detectorを提案する。
わずか210万のパラメータを持つにもかかわらず、Tiny-toxic-detectorはベンチマークデータセット上での競合的なパフォーマンスを達成する。
Tiny-toxic-detectorは、より持続的でスケーラブルなAI駆動のコンテンツモデレーションソリューションへの進歩を表している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:31:38 GMT)
Theoretical and Methodological Framework for Studying Texts Produced by Large Language Models [0.0] 本稿では,大規模言語モデル(LLM)の研究における概念的,方法論的,技術的課題について述べる。
LLMを基質とし、モデルがシミュレートするエンティティを区別する理論的な枠組みの上に構築されている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:34:10 GMT)
The relevance of degenerate states in chiral polaritonics [0.0] 本研究では, パリティ違反/キラル光・マター相互作用が, キラル偏光のすべての関連面を捉えるのに必要かどうかを考察する。
この問題は、アキラル理論(ハミルトニアン)がまだキラル解を持っているため、答えは自明ではない。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:45:00 GMT)
Strongly interacting fermions are non-trivial yet non-glassy [0.0] 我々は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な位相に属することを示した。
この結果は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な相に属することを示唆している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:19:08 GMT)
Stochastic Metric Fluctuations and Detection of Gravitons [0.0] ブラウン運動実験を再現してグラビトンを検出する方法を提案する。
重力子に対するボース=アインシュタインの占有数$N_g$は、物理系の重力ランダムなメートル法ゆらぎの粒子成分となるのに十分大きい。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:11:29 GMT)
Reinforcement Learning without Human Feedback for Last Mile Fine-Tuning of Large Language Models [0.0] 強化学習は、言語モデルと人間の信号の整合に使用される。
この研究は、強化学習を用いたラストマイル微調整のためのフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:49:18 GMT)
Recent Advances in Semiclassical Methods Inspired by Supersymmetric Quantum Mechanics [0.0] 最近の研究では、超対称性量子力学と半古典的手法の正確性の間に深い関係が示されている。
具体的には、従来の形状不変ポテンシャルの数学的形式は、いくつかの関連する状況において正確性を保証する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:48:44 GMT)
Rapid, in-situ neutralization of nitrogen- and silicon-vacancy centers in diamond using above-band-gap optical excitation [0.0] 我々は、窒素(NV)およびシリコン空孔(SiV)中心を動的に中和するために、深紫外放射線(DUV)を用いることを示した。
まず、各スペクトルの変動を相関させて、中性NV状態と負電荷NV状態の変換について検討する。
次に、負電荷SiV$-$中心の漂白と充電の時間ダイナミクスを観察し、100-mu$s DUVパルス内でSiV$-$フォトルミネッセンスを80%低減する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:43:33 GMT)
Quantum violations of joint reality [0.0] 我々は新しい共同現実の基準を導入する。
この基準によると、量子力学は一般に、非可換な可観測物が現実のジョイント要素を持つことを妨げている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:54:25 GMT)
Quantum decoherence from complex saddle points [0.0] 量子デコヒーレンス(quantum decoherence)は、量子物理学を古典物理学にブリッジする効果である。
カルデイラ・レゲットモデルにおける第一原理計算について述べる。
また、モンテカルロ計算による一般モデルへの作業拡張についても論じる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:35:25 GMT)
Quantum algorithms in distributed quantum computing [0.0] 分散量子コンピューティング(DQC)は、量子通信リンクを介して接続される複数の量子処理ユニット(QPU)を使用して量子コンピュータをスケールする方法を提供する。
我々は分散量子コンピューティングシミュレータを構築し、それを量子アルゴリズムの調査に利用した。
そこでは,DQCにおける動的量子回路の適用性を示す。そこでは,ノイズの多いプロセッサ間(非局所)量子ゲートの代わりに,中間回路計測,局所演算,古典的通信が使用される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 21:19:05 GMT)
Quantum Transport Theory of Strongly Correlated Matter [0.0] 本報告では, 一般相互作用ハミルトニアンに対するKubo式計算の最近の進歩について述べる。
ボルツマン方程式とホール伝導率プロキシがそれらの妥当性を超える強い散乱状態における電気的および熱的導電率を計算することを目的としている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:51:12 GMT)
Quantum Sieving for Code-Based Cryptanalysis and Its Limitations for ISD [0.0] 上述したサブルーチンの量子変種を設計することで、コードシービングのための最初の量子アルゴリズムを導入する。
我々の量子ウォークアルゴリズムは、局所性に敏感なフィルタリング層を追加することにより、基礎となる探索問題の構造を利用する。
我々の分析は、このフレームワークが量子IDDアルゴリズムの最先端性を上回るように適応されるべきであることを強調している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:47:33 GMT)
Physical Security of Chip-Based Quantum Key Distribution Devices [0.0] 本稿では,計測デバイス独立(MDI)QKD統合フォトニックチップを用いたトロイの木馬攻撃(THA)について検討する。
光ダイオードの感度を考慮すれば、モニタ用フォトダイオードと十分な光分離を適切に組み合わせることで、高出力スニッフィング攻撃を検出することができることを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:01:04 GMT)
Phase diagram of the J1-J2 Heisenberg second-order topological quantum magnet [0.0] ハイゼンベルクモデルの呼吸順序パラメータから生じるトポロジカルスピノンコーナーモードの出現を示す。
この結果は, 位相量子磁性を設計するためのパラダイムシステムとして, 呼吸フラストレーション付き正方格子ハイゼンベルクモデルを確立した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:39:53 GMT)
One-Shot Learning Meets Depth Diffusion in Multi-Object Videos [0.0] 本稿では,一対のテキスト・ビデオから一対のコヒーレント・多様な映像を生成可能な,新しい深度条件付き手法を提案する。
提案手法は,従来設計した空間的・時間的注意機構を用いて,事前学習したモデルを用いて連続的な動きを捉える。
推論中、ビデオ生成のための構造的ガイダンスを提供するためにDDIMインバージョンを使用する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:58:10 GMT)
On-device AI: Quantization-aware Training of Transformers in Time-Series [0.0] Transformerモデルは、これらのAIモデルの中で最も魅力的だ。
私の研究は、時系列予測タスクのためのTransformerモデルを最適化することに焦点を当てています。
最適化されたモデルは、組み込みフィールドプログラマブルゲートアレイ(FPGA)上にハードウェアアクセラレータとしてデプロイされる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:49:22 GMT)
On the interpretation of quantum theory as games between observers and nature played in Minkowski spacetime [0.0] 2019年、ミンコフスキー時空でゲーム理論の特殊相対性理論への一般化としてゲームを紹介した。
ナッシュ均衡や平らな戦略形式を含むゲーム理論の多くの概念は、自然に時空ゲームに拡張される。
時空ゲームは特別なケースとして因果文脈性シナリオを回復することを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:58:52 GMT)
Multitask learning for improved scour detection: A dynamic wave tank study [0.0] オフショア・ウィンドファームは、名目上同定されたウィンドタービン構造の人口と見なすことができる。
例えば、幾何学、海底条件、温度差などである。
本稿では,基礎硬度分布パラメータを人口および地域レベルで推定するために,ベイズ階層モデルを用いた学習手法について検討する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:39:01 GMT)
Multimode advantage in continuous variable quantum battery [0.0] 連続可変(CV)システムの枠組みに基づくマルチモード量子電池(QB)のアーキテクチャを提供する。
分離可能な状態と絡み合った状態を生成するためにパラメータを調整可能な多モード初期状態の汎用クラスを用いて,電池の性能について検討する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 04:39:49 GMT)
Modeling offensive content detection for TikTok [0.0] 本研究では,攻撃内容を含むTikTokデータの収集と解析を行う。
攻撃的なコンテンツ検出のための一連の機械学習とディープラーニングモデルを構築している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:47:41 GMT)
Modeling Time-Variant Responses of Optical Compressors with Selective State Space Models [0.0] 本稿では,Selective State Spaceモデルを用いたディープニューラルネットワークを用いた光学ダイナミックレンジ圧縮機のモデル化手法を提案する。
ネットワークを動的に調整するために、機能ワイドリニア変調とゲート付きリニアユニットを統合した洗練された技術が特徴である。
提案アーキテクチャは、ライブオーディオ処理において重要な低レイテンシおよびリアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:46:54 GMT)
Mixed higher-order topology and nodal and nodeless flat band topological phases in a superconducting multiorbital model [0.0] ベナルカザル-ベルネヴィグ-ヒューズ模型の軌道バージョンに現れる位相位相について検討する。
磁場と超伝導ペアリング振幅の弱い値に対して、8つのゼロエネルギーコーナーモードを持つ2階のトポロジカル超伝導相を求める。
結節位相では、フラットバンドは相互空間のノード間で局所化されるが、ノードレス位相では、その完全なバルクギャップを持ち、ゼロエネルギー境界フラットバンドはブリルアンゾーン全体にまたがる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:15:22 GMT)
Mitigating Exaggerated Safety in Large Language Models [0.0] 26.1%の安全プロンプトは危険と誤分類され、拒否された。
XSTestデータセットプロンプトの組み合わせに加えて、インタラクティブ、コンテキスト、少数ショットプロンプトも使用しています。
これらの促進策を組み合わせることで、全体の92.9%の過大な安全行動を軽減することができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:50:10 GMT)
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming [0.0] ミニオムニ(Mini-Omni)は、リアルタイム音声対話が可能な音声ベースのエンドツーエンド会話モデルである。
そこで本研究では,テキストによる音声生成手法と,推論中のバッチ並列戦略を併用して,性能を向上させる手法を提案する。
また、最適化音声出力のための微調整モデルにVoiceAssistant-400Kデータセットを導入する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:18:53 GMT)
Mid-infrared characterization of NbTiN superconducting nanowire single-photon detectors on silicon-on-insulator [0.0] 超伝導ナノワイヤ単光子検出器は、紫外線から近赤外域までの様々な波長で個々の光子を検出するために広く用いられている。
我々は、U字型NbTiN系超伝導ナノワイヤ単光子検出器のスペクトル検出能力を、中赤外域に拡張する取り組みについて述べる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:18:21 GMT)
Measuring entanglement along collective operators [0.0] 本稿では,集団変数の挙動を解析し,多党間の絡み合いを研究するための枠組みを提案する。
我々はその性質と混合状態にどのように拡張できるかを徹底的に分析する。
これは、エンタングルメント量子化器の様々な性質が直接ピクトロリアル解釈を持つスペクトル空間を導入することで実現される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:55:52 GMT)
Machine learning models for daily rainfall forecasting in Northern Tropical Africa using tropical wave predictors [0.0] 数値気象予報(NWP)モデルは、北熱帯アフリカにおけるより単純な気候学に基づく降水予測と比較すると性能が劣ることが多い。
本研究では,ガンマ回帰モデルと熱帯波(TW)で学習した畳み込みニューラルネットワーク(CNN)の2つの機械学習モデルを用いて,7~9月のモンスーンシーズンの日降雨を予測する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:36:22 GMT)
M4CXR: Exploring Multi-task Potentials of Multi-modal Large Language Models for Chest X-ray Interpretation [0.0] M4CXRは胸部X線(CXR)の解釈を強化するために設計された多モード大言語モデル(LLM)である。
このモデルは、医療報告生成(MRG)、視覚的接地、視覚的質問応答(VQA)などの複数のタスクをサポートする。
M4CXRは、チェーン・オブ・シークレット・プロンプト戦略を用いて、MRGの最先端の臨床精度を達成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:12:58 GMT)
Low-Cost Language Models: Survey and Performance Evaluation on Python Code Generation [0.0] 大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクで一般的な選択肢となっている。
LLMの相当な計算とメモリ要件は、限られたリソースを持つユーザーにはアクセスできないことが多い。
本稿では,資源集約型LLMの代替となる,非常に低コストなモデルに焦点をあてる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:23:15 GMT)
Logic Contrastive Reasoning with Lightweight Large Language Model for Math Word Problems [0.0] 本研究では,数理推論タスクにおける軽量大言語モデル(LLM)の性能向上に焦点をあてる。
本稿では,数理論理の類似性を計測し,自動スクリーニング機構を設計する手法を提案する。
肯定的および否定的な例示プロンプトを慎重に作成することにより、音響推論ロジックの導入に向けてモデルを導出する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:26:42 GMT)
Josephson Traveling Wave Parametric Amplifiers with Plasma oscillation phase-matching [0.0] 本稿では,位相整合のための共振素子として,増幅器の中心となるジョセフソン接合を用いることを提案する。
提案したTWPAの設計は、15dBと3.5GHzの帯域幅を持ち、最先端のTWPAと同等である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:22:50 GMT)
Is text normalization relevant for classifying medieval charters? [0.0] 本研究では,歴史文書の正規化が中世チャーターの分類に与える影響について検討した。
その結果,与えられた正規化はタスクの配置を最小限に改善するが,デートの精度は低下することがわかった。
その結果, 歴史的テキストの正規化に対する選択的アプローチが示唆され, テキストの特徴を保存することの重要性が強調された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:19:57 GMT)
Innovative Speech-Based Deep Learning Approaches for Parkinson's Disease Classification: A Systematic Review [0.0] パーキンソン病(PD)は早期の発声障害を伴うことが多い。
近年のAIの進歩、特に深層学習(DL)は、音声データの解析を通じてPD診断を大幅に強化している。
DLアプローチは、エンドツーエンド(E2E)学習、転送学習(TL)および深層音響特徴抽出(DAFE)アプローチに分類される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:06:57 GMT)
In-situ scanning gate imaging of individual two-level material defects in live superconducting quantum circuits [0.0] 2レベルシステム欠陥(TLS)は、構造的に非晶質材料の低温物理を制御している。
量子コンピューティングのための安定な高コヒーレンスプラットフォームの実現に向けた最近の進歩は、固体量子回路におけるTLSの研究の重要性を高めている。
ここでは、ミリケルビン温度で生きた超伝導量子回路上で走査ゲート顕微鏡を行い、個々のTLSを特定する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:04:43 GMT)
Improved Circuit Lower Bounds With Applications to Exponential Separations Between Quantum and Classical Circuits [0.0] GC0 は AC0 であり、十分に小さな球の内部で振る舞う Tal-fan-in ゲートは外部で一定でなければならない。
本稿では,AC0[p]リフトのHam-lemma下限をGC0[p]に限定し,パラメータの損失を伴わないことを示す。
また、量子回路と古典回路の最も強い非条件分離を確立する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:09:01 GMT)
Hyperdimensional Vector Tsetlin Machines with Applications to Sequence Learning and Generation [0.0] 我々は,バニラ・テトリンマシンと競合する高速かつ高速な逐次データを学習し,生成するための2層モデルを構築した。
提案手法は,予測,新しいシーケンス生成,分類の2分野に適用する。
後者については、UCR Time Series Archiveの全結果から導出し、標準ベンチマークと比較して、時系列分類において、その手法がいかに優れているかを確認する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 15:28:01 GMT)
Holographic analysis of boundary correlation functions for the hyperbolic-lattice Ising model [0.0] 双曲格子イジングモデルの境界スピン相関関数をホログラムの観点から解析する。
境界相関関数は準周期的振動を伴うパワー-ロー崩壊を示す一方で、バルク相関関数は常に指数関数的に減衰することを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:18:44 GMT)
Generative AI in Ship Design [0.0] 生成AIは、機械学習と人工知能に根ざした計算アルゴリズムを利用して船体設計を最適化する、新しいアプローチを提案する。
本報告では、データセット収集、モデルアーキテクチャの選択、トレーニング、検証などのステップを含む、この目的のための生成AIの体系的な作成について概説する。
全体として、このアプローチは、より広い設計空間を探索し、多分野最適化の目的を効果的に統合することで、船の設計に革命をもたらすことを約束している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:55:35 GMT)
GL-TSVM: A robust and smooth twin support vector machine with guardian loss function [0.0] 非対称,有界,スムーズな特徴を特徴とする新規な損失関数であるガーディアンロス(G-loss)を導入する。
構造リスク最小化(SRM)の原則に従うため,正規化項をGL-TSVMの目的関数に組み込む。
UCIデータセットとKEELデータセットの実験的解析は,提案したGL-TSVMの有効性を裏付けるものである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:14:20 GMT)
From cart to truck: meaning shift through words in English in the last two centuries [0.0] この擬似論的研究は、時間とともに異なる単語が同じ概念をどう表現するかを、ダイアクロニックな単語埋め込みを用いて調査する。
我々は、エネルギー、輸送、エンターテイメント、およびコンピューティング領域の変化を特定し、言語と社会的な変化の関連を明らかにする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:05:39 GMT)
Fidelity-dissipation relations in quantum gates [0.0] 実際の量子ゲートは、一般的に散逸環境の影響を受け、その忠実度を著しく低下させる。
本研究では,ジェネリック量子ゲートの平均忠実度と計算過程中に発生する散逸の基本的な関係を解明する。
その結果、熱力学と量子コンピューティングの深い関係に光を当て、熱力学によって課される計算の限界を明らかにした。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:53:31 GMT)
Fermionic logarithmic negativity in the Krawtchouk chain [0.0] 非補体領域の絡み合いは不均一な自由フェルミオン鎖で研究される。
隣接する領域では、負性スケーリングは共形場理論のそれに対応する。
解離した地域については,各地域が1つの場所に縮小する骨格体制に焦点をあてる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:42:56 GMT)
Fate of non-Hermitian free fermions with Wannier-Stark ladder [0.0] ワニエ・スタークの局在は非エルミート自由フェルミオンの絡み合い挙動を動的に変化させる。
定常状態半鎖絡みのエントロピーを観察し、2つの異なる地域法域を同定する。
本研究は,非エルミート皮膚効果と無障害局所化との相互作用から出現する新規な絡み合い相について考察した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:08:15 GMT)
Exploring Multiple Strategies to Improve Multilingual Coreference Resolution in CorefUD [0.0] 本稿では,エンド・ツー・エンドのニューラル・コアス・リゾリューションシステムについて述べる。
まず、モノリンガルとクロスリンガルのバリエーションを含む強力なベースラインモデルを構築します。
多様な言語文脈における性能向上のためのいくつかの拡張を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:27:05 GMT)
Estimating the number of reachable positions in Minishogi [0.0] 候補位置を生成することにより到達可能な位置の数を推定し、初期位置からの一連の法的移動により到達可能な位置の比率を測定する。
実験の結果、到達可能なMinishogiのポジションは約2.38倍1018ドルであることが判明した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:20:12 GMT)
Erasing Concepts from Text-to-Image Diffusion Models with Few-shot Unlearning [0.0] 本稿では,数発のアンラーニングを用いてテキストエンコーダを更新する新しい概念消去手法を提案する。
提案手法は10秒以内に概念を消去し,概念の消去をこれまで以上に容易に行えるようにする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:22:48 GMT)
Entanglement dynamics in $κ$-deformed spacetime [0.0] 量子場に結合した2つの同一かつ互いに独立な2レベル原子をオープン量子系として扱う。
我々は、$kappa$-deformed と Minkowski の時空で異なる軌道で移動する2つの原子の絡み合いのダイナミクスを比較した。
環境が引き起こす原子間相互作用が存在しない場合、$kappa$変形時空における2つの静的原子の絡み合いのダイナミクスはミンコフスキー時空のそれに還元される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 07:40:11 GMT)
Enhancing precision thermometry with nonlinear qubits [0.0] 量子温度測定(Quantum thermometry)は、量子系の超低温を測定する研究である。
このような量子温度計の精度は、量子測定によって温度を推定できる程度によって制限される。
非線形シュリンガー方程式によって記述された量子温度計は、大幅に精度が向上することを示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:08:07 GMT)
Enhancing Customer Churn Prediction in Telecommunications: An Adaptive Ensemble Learning Approach [0.0] 本稿では,高精度な顧客チャーン予測のための適応型アンサンブル学習フレームワークを提案する。
このフレームワークは、XGBoost、LightGBM、LSTM、Multi-Layer Perceptron(MLP)ニューラルネットワーク、Support Vector Machine(SVM)など、複数のベースモデルを統合する。
この研究は99.28%の精度を達成し、チャーン予測の大きな進歩を示している。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:27:42 GMT)
Enhancing Conditional Image Generation with Explainable Latent Space Manipulation [0.0] 本稿では,条件付きプロンプトに固執しながら,参照画像への忠実性を実現するための新しいアプローチを提案する。
そこで我々は,クロスアテンション・レイヤのクロスアテンション・マップと遅延ベクトルの勾配を解析した。
この情報を用いて,被写体を保存しつつ,参照画像の特徴をシームレスに統合し,特定のタイミングでマスクを作成する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 03:12:04 GMT)
Electron Spin Resonance Spectroscopy in a Transmission Electron Microscope [0.0] 統合はスピン系とその力学、量子材料、ラジカル、電気化学反応、放射線損傷のその場での研究を促進する。
この発展は、ナノスケールで高度に制御された電子プローブを用いたマイクロ波制御量子スピン研究への重要な技術的進歩を示す。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:42:13 GMT)
Efficient post-selection in light-cone correlations of monitored quantum circuits [0.0] 選択後の光円錐動的相関関数は、異なるユニタリ回路の平均相関から効率的に得られることを示す。
これは、ある回路における稀な測定結果と別の回路における典型的な結果とを結びつける。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 22:04:56 GMT)
Dynamics of a V-type atom inside a deformed cavity field and in the presence of an external Microwave field [0.0] マイクロ波場の存在下で, 単一モード変形空洞内のV型原子間の相互作用について検討した。
この系を記述するハミルトニアンは、場作用素を変形させることにより、標準のJaynes-Cummingsモデルから導かれる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:28:33 GMT)
Detecting single gravitons with quantum sensing [0.0] 実験室では, 単一グラビトン交換のシグネチャが観察可能であることを示す。
光子に対する光電効果の発見と類似して、そのようなシグネチャは重力の量子化に関する最初の実験的手がかりを与えることができる。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:35:37 GMT)
Detecting quasi-degenerate ground states in 1D topological models via VQE [0.0] Su-シュリーファー-ヘーガー開鎖とキタエフ開鎖の正確な基底状態について検討する。
これらのモデルは、熱力学の極限で単一粒子エネルギーが消滅するエッジモードを特徴とする対称性で保護された位相位相をホストする。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:28:37 GMT)
Designing a compact cavity-enhanced source of entangled photons [0.0] 量子リピータは、量子メモリとの効率的な結合を可能にする絡み合いの源を必要とする。
ここでは、この課題をコンパクトで狭帯域のソース設計で解決する。
絡み合ったペアは、Fabry-P'erotキャビティ内の2つの垂直配向非線形結晶においてSPDCを介して生成される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:11:09 GMT)
Defining Interoperability: a universal standard [0.0] 本稿では、相互運用性の進化をトレースすることで、新しい普遍的な定義を提案する。
この定義はこれらの矛盾に対処し、様々な分野に適用可能な堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:16:59 GMT)
Corrections to adiabatic behavior for long paths [0.0] 我々は,非ゴー定理を考案することによって,断熱的量子計算の計算困難度を決定するのに,総時間は十分ではないと主張している。
時間周期ハミルトニアンの場合の結果、誤差が固定され、小さく保たれたときに経路長が増加するにつれて増大する計算コストのプロキシが存在することを示唆し、その挙動がどの程度一般であるかを推測する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:46:34 GMT)
Comparative Study of State-based Neural Networks for Virtual Analog Audio Effects Modeling [0.0] 本稿では,仮想アナログモデリングにおける機械学習の応用について考察する。
我々は、ステートスペースモデルと線形リカレントユニットを、より一般的なLong Short-Term Memoryネットワークと比較する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:44:59 GMT)
Circuit QED Emission Spectra in the Ultrastrong Coupling Regime: How They Differ from Cavity QED [0.0] キャビティQEDで研究された現象は、超伝導人工原子とマイクロ波光子を用いても探索できる。
回路QEDシステムは、個々の人工原子と超強結合状態に達する可能性を提供する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 14:24:10 GMT)
Characterization of point-source transient events with a rolling-shutter compressed sensing system [0.0] ポイントソースの過渡イベント(PSTE)は、イメージングシステムにいくつかの課題をもたらす。
これらの要件を満たす従来のイメージングシステムは、価格、サイズ、重量、消費電力、データ帯域幅の点で費用がかかる。
画像システムのローリングシャッター読み出しに適応した新しい圧縮センシングアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 19:22:37 GMT)
CW-CNN & CW-AN: Convolutional Networks and Attention Networks for CW-Complexes [0.0] 本稿では,CW複雑なデータポイントを学習するための新しいフレームワークを提案する。
我々は、CW複体に対してよく定義された畳み込みと注意の概念を開発する。
我々は、このフレームワークを教師付き予測の文脈で説明し、解釈する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 16:32:24 GMT)
CNN Based Detection of Cardiovascular Diseases from ECG Images [0.0] このモデルはInceptionV3アーキテクチャを使って構築され、転送学習によって最適化された。
開発されたモデルでは、MIや他の心血管疾患を93.27%の精度で検出することに成功した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 11:26:07 GMT)
Brief Synopsis of the Scientific Career of T. R. Hurd [0.0] トーマス・ロバート・ハードの名誉を称える国際理論・応用財務ジャーナル」特集号によせて
トム・ハードの科学的経歴の短い要約と、彼の科学的出版物の一覧。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:25:26 GMT)
Branch-and-cut algorithms for colorful components problems [0.0] 我々は,各ノードに色を割り当てる色付きグラフを,カラフルな連結成分に分割しなければならない3つの最適化問題に取り組む。
これらの問題は、コミュニティ検出、サイバーセキュリティ、バイオインフォマティクスに応用されている。
整数非線型定式化(英語版)を行い、標準手法を用いて線形化する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 13:10:48 GMT)
Block encoding by signal processing [0.0] 単位行列に対する量子特異値変換(QSVT)や量子固有値変換(QETU)といったQSPベースの手法がBEの実装に有効に利用できることを示す。
本稿では,QSVTアルゴリズムとQETUアルゴリズムと組み合わせて,格子ボソンに対するハミルトニアンの符号化をブロックするいくつかの例を示す。
QSVTをBEに使用すると、サイト毎のキュービット数で最高のゲートカウントスケーリングが得られるが、LOVE-LCUは最大$lesssim11$ qubitsの演算子に対して、他のすべてのメソッドよりも優れている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:00:02 GMT)
Awes, Laws, and Flaws From Today's LLM Research [0.0] 良質な研究と見なされる基準に基づいて2000以上の研究作品を評価した。
創発的な行動や倫理的否定の主張の減少など、さまざまな傾向が見られます。
本論文は, 責任ある科学的手法の基礎に生きるために, より精査と厳密さの必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:00:24 GMT)
Anomalous multi-gap topological phases in periodically driven quantum rotors [0.0] 周期的に駆動される量子ローターは、多ギャップトポロジカルフェーズを実装するための、有望で広く適用可能なプラットフォームを提供する。
強駆動状態に生じる異常なディラック弦位相の出現について報告する。
その結果、量子ローターの最先端の実験における直接的応用が明らかとなった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 18:27:16 GMT)
An algebraic characterisation of Kochen-Specker contextuality [0.0] 文脈性は古典物理学と量子物理学を区別する重要な特徴である。
古典的な概念を用いた量子論の記述に根本的な障害を表現している。
異なるフレームワークは現象の異なる側面に対処するが、それらの正確な関係はしばしば不明である。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:58:12 GMT)
Amplitude Amplification and Estimation using a Floquet system [0.0] 量子キックドローター(QKR)は、時間依存の量子カオスの基本モデルである。
量子アルゴリズムを実装し、非構造化探索を行う。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 05:14:56 GMT)
Algebraic method of group classification for semi-normalized classes of differential equations [0.0] 半正規化類から系の対称性群と不変代数を分解する重要な定理を証明する。
実世界のアプリケーションで発生するクラスの非自明な例が提供される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:42:04 GMT)
Addressing Common Misinterpretations of KART and UAT in Neural Network Literature [0.0] This note address the Kolmogorov-Arnold Representation Theorem (KART) and the Universal Approximation Theorem (UAT)
我々の発言は、ニューラルネットワークの専門家の間でのKARTとUATのより正確な理解を支援することを目的としています。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 09:50:31 GMT)
Acceptable Use Policies for Foundation Models [0.0] 本稿では、30のファンデーションモデル開発者から許容可能な利用ポリシーを特定する。
それはそれらが含む利用制限を分析し、受け入れられる利用ポリシーは基礎モデルの規制を理解するための重要なレンズである、と論じている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 06:04:16 GMT)
ARINC 429 Cyber-vulnerabilities and Voltage Data in a Hardware-in-the-Loop Simulator [0.0] ARINC 429は民間のアビオニクスのためのユビキタスデータバスであり、異なるメーカーからデバイス間の信頼性の高い通信を可能にする。
ARINC 429バスを用いたハードウェア・イン・ザ・ループシミュレータを構築し、これらの脆弱性を調査し、航空機の能力を否定し、劣化させ、破壊する可能性を特定した。
ARINC 429バスを用いた多機能ディスプレイに対するサービス拒否攻撃を行い,重要なナビゲーション補助具を無効にすることに成功した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:06:20 GMT)
AI Meets the Classroom: When Does ChatGPT Harm Learning? [0.0] 我々は,生成型AI,特に大規模言語モデル(LLM)がプログラミングクラスにおける学習に与える影響について検討する。
LLMの使用が学習結果に肯定的,否定的な影響を及ぼす可能性が3つの研究で示された。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 17:07:46 GMT)
AI Consciousness is Inevitable: A Theoretical Computer Science Perspective [0.0] 我々は意識のための正式な機械モデルを開発する。
このモデルはアラン・チューリングの単純だが強力な計算モデルとバーナード・ベアーズの意識の劇場モデルにインスパイアされている。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 20:14:14 GMT)
A quantum Pascal pyramid and an extended de Moivre-Laplace theorem [0.0] 我々は「量子パスカルピラミッド」をパスカルの三角形の一般化として記述する。
devrevre-Laplace定理の拡張は、量子ピラミッドの$q$-thカラムに適用される。
量子パスカルピラミッドの最初の2つの柱を用いて、レーザー物理学において以前に知られていたエルミート・ガウスモードを計算する運動が示される。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 08:23:25 GMT)
A Review of Quantum Scientific Computing Algorithms for Engineering Problems [0.0] スーパーポジションや絡み合いのような量子現象を活用する量子コンピューティングは、コンピューティング技術における変革的な力として現れつつある。
本稿では,量子力学の基礎概念と,その計算発展への意義を体系的に検討する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 02:19:00 GMT)
A Normalized Bottleneck Distance on Persistence Diagrams and Homology Preservation under Dimension Reduction [0.0] パーシステンスダイアグラム(PD)は、ポイントクラウドデータのシグネチャとして使用される。
PD間のボトルネック距離d_Bを用いて2つの点の雲を比較することができる。
我々は、PD間の新しいスケール不変距離を正規化ボトルネック距離d_Nと定義し、研究する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 01:26:31 GMT)
A Machine Learning-based Approach for Solving Recurrence Relations and its use in Cost Analysis of Logic Programs [0.0] 我々は、任意の制約付き反復関係を解くための、新しい、一般的なアプローチを開発する。
CiaoPPシステムにおけるプロトタイプの実装とその実験的評価は,非常に有望な結果を示した。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 23:21:57 GMT)
A Deep-Learning-Based Lable-free No-Reference Image Quality Assessment Metric: Application in Sodium MRI Denoising [0.0] ナトリウムMRIのような新しいMRI技術は、本質的に低信号のため、画像の質が低いのが一般的である。
ディープラーニングモデルは、特有のトレーニングセットに特化しているという点において、ユニークな特徴を持っている。
そこで本研究では,新しいDLベースの NR-IQA メトリックである Model Metric (MSM) を提案する。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 12:16:55 GMT)
A Comparative Study of Hyperparameter Tuning Methods [0.0] 木構造型Parzen Estimator (TPE)、遺伝的検索、ランダム検索は回帰および分類タスク間で評価される。
ランダム検索は回帰タスクに優れ、TPEは分類タスクに効果的であった。
論文参考訳(メタデータ) (Thu, 29 Aug 2024 10:35:07 GMT)