VQ-Map: Bird's-Eye-View Map Layout Estimation in Tokenized Discrete Space via Vector Quantization [108.7] Bird's-eye-view (BEV) マップのレイアウト推定には、エゴ車の周囲の環境要素のセマンティクスを正確に完全に理解する必要がある。
本稿では,Vector Quantized-Variational AutoEncoder (VQ-VAE) に似た生成モデルを用いて,トークン化された離散空間における高レベルのBEVセマンティクスの事前知識を取得することを提案する。
得られたBEVトークンには,異なるBEV要素のセマンティクスを包含したコードブックが組み込まれているため,スパースバックボーン画像特徴と得られたBEVトークンとを直接一致させることができる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:09:47 GMT)
GenAI-Bench: Evaluating and Improving Compositional Text-to-Visual Generation [103.3] VQAScoreは、VQAモデルが画像がプロンプトを正確に描写しているとみなす可能性を測定するメトリクスである。
VQAScoreによるランク付けは、PickScore、HPSv2、ImageRewardなどの他のスコアリング方法よりも2倍から3倍効果的である。
我々は、同じプロンプトから生成されたランキング画像のスコアを評価するために、4万以上の人間格付けを備えたGenAI-Rankベンチマークを新たにリリースした。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:22:32 GMT)
Automated Evaluation of Large Vision-Language Models on Self-driving Corner Cases [102.1] 自動運転コーナーケースにおけるLVLMの自動評価のための最初のベンチマークであるCODA-LMを提案する。
テキストのみの大規模言語モデルを判断として使用すると、LVLMの判断よりも人間の好みとの整合性が向上することを示す。
CODA-VLM は GPT-4V を+21.42% 上回っても GPT-4V と相容れない性能を示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:54:33 GMT)
Explaining and Improving Contrastive Decoding by Extrapolating the Probabilities of a Huge and Hypothetical LM [93.8] コントラストデコーディング(CD)は,小型のアマチュアLMを用いて,大規模専門家言語モデル(LM)の次点分布を改善する。
我々は$mathbfA$symptotic $mathbfP$robability $mathbfD$ecoding (APD)と呼ばれる新しい教師なし復号法を提案する。
APDは異なる大きさのLMから確率曲線を明示的に外挿し、CDよりも多くの推論コストを発生させることなく無限大のLMから確率曲線を推定する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:31:44 GMT)
CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models [92.0] 我々はCARESを紹介し,医療領域全体での医療LVLMの信頼性を評価することを目的とする。
我々は,Med-LVLMの信頼性を,信頼性,公正性,安全性,プライバシ,堅牢性,5次元にわたって評価する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:54:14 GMT)
MVInpainter: Learning Multi-View Consistent Inpainting to Bridge 2D and 3D Editing [90.3] 新規ビュー合成(NVS)と3D生成は、最近顕著に改善されている。
我々はMVInpainterを提案し、3D編集を多視点2Dインペインティングタスクとして再フォーマットする。
MVInpainterは、スクラッチから完全に新しいビューを生成するのではなく、参照ガイダンスで複数のビューイメージを部分的に描き込む。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 02:01:56 GMT)
Meta-Exploiting Frequency Prior for Cross-Domain Few-Shot Learning [87.0] クロスドメインなFew-Shot学習のための新しいフレームワーク,Meta-Exploiting Frequency Priorを導入する。
各クエリ画像を高周波および低周波成分に分解し,特徴埋め込みネットワークに並列に組み込む。
本フレームワークは、複数のドメイン間数ショット学習ベンチマークにおいて、最先端の新たな結果を確立する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 04:02:35 GMT)
GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.2] 本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:45:15 GMT)
PageRank Bandits for Link Prediction [72.6] リンク予測は、リコメンダシステムやナレッジグラフ補完といった幅広いアプリケーションを用いたグラフ学習において重要な問題である。
本稿では,リンク予測を逐次的意思決定プロセスとして再構成し,各リンク予測インタラクションを逐次的に行う。
本稿では,PageRankとコンテキスト的帯域を結合した新しい融合アルゴリズム PRB (PageRank Bandits) を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:39:28 GMT)
One for All: Multi-Domain Joint Training for Point Cloud Based 3D Object Detection [71.8] textbfOneDet3Dは、異なるドメイン間での3D検出に対処する汎用的なワン・ツー・オール・モデルである。
本稿では、データ干渉問題に対処するため、ルーティング機構によって誘導される散乱とコンテキストにおけるドメイン認識を提案する。
完全なスパース構造とアンカーフリーヘッドは、さらに大きなスケールの差のある点雲を収容する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:21:56 GMT)
SQL Injection Jailbreak: a structural disaster of large language models [71.6] LLMによる入力プロンプトの構築を利用して、ユーザプロンプトにジェイルブレイク情報を注入する新しいジェイルブレイク手法を提案する。
提案手法は,AdvBench の文脈でよく知られた5つのオープンソース LLM に対する攻撃成功率を約100% 達成する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:36:34 GMT)
Little Giants: Synthesizing High-Quality Embedding Data at Scale [71.4] SPEEDは,オープンソースの小型モデルと協調して大規模な埋め込みデータを効率的に生成するフレームワークである。
SPEEDはGPT API呼び出しの1/10未満しか使用せず、両者が合成データのみに基づいてトレーニングされている場合、最先端の埋め込みモデルE5_mistralよりも優れている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:14:34 GMT)
Dynamic and Textual Graph Generation Via Large-Scale LLM-based Agent Simulation [70.6] GraphAgent-Generator (GAG) は動的グラフ生成のための新しいシミュレーションベースのフレームワークである。
本フレームワークは,確立されたネットワーク科学理論において,7つのマクロレベルの構造特性を効果的に再現する。
最大10万近いノードと1000万のエッジを持つグラフの生成をサポートし、最低速度は90.4%である。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 06:58:34 GMT)
ElectionSim: Massive Population Election Simulation Powered by Large Language Model Driven Agents [70.2] 我々は,大規模言語モデルに基づく革新的な選挙シミュレーションフレームワークであるElectronSimを紹介する。
ソーシャルメディアプラットフォームからサンプリングした100万レベルの投票者プールを提示し、正確な個人シミュレーションを支援する。
PPEは、米国大統領選挙シナリオ下での我々の枠組みの性能を評価するための、世論調査に基づく大統領選挙ベンチマークである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:19:49 GMT)
Visual Text Generation in the Wild [67.4] 野生で高品質なテキスト画像を生成する視覚テキスト生成装置(SceneVTG)を提案する。
提案したSceneVTGは、従来のレンダリングに基づく手法と最近の拡散に基づく手法を、忠実さと理性の観点から大きく上回っている。
生成された画像は、テキスト検出とテキスト認識を含むタスクに優れたユーティリティを提供する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 08:12:57 GMT)
Socialized Learning: A Survey of the Paradigm Shift for Edge Intelligence in Networked Systems [62.3] 本稿では,エッジインテリジェンス(EI)と社会学習(SL)の統合に関する文献レビューの結果について述べる。
SLは、エージェントの協調能力と集団知性を増幅することを目的とした、社会的原則と行動に基づく学習パラダイムである。
ソーシャル化アーキテクチャ、ソーシャル化トレーニング、ソーシャル化推論の3つの統合コンポーネントについて詳しく検討し、その強みと弱点を分析した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:45:47 GMT)
Multimodality Helps Few-Shot 3D Point Cloud Semantic Segmentation [61.9] FS-PCS (Few-shot 3D point cloud segmentation) は、最小のサポートサンプルで新しいカテゴリを分割するモデルを一般化することを目的としている。
本稿では,テキストラベルと潜在的に利用可能な2次元画像モダリティを利用して,コストフリーのマルチモーダルFS-PCSセットアップを提案する。
トレーニングバイアスを軽減するため,テスト時間適応型クロスモーダルセグ(TACC)技術を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:00:34 GMT)
L-C4: Language-Based Video Colorization for Creative and Consistent Color [59.1] 創造的・一貫性のある色(L-C4)のための言語ベースビデオカラー化を提案する。
我々のモデルは、事前訓練された相互モダリティ生成モデルに基づいて構築される。
本研究では,フリックやカラーシフトを防止するために時間的に変形可能な注意点と,長期のカラー一貫性を維持するためにクロスクリップ融合を提案する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 09:27:15 GMT)
Adaptive Domain Learning for Cross-domain Image Denoising [57.4] 本稿では,クロスドメイン画像認識のための適応型ドメイン学習手法を提案する。
私たちは、異なるセンサー(ソースドメイン)からの既存のデータに加えて、新しいセンサー(ターゲットドメイン)からの少量のデータを使用します。
ADLトレーニングスキームは、ターゲットドメインのモデルを微調整するのに有害なソースドメイン内のデータを自動的に削除する。
また,センサ固有の情報(センサタイプとISO)を取り入れ,画像認識のための入力データを理解するための変調モジュールも導入した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:08:26 GMT)
Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.6] 本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:48:21 GMT)
Gradient-Variation Online Learning under Generalized Smoothness [56.4] 勾配変分オンライン学習は、オンライン関数の勾配の変化とともにスケールする後悔の保証を達成することを目的としている。
ニューラルネットワーク最適化における最近の取り組みは、一般化された滑らかさ条件を示唆し、滑らかさは勾配ノルムと相関する。
ゲームにおける高速収束と拡張逆最適化への応用について述べる。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 14:34:59 GMT)
Are you still on track!? Catching LLM Task Drift with Activations [55.8] タスクドリフトは攻撃者がデータを流出させたり、LLMの出力に影響を与えたりすることを可能にする。
そこで, 簡易線形分類器は, 分布外テストセット上で, ほぼ完全なLOC AUCでドリフトを検出することができることを示す。
このアプローチは、プロンプトインジェクション、ジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:52:35 GMT)
Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0] Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 07:01:13 GMT)
Pre-trained Molecular Language Models with Random Functional Group Masking [54.9] SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:56:15 GMT)
HOBBIT: A Mixed Precision Expert Offloading System for Fast MoE Inference [54.4] フレキシブルで効率的なMoE推論を実現するための混合精度専門家オフロードシステムHOBBITを提案する。
キーとなる洞察は、重要でないキャッシュミスの専門家を低い精度で動的に置き換えることで、専門家のロード遅延を大幅に削減できるということです。
HOBBITは、最先端のMoEオフロードシステムと比較して、デコードで最大9.93倍のスピードアップを達成する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 04:25:46 GMT)
Know Where You're Uncertain When Planning with Multimodal Foundation Models: A Formal Framework [54.4] 認識と計画生成の不確実性を解消し、定量化し、緩和する包括的枠組みを提案する。
本稿では,知覚と意思決定の独特な性質に合わせた手法を提案する。
この不確実性分散フレームワークは, 変動率を最大40%削減し, タスク成功率をベースラインに比べて5%向上させることを示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:32:00 GMT)
Data Augmentation for End-to-end Code-switching Speech Recognition [54.1] コードスイッチングデータ拡張のための3つの新しいアプローチが提案されている。
既存のコードスイッチングデータによる音声スプライシングと、単語翻訳や単語挿入によって生成された新しいコードスイッチングテキストによるTS。
200時間のMandarin-Britishコードスイッチングデータセットの実験では、コードスイッチングASRを個別に大幅に改善した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 04:25:14 GMT)
Unsupervised Visible-Infrared Person ReID by Collaborative Learning with Neighbor-Guided Label Refinement [53.0] 教師なし学習 可視赤外人物再識別 (USL-VI-ReID) は、ラベルなしのクロスモダリティデータセットからモダリティ不変の特徴を学習することを目的としている。
本稿では,生成したラベルを1つのモダリティからそれに対応するモダリティに同時に割り当てる,Dual Optimal Transport Label Assignment (DOTLA) フレームワークを提案する。
提案したDOTLA機構は、相互強化と相互モダリティデータアソシエーションの効率的な解を定式化することにより、不十分でノイズの多いラベルアソシエーションの副作用を効果的に低減することができる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:50:53 GMT)
Machine Learning Innovations in CPR: A Comprehensive Survey on Enhanced Resuscitation Techniques [52.7] 心肺蘇生(CPR)における機械学習(ML)と人工知能(AI)の変革的役割について検討する。
再現結果を改善する上で、予測モデリング、AI強化デバイス、リアルタイムデータ分析の影響を強調している。
本稿は、この新興分野における現在の応用、課題、今後の方向性に関する包括的概要、分類、および批判的分析を提供する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:01:50 GMT)
Efficient and Robust Regularized Federated Recommendation [52.2] 推薦システム(RSRS)は、ユーザの好みとプライバシの両方に対処する。
通信効率を向上させるために,非一様勾配勾配勾配を取り入れた新しい手法を提案する。
RFRecFの強靭性は、多様なベースラインに比べて優れている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:10:20 GMT)
Autoformulation of Mathematical Optimization Models Using LLMs [50.0] 商用問題解決者のための自然言語記述から最適化モデルを作成するための自動アプローチを開発する。
本稿では,(1)問題依存仮説空間の定義,(2)不確実性の下でこの空間を効率的に探索すること,(3)定式化の正しさを評価すること,の3つの課題を同定する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:41:38 GMT)
Understanding and Scaling Collaborative Filtering Optimization from the Perspective of Matrix Rank [48.0] 協調フィルタリング(CF)手法は現実世界のレコメンデーションシステムを支配している。
本研究では,異なる学習戦略下での埋め込みテーブルの特性について検討する。
ユーザの安定なランクとアイテムの埋め込みを規則化する,効率的なウォームスタート戦略を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 22:11:35 GMT)
Evaluating LLMs' Mathematical and Coding Competency through Ontology-guided Interventions [47.8] 算術的推論とコード生成という,2つの一般的な推論タスクに注目します。
i) 数学やコーディング問題に対する摂動の一般的なオントロジー, (ii) 摂動を応用するための半自動手法, (iii) 2つのデータセットを紹介する。
混乱した質問に対して、すべてのモデルで大幅なパフォーマンス低下を示します。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:52:58 GMT)
RSA: Resolving Scale Ambiguities in Monocular Depth Estimators through Language Descriptions [47.6] 一つの画像から深度を推定することは、視線投影によるスケールの損失による不適切な問題である。
我々の目標は、線形変換によりメートルスケールの深度マップを復元することである。
提案手法は,画像中のオブジェクトを記述したテキストキャプションを入力として,線形変換のパラメータを出力する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 02:20:28 GMT)
Augmenting Biomedical Named Entity Recognition with General-domain Resources [47.2] ニューラルネットワークに基づくバイオメディカル名前付きエンティティ認識(BioNER)モデルのトレーニングは通常、広範囲でコストのかかる人的アノテーションを必要とする。
GERBERAは、一般ドメインのNERデータセットをトレーニングに利用した、単純なyet効率の手法である。
我々は,81,410インスタンスからなる8つのエンティティタイプの5つのデータセットに対して,GERBERAを体系的に評価した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:42:13 GMT)
Compressing Large Language Models using Low Rank and Low Precision Decomposition [46.3] この研究は、新しい訓練後のLLM圧縮アルゴリズムである$rm CALDERA$を導入している。
重量行列 $mathbfW$ の固有の低ランク構造を利用して、低ランクで低精度な分解によってそれを近似する。
その結果、LlaMa-$2$$7$B/$13B$/$70$BとLlaMa-$3$B $rm CALDERA$は、既存のトレーニング後の圧縮技術より優れていることが示された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:25:29 GMT)
ERBench: An Entity-Relationship based Automatically Verifiable Hallucination Benchmark for Large Language Models [46.1] 大規模言語モデル(LLM)は、様々なアプリケーションで前例のない性能を達成したが、評価は依然として難しい。
既存のリレーショナルデータベースを利用することは、ベンチマークを構築する上で有望なアプローチである、と我々は主張する。
我々は,これらの整合性制約を用いて任意のデータベースをLLMベンチマークに変換するERBenchを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:38:50 GMT)
DELE: Deductive $\mathcal{EL}^{++} \thinspace $ Embeddings for Knowledge Base Completion [45.8] オントロジーはクラス、関係、個人を$mathbbn$に埋め込み、$bbRn$のエンティティ間の類似性を計算することができる。
本手法は,知識ベースや完了タスクのベースライン埋め込みよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:00:04 GMT)
LiveScene: Language Embedding Interactive Radiance Fields for Physical Scene Rendering and Control [45.1] 本稿では,複雑なシーンにオブジェクトレベルの再構築を拡大し,インタラクティブなシーン再構築を推し進める。
複数のオブジェクトを効率的に再構成し,制御する,シーンレベルの言語埋め込み型対話型放射場LiveSceneを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 07:37:05 GMT)
FIFO-Diffusion: Generating Infinite Videos from Text without Training [44.7] FIFO-Diffusionは概念的には、追加のトレーニングなしで無限に長いビデオを生成することができる。
提案手法では, 頭部に完全に識別されたフレームを列挙し, 尾部に新しいランダムノイズフレームを列挙する。
提案手法が既存のテキスト・ビデオ生成ベースラインに対して有望な結果と有効性を示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:40:41 GMT)
READoc: A Unified Benchmark for Realistic Document Structured Extraction [44.4] 本稿では,DSEを現実的なタスクとして定義するREADocという新しいベンチマークを紹介する。
READocデータセットは、arXivとGitHubの2,233の多種多様な実世界のドキュメントから派生したものだ。
さらに,最先端DSE手法の統一評価法を開発した。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 09:09:21 GMT)
Monotonic Paraphrasing Improves Generalization of Language Model Prompting [42.7] MonoParaはエンド・ツー・エンドのデコーディング戦略であり、プロンプトや命令を下位のパープレクティリティに言い換える。
いかなる訓練も必要とせず、単調に言い換えられたプロンプトや命令の難易度を下げることができる。
また、乱雑なタスク命令に対するLMの一般化を効果的に改善することが示されている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:53:41 GMT)
TOPA: Extending Large Language Models for Video Understanding via Text-Only Pre-Alignment [42.6] ビデオの理解は、相当量のWebビデオテキストデータが利用できるにもかかわらず、依然として課題である。
ビデオ理解のための大規模言語モデル(LLM)を拡張する新しいアプローチであるテキストオンリー・プレアライメント(TOPA)を導入する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:25:57 GMT)
AnyV2V: A Tuning-Free Framework For Any Video-to-Video Editing Tasks [41.6] 我々はビデオ編集を簡単にするための新しいチューニング不要のパラダイムであるAnyV2Vを紹介する。
AnyV2Vは、既存の画像編集ツールを利用して、幅広いビデオ編集タスクをサポートすることができる。
評価の結果,AnyV2Vは他のベースライン法に匹敵するCLIPスコアが得られた。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:16:54 GMT)
HiMemFormer: Hierarchical Memory-Aware Transformer for Multi-Agent Action Anticipation [39.9] オンラインマルチエージェントアクション予測のためのトランスモデルであるHiMemFormer(HiMemFormer)を提案する。
HiMemFormerは、アクション予測におけるノイズや冗長な情報を避けるために、エージェント固有の好みでグローバルコンテキストを適用する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:33:37 GMT)
HW-GPT-Bench: Hardware-Aware Architecture Benchmark for Language Models [39.8] HW-GPT-Benchはハードウェア対応のベンチマークで、GPT-2ファミリ内の13のアーキテクチャデバイスにわたる様々なハードウェアメトリクスを近似する。
我々のサロゲートは、キャリブレーションされた予測と確実な不確実性推定を通じて、エネルギーと遅延測定に固有のヘテロセダスティックノイズを忠実にモデル化する。
本稿では,HW-GPT-Benchの多目的最適化アルゴリズムの最適化軌道を数秒でシミュレーションすることで,HW-GPT-Benchの有用性を実証する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:45:35 GMT)
Why are Visually-Grounded Language Models Bad at Image Classification? [39.8] GPT-4VやLLaVAといった視覚的言語モデル(VLM)を用いて画像分類タスクを再検討する。
既存のプロプライエタリかつパブリックなVLMは、ImageNetのような標準画像分類ベンチマークにおいてCLIPを著しく上回っていることがわかった。
画像分類のための重要な情報は、VLMの潜在空間に符号化されるが、十分なトレーニングデータで効果的に復号化できる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:23:45 GMT)
Degradation-Aware Residual-Conditioned Optimal Transport for Unified Image Restoration [39.5] オールインワン画像復元は、現実のアプリケーションのための実用的で有望な低レベル視覚タスクとして登場した。
本稿では, 画像復元を最適輸送問題としてモデル化する, DA-RCOT (Degradation-Aware Residual-Conditioned Optimal Transport) アプローチを提案する。
DA-RCOTは,複数の劣化があっても現実のシナリオに優れた適応性を提供し,劣化レベルと劣化数の両方に顕著な堅牢性を示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:57:19 GMT)
Graph Fourier Neural ODEs: Bridging Spatial and Temporal Multiscales in Molecular Dynamics [39.4] 分子動力学における空間的・時間的多スケール相互作用を共同でモデル化する新しい枠組みを提案する。
MD17データセット上で本モデルを評価し,最先端のベースラインに対して一貫した性能向上を示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:10:48 GMT)
Conformal Risk Minimization with Variance Reduction [37.7] コンフォーマル予測(CP)は、ブラックボックスモデルにおける確率的保証を達成するための分布自由フレームワークである。
最近の研究は、トレーニング中のCP効率の最適化に重点を置いている。
我々は、この概念を共形リスク最小化の問題として定式化する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:48:15 GMT)
Online Graph Learning via Time-Vertex Adaptive Filters: From Theory to Cardiac Fibrillation [37.7] グラフシフト演算子(GSO)の適応推定のためのオンラインアルゴリズムであるAdaCGPを導入する。
シミュレーションにより、AdaCGPは様々なグラフトポロジに対して一貫して良好に機能し、GSO推定において82%以上の改善が達成されることを示す。
AdaCGPのグラフ構造の変化を追跡する能力は、抗不整脈薬による心室細動動態の記録に示されている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:43:51 GMT)
Trustworthy Federated Learning: Privacy, Security, and Beyond [37.5] Federated Learning (FL)は、生データを転送することなく、分散データソース間で協調的なモデルトレーニングを促進することで、問題に対処する。
FLが抱えるセキュリティとプライバシに関する広範な調査を行い、通信リンクの脆弱性とサイバー脅威の可能性を明らかにします。
FLフレームワーク内で発生する複雑なセキュリティ課題を特定し、セキュアで効率的なFLシステムの開発に寄与することを目的としている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:18:01 GMT)
Multi-Agent Diagnostics for Robustness via Illuminated Diversity [37.4] 発光ダイバーシティ(MADRID)によるロバストネスのマルチエージェント診断法を提案する。
MADRIDは、事前訓練されたマルチエージェントポリシーの戦略的脆弱性を明らかにする様々な敵シナリオを生成する。
我々は,Google Research Footballの11vs11バージョンにおけるMADRIDの有効性を評価する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:13:18 GMT)
LinRec: Linear Attention Mechanism for Long-term Sequential Recommender Systems [36.5] 我々はトランスフォーマーに基づくシーケンスレコメンダシステム(LinRec)のための新しいL2正規化線形アテンションを提案する。
本稿では,LinRecが注意機構の特性を保ちながら線形複雑性を有することを示す。
実験は2つの公開ベンチマークデータセットに基づいて行われ、LinRecモデルとTransformerモデルの組み合わせが同等またはそれ以上のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:56:00 GMT)
Spectral Editing of Activations for Large Language Model Alignment [36.3] 大規模言語モデル(LLM)は、非現実的あるいは偏見のあるコンテンツを生成するなど、望ましくない振る舞いを示すことが多い。
本稿では、入力表現を方向に向けて投影するための新しい推測時間編集手法、すなわち、アクティベーションのスペクトル編集(SEA)を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:12:14 GMT)
FilterNet: Harnessing Frequency Filters for Time Series Forecasting [34.8] FilterNetは、時系列信号の特定の成分を選択的に通過または減衰させることにより、重要な情報的時間パターンを抽出するために、我々の提案した学習可能な周波数フィルタ上に構築されている。
2つのフィルタを備えることで、FilterNetは、時系列文学で広く採用されている線形およびアテンションマッピングを概ねサロゲートすることができる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:20:41 GMT)
Co-clustering for Federated Recommender System [33.7] Federated Recommender System(FRS)は、高品質なレコメンデーションの提供とユーザのプライバシの保護のバランスをとるソリューションを提供する。
パーソナライズされた意思決定パターンによって一般的に観察されるFRSにおける統計的不均一性の存在は、課題を引き起こす可能性がある。
本稿では,Co-clustering Federated RecommendationメカニズムであるCoFedRecを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:32:07 GMT)
Learning to Reason via Program Generation, Emulation, and Search [33.1] 言語モデル(LM)によるプログラム合成は、多くの推論能力を解放した。
すべての推論タスクは、コードとして容易に表現できるわけではない。例えば、常識的推論、道徳的意思決定、皮肉な理解を含むタスクである。
我々は,プログラム合成スキルをこのようなタスクに拡張するために,コード生成とエミュレートされた実行(CoGEX)を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 22:44:20 GMT)
Talking Heads: Understanding Inter-layer Communication in Transformer Language Models [32.3] 2つのLMで用いられるメカニズムを分析し、1つのタスクでコンテキスト内のアイテムを選択的に抑制する。
モデルが残ストリームの低ランクな部分空間に書き込まれて,後続のレイヤで読み出される特徴を表現することが分かりました。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:48:48 GMT)
Powering In-Database Dynamic Model Slicing for Structured Data Analytics [31.4] 本稿では,指定されたsqlクエリのモデルをカスタマイズする新しい動的スライシング手法であるLEADSを紹介する。
LEADSは、専門家(MoE)の混合を通じて構造化データの予測モデリングを改善し、SQL対応ゲーティングネットワークによって効率を維持する。
実世界のデータセットに関する我々の実験は、LEADSがベースラインモデルより一貫して優れていることを示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:58:12 GMT)
ParallelEdits: Efficient Multi-Aspect Text-Driven Image Editing with Attention Grouping [31.0] ParallelEditsは、複数の属性をまたいだ同時編集をシームレスに管理するメソッドである。
PIE-Bench++データセットは、多面的シナリオにおけるテキスト駆動の画像編集方法を評価するためのベンチマークである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:34:35 GMT)
Teaching Models to Improve on Tape [30.3] 大きな言語モデル(LLM)は、特定の制約の下でコンテンツを生成するよう促されたときにしばしば苦労する。
最近の研究は、LLMがそのような是正的フィードバックの恩恵を受けることを示している」。
本稿では,そのような報酬をモデルに教えるためのRLフレームワークを紹介し,その制約を満たす能力に応じてモデルに報酬を与える。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:49:55 GMT)
Customized Subgraph Selection and Encoding for Drug-drug Interaction Prediction [29.6] 薬物と薬物の相互作用(DDI)を予測するために、グラフベースの方法が効果的で解釈可能であることが証明された
サブグラフの選択と符号化はこれらの手法において重要な段階であるが、手動調整のコストが高いため、これらのコンポーネントのカスタマイズは未探索のままである。
本稿では,サブグラフベースのフレームワーク内でデータ固有のコンポーネントを探索する手法を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:41:35 GMT)
Sample-Efficient Alignment for LLMs [29.5] 本研究では,大規模言語モデル (LLM) と人選好を協調させる手法について検討した。
我々はトンプソンサンプリングに基づく統一アルゴリズムを導入し、2つの異なるLCMアライメントシナリオでその応用を強調した。
その結果,SEAはオラクルの嗜好と高いサンプル効率の整合性を達成し,近年のLCMの活発な探査方法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:18:28 GMT)
MultiBalance: Multi-Objective Gradient Balancing in Industrial-Scale Multi-Task Recommendation System [28.2] 産業規模のマルチタスクレコメンデーションシステムにおいて,MultiBalanceと呼ばれる勾配バランス手法を提案する。
タスク毎の勾配のバランスを保ち、負の移動を軽減し、グリッド検索や手動探索の膨大なコストを節約します。
我々はMetaの大規模広告の実験を行い、マルチタスクレコメンデーションシステムを提供し、MultiBalanceが大きな利益を得るのを観察する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:20:21 GMT)
Federated Learning Clients Clustering with Adaptation to Data Drifts [28.0] フェデレートラーニング(FL)は、エッジデバイス間のディープラーニングモデルのトレーニングを可能にする。
本稿では,データドリフトを低オーバーヘッドで迅速に処理するクラスタリングFLフレームワークであるFieldingを紹介する。
評価の結果,Fielding はモデルの最終精度を 1.9%-5.9% 向上し,目標精度 1.16x-2.61x に到達した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:13:38 GMT)
Rethinking Weight Decay for Robust Fine-Tuning of Foundation Models [27.8] 本稿では,新しい重み劣化手法Selective Projection Decay (SPD)を提案する。
SPDは特定の層に強いペナルティを課し、他の層は自由に変更できる。
SPDを搭載した場合、Adamはベンチマーク上でより優れた分散ロバスト性とアウト・オブ・ディストリビュート性能を提供する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 23:36:53 GMT)
InterIntent: Investigating Social Intelligence of LLMs via Intention Understanding in an Interactive Game Context [27.7] 大規模言語モデル(LLM)は、人間の社会的知性を模倣する可能性を実証している。
我々は,ゲーム環境における意図を理解し,管理する能力をマッピングすることで,LLMの社会的知性を評価する新しい枠組みであるInterIntentを開発した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:15:22 GMT)
Stochastic Communication Avoidance for Recommendation Systems [27.6] 本稿では,ルックアップテーブルを用いた任意の分散システムの通信コストを解析する理論的枠組みを提案する。
本稿では,メモリ,計算,通信制約を考慮したスループットを最大化するアルゴリズムを提案する。
フレームワークとアルゴリズムをPyTorchで実装し、ベースラインを越えたGPUシステムのトレーニングスループットを最大6倍に向上します。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:37:37 GMT)
EcoAct: Economic Agent Determines When to Register What Action [27.4] EcoActは、タスクを推論する複数のステップにおいて、計算コストを50%以上削減する。
プロンプトに小さな変更を加えるだけで、任意の推論パイプラインにプラグインできる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:37:06 GMT)
Flexible Coded Distributed Convolution Computing for Enhanced Fault Tolerance and Numerical Stability in Distributed CNNs [26.3] 本稿では,Flexible Coded Distributed Convolution Computingフレームワークを紹介する。
分散CNNの耐障害性と数値安定性を向上させる。
実験的な結果は、計算効率、耐障害性、スケーラビリティにおけるフレームワークの有効性を検証する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:05:29 GMT)
Differentiable Quantum Computing for Large-scale Linear Control [26.1] 証明可能なスピードアップを伴う線形四進法制御のためのエンドツーエンド量子アルゴリズムを提案する。
政策勾配法に基づくアルゴリズムでは,リアプノフ方程式を解くための新しい量子サブルーチンが組み込まれている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:54:33 GMT)
Goal-Oriented Semantic Communication for Wireless Visual Question Answering with Scene Graphs [26.0] VQA(Visual Question Answering)は、局所的な計算制約を緩和し、自然言語による視覚知覚を加速するためにエッジコンピューティングを採用している。
本稿では,セマンティック情報を効果的に抽出し,伝達することに焦点を当てた,ゴール指向のセマンティックコミュニケーションフレームワークを提案する。
我々は,従来のビット指向伝送と比較して,応答精度を最大59%向上すると同時に,全遅延を最大65%低減することを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:01:18 GMT)
Facet-Aware Multi-Head Mixture-of-Experts Model for Sequential Recommendation [25.5] 逐次レコメンデーションのためのFAME(Facet-Aware Multi-Head Mixture-of-Experts Model for Sequential Recommendation)という新しい構造を提案する。
最後のマルチヘッドアテンション層における各頭部からのサブ埋め込みを活用して,次の項目を別々に予測する。
ゲーティングメカニズムは、各ヘッドからのレコメンデーションを統合し、それらの重要性を動的に決定する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:47:45 GMT)
DesignRepair: Dual-Stream Design Guideline-Aware Frontend Repair with Large Language Models [25.5] DesignRepairは、コードアスペクトとレンダリングページアスペクトの両方から設計品質の問題を調べ、修復する、新しいデュアルストリーム設計ガイドライン対応システムである。
提案手法の有効性と有効性を評価し, 設計ガイドライン, アクセシビリティ, ユーザエクスペリエンスの指標への適合性を著しく向上した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:25:47 GMT)
Divide-and-Conquer Meets Consensus: Unleashing the Power of Functions in Code Generation [25.3] FunCoderは、機能的なコンセンサスに分割と参照の戦略を取り入れたコード生成フレームワークである。
FunCoderは、HumanEval、MBPP、xCodeEval、MATHにおいて、GPT-3.5とGPT-4で、最先端のメソッドを平均で+9.8%上回る。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:04:54 GMT)
Large Language Model Supply Chain: Open Problems From the Security Perspective [25.3] 大規模言語モデル(LLM)はソフトウェア開発パラダイムを変えつつあり、学術と産業の両方から大きな注目を集めています。
各コンポーネントの潜在的なセキュリティリスクとLCM SCのコンポーネント間の統合について議論する第一歩を踏み出します。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:20:21 GMT)
BrepGen: A B-rep Generative Diffusion Model with Structured Latent Geometry [24.8] BrepGenは拡散に基づく生成手法であり、境界表現(Breep)コンピュータ支援設計(CAD)モデルを直接出力する。
BrepGenは、階層木における新しい構造付き潜在幾何学としてB-repモデルを表す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:04:52 GMT)
UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models [24.2] ユニガード(UniGuard)は、モノモダルとクロスモーダルの有害信号を共同で検討する新しい安全ガードレールである。
最小の計算コストで推論中に任意の入力プロンプトにシームレスに適用できる。
LLaVA、Gemini Pro、GPT-4、MiniGPT-4、InstructBLIPなど、最先端のMLLMにまたがる印象的な一般化性を示している。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 22:19:20 GMT)
RS-MoE: Mixture of Experts for Remote Sensing Image Captioning and Visual Question Answering [23.7] 本稿では,リモートセンシングに特化してカスタマイズされた,最初のMixture of ExpertベースのVLMであるRS-MoEを提案する。
従来のMoEモデルとは異なり、RS-MoEのコアとなるMoEブロックは、新しいインストラクションルータと複数の軽量言語モデル(LLM)をエキスパートモデルとして組み込んだものである。
本モデルでは, 精度, 文脈に関連のあるキャプションを生成する際に, 最先端の性能を実現する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:05:49 GMT)
Impact of Strategic Sampling and Supervision Policies on Semi-supervised Learning [23.5] 半教師付き表現学習フレームワークでは、ラベル付きデータの数が極めて少ない場合には、これらのサンプルの品質と代表性がますます重要になる。
半教師付き学習に関する既存の文献は、ラベル付けのための限られた数のデータポイントをランダムにサンプリングする。
これらのラベル付きサンプルは、トレーニングプロセス全体を通して、未ラベルのデータとともに使用される。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:20:07 GMT)
Unexploited Information Value in Human-AI Collaboration [23.4] ヒューマンAIチームのパフォーマンスを改善する方法は、各エージェントがどのような情報や戦略を採用しているかを知らなければ、しばしば明確ではない。
本稿では,人間とAIの協調関係を分析するための統計的決定理論に基づくモデルを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:34:45 GMT)
Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models [23.0] 我々は,LVLM(Large Vision-Language Models)における対象と関係の幻覚を同時に測定するための統一的なフレームワークを設計する。
本稿では,トリプルトレベルの幻覚評価ベンチマークTri-HEを紹介する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:35:12 GMT)
HeightMapNet: Explicit Height Modeling for End-to-End HD Map Learning [22.9] 本稿では,道路面の高さ分布と画像特徴の動的関係を確立する新しいフレームワークであるHeightMapNetを紹介する。
本研究では,Bird's-Eye-View (BEV) の機能の精度を従来の手法以上の精度で改善する。
HeightMapNetは、挑戦的なnuScenesとArgoverse 2データセットに関する例外的な結果を示している。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:35:17 GMT)
Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey [22.5] 優先度調整は、深層生成モデルと人間の嗜好を整合させる重要なプロセスである。
この調査は、最近の嗜好調整の進歩と人間のフィードバックの統合を概観するものである。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 01:51:57 GMT)
Graph-based Confidence Calibration for Large Language Models [22.4] 本稿では,信頼度推定モデルを構築するための新しい手法を提案する。
重み付きグラフを用いて、質問に対する大きな言語モデルの応答の一貫性を表現します。
次に、正しい応答の確率を推定するためにグラフニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:36:44 GMT)
Achieving Domain-Independent Certified Robustness via Knowledge Continuity [22.0] 我々は、リプシッツ連続性に触発された新しい定義である知識連続性を示す。
提案した定義は、ニューラルネットワークの損失関数と中間学習距離空間にのみ依存することを保証する。
ニューラルネットワークの脆弱なコンポーネントのローカライズには,知識の連続性が有効であることを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:37:59 GMT)
SkyServe: Serving AI Models across Regions and Clouds with Spot Instances [21.9] SkyServeは、リージョンとクラウドをまたいだスポットとオンデマンドのレプリカを混ぜて、AIモデルを効率的に提供するシステムです。
SkyServeは、オンデマンドレプリカを使用する場合と比較して、高可用性を実現する一方で、コストを最大44%削減する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 05:00:53 GMT)
Context-Aware Token Selection and Packing for Enhanced Vision Transformer [21.9] 従来の自己保持機構は、非効率性と不正確さに悩まされている。
我々はSelect and Pack Attention (SPA)という新しいアルゴリズムを提案する。
SPAは、選択ラベルによって管理される低コストのゲーティング層を使用して情報トークンを動的に選択し、これらのトークンを新しいバッチにまとめる。
実験の結果、SPAはオブジェクト検出の0.6mAP改善や計算コストの16.4%削減など、優れたパフォーマンスと効率を提供することが示された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:00:01 GMT)
Digital Twin-Enhanced Wireless Indoor Navigation: Achieving Efficient Environment Sensing with Zero-Shot Reinforcement Learning [21.8] ミリ波通信は将来のモバイルネットワークにおいて重要な要素であり、複雑な環境での屋内ナビゲーションに最適である。
従来の物理学に基づく手法、例えば到着角(AoA)は複雑なシナリオでは不足することが多い。
本稿では,デジタル双生児が提供する身体的洞察を利用して,強化学習(RL)報酬関数を形作る物理情報強化学習(PIRL)手法を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:09:53 GMT)
Sequential Resource Trading Using Comparison-Based Gradient Estimation [21.2] 資源割り当てのシーケンシャルなトレーディングを、2つの合理的なエージェントが有限のカテゴリから逐次的にリソースを交換する環境で検討する。
本稿では,提案エージェントが応答エージェントの勾配(参照)を推定し,事前の受け入れや拒絶の応答に基づいて提案を行うアルゴリズムを提案する。
有限個の提案が連続的に拒否された後、応答剤は最適に近い状態にあるか、エージェントの勾配が密に一致しているかを示す。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 23:38:11 GMT)
Activating Self-Attention for Multi-Scene Absolute Pose Regression [21.2] マルチシーン絶対ポーズ回帰は、高速でメモリ効率のよいカメラポーズ推定の需要に対処する。
変圧器エンコーダは、崩壊した自己アテンションマップのために未利用である。
クエリとキーをアライメントし、クエリキー空間の歪みを防止できる補助的損失を示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:00:36 GMT)
PSformer: Parameter-efficient Transformer with Segment Attention for Time Series Forecasting [21.0] 時間予測は、高次元のデータと長期の依存関係によってしばしば複雑になる、さまざまな領域において重要な課題である。
本稿では,パラメータ共有(PS)と空間時間注意(SegAtt)という,時系列予測のための新しいトランスフォーマーアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:04:00 GMT)
ReDAN: An Empirical Study on Remote DoS Attacks against NAT Networks [20.9] ローカルNATネットワークの外部で動作するインターネット攻撃者は、NATデバイスをリモートで識別し、特定NATデバイスから外部サーバへのTCP接続を停止できることを示す。
我々はNAT仕様内のPMTUD機構の欠陥を利用して、インターネット上のNATデバイスを識別する。
実験の結果,既存のNATデバイスに広範なセキュリティ脆弱性が認められた。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:22:31 GMT)
Enriching Tabular Data with Contextual LLM Embeddings: A Comprehensive Ablation Study for Ensemble Classifiers [20.5] 本研究では,大規模言語モデルの埋め込みから派生した特徴を持つデータセットを豊かにするための体系的アプローチを提案する。
我々はRoBERTaとGPT-2の埋め込みがランダムフォレスト、XGBoost、CatBoostなどのアンサンブル分類器に与える影響を評価する。
その結果,埋め込みと従来の数値的特徴とカテゴリー的特徴を統合することで,予測性能が向上することが示唆された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:45:00 GMT)
Stabilized Proximal-Point Methods for Federated Optimization [20.3] 非加速アルゴリズムの通信複雑性は、分散近位点アルゴリズムであるDANEによって達成される。
ハイブリッド投影近点法に着想を得て,新しい分散アルゴリズムS-DANEを提案する。
S-DANEは、S-DANEとして良好な局所計算効率を保ちながら、通信の複雑さを最もよく表すことを示す。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 10:13:18 GMT)
HDRGS: High Dynamic Range Gaussian Splatting [20.1] 高ダイナミックレンジ(GS)法は輝度によって色次元を向上し、トーンマッピングに非対称グリッドを使用する。
本手法は, 合成シナリオと実世界のシナリオの両方において, 現在の最先端技術を超えている。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 11:15:53 GMT)
Investigating the Impact of Interpersonal Challenges on Feeling Welcome in OSS [20.1] 対人的課題は、貢献者の間での歓迎感、特に過小評価されたグループからの歓迎感を阻害する。
本稿では,OSS内の多様な集団の歓迎意識に及ぼす対人的課題の影響について検討する。
性別、人種、障害グループによって異なる課題が、人々がどのように歓迎されているかに独特な影響を与えることがわかりました。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:11:50 GMT)
Toward Efficient Kernel-Based Solvers for Nonlinear PDEs [20.0] 本稿では,非線形偏微分方程式(PDE)を効率的に解くための新しいカーネル学習フレームワークを提案する。
カーネルに微分演算子を埋め込む最先端のカーネルソルバとは対照的に,本手法ではこれらの演算子をカーネルから排除する。
我々は、標準カーネル形式を用いて解をモデル化し、導関数を計算するために補間剤を区別する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 04:01:46 GMT)
SPES: Spectrogram Perturbation for Explainable Speech-to-Text Generation [19.8] 説明可能な音声・テキスト生成のためのスペクトログラム摂動法(SPES)を提案する。
SPESは、入力スペクトログラムと以前に生成されたトークンの両方に基づいて、予測されたトークンについて説明を提供する。
音声認識と翻訳に関する広範囲な評価は、SPESが人間に忠実で妥当な説明を生成することを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 23:02:30 GMT)
Qplacer: Frequency-Aware Component Placement for Superconducting Quantum Computers [19.4] ノイズの多い中間規模量子(NISQ)コンピュータは、量子ビット数の限界に直面し、大規模かつフォールトトレラントな量子コンピューティングへの進歩を妨げる。
我々は,限られた基板領域における多面的クロストークを体系的に解決する一般的なアプローチを動機付けている。
超伝導量子コンピュータに適した周波数対応静電配置フレームワークQplacerを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:21:39 GMT)
InstantGeoAvatar: Effective Geometry and Appearance Modeling of Animatable Avatars from Monocular Video [19.1] InstantGeoAvatarは、詳細な3次元幾何学の単眼ビデオから効率的かつ効果的な学習方法である。
本稿では,ボリュームレンダリングパイプラインにシームレスに適合する幾何対応 SDF 正規化方式を提案する。
幾何再構成と新しいビュー合成の競争力は5分以内のトレーニング時間で得られる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:26:33 GMT)
HDRGS: High Dynamic Range Gaussian Splatting [19.1] 高ダイナミックレンジ(GS)法は輝度によって色次元を向上し、トーンマッピングに非対称グリッドを使用する。
本手法は, 合成シナリオと実世界のシナリオの両方において, 現在の最先端技術を超えている。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 11:15:53 GMT)
Domain-specific Guided Summarization for Mental Health Posts [18.8] デュアルエンコーダと適応デコーダを備えたガイド付き要約器を提案する。
生成した要約の誤りを正すための編集後修正モデルを提案する。
実験はメンタルヘルスのポスト用に特別に設計されていますが、私たちが開発した方法論は幅広い適用性を提供します。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:57:41 GMT)
DNTextSpotter: Arbitrary-Shaped Scene Text Spotting via Improved Denoising Training [17.7] 任意のテキストスポッティングのための新しいDenoising Training(DNTextSpotter)を提案する。
DNTextSpotterは、denoising部のクエリをノイズのある位置クエリとノイズのあるコンテンツクエリに分解する。
4つのベンチマークで最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 14:33:34 GMT)
DNTextSpotter: Arbitrary-Shaped Scene Text Spotting via Improved Denoising Training [17.7] 任意のテキストスポッティングのための新しいDenoising Training(DNTextSpotter)を提案する。
DNTextSpotterは、denoising部のクエリをノイズのある位置クエリとノイズのあるコンテンツクエリに分解する。
4つのベンチマークで最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 14:33:34 GMT)
ROAD-Waymo: Action Awareness at Scale for Autonomous Driving [17.5] ROAD-Waymoは、道路シーンにおけるエージェント、アクション、位置、イベント検出の技術の開発とベンチマークのための広範なデータセットである。
既存のデータセット(および複数の都市を含む)よりもかなり大きく、より困難なものには、198kの注釈付きビデオフレーム、54kのエージェントチューブ、3.9Mのバウンディングボックス、合計12.4Mのラベルがある。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:46:50 GMT)
Conditional Latent Space Molecular Scaffold Optimization for Accelerated Molecular Design [17.2] 初期入力と類似性を保ちながら分子を戦略的に修飾するための条件付き遅延空間分子スカフォールド最適化(CLaSMO)を導入する。
我々のLSBO設定は、最適化のサンプル効率を向上し、我々の修正アプローチは、実世界の適用可能性の高い分子を得るのに役立ちます。
我々はまた、化学の専門家がCLaSMOをHuman-in-the-Loop設定で適用できるオープンソースのWebアプリケーションも提供する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:17:38 GMT)
Query-Efficient Correlation Clustering with Noisy Oracle [17.1] 共同マルチアーマッドバンド(PE-CMAB)における純粋探索のパラダイムに根ざしたオンライン学習問題の2つの新しい定式化を導入する。
我々は,サンプリング戦略と古典近似アルゴリズムを組み合わせるアルゴリズムを設計し,それらの理論的保証について検討する。
本研究は, PE-CMABの場合のクラスタリング時アルゴリズムの最初の例であり, 基礎となるオフライン最適化問題はNP-hardである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:54:13 GMT)
TPOT: Topology Preserving Optimal Transport in Retinal Fundus Image Enhancement [16.8] 持続性図の差を最小限に抑えて血管構造を規則化する訓練パラダイムを提案する。
得られたフレームワークをTPOT(Topology Preserving Optimal Transport)と呼ぶ。
大規模データセットを用いた実験結果から,提案手法の優位性を示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:04:35 GMT)
Dissecting Open Edge Computing Platforms: Ecosystem, Usage, and Security Risks [16.8] オープンエッジコンピューティングプラットフォーム(OECP)は、大規模エッジノード、広範囲の使用と採用、およびエッジノードとして参加するサードパーティへのオープン性を主張している。
我々は2つの代表OECPに関する最初の実証的研究を行い、エッジノードを配置することで実現した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:41:33 GMT)
An Empirical Study of Validating Synthetic Data for Formula Generation [16.3] 大規模言語モデル(LLM)は、スプレッドシートで公式を書くのに役立つ。
我々は、(他の)モデルを用いて、微調整のための合成自然言語発話を生成する。
バリデーションは、4つのモデルにわたる生データよりも性能を向上させることを実証する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 12:44:42 GMT)
Data Extraction Attacks in Retrieval-Augmented Generation via Backdoors [15.9] 本稿では,RAG(Retrieval-Augmented Generation)システムの知識データベースを対象としたデータ抽出攻撃について検討する。
この脆弱性を明らかにするために, LLM内にバックドアを作成するために, 微調整期間中に少量の有毒データを注入するバックドアRAGを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 22:27:40 GMT)
qGDP: Quantum Legalization and Detailed Placement for Superconducting Quantum Computers [15.5] 現在、NISQ(Noisy Intermediate-Scale Quantum)コンピュータは量子ビット数によって制限されている。
これらのシステムをスケールする上で大きな課題はクロストークであり、これはキュービットや共振器のような近隣のコンポーネント間の不要な相互作用から生じる。
qGDPは、最先端の合法化エンジンを一貫して上回り、忠実度を大幅に改善し、空間的違反を低減し、それぞれ34.4xと16.9xの平均ゲインを達成している。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:14:27 GMT)
WiCV@CVPR2024: The Thirteenth Women In Computer Vision Workshop at the Annual CVPR Conference [15.4] WiCVは、コンピュータビジョンのコミュニティにおいて、表現不足の女性の声を増幅することを目的としている。
このような出来事は、フィールド内の男女不均衡に対処する上で重要な役割を担っていると我々は信じている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:45:10 GMT)
Learning to Construct Implicit Communication Channel [15.4] 入出力通信は協調型マルチエージェントシステムにおいて重要な要素である。
暗黙のコミュニケーションの学習に関するこれまでの研究は、主に心の理論(ToM)に依存している。
本稿では,暗黙的な通信チャネルを明示的に構築できるImplicit Channel Protocol (ICP) フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:58:22 GMT)
DSDE: Using Proportion Estimation to Improve Model Selection for Out-of-Distribution Detection [15.2] CIFAR10とCIFAR100の実験結果から,OoD検出問題に対処するためのアプローチの有効性が示された。
提案手法をDOS-Storey-based Detector Ensemble (DSDE) と呼ぶ。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:01:36 GMT)
CiteME: Can Language Models Accurately Cite Scientific Claims? [15.1] 論文を参照する文章を引用すると、LMは研究助手として、参照された論文を正しく識別できるだろうか?
我々のベンチマークであるCiteMEは、最近の機械学習論文からのテキスト抜粋で構成されており、それぞれが1つの論文を参照している。
CiteMEの使用は、フロンティアのLMと人間のパフォーマンスの間に大きなギャップがあることを明らかにし、LMは4.2-18.5%の精度しか達成せず、人間は69.7%である。
我々は、GPT-4o LM上に構築された自律システムであるCiteAgentを導入することにより、このギャップを埋める。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 20:58:35 GMT)
Implicit Discourse Relation Classification For Nigerian Pidgin [14.9] ナイジェリアのピジン(NP)は1億人近い人々によって話されているが、比較的少ないNLP資源とコーパスを持っている。
我々は、オープンソースのIDRCツールを使用してラベルをバックプロジェクションし、NPのための合成談話コーパスを作成し、PDTBとPDTBラベルをプロジェクションする。
ネイティブ」NP分類を学習する後者のアプローチは、ベースラインを13.27%、f$_1$スコアで33.98%上回っている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:56:24 GMT)
Learning Hidden Subgoals under Temporal Ordering Constraints in Reinforcement Learning [14.5] 本稿では, bf 順序付き bf 制約 (LSTOC) に基づく bf l 隠れ bf サブゴールに対する新しい RL アルゴリズムを提案する。
本研究では,隠れたサブゴールとその時間的順序を同時に学習できる新しいコントラスト学習目標を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:22:39 GMT)
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models [14.4] 本稿では、REC-12BとREC-70Bという2つの微調整汎用LLM自動評価器を紹介する。
それらは、忠実性、指示従順性、一貫性、完全性など、様々な次元で生成されたテキストを評価するように設計されている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:36:33 GMT)
Online Relational Inference for Evolving Multi-agent Interacting Systems [14.3] オンライン推論(ORI)は、マルチエージェントインタラクションシステムの進化において、隠れた相互作用グラフを効率的に識別するように設計されている。
固定トレーニングセットに依存する従来のオフラインメソッドとは異なり、ORIはオンラインバックプロパゲーションを採用し、新しいデータポイント毎にモデルを更新する。
重要な革新は、AdaRelationと呼ばれる新しい適応学習技術によって最適化されたトレーニング可能なパラメータとして、隣接行列を使用することである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 05:43:55 GMT)
A Simple and Effective $L_2$ Norm-Based Strategy for KV Cache Compression [14.0] キーバリューキャッシュサイズを減らすための既存のアプローチは、圧縮戦略を学ぶためのモデルを微調整するか、シーケンス長を減らすためにアテンションスコアを利用するかのいずれかである。
キャッシュされたKVペアに対して、$L$とアテンションスコアとの間に明らかな相関関係が見られ、キー埋め込みの低い$L$がデコード時に高いアテンションスコアをもたらす。
実験の結果,この単純な手法により,言語モデリングやニードル・イン・ア・ヘイスタックタスクでは50%,パスキー検索タスクでは90%,精度を損なうことなく,KVキャッシュサイズを50%削減できることがわかった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:42:35 GMT)
A Simple and Effective $L_2$ Norm-Based Strategy for KV Cache Compression [14.0] キーバリューキャッシュサイズを減らすための既存のアプローチは、圧縮戦略を学ぶためのモデルを微調整するか、シーケンス長を減らすためにアテンションスコアを利用するかのいずれかである。
キャッシュされたKVペアに対して、$L$とアテンションスコアとの間に明らかな相関関係が見られ、キー埋め込みの低い$L$がデコード時に高いアテンションスコアをもたらす。
実験の結果,この単純な手法により,言語モデリングやニードル・イン・ア・ヘイスタックタスクでは50%,パスキー検索タスクでは90%,精度を損なうことなく,KVキャッシュサイズを50%削減できることがわかった。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 09:42:35 GMT)
MoCE: Adaptive Mixture of Contextualization Experts for Byte-based Neural Machine Translation [13.7] バイトベースの機械翻訳システムは、多言語設定において大きな可能性を秘めている。
各文字を特定のバイトにマッピングするUnicodeエンコーディングは、新しい言語においても未知の単語の出現を排除している。
局所的な文脈化は、初期意味論をトークンに割り当て、文理解を改善するのに有効であることが証明されている。
本稿では,アダプティブ・マルチスケール・ハイド・アテンション(Ada-MSHA)を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:15:43 GMT)
Towards Small Object Editing: A Benchmark Dataset and A Training-Free Approach [13.3] テキストとこれらのオブジェクト間の相互注意マップの整列が困難であるため、小さなオブジェクト生成は制限されている。
我々の手法は、このアライメント問題を局所的およびグローバルな注意誘導とともに大幅に軽減する、トレーニング不要な手法を提供する。
予備的な結果から,本手法の有効性が示され,既存モデルと比較して,小型オブジェクト生成の忠実度と精度が著しく向上した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:38:23 GMT)
A Multi-Modal Unsupervised Machine Learning Approach for Biomedical Signal Processing in CPR [12.8] CPR中の生体信号のリアルタイム解析は、モニタリングと意思決定に不可欠である。
フィルタのような従来の分極法は、CPR信号に存在する様々な複雑なノイズパターンに適応するのに苦労する。
本稿では,マルチモーダルフレームワークを用いたCPR信号の非教師なし機械学習(ML)手法を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:40:25 GMT)
Non-Cross Diffusion for Semantic Consistency [12.6] 常微分方程式(ODE)モデルを学習するための生成モデリングにおける革新的アプローチであるNon-Cross Diffusionを導入する。
提案手法は,2つの分布からサンプリングされた点を非交差経路で効果的に接続する,入力の上昇次元を戦略的に組み込む。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:30:04 GMT)
From Tokens to Materials: Leveraging Language Models for Scientific Discovery [12.2] 本研究では, 材料科学における材料特性予測のための言語モデル埋め込みの適用について検討した。
本研究では、ドメイン固有モデル、特にMatBERTが、複合名や材料特性から暗黙的な知識を抽出する際の汎用モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:03:56 GMT)
Polar R-CNN: End-to-End Lane Detection with Fewer Anchors [12.0] 車線検出は自動運転において重要かつ困難な課題である。
既存のアンカーベースの手法は、以前のレーンアンカーを利用して特徴を抽出し、レーンの位置と形状を洗練させる。
レーン検出のためのエンドツーエンドアンカー方式であるPolar R-CNNを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:40:18 GMT)
Deep Activity Model: A Generative Approach for Human Mobility Pattern Synthesis [11.9] 我々は,人間の移動性モデリングと合成のための新しい生成的深層学習手法を開発した。
オープンソースのデータを使って、アクティビティパターンとロケーショントラジェクトリの両方を組み込む。
モデルはローカルデータで微調整できるため、さまざまな領域にわたるモビリティパターンを正確に表現することができる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:38:52 GMT)
Uncertainty-Based Extensible Codebook for Discrete Federated Learning in Heterogeneous Data Silos [11.4] フェデレートラーニング(FL)は、大規模な分散データセットを活用することを目的としている。
従来の研究では、離散表現は小さな分布シフトをまたいだモデル一般化を促進するために研究されてきた。
FLから派生したモデルでは,不慣れな分布を持つデータサイロに適用した場合,不確実性が著しく向上することが確認できた。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:56:20 GMT)
Enhancing Cyber-Resilience in Integrated Energy System Scheduling with Demand Response Using Deep Reinforcement Learning [11.2] 本稿では, 状態適応型深部強化学習(DRL)に基づくモデルレスレジリエンススケジューリング手法を提案する。
提案手法は、電力・ガス・熱可塑性負荷の相互作用能力を調べるためのIDRプログラムを設計する。
スケジューリング戦略に対するサイバー攻撃の影響を軽減するため,SA-SAC (State-adversarial soft actor-critic)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 04:27:04 GMT)
TRAWL: Tensor Reduced and Approximated Weights for Large Language Models [11.1] TRAWL (Tensor Reduced and Approximated Weights for Large Language Models) は、複数の重み行列に対してテンソル分解を適用し、大域的な構造パターンを捉えることでLLMを効果的に分解する手法である。
我々の実験によると、TRAWLは、追加のデータやトレーニング、微調整を必要とせず、ベンチマークデータセットのベースラインモデルよりも最大16%モデル性能を向上させる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 22:38:08 GMT)
MassiveGNN: Efficient Training via Prefetching for Massively Connected Distributed Graphs [11.0] 本稿では,現在最先端のAmazon DistDGL分散GNNフレームワーク上に,パラメータ化された連続プリフェッチと消去方式を提案する。
NERSC(National Energy Research Scientific Computing Center)のPerlmutterスーパーコンピュータでは、エンドツーエンドのトレーニング性能が15~40%向上している。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:27:13 GMT)
Object segmentation from common fate: Motion energy processing enables human-like zero-shot generalization to random dot stimuli [11.0] ゼロショット図形-地上セグメンテーションのための広い範囲の光学フローモデルと神経科学による運動エネルギーモデルを評価する。
異なるデータセットでトレーニングされた40の深い光フローモデルの断面は、ランダムなドットビデオの動作パターンを推定するのに苦労している。
この神経科学にインスパイアされたモデルは、現在のコンピュータビジョンモデルにおけるランダムドット刺激に対する人間のようなゼロショット一般化の欠如にうまく対処する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:59:45 GMT)
Boosting Jailbreak Transferability for Large Language Models [10.9] 不整合出力を削減するために,シナリオ誘導テンプレート,最適化された接尾辞選択,および再接尾辞攻撃機構の統合を提案する。
提案手法は,様々なベンチマーク実験において優れた性能を示し,攻撃実行と転送可能性の両方において100%近い成功率を達成した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:22:30 GMT)
FactorizePhys: Matrix Factorization for Multidimensional Attention in Remote Physiological Sensing [10.8] Factorized Self-Attention Module (FSAM) は、非負行列分解を用いたボクセル埋め込みから多次元の注意を計算する。
提案手法は,空間的,時間的,チャネル的注意を包括的に獲得し,一般的な信号抽出の性能を高めるために,ボクセルの埋め込みを適応的に分解する。
FactorizePhysは、生のビデオフレームから血流パルス信号を推定するためのエンドツーエンドの3D-CNNアーキテクチャである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:22:58 GMT)
PreCM: The Padding-based Rotation Equivariant Convolution Mode for Semantic Segmentation [10.7] 本稿では,パッド型回転同変畳み込みモード(PreCM)を数値的に構築する。
PreCMは、マルチスケールの画像や畳み込みカーネルだけでなく、複数の畳み込みを置き換えるための代替コンポーネントとしても使用できる。
実験により、PreCMベースのネットワークは、元のネットワークやデータ拡張ベースのネットワークよりもセグメンテーション性能が良いことを示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:26:55 GMT)
A Visual Question Answering Method for SAR Ship: Breaking the Requirement for Multimodal Dataset Construction and Model Fine-Tuning [10.7] 現在の視覚的質問応答(VQA)タスクは、しばしばマルチモーダルデータセットと微調整された視覚言語モデルを構築する必要がある。
本稿では,オブジェクト検出ネットワークと視覚言語モデルを統合する新しいVQA手法を提案する。
この統合は、船舶の位置、密度、サイズ分析といった側面に重点を置いて、VQAシステムの能力を強化することを目的としている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:03:39 GMT)
HC$^3$L-Diff: Hybrid conditional latent diffusion with high frequency enhancement for CBCT-to-CT synthesis [10.7] 本稿では,CBCT-to-CT合成のための新しい条件付き潜時拡散モデルを提案する。
我々はUnified Feature (UFE) を用いて画像を低次元の潜在空間に圧縮する。
本手法は, CBCT-to-CTの高精細合成を患者1人当たり2分以上で効率よく行うことができる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:00:12 GMT)
Efficient Deep Learning Infrastructures for Embedded Computing Systems: A Comprehensive Survey and Future Envision [10.5] 近年、ディープニューラルネットワーク(DNN)は、さまざまな現実世界のビジョンと言語処理タスクにおいて、目覚ましい成功を収めている。
これまでのよく確立されたDNNは、優れた精度を維持することができるにもかかわらず、より深く、より広いものへと進化してきた。
この調査は、組み込みコンピューティングシステムのための最近の効率的なディープラーニングインフラについて議論することに焦点を当てる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:55:04 GMT)
Integrating Graph Neural Networks and Many-Body Expansion Theory for Potential Energy Surfaces [10.5] 第一原理量子力学(QM)モデリングは、物質のサイズが数百の原子を超えるにつれて実現不可能になった。
フラグメントベースグラフニューラルネットワーク(FBGNN)を,フラグメントベース多体展開(MBE)理論に統合する新しい計算ツールを開発した。
FBGNN-MBEの開発は、ディープラーニングモデルをフラグメントベースのQM手法に統合する新しいフレームワークの可能性を示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:03:32 GMT)
Consensus Under Adversary Majority Done Right [10.3] 傍観者は、反対多数派の傍観者というコンセンサスプロトコルを悩ませている。
1983年、ドレフとストロングは99%の敵の可能性があることを示した。
我々は, 1/2以上, 1/3以上は部分同期に対して, 不合理な結果が知られている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:21:52 GMT)
EEE-Bench: A Comprehensive Multimodal Electrical And Electronics Engineering Benchmark [10.3] 大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、科学や数学など様々な分野で有望なスキルを実証している。
実用工学的課題の解決におけるLMMの能力評価を目的としたマルチモーダルベンチマークであるEEE-Benchを提案する。
我々のベンチマークは、アナログ回路や制御システムなど10の必須課題にまたがる2860の慎重に計算された問題からなる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:17:56 GMT)
RSNet: A Light Framework for The Detection of Multi-scale Remote Sensing Targets [10.1] RSNetは、SAR画像における船舶検出を強化するために設計された軽量フレームワークである。
Waveletpool-GuidedContext(WCG)は、グローバルなコンテキスト理解を導くバックボーンである。
ウェーブレットプール・スターフュージョン (WSF) は、残っているウェーブレット要素の乗算構造を用いてネックとして導入された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:09:37 GMT)
GITSR: Graph Interaction Transformer-based Scene Representation for Multi Vehicle Collaborative Decision-making [9.9] 本研究では,交通状態の空間的相互作用の効率的な表現とモデル化に焦点を当てた。
本研究では,グラフインタラクショントランスフォーマに基づくシーン表現のための効果的なフレームワークであるGITSRを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:27:26 GMT)
Fixing Security Vulnerabilities with AI in OSS-Fuzz [9.7] OSS-Fuzzは、オープンソースシステムの継続的な検証のための最も重要で広く使用されているインフラである。
セキュリティ脆弱性を修正するために、よく知られたAutoCodeRoverエージェントをカスタマイズします。
OSS-Fuzz脆弱性データを用いた経験から,LSMエージェントの自律性はセキュリティパッチの成功に有用であることがわかった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:20:32 GMT)
AnyRotate: Gravity-Invariant In-Hand Object Rotation with Sim-to-Real Touch [9.6] 我々は,高密度のsim-to-realタッチを用いた重力不変多軸物体回転システムであるAnyRotateを提案する。
我々の定式化により、統一されたポリシーの訓練により、任意の回転軸に関する未知の物体を任意の方向で回転させることができる。
リッチな多指触覚センシングは不安定な把握を検知し、ポリシーの堅牢性を改善するリアクティブな振る舞いを提供する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:22:30 GMT)
eXponential FAmily Dynamical Systems (XFADS): Large-scale nonlinear Gaussian state-space modeling [9.5] 非線形状態空間グラフィカルモデルのための低ランク構造化変分オートエンコーダフレームワークを提案する。
我々のアプローチは、より予測的な生成モデルを学ぶ能力を一貫して示している。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:42:12 GMT)
Can Language Models Replace Programmers? REPOCOD Says 'Not Yet' [9.5] 大規模言語モデル(LLM)は、Pythonのコーディング問題を解く際に90%以上のpass@1を達成している。
REPOCODは、11の人気のある現実世界プロジェクトから収集された980の問題のコード生成ベンチマークである。
REPOCODの各タスクには、平均313.5人の開発者によるテストケースが含まれている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:24:10 GMT)
A Deep Dive Into Large Language Model Code Generation Mistakes: What and Why? [9.2] 大規模な言語モデルは、仕様から逸脱する欠陥コードを生成することができる。
広範囲な手動分析により, ノンシンタクティックな誤りの7つのカテゴリーが同定された。
評価の結果,LPMの誤りの原因を特定すると,ReActプロンプト技術を用いたGPT-4が最大0.65のF1スコアを達成できることがわかった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:47:03 GMT)
AURA: Amplifying Understanding, Resilience, and Awareness for Responsible AI Content Work [9.2] 本研究では、責任あるAI(RAI)活動を支援するコンテンツワークの性質と課題について検討する。
我々は、RAIコンテンツワークの概念化と、コンテンツワーカーに全体的なサポートを提供するための推奨の枠組みを開発する。
我々は、我々のフレームワークが、RAIコンテンツ労働者の幸福でプロフェッショナルな開発を支援するために、将来のイノベーションをどのように導くかについて議論する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:27:02 GMT)
Anomalous Client Detection in Federated Learning [8.9] フェデレートラーニング(FL)は、レイテンシとプライバシを意識したアプリケーションのための、有望なソリューションだと見なされている。
多くのクライアントでデータが分散しているため、故障したデバイスや予期せぬイベントに起因するクライアントの異常を監視することは困難である。
FLフレームワークにおける悪意のあるクライアント攻撃やクライアントドリフトを克服する異常なクライアント検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:15:21 GMT)
Multimodal Graph Neural Network for Recommendation with Dynamic De-redundancy and Modality-Guided Feature De-noisy [8.8] 動的デ冗長性とモダリティ誘導型特徴デノイズを用いたマルチモーダルグラフニューラルネットワーク(MGNM)を提案する。
実験により,MGNMは冗長情報の復調・除去を行うマルチモーダル情報に対して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:23:07 GMT)
A new general quantum state verification protocol by the classical shadow method [8.5] 従来の量子状態検証の枠組みでは、各タイプの状態に対して最適なプロトコルや効率的なプロトコルを精巧に設計する必要がある。
本稿では,従来の枠組みにもとづく仮説検証の用語を用いて,この新たなプロトコルを再構築し,それらの類似点と相違点について検討する。
従来のフレームワークとシャドーオーバーラッププロトコルの考え方を組み合わせた新しいプロトコルを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:21:35 GMT)
Adaptive Conformal Inference by Particle Filtering under Hidden Markov Models [8.5] 本稿では,この問題に対処するための粒子フィルタリング手法を活用する適応型共形推論フレームワークを提案する。
観測不能な隠れ状態に直接焦点をあてるのではなく、隠れ状態の実際の後部分布の近似として重み付き粒子を革新的に利用する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:15:32 GMT)
Analysis of regularized federated learning [8.5] フェデレーション学習は、異質なビッグデータとプライバシ保護を扱うための効率的なツールである。
ループ降下は、通信コストを削減するために、ビッグデータの実装においてしばしば使用される。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:47:54 GMT)
Hyperbox Mixture Regression for Process Performance Prediction in Antibody Production [8.5] 本稿では,ハイパーボックスを用いた入力空間分割を用いた新しいHMRモデルを提案する。
本研究では,15日間の培養期間におけるモノクローナル抗体製造における品質特性の予測におけるモデルの性能評価を行った。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:04:35 GMT)
A Practical and Privacy-Preserving Framework for Real-World Large Language Model Services [8.3] 大規模言語モデル(LLM)は、テキスト理解と生成において例外的な能力を示した。
個人はしばしばLLM企業が提供するオンラインAI・アズ・ア・サービス(AI)に依存している。
このビジネスモデルは、サービスプロバイダがユーザのトレースパターンや行動データを悪用する可能性があるため、重大なプライバシー上のリスクをもたらす。
本稿では,サービスプロバイダが要求を提出した個人にリンクさせることを防止し,ユーザの匿名性を確保するための実用的かつプライバシ保護フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 07:40:28 GMT)
AED: An black-box NLP classifier model attacker [8.2] Deep Neural Networks(DNN)は、コネクテッドおよび自動化された車両、疾患、雇用といった領域における現実世界のタスクの解決に成功している。
これらのDNNモデルの潜在的なバイアスと堅牢性に関する懸念が高まっている。
本稿では,単語レベルのNLP分類器攻撃モデル"AED"を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:47:36 GMT)
Provable Acceleration for Diffusion Models under Minimal Assumptions [8.2] そこで本研究では,スコアベースサンプルの学習自由化手法を提案する。
最小限の仮定で、我々のスキームは$widetildeO(d5/4/sqrtvarepsilon)$ iterationsの総変量で$varepsilon$-accuracyを達成する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:56:22 GMT)
OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset [8.1] 1.8M 問題解対を持つ数学指導用チューニングデータセット OpenMathInstruct-1 を構築した。
このデータセットは、2つの人気のある数学推論ベンチマークであるGSM8KとMATHのコード解釈ソリューションを合成することによって構築される。
我々の最良のモデルであるOpenMath-CodeLlama-70Bは、OpenMath Instruct-1のサブセットでトレーニングされ、GSM8Kで84.6%、MATHで50.7%のスコアを得た。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:48:02 GMT)
ANNE: Adaptive Nearest Neighbors and Eigenvector-based Sample Selection for Robust Learning with Noisy Labels [7.9] 本稿では,Adaptive Nearest Neighbors and Eigenvector-based sample selection methodを紹介する。
ANNEは、損失に基づくサンプリングとFINEとAdaptive KNNを統合し、幅広いノイズレートシナリオのパフォーマンスを最適化する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:51:38 GMT)
Unlocking the Theory Behind Scaling 1-Bit Neural Networks [7.6] 1ビットのLarge Language Models (LLM)が登場し、従来のLLMに匹敵する効率とパフォーマンスの素晴らしい組み合わせを示している。
1ビットニューラルネットワークのスケーリング法則を厳格に確立した最初の理論的結果を示す。
この結果から,Int1が今後,ニューラルネットワークの精度の基準となる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:18:57 GMT)
Optical Flow Representation Alignment Mamba Diffusion Model for Medical Video Generation [7.4] 医療ビデオモデルは、医療産業に大きな影響を与えることが期待されている。
3つの要素を組み込んだ医用ビデオジェネレータ(MedSora)を提案する。
テストと応用は、MedSoraが医療ビデオの生成において優れた視覚的品質を示すことを示している。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:57:00 GMT)
BG-GAN: Generative AI Enables Representing Brain Structure-Function Connections for Alzheimer's Disease [7.4] 脳構造-機能結合を表すために,双方向グラフ生成対向ネットワーク (BG-GAN) が提案されている。
Balancerと呼ばれる新しいモジュールは、ジェネレータとディスクリミネータ間の最適化を無効にするように設計されている。
ADNIデータセットを用いた実験結果から、生成された構造接続と生成された関数接続の両方がADの識別精度を向上させることが示された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:03:25 GMT)
PutnamBench: Evaluating Neural Theorem-Provers on the Putnam Mathematical Competition [7.0] パットナムベンチ (PutnamBench) は、ウィリアム・ローウェル・パットナム数学コンペティション (William Lowell Putnam Mathematical Competition) から導かれる640の定理の、1692年の手作りの形式化からなる。
パットナムベンチは、学部数学コースで教えられる幅広いトピックにおいて、重大な問題解決能力と熟練度を必要とする。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 17:14:37 GMT)
Fi$^2$VTS: Time Series Forecasting Via Capturing Intra- and Inter-Variable Variations in the frequency domain [6.6] 時系列予測(TSF)は、電気変換、医療モニタリング、作物の生育など、様々な応用において重要な役割を果たしている。
TSFのディープラーニング手法の進歩にもかかわらず、長期連続を予測する能力は依然として制限されている。
これはtextbfintra- および textbfinter- textbfVariations をキャプチャするために textbfFrequency ドメインの観点を活用するものだ。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 04:17:58 GMT)
Fi$^2$VTS: Time Series Forecasting Via Capturing Intra- and Inter-Variable Variations in the Frequency Domain [6.6] 時系列予測(TSF)は、電気変換、医療モニタリング、作物の生育など、様々な応用において重要な役割を果たしている。
TSFのディープラーニング手法の進歩にもかかわらず、長期連続を予測する能力は依然として制限されている。
これはtextbfintra- および textbfinter- textbfVariations をキャプチャするために textbfFrequency ドメインの観点を活用するものだ。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 04:17:58 GMT)
Fi$^2$VTS: Time Series Forecasting Via Capturing Intra- and Inter-Variable Variations in the Frequency Domain [6.6] 時系列予測(TSF)は,医療モニタリングや作物の生育など,様々な分野で重要な役割を担っている。
これはtextbfintra- および textbfinter- textbfVariations をキャプチャするために textbfFrequency ドメインの観点を活用するものだ。
インセプションブロックは情報を統合するために使用され、異なる変数間の相関をキャプチャする。
バックボーンネットワークであるFi$2$VTSは、複数のFi$2$を連結することで残余アーキテクチャを採用している。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 04:17:58 GMT)
Fi$^2$VTS: Time Series Forecasting Via Capturing Intra- and Inter-Variable Variations in the Frequency Domain [6.6] 時系列予測(TSF)は,医療モニタリングや作物の生育など,様々な分野で重要な役割を担っている。
これはtextbfintra- および textbfinter- textbfVariations をキャプチャするために textbfFrequency ドメインの観点を活用するものだ。
インセプションブロックは情報を統合するために使用され、異なる変数間の相関をキャプチャする。
バックボーンネットワークであるFi$2$VTSは、複数のFi$2$を連結することで残余アーキテクチャを採用している。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 04:17:58 GMT)
Comparative Study on Semi-supervised Learning Applied for Anomaly Detection in Hydraulic Condition Monitoring System [6.5] 本研究では,油圧モニタリングシステムにおける異常検出に応用した半教師付き学習手法を系統的に比較した。
カスタマイズされた極端学習マシンをベースとした半教師付きHELMモデルは、最先端の性能(99.5%)、最低偽陽性率(0.015)、最高のF1スコア(0.985)が他の半教師付き手法を上回った。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:28:17 GMT)
MapEx: Indoor Structure Exploration with Probabilistic Information Gain from Global Map Predictions [6.4] 我々は、しばしば予測可能で繰り返しパターンから構成される、構造化された屋内環境を探索するロボットに焦点を当てる。
近年の研究では、深層学習技術を用いて地図の未知領域を予測し、これらの予測を情報ゲイン計算に利用している。
本研究では,予測地図を用いて情報ゲイン推定のための確率的センサモデルを構築する新しい探索フレームワークであるMapExを紹介する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 23:51:33 GMT)
CATS: Contextually-Aware Thresholding for Sparsity in Large Language Models [6.4] 大規模言語モデル(LLM)は、劇的に高度なAIアプリケーションを持っているが、その膨大な推論コストのため、そのデプロイメントは難しいままである。
本稿では,基本LLMの活性化と推論コストの低減を両立させる新しいフレームワーク,CATS(Contextually Aware Thresholding for Sparsity)を提案する。
提案手法は,Mistral-7BやLlama2-7Bなどの各種ベースモデルに適用可能であり,下流タスク性能において既存のスペーサー化手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:25:47 GMT)
ParseCaps: An Interpretable Parsing Capsule Network for Medical Image Diagnosis [6.3] 本稿では, スパースアキシャルアテンションルーティングと畳み込みカプセル層を利用した新しいカプセルネットワークParseCapsを紹介し, パースツリーのような構造を形成する。
CE-MRI、PH$2$、Derm7ptデータセットの実験結果から、ParseCapsは分類精度、冗長性低減、堅牢性で他のカプセルネットワークよりも優れているだけでなく、解釈可能な説明を提供する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:34:31 GMT)
Exploring the Edges of Latent State Clusters for Goal-Conditioned Reinforcement Learning [6.3] クラスタエッジ探索(CE2$)は,エージェントがアクセス可能な目標状態に優先順位を与える,新たな目標指向探索アルゴリズムである。
挑戦的なロボティクス環境では、CE2$はベースライン法やアブレーションに比べて探索の効率が優れている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:21:43 GMT)
SynCo: Synthetic Hard Negatives in Contrastive Learning for Better Unsupervised Visual Representations [6.2] 表現空間上で合成ハードネガティブを生成することによってモデル性能を向上させる新しい手法であるSynCoを導入する。
MoCoフレームワーク上に構築されたSynCoは,計算オーバーヘッドを最小限に抑えた,さまざまな合成ハードネガをオンザフライで生成するための6つの戦略を導入している。
我々の合成ハード・ネガティブ・ジェネレーション・アプローチは、自己教師付きコントラスト学習を通じて学習した視覚的表現を著しく向上させる。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 22:57:56 GMT)
Distilling Invariant Representations with Dual Augmentation [6.2] 教師モデルと学生モデルの両方において、不変な特徴学習を促進するために、二重強化戦略を導入する。
我々の手法は、蒸留中に両方のモデルに適用された異なる拡張を活用し、学生に堅牢で伝達可能な特徴をつかむよう促す。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 22:31:31 GMT)
Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignment [6.2] 知識蒸留(英: Knowledge Distillation、KD)は、暗黒の知識を教師から学生にロジットや中間的特徴を通じて伝達する。
最近の研究は、ロジットベースの手法の可能性を明らかにし、ロジットに基づく単純なKDフォームをライムライトに戻す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:42:16 GMT)
Towards Effective Planning Strategies for Dynamic Opinion Networks [6.0] 介入計画には、キーノードの特定と制御の実行が含まれる。
ネットワークサイズが大きくなると、この問題は計算的に難解になる。
正確な情報を伝達するためのキーノードを識別するためのランキングアルゴリズムを導入する。
我々は強化学習に基づく集中型動的計画フレームワークを開発する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:13:34 GMT)
Comparative Study on Supervised versus Semi-supervised Machine Learning for Anomaly Detection of In-vehicle CAN Network [6.0] 本研究では,CANメッセージ異常検出のための完全教師付き機械学習と半教師付き機械学習との比較を行った。
XGBoostベースのモデルでは、最高の精度(98.65%)、精度(0.9853)、ROC AUC(0.9585)が文献で報告されている他の手法に勝っている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:24:26 GMT)
Decision Trees for Interpretable Clusters in Mixture Models and Deep Representations [5.7] 混合モデルに対する説明可能性-雑音比の概念を導入する。
本研究では,混合モデルを入力として,データに依存しない時間に適切な木を構築するアルゴリズムを提案する。
結果の決定ツリーの誤り率について,上と下の境界を証明した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:00:20 GMT)
An Exploration of Higher Education Course Evaluation by Large Language Models [4.9] 人工知能(AI)における大規模言語モデル(LLM)は、コース評価プロセスを強化するための新しい道筋を示す。
本研究は,中国大大学の100コースにわたる厳密な実験を行い,複数の視点から自動コース評価へのLLMの適用について検討した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:43:52 GMT)
AMPCliff: quantitative definition and benchmarking of activity cliffs in antimicrobial peptides [4.8] 本研究は、カノニカルアミノ酸からなる抗微生物ペプチド(AMP)の交流現象に対する定量的な定義およびベンチマークフレームワークAMPCliffを紹介する。
AMPCliffは、MICによってAMPの活性を定量化し、0.9を、少なくとも2倍のMIC変化を持つ一対の配列ペプチド間の正常化BLOSUM62類似度スコアの最小しきい値として定義する。
解析の結果,これらのモデルがAMP ACイベントを検出できることが明らかとなり,事前学習されたタンパク質言語モデルESM2が評価において優れた性能を示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:59:50 GMT)
Personalized Path Recourse for Reinforcement Learning Agents [4.8] 目標は、エージェントの本来のパスと高い類似性を確保しながら、望ましい目標を達成するために、与えられた行動経路を編集することである。
このようなパーソナライズされたパスを生成するために、パーソナライズされたリコースエージェントを訓練する。
提案手法は強化学習と教師あり学習設定の両方に適用できる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:16:54 GMT)
Leverage Multi-source Traffic Demand Data Fusion with Transformer Model for Urban Parking Prediction [4.7] 本研究では,空間時間深層学習とマルチソースデータ融合を組み合わせた駐車予測フレームワークを提案する。
このフレームワークは、時空間深層学習モデルとしてのTransformerに基づいている。
実世界の実証データを用いて,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:55:19 GMT)
Learning World Models for Unconstrained Goal Navigation [4.5] 本研究では,世界モデル学習のための目標指向探索アルゴリズムであるMUNを紹介する。
MUNは、リプレイバッファ内の任意のサブゴール状態間の状態遷移をモデル化することができる。
その結果、MUNは世界モデルの信頼性を高め、政策の一般化能力を大幅に改善することを示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 01:35:06 GMT)
Estimating Generalization Performance Along the Trajectory of Proximal SGD in Robust Regression [4.2] 本稿では,反復アルゴリズムの軌道に沿った反復の一般化誤差を正確に追跡する推定器を提案する。
結果は、ハマー回帰(英語版)、擬ハマー回帰(英語版)、および非滑らかな正則化子を持つそれらのペナル化変種(英語版)など、いくつかの例を通して説明される。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 13:54:06 GMT)
Counterfactual explainability of black-box prediction models [4.1] ブラックボックス予測モデルに対する対実的説明可能性という新しい概念を提案する。
対物的説明可能性には3つの大きな利点がある。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:29:09 GMT)
Enhancing Glucose Level Prediction of ICU Patients through Irregular Time-Series Analysis and Integrated Representation [4.1] 我々は,次のレベルを予測するための新しい学習モデルを開発し,低血糖,高血糖,高血糖に分類した。
本研究はICU患者における血糖値の予測に焦点をあてるが、MITSTは他の重要な事象予測タスクにも容易に拡張できる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:03:11 GMT)
BF-IMNA: A Bit Fluid In-Memory Neural Architecture for Neural Network Acceleration [4.1] 本稿では,CNN(End-to-end Convolutional NN)推論のためのビット流動型IMCアクセラレータであるBF-IMNAを提案する。
BF-IMNAの中心はAssociative Processors (AP) であり、これはビットシリアルワード並列シングルインストラクション、Multiple Data (SIMD) のようなエンジンである。
本稿では,AlexNet,VGG16,ResNet50,BF-IMNAにおける画像Netのエンドツーエンド推論性能について報告する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:02:23 GMT)
Designing Robust Quantum Neural Networks: Exploring Expressibility, Entanglement, and Control Rotation Gate Selection for Enhanced Quantum Models [4.0] 本研究では,クオン進化型ニューラルネットワーク(QuNN)のロバスト性について,従来のニューラルネットワークと比較して検討した。
本研究では,表現性,絡み合い,制御された回転ゲート選択という,3つの量子回路メトリクスを利用する新しい手法を開発した。
以上の結果から,QuNNはMNISTデータセットでは最大60%,Fashion-MNISTデータセットでは40%,CNNでは最大40%の堅牢性を示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:18:07 GMT)
G-SPARC: SPectral ARchitectures tackling the Cold-start problem in Graph learning [3.9] コールドスタートノードに対処する新しいフレームワークであるG-SPARCを提案する。
グラフ表現からスペクトル表現への移行というキーアイデアを利用することで、我々のアプローチはコールドスタートノードに一般化できる。
本手法は,ノード分類,ノードクラスタリング,リンク予測など,コールドスタートノードの既存モデルよりも優れている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:39:09 GMT)
Bridging Today and the Future of Humanity: AI Safety in 2024 and Beyond [3.8] 本稿では,先進的人間社会の青写真について述べる。
あらゆる物のインターネットが現実になる未来を概説している。
この青写真に対する現在の取り組みを推し進めることで、現在の取り組みと長期的ニーズとの整合性を検討する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:17:58 GMT)
Denoising Fisher Training For Neural Implicit Samplers [3.7] 本稿では, 理論的保証のあるニューラル暗黙サンプリングのための新しい訓練手法であるDenoising Fisher Training (DFT)を紹介する。
DFTは、2次元合成分布、ベイズロジスティック回帰、高次元エネルギーベースモデル(EBM)を含む様々なサンプリングベンチマークで実証的に検証されている。
高次元EMMを用いた実験では、最高1ステップのDFTニューラルサンプリングが最大200個のサンプリングステップでMCMC法と同等の結果を得ることができ、100倍以上の効率が得られた。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:21:59 GMT)
H2G2-Net: A Hierarchical Heterogeneous Graph Generative Network Framework for Discovery of Multi-Modal Physiological Responses [3.7] 本稿では,ドメイン知識のないグラフ構造を自動的に学習する階層型ヘテロジニアスグラフ生成ネットワーク(H2G2-Net)を提案する。
提案手法をマルチモーダルな生理学的信号からなるCagPilotデータセット上で検証する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:26:07 GMT)
DPCL-Diff: The Temporal Knowledge Graph Reasoning based on Graph Node Diffusion Model with Dual-Domain Periodic Contrastive Learning [3.6] 二重領域周期性学習(DPCL-Diff)を用いたグラフノード拡散モデルを提案する。
GNDiffはノイズを疎結合なイベントに導入し、新しいイベントをシミュレートする。
DPCL-Diffは周期事象と非周期事象をポアンカー空間とユークリッド空間にマッピングし、それらの特徴を利用して類似の周期事象を効果的に区別する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:30:29 GMT)
Are LLMs good pragmatic speakers? [3.4] 大規模言語モデル(LLM)は、自然言語のプラグマティクスを含むと仮定されたデータに基づいて訓練されているが、実際にはプラグマティクス話者のように振る舞うのか?
我々は,人間のコミュニケーションにおける実践的推論をモデル化するRational Speech Act (RSA) フレームワークを用いて,この問題に答えようとしている。
LLMのスコアはRSAのスコアと何らかの正の相関があるが、現実的な話者のように振る舞うという十分な証拠はない。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:23:18 GMT)
Fractal and Turbulent Feature Extraction and NFT Label Generation for Pollock Style Migration Paintings Based on VGG19 [3.3] 本稿では, 深層学習, フラクタル解析, 乱流特徴抽出技術を融合した革新的な手法を提案する。
画像の内容とスタイルは,MindSporeディープラーニングフレームワークと事前学習されたVGG19モデルにより抽出される。
本手法は,コンテンツ損失,スタイル損失,フル分散損失を組み合わせ,高品質なPollockスタイルの画像を生成する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:35:27 GMT)
Continuous Management of Machine Learning-Based Application Behavior [3.3] 機械学習モデルの非機能特性は、監視、検証、維持されなければならない。
MLベースのアプリケーションの安定な非機能動作を保証することを目的としたマルチモデルアプローチを提案する。
非機能的プロパティフェアネスに着目した実世界のシナリオで,我々のソリューションを実験的に評価した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:22:08 GMT)
Multipartite Intrinsic Non-Locality and Device-Independent Conference Key Agreement [3.2] デバイス非依存(DI)会議鍵契約におけるマルチパートシナリオにおける資源の定量化手法として,マルチパーティ固有の非局所性を導入する。
局所演算と共通乱数性と呼ばれる自由操作のクラスにおいて,多部固有の非局所性は加法,凸,単調であることを証明する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:37:54 GMT)
Asynchronous Perception Machine For Efficient Test-Time-Training [3.2] テスト時間トレーニング(TTT)のための計算効率の良いアーキテクチャである非同期知覚機械(APM)を提案する。
APMは、任意の順序で、任意の順序で画像のパッチを一度に処理でき、ネット内のセマンティックアウェアネスをテクストゥルエンコードする。
我々は、データセット固有の事前トレーニング、拡張、あるいは任意のプレテキストタスクなしで、配信外画像を認識するAPMの能力を実証する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:44:01 GMT)
Reconstructing MODIS Normalized Difference Snow Index Product on Greenland Ice Sheet Using Spatiotemporal Extreme Gradient Boosting Model [3.1] グリーンランド氷床(GrIS)のような極域における雲の存在は、MODISデータに欠落したピクセルを大量に導入する。
そこで本研究では, 時間的極勾配(STXGTXSI)モデルを用いて, 包括的NDSIデータセットを生成する手法を提案する。
モデルは従来の機械学習モデルの性能を超え、優れたNDSI予測能力を示している。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:15:38 GMT)
Observation of freezing phenomenon in high-dimensional quantum correlation dynamics [3.1] ダイヤモンド中の1つの窒素空孔中心を用いた局所劣化雑音下での高次元QCの性能について検討した。
高次元量子不協和力学の凍結現象が観測され、不協和音は局所的減音雑音に対して頑健であることが示された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:01:10 GMT)
Poison Attacks and Adversarial Prompts Against an Informed University Virtual Assistant [3.1] 大規模言語モデル(LLM)は特に敵の攻撃に対して脆弱である。
AIベースのシステムの急速な開発ペースは、意思決定において人間を支援するジェネレーティブAI(GenAI)の可能性によって推進されている。
脅威アクターは、セキュリティギャップ、貧弱な保護、限られたデータガバナンスを使用して、システムとそのデータへの不正アクセスを許可する攻撃を実行することができる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 05:34:38 GMT)
Deep Configuration Performance Learning: A Systematic Survey and Taxonomy [3.1] 我々は6つの索引付けサービスにまたがる1,206件の検索済み論文を網羅し,ソフトウェアのパフォーマンス学習におけるディープラーニングのトピックを包括的にレビューする。
本研究は, 構成データ作成に関連する技術について, 重要な統計, 分類学, 強度, 弱点, 最適利用シナリオについて概説した。
また、調査した研究から、優れた実践と潜在的に問題となる現象を同定し、その分野における将来の機会に関する実行可能な提案と洞察を包括的にまとめる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:42:43 GMT)
Generative AI Policy and Governance Considerations for Health Security in Southeast Asia [2.7] 6億1100万人を代表とする国際機関である東南アジア諸国協会(ASEAN)の政策・ガバナンス活動に焦点をあてる。
私は、サステナビリティを政策立案者にとっての機会の領域とみなし、ジェネレーティブAI研究者が自身の仕事に最も大きな影響を与えることを推奨することで、結論付けます。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:39:42 GMT)
Building the Self-Improvement Loop: Error Detection and Correction in Goal-Oriented Semantic Communications [2.7] 意味コミュニケーション(SemCom)はシンボルよりも意味の伝達に重点を置いており、コミュニケーション効率が大幅に向上している。
これらの利点にもかかわらず、送信された意味と受信された意味の相違から生じるセマンティックエラーは、システムの信頼性に対する大きな課題である。
本稿では,SemComシステムにおけるセマンティックエラーの検出と修正のための包括的フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:29:23 GMT)
Simulation of fidelity in entanglement-based networks with repeater chains [2.6] 我々はNetSquid上にシミュレーション環境を実装し、量子リピータや量子スイッチの経路にまたがるエンドツーエンドの忠実度を推定する。
スイッチモデルには、現在他のツールで利用できないいくつかの一般化が含まれている。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 14:51:07 GMT)
Large-Scale Multi-Robot Coverage Path Planning on Grids with Path Deconfliction [2.6] マルチロボット被覆経路計画(MCPP: Multi-Robot Coverage Path Planning)を4つの隣接する2DグリッドG上で検討し、複数のロボットがGのすべてのセルをカバーする経路を計算することを目的とした。
問題を直接Gで修正し、グリッドベースのMCPPの解法を革新し、新しいNP硬度結果を確立する。
提案手法は,最大100台のロボットを最大256x256まで実行時間内にグリッド上で管理することにより,ソリューションの品質と効率を大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 22:37:56 GMT)
Are Large-scale Soft Labels Necessary for Large-scale Dataset Distillation? [2.4] ImageNet-condensationでは、補助ソフトラベルのストレージは、凝縮データセットのストレージを30倍以上上回る。
縮合されたデータセットのクラス内における高い類似性は、大規模ソフトラベルの使用を必要とすることを示す。
画像の多様性を改善する重要な利点は、単純なランダムプルーニングによってソフトラベル圧縮を実現することができることである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:39:09 GMT)
A Machine Learning based Hybrid Receiver for 5G NR PRACH [2.3] 本稿では、プリアンブル検出のためのAI/MLモデルと、タイピング前進推定のための従来のピーク検出を併用したハイブリッド受信機の設計について述べる。
その結果、シミュレーションおよび実際のハードウェアキャプチャーデータセットに対する従来の受信機と比較して、ハイブリッド受信機の性能が優れていた。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:49:12 GMT)
Exploring PCA-based feature representations of image pixels via CNN to enhance food image segmentation [2.2] 本稿では、畳み込みニューラルネットワーク(CNN)を用いて、PCAに基づく画像画素の特徴表現を探索し、セグメンテーションを強化する手法を提案する。
シルエットスコアに基づく内部クラスタリング指標を定義し,様々な画素レベルの特徴表現のクラスタリング品質を評価する。
提案手法は食材ラベル付きデータセットFoodSeg103で良好に動作し、平均mIoUスコアが0.5423である。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 07:33:41 GMT)
Integration of Large Vision Language Models for Efficient Post-disaster Damage Assessment and Reporting [2.0] DisasTellerは、ディスアスター後管理におけるタスクの自動化を目的とした、最初のマルチLVLMベースのフレームワークである。
DisasTellerは、災害対応アクティビティを自律的に実装し、人間の実行時間を短縮し、リソースの分散を最適化する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:25:55 GMT)
Lorentz-Equivariant Quantum Graph Neural Network for High-Energy Physics [1.9] 現在の量子グラフニューラルネットワーク(GNN)はノイズに対する堅牢性を欠き、しばしば固定対称群によって制約される。
本稿では,LorentzNet における Lorentz Group Equivariant Block モジュールを量子回路で置き換えることにより,性能が著しく向上することを示す。
本研究は, ノイズ耐性ジェットタグ, イベント分類, 広範囲なデータ共有型HEPタスクにおけるローレンツ・EQGNNの即時適用の可能性を明らかにするものである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:34:48 GMT)
Statistical guarantees for denoising reflected diffusion models [1.9] 近年,進化するAIの領域が急速に拡大しているため,拡散モデルの認知化が重要な研究領域となっている。
本稿では,反射拡散モデルの統計的保証について検討する。
本研究の主な貢献は, 反射拡散モデルに基づく新しいクラスを統計的に解析することと, 時間と空間の両方における精密なスコア近似法である。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:26:35 GMT)
BERTtime Stories: Investigating the Role of Synthetic Story Data in Language pre-training [1.9] TinyStories を用いた言語事前学習における合成物語データの効果について検討した。
TinyStoriesのサブセット上でGPT-Neoモデルをトレーニングします。
1億語未満の単語にアクセスしても、モデルは与えられたストーリーに対して高品質でオリジナルな補完を生成することができる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:23:12 GMT)
DualAD: Dual-Layer Planning for Reasoning in Autonomous Driving [1.8] 運転中の人間の推論を模倣する新しい自動運転フレームワークであるDualADを提案する。
DualADは、ルールベースのモーションプランナとルールベースのテキストエンコーダを備えた上位レイヤの2つのレイヤで構成されている。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 15:59:58 GMT)
Investigating Large Language Models for Complex Word Identification in Multilingual and Multidomain Setups [1.8] 複雑な単語識別(CWI)は語彙的単純化作業において必須のステップであり、最近はそれ自体がタスクとなっている。
大規模言語モデル(LLM)は最近、ゼロ/フェーショット設定で目に見えないタスクを解決できる汎用性と能力のために、自然言語処理コミュニティで人気を博した。
Llama 2, Llama 3, Vicuna v1.5などのオープンソースモデルや, CWI, LCP, MWE設定におけるChatGPT-3.5-turbo, GPT-4oなどのクローズソースなど, LLMの使用状況について検討した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 22:31:02 GMT)
Robust Neural Processes for Noisy Data [1.7] ノイズによってデータが汚染された場合の文脈内学習モデルの振る舞いについて検討する。
クリーンなデータで最高のパフォーマンスを示すモデルは、ノイズの多いデータで最高のパフォーマンスを示すモデルとは異なることが分かりました。
本稿では,NPモデルの学習方法を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:00:55 GMT)
A Coverage-Guided Testing Framework for Quantum Neural Networks [1.7] 量子ニューラルネットワーク(QNN)は、量子コンピューティングとニューラルネットワークを組み合わせて機械学習モデルを改善する。
本稿では,QNNの状態探索を体系的に評価するために,QNNを対象としたテストカバレッジ基準のセットであるQCovを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:07:27 GMT)
Mitigating Matching Biases Through Score Calibration [1.6] レコードマッチングにおけるバイアスの結果は、人口集団間での不平等なエラー率をもたらし、倫理的および法的懸念を提起する。
本稿では,従来の回帰モデルに適用された公正度指標を適用し,レコードマッチングにおけるすべてのしきい値の累積バイアスを評価する。
本稿では, 最適輸送理論とワッサーシュタインバリセンタを利用して, 階層群間でのマッチングスコアのバランスをとることを目的とした, ポストプロセッシングキャリブレーション手法を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:01:40 GMT)
LaB-GATr: geometric algebra transformers for large biomedical surface and volume meshes [1.5] 高忠実度メッシュを用いた学習のための幾何学的トークン化を備えた深層ニューラルネットワークLaB-GATrを提案する。
LaB-GATrは、心臓血管血行動態モデリングと神経発達型表現型予測の3つの課題について最先端の結果を得る。
以上の結果から,LaB-GATrは高忠実度メッシュで学習するための強力なアーキテクチャであることを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:21:04 GMT)
Performance Evaluation of Deep Learning Models for Water Quality Index Prediction: A Comparative Study of LSTM, TCN, ANN, and MLP [1.5] 水質評価による水質指標(WQI)の環境モニタリングと予測モデル
WQIは水道の品質の尺度である。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:09:53 GMT)
MSI-NeRF: Linking Omni-Depth with View Synthesis through Multi-Sphere Image aided Generalizable Neural Radiance Field [1.3] 深層学習全方位深度推定と新しいビュー合成を組み合わせたMSI-NeRFを提案する。
入力画像の特徴抽出とワープにより,コストボリュームとして多面体画像を構築する。
ネットワークには,4つの画像のみを用いて未知のシーンを効率的に再構築する一般化機能がある。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:31:10 GMT)
GramSeq-DTA: A grammar-based drug-target affinity prediction approach fusing gene expression information [1.2] 薬物や標的の構造情報と化学摂動情報を統合するGramSeq-DTAを提案する。
我々の手法は、広く使われているDTAデータセットで検証された場合、現在の最先端のDTA予測モデルよりも優れている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:17:09 GMT)
Efficient and Accurate Pneumonia Detection Using a Novel Multi-Scale Transformer Approach [1.2] 胸部X線からの肺炎検出を促進するために,ディープラーニングとトランスフォーマーに基づく注意機構を組み合わせた新しいアプローチを提案する。
本手法は,トランスUNetモデルを用いて肺のセグメンテーションから開始する。
提案手法は,Kermanyデータセットで92.79%,Cohenデータセットで95.11%の精度を達成する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 11:51:50 GMT)
Capsule Vision Challenge 2024: Multi-Class Abnormality Classification for Video Capsule Endoscopy [1.1] 本稿では,ビデオカプセル内視鏡(VCE)フレームにおける異常の分類モデルを提案する。
マイノリティクラス表現を強化するために,ロジテーションライブラリを用いた階層拡張戦略を実装した。
私たちのパイプラインはPyTorchで開発され、柔軟性のあるアーキテクチャを使って、分類の複雑さをシームレスに調整します。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:34:04 GMT)
OSAD: Open-Set Aircraft Detection in SAR Images [1.1] オープンセット検出は、クローズドセットでトレーニングされた検出器によって、すべての既知のオブジェクトを検出し、オープンセット環境で未知のオブジェクトを識別することを目的としている。
これらの課題に対処するため、SAR画像のための新しいオープンセット航空機検出器、Open-Set Aircraft Detection (OSAD) が提案されている。
グローバルコンテキストモデリング(GCM)、位置品質駆動型擬似ラベル生成(LPG)、プロトタイプコントラスト学習(PCL)の3つの専用コンポーネントを備えている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:06:14 GMT)
Loop-Residual Neural Networks for Iterative Refinement [1.1] 本稿では,モデルサイズを増大させることなく,より長い計算時間を活用することにより,より優れた性能を実現する新しいループ残差ニューラルネットワークを提案する。
提案手法では,残差接続を持つモデルのサブセットを反復的にループすることで,入力を複数回再検討する。
本稿では,GPT-2とLoop-Residualモデルを比較し,同様のパラメータ数を維持しつつ,言語モデリングタスクの性能向上を示す実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 00:36:24 GMT)
Loop-Residual Neural Networks for Iterative Refinement [1.1] 本稿では,モデルサイズを増大させることなく,より長い計算時間を活用することにより,より優れた性能を実現する新しいループ残差ニューラルネットワークを提案する。
提案手法では,残差接続を持つモデルのサブセットを反復的にループすることで,入力を複数回再検討する。
本稿では,GPT-2とLoop-Residualモデルを比較し,同様のパラメータ数を維持しつつ,言語モデリングタスクの性能向上を示す実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 00:36:24 GMT)
Automated Personnel Selection for Software Engineers Using LLM-Based Profile Evaluation [1.1] 本研究は,NLP(Advanced Natural Language Processing)技術に基づく自動スタッフ選択手法を用いて,ソフトウェアエンジニアのプロファイルを評価する。
教育、経験、スキル、自己紹介といった重要な属性を持つLinkedInプロファイルを収集して、新たなデータセットが生成される。
85%の精度と0.85のF1スコアで、RoBERTaは最高の成績を収めた。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:35:25 GMT)
Privacy-Preserving Customer Churn Prediction Model in the Context of Telecommunication Industry [1.0] クラウド環境におけるプライバシ保護型顧客チャーン予測モデルのためのフレームワークを提案する。
我々は,GAN(Generative Adversarial Networks)とアダプティブウェイト・オブ・エビデンス(Adaptive Weight-of-Evidence,aWOE)を組み合わせた新しいアプローチを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:08:59 GMT)
Leveraging Microservices Architecture for Dynamic Pricing in the Travel Industry: Algorithms, Scalability, and Impact on Revenue and Customer Satisfaction [1.0] 本研究では,旅行分野を対象としたリアルタイム動的価格体系の実装について検討する。
このシステムは、需要、競合価格、その他の外部状況などの要因をリアルタイムに解決するように設計されている。
コントロールされたシミュレーションと実生活のアプリケーションの両方で、収益生成が22%、価格応答時間が17%改善した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:24:02 GMT)
Equitable Length of Stay Prediction for Patients with Learning Disabilities and Multiple Long-term Conditions Using Machine Learning [1.0] 本研究は,学習障害患者9,618例の入院状況とウェールズの人口の長期的状況について分析した。
調査コホートでは, 人口動態, 長期経過状況, 薬剤歴, 病院訪問, 生活史について検討した。
我々は,このコホートにおける入院期間を予測するために,機械学習モデルを適用した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:14:20 GMT)
More quantum chemistry with fewer qubits [1.0] 本稿では,2次摂動理論を用いて物理問題の表現を改善する量子アルゴリズムを提案する。
特に、我々の量子アルゴリズムは、未摂動ハミルトニアンの下での一連の時間進化ステップを通じて、二階エネルギー補正を評価する。
我々の摂動理論量子アルゴリズムは対称性適応摂動理論にも適用できる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:22:29 GMT)
Ontology Population using LLMs [1.0] 知識グラフ(KG)は、データ統合、表現、可視化にますます活用されている。
LLMはそのようなタスクに有望な機能を提供し、自然言語の理解とコンテンツ生成に優れています。
本研究では、Enslaved.org Hub Ontologyに着目し、KG集団に対するLLMの有効性について検討した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:39:20 GMT)
High-performance automated abstract screening with large language model ensembles [0.9] 大規模言語モデル(LLM)は入力テキストの処理と解釈を必要とするタスクに優れる。
抽象スクリーニングは、包括的および排他的基準の繰り返し適用を含む体系的レビューの労働集約的な構成要素である。
800レコードのサブセットに対する試行では、最適なプロンプト戦略を特定し、人間の研究者にとって優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:06:14 GMT)
Physics-aware deep learning framework for the limited aperture inverse obstacle scattering problem [0.9] 本稿では,限られた開口逆障害物散乱問題に対する深層学習手法について考察する。
これは、ニューラルネットワークアーキテクチャに散乱モデルに関連する物理演算子を提供することによって達成される。
また,入力された限られた開口データに小さな雑音を加えることで,新たな正規化項を導入し,学習した逆演算子の滑らかさを効果的に向上できることを示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:42:34 GMT)
A Quantum Algorithm for Shapley Value Estimation [0.9] そこで我々は,ある信頼区間内でShapley値を抽出できる量子アルゴリズムを提案する。
投票ゲームの具体例で各アプローチの有効性を示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:11:33 GMT)
Optimizing Gastrointestinal Diagnostics: A CNN-Based Model for VCE Image Classification [0.9] MisaHub Capsule Vision Challengeは、ビデオカプセル内視鏡(VCE)画像からGI異常を自律的に分類できるベンダーに依存しない人工知能モデルの開発を促進する。
本報告では, 血管拡張症, 出血, エロージョン, 浮腫, 異物, リンパ管拡張症, ポリープ, 潰瘍, ワームなど10種類の消化管病変の多型分類に特化して設計されたCNNアーキテクチャについて述べる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:30:37 GMT)
Duality theory for Clifford tensor powers [0.8] クリフォード群の表現論は、量子情報理論においてますます顕著な役割を担っている。
本稿では、量子ビットシステムも含む双対性アプローチのための統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:04:52 GMT)
Dissipative ground state preparation in ab initio electronic structure theory [0.7] 我々はリンドブラッド力学を用いて、一般的な初期電子構造問題に対する基底状態の効率的な作成を行う。
これらの問題は、幾何学的局所性や空間的構造が欠如しているハミルトニアンにしばしば関係している。
完全イニシアチブハミルトニアンに対するリンドブラッド力学をシミュレートするためにモンテカルロ軌道に基づくアルゴリズムを用いる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 07:35:46 GMT)
ArEEG_Chars: Dataset for Envisioned Speech Recognition using EEG for Arabic Characters [0.7] 現在、アラビア文字のEEG信号のためのEEGデータセットは公開されていない。
ArEEG_Charsは、30人の参加者から収集されたアラビア語31文字のための新しいEEGデータセットである。
本研究で収集した脳波信号の総計は39857である。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 05:00:52 GMT)
DAG: Dictionary-Augmented Generation for Disambiguation of Sentences in Endangered Uralic Languages using ChatGPT [0.6] 2つの絶滅危惧言語における補題を曖昧にするためにChatGPTを使用できることを示す。
我々は、候補の補題の辞書翻訳を多数言語に提供することで、私たちのプロンプトを強化する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:25:39 GMT)
A New Logic For Pediatric Brain Tumor Segmentation [0.6] 深層学習アーキテクチャを用いた小児脳腫瘍の分節化のための新しいアプローチを提案する。
PED BraTS 2024テストセットに4つの異なる腫瘍ラベルを基準としてベンチマークを行った。
我々は、最先端(SOTA)モデルに対して、我々のモデルの性能を評価する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:52:14 GMT)
SinaTools: Open Source Toolkit for Arabic Natural Language Processing [0.5] 我々は、アラビア語の自然言語処理と理解のためのオープンソースのPythonパッケージであるSinaToolsを紹介した。
本稿では,SinaToolsとそのベンチマーク結果について述べる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:03:52 GMT)
Energy-Aware FPGA Implementation of Spiking Neural Network with LIF Neurons [0.5] スパイキングニューラルネットワーク(SNN)は、TinyMLの最先端ソリューションとして際立っている。
本稿では,第1次Leaky Integrate-and-Fire(LIF)ニューロンモデルに基づく新しいSNNアーキテクチャを提案する。
ハードウェアフレンドリーなLIF設計も提案され、Xilinx Artix-7 FPGA上で実装されている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:42:10 GMT)
Global Optimisation of Black-Box Functions with Generative Models in the Wasserstein Space [0.3] ブラックボックスシミュレータの最適化はシミュレータや高次元では困難である。
我々は、パラメータ空間全体のブラックボックス応答をモデル化するために、深い生成的サロゲートアプローチを用いる。
次に、この知識を活用して、ワッサーシュタイン距離に基づいて提案された不確実性を推定する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 13:37:04 GMT)
Guiding Genetic Programming with Graph Neural Networks [0.2] 本稿では,記号回帰問題から付加的な知識を引き出すためにグラフニューラルネットワークを用いたEvoNUDGEを提案する。
多数の問題インスタンスに対する広範な実験では、EvoNUDGEは複数のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 20:43:31 GMT)
Diversity Progress for Goal Selection in Discriminability-Motivated RL [0.2] 目的条件付きRL「ダイバーシティ・プログレス」におけるゴール選択ポリシーの学習方法を提案する。
学習者は、目標セットに対する識別可能性の観察的改善に基づくカリキュラムを構成する。
DPをモチベーションとしたエージェントが,従来のアプローチよりも早く,識別可能なスキルのセットを学習できることを実証的に実証した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:47:39 GMT)
Token Composition: A Graph Based on EVM Logs [0.0] ブロックチェーン上でトークン構成を実証分析する。
他のトークンによるトークンのトークン化を表すグラフを導入します。
グラフの性質、例えば連結成分と巡回構造をトークン化過程に関連付ける。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 21:37:54 GMT)
VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation [0.0] 高速ビデオ(HSV)セグメンテーションは、沸騰熱伝達などの科学・産業応用における動的物理過程の解析に不可欠である。
位相検出のための多様なHSVデータセットを微調整したSegment Anything Model (SAM) の特殊適応であるVideoSAMを提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:18:27 GMT)
Undermining Image and Text Classification Algorithms Using Adversarial Attacks [0.0] 本研究は,各種機械学習モデルを訓練し,GANとSMOTEを用いてテキスト分類モデルへの攻撃を目的とした追加データポイントを生成することにより,そのギャップを解消する。
実験の結果,分類モデルの重大な脆弱性が明らかとなった。特に,攻撃後の最上位のテキスト分類モデルの精度が20%低下し,顔認識精度が30%低下した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:44:28 GMT)
Symmetry-Resolved Relative Entropy of Random States [0.0] ウィッシュアートアンサンブルから引き出された対称ランダム状態の相対エントロピーを計算する。
その結果,ランダムな純粋状態の対称性を解いた相対エントロピーは普遍的な統計的挙動を示すことがわかった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:16:24 GMT)
Super-Resolution without High-Resolution Labels for Black Hole Simulations [0.0] ブラックホールシミュレーションは、宇宙で最も暴力的な出来事の理解を深める鍵となります。
ブラックホールシミュレーションの生成は、計算コストとスケーラビリティの問題によって制限される。
本稿では,高解像度ラベルを直接必要とせず,超高解像度技術を適用することによって,これらの制限を回避する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:12:41 GMT)
Stress Predictions in Polycrystal Plasticity using Graph Neural Networks with Subgraph Training [0.0] 金属の多結晶塑性は非線形挙動とひずみ硬化により特徴づけられ、数値モデルが計算集約化される。
有限要素法(FEM)シミュレーションの複雑なジオメトリを用いて多結晶塑性を代理するグラフニューラルネットワーク(GNN)を用いる。
FEMメッシュグラフから生成されたサブグラフに基づいてGNNを訓練する。
トレーニングされたGNNを周期性多結晶体に適用し,結晶塑性理論に基づく応力-ひずみマップを学習する。
提案したGNN塑性モデルは、ランダムに選択された試験多結晶上でのベンチマークFEM法と比較して150倍以上の速度で加速する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 23:34:38 GMT)
Spin migration in density functional theory: energy, potential and density perspectives [0.0] 我々は、異なる原子系において、エネルギー、コーン・シャム軌道、KSポテンシャル、電子密度の挙動を分数スピンに関して研究する。
本結果は,既存近似の質を新たな視点から評価する上で有効である。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:49:35 GMT)
Self-Normalizing Foundation Model for Enhanced Multi-Omics Data Analysis in Oncology [0.0] SeNMoは、33のがんタイプにわたるマルチオミクスデータに基づいてトレーニングされた基礎モデルである。
当科では,33のがん部位を含む膵癌マルチオミクスデータを用いて,SeNMoの全身生存を訓練した。
SeNMoはMoffitt Cancer CenterとCPTAC肺扁平上皮癌という2つの独立したコホートで検証された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 17:07:58 GMT)
SISMIK for brain MRI: Deep-learning-based motion estimation and model-based motion correction in k-space [0.0] 本研究では,脳の2次元スピンエコースキャンにおける動き推定と補正の振り返り手法を提案する。
この手法は、深いニューラルネットワークのパワーを利用してk空間の運動パラメータを推定する。
モデルに基づくアプローチを用いて、劣化した画像を復元し、「幻覚」を避ける。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 16:09:04 GMT)
Rapidly mixing loop representation quantum Monte Carlo for Heisenberg models on star-like bipartite graphs [0.0] バイパルタイト相互作用グラフを持つハイゼンベルク反強磁性体(AFM)は、計算量子モンテカルロ研究の一般的なターゲットである。
直列展開QMC法の基底状態変種を導入し、相互作用グラフ上のAFMの特別なクラスに$O(1)$-bipartite成分(スターライクな)を導入する。
我々は、Jerrumとシンクレアの正準経路法を用いて、関連するQMCマルコフ鎖(キュービット数の多項式時間)の高速混合を証明した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 06:19:42 GMT)
Quantum Probability Geometrically Realized in Projective Space [0.0] 本稿では、与えられた量子系の複素ヒルベルト空間に関連する射影空間に全ての量子確率公式を渡すことを目的とする。
アップショットは、量子論は射影部分空間の確率論であり、または同等に、量子事象の確率論であるということである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 00:01:39 GMT)
Pulsation of quantum walk on Johnson graph [0.0] 我々はパルスと呼ばれるグラフ上の離散時間量子ウォーク現象を提案する。
脈動は、状態が一様重ね合わせの初期状態と周期的に$G_1$と$G_2$の間を転送することを意味する。
この証明は有限次元ベクトル空間における加藤の理論に基づいている。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 07:32:19 GMT)
Nash equilibria in four-strategy quantum game extensions of the Prisoner's Dilemma [0.0] 本稿では,囚人のジレンマに対する量子的アプローチのための純粋戦略におけるナッシュ均衡について検討する。
各クラスについて、可能なすべてのナッシュ均衡を特定し、分析する。
その結果、量子環境における戦略行動の複雑さと多様性が明らかになった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 23:09:36 GMT)
Mapping Global Floods with 10 Years of Satellite Radar Data [0.0] 本研究では,Sentinel-1 Synthetic Aperture Radar (SAR)衛星画像の雲透過性を利用した新しい深層学習洪水検出モデルを提案する。
我々は、クラウドカバレッジの影響を受けない予測を備えた、ユニークな、縦断的なグローバルな洪水範囲データセットを作成します。
我々は,エチオピアの歴史的洪水発生地域を特定し,2024年5月のケニアの洪水時のリアルタイム災害対応能力を示す。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:44:32 GMT)
MamT$^4$: Multi-view Attention Networks for Mammography Cancer Classification [0.0] この研究は、ベトナムのデジタルマンモグラフィーの独立したテストデータセットにおいて、最初のROC-AUCの84.0$pm$1.7とF1の56.0$pm$1.3を達成した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:49:52 GMT)
Machine-Learning Analysis of Radiative Decays to Dark Matter at the LHC [0.0] 高輝度大型ハドロン衝突型加速器(HL-LHC)の主目的の一つは、弱い相互作用を持つ物質粒子(WIMP)の探索である。
この研究では、機械学習(ML)技術を用いて、超対称フレームワークにおけるWIMP放射崩壊をダークマター(DM)候補に探索する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 15:29:36 GMT)
Local Quantum Search Algorithm for Random $k$-SAT with $Ω(n^{1+ε})$ Clauses [0.0] 平均ケース複雑性理論に基づいて,$m=Omega(n2+delta+epsilon)$のとき,max-k-SSAT が平均計算アルゴリズムであることを示す。
また、平均ケース複雑性理論に基づいて$m=Omega(n2+delta+epsilon)$のとき、max-k-SSATが平均であることが証明される。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:00:18 GMT)
LLMs and the Madness of Crowds [0.0] 本研究では,大規模言語モデル(LLM)が生成する誤答のパターンを,評価中に解析する。
その結果, 誤応答はランダムに分布せず, モデル間で系統的に相関していることがわかった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 12:03:12 GMT)
Hierarchical Sentiment Analysis Framework for Hate Speech Detection: Implementing Binary and Multiclass Classification Strategy [0.0] 本稿では,英語におけるヘイトスピーチを検出するために,共有感情表現と統合された新しいマルチタスクモデルを提案する。
我々は、感情分析とトランスフォーマーに基づく訓練モデルを利用することで、複数のデータセット間でのヘイトスピーチの検出を大幅に改善できると結論付けた。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 04:11:33 GMT)
Flatband makes the wave go round [0.0] 我々は、フラットバンドのハイゼンベルク量子スピン系において、絶え間なく進化する孤立波が出現することを示す。
この現象は、ハバード系と同様に、1次元、2次元、3次元の様々なフラストレーションされたスピン系に対して比較的一般的なものである。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 13:12:00 GMT)
FaceDig: Automated tool for placing landmarks on facial portraits for geometric morphometrics users [0.0] FaceDigはAIを利用したツールで、人間のレベルの精度でランドマークの配置を自動化する。
これは、最大かつ最も民族的に多様な顔データセットの1つを用いて訓練された。
以上の結果から,FaceDigは専門家が手作業で配置したものに匹敵する,信頼性の高いランドマーク座標を提供することが示された。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 10:03:52 GMT)
Enhancing LLM Evaluations: The Garbling Trick [0.0] 大規模言語モデル(LLM)はますます強力になり、パフォーマンスに基づいたモデルの区別が困難になる。
本稿では,既存のLCM評価を,段階的に困難なタスクに変換する一般的な手法を提案する。
結果から,これらのモデルの比較推論能力,特に OpenAI の o1-preview と Google の gemini-pro-1.5 の区別が明らかになった。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 11:39:50 GMT)
Efficient Medical Image Retrieval Using DenseNet and FAISS for BIRADS Classification [0.0] 本稿では,DenseNetとFAISSを用いた医用画像検索手法を提案する。
DenseNetは複雑な医療画像の特徴抽出に適している。
FAISSは大規模データセットにおける高次元データの効率的な処理を可能にする。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 08:14:31 GMT)
Educational Effects in Mathematics: Conditional Average Treatment Effect depending on the Number of Treatments [0.0] 本研究では,高学院大学学術支援センターの教育効果について検討した。
T-learnerを用いて,センターの対面支援プログラムの条件平均治療効果(CATE)を評価した。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 09:39:55 GMT)
DuoGNN: Topology-aware Graph Neural Network with Homophily and Heterophily Interaction-Decoupling [0.0] グラフニューラルネットワーク(GNN)は、自動疾患診断など、様々な医療画像の応用に有効であることが証明されている。
それらは本質的に2つの基本的な制限に悩まされる: まず、不明瞭なノードの埋め込みは、ヘテロ親和性ノードの集約に起因する。
我々は、トポロジを利用してホモ親和性およびヘテロ親和性のあるエッジを分離するスケーラブルで一般化可能なアーキテクチャであるDuoGNNを提案する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 09:23:33 GMT)
DuoGNN: Topology-aware Graph Neural Network with Homophily and Heterophily Interaction-Decoupling [0.0] グラフニューラルネットワーク(GNN)は、自動疾患診断など、様々な医療画像の応用に有効であることが証明されている。
それらは本質的に2つの基本的な制限に悩まされる: まず、不明瞭なノードの埋め込みは、ヘテロ親和性ノードの集約に起因する。
我々は、トポロジを利用してホモ親和性およびヘテロ親和性のあるエッジを分離するスケーラブルで一般化可能なアーキテクチャであるDuoGNNを提案する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 09:23:33 GMT)
Dimension Independent and Computationally Efficient Shadow Tomography [0.0] シャドウトモグラフィーアルゴリズムは$n=Theta(sqrtmlog m/epsilon2)$サンプルを使用し、$m$の測定と追加エラー$epsilon$について説明する。
これは、ナイーブなアプローチを改善する、これまで知られていたすべてのアルゴリズムとは対照的である。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 03:07:35 GMT)
Diagnosing Medical Datasets with Training Dynamics [0.0] 本研究は,人間のアノテーションの代替としてトレーニング力学を用いる可能性について検討する。
このフレームワークは、データポイントを、簡単に学習できる、学習しにくい、あいまいなカテゴリに分類する。
データマップフレームワークの医療領域への実現可能性と移行性を評価するため,包括的評価を行った。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 18:37:35 GMT)
Decomposable dynamics on matrix algebras [0.0] D-divisible dynamical map のジェネレータを乗算する時間依存係数の正の値に分解可能ディバイザビリティをエンコードする。
これは、マルコフ半群生成器を乗算するデコヒーレンス率の正の値と同値であるCP-可除性(CP-可除性)に類似する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 23:30:36 GMT)
Controlled Gates in the Clifford Hierarchy [0.0] クビットクリフォード階層における任意の制御ゲートによって満たされなければならない条件の集合を証明する。
我々は証明をある種のユニタリの直和からなるゲートに拡張する。
論文参考訳(メタデータ) (Sun, 3 Nov 2024 02:34:18 GMT)
Collective Dissipation of Oscillator Dipoles Strongly Coupled to 1-D Electromagnetic Reservoirs [0.0] 1次元電磁貯留層に結合した高調波発振器としてモデル化されたダイポールの集合散逸ダイナミクスについて検討した。
弱いカップリングにおいては、マルコフ的リンドブラッドマスター方程式から期待されるダイナミクスの回復とは別に、空間的に分離された2レベルエミッタに対する非マルコフ的効果も得られる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 19:22:58 GMT)
Co-data Learning for Bayesian Additive Regression Trees [0.0] 本稿では,コデータから木間関係の予測モデルを構築することを提案する。
提案手法は複数のデータ型を同時に扱うことができる。
Co-dataは、大きなB細胞リンパ腫の予後を拡散させる用途における予測を強化する。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 14:03:49 GMT)
Chronic Obstructive Pulmonary Disease Prediction Using Deep Convolutional Network [0.0] 提案された研究は、Convolutional Brain Organizationに基づくディープラーニングのアイデアを使用して、臨床専門家を支援することを望んでいる。
We used MFCC, Mel-Spectrogram, Chroma, Chroma (Steady Q), and Chroma CENS from the Librosa AI library in the test。
新しいシステムは、感染の深刻さ、軽度、中等度、あるいは重症度も調べることもできる。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 05:01:49 GMT)
Born's rule from epistemic assumptions [0.0] ボルンの法則は、量子力学的振幅から確率を計算するためのレシピである。
ボルンの法則は、第一原理から一般的に受け入れられるものではない。
論文参考訳(メタデータ) (Sun, 03 Nov 2024 02:13:55 GMT)