Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model [133.0] 我々は、30Bationalパラメータと最大204フレームの動画を生成する機能を備えた、テキストからビデオまでの事前トレーニングモデルであるStep-Video-T2Vを提案する。
Vari Autoencoder (Vari Autoencoder, Video-VAE) はビデオ生成タスク用に設計されており、16x16空間圧縮比と8x時間圧縮比を達成している。
Step-Video-T2Vのパフォーマンスは、新しいビデオ生成ベンチマークであるStep-Video-T2V-Evalで評価され、最先端のテキスト・ビデオの品質を示している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:58:10 GMT)
Organize the Web: Constructing Domains Enhances Pre-Training Data Curation [129.3] トピックとフォーマットの両面からWebページを整理するフレームワークを開発する。
我々は,大規模な言語モデルからアノテーションを抽出して,事前学習データを自動的にアノテートし,効率的なキュレーションを行う。
我々の研究は、ドメインの構築と混合が、品質ベースのデータキュレーション手法の貴重な補完となることを実証している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:02:37 GMT)
A Survey of Safety on Large Vision-Language Models: Attacks, Defenses and Evaluations [127.5] この調査はLVLMの安全性を包括的に分析し、攻撃、防御、評価方法などの重要な側面をカバーする。
我々はこれらの相互関連コンポーネントを統合する統一フレームワークを導入し、LVLMの脆弱性を概観する。
我々は,最新のLVLMであるDeepseek Janus-Pro上で一連の安全性評価を行い,その結果を理論的に分析する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:42:43 GMT)
When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding [118.7] CMVC(Cross-Modality Video Coding)は、ビデオ符号化における多モード表現とビデオ生成モデルを探索する先駆的な手法である。
復号化の際には、以前に符号化されたコンポーネントとビデオ生成モデルを利用して複数の復号モードを生成する。
TT2Vは効果的な意味再構成を実現し,IT2Vは競争力のある知覚整合性を示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:33:21 GMT)
Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.2] 深部異方性回帰における自己教師付き共分散推定について検討する。
正規分布の間の2-ワッサーシュタイン距離の上界を導出する。
幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:37:11 GMT)
Preference Optimization for Reasoning with Pseudo Feedback [100.6] 提案手法では,解のラベル付けを関連するテストケースに対する評価として行うことで,推論タスクに対する疑似フィードバックを生成する手法を提案する。
本研究では,擬似フィードバックを優先最適化に用いる数学的推論と符号化の両タスクについて実験を行い,両タスク間の改善を観察する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:32:11 GMT)
Realistic Evaluation of Deep Partial-Label Learning Algorithms [94.8] 部分ラベル学習(Partial-label Learning, PLL)は、各サンプルが複数の候補ラベルに関連付けられている弱い教師付き学習問題である。
近年,モデル性能向上のために多くのディープアルゴリズムが開発されている。
初期のアルゴリズムは、しばしば過小評価され、複雑な設計で多くの後のアルゴリズムより優れている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:22:16 GMT)
Granite Vision: a lightweight, open-source multimodal model for enterprise Intelligence [88.7] 視覚機能を備えた軽量な大規模言語モデルであるGranite Visionを紹介した。
我々のモデルは、包括的な命令追従データセットに基づいて訓練されている。
Granite Visionは、ビジュアル文書理解に関連する標準ベンチマークで強力な結果を得る。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:36:32 GMT)
Anti-Forgetting Adaptation for Unsupervised Person Re-identification [87.0] デュアルレベル・ジョイント・アダプテーションとアンチフォゲッティング・フレームワークを提案する。
ソースドメインと各適用対象ドメインを忘れることなく、モデルを新しいドメインに漸進的に適応させる。
提案手法は、教師なしのReIDモデルのアンチフォッゲッティング、一般化、後方互換性能力を大幅に改善する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:08:20 GMT)
MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs [81.0] MathGAPは、それらの算術的証明構造に関する仕様に従って、問題文と連鎖推論トレースを生成する。
MathGAP を用いて, LLM はより深く, より広くなるにつれて, 性能が著しく低下することがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:15:01 GMT)
Large Language Diffusion Models [77.0] 自己回帰モデル(ARM)は、大規模言語モデル(LLM)の基盤として広く見なされている。
我々は,事前学習および教師付き微調整パラダイムの下で,ゼロから学習した拡散モデルであるLLaDAを紹介する。
本研究は,ARMの代替として,拡散モデルを構築した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:23:51 GMT)
Simplifying DINO via Coding Rate Regularization [74.9] DINOとDINOv2は、大規模にラベル付けされていない画像データから表現を学ぶために広く使われている2つのモデルファミリーである。
この研究は、設計原則をシンプルにすることで、ディープラーニングの実証的な実践を改善する可能性を強調します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:58:04 GMT)
Text-guided Sparse Voxel Pruning for Efficient 3D Visual Grounding [74.0] 視覚的グラウンド化のための効率的なマルチレベル畳み込みアーキテクチャを提案する。
提案手法はトップ推論速度を達成し,従来の最速の手法を100% FPS で上回っている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:59:59 GMT)
Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving [72.9] 本稿では,オープンソースの大規模言語モデル(LLM)であるGoedel-Proverを紹介する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:40:12 GMT)
Learning to Predict Global Atrial Fibrillation Dynamics from Sparse Measurements [71.5] FibMapは、スパース測定からグローバルAFダイナミクスを再構築するグラフリカレントニューラルネットワークモデルである。
51の非接触全アリア記録に基づいてトレーニングされ、検証され、フィブマップは10%の表面カバレッジから全アリアダイナミクスを再構築した。
実世界の接触マッピング記録にFibMapの臨床的有用性を示し,非接触マッピングに匹敵する再現性を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:14:14 GMT)
LaRA: Benchmarking Retrieval-Augmented Generation and Long-Context LLMs - No Silver Bullet for LC or RAG Routing [70.4] 本稿では,RAGとLC LLMを厳格に比較するための新しいベンチマークであるLaRAを提案する。
LaRAは4つのQAタスクカテゴリと3種類の自然発生長文を対象とした2,326のテストケースを含んでいる。
RAGとLCの最適選択は,モデルのパラメータサイズ,長文機能,コンテキスト長,タスクタイプ,取得したチャンクの特性など,複雑な相互作用に依存する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:04:22 GMT)
Low Tensor-Rank Adaptation of Kolmogorov--Arnold Networks [70.1] コルモゴロフ-アルノルドネットワーク(KAN)は、様々な領域における多層知覚(MLP)の代替としての可能性を示した。
微調整カンのためのローテンソルランク適応(LoTRA)を開発した。
微調整カンによる様々な偏微分方程式(PDE)を効率的に解くためのLoTRAの適用について検討する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:43:07 GMT)
Performative Prediction on Games and Mechanism Design [69.8] エージェントが過去の正確性に基づいて予測を信頼するかを判断する集団リスクジレンマについて検討する。
予測が集合的な結果を形成するにつれて、社会福祉は関心の指標として自然に現れる。
よりよいトレードオフを実現し、それらをメカニズム設計に使用する方法を示します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:48:10 GMT)
HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation [68.4] HealthGPTは医療用大規模視線モデル(Med-LVLM)である
医療的な視覚的理解と生成能力を統合された自己回帰パラダイムに統合する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:42:36 GMT)
Dream to Drive: Model-Based Vehicle Control Using Analytic World Models [67.2] 我々は次の状態予測器、最適プランナー、最適逆状態の学習を可能にする3つの新しいタスク設定を提案する。
現在の動作に関して次のシミュレータ状態の勾配を必要とする分析ポリシ(APG)とは異なり、提案したセットアップは、現在の状態に関して次の状態の勾配に依存する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:46:49 GMT)
AI-in-the-Loop Sensing and Communication Joint Design for Edge Intelligence [65.3] 本稿では,AI-in-the-loopジョイントセンシングと通信によるエッジインテリジェンス向上のためのフレームワークを提案する。
私たちの研究の重要な貢献は、バリデーション損失とシステムのチューニング可能なパラメータとの間に明確な関係を確立することです。
提案手法は, 通信エネルギー消費を最大77%削減し, 試料数で測定した検知コストを最大52%削減する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:56:58 GMT)
DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders [63.7] リニアリカレントニューラルネットワーク(線形RNN)は、シーケンスモデリングのためのトランスフォーマーの競合代替手段として登場した。
既存のアーキテクチャは、表現性と効率の基本的なトレードオフに直面しており、状態遷移行列の構造によって規定されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:59:05 GMT)
DimOL: Dimensional Awareness as A New 'Dimension' in Operator Learning [63.6] 本稿では,DimOL(Dimension-aware Operator Learning)を紹介し,次元解析から洞察を得る。
DimOLを実装するために,FNOおよびTransformerベースのPDEソルバにシームレスに統合可能なProdLayerを提案する。
経験的に、DimOLモデルはPDEデータセット内で最大48%のパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:27:05 GMT)
Verbalized Machine Learning: Revisiting Machine Learning with Language Models [63.1] 言語化機械学習(VML)の枠組みを紹介する。
VMLはパラメータ空間を人間の解釈可能な自然言語に制限する。
我々は,VMLの有効性を実証的に検証し,VMLがより強力な解釈可能性を実現するためのステップストーンとして機能することを期待する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:51:46 GMT)
Strada-LLM: Graph LLM for traffic prediction [62.2] 交通予測における大きな課題は、非常に異なる交通条件によって引き起こされる多様なデータ分散を扱うことである。
近位交通情報を考慮した交通予測のためのグラフ対応LLMを提案する。
我々は、新しいデータ分散に直面する際に、ドメイン適応を効率的にするための軽量なアプローチを採用する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:09:49 GMT)
Video2Policy: Scaling up Manipulation Tasks in Simulation through Internet Videos [61.9] 我々は,インターネット上のRGBビデオを利用して日常の人間行動に基づいてタスクを再構築する新しいフレームワークであるVideo2Policyを紹介した。
本手法は投球のような複雑で困難なタスクを含む,そのようなタスクに対するRLポリシーのトレーニングに成功している。
生成したシミュレーションデータは,一般的なポリシをトレーニングするためにスケールアップ可能であり,Real2Sim2Real方式で実ロボットに転送可能であることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:22:03 GMT)
A Multiagent Path Search Algorithm for Large-Scale Coalition Structure Generation [61.1] 結合構造生成はマルチエージェントシステムにおける基本的な計算問題である。
我々はCSGの多エージェントパス探索アルゴリズムであるSALDAEを開発し、連立構造グラフ上で運用する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:21:27 GMT)
Do We Need to Verify Step by Step? Rethinking Process Supervision from a Theoretical Perspective [59.6] 標準的なデータカバレッジの仮定では、強化学習はプロセスの監督よりも統計的に難しいものではない。
任意のポリシーの利点関数が最適なプロセス報酬モデルとして機能することを証明する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:21:56 GMT)
MM-RLHF: The Next Step Forward in Multimodal LLM Alignment [59.5] MM-RLHF, $mathbf120k$ fine-fine, human-annotated preference comparison pairsを含むデータセットを紹介する。
本稿では,報酬モデルの品質向上とアライメントアルゴリズムの効率向上のために,いくつかの重要なイノベーションを提案する。
我々のアプローチは、$mathbf10$の異なる次元と$mathbf27$のベンチマークで厳格に評価されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:59:51 GMT)
Generating on Generated: An Approach Towards Self-Evolving Diffusion Models [58.1] 再帰的自己改善(Recursive Self-Improvement、RSI)は、インテリジェンスシステムがその能力を自律的に改善することを可能にする。
本稿では、テキスト・画像拡散モデルにおけるRSIの適用について検討し、合成データによるトレーニング崩壊の課題に対処する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:41:47 GMT)
Dynamic Scene Understanding through Object-Centric Voxelization and Neural Rendering [57.9] オブジェクト中心学習が可能な動的シーンのための3次元生成モデルDynaVol-Sを提案する。
ボキセル化は、個々の空間的位置において、物体ごとの占有確率を推定する。
提案手法は2次元セマンティックな特徴を統合して3次元セマンティック・グリッドを作成し,複数の不整合ボクセル・グリッドを通してシーンを表現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:44:24 GMT)
AgentStudio: A Toolkit for Building General Virtual Agents [57.0] 一般的な仮想エージェントは、マルチモーダルな観察、複雑なアクション空間のマスター、動的でオープンなドメイン環境における自己改善を扱う必要がある。
AgentStudioは、非常に汎用的な観察とアクション空間を備えた軽量でインタラクティブな環境を提供する。
オンラインベンチマークタスクの作成、GUI要素の注釈付け、ビデオ内のアクションのラベル付けといったツールを統合する。
環境とツールに基づいて、GUIインタラクションと関数呼び出しの両方を効率的な自動評価でベンチマークするオンラインタスクスイートをキュレートします。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:13:39 GMT)
A Survey on Personalized Content Synthesis with Diffusion Models [57.0] PCSは、特定のユーザ定義のプロンプトに対する関心の主題をカスタマイズすることを目的としている。
過去2年間で150以上の方法が提案されている。
本稿では,PCSの拡散モデルに着目した包括的調査を行う。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:16:50 GMT)
COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping [56.9] 集積ロボットグルーピングは、表面衝突などの環境制約により、所望のグルーピングポーズが運動的に不可能な場所である。
従来のロボット操作アプローチは、人間が一般的に使用する非包括的または双対的戦略の複雑さに苦しむ。
本稿では,2つの協調ポリシーを活用する学習ベースアプローチであるCOMBO-Grasp(Constraint-based Manipulation for Bimanual Occluded Grasping)を紹介する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:15:42 GMT)
Compression-Aware One-Step Diffusion Model for JPEG Artifact Removal [56.3] CODiffはJPEGアーティファクト削除のための圧縮対応ワンステップ拡散モデルである。
明示的な学習と暗黙的な学習を組み合わせた二重学習戦略を提案する。
その結果,CODiffは定量的および視覚的品質指標の両方において,最近の先行手法を超越していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:46:27 GMT)
Has My System Prompt Been Used? Large Language Model Prompt Membership Inference [56.2] Prompt Detectiveは,システムプロンプトがサードパーティの言語モデルによって使用されているかどうかを確実に判断する統計手法である。
我々の研究は、システムの小さな変更でさえ、異なる応答分布に現れ、統計的に意味のある迅速な使用を検証できることを明らかにした。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:00:42 GMT)
A Taxonomy of Linguistic Expressions That Contribute To Anthropomorphism of Language Technologies [56.0] 擬人化とは、非人間的な対象や実体に対する人間のような性質の帰属である。
人為的同型の影響を生産的に議論するためには、言語が成型できる様々な方法の共通語彙が必要である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:43:46 GMT)
Graph Foundation Models for Recommendation: A Comprehensive Survey [55.7] 大規模言語モデル(LLM)は自然言語を処理し、理解するために設計されており、どちらも非常に効果的で広く採用されている。
最近の研究はグラフ基礎モデル(GFM)に焦点を当てている。
GFM は GNN と LLM の強みを統合し,複雑な RS 問題をより効率的にモデル化する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:25:51 GMT)
Beyond Sample-Level Feedback: Using Reference-Level Feedback to Guide Data Synthesis [55.7] LLMは、主に高品質なデータセットの命令チューニングのために、自然言語命令に従う際、顕著な能力を示す。
最近のアプローチでは、データ品質を改善するためにフィードバックが組み込まれているが、典型的にはサンプルレベルで運用され、個々のレスポンスに対してフィードバックを生成し、適用している。
本稿では,厳密にキュレートされたシードデータから,高品質な参照サンプルに基づいてフィードバックを収集する新しい手法であるReference-Level Feedbackを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:00:12 GMT)
OWLS: Scaling Laws for Multilingual Speech Recognition and Translation Models [55.6] 本稿では,多言語音声認識および翻訳モデルのオープンアクセススイートであるOWLSを紹介する。
OWLSを使用してニューラルスケーリング法則を導出し、スケーリング時に最終的なパフォーマンスが確実に予測できることを示す。
大規模音声モデルにおける創発的能力の発見により,OWLSを新たな研究方向の電力源として活用する方法を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:51:40 GMT)
Ten Challenging Problems in Federated Foundation Models [55.3] フェデレーション・ファンデーション・モデル(Federated Foundation Models、FedFM)は、フェデレーション・モデルの一般的な能力とフェデレーション・ラーニングのプライバシー保護能力を融合させる分散学習パラダイムである。
本稿では,FedFMに固有の10の課題について,基礎理論,プライベートデータの利用,継続学習,非学習,非IIDおよびグラフデータ,双方向知識伝達,インセンティブ機構設計,ゲーム機構設計,モデル透かし,効率を包括的に要約する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:01:15 GMT)
KKA: Improving Vision Anomaly Detection through Anomaly-related Knowledge from Large Language Models [54.6] Key Knowledge Augmentation (KKA)は,大規模言語モデル(LLM)から異常関連知識を抽出する手法である。
KKAは、生成した異常を、通常のサンプルと類似性に応じて、容易な異常と硬い異常と分類する。
実験の結果,提案手法は様々な視覚異常検出器の性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:46:49 GMT)
Exploit Gradient Skewness to Circumvent Byzantine Defenses for Federated Learning [54.4] フェデレート・ラーニング(FL)はビザンツの攻撃に対する脆弱性で有名だ。
現在のビザンティンの防衛線は共通の帰納バイアスを共有しており、全ての勾配の中で、密集した防御線は正直である可能性が高い。
不均一なデータにより、高密度に分布する直交勾配群が最適勾配から遠ざかっていることが判明した。
我々はSTRIKEと呼ばれる新しいスキュー・アウェア・アタックを提案し、まず、スキュー・グラデーションを探索し、次に、スキュー・グラデーション内にビザンチン・グラデーションを構築する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:36:02 GMT)
HAMSTER: Hierarchical Action Models For Open-World Robot Manipulation [54.0] 階層型視覚-言語-アクションモデルは、標準的なモノリシックVLAモデルよりも、ドメイン外のデータを利用するのに効果的であることを示す。
階層設計により、高レベルなVLMは、オフドメイン微調整データと実ロボットテストシナリオの間の重要なドメインギャップをまたいで転送可能であることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:06:32 GMT)
ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RAG Capabilities [54.0] ChatQA 2は、128Kコンテキストウィンドウを備えたLlama 3.0ベースのモデルである。
Llama3-70Bベースのコンテキストウィンドウを8Kから128Kまで拡張するためのトレーニングレシピを提案する。
RAGを用いた長文LLMの性能は,多数のチャンクを検索した場合に向上することがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:58:41 GMT)
Magic 1-For-1: Generating One Minute Video Clips within One Minute [53.1] メモリ消費と推論遅延を最適化した効率的なビデオ生成モデルMagic 1-For-1(Magic141)を提案する。
テスト時間スライディングウィンドウを適用することで、1分以内に1分間の動画を生成できるようになり、視覚的品質と動きのダイナミクスが大幅に向上した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:02:38 GMT)
Self-Refinement Strategies for LLM-based Product Attribute Value Extraction [51.5] 本稿では,製品属性値抽出タスクに2つの自己補充手法を適用した。
実験の結果, 2つの自己補充技術は, 処理コストを大幅に増大させながら, 抽出性能を著しく向上させることができないことがわかった。
開発データを持つシナリオでは、ファインチューニングが最もパフォーマンスが高いのに対して、ファインチューニングの上昇コストは製品記述の量が増加するにつれてバランスがとれる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:47:26 GMT)
VLM-Guard: Safeguarding Vision-Language Models via Fulfilling Safety Alignment Gap [51.3] 視覚言語モデル(VLM)には、安全性に関する懸念が増している。
VLMはテキストによる安全アライメントを持つLLM上に構築できるが、視覚のモダリティが統合されると容易に損なわれる。
本稿では,VLM の LLM 成分を VLM の安全アライメントの監督に活用する推論時介入戦略 VLM-Guard を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:44:43 GMT)
SeWA: Selective Weight Average via Probabilistic Masking [51.0] より良く、より高速な収束を達成するためには、ほんの数ポイントしか必要としないことを示す。
離散選択問題を連続的な部分集合最適化フレームワークに変換する。
両凸画像チェックポイントの値よりもシャープなSeWAの安定性境界を導出する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:35:21 GMT)
Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.0] 我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:56:19 GMT)
A distributional simplicity bias in the learning dynamics of transformers [50.9] 自然言語データに基づいてトレーニングされたトランスフォーマーは、単純さのバイアスも示している。
具体的には、入力トークン間の多体相互作用を逐次学習し、低次相互作用の予測誤差において飽和点に達する。
このアプローチは、自然言語処理などにおいて、データ内の異なる順序の相互作用が学習にどのように影響するかを研究する可能性を開く。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:20:42 GMT)
The Role of World Models in Shaping Autonomous Driving: A Comprehensive Survey [50.6] ドライビング・ワールド・モデル(DWM)は、ドライビング・プロセス中のシーンの進化を予測することに焦点を当てている。
DWM法は、自律運転システムが動的運転環境をよりよく知覚し、理解し、相互作用することを可能にする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:43:15 GMT)
Detect, Investigate, Judge and Determine: A Knowledge-guided Framework for Few-shot Fake News Detection [50.1] Few-Shot Fake News Detection (FS-FND) は、極めて低リソースのシナリオにおいて、非正確なニュースを実際のニュースと区別することを目的としている。
ソーシャルメディア上でのフェイクニュースの拡散や有害な影響により、このタスクは注目を集めている。
本稿では,内外からLLMを増強するDual-perspective Knowledge-Guided Fake News Detection (DKFND)モデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:56:16 GMT)
Benchmarking Predictive Coding Networks -- Made Simple [48.7] 機械学習における予測符号化ネットワーク(PCN)の効率性とスケーラビリティの問題に取り組む。
そこで我々は,PCXと呼ばれる,パフォーマンスと簡易性を重視したライブラリを提案する。
我々は,PCNの既存アルゴリズムと,生物工学的な深層学習コミュニティで普及している他の手法を併用して,このようなベンチマークを広範囲に実施する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:38:03 GMT)
Fast Proxies for LLM Robustness Evaluation [48.5] 我々は,LLMの現実的ロバスト性を予測するための高速プロキシメトリクスと,シミュレーションされたアタッカーアンサンブルとの比較を行った。
これにより、攻撃自体の実行を必要とせずに、計算コストの高い攻撃に対するモデルの堅牢性を見積もることができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:15:27 GMT)
STAR: Spectral Truncation and Rescale for Model Merging [48.2] モデルマージにおける重要な課題は、モデルの数が増加するにつれてタスクパフォーマンスが必然的に低下することである。
我々は,合併紛争の緩和を目的とした$mathbfS$pectral $mathbfT$runcation $mathbfA$nd $mathbfR$escale (STAR)を提案する。
多様なNLPタスクにおける広範囲なモデル統合事例によるSTARの有効性を実証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:59:58 GMT)
Towards Top-Down Reasoning: An Explainable Multi-Agent Approach for Visual Question Answering [47.7] 本稿では,視覚言語モデル(VLM)の能力を高めるために,LLM(Large Language Models)の拡張的知識を活用することで,新しいマルチエージェントコラボレーションフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:09:50 GMT)
RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation [47.4] 96のオブジェクトクラスを含む479のタスクにわたる107kのデモトラジェクトリを含むデータセットであるRoboMINDを紹介した。
RoboMINDは人間の遠隔操作を通じて収集され、総合的なロボット関連情報を含んでいる。
私たちのデータセットには5万個の実世界の障害デモが含まれており、それぞれに詳細な原因が伴い、障害のリフレクションと修正を可能にしています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:32:16 GMT)
DiOpt: Self-supervised Diffusion for Constrained Optimization [46.8] DiOptは、反復的な自己学習を通じて、最適に近い解分布を体系的に学習する新しい拡散パラダイムである。
我々の知る限りでは、DiOptは自己教師付き拡散と厳しい制約を満たす最初の成功例である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:43:08 GMT)
MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions [46.6] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM)と人間の嗜好の整合性を示す。
トークンのシーケンスや高レベルの言語構造を含むマクロアクションを学習プロセスに組み込んだ,シンプルで効果的なRLHFフレームワークであるMA-RLHFを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:02:03 GMT)
Evaluating and Improving Graph to Text Generation with Large Language Models [46.5] 大規模言語モデル(LLM)は、様々なタスクにおいて大きな可能性を証明している。
我々は、グラフからテキストへの生成タスクにおいて、現在のオープンソース LLM を誘導する包括的な評価を行う。
我々は、新しいグラフからテキストへのデータセット、PlanGTGを導入し、2つのサブタスク、すなわちリオーダーと属性を注釈付けした。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:38:15 GMT)
Rethinking Reward Model Evaluation: Are We Barking up the Wrong Tree? [46.4] RMの精度の違いが、最適化されたポリシー性能のギャップにどのように変換されるかを検討する。
我々は、RM品質の測定に使用する精度が、潜在的なRM過度な最適化を十分に捉えることができないことを認識している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:21:57 GMT)
Training Neural Networks on Data Sources with Unknown Reliability [45.9] 教師あり学習では、ソースの推定信頼性に比例した多くのステップで、各データソース上でニューラルネットワークをトレーニングすることを目指している。
このようにして、ウォームアップ中のすべてのソースでのトレーニングを可能にし、最終トレーニング段階で信頼性の低いソースでの学習を削減します。
信頼性のあるデータソースと信頼性の低いデータソースを混在させることで,モデル性能を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:35:40 GMT)
A Survey on Human-Centered Evaluation of Explainable AI Methods in Clinical Decision Support Systems [45.9] 本稿では,臨床診断支援システムにおける説明可能なAI手法の人間中心評価について調査する。
本研究は、XAIの医療への統合における重要な課題を明らかにし、XAIの評価方法と利害関係者の臨床的ニーズを整合させる構造的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:21:29 GMT)
Automated Hypothesis Validation with Agentic Sequential Falsifications [45.6] 多くの実世界の仮説は抽象的で、直接の検証が難しいハイレベルな主張である。
本稿では,自由形式仮説の厳密な自動検証のためのエージェントフレームワークであるPopperを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:46:00 GMT)
Analyzing Patient Daily Movement Behavior Dynamics Using Two-Stage Encoding Model [44.4] 本研究では,認知症高齢者の在宅活動記録のデータセットに焦点をあてた。
本稿では,2段階の自己教師型学習手法を提案する。第1段階では,時系列のアクティビティをテキスト文字列に変換し,それを微調整言語モデルで符号化する。
第2段階では、これらの時系列ベクトルは、PageRank法を適用して2次元化され、潜伏状態遷移を分析し、参加者の行動パターンを定量的に評価し、活動バイアスを特定する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:53:52 GMT)
Shaping Inductive Bias in Diffusion Models through Frequency-Based Noise Control [43.9] 我々は拡散確率モデル(DPM)のトレーニングとサンプリングに誘導バイアスを組み込む。
本研究は,各データセットが異なる誘導バイアスを必要とすること,および適切な周波数ベースノイズ制御により,標準拡散よりも生成性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:46:37 GMT)
Symmetry-Preserving Diffusion Models via Target Symmetrization [43.8] 本稿では, 対称性付き損失関数を用いて等価性を強制する新しい手法を提案する。
本手法では,モンテカルロサンプリングを用いて平均値を推定し,計算オーバーヘッドを最小限に抑える。
実験では,既存の方法と比較して試料の品質が向上した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:26:57 GMT)
GroverGPT: A Large Language Model with 8 Billion Parameters for Quantum Searching [43.5] 量子チューリングマシンの出力をシミュレートするために,大規模言語モデルを活用する可能性について検討する。
特殊なモデルであるGroverGPTは、15兆以上のトークンでトレーニングされた。
OpenAIのGPT-4o(45%の精度)を一貫して上回り、6ビットと10ビットのデータセットでほぼ100%の精度を達成した。
また、3から6キュービットのデータで訓練すると、20キュービットを超えるシステムに対して95%を超える精度で強い一般化を示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:00:08 GMT)
Large Language Model-Brained GUI Agents: A Survey [42.8] マルチモーダルモデルはGUI自動化の新しい時代を支えてきた。
彼らは自然言語理解、コード生成、視覚処理において例外的な能力を示した。
これらのエージェントはパラダイムシフトを表しており、ユーザーは単純な会話コマンドで複雑なマルチステップタスクを実行できる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:42:16 GMT)
Agentic Verification for Ambiguous Query Disambiguation [42.2] 本稿では,検索拡張世代(RAG)における問合せの曖昧化という課題に対処する。
本稿では,早期にレシーバとジェネレータからのフィードバックを取り入れて,ダイバーシフィケーションと検証を一体化するための共同手法を提案する。
広く採用されているASQAベンチマークにおいて,本手法の有効性と有効性を検証し,多種多様かつ検証可能な解釈を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:31:39 GMT)
A Preliminary Exploration with GPT-4o Voice Mode [42.2] 本報告では,GPT-4oを様々なタスクにわたって評価し,その音声処理と推論能力について分析する。
他の大型オーディオ言語モデル(LALM)よりも幻覚に対する堅牢性が高い。
GPT-4oの安全性メカニズムは、話者識別、年齢分類、MOS予測、オーディオディープフェイク検出などのタスクを減少させる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:34:08 GMT)
Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning [41.9] メモリRLの総合ベンチマークであるMIKASA(Memory-Intensive Skills Assessment Suite for Agents)を紹介する。
また、テーブルトップロボット操作におけるメモリ能力を評価するために、32個のメモリ集約タスクを慎重に設計したベンチマークであるMIKASA-Roboを開発した。
我々のコントリビューションは、メモリRL研究を進めるための統一的なフレームワークを確立し、現実のアプリケーションのためのより信頼性の高いシステムの開発を推進します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:46:19 GMT)
Teaching LLMs to Abstain across Languages via Multilingual Feedback [40.8] 多言語フィードバックは,多様な言語,文化,コミュニティ間の知識ギャップを識別する上で有効であることを示す。
大規模な実験により、多言語フィードバックアプローチは、様々な強いベースラインよりも優れていることが示された。
さらに分析したところ、多言語フィードバックは多言語話者に役立てるための効果的かつ公平な回避戦略であることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:42:30 GMT)
Programming Every Example: Lifting Pre-training Data Quality Like Experts at Scale [40.7] Programming Every Example(ProX)は、データの洗練をプログラミングタスクとして扱う。
ProXで計算されたデータに基づいて事前訓練されたモデルは、元のデータまたは他の選択方法によってフィルタリングされたデータよりも2%以上優れている。
われわれは500Bコーパス、モデルと共にProXをオープンソース化し、すべてのトレーニングと実装の詳細を共有しています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:44:08 GMT)
Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning [40.1] 我々はフォレスト・オブ・サート(FoT)と呼ばれる新しい推論フレームワークを提案する。
FoTは複数の推論木を統合し、複雑な論理問題を解くために集合的な意思決定を活用する。
本稿では,リアルタイムの誤り訂正を可能にする動的自己補正戦略と,コンセンサス誘導による意思決定戦略を導入する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:46:53 GMT)
The shape of the brain's connections is predictive of cognitive performance: an explainable machine learning study [40.0] dMRIトラクトグラフィー由来の形状の変動が、個体間での脳の機能的変動と関係しているかどうかは不明である。
本研究は, トラクトログラフィー・ファイバ・クラスタ形状測定を応用し, 被験者固有の認知能力を予測することの可能性を探る。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:50:35 GMT)
TractShapeNet: Efficient Multi-Shape Learning with 3D Tractography Point Clouds [39.9] トラクトグラフィーのポイントクラウド表現を利用した新しいフレームワークTractShapeNetを導入し、5つの形状測度を計算した。
形状測定計算実験により,提案したTractShapeNetは,他のクラウドベースニューラルネットワークモデルよりも優れていることが示された。
その結果,より高速かつ効率的な形状測定計算が実現できることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:46:03 GMT)
Towards Transparent and Accurate Plasma State Monitoring at JET [39.6] トカマクデバイス内のプラズマの制御とモニタリングは複雑で難しい。
破壊のようなプラズマの異常事象は定常的な動作を妨げる。
本稿では,トカマク中のプラズマ状態を透過的かつデータ駆動的に監視する手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:09:03 GMT)
Boundary Time Crystals as AC sensors: enhancements and constraints [39.6] 印加された交流場にスピンが共鳴するとBTCの感度が向上する。
長いコヒーレンス時間と多部相関にもかかわらず、BTCのエントロピーコストはACフィールド情報の最適な復号を妨げている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:36:07 GMT)
One Leaf Reveals the Season: Occlusion-Based Contrastive Learning with Semantic-Aware Views for Efficient Visual Representation [39.1] 本稿では,OCL(Occluded Image contrastive Learning)と呼ばれる,効率的な視覚概念表現のための,スケーラブルで簡単な事前学習パラダイムを提案する。
当社のOCLアプローチは単純で、パッチをランダムにマスクして、画像内の異なるビューを生成し、それらを画像のミニバッチ間で対比する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:42:11 GMT)
Artificial Intelligence in Spectroscopy: Advancing Chemistry from Prediction to Generation and Beyond [38.3] 機械学習(ML)と人工知能(AI)の急速な出現は、化学に大きな変革をもたらした。
分光・分光データへのこれらの手法の適用は、分光機械学習(SpectraML)と呼ばれるが、いまだに研究が進んでいない。
我々はSpectraMLの統一的なレビューを行い、フォワードタスクと逆タスクの両方に対する最先端のアプローチを体系的に検証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:07:25 GMT)
A Comprehensive Framework for Automated Segmentation of Perivascular Spaces in Brain MRI with the nnU-Net [37.2] 神経変性疾患では、PVS(perivascular space)の増大が一般的である。
現在不足している信頼性の高いPVS検出方法が必要である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:44:21 GMT)
MAGNET: Augmenting Generative Decoders with Representation Learning and Infilling Capabilities [37.2] 本稿では,デコーダのみの大規模言語モデル (LLM) を適応させて,ロバストな表現を生成し,不足するテキストスパンを埋め込む手法であるMAGNETを提案する。
この結果から, MAGNET に適応した LLM は, トークンレベルおよび文レベル表現学習タスクにおいて, 強いテキストエンコーダを超越していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:32:56 GMT)
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning [36.7] S-Temporal Memory Agent (STMA) は,時間記憶の統合による計画と実行の促進を目的としたフレームワークである。
複雑性レベル4.7%のマルチステップ計画と探索を含む32タスクのTextWorld環境におけるSTMAを評価した。
実験の結果、STMAは最先端モデルと比較して31.25%の成功率、平均スコアが24.7%上昇していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:12:09 GMT)
KernelBench: Can LLMs Write Efficient GPU Kernels? [36.4] KernelBenchは、高速で正確なカーネルを記述する言語モデルの能力を評価するためのオープンソースのフレームワークである。
本稿では,関数的に正しい生成カーネルの割合を計測する,新しい評価基準であるfast_pを紹介する。
実験の結果,フロンティア推論モデルが最も優れているが,全体としては不足していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:30:53 GMT)
From Markov to Laplace: How Mamba In-Context Learns Markov Chains [36.2] 我々はマルコフ連鎖の文脈内学習について研究し、驚くべき現象を明らかにする。
トランスとは異なり、単層マンバでさえ、文脈内ラプラシアスムージング推定器を効率的に学習する。
これらの理論的な洞察は経験的な結果と強く一致し、マンバと最適統計推定器の間の最初の公式な関係を表す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:13:55 GMT)
Quantum Chaos in Random Ising Networks [36.1] ErdHos-R'enyiネットワーク上の横場イジングモデルにおける普遍量子カオスシグネチャの検討
レベル間隔統計とスペクトルフォームファクターは、疎密で密接なネットワークのこの分解を示唆している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:05:05 GMT)
Towards Empowerment Gain through Causal Structure Learning in Model-Based RL [35.9] 本稿では,学習効率と制御性を向上させるための新しいフレームワークであるEmpowerment through Causal Learning (ECL)を提案する。
ECLは、まず、収集されたデータに基づいて環境の因果ダイナミクスモデルを訓練する。
そして、探索によって収集されたデータを同時に利用して、因果ダイナミクスモデルをより制御しやすいように更新する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:59:09 GMT)
BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds [35.6] 疎い足場におけるヒューマノイド移動のための強化学習フレームワーク、BeamDojoを紹介した。
BeamDojoは、密集した移動報酬と疎い足場報酬の学習プロセスのバランスをとる。
実世界の展開を実現するために,LiDARを用いた標高マップを実装した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:42:42 GMT)
Balancing the Scales: A Theoretical and Algorithmic Framework for Learning from Imbalanced Data [35.0] 本稿では,不均衡な分類における一般化を解析するための新しい理論的枠組みを提案する。
本稿では,2値設定と複数値設定の両方に新しいクラス不均衡なマージン損失関数を提案し,その強い$H$一貫性を証明し,それに対応する学習保証を導出する。
我々は、信頼率を組み込んだ新しい一般学習アルゴリズムIMMAXを考案し、様々な仮説集合に適用する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:57:16 GMT)
Model-Based Privacy-Preserving Knowledge Transfer for Large Language Models [34.9] Llamdexは大規模言語モデル(LLM)を強化するフレームワークで、ドメイン固有のデータに基づいてトレーニングされたモデルのみを使用する。
提案手法は,ドメイン固有のタスクの精度を大幅に向上し,最大26%の精度向上を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:47:42 GMT)
POI-Enhancer: An LLM-based Semantic Enhancement Framework for POI Representation Learning [34.9] 近年の研究では、多モーダル情報によるPOI表現の充実がタスク性能を大幅に向上させることが示されている。
広範なテキストデータに基づいて訓練された大規模言語モデル (LLMs) は、リッチテキストの知識を持つことがわかった。
古典的なPOI学習モデルによって生成されたPOI表現を改善するために,LLMを利用するポータブルフレームワークであるPOI-Enhancerを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:34:24 GMT)
The Graph's Apprentice: Teaching an LLM Low Level Knowledge for Circuit Quality Estimation [34.4] 本研究は,HDLコードから直接回路品質を推定するための予測ネットワークを用いて,大規模言語モデル(LLM)を拡張することを提案する。
性能を向上させるために、Look-Up Table (LUT)グラフでトレーニングされたグラフニューラルネットワーク(GNN)の埋め込みを使用してモデルを正規化する。
提案手法は,既存のベンチマークOpenABCDにおけるRTLレベルの推定手法と比較して,優れた性能を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:35:03 GMT)
PhishIntel: Toward Practical Deployment of Reference-Based Phishing Detection [34.0] PhishIntelは、現実世界のデプロイメントのためのエンドツーエンドのフィッシング検出システムである。
検出プロセスを、ローカルのブラックリストと結果キャッシュをチェックする高速タスクと、オンラインのブラックリスト検証、URLクローリング、Webページ分析を実行する遅いタスクの2つに分割する。
この高速スロータスクシステムアーキテクチャは、参照ベースのフィッシング検出器の堅牢な検出能力を保ちながら、低応答レイテンシを保証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:17:20 GMT)
Determining angle of arrival of radio frequency fields using subwavelength, amplitude-only measurements of standing waves in a Rydberg atom sensor [34.0] 本稿では,AoAセンサのための新しいタイプのRydbergセンサについて紹介する。
リードベルクセルに金属板を配置することにより、入射RF場の強度とは独立にAoAを決定することができる。
我々は,ロボットアンテナ位置決めシステムを用いて,4.2,5.0,5.7GHzの高精度AoA測定を行った。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:33:57 GMT)
Enhancing Multilingual LLM Pretraining with Model-Based Data Selection [33.7] 本稿では,多言語データセットを対象としたモデルベースフィルタリングフレームワークを提案する。
当社のアプローチは透明性、単純さ、効率性を重視しています。
フレームワークを20言語に拡張し、洗練された事前トレーニングデータセットをリリースします。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:42:07 GMT)
ReStyle3D: Scene-Level Appearance Transfer with Semantic Correspondences [33.1] ReStyle3Dは、シーンレベルの外観を1つのスタイルのイメージから、複数のビューで表現された現実世界のシーンに転送するためのフレームワークである。
明示的な意味対応と多視点整合性を組み合わせることで、正確で一貫性のあるスタイリングを実現する。
私たちのコード、事前訓練されたモデル、データセットは、インテリアデザイン、仮想ステージング、そして3D一貫性のあるスタイリングにおける新しいアプリケーションをサポートするために、公開されます。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:54:21 GMT)
ReFoRCE: A Text-to-SQL Agent with Self-Refinement, Format Restriction, and Column Exploration [32.8] スパイダー2.0データセットの現在の最先端のパフォーマンスは、まだ20%に制限されている。
長文制約を緩和するテーブル圧縮を導入したReFoRCEを提案する。
ReFoRCEはスパイダー2.0-Snowで31.26点、スパイダー2.0-Liteで30.35点を得た。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:38:16 GMT)
A Regularized Newton Method for Nonconvex Optimization with Global and Local Complexity Guarantees [31.8] 2階局所呼び出しに関して、$epsilon-frac32) + tilde O$と、Hessian-vectorvectorsに対して$tilde O(epsilon-frac74)$という大域的な複雑さを見出す。
予備的な数値計算の結果は、我々のアルゴリズムを示している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:53:45 GMT)
ChorusCVR: Chorus Supervision for Entire Space Post-Click Conversion Rate Modeling [31.7] クリック後変換率の推定は、収益ビジネスのレコメンデーションシステムにおいて重要なタスクである。
クリックされていないサンプルに対するイベント後のラベルがないため、CVR学習タスクはクリックされたサンプルのみを使用するのが一般的である。
そこで本研究では,空間全体に偏ったCVR学習を実現するための新しいChorusCVRモデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:33:27 GMT)
V2V-LLM: Vehicle-to-Vehicle Cooperative Autonomous Driving with Multi-Modal Large Language Models [31.5] 車両間通信(V2V)は提案されているが、検出と追跡に重点を置く傾向にある。
本稿では,Large Language Models (LLM) を協調自律運転に組み込む新しい問題設定を提案する。
また,LLMを用いて複数の連結自動運転車の知覚情報を融合するV2V-LLM法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:05:41 GMT)
Task Aware Dreamer for Task Generalization in Reinforcement Learning [31.4] 一般的な世界モデルのトレーニングは、タスクにおいて同様の構造を活用でき、より一般化可能なエージェントのトレーニングに役立つことを示す。
本稿では,タスク間の遅延特性を識別するために,報酬インフォームド機能を統合するタスク・アウェア・ドリーマー (TAD) という新しい手法を提案する。
画像ベースのタスクと状態ベースのタスクの両方の実験は、TADが異なるタスクを同時に処理するパフォーマンスを大幅に改善できることを示している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:12:18 GMT)
Analyzing and Boosting the Power of Fine-Grained Visual Recognition for Multi-modal Large Language Models [31.3] Finedeficsは、トレーニングフェーズにオブジェクトの情報属性記述を組み込むことで、モデルのFGVR能力を向上するMLLMである。
我々は、オブジェクト-属性対と属性-カテゴリ対を同時に比較学習し、類似しているが誤ったカテゴリの例をハードネガティブとして利用する。
複数の人気のあるFGVRデータセットに対する広範囲な評価は、Finedeficsが既存のMLLMを同等のパラメータサイズで上回っていることを示している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:57:30 GMT)
Data Center Cooling System Optimization Using Offline Reinforcement Learning [31.0] 直流冷却システムのエネルギー効率最適化のための物理インフォームドオフライン強化学習(RL)フレームワークを提案する。
私たちのフレームワークは,ACUのクローズドループ制御のために,大規模生産用DCに導入され,検証されている。
以上の結果から,直流冷却システムにおいて安全・運転制約に違反することなく1421%の省エネを達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:50:36 GMT)
Learning Relational Tabular Data without Shared Features [30.9] 共有機能や事前整合データを必要としない効果的なクロステーブルトレーニングを実現する新しいフレームワークを提案する。
リールは、適切に整列されたデータは、不正な整列したデータよりも損失が低いという原則で機能する。
リールは最先端の手法に比べて予測性能が26.8%向上した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:51:07 GMT)
Local-Prompt: Extensible Local Prompts for Few-Shot Out-of-Distribution Detection [29.8] Local-Promptは、ローカルプロンプトによる地域強化を強調する新しいチューニングパラダイムである。
提案手法は,ImageNet-1kデータセットを用いた4ショットチューニングにおいて,最先端手法に対して平均FPR95を5.17%削減する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:58:39 GMT)
EvidenceMap: Learning Evidence Analysis to Unleash the Power of Small Language Models for Biomedical Question Answering [29.7] バイオメディカル・エビデンス・マップ(EvidenceMap)は,バイオメディカル・エビデンス(バイオメディカル・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・マップ(バイオメディカル・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・エビデンス・マップ(バイオメディカル・エビデンス・エビデンス・エビデンス)を学習するための言語モデルである。
本手法は,66Mパラメータのみを微調整したモデルによるエビデンス解析を行い,基準ベースの品質と精度の5.7%,8B LLMのRAG法を19.9%上回った。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:02:04 GMT)
ClusMFL: A Cluster-Enhanced Framework for Modality-Incomplete Multimodal Federated Learning in Brain Imaging Analysis [28.8] 脳画像解析の文脈では、モダリティの不完全性は重要な課題である。
本稿では,機能クラスタリングを利用した新しいMFLフレームワークであるClusMFLを提案する。
ClusMFLは、様々なモダリティの不完全性のレベルにまたがる様々なベースライン手法と比較して、最先端の性能を達成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:33:59 GMT)
Towards Cross-Lingual Explanation of Artwork in Large-scale Vision Language Models [28.7] 本研究では、機械翻訳に頼ることなく、複数の言語で拡張データセットを作成する。
リソース豊富な英語のインストラクションチューニングが、他の言語のパフォーマンスを向上させるかどうかを検討した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:56:31 GMT)
Synthesis of Dynamic Masks for Information-Theoretic Opacity in Stochastic Systems [28.4] 本研究では,システムから外部オブザーバへの情報漏洩を最小限に抑えるため,「マスク」と呼ばれる動的情報伝達機構の合成について検討する。
システムにとって、オブザーバは、システム軌道の最終状態が秘密状態の集合に属するかどうかを推測することを目的としている。
ダイナミックマスクは、最終状態の不透明性(最終状態の不透明性と呼ばれる性質)に関する観測者の不確実性を最大化するために、センサ情報を規制しようとする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:53:22 GMT)
Analog In-memory Training on General Non-ideal Resistive Elements: The Impact of Response Functions [28.4] インメモリコンピューティング(AIMC)は、有望なエネルギー効率のソリューションとして出現する。
本稿ではまず,AIMCハードウェア上での勾配に基づくトレーニングの理論的基礎を提供する。
雑音の更新と非対称応答関数がAnalog SGDに悪影響を及ぼすことを示す。
この問題を解決するために、残差学習アルゴリズムであるTiki-Takaは、主配列と残差配列を双方向に最適化することにより、臨界点に正確に収束する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:32:42 GMT)
Self-Consistent Model-based Adaptation for Visual Reinforcement Learning [27.7] 視覚強化学習エージェントは、視覚障害による実世界のアプリケーションの性能低下に直面している。
既存の方法は、手作りの拡張でポリシーの表現を微調整することに依存している。
本稿では、ポリシーを変更することなくロバスト適応を促進する新しい手法である自己一貫性モデルベース適応(SCMA)を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:23:56 GMT)
S2CFormer: Reorienting Learned Image Compression from Spatial Interaction to Channel Aggregation [26.9] 我々はS2CFormerの2つのインスタンス(S2C-ConvとS2C-Attention)を提示する。
どちらのモデルも最先端(SOTA)のR-D性能を示し、デコード速度は大幅に高速である。
本稿では,異なるS2CFormerインスタンスの強度を組み合わせた拡張licモデルであるS2C-Hybridを紹介する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:30:07 GMT)
Efficient Evaluation of Multi-Task Robot Policies With Active Experiment Selection [26.0] 学習したロボット制御ポリシーを評価して、その物理的タスクレベルの能力を決定するには、実験者による時間と労力がかかる。
すべてのタスクに対して,すべてのポリシを複数回テストすることは現実的ではない。
実験を順次実施する際には,全てのタスクやポリシーにまたがるロボット性能の分布をモデル化することを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:07:02 GMT)
Preference learning made easy: Everything should be understood through win rate [25.8] 本研究は、ペアワイズ選好データのサンプリングから始まる選好学習を理解するための枠組みを提案する。
まず、データ分布における嗜好と有病率の両方を尊重する生成モデルの唯一の評価が、勝利率の一形態であることを示す。
次に、選好学習手法を、勝利率最適化(WRO)または非WROとして分析する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:01:34 GMT)
Generalised Parallel Tempering: Flexible Replica Exchange via Flows and Diffusions [25.7] 一般化並列テンパリング(GePT)は、現代の生成モデリングにおける最近の進歩を取り入れることができる。
GePTはサンプルの品質を向上し,複雑な分布を扱うために必要な計算資源の増大を低減できることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:41:44 GMT)
Online Inverse Linear Optimization: Improved Regret Bound, Robustness to Suboptimality, and Toward Tight Regret Analysis [25.5] 本稿では,学習者が時間変化の可能な行動群とエージェントの最適な行動群の両方を観察するオンライン学習問題について検討する。
我々は、以前の$O(n4ln T)$の限界を$n3$の係数で改善した$O(nln T)$後悔境界を得る。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:31:23 GMT)
EC-Diffuser: Multi-Object Manipulation via Entity-Centric Behavior Generation [25.1] 高次元観測から物体を操作することを学ぶことは重要な課題である。
最近のアプローチでは、大規模なオフラインデータを使用して、ピクセル観測からモデルをトレーニングしている。
本稿では、オブジェクト中心の表現とエンティティ中心のトランスフォーマーを活用する新しい行動クローニング(BC)手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:43:22 GMT)
CATCH: Channel-Aware multivariate Time Series Anomaly Detection via Frequency Patching [24.9] 周波数パッチに基づくフレームワークであるCATCHを紹介する。
本稿では,パッチワイドマスクジェネレータとマスクアテンション機構を備えたChannel Fusion Module (CFM)を提案する。
10の現実世界のデータセットと12の合成データセットの実験は、CATCHが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:59:46 GMT)
Is What You Ask For What You Get? Investigating Concept Associations in Text-to-Image Models [24.9] テキスト・ツー・イメージ(T2I)モデルは、現実のアプリケーションでますます使われている。
望ましいタスクに適したイメージを生成するために、これらのモデルを監査する必要性が高まっている。
視覚言語モデルの条件分布を特徴付けるフレームワークであるConcept2Conceptを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:52:51 GMT)
Revisiting Generalization Power of a DNN in Terms of Symbolic Interactions [24.8] 本稿では,ディープニューラルネットワーク(DNN)の一般化能力について,インタラクションの観点から分析することを目的とする。
DNNの一般化パワーは相互作用の一般化パワーとして説明できる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:46:14 GMT)
Neural Force Field: Learning Generalized Physical Representation from a Few Examples [24.7] 大規模なトレーニングにもかかわらず、現在のAIモデルは、同様の一般化を達成するのに依然として苦労している。
ニューラル正規微分方程式(NODE)に基づくモデリングフレームワークであるニューラルフォース場(NFF)を提案する。
NFFは、重力、支持、衝突などの基本的な物理的概念を解釈可能な方法で捉えている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:29:09 GMT)
Unknown Word Detection for English as a Second Language (ESL) Learners Using Gaze and Pre-trained Language Models [24.6] 本稿では,テキストの内容と視線軌跡に基づいて未知語の確率を高精度に予測する,トランスフォーマーに基づく機械学習手法であるEyeLingoを提案する。
20名を対象にした調査では, 精度は97.6%, F1スコアは71.1%であった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:57:04 GMT)
Provably Efficient RL under Episode-Wise Safety in Linear CMDPs [24.3] 制約決定過程(CMDP)における強化学習問題について検討する。
本稿では,線形CMDPに対するRLアルゴリズムを提案する。
その結果,近年のCMDPアルゴリズムは制約に違反するか,指数計算コストに悪影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:07:25 GMT)
SELP: Generating Safe and Efficient Task Plans for Robot Agents with Large Language Models [24.2] 等価投票、制約付き復号化、ドメイン固有の微調整という3つの重要な洞察を提示する。
等価投票は、複数の線形時間論理(LTL)式の生成とサンプリングによって一貫性を保証する。
制約付き復号法は生成された公式を使って計画の自動回帰推論を実行する。
ドメイン固有の微調整は、特定のタスクドメイン内で安全で効率的なプランを生成するために、LSMをカスタマイズする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:40:55 GMT)
Elastic Representation: Mitigating Spurious Correlations for Group Robustness [24.1] ディープラーニングモデルは、入力特徴とラベルの急激な相関に依存する場合、深刻なパフォーマンス劣化に悩まされる可能性がある。
ニューラルネットワークの最後の層からの表現に対して,核とフロベニウスの法則を課すことで特徴を学習するための弾性表現(ElRep)を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:25:27 GMT)
A Critical Look At Tokenwise Reward-Guided Text Generation [23.9] フルシーケンスでトレーニングされた報酬モデルは、スコアリング部分シーケンスと互換性がないことを示す。
本稿では,部分列を明示的に学習するBradley-Terry報酬モデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:46:51 GMT)
Language Models Largely Exhibit Human-like Constituent Ordering Preferences [23.7] 我々は,大規模言語モデルと多様な特性を比較し,構成運動の性能を評価する。
粒子移動に関する予期せぬ行動にもかかわらず、LLMは概して構成順序に関する人間の嗜好と一致している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:06:20 GMT)
Region-Adaptive Sampling for Diffusion Transformers [23.4] RASは、DiTモデルの焦点に基づいて、画像内の領域に異なるサンプリング比を動的に割り当てる。
安定拡散3とLumina-Next-T2IのRASを評価し,それぞれ2.36xと2.51xの高速化を実現し,生成品質の低下を最小限に抑えた。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:59:36 GMT)
MixMin: Finding Data Mixtures via Convex Minimization [23.4] 機械学習パイプラインは、多種多様なソースからのデータの組み合わせと混合が増えている。
最適なデータ混合物を見つけることは困難でオープンな問題です。
私たちはこのデータミキシング問題を2段階の目的として定式化し、最良のミキシングは、下流の目的のために最良のモデルに導かれるものです。
本稿では,モデルクラスが大きくなるにつれて,両レベルのデータ混合目標が凸となることを観察する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:15:53 GMT)
Conditional Latent Coding with Learnable Synthesized Reference for Deep Image Compression [23.0] 本稿では,外部辞書から動的参照を合成して,潜時領域における入力画像の条件付き符号化を行う方法について検討する。
各入力画像に対して、辞書から関連する特徴を選択して合成することで、条件付き潜伏語を合成することを学ぶ。
次に、合成潜水剤を用いて符号化プロセスを導出し、入力画像と参照辞書の相関をより効率的に利用できるようにする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:56:21 GMT)
GEVRM: Goal-Expressive Video Generation Model For Robust Visual Manipulation [23.0] 本稿では,ロボットの視覚操作の堅牢性を高めるために,新しい閉ループ視覚言語アクション(VLA)法を提案する。
GEVRMのテキスト誘導ビデオ生成モデルは、表現力の高い将来の視覚計画目標を生成することができる。
GEVRMは、標準ベンチマークとCALVINベンチマークの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:51:57 GMT)
$\textrm{A}^{\textrm{2}}$RNet: Adversarial Attack Resilient Network for Robust Infrared and Visible Image Fusion [22.7] Infrared and visible image fusion (IVIF) は視覚能力を高める重要な技術である。
本稿では,textrmAtextrm2$RNetと呼ばれる新たな攻撃耐性ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:03:41 GMT)
Heterogeneous Resource Allocation with Multi-task Learning for Wireless Networks [22.5] マルチタスク学習(MTL)フレームワークを提案し、単一のディープニューラルネットワーク(DNN)が様々な最適化問題を共同で解決できるようにする。
本フレームワークでは, 異なる次元値, 目的値, 制約値の最適化問題を, 個別のタスクとして扱う。
計算結果から,多種多様な最適化問題の解法におけるMTL手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:13:33 GMT)
X-Boundary: Establishing Exact Safety Boundary to Shield LLMs from Multi-Turn Jailbreaks without Compromising Usability [21.9] 既存の防御方法は、マルチターンジェイルブレイクに対するLDMの堅牢性を改善するが、ユーザビリティを損なう。
我々は,有害な表現を安全な表現から遠ざけ,正確な識別境界を得るために,X境界を提案する。
実験結果から,X-Boundaryは多ターンジェイルブレイクに対する最先端の防御性能を実現することが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:22:51 GMT)
Causal Information Prioritization for Efficient Reinforcement Learning [21.7] 現在の強化学習(RL)法は、しばしばサンプル効率に悩まされる。
最近の因果的アプローチはこの問題に対処することを目的としているが、それらは報酬誘導による状態や行動の因果的理解の基礎的なモデリングを欠いている。
本稿では,CIP(Causal Information Prioritization, 因果情報優先化)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:44:17 GMT)
Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models [21.7] 我々は,ロボットが高レベルの手動指示で案内される複雑な組み立てタスクを実行できる新しいフレームワークであるManual2Skillを提案する。
提案手法では,視覚言語モデル(VLM)を用いて,教師画像から構造化情報を抽出する。
実世界のIKEA家具の組み立てに成功して, Manual2Skillの有効性を実証した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:25:24 GMT)
MassSpecGym: A benchmark for the discovery and identification of molecules [21.5] 我々はMS/MSデータから分子の発見と同定のための最初の包括的なベンチマークであるMassSpecGymを提案する。
当社のベンチマークは,MS/MSスペクトルをラベル付けした高品質な画像集としては最大である。
デ・ノボ分子構造生成、分子検索、スペクトルシミュレーションという3つのMS/MSアノテーションの課題を定義している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:24:02 GMT)
Noise-Aware Algorithm for Heterogeneous Differentially Private Federated Learning [21.3] 本稿では,クライアントモデル更新における真のノイズレベルを効率的に推定するRobust-HDPを提案する。
ユーティリティと収束速度を改善し、不正なプライバシパラメータをサーバに送信する可能性のあるクライアントに対して安全である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:16:23 GMT)
ResearchArena: Benchmarking Large Language Models' Ability to Collect and Organize Information as Research Agents [21.2] 本研究では,学術調査における大規模言語モデル(LLM)の評価のためのベンチマークであるResearchArenaを紹介する。
これらの機会を養うため、12万のフルテキスト学術論文と7.9Kのサーベイ論文の環境を構築した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:37:35 GMT)
LiveVal: Time-aware Data Valuation via Adaptive Reference Points [21.1] 提案するLiveValは,3つの重要な設計を持つ効率的な時間認識データ評価手法である。
LiveValは、さまざまなモダリティとモデルスケールにわたる効率的なデータバリュエーションを提供し、従来のメソッドよりも180のスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:41:20 GMT)
Exploring Neural Granger Causality with xLSTMs: Unveiling Temporal Dependencies in Complex Data [20.8] 時系列における因果関係は、特に非線形依存の存在下では決定が難しい。
本稿では,変数間の長距離関係を捉えるために,Granger causal xLSTM(GC-xLSTM)を提案する。
提案したGC-xLSTMモデルの総合的有効性を示す3つのデータセットに関する実験的検討を行った。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:07:03 GMT)
RASPNet: A Benchmark Dataset for Radar Adaptive Signal Processing Applications [20.6] RASPNetデータセットは16TBを超えるサイズで、アメリカ合衆国全土の様々な地形や土地にまたがる現実的なシナリオを100種類構成している。
RASPNetは、レーダーと複雑な値の学習アルゴリズムのベンチマークに使用できる、空中レーダー設定からの1万のクラッタ実現で構成されている。
RASPNetが現実的な適応型レーダ処理シナリオにどのように使用できるかを示すために、転送学習の例を含む、その構成、組織、およびいくつかのアプリケーションの概要を述べる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:49:54 GMT)
SessionRec: Next Session Prediction Paradigm For Generative Sequential Recommendation [20.5] 生成的逐次レコメンデーションのための新しい次世代予測パラダイムであるSessionRecを紹介する。
実際のセッションベースのユーザインタラクションに矛盾するNIPPの項目レベルの自己回帰生成とは異なり、我々のフレームワークはセッション認識表現学習を導入している。
その結果、次のセッション予測パラダイムの下で、セッション内の項目のランクロスを組み込むことで、生成シーケンス推薦モデルのランキングの有効性を著しく向上できることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:36:20 GMT)
DR-MPC: Deep Residual Model Predictive Control for Real-world Social Navigation [20.3] シミュレーションにおける深層強化学習(Dep Reinforcement Learning, DRL)は、いくつかの約束があるが、多くの先行研究は、実際の人間の動きのニュアンスを捉えないシミュレータに依存している。
本研究では,現実のクラウドナビゲーションデータから,ロボットがDRLを迅速かつ安全に実行できるようにするためのDR-MPC(Deep Residual Model Predictive Control)を提案する。
DR-MPCは、MPCベースの経路追跡を持ち、徐々に人間とより効果的に対話することを学ぶ。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:14:35 GMT)
Diverse Inference and Verification for Advanced Reasoning [19.9] OpenAI o1、o3、DeepSeek R1のようなLLMの推論は数学とコーディングに大きな進歩をもたらした。
テスト時に複数のモデルとメソッドを組み合わせる、さまざまな推論アプローチを使用します。
数学や符号問題の検証や他の問題に対する拒絶サンプリングは簡単かつ効果的であることがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:22:25 GMT)
How Users Who are Blind or Low Vision Play Mobile Games: Perceptions, Challenges, and Strategies [19.7] 本研究では,視覚的,低視的(BLV)ユーザが,アクセシビリティの異なるモバイルゲームをどのように経験するかを検討する。
以上の結果から,BLVプレイヤーはモバイルゲームに目を向け,退屈を軽減し,達成感を達成し,ソーシャルなつながりを築き,ゲームのアクセシビリティレベルに応じて障壁に直面していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:27:53 GMT)
Is Deep Learning finally better than Decision Trees on Tabular Data? [19.7] タブラルデータは、多くの現実世界のアプリケーションでその汎用性と使いやすさのために、ユビキタスなデータモダリティである。
データに関する最近の研究は、この領域におけるニューラルネットワークの限界についてユニークな視点を提供する。
本研究は、その基礎となる学習パラダイムに基づいて、10の最先端モデルを分類する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:37:07 GMT)
Modern Hopfield Networks with Continuous-Time Memories [19.6] 本稿では,大規模な離散ホップフィールドメモリを小さな連続記憶に圧縮する手法を提案する。
作業記憶における連続的資源割り当ての心理学的理論に着想を得て,大規模な離散ホップフィールド記憶を小さな連続記憶に圧縮する手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:41:05 GMT)
CR-CTC: Consistency regularization on CTC for improved speech recognition [19.0] Connectionist Temporal Classification (CTC) は自動音声認識(ASR)の手法として広く使われている。
本稿では,2つのCTC分布間の整合性を実現するConsistency-Regularized CTC (CR-CTC)を提案する。
CTCとアテンションベースのエンコーダデコーダ(CTC/AED)を組み合わせたトランスデューサやシステムに匹敵する技術結果が得られることで、CTCの性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:13:03 GMT)
Unsupervised Entity Alignment Based on Personalized Discriminative Rooted Tree [18.9] 上記の2つの問題に対処するため、UNEAと呼ばれる新しい非教師なしのエンティティアライメント手法を提案する。
我々のUNEAは、監督されていないEAタスクの新たな最先端を実現し、既存の管理されたEAベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:45:39 GMT)
Suppressing spurious transitions using spectrally balanced pulse [18.9] 超伝導量子ビットでは、寄生相互作用は量子ゲートの性能を著しく制限することができる。
本稿では、スペクトルバランスの取れたマイクロ波パルスを用いて、望ましくない遷移を抑制するパルス整形法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:27:36 GMT)
Unsupervised Discovery of Object-Centric Neural Fields [18.9] 1つの画像から3次元オブジェクト中心のシーン表現を推定する。
我々は、対象中心神経場(uOCF)の教師なし発見を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:53:14 GMT)
Do Large Language Models Possess Sensitive to Sentiment? [18.9] 大規模言語モデル(LLM)は、最近、言語理解における異常な能力を示した。
本稿では,LLMがテキストモーダルの感情を検知し,反応する能力について検討する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:04:55 GMT)
Post-training an LLM for RAG? Train on Self-Generated Demonstrations [18.9] 大規模言語モデル(LLM)は知識集約型NLPタスクとしばしば競合する。
検索拡張生成(RAG)は、モデルがコンテキスト内情報を利用することを可能にする。
自己生成型実演を用いたRAG対応LDMの学習法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:00:49 GMT)
PolyPath: Adapting a Large Multimodal Model for Multi-slide Pathology Report Generation [18.7] 最大4万768ピクセルの画像パッチから10倍の倍率で複数の全スライディング画像から診断を生成できることを実証する。
専門家の病理学者による評価では、生成された報告テキストは臨床的に正確であり、元の報告と同等か、あるいは好意的であることが示されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:09:13 GMT)
Solving Empirical Bayes via Transformers [18.7] この研究は、最も古い統計問題の1つを解決するために、現代のAIツール(トランスフォーマー)を適用している。
トランスモデルは、合成生成されたペアのセット$(X,theta)$で事前訓練され、未知の$pi$に適応することで、コンテキスト内学習(ICL)を学習する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:06:15 GMT)
Exploring the Camera Bias of Person Re-identification [18.6] 我々は、ReIDモデルのカメラバイアスを未確認領域で測定し、データ分散シフトによってカメラバイアスがより顕著になることを示す。
未確認領域データのデバイアス化手法として,埋め込みベクトル上の特徴正規化を再考する。
本手法はバイアス低減に有効であり,低レベル画像特性や体角などの詳細なバイアス要因に適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:39:24 GMT)
On-demand shaped photon emission based on a parametrically modulated qubit [18.6] シングルレールおよびデュアルレールのタイムビン型光子生成器は、ポイントツーポイント量子ネットワークの量子インターフェースとして機能することができる。
我々は,GPUのデータストリーム処理に基づく効率的な光子場計測装置を開発した。
その結果,本手法はハードウェア効率が高く,実装が簡単で,拡張性が高いことがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:33:26 GMT)
Large Language Models for Anomaly and Out-of-Distribution Detection: A Survey [18.6] 大規模言語モデル(LLM)は、自然言語処理だけでなく、より広範なアプリケーションでもその効果を実証している。
本調査は,LSMの文脈下での異常検出とOOD検出の問題点に焦点を当てた。
LLMが果たす役割に基づいて,既存のアプローチを2つのクラスに分類する新たな分類法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:35:51 GMT)
Latent Diffusion Model-Enabled Low-Latency Semantic Communication in the Presence of Semantic Ambiguities and Wireless Channel Noises [18.5] 本稿では,ソースデータのアウトレイラを処理するために,遅延拡散モデルを用いたSemComシステムを開発した。
軽量な単層遅延空間変換アダプタは、送信機でのワンショット学習を完了させる。
終端整合蒸留法を用いて, 潜時空間で訓練した拡散模型を蒸留する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:57:02 GMT)
Quantifying the Impact of Motion on 2D Gaze Estimation in Real-World Mobile Interactions [18.3] 本稿では,ユーザの移動度と行動がモバイル視線追跡精度に与える影響を実証的に示す。
頭部距離、頭部ポーズ、装置の向きは、正確性に影響を与える重要な要因である。
発見は、より堅牢で適応的な視線追跡システムの必要性を強調している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:44:52 GMT)
Transformer-based Graph Neural Networks for Battery Range Prediction in AIoT Battery-Swap Services [18.0] 共有経済の概念は広く認知され、この文脈において、共有E-Bike電池は社会的な関心の焦点として現れてきた。
人気にもかかわらず、SEBの残りのバッテリー範囲と現実に関するユーザの期待との間には、注目すべき相違点が残っている。
本稿では,SEBのバッテリ範囲の予測に特化して設計されたSEB-Transformerと呼ばれる構造トランスモデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:38:49 GMT)
Protecting Privacy in Multimodal Large Language Models with MLLMU-Bench [17.7] マルチモーダル・ラージ・モデル・アンラーニングベンチマーク(MLLMU-Bench)は,マルチモーダル・マシン・アンラーニングの理解を深めるための新しいベンチマークである。
MLLMU-Benchは500の架空のプロファイルと153のプロフィールで構成され、各プロファイルは14以上のカスタマイズされた質問応答ペアで構成され、マルチモーダル(画像+テキスト)とユニモーダル(テキスト)の両方の観点から評価される。
意外なことに、我々の実験では、ユニモーダル・アンラーニングのアルゴリズムは生成タスクやクローズタスクに優れており、マルチモーダル・アンラーニングのアプローチはマルチモーダル入力による分類タスクにおいてより優れている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:08:37 GMT)
Gradient GA: Gradient Genetic Algorithm for Drug Molecular Design [17.6] 実験の結果,提案手法は収束速度と解法品質の両方を著しく改善し,最先端技術よりも優れていた。
例えば、バニラ遺伝アルゴリズムよりも最大25%向上している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:03:39 GMT)
Accelerating Unbiased LLM Evaluation via Synthetic Feedback [17.6] 本稿では,人間のアノテーションへの依存を減らすために,人間と合成フィードバックを統合した統計的に原則化されたフレームワークを提案する。
実験では、市販の合成評価器で最大12.2%、微調整で最大24.8%のアノテーションを減らした。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:27:09 GMT)
Learning to Substitute Words with Model-based Score Ranking [17.5] スマートワード置換は、単語選択を改善することによって文質を向上させることを目的としている。
現在のベンチマークは、人間のラベル付きデータに依存している。
文質の定量化にはモデルベーススコア(BARTScore)を用いる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:09:11 GMT)
LLM-Powered Preference Elicitation in Combinatorial Assignment [17.4] 提案手法は,大規模言語モデル(LLM)を人為的プロキシとして活用し,課題における選好選択(PE)を簡素化するものである。
本稿では,SOTA ML を用いた嗜好推論方式と併用して動作する LLM プロキシのフレームワークを提案する。
コース割当て領域における人間の問合せに対するLLMプロキシの有効性を実験的に評価した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:12:20 GMT)
CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network [17.3] CrossFiはシアムネットワークベースのアプローチで、ドメイン内シナリオとクロスドメインシナリオの両方に優れています。
私たちは、クラスごとにテンプレートを生成することができる余分なWeight-Netを開発し、CrossFiがさまざまなシナリオで機能できるようにします。
ジェスチャー認識タスクでは、ドメイン内シナリオで98.17%、ワンショットクロスドメインシナリオで91.72%、ゼロショットクロスドメインシナリオで64.81%、ワンショット新しいクラスシナリオで84.75%の精度を達成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:12:02 GMT)
SAM-LAD: Segment Anything Model Meets Zero-Shot Logic Anomaly Detection [17.3] 視覚異常検出は、産業的欠陥検出や診断など、現実世界の応用において不可欠である。
我々は,任意のシーンにおける論理的異常検出のためのゼロショット・プラグイン・アンド・プレイフレームワークSAM-LADを提案する。
産業用データセットを含む様々なベンチマークを用いて,提案するSAM-LADを検証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:34:39 GMT)
AACessTalk: Fostering Communication between Minimally Verbal Autistic Children and Parents with Contextual Guidance and Card Recommendation [17.3] タブレットベースのAI通信システムであるAACessTalkについて述べる。
MVAの子供と親との有意義な交換を促進する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:14:14 GMT)
Uncertainty-Aware Explanations Through Probabilistic Self-Explainable Neural Networks [17.2] Prob-PSENNは、それらの値上の確率分布を持つプロトタイプの点推定を置き換える。
Prob-PSENNは、確率的でないものよりも有意義で堅牢な説明を提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:30:15 GMT)
Exploring Representations and Interventions in Time Series Foundation Models [17.2] 時系列基礎モデル(TSFM)は、幅広いアプリケーションのための強力なツールであることを約束する。
彼らの内部表現や学習された概念はまだよく理解されていない。
本研究では,様々なTSFMにおける表現の構造と冗長性について検討する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:24:08 GMT)
Beyond English: Unveiling Multilingual Bias in LLM Copyright Compliance [17.2] LLM(Large Language Models)は、著作権保護されたコンテンツの公正使用に関して重要な懸念を提起している。
LLMは言語間における著作権作品保護のバイアスを示すか?
特定の言語でプロンプトを使って著作権のあるコンテンツを引用するのは簡単か?
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:59:10 GMT)
EnigmaEval: A Benchmark of Long Multimodal Reasoning Challenges [17.1] エニグマエスバル(EnigmaEval)は、パズル競技やイベントから派生した問題と解決策のデータセットである。
このデータセットは、暗黙の知識合成と多段階帰納的推論を実行するモデルの能力を探索する。
ベンチマークは1184のパズルで構成されており、複雑度は様々だ。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:40:15 GMT)
SmartEdge: Smart Healthcare End-to-End Integrated Edge and Cloud Computing System for Diabetes Prediction Enabled by Ensemble Machine Learning [16.8] インターネット・オブ・メディカル・モノズ(IoMT)は,特にスマート病院や遠隔患者モニタリング(RPM)で注目されている。
必要なコンピューティングとストレージ機能を提供するためにクラウドコンピューティングに依存している現在のアプローチは、これらの遅延に敏感なアプリケーションにはスケールしない。
本稿では、AIを活用したスマートヘルスケアのエンドツーエンド統合エッジとクラウドコンピューティングシステムであるSmartEdgeを紹介し、糖尿病の予測を行う。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:42:17 GMT)
Making FETCH! Happen: Finding Emergent Dog Whistles Through Common Habitats [16.8] 犬の笛は二重の意味を持つコード化された表現である。
ソーシャルメディアコーパスにおける新規犬笛発見タスクであるFETCH!を紹介した。
本稿では,ベクトルデータベースと大規模言語モデルの強みを組み合わせた強力なベースラインシステムであるEarShotを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:43:14 GMT)
In-Context Learning of Linear Dynamical Systems with Transformers: Error Bounds and Depth-Separation [16.7] 本稿では,雑音の線形力学系群を表す変圧器の文脈内学習能力の近似論的側面について検討する。
最初の理論的結果は、タスク間で一様に定義された$L2$-testing損失に対して、多層変圧器の近似誤差の上限を確立する。
2つ目の結果は、単層線形変圧器のクラスに対する近似誤差の非最小化下界を確立することである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:54:41 GMT)
Robustness tests for biomedical foundation models should tailor to specification [16.7] 我々は、優先順位に基づくタスク指向のアプローチにより、事前定義された仕様にロバスト性評価の目的を調整することを提案する。
我々は、具体的ポリシーに対して、仕様におけるロバストネスの概念の粒度の分類を採用するよう促す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:52:10 GMT)
Labeling Synthetic Content: User Perceptions of Warning Label Designs for AI-generated Content on Social Media [16.5] 我々は,感情,色彩・色調,位置,ディテールの程度によって異なる10種類のラベルデザインサンプルを考案し,評価した。
実験では、これらの10のラベルにランダムに割り当てられた911人の被験者と、ソーシャルメディアの内容を評価する制御グループについて検討した。
その結果、ラベルの存在は、コンテンツがAIによって生成されたり、ディープフェイクされたり、編集されたりする、というユーザの信念に重大な影響を及ぼした。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:35:42 GMT)
A Survey on LLM-powered Agents for Recommender Systems [16.5] 大規模言語モデル(LLM)を利用したエージェントは、自然言語の相互作用と解釈可能な推論を可能にすることによって、有望なアプローチを提供する。
この調査は、レコメンデータシステムにおけるLSMを利用したエージェントの新たな応用の体系的なレビューを提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:57:07 GMT)
Space-aware Socioeconomic Indicator Inference with Heterogeneous Graphs [16.3] 非連続推論のための地理空間を表現するために不均一なグラフ構造を用いる空間認識型社会経済指標推論法GeoHGを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:46:31 GMT)
Stochastic Semi-Gradient Descent for Learning Mean Field Games with Population-Aware Function Approximation [16.0] 平均場ゲーム (MFGs) は人口分布を通した大規模マルチエージェントシステムにおける相互作用をモデル化する。
MFGの伝統的な学習方法は固定点反復(FPI)に基づいており、政策更新と人口分布を個別に逐次計算する。
本稿では,ゲーム力学を制御する統一パラメータとして,政策と人口を扱う新しい視点を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:41:41 GMT)
OptiMUS-0.3: Using Large Language Models to Model and Solve Optimization Problems at Scale [15.9] 本稿では,Large Language Model (LLM) を用いた自然言語記述から線形プログラミング問題の定式化と解法を提案する。
本システムでは,数理モデルの開発,ソルバコードの記述とデバッグ,生成したソリューションの評価,モデルとコードの効率性と正確性の向上を実現している。
実験によると、OptiMUS-0.3は、簡単なデータセットで12%以上、ハードデータセットで8%以上、既存の最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:41:16 GMT)
Towards a Mechanistic Explanation of Diffusion Model Generalization [15.7] 本研究では,拡散モデルの一般化動作を説明する学習自由機構を提案する。
事前学習した拡散モデルと理論上最適な経験的モデルを比較することにより、共用局所帰納バイアスを同定する。
本稿では,ネットワークの動作を再現するローカルな経験的デノイザを集約する新しいデノイケーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:20:14 GMT)
Insect-Foundation: A Foundation Model and Large Multimodal Dataset for Vision-Language Insect Understanding [15.4] 本稿では,昆虫ドメイン知識の視覚的理解を促進するために,新しい多モード対話モデルInsect-LLaVAを提案する。
提案したデータセットにより,昆虫の視覚的特徴と意味的特徴を理解することができる。
我々は,Patch-wise Relevant Attention(パッチワイド・レバレント・アテンション)機構を備えた,新しいマイクロ機能自己教師型学習を導入することで,Insect Foundation Modelを開発する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:29:17 GMT)
LoRA Training Provably Converges to a Low-Rank Global Minimum or It Fails Loudly (But it Probably Won't Fail) [15.4] 低ランク適応 (LoRA) は、大規模な基礎モデルを微調整するための標準的アプローチとなっている。
また,LoRAトレーニングは,低ランクで大小のグローバル・ミニマライザに収束することを示した。
LoRAトレーニングにおけるゼロ初期化と重み劣化は、低ランクで小さなマグニチュード領域に対して暗黙の偏りを生じさせると論じる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:39:04 GMT)
Efficient Quantum Frequency Conversion of Ultra-Violet Single Photons from a Trapped Ytterbium Ion [15.2] トラップされたYb$+$イオンから放出される紫外光子の高効率差周波変換を可視域に示す。
この結果は、Yb$+$イオンに基づく長距離捕捉型イオン量子ネットワークの実現に向けた重要なステップを提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:27:40 GMT)
Learning Strategy Representation for Imitation Learning in Multi-Agent Games [15.2] 本稿では,マルチエージェントゲームにおける戦略表現を効果的に学習するSTRIL(Strategy Representation for Learning)フレームワークを紹介する。
STRILは既存のILアルゴリズムに統合可能なプラグインメソッドである。
2人プレイのPong、Limit Texas Hold'em、Connect Fourなど、競合するマルチエージェントシナリオにおけるSTRILの有効性を実証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:22:03 GMT)
An Information Theoretic Perspective on Conformal Prediction [15.2] コンフォーマル予測(CP)は、ユーザが特定した確率で真の答えを含むことが保証される予測セットを構成する。
本研究では,情報理論を利用して共形予測と不確実性の概念を結びつける。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:49:05 GMT)
How Privacy-Savvy Are Large Language Models? A Case Study on Compliance and Privacy Technical Review [15.2] プライバシ情報抽出(PIE)、法および規制キーポイント検出(KPD)、質問応答(QA)などのプライバシー関連タスクにおいて、大規模言語モデルの性能を評価する。
本稿では, BERT, GPT-3.5, GPT-4, カスタムモデルなど, プライバシコンプライアンスチェックや技術プライバシレビューの実行能力について検討する。
LLMは、プライバシーレビューの自動化と規制上の相違点の特定を約束する一方で、法律標準の進化に完全に準拠する能力において、大きなギャップが持続している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:02:14 GMT)
Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification [15.1] 本稿では,動的少ショットテキスト分類のためのグラフベースのオンライン検索拡張生成フレームワークであるGORAGを提案する。
GORAGは、すべてのターゲットテキストの側情報を抽出して重み付きグラフを構築し、維持する。
実証的な評価は、GORAGがより包括的で正確な文脈情報を提供することで、既存のアプローチよりも優れていることを示している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:32:00 GMT)
STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection [14.9] 中国語ヘイトスピーチのきめ細かい検出方法を提案する。
まず,ターゲット・Argument-Hateful-Group Quaruples(STATE ToxiCN)を含むデータセットを構築する。
次に,既存モデルのヘイトスピーチ検出性能について検討した。
最後に,中国のヘイトフルスラングに関する最初の研究を行い,LLMがそのような表現を検出する能力を評価する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:03:43 GMT)
VicKAM: Visual Conceptual Knowledge Guided Action Map for Weakly Supervised Group Activity Recognition [14.7] 既存のグループアクティビティ認識手法は、重要な領域を自動キャプチャするためにオブジェクト検出器やアテンション機構に依存している。
VicKAM(Visual Conceptual Knowledge Guided Action Map)という新しいフレームワークを提案する。
VicKAMは、個々のアクションの位置を効果的に捕捉し、弱い教師付きグループ活動認識のためのアクションセマンティクスと統合する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:49:06 GMT)
Auto.gov: Learning-based Governance for Decentralized Finance (DeFi) [14.7] Auto.govは学習ベースのガバナンスフレームワークで、Q-ネットワーク強化学習(RL)戦略を用いて半自動データ駆動パラメータ調整を行う。
実世界のデータを用いたテストでは、Auto.govはベンチマークアプローチを少なくとも14%上回り、静的ベースラインモデルは10倍に向上している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:42:54 GMT)
Contrastive Federated Learning with Tabular Data Silos [14.4] 本稿では,垂直分割データサイロから学習するためのソリューションとして,タブラルデータサイロを用いたコントラシブ・フェデレート・ラーニング(CFL)を提案する。
CFLは、プライバシを維持するためにオリジナルのデータや代表データの共有を必要とせずに、サンプルのミスアライメントを伴うデータサイロのソリューションを提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:25:19 GMT)
Towards Automated Cross-domain Exploratory Data Analysis through Large Language Models [14.2] 本稿では,自動クロスドメイン探索データ分析システムであるTiInsightについて述べる。
TiInsightは、GPT-4を用いてスパイダーデータセット上で86.3%の階層的実行精度を達成した。
また、Birdデータセット上での最先端のパフォーマンスも示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:49:05 GMT)
Tempo: Helping Data Scientists and Domain Experts Collaboratively Specify Predictive Modeling Tasks [14.1] 我々は、データサイエンティストとドメインエキスパートがモデル仕様について協力するのを支援する対話型システムであるTempoを開発した。
データサイエンティストは、事前処理の選択についてより透明性の高い仕様を迅速にプロトタイプできる。
ドメインエキスパートは、モデルが期待通りに振る舞うことを検証するために、データサブグループ内のパフォーマンスを評価することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:44:37 GMT)
Misspecification-robust likelihood-free inference in high dimensions [13.9] 本稿では,ベイズ最適化に基づく近似離散関数の確率的手法による拡張を提案する。
提案手法は,高次元パラメータ空間に対する計算スケーラビリティを,各パラメータの別個の取得関数と相違点を用いて達成する。
本手法は,100次元空間における標準例による計算効率のよい推論を成功させ,既存のモジュール化ABC法と比較した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:25:24 GMT)
Linear Mode Connectivity in Differentiable Tree Ensembles [13.7] 線形モード接続性(英: Linear Mode Connectivity, LMC)は、パラメータ空間における線形補間モデルに対して一貫して存在する現象である。
我々はまず,木に基づく微分可能モデルであるソフトツリーニューロンのLCCを実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:13:55 GMT)
Forget the Data and Fine-Tuning! Just Fold the Network to Compress [13.6] 構造的に類似したニューロンを層にマージする新しいデータフリーモデル圧縮技術であるモデルフォールディングを導入する。
モデル折り畳みはデータ駆動圧縮技術に匹敵する性能を示し,最近提案したデータフリー手法よりも優れていた。
このアプローチは大規模モデルを圧縮するのに特に有効であり、資源制約された環境への展開に適している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:10:43 GMT)
Eidetic Learning: an Efficient and Provable Solution to Catastrophic Forgetting [13.4] 本稿では,破滅的な忘れを確実に解決する方法であるEidetic Learningを提案する。
Eidetic Learningでトレーニングされたネットワーク – ここではEideticNet – は、リハーサルやリプレイを必要としない。
EideticNetは実装とトレーニングが容易で、効率的で、パラメータの数で時間と空間の複雑さが線形である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:39:22 GMT)
Pitfalls of Evidence-Based AI Policy [13.4] 目的がエビデンスベースのAIポリシーであるなら、第一の規制目標は、AIリスクを特定し、研究し、検討するプロセスを積極的に促進することである、と我々は主張する。
これを促進するために、ブラジル、カナダ、中国、EU、韓国、英国、米国がそれぞれ、さらなる証拠調査政策を採用する実質的な機会を持っていることを示すための15の規制目標について論じる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:01:40 GMT)
QTSeg: A Query Token-Based Dual-Mix Attention Framework with Multi-Level Feature Distribution for Medical Image Segmentation [13.4] 医用画像のセグメンテーションは、正確な診断と自動診断プロセスの実現を医療専門家に支援する上で重要な役割を担っている。
従来の畳み込みニューラルネットワーク(CNN)は、長い範囲の依存関係をキャプチャするのに苦労することが多い。
近年の取り組みはCNNとトランスフォーマーを組み合わせて性能と効率のバランスをとることに重点を置いているが、既存の手法は計算コストを低く抑えながら高いセグメンテーション精度を達成するという課題に直面している。
ローカルおよびグローバルな情報を効果的に統合する医療画像セグメンテーションのための新しいアーキテクチャであるQTSegを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:03:10 GMT)
RareAgents: Advancing Rare Disease Care through LLM-Empowered Multi-disciplinary Team [13.3] 希少な病気が世界中で約3億人に影響を与えている。
近年,大規模言語モデル (LLM) を利用したエージェントが,様々な領域にまたがる顕著な応用を実証している。
RareAgentsは、Llama-3.1-8B/70Bをベースモデルとして、MDT(Advanced Multidisciplinary Team)のコーディネーション、メモリメカニズム、医療ツールの利用を統合する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:40:39 GMT)
Topological Neural Networks over the Air [13.3] トポロジカルニューラルネットワーク(TNN)は、トポロジカル空間上のデータから表現をモデル化する情報処理アーキテクチャである。
本稿では,無線通信モデルをアーキテクチャに組み込んだ,常連セルコンプレックスを用いた新しいTNN設計を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:45:36 GMT)
Navigating Label Ambiguity for Facial Expression Recognition in the Wild [13.2] 本研究では,NLA(Navigating Label Ambiguity)と呼ばれる,現実世界の環境下で堅牢な新しいフレームワークを提案する。
NLAの背景にある動機は、各イテレーションであいまいなサンプルを動的に推定し強調することは、ノイズとクラス不均衡を軽減することである。
大規模な実験は、NLAが既存の手法を総合的および平均的精度で上回ることを示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:24:38 GMT)
RTBAS: Defending LLM Agents Against Prompt Injection and Privacy Leakage [13.0] 既存のディフェンス(OpenAI GPT)は、すべてのツールコールの前にユーザ確認を必要とする。
我々はRTBAS(Robust TBAS)を導入し,完全性と機密性を維持するツールコールを自動的に検出し,実行する。
これらの課題を克服するために、LM-as-a-judge と attention-based saliency という2つの新しい依存性スクリーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:16:40 GMT)
KGGen: Extracting Knowledge Graphs from Plain Text with Language Models [12.9] 抽出されたKGの空間性を低減するために,関連エンティティをクラスタリングするテキスト・ツー・KGジェネレータ(KGGen)を提案する。
KGGenはPythonライブラリ(textttpip install kg-gen)として利用可能で、誰でもアクセスできる。
KGGenとともに、最初のベンチマークである、ノードとエッジにおける情報の計測(MINE)をリリースし、プレーンテキストから有用なKGを生成する抽出器の能力をテストする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:28:08 GMT)
Zero-Knowledge Proof Frameworks: A Systematic Survey [12.9] Zero-Knowledge Proofs (ZKPs) は暗号プリミティブであり、証明者が秘密そのものについて何も明らかにせずに、秘密の値の知識を検証者に示すことができる。
ZKPは、業界と学術の両方で実証されているように、非常に強力なツールである。
これらのフレームワークの機能と実世界のアプリケーションを理解するには、依然として大きなギャップがあります。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:55:36 GMT)
Rethinking Conventional Wisdom in Machine Learning: From Generalization to Scaling [12.8] 大規模言語の事前学習とスケーリング法則の発見は、機械学習のパラダイムシフトを表している。
本稿では,スケール中心の大規模言語モデル (LLM) 時代においてもはや成り立たないような,レギュラー化に基づくいくつかの重要な原則について検討する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:54:23 GMT)
Janus: Collaborative Vision Transformer Under Dynamic Network Environment [12.8] ビジョントランスフォーマー(ViT)は、従来の畳み込みニューラルネットワークアーキテクチャよりも優れており、様々なコンピュータビジョンタスクにおいて最先端の結果を達成した。
ViTは計算コストがかかるため、リソース制限されたエッジデバイス上でのみ動作させるか、変動するネットワークを介して送信された生データを受信した後、リモートクラウドサーバで実行する必要がある。
我々は、動的ネットワーク上での低レイテンシクラウド-デバイス協調型ビジョントランスフォーマー推論のための最初のフレームワークであるJanusを紹介する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:49:52 GMT)
Self-Supervised Learning for Neural Topic Models with Variance-Invariance-Covariance Regularization [12.8] 本研究では,NTMのパワーと正規化された自己教師型学習手法を組み合わせた自己教師型ニューラルネットワーク(NTM)を提案する。
NTMは、ドキュメント内の単語の後ろに隠された潜在トピックをニューラルネットワークで学習する。
我々のモデルは、定量的にも質的にも、ベースラインや最先端モデルよりも優れています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:47:37 GMT)
FreeBlend: Advancing Concept Blending with Staged Feedback-Driven Interpolation Diffusion [12.7] 概念ブレンディングは、生成モデルにおいて、有望だが未発見の領域である。
FreeBlendは、これらの課題に対処するために設計された、効果的な、トレーニング不要のフレームワークです。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:17:12 GMT)
Nonasymptotic CLT and Error Bounds for Two-Time-Scale Stochastic Approximation [12.7] We consider linear two-time-scale approximation algorithm driven by martingale noise。
我々は、PolyakRuppert平均化を用いた2時間スケール近似のためのワッサーシュタイン-1距離に関する最初の漸近的中心極限定理を導出した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:20:30 GMT)
MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling [12.2] 大規模言語モデル(LLM)のための汎用エージェントアーキテクチャであるMeNTiを紹介する。
MeNTiは特殊な医療ツールキットを統合し、メタツールとネスト呼び出し機構を使用してLSMツールの利用を促進する。
計算機シナリオの臨床過程におけるLCMの定量的評価能力を評価するために,CalcQAを紹介する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:27:25 GMT)
Representation Learning on Out of Distribution in Tabular Data [11.9] 本稿では,標準CPUハードウェア上で効率よく動作する軽量で効率的なソリューションTCLを提案する。
FT-Transformer や ResNet など,TCL が既存のモデルよりも優れていることを示す。
また,本研究では,簡単な実験と可視化によるOODデータの検出と評価の実践的ガイダンスも提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:36:04 GMT)
From Deep Additive Kernel Learning to Last-Layer Bayesian Neural Networks via Induced Prior Approximation [11.9] 本稿では,最終層GPの付加構造を組み込んだDep Additive Kernel (DAK) モデルを提案する。
提案手法は,DKLの解釈性と,BNNの計算上の利点を享受する。
実験結果から,提案手法は回帰タスクと分類タスクの両方において最先端のDKL法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:14:17 GMT)
SWA-LDM: Toward Stealthy Watermarks for Latent Diffusion Models [11.9] 埋め込みプロセスのランダム化によって透かしを強化する新しい手法であるSWA-LDMを紹介する。
提案する透かし攻撃は,既存の潜水式透かし法の本質的脆弱性を明らかにする。
この研究は、LDM生成画像の不正使用に対する保護に向けた重要なステップである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:55:45 GMT)
Identifiable Steering via Sparse Autoencoding of Multi-Concept Shifts [11.8] ステアリング法は、大きな言語モデル(LLM)の表現を操作して、望ましい特性を持つ応答を誘導する。
伝統的に、ステアリングは、単一のターゲット概念で異なる対照的なプロンプトのペアなど、監督に依存してきた。
Sparse Shift Autoencoders (SSAE)を導入し、その代わりに埋め込みの違いをスパース表現にマッピングする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:49:41 GMT)
VT-GAN: Cooperative Tabular Data Synthesis using Vertical Federated Learning [11.8] VFLは、異なるデータホルダー間で機械学習モデルをトレーニングするための協調的なアプローチである。
本稿では,VT-GANフレームワークであるVertical Federated Tabular GANを紹介し,VFLがGANの実装に有効であることを示す。
機械学習ユーティリティの違いは、極めて不均衡なデータ分散の下でも、最大2.7%まで小さくすることができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:05:36 GMT)
Dimension-free Score Matching and Time Bootstrapping for Diffusion Models [11.7] 拡散モデルは、様々な雑音レベルにおける対象分布のスコア関数を推定してサンプルを生成する。
本研究では,これらのスコア関数を学習するために,次元自由なサンプル境界の複雑性を初めて(ほぼ)確立する。
我々の分析の重要な側面は、ノイズレベル間でのスコアを共同で推定する単一関数近似器を使用することである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:32:22 GMT)
Learning to Decouple Complex Systems [11.7] 本研究では,不規則なサンプルや散逸した逐次観測を扱うための逐次学習手法を提案する。
我々は、単純体の中で進化するメタシステムは射影微分方程式(ProjDEs)によって支配されると主張する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:43:23 GMT)
Prompt-based Depth Pruning of Large Language Models [11.5] 我々はPuDDing(Prompt-routed Dynamic Depth Pruning)と呼ばれる動的深度解析アルゴリズムを開発し、入力プロンプトに基づいてモデルからどのブロックを省略するかを決定する。
コモンセンス推論ベンチマークの実証的な結果から、PuDDingは推論言語モデルを効果的に加速し、静的深さプルーニングベースラインよりもタスク上での性能が向上することが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:46:43 GMT)
Efficient Zero-Order Federated Finetuning of Language Models for Resource-Constrained Devices [11.5] エッジデバイス上での微調整大型言語モデル(LLM)は、高いメモリ、通信、計算要求のために依然として困難である。
ネットワークを2つのブロックに分割し,ブロック毎に異なる数の摂動を適用するフェデレート分割摂動ゼロオーダー最適化(FedSPZO)を提案する。
我々の評価では、フェデレート学習における技術技術のゼロオーダー状態と比較すると、計算オーバーヘッドの2.5~7倍の削減効果が示される。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:49:02 GMT)
Autoware.Flex: Human-Instructed Dynamically Reconfigurable Autonomous Driving Systems [11.5] 本稿では,人間の入力を駆動プロセスに組み込んだ新しい自律運転システム(ADS)であるAutoware$.$Flexを提案する。
1)自然言語で表現された人間の指示を、ADSが理解できる形式に翻訳し、(2)これらの命令が安全かつ一貫して実行されることを保証する。
シミュレータと現実の自動運転車の両方で実施された実験は、Autoware$.$Flexが人間の指示を効果的に解釈し、安全に実行することを示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:12:12 GMT)
Using MRNet to Predict Lunar Rock Categories Detected by Chang'e 5 Probe [11.4] チャン5号のミッションで選ばれたオセアヌス・プロセララムには、様々な種類の岩石が含まれている。
データセットには100の画像が含まれており、ランダムにトレーニング、検証、テストセットに分割されている。
本稿では,月面画像のグローバル情報をフル活用するためにMRNetネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:12:19 GMT)
ManiTrend: Bridging Future Generation and Action Prediction with 3D Flow for Robotic Manipulation [11.2] 3次元流れは、シーン内の3次元粒子の動きの傾向を表す。
ManiTrendは3D粒子、視覚観察、操作動作のダイナミクスをモデル化する統合フレームワークである。
提案手法は最先端の性能を高い効率で達成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:13:57 GMT)
EQ-VAE: Equivariance Regularized Latent Space for Improved Generative Image Modeling [11.1] 潜在生成モデルは、イメージを潜在空間に圧縮するためのオートエンコーダに依存し、次いで、潜在分布を学習するための生成モデルが続く。
EQ-VAE(EQ-VAE)は、遅延空間における等式を強制し、再構成品質を劣化させることなく、その複雑さを低減させる単純な正規化手法である。
DiT, SiT, REPA, MaskGITなどの最先端生成モデルの性能を向上し, SD-VAE微調整を5回だけ行うことで, DiT-XL/2上で7回の高速化を実現した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:48:01 GMT)
Process Reward Models for LLM Agents: Practical Framework and Directions [11.0] エージェントプロセス・リワード・モデル (AgentPRM) を導入する。
InversePRMを提案する。これは、明示的な結果の監督なしに、デモから直接プロセス報酬を学習する。
ALFWorldベンチマークで評価したところ、AgentPRMとInversePRMで訓練された3Bモデルは、強力なGPT-4oベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:34:28 GMT)
RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control [10.9] RealCam-I2Vは拡散型ビデオ生成フレームワークである。
単分子距離深度推定を統合し、前処理ステップで3次元シーン再構成を確立する。
トレーニング中、再構成された3Dシーンは、絶対値に対するカメラパラメータのスケーリングを可能にする。
RealCam-I2Vは、RealEstate10Kおよびドメイン外画像の制御性とビデオ品質を大幅に改善する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:21:49 GMT)
AdaPTS: Adapting Univariate Foundation Models to Probabilistic Multivariate Time Series Forecasting [10.9] 本稿では,機能間の複雑な依存関係を管理し,予測の不確実性を定量化するアダプタを提案する。
合成データセットと実世界のデータセットの両方で実施された実験により、アダプタの有効性が確認された。
私たちのフレームワークであるAdaPTSは、アダプタをモジュール的でスケーラブルで効果的なソリューションとして位置づけています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:46:19 GMT)
Small Models, Big Impact: Efficient Corpus and Graph-Based Adaptation of Small Multilingual Language Models for Low-Resource Languages [10.4] 低リソース言語(LRL)は、限られたデータのために自然言語処理(NLP)において重大な課題に直面している。
現在の最先端の大規模言語モデル(LLM)は、まだLRLと競合している。
mBERTやXLM-Rのような小さなマルチリンガルモデル(mLM)は、トレーニングデータサイズに適合する能力が向上するため、より有望である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:10:39 GMT)
Bag of Tricks for Inference-time Computation of LLM Reasoning [10.4] 複雑度の異なる推論タスクに対して,様々な推論時間計算戦略を検証・ベンチマークする。
我々のアブレーション研究は、これまで見過ごされていた戦略が性能を大幅に向上させることができることを示している。
我々は,8つの推論タスクにまたがる6つの代表的手法を体系的に評価することにより,推論時間計算の標準ベンチマークを確立する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:37:00 GMT)
A Consolidated Volatility Prediction with Back Propagation Neural Network and Genetic Algorithm [10.2] 本稿では,バックプロパゲーションニューラルネットワークと遺伝的アルゴリズムを併用した統合モデルを構築し,新興市場の将来的ボラティリティを予測する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:17:07 GMT)
Generative Models, Humans, Predictive Models: Who Is Worse at High-Stakes Decision Making? [10.2] 大規模な生成モデル(LM)は、これまで予測モデルや人間によって行われていた意思決定タスクに既に使用されている。
我々は、高い意思決定タスクである再帰的予測において、人気のあるLMをテストに投入した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:41:23 GMT)
Context-Aware or Context-Insensitive? Assessing LLMs' Performance in Document-Level Translation [10.2] 大規模言語モデル(LLM)は、機械翻訳においてますます強力な競争相手となっている。
文章の外部からの文脈なしには、いくつかの単語を翻訳できない文書レベルの翻訳に焦点を当てる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:15:13 GMT)
Proper Learnability and the Role of Unlabeled Data [10.2] 適切な学習可能性が論理的に決定不可能な問題、すなわちZFC公理に依存しない問題が存在することを示す。
そこで本研究では,PACモデルにおいて,適切な学習可能性の特性を損なう不確実性に関するすべての結果を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:41:53 GMT)
Beyond the Singular: The Essential Role of Multiple Generations in Effective Benchmark Evaluation and Analysis [10.1] 大規模言語モデル(LLM)は、現実世界のアプリケーションにおいて重要なユーティリティを実証している。
LLMの能力を評価するにはベンチマーク評価が不可欠である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:10:00 GMT)
Uncertainty-Aware Critic Augmentation for Hierarchical Multi-Agent EV Charging Control [10.0] ビルとEVの両方のエネルギー需要を規制する新しいリアルタイム充電制御であるHUCAを提案する。
HUCAは階層的なアクタークリティカルネットワークを使用して、動的価格シナリオにおけるEV充電の必要性を考慮して、建物の電力コストを動的に削減する。
実世界の電気データセットのシミュレーションと不確実な離脱シナリオによる実験により、HUCAは総電力コストにおいてベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:12:45 GMT)
Small Loss Bounds for Online Learning Separated Function Classes: A Gaussian Process Perspective [9.9] そこで本研究では,従来の研究よりも高い一般化率で低損失境界を達成できるオラクル効率のアルゴリズムを提案する。
また,この分離条件下では,最適な学習率が得られる差分プライベート学習の変種も提示する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:52:50 GMT)
THESAURUS: Contrastive Graph Clustering by Swapping Fused Gromov-Wasserstein Couplings [9.8] We present conTrastive grapH clustEring by SwApping fUsed gRomov-wasserstein couplingS (THESAURUS)
本手法では,コンテキスト情報を提供するためのセマンティックプロトタイプを導入し,クロスビュー代入予測プレテキストタスクを採用する。
これはGromov-Wasserstein Optimal Transport (GW-OT) と提案したプロトタイプグラフを利用して、グラフ構造のクラスタ情報を徹底的に活用する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:40:30 GMT)
Mechanistic Unveiling of Transformer Circuits: Self-Influence as a Key to Model Reasoning [9.8] このような課題を解決するために言語モデルでどのような多段階推論機構が使われているのかはいまだ不明である。
回路解析と自己影響関数を用いて、推論過程を通して各トークンの変動の重要性を評価する。
提案手法は,モデルが使用する人間の解釈可能な推論過程を明らかにする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:46:53 GMT)
CMRNext: Camera to LiDAR Matching in the Wild for Localization and Extrinsic Calibration [9.7] CMRNextはカメラ-LIDARマッチングの新しいアプローチであり、センサー固有のパラメータとは独立しており、一般化可能であり、野生で使用することができる。
3つの公開データセットと3つの社内ロボットを含む6つの異なるロボットプラットフォーム上でCMRNextを広範囲に評価した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:23:35 GMT)
Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning [9.7] 我々はオオカミ狩猟戦略に触発されたWolfpack Adversarial Attackフレームワークを提案する。
我々はまた、Wolfpack-Adversarial Learning for MARLフレームワークを導入し、提案したWolfpack攻撃に対して堅牢なMARLポリシーをトレーニングする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:27:24 GMT)
Floquet Engineering and Harnessing Giant Atoms in Frequency-Comb Emission and Bichromatic Correlations in Waveguide QED [9.6] 我々は動的に変調された量子ビットアレイを考察し、周波数制御された単一光子放射を実現する。
また、周波数フィルタ量子相関におけるパリティ依存的な束縛と反バンチングも提供する。
この研究は、集合放出の分野を根本的に拡張し、周波数符号化された量子情報処理の実装に広く応用されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:18:54 GMT)
A Scoresheet for Explainable AI [9.5] 本稿では、説明可能性要件の特定や、特定のアプリケーションに提供される説明可能性側面の評価に使用できるスコアシートを開発する。
スコアシートは、様々な利害関係者の要求を考慮して開発され、マルチエージェントシステムや他のAI技術にも適用できる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:08:10 GMT)
End-to-End Learning Framework for Solving Non-Markovian Optimal Control [9.2] 本稿では、FOLTIシステムのための革新的なシステム識別方法制御戦略を提案する。
また、最初のエンドツーエンドデータ駆動学習フレームワークであるFractional-Order Learning for Optimal Control(FOLOC)も開発しています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:18:11 GMT)
SuperMerge: An Approach For Gradient-Based Model Merging [9.1] ChatGPT、Claude、LLaMAといった大規模な言語モデルは巨大なモノリシックで、何千ものタスクを同時にサポートする超能力を持っている。
タスク固有のモデルを使用する場合の課題のひとつは、モデルが既存のタスクにすでにデプロイされている後、新しいタスクを解決するための漸進的な必要性である。
SuPERMERGEと呼ばれるモデルマージ方式を提案する。
SuPERMERGEは、自然言語処理やコンピュータビジョンタスクにおいて、既存のモデルマージ手法よりも優れていることを実験的に実証した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:40:13 GMT)
On the Statistical Complexity of Estimating Vendi Scores from Empirical Data [9.1] Vendiスコアは、行列ベースのエントロピー測度を用いて生成されたデータの多様性を定量化するソリューションを提供する。
ベンディスコアは通常、$n$生成されたサンプルに対して$n倍n$のカーネル行列の固有分解によって計算される。
我々は,既存のNystr"om法とFKEA近似法を用いて,Vendiスコアを近似する手法が,共に人口減少のVendiスコアに収束することを示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:19:05 GMT)
OpenEMMA: Open-Source Multimodal Model for End-to-End Autonomous Driving [9.1] マルチモーダル大言語モデル(MLLM)に基づくオープンソースのエンドツーエンドフレームワークであるOpenEMMAを提案する。
OpenEMMAは、Chain-of-Thought推論プロセスを導入することで、ベースラインよりも大幅に改善されている。
OpenEMMAは、様々な挑戦的な運転シナリオにおいて、有効性、一般化可能性、堅牢性を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:22:47 GMT)
Efficient Multitask Learning in Small Language Models Through Upside-Down Reinforcement Learning [9.0] 小型言語モデル (SLM) はマルチタスクのプロンプト生成タスクにおいて競合性能を達成することができる。
Llama-3, Qwen2, Mistral など最先端モデルの 5% 以内の妥当性スコアを達成できる SLM のトレーニングを行う。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:39:45 GMT)
Probing Perceptual Constancy in Large Vision Language Models [8.8] 色,サイズ,形状の3領域にわたる253個の実験を用いて,33個の視覚言語モデル(VLM)を評価した。
VLMでは,色や大きさの相違が明らかで,形状の相違が顕著であった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:31:43 GMT)
Batch-Adaptive Annotations for Causal Inference with Complex-Embedded Outcomes [8.8] 結果に対する介入の因果効果を推定することが重要である。
しかし、医療やソーシャルサービスといった領域では、この結果に関する重要な情報は、構造化されていないテキストによって文書化されることが多い。
大規模言語モデル(LLM)の最近の進歩は、スケーラブルだが非構造化テキストデータの不正確なアノテーションを可能にする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:25:35 GMT)
TaskGalaxy: Scaling Multi-modal Instruction Fine-tuning with Tens of Thousands Vision Task Types [8.8] マルチモーダルビジュアル言語モデルは、モデルアーキテクチャの進歩、トレーニング技術、高品質なデータによって推進され、オープンワールドのアプリケーションで注目を集めている。
微調整データセットにおけるタスクの多様性を高めるための既存の取り組みは、手作業ラベリングの労働集約的なプロセスによって妨げられている。
本研究では,19,227の階層型タスクタイプと413,648のサンプルからなる大規模マルチモーダル命令微調整データセットであるTaskGalaxyを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:32:46 GMT)
AlphaPO - Reward shape matters for LLM alignment [8.7] textbfAlphaPOは、標準的なログ報酬以外の報酬関数の形状を変えるのに役立つ新しいDAAである。
最高のパフォーマンスを持つDAAの1つであるSimPOと比較して、AlphaPOはアライメント性能が7%から10%向上した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:35:48 GMT)
Sum-of-Parts: Self-Attributing Neural Networks with End-to-End Learning of Feature Groups [8.7] Sum-of-Partsは、任意の差別化可能なモデルをグループベースのSANNに変換するフレームワークである。
SOPは、視覚および言語タスクにおけるSANNの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:20:20 GMT)
On Volume Minimization in Conformal Regression [8.7] 分割共形回帰における体積最適性の問題について検討する。
まず、古典分割法により返される区間の余剰体積損失に基づいて、有限サンプル上界を導出する。
EffOrtは学習ステップを変更する手法で、基本予測関数が選択され、返却間隔の長さを最小化する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:14:22 GMT)
Pavlok-Nudge: A Feedback Mechanism for Atomic Behaviour Modification with Snoring Usecase [8.6] 本稿では,まず,軽量なディープラーニングモデルを用いて対象の動作を検知し,その後Pavlokを通じてユーザを搾取するフレームワークを提案する。
提案手法は,いびきの文脈で実装し,検証する。
この予測に基づき、睡眠姿勢の変化などの予防対策として、利用者を苦しめるためにパヴロクを用いている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:24:07 GMT)
Data-driven Super-Resolution of Flood Inundation Maps using Synthetic Simulations [8.5] 物理シミュレーションにより得られた高品質な合成データを用いてモデルを訓練する。
アイオワ州の洪水イベントから得られた実世界のデータに基づいて,我々のモデルを評価した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:16:39 GMT)
Learning to Calibrate for Reliable Visual Fire Detection [8.5] 火災は突然の発火と破壊力によって特徴付けられ、早期の火災検知は人間の安全と保護の確保に不可欠である。
ディープラーニングモデルは、しばしば過剰な自信を示す傾向を示し、既存のほとんどの研究は、主に分類性能の向上に焦点を当てている。
本研究では,不確実性を測定する指標である期待誤差(ECE)を微分可能なCE損失関数に変換することを提案する。
この損失とクロスエントロピーの損失が組み合わされ、多クラス火災検知モデルの訓練プロセスが導かれる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:45:16 GMT)
Accuracy and Political Bias of News Source Credibility Ratings by Large Language Models [8.4] 本稿では,3つの主要なプロバイダから9つの広く使用されている言語モデル(LLM)を評価し,信頼性および高品質な情報ソースを識別する能力を評価する。
より大規模なモデルは、情報不足のために評価の提供を拒否する傾向にあるのに対して、より小さなモデルは、評価においてエラーを起こす傾向にある。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:00:08 GMT)
Data Valuation using Neural Networks for Efficient Instruction Fine-Tuning [8.3] 影響関数はモデルトレーニングに重要な洞察を与える。
既存の手法は計算コストが大きく、一般化が限られている。
本稿では、ニューラルネットワークを用いて影響値を推定し、最大99%のコスト削減を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:55:47 GMT)
Decision Information Meets Large Language Models: The Future of Explainable Operations Research [8.2] 本稿では,動作可能で理解可能な説明を重視した包括的フレームワーク,説明可能な操作研究(EOR)を提案する。
EORの中核は決定情報(Decision Information)の概念であり、それは何の分析から生まれ、複雑な制約の影響を評価することに焦点を当てている。
我々は,オペレーション・リサーチにおける説明と分析の有効性を厳格に評価するために,最初の産業ベンチマークを導入する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:25:06 GMT)
Prediction hubs are context-informed frequent tokens in LLMs [8.1] 疎遠性(はちちちち、英: Hubness)は、高次元データに標準距離測定を適用する際に生じる、不均等な点の最も近い近傍の傾向である。
自己回帰型大言語モデル(LLM)は高次元表現で機能するので、それらがハブ性にも影響されるかどうかを問う。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:52:41 GMT)
Improved Online Confidence Bounds for Multinomial Logistic Bandits [8.1] 本稿では,MNLモデルに対するオンライン信頼度の向上を提案する。
この結果をMNLブレイビットに適用し,変分依存性の最適後悔を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:01:12 GMT)
Combinatorial Reinforcement Learning with Preference Feedback [8.1] そこでは,学習エージェントが順次,複数の項目をユーザへ割り当てるアクションを提示する,優先的なフィードバックによる強化学習を検討する。
本枠組みは,(1)各項目の未知の値,(2)選択性を維持しながら楽観性を確保することの難しさ,の2つの課題に直面する。
本稿では,これらの課題に対処し,統計的に効率的なアルゴリズムMNL-VQLを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:37:02 GMT)
AttenGluco: Multimodal Transformer-Based Blood Glucose Forecasting on AI-READI Dataset [8.1] 糖尿病は、持続的な高血糖値(BGL)を特徴とする慢性代謝異常である
近年のディープラーニングモデルでは,BGL予測の改善が期待できる。
本研究では,長期血糖予測のためのマルチモーダルトランスフォーマーベースのフレームワークであるAttenGlucoを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:07:38 GMT)
MTLM: an Innovative Language Model Training Paradigm for ASR [8.0] 本稿では、従来の一方向のLMが左右のコンテキストを完全に活用できるような、LMのトレーニング手法を提案する。
一方向のLMと比較して、私たちのLMは、ASRがより一貫して、より意味的に曖昧な方法で仮説を転写するのを促進します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:21:10 GMT)
Forecasting time series with constraints [7.8] 時系列予測は、従来の機械学習アルゴリズムの有効性を制限するユニークな課題を示す。
本稿では,時系列予測における線形制約の統合と統合のための統合フレームワークを提案する。
制約付き経験的リスクの正確な最小化は線形代数だけで効率的に計算できることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:18:17 GMT)
Do Large Language Models Reason Causally Like Us? Even Better? [7.7] 大きな言語モデル(LLM)は、人間のようなテキストを生成する際、印象的な能力を示している。
我々は,コライダーグラフに基づくタスクを用いて,人間と4つのLDMの因果推論を比較した。
LLMは、モデル、コンテキスト、タスクに基づくアライメントシフトを伴って、人間のようなスペクトルから規範的推論へと因果関係を推論する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:09:15 GMT)
SPIRIT: Short-term Prediction of solar IRradIance for zero-shot Transfer learning using Foundation Models [7.6] 太陽放射予測に基礎モデルを活用する新しい手法を提案する。
提案手法は,ゼロショットトランスファー学習における最先端モデルを約70%向上させ,過去のデータに頼ることなく,新しい場所での効果的なパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:10:17 GMT)
Boosting Graph Neural Network Expressivity with Learnable Lanczos Constraints [7.6] グラフニューラルネットワーク(GNN)はグラフ構造化データの処理に優れるが、リンク予測タスクでは性能が劣ることが多い。
グラフラプラシア行列の固有基底に誘導された部分グラフを埋め込むことによりGNNの表現性を高める新しい手法を提案する。
本研究では,2-WLで区別できないグラフを,効率的な時間的複雑性を維持しながら識別できることを実証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:08:20 GMT)
An Interactive Framework for Implementing Privacy-Preserving Federated Learning: Experiments on Large Language Models [7.5] フェデレートラーニング(FL)は、ユーザのデータをローカルデバイスに保存することで、プライバシを高める。
最近の攻撃は、トレーニング中にユーザーが共有したアップデートが、データに関する重要な情報を明らかにすることを実証している。
プライバシ実践者としての人間エンティティを統合し,モデルのプライバシとユーティリティの最適なトレードオフを決定するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:52:34 GMT)
LiSA: Leveraging Link Recommender to Attack Graph Neural Networks via Subgraph Injection [7.5] 本稿では,GNNシステム内のリンクレコメンデータとノード分類の両方を欺くために,孤立したサブグラフを注入する新たな逆シナリオを提案する。
本稿では,2つの対向目的を同時に満たすために,二重サロゲートモデルと双方向最適化を用いたLiSAフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:10:36 GMT)
SciClaimHunt: A Large Dataset for Evidence-based Scientific Claim Verification [7.4] 本稿では,SciClaimHuntとSciClaimHunt_Numの2つの大規模データセットを紹介する。
本稿では,これらのデータセットの有効性を評価するために,科学的クレーム検証に適したベースラインモデルをいくつか提案する。
SciClaimHuntとSciClaimHunt_Numで訓練されたモデルと既存の科学的クレーム検証データセットを比較し,その品質と信頼性を評価する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:34:26 GMT)
Physics-Informed Generative Modeling of Wireless Channels [7.4] 無線チャネルの物理関連圧縮性と疎ベイズ生成モデル(SBGM)を組み合わせたモデルを提案する。
本手法は,既定のオンライン操作中にアクセスポイント(AP)が受信した圧縮観測から学習することができる。
物理的に解釈可能で、再トレーニングを必要とせずに任意のシステム構成に一般化する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:05:48 GMT)
Why does my medical AI look at pictures of birds? Exploring the efficacy of transfer learning across domain boundaries [7.3] ダウンストリームタスクのドメインからのデータに対する事前トレーニングは、ほとんどの場合、ImageNetプリトレーニングされたモデルよりも好まれるべきである。
RadNet-12Mは,1200万以上のCT画像スライスを含むデータセットである。
実験では、ドメイン内およびクロスドメイン転送シナリオ、データスケールの変化、微調整と線形評価、特徴空間解析について検討した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:12:02 GMT)
(How) Can Transformers Predict Pseudo-Random Numbers? [7.2] 線形合同生成器(LCG)から擬似ランダム数列を学習するトランスフォーマーの能力について検討する。
我々の分析によれば、トランスフォーマーは無意味なmoduli(m$)とパラメータ(a,c$)でLCGシーケンスのコンテキスト内予測を行うことができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:59:40 GMT)
Classifier-free Guidance with Adaptive Scaling [7.2] フリーガイダンス(CFG)は、テキスト駆動拡散モデルにおいて必須のメカニズムである。
本稿では,世代誘導の影響を制御できる$beta$adaptive-CFGを提案する。
提案モデルでは,テキスト・ツー・イメージのCLIP類似度スコアを,参照CFGと類似したレベルに維持し,FIDスコアが向上した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:04:53 GMT)
An Innovative Next Activity Prediction Approach Using Process Entropy and DAW-Transformer [7.1] 本稿では,エントロピー駆動モデル選択手法とDAW-Transformerを提案する。
6つの公開データセットで実験を行い,プロセスエントロピーを用いて評価した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:02:00 GMT)
Collaborative Channel Access and Transmission for NR Sidelink and Wi-Fi Coexistence over Unlicensed Spectrum [7.1] 5G-Advancedは、データレートを上げるために、ライセンスなしスペクトル(SL-U)上のサイドリンク通信を導入した。
ライセンスされていないスペクトルにおけるSL-Uの主な課題は、Wi-Fiのような既存のシステムと公平に共存することである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:09:24 GMT)
Probabilistic Super-Resolution for High-Fidelity Physical System Simulations with Uncertainty Quantification [7.1] 超解像(SR)は、低分解能データから物理系の高忠実度シミュレーションを生成するための有望なツールである。
既存のディープラーニングベースのSR手法では、ラベル付きの大きなデータセットが必要であり、信頼性のある不確実性定量化(UQ)が欠如している。
本稿では,統計有限要素法とエネルギーベース生成モデルを利用した確率的SRフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:37:21 GMT)
PRISM: A Robust Framework for Skill-based Meta-Reinforcement Learning with Noisy Demonstrations [7.1] スキルベースメタRL(PRISM)の優先的リファインメントを提案する。
PRISMは、ノイズの多いデータに近い探索を統合して、オンライントラジェクトリを生成し、それらをオフラインデータと組み合わせる。
ノイズの影響に対処することにより,雑音や準最適データであっても,長時間の作業において,安定したスキル学習と優れたパフォーマンスを確保できる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:02:01 GMT)
Precise Parameter Localization for Textual Generation in Diffusion Models [7.1] 新たな拡散モデルでは、高画質のテキストを統合してフォトリアリスティックな画像を合成することができる。
注意アクティベーションパッチでは、拡散モデルのパラメータの1%未満が注意層に含まれており、画像内のテキストコンテンツの生成に影響を与えることが示されている。
テキストコンテンツ生成に責任のあるレイヤをローカライズすることの恩恵を受けるアプリケーションをいくつか紹介する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:11:23 GMT)
Hybrid Offline-online Scheduling Method for Large Language Model Inference Optimization [6.9] 大規模言語モデル(LLM)をデプロイするサービスシステムの推論最適化について検討する。
推論最適化問題を混合整数プログラミング(MIP)モデルとして定式化し,ハイブリッドオフライン方式をソリューションとして提案する。
LLaMA-65BモデルとGSM8Kデータセットの実際のデータを用いた実験では、システム利用率が80.2%から89.1%に改善され、総推定時間は201.00から190.58秒に短縮された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:00:00 GMT)
COMBINEX: A Unified Counterfactual Explainer for Graph Neural Networks via Node Feature and Structural Perturbations [6.9] 我々は,ノード分類タスクとグラフ分類タスクの両方に対して,対実的な説明を生成する新しいGNN説明器であるCOMBINEXを提案する。
構造的および特徴に基づく変更を独立に扱う従来の方法とは異なり、COMBINEXはエッジとノードの特徴への修正を最適にバランスする。
この統一されたアプローチは、モデルの予測を反転させるために必要な最小限かつ効果的な変更を保証し、現実的で解釈可能な反事実をもたらす。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:17:24 GMT)
Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual LLMs: An Extensive Investigation [6.8] 近年のジェネレーティブ・大型言語モデル(LLM)は英語以外の言語では顕著な性能を示した。
これらの言語で刺激されると、より有害な社会的偏見と毒性のレベルを表現する傾向がある。
異なる微調整法がモデルのバイアスや毒性に与える影響について検討するが、その効果は、流動的で多様なテキストを生成する能力にも及んでいる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:39:29 GMT)
AffinityFlow: Guided Flows for Antibody Affinity Maturation [6.7] 本稿では,抗体と抗原配列のみを用いて,親和性成熟のための配列のみのシナリオを探索する。
最近、AlphaFlowはAlphaFoldをフローマッチングにラップし、様々なタンパク質構造を生成する。
本稿では,(1)構造に基づく親和性予測器を用いて構造生成を高結合親和性へ導くために,(1)規則を修正し,(2)規則に基づく親和性予測器によって改良された配列変異を生成するための逆フォールディングを適用する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:43:22 GMT)
Analysis of Off-Policy $n$-Step TD-Learning with Linear Function Approximation [6.7] 本稿では,致命的な三者シナリオにおける多段階時間差(TD)学習アルゴリズムについて分析する。
特に、サンプリング地平線$n$が十分に増加するにつれて、$n$ステップのTD学習アルゴリズムが解に収束することが証明される。
2つの$n$のTD-learningアルゴリズムが提案され分析され、モデルに基づく決定論的アルゴリズムのモデルフリー強化学習とみなすことができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:46:10 GMT)
Simulating Quantum Light in Lossy Microring Resonators Driven by Strong Pulses [6.7] 単一リング共振器におけるパルス光子対生成の量子論を提案する。
このアプローチは、ハイゼンベルク図形入力出力形式と古典非線形光学からの池田写像を組み合わせる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:33:29 GMT)
The Ann Arbor Architecture for Agent-Oriented Programming [6.6] 我々は、言語モデルはオートマタとして機能し、全てのオートマタと同様に、彼らが受け入れる言語でプログラムされるべきであると主張している。
本稿では,言語モデルのエージェント指向プログラミングのための概念的フレームワークであるAnn Arbor Architectureを紹介する。
エージェントプラットフォームPostlineの設計とエージェントトレーニングの初期実験について報告する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:21:36 GMT)
Image Forgery Localization with State Space Models [6.6] 選択SSMを利用した画像フォージェリローカライズ手法であるLoMaを提案する。
LoMaは、空間領域を横切り、改ざんされた画像を順序付けられたパッチシーケンスに変換するために、アトラス選択的スキャンを使用する。
これは、SSMベースのモデルに基づいて構築された最初の画像フォージェリーローカライゼーションモデルである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:25:16 GMT)
A Robust Attack: Displacement Backdoor Attack [6.6] 我々は、ターゲットサンプルを移動させ、それ自身と組み合わせて、バックドアサンプルである変位バックドアアタック(DBA)を形成する、非常に堅牢なバックドアアタックを提案する。
実験の結果、DBA攻撃は、回転や収穫などの現実世界の違いをシミュレートするデータ拡張に抵抗できることが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:15:13 GMT)
Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation [6.6] 球面に無注意の視覚マンバを導入する。
本手法は球面データを三角形パッチの列として表現することで表面パッチを実現する。
提案したSurface Vision Mambaは、複数の神経発達型表現型回帰タスクで評価される。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:55:40 GMT)
Controlling superradiant phase transition in quantum Rabi model [6.5] 超強結合状態において、量子ラビモデルは、量子ビット遷移周波数と空洞場の周波数との比が無限に近づくとき、量子相転移(QPT)を示すことができる。
本稿では,量子ラビモデルのQPTを強結合系で操作するための実用的スキームを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:05:09 GMT)
Long-Lived Photon Blockade with Weak Optical Nonlinearity [6.5] 従来の光子遮断では、複数の光子によるキャビティモードの占有は、強い光非線形性によって抑制される。
いくつかの空洞寿命の大きな時間窓上で光子遮断を実現する方法を提案する。
LLPB現象は、弱い光学非線形性を持つ材料を利用した単一光子源の開発に役立つ可能性がある。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:52:24 GMT)
ChatIoT: Large Language Model-based Security Assistant for Internet of Things with Retrieval-Augmented Generation [6.4] ChatIoTは、大規模な言語モデル(LLM)ベースのIoTセキュリティアシスタントで、IoTセキュリティと脅威インテリジェンスの普及を目的としている。
我々は、不均一なデータセットを扱うエンドツーエンドのデータ処理ツールキットを開発した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:00:18 GMT)
Continual Learning with Strategic Selection and Forgetting for Network Intrusion Detection [6.3] 侵入検知システム(IDS)はデジタルインフラの保護に不可欠である。
本稿では,IDSの新しい連続学習手法であるSSF(Strategic Selection and Forgetting)を提案する。
提案手法は,新しいサンプルを選択的に選択する戦略的サンプル選択アルゴリズムと,古いサンプルをドロップする戦略的忘れ機構を備える。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:15:37 GMT)
Siren Song: Manipulating Pose Estimation in XR Headsets Using Acoustic Attacks [6.2] 我々は,XRヘッドセットにおける慣性測定ユニット(IMU)における擬似信号を生成する音響攻撃の効果を作成した。
HoloLens 2では,ユーザ入力の操作,クリックジャッキング,ゾーン侵入,ユーザインタラクションの否定という,概念実証の4つのエンド・ツー・エンドを実証する。
我々の実験によると、現在の商用XRヘッドセットはアコースティックアタックの影響を受けやすいため、セキュリティへの懸念が高まっている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:06:03 GMT)
Recent Advances of NeuroDiffEq -- An Open-Source Library for Physics-Informed Neural Networks [6.2] NeuroDiffEqは、ニューラルネットワークを利用して微分方程式を解くライブラリである。
NeuroDiffEqは任意の次元の複雑な境界値問題を解くことができ、無限大の境界条件に取り組み、実行時の動的注入の柔軟性を維持することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:32:12 GMT)
OMNI-EPIC: Open-endedness via Models of human Notions of Interestingness with Environments Programmed in Code [6.1] オープンエンドおよびAI生成アルゴリズムは、ますます複雑なタスクを無期限に生成し、解決することを目的としている。
この壮大なビジョンを達成するためには、学習は潜在的なタスクの膨大な範囲内で行われなければならない。
OMNI-EPICという新しいフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:24:59 GMT)
Learning to be Smooth: An End-to-End Differentiable Particle Smoother [6.0] 本研究では, 粒子スムースナーの訓練において, 長時間連続する勾配の低分散伝播の枠組みを開発する。
我々の"2-filter'は、時間とともに前方と後方に伝播する粒子の流れを統合する。
得られた混合密度粒子のスムース化は、最先端粒子フィルタよりもかなり正確である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:26:54 GMT)
On Space Folds of ReLU Neural Networks [6.0] 近年の研究では、ReLUニューラルネットワークは入力空間の空間折り畳みとして幾何学的に理解できることが示唆されている。
本稿では、この空間現象をReLUモデルで初めて定量的に解析する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:22:24 GMT)
Domain-Invariant Per-Frame Feature Extraction for Cross-Domain Imitation Learning with Visual Observations [6.0] IL(Imitation Learning)は、エージェントが報酬信号なしで専門家の行動を模倣することを可能にするが、高次元、雑音、不完全な視覚的観察を伴うクロスドメインシナリオの課題に直面している。
ドメイン不変な特徴を個々のフレームから抽出し,それをシーケンスに適応させて,専門家の行動を分離し,再現する新しいIL手法であるDIFF-ILを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:57:25 GMT)
Interpretable Concept-based Deep Learning Framework for Multimodal Human Behavior Modeling [6.0] EUの一般データ保護規則は、リスクの高いAIシステムが十分に解釈可能であることを要求している。
既存の説明可能なメソッドは、しばしば解釈可能性とパフォーマンスを妥協する。
我々は、新しく一般化可能なフレームワーク、すなわち注意誘導概念モデル(AGCM)を提案する。
AGCMは、予測につながる概念とそれらがどこに観察されるかを特定することによって、学習可能な概念的な説明を提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:15:21 GMT)
MEADOW: Memory-efficient Dataflow and Data Packing for Low Power Edge LLMs [5.9] 大規模言語モデルのオフチップメモリアクセスを大幅に削減するフレームワークであるMEADOWを紹介する。
MEADOW は GEMM ベースの LLM 実装と比較して 1.5x と 2.5x のデコードとプリフィル遅延を示す。
MEADOWは、従来のLLM最適化作業と比較して、エンドツーエンドのレイテンシの改善を40%以上達成している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:50:37 GMT)
Multifidelity Simulation-based Inference for Computationally Expensive Simulators [5.9] 我々は,高忠実度シミュレータのパラメータを限られたシミュレーション予算内で推測するために,安価な低忠実度シミュレーションを活用する,神経後部推定のための多忠実度アプローチであるMF-NPEを紹介する。
MF-NPEは、最大2桁の高忠実度シミュレーションを必要としながら、現在の手法に匹敵する性能を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:55:02 GMT)
Lorecast: Layout-Aware Performance and Power Forecasting from Natural Language [5.8] 我々はLorecastと呼ばれる新しい手法を導入し、英語のプロンプトを入力として受け取り、レイアウトを意識した性能と電力推定を迅速に生成する。
Lorecastは、分析後の数パーセントの誤差で精度が向上する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:08:39 GMT)
Self-Training: A Survey [5.8] 半教師付きアルゴリズムは、ラベル付き観測の小さなセットとラベルなし観測の大きなセットから予測関数を学習することを目的としている。
近年,自己学習手法が注目されていることは確かである。
本稿では,バイナリクラスとマルチクラス分類のための自己学習手法と,その変種と関連する2つのアプローチを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:55:19 GMT)
Towards Polyp Counting In Full-Procedure Colonoscopy Videos [5.8] 大きな課題は、フルプロデュール大腸内視鏡ビデオにおけるポリープ・トラックレットの自動識別、追跡、再結合(ReID)である。
本研究では,フルプロデューサビデオを提供する最初のオープンアクセスデータセットであるREAL-Colonデータセットを活用する。
我々は以前提案したポリプトラックレットの表現を学習するためのSimCLRベースの手法を再実装した。
提案手法は,REAL-Colonデータセットにおいて,ポリプフラグメンテーション率6.30と偽陽性率(FPR)を5%以下とした最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:02:38 GMT)
Towards Reliable Empirical Machine Unlearning Evaluation: A Cryptographic Game Perspective [5.7] 機械学習は機械学習モデルを更新し、データ保護規則に従って、特定のトレーニングサンプルから情報を削除する。
近年、多くの未学習アルゴリズムが開発されているにもかかわらず、これらのアルゴリズムの信頼性評価は依然としてオープンな研究課題である。
この研究は、非学習アルゴリズムを実証的に評価するための、新しく信頼性の高いアプローチを示し、より効果的な非学習技術を開発するための道を開いた。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:03:45 GMT)
A Unified Approach to Routing and Cascading for LLMs [5.7] 様々なエージェントシステムに埋め込まれた大規模言語モデル(LLM)は、コストパフォーマンスのトレードオフを改善するためのモデル選択戦略の可能性を高めている。
既存の戦略には、クエリ毎にひとつのモデルが選択されるルーティング、あるいは、満足のいく回答が見つかるまで順次、より大きなモデルを実行するカスケードがある。
我々は、カスケードのための新しい最適戦略を導き、既存のルーティング戦略の最適性を証明する。
本稿では、ルーティングとカスケードを統合した統合フレームワークであるカスケードルーティングを理論的に最適な戦略として提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:13:33 GMT)
A Lightweight and Effective Image Tampering Localization Network with Vision Mamba [5.4] 現在の画像改ざん手法は、畳み込みニューラルネットワーク(CNN)とトランスフォーマーに依存している。
視覚的マンバ(ForMa)をベースとした,視覚障害者の視覚的触覚ローカライゼーションのための軽量かつ効果的なフォレストネットワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:35:44 GMT)
Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints [5.3] この研究は、未知のロボット遷移モデルの下でのマルチロボット協調の問題に対処する。
本稿では,ハイレベルなタスクアロケーションと低レベルな分散ポリシ学習と実行を統合した双方向フレームワークを提案する。
提案アルゴリズムを理論的に検証し,課題割り当てが所望の確率閾値を高い信頼性で満たすことを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:39:21 GMT)
Anomaly Detection with LWE Encrypted Control [5.3] 本稿では,エラー暗号信号を用いた学習における異常検出機構を提案する。
この検出器はLWE暗号の同型性を利用して、暗号化されたサンプルの変換に関する仮説テストを実行する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:38:51 GMT)
Weighted quantization using MMD: From mean field to mean shift via gradient flows [5.2] 粒子の集合を用いて確率分布を近似することは、機械学習と統計学の基本的な問題である。
我々は,MSIPがカーネル密度推定におけるモードの同定に広く用いられている平均シフトアルゴリズムを拡張していることを示す。
また、MSIPは事前条件付き勾配降下と解釈でき、ロイドのクラスタリングアルゴリズムの緩和として機能することを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:13:20 GMT)
ICST Tool Competition 2025 - Self-Driving Car Testing Track [5.2] 目的は、ソフトウェアテスタがSDCのシミュレーションベースのテストでテスト選択の問題に対処するツールを提出するためのプラットフォームを提供することである。
本稿では,コンペの状況,フレームワーク,参加ツール,評価方法論,重要な知見について概説する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:08:56 GMT)
Tradeoffs in Processing Queries and Supporting Updates over an ML-Enhanced R-tree [5.1] 本稿では,R木多次元インデックス構造に着目し,多次元データのインデックス化に広く利用されている。
R-treeは機械学習モデルで強化され、R-treeのパフォーマンスが向上した。
AI+R-treeは、従来のディスクベースのR-treeをMLモデルで拡張し、R-treeのクエリ処理性能を向上させるML強化R-treeインデックス構造である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:16:26 GMT)
Thompson Sampling for Repeated Newsvendor [5.1] 本稿では,検閲されたフィードバックによるオンライン学習におけるトンプソンサンプリング(TS)の性能に着目した。
以上の結果から,TSは未知の需要パラメータを正確に推定し,ほぼ最適の注文決定を導いた。
この研究は、検閲されたフィードバックを用いて、一般的なオンライン学習問題を探求する基盤も築き上げた。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:16:58 GMT)
Optimizing GPT for Video Understanding: Zero-Shot Performance and Prompt Engineering [5.1] 我々は、ゼロショット分類のためのGPTベースのモデルを探索し、最適化することで、ビデオコンテンツ分類における業界の課題に取り組む。
我々は,迅速な最適化と政策改善を通じて,GPTの性能向上に新たなアプローチを貢献する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:31:39 GMT)
Multi-view 3D surface reconstruction from SAR images by inverse rendering [5.0] 本稿では,制約のない合成開口レーダ(SAR)画像から3次元再構成を行うための新しい逆レンダリング手法を提案する。
本手法は,SAR画像における幾何学的不均一性を利用する可能性を示し,マルチセンサデータ融合の道を開く。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:19:32 GMT)
Intensity-Spatial Dual Masked Autoencoder for Multi-Scale Feature Learning in Chest CT Segmentation [4.9] 本稿では,ISD-MAE (Intensity-Spatial Dual Masked AutoEncoder) という改良手法を提案する。
このモデルは、二重ブランチ構造とコントラスト学習を利用して、組織の特徴と境界の詳細を学習する能力を強化する。
以上の結果より, ISD-MAEは2次元肺炎および縦隔腫瘍セグメンテーションにおいて他の方法よりも有意に優れていた。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:48:39 GMT)
AutoS$^2$earch: Unlocking the Reasoning Potential of Large Models for Web-based Source Search [4.9] AutoS$2$earchは、Webアプリケーションのゼロショットソースサーチに大規模なモデルを活用する新しいフレームワークである。
私たちの仕事は、Webエンジニアリングを使用して、他の産業アプリケーションでこのような自律的なシステムを設計する上で、貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:58:28 GMT)
A Unified Evaluation Framework for Epistemic Predictions [4.9] 本稿では,不確実性認識型分類器の統一評価フレームワークを提案する。
ユーザは、適切に設計されたパフォーマンス指標を使用して、精度と予測精度のトレードオフを調整できる。
これにより、所望のトレードオフの関数として、特定の現実世界のアプリケーションに最も適したモデルを選択することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:47:09 GMT)
NeuroXVocal: Detection and Explanation of Alzheimer's Disease through Non-invasive Analysis of Picture-prompted Speech [4.8] NeuroXVocalは、音声分析によってアルツハイマー病(AD)の可能性を分類し、説明する新しい二重成分システムである。
分類コンポーネント(Neuro)は、音声パターンと音声特徴をキャプチャする音響特徴、音声書き起こしから抽出したテキスト特徴、言語パターンを表す事前計算された埋め込みの3つの異なるデータストリームを処理する。
説明可能性コンポーネント(XVocal)は、大規模言語モデルとAD研究文献のドメイン固有の知識ベースを組み合わせた、検索・拡張生成(RAG)アプローチを実装している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:09:49 GMT)
Assortment Optimization for Patient-Provider Matching [4.8] ライジングプロバイダのターンオーバーは、医療管理者に対して、患者を利用可能なプロバイダに頻繁に再マッチさせるよう強制する。
そこで我々は,各患者に提供者のメニューを同時に提供する患者-研究者マッチングモデルを開発した。
アソシエーションを前もって提供することで、管理者は論理的容易性と患者の自律性のバランスをとることができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:32:11 GMT)
Universal Stochastic Equations of Monitored Quantum Dynamics [4.8] 全密度行列スペクトルのガウス時間進化を管理する普遍的なフォッカー・プランク方程式を導出する。
カオス状態におけるエントロピーの普遍的ゆらぎを同定し、メソスコピック電子輸送現象における普遍的コンダクタンスゆらぎの非一意的代替として機能する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:47:50 GMT)
Universal Machine Learning Interatomic Potentials are Ready for Solid Ion Conductors [4.7] UMLIP(Universal Machine Learning Interatomic potential)は、その効率性とほぼDFTレベルの精度で、有望なソリューションを提供する。
本研究は, エネルギー, 力, 熱力学特性, 弾性率, リチウムイオン拡散挙動の6つの先進的UMLIPモデルを系統的に評価する。
その結果、MatterSimは、特に複雑な物質システムにおいて、ほぼすべての指標において、他の指標よりも優れています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:55:53 GMT)
MuDoC: An Interactive Multimodal Document-grounded Conversational AI System [4.7] 長いドキュメントと対話するマルチモーダルなドキュメントグラウンドAIシステムを構築することは、依然として課題である。
GPT-4oに基づく対話型対話型AIエージェント「MuDoC」を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:05:51 GMT)
A Hybrid Cross-Stage Coordination Pre-ranking Model for Online Recommendation Systems [4.7] HCCP(Hybrid Cross-Stage Coordination Pre-level Model)を提案する。
HCCPは、上流(検索)と下流(ランク、再ランク)からの情報を統合する。
最大14.9%のUCVRと1.3%のUCTRがJD Eコマースレコメンデーションシステムに貢献している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:42:54 GMT)
The state of a quantum system is not a complete description for retrodiction [4.6] 混合量子状態は、不特定形の無知を捉えたり、システムの真の純粋状態に関する知識の欠如を記述するものとして捉えることができる。
我々は、過去の状態を後続の観測から推定する以前の信念("Retrodiction")が、異なる更新された信念へと導かれることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:17:32 GMT)
Delving into LLM-assisted writing in biomedical publications through excess vocabulary [4.6] ChatGPTのような大きな言語モデル(LLM)は、人間レベルのパフォーマンスでテキストを生成し、修正することができる。
PubMedによる2010年から2024年にかけての1500万以上のバイオメディカル・抽象化の語彙変化について検討した。
バイオメディカル研究におけるLCMは,コビッドパンデミックなどの世界大イベントの影響を超越し,科学的な執筆に前例のない影響を与えていることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:01:27 GMT)
Wormhole Memory: A Rubik's Cube for Cross-Dialogue Retrieval [4.6] 本研究では,異なる対話間で任意に検索可能なルービックキューブとしてメモリを実現するワームホールメモリモジュール(WMM)を提案する。
実験結果から,WMMは対話間のメモリ取得能力と定量的指標の安定性を示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:46:11 GMT)
AirRAG: Activating Intrinsic Reasoning for Retrieval Augmented Generation using Tree-based Search [4.5] 本稿では,システム解析と効率的な推論行動を統合したRAGにおける新しい思考パターンを提案する。
具体的には,本手法は5つの基本的な推論動作を設計し,より広い木に基づく推論空間に拡張する。
実験により,複雑な質問応答データセットに対して,AirRAGの有効性を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:20:47 GMT)
Holographic View of Mixed-State Symmetry-Protected Topological Phases in Open Quantum Systems [4.4] D次元混合対称性保護位相(mSPTs)と(d+1)次元サブシステム対称性保護位相(SSPTs)のホログラフィック双対性を確立する。
具体的には、サブシステム対称性Sと大域対称性Gを持つ(d+1)次元SSPTの境界層の還元密度行列が、強いSと弱いG対称性を持つd次元mSPTに対応することを示す。
このホログラム双対性にはいくつかの意味を論じるが、その中には双対性を通して本質的なmSPT状態を作成する方法も含まれる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:31:28 GMT)
A Hardware-Friendly Shuffling Countermeasure Against Side-Channel Attacks for Kyber [4.4] CRYSTALS-Kyberは、大規模な量子コンピュータによる攻撃に耐えるために、NISTによる唯一の鍵カプセル化機構(KEM)スキームとして標準化されている。
本稿では,新しいコンパクトシャッフルアーキテクチャを取り入れた,キーバーのセキュアで効率的なハードウェア実装を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:49:19 GMT)
Task-Aware Virtual Training: Enhancing Generalization in Meta-Reinforcement Learning for Out-of-Distribution Tasks [4.4] Task-Aware Virtual Training (TAVT)は、トレーニングとアウト・オブ・ディストリビューション(OOD)シナリオの両方のタスク特性をキャプチャする新しいアルゴリズムである。
数値計算の結果,TAVT は様々な MuJoCo および MetaWorld 環境における OOD タスクの一般化を著しく促進することが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:19:06 GMT)
Applying Deep Learning to Ads Conversion Prediction in Last Mile Delivery Marketplace [4.4] ディープニューラルネットワーク(DNN)は、Webスケールのランキングシステムに革命をもたらし、複雑なユーザの振る舞いを捉え、パフォーマンスを向上するブレークスルーを可能にした。
DoorDashでは、ホームページ広告ランキングシステムを従来のツリーベースモデルから最先端のマルチタスクDNNに移行することで、この変革的なパワーを活用しました。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:23:20 GMT)
Implicit Language Models are RNNs: Balancing Parallelization and Expressivity [4.3] 状態空間モデル(SSM)とトランスフォーマーが言語モデリングのランドスケープを支配している。
固定点に収束するまで変換を繰り返す暗黙のSSMを提案する。
提案手法は, 正規言語における状態追跡能力に優れ, トランスフォーマーやSSMよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:17:31 GMT)
Nonreciprocal routing induced by chirality in an atom-dimer waveguide-QED system [4.3] 導波路QEDシステムにおける単一光子ルータの実装手法を提案する。
実空間法による単一光子散乱振幅の正確な解析式を得る。
この系が非マルコフ系で機能すると、非対称性係数を調整して単一の光子をオンデマンドで伝達できることが分かる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:40:56 GMT)
Middleman Bias in Advertising: Aligning Relevance of Keyphrase Recommendations with Search [4.3] 本稿では,クリック/セール信号の学習関連度フィルタモデルの欠点について述べる。
我々は,2つの動的システム間の相互作用として,広告主のキーフレーズの関連性を再認識する。
本稿では,検索関連システムのバイアスと,広告主のキーワードを検索関連信号と整合させる必要性について論じる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:05:02 GMT)
Detecting and Monitoring Bias for Subgroups in Breast Cancer Detection AI [4.2] 2つのマンモグラフィーデータセットを用いたハイパフォーマンスAIモデルの性能解析を行った。
本分析では, 顕著な低パフォーマンスを示すサブグループを同定した。
我々は時間とともに性能のドリフトを検出するためのモニタリング手法を採用した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:26:21 GMT)
Expert-Agnostic Learning to Defer [4.2] EA-L2D:Expert-Agnostic Learning to Deferを紹介します。
専門家が1~16%、未確認の専門家が4~28%、そして、専門家の多様性が高い環境では、パフォーマンスが向上するのを観察する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:59:25 GMT)
Universal Lesion Segmentation Challenge 2023: A Comparative Research of Different Algorithms [4.1] 1)すべての組織タイプでうまく機能するモデルをトレーニングし、2)高速な推論を行うことができる。
合理性、成功、失敗を文書化しています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:54:23 GMT)
Syntriever: How to Train Your Retriever with Synthetic Data from LLMs [4.1] ブラックボックスLLMの合成データを用いた検索者のための学習フレームワークであるSyntrieverを提案する。
そこで我々は,LLM選好を正規化して学習するために,部分的なPockett-Luceランキングと呼ばれる選好モデルを提案する。
実験により、Syntrieverは様々なドメインのベンチマークデータセット上で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:05:29 GMT)
Automatic Evaluation Metrics for Artificially Generated Scientific Research [4.0] 本研究では,2つの自動評価指標,特に引用数予測とレビュースコア予測について検討する。
本研究の結果から, 引用数予測はレビュースコア予測よりも有効であり, 完全論文より純粋にスコア予測が困難であることが判明した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:56:14 GMT)
Solving the enigma: Enhancing faithfulness and comprehensibility in explanations of deep networks [4.0] 本稿では,説明の正確性と理解性の両方を最大化することに集中して,ディープネットワークの説明可能性を高めるために設計された新しいフレームワークを提案する。
我々のフレームワークは、複数の確立されたXAI手法の出力を統合し、"説明(explanation)"と呼ばれる非線形ニューラルネットワークモデルを活用し、統一的で最適な説明を構築する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:28:44 GMT)
Spatial-aware decision-making with ring attractors in reinforcement learning systems [3.9] Ring attractorsは、強化学習(RL)における学習速度と精度を改善する生物学的に妥当なメカニズムを提供する
アクション選択プロセスにおけるリングアトラクターの応用には、リング上の特定の場所にアクションをマッピングし、神経活動に基づいて選択されたアクションをデコードすることが含まれる。
提案手法は,Atari 100kベンチマークにおける最先端性能を大幅に改善し,選択した最先端ベースライン間で53%の性能向上を実現した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:42:44 GMT)
Enhancing Neural Function Approximation: The XNet Outperforming KAN [3.9] XNetは、Couchy積分ベースのアクティベーション関数を高次関数に利用する、単層ニューラルネットワークアーキテクチャである。
我々は、XNetで使用されるコーシー活性化関数が任意の順序収束を達成することを示す。
結果は、科学計算とAIアプリケーションの両方において、XNetを高効率なアーキテクチャとして確立する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:50:45 GMT)
MedMimic: Physician-Inspired Multimodal Fusion for Early Diagnosis of Fever of Unknown Origin [3.9] MedMimicは、現実世界の診断プロセスにインスパイアされたマルチモーダルフレームワークとして紹介されている。
DINOv2、Vision Transformer、ResNet-18といった事前訓練されたモデルを使用して、高次元の18F-FDG PET/CTイメージングを意味のある特徴に変換する。
学習可能な自己注意型核融合ネットワークは、これらの画像特徴を分類のための臨床データと統合する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:14:15 GMT)
Observer-Aware Probabilistic Planning Under Partial Observability [3.9] 観測者対応のマルコフ決定プロセス(OAMDP)に基づいて,部分的可観測性問題に対処する枠組みを提案する。
部分可観測性へのOAMDPの拡張は、より現実的な問題に対処できるだけでなく、動的に隠れた興味のある変数を考慮できる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:41:04 GMT)
Precise Quantum Control of Molecular Rotation Toward a Desired Orientation [3.8] 本稿では, 最適振幅, 位相, 遅延を有するレーザーパルスシーケンスを用いて, 量子状態の限られたセットを正確に制御するための解析的枠組みを提案する。
この研究は、分子内の多レベルサブシステムに対する精密な制御を達成するための重要な進歩である。
分子配向や配向、超低温極性分子の精密量子制御に関連する様々な分野の分野にも応用できる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:41:16 GMT)
Artificial Intelligence to Assess Dental Findings from Panoramic Radiographs -- A Multinational Study [3.8] 6,669個の歯科用パノラマ線写真(DPR)を3つのデータセットから分析した。
性能指標には、受信機動作特性曲線(AUC-ROC)の感度、特異性、面積が含まれていた。
AIシステムは、人間の読者に匹敵する、あるいは優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:34:21 GMT)
Thinning a Wishart Random Matrix [3.7] 独立な$N_p(mu, Sigma)$行を持つ2つの独立したデータ行列を生成することができることを示す。
これらの独立したデータ行列は、トレインテストのパラダイム内で直接使用したり、独立した要約統計を引き出すために使用することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:34:38 GMT)
MEMS and ECM Sensor Technologies for Cardiorespiratory Sound Monitoring - A Comprehensive Review [3.6] 本稿では, 心臓と肺の音響特性について紹介するとともに, 聴診器の進化史について概説する。
本稿では,エレクトレットコンデンサマイクロホン(ECM)の基本概念とそれに基づく聴診器について論じる。
本稿では,過去10年間のMEMSをベースとしたウェアラブルデザインに重点を置いて,心肺蘇生のためのセンシング技術について総括的にレビューする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:05:28 GMT)
Semantica: Decentralized Search using a LLM-Guided Semantic Tree Overlay [3.6] この作業は、意味を捉え、セマンティックオーバーレイネットワークの約束を満たすために、Large Language Modelsからの埋め込みを使用する。
提案アルゴリズムはSemanticaと呼ばれ,言語モデルによって計算された文書埋め込みを利用したプレフィックスツリー(トリー)を構築する。
Semanticaは現在の最先端のアプローチの最大10倍のセマンティックなユーザを見出している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:25:29 GMT)
MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools [3.5] 日常オブジェクトのマルチスペクトルミリ波(mmWave)画像の最初のデータセットであるMITOを提示する。
我々はRGB-D画像や地上の真理セグメンテーションマスクと同様に、視線および非視線における実世界のmmWave画像を提供する。
また,任意の3次元三角形メッシュに対して合成mmWave画像を生成するためのオープンソースのシミュレーションツールを開発した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:12:14 GMT)
Solvable Dynamics of Self-Supervised Word Embeddings and the Emergence of Analogical Reasoning [3.5] 本稿では,2次単語埋め込みモデルという,可解なコントラスト付き自己教師付きアルゴリズムのクラスについて検討する。
我々の解は、これらのモデルが1度に1つの線型部分空間を学習し、それぞれがモデル容量が飽和するまで、埋め込みの効果的なランクを増すことを示した。
我々は、動的理論を用いて、モデルがアナログを完遂する能力をどのように、いつ取得するかを予測する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:16:48 GMT)
SWAP Attack: Stealthy Side-Channel Attack on Multi-Tenant Quantum Cloud System [3.5] 共有量子デバイス上のクロストークにより、敵は近隣の被害者回路を妨害することができる。
SWAPベースのサイドチャネル攻撃は、実際のIBM量子デバイスで検証されているように、アクティブモードとパッシブモードの両方で動作することを示す。
我々の研究は、出現する脅威に対して量子計算を保護するための堅牢なセキュリティ対策の緊急の必要性を強調している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:25:08 GMT)
Local Reasoning about Probabilistic Behaviour for Classical-Quantum Programs [3.4] 確率的振る舞いに関する局所的推論のための新しい量子ホア論理を提案する。
論理学における証明規則は意味論的意味論に関して健全であることを示す。
結果として得られる論理フレームワークは、CoqQLRと呼ばれ、古典量子プログラムに関する半自動推論を容易にする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:05:29 GMT)
AI Safety for Everyone [3.4] AIの安全性に関する最近の議論と研究は、AIの安全性と高度なAIシステムからの現実的リスクとの深いつながりを強調している。
このフレーミングは、AIの安全性にコミットしているが、異なる角度から分野にアプローチする研究者や実践者を排除する可能性がある。
私たちは、現在のAIシステムに対する即時的で実践的な懸念に対処する、数多くの具体的な安全作業を見つけました。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:11:22 GMT)
Supervised contrastive learning for cell stage classification of animal embryos [3.4] 深層学習による2次元タイムラプス顕微鏡ビデオから胚の細胞ステージを自動分類することを目的としている。
我々は,ビデオ顕微鏡によるウシ胚発生の解析に焦点をあてた。
CLEmbryoは、教師付きコントラスト学習とトレーニングの焦点損失を組み合わせた新しい手法であり、軽量な3次元ニューラルネットワークCSN-50をエンコーダとして導入する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:13:09 GMT)
Score-of-Mixture Training: Training One-Step Generative Models Made Simple via Score Estimation of Mixture Distributions [3.3] 本稿では,一段階生成モデルの学習のための新しいフレームワークであるSMTを提案する。
SMTは、複数のノイズレベルにわたる実検体と偽検体の混合分布のスコアを推定する。
提案手法は,Score-of-Mixture Distillation (SMD)と呼ばれる事前学習拡散モデルを用いて,スクラッチ(SMT)と蒸留の両方のトレーニングを支援する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:32:22 GMT)
Empirical Bayes Estimation with Side Information: A Nonparametric Integrative Tweedie Approach [3.3] 非パラメトリック積分的ツイーディー (NIT) アプローチを開発し、複合推定の精度を高める。
我々は、NITのリスクを理論的に分析し、NITがオラクル次元推定器に収束する速度を確立する。
NITの数値性能は、シミュレーションデータと実データの両方の解析を通して説明され、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:29:40 GMT)
U Can Touch This! Microarchitectural Timing Attacks via Machine Clears [3.2] 本稿では,自己修正型コード検出機構によって引き起こされるマシンクリアを利用するサイドチャネル技術であるMCHammerを紹介する。
多くの従来の手法とは異なり、MCHammerはメモリアクセスや待ち時間を必要としないため、非常に効率的である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:25:31 GMT)
EmbBERT-Q: Breaking Memory Barriers in Embedded NLP [3.2] EmbBERT-Qは、メモリ制約の厳しい小さなデバイス向けに特別に設計された、新しい小さな言語モデルである。
アーキテクチャの革新とハードウェア互換の8ビット量子化を組み合わせることで、EmbBERT-Qは一貫して2MBのメモリ予算までスケールダウンされたいくつかのベースラインモデルより優れている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:33:31 GMT)
Control-flow anomaly detection by process mining-based feature extraction and dimensionality reduction [3.1] 本稿では,アライメントに基づくアライメントチェックを用いたプロセスマイニングに基づく特徴抽出手法を提案する。
制御フロー異常検出技術を開発するために,本手法を柔軟かつ説明可能なフレームワークに統合する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:06:59 GMT)
The Cure is in the Cause: A Filesystem for Container Debloating [3.1] トップダウンのコンテナの50%以上が60%以上肥大化しており、BAFFSはコンテナのサイズを大幅に削減している。
サーバレス機能の場合、BAFFSはコールドスタートのレイテンシを最大68%削減する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:55:48 GMT)
Willingness to Read AI-Generated News Is Not Driven by Their Perceived Quality [3.0] 本研究では,AI支援記事とAI生成記事と人為的ニュース記事の認識品質について検討する。
また、これらのニュース記事の生成にAIが関与していることの開示が、彼らとの関わりに影響を及ぼすかどうかについても調査している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:39:01 GMT)
Comprehensive Review of Neural Differential Equations for Time Series Analysis [3.0] 本稿では,NDEに基づく時系列解析手法について概説する。
NDEは、ニューラルネットワークの柔軟性と微分方程式の数学的厳密さを組み合わせたパラダイムシフトを表している。
本稿では, それらの数学的定式化, 数値計算法, 応用に関する詳細な議論を行い, 連続時間力学をモデル化する能力を強調した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:21:04 GMT)
Strong field physics in open quantum systems [2.9] 本研究では,多体環境を熱浴で表現する強磁場モデルを構築した。
我々のアプローチは、計算量と数学的複雑さを最小限に抑えた多体物理学を強力なレーザー力学に統合することを可能にする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:50:49 GMT)
Revisiting the Berkeley Admissions data: Statistical Tests for Causal Hypotheses [2.9] 我々は、バークレーの大学院入学を因果レンズで説明する。
因果モデル上でのグラフィカル、対実的、介入的クエリに基づいて、フェアネスの異なる因果的概念を比較した。
観測データのみを用いたこれらの概念の統計的テストを開発する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:43:35 GMT)
Can Post-Training Quantization Benefit from an Additional QLoRA Integration? [2.7] 大規模言語モデル(LLM)は自然言語処理を変革しているが、現実のデプロイメントには大きな課題がある。
本研究では,これらの問題に対処するために,4ビットポストトレーニング量子化(PTQ)とQLoRAの統合について検討する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:56:19 GMT)
An Efficient Large Recommendation Model: Towards a Resource-Optimal Scaling Law [2.7] Climberはリソース効率のよいレコメンデーションフレームワークです。
中国最大の音楽ストリーミングプラットフォームの一つであるNetease Cloud Musicで成功を収めている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:25:09 GMT)
ScamFerret: Detecting Scam Websites Autonomously with Large Language Models [2.6] ScamFerretは、大きな言語モデル(LLM)を使用して、特定のURLからデータを自律的に収集して分析し、それが詐欺であるかどうかを判断する革新的なエージェントシステムである。
評価の結果、ScamFerretは英語で4つの詐欺タイプを分類する0.972の精度と、オンラインショッピングサイトを3つの言語で分類する0.993の精度を達成できた。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:16:38 GMT)
DomainLynx: Leveraging Large Language Models for Enhanced Domain Squatting Detection [2.6] ドメイン・スクワットはインターネットのセキュリティにとって重大な脅威となり、攻撃者はますます高度な技術を用いている。
本研究では,Large Language Models (LLMs) を利用した新しい複合AIシステムであるDomainLynxを紹介した。
2億900万のドメインから34,359のスクワットドメインを検出し、ベースラインの手法を2.5倍上回った。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:29:21 GMT)
Acoustic Wave Manipulation Through Sparse Robotic Actuation [2.6] 本研究では,空間的にスパースなアクチュエータを通して波に影響を及ぼすことのできるロボットによって部分的に観察される音波の操作について検討する。
この問題は、新しい人工材料、超音波切断ツール、エネルギー収穫などの用途の設計に大きな可能性を秘めている。
本研究では,特定の領域に分散した音響エネルギーを集中させるか,所望のタスクに応じて抑制するかのどちらかに適用可能な,効率的なデータ駆動型ロボット学習法を開発した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:28:20 GMT)
Recent Advances in Malware Detection: Graph Learning and Explainability [2.6] この調査は、グラフ学習と説明可能性の間の相互作用に焦点を当てている。
これらのコンポーネントを統合することで、グラフ学習と説明可能性が堅牢で解釈可能でスケーラブルなマルウェア検出システムの構築にどのように貢献するかを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:10:03 GMT)
Accelerometry-based Energy Expenditure Estimation During Activities of Daily Living: A Comparison Among Different Accelerometer Compositions [2.5] 呼吸呼吸データから身体活動エネルギー支出(PAEE)を測定することができる。
または、PAEEは体の動きから予測でき、加速度計で測定して推定することができる。
COMベースの設定と手首ベースの設定の性能を評価し,比較した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:17:59 GMT)
VocalCrypt: Novel Active Defense Against Deepfake Voice Based on Masking Effect [2.4] AI音声クローンの急速な進歩は、機械学習によって推進され、テキスト音声(TTS)と音声変換(VC)の分野に大きな影響を与えている。
本研究では,SFSをベースとした擬似音色(ジャミング情報)を人間の耳に知覚できない音声セグメントに埋め込む,新たなアクティブディフェンス手法であるVocalCryptを提案する。
VocalCryptは、対向雑音の組み込みなど既存の手法と比較して、ロバスト性やリアルタイム性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:43:01 GMT)
Variational empirical Bayes variable selection in high-dimensional logistic regression [2.4] 我々は,その新しい,計算効率の良い変分近似を開発した。
そのようなノベルティの1つは、回帰係数自身ではなく、モデル空間上の辺分布に対してこの近似を直接発展させることである。
シミュレーションにおいて,本手法の強い性能を実証し,我々の変分近似が近似している後部分布で満たされる強い選択整合性を引き継ぐことを証明した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:57:13 GMT)
Dynamic-Computed Tomography Angiography for Cerebral Vessel Templates and Segmentation [2.4] 我々はCT画像から直接血管を分割する2つの分割法を開発し,評価する。
DL血管セグメンテーションを作成するために,MRA血管セグメンテーションツールiCafeを用いて動脈および静脈構造を29例に分けた。
いずれのセグメンテーションも,11例の4D-CTデータセットを用いて評価し,神経放射線技師による検証を行った。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:33:04 GMT)
Detecting Phishing Sites Using ChatGPT [2.4] 本稿では,大規模言語モデル(LLM)を用いてフィッシングサイトを検出するChatPhishDetectorという新しいシステムを提案する。
本システムでは,Webクローラを利用してWebサイトから情報を収集し,クローリングデータに基づいてLLMのプロンプトを生成し,LLMが生成した応答から検出結果を取得する。
GPT-4Vを用いた実験結果は、98.7%の精度と99.6%のリコールで優れた性能を示し、他のLLMや既存のシステムよりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:57:15 GMT)
Leveraging Large Language Models to Enhance Machine Learning Interpretability and Predictive Performance: A Case Study on Emergency Department Returns for Mental Health Patients [2.4] 救急部門(ED)は精神状態の回復が大きな医療負担となり、患者の24-27%が30日以内に帰国する。
大規模言語モデル(LLM)と機械学習を統合することにより、EDメンタルヘルスリターンリスクモデルの予測精度と臨床的解釈性が向上するか否かを評価する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:10:58 GMT)
A Study of Undefined Behavior Across Foreign Function Boundaries in Rust Libraries [2.4] Rustは、他の言語との相互運用に頻繁に使用される。
Miriは、これらのモデルに対してアプリケーションを検証できる唯一の動的解析ツールである。
Miriは、外部機能のバグ発見をサポートしておらず、Rustエコシステムに重大な正当性ギャップがあることを示唆している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:28:17 GMT)
ExplainReduce: Summarising local explanations via proxies [2.3] XAIに対するしばしば使われるモデルに依存しないアプローチは、単純なモデルを局所的な近似として使用して、いわゆる局所的な説明を生成することである。
本稿は、局所的な説明の大規模な集合が、生成的グローバルな説明として機能する、単純なモデルの小さな"プロキシセット"に還元されることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:14:02 GMT)
The Adoption and Efficacy of Large Language Models: Evidence From Consumer Complaints in the Financial Industry [2.3] 本研究は、2015年から2024年までの消費者金融保護局に提出された消費者苦情に対するLarge Language Models(LLMs)の効果について検討する。
LLMの利用は、金融機関から救済を受ける可能性の高まりと関連している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:44:16 GMT)
HighGuard: Cross-Chain Business Logic Monitoring of Smart Contracts [2.2] HighGuardは、スマートコントラクトのビジネスロジック仕様に違反したトランザクションを検出するツールである。
異なるブロックチェーンプラットフォーム間でビジネスロジックの欠陥を検出するために、クロスチェーン環境で運用することができる。
54のエクスプロイトを含む評価では,ビジネスロジックの脆弱性検出におけるHighGuardの有効性が確認された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:16:35 GMT)
Looking around you: external information enhances representations for event sequences [2.2] 本稿では,複数のユーザ表現から情報を集約する手法を提案する。
本研究は,単純なプール技術からトレーニング可能な注意に基づくアプローチまで,多様なアグリゲーションアプローチについて考察する。
提案手法は,既存のエンコーダ上で動作し,その効率的な微調整を支援する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:59:37 GMT)
InterGridNet: An Electric Network Frequency Approach for Audio Source Location Classification Using Convolutional Neural Networks [2.1] InterGridNetと呼ばれる新しいフレームワークが導入され、SP Cup 2016データセットのElectric Network Frequency(ENF)シグネチャの位置分類に浅いRawNetモデルを利用している。
テスト記録におけるInterGridNetの全体的な精度は92%であり、SPカップ2016でテストされた最先端の手法に対する効果を示している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:45:35 GMT)
HaSPeR: An Image Repository for Hand Shadow Puppet Recognition [2.0] シャドウグラフィー(Shadowgraphy)またはボンボマニー(ombromanie)は、演劇芸術とストーリーテリングの一形態である。
プロとアマチュアの両方の手影人形クリップから抽出した15のクラスに15,000枚の手影人形画像からなる新しいデータセットを提案する。
本研究は,注目型トランスアーキテクチャよりも,スキップ接続型畳み込みモデルの大幅な性能上の優位性を示すものである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:53:27 GMT)
Shield Synthesis for LTL Modulo Theories [2.0] 我々は、より表現力のある論理で複雑な安全仕様に適合するシールドを生成するための新しいアプローチを開発する。
私たちの知る限りでは、このような表現力に対するシールドのアプローチはこれが初めてです。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:19:01 GMT)
Hands-off Image Editing: Language-guided Editing without any Task-specific Labeling, Masking or even Training [2.0] このタスクに対する最先端のアプローチは、監視に関連する典型的なスケールアップとドメイン適応の障害に悩まされる。
そこで我々は,このようなタスク固有の監督を伴わずに,改善のためのより良い可能性を提供する新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:41:42 GMT)
Explain Yourself, Briefly! Self-Explaining Neural Networks with Concise Sufficient Reasons [1.9] 出力の不可欠な部分として、予測の簡潔な理由を生成するためにモデルを訓練する。
以上の結果から,本フレームワークは,競合するポストホック法よりも,簡潔で忠実な部分集合をかなり効率的に生成することが示された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:39:17 GMT)
Growth strategies for arbitrary DAG neural architectures [1.9] 私たちは、必要に応じて小さなモデルのサイズを拡大できるニューラルアーキテクチャの成長にフォーカスしています。
我々は過剰な計算を減らし、よりパラメータ効率の良いアーキテクチャに向けてネットワークの成長を推し進める戦略を探る。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:28:29 GMT)
Towards Watermarking of Open-Source LLMs [1.9] 我々はオープンソースのLCM透かしの体系的研究の基礎を築いた。
最初に、一般的なモデル修正に対する耐久性を含む、重要な要件を明示的に定式化します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:41:23 GMT)
Evaluating the Meta- and Object-Level Reasoning of Large Language Models for Question Answering [1.9] 大きな言語モデル(LLM)は自然言語のタスクに優れるが、複雑で多段階の推論を必要とする質問回答(QA)タスクでは課題に直面している。
これらのタスクのいくつかで必要とされる推論のタイプを概説し、メタレベルの推論の観点でそれらを再設計します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:55:43 GMT)
Temporal Scale and Shift Invariant Automatic Event Recognition using the Mellin Transform [1.9] 本研究では,異なる速度で動作する動画の自動イベント認識を実現する手法を提案する。
この手法により、認識精度を高く向上させ、ビデオデータベース内のほぼすべての不要事象をフィルタリングすることができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:24:04 GMT)
"It's Like Not Being Able to Read and Write": Narrowing the Digital Divide for Older Adults and Leveraging the Role of Digital Educators in Ireland [1.8] 本研究は,デジタル教育者が高齢者に欠かせないデジタルスキルの発達をいかに支援するかを考察する。
本研究は,高齢者の学習ニーズに合わせて,個人化されたステップバイステップ指導の重要性を強調した。
主な課題は、限られた交通手段、インターネット接続の貧弱、時代遅れのデバイス、そして学習に対する家族的サポートの欠如である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:54:40 GMT)
Deep Tree Tensor Networks for Image Recognition [1.8] 本稿では,ittextbfDeep textbfTree textbfTensor textbfNetwork (DTTN) という新しいアーキテクチャを紹介する。
DTTNは、マルチ線形操作を通じて、機能間での2L$の乗法的相互作用をキャプチャする。
理論的には、特定の条件下での量子インスパイアされたTNモデルと相互作用するネットワークの等価性を明らかにする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:41:33 GMT)
Arithmetic in Transformers Explained [1.8] 我々は、加算、減算、または両方で訓練された44個の自己回帰トランスモデルを解析する。
加算モデルが共通論理アルゴリズムに収束し、ほとんどのモデルが99.999%の精度で予測できることを示す。
我々は,これらのアルゴリズム回路を定義し,発見し,視覚化するために,機械的解釈可能性ツールの再利用ライブラリを導入する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:43:31 GMT)
Learning Stochastic Dynamics from Snapshots through Regularized Unbalanced Optimal Transport [1.7] 少ない時間分解スナップショットからのサンプルを使用して動的に再構築することは、自然科学と機械学習の両方において重要な問題である。
本稿では、正規化された不均衡な最適輸送(RUOT)を解き、観察されたスナップショットから連続的な不均衡なダイナミクスを推定するための新しいディープラーニング手法を提案する。
本手法は,RUOT形式に基づいて,成長・死過程の事前知識や追加情報を必要とせず,これらのダイナミクスをモデル化する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:36:01 GMT)
Entropy Collapse in Mobile Sensors: The Hidden Risks of Sensor-Based Security [1.6] 複数のアプリケーションコンテキストにまたがる4つの多様なデータセットにわたるモバイルセンサデータのエントロピーを系統的に分析する。
シャノンエントロピーは複数の倍数であるにもかかわらず, 単一センサの平均ミンエントロピー値は3.408-4.483ビット (S.D.=1.018-1.574) である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:43:47 GMT)
Utilizing Transaction Prioritization to Enhance Confirmation Speed in the IOTA Network [1.5] IOTAネットワーク内でのクリティカルまたは高プライオリティなIoTトランザクションの優先度レベルを統合するために設計された最適化フレームワークを提案する。
実験結果から,提案アルゴリズムの優先度の高いトランザクションは,従来のIOTAシステムに比べて少ない時間で最終確認値に達することがわかった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:57:34 GMT)
A Latent Causal Inference Framework for Ordinal Variables [1.5] Likertスケールのような正規変数は応用研究において一般的である。
因果推論の既存の方法は、名目または連続的なデータをターゲットにする傾向がある。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:33:21 GMT)
SoK: State of the time: On Trustworthiness of Digital Clocks [1.5] 本研究の目的は,タイミングスタックを敵の操作に脆弱にする問題を総合的に理解することである。
これにより、物理的タイミング成分やデバイス上でのタイムキーピングなど、新たな攻撃面が発見できる。
新たに出現する信頼性の高いタイミングアーキテクチャには欠陥があり,システムセキュリティがより広範なリスクを伴っていることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:37:02 GMT)
Adaptive Neural Networks for Intelligent Data-Driven Development [1.4] 本稿では,既知の物体を現在の知覚システムに効率的に組み込むことができる適応型ニューラルネットワークアーキテクチャを提案する。
1)既存の性能を維持しながら新しいクラスを統合するスケーラブルなネットワーク拡張戦略,(2)新たに追加されたクラスの追加リトレーニングを必要としない動的OoD検出コンポーネント,(3)安全クリティカルなデプロイメントに適した検索ベースのデータ拡張プロセスである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:18:54 GMT)
Aspect-Oriented Summarization for Psychiatric Short-Term Readmission Prediction [1.4] 大規模言語モデル(LLM)は、タスク固有のデータセットの教師付きトレーニングを必要とせずに、長いドキュメントを処理できる。
長い複雑な入力を持つタスクに対して実現可能なアプローチの1つは、まず文書を要約し、次に教師付き微調整を要約に適用することである。
本稿では,原文書の異なる重要な側面を捉えることを目的とした,長文の要約処理手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:59:28 GMT)
F-StrIPE: Fast Structure-Informed Positional Encoding for Symbolic Music Generation [1.3] 本稿では,線形複雑度に作用する構造インフォームドPEスキームF-StrIPEを提案する。
記号音楽におけるメロディを用いたF-StrIPEの経験的メリットを解説する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:15:18 GMT)
Optimal lower Lipschitz bounds for ReLU layers, saturation, and phase retrieval [1.2] 本稿では,3つの問題を統一的な視点で再検討する。
リプシッツ境界をReLU層とクリッピングに導出し、これは相検索の既知結果と類似している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:10:28 GMT)
A Powerful Random Forest Featuring Linear Extensions (RaFFLE) [1.2] RaFFLEは、ランダムな森林アンサンブル内でPILOTツリーをベースラーナーとして統合する新しいフレームワークである。
PILOT木は、従来の決定木の計算効率と線形モデル木の柔軟性を組み合わせたものである。
RaFFLEは様々な回帰問題に対処するための汎用ツールであることが証明されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:22:51 GMT)
TransGUNet: Transformer Meets Graph-based Skip Connection for Medical Image Segmentation [1.2] 我々は、スキップ接続フレームワークを強化するために、注意的クロススケールグラフニューラルネットワーク(ACS-GNN)を導入する。
ACS-GNNは、クロススケールな特徴マップをグラフ構造に変換し、ノードの注意を通して複雑な解剖学的構造をキャプチャする。
我々のフレームワークであるTransGUNetは、ASS-GNNとEFSをベースとした空間 attentio から構成され、様々なモードでドメインの一般化性を高める。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:54:13 GMT)
Video Soundtrack Generation by Aligning Emotions and Temporal Boundaries [1.2] EMSYNCはビデオベースのシンボリック音楽生成モデルであり、音楽とビデオの感情的内容と時間的境界を一致させる。
本研究では,音節をシーンカットで予測・調整できる新しい時間的条件付け機構である境界オフセットを導入する。
主観的聴取テストにおいて、EMSYNCは、音楽理論を意識した参加者だけでなく、一般の聴取者に対しても、すべての主観的尺度で最先端のモデルより優れている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:32:59 GMT)
Limited Parallelization in Gate Operations Leads to Higher Space Overhead and Lower Noise Threshold [1.2] 現代の誤り訂正量子メモリや回路では、クロストークのような問題によりゲート操作の並列化が厳しく制限されている。
本稿では,誤差補正フレームワークの並列化レベルの観点から,必要空間のオーバーヘッドに対する解析的下限を求める。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:06:22 GMT)
Federated Learning with Reservoir State Analysis for Time Series Anomaly Detection [1.2] フェデレートラーニングでは、複数のクライアントによるローカルモデルトレーニングとサーバによるモデル統合は、モデルパラメータ共有によってのみ繰り返される。
本研究では,計算効率とデータプライバシ保護を同時に求めるために,貯水池状態解析を用いたフェデレーション学習手法を提案する。
時系列異常検出のためのベンチマークデータセットを用いて,InFed MD-RSの性能評価を行った。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:34:44 GMT)
Evaluating and Improving Graph-based Explanation Methods for Multi-Agent Coordination [1.1] グラフニューラルネットワーク(GNN)が採用され、マルチロボットとマルチエージェント学習に極めて有効であることが示されている。
複数エージェントの協調関係を説明するための既存のGNN説明手法の適合性について検討し,その特徴付けを行う。
本稿では,GATベースのポリシーを既存のグラフベースの説明書に適応できるような注意エントロピー正規化項を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:25:45 GMT)
A Roadmap to Address Burnout in the Cybersecurity Profession: Outcomes from a Multifaceted Workshop [1.0] 社会技術レンズを通してバーンアウトの原因と結果を探究することが不可欠である。
サイバーセキュリティのリーダーの46%近くが、彼らの役割を離れることを考えている。
この分析の中心は、元国家安全保障局(NSA)の戦術サイバーオペレーターの実証研究である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:55:13 GMT)
PromptArtisan: Multi-instruction Image Editing in Single Pass with Complete Attention Control [1.0] PromptArtisanはマルチインストラクション画像編集の画期的なアプローチだ。
1回のパスで顕著な結果が得られ、時間を要する反復的な改善の必要性がなくなる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:11:57 GMT)
Commitment Schemes from OWFs with Applications to Quantum Oblivious Transfer [1.0] 本稿では,量子オブリバスト転送プロトコルにおけるコミットメントスキームの効率改善について検討する。
2ビット文字列の通信複雑性を低減するために,一方向関数(OWF)の存在を必要とするNaorのコミットメントスキームの拡張を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:35:38 GMT)
MathConstruct: Challenging LLM Reasoning with Constructive Proofs [0.9] mcは、様々な数学コンペから得られた126の課題の新しいベンチマークである。
mcは、解の正確性を容易に検証できるため、大規模言語モデルの評価に適している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:44:22 GMT)
On multivariate polynomials achievable with quantum signal processing [0.9] 量子信号処理(QSP)は、多くの既知の量子アルゴリズムを統一し、単純化することが証明されたフレームワークである。
QSPプロトコルで達成できるものを特徴付けることは、この技法の力の重要な部分である。
この研究は、文献で見られるものと若干異なる形式を使い、分解性のためのより単純な必要条件を見つけるために使用する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:07:25 GMT)
Estimation of the Learning Coefficient Using Empirical Loss [0.9] 学習係数は,情報基準の性能分析において重要な役割を果たす。
本稿では,従来の手法と根本的に異なる新しい数値推定法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:30:04 GMT)
Bulk-to-boundary anyon fusion from microscopic models [0.9] 2+1次元非キラルトポロジカル秩序の固定点モデルにおいて,バルク内および境界におけるエノン間の融合現象について検討した。
我々の構成における繰り返しのテーマは、ツイストされたコホモロジー群を未解決群に関連付ける同型である。
この研究の結果は、有限群のツイストゲージ理論によって記述された境界を持つ2次元位相誤差補正符号の論理作用素を直接的に研究することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:51:14 GMT)
Variational optical phase learning on a continuous-variable quantum compiler [0.9] 本稿では,2つのモード列光を用いてガウスユニタリ演算を学習するCV量子コンパイラの実験実装について述べる。
本研究の結果は, 可変スチーズによるコストランドスケープの調整可能制御によって実現され, 同時に精度を高め, 解決までの時間を短縮するための重要な枠組みが提供される。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:52:18 GMT)
Mitigating the Impact of Labeling Errors on Training via Rockafellian Relaxation [0.9] ニューラルネットワークトレーニングのための新しい損失軽減手法であるRockafellian Relaxation Method (RRM)を提案する。
RRMは、コンピュータビジョンと自然言語処理における分類タスクにおける堅牢な性能を達成するために、ニューラルネットワーク手法を強化することができることを示す実験(感覚分析)
RRMは、ラベル付けエラーと/または敵対的摂動の両方から生じるデータセット汚染の影響を緩和し、さまざまなデータドメインと機械学習タスクで有効性を示すことができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:48:52 GMT)
Annotating Compositionality Scores for Irish Noun Compounds is Hard Work [0.8] 本稿では,アイルランド語で特定される各種ドメインの複合名詞について,専門家アノテータによる分析を行った。
我々は、重要な特徴である構成性だけでなく、ドメインの特異性にも焦点を合わせ、アノテータの親しみと信頼度も評価します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:32:29 GMT)
A Sea of Coins: The Proliferation of Cryptocurrencies in UniswapV2 [0.8] 新たに作成したトークンの財務的影響を分析し、市場ダイナミクス、収益性、流動性操作を評価する。
簡単な買い買い戦略を適用することで、新しく作成されたトークンへの投資に関連するいくつかの大きなリスクを明らかにすることができます。
本研究は、分散市場におけるリスクと金融のダイナミクスと投資家への課題に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:18:39 GMT)
A Hybrid Edge Classifier: Combining TinyML-Optimised CNN with RRAM-CMOS ACAM for Energy-Efficient Inference [0.8] 近接センサ機械学習(ML)アプローチは、正確でエネルギー効率のよいテンプレートマッチング処理を導入するために実装されている。
極端端ケースで実現可能な新しいソリューションを導入するために,従来の技術と新興技術を組み合わせたハイブリッドソリューションが提案され始めている。
エッジアプリケーションに最適化されたディープニューラルネットワーク(DNN)は、エッジMLソリューションの実装において強力な候補になる可能性がある。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:21:36 GMT)
SAMRI-2: A Memory-based Model for Cartilage and Meniscus Segmentation in 3D MRIs of the Knee Joint [0.8] 本研究では,メモリベースのVFMを用いた3次元MRIによる軟骨・半月板分割のためのディープラーニング(DL)手法を提案する。
我々はCNNベースの3D-VNetと2つの自動トランスフォーマーベースモデル(SaMRI2DとSaMRI3D)、およびトランスフォーマーベースのプロンプト可能なメモリベースVFM(SAMRI-2)を270例の3D膝MRIで訓練した。
SAMRI-2はHSSで訓練され、他の全てのモデルより優れ、平均5ポイント改善し、最高12ポイント向上した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:18:01 GMT)
HADL Framework for Noise Resilient Long-Term Time Series Forecasting [0.8] 長期の時系列予測は、金融、経済、エネルギーといった分野において重要である。
拡張されたルックバックウィンドウにおける時間ノイズの影響は未調査であり、しばしばモデル性能と計算効率を劣化させる。
本稿では、離散ウェーブレット変換(DWT)と離散コサイン変換(DCT)を統合することで、これらの課題に対処する新しいフレームワークを提案する。
提案手法は,ノイズの多い入力に対する競合堅牢性を示し,計算複雑性を著しく低減し,多様なベンチマークデータセット間での競合性ないし最先端の予測性能を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:41:42 GMT)
Interlayer Dzyaloshinskii-Moriya interactions induced via non-linear phononics in bilayer van der Waals materials [0.8] 本研究では, 非線形フォニックスによる光駆動構造変化が2層ファンデルワールス材料の磁気秩序に及ぼす影響について検討した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:18:21 GMT)
ORI: O Routing Intelligence [0.7] 単一大規模言語モデル(LLM)は、成長を続けるタスクの範囲に直面すると、しばしば不足する。
我々は,一組のLLMを利用する動的フレームワークであるORI(O Routing Intelligence)を提案する。
クエリをインテリジェントにルーティングすることで、ORIはMMLUで最大2.7ポイント、MuSRで1.8ポイントという最強の個別モデルを上回っている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:00:20 GMT)
Efficient Hierarchical Contrastive Self-supervising Learning for Time Series Classification via Importance-aware Resolution Selection [0.7] 本稿では,階層型コントラスト学習モデルの学習方法を提案する。
各解像度のデータ埋め込みが極めて依存しているという事実に着想を得て、重要対応の解像度選択に基づくトレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:32:50 GMT)
What is a Feature, Really? Toward a Unified Understanding Across SE Disciplines [0.7] ソフトウェア工学において、'フィーチャー'の概念は要求工学(RE)やソフトウェア製品ライン(SPL)といった分野で矛盾なく定義される。
本稿では、実世界のプロジェクト間で機能がどのように記述され、実装され、管理されるかを研究するための実証的、データ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:08:53 GMT)
URIEL+: Enhancing Linguistic Inclusion and Usability in a Typological and Multilingual Knowledge Base [0.7] ELは、7970言語のための地理、系統学、およびタイプ論的ベクトル表現を提供する知識ベースである。
lang2vecツールを介してアクセス可能な4005言語のベクトル間の距離測定が含まれている。
これらの課題に対処するために、これらの制限に対処するELとlang2vecの拡張バージョンであるEL+を紹介します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:30:10 GMT)
Increasing Both Batch Size and Learning Rate Accelerates Stochastic Gradient Descent [0.7] 4つのスケジューラを用いたミニバッチ勾配降下(SGD)の理論解析を行った。
我々は,スケジューラ(i)を用いたミニバッチSGDが,経験的損失の完全な勾配ノルムの期待を最小化しているとは限らないことを示す。
また,スケジューラ (iii) や (iv) を用いることで,スケジューラ (i) や (ii) よりもスケジューラ (i) よりもスケジューラ (i) や (ii) の方がスケジューラ (iv) の完全勾配ノルムが小さくなることを示す解析結果も提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:58:34 GMT)
TRISHUL: Towards Region Identification and Screen Hierarchy Understanding for Large VLM based GUI Agents [0.7] TRISHULは、総合的なGUI理解のための一般のLVLMを強化する、トレーニング不要のフレームワークである。
この結果は、ScreenSpot、VisualWebBench、AITW、Mind2WebデータセットをまたいだアクショングラウンドにおけるTRISHULの優れたパフォーマンスを示している。
GUI参照の場合、TRISHULはScreenPRベンチマークのToLエージェントを超え、堅牢で適応可能なGUI理解のための新しい標準を設定している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 06:23:57 GMT)
Interpretable Early Warnings using Machine Learning in an Online Game-experiment [0.7] 大規模なソーシャルゲームであるRedditのr/placeは、統計的早期警告信号をテストするユニークな機会を提供する。
我々は,複数のシステム固有の時系列の予測能力を組み合わせた,機械学習に基づく早期警告システムを開発した。
我々のアルゴリズムは、20分以内に起こる遷移の半分を、わずか3.7%の偽陽性率で検出する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:14:50 GMT)
DPM-Bench: Benchmark for Distributed Process Mining Algorithms on Cyber-Physical Systems [0.7] 本稿では分散プロセスマイニングアルゴリズムの比較のためのDPM-Benchベンチマークを紹介する。
その結果、情報システム技術者は、既存のインフラが分散プロセスマイニングを行うのに十分かどうかを評価することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:02:18 GMT)
Parity Quantum Computing as YZ-Plane Measurement-Based Quantum Computing [0.7] 最近導入された定数深度復号法を応用した普遍パリティ量子計算は,YZ平面計測のみを用いた二部グラフ上の測定に基づく量子計算と等価であることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:10:02 GMT)
Merging public elementary schools to reduce racial/ethnic segregation [0.6] 学校合併」とは、学校における通学境界、あるいはキャッチメントエリアを融合させることである。
この方法でのペアリングや三つ組の学校は、人種と民族の分離を中央値の20%減少させる可能性がある。
当社の結果は、政策立案者やコミュニティメンバがさらなる調査を行うための公開ダッシュボードを通じて公開されています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:36:28 GMT)
Zeno-effect Computation: Opportunities and Challenges [0.6] 我々は、立方体を直接ではなく3つの状態系に基づいて構成するので、立方体は状態の1つを投影した後に残ることができる。
測定や散逸的ゼノ効果によって排他的に定義された設定がフラストレーションを許さない、という大きな課題がある。
我々は、例えば、光学的設定でしばしば行われるような、利得と損失を含む、この課題を克服する手法について議論する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:32:09 GMT)
What You See Is Not Always What You Get: An Empirical Study of Code Comprehension by Large Language Models [0.6] ソースコードに隠された文字操作がLLMの動作を誤認し,人間のレビュアーには検出不能なままにしておくという,大きな言語モデル(LLM)の攻撃に対する脆弱性について検討する。
これらの攻撃には、コードリオーダー、見えないコーディング文字、コード削除、コードホモグリフが含まれる。
以上の結果より,LLMは摂動の大きさと性能に異なる負の相関性を示す一方,LLMは認識不能なコードキャラクタ攻撃に対する感受性を示すことが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:21:37 GMT)
Automated Test Case Repair Using Language Models [0.6] 欠陥のないテストケースは、テストスイートの品質を低下させ、ソフトウェア開発プロセスを破壊します。
テストケースの自動修復に事前訓練されたコード言語モデルを活用する新しいアプローチであるTaRGETを提案する。
TaRGETは、テスト修復を言語翻訳タスクとして扱い、言語モデルを微調整するために2段階のプロセスを使用する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:02:51 GMT)
Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model [0.6] VibeGenは、ノーマルモードの振動を条件としたエンド・ツー・エンドのデ・ノボタンパク質の設計を可能にする、ジェネレーティブなAIフレームワークである。
我々の研究は、タンパク質のダイナミクスを生成タンパク質の設計に統合し、配列と振動の振舞いの直接的な双方向リンクを確立する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:07:54 GMT)
Symmetry-Aware Bayesian Flow Networks for Crystal Generation [0.6] 結晶生成のための新しい対称性対応ベイズフローネットワーク(BFN)であるSymbBFNを紹介する。
SymmBFNは効率を大幅に改善し、安定な構造を生成する。
結晶性物質の発見を加速するための有効なツールとして,BFNが確立されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:29:18 GMT)
Exploring Channel Distinguishability in Local Neighborhoods of the Model Space in Quantum Neural Networks [0.5] 量子ニューラルネットワーク(QNN)が登場し、注目されている。
QNNはトレーニングが難しいことで知られていますが、これは部分的にはAnsatzesと呼ばれるアーキテクチャによるものだと仮定しています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:05:51 GMT)
SGS-GNN: A Supervised Graph Sparsification method for Graph Neural Networks [0.5] SGS-GNNは,エッジとサンプルのスパース部分グラフのサンプリング確率分布をユーザが指定したサイズで学習する新しい教師付きグラフスペーサーである。
SGS-GNNは損失関数に正規化器を用いてスパースグラフのホモフィリーを高め、異種グラフ上のGNNの精度を高める。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:03:43 GMT)
Learning Fair Policies for Infectious Diseases Mitigation using Path Integral Control [0.5] 感染症は社会に大きな公衆衛生上の問題を引き起こす。
本研究では,不確実性のある意思決定のための枠組みを提案し,公平性に配慮した病害軽減政策を策定する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:08:06 GMT)
Learning to Solve the Min-Max Mixed-Shelves Picker-Routing Problem via Hierarchical and Parallel Decoding [0.4] 混合棚ピッカールーティング問題(MSPRP)はロジスティクスにおける基本的な課題であり、ピッカーはSKUを効率的に回収するために混合棚環境をナビゲートする必要がある。
マルチエージェント強化学習により,MSPRPのmin-max変異を解くための新しい階層的並列デコーディング手法を提案する。
実験では、特に大規模およびアウト・オブ・ディストリビューションインスタンスにおいて、ソリューションの品質と推論速度の両方で最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:42:30 GMT)
Diamond Circuits for Surface Codes [0.4] ダイヤモンド回路と呼ばれる興味深い回路ファミリを提示し、ベンチマークする。
彼らはサブシステムサーフェスコードを中心に構築されたミドルサイクル構造を使用して、リーブまたは「ヘビースクエア」格子上にサーフェスコードを実装する。
これらの回路は、周波数衝突や制御線数によって量子コンピュータが制限される状況において有用である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:33:43 GMT)
Mapping bathymetry of inland water bodies on the North Slope of Alaska with Landsat using Random Forest [0.4] アラスカの北斜面は小さな水域が支配しており、地域住民や野生生物にとって重要な生態系を提供している。
このような情報収集の難しさから,水面深の詳細な情報は乏しい。
我々は,アラスカ北斜面の多スペクトルランドサットデータから深度を予測するために,機械学習モデル(ランサムフォレスト回帰モデル)を訓練した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:08:37 GMT)
VisCon-100K: Leveraging Contextual Web Data for Fine-tuning Vision Language Models [0.4] 我々は、インターリーブされた画像テキストWebドキュメントから派生した新しいデータセットVisCon-100Kを紹介する。
提案手法では,45KのWebドキュメントをOBELICSデータセットから100Kの画像会話サンプルに変換する。
GPT-4V を用いて画像・コンテキストキャプションと OpenChat 3.5 モデルを生成し,これらのキャプションを多種多様な自由形式の質問応答対に変換する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:59:33 GMT)
A novel approach to data generation in generative model [0.3] 本稿では,データ生成を再定義する新しい幾何学的枠組みであるConvergent Fusion Paradigm理論を紹介する。
潜在空間幾何学を変更して創発的な高次元構造と相互作用することで、その理論は識別可能性問題や幻覚のような意図しない人工物といった重要な課題に対処する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:27:02 GMT)
Variationally optimizing infinite projected entangled-pair states at large bond dimensions: A split-CTMRG approach [0.3] 本稿では,PEPS層を分離し,新しい環境テンソルを活用することで,精度を保ちながら計算複雑性を低減できる「スプリットCTMRG」アルゴリズムを提案する。
量子格子モデルのベンチマークでは、変動エネルギー最適化のためのかなりのスピードアップが示され、この手法は大規模PEPSシミュレーションに有用である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:59:33 GMT)
Machine Learning for Phase Estimation in Satellite-to-Earth Quantum Communication [0.2] グローバル連続可変量子鍵分布(CV-QKD)ネットワークは、衛星から地球への一連のチャネルを用いて確立することができる。
CV-QKDの実装には,信号位相誤差推定アルゴリズムの高速化と精度が不可欠である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:07:59 GMT)
A Simulation-Based Framework for Leveraging Shared Autonomous Vehicles to Enhance Disaster Evacuations in Rural Regions with a Focus on Vulnerable Populations [0.2] 本研究は,農村部における災害前・災害後避難にSAVを配備する枠組みを提案する。
この枠組みは、障害者、英語能力の制限、高齢者を含む脆弱なグループのニーズを優先している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:34:02 GMT)
Flat-band (de)localization emulated with a superconducting qubit array [0.2] 超伝導量子ビットアレイを用いてロンベック格子上の密結合モデルをエミュレートする。
分散バンドに対する障害誘発パラメータの局在と、フラットバンドに対する障害誘発非局在を観察する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:51:33 GMT)
Opportunities and challenges of quantum computing for climate modelling [0.1] 気候変動への適応には、堅牢な気候予測が必要である。
これらの射影の不確かさは大きい。
機械学習ベースのハイブリッドESMの新たな開発は、システム的にエラーを低減させる大きな可能性を示している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:25:06 GMT)
ViRAC: A Vision-Reasoning Agent Head Movement Control Framework in Arbitrary Virtual Environments [0.1] 本稿では,大規模モデルの常識的知識と推論能力を活用するViRACを提案する。
ViRACは最近の最先端技術よりも自然でコンテキスト対応の頭部回転を生成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:46:43 GMT)
ProReco: A Process Discovery Recommender System [0.1] 本稿ではプロセス発見レコメンダシステムProRecoを紹介する。
ProRecoは、ユーザの好みとイベントログの特性に基づいて、最も適切なアルゴリズムを推奨している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:34:36 GMT)
Detecting hidden structures from a static loading experiment: topology optimization meets physics-informed neural networks [0.1] 隠れた測地を識別するPINNに基づくトポロジ最適化フレームワークを提案する。
我々は,隠れた空洞と包含物の数,位置,形状を検出することによって,我々の枠組みを検証する。
本手法は,工学における幾何最適化問題を解くためのPINNの経路を開く。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:20:06 GMT)
Quantum Neural Networks for Cloud Cover Parameterizations in Climate Models [0.1] 短時間の高解像度気候シミュレーションで訓練された機械学習モデルは、従来のパラメータ化を代替する有望な候補である。
QNNは従来のものと異なり、その高い表現性が、正確なデータ駆動スキームのための有望なツールになる可能性がある。
調査対象のQNNの全体的な性能は、トレーニング可能なパラメータの数と同じ大きさの古典的NNと同等であることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:02:49 GMT)
Zero Shot Time Series Forecasting Using Kolmogorov Arnold Networks [0.0] 異なる市場における市場不変の表現を学習することにより、エネルギー価格を予測するために設計されたクロスドメイン適応モデルを導入する。
Kolmogorov-Arnoldネットワークを利用することで、我々のモデルはエネルギー価格データの複雑なパターンを捉える能力を高めることができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:50:40 GMT)
Variational Scarring in Graphene Quantum Dots [0.0] 単層グラフェン上に作製した楕円量子ドットにおいて, 変分スカーリングが発生することを示す。
また,これらの傷跡の指紋は走査型トンネル顕微鏡で検出できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:38:48 GMT)
Variational Inference on the Boolean Hypercube with the Quantum Entropy [0.0] ブールハイパーキューブ上の対数マルコフ確率場の対数分割関数上界の変分推論を導出する。
そこで本研究では,これらの境界を原始双対最適化に基づいて効率的に計算するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:25:32 GMT)
Using Artificial Intelligence to Improve Classroom Learning Experience [0.0] その焦点は、機械学習アルゴリズムを使って生徒の学習体験を改善することだ。
ロジスティック回帰アルゴリズムは、評価スコア、授業期間、好みの学習スタイルなどの6つの予測変数を用いてバイナリ分類に適用される。
76,519人の候補者と35人の予測変数によるケーススタディでは、ロジスティック回帰を用いて学術的なドロップアウトリスクを評価し、テスト精度は87.39%である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:15:37 GMT)
Understanding the relationships between the perceptions of burnout and instability in Software Engineering [0.0] 燃え尽き症候群は、生産性、転職、そして最も重要なことは、開発者の幸福に影響を与えると認識されている病気です。
本研究は,ソフトウェア開発者の間で認識される不安定性とバーンアウトの関係を同定し,記述することを目的とする。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:59:30 GMT)
Unconventional Transport in a System with a Tower of Quantum Many-Body Scars [0.0] 本稿では, 量子多体傷の塔を支えるスピン-1モデルにおいて, 非定常輸送現象の観測を報告する。
量子多体傷に近いエネルギーを持つ励起状態が輸送を維持する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:58:39 GMT)
Ultracold long-range van der Waals Rydberg trimer [0.0] 希薄原子-ガス混合系における超長距離ファンデルワールス三量体の存在を予測した。
これらは、長距離ファンデルワールス相互作用によって媒介されるリドベルク原子と二原子極性分子の結合状態である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:02:27 GMT)
TrustZero - open, verifiable and scalable zero-trust [0.0] この論文では、ユニバーサルな"トラストトークン"を中心に構築されたゼロトラストセキュリティのスケーラブルなレイヤであるTrustZeroを紹介します。
ZTAの原則と暗号を統合することで、TrustZeroはレガシーシステムや組織間通信に適応可能なセキュアなWeb-of-trustフレームワークを確立する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:38:08 GMT)
Translating Common Security Assertions Across Processor Designs: A RISC-V Case Study [0.0] RISC-Vは、プロセッサ設計における適応性とコスト効率で人気を集めている。
アサーションベースのセキュリティ検証は、セキュリティ機能が効果的に満たされることを保証するための有望なアプローチであることが証明されている。
最近のアプローチでは、事前に定義されたセキュリティアサーションを別の設計に翻訳することに重点を置いている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:36:47 GMT)
Towards mutual synchronization of serially connected Spin Torque Oscillators based on magnetic tunnel junctions [0.0] 複数のニューロモルフィックアプリケーションは、2つ以上のデバイスを共通の信号にチューニングする必要がある。
スピントロニクスでは、直流信号を用いた2つの発振器の同期は依然として難しい問題である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:34:01 GMT)
The simplest 2D quantum walk detects chaoticity [0.0] 二次元閉領域(硬壁ビリヤード)の2つの空間座標に沿った1次元の交互ウォークからなる極めて単純なモデルを考える。
境界の形状が決定論的古典的な運動方程式を誘導し、量子化問題に対するカオス的シグネチャに変換するカオス的あるいは規則的挙動は、量子ウォーカーの固有関数のスペクトル統計学と形態学の急激な違いをもたらす。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:55:45 GMT)
The molecular nature of superfluidity: Viscosity of helium from quantum stochastic molecular dynamics simulations over real trajectories [0.0] 量子液体の粘度は古典液体の粘度よりも著しく小さく、最も低い温度でほぼ5倍小さい。
古典と量子の液体はボース=アインシュタイン凝縮を除いて同一であり、超流動性の分子機構を示唆している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 03:35:49 GMT)
The information loss problem and Hawking radiation as tunneling [0.0] 我々はホーキング放射をトンネルとして解法を再検討する。
ブラックホールの蒸発は時間依存シュロディンガー方程式によって制御されていることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:25:46 GMT)
The Quantum Wave Function as a Complex Probability Distribution [0.0] 波動関数とその複素共役は複素確率分布と解釈できることを示す。
量子論におけるプロセスの考え方を受け入れることは、大きな物体に古典的な振る舞いが現れる理由を説明するかもしれないことが示唆されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:39:06 GMT)
The Jaynes Cummings model as an autonomous Maxwell demon [0.0] 我々は,ジャイネス累積モデルを,キュービットを非常に大きな初期コヒーレント場を持つ空洞に結合する自律熱力学機械として再考する。
本分析では, クビットの単元的挙動を短時間で予測するなど, このモデルの異なる挙動を明らかにする。
その後のダイナミクスは、キュービット上の空洞からのフィードバックを特徴としており、初期状態に関わらず、キュービットを浄化しているように見える。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:10:09 GMT)
The Eclipsing Binaries via Artificial Intelligence. II. Need for Speed in PHOEBE Forward Models [0.0] 現代の天文学では、収集されたデータの量は手動分析の能力を大きく上回っている。
AIは、フォワードモデルを生成するのに必要な時間から計算ボトルネックが発生するシミュレーションコードを最適化することができる。
我々は、100万以上の合成光曲線のデータセットに基づいてトレーニングされた、完全に接続されたフィードフォワード人工ニューラルネットワーク(ANN)を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:44:33 GMT)
The Devil is in the Prompts: De-Identification Traces Enhance Memorization Risks in Synthetic Chest X-Ray Generation [0.0] 生成モデル、特にテキスト画像拡散モデル(T2I)は、医療画像解析において重要な役割を果たす。
これらのモデルは、データの記憶をトレーニングする傾向があり、患者のプライバシに重大なリスクをもたらす。
本研究は,データ記憶のトレーニングに最も寄与するプロンプトを同定するための最初の体系的試みである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:24:56 GMT)
The Blind Men and the Elephant: Mapping Interdisciplinarity in Research on Decentralized Autonomous Organizations [0.0] 分散自治機構(DAO)は、特にビジネス、経済学、コンピュータ科学において、学際的な関心を集めている。
研究は分野によって断片化され、その可能性に対する包括的な理解が制限されている。
現在の研究は主に応用され、ケース駆動であり、理論的な統合は限られている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:06:43 GMT)
The $S=\frac{1}{2}$ XY and XYZ models on the two or higher dimensional hypercubic lattice do not possess nontrivial local conserved quantities [0.0] 我々は、モデルがハミルトニアンのような自明なものを除いて局所保存量を持たないことを証明した。
この結果は、モデルが非可積分であることを強く示唆している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:34:12 GMT)
Technical Risks of (Lethal) Autonomous Weapons Systems [0.0] 自律兵器システム(L)AWSの自律性と適応性は、前例のない運用能力を約束する。
しかし、彼らはまた、国際安全保障における制御、説明責任、安定性の原則に挑戦する深刻なリスクも導入している。
このレポートでは、(L)AWSデプロイメントに関連する重要な技術的リスクを概説し、予測不能、透明性の欠如、運用上の信頼性の欠如を強調している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:09:43 GMT)
Studying number theory with deep learning: a case study with the Möbius and squarefree indicator functions [0.0] 我々は、M"obius function $mu(n)$ と squarefree indicator function $mu2(n)$ を計算するために小さな変換器モデルを訓練する。
我々は、モデルがどのように機能するかを理解するために追加モデルを反復的に訓練し、最終的には理論的な説明を見つける。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:50:00 GMT)
Stimulated emission or absorption of gravitons by light [0.0] サニャック型幾何学における重力波と電磁波のエネルギー交換について検討する。
現代の技術で、刺激された放出やグラビトンの吸収の兆候を観察できるはずである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:15:15 GMT)
Statistical modeling of categorical trajectories with multivariate functional principal components [0.0] 分類過程の統計的モデリングの問題を多変量関数型データ解析問題に変換する。
本研究では,2つ以上の状態を同時に観察できる時間的チェック・ア・ア・ア・ア・ア・ア・ア・ア・プリーなどの実験を,容易に拡張して分析する方法を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:15:17 GMT)
Stabilizing and Solving Inverse Problems using Data and Machine Learning [0.0] 境界条件が不明な非線形偏微分方程式 (PDE) に対する解の再構成を含む逆問題を考える。
この集合データを活用するために、まず、線形展開において適切な分解(POD)を用いて境界データを圧縮する。
我々は,低次元潜在空間におけるデータセットのパラメトリゼーションを提供するオートエンコーダを用いて,拡張係数の非線形低次元構造を同定する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:22:09 GMT)
Spin coherence in strongly coupled spin baths in quasi-two-dimensional layers [0.0] 本研究では,NV$-$-スピンのスピンコヒーレンス崩壊をダイヤモンド層中の窒素欠陥の強いカップリング浴と相互作用させることを検討した。
薄いダイヤモンド層では、スピンコヒーレンス時間がバルクダイヤモンドの時間を超えることが示され、バルクの高欠陥濃度による制限を超えることができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:55:19 GMT)
Spin Liquid and Superconductivity emerging from Steady States and Measurements [0.0] リンドブラディアン群の進化の定常混合状態は、二重ヒルベルト空間の「グッツウィラー射影」波動関数に写像する。
また、混合状態の所望の物理を構成するための実験的プロトコルを設計する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:10:23 GMT)
Spatiotemporal Graph Neural Networks in short term load forecasting: Does adding Graph Structure in Consumption Data Improve Predictions? [0.0] 短期的な負荷予測は、従来の電力システムや現代の電力システムにおいて重要な役割を果たす。
ほとんどのSTLFモデルは、過去のデータからの時間的依存を利用して将来の消費を予測する。
スマートメーターの普及により、そのデータは一時的な依存関係を含むことができる。
STGNNは、グラフとしてスマートメーター間の関係をモデル化することで、そのような相互関係を利用することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:16:47 GMT)
SequentialBreak: Large Language Models Can be Fooled by Embedding Jailbreak Prompts into Sequential Prompt Chains [0.0] 本稿では,大規模言語モデル(LLM)の脆弱性を利用した新しいジェイルブレイク攻撃であるSequentialBreakを紹介する。
問題バンク,ダイアログ補完,ゲーム環境などの事例に限らず,有害なプロンプトをLCMを騙して有害な応答を発生させる良質なプロンプトに埋め込む,いくつかのシナリオについて論じる。
大規模な実験では、SequentialBreakは単一のクエリしか使用せず、攻撃成功率を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:32:54 GMT)
Schmidt Decomposition of Multipartite States [0.0] 量子状態のシュミット分解は、絡み合いの研究に有用な多くの性質を持つ。
我々は、多粒子状態のシュミット分解の存在に必要な十分条件を得る。
シュミット除算可能な多部状態の分解を効率よく得るアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:55:24 GMT)
SDC-HSDD-NDSA: Structure Detecting Cluster by Hierarchical Secondary Directed Differential with Normalized Density and Self-Adaption [0.0] 密度ベースのクラスタリングは最も人気のあるクラスタリングアルゴリズムである。
低密度領域で分離される限り、任意の形状のクラスターを識別することができる。
しかし、低密度領域で分離されていない高密度領域は、複数のクラスタに属する異なる構造を持つ可能性がある。
本稿では,この問題に対処する新しい密度クラスタリング手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:34:58 GMT)
Rigorous lower bound of the dynamical critical exponent of the Ising model [0.0] 最もよく知られた$d$-次元運動イジングモデルの動的臨界指数$z$のバウンドは$zgeq 2-eta$である。
私たちはこれを$zgeq 2$に厳格に改善します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 04:40:24 GMT)
Rhythmic sharing: A bio-inspired paradigm for zero-shot adaptation and learning in neural networks [0.0] 我々は,リンク強度の振動に基づく学習パラダイムを開発し,これらの振動の協調と学習を関連づける。
このパラダイムは,ニューラルネットワークの急速な適応と学習をもたらす。
我々の研究は、主要なAIモデルに迅速な適応と学習機能を導入するための扉を開く。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:18:34 GMT)
Revealing the fuel of a quantum continuous measurement-based refrigerator [0.0] 量子計測が熱や仕事の形でエネルギーを供給するかどうかを決定するためには,装置の顕微鏡モデルが必要であることを示す。
本研究では, 測定ベース冷凍機を熱で燃料とする場合の最大熱力学効率と, 作業時の信号-雑音比で定量化した最大測定効率とのトレードオフを実証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:24:13 GMT)
Representation and Interpretation in Artificial and Natural Computing [0.0] 仮定的自然言語処理では、どちらのプロセスも同一のエージェントによって実行される。
デジタルコンピュータで使用されるモードはアルゴリズムのモードである。
計算モードがアルゴリズムよりも強力になるためには、有効なアルゴリズムを欠いた関数を計算すべきである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:57:29 GMT)
Reinforcement Learning in Strategy-Based and Atari Games: A Review of Google DeepMinds Innovations [0.0] 強化学習(Reinforcement Learning, RL)は、多くのアプリケーション、特にゲームで広く使われている。
Google DeepMindはこの分野でイノベーションの先駆者であり、高度なAIモデルを作成するために強化学習アルゴリズムを使用している。
本稿では,アタリゲームと戦略ベースゲームにおける強化学習の意義について概説する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:06:34 GMT)
Quantum-selected configuration interaction with time-evolved state [0.0] 量子選択構成相互作用(QSCI)は、量子デバイス上の入力量子状態を使用して重要な基底を選択する。
QSCIの入力として,ターゲットハミルトニアンによる時間進化状態を提案する。
提案法により得られた量子化学ハミルトニアンのエネルギーの精度を数値的に検討する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:11:14 GMT)
Quantum Probability Geometrically Realized in Projective Space [0.0] 本稿では、与えられた量子系の複素ヒルベルト空間に関連する射影空間に全ての量子確率公式を渡すことを目的とする。
アップショットは、量子論は射影部分空間の確率論であり、または同等に、量子事象の確率論であるということである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:50:00 GMT)
Quantum Fanout and GHZ states using spin-exchange interactions [0.0] スピン交換(ハイゼンベルク)相互作用により、$n$論理量子ビット上のファンアウト演算をどのように実装できるかを示す。
また、同じ相互作用を使って任意の$q>1$に対してMod_qゲートを実装することも示しています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:17:32 GMT)
QMaxViT-Unet+: A Query-Based MaxViT-Unet with Edge Enhancement for Scribble-Supervised Segmentation of Medical Images [0.0] 医用画像分割のための新しいフレームワークQMaxViT-Unet+を提案する。
このフレームワークはU-Netアーキテクチャ上に構築されており、エンコーダとデコーダはMulti-Axis Vision Transformer (MaxViT)ブロックに置き換えられている。
提案したQMaxViT-Unet+は, 心構造, 大腸ポリープ, 乳癌に焦点を絞った4つの公開データセットで評価した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:56:24 GMT)
QKD security proofs for decoy-state BB84: protocol variations, proof techniques, gaps and limitations [0.0] 本稿では,BB84プロトコルを用いた事実上のデコイ状態量子鍵分布のセキュリティ証明について論じる。
私たちの焦点は、既存の文献のギャップにあります。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:02:30 GMT)
Probabilistic Lexical Manifold Construction in Large Language Models via Hierarchical Vector Field Interpolation [0.0] 提案手法は,単語表現が位相的整合性に従属する確率関数空間を構築する。
確率制約は、文脈関係を洗練することによって語彙コヒーレンスを高め、複数の言語分布における意味的安定性を改善する。
計算効率の評価では、表現は小さな処理オーバーヘッドをもたらすが、構造化された表現学習アプローチは実用的展開にはスケーラブルである。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:47:10 GMT)
Planckian Bounds From Local Uncertainty Relations [0.0] 熱多体系に「局所不確実性関係」を導入する。
これらは普遍的非相対論的速度制限と輸送係数境界をもたらす。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:57:43 GMT)
Persistent Topological Negativity in a High-Temperature Mixed-State [0.0] 我々はグリーンベルガー・ホルン・ザイリンガー状態(GHZ)のエンタングルメント構造を、強対称量子チャネルの下で熱化するときに研究する。
大規模地域のトポロジカルエンタングルメントの負性は, この遷移に敏感であることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:40:59 GMT)
Parameterization and optimizability of pulse-level VQEs [0.0] 量子固有解法(VQEs)試験状態は、一連のパラメータ化ゲートを基準状態に適用することによって作成される。
最近提案されたctrl-VQEアルゴリズムは、パルスの振幅、周波数、位相を分子エネルギーを最小化するために用いられる変動パラメータとして取る。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:46:56 GMT)
Optimal Dataset Size for Recommender Systems: Evaluating Algorithms' Performance via Downsampling [0.0] この論文は、レコメンデーションシステムのエネルギー効率を最適化するための戦略としてデータセットのダウンサンプリングを調査している。
7つのデータセット、12のアルゴリズム、そして2つのレベルのコアプルーニングに2つのダウンサンプリングアプローチを適用することで、この研究はランタイムと二酸化炭素排出量を大幅に削減することを示した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:35:58 GMT)
Ocular Disease Classification Using CNN with Deep Convolutional Generative Adversarial Network [0.0] 我々は,CNNに基づく分類モデルの訓練のためのデータセットを合成するために,GANに基づくデータ生成手法を提案する。
モデル分類の精度を元の眼画像と比較すると、近視の精度は78.6%、緑内障の88.6%、白内障の84.6%、全体分類の精度は84.6%である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:47:18 GMT)
Object Detection and Tracking [0.0] プロジェクトの目的は、オブジェクト検出のための最新の技術を統合することであり、リアルタイムのパフォーマンスで高い精度を達成することを目的としている。
本研究では,ディープラーニング技術を用いて,エンドツーエンドの物体検出問題を完全に解決する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:13:52 GMT)
New tools for comparing classical and neural ODE models for tumor growth [0.0] 腫瘍成長をモデル化するための新しい計算ツールであるTormaGrowth$.$jlが導入された。
このツールは、General BertalanffyやGompertzといった標準の教科書モデルと、ニューラルODEモデルを含む新しいモデルとの比較を可能にする。
今回我々は,非小細胞肺癌と膀胱癌に対するヒトのメタスタディを再検討し,これまで報告された性能差が統計的に有意であるか否かを判定した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:24:52 GMT)
Network Level Spatial Temporal Traffic State Forecasting with Hierarchical-Attention-LSTM (HierAttnLSTM) [0.0] 本稿では,オープンベンチマークにホストされたPeMS(Caltrans Performance Measurement System)から,多様なトラフィック状態データセットを活用する。
我々は,低レベルから高レベルLong Short-Term Memory (LSTM) ネットワーク間のセルおよび隠れ状態とアテンションプーリング機構を統合した。
構築された階層構造は、ネットワークレベルのトラフィック状態の空間的時間的相関をキャプチャして、異なる時間スケールにまたがる依存関係を考慮に入れられるように設計されている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:36:56 GMT)
Named entity recognition for Serbian legal documents: Design, methodology and dataset development [0.0] セルビア語で書かれた法的文書の場合には,名前付きエンティティ認識(NER)の一解法を提案する。
これは、テキストコンテンツから特定のデータポイントを識別し分類する特定のタスクに慎重に適応していた変換器(BERT)からの事前訓練された双方向エンコーダ表現を活用している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:23:39 GMT)
Mechanism and Emergence of Stacked Attention Heads in Multi-Layer Transformers [0.0] 最小限の層を持つ変圧器でのみ解決できる,単純で一般的な推論タスクである検索問題を紹介します。
大規模な言語モデルは、微調整をせずに、異なるプロンプト式でタスクを解くことができることを実証的に示します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:56:45 GMT)
Many-body theory calculations of positron binding to parabenzoquinone [0.0] パラベンゾキノンのポジトロン結合は、テキサブの多体理論を用いて研究されている。
偏光, 仮想ポジトロニウム生成, ポジトロンホール反発などの電子-ポジトロン相関の影響を考察した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:41:33 GMT)
Man Made Language Models? Evaluating LLMs' Perpetuation of Masculine Generics Bias [0.0] 本稿では,フランス語の汎用命令に対する男性ジェネリック(MG)の使用状況について分析する。
MGは中立ではなく、性バイアスを引き起こす。
また,LSMはジェンダーフェア言語を自然に使用するのに消極的であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 22:05:54 GMT)
Making sense of negative probabilities: An exact representation of the dynamics of quantum spin chains as classical stochastic processes with particle/antiparticle pairs [0.0] 顕著な問題は、非可換可観測体の合同確率を定義しようとするときに生じる。
古典的連続時間マルコフ連鎖を用いた量子スピン鎖の力学の正確な表現を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:00:11 GMT)
Long-range $CCΦ$ gates via radio-frequency-induced Förster resonances [0.0] 高周波誘起F"オースター共鳴相互作用に基づく新しいCCPhi$量子位相ゲートプロトコルを提案する。
室温条件下での平均ゲート忠実度は99.27 %である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:02:36 GMT)
Leveraging large language models for structured information extraction from pathology reports [0.0] 乳がん病理組織学的報告から構造情報を抽出する際の大規模言語モデルの精度を評価する。
構造化情報抽出のためのオープンソースツールは、自然言語を使って非プログラマがカスタマイズできる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:46:02 GMT)
Leveraging V2X for Collaborative HD Maps Construction Using Scene Graph Generation [0.0] HDマップは自動運転車のナビゲーションにおいて重要な役割を担い、精度と安全性を向上させるために搭載された知覚センサーを補完する。
従来のHDマップ生成は、コストがかかりリアルタイムのインフラ変更をキャプチャできない専用のマッピング車両に依存している。
本稿では,V2X通信とScene Graph Generationを利用する新しいフレームワークであるHDMapLaneNetについて述べる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:56:10 GMT)
Layered Uploading for Quantum Convolutional Neural Networks [0.0] 量子回路に沿ってデータをアップロードする新しいアーキテクチャを提案する。
これにより、量子回路に使用する量子ビットの数を増やすことなく、データからより多くの機能を利用することができます。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:59:44 GMT)
Large Language Models and Synthetic Data for Monitoring Dataset Mentions in Research Papers [0.0] 本稿では,研究領域間のデータセット参照検出を自動化する機械学習フレームワークを提案する。
我々は,研究論文からゼロショット抽出,品質評価のためのLCM-as-a-Judge,および改良のための推論剤を用いて,弱教師付き合成データセットを生成する。
推論では、ModernBERTベースの分類器がデータセットの参照を効率的にフィルタリングし、高いリコールを維持しながら計算オーバーヘッドを低減する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:16:02 GMT)
LSM Trees in Adversarial Environments [0.0] 我々は、読み取り性能の大幅な低下につながる敵のワークロードに焦点を当てる。
我々の評価では、人気のあるLSMストアの読み込み遅延を最大800%まで増加させています。
私たちは、LevelDBとRocksDBという2つの人気のあるLSMストアに逆レジリエンスを実装しています。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:25:25 GMT)
Ising Hamiltonian Minimization: Gain-Based Computing with Manifold Reduction of Soft-Spins vs Quantum Annealing [0.0] 半古典的ソフトスピンモデルと量子アニーリングの力学に基づくゲインベースの計算パラダイムの性能を比較する。
以上の結果から,これらの半古典的モデルが,次元景観の拡大による課題に直面していることが示唆された。
本稿では, ソフトスピン振幅を定義位相空間領域に制限する「多様体還元法」を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:14:31 GMT)
Investigation of intrinsic nonlinear effects in driven-dissipative optomechanical systems using the generalized linear response theory [0.0] 本研究では, 固有非線形光学相互作用が弱い摂動に対する駆動散逸型光学系の線形応答に及ぼす影響について検討した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:06:33 GMT)
InfoPos: A ML-Assisted Solution Design Support Framework for Industrial Cyber-Physical Systems [0.0] InfoPosフレームワークの最初のイテレーションを導入し、利用可能な位置を考慮したユースケースの配置を可能にします。
そのインプットによって、デザイナと開発者は最も効果的な対応する選択を明らかにすることができる。
産業用サイバー物理システムのための異常識別ユースケースであるデモ隊の結果は、異なるビルディングブロックの使用によって達成された影響を反映している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:43:19 GMT)
Image Embedding Sampling Method for Diverse Captioning [0.0] 本稿では,異なる画像領域に明示的に参加することで,キャプションの多様性と情報提供性を向上する学習自由フレームワークを提案する。
提案手法は,画像キャプションのアライメント,セマンティックな整合性,多様性の観点から,より大規模なモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:33:19 GMT)
High-Throughput Computational Screening and Interpretable Machine Learning of Metal-organic Frameworks for Iodine Capture [0.0] 湿潤環境下での放射性ヨウ素同位体の流出除去は, 核廃棄物処理や原子力事故の軽減において重要な役割を担っている。
本研究では, 高スループットの計算スクリーニングと機械学習を組み合わせることで, 湿潤空気環境下での1816の金属-有機フレームワーク(MOF)材料のヨウ素捕捉性能を明らかにした。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:22:28 GMT)
Hamiltonian Learning using Machine Learning Models Trained with Continuous Measurements [0.0] 我々は最近の機械学習モデルを用いて、量子ビットの連続弱測定を入力としてハミルトンパラメータを推定する作業を構築した。
本モデルでは,(1)弱測定トレーニングレコードを既知のハミルトンパラメータでラベル付けできる教師なし学習と,(2)ラベルを使用できない教師なし学習の2つの設定について検討する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:53:36 GMT)
Hallucinations and Truth: A Comprehensive Accuracy Evaluation of RAG, LoRA and DoRA [0.0] 生成AIの最近の進歩により、自然言語処理(NLP)システムの効率性と適応性が大幅に向上した。
本稿では,RAG,LoRA,DoRAを大規模に評価し,2万のFAQクエリに基づいてモデル微調整と生成性能を評価する。
DoRAは高い精度(90.1%)、関連スコア(0.88)、最低レイテンシ(クエリ毎110ms)を達成し、現実のドメイン固有の生成AIアプリケーションにおいてLoRAとRAGの両方を上回っている。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 17:38:25 GMT)
GraphiT: Efficient Node Classification on Text-Attributed Graphs with Prompt Optimized LLMs [0.0] GraphiT(Graphs in Text)は、グラフをテキストフォーマットにエンコードするフレームワークである。
GraphiTがすぐに微調整することなく、測定可能な結果をもたらす方法を示します。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:38:41 GMT)
Generalized Uncertainty Principle mimicking dynamical Dark Energy: matter perturbations and gravitational wave data analysis [0.0] 一般化不確実性原理(GUP)は量子重力モデリングにおいて、ほぼユビキタスな特徴である。
我々は、原始重力波(PGW)の余剰密度について考察する。
103,mathrmHz$以下の周波数域における次世代GW観測の感度を利用することで、他の宇宙物理学的・天体物理学的限界よりも厳密な$betalesssim1039$を制約する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:44:44 GMT)
Generalized Attention Flow: Feature Attribution for Transformer Models via Maximum Flow [0.0] Generalized Attention Flow (GAF) はトランスフォーマーモデルのための新しい特徴属性法である。
GAFは、注意重み、その勾配、最大流量問題、および特徴属性の性能を高める障壁法を統合している。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:50:58 GMT)
Generalised Process Theories [0.0] 本稿では,SMCをオペラカル構造に接続する最近の結果に動機づけられた,オペラカル代数を用いた代替形式化を提案する。
我々は、従来のプロセス理論のアプローチを統一し拡張する、アクセス可能だが厳格な定式化を提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:47:07 GMT)
FrGNet: A fourier-guided weakly-supervised framework for nuclear instance segmentation [0.0] 核インスタンスセグメンテーションは病理画像解析において重要な役割を担っている。
主な課題は、インスタンスを正確にセグメンテーションすることの難しさと、正確なマスクレベルのアノテーションのコストの高さから生じる。
本研究では,弱制御型核インスタンス分割問題を解くための4つのガイダンスフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:51:25 GMT)
Federated Learning-Driven Cybersecurity Framework for IoT Networks with Privacy-Preserving and Real-Time Threat Detection Capabilities [0.0] 従来の集中型セキュリティ手法は、IoTネットワークにおけるプライバシ保護とリアルタイム脅威検出のバランスをとるのに苦労することが多い。
本研究では,IoT環境に特化したフェデレート学習駆動型サイバーセキュリティフレームワークを提案する。
局所的に訓練されたモデルのセキュアアグリゲーションは、同型暗号を用いて達成され、機密情報を漏らさずに協調学習が可能である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 23:11:51 GMT)
Fault-tolerant Quantum Computation without Distillation on a 2D Device [0.0] 2次元曲面符号間の耐故障性のない非クリフォードゲートの実装に、ループパイプラインアーキテクチャをどのように利用できるかを示す。
このゲートを実装するのに必要なシャットリングスケジュールは、標準的な2Dサーフェスコードを実装するのに必要なものよりも、わずかに複雑である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 07:38:26 GMT)
Exceptional topology in non-Hermitian twisted bilayer graphene [0.0] ツイストされた二層グラフェン(TBG)は、マジックアングルで異常な電子特性を持ち、マジックアングルで孤立した平らなバンドを持つ。
本研究では, 他の層に対してグラフェンがねじれた非エルミチアンTBGの利得と損失について検討した。
エルミート魔法角よりも大きい「例外魔法角」では、例外的な環は一致し、ゼロエネルギーと有限寿命を持つ非エルミート平面バンドを形成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:20:00 GMT)
Evidence of Scaling Regimes in the Hopfield Dynamics of Whole Brain Model [0.0] ホップフィールドリカレントニューラルネットワークは、特定の指数が使用するパーセルの数と結合強度の減衰長に依存するスケーリング機構を示す。
このスケーリング機構は、人間の脳内での情報伝達過程が空間的に相関したパターンを示すデコらによって導入された絵を復元する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:04:27 GMT)
Entangling power of Anti-Jaynes-Cummings model and its efficiency to encode information in atomic system [0.0] 量子情報処理にはエンタングパワーが不可欠である。
本研究では,量子相関生成におけるアンチジャイネス・カミングスモデル(AJCM)について検討する。
AJCMは、情報符号化のための量子チャネルに適した絡み合いを生成する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:06:25 GMT)
Entanglement enhancement induced by noise in inhomogeneously monitored systems [0.0] 非均一に観測された量子系における強いノイズが絡み合いをいかに高めるかを研究する。
以上の結果から, 典型的には騒音に起因する有害な影響とは対照的に, アシラの騒音はシステム内の絡み合いを著しく高めることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:26:51 GMT)
Enhancing anomaly detection with topology-aware autoencoders [0.0] オートエンコーダは信号に依存しないアプローチを提供するが、その潜在空間の位相によって制限される。
球面(Sn$)、積(S2 otimes S2$)、射影(mathbbRP2$)潜在空間を持つオートエンコーダを構築する。
提案手法をハドロン上クォーク崩壊シミュレーションに適用することにより, 適切な位相制約を持つ潜在空間が異常事象の検出における感度と頑健性を高めることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:50:46 GMT)
Enhanced Compressive Threshold Quantum State Tomography for Qudit Systems [0.0] 本研究では, 圧縮センシングとしきい値量子状態トモグラフィにインスパイアされた効率的な量子状態トモグラフィー法を提案する。
我々は,IBMQ 上でのシミュレーションによるアルゴリズムの検証を行い,$Nleq7$ qubit システムの効率的かつ正確な再構築を実証する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:18:36 GMT)
Efficacy of tomographic markers of photon addition to coherent states of light: Comparison with experiment [0.0] 光のコヒーレントな状態への光子付加のマーカーは、関連する光トモグラフィーから計算可能である。
これらのマーカーは、対応するトモグラムからの光への光付加の特定の側面を特徴付けるための実行可能な手順を提供することができる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:11:10 GMT)
Effects of finite trapping on the decay, recoil, and decoherence of dark states of quantum emitter arrays [0.0] 1次元導波路または自由空間における2, 3, 多くの原子の長寿命サブラジアント状態に対する有限トラップ強度の影響について検討した。
比較的密なトラップでは、共有電子励起の崩壊は励起状態の寿命に比例する原子にエネルギーを与える。
本研究は,量子メモリの挙動と原子配列実験に関する知見を提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:27:45 GMT)
Effcient classical error correction for parity encoded spin systems [0.0] 本稿では,PEアーキテクチャのスピン読み出しにおける誤りの訂正方法について述べる。
スピン読み出しにおける独立かつ同一に分散されたエラーは、非常に単純な復号アルゴリズムによって修正可能であることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:34:55 GMT)
Dynamical invariant based shortcut to equilibration in open quantum systems [0.0] 我々はルイス=リースフェルド不変量を用いて、駆動されたオープン量子系の平衡を高速化する。
提案プロトコルは、単純な非最適化プロトコルよりも短い時間スケールで高忠実度制御を実現することができることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 08:45:01 GMT)
Dynamic Reinforcement Learning for Actors [0.0] 動的強化学習(Dynamic RL)は、アクター(アクション生成ニューラルネットワーク)出力の代わりに、システムダイナミクスを直接制御する。
Actorは当初、その環境とループを通してカオス力学を生成するように設計されている。
動的RLは「感度」と呼ばれる局所指数を用いてグローバルシステムダイナミクスを制御する
論文参考訳(メタデータ) (Fri, 14 Feb 2025 14:50:05 GMT)
Direct Preference Optimization-Enhanced Multi-Guided Diffusion Model for Traffic Scenario Generation [0.0] 拡散に基づくモデルは、現実的な交通シナリオを生成するために現実世界の運転データを使用することの有効性が認識されている。
これらのモデルは、特定のトラフィック嗜好を取り入れ、シナリオリアリズムを強化するためにガイド付きサンプリングを採用している。
本稿では,新しいトレーニング戦略を利用して,交通前兆に密着した多誘導拡散モデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:29:43 GMT)
Decomposed Quadratization: Efficient QUBO Formulation for Learning Bayesian Network [0.0] 目的関数で使用されるバイナリ変数の数を最小限にすることが不可欠である。
そこで本研究では,従来の二次化手法よりもビット容量に有利なQUBOの定式化を提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 02:26:40 GMT)
Cosmic muon flux attenuation methods for superconducting qubit experiments [0.0] 超伝導量子ビットを含む実験と互換性のある宇宙ムーンフラックスを減衰させる2つの実用的な緩和法を提案し,実証する。
特別に構築された宇宙ムーン検出器を用いて、都市環境に広く存在する地下地を同定し、宇宙ムーンフラックスの大きな減衰を達成できる。
地上実験室では2つのゲルマニウムウェハを用い,それぞれに粒子センサを装着し,天空に対するチップの配向が基板上に堆積したエネルギー量と種類にどのように影響するかを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:07:33 GMT)
Consumer Segmentation and Participation Drivers in Community-Supported Agriculture: A Choice Experiment and PLS-SEM Approach [0.0] 地域農業(CSA)は、消費者と生産者との強いつながりを育む上で重要な役割を担っている。
本研究の目的は,日本における CSA 参加の可能性を特定し,既存の CSA 参加理論を検証することである。
本研究は, 環境・社会的影響におけるCSAの役割を強調することにより, 日本におけるCSAの促進が最も効果的である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:21:34 GMT)
Compress image to patches for Vision Transformer [0.0] Vision Transformer (ViT) はコンピュータビジョンの分野で大きな進歩を遂げた。
モデルの深さと入力画像の解像度が増加するにつれて、トレーニングやViTモデルの実行に伴う計算コストが劇的に上昇した。
本稿では、CI2P-ViTというCNNとVision Transformerに基づくハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:40:37 GMT)
Coevolution of Camouflage [0.0] 自然界のカモフラージュは捕食者と獲物との競争から生じているようである。
この研究は、その敵対関係の抽象的なモデルをシミュレートする。
それは、進化する捕食者の視覚と競合する、獲物のカモフラージュパターンの進化を通して、クリーププシスを観察する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:33:29 GMT)
Classification of Temporal Graphs using Persistent Homology [0.0] 時間グラフは、相互作用をタイムスタンプ付きエッジとして表現することで、動的システムを効果的にモデル化する。
永続ホモロジーを用いた時間グラフ解析のための新しい手法を提案する。
我々のアプローチはノードクラスフリーであり、広範囲の時間グラフ解析に柔軟性を提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:55:15 GMT)
City-Scale Multi-Camera Vehicle Tracking System with Improved Self-Supervised Camera Link Model [0.0] 本稿では,自己監督型カメラリンクモデルを用いた,革新的なマルチカメラ車両追跡システムを提案する。
提案手法は,61.07%のIDF1スコアを有するCityFlow V2ベンチマークにおいて,自動カメラリンク方式の最先端性を実現する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:55:30 GMT)
Circuit locality from relativistic locality in scalar field mediated entanglement [0.0] 局所性は現代物理学において中心的な概念であるが、異なる分野が異なる方法でそれを理解している。
系が局所状態の量子制御された重ね合わせに置かれると、相対論的局所性によって特定の種類の回路が生じることを示す。
これらの局所性の間の関係は、量子回路言語で量子場理論を定式化できるかどうかを理解するために重要である。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 15:13:02 GMT)
Benchmarking the rationality of AI decision making using the transitivity axiom [0.0] 我々は、人間の嗜好の推移性を評価するために設計された一連の選択実験を通して、AI応答の合理性を評価する。
Llama 2 と 3 モデルは一般的に遷移度を満足するが、違反が発生した場合、LLM の Chat/Instruct バージョンでのみ発生する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 20:56:40 GMT)
Automation Bias in the AI Act: On the Legal Implications of Attempting to De-Bias Human Oversight of AI [0.0] 本稿では,人工知能法(AIA)における自動化バイアス(AB)の明示的言及の法的意味について検討する。
TheAIAは、リスクの高いAIシステムに対する人間の監視を義務付け、プロバイダがABの認識を可能にすることを要求する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 09:26:59 GMT)
AttentionSmithy: A Modular Framework for Rapid Transformer Development and Customization [0.0] AttentionSmithyは、トランスフォーマーのイノベーションを単純化するモジュール式ソフトウェアパッケージです。
ユーザは、広範なコーディングなしに、トランスフォーマーの変種を迅速にプロトタイプ化し、評価することができる。
細胞型分類において95%以上の精度を達成し,遺伝子特異的モデリングにおける適応性を示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 21:38:39 GMT)
Atomic Fermi superfluids with tunable pairing interactions under the influence of spin-dependent Rydberg molecular potentials [0.0] 我々は2成分原子フェルミ超流体のエネルギースペクトルと固有状態について検討する。
魅力的なULRMポテンシャルは局所密度の蓄積をもたらすが、その差は局所分極ポテンシャルをもたらす。
我々は、Rydberg atom-Fermi超流動系の実験的実現と測定について論じる。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:34:14 GMT)
Are Large Language Models the future crowd workers of Linguistics? [0.0] 本研究の目的は,Large Language Models (LLM) が経験的言語パイプラインに含まれる場合,障害を克服できるかどうか,という疑問に答えることである。
元々は人間の被験者のために設計された2つの強制的誘発タスクは、OpenAIのGPT-4o-miniモデルの助けを借りて再現される。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:23:39 GMT)
Analog Quantum Teleportation [0.0] デジタルテレポーテーションプロトコルは、絡み合い、局所測定、古典的な通信チャネルを利用する。
古典的な通信がノイズの多い量子チャネルを介して伝送によって置き換えられるアナログテレポーテーションプロトコルについて考察する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 16:03:05 GMT)
Algorithmic contiguity from low-degree conjecture and applications in correlated random graphs [0.0] 2つの問題に対して計算硬度を示す。
我々の証明の主な要素の1つは、2つの確率測度の間の近位関係を導出することである。
このフレームワークは、異なるタスク間のリダクションを実行するための便利なツールを提供する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 00:24:51 GMT)
A topological theory for qLDPC: non-Clifford gates and magic state fountain on homological product codes with constant rate and beyond the $N^{1/3}$ distance barrier [0.0] 我々は,量子低密度パリティチェック(qLDPC)とトポロジカルコードにおけるフォールトトレラント量子計算の統一理論を開発した。
製品構築から得られたすべてのqLDPCおよびCSSコードに対して、トポロジ的データを符号化する隠された単純複素構造が存在することを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 05:51:26 GMT)
A note on spontaneous symmetry breaking in the mean-field Bose gas [0.0] 系がボース=アインシュタイン凝縮を示すときと、ギブス状態の1粒子密度行列がマクロ固有値を持つという意味でのみ、自発的な$U(1)$対称性の破れが起こることを示す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 13:42:46 GMT)
A new and flexible class of sharp asymptotic time-uniform confidence sequences [0.0] 古典統計学のように、信頼性シーケンスは高レベルの仮定カバレッジが達成されることを示す非パラメトリックツールである。
軽度の仮定の下で、鋭い時間一様信頼系列を生成する新しいフレキシブルな信頼系列のクラスを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 18:57:16 GMT)
A Short History of Rocks: or, How to Invent Quantum Computing [0.0] ファインマンの状態に基づくアナロジーは量子コンピューティングに到達するための唯一の方法ではないと我々は主張する。
ジョン・フォン・ノイマン(John von Neumann)氏が軍事用コンピュータのデバッグのためにクロスロード作戦をスキップし、この問題に悩まされ、全く異なる量子コンピューティングのイメージを発見した、という別のタイムラインを想像してみよう。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:04:56 GMT)
A Self-Supervised Reinforcement Learning Approach for Fine-Tuning Large Language Models Using Cross-Attention Signals [0.0] 本稿では,ループフィードバックにおいて人間に依存しない大規模言語モデルのための新しい強化学習フレームワークを提案する。
代わりに、我々のアプローチでは、モデル自体内のクロスアテンション信号を使用して、自己教師付き報酬を導き出す。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 01:44:04 GMT)
A Relative Homology Theory of Representation in Neural Networks [0.0] 従来の研究では、ReLUアクティベーション関数を持つニューラルネットワークによって実装されたマップの集合は、断片的線形連続写像の集合と同一であることが証明されている。
これは$Phi_J$の局所ランクと$cap textImPhi_J_i$の交叉に関する2つのセットに分けることができる。
後者を重複分解 $O_Phi$ と呼び、各ポリヘドロンと入力多様体の間の交叉が成立することを証明する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 10:28:36 GMT)
A Multiobjective Reinforcement Learning Framework for Microgrid Energy Management [0.0] マイクログリッド(MG)は、電力グリッドの脱炭と分散化のための有望なソリューションを提供する。
しかし、MGオペレーションは、しばしば、異なる利害関係者の利益を表す複数の目的について検討する。
本稿では,高次元目的空間を探索し,対立する目的間のトレードオフを明らかにする,多目的強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 19:21:42 GMT)
A Bregman firmly nonexpansive proximal operator for baryconvex optimization [0.0] 我々は、この新しい作用素が、ユークリッドと情報測地を組み合わせたブレグマンの発散に関して、しっかりとブレグマンであることを示す。
関連する連続フローを導出する。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 11:15:25 GMT)
3D ReX: Causal Explanations in 3D Neuroimaging Classification [0.0] 我々は3Dモデルのための最初の因果関係に基づくポストホック説明可能性ツールである3D ReXを紹介する。
脳卒中検出モデルを用いて3次元ReXを検証し,脳卒中に関連する特徴の空間分布について考察した。
論文参考訳(メタデータ) (Fri, 14 Feb 2025 12:10:07 GMT)