Rethinking Evaluation of Infrared Small Target Detection [105.6] 本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 02:45:07 GMT)
Probabilistic Token Alignment for Large Language Model Fusion [100.3] 大規模言語モデル(LLM)をスクラッチからトレーニングすると、ユニークな機能と強みを持つモデルが得られるが、コストがかかり、しばしば冗長な機能をもたらす。
既存のモデル融合における重要な課題は、手動で定義された語彙のアライメントに依存することである。
PTA-LLM と呼ばれるアライメントのための一般およびソフトマッピングとして確率的トークンアライメント法を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:18:24 GMT)
Risk Comparisons in Linear Regression: Implicit Regularization Dominates Explicit Regularization [97.0] 既存の理論では、キャパシティとソース条件によって分類された線形回帰問題に対して、勾配降下(GD)は常に極小極小である。
この研究は、よく特定された線形回帰問題に対して、これらのアルゴリズムに対する有限サンプルリスクのインスタンスワイズ比較を提供する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:02:38 GMT)
A Scalable Multi-Robot Framework for Decentralized and Asynchronous Perception-Action-Communication Loops [72.2] グローバルな目的を達成するため,大規模なロボット群における協調作業は,大規模環境における課題である。
ロボットはパーセプション・アクション・コミュニケーションループを実行し、ローカル環境を認識し、他のロボットと通信し、リアルタイムで行動を起こす必要がある。
近年では、フロッキングやカバレッジ制御などのアプリケーションでグラフニューラルネットワーク(GNN)を使用してこの問題に対処している。
本稿では、分散化されたGNNを用いてナビゲーション動作を計算し、通信のためのメッセージを生成するロボット群における非同期PACフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:41:13 GMT)
DCAD-2000: A Multilingual Dataset across 2000+ Languages with Data Cleaning as Anomaly Detection [72.0] 新たに抽出したCommon Crawlデータを用いて構築された大規模多言語コーパスであるDCAD-2000を導入する。
DCAD-2000には2,282言語、46.72TBのデータ、833億のドキュメントがあり、155のハイソース言語と159のスクリプトがある。
我々はFineTaskベンチマークでDCAD-2000の品質を評価し、多言語データセットの品質とタスク性能を大幅に改善した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:30:39 GMT)
Reflecting on the State of Rehearsal-free Continual Learning with Pretrained Models [70.2] 単純かつ軽量なPEFTベースラインによるP-RFCL手法の整合性を示す。
P-RFCL の手法が,単純で軽量な PEFT ベースラインでマッチング可能であることを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:32:38 GMT)
A Mutual Learning Method for Salient Object Detection with intertwined Multi-Supervision--Revised [67.6] 本稿では,有意な物体検出だけでなく,前景の輪郭検出やエッジ検出から,その監視を活用して,有意性検出ネットワークを訓練することを提案する。
まず,一様ハイライトの有向マップを生成するために,有向物体検出タスクと前景輪郭検出タスクを相互に活用する。
第2に、前景輪郭とエッジ検出タスクが同時にガイドされ、それによって正確な前景輪郭予測が行われ、エッジ予測のための局所ノイズが低減される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:30:32 GMT)
WikiBigEdit: Understanding the Limits of Lifelong Knowledge Editing in LLMs [66.5] 我々は、生涯にわたる知識編集の研究を現実の編集に事実上の規模で橋渡しする。
まず,実世界のウィキデータ編集の大規模ベンチマークであるWikiBigEditを紹介した。
最初の例では、知識編集のための500万以上の質問応答ペアが含まれている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:03:38 GMT)
Dendritic Resonate-and-Fire Neuron for Effective and Efficient Long Sequence Modeling [66.1] 樹状共振器(RF)ニューロンは入力信号から効率的に周波数を抽出し、スパイク列車に符号化することができる。
RFニューロンは、複雑なタスクにおけるエネルギー効率とトレーニング速度のトレードオフとして、有効なメモリ容量が限られている。
本稿では,複数の共振器とソマアーキテクチャを明示的に組み込んだDdendritic Resonate-and-Fireモデルを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 18:15:45 GMT)
Leveraging RGB Images for Pre-Training of Event-Based Hand Pose Estimation [64.9] RPEPはラベル付きRGB画像と未ラベルのイベントデータを用いたイベントベースの3次元ポーズ推定のための最初の事前学習手法である。
EvRealHandsの24%の改善を達成し、実イベントデータにおける最先端の手法を著しく上回る結果となった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:07:49 GMT)
GroundFlow: A Plug-in Module for Temporal Reasoning on 3D Point Cloud Sequential Grounding [63.7] 3次元点雲(SG3D)における連続的な接地は、詳細なステップで日々の作業のためにテキスト命令に従うことによって、オブジェクトのシーケンスを探索することを指す。
現在の3Dビジュアルグラウンド法では,各ステップから有用な時間情報を抽出することなく,複数のステップでテキスト命令を処理している。
GroundFlow - 3Dポイントクラウドシーケンシャルグラウンド上での時間的推論のためのプラグインモジュール。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:18:34 GMT)
Ultra-short-term solar power forecasting by deep learning and data reconstruction [60.2] 深層学習に基づく超短周期太陽エネルギー予測とデータ再構成を提案する。
我々は、ターゲット予測期間に対する長期的および短期的依存関係をキャプチャするために、ディープラーニングモデルを用いる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:22:35 GMT)
CAARMA: Class Augmentation with Adversarial Mixup Regularization [59.9] 話者検証は典型的なゼロショット学習課題である。
クラス拡張フレームワークであるCAARMAを紹介する。
当社のフレームワークは,すべてのベースラインモデルに対して,8%の大幅な改善を実現しています。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:40:13 GMT)
Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification [59.2] 本稿では,CLIPの階層的空間意味論を活用することで3次元幾何学的忠実度を高めるフレームワークを提案する。
本手法は3次元のクラスインクリメンタル学習を著しく改善し,テクスチャバイアスに対して優れた幾何コヒーレンスとロバスト性を実現する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 04:53:08 GMT)
Evolution of Concepts in Language Model Pre-Training [54.0] クロスコーダと呼ばれるスパース辞書学習手法を用いて,事前学習スナップショットにおける線形解釈可能な特徴の進化を追跡する。
ほとんどの機能が特定のポイントの周りに形成され始め、さらに複雑なパターンが後のトレーニング段階に現れます。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 18:53:12 GMT)
Creating General User Models from Computer Use [53.6] 本稿では,コンピュータとのインタラクションを観察することでユーザについて学習する汎用ユーザモデル(GUM)のアーキテクチャを提案する。
GUMは、ユーザ(例えばデバイスのスクリーンショット)の非構造化観察を入力として受け取り、ユーザの知識と好みをキャプチャする信頼度重み付け命題を構築する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:03:34 GMT)
Why Are Web AI Agents More Vulnerable Than Standalone LLMs? A Security Analysis [47.3] 本研究では,WebAIエージェントの脆弱性の増加に寄与する要因について検討する。
我々は,WebAIエージェントの脆弱性を増幅する3つの重要な要因,(1)ユーザの目標をシステムプロンプトに埋め込んだこと,(2)マルチステップアクション生成,(3)観察能力の3つを特定した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:29:53 GMT)
Breaking the Reviewer: Assessing the Vulnerability of Large Language Models in Automated Peer Review Under Textual Adversarial Attacks [46.9] 本稿では,大規模言語モデル (LLM) が,敵対的攻撃の存在下で自動レビュアーとして使用されることのロバスト性について検討する。
テキスト操作はLLM評価を歪ませる可能性があるため,本評価は重大な脆弱性を明らかにする。
我々の発見は、学術コミュニケーションの完全性よりも、AIの強化を確実にするために、敵対的リスクに対処することの重要性を強調した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:54:46 GMT)
EarthGPT-X: A Spatial MLLM for Multi-level Multi-Source Remote Sensing Imagery Understanding with Visual Prompting [46.4] EarthGPT-Xは、マルチソースRS画像の理解を統一する最初のフレキシブル空間MLLMである。
1つのフレームワークで様々な視覚的プロンプトの下で、粗い粒度ときめ細かな視覚的タスクを達成します。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 04:36:55 GMT)
AgriDoctor: A Multimodal Intelligent Assistant for Agriculture [45.8] AgriDoctorは、インテリジェントな作物病診断と農業知識の相互作用のために設計されたモジュラーでマルチモーダルなフレームワークである。
効果的なトレーニングと評価を容易にするために,400000の注釈付き疾患画像,831のエキスパートによる知識エントリ,30000のバイリンガルプロンプトによるインテント駆動ツール選択のベンチマークであるAgriMMを構築した。
実験により、AgriMMで訓練されたAgriDoctorは、細粒度の農業作業において最先端のLVLMを著しく上回っていることが示された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:51:57 GMT)
Large Language Models as End-to-end Combinatorial Optimization Solvers [45.3] 物流や製造などの意思決定シナリオの中心となる組合せ最適化(CO)問題は、伝統的に問題固有のアルゴリズムを使用して解決される。
既存のアプローチは、コード生成やソルバ呼び出しといった中間ステップに依存しており、その汎用性とアクセシビリティを制限している。
本稿では,大規模言語モデル(LLM)を,自然言語問題記述をソリューションに直接マッピングすることで,エンドツーエンドのCOソルバとして機能させる,新たなフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:30:30 GMT)
SUA: Stealthy Multimodal Large Language Model Unlearning Attack [44.9] 大規模なデータに基づいてトレーニングされたマルチモーダル大規模言語モデル(MLLM)は、機密性の高い個人情報や写真を記憶し、深刻なプライバシーリスクを生じさせる可能性がある。
MLLMアンラーニング手法を提案する。
未学習LLMの未学習知識を回復することを目的としたLLMアンラーニング攻撃の新たな問題について検討する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:41:22 GMT)
HDC-X: Efficient Medical Data Classification for Embedded Devices [44.6] HDC-Xは低消費電力デバイス向けに設計された軽量な分類フレームワークである。
心臓の音の分類では、HDC-Xはベイジアン・レスネットよりもエネルギー効率が高く、精度は1%以下である。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 15:09:06 GMT)
Global Prompt Refinement with Non-Interfering Attention Masking for One-Shot Federated Learning [44.0] Federated Prompt Learning (FPL) は、凍結した事前学習モデルの上に軽量なプロンプトをチューニングすることで、コミュニケーション効率の高い適応を可能にする。
単発FPLのための非干渉注意マスキング法(GPR-NIAM)を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:13:13 GMT)
Catching the Details: Self-Distilled RoI Predictors for Fine-Grained MLLM Perception [43.4] MLLM(Multimodal Large Language Models)は、微細な知覚を行うために高解像度の視覚情報を必要とする。
近年の手法では、RoI(Rerea-of-Interest)メカニズムを活用して、健全な領域に焦点をあてている。
本稿では,このトレードオフを解決する効率的な自己拡張型地域提案ネットワーク(SD-RPN)を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:54:04 GMT)
Rethinking Backdoor Detection Evaluation for Language Models [43.2] バックドア攻撃は、公開された言語モデルに依存する実践者にとって大きなセキュリティリスクをもたらす。
対策として、バックドア検出手法は、リリースされたモデルにバックドアが含まれているかどうかを検出することを目的としている。
既存のバックドア検出手法は標準ベンチマークでバックドアモデルを検出するのに高い精度を持っているが、野生のバックドアを堅牢に識別できるかどうかは不明である。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:37:27 GMT)
Are you sure? Measuring models bias in content moderation through uncertainty [41.4] 我々は、脆弱なグループに属する人々によって注釈付けされたメッセージの分類における不確実性に基づいて、モデルをベンチマークする教師なしのアプローチを提案する。
コンフォメーション予測手法を用いて計算された不確実性を利用して,女性や非白人アノテータに対する11モデルのバイアスを分析する。
その結果,一部の事前学習モデルでは,予測の信頼性が低い場合でも,少数派からのラベルを高い精度で予測できることがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:54:06 GMT)
RefLoRA: Refactored Low-Rank Adaptation for Efficient Fine-Tuning of Large Models [41.3] Low-Rank Adaptation (LoRA)は、事前訓練された重み行列の低次元部分空間を更新することにより、微調整された大型モデルの計算およびメモリオーバーヘッドを下げる。
本稿では、損失の上限を最小化するステップ毎の最適低ランク因子化について述べる。
結果として得られた低ランク適応(RefLoRA)法は、一貫した重量とバランスの取れた重量の更新とともに、より平坦な損失景観を促進する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 21:14:12 GMT)
MOMENTS: A Comprehensive Multimodal Benchmark for Theory of Mind [41.2] MoMentS (Multimodal Mental States) は、社会的にインテリジェントなマルチモーダルエージェントを構築するためのベンチマークである。
MoMentSには、7つの異なるToMカテゴリにまたがる2300以上の多重選択質問が含まれている。
いくつかのMLLMを評価し、ビジョンは一般的に性能を改善するが、モデルがそれを効果的に統合するのに苦戦していることを発見した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:36:05 GMT)
TableEval: A Real-World Benchmark for Complex, Multilingual, and Multi-Structured Table Question Answering [41.1] 既存のTableQAベンチマークは、単純なフラットテーブルにフォーカスし、データ漏洩に悩まされることがしばしばある。
現実的なTableQAタスク上でLLMを評価するために設計された新しいベンチマークであるTableEvalを紹介する。
データ漏洩のリスクを最小限に抑えるため、最近の実世界の文書からすべてのデータを収集する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:29:52 GMT)
Error Correction Code Transformer: From Non-Unified to Unified [41.0] 従来のデコーダは、特定のデコードアルゴリズムに適した固定ハードウェア回路として設計されていた。
本稿では、複数の線形ブロックコードを扱うことができる、コードに依存しないトランスフォーマーベースのデコードアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:59:30 GMT)
Learning and Optimization with 3D Orientations [39.1] 本稿では,3次元配向に関連するすべての表現と「トリック」を,簡潔かつ統一した表記法で明確に提示する。
それらを代表的なシナリオでベンチマークします。
シナリオに応じてガイドラインを提供し、記述されたすべての配向数学の参照実装を提供する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:11:03 GMT)
InMind: Evaluating LLMs in Capturing and Applying Individual Human Reasoning Styles [39.0] 社会的推論ゲームは、個別の推論スタイルを評価するための自然なテストベッドを提供する。
我々は,LLMがパーソナライズされた推論スタイルをキャプチャして適用できるかどうかを評価するための認知基盤評価フレームワークであるInMindを紹介する。
ケーススタディとして、InMindをゲームAvalonに適用し、11の最先端LCMを評価した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:54:25 GMT)
Speech Recognition on TV Series with Video-guided Post-ASR Correction [38.5] 本稿では、ビデオコンテキストをキャプチャし、ASR出力を洗練するためのVPC(Video-Guided Post-ASR Correction)フレームワークを提案する。
本手法は複雑なマルチメディア環境における転写精度を常に向上させる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:56:28 GMT)
Post-hoc Reward Calibration: A Case Study on Length Bias [38.5] リワードモデル(RM)は、トレーニングデータに突発的な相関を利用してバイアスを発生させることができる。
これらのバイアスは、誤った出力ランキング、準最適モデル評価、望ましくない振る舞いの増幅につながる可能性がある。
本稿では、追加データやトレーニングを使わずにバイアスを修正するという課題に対処する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 21:37:57 GMT)
TSGym: Design Choices for Deep Multivariate Time-Series Forecasting [38.1] この作業は、深いMTSFメソッドをそのコアできめ細かいコンポーネントに分解することでギャップを埋める。
MTSFタスクのためのTSGymと呼ばれる新しい自動化ソリューションを提案する。
大規模な実験により、TSGymは既存のMTSF法やAutoML法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:49:31 GMT)
Advancing Audio-Visual Navigation Through Multi-Agent Collaboration in 3D Environments [37.7] MASTAVNはスケーラブルなフレームワークで、2人のエージェントが共同で3D環境でオーディオターゲットにローカライズし、ナビゲートすることができる。
MASTAVNは単一エージェントや非協調ベースラインと比較してタスク完了時間の大幅な短縮とナビゲーション成功率の顕著な改善を実現している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:05:26 GMT)
DeepEOSNet: Capturing the dependency on thermodynamic state in property prediction tasks [37.5] 独立状態における熱力学特性の依存性をより正確に把握するための機械学習(ML)アーキテクチャを提案する。
このアイデアはDeepONetアーキテクチャに基づいているので、私たちのアプローチをDeepEOSNetと呼びます。
以上の結果から,DeepEOSNetの蒸気圧予測性能と混合臼歯容積予測性能に匹敵する性能を示した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:16:14 GMT)
PGSTalker: Real-Time Audio-Driven Talking Head Generation via 3D Gaussian Splatting with Pixel-Aware Density Control [37.4] PGSTalkerは3次元ガウススプラッティングに基づくリアルタイム音声駆動音声ヘッド合成フレームワークである(3DGS)。
レンダリング性能を向上させるため,画素認識密度制御手法を提案し,点密度を適応的に割り当て,動的顔領域のディテールを向上し,冗長性を低減した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:01:54 GMT)
From Prediction to Understanding: Will AI Foundation Models Transform Brain Science? [37.3] 生成事前学習(ChatGPTの「GPT」)は、人間の監督なしに大量のインターネットテキストから言語モデルを学習することを可能にする。
ファンデーションモデルという用語は、ドメイン内およびドメイン間の幅広いタスクに適応可能な、大規模な事前訓練されたシステムを指す。
これらのモデルは強い予測精度を達成し、計算原理を照らすことを期待する。
ここでは、ファンデーションモデルが脳科学に生産的に統合される方法について概説し、彼らの約束と限界の両方を強調します。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:39:04 GMT)
Improving Medium Range Severe Weather Prediction through Transformer Post-processing of AI Weather Forecasts [37.1] 本研究では,デコーダのみのトランスフォーマーネットワークをAIによる天気予報処理に活用する手法を提案する。
本手法は,予測リードタイムをシーケンシャルトークンとして扱うことで,トランスフォーマーが複雑な時間的関係を学習できるようにする。
その結果,変圧器を用いた後処理は,高密度ニューラルネットワークと比較して予測能力を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:40:41 GMT)
SignalLLM: A General-Purpose LLM Agent Framework for Automated Signal Processing [36.2] 大規模言語モデル(LLM)は、強力な推論能力、幅広い汎用知識、文脈内学習、モーダル間伝達能力を提供する。
本稿では,SPタスクのための汎用LLMベースのエージェントフレームワークであるSignalLLMを紹介する。
コミュニケーションとセンシングにおける5つの代表的なタスクを通して,SignalLLMの汎用性と有効性を示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 18:54:54 GMT)
Expressive Power of Graph Neural Networks for (Mixed-Integer) Quadratic Programs [35.7] 二次計画法 (QP) は非線形計画法において最も広く適用されている分野である。
最近、グラフニューラルネットワーク(GNN)がQPの新しい可能性を公開した。
理論上、GNNがQPタスクに対して何を達成でき、達成できないのかは不明だ。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:20:40 GMT)
STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting [35.6] 適応的地域境界最適化と動的月次予測アロケーションのための新しいAI駆動フレームワークを提案する。
具体的には,グローバル空間分布と地域空間分布を整合させるSAA(Spatial-Aligned Attention)機構を用いる。
また、異なる月ごとの大気変数を専門の専門家に動的にルーティングするTMOEモジュールを設計する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:27:52 GMT)
VQToken: Neural Discrete Token Representation Learning for Extreme Token Reduction in Video Large Language Models [35.4] 最小限の離散トークンを用いてビデオ全体を表現することを目的としたExtreme Short Token Reductionという新しいタスクを紹介した。
Extreme Short Token Reductionタスクでは、私たちのVQTokenはシーケンスをオリジナルの長さのわずか0.07パーセントまで圧縮し、NextQA-MCベンチマークでは0.6%の精度しか達成していません。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:45:54 GMT)
$\texttt{DiffSyn}$: A Generative Diffusion Approach to Materials Synthesis Planning [31.6] 本稿では,50年間にわたる23,000以上の合成レシピに基づいて学習した生成拡散モデルを提案する。
$textttDiffSyn$は、所望の構造と有機テンプレートに条件付けされた確率的な合成経路を生成する。
概念実証として、$textttDiffSyn$生成合成経路を用いてUFI材料を合成する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:19:47 GMT)
When Color-Space Decoupling Meets Diffusion for Adverse-Weather Image Restoration [31.3] 我々はLumina-Chroma Decomposition Network(LCDN)とLumina-Guided Diffusion Model(LGDM)を提示する。
LCDNは、YCbCr色空間で劣化した画像を処理し、分解関連輝度と劣化不変色成分を別々に処理する。
LGDMにはTextitDynamic Time Step Lossが組み込まれており、デノナイジングネットワークを最適化し、画像内の低周波と高周波の両方の特徴のバランスの取れた回復を保証する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:39:06 GMT)
AirQA: A Comprehensive QA Dataset for AI Research with Instance-Level Evaluation [31.0] AirQAは人工知能(AI)分野における人手による包括的な紙QAデータセットである
3つのLDMベースのエージェントにより、ExTrActorは人間の介入なしにサンプル生成および軌道収集を行うことができる。
ExTrActorは、小さなモデルのマルチターンツール使用能力を一貫して改善し、より大きなモデルに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:24:17 GMT)
ACORD: An Expert-Annotated Retrieval Dataset for Legal Contract Drafting [30.8] ACORDは、責任の制限(Limitation of Liability)、償却(Indemnification)、統制の変更(Change of Control)、最も好まれる国家( Most Favored Nation)といった複雑な契約条項に焦点を当てている。
114のクエリと126,000のクエリクロースペアが含まれており、それぞれが1から5の星のスケールでランク付けされている。
タスクはクエリーに最も関連性の高い前例句を見つけることである。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:40:13 GMT)
MAIN: Mutual Alignment Is Necessary for instruction tuning [30.7] 命令応答対の品質は,各コンポーネントの個々の品質ではなく,相互整合度によって決定される。
本稿では,相互制約による命令と応答のコヒーレンスを強制する相互アライメントフレームワーク(MAIN)を提案する。
MAINはモデルアーキテクチャやサイズを多用し、LLaMA、Mistral、Qwenモデルで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:21:59 GMT)
Bridging Past and Future: Distribution-Aware Alignment for Time Series Forecasting [30.7] 時系列予測のための表現学習フレームワークであるTimeAlignを紹介する。
我々は,過去と将来の表現を明示的に整列し,入力履歴と将来の目標との分布的ギャップを埋める。
利得は主に、歴史的入力と将来の出力の間の周波数ミスマッチの修正から生じる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:18:35 GMT)
K-DeCore: Facilitating Knowledge Transfer in Continual Structured Knowledge Reasoning via Knowledge Decoupling [30.5] 既存の連続学習アプローチは、シーケンシャルなタスクに適用した場合、重大な課題に直面します。
そこで我々はCSKRフレームワークであるtextscK-DeCoreを提案する。
textscK-DeCoreは、異なるステージに対してデュアルパースペクティブなメモリ統合機構を統合し、構造誘導された擬似データ合成戦略を導入する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:24:49 GMT)
PTQTP: Post-Training Quantization to Trit-Planes for Large Language Models [30.5] 大規模言語モデル(LLM)から極低ビット幅への後学習量子化は依然として困難である。
既存のUltra-low-bit PTQ法はバイナリ近似や複雑な補償機構に依存している。
重量行列を構造化三重項 -1, 0, 1 個の三重項平面に分解する最初の三重項 PTQ フレームワークである Trit-Planes (PTQTP) について紹介する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:07:20 GMT)
MaskVCT: Masked Voice Codec Transformer for Zero-Shot Voice Conversion With Increased Controllability via Multiple Guidances [30.2] MaskVCTはマルチファクタ制御が可能なゼロショット音声変換モデルである。
このモデルは、インテリジェンス性と話者類似性を高めるために、連続的または量子化された言語的特徴を利用することができる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:14:51 GMT)
Equip Pre-ranking with Target Attention by Residual Quantization [28.5] TARQは、産業レコメンデーションシステムのための新しいプレグレードのフレームワークである。
当社のモデルは本番環境に完全にデプロイされており、毎日数千万人のアクティブユーザが利用しています。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:33:28 GMT)
Agentic AI Software Engineers: Programming with Trust [28.2] 大きな言語モデル(LLM)は、コードスニペットを生成するのに驚くほどの習熟度を示している。
AIソフトウェアエンジニアのデプロイに成功するためには、人間主導のソフトウェアエンジニアリングプラクティスによって確立された信頼と同等以上の信頼レベルが必要である、と私たちは主張する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:07:27 GMT)
SLAM-Former: Putting SLAM into One Transformer [28.2] SLAM-Formerは、完全なSLAMを単一の変換器に統合する新しいニューラルアプローチである。
SLAM-Formerは,最先端の高密度SLAM法と比較して,優れた,あるいは高い競争力を発揮することを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 04:04:47 GMT)
Automated Facility Enumeration for Building Compliance Checking using Door Detection and Large Language Models [28.0] ビルコンプライアンスチェック(BCC)は、建設施設が規制基準を満たすことを保証するための重要なプロセスである。
その重要性にもかかわらず、この問題はほとんど文献で見過ごされてきた。
大規模言語モデル(LLM)の最近の進歩は、自動化を強化する新たな機会を提供する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:41:44 GMT)
The Better You Learn, The Smarter You Prune: Towards Efficient Vision-language-action Models via Differentiable Token Pruning [27.8] LightVLAは、視覚言語アクション(VLA)モデルのための差別化可能なトークンプルーニングフレームワークである。
ビジュアルトークンの重要性を評価するために動的クエリを生成し、差別化可能なトークン選択を可能にするためにGumbel softmaxを採用する。
LightVLAはFLOPとレイテンシをそれぞれ59.1%、38.2%削減し、タスク成功率は2.6%改善した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:51:09 GMT)
From Easy to Hard: The MIR Benchmark for Progressive Interleaved Multi-Image Reasoning [27.1] Multi-image Interleaved Reasoningは、複数の画像とその関連するテキストコンテキストを共同で理解し、推論するマルチモーダル大言語モデル(MLLM)の能力を改善することを目的としている。
MIRは、画像領域と対応するテキストを正確に関連付けるために、インターリーブされたテキストコンテキストを伴う複数の画像に対する共同推論を必要とする。
提案手法は, MIRベンチマークおよび他の確立されたベンチマークにおいて, モデル推論性能を著しく向上させる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:19:02 GMT)
Optimal Transport for Handwritten Text Recognition in a Low-Resource Regime [27.1] HTR (State-of-the-art method for Handwriting Text Recognition) は、手書き文字認識の手法である。
本稿では,標準HTRモデルパラダイムとは異なり,語彙特性の事前知識を軽度に活用できる新しい枠組みを提案する。
ラベルのない画像から抽出した視覚特徴と意味的単語表現を協調する反復的ブートストラップ手法を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:25:22 GMT)
The Cost of Compression: Tight Quadratic Black-Box Attacks on Sketches for $\ell_2$ Norm Estimation [26.5] 線形スケッチによる次元の低減は強力で広く使われている手法であるが、敵の入力に弱いことが知られている。
ここでは、Rk × n$ の固定されたスケッチ行列 $A が Rn$ の高次元ベクトル $v を Rk$ の低次元スケッチ $A v に写像する。
我々は、$tildeO(k2)$クエリを使用して、ノルム推定の失敗または逆入力を構成する、普遍的で非適応的な攻撃を示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:36:31 GMT)
DeepInsert: Early Layer Bypass for Efficient and Performant Multimodal Understanding [26.4] 本稿では,事前学習したトランスモデルに対する簡単な修正を提案する。
まず最初に言語プロンプトと結合するのではなく、マルチモーダルトークンを直接中央に挿入します。
その結果,本手法は,学習と推論の双方において計算コストを削減できることが示唆された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:16:09 GMT)
ARE: Scaling Up Agent Environments and Evaluations [23.0] 本稿では,スケーラブルな環境構築のための研究プラットフォームであるMeta Agents Research Environments (ARE)を紹介する。
AREは、複雑で多様な環境を構築するための単純な抽象化を提供する。
また、AREで構築され、汎用エージェント能力を測定するために設計されたベンチマークであるGaia2を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:59:45 GMT)
Quantum State Tomography for Tensor Networks in Two Dimensions [22.4] 制約付き最小二乗推定器がPEPS(またはPEPO)の安定回復を実現することを示す。
これらの結果は,実践情報処理におけるPEPSとPEPOの信頼性向上のための理論的支援を提供する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:42:29 GMT)
KNN-MMD: Cross Domain Wireless Sensing via Local Distribution Alignment [22.1] クロスドメイン無線センシングのためのK-Nearest Maximum Neighbors Mean Discrepancy (KNN-MMD)を提案する。
我々のアプローチは、ターゲットドメインからKNNを使用してヘルプセットを構築し、ソースとターゲットドメイン間の局所的なアライメントを可能にすることから始まります。
また、モデルの性能がエポック間で急激に変動するクロスドメイン手法でよく見られる重要な不安定性問題にも対処する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:35:12 GMT)
TempFlow-GRPO: When Timing Matters for GRPO in Flow Models [22.0] 本稿では,フローベース生成に固有の時間構造を捕捉し,活用する,原理的なGRPOフレームワークを提案する。
新しい革新は、基礎となる生成力学を尊重する時間的に認識された最適化をモデルに与える。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:06:38 GMT)
DreamControl: Human-Inspired Whole-Body Humanoid Control for Scene Interaction via Guided Diffusion [21.6] 本稿では,自律型全身ヒューマノイドスキルの学習手法であるDreamControlを紹介する。
我々の中心となるイノベーションは、人間の動きデータに基づいて事前訓練された拡散を使うことです。
本研究では,Unitree G1ロボットにおけるDreamControlの有効性を検証する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:29:04 GMT)
SAM-DCE: Addressing Token Uniformity and Semantic Over-Smoothing in Medical Segmentation [21.6] Segment Anything Model (SAM)は、自然画像に印象的なゼロショットセグメンテーション能力を示す。
SAMは、ドメインシフト、解剖学的多様性、およびユーザが提供するプロンプトに依存するため、医療画像の困難に遭遇する。
トークンの均一性を緩和し、クラス間分離性を高め、きめ細かな一貫した表現でマスクデコードを強化しながら、局所的な識別とグローバルな意味のバランスをとるSAM-DCEを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 02:39:48 GMT)
FlagEval Findings Report: A Preliminary Evaluation of Large Reasoning Models on Automatically Verifiable Textual and Visual Questions [19.5] 我々は,現在の大推理モデル (LRM) の評価を行い,いくつかの予備的な知見を得た。
また、視覚的手がかりから推論をテストすることを目的とした視覚言語モデルの評価ベンチマークROMEもリリースした。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:53:30 GMT)
The Complexity of Finding Local Optima in Contrastive Learning [18.9] 個別設定で$mathsfPLS$-hardness、連続設定で$mathsfPLS$-hardnessを証明します。
この結果から,アルゴリズムが様々なコントラスト学習問題の局所的最適解を見つけることは不可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:21:04 GMT)
SPFSplatV2: Efficient Self-Supervised Pose-Free 3D Gaussian Splatting from Sparse Views [18.8] スパース多視点画像から3次元ガウススプラッティングを行うための効率的なフィードフォワードフレームワークであるSPFSplatV2について述べる。
ドメイン内およびドメイン外の新規ビュー合成において、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 21:37:56 GMT)
ME-Mamba: Multi-Expert Mamba with Efficient Knowledge Capture and Fusion for Multimodal Survival Analysis [18.5] 病理画像とゲノムデータを統合した マルチモーダルサバイバル分析が 有望なアプローチとして現れました
本稿では,識別学的特徴とゲノム的特徴を抽出するマルチエキスパート・マンバシステムを提案する。
本手法は比較的少ない計算量で安定かつ高精度な生存解析を実現する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:23:04 GMT)
A Chain-of-thought Reasoning Breast Ultrasound Dataset Covering All Histopathology Categories [18.2] 4,838例の10,019病変の11,439枚の画像を含む,チェーン・オブ・シント(CoT)推論分析のためのデータセットであるBUS-CoTを提案する。
我々は,臨床実践においてエラーが発生しやすい稀な症例において,堅牢なAIシステムの実現を目指している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:59:19 GMT)
Long-Tailed Out-of-Distribution Detection with Refined Separate Class Learning [16.6] 堅牢な機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
我々はRefined Separate Class Learning (RSCL)と呼ばれる新しいアプローチを提案する。
RSCLは、分配データにおける分類精度を改善しつつ、優れたOOD検出性能を実現する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:09:57 GMT)
AI-based Methods for Simulating, Sampling, and Predicting Protein Ensembles [16.6] レビューでは、AIによるタンパク質アンサンブルの予測に向けた最近の研究の方向性を強調している。
現在の手法の技術的成熟度に関する現実的な評価に重点を置いている。
私たちは、トレーニングデータの可用性における課題を克服するために、モデルトレーニング、シミュレーション、推論の間の"ループを閉じる"ことを提唱します。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:14:45 GMT)
TranSQL+: Serving Large Language Models with SQL on Low-Resource Hardware [16.5] グラフを純粋なSQLクエリに変換して,リレーショナルデータベースで実行するテンプレートベースのコードジェネレータであるTran+を紹介した。
また、結合操作を改善するための行列列最適化(ROW2Seek)を提案する。
本稿では,低リソースハードウェア上での大規模言語モデルの実践環境として,リレーショナルデータベースに注目した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:47:12 GMT)
Preference Distillation via Value based Reinforcement Learning [16.2] 我々は,教師モデルの値関数から補助的な報酬を付与し,ソフトガイドを提供する,textitTeacher Value-based Knowledge Distillation (TVKD)を提案する。
TVKDは標準のDPOトレーニングフレームワークに統合することができ、追加のロールアウトを必要としない。
実験の結果,TVKDは様々なベンチマークやモデルサイズで連続的に性能を向上することがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:52:28 GMT)
Distribution Prompting: Understanding the Expressivity of Language Models Through the Next-Token Distributions They Can Produce [16.1] いくつかの分布は、他の分布よりもはるかに困難であることを示す。
非常に低いエントロピーあるいは非常に高いエントロピーの分布は、中間エントロピーの分布よりも近似が容易である。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:15:35 GMT)
LLMs as Layout Designers: A Spatial Reasoning Perspective [15.6] LaySPAは、拡張学習ベースのフレームワークで、空間的推論機能を備えた大規模言語モデルを拡張している。
我々は,LaySPAが構造的に健全で視覚的に魅力的なレイアウトを生成し,汎用LLMよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:02:59 GMT)
Guiding Cross-Modal Representations with MLLM Priors via Preference Alignment [15.5] クロスモーダル表現学習を導く新しいフレームワークであるMAPLE(Modality-Aligned Preference Learning for Embeddings)を紹介する。
MaPLEは、学習過程を強化学習として定式化し、既成のMLLMを用いた自動選好データ構築と、新たなRPA(Relative Preference Alignment)損失という2つの重要な要素を定式化している。
実験結果から,我々の嗜好誘導アライメントは細粒度クロスモーダル検索において著しく向上することが示された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 02:30:09 GMT)
Neural Network Based Framework for Passive Intermodulation Cancellation in MIMO Systems [15.3] 本稿では, アンテナやサブキャリア間の非線形依存関係を効率的に捉えるために, 奥行き分離可能な畳み込みと拡張畳み込みを利用するPIMキャンセルのための軽量ディープラーニングフレームワークを提案する。
その結果,3次受動変調(PIM)の歪みを効果的に抑制し,最大29dBの平均電力誤差(APE)を111kのトレーニングパラメータで達成できることがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:43:53 GMT)
Auditability and the Landscape of Distance to Multicalibration [14.9] 予測器の多重校正までの距離の監査性は$f$である。
本研究は,より強力なマルチキャリブレーションアルゴリズムの開発に影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:26:48 GMT)
DT-NeRF: A Diffusion and Transformer-Based Optimization Approach for Neural Radiance Fields in 3D Reconstruction [13.6] 本稿では3次元シーン再構成におけるディテールリカバリとマルチビュー整合性を高めるために拡散モデル-Dニューラルレーダランス場(DT-NeRF)法を提案する。
拡散モデルとトランスフォーマーを組み合わせることで、DT-NeRFはスパース視点でディテールを効果的に復元し、複雑な幾何学的シーンで高い精度を維持する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:45:22 GMT)
Building Coding Agents via Entropy-Enhanced Multi-Turn Preference Optimization [13.3] 本稿では,エントロピー強化フレームワークであるEntroPOを紹介し,既存の優先最適化アルゴリズムをマルチターンツール支援設定に適用する。
EntroPOは、さまざまな家族やサイズのモデル群を微調整することで検証する。
swebenchのリーダーボードでは、オープンウェイトモデルの間で、新しい最先端の結果が確立される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:28:26 GMT)
TactfulToM: Do LLMs Have the Theory of Mind Ability to Understand White Lies? [13.1] TactfulToMは,Large Language Models (LLM) の機能を評価するために設計された新しい英語ベンチマークである。
我々のベンチマークは、LLMが手動で設計したシードストーリーを会話に拡張し、真に白い嘘をつくのに必要な情報非対称性を維持するマルチステージのヒューマン・イン・ザ・ループ・パイプラインを通じて生成される。
我々は、TactfulToMが人間よりかなり低い性能を発揮する最先端のモデルでは困難であることが示し、ToM推論を完全に理解し、白い嘘を真に理解する能力の欠点を明らかにした。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:18:35 GMT)
MoEs Are Stronger than You Think: Hyper-Parallel Inference Scaling with RoE [13.0] トークンレベルでの予測品質を改善する補完的なフレームワークであるハイパー並列スケーリングを導入する。
この概念をMixture-of-Experts(MoE)モデルで実装し、Roster of Experts(RoE)と呼ぶ。
RoEはトレーニング不要な推論アルゴリズムで、単一のMoEをMoEのダイナミックアンサンブルに変換する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 21:05:29 GMT)
LEO-MINI: An Efficient Multimodal Large Language Model using Conditional Token Reduction and Mixture of Multi-Modal Experts [12.8] マルチモーダル大言語モデル(MLLM)における視覚トークンの冗長性は、その計算効率を著しく低下させる。
視覚トークンの数を大幅に減らし,同時に視覚推論能力を高める新しいMLLMであるLEO-MINIを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:16:39 GMT)
Quantum phase transition in two dimension nonlinear cavity optomagnonic system [12.8] 超流動モット絶縁体とエルゴード多量体局在遷移を2次元非線形キャビティオロマグニック系に基づいて検討した。
フォノン-フォトンカップリングの導入は、YIG球のケーラー非線形性を考える際の系のコヒーレンスを高める。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:00:44 GMT)
PASS: Path-selective State Space Model for Event-based Recognition [12.7] イベントカメラは、高時間分解能などの利点を持つバイオインスパイアされたセンサーである。
当社のPASSフレームワークは,高次イベントモデリングに優れた能力を示す。
私たちの重要な洞察は、状態空間モデルを通じて適応的に符号化されたイベント機能を学ぶことです。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:23:12 GMT)
Comprehensive Review of Neural Differential Equations for Time Series Analysis [12.3] 本稿では,NDEに基づく時系列解析手法について概説する。
NDEは、ニューラルネットワークの柔軟性と微分方程式の数学的厳密さを組み合わせたパラダイムシフトを表している。
本稿では, それらの数学的定式化, 数値計算法, 応用に関する詳細な議論を行い, 連続時間力学をモデル化する能力を強調した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:39:38 GMT)
Quality Assessment of Tabular Data using Large Language Models and Code Generation [11.9] 統計的インライナー検出とLCM駆動型ルールとコード生成を組み合わせた3段階のフレームワークを提案する。
従来のクラスタリングを通じてデータサンプルをフィルタリングした後、LCMに意味論的に有効な品質ルールを作成するように繰り返し促します。
信頼性の高い品質ルールを生成するために、外部知識ソースとドメイン固有の少数ショット例を活用することにより、検索強化生成(RAG)によるLCMを支援する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 02:54:05 GMT)
VidCLearn: A Continual Learning Approach for Text-to-Video Generation [11.9] VidCLearnはテキスト・ビデオ生成のための継続的学習フレームワークである。
動きの平滑性を高めるための新しい時間的一貫性損失と、推論における構造的ガイダンスを提供するビデオ検索モジュールを導入する。
私たちのアーキテクチャは、良好な生成性能を維持しながら、既存のモデルよりも計算効率が良いように設計されています。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:34:19 GMT)
Subjective Camera 1.0: Bridging Human Cognition and Visual Reconstruction through Sequence-Aware Sketch-Guided Diffusion [11.9] 物理的カメラが捉えられない意味のある瞬間を再構成する主観カメラの概念を導入する。
本稿では,容易にアクセス可能な主観的読み出しから現実のシーンを再構築するフレームワークである主観カメラ1.0を提案する。
提案手法は,大規模なペアリングトレーニングデータを避け,一般化問題を緩和する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:31:59 GMT)
ISCS: Parameter-Guided Channel Ordering and Grouping for Learned Image Compression [11.6] 本稿では,事前学習したlicモデルにおいて重要なチャネルを特定し,整理するためのデータセットに依存しない手法を提案する。
提案手法は,再現性を維持しつつ計算を効果的に削減し,既存の学習圧縮フレームワークを実用的かつモジュール的に拡張する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:44:15 GMT)
DecipherGuard: Understanding and Deciphering Jailbreak Prompts for a Safer Deployment of Intelligent Software Systems [11.6] DecipherGuardは、難読化ベースのプロンプトに対抗するための解読レイヤと、脱獄攻撃に対するガードレールの有効性を高めるための低ランク適応メカニズムを統合する新しいフレームワークである。
22,000以上のプロンプトに対する実証的な評価は、DecipherGuardがDSRを36%から65%改善し、全体的なガードレール性能(OGP)がLlamaGuardや他の2つのランタイムガードレールと比較して20%から50%向上したことを示している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:46:35 GMT)
AdaptiveGuard: Towards Adaptive Runtime Safety for LLM-Powered Software [11.6] ガードレールは、LLM(Large Language Models)ベースのソフトウェアを安全にデプロイするために重要である。
本稿では,新しい脱獄攻撃をアウト・オブ・ディストリビューション(OOD)入力として検出する適応ガードレールであるAdaptiveGuardを提案する。
我々は、AdaptiveGuardがOOD検出精度96%を達成し、2回の更新ステップで新たな攻撃に適応し、85%以上のF1スコアを分散後のデータに保持していることを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:22:42 GMT)
ScenGAN: Attention-Intensive Generative Model for Uncertainty-Aware Renewable Scenario Forecasting [11.6] 本稿では,再生可能エネルギーとディープラーニングの領域における不確実性について考察する。
不確実性認識モデルは、再生可能シナリオ予測のために慎重に設計されている。
処理層における気象情報、予報、歴史的軌跡の統合により、相乗的予測能力が向上する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 15:18:51 GMT)
FP-Inconsistent: Measurement and Analysis of Fingerprint Inconsistencies in Evasive Bot Traffic [11.6] 本研究では,回避ボットの大規模な評価を行い,指紋の改ざんが検出の妨げになるかどうかを調査する。
DataDomeに対する平均回避率は52.93%、BotDに対する平均回避率は44.56%である。
回避ボットは指紋属性の整合性を確保するのに困難であると考えられるため、このような不整合を検出するためのルールを見つけるためのデータ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:21:37 GMT)
Differential Privacy for Euclidean Jordan Algebra with Applications to Private Symmetric Cone Programming [11.5] ユークリッドジョルダン代数の出力を持つ函数に対する微分プライベート機構について検討する。
様々な条件下で対称コーンプログラムを解くためのプライベートアルゴリズムを導出する。
応用として、半定値プログラミングのための微分プライベートアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 04:34:12 GMT)
Advancing Speech Understanding in Speech-Aware Language Models with GRPO [11.5] 音声対応大規模言語モデル(SALLM)を学習するためのグループ相対政策最適化法(GRPO)を提案する。
SALLMは、音声理解タスクに非常に効果的であることが証明されている。
モデルの生成能力をよりよく反映したオープンフォーマットタスクに重点を置いています。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:09:36 GMT)
Joint Cooperative and Non-Cooperative Localization in WSNs with Distributed Scaled Proximal ADMM Algorithms [11.1] 協調的および非協調的局所化は、無線センサネットワークで同時に発生する。
協調型および非協調型局所化のための乗算器のスケールド近位方向法を開発した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:32:53 GMT)
OptiChat: Bridging Optimization Models and Practitioners with Large Language Models [11.0] 本稿では,最適化モデルから結論を導出するための自然言語対話システムOptiChatを紹介する。
最適化モデルに適した関数呼び出しとコード生成による大規模言語モデルの拡張により、シームレスな相互作用を可能にし、幻覚のリスクを最小限に抑える。
OptiChatは、最適化モデルと実践者の間のギャップを効果的に埋め、自律的で正確でインスタントな応答を提供することを示した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:31:05 GMT)
A Dual-Modulation Framework for RGB-T Crowd Counting via Spatially Modulated Attention and Adaptive Fusion [10.9] 本稿では,RGB-Thermal (RGB-T) の正確なクラウドカウントのためのDual Modulation Frameworkを提案する。
我々は空間変調注意(SMA)と適応核融合変調(AFM)の2つのモジュールを使用する。
RGB-T群集カウントデータセットを用いた実験により, 従来の手法と比較して, 提案手法の優れた性能を示した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:52:29 GMT)
DescriptorMedSAM: Language-Image Fusion with Multi-Aspect Text Guidance for Medical Image Segmentation [10.6] 本稿では,MedSAMの軽量拡張であるDescriptorMedSAMを提案する。
DescriptorMedSAMはCLIPテキストエンコーダを使用して、放射線学スタイルのディスクリプタを密度の高い埋め込みに変換する。
我々は、構造化言語プロンプトが空間的相互作用を効果的に置き換え、強力なゼロショット性能と高速な少数ショット適応を実現することを実証した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:33:16 GMT)
SFN-YOLO: Towards Free-Range Poultry Detection via Scale-aware Fusion Networks [10.4] スケール・アウェア・フュージョンを利用したSFN-YOLOという革新的な養鶏検出手法を提案する。
このアプローチは、複雑な環境における検出を改善するために、詳細なローカル機能とより広範なグローバルコンテキストを組み合わせる。
総合的な実験では、我々のモデルは7.2Mパラメータだけで80.7%のmAPを達成しており、これはベンチマークよりも35.1%少ない。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:03:48 GMT)
Beat on Gaze: Learning Stylized Generation of Gaze and Head Dynamics [10.3] StyGazeTalkは、同期された視線とヘッドモーションスタイルを生成するオーディオ駆動方式である。
本稿では,視線追跡,音声,頭部ポーズ,3次元顔パラメータからなる高精度マルチモーダルデータセットを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:27:57 GMT)
Going beyond Landauer: Information-cost relations from inference based on the maximum entropy principle [10.2] 最大エントロピー原理に基づく一般的な情報コストトレードオフ関係を導出する。
i) 複数電荷のシナリオにおける熱力学的コストに対する情報コンテンツインフォームド上限, (ii) ナノスケールでユビキタスな観測可能なゆらぎの変化に対する情報コンテンツインフォームド下限の2つの重要な結果を示す。
この結果は、一般的な有限時間量子過程における熱力学的コストの制約における最大エントロピー推論の幅広い有用性を裏付けるものである。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:38:17 GMT)
Meissner-Like Currents of Photons in Anomalous Superradiant Phases [10.1] 我々は、スタガー磁場下で量子ラビ鎖にマイスナー様光子電流を提示する。
マイスナー相は異なる渦構造と異常スケーリング指数を示す。
本研究により,光物質結合系における量子ホール型ロバスト性に類似した安定化光子渦とエッジ電流の観測が可能となった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:13:53 GMT)
Rapid Preparation of Rydberg Superatom W State Using Superadiabatic Techniques [9.9] 我々は、Rydberg超原子の有効エネルギーレベルに関する量子情報をエンコードする。
本稿では,超断熱的反復法に基づくRydberg超原子W状態の高速な生成法を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:23:12 GMT)
LTA-thinker: Latent Thought-Augmented Training Framework for Large Language Models on Complex Reasoning [9.5] 大規模言語モデルの複雑な推論は、テスト時間スケーリング(TTS)を使用して動的に最適化し、オーバーライドを緩和することができる。
本稿では,分散分散を改善し,2つの観点から推論性能を向上させる潜在思考強化学習フレームワーク--LTA-Thinkerを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:58:42 GMT)
Intention-aware Hierarchical Diffusion Model for Long-term Trajectory Anomaly Detection [9.4] Intention-aware Hierarchical Diffusion Model (IHiDgoal) と呼ばれる教師なし軌道異常検出手法を提案する。
IHiDgoalは、高レベルインテント評価と低レベルサブ軌道解析の両方を通して異常を検出する。
実験の結果,IHiDgoal法は,最先端のベースラインよりもF1スコアにおいて,異常検出性能を最大30.2%向上することがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:57:22 GMT)
Towards Interpretable and Efficient Attention: Compressing All by Contracting a Few [9.0] 両問題を同時に緩和するための統一最適化目標を提案する。
目的に対して最適化をアンロールすることにより、本質的に解釈可能で効率的な注意機構を導出する。
実験では、いくつかの視覚的タスクにおけるCBSAの同等のパフォーマンスと、さらに優れたアドバンテージが示される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:57:13 GMT)
Temporal-Aware User Behaviour Simulation with Large Language Models for Recommender Systems [8.7] 大きな言語モデル(LLM)は、言語理解、推論、生成において人間のような能力を示す。
既存のアプローチのほとんどは静的なユーザプロファイリングに依存しており、ユーザの関心事の時間的および動的な性質を無視している。
本研究では,Recommender Systems, DyTA4Recのための動的時間認識エージェントベースシミュレータを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:10:02 GMT)
R1-Fuzz: Specializing Language Models for Textual Fuzzing via Reinforcement Learning [7.5] ファジィングは脆弱性発見には有効だが、コンパイラやインタプリタ、データベースエンジンといった複雑なターゲットと競合する。
本稿では、R1-Fuzzを提案する。R1-Fuzzは、強化学習(RL)を利用して、コスト効率の高い言語モデルを専門化し、それらをファジング入力生成のために統合するフレームワークである。
R1-Fuzzは最先端のファズーよりも75%高いカバレッジを実現し、これまで不明な29の脆弱性を発見した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 15:21:43 GMT)
A Portable and Stealthy Inaudible Voice Attack Based on Acoustic Metamaterials [7.3] 本稿では,音声制御システムにおいて,音響メタマテリアルを活用するための最初のアプローチであるMETAATTACKを提案する。
METAATTACKは、バッグに入れるのに十分な小型のポータブルデバイスを用いて、より長い攻撃範囲と高精度を実現する。
私たちは、MeTAATTACKがSiri、Alexa、Google Assistant、XiaoAI、Xiaoyiなど、音声制御されたパーソナルアシスタントの代表的アシスタントに対して、難解な攻撃を開始するのに使えることを示した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:38:56 GMT)
RALLM-POI: Retrieval-Augmented LLM for Zero-shot Next POI Recommendation with Geographical Reranking [7.1] 次の関心のポイント(POI)推奨は、ユーザの次の目的地を歴史的な動きから予測する。
従来のモデルは集中的なトレーニングを必要とし、LSMは柔軟性と一般化可能なゼロショットソリューションを提供する。
ALLM-POIは,LLMと検索強化生成と自己修正を結合したフレームワークである。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:52:28 GMT)
Towards Quantifying the Hessian Structure of Neural Networks [7.1] ニューラルネットワーク(NN)のヘッセン行列は、ほぼブロック対角構造を示すと実証研究が報告した。
報告されたヘッセン構造は、アーキテクチャ設計に根ざした「静的力」と、トレーニングから生じる「動的力」の2つの力の混合に由来する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:19:50 GMT)
BAGELS: Benchmarking the Automated Generation and Extraction of Limitations from Scholarly Text [7.0] 科学的研究において、「限界」とは研究の欠点、制約、弱点を指す。
著者はしばしば論文の制限を過小評価し、編集要件を満たすためヘッジ戦略に依存している。
この傾向と科学論文の急増が組み合わさって、自動化アプローチの必要性が高まっている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:30:31 GMT)
Direct measurement of quantum geometric tensor in pseudo-Hermitian systems [6.9] 量子幾何テンソル(QGT)は、エルミート的および非エルミート的状態の量子状態の幾何学と位相を符号化する。
ここでは、実スペクトルを持つ擬エルミート系において、QGTのすべての成分を直接抽出する2つの量子シミュレーションスキームを開発する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:45:06 GMT)
DRES: Fake news detection by dynamic representation and ensemble selection [6.9] ソーシャルメディアによる情報の急速な拡散は、テキストベースの偽ニュース検出を重要視している。
本稿では,テキストのみに基づく偽ニュースを識別するための動的表現とアンサンブル選択(DRES)と呼ばれる新しい検出手法を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:06:58 GMT)
Image-to-Brain Signal Generation for Visual Prosthesis with CLIP Guided Multimodal Diffusion Models [6.8] 画像からM/EEGを生成する最初の画像-脳信号フレームワークを提案する。
提案フレームワークは,事前学習したCLIPビジュアルエンコーダと,有意な拡張U-Net拡散モデルからなる。
コンディショニングのための単純な結合に依存する従来の生成モデルとは異なり、我々のクロスアテンションモジュールは視覚的特徴と脳信号表現の間の複雑な相互作用を捉えている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:49:10 GMT)
Bio-Inspired Adaptive Neurons for Dynamic Weighting in Artificial Neural Networks [6.7] 従来のニューラルネットワークは、推論中に一定の重みを使い、入力条件の変化に適応する能力を制限する。
本稿では,ニューロン重みを入力信号の関数としてモデル化する,適応型ニューラルネットワークのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:12:33 GMT)
Large Language Models Badly Generalize across Option Length, Problem Types, and Irrelevant Noun Replacements [6.2] 本稿では,小摂動下での大規模言語モデル(LLM)の一般化能力を評価するための一般化ストレステストを提案する。
ベンチマークスコアが高いにもかかわらず、軽微ながらコンテンツ保存の修正に直面した場合、LCMは深刻な精度低下と予期せぬバイアスを示すという、新規で重要な知見を得た。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:10:28 GMT)
The Principles of Human-like Conscious Machine [6.2] 本稿では, 異常意識に対する基質非依存, 論理的厳密, 偽装抵抗性満足度基準を提案する。
我々は、この基準を満たす機械は、意識を他の人間に当てはめる少なくとも同じレベルの信頼をもって意識とみなすべきであると論じている。
この枠組みとその原理を満たす機械として、人間自身を捉えることができることを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:11:30 GMT)
State complexity and phase identification in adaptive quantum circuits [6.0] 我々は、同じ量子相内の状態が、一定の深さの回路に接続された量子状態の集合によって定義されることを示し、同じスケールの重みや反浅さを共有しなければならない。
これは量子相の指標としてこれらの量を確立し、多体物理学においてそれらの重要な役割を担っている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:03:05 GMT)
Prospective Multi-Graph Cohesion for Multivariate Time Series Anomaly Detection [5.9] 高次元時系列データにおける異常検出は多くの産業用途において重要である。
本稿では,多変量TSADのためのPMGCフレームワークを提案する。
PMGCは、長期静的グラフと一連の短期インスタンス単位の動的グラフを統合することで空間相関を利用する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 21:00:21 GMT)
Quantifying multilevel coherence and multipartite correlation based on $α$-affinity [5.8] マルチレベルコヒーレンスを定量化するための$alpha$-affinityベースの指標を2つ導入する。
我々は,多部相関の$alpha$-affinityに基づく指標を定義し,それらの特性を解析する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:50:34 GMT)
An Efficient Dual-Line Decoder Network with Multi-Scale Convolutional Attention for Multi-organ Segmentation [5.7] 本稿では,効率的なデュアルラインデコーダセグメンテーションネットワーク(EDLDNet)を提案する。
提案手法は, モデルロバスト性向上のため, トレーニング時に構造的摂動を取り入れることを学ぶノイズデコーダを特徴とする。
両デコーダから複数スケールのセグメンテーションマスクを活用することにより,変異に基づく損失関数を用いてモデルの一般化を促進する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:13:19 GMT)
Accurate and Complete Surface Reconstruction from 3D Gaussians via Direct SDF Learning [5.6] 3D Gaussian Splatting (3DGS) はフォトリアリスティック・ビュー・シンセサイザーの強力なパラダイムとして登場した。
3DGSパイプラインに直接サインドディスタンスフィールド(Signed Distance Field, SDF)学習を組み込む統合フレームワークであるDiGSを提案する。
DiGSは高い忠実度を維持しつつ,復元精度と完全性を常に向上することを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:09:22 GMT)
Security Vulnerabilities in Software Supply Chain for Autonomous Vehicles [5.6] 自動運転車のオープンソースソフトウェアコンポーネントのセキュリティ脆弱性を分析します。
目標は、研究者、実践家、政策立案者に対して、AVドメインのオープンソースソフトウェアエコシステムにおいて、既存のセキュリティ上の欠陥について知らせることである。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:22:05 GMT)
Delay compensation of multi-input distinct delay nonlinear systems via neural operators [5.6] 予測器近似が一様(時間内)誤差境界を満たす場合、半言語的実用安定性が対応することを示す。
このような近似器の場合、必要となる一様誤差はシステム内のアトラクションの所望領域と制御入力数に依存する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 15:46:46 GMT)
CodeSSM: Towards State Space Models for Code Understanding [5.6] 状態空間モデル(SSM)は、コード理解タスクの有望な代替手段である。
CodeSSMは、コードコーパスでトレーニングされた最初のSSMベースのモデルである。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:42:50 GMT)
nDNA -- the Semantic Helix of Artificial Cognition [5.6] AIファンデーションモデルが能力で成長するにつれて、より深い疑問が浮かび上がってくる。
そこで我々は,本質的な信念の幾何学を通して,この潜伏したアイデンティティを捉える意味的遺伝子型表現としてニューラルDNAを提案する。
生物学的DNAと同様に、nDNAは祖先、突然変異、セマンティックな遺伝をコードし、微調整やアライメントの傷跡、文化的なインプリント、建築的な漂流などに見られる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:28:18 GMT)
CUTE: A Multilingual Dataset for Enhancing Cross-Lingual Knowledge Transfer in Low-Resource Languages [5.4] 中国語,ウイグル語,チベット語,英語のデータセットを構築し,オープンソース化する。
このデータセットは、ウイグル語とチベット語のための、これまでで最大のオープンソースコーパスである。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 04:30:49 GMT)
Causal Representation Learning from Multimodal Clinical Records under Non-Random Modality Missingness [5.4] 臨床ノートには、診断や薬物などの豊富な患者情報が含まれており、患者表現学習に有用である。
大規模言語モデルの最近の進歩は、臨床的テキストから意味のある表現を抽出する能力をさらに改善した。
マルチモーダル臨床記録における観察データと情報欠如を利用した因果表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:34:52 GMT)
Feel the Difference? A Comparative Analysis of Emotional Arcs in Real and LLM-Generated CBT Sessions [5.3] 本稿では,認知行動療法(CBT)対話のデータセットであるRealCBTを紹介する。
実際のCBTセッションとLCM生成CBTセッションの感情弧の比較分析を行った。
合成対話は流動的で構造的に整合的であるが、実際の会話から重要な感情特性へと分岐する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:12:43 GMT)
The Transfer Neurons Hypothesis: An Underlying Mechanism for Language Latent Space Transitions in Multilingual LLMs [5.2] 近年の研究では、デコーダベースのLLMにおける多言語入力のための処理フレームワークが提案されている。
本研究では,ニューロンモジュール内の特定のニューロンが,言語固有の潜在空間と共有意味潜在空間の間で表現を伝達する役割を担っていることを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:44:16 GMT)
Beyond Autocomplete: Designing CopilotLens Towards Transparent and Explainable AI Coding Agents [5.0] CopilotLensは、シンプルな提案から透過的で説明可能なインタラクションにコード補完を再構築する、インタラクティブなフレームワークである。
CopilotLensは、動的で2段階のインターフェースを通じてAIエージェントの"思考プロセス"を再構築する説明レイヤとして機能する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 15:50:29 GMT)
A Simple Review of EEG Foundation Models: Datasets, Advancements and Future Perspectives [4.8] 脳波モデル(EEG-FM)の最新動向を振り返って
EEG-FMは、EEGデータを処理し分析する大きな可能性を示している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:08:12 GMT)
Disentangling Content from Style to Overcome Shortcut Learning: A Hybrid Generative-Discriminative Learning Framework [4.7] ショートカット学習は、本質的な構造の代わりにテクスチャのような表面的特徴を利用する。
本稿では,明示的なコンテンツ非絡み合いを実現するハイブリッドフレームワークHyGDLを提案する。
従来の方法とは異なり、この原理的な非絡み合いにより、HyGDLは真に堅牢な表現を学ぶことができる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:18:37 GMT)
Exploring the Design Space of 3D MLLMs for CT Report Generation [4.7] マルチモーダル大規模言語モデル (MLLM) は,放射線学報告生成 (RRG) を自動化するための有望な方法として登場した。
本研究では,視覚的入力表現,プロジェクタ,Large Language Models (LLM) および3次元CTレポート生成のための微調整技術を含む3次元MLLMの設計空間について検討する。
我々は,GREENスコアのパフォーマンスを最大10%向上させ,MICCAI 2024 AMOS-MMチャレンジで2位となる2つの知識に基づくレポート向上手法を提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:26:01 GMT)
CameraVDP: Perceptual Display Assessment with Uncertainty Estimation via Camera and Visual Difference Prediction [4.2] 視覚差分予測器を用いたカメラベース再構成パイプラインを提案する。
再構成パイプラインは、HDR画像の重ね合わせ、MTFインバージョン、ナビゲーション補正、幾何学的歪曲、ホモグラフィ変換、色補正を組み合わせたものである。
提案するCameraVDPフレームワークを,欠陥画素検出,色認識,非均一性評価の3つの応用により検証した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 21:34:01 GMT)
A geometric framework for momentum-based optimizers for low-rank training [4.2] 低ランクの事前学習と微調整が、大規模ニューラルネットワークの計算コストと記憶コストを削減できる有望な技術として登場した。
古典的運動量法は、基礎となる最適化景観の幾何学のため、局所最適に収束するのに苦労することを示す。
動的低ランク近似から導かれる新しいトレーニング戦略を導入し,その基礎となる幾何学的構造を明示的に説明する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:40:40 GMT)
Theoretical Insights into CycleGAN: Analyzing Approximation and Estimation Errors in Unpaired Data Generation [4.1] 我々は、CycleGANと呼ばれる未ペアデータ生成モデルの過大なリスクを分析することに重点を置いている。
古典的なGANとは異なり、CycleGANは2つの障害のない分布間でデータを変換するだけでなく、マッピングの一貫性を保証する。
モデルアーキテクチャとトレーニング手順の両方の影響を考慮すると、リスクは近似誤差と推定誤差の2つの項に分解される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:08:36 GMT)
Learn to Optimize Resource Allocation under QoS Constraint of AR [3.9] インタラクティブな拡張現実(AR)サービスのためのアップリンクとダウンリンクのパワーアロケーションについて検討し、ARデバイスによってキャプチャされたライブビデオがネットワークエッジにアップロードされ、次にARビデオがダウンロードされる。
タンデムキューシステムとしてAR伝送プロセスをモデル化することにより、エンドツーエンドのレイテンシと信頼性に関するQoS(probabilistic quality of Service)要件の上限を導出する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:07:27 GMT)
Style-Preserving Policy Optimization for Game Agents [3.9] MMPPO(Mixed Proximal Policy Optimization)は、異なるスタイルを維持しながら、既存の準最適エージェントの能力を向上させるように設計されている。
MPPOは、デモ参加者のプレイスタイルを保ちながら、純粋なオンラインアルゴリズムに匹敵する、あるいはそれより優れている熟練度を達成している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:22:19 GMT)
Interpretability-Aware Pruning for Efficient Medical Image Analysis [3.9] 予測性能と透明性の両方を保ちながら、モデルの複雑さを軽減できる解釈可能性誘導型プルーニングフレームワークを導入する。
複数の医用画像分類ベンチマークによる実験により, 精度の低下を最小限に抑えた高い圧縮率が得られることが示された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:25:35 GMT)
Dark and Bright Patterns in Cookie Consent Requests [3.8] ダークパターンは、説得力のあるインターフェース設計を通じて人々の振る舞いを操縦する(悪)デザインナッジです。
本研究では,3つの共通デザインナッジがユーザの同意決定および個人データの制御に対する認識に与える影響について検討した。
以上の結果から,現在のクッキー同意要求の実装の多くは,インターネット利用者にとって意味のある選択を可能にするものではないことが示唆された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:30:38 GMT)
System for systematic literature review using multiple AI agents: Concept and an empirical evaluation [3.5] 体系的文献レビュー(SLR)は証拠に基づく研究の基礎である。
本稿では,SLRの完全自動化を目的とした新しいマルチAIエージェントシステムを提案する。
包括性と精度を維持しつつ,従来のSLRに必要な時間と労力を大幅に削減できることを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:27:39 GMT)
Modeling Bottom-up Information Quality during Language Processing [3.4] 視覚情報と単語識別の相互情報としてボトムアップ情報の「品質」に対する情報理論的操作を提案する。
我々は、英語と中国語のデータを用いて、情報品質の低下が読書時間に与える影響を推定する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:59:47 GMT)
Data-Driven Reconstruction of Significant Wave Heights from Sparse Observations [3.4] マルチスケールU-NetとMLPを融合したハイブリッドディープラーニングフレームワークであるAUWaveを紹介する。
データリッチな構成において、AUWaveが代表的ベースラインを一貫して上回ることを示す。
アーキテクチャのマルチスケールおよびアテンションコンポーネントは、最小でも非自明な空間アンカーが利用できる場合、精度が向上する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:12:28 GMT)
Entanglement and optimization within autoregressive neural quantum states [3.3] ニューラル量子状態(NQS)は、非常に絡み合った量子多体波動関数を表現することができる強力な変分アンゼである。
最大256ドルのスピンを持つ鎖に対するランダム自己回帰波動関数のアンサンブルの大規模シミュレーションを行う。
平均エンタングルメントスケーリング, エンタングルメントスペクトル, 相関関数における遷移のシグネチャを明らかにする。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:32:03 GMT)
Unified Framework for Pre-trained Neural Network Compression via Decomposition and Optimized Rank Selection [3.2] 本稿では, 階数制約内での複合圧縮損失を利用して, 分解と階数選択を適用した統一的な枠組みを提案する。
提案手法は連続空間におけるランクの自動探索を含み,事前学習モデルに対する最適なランク設定を効率的に同定する。
様々なベンチマークデータセットとモデルを用いて、包括的分析により、本手法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:38:19 GMT)
On the Limits of Tabular Hardness Metrics for Deep RL: A Study with the Pharos Benchmark [3.2] 我々は、原則付きRLベンチマークのための新しいオープンソースライブラリ、textttpharosを紹介した。
textttpharosは環境構造とエージェント表現の両方を体系的に制御できることを示す。
この研究は、新しい表現対応の硬度測定を緊急に必要とすることを強調し、それらを開発する上で重要なツールとしてtexttpharos を位置づけている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:14:10 GMT)
PoseBench3D: A Cross-Dataset Analysis Framework for 3D Human Pose Estimation via Pose Lifting Networks [3.1] 我々は3次元ポーズ推定のための標準化されたテストフレームワークPoseBench3Dを開発した。
本稿では,Protocol 1: MPJPEとProtocol 2: PA-MPJPEの100以上のクロスデータセット結果について報告する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:49:40 GMT)
Point-RTD: Replaced Token Denoising for Pretraining Transformer Models on Point Clouds [3.0] 本稿ではトークンのロバスト性を改善するために設計された新しい事前学習戦略であるPoint-RTD(Replaced Token Denoising)を紹介する。
ShapeNetデータセットでは、Point-RTDはPointMAEと比較して復元誤差を93%以上削減し、Chamfer Distanceの14倍以上低い値を達成する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:25:25 GMT)
Data-Driven Discovery of PDEs via the Adjoint Method [2.9] 本稿では、与えられたデータに基づいて、基礎となる支配的偏微分方程式(PDE)を発見する方法を提案する。
PDEの形式を同定する上で,提案手法の有効性を示す。
また,その性能をPDE-FIND(PDE-FIND)として有名なPDE関数同定法と比較した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:42:00 GMT)
Bosonic Entanglement and Quantum Sensing from Energy Transfer in two-tone Floquet Systems [2.9] 量子強度センサは、標準的な量子限界(回路)を超え、量子力学によって規定される基本的な精度限界に近づき、幅広い科学分野の応用を見つけつつある。
センサ回路における多くの粒子間の絡み合いと量子情報の保存について述べる。
マイクロ波系における超伝導絡み合ったセンサを提案し, 高精度測定における実用化の可能性を明らかにする。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:08:49 GMT)
Designing AI-Agents with Personalities: A Psychometric Approach [2.9] 本稿では,定量的かつ心理学的に検証された個人性をAIエージェントに割り当てる手法を提案する。
3つの研究で実現可能性と限界を評価した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:37:10 GMT)
Feasibility Study of 3D-Printed Micro Junction Array for Ion Trap Quantum Processor [2.8] 3Dプリントマイクロジャンクションアレイを用いたイオントラッププラットフォームを提案する。
表面電極トラップ上に3次元構造したマイクロラジオ周波数(RF)電極を統合することにより、電界分布の柔軟な制御が可能となる。
輸送中に均一なイオン閉じ込めを保ちながら擬ポテンシャル障壁を著しく低減する接合形状を同定する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:17:32 GMT)
LVADNet3D: A Deep Autoencoder for Reconstructing 3D Intraventricular Flow from Sparse Hemodynamic Data [2.6] スパース速度ベクトル入力から完全分解能心室内速度場を再構成する3次元畳み込みオートエンコーダであるLVADNet3Dを提案する。
CFDシミュレーションを用いて心室中血流の高分解能データセットを作製した。
様々な入力構成において、LVADNet3DはベースラインのUNet3Dモデルより優れ、低い再構成誤差とより高いPSNR結果が得られる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:20:25 GMT)
Tenure Under Pressure: Simulating the Disruptive Effects of AI on Academic Publishing [2.4] 本稿では,AIによる応募の急増が机の拒絶率,レビューサイクル,大学出版ポートフォリオにどのように影響するかをシミュレーションモデルを用いて検討する。
以上の結果から,早期採用者は当初は恩恵を受けるが,負荷の増加とともに全体の受入れ率は急激に低下し,有期追跡学部は不均等に否定的な結果がみられた。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:13:23 GMT)
Dynamical Low-Rank Compression of Neural Networks with Robustness under Adversarial Attacks [2.4] 本稿では,各層における低ランクコアの条件数を制御する新しいスペクトル正規化器によって強化された低ランクトレーニング手法を提案する。
提案手法は, クリーンな精度を犠牲にすることなく, 対向摂動に対する圧縮モデルの感度を緩和する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:24:24 GMT)
Quantum Adaptive Self-Attention for Financial Rebalancing: An Empirical Study on Automated Market Makers in Decentralized Finance [2.3] 量子古典的自己アテンションブロックである textbfQuantum Adaptive Self-Attention (QASA) について検討した。
QASAは変分量子回路(VQC)を介して量子クエリ/キー/値を構築し、標準的なソフトマックスの注意をPauli-$Z$期待ベクトルに適用する。
textbfQASA-Sequence 変種は、単一モデルのリスク調整されたパフォーマンス(textbf13.99% return; textbfe 1.76)を得る
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:27:14 GMT)
Simulating decoherence of two coupled spins using the generalized cluster correlation expansion [2.3] 一般化クラスタ相関展開法 (gCCE) を用いて, 原子核浴と相互作用する2つの結合電子スピンのコヒーレンスをシミュレートする。
2電子還元密度行列の$T$と$T*$を特徴付けることによって、コヒーレントな2電子系のデファス化を研究する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:41:39 GMT)
BiPrompt-SAM: Enhancing Image Segmentation via Explicit Selection between Point and Text Prompts [2.2] BiPrompt-SAMは、新しいデュアルモーダルプロンプトセグメンテーションフレームワークである。
複雑なモデル修正なしに、空間的精度と意味的文脈を融合する。
これはEndovis17の医療データセット上で強力なゼロショットパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:06:05 GMT)
Data-efficient Kernel Methods for Learning Hamiltonian Systems [1.9] データから直接ハミルトニアンのシステムを識別・予測するためのカーネルベースの手法を提案する。
ハミルトンの学習前に軌道を再構成する二段階法と、両方を共同で推論する一段階法という2つの方法を提案する。
本フレームワークは,2段階のカーネルベースラインを精度よく,データ効率の予測を行い,性能を向上する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:50:17 GMT)
Shall We Play a Game? Language Models for Open-ended Wargames [1.8] 言語モデル(LM)は、どのようにして現実の、連続的な決定に対する洞察を提供することができるか、ますます検討されている。
我々は、戦争ゲームにおけるAIに関する最近の100作品のキュレートされた選択のスコーピングレビューを行います。
異なる適用領域におけるLMの使用時期と使用方法について検討する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 18:37:17 GMT)
Progressive Size-Adaptive Federated Learning: A Comprehensive Framework for Heterogeneous Multi-Modal Data Systems [1.7] 本稿では,SAFL(Size-Based Adaptive Federated Learning)を紹介する。
SAFLは、異種マルチモーダルデータ間のデータセットサイズ特性に基づいて、フェデレーション学習を編成する。
全データセットの平均精度は87.68%で、構造化データモダリティは99%以上である。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 04:50:02 GMT)
seqBench: A Tunable Benchmark to Quantify Sequential Reasoning Limits of LLMs [1.1] 我々は,Large Language Models (LLMs) における逐次推論限界を探索するベンチマークであるseqBenchを紹介する。
検索の複雑さが最小限であるにもかかわらず、セクベンチの構造的推論タスクでは、トップパフォーマンスモデルでさえ体系的に失敗することがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:32:13 GMT)
Mind the Gap: Comparing Model- vs Agentic-Level Red Teaming with Action-Graph Observability on GPT-OSS-20B [1.0] 本稿では,20ビリオンパラメータのオープンソースモデルであるGPT-OSS-20Bの比較レッドチーム化分析を行う。
評価の結果,モデルレベルとエージェントレベルの脆弱性プロファイルの根本的な違いが明らかになった。
エージェントレベルの反復攻撃は、モデルレベルで完全に失敗する目標を妥協することに成功した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:18:34 GMT)
Automatic Classification of Magnetic Chirality of Solar Filaments from H-Alpha Observations [0.9] 我々は、MAGFiLOデータセットに基づいて、太陽フィラメントキラリティ分類のための最初の再現可能なベースラインを確立する。
MAGFiLOデータセットには、GONG H-Alphaによる1万以上の手動のフィラメントが含まれている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:55:14 GMT)
Training the next generation of physicians for artificial intelligence-assisted clinical neuroradiology: ASNR MICCAI Brain Tumor Segmentation (BraTS) 2025 Lighthouse Challenge education platform [0.9] 我々は,MICCAI脳腫瘍灯台チャレンジ2025において,学生と研修生を対象としたマルチモーダルな教育手法を開発した。
2023年と2024年のBraTS課題に対して、60名の医学生と放射線学研修生が脳腫瘍MR画像に注釈をつけることを志願した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:39:32 GMT)
QA-prompting: Improving Summarization with Large Language Models using Question-Answering [0.8] 言語モデル(LM)は自然言語処理に革命をもたらし、プロンプトやテキスト内学習を通じて高品質なテキスト生成を可能にした。
本稿では,質問応答を要約生成の中間段階として利用する要約の簡易なプロンプト手法であるQA-promptingを提案する。
提案手法はキー情報を抽出し,テキストのコンテキストを強化して位置バイアスを緩和し,タスク毎の単一LMコールにおける要約を改善する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:11:28 GMT)
Bribers, Bribers on The Chain, Is Resisting All in Vain? Trustless Consensus Manipulation Through Bribing Contracts [0.8] この研究は、バリデータを対象とした3つの新しく効率的な収賄契約を導入し、実装し、評価する。
最初の贈収賄契約により、英国人は提案されたブロックに投票することでブロックチェーンをフォークすることができる。
第2の契約は、バリデータに対して自発的にコンセンサスプロトコルを終了させるインセンティブを与える。
第3の契約は、銀行がRANDAOビーコンの操作力を競売にかけられる、信頼できない収賄市場を構築している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 18:12:17 GMT)
Prompt-Based Simplification for Plain Language using Spanish Language Models [0.6] 本稿では,LearS 2025 Subtask 1: Adaptation of Text to Plain Language (PL) in Spanishについて述べる。
我々は、プロンプトエンジニアリングを用いたゼロショット構成やローランド適応(LoRA)を用いた微調整版など、スペイン語のテキストで訓練されたモデルに基づく戦略を探求した。
最終的なシステムはバランスよく一貫した性能で選択され、正規化ステップ、RigoChat-7B-v2モデル、PL指向のプロンプトが組み合わされた。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:28:37 GMT)
On the Simplification of Neural Network Architectures for Predictive Process Monitoring [0.6] パラメータ数とアーキテクチャの深さの両面からモデル複雑性の低減が予測性能に与える影響を分析する。
その結果,Transformerモデルが85%縮小すると性能が2~3%低下することがわかった。
以上の結果から,モデル簡易化が予測精度を維持できる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:21:45 GMT)
From domain-landmark graph learning to problem-landmark graph generation [0.5] 計画領域の複数の計画課題からランドマーク関係を学習する新しい手法を提案する。
我々は、よく知られた計画領域に対するアプローチによって発見された情報の精度とリコールを評価する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:41:56 GMT)
MDF-MLLM: Deep Fusion Through Cross-Modal Feature Alignment for Contextually Aware Fundoscopic Image Classification [0.3] 既存のマルチモーダル大言語モデル(MLLM)は網膜疾患の診断に不可欠な低レベルの空間的詳細を捉えるのに苦労することが多い。
このモデル開発と検証は、3つの公開データセットからコンパイルされた1,305個の画像テキストペアに対して行われた。
MDF-MLLMは、4つのU-Net層エンコーダからLLaMA 3.2 11B MLLM内のクロスアテンションブロックへのスキップ機能を統合する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:46:35 GMT)
Agentic AI for Multi-Stage Physics Experiments at a Large-Scale User Facility Particle Accelerator [0.3] Advanced Light Sourceの粒子加速器で実装されたこのシステムは、自然言語のユーザプロンプトを構造化された実行計画に変換する。
機械物理の代表的な課題として,手作業によるスクリプティングと比較して,準備時間が2桁短縮されたことを示す。
その結果、エージェントAIを加速器実験に安全に統合するための青写真が確立され、機械物理学の研究が要求される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:11:03 GMT)
LCES: Zero-shot Automated Essay Scoring via Pairwise Comparisons Using Large Language Models [0.3] 本稿では,AESをペア比較タスクとして定式化する方法であるLCES(Comparent Essay Scoring)を提案する。
具体的には、2つのエッセイのどちらが優れているかを判断し、そのような比較を多く集め、それらを連続的なスコアに変換するようにLCMに指示する。
AESベンチマークデータセットを用いた実験により、LCESは計算効率を保ちながら従来のゼロショット法よりも精度が高いことが示された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 10:54:09 GMT)
Bridging Cybersecurity Practice and Law: a Hands-on, Scenario-Based Curriculum Using the NICE Framework to Foster Skill Development [0.3] 本稿では,中小企業(SMB)における最頻攻撃ベクトルについて述べる。
NICE Frameworkの技術的・非技術的タスク、知識、スキル、能力(TKSA)の実用的なモデルを提案する。
現実的なサイバー脅威シナリオに学習者を没入させることで、サイバーセキュリティインシデントに対応するための実践的理解と準備が強化される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:36:30 GMT)
(DEMO) Deep Reinforcement Learning Based Resource Allocation in Distributed IoT Systems [0.2] 本稿では,実世界の分散IoT環境での深層強化学習モデルをトレーニングするための新しいフレームワークを提案する。
提案フレームワークでは,DRLモデルがフィードバック情報でトレーニングされるのに対して,IoTデバイスはDRLベースの方法で通信チャネルを選択する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 02:50:29 GMT)
Personalised Pricing: The Demise of the Fixed Price? [0.2] 経済理論における価格差別の基礎とその大衆的認識について論じる。
我々の調査は、消費者がオンライン価格差別に批判的で疑念を抱いていることを示している。
我々は、一般データ保護規則(業界)が最も議論を呼んだオンライン価格差別の形式に当てはまると主張している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:39:08 GMT)
Microtargeted propaganda by foreign actors: An interdisciplinary exploration [0.2] 本稿は、外国人俳優によるマイクロターゲットの1つのタイプに焦点を当てる。
例えば、ロシアは米国内の特定のグループを広告で標的にしており、不協和を誘うことを目指している。
外国の俳優は、例えば特定の政党を支持する広告によって、ヨーロッパの選挙に影響を及ぼそうともしていた。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:32:21 GMT)
Towards Generalized Synapse Detection Across Invertebrate Species [0.1] SimpSynはシングルステージのResidual U-Netで、シナプス前および後における二重チャネルの球面の予測を訓練している。
F1スコアのSynfulは、すべてのボリュームで相乗的なサイト検出に優れています。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 11:40:49 GMT)
Uncovering Implicit Bias in Large Language Models with Concept Learning Dataset [0.0] 文脈内概念学習実験を用いて、量子化器における言語モデルは上向きの単調性に偏りがあることを発見した。
これは、言語モデルに隠れたバイアスを発見する効果的な方法として、コンテキスト内概念学習が有効であることを示している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:04:31 GMT)
Tracking Patterns in Toxicity and Antisocial Behavior Over User Lifetimes on Large Social Media Platforms [0.0] われわれはRedditとWikipediaの5億件近いコメントで14年間にわたって毒性を分析している。
Reddit上で最も有毒な行動は、最もアクティブなユーザーによって集計され、最も有毒な行動は、最もアクティブでないユーザーによって集計され、Wikipedia上で最も有毒な行動であることがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:38:27 GMT)
Time Series Forecasting Using a Hybrid Deep Learning Method: A Bi-LSTM Embedding Denoising Auto Encoder Transformer [0.0] 本研究では,BI-LSTM埋め込み型自動エンコーダモデル(BDM)を提案する。
提案モデルの性能をTransformer, CNN, RNN, LSTM, GRUなどのベンチマークモデルと比較することにより評価した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:16:32 GMT)
Thermal Noise Measurement Below the Standard Quantum Limit [0.0] 量子ノイズに依存しない光学キャビティ内の熱雑音を特徴付ける手法を提案する。
GaAsカンチレバーマイクロ共振器に懸濁したGaAs AlGaAsマイクロミラーの熱雑音特性を測定した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 22:38:01 GMT)
Static Security Vulnerability Scanning of Proprietary and Open-Source Software: An Adaptable Process with Variants and Results [0.0] ソフトウェア開発組織内のセキュリティ目標を達成する上で、ソフトウェア脆弱性は依然として重大なリスク要因です。
本稿では,支援手法とツールを用いたエンドツーエンドプロセスを提案する。
この主要なDevSecOps関数に対して、ツールセットが記述され、反復的なプロセスに置かれる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:00:18 GMT)
Star products and their Hilbert space mirrors [0.0] 位相空間関数の積の逆カヒル・グラバー変換(英語版)(iCG)を考えると、憎悪された星積 $mathbinwidehatstar_s$ の微分形式が現れる。
これは通常のスター積 $mathbinstar_s$ のヒルベルト空間鏡であり、古典力学の解釈をデコヒーレンスによる量子力学の既約変形として支持している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:56:02 GMT)
Quantum Abduction: A New Paradigm for Reasoning under Uncertainty [0.0] 本稿では、重ね合わせの仮説をモデル化し、構成的または破壊的に干渉できるパラダイムである量子アブダクションを紹介する。
ケーススタディは歴史的謎、文学的な実演、医学的診断、科学的理論の変化に及んでいる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:41:49 GMT)
Pulling Back the Curtain on ReLU Networks [0.0] より深いニューロンの勾配は ミスアライメントで知られています ネットワークの内部表現を曖昧にします
後方通過のみにソフトゲーティングを施すことにより、弱い励起ニューロンの局所的な影響を減少させることで、これを証明した。
結果として得られた変化した勾配は「励起プルバック」と呼ばれ、顕著な知覚的アライメントを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 12:46:56 GMT)
Proposal for macroscopic delocalisation of a large mass in a RF trap [0.0] ポールトラップにイオンを混入した数百ナノメートルの荷電質量を考える。
イオンとのクーロン相互作用により空間状態を操作する手法を提案する。
提案手法は, ナノ粒子を数ナノメートルでコヒーレントに置き換えることが可能であることを実証する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 13:54:42 GMT)
Physically consistent predictive reduced-order modeling by enhancing Operator Inference with state constraints [0.0] 本稿では,減階モデル予測に状態制約を埋め込むことにより,演算子推論を高速化する新しい手法を提案する。
シャル燃焼への適用として, 提案手法が安定性と精度に関する他の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:40:01 GMT)
Parameter-efficient fine-tuning (PEFT) of Vision Foundation Models for Atypical Mitotic Figure Classification [0.0] 非定型有糸分裂図(AMF)は腫瘍攻撃性と予後不良を伴う稀な異常な細胞分裂である。
MID 2025OG チャレンジでは非定型有糸分裂分類のための専用トラックが導入された。
Virchow, Virchow2, UNIを含む大規模視覚基盤モデルのパラメータ効率向上のためのローランド適応(LoRA)を用いた検討を行った。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 05:46:54 GMT)
PMRT: A Training Recipe for Fast, 3D High-Resolution Aerodynamic Prediction [0.0] サロゲートモデルは、訓練された設計空間内の空気力学を正確に予測することが示されている。
確率的多分解能トレーニングスケジュールであるプログレッシブ・マルチリゾリューション・トレーニング(PMRT)を提案する。
PMRTは、トレーニング中に変化する確率に基づいて、3つの解像度からバッチをサンプリングする。
シミュレーションパラメータの条件付けにより,実世界のデータセットを含む,さまざまな問題解決者から5つのデータセットを1つのモデルでトレーニングできることが示される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 18:05:50 GMT)
Out-of-Distribution Generalization in the ARC-AGI Domain: Comparing Execution-Guided Neural Program Synthesis and Test-Time Fine-Tuning [0.0] 我々はARC-AGIドメインで制御された合成一般化実験を行う。
本実験におけるニューラルプログラム合成とテスト時間微調整手法の比較を行った。
実行誘導型ニューラルプログラム合成は、新しい解を構成する能力において、すべての参照アルゴリズムより優れていることがわかった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:56:12 GMT)
On the Quantization of the Electromagnetic Field with Magnetic Monopoles [0.0] 磁気モノポールの存在下での電磁場の量子化のための共変フレームワークを提案する。
我々は、従来の光子に加えて、磁気電荷に付随する二重光子の存在を予測する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:43:46 GMT)
Neuro-inspired Ensemble-to-Ensemble Communication Primitives for Sparse and Efficient ANNs [0.0] G2GNetは、フィードフォワード層にまたがるスパースでモジュラーな接続を強制する新しいアーキテクチャである。
G2GNetの精度は最大75%まで向上し、ベンチマークでは最大4.3%向上した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:43:54 GMT)
NeuFACO: Neural Focused Ant Colony Optimization for Traveling Salesman Problem [0.0] 本研究では,高度強化学習と拡張Ant Colony Optimization(ACO)を組み合わせた,旅行セールスマン問題(TSP)の非自己回帰的枠組みを提案する。
NeuFACOは、グラフニューラルネットワークをトレーニングするためのエントロピー正規化を備えたPPO(Proximal Policy Optimization)を採用しており、候補リスト、制限されたツアーリファインメント、スケーラブルなローカル検索を備えた最適化されたACOフレームワークに統合されている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:09:47 GMT)
Machine Learning for Campus Energy Resilience: Clustering and Time-Series Forecasting in Intelligent Load Shedding [0.0] 本研究では,ラゴス大学のための機械学習に基づく負荷層フレームワークを提案する。
55棟の建物から3,648件の時間記録を収集し、建物レベルの消費モデルを構築した。
その後、Mini-Batch K-Meansは、建物を高、中、低要求のクラスタに分類するために使用された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:29:31 GMT)
Lightweight MobileNetV1+GRU for ECG Biometric Authentication: Federated and Adversarial Evaluation [0.0] 本稿では,ECGに基づく認証のための軽量ディープラーニングモデル(MobileNetV1+GRU)を提案する。
我々は、ECGID、MIT-BIH、CYBHi、TBデータセットを用いて、ウェアラブル条件とエッジデプロイメントをシミュレートする。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:46:31 GMT)
LEMs: A Primer On Large Execution Models [0.0] 大規模実行モデル(LEM)は、複雑な実行問題を解決するための新しいディープラーニングフレームワークである。
LEMは、固定順序の順序から、実行期間が最小時間と最大時間に制限されるシナリオへのアプローチを一般化する。
LEMは、フレキシブルな時間制約内で実行パスを動的に最適化することで、従来のベンチマークよりも優れた実行性能を実現する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:01:04 GMT)
Invariant Random Subgroups, Soficity, and Lück's determinant conjecture [0.0] 我々は、共双線型ではなく、従って共ソフィックでない決定的予想を満たすIRSの存在を証明した。
このことは、決定的予想を満たすことは、群に対する充足性よりも弱い性質であるかもしれないという証拠を与える。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:42:39 GMT)
Information geometry of transitions between quantum nonequilibrium steady states [0.0] 量子非平衡定常状態間の緩やかな遷移について、非断熱エントロピー生成は先行順序であることを示す。
任意に高速なプロセスを保持する余剰エントロピーフラックスの上界を導出する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:35:32 GMT)
In Numeris Veritas: An Empirical Measurement of Wi-Fi Integration in Industry [0.0] 現実の環境でのWi-Fiの普及とセキュリティ設定に関して、重要な知識ギャップが存在する。
我々は1087の高信頼産業Wi-Fiネットワークの最初の公開データセットを作成している。
業界全体でWi-Fiの採用が増えているが、セキュリティの欠陥を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:01:58 GMT)
Hyperfine van der Waals repulsion between open-shell polar molecules [0.0] 本報告では, オープンシェル極性分子とサブミルキリルビン温度の相互作用について述べる。
この超微細ファンデルワールス相互作用は、1つの量子によって異なる2つの回転状態の2つの分子の間で起こる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 23:09:27 GMT)
How to simulate magic state cultivation with around $8$ Clifford terms on average [0.0] 我々は,非クリフォード$d=5$マジックステート培養回路のシミュレーション方法を示す。
我々の結果は、内部構造を持つ運用関連の高い高いT$カウント量子回路のシミュラビリティに光を当てる。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 20:19:22 GMT)
Guided and Unguided Conditional Diffusion Mechanisms for Structured and Semantically-Aware 3D Point Cloud Generation [0.0] リアルな3Dポイントクラウドの生成は、リモートセンシング、ロボット工学、デジタルオブジェクトモデリングにおけるコンピュータビジョンの基本的な問題である。
本稿では,各ポイントごとのセマンティック・コンディショニングを世代内に直接組み込む拡散型フレームワークを提案する。
この設計は、構造的コヒーレントかつセグメンテーションを意識した点雲を生成し、合成中に対象部品が明示的に表現される。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:19:36 GMT)
Green's functions for magnetic Dirac operators and bulk-edge correspondence [0.0] 無限質量とジグザグの場合を補間する境界条件を持つ半平面上での磁気ディラック作用素の分解核について検討する。
これらのカーネルは、最近示された無限質量の場合からのバルクエッジ対応の証明が、Ad zigzag litteram を繰り返すことができるように、すべての要求特性を持つことを示す。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 16:48:01 GMT)
Feynman's path to Schrödinger (and various other things) [0.0] ファインマンの経路積分の定式化は、ラグランジアンフレームワークを量子力学に組み込む試みから生まれた。
経路積分からシュリンガー方程式を導出し、確率の保存を実証する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:57:56 GMT)
Explicit construction of a 2-design of ${\rm U}(2)$ from the theory of angular momentum [0.0] ユニタリ設計は、量子科学と技術における実りの多い応用において、豊かで基礎的なものである。
この研究の目的は、すべてのツールボックスに属するツール(角運動量の理論)にのみ依存する、$rm U(2) の 2-設計の明示的な構成を提供することである。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 15:39:43 GMT)
Diffusion Graph Neural Networks and Dataset for Robust Olfactory Navigation in Hazard Robotics [0.0] 香りによるナビゲーションは、ロボットシステムにおいて需要が高まっている能力である。
現在の方法はしばしば曖昧さに悩まされ、特にロボットが不正な物体に臭気をあてはめる場合である。
本稿では,新しい機械学習手法とともに,マルチモーダル・ウルフアクション・データセットを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 03:08:57 GMT)
Detecting Urban PM$_{2.5}$ Hotspots with Mobile Sensing and Gaussian Process Regression [0.0] 我々はルワンダのキガリで200mの解像度でPM$_2.5$汚染マップを初めて作成した。
キガリのホットスポットは、大気汚染が都市全体の平均を上回っている。
オープンソースのソフトウェアを使うことで、私たちの方法は世界中の都市で低コストのセンサーで再適用できます。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:50:35 GMT)
Deep Synthetic Cross-Project Approaches for Software Reliability Growth Modeling [0.0] Deep Synthetic Cross-Project SRGM (DSC-SRGM) は、合成データ生成とクロスプロジェクト移行学習を統合する新しいアプローチである。
DSC-SRGMは従来のSRGMよりも最大で23.3%精度が向上し、実際のデータセットでトレーニングされたクロスプロジェクトディープラーニングモデルでは32.2%となった。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:15:00 GMT)
Deep Learning Inductive Biases for fMRI Time Series Classification during Resting-state and Movie-watching [0.0] 我々は、CNN、長期記憶ネットワーク(LSTM)、トランスフォーマーを含むディープラーニングにおける3つの大きな帰納バイアスモデルと比較する。
CNNは、休息状態と映画視聴の両方において、性分類の最も高い差別を一貫して達成した。
その結果, このデータセットサイズでは, 局所的な空間パターンと地域間依存関係によって識別情報が伝達されることが示唆された。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 08:11:31 GMT)
Data-driven approach to the design of complexing agents for trivalent transuranium elements [0.0] トランウラニウム元素の錯体の性質は、様々な化学分野の研究の対象とされてきた。
最新の機械学習手法を使用して、多数の要素で利用可能な実験データを使用することのできる、新しいニューラルネットワークアーキテクチャを作成しました。
また, 提案モデルの適用性ドメインについて述べるとともに, 錯体の安定性に最も影響を及ぼす分子断片を同定した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:37:32 GMT)
Corner functions from entanglement indices of harmonic lattices [0.0] 本研究では,2つの隣接部分集合間の対数ネガティビティ(LN)や相互情報(MI)といった絡み合いの指標を,調和振動子の単独集合$U$で検討する。
まず、前回の研究では、角度 $pi/2, pi/4, 3pi/4$ のコーナー関数の値を検証する。
普遍システム$U$が固定端境界条件(FBCs)を満たす場合、$U$のいくつかの場所でLN, MIsを計算し、特にコーナー関数と得られた値を比較する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 06:06:16 GMT)
Context Is What You Need: The Maximum Effective Context Window for Real World Limits of LLMs [0.0] 大規模言語モデルにおけるコンテキストウィンドウの現実的利用をテストする。
報告した最大コンテキストウィンドウ (MCW) サイズと最大有効コンテキストウィンドウ (MECW) サイズを比較した。
我々のデータは、提供された問題の種類に基づいて、最大有効コンテキストウィンドウシフトを明らかにします。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 14:38:17 GMT)
Constructing an approximate logical Markovian model of consecutive QEC cycles of a stabilizer code [0.0] 1つの難点は、論理的性能と低レベルのエラーモデルの間に明確な接続がないことである。
連続ノイズQECサイクルは論理サブシステムにのみ作用するメモリレスエラープロセスによってモデル化できることを示す。
我々は、近似論理マルコフモデルが論理的特徴付けに有用なツールであり、論理的性能を保証する安定化器コードの実装を設計する助けになることを期待している。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 02:43:16 GMT)
ConfidentSplat: Confidence-Weighted Depth Fusion for Accurate 3D Gaussian Splatting SLAM [0.0] ConfidentSplatは、3D Gaussian Splatting (3DGS)ベースのSLAMシステムである。
再現精度(L1深度誤差)と新しいビュー忠実度(PSNR, SSIM, LPIPS)は,ベースラインよりも大幅に向上した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 01:28:03 GMT)
Certified Pruning from Counterfactual Consistency: Exact Certificates and Structured SAT Families [0.0] 実験室の文脈性実験において,エプシロン対数測定器とエプシロン安定性を定式化し,ノイズが強いが検証可能な制約を捉えた。
我々はこれらの制約をコンテキストのネットワークに拡張し、CNF-SATインスタンス全体でグローバルに適用される文脈性型不等式を生成する。
本稿では,Farkasの2つの証明を正確な算術で検証し,すべての学習節を認証するプロパゲートとプルーの解法を実装した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 07:39:39 GMT)
Bosonic error correction codes based on states generated via particle number resolving measurements [0.0] 粒子数測定により生成した状態から生成した粒子の損失と劣化に対するボソニックな誤り訂正符号を導入する。
このようなエラーの修正に適しているとして,これらの状態を解析し,エラーの軽減に最も寄与する特徴を同定する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 09:24:19 GMT)
BeNNS: A Surrogate Model for Hybrid Online-Offline Evolution of SFC Embedding [0.0] Service Function Chains (SFC) は、コンピュータネットワーク内の機能とサービスのプログラムによる制御を可能にする。
SFCを基盤となる物理ネットワークと計算インフラに埋め込むことの課題はNPハードの問題である。
生成したソリューションを評価するためのハイブリッドオンラインオフラインアプローチを導入する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 00:51:13 GMT)
Active Learning for Machine Learning Driven Molecular Dynamics [0.0] 機械学習された粗粒度(CG)電位は速いが、シミュレーションがアンサンプされた生体分子配座に達すると時間とともに劣化する。
分子動力学におけるCGニューラルネットワークの新たな能動的学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 19:26:32 GMT)
A Statistical Mixture-of-Experts Framework for EMG Artifact Removal in EEG: Empirical Insights and a Proof-of-Concept Application [0.0] 現状の脳波計測法(EMG)は,高雑音条件下で準最適に機能する。
本稿では,新しいMix-of-Experts(MoE)フレームワークによって駆動される信号フィルタリングアルゴリズムを提案する。
提案アルゴリズムは,脳波-EMGデノベーション問題に対する3つの新しい統計的洞察を利用する。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:39:56 GMT)
A Comprehensive Performance Comparison of Traditional and Ensemble Machine Learning Models for Online Fraud Detection [0.0] リアルタイム不正検出は金融セキュリティにとって不可欠だが、取引量の増加と現代の不正パターンの複雑さのために依然として困難である。
本研究では、ランダムフォレスト、SVM、ロジスティック回帰のような従来の機械学習モデルと、スタックや投票のようなアンサンブルメソッドとの包括的な比較を示す。
アンサンブル法は約0.99の精度を達成したが、従来の手法はリコールの点で優れた性能を示した。
論文参考訳(メタデータ) (Sun, 21 Sep 2025 17:53:24 GMT)