OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM [128.4] 我々はOmniVinciを紹介します。OmniVinciは強力でオープンソースのOmni-modal LLMを構築するためのイニシアチブです。
モデルアーキテクチャでは、(i)OmniAlignNetで視覚とオーディオの埋め込みのアライメントを強化する方法、(ii)視覚と音声信号の時間的アライメントをキャプチャするための時間的エンベディンググループ、(iii)オムニモーダル埋め込みにおける絶対時間的情報をエンコードするための制約付きロータリー時間エンベディングという3つの重要なイノベーションを提示する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:59:59 GMT)
Muddit: Liberating Generation Beyond Text-to-Image with a Unified Discrete Diffusion Model [118.5] テキストと画像の両モードをまたいで高速かつ並列に生成できる,統一的な離散拡散変換器であるMudditを導入する。
Mudditは、スクラッチからトレーニングされた以前の統一拡散モデルとは異なり、トレーニング済みのテキストからイメージまでのバックボーンから、強力な視覚的事前情報を軽量のテキストデコーダに統合する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:26:05 GMT)
Learnable Item Tokenization for Generative Recommendation [113.8] LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:14:56 GMT)
BLIP3o-NEXT: Next Frontier of Native Image Generation [113.3] 本稿では,ネイティブ画像生成の次のフロンティアであるBLIP3シリーズにおいて,完全にオープンな基盤モデルBLIP3oを提案する。
BLIP3oは単一のアーキテクチャで画像生成と画像編集を統一し、強力な画像生成と画像編集機能を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:50:58 GMT)
Elevating Visual Perception in Multimodal LLMs with Visual Embedding Distillation [109.6] 近年,MLLMの開発における標準的な実践は,視覚エンコーダの機能をLLMに供給し,自然言語による指導を施すことである。
このアプローチは、しばしばモデルが言語理解に傾き、データに存在するリッチな視覚知覚信号を損なう。
本稿では,視覚知識をエキスパートビジョンエンコーダからLLMの隠れ表現に注入する最初のアプローチであるVisPer-LMを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:33:41 GMT)
Scaling Instruction-Based Video Editing with a High-Quality Synthetic Dataset [103.4] 命令ベースの動画編集のためのフレームワークであるDittoを開発した。
我々は100万の高忠実度ビデオ編集サンプルのデータセットを構築した。
カリキュラム学習戦略を用いてDitto-1MでモデルであるEdittoをトレーニングする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:31:40 GMT)
3DPR: Single Image 3D Portrait Relight using Generative Priors [101.7] 3DPRは画像ベースのリライティングモデルであり、マルチビューのOne-Light-at-A-Time (OLAT)イメージから学習した生成的事前情報を活用する。
我々は,事前学習した画像データセットから学習した顔の幾何に先立ってリッチな情報を提供する,事前学習された生成ヘッドモデルの潜時空間を活用する。
我々のリフレクタンスネットワークは生成ヘッドモデルの潜在空間で動作し、比較的少数の光ステージ画像でリフレクタンスモデルを訓練することが可能である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:37:42 GMT)
PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation [97.4] 大規模視覚言語モデル(LVLM)は、推論中に重要な計算とメモリオーバーヘッドを引き起こす。
ここでは、PrefixKVについて述べる。ここでは、Prefixは、元のシーケンスの位置ではなく、重要度に基づいて、上位ランクのKVを意味する。
本手法は他の手法と比較して最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:54:10 GMT)
What's Wrong with Your Code Generated by Large Language Models? An Extensive Study [92.6] 本研究は,3つの一般的なベンチマーク上で,3つの主要なクローズドソースLLMと6つの人気のあるオープンソースLLMの性能評価を行った。
間違ったコードに対するバグの分類を開発し、一般的なバグタイプに対する根本原因を分析した。
本稿では,自己批判を導入し,LLMが生成したコードに対する批判と修正を可能にする,新たな学習自由反復手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:05:01 GMT)
FreqPDE: Rethinking Positional Depth Embedding for Multi-View 3D Object Detection Transformers [91.6] 周波数対応位置深度埋め込み (FreqPDE) を導入し, 空間情報と2次元画像特徴を付加して3次元検出変換器デコーダを提案する。
FreqPDEは2D画像特徴と3D位置埋め込みを組み合わせることで、クエリデコーディングのための3D深度認識機能を生成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:36:54 GMT)
Reinforcement Learning with Verifiable yet Noisy Rewards under Imperfect Verifiers [90.5] RLVR(Reinforcement Learning with Verifiable Rewards)は、人為的なラベル付けを避けるために、自動検証に対するポリシーを訓練する。
認証ハッキングの脆弱性を軽減するため、多くのRLVRシステムはトレーニング中にバイナリ$0,1$の報酬を破棄する。
この選択にはコストがかかる:textitfalse negatives(正しい回答、FNを拒絶)とtextitfalse positives(間違った回答、FPを受け入れる)を導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:20:55 GMT)
CAIT: Triple-Win Compression towards High Accuracy, Fast Inference, and Favorable Transferability For ViTs [89.8] ビジョントランスフォーマー (ViT) は様々なビジョンタスクの最先端モデルとして登場した。
本稿では,高次アンダーライン精度,高速アンダーライン推論速度,下流タスクに対する好適なアンダーライン変換性を両立させたViTの合同アンダーライン圧縮法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:11:59 GMT)
Summarizing Speech: A Comprehensive Survey [89.7] 音声の要約は、音声・音声コンテンツの増加量を効率的に管理し、アクセスするために欠かせないツールとなっている。
本調査では,要約手法の質を評価する上で重要な,既存のデータセットと評価プロトコルについて検討する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:15:27 GMT)
FlexiReID: Adaptive Mixture of Expert for Multi-Modal Person Re-Identification [88.6] FlexiReIDはフレキシブルなフレームワークで、4つのモードにわたる7つの検索モードをサポートする。
一般的な4つのRe-IDデータセットを4つのモードすべてを含むように拡張した統合データセットであるCIRS-PEDESを構築した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:41:05 GMT)
Cross-layer Attention Sharing for Pre-trained Large Language Models [87.2] 大規模言語モデル(LLM)における自己注意の軽量代用であるLISAを導入する。
その結果,LISAは高い応答品質を維持しつつ,全レイヤの53%~84%以内の冗長な注意計算を減らしていることがわかった。
LISAの実装により,LLaMA3-8B,LLaMA2-7B,LLaMA2-13Bに対して最大スループット19.5%,32.3%,40.1%のスループット向上を実現した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:45:17 GMT)
Learning More with Less: A Generalizable, Self-Supervised Framework for Privacy-Preserving Capacity Estimation with EV Charging Data [84.4] 自己教師付き事前学習に基づく第一種能力推定モデルを提案する。
我々のモデルは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:22:40 GMT)
FinChain: A Symbolic Benchmark for Verifiable Chain-of-Thought Financial Reasoning [82.7] FinChainは、ファイナンスにおける検証可能なChain-of-Thought評価のために特別に設計された最初のベンチマークである。
12の金融ドメインに58のトピックがあり、それぞれがパラメータ化されたシンボリックテンプレートと実行可能なPythonトレースで表現されている。
FinChainは、多段階の財務推論における永続的な弱点を明らかにし、信頼できる、解釈可能な、検証可能な金融AIを開発するための基盤を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:13:48 GMT)
Towards Reliable and Holistic Visual In-Context Learning Prompt Selection [82.2] Visual In-Context Learning (VICL) は、視覚基礎モデルを新しいタスクに適用するための顕著なアプローチとして登場した。
部分2Global や VPR のような VICL の手法は、クエリ画像とより視覚的に類似したイメージが、より良いコンテキスト内例として機能するという類似性と優先度の仮定に基づいている。
本稿では、VICLにおけるテキスト内サンプルの信頼性と包括的選択のために、Partial2Globalの拡張版を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:13:00 GMT)
Latent Reasoning in LLMs as a Vocabulary-Space Superposition [80.0] 大規模言語モデル(LLM)は、チェーン・オブ・シークレット・プロンプトによる強力な推論能力を示すが、明示的な推論は計算上のオーバーヘッドを大幅に引き起こす。
遅延推論に関する最近の研究は、明示的な監督なしに遅延空間を推論することでコストを削減するが、性能は著しく低下する。
この問題に対処するため、LLM語彙の列空間に潜伏空間を制限し、潜伏推論を語彙確率の重ね合わせとして扱う。
後続の推論が終わると、それは最終的な答えを得るために明確な推論の固有状態に崩壊する。
Latent-SFTはGSM8kに新しい状態を設定し、明示的に一致する
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:51:20 GMT)
Refer to Any Segmentation Mask Group With Vision-Language Prompts [79.4] RAS(Refer to Any Mask Group)は、複雑なマルチモーダル相互作用と理解を伴うセグメンテーションモデルを強化する。
我々は,従来の参照表現セグメンテーション(RES)および一般化参照表現セグメンテーション(GRES)タスクと同様に,新しいORESタスクにおけるRASの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:20:57 GMT)
Latent Diffusion Model without Variational Autoencoder [78.3] 本稿では,変分オートエンコーダを持たない新しい潜伏拡散モデルSVGを紹介する。
凍結したDINO機能を利用して、明確な意味的識別性を持つ特徴空間を構築する。
迅速な拡散訓練を可能にし、数ステップのサンプリングをサポートし、生成品質を向上させる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:17:44 GMT)
VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use [78.3] VerlToolは、体系的な設計原則を通じて制限に対処する統一的でモジュール化されたフレームワークです。
我々のフレームワークはARLTをマルチターントラジェクトリとして定式化し、マルチモード観測トークン(テキスト/画像/ビデオ)を単一ターンRLVRパラダイムを超えて拡張する。
モジュール化されたプラグインアーキテクチャは、軽量Python定義のみを必要とする迅速なツール統合を可能にする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:09:17 GMT)
GaussGym: An open-source real-to-sim framework for learning locomotion from pixels [78.1] 本稿では,3次元ガウススプラッティングをベクトル化物理シミュレータのドロップインとして統合した光現実的ロボットシミュレーションを提案する。
これにより、コンシューマGPUで毎秒10万ステップを超える、前例のないスピードを実現している。
また,シミュレーティブ・トゥ・リアル・ロボティクス・セッティングにおける適用性を実証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:34:52 GMT)
Proto-Former: Unified Facial Landmark Detection by Prototype Transformer [77.5] Proto-Formerは、統一的で適応的でエンドツーエンドの顔ランドマーク検出フレームワークである。
統一されたアーキテクチャ内で、複数のデータセットをまたいだ共同トレーニングを可能にする。
Proto-Formerは、既存の最先端手法よりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:00:25 GMT)
RadioDiff-$k^2$: Helmholtz Equation Informed Generative Diffusion Model for Multi-Path Aware Radio Map Construction [76.2] 物理インフォームド・ジェネレーティブ・ラーニング・アプローチであるRadioDiff-$k2$を提案する。
提案するRadioDiff-$k2$フレームワークは,画像レベルのRM構成とローカライズタスクの両方において,最先端(SOTA)性能を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:25:13 GMT)
VITA-VLA: Efficiently Teaching Vision-Language Models to Act via Action Expert Distillation [76.1] VLA(Vision-Language Action)モデルは、事前訓練された視覚言語モデル(VLM)の強い知覚能力を活用することにより、ロボット操作を著しく向上させる。
本稿では,VLMに事前訓練された小規模な行動モデルから知識を伝達することで,動作実行能力を持たせる,簡易かつ効果的な蒸留ベースフレームワークを提案する。
5つの操作課題にわたる実世界の実験において,本手法は教師モデルより一貫して優れ,82.0%の成功率(17%改善)を達成した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:19:59 GMT)
FASTopoWM: Fast-Slow Lane Segment Topology Reasoning with Latent World Models [75.3] レーンセグメント推論は、総合的な鳥眼ビュー(BEV)ロードシーン理解を提供する。
ストリームベースの時間的伝搬法は,クエリレベルとBEVレベルの両方に時間的手がかりを組み込むことで,有望な結果を示した。
FASTopoWMは、潜在世界モデルで拡張された新しい高速スローレーンセグメント推論フレームワークである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:41:32 GMT)
A Generative Framework for Personalized Sticker Retrieval [73.6] 我々はパーソナライズされたステッカー検索のための新しい生成フレームワークであるPEARLを提案する。
i) ユーザ固有のステッカー嗜好を符号化するために,識別的ユーザ表現を学習するための表現学習モデルを設計し, (ii) ユーザのクエリ意図に合致したステッカーを生成するために, 新たな意図認識学習目標を提案する。
オフライン評価とオンラインテストの両方による実証的な結果は、PEARLが最先端の手法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:15:24 GMT)
Controlling What You Share: Assessing Language Model Adherence to Privacy Preferences [73.6] ローカルモデルがこれらの命令を使ってクエリを書き換えるフレームワークを構築します。
軽量なローカルLCMを用いた実験では、微調整後、はるかに大きなゼロショットモデルの性能を著しく上回った。
同時に、このシステムは、ユーザー定義プライバシの好みをよりよく理解したモデルの必要性を強調し、ユーザー指示に完全に準拠するという課題に直面している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:45:26 GMT)
Compressed and Smooth Latent Space for Text Diffusion Modeling [71.9] テキスト生成のための新しいアプローチであるCosmosを紹介します。
我々は,トークンレベルの拡散モデルに匹敵する生成品質を維持しつつ,テキスト表現を8倍に圧縮できることを実証した。
本研究では,ストーリー生成,質問生成,要約,デトキシフィケーションを含む4つの多種多様な生成課題についてコスモスを評価し,様々な生成パラダイムと比較する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:11:02 GMT)
Rethinking Efficient Hierarchical Mixing Architecture for Low-light RAW Image Enhancement [70.9] 高速低照度画像信号処理(ISP)のための階層混合アーキテクチャ(HiMA)を提案する。
HiMAはTransformerとMambaモジュールの相補的な長所を利用して、大規模かつ小規模な機能を処理する。
局所的な変動が強い不均一照明に対処するため,LoDA(Local Distribution Adjustment)を提案する。
さらに,第1段階からの復号化出力をフル活用するために,MPFモジュールを設計する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:09:38 GMT)
TopoStreamer: Temporal Lane Segment Topology Reasoning in Autonomous Driving [70.9] TopoStreamerは、レーンセグメントトポロジー推論のためのエンドツーエンドの時間知覚モデルである。
TopoStreamerは、ストリーミング属性制約、動的レーン境界位置エンコーディング、およびレーンセグメントのデノイングという3つの重要な改善点を紹介している。
Open-Lane-V2データセットでは、TopoStreamerが最先端のメソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:39:04 GMT)
Exploring Conditions for Diffusion models in Robotic Control [70.3] 我々は,ロボット制御のためのタスク適応型視覚表現を得るために,事前学習したテキスト・画像拡散モデルを活用することを検討する。
テキスト条件をナビゲート的に適用すると、制御タスクにおいて最小あるいは負の利得が得られることがわかった。
本稿では,制御環境に適応する学習可能なタスクプロンプトと,細粒度でフレーム固有の細部をキャプチャする視覚プロンプトを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:24:14 GMT)
Topological Structure Learning Should Be A Research Priority for LLM-Based Multi-Agent Systems [70.0] 大規模言語モデルに基づくマルチエージェントシステム(MAS)は、協調的な知性によって複雑なタスクに取り組むための強力なパラダイムとして登場した。
我々は,エージェント間相互作用の構造を明示的にモデル化し,動的に最適化する,エフェトロジーを意識したMASへのパラダイムシフトを求める。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:41:02 GMT)
Genie Envisioner: A Unified World Foundation Platform for Robotic Manipulation [69.3] 我々は,ロボット操作のための統一世界基盤プラットフォームであるGenie Envisioner(GE)を紹介する。
GEは、ポリシー学習、評価、シミュレーションを単一のビデオ生成フレームワークに統合する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:36:47 GMT)
Point or Line? Using Line-based Representation for Panoptic Symbol Spotting in CAD Drawings [67.6] ベクトルグラフィカルプリミティブからなるCAD図面におけるパノプティカルシンボルスポッティングの課題について検討する。
既存の手法は通常、画像化、グラフ構築、あるいは点ベースの表現に依存している。
本稿では,プリミティブの行ベースの表現を通じてこれらの課題に対処する新しい手法であるVecFormerを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:59:05 GMT)
What Layers When: Learning to Skip Compute in LLMs with Residual Gates [66.2] GateSkipは、デコーダのみのLMにおけるトークンワイド層スキップを可能にする残差ストリームゲーティング機構である。
各Attention/MLPブランチは、残ストリームに再入力する前に、ブランチの出力を凝縮するシグモイドリニアゲートを備えている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:30:17 GMT)
Emergence of Linear Truth Encodings in Language Models [64.9] 大規模言語モデルは偽文と真を区別する線形部分空間を示すが、それらの出現のメカニズムは不明確である。
このような真理部分空間をエンドツーエンドに再現する,透明な一層トランスフォーマー玩具モデルを導入する。
本研究では,真理エンコーディングが実現可能な単純な設定について検討し,将来のトークンにおけるLM損失を減らすために,この区別を学習するようモデルに促す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:30:07 GMT)
Embody 3D: A Large-scale Multimodal Motion and Behavior Dataset [64.4] Embody 3Dは、439人の参加者から収集された500時間分の3Dモーションデータからなるマルチモーダルデータセットである。
データセットには、誘発された動き、手の動き、移動を含む、幅広い個人動作データが含まれている。
我々は,手の動きの追跡や身体形状,テキストアノテーション,参加者毎に別々の音声トラックなど,追跡された人間の動作を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:06:36 GMT)
X$^{2}$-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction [64.2] 現在の方法では、時間分解能を呼吸ゲーティング装置で固定相に識別する。
新規なフレームワークであるX$2$-Gaussianは、動的放射スプラッティングと自己監督型呼吸運動学習を統合することで、連続的な4DCT再構成を可能にする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:17:20 GMT)
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians [63.4] モノクロ画像とビデオからの頭部の3次元再構成は、多くの視覚的応用の根底にある。
従来の手法は、豊富な2Dビデオから自己監督的な方法で学習しようとしてきた。
SHeaP (Self-supervised Head Geometry Predictor Learned through 2D Gaussian)を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:35:50 GMT)
DriveGen3D: Boosting Feed-Forward Driving Scene Generation with Efficient Video Diffusion [62.6] DriveGen3Dは、高品質で制御可能な動的3D駆動シーンを生成するための新しいフレームワークである。
本研究は,映像の高速化と大規模動的シーン再構築を融合させることにより,この手法のギャップを埋めるものである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:00:08 GMT)
BPL: Bias-adaptive Preference Distillation Learning for Recommender System [61.9] 本稿では,BPL(Bias-Adaptive Preference distillation Learning)と呼ばれる新たな学習フレームワークを導入し,ユーザの嗜好を徐々に明らかにする。
BPLは、収集したフィードバックに合わせた正確な好みの知識を保持し、実際のテストで高いパフォーマンスをもたらす。
信頼性フィルタリングによる自己蒸留により、BPLはトレーニングプロセスを通してその知識を反復的に洗練する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:09:04 GMT)
V2X-Radar: A Multi-modal Dataset with 4D Radar for Cooperative Perception [61.6] V2X-Radarは、4Dレーダを特徴とする世界初の大規模実世界のマルチモーダルデータセットである。
データセットは20KのLiDARフレーム、40Kのカメライメージ、20Kの4Dレーダデータで構成され、5つのカテゴリに350Kの注釈付きボックスが含まれている。
様々な研究領域をサポートするために, 協調認識のためのV2X-Radar-C, 路面認識のためのV2X-Radar-I, 単車知覚のためのV2X-Radar-Vを確立した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:22:48 GMT)
Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.4] 文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:33:16 GMT)
Compressing Many-Shots in In-Context Learning [61.2] マルチショットプロンプトを圧縮することにより,ICL推論のメモリと計算効率を向上させる手法を提案する。
まず,既存のプロンプト圧縮手法がマルチショット圧縮には有効でないことを示す。
本稿では,レイヤワイド圧縮手法であるMemComを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:57:42 GMT)
SegDAC: Improving Visual Reinforcement Learning by Extracting Dynamic Objectc-Centric Representations from Pretrained Vision Models [61.1] SegDACは、視覚的強化学習のためのアクター駆動アクター・クリティカル法である。
人間のラベルを使わずに、オンラインRLを使うことに集中すべきセグメントを学習する。
視覚的一般化を著しく改善し、最も難しい設定での事前性能を倍増させ、サンプル効率で事前メソッドをマッチングまたは超越させる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:15:14 GMT)
Dual-Weighted Reinforcement Learning for Generative Preference Modeling [61.1] 本稿では,2重強化学習(DWRL)を嗜好モデリングの新しいフレームワークとして提案する。
本稿では、DWRLを生成的嗜好モデル(GPM)を訓練して嗜好モデルに適用し、まず思考を生成し、それから人間の選好スコアを予測する。
その結果、DWRLは、検証可能なタスク以上の推論強化された選好学習の一般的なフレームワークとして位置づけられた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:14:24 GMT)
AutoGraph-R1: End-to-End Reinforcement Learning for Knowledge Graph Construction [60.5] 強化学習(RL)を用いたタスクパフォーマンスのKG構築を直接最適化する最初のフレームワークであるAutoGraph-R1を紹介する。
我々は2つの新しいタスク対応報酬関数を設計し、1つは知識担体としてのグラフと、もう1つは知識指標としてのグラフを設計する。
私たちの研究は、構築とアプリケーションの間のループを閉じることが可能であることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:03:36 GMT)
Evaluating Large Language Models with Psychometrics [59.8] 本稿では,Large Language Models (LLMs) の心理的構造を定量化するための総合的ベンチマークを提案する。
私たちの研究は、13のデータセットで評価された5つの重要な心理的構成要素、人格、価値観、感情的知性、心の理論、自己効力性を特定します。
LLMの自己報告特性と実際のシナリオにおける応答パターンとの間に大きな相違が発見され,その挙動の複雑さが明らかになった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:59:50 GMT)
Where MLLMs Attend and What They Rely On: Explaining Autoregressive Token Generation [59.4] マルチモーダル大規模言語モデル(MLLM)は、視覚入力と自然言語出力の整合性を示す。
しかし、生成したトークンが視覚的モダリティに依存する範囲は、いまだに理解されていない。
MLLMにおける自己回帰トークン生成を説明するための軽量なブラックボックスフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:14:57 GMT)
FinHEAR: Human Expertise and Adaptive Risk-Aware Temporal Reasoning for Financial Decision-Making [58.0] FinHEARは、人間の専門知識と適応的リスク認識推論のためのフレームワークである。
専門のエージェントを編成し、過去の傾向を分析し、現在の出来事を解釈し、専門家にインフォームドされた前例を検索する。
金融データセットの実証的な結果から、FinHEARはトレンド予測やトレーディングタスクにおいて、一貫して強いベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:11:12 GMT)
The Choice of Divergence: A Neglected Key to Mitigating Diversity Collapse in Reinforcement Learning with Verifiable Reward [57.6] Reinforcement Learning with Verifiable Reward (RLVR) を用いた細調整大型言語モデル(LLM)における中心的パラドックスは、多目的性能の頻繁な劣化である。
これはしばしば破滅的な忘れが伴い、モデルが以前獲得したスキルを失う。
我々は,標準RLVR目標には知識保持のための重要なメカニズムが欠如していると主張している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:26:39 GMT)
DeceptionBench: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenarios [57.3] 現実的な現実のシナリオにまたがる騙しのキャラクタリゼーションは未解明のままである。
DeceptionBenchは、さまざまなドメインにまたがる認知傾向を体系的に評価する最初のベンチマークです。
本研究は,本質的な側面から,ユーザ満足度を優先する自己関心のエゴスティックな傾向を示すモデルや,サイコファンティックな行動を示すモデルについて検討する。
実世界のフィードバックダイナミクスのより現実的なシミュレーションを構築するために,持続的マルチターン相互作用ループを組み込んだ。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:14:26 GMT)
Can LLMs Correct Themselves? A Benchmark of Self-Correction in LLMs [57.1] 大規模言語モデル(LLM)の自己補正は、推論性能を高める重要な要素として現れる。
本研究では,自己補正戦略の有効性を評価するためのベンチマークであるCorrectBenchを紹介する。
その結果,1) 自己補正手法は, 複雑な推論タスクにおいて, 精度を向上させることが可能であり, 2) 異なる自己補正戦略の混合により, 効率は低下するものの, さらなる改善がもたらされることが明らかとなった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:40:19 GMT)
MARIS: Marine Open-Vocabulary Instance Segmentation with Geometric Enhancement and Semantic Alignment [56.9] 我々は,水中オープンボキャブラリ(OV)セグメンテーションのための大規模なベンチマークであるtextbfMARIS (underlineMarine Open-Vocabulary underlineInstance underlineSegmentation)を紹介した。
当社のフレームワークは、既存のOVベースラインであるIn-DomainとCross-Domainの両方を一貫して上回ります。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:50:58 GMT)
Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning [56.5] 固定ステップのEulerスキームによるフローマッチング推論プロセスの離散化は,最適輸送から変化するJordan-Kinderlehrer-Otto原理と整合する,というキーインサイトに基づいて,SWFP(Stepwise Flow Policy)フレームワークを紹介した。
SWFPは、大域的な流れを、プロキシメート分布間の小さな漸進的な変換の列に分解する。
この分解は、小さな流れブロックのカスケードを介して事前訓練された流れを微調整する効率的なアルゴリズムを導き、大きな利点をもたらす。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:43:51 GMT)
Towards Inference-time Scaling for Continuous Space Reasoning [55.4] 推論時間スケーリングは、大規模言語モデルにおけるテキストベースの推論に有効であることが証明されている。
本稿では,そのような確立された手法が連続空間における推論にうまく適応できるかどうかを考察する。
本研究では,ドロップアウト型サンプリングによる多種多様な推論経路の実現可能性を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:39:44 GMT)
Diffusion Models are Efficient Data Generators for Human Mesh Recovery [55.4] 生成モデルにより生成された合成データはCGレンダリングデータと相補的であることを示す。
我々はHumanWildと呼ばれる最近の拡散モデルに基づく効率的なデータ生成パイプラインを提案する。
われわれの研究は、人間の3Dリカバリを現場に拡大するための道を開くかもしれない。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:56:49 GMT)
From Language to Locomotion: Retargeting-free Humanoid Control via Motion Latent Guidance [55.3] 既存の言語誘導型ヒューマノイドパイプラインは面倒で信頼できない。
本稿では,言語を基盤とした動作潜伏者に対してヒューマノイドポリシーを規定する言語フリーフレームワークであるRoboGhostを紹介する。
我々は,RoboGhostがデプロイメントの遅延を大幅に低減し,成功率と精度を向上し,スムーズでセマンティックに整合したヒューマノイドを生成することを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:37:59 GMT)
SANR: Scene-Aware Neural Representation for Light Field Image Compression with Rate-Distortion Optimization [54.2] エンドツーエンドの速度歪みを最適化した光場画像圧縮のためのScene-Aware Neural Representationフレームワークを提案する。
シーン認識のために,SANRは階層的なシーンモデリングブロックを導入している。
実験の結果,SANRはHEVCに対する65.62%のBD節減率で,変形率に関する最先端技術よりも有意に優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:00:43 GMT)
FinTrust: A Comprehensive Benchmark of Trustworthiness Evaluation in Finance Domain [54.1] FinTrust は金融アプリケーションにおける LLM の信頼性を評価するためのベンチマークである。
o4-miniのようなプロプライエタリなモデルは、安全性など、ほとんどのタスクでパフォーマンスに優れています。
DeepSeek-V3のようなオープンソースモデルは、業界レベルの公正さのような特定の分野に利点がある。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:45:49 GMT)
RAG vs. GraphRAG: A Systematic Evaluation and Key Insights [53.8] 我々は,テキストベースベンチマークを用いて,検索型拡張生成(RAG)とグラフRAGを体系的に評価する。
本結果は,RAGとGraphRAGの異なる課題と評価の観点から,それぞれ異なる強みを浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:58:11 GMT)
UniMamba: Unified Spatial-Channel Representation Learning with Group-Efficient Mamba for LiDAR-based 3D Object Detection [53.8] LiDAR 3D検出の最近の進歩は、ポイントクラウド空間からグローバルな依存関係をキャプチャするTransformerベースのフレームワークの有効性を示している。
トランスフォーマーのかなりの数の3Dボクセルと二次的な複雑さのため、トランスフォーマーに供給する前に複数のシーケンスがグループ化され、受容野が制限される。
2次元視覚タスクの分野で達成された状態空間モデル(SSM)の印象的な性能に触発されて、我々は新しい統一マンバ(UniMamba)を提案する。
特に、UniMambaブロックは、主にローカリティモデリング、Zオーダーシリアライゼーション、局所グローバルシーケンシャルアグリゲータで構成されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:54:59 GMT)
Chronos-2: From Univariate to Universal Forecasting [52.8] Chronos-2は、一変量、多変量、共変量による予測タスクをゼロショットで処理できる事前訓練されたモデルである。
fev-bench、GIFT-Eval、Chronos Benchmark IIの3つの総合ベンチマークで最先端のパフォーマンスを提供する。
Chronos-2のコンテキスト内学習能力は、現実世界の予測パイプラインで"as is"として使用できる汎用予測モデルとして確立されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:00:53 GMT)
SIRI-Bench: Challenging VLMs' Spatial Intelligence through Complex Reasoning Tasks [51.8] SIRI-Benchは視覚言語モデルの構造的空間知性を評価するためのベンチマークである。
Benchは9000の動画検索用三脚で構成されており、各問題はリアルな3Dシーンに埋め込まれている。
実験結果から,最先端のVLMはSIRI-Benchでかなり苦労し,構造的空間推論の課題を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:36:30 GMT)
Paper2Web: Let's Make Your Paper Alive! [51.8] 学術Webページ生成を評価するためのベンチマークデータセットとフレームワークであるPaper2Webを紹介する。
PWAgentは、科学論文をインタラクティブでマルチメディアに富んだ学術ホームページに変換する自律パイプラインである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:35:58 GMT)
Scope: Selective Cross-modal Orchestration of Visual Perception Experts [51.3] SCOPEはMixture-of-Encodersフレームワークで、インスタンスレベルのルーティングを通じて画像テキストペアごとに1つの特別なエンコーダを動的に選択する。
軽量ルータは、テキストプロンプトと共有視覚特徴間の相互アテンションを使用して、ルーティングされたエンコーダから最適なエンコーダを選択する。
注目すべきは、共有された1つプラス1つのルーティングエンコーダを持つSCOPEは、4つの余分なエンコーダを同時に使用し、計算量を24-49%削減する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:30:31 GMT)
Bidirectional Representations Augmented Autoregressive Biological Sequence Generation:Application in De Novo Peptide Sequencing [51.1] 自己回帰(AR)モデルは、全体的な双方向表現を提供するが、生成的コヒーレンスとスケーラビリティに関する課題に直面している。
非自己回帰機構からリッチなコンテキスト情報を動的に統合することにより、AR生成を向上するハイブリッドフレームワークを提案する。
新しいクロスデコーダアテンションモジュールにより、ARデコーダは、これらの双方向機能を反復的にクエリし、統合することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:38:43 GMT)
DPTrack:Directional Kernel-Guided Prompt Learning for Robust Nighttime Aerial Tracking [51.0] DPTrackは夜間シナリオのためのプロンプトベースの空中追跡装置である。
与えられたオブジェクトの属性機能を指向カーネルにエンコードする。
カーネル誘導プロンプトモジュールは、検索領域の特徴を越えてカーネルを伝搬する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:07:19 GMT)
Semi-Supervised Regression with Heteroscedastic Pseudo-Labels [50.5] 両レベル最適化の観点から,疑似ラベルの影響を動的に調整する不確実性認識型擬似ラベル化フレームワークを提案する。
我々は、様々なベンチマークSSRデータセットにまたがって、我々のアプローチを検証するための理論的洞察と広範な実験を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:06:23 GMT)
Robust Layerwise Scaling Rules by Proper Weight Decay Tuning [50.1] 現代のスケール不変アーキテクチャでは、トレーニングは急速に劣化したグラデーション状態に入る。
我々は,AdamWに対して,幅をまたいだサブ層ゲインを保ったウェイトデカイスケーリングルールを導入する。
この結果は,パラメータが設定した定常スケールを明示的に制御することにより,ほぼ入出力体制を超えて$mu$Pを拡大する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:58:35 GMT)
All Roads Lead to Likelihood: The Value of Reinforcement Learning in Fine-Tuning [49.4] 基礎モデルファインチューニング(FT)における最強の結果は,比較的複雑な2段階の訓練手順によって達成されることを示す。
具体的には、オンラインフィードバックを提供するために使用する前に、まず、あるデータセット(例えば、人間の好み)に報酬モデル(RM)をトレーニングする。
生成検証ギャップの問題に対して、比較的単純なRMを選好データから学習することは比較的容易である、という説明を最も支持している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:56:28 GMT)
PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification [49.4] 位相振幅デカップリング(PAD)は、位相(モダリティ共有)と振幅(モダリティ補完)を分離する周波数対応のフレームワークである。
この研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:18:59 GMT)
EmoSphere-SER: Enhancing Speech Emotion Recognition Through Spherical Representation with Auxiliary Classification [49.1] EmoSphere-SERは球面VAD領域の分類を統合してVAD回帰を導出するジョイントモデルである。
本フレームワークでは,VAD値を複数の球面領域に分割した球面座標に変換し,各点がどの球面領域に属しているかを予測する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:34:55 GMT)
DiEmo-TTS: Disentangled Emotion Representations via Self-Supervised Distillation for Cross-Speaker Emotion Transfer in Text-to-Speech [49.1] 音声合成における話者間感情伝達は、正確な感情モデリングのための話者非依存感情埋め込みの抽出に依存する。
本研究では,感情情報の損失を最小限に抑え,話者のアイデンティティを保持する自己教師型蒸留法であるDiEmo-TTSを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:32:30 GMT)
3D Weakly Supervised Semantic Segmentation via Class-Aware and Geometry-Guided Pseudo-Label Refinement [49.1] 3D弱教師付きセマンティックセマンティックセマンティクスは、スパースデータや低コストデータを活用することでセマンティクスセマンティクスセマンティクスを実現することを目的としている。
それまでの作業では、主にクラスアクティベーションマップや事前訓練された視覚言語モデルを使用してこの問題に対処していた。
本稿では,3次元幾何学的先行概念をクラス認識誘導機構に統合した,シンプルで効果的な3次元教師付きセマンティックセマンティックセマンティックセマンティクス法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:53:43 GMT)
Beyond-Diagonal RIS Under Non-Idealities: Learning-Based Architecture Discovery and Optimization [48.1] 近年、電磁波の高度な制御を可能にするために、対角線外再構成可能なインテリジェントサーフェス(BD-RIS)が導入されている。
BD-RISの設計と展開において大きな問題は、その性能と回路の複雑さのトレードオフである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:46:08 GMT)
Efficient Quantum State Preparation with Bucket Brigade QRAM [47.7] 量子状態におけるデータの合成は、量子アルゴリズムの設計において重要な要素である。
効率的な状態準備を実現するための主要なアプローチの1つは、量子ランダムアクセスメモリ(QRAM)を使用することである。
本稿では,Bucket Brigade QRAM(BBQRAM)の物理モデルとSegment Treeの古典的データ構造を統合し,効率的な状態生成を実現するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:50:07 GMT)
Deep Learning Based Domain Adaptation Methods in Remote Sensing: A Comprehensive Survey [47.5] ドメイン適応は、ソースドメインから異なる分散ターゲットドメインに知識を転送することを目的としています。
ディープラーニングは、機能表現とドメイン間の知識伝達のための強力なツールとして登場した。
本稿では,重要な概念,数学的表記法,方法論の分類を解明するための予備知識を紹介する。
次に、タスク分類、入力モード、監督、パラダイム、アルゴリズムの粒度など、既存のアルゴリズムを複数の視点から整理する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:00:44 GMT)
GRank: Towards Target-Aware and Streamlined Industrial Retrieval with a Generate-Rank Framework [47.3] 産業規模のレコメンデータシステムはカスケードパイプラインに依存しており、検索段階では何十億ものアイテムから設定されたハイリコール候補を厳格なレイテンシで返さなければならない。
本稿では,ユーザ中心の検索とターゲット認識学習をシームレスに統一する新しい構造化インデックスフリー検索パラダイムであるGRankを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:15:09 GMT)
HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination [46.9] 有限仮説集合のサンプルとして LLM を扱う診断スイートである hypoSpace を紹介する。
我々は、決定論的検証器と正確に列挙された仮説空間を持つ3つの構造化された領域において、HypoSpaceをインスタンス化する。
命令調整と推論に焦点を当てたモデル全体では、検証性はしばしば高く保たれ、ユニキネスとリカバリは許容空間が大きくなるにつれて劣化する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:00:32 GMT)
Taming the Judge: Deconflicting AI Feedback for Stable Reinforcement Learning [46.7] 本稿では,強化学習訓練過程における不整合の検出と解決を目的とした包括的枠組みを提案する。
我々のフレームワークには2つの主要なコントリビューションが含まれている: 第一に、判定競合を定量化する新しい指標である衝突検出率(CDR)、第二に、政策最適化前のサイクルを除去して信号を浄化するフレームワークであるDeconflicted Graph Rewards(DGR)である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:34:59 GMT)
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation [46.4] 光胸腺撮影と心電図は、連続血圧モニタリング(BP)を可能にする可能性がある。
しかし、データ品質と患者固有の要因の変化のため、正確で堅牢な機械学習(ML)モデルは依然として困難である。
本研究では,1つのモータリティで事前学習したモデルを効果的に利用して,異なる信号タイプの精度を向上させる方法について検討する。
本手法は, 拡張期BPの最先端精度を約1.5倍に向上し, 拡張期BPの精度を1.5倍に向上させる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:25:25 GMT)
AUGUSTUS: An LLM-Driven Multimodal Agent System with Contextualized User Memory [44.5] 本稿では,認知科学における人間の記憶の考え方に沿ったマルチモーダルエージェントシステムであるAUGUSTUSを紹介する。
ベクトルデータベースを使用する既存のシステムとは違って、セマンティックタグに情報を概念化し、タグをコンテキストに関連付け、グラフ構造化したマルチモーダル・コンテクストメモリに格納し、効率的な概念駆動型検索を行う。
従来のマルチモーダルRAG手法よりも,ImageNet分類では3.5倍高速であり,MSCベンチマークではMemGPTよりも優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:58:22 GMT)
A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography [44.2] そこで我々は,10個の白質トラクトグラフィー形状を予測できる新しいディープラーニングフレームワークであるTract2Shapeを提案する。
モデル効率を向上させるために,モデルの次元削減アルゴリズムを用いて5つの一次形状成分を予測した。
本研究では,HCP-YAデータセットと未確認PPMIデータセットを用いて,Tract2Shapeの性能評価を行った。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:42:53 GMT)
Layer as Puzzle Pieces: Compressing Large Language Models through Layer Concatenation [43.8] 大きな言語モデルは自然言語処理タスクで優れていますが、その巨大なサイズは高い計算量とストレージ要求をもたらします。
近年の研究では, 層状プルーニングによるモデルサイズ削減が試みられている。
我々は、構造化プルーニングパラダイムを再検討し、いくつかの重要な制限を明らかにした。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:27:06 GMT)
A Split-Client Approach to Second-Order Optimization [43.8] 二階法は収束の速さを約束するが、ヘッセンの計算は勾配よりもはるかに高価であるため、実際にはほとんど使われない。
本稿では,異なるクライアントによって勾配と曲率を非同期に計算するEmphsplit-clientフレームワークを提案する。
非同期曲率は常にバニラとラジ・ヘッセンのベースラインを上回り、二階精度を維持している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:58:11 GMT)
PFGS: Pose-Fused 3D Gaussian Splatting for Complete Multi-Pose Object Reconstruction [43.5] PFGSはポーズ対応の3DGSフレームワークであり、多目的画像キャプチャーから完全なオブジェクトを再構築する実践的な課題に対処する。
我々のポーズアウェア融合戦略は、グローバルとローカルの登録を組み合わせて、効果的にビューをマージする。
PFGSは定性評価と定量的評価の両方において、強いベースラインを一貫して上回る。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:36:59 GMT)
Learning What Matters: Steering Diffusion via Spectrally Anisotropic Forward Noise [43.1] Diffusion Probabilistic Models (DPM) は強力な生成性能を達成しているが、その帰納的バイアスは大半が暗黙的である。
本研究では,拡散モデルのトレーニングとサンプリングに帰納的バイアスを組み込むことにより,モデルの目的とするデータ分布をよりよく適応することを目的とする。
異方性前方共分散を周波数対角共分散に置き換えることで、これらのバイアスを形作る異方性雑音演算子を導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:04:53 GMT)
Deliberation on Priors: Trustworthy Reasoning of Large Language Models on Knowledge Graphs [42.9] 我々は、優先事項に関する審議(DP)と呼ばれる信頼できる推論フレームワークを提案する。
DPは、教師付き微調整とKahneman-Tversky最適化を組み合わせることで、構造的事前をLLM(Large Language Models)に統合する。
本フレームワークでは,LLMに対して,抽出した制約前処理に基づいて精巧な推論検証を行うための推論イントロスペクション戦略を採用している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:02:21 GMT)
Clarifying the Ti-V Phase Diagram Using First-Principles Calculations and Bayesian Learning [42.4] チタン-バナジウム(Ti-V)二元合金が体中心立方晶(BCC)の相違点を示すか、あるいは完全に可溶であるかについては、対立する実験は意見が一致しない。
先導的な仮説は、合金の調製時の酸素汚染の相違によるものである。
我々は、活発に訓練されたモーメント図と自由エネルギー表面の推測を結合するab initio + machine-learningワークフローを使用する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:11:33 GMT)
Vision-Centric Activation and Coordination for Multimodal Large Language Models [42.3] マルチモーダルな大言語モデル(MLLM)は、視覚エンコーダからLLMへのイメージ機能を統合し、高度な理解能力を示す。
しかし、メインストリームMLLMは、重要な視覚中心の情報を無視して、テキストトークンの次のトークン予測によってのみ監督される。
本稿では,ビジョン中心のアクティベーションとコーディネーションによってMLLM表現を最適化するVaCoを紹介する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:32:19 GMT)
POPI: Personalizing LLMs via Optimized Natural Language Preference Inference [42.3] POPIは、不均一なユーザ信号を簡潔な自然言語要約に変換するための選好推論モデルを導入する一般的なフレームワークである。
これらの要約は、パーソナライズされた応答を生成するために共有生成モデルを必要とする透明でコンパクトで、転送可能なパーソナライズ表現として機能する。
4つのパーソナライズベンチマークによる大規模な実験により、POPIはパーソナライズ精度を常に改善し、コンテキストオーバーヘッドを大きなマージンで低減することを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:07:57 GMT)
The Spark Effect: On Engineering Creative Diversity in Multi-Agent AI Systems [42.1] アート・オブ・Xはペルソナ条件のLLMエージェントを開発 -- 内部でSparksとブランド化
このホワイトペーパーは、Sparkエージェントプログラムの背後にあるフレーミング、実験的設計、および量的証拠を文書化している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:56:18 GMT)
Unimedvl: Unifying Medical Multimodal Understanding And Generation Through Observation-Knowledge-Analysis [41.9] 画像理解と生成タスクの同時解析のための医用統合マルチモーダルモデルUniMedVLを紹介する。
UniMedVLは5つの医用画像理解ベンチマークにおいて優れた性能を示し、8つの医用画像モダリティにまたがる生成品質のモデルに適合する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:54:58 GMT)
Build Your Personalized Research Group: A Multiagent Framework for Continual and Interactive Science Automation [41.7] 我々は,リアルタイムエージェント推論によって動的に決定されるテキストを特徴とするオープンソースのマルチエージェントフレームワークであるtexttfreephdlaborを提案する。
このフレームワークは、テキスト自動コンテキストのコンパクト化、情報劣化を防ぐためのテキストワークスペースベースのコミュニケーション、セッション間のテキストメモリ持続性、およびテキストノンブロッキング人間の介入メカニズムを含む包括的なインフラを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:13:32 GMT)
When to Ensemble: Identifying Token-Level Points for Stable and Fast LLM Ensembling [41.5] 本研究では,従来のアンサンブル法を長文生成に用いた場合,アンサンブル位置を慎重に選択する必要があることを示す。
我々は,これらの要因を共同で検討し,選択的にアンサンブルするフレームワークSAFE(Stable and Fast LLM Ensembling)を提案する。
MATH500 や BBH などの多種多様なベンチマーク実験により,SAFE は既存の手法よりも精度と効率が優れていることを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:18:29 GMT)
Rethinking Robustness in Machine Learning: A Posterior Agreement Approach [41.5] モデル検証の後方合意(PA)理論は、ロバストネス評価のための原則的な枠組みを提供する。
PAは、異なるシフト条件で学習アルゴリズムの脆弱性を信頼性のある分析を行う。
その結果,PAは精度に基づく尺度よりも高い差別性を提供する一方で,監督は不要であることが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:57:22 GMT)
LLMs Judge Themselves: A Game-Theoretic Framework for Human-Aligned Evaluation [41.4] 本研究は,ゲーム理論の原理が大規模言語モデル(LLM)の評価に効果的に適用できるかどうかを考察する。
そこで我々は,LLMが自己再生とピアレビューを通じて相互の出力を評価できる新しい代替案を提案する。
本フレームワークでは,ゲーム理論の投票アルゴリズムを組み込んでピアレビューを集約し,モデル生成ランキングが人間の嗜好を反映するかどうかを原則的に調査する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:34:25 GMT)
NDM: A Noise-driven Detection and Mitigation Framework against Implicit Sexual Intentions in Text-to-Image Generation [41.1] テキスト・ツー・イメージ(T2I)モデルは不適切なコンテンツを生成するのに弱い。
暗黙の性的プロンプトは、しばしば良心的な言葉に変装して、予想外の性的内容を引き起こす可能性がある。
我々は,最初のノイズ駆動型検出・緩和フレームワークであるNDMを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:37:02 GMT)
WebInject: Prompt Injection Attack to Web Agents [40.9] マルチモーダル大言語モデル(MLLM)ベースのWebエージェントは、Webページのスクリーンショットに基づいてアクションを生成することにより、Webページ環境と対話する。
本稿では,Webエージェントを誘導して攻撃者特定アクションを実行するために,Webページ環境を操作するプロンプトインジェクション攻撃であるWebInjectを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:52:39 GMT)
Planner and Executor: Collaboration between Discrete Diffusion And Autoregressive Models in Reasoning [40.7] 現在の自己回帰言語モデル(ARM)は精度が高いが、長いトークンシーケンスを必要とするため、コストがかかる。
DDLMは一定数のステップで並列かつ柔軟な生成を可能にする。
本稿では, DDLMとARMを結合したハイブリッドアーキテクチャについて検討し, 協調が相補的利益をもたらすかどうかを検証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:16:19 GMT)
Improving Inference-Time Optimisation for Vocal Effects Style Transfer with a Gaussian Prior [40.1] Style Transfer with Inference-Time optimisation (ST-ITO) は、参照音声の応用効果をオーディオトラックに転送する手法である。
パラメータ空間上のDiffVox音声プレセットデータセットから派生したガウス先行データを提案する。
結果の最適化は最大姿勢推定と等価である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:41:58 GMT)
Scaling Physical Reasoning with the PHYSICS Dataset [40.0] PHYSICSは、被験者と難易度にまたがる16,568の高品質な物理問題を含むデータセットである。
力学、電磁気学、熱力学、光学、現代物理学の5つの分野を網羅している。
また、高校から大学院レベルの物理学コースまで幅広い難易度がある。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:01:52 GMT)
Seeing Through the Brain: New Insights from Decoding Visual Stimuli with fMRI [40.0] 我々は、fMRI信号が、視覚ベースの空間や共同テキスト画像空間よりも、言語モデルのテキスト空間によく似ていることを示す。
視覚刺激再構成のためのメディア間表現として,fMRI sIgnals を構造化テキスト空間に投影するモデル PRISM を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:18:06 GMT)
The Road Less Traveled: Enhancing Exploration in LLMs via Sequential Sampling [39.7] 強化学習(RL)は,大規模言語モデル(LLM)の推論能力の向上に重要である。
提案するSESA(Sequential SAmpling framework)は,多種多様なソリューションスケッチを逐次生成し,それらを完全な推論経路に拡張する。
合成課題における実験により, 逐次サンプリングは経路の多様性や崩壊からの回復の観点から, 従来のRL法よりも一貫して優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:15:11 GMT)
Kernel Regression in Structured Non-IID Settings: Theory and Implications for Denoising Score Learning [39.3] 我々は、信号ノイズ因果構造を持つ非I.d.データに対するKRR一般化の最初の系統的研究を示す。
本研究は,スコア学習のノイズ化,一般化保証の確立,ノイズの多いデータ点のサンプリングのための原則的ガイダンスの提供に応用する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:52:40 GMT)
Learning Correlated Reward Models: Statistical Barriers and Opportunities [39.3] 本稿では,IIA仮定を避けたRUM学習における統計的・計算的課題について検討する。
ほぼ最適性能を持つ統計的・計算効率の高い推定器を考案する。
結果は、学習関連ユーティリティにおける高次嗜好データの利点を強調し、よりきめ細かい人間の嗜好のモデリングを可能にする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:31:17 GMT)
ERNet: Efficient Non-Rigid Registration Network for Point Sequences [39.2] 非剛性変形中の点雲列の登録にスケーラブルなデータ駆動方式を導入する。
一貫性のある登録を効果的に活用しながら、ノイズや部分的な入力を処理するように設計されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:25:00 GMT)
Stochastic Optimization with Random Search [39.1] ノイズの多い関数評価しかできない最適化のためのランダム検索を再検討する。
提案手法は従来考えられていたよりもスムーズな仮定の下で機能し、より強い仮定は保証の改善を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:57:46 GMT)
Detecting Adversarial Fine-tuning with Auditing Agents [39.0] 本稿では, モデル展開前に有害な微調整を検知できることを実証し, 微調整監査エージェントの概念を紹介する。
文献からの8つの強力な微調整攻撃と5つの良質な微調整モデルに対する検出手法の評価を行った。
最も有望なのは、データセットの安全性評価とコンテンツモデレーションを回避する隠蔽暗号攻撃を検出することができることだ。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:01:16 GMT)
Theoretical Refinement of CLIP by Utilizing Linear Structure of Optimal Similarity [38.5] 本稿では,CLIPなどのマルチモーダルコントラスト事前学習フレームワークにおける類似性メカニズムの強化を提案する。
現在の実装では、2つのモード間のポイントワイド相互情報(PMI)の基盤となる線形構造を十分に活用できない。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:21:31 GMT)
SARHAchat: An LLM-Based Chatbot for Sexual and Reproductive Health Counseling [38.1] 既存の会話システムは、性および生殖健康(SRH)のような敏感な医療領域でしばしば混乱する
UNC School of Nursingのこの研究は、概念実証のためのLarge Language Model(LLM)ベースのチャットボットであるSARHAchatを紹介している。
本評価は,SARHAchatが自然な会話の流れを維持しつつ,正確かつ適切な避妊カウンセリングを提供する能力を示すものである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:22:49 GMT)
Flexible Qubit Allocation of Network Resource States [37.9] フレキシブルで非自明なqubit-to-node代入を用いたグラフ状態の利用について検討する。
ネットワークリソースの状態として任意のアロケーションを持つクラスタ状態に注目する。
物理ネットワーク上の絡み合いトポロジをオーバーレイするモデリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:01:17 GMT)
Revisiting Knowledge Distillation: The Hidden Role of Dataset Size [37.7] 知識蒸留(KD)は、教師モデルから学生モデルの訓練を記述し、ディープラーニングにおいて広く採用されている技法である。
従来の研究では、蒸留の2つの中心的な側面、すなわちモデルサイズと一般化に焦点が当てられていた。
本研究では,3次元の蒸留について検討する。
我々は、さまざまなデータセット、タスク、ニューラルネットワークに関する一連の実験を行い、蒸留の効果は保存されているだけでなく、低データ体制下で増幅されていることを実証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:40:45 GMT)
CHROME: Clothed Human Reconstruction with Occlusion-Resilience and Multiview-Consistency from a Single Image [37.2] 我々は,1つの隠蔽画像から複数視点の整合性を持つ3次元人体を再構成するための新しいパイプラインを提案する。
そして、3次元再構成モデルを用いて、隠蔽された入力と合成されたビューの両方に条件付き3次元ガウスの集合を予測する。
新規なビュー合成(最大3dbPSNR)と、挑戦的な条件下での幾何学的再構成の両方において、大幅な改善が達成されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:30:11 GMT)
Machine Learning for Climate Policy: Understanding Policy Progression in the European Green Deal [37.1] テキストとメタデータを組み込んだ165のポリシーのデータセットを提示する。
本研究では,政策の進行状況を予測し,TF-IDF,BERT,ClimateBERTなどのテキスト表現手法を比較することを目的とする。
説明可能なAIの手法を使用することで、政策用語や政党や国の表現を含むメタデータといった要因の影響が強調される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:52:03 GMT)
KITE: A Benchmark for Evaluating Korean Instruction-Following Abilities in Large Language Models [36.9] 本稿では,韓国語指導フォロータスク評価(KITE)について紹介する。
事実知識や複数選択テストに重点を置いている既存の韓国のベンチマークとは異なり、KITEは多様なオープンエンド命令フォロータスクを直接ターゲットとしている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:45:15 GMT)
Hybrid Reinforcement: When Reward Is Sparse, It's Better to Be Dense [36.7] HEROは、検証者信号と報酬モデルスコアを構造化された方法で統合する強化学習フレームワークである。
HEROはRMのみのベースラインと検証者のみのベースラインを一貫して上回り、検証可能なタスクと検証しにくいタスクの両方で大きな利益を上げている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:03:41 GMT)
ReasonIF: Large Reasoning Models Fail to Follow Instructions During Reasoning [36.5] 本稿では、以下の推論命令を評価するためのベンチマークであるReasonIFを紹介する。
オープンソース LRM における命令順守の推論にはかなりの失敗がある。
推論命令の忠実度を高めるための2つの戦略を探求する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:38:28 GMT)
DSSmoothing: Toward Certified Dataset Ownership Verification for Pre-trained Language Models via Dual-Space Smoothing [36.4] 既存のデータセットのオーナシップ検証手法は、推論中に透かしが安定していると仮定する。
2次元空間の平滑化に基づく PLM のための最初の認証済みデータセットのオーナシップ検証手法を提案する。
DSSmoothingは安定かつ信頼性の高い検証性能を実現し、潜在的適応攻撃に対する堅牢性を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:25:32 GMT)
DocMMIR: A Framework for Document Multi-modal Information Retrieval [35.4] 本稿では,新しいマルチモーダル文書検索フレームワークDocMMIRを紹介する。
450Kサンプルからなる大規模クロスドメインマルチモーダルベンチマークを構築した。
その結果、ゼロショットベースラインに比べてMRR@10は+31%改善した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:30:22 GMT)
ACON: Optimizing Context Compression for Long-horizon LLM Agents [35.4] 大規模言語モデル(LLM)は、動的で現実世界の環境においてエージェントとしてますます多くデプロイされている。
エージェントコンテキスト最適化(ACON)は、環境観測と相互作用履歴の両方を簡潔な凝縮に最適に圧縮する。
ACONは、メモリ使用量を26~54%削減し、タスク性能を保ちながら、より小さな圧縮機に蒸留すると95%以上の精度を維持する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:48:23 GMT)
Code Execution as Grounded Supervision for LLM Reasoning [35.3] チェーン・オブ・ソート(CoT)による大規模言語モデルのトレーニングは,推論能力の向上に有効であることが証明されている。
本稿では,プログラム実行の決定性を利用して,高品質なCoT監視データセットを生成するスケーラブルな手法を提案する。
提案手法では,コード実行から検証可能なステップバイステップの推論トレースを抽出し,それを自然言語のCoT推論に変換する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:50:09 GMT)
A Framework for Rapidly Developing and Deploying Protection Against Large Language Model Attacks [35.2] 大規模言語モデル(LLM)はAIデプロイメントに革命をもたらし、業界全体で自律的および半自律的なアプリケーションを可能にする。
LLMに対するゼロデイアタックや新規アタックは、既知のアプローチでは防げない。
これにより、AI保護システムは、確立されたマルウェア保護システムに似たカテゴリに置かれる。
本稿では,マルウェア検出と脅威知能の確立に根ざした,生産レベルの防衛システムを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:13:18 GMT)
iLRM: An Iterative Large 3D Reconstruction Model [34.7] 本稿では,反復的改良機構を用いて3次元ガウス表現を生成する反復的大規模3次元再構成モデル(iLRM)を提案する。
RE10KやDL3DVといった広く使われているデータセットの実験結果から、iLRMは復元品質と速度の両方で既存の手法より優れていることが示されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:41:00 GMT)
Deep Edge Filter: Return of the Human-Crafted Layer in Deep Learning [34.6] 我々は、モデル一般化性を改善するために、ディープニューラルネットワーク機能にハイパスフィルタを適用する新しいアプローチであるディープエッジフィルタを導入する。
Vision、Text、3D、Audioといったさまざまなドメインにわたる実験結果は、一貫したパフォーマンス改善を示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:10:17 GMT)
Experience-Driven Exploration for Efficient API-Free AI Agents [34.4] KG-Agentは、エージェントの生のピクセルレベルのインタラクションを永続的なState-Action Knowledge Graphに構造化する、経験駆動学習フレームワークである。
KG-Agentは、機能的に類似しているが視覚的に異なるGUI状態をリンクすることで、非効率な探索を克服する。
我々は,最先端手法よりも探索効率と戦略深度が大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:53:06 GMT)
LeMat-Traj: A Scalable and Unified Dataset of Materials Trajectories for Atomistic Modeling [34.3] 大規模リポジトリから集約された1億2000万以上の原子構成からなるキュレートデータセットであるLeMat-Trajを紹介した。
LeMat-Trajはデータ表現を標準化し、結果とフィルタを調和させ、広く使われているDFT機能にまたがる高品質な構成を実現する。
LeMaterial-Fetcherは、新しいデータソースを容易に組み込むために、コミュニティに再現可能なフレームワークを提供するために設計された、モジュラーでオープンソースのライブラリである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:10:50 GMT)
MCA: Modality Composition Awareness for Robust Composed Multimodal Retrieval [34.2] MLLM(Multimodal large language model)は、入力を直接処理する統一エンコーダである。
フレキシブルで高度な一方で、従来のコントラスト学習で訓練された統一エンコーダは、モダリティのショートカットを学習しがちである。
この問題を軽減するためのモダリティ構成意識フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:20:35 GMT)
InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models [34.2] 本稿では、連続的な事前学習と教師付き微調整をシームレスに統合するエンドツーエンドのFP8トレーニングレシピを提案する。
我々は,FP8をBF16の実用的で堅牢な代替品として確立し,大規模モデルトレーニングをさらに民主化するためのコードをリリースする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:54:44 GMT)
PIShield: Detecting Prompt Injection Attacks via Intrinsic LLM Features [34.0] 既存のプロンプトインジェクション検出法は、しばしば準最適性能および/または高い計算オーバーヘッドを持つ。
本稿では,有効かつ効率的に検出できるPIShieldを提案する。
PIShieldは高効率かつ効率的であり,既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:30:15 GMT)
Perception Before Reasoning: Two-Stage Reinforcement Learning for Visual Reasoning in Vision-Language Models [33.8] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を引き出すのに非常に有効であることが証明されている。
視覚言語モデル(VLM)の知覚能力と推論能力を両立させる2段階強化学習フレームワークを提案する。
提案した2段階強化学習プロセスの後,視覚言語モデルであるPeBR-R1を得た。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:09:35 GMT)
Low-Frequency First: Eliminating Floating Artifacts in 3D Gaussian Splatting [33.7] 3D Gaussian Splatting (3DGS)は、3D再構成のための強力な表現である。
3DGSはフローティングアーティファクトをしばしば生成し、これは実際の幾何学から切り離された誤った構造である。
最適化されていないガウスを選択的に拡張し、高精度な低周波学習を優先するEFA-GSを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:12:52 GMT)
Facts in Stats: Impacts of Pretraining Diversity on Language Model Generalization [33.6] 本稿では,ジェネリックトークンの統計ストリームと,ソースとターゲットのトークンペアの抽象的な事実ストリームを組み合わせたフレキシブルな合成テストベッドを提案する。
文脈的多様性の増大は分布内分布(ID)の精度を低下させるが、分布外分布(OOD)の一般化に対する影響は文脈的構造に大きく依存する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:58:01 GMT)
Optimization of the quantization of dense neural networks from an exact QUBO formulation [33.0] 本研究は,新しいROUNDベースのQUBO定式化による高密度ニューラルネットワークのためのポストトレーニング量子化(PTQ)手法を提案する。
MNIST, FashionMNIST, EMNIST, CIFAR-108 を int から int1 への整数精度で評価し, 従来手法と比較した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:57:28 GMT)
Expert Merging in Sparse Mixture of Experts with Nash Bargaining [33.0] NAMEx(Nash Merging of Experts)は,Bargaining Nashをマージプロセスに組み込んだ,新たなフレームワークである。
NAMExは競合するMoEアーキテクチャとシームレスに統合しながら、競合する手法よりも一貫して優れていることを示す。
Qwen1.5-MoE (14B) や DeepSeek-MoE (16B) といった大規模システムに適用することで NAMEx のスケーラビリティを実証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:23:01 GMT)
Reflections from Research Roundtables at the Conference on Health, Inference, and Learning (CHIL) 2025 [32.7] 第6回保健・推論・学習年次会議(CHIL 2025)は2025年6月25日から27日にかけてアメリカ合衆国カリフォルニア州バークレーのカリフォルニア大学バークレー校で開催された。
今年のプログラムの一環として、私たちはResearch Roundtablesを開催し、機械学習とヘルスケアの交差点で重要な、タイムリーなトピックに関する、共同で小さなグループの対話を触媒しました。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:54:03 GMT)
BSGS: Bi-stage 3D Gaussian Splatting for Camera Motion Deblurring [32.5] Bi-Stage 3D Gaussian Splattingは、モーションブルー画像から3Dシーンを再構築する新しいフレームワークである。
両段階を最適化するためのサブフレーム勾配集約戦略を提案する。
提案手法の有効性を検証し,その有効性を示す実験を行った。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:55:20 GMT)
Self-supervised Multi-future Occupancy Forecasting for Autonomous Driving [32.0] LiDARで生成された占有グリッドマップ(L-OGM)は、シーン表現のための頑丈な鳥眼ビューを提供する。
提案するフレームワークであるLOPR(Latent Occupancy Prediction)は、生成アーキテクチャの潜在空間においてL-OGM予測を行う。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:39:40 GMT)
A Theoretical Study on Bridging Internal Probability and Self-Consistency for LLM Reasoning [31.9] サンプリングに基づくテスト時間スケーリング手法を解析するための最初の理論的枠組みを提供する。
RPCは2つの重要なコンポーネント、パープレキシティ・一貫性と推論・プルーニングを通じて、理論的な洞察を活用するハイブリッド手法です。
RPCは、信頼性を向上するだけでなく、サンプリングコストを50%削減しながら、自己整合性に匹敵する推論性能を達成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:59:30 GMT)
Beyond Final Code: A Process-Oriented Error Analysis of Software Development Agents in Real-World GitHub Scenarios [31.7] 問題解決フェーズにおけるPythonの実行エラーは、低解像度率と推論オーバーヘッドの増加と相関している。
私たちは、ModuleNotFoundErrorやTypeErrorのような最も一般的なエラーを特定し、OSErrorやデータベース関連の問題のような特に困難なエラーを強調しました。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:33:23 GMT)
Learning to Interpret Weight Differences in Language Models [31.7] Diff Interpretation Tuning (DIT) は、モデルにファインタニングによって引き起こされる修正を記述することを訓練する手法である。
提案手法は, 提案手法を用いて, 精度の高い自然言語記述を用いて, 微調整による修正を記述できることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:55:19 GMT)
LinEAS: End-to-end Learning of Activation Steering with a Distributional Loss [31.7] リニアエンドツーエンドアクティベーションステアリング(LinEAS)
本稿では,全層分布シフトを同時に考慮したグローバル損失の学習手法を提案する。
LinEASはモダリティに非依存であり、既存のアクティベーションステアリング手法よりも優れており、単一ステップのテキスト・画像生成モデルの出力に新しい概念を含むことを実証的に見出した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:58:22 GMT)
How to Sell High-Dimensional Data Optimally [31.7] 意思決定バイヤーと独占販売者を含む情報価格の問題を考える。
買い手は、国家のより正確な評価によるより良い判断により、より大きな実用性を得るので、売り手は、価格で補足情報を約束することができる。
本稿では,状態空間へのアクセスのみをサンプリングするアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:49:03 GMT)
Decoding Listeners Identity: Person Identification from EEG Signals Using a Lightweight Spiking Transformer [31.7] スパイキングニューラルネットワーク(SNN)を用いた新しい脳波人物識別手法を提案する。
提案したSNNモデルは、脳波信号に固有の時間的複雑さを扱うことができる。
EEG-Music Emotion Recognition Challengeデータセットでは,10%未満のエネルギー消費で100%の分類精度を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:20:01 GMT)
Do Audio LLMs Really LISTEN, or Just Transcribe? Measuring Lexical vs. Acoustic Emotion Cues Reliance [31.6] LISTEN(Lexical vs. Acoustic Speech Test for Emotion in Narratives)は、感情理解における音響感度からの語彙依存を解消するためのベンチマークである。
6つの最先端のLALMの評価を総合して、一貫した語彙支配を観察する。
その結果、現在のLALMは「リスト」よりも「書き起こし」がほとんどであり、語彙の意味論に大きく依存し、音響的手がかりをあまり利用していないことが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:54:23 GMT)
First-order State Space Model for Lightweight Image Super-resolution [31.4] 状態空間モデル(SSM)は、NLPタスクにおいて有望であり、視覚タスクにますます適用されている。
本稿では,最初のMambaモジュールを改善するために,FSSM(First-order State Space Model)を提案する。
FSSMは5つのベンチマークデータセット上でのMambaIRの性能を改善した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:22:00 GMT)
Familiarity-Aware Evidence Compression for Retrieval-Augmented Generation [31.4] 対象モデルに慣れ親しんだ証拠を抽出する訓練不要な証拠圧縮手法であるFaviCompを提案する。
FaviCompは、複数のオープンドメインQAデータセット間で、最新のエビデンス圧縮ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:45:59 GMT)
MGE-LDM: Joint Latent Diffusion for Simultaneous Music Generation and Source Extraction [31.3] MGE-LDMは、同時音楽生成、ソース計算、クエリ駆動ソース分離のための統合潜在拡散フレームワークである。
遅延空間における条件付き塗装タスクとして分離と計算の両方を定式化することにより、任意の楽器源の柔軟でクラスに依存しない操作を支援する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:32:19 GMT)
CARDIUM: Congenital Anomaly Recognition with Diagnostic Images and Unified Medical records [31.0] 先天性心疾患(CHD)の出生前診断は、人工知能(AI)による解決策に大きな可能性を秘めている。
心臓データセットは、胎児超音波と心エコー画像と、出生前CHD検出のための母体臨床記録を統合した、初めて公開されたマルチモーダルデータセットである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:30:19 GMT)
Rethinking Convergence in Deep Learning: The Predictive-Corrective Paradigm for Anatomy-Informed Brain MRI Segmentation [30.9] 本稿では,学習を根本的に加速させるために,モデルタスクを分離するフレームワークである予測補正(PC)パラダイムを紹介する。
PCambaNetは2つの相乗的モジュールから構成される。第一に、予測優先モジュール(PPM)は計算コストの低い粗い近似を生成する。
次に、Corrective Residual Network (CRN)は、残差エラーをモデル化することを学び、ネットワークのフル容量をこれらの課題領域の精製に集中させる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:51:33 GMT)
MARS: Reinforcing Multi-Agent Reasoning of LLMs through Self-Play in Strategic Games [30.9] 我々は、協調ゲームと競争ゲームの両方において、セルフプレイを通じてLLMのマルチエージェント推論を動機付けるエンドツーエンドのRLフレームワークであるMARSを紹介する。
LLMにおける汎用マルチエージェント推論機能を開発するための強力なアプローチとして,戦略ゲームにおけるセルフプレイによるエンドツーエンドのRLトレーニングを確立した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:08:06 GMT)
SEGA: A Stepwise Evolution Paradigm for Content-Aware Layout Generation with Design Prior [30.8] コンテンツ対応レイアウト生成のためのステップワイド進化パラダイムSEGAを紹介する。
人間の思考の体系的なモードにインスパイアされたSEGAは、粗大な戦略を持つ階層的推論フレームワークを採用している。
我々は、豊富なメタ情報アノテーションを備えた新しい大規模ポスターデータセットであるGenPoster-100Kを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:36:26 GMT)
HarmRLVR: Weaponizing Verifiable Rewards for Harmful LLM Alignment [30.7] HarmRLVRは、RLVRのアライメント可逆性リスクに関する最初の体系的な研究である。
安全アライメントは、応答のない64個の有害なプロンプトでGRPOを用いて迅速に逆転できることを示す。
この結果から,RLVRは有害なアライメントのために効率的に利用でき,オープンソースのモデル安全性に深刻な脅威をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:13:44 GMT)
Hyperbolic Structured Classification for Robust Single Positive Multi-label Learning [30.5] Single Positive Multi-Label Learning (SPMLL)は、各トレーニングサンプルが1つの正のラベルでアノテートされるという、難しいシナリオに対処する。
本稿では,各ラベルを点やベクトルではなく,双曲球として表現する最初の双曲分類フレームワークを提案する。
球型アプローチは自然に複数の関係型を同時にキャプチャする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:06:38 GMT)
GuideFlow3D: Optimization-Guided Rectified Flow For Appearance Transfer [30.0] 本稿では3Dアセットに外観を移すためのユニバーサルガイダンスにインスパイアされた原則的アプローチを提案する。
提案手法は, テクスチャと幾何学的詳細を入力3Dアセットに伝達し, 質的, 定量的にベースラインを上回る。
そこで我々は,GPTに基づくシステムを用いて,出力を客観的にランク付けし,ロバストで人間的な評価を確実にする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:22:04 GMT)
LEME: Open Large Language Models for Ophthalmology with Advanced Reasoning and Clinical Validation [29.9] 我々は、Language Enhanced Model for Eye (LEME)と呼ばれる、眼科専門のオープンソースLSMを導入する。
LEMEは当初、Llama2 70Bフレームワークで事前訓練され、さらに127,000個の非コピーライトの訓練インスタンスで微調整された。
GPT-3.5, GPT-4, 3台のLlama2モデル(7B, 13B, 70B), PMC-LLAMA 13B, Meditron 70B, EYE-Llamaに対してLEMEをベンチマークした。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:50:50 GMT)
State Your Intention to Steer Your Attention: An AI Assistant for Intentional Digital Living [29.7] 本稿では,ユーザの意図を取り入れた新しいAIアシスタントを導入し,その意図に沿う活動が進行しているかどうかを評価し,逸脱が発生した場合の穏やかな痛手を提供する。
このシステムは、大きな言語モデルを利用してスクリーンショット、アプリケーションタイトル、URLを分析し、動作が指示された目標から外れたときに通知を発する。
その結果、我々のAIアシスタントは、ユーザーの焦点維持とデジタル行動と意図の整合性を効果的に支援していることがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:53:09 GMT)
GaSLight: Gaussian Splats for Spatially-Varying Lighting in HDR [29.6] GaSLightは、通常の画像から空間的に変化する光を生成する方法である。
ガウススプレートを用いて3次元照明をモデル化し,空間変動照明を実現する。
我々の手法はHDR推定の最先端結果をもたらす。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:51:15 GMT)
Robust High-Resolution Multi-Organ Diffusion MRI Using Synthetic-Data-Tuned Prompt Learning [29.6] 本稿では,物理インフォームドモデリングと合成データ駆動型即時学習による課題を克服するリコンストラクションフレームワークLoSP-Promptを紹介する。
ショット間位相の変動を高次局所平滑位相(LoSP)としてモデル化し,低ランクハンケル行列再構成に組み込んだ。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:51:35 GMT)
When Seeing Is not Enough: Revealing the Limits of Active Reasoning in MLLMs [29.2] MLLM(Multimodal large language model)は、幅広いベンチマークで強力な機能を示している。
既存の評価のほとんどは受動的推論に重点を置いており、モデルが完全な情報の下でステップバイステップの推論を行う。
MLLMは不完全な情報の下で行方不明の証拠を積極的に取得できるのか?
我々はMLLMに、タスク固有の事前情報のない候補プールから目標画像を選択することにより、欠落した証拠を積極的に取得し、不完全な情報の下で決定を反復的に洗練するよう要求する。
20個の優れたMLLMを評価したところ、アクティブな推論ラグがパッシブな設定ではるかに遅れていることが分かり、かなりの余地があることが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:17:27 GMT)
CORE: Reducing UI Exposure in Mobile Agents via Collaboration Between Cloud and Local LLMs [29.0] モバイルエージェントは、スマートフォンユーザインタフェース(UI)上でタスクを計画し実行するために、LLM(Large Language Models)に依存している。
我々は,クラウドとローカルLLMの強みを組み合わせた$textbfCO$llaborativeフレームワークである$textbfCOREを提案する。
COREはUI露出を最大55.6%削減し、タスク成功率はクラウドのみのエージェントよりわずかに低い。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:11:05 GMT)
RIFLE: Removal of Image Flicker-Banding via Latent Diffusion Enhancement [29.0] FB(Flicker-banding)は、カメラのローリングシャッター読み出しとディスプレイの明るさ変調との間の時間的エイリアスから生じる明るさ%u2013darkストライプを交互に変化させる。
我々は、FB除去を専用修復タスクとして定式化し、遅延拡散拡張(RIFLE)による画像フリッカバンディングの除去を導入する。
我々の知る限りでは、FBのシミュレーションと除去の研究は初めてである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:59:38 GMT)
VocalBench-DF: A Benchmark for Evaluating Speech LLM Robustness to Disfluency [29.0] 音声-LLMは、多くのアプリケーションにおいて強い性能を示すが、その頑健性は、特に音声の拡散に対して、非常に低テストである。
本研究では,現在音声障害を抱えているユーザとの対話において,現在の音声LLMが性能を維持することができるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:01:41 GMT)
FACE: A General Framework for Mapping Collaborative Filtering Embeddings into LLM Tokens [29.0] 大規模言語モデル(LLM)は、協調フィルタリング(CF)ベースのレコメンデーションシステムと統合するために研究されている。
重要な課題は、LCMがCFアプローチが生み出す非セマンティックな埋め込みを解釈するのに苦労していることである。
FACEはCF埋め込みを事前訓練されたLLMトークンにマッピングする一般的な解釈可能なフレームワークである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:19:54 GMT)
Effect of Reporting Mode and Clinical Experience on Radiologists' Gaze and Image Analysis Behavior in Chest Radiography [28.8] 本研究では、自由テキスト(FT)、構造化レポート(SR)、AI支援構造化レポート(AI-SR)の3つの報告モードが画像解析行動、診断精度、効率、ユーザエクスペリエンスに与える影響を評価した。
4人の初心者と4人の非初心者(放射線学者と医学生)が、カスタマイズされたビューアーとアイトラッキングシステムを用いて、セッション毎に35のベッドサイド胸部X線写真を分析した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:33:07 GMT)
Select Less, Reason More: Prioritizing Evidence Purity for Video Reasoning [28.2] 我々は、我々の中核哲学に基づく新たなエビデンス優先適応フレームワーク「Select Less, Reason More」を提案する。
我々のコアコントリビューションは、エビデンス認識強化学習(EARL)フレームワークであり、モデルがエビデンスの積極的な尋問者へと変換される。
我々のEARL学習モデルは,オープンソースビデオLLMの新たな最先端化を実現し,有効かつ高純度な視覚的エビデンス選択ポリシーを同時に学習する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:52:40 GMT)
WUGNECTIVES: Novel Entity Inferences of Language Models from Discourse Connectives [28.2] 談話接続が世界について言語モデルに情報を伝達できるかどうかを考察する。
本稿では,8,880個の刺激のデータセットであるWUGNECTIVESについて述べる。
LMをチューニングして推論動作を示すと、ほとんどの接続性において注目すべき改善が得られます。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:29:16 GMT)
Interpretable Decision-Making for End-to-End Autonomous Driving [27.8] 本稿では,自律運転における制御コマンドを最適化しながら,解釈可能性を高める手法を提案する。
本稿では,スパース・ローカライズされた特徴写像を生成することで,モデルの解釈可能性を促進する損失関数を提案する。
また,本手法は,屈折率の低減と相関し,より安全かつ高性能な駆動モデルを実現することによる解釈可能性の向上を実証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:22:35 GMT)
Neuro-Symbolic Spatial Reasoning in Segmentation [27.7] Open-Vocabulary Semantic (OVSS)は、オープンなカテゴリの集合からピクセルレベルのラベルを割り当てる。
我々はOVSSにニューロシンボリック(NeSy)空間推論を導入する。
これは、OVSSでNeSy空間推論を探索する最初の試みである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:35:34 GMT)
A Plug-and-Play Learning-based IMU Bias Factor for Robust Visual-Inertial Odometry [27.6] Inertial Prior Network (IPNet) を利用した新しいプラグアンドプレイモジュールを提案する。
IPNetは、特定のプラットフォームの動作特性を暗黙的にキャプチャすることで、IMUバイアスを推論する。
本研究では、まず、スライドウインドウアプローチを用いて生のIMUデータのみを用いてバイアスを直接推測する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:20:42 GMT)
Soundness-Aware Level: A Microscopic Signature that Predicts LLM Reasoning Potential [27.6] 検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)において強い推論をもたらす。
私たちの重要な発見は、高ポテンシャルモデルが本質的に音質に敏感であることです。
本稿では,これらの分布の分離を測定するためにJensen-Shannon Divergence を用いた顕微鏡計測法である Soundness-Aware Level (SAL) を紹介する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:52:00 GMT)
AsyncVoice Agent: Real-Time Explanation for LLM Planning and Reasoning [27.5] 非同期アーキテクチャが会話音声からストリーミングバックエンドを分離するシステムであるAsyncVoice Agentを提案する。
この設計により、ナレーションと推論が並列に実行され、ユーザーはモデルの推論プロセスを中断し、クエリし、管理することができる。
客観的ベンチマークでは、このアプローチはモノリシックなベースラインに比べて600倍以上のレイテンシを削減している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:00:08 GMT)
Imaginarium: Vision-guided High-Quality 3D Scene Layout Generation [27.1] 本稿では,視覚誘導型3次元レイアウト生成システムを提案する。
まず,2,037のシーンアセットと147の3Dシーンレイアウトを含む高品質なアセットライブラリを構築した。
次に、画像生成モデルを用いて、プロンプト表現を画像に拡張し、それを微調整してアセットライブラリと整合させる。
シーングラフと全体視覚意味論を用いてシーンレイアウトを最適化し、画像との論理的コヒーレンスとアライメントを確保する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:48:08 GMT)
A Survey and Benchmarking of Spatial-Temporal Traffic Data Imputation Models [26.9] 交通データ計算は、インテリジェント交通システムにおいて重要な前処理ステップである。
計算モデルの大幅な進歩にもかかわらず、実用的な応用のためのモデル選択と開発は依然として困難である。
本稿では,現実の交通データ損失シナリオを体系的にカタログ化した,交通データ不足パターンと計算モデルのための実践指向手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:37:32 GMT)
CLASP: General-Purpose Clothes Manipulation with Semantic Keypoints [26.8] 本稿では,CLothes mAnipulation with Semantic KeyPoints (CLASP)について述べる。
CLASPの中核となる考え方はセマンティックキーポイント(例えば ''left sleeve'' や ''right shoulder' など)である。
CLASPはセマンティックキーポイントを中間表現として使用し、ハイレベルなタスク計画と低レベルなアクション実行を接続する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:17:10 GMT)
Unleashing Scientific Reasoning for Bio-experimental Protocol Generation via Structured Component-based Reward Mechanism [26.6] SciRecipeは27の生物学的サブフィールドにまたがる12K以上の構造化プロトコルからなる大規模データセットである。
プロトコル生成をさらに改善するために,解析,構造化,表現を分離する"Sketch-and-Fill"パラダイムを提案する。
我々はThothを開発し、知識獲得から運用的推論に至る段階的な知識と行動のプロセスで訓練する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:47:50 GMT)
SP-Rank: A Dataset for Ranked Preferences with Secondary Information [26.5] SP-Rankは、ベンチマークアルゴリズムのための最初の大規模で一般公開されたデータセットであり、ランキングタスクにおいて、一階述語と二階述語の両方を活用する。
各データポイントには、個人投票(第1次信号)と、他人の投票方法のメタ予測(第2次信号)が含まれている。
我々はSP-RankをSP-Votingに対して1次投票のみを使用する従来の集計手法と比較し,その2次投票法について比較した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:26:40 GMT)
JudgeSQL: Reasoning over SQL Candidates with Weighted Consensus Tournament [26.5] 審査員は、構造化された推論と重み付けされたコンセンサストーナメント機構を通じて候補者の選択を再定義する原則的な枠組みである。
審査員は優れた判断能力と優れたクロススケール一般化とジェネレータ能力を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:46:38 GMT)
Learning to Answer from Correct Demonstrations [26.4] 質問(あるいはプロンプト)に対する回答(あるいは完了)を生成するための学習の課題について,複数の正しい回答が存在する可能性について検討する。
我々は,この問題を文脈的包帯におけるオフライン模倣学習として定式化し,いくつかの最適推定から実演する。
私たちの仕事は、正しいデモから学ぶとき、可能性以上のものを探します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:20:17 GMT)
BASIL: Bayesian Assessment of Sycophancy in LLMs [26.3] Sycophancyは、人間とAIのコラボレーションの文脈で理解するために重要である。
既存のLLMにおけるサイコファンシーの研究方法は、記述的(サイコファンシーが誘発されたときの学習行動の変化)または規範的である。
LLMの合理性に対する梅毒の規範的影響を研究するためのベイズ的枠組みを導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:24:25 GMT)
Enhancing Generalization and Scalability for Multi-Objective Optimization with Population Pre-Training [26.2] 多目的最適化問題(MOP)は、競合する目的の同時最適化を必要とする。
本稿では,過去の最適化知識を活用して複雑なMOPを効率的に解くPopulation Pre-trained Model (PPM)を提案する。
提案手法は, 最大5000次元の下流最適化タスクに対して, トレーニングスケールの5倍, 先行作業の200倍の精度で頑健な一般化を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:30:10 GMT)
EvolveR: Self-Evolving LLM Agents through an Experience-Driven Lifecycle [26.0] 現在のLLM(Large Language Model)エージェントは、ツール使用時のパフォーマンスは高いが、自身の経験から体系的に学習する能力は欠如している。
EvolveRは、エージェントが完全なクローズドループ体験ライフサイクルを通じて自己改善できるように設計されたフレームワークである。
複雑なマルチホップ質問応答ベンチマークにおけるEvolveRの有効性を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:03:16 GMT)
MegaScale-MoE: Large-Scale Communication-Efficient Training of Mixture-of-Experts Models in Production [26.0] 本稿では,大規模混合実験(MoE)モデルの効率的なトレーニングに適した生産システムであるMegaScale-MoEについて述べる。
MegaScale-MoEは、各MoE層における注意とFFNのための通信効率の戦略をカスタマイズする。
MegaScale-MoEは1.41Mトークン/秒のトレーニングスループットを実現し、Megatron-LMと比較して1.88$timesの効率向上を実現している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:03:44 GMT)
L2RSI: Cross-view LiDAR-based Place Recognition for Large-scale Urban Scenes via Remote Sensing Imagery [25.9] 従来の3Dマップのコストと時間を要するLiDARによる位置認識の課題に対処する。
高分解能リモートセンシング画像を用いたLiDAR位置認識のための新しい手法L2RSIを提案する。
このアプローチは、地図プロキシとして容易に利用可能なオーバーヘッド画像を活用することにより、大規模ローカライズ機能を低コストで実現している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:14:06 GMT)
Flexora: Flexible Low Rank Adaptation for Large Language Models [25.9] 大規模言語モデル(LLM)は、モデルパラメータのスケールを拡大することで、人工知能の進歩を推進している。
特定の下流タスクにおけるそれらのパフォーマンスは、通常これらのタスクの知識境界によって妨げられる。
本稿では,フレキシブルな低ランク適応法 (Flexora) を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:10:06 GMT)
Element2Vec: Build Chemical Element Representation from Text for Property Prediction [25.9] 化学元素の物性データは材料設計と製造に不可欠である。
従来の手法では、他の要素の性質や関連する性質を数値解析による予測に用いているが、複雑な関係のモデル化に失敗することが多い。
近年,プロパティ推定のための言語モデルなど,高度なAIツールの探索が試みられている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:48:49 GMT)
Euclidean Distance Matrix Completion via Asymmetric Projected Gradient Descent [25.8] 本稿では,Burer-Monteiro因子化に基づく勾配型アルゴリズムの提案と解析を行う。
部分ユークリッド距離測定から点集合構成を再構成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:13:10 GMT)
DexCanvas: Bridging Human Demonstrations and Robot Learning for Dexterous Manipulation [25.8] このデータセットには、実際の人間の実演から70時間シードされた7000時間に及ぶ手-物体の相互作用が含まれている。
各エントリは、同期されたマルチビューRGB-D、MANOハンドパラメータによる高精度モキャップ、物理的に一貫した力プロファイルによるフレーム単位の接触点を組み合わせる。
私たちのリアル・トゥ・シムパイプラインは、物理シミュレーションにおいてアクティベートされたMANOハンドを制御するポリシーをトレーニングするために強化学習を使用します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:08:14 GMT)
Hopfield-Fenchel-Young Networks: A Unified Framework for Associative Memory Retrieval [25.7] ホップフィールドネットワークのような連想記憶モデルは、メモリ容量の進歩とトランスフォーマーにおける自己注意とのつながりにより、新たな関心を集めている。
本研究では,これらのモデルをより広範なエネルギー関数群に一般化する統合フレームワークであるHopfield-Fenchel-Youngネットワークを導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:06:10 GMT)
MLFM: Multi-Layered Feature Maps for Richer Language Understanding in Zero-Shot Semantic Navigation [25.6] LangNavはオープンソースのマルチオブジェクトナビゲーションデータセットで、自然言語のゴール記述がある。
MLFMは、事前訓練された視覚言語機能からクエリ可能な多層セマンティックマップを構築する。
LangNavの実験では、MLFMは最先端のゼロショットマッピングベースのナビゲーションベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:58:38 GMT)
FedPURIN: Programmed Update and Reduced INformation for Sparse Personalized Federated Learning [25.6] プログラム更新と還元情報を用いたフェデレーション学習(FedPURIN)を提案する。
FedPURINは整数プログラミングの定式化を通じて送信する重要なパラメータを戦略的に識別する。
スパースアグリゲーション・スキームに統合され、有効性を保ちながら通信の大幅な削減を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:54:43 GMT)
MOBODY: Model Based Off-Dynamics Offline Reinforcement Learning [25.5] オフラインソースと限られたターゲットデータセットからポリシーを学習することを目的として、オフライン強化学習をオフラインで研究する。
学習対象の動的遷移を用いたポリシーを最適化するモデルベースオフダイナミックスオフラインRLアルゴリズムMOBODYを提案する。
我々はMOBODYを幅広い MuJoCo および Adroit ベンチマークで評価し、最先端のオフダイナミックス RL ベースラインよりも優れていることを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:06:39 GMT)
CoDS: Enhancing Collaborative Perception in Heterogeneous Scenarios via Domain Separation [25.4] 協調的知覚は、自律運転における個人の知覚を改善することが証明されている。
ほとんどのメソッドは、すべてのエージェントに対して同一のエンコーダを仮定するが、これらのモデルが現実世界のアプリケーションにデプロイされる際には正しくは保たない。
既存の手法は通常、隣接する特徴とエゴ車の特徴とを一致させるが、これはドメインギャップからのノイズに弱い。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:48:45 GMT)
ImpMIA: Leveraging Implicit Bias for Membership Inference Attack under Realistic Scenarios [25.4] 我々は、ニューラルネットワークのImplicitバイアスを利用するメンバーシップ推論攻撃であるImpMIAを紹介する。
ImpMIAはKarush-Kuhn-Tucker最適条件を用いてトレーニングサンプルを識別する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:02:31 GMT)
PRISON: Unmasking the Criminal Potential of Large Language Models [25.2] 我々は,大言語モデルの犯罪ポテンシャルを,虚偽の声明,フレームアップ,心理的操作,感情の軽視,道徳的拡張の5つの特徴にまたがって定量化する。
その結果、最先端のLLMは、誤解を招く声明や回避戦術の提案など、創発的な犯罪傾向をしばしば示している。
刑事役のモデルでは、平均44%の精度で偽装行為を認識し、犯罪行為の実行と検出の重大なミスマッチを明らかにしている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:39:10 GMT)
WEBSERV: A Browser-Server Environment for Efficient Training of Reinforcement Learning-based Web Agents at Scale [25.0] 強化学習(RL) Webエージェントの訓練と評価が注目されている。
既存の環境は、過度でノイズの多いコンテキストでポリシーモデルを圧倒します。
我々は、コンテキストとアクションの複雑さのバランスをとるサイトに依存しないブラウザ環境であるWEBSERVを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:54:33 GMT)
Rethinking Cross-lingual Gaps from a Statistical Viewpoint [24.9] 大きな言語モデル(LLM)は、ソース言語からの知識を取得し、ターゲット言語からのクエリ時にアクセス可能にすることで、ブリッジとして機能する。
これまでの研究では、言語間ギャップ(viz.)が指摘されており、クエリがソース言語にある場合と比較して、ターゲット言語で知識がクエリされた場合の精度の低下である。
対象言語における応答のばらつきが,このギャップの主な原因であると仮定する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:34:04 GMT)
FPEdit: Robust LLM Fingerprinting through Localized Parameter Editing [24.6] FPEditは、知識編集を利用してセマンティック・コヒーレントな自然言語の指紋を注入する新しいフレームワークである。
FPEditは,全パラメータの微調整とパラメータ効率の両面において,95-100%の指紋保持を実現する。
FPEditは、30GB未満のGPUメモリを使用して、LLaMA2-7Bに10個の指紋ペアを2分以内で埋め込むことができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:53:43 GMT)
The Face of Persuasion: Analyzing Bias and Generating Culture-Aware Ads [24.6] テキスト・ツー・イメージのモデルは、ビジュアル広告をカスタマイズし、特定の人口をターゲットにしている。
本研究では、異なる広告トピックの広告における人口統計バイアスと、描写された人々の性別や人種を除いて同一である広告の異なる説得度(モデルによる判断)を調査することによって、この可能性を検証した。
また、特定の国の広告をターゲットとする手法も試行している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:05:31 GMT)
PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model [24.4] PaddleOCR-VL-0.9Bはコンパクトだが強力な視覚言語モデル(VLM)である
NaViTスタイルの動的解像度ビジュアルエンコーダとERNIE-4.5-0.3B言語モデルを統合し、正確な要素認識を実現する。
この革新的なモデルは、109言語を効率的にサポートし、複雑な要素を認識するのに優れている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:12:46 GMT)
FLUKE: A Linguistically-Driven and Task-Agnostic Framework for Robustness Evaluation [24.4] FLUKEは、システムの最小限のテストデータを通じてモデルロバスト性を評価するためのフレームワークである。
FLUKEの実用性は、6つの異なるNLPタスクにまたがる細調整モデルと大規模言語モデル(LLM)の両方を評価することで実証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:07:52 GMT)
MNO: Multiscale Neural Operator for Computational Fluid Dynamics with 3D Point Cloud Data [24.2] 我々は,非構造化点雲上での計算流体力学(CFD)のための新しいアーキテクチャであるマルチスケールニューラル演算子(MNO)を紹介する。
MNOは、長距離依存のための大域的次元収縮アテンションモジュール、近隣レベルのインタラクションのための局所グラフアテンションモジュール、細かな詳細のためのマイクロポイント・アテンションモジュールの3つの尺度で明確に情報を分解する。
すべてのタスクにおいて、MNOは最先端のベースラインを一貫して上回り、予測エラーを5%から40%削減し、3D CFD問題に挑戦する際の堅牢性を向上した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:01:59 GMT)
Soft Graph Transformer for MIMO Detection [23.6] ソフトグラフ変換器(Soft Graph Transformer、SGT)は、ML(Maximum Likelihood)検出のために設計されたソフトインプット・ソフトアウトプット・ニューラルアーキテクチャである。
SGTは、シンボルと制約サブグラフ内のコンテキスト依存をエンコードするセルフアテンションと、サブグラフを横断する構造化メッセージパッシングを実行するグラフ対応のクロスアテンションを組み合わせることで、これらの制限に対処する。
実験では、SGTがほぼMLのパフォーマンスを達成し、ソフトなプリエンスを利用するレシーバシステムのためのフレキシブルで解釈可能なフレームワークを提供することを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:57:20 GMT)
CCD: Mitigating Hallucinations in Radiology MLLMs via Clinical Contrastive Decoding [23.4] マルチモーダル大規模言語モデル(MLLM)は近年,視覚認識と自然言語理解を統合することで,放射線学において顕著な進歩を遂げている。
医学的幻覚と呼ばれる臨床的に欠かせない記述をしばしば生成し、正確さと画像的アウトプットを要求される医学的応用に重大なリスクをもたらす。
我々は,タスク固有の放射線学の専門家モデルから構造化された臨床信号を統合する訓練不要かつ検索不要な推論フレームワークである臨床コントラストデコーディング(CCD)を紹介した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:59:53 GMT)
HOB: A Holistically Optimized Bidding Strategy under Heterogeneous Auction Mechanisms with Organic Traffic [23.2] 電子商取引広告プラットフォームは通常、第2価格オークション(SPA)または第1価格オークション(FPA)を通じて商業トラフィックを販売している。
自動入札システムにとって、このような傾向は重要な課題であり、多様な広告主の目的を満たすため、異種オークションチャネルをまたいだ最適な戦略を決定することである。
我々は,有機トラフィックの存在を考慮に入れた,FPAチャネル下での最適入札のための効率的なソリューションを導出する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:00:09 GMT)
CogBench: A Large Language Model Benchmark for Multilingual Speech-Based Cognitive Impairment Assessment [23.2] 音声に基づく認知障害評価のための大規模言語モデルの言語間およびサイト間一般化性を評価するための最初のベンチマークであるCagBenchを提案する。
以上の結果から,従来のディープラーニングモデルはドメイン間で変換されると大幅に劣化することがわかった。
本研究は,臨床的に有用で言語学的に堅牢な音声に基づく認知評価ツールを構築するための重要なステップを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:03:10 GMT)
On Universality of Deep Equivariant Networks [23.2] 等変ニューラルネットワークの普遍性は依然として稀である。
十分な深さまたは適切な読み出し層を追加することで、同変ネットワークはエントリワイド分離可能なシステム内で普遍性が得られることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:51:31 GMT)
InfiMed-ORBIT: Aligning LLMs on Open-Ended Complex Tasks via Rubric-Based Incremental Training [23.1] ORBITは、ハイテイクな医療対話用に特別に設計されたオープンなトレーニングフレームワークである。
解析の結果,ルーブリック駆動のRLsterは様々なシナリオで一貫した性能向上を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:51:28 GMT)
AB-UPT for Automotive and Aerospace Applications [23.0] Anchored-Branched Universal Physics Transformers (AB-UPT) は、自動車の流体力学シミュレーションを再現する強力な能力を示している。
AB-UPTのユースケースを実証的に評価した2つの新しいデータセットを追加し、高品質なデータ生成と最先端のニューラルサロゲートを組み合わせる。
AB-UPTは、単純な等方的テセルレート幾何学表現から、数秒以内の統合空力のほぼ完全な予測値を得る。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:40:35 GMT)
PackageIntel: Leveraging Large Language Models for Automated Intelligence Extraction in Package Ecosystems [22.9] PackageIntelは、悪意のあるパッケージインテリジェンスの収集、処理、検索に革命をもたらす新しいプラットフォームである。
我々は,21の異なるインテリジェンスリポジトリから生成された20,692のNPMおよびPyPIパッケージを含む包括的データベースを開発した。
PackageIntelは、SnykやOSVのような主要なデータベースよりも平均70%早く脅威を検出し、1インテリジェンスあたり0.094ドルで費用対効果で運用する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:33:48 GMT)
Multi-dimensional Data Analysis and Applications Basing on LLM Agents and Knowledge Graph Interactions [22.9] 大規模言語モデル(LLM)は、自然言語の理解と生成においてよく機能するが、構造化知識を処理する際には「ハロシン化」の問題に悩まされる。
本稿では,LLMエージェントと知識グラフの相互作用に基づく多次元データ解析手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:38:44 GMT)
Proactive Scene Decomposition and Reconstruction [22.8] 本稿では,シーンのプロアクティブな分解と再構築の新たな課題を定式化する。
我々は人間と物体の相互作用を反復的に分解し、環境を再構築する。
提案システムは動的環境における複数のタスクを効果的に統合する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:57:33 GMT)
Learning to Detect Unknown Jailbreak Attacks in Large Vision-Language Models [22.8] 攻撃特化学習からタスク特化学習へ焦点を移すことにより、未知のジェイルブレイク攻撃を正確に検出する一般的なフレームワークを提案する。
実験の結果,AUROCの未知攻撃に対する検出精度は向上し,効率は向上した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:37:45 GMT)
SentinelNet: Safeguarding Multi-Agent Collaboration Through Credit-Based Dynamic Threat Detection [22.2] 大規模言語モデル(LLM)を用いたマルチエージェントシステム(MAS)の信頼性と意思決定能力に悪質なエージェントが重大な脅威をもたらす
マルチエージェントコラボレーションにおいて,悪意ある動作を積極的に検出・緩和する,最初の分散化フレームワークであるSentinelNetを提案する。
MASベンチマークの実験では、SentinelNetは2回の討論ラウンドで100%近く、悪意のあるエージェントのほぼ完全な検出を実現し、漏洩したベースラインからシステム精度の95%を回復している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:10:35 GMT)
On the Ability of LLMs to Handle Character-Level Perturbations: How Well and How? [22.2] 本研究は, 文字レベルの頻繁な摂動に対する現代LLMの弾力性について検討する。
UCC-Injは、見えないUnicode制御文字をテキストに挿入し、LCMの誤用を防ぐ実用的な方法である。
トークン化を断片化し、信号と雑音の比を著しく下げる強い難読化にもかかわらず、多くのLLMは依然として顕著な性能を維持している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:48:25 GMT)
Text2Schema: Filling the Gap in Designing Database Table Structures based on Natural Language [22.2] データベースのバックグラウンドを持たない人は、通常、ファイルシステムやExcelデータ管理のようなツールに依存します。
データベースシステムは強力な管理能力を持っているが、ユーザーからの高度な専門知識を必要とする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:09:40 GMT)
Temporal Referential Consistency: Do LLMs Favor Sequences Over Absolute Time References? [21.9] LLM(Large Language Model)は、知識ソースの代替品である。
LLMは現実的に正確でなければならないし、時間次元にわたって一貫性を示す必要がある。
この重要な要件にもかかわらず、LLMの時間的整合性を確保する努力は依然として不十分である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:33:48 GMT)
Valeo Near-Field: a novel dataset for pedestrian intent detection [21.7] 本稿では,エゴ車両に接近する歩行者の意図を検出するための新しいデータセットを提案する。
データセットは、魚眼カメラフィード、ライダーレーザースキャン、超音波センサー読み取り、モーションキャプチャベースの3Dボディポーズを含む、同期されたマルチモーダルデータを含む。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:02:54 GMT)
Understanding Prompt Tuning and In-Context Learning via Meta-Learning [21.5] 本稿では,ベイズ的視点から最適なプロンプトの理解について論じる。
メタ学習ニューラルネットワークが事前学習分布に対してベイズ予測器としてどのように振る舞うかを示す。
また、トークンアルファベット以外の実数値ベクトル列であるソフトプレフィックスが、訓練されたネットワークや訓練されていないネットワークに対して非常に効果的なプロンプトをもたらすことも確認した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:20:56 GMT)
Explore-then-Commit for Nonstationary Linear Bandits with Latent Dynamics [21.2] 報酬が行動と潜伏状態の両方に依存する非定常バンドイット問題について検討する。
有限地平線$T$に対する探索列コミットアルゴリズムを提案する。
提案アルゴリズムは, $tildemathcalO(T2/3)$ regret を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:41:14 GMT)
BandCondiNet: Parallel Transformers-based Conditional Popular Music Generation with Multi-View Features [21.1] BandCondiNetは並列トランスフォーマーに基づく条件付きモデルであり、高品質なマルチトラックサンプルを生成する。
BandCondiNetの特殊なモジュール: 音楽構造を強化するための構造拡張アテンション(SEA)と、トラック間の調和を強化するためのクロストラックトランスフォーマー(CTT)である。
短いデータセットの客観的な結果は、BandCondiNetがフィリティと推論速度に関連する10の指標のうち9の条件付きモデルを上回っていることを示している。
長いデータセットでは、BandCondiNetが10のメトリクスすべてにわたる条件付きモデルをすべて上回っている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:11:56 GMT)
Foundation Models for Scientific Discovery: From Paradigm Enhancement to Paradigm Transition [21.1] 基礎モデル(FM)は科学研究の風景を変えつつある。
FMは単に既存の科学的方法論を強化しているだけなのか、それとも科学の実施方法を再定義しているのだろうか?
本稿では,FMが新たな科学パラダイムへの移行を触媒していることを論じる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:40:26 GMT)
GraphMind: Interactive Novelty Assessment System for Accelerating Scientific Discovery [20.9] $textbfGraphMind$は、科学論文や草案の新規性を評価するユーザを支援するために設計された、使いやすい対話型Webツールである。
$textbfGraphMind$を使えば、ユーザーは科学論文の主要構造を捉え、様々な視点から関連するアイデアを探求し、斬新さを評価することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:49:07 GMT)
Diffusion Bridge Networks Simulate Clinical-grade PET from MRI for Dementia Diagnostics [20.9] 診断品質のFDG-PET像をシミュレートするために,MRIから確率的マッピングと補助的患者情報を学ぶフレームワークSiM2Pを提案する。
SiM2Pは3群の鑑別精度を75.0%から84.7%に改善した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:42:11 GMT)
Capture, Canonicalize, Splat: Zero-Shot 3D Gaussian Avatars from Unstructured Phone Images [20.9] キャプチャー、カノニカライズ、Splat」パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的四角形アバターを生産する。
この"Capture, Canonicalize, Splat"パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的な四角形アバターを生成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:24:28 GMT)
DCMIL: A Progressive Representation Learning of Whole Slide Images for Cancer Prognosis Analysis [20.8] 本稿では、DCMIL(Dual-curriculum contrastive multi-instance learning)と呼ばれる、難易度から難易度までのプログレッシブな表現学習を提案する。
12種類のがん(5,954人、12.54万個のタイル)の実験では、DCMILが標準的なWSIベースの予後モデルより優れていることが示されている。
DCMILは、微細な予後関連領域を特定し、堅牢なインスタンスの不確実性評価を提供し、正常組織と腫瘍組織の間の形態的差異を捉えている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:24:10 GMT)
PolySkill: Learning Generalizable Skills Through Polymorphic Abstraction [20.7] 新しいフレームワークであるPolySkillを導入し、エージェントが一般化可能な構成スキルを学習できるようにする。
実験の結果,本手法はWebサイトにおけるスキルの再利用を1.7倍に改善することがわかった。
エージェントが自身の目標を特定して洗練させることで、PolySkillはエージェントのより良いカリキュラムを学ぶ能力を高める。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:56:00 GMT)
H2OFlow: Grounding Human-Object Affordances with 3D Generative Models and Dense Diffused Flows [20.6] emphH2OFlowは、3D生成モデルから生成された合成データのみを使用して、3D HOIの可利用性を学ぶ新しいフレームワークである。
現実世界のオブジェクトに効果的に一般化し、手動のアノテーションやメッシュベースの表現に依存する従来のメソッドを超える。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:30:13 GMT)
MRASfM: Multi-Camera Reconstruction and Aggregation through Structure-from-Motion in Driving Scenes [20.6] 本研究では,シーンの駆動に特化して設計されたMRASfM(Multi-camera Reconstruction and Aggregation Structure-from-Motion)フレームワークを提案する。
MRASfMは、登録プロセス中にマルチカメラシステム内の固定空間関係を利用して、カメラポーズ推定の信頼性を高める。
Bundle Adjustment (BA) において、マルチカメラセットを単一ユニットとして扱うことは、最適化変数の削減と効率の向上に役立つ。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:20:59 GMT)
H3Fusion: Helpful, Harmless, Honest Fusion of Aligned LLMs [20.1] H3フュージョン(H3Fusion)は、制御可能なドリフトとしてアライメントをモデル化する、MoE(Mixix-of-experts)ベースの融合機構である。
我々は、生成した埋め込みとアライメント埋め込みの距離を利用するという2つの目的を見出すことにより、アライメントを定式化する。
3つのベンチマークデータセットの大規模な評価は、H3Fusionが3つの面でより有用で、有害で、より正直であることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:55:14 GMT)
Geometric Mixture Models for Electrolyte Conductivity Prediction [20.1] 電解質系におけるイオン伝導率の正確な予測は、多くの科学的および技術的応用を促進するために重要である。
分子の幾何グラフ表現を組み込んで,まずCALiSolとDiffMix電解質のデータセットを再編成し,拡張する。
次に、混合系に必須だが挑戦的な性質を持つSet-SE(3)を保存した新しい幾何認識フレームワークGeoMixを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:56:15 GMT)
VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications [20.1] 実世界の環境に根ざした多目的対話型タスクのエージェントを評価するベンチマークであるVitaBenchを紹介する。
VitaBenchは、66のツールを含む、これまでで最も複雑な生命維持シミュレーション環境を持つエージェントを提示する。
総合評価の結果,最も先進的なモデルでさえ,クロスシナリオタスクにおいて30%の成功率しか達成できないことがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:04:19 GMT)
Finetune Once: Decoupling General & Domain Learning with Dynamic Boosted Annealing [19.7] 微調整プロセスの合理化を目的とした動的ブーストアニーリング(DBA)を提案する。
DBAはバニラ微調整よりも5.8%の継手性能向上を実現している。
DBA法はバニラ法と比較してGPU時間を91.0%削減できる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:51:47 GMT)
Reasoning-Enhanced Large Language Models for Molecular Property Prediction [19.6] 分子特性予測は、薬物発見と物質科学にとって不可欠である。
既存のアプローチは、限定的な解釈可能性、クロスタスクの一般化の貧弱、化学的推論能力の欠如に悩まされている。
分子特性予測に化学推論を組み込んだ多モーダル大言語モデルMPPReasonerを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:23:43 GMT)
Continual Knowledge Consolidation LORA for Domain Incremental Learning [19.4] 連続知識統合低ランク適応(CONEC-LoRA)はDIL問題に対処する。
CONEC-LoRAはタスク共有LORAとタスク固有LORAの融合によって開発されている。
このモジュールは、合成サンプルバイアス問題に対処するために、ボールジェネレータ損失と変換モジュールを統合する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:16:08 GMT)
Leveraging Learning Bias for Noisy Anomaly Detection [19.2] 本稿では、フル教師なし画像異常検出(FUIAD)の課題に対処する。
従来の方法では、異常のないトレーニングデータを仮定するが、実世界の汚染により、モデルは通常通り異常を吸収する。
モデルに固有の学習バイアスを利用する2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:08:02 GMT)
Calibrated Predictive Lower Bounds on Time-to-Unsafe-Sampling in LLMs [19.0] 我々は、生成モデルのための新しい安全対策である、時間対安全サンプリングを導入する。
安全でない出力は、よく整列されたモデルではまれであるため、事実上のサンプリング予算では観測されないことがある。
本稿では,厳密なカバレッジ保証付きプロンプトの時間とアンセーフサンプリングに基づいて,低予測境界(LPB)を構築するための新しいキャリブレーション手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:16:17 GMT)
Intent Clustering with Shared Pseudo-Labels [18.7] インテントクラスタリングのための直感的で,トレーニングのない,ラベルのない手法を提案する。
提案手法は,同一クラスタに属するテキストがより多くのラベルを共有できるという仮説に基づいている。
4つのベンチマークセットに対する評価は,本手法が最近のベースラインに匹敵する結果が得られることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:18:40 GMT)
Retro3D: A 3D-aware Template-free Method for Enhancing Retrosynthesis via Molecular Conformer Information [18.7] 再合成は、有機合成と薬物開発において重要な役割を担っている。
本稿では,3次元コンフォメータデータと空間情報を組み合わせたトランスフォーマーベースのテンプレートフリー手法を提案する。
我々のアプローチには、入力段階で3D位置データを統合するAtom-align Fusionモジュールが含まれています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:39:52 GMT)
Recurrent Natural Policy Gradient for POMDPs [18.6] 部分観測可能なマルコフ決定過程(POMDP)の解法は、強化学習(RL)における根本的な課題である。
本稿では,リカレントニューラルネットワーク(RNN)アーキテクチャを自然ポリシー勾配(NPG)法と時間差学習(TD)法に統合するナチュラルアクタ・クリティカル(NAC)アルゴリズムについて検討する。
提案手法は,関数近似への大域的最適性を実現するために,サンプル反復と複雑性のバウンドを含む,漸近的でない理論的保証を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:04:22 GMT)
DroneAudioset: An Audio Dataset for Drone-based Search and Rescue [18.5] 無人航空機(UAV)は、人間の存在を検知するための捜索・救助ミッションにますます利用されている。
ドローンをベースとした音声認識は、有望だが、マスクが人間の存在を示すという極端なエゴノイズに悩まされている。
DroneAudiosetデータセットは,23.5時間の注釈付き記録を備えた,包括的なドローンオーディションデータセットである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:33:48 GMT)
Sequence Modeling with Spectral Mean Flows [18.4] ニューラルネットワークを用いたシーケンスモデリングの鍵となる問題は、高非線形で確率的な状態ダイナミクスをどのように表現し、学習するかである。
隠れマルコフテンソル(HMM)の演算子理論的ビューに基づく新しいシーケンスモデリング手法を提案する。
生成過程は、列の空間における最大平均不一致(MMD)勾配フローとして定義される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:56:57 GMT)
ScholarEval: Research Idea Evaluation Grounded in Literature [18.3] ScholarEvalは2つの基本的な基準に基づいて研究アイデアを評価する検索強化評価フレームワークである。
ScholarEvalを評価するために、ScholarIdeasを紹介します。
以上の結果から,ScholarEvalは,ScholarIdeasのアノテートルーリックに言及される点を,すべての基線に比べてはるかに高い範囲でカバーできることが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:55:07 GMT)
FLEX: A Largescale Multimodal, Multiview Dataset for Learning Structured Representations for Fitness Action Quality Assessment [18.3] アクション品質アセスメント(AQA)は、体育トレーニングにおけるエラーを検出する大きな可能性を持っている。
既存のAQAデータセットは、シングルビューの競技スポーツとRGBビデオに限られている。
本稿では,フィットネスAQAのための大規模マルチモーダルマルチビューデータセットFLEXを紹介する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:26:07 GMT)
Cost-Aware Retrieval-Augmentation Reasoning Models with Adaptive Retrieval Depth [18.1] 本稿では,検索した文書リストの長さを動的に調整する検索拡張推論モデルを提案する。
我々は、強化学習による効率的な検索強化推論モデルの訓練のための費用対効果関数を開発する。
提案手法を7つの公開質問応答データセットで評価し,有効性を損なうことなく,高い効率性を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:04:03 GMT)
SoK: Taxonomy and Evaluation of Prompt Security in Large Language Models [17.9] 大規模言語モデル(LLM)は現実世界のアプリケーションに不可欠なものとなり、様々な分野にまたがってサービスを動かしている。
彼らの広範な展開は、特にジェイルブレイクのプロンプトを通じて、重大なセキュリティリスクを露呈している。
攻撃技術と防御技術の両方を徹底的に研究しているにもかかわらず、フィールドは断片化されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:38:54 GMT)
TranSimHub:A Unified Air-Ground Simulation Platform for Multi-Modal Perception and Decision-Making [17.9] TranSimHubは、地上共同インテリジェンスのための統合シミュレーションプラットフォームである。
TranSimHubは、RGB、ディープ、セマンティックセグメンテーションのモダリティをまたいだ同期マルチビューレンダリングを提供する。
2つのドメイン間の情報交換もサポートし、因果シーンエディタも備えている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:56:34 GMT)
The Formalism-Implementation Gap in Reinforcement Learning Research [17.9] 本稿では、強化学習研究は、エージェント能力の実証にのみ焦点を絞ることをやめるべきである、と論じる。
ベンチマークが基礎となる数学的形式にどのようにマッピングされるか、より正確にする必要がある、と氏は主張する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:35:54 GMT)
PassREfinder-FL: Privacy-Preserving Credential Stuffing Risk Prediction via Graph-Based Federated Learning for Representing Password Reuse between Websites [17.6] クレジットカードの侵入攻撃は、複数のウェブサイトでパスワードを頻繁に再利用するオンラインユーザーに大きな被害をもたらした。
本稿では,ウェブサイト間の資格侵害リスクを予測する新しいフレームワークであるPassREfinder-FLを提案する。
我々はPassREfinder-FLを22,378のウェブサイトから流出した3億3千万のアカウントの実際のデータセットで評価した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:59:24 GMT)
Self-Certifying Primal-Dual Optimization Proxies for Large-Scale Batch Economic Dispatch [17.6] 本稿では、双対性理論を利用して予測の最適性ギャップを効率的に束縛するハイブリッド解法を提案する。
大規模送信システムにおける実験により,ハイブリッド・ソルバは高いスケーラビリティを有することが示された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:45:21 GMT)
Expanding the Action Space of LLMs to Reason Beyond Language [17.2] 大規模言語モデル(LLM)は自然言語における強力な推論である。
彼らの行動は通常、語彙トークンの発行に限られる。
これは、推論と制御の義務の両方でモデルの言語をオーバーロードする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:22:31 GMT)
A Computable Measure of Suboptimality for Entropy-Regularised Variational Objectives [17.2] ベイズ以降のいくつかの手法は、エントロピー規則化された変分目的が最小化される確率分布をターゲットにしている。
この柔軟性の向上は、目標に対する明示的な非正規化密度へのアクセスを失うことにより、計算上の課題をもたらす。
我々は「漸進的不一致」と呼ばれる新たな準最適度尺度、特に明示的に計算できる「カーネル勾配不一致」を導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:51:16 GMT)
Budget Allocation for Unknown Value Functions in a Lipschitz Space [17.2] 我々は、中間モデルの空間を探索するために、最適に有界な予算を割り当てることの課題に対処する。
我々はこれを、リプシッツ空間内の未知値関数に対する一般的な予算割当問題として定式化する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:38:58 GMT)
SATA-BENCH: Select All That Apply Benchmark for Multiple Choice Questions [17.1] 大規模言語モデル(LLM)は、単一回答の複数選択タスクでますます評価される。
多くの実世界の問題は、選択肢の集合から正しい答えを識別する必要がある。
SATA-BENCHは、Select All That Apply 質問における LLM の評価のための最初の専用ベンチマークである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:12:31 GMT)
Cost Savings from Automatic Quality Assessment of Generated Images [17.1] 本稿では,一般のIQAエンジンの精度と通過率に応じてコスト削減を見積もる式を提案する。
この式は、背景塗布のユースケースに適用され、単純なAutoML溶液で得られる51.61%の大幅なコスト削減が示される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:41:03 GMT)
ReCon: Region-Controllable Data Augmentation with Rectification and Alignment for Object Detection [16.8] 生成モデルは、所望の分布に従属するサンプルを合成することによって、データ拡張のための強力なツールとして登場した。
ReConは、オブジェクト検出のための構造制御可能な生成モデルの能力を高める新しい拡張フレームワークである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:06:06 GMT)
Large Reasoning Embedding Models: Towards Next-Generation Dense Retrieval Paradigm [16.8] 本稿では、推論過程を表現学習に統合するLarge Reasoning Embedding Model(LREM)を提案する。
難解なクエリに対して、LREMはまず、元のクエリの深い理解を達成するために推論を行い、その後、検索のための推論拡張クエリ埋め込みを生成する。
この推論プロセスは、元のクエリとターゲットアイテム間のセマンティックギャップを効果的にブリッジし、検索精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:24:26 GMT)
Distractor Injection Attacks on Large Reasoning Models: Characterization and Defense [16.5] 我々は, LRM が主要な目的から無関係で複雑なタスクをプロンプトに不正に埋め込むことによって逸脱する原因となる重要な脆弱性を解析する。
現状のLEMでも高い感受性を示し, インジェクトインジェクターによりタスク精度を最大60%削減した。
本稿では, 教師付きファインタニング(SFT)と強化学習(RL)を併用した, 合成敵データを用いたトレーニングベースディフェンスを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:16:34 GMT)
Ambusher: Exploring the Security of Distributed SDN Controllers Through Protocol State Fuzzing [16.3] 我々は、分散SDNコントローラで使用されるプロトコル内の脆弱性を発見するために設計されたテストツールであるAmbusherを紹介する。
Ambusherはプロトコル状態ファズリングを利用してこれを実現し、推論された状態マシンに基づいて攻撃シナリオを体系的に見つける。
2つのキャンパスネットワークと1つのエンタプライズネットワークにまたがる実際のSD-WANデプロイメントで実施したAmbusherの評価は、6つの潜在的な脆弱性を明らかにする能力を示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:21:24 GMT)
Towards Relaxed Multimodal Inputs for Gait-based Parkinson's Disease Assessment [16.3] マルチモーダルアプローチは、様々なデータソースからの補完情報を効果的に統合することで、強力な性能を示している。
本稿では,マルチモーダル学習を多目的最適化(MOO)問題として定式化するパーキンソン評価システムを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:35:57 GMT)
Incentive-Based Federated Learning: Architectural Elements and Future Directions [16.2] フェデレーション学習は、データのプライバシを損なうことなく、協調的なモデルトレーニングを可能にすることによって、機械学習に革命をもたらすことを約束する。
しかし、実践的な適応性は、参加ジレンマのような重要な要因によって制限される。
本章では,連合学習システムにおけるインセンティブのメカニズムを設計する上での根本的な課題について述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:44:10 GMT)
Bayesian Ego-graph inference for Networked Multi-Agent Reinforcement Learning [16.2] 本稿では,ネットワーク型MARLのためのグラフベースのポリシーを提案する。
ベイズ変分法による疎密なコンテキスト認識相互作用構造を学習する分散型アクターフレームであるBayesGを紹介する。
BayesGは、最大167エージェントの大規模トラフィック制御タスクにおいて、強力なMARLベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:31:04 GMT)
VO-DP: Semantic-Geometric Adaptive Diffusion Policy for Vision-Only Robotic Manipulation [16.1] ビジョンオンリー・シングルビュー拡散政策学習法(VO-DP)
ビジョンオンリーかつ単一視点拡散政策学習法(VO-DP)を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:01:33 GMT)
Narrowing Action Choices with AI Improves Human Sequential Decisions [16.0] 近年の研究では、人間の専門家が理解する必要のない意思決定支援システムの設計が可能であることが示されている。
我々は、AIを使って人間が取ることができるアクションのセットを絞り込み、そのアクションセットから人間にアクションを取るよう依頼するシステムを開発する。
システムによって支援されたゲームをプレイする参加者は、自力でプレイする参加者を30ドル%、システムで使用しているAIエージェントを2ドル%で上回ります。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:00:00 GMT)
FSRF: Factorization-guided Semantic Recovery for Incomplete Multimodal Sentiment Analysis [16.0] マルチモーダル知覚分析(MSA)は、人間の感情理解にマルチモーダルデータを活用する研究ホットスポットとなっている。
これまでのMSA研究は主に、完全なマルチモーダルデータに対する相互作用と融合の実行に焦点を当ててきた。
MSAタスクにおけるモダリティの欠如を緩和する因子分解誘導セマンティック・リカバリ・フレームワーク(FSRF)を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:35:00 GMT)
EASELAN: An Open-Source Framework for Multimodal Biosignal Annotation and Data Management [15.8] 機械学習と適応認知システムの最近の進歩は、大規模で豊富な注釈付きマルチモーダルデータの需要を増大させている。
本稿では,アノテーションを改善するためのEASELANアノテーションフレームワークを紹介する。
アノテーションパイプラインのすべてのステージをサポートするために、新しいコンポーネントを追加することで、堅牢なELANツールの上に構築されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:56:04 GMT)
Enhanced Renewable Energy Forecasting using Context-Aware Conformal Prediction [15.6] 本稿では,新しい重み付け方式を用いてコンテキスト対応キャリブレーションセットを構築するための調整校正フレームワークを提案する。
提案手法は, 再生可能エネルギー応用において高い予測信頼性とロバスト性を実現することを実証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:02:46 GMT)
Tequila: Trapping-free Ternary Quantization for Large Language Models [15.6] 大規模言語モデル(LLM)をエッジデバイスにデプロイするには,量子化技術が不可欠である。
テキーラ(Tequila)は、デッドゾーントラッピングされた重みを動的バイアスとして再資源化することで、トラップなし量子化最適化手法である。
SOTAベースラインよりも4%の精度向上を実現し、(1%の差で)完全精度のパフォーマンスと3.0倍の推論スピードアップとほぼ一致している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:05:33 GMT)
Attention Sinks in Diffusion Language Models [15.5] Masked Diffusion Language Models (DLM) は、最近、従来の自己回帰モデル (ARM) に代わる有望な代替品として登場した。
我々はDLMの注意パターンを実験的に分析し、これまで様々なトランスフォーマーアーキテクチャで見られた注意沈降現象に着目した。
まず、ARMとは異なり、DLMのシンク位置は生成過程を通して変化し、動的挙動を示す傾向にある。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:23:58 GMT)
Iterative Motion Compensation for Canonical 3D Reconstruction from UAV Plant Images Captured in Windy Conditions [15.4] 植物の3D表現型は、植物の成長、収量予測、病気の制御を理解する上で重要な役割を担っている。
本稿では,個々の農作物の高品質な3D再構築を可能にするパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:04:08 GMT)
One-Bit Quantization for Random Features Models [15.0] ニューラルネットワークの最近の進歩は、計算とメモリの要求を著しく上回っている。
1ビットの重み圧縮は、リソース制約のあるデバイスでの効率的な推論を可能にする。
ランダム特徴量モデルにおける1ビット量子化の解析を行う。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:42:09 GMT)
ParaFormer: Shallow Parallel Transformers with Progressive Approximation [14.8] ParaFormerは、構造と計算の両方において真の並列性のために設計された浅層トランスフォーマーアーキテクチャである。
理論的解析により,それらの性能は層間協調による漸進的近似に依存していることが示された。
ParaFormerは最大15.07倍のモデル圧縮をサポートし、適応型継続的学習のためのモデル拡張を容易にする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:28:26 GMT)
CausalVerse: Benchmarking Causal Representation Learning with Configurable High-Fidelity Simulations [14.8] 因果表現学習は、データ生成プロセスを明らかにし、基礎となる因果変数と関係を特定することを目的としている。
データセットは4つのドメインで24のサブシーンにわたる約2万の画像と300万のビデオフレームで構成されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:05:53 GMT)
ProofOptimizer: Training Language Models to Simplify Proofs without Human Demonstrations [14.7] Proofrは、人間の監督を必要とせず、リーンの証明を単純化するために訓練された最初の言語モデルです。
Provrは専門家の反復と強化学習を通じてトレーニングされ、リーンを使って単純化の検証とトレーニング信号を提供する。
Provrは、最先端のRL訓練プローバーが標準ベンチマークで生成した証明を実質的に圧縮する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:45:30 GMT)
Direct Preference Optimization with Unobserved Preference Heterogeneity: The Necessity of Ternary Preferences [14.7] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の価値の整合の中心となっている。
最近の選択肢であるDPO(Direct Preference Optimization)は、好みを直接最適化することでパイプラインを単純化している。
生成モデルアライメントにおける多様なユーザに対する公平性とパーソナライズのための理論的かつアルゴリズム的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:00:40 GMT)
Direct Preference Optimization With Unobserved Preference Heterogeneity: The Necessity of Ternary Preferences [14.7] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の価値の整合の中心となっている。
最近の選択肢であるDPO(Direct Preference Optimization)は、好みを直接最適化することでパイプラインを単純化している。
生成モデルアライメントにおける多様なユーザに対する公平性とパーソナライズのための理論的かつアルゴリズム的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:49:06 GMT)
FEMBA: Efficient and Scalable EEG Analysis with a Bidirectional Mamba Foundation Model [14.7] 本稿では,脳波分析のための新たな自己組織化フレームワークであるFEMBA(Foundational EEG Mamba + Bidirectional Architecture)を紹介する。
2次時間とメモリの複雑さが原因のTransformerベースのモデルとは異なり、FEMBAはシーケンス長と線形にスケールする。
トランスモデルと比較して競争性能が向上し、計算コストは大幅に低下する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:59:55 GMT)
Language Models are Injective and Hence Invertible [14.5] 非線型活性化や正規化のようなトランスフォーマー成分は本質的に非単射である。
数学的には、離散的な入力シーケンスを対応する連続表現のシーケンスにマッピングするトランスフォーマー言語モデルがインジェクティブであることが証明される。
隠れアクティベーションから正確な入力テキストを有効かつ効率的に再構築する最初のアルゴリズムであるSipItを紹介する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:25:30 GMT)
PTMPicker: Facilitating Efficient Pretrained Model Selection for Application Developers [14.4] 適切な事前学習モデル(PTM)を正確に同定するためのPTMPickerを提案する。
まず、PTMの共通属性と本質属性からなる構造化テンプレートを定義し、その後、PTMPickerは候補モデルとユーザ意図の機能の両方を表す。
キュレートされたPTMデータセットと合成されたモデル検索要求の実験は、PTMPickerがユーザーが効果的にモデルを特定するのに役立つことを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:24:28 GMT)
Semantic4Safety: Causal Insights from Zero-shot Street View Imagery Segmentation for Urban Road Safety [14.3] ストリートビュー画像にゼロショットセマンティックセグメンテーションを適用して,11の解釈可能なストリートスケープインジケータを導出するフレームワークを提案する。
オースチンで発生した約3万件の事故記録を分析し,事故タイプ固有の因果パターンを明らかにする。
因果推論による予測モデリングをブリッジすることで、セマンティック4セーフティは標的とした介入とハイリスク回廊診断をサポートする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:45:28 GMT)
Beyond Static Assumptions: the Predictive Justified Perspective Model for Epistemic Planning [14.2] Justified Perspective(JP)モデルは、疫学計画(EP)問題を解決するための最先端のアプローチである。
既存のEPメソッドはすべて、古典的な計画から静的環境の仮定を継承する。
この制限は、マルチエージェント設定のロボット工学のような分野におけるEPの適用を妨げる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:22:31 GMT)
Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification [14.0] ドメイン一般化可能な再識別(DG Re-ID)は、1つ以上のソースドメインでモデルをトレーニングし、目に見えないターゲットドメインのパフォーマンスを評価することを目的としている。
相関型条件付スキームを用いた拡散モデル支援表現学習法を提案する。
本手法は,相関型条件付スキームを用いて,差別的でコントラストのあるRe-IDモデルと事前学習した拡散モデルを統合する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:00:35 GMT)
Spatiotemporal Besov Priors for Bayesian Inverse Problems [14.0] データ科学における多くの逆問題には、空間的特徴を持つコンピュータ化された時間依存オブジェクトの列に由来する解が必要である。
ランダムな係数を持つウェーブレット展開によって定義される Besmoothsov process (BP) は、この性質の以前の逆問題により適していると考えられる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:48:11 GMT)
Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery [13.9] コストのかかる3Dアノテーションを伴わない最初の都市ブロックスケール3Dシーン作成フレームワークである textbfSkyfall-GS を提案する。
我々は、幾何的およびフォトリアリスティックなテクスチャを徐々に強化するために、カリキュラム駆動の反復的洗練戦略を調整する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:59:51 GMT)
Conformal Prediction for Signal Temporal Logic Inference [13.8] 信号時間論理(STL)推論は時系列データから人間の解釈可能な規則を抽出しようとする。
既存のメソッドには、推論されたルールに対する正式な信頼性保証がない。
STL推論のためのエンドツーエンドの差別化可能なCPフレームワークを導入し、信頼性と解釈性の両方を向上させる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:23:06 GMT)
Optimistic Query Routing in Clustering-based Approximate Maximum Inner Product Search [13.8] この研究は、クラスタリングに基づく最大内部積探索におけるルーティングを研究することによってギャップを埋める。
各シャード内の内積分布のモーメントを組み込んで最大内積を推定する枠組みを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:07:37 GMT)
Enhancing Code Review through Fuzzing and Likely Invariants [13.7] FuzzSightは、非クラッシングファジィ入力の潜在的な不変量を利用して、プログラムバージョン間での振る舞いの違いを強調するフレームワークである。
評価では、FuzzSightがレグレッションバグの75%、最大80%の脆弱性を24時間のファズリングによって発見しました。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:30:22 GMT)
Subdimensional entanglement entropy: from virtual response to mixed-state holography [13.7] 本稿では,多体系を特徴付ける応答理論として,SEE(textitsubdimensional entanglement Entropy)を導入する。
絡み合い、混合状態とカテゴリー対称性、トポロジカル秩序のホログラフィック原理、幾何学的トポロジカル応答をブリッジすることで、SEEは統一された枠組みを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:54:55 GMT)
On the Generalization Properties of Learning the Random Feature Models with Learnable Activation Functions [13.5] 我々は最近提案されたカーネル手法である学習可能活性化関数を用いたランダム特徴モデル(RFLAF)の一般化特性について検討した。
特徴量生成にデータ依存型サンプリング方式を適用することにより、回帰処理と分類処理の両方において、RAFAFを学習するために必要な特徴量に、はるかに厳しい制約を課すことができる。
重み付きRAFFは, 通常のRAFAFと比較すると, 特徴量が少なく, 同じ性能を達成できることが示される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:29:10 GMT)
Outraged AI: Large language models prioritise emotion over cost in fairness enforcement [13.5] 我々は,大言語モデル (LLM) が感情を用いて罰を導いていることを示す。
不公平はより強い否定的な感情をもたらし、より多くの罰を導いた。
将来のモデルでは、人間のような感情的知性を達成するために、感情を文脈に敏感な推論と統合すべきである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:41:36 GMT)
Extending Audio Context for Long-Form Understanding in Large Audio-Language Models [13.3] 部分YARNは、大規模オーディオ言語モデル(LALM)のためのトレーニングフリーで、音声のみのコンテキスト拡張手法である。
VLATはトレーニング中に様々なオーディオ長をシミュレートし、トレーニングで見られるものよりもはるかに長い入力への一般化を可能にする。
SALMONN と Qwen2-Audio に関する実験により、Arial YaRN は様々な設定でオリジナルのモデルよりも優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:44:28 GMT)
Rewiring Human Brain Networks via Lightweight Dynamic Connectivity Framework: An EEG-Based Stress Validation [13.3] 本研究では,時間変化指向伝達関数に基づく軽量な動的脳結合フレームワークを提案する。
TV DTFは、異なる周波数帯域にわたる脳領域間の方向情報の流れを推定する。
テレビDTFの特徴はMLに基づくストレス分類によって検証された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:21:48 GMT)
Towards Low-Resource Alignment to Diverse Perspectives with Sparse Feedback [13.1] 我々は,多元的デコーディングとモデルステアリングという2つの手法を用いて,低リソース環境下での言語モデルの多元的アライメントを強化することを目指している。
提案手法は,ヘイトスピーチ検出や誤情報検出などのハイテイクタスクにおいて,偽陽性を減少させる。
私たちの研究が多様性の重要性と、言語モデルが微妙な視点に適応できる方法を強調していることを願っています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:06:21 GMT)
Identity-GRPO: Optimizing Multi-Human Identity-preserving Video Generation via Reinforcement Learning [13.0] Identity-GRPOは、マルチヒューマンアイデンティティ保存ビデオ生成のための人間のフィードバック駆動最適化パイプラインである。
VACE と Phantom を大幅に向上させるマルチヒューマン一貫性のためのGRPO バリアントを採用している。
実験の結果、Identity-GRPOはベースラインメソッドよりも最大で18.9%向上していることがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:33:55 GMT)
WebGen-V Bench: Structured Representation for Enhancing Visual Design in LLM-based Web Generation and Evaluation [13.0] WebGen-Vは、データ品質と評価を向上させる命令-HTML生成のための新しいベンチマークとフレームワークである。
WebGen-Vは、(1)現実世界のWebページを継続的に収集する非有界でエージェント的なクローリングフレームワーク、(2)メタデータ、ローカライズされたUIスクリーンショット、およびフォーマットされたテキストと画像アセットを統合する構造化されたセクションワイドなデータ表現、(3)テキスト、レイアウト、ビジュアルを整列したセクションレベルのマルチモーダル評価プロトコルである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:37:37 GMT)
Universal Reconstruction of Complex Magnetic Profiles with Minimum Prior Assumptions [13.0] 計測された磁場から空間的に変化する磁化密度を再構成する新しい,効率的な方法を提案する。
現実的な実験条件下での多種多様な磁性構造をシミュレーションし,本手法の有効性を検証した。
我々のアプローチは、複雑な磁化プロファイルを探索するための汎用的で普遍的なツールを提供し、将来の量子センシング実験への道を開く。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:18:48 GMT)
Towards Automatic Evaluation and Selection of PHI De-identification Models via Multi-Agent Collaboration [12.9] TEAM-PHIはマルチエージェント評価と選択のためのフレームワークである。
大規模な言語モデル(LLM)を使用して、識別不能の品質を自動的に測定する。
ゴールドレーベルに大きく依存せずに最高のパフォーマンスモデルを選択する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:06:31 GMT)
MirrorFuzz: Leveraging LLM and Shared Bugs for Deep Learning Framework APIs Fuzzing [12.9] ディープラーニング(DL)フレームワークは、幅広い人工知能アプリケーションのバックボーンとして機能する。
DLフレームワーク内のバグは、高レベルのアプリケーションにおいて重要な問題に陥り、信頼性とセキュリティを損なう可能性がある。
DLフレームワークで共有バグを発見するための自動APIファズリングソリューションであるMirrorFuzzを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:34:00 GMT)
Reliability of Large Language Model Generated Clinical Reasoning in Assisted Reproductive Technology: Blinded Comparative Evaluation Study [12.9] 大言語モデル(LLM)は医療データを合成できるが、その臨床的信頼性は検証されていない。
本研究は, LLM生成したCoTの信頼性を評価し, 品質向上に向けた戦略について検討する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:29:01 GMT)
Particle Dynamics for Latent-Variable Energy-Based Models [12.8] 潜時変動エネルギーベースモデル(LVEBM)は、観測されたデータと潜時変数の結合対に1つの正規化されたエネルギーを割り当てる。
我々は,潜伏勾配と関節勾配の分布に関するサドル問題として,最大様態訓練を再検討した。
我々は、KL分散とワッサーシュタイン2距離における崩壊率を用いて、標準の滑らかさと解離性仮定の下での存在と収束を証明した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:04:49 GMT)
Which exceptional low-dimensional projections of a Gaussian point cloud can be found in polynomial time? [12.8] 反復アルゴリズムのクラスで実現可能な分布のサブセット$mathscrF_m,alpha$について検討する。
統計物理学の非厳密な手法は、一般化されたパリの公式の言葉で$mathscrF_m,alpha$の間接的な特徴づけを与える。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:35:41 GMT)
Text Takes Over: A Study of Modality Bias in Multimodal Intent Detection [12.8] 本研究では,多目的意図検出タスクにおいて,テキストのみを含むLarge Language Models (LLMs) と非LLMs (マルチモーダルモデル) の有効性について検討する。
この結果,テキストのみのLLMであるMistral-7Bは,MIntRec-1で約9%,MIntRec2.0データセットで約4%,最も競争力のあるマルチモーダルモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:05:04 GMT)
CoUn: Empowering Machine Unlearning via Contrastive Learning [12.7] CoUnは、保持データのみを使用してスクラッチから再トレーニングされたモデルが、保持データとのセマンティックな類似性に基づいて、忘れデータを分類する、という観察にインスパイアされた、新しいMUフレームワークである。
CoUnは、学習したデータ表現をコントラスト学習(CL)と教師付き学習によって調整し、データを保持するためにのみ適用することで、この振る舞いをエミュレートする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:39:03 GMT)
TraceCoder: Towards Traceable ICD Coding via Multi-Source Knowledge Integration [12.5] 我々は、CD符号化におけるトレーサビリティと説明可能性を高めるために、マルチソース外部知識を統合するフレームワークであるTraceCoderを提案する。
TraceCoderはUMLS、ウィキペディア、大型言語モデル(LLM)など様々な知識ソースを動的に組み込んで、コード表現の充実、セマンティックギャップの橋渡し、希少かつ曖昧なコードを扱う。
また、ラベル、臨床コンテキスト、知識間の相互作用をモデル化するハイブリッドアテンション機構を導入し、ロングテールコード認識を改善し、それらを外部証拠に根拠付けることによって解釈する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:08:07 GMT)
Self-Supervised Representation Learning with ID-Content Modality Alignment for Sequential Recommendation [12.4] SICSRec というID-Content モダリティアライメントを用いた自己教師型表現学習モデルを提案する。
本稿では,ID-モダリティシーケンスエンコーダがユーザの行動嗜好を捉え,コンテンツ-モダリティシーケンスエンコーダがユーザのコンテンツ嗜好を学習し,ミックス-モダリティシーケンスデコーダがこれらの2種類の嗜好の本質的な関係を把握できる,トランスフォーマーベースのシーケンシャルモデルを設計する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:18:13 GMT)
AppCopilot: Toward General, Accurate, Long-Horizon, and Efficient Mobile Agent [12.3] 本稿では,モバイルエージェントが現実的かつスケーラブルな影響をもたらすために解決すべき4つの中核的問題を特定する。
アプリケーション間で動作するマルチモーダル,マルチエージェント,汎用モバイルエージェントであるAppCopilotを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:57:58 GMT)
Beyond Accuracy: Are Time Series Foundation Models Well-Calibrated? [12.2] 近年の5つの時系列基礎モデルと2つの競争ベースラインの校正関連特性について検討する。
時系列基礎モデルはベースラインモデルよりも一貫して優れており、体系的に過度か過小評価されない傾向にある。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:41:24 GMT)
Towards Symmetry-Aware Efficient Simulation of Quantum Systems and Beyond [12.1] このパースペクティブは、物理インフォームドテンソルネットワークが量子シミュレーション、計算、機械学習におけるスケーラブルなアプローチの統一戦略を提供すると主張している。
同じ原理は一般的な対称性にまで拡張され、機械学習における同変ニューラルネットワークを刺激し、変分量子アルゴリズムにおける対称性保存アンサーゼを導く。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:35:16 GMT)
TokenTiming: A Dynamic Alignment Method for Universal Speculative Decoding Model Pairs [12.1] 投機的復号化は推論効率を大幅に向上させる。
ドラフトとターゲットモデルは、同じ語彙を共有しなければならない。
普遍的な投機的復号化のためのアルゴリズムTokenTimingを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:25:36 GMT)
Generative AI Literacy: A Comprehensive Framework for Literacy and Responsible Use [11.9] 生成AIの堅牢な理解の欠如は、生成AIを効果的に、批判的に、責任を持って使用する個人の能力を妨げます。
これらのガイドラインは、生産的AIを効率的、倫理的、インフォメーションな方法で使用するためのメンバーを支援するフレームワークを開発する学校、企業、組織を支援することを目的としている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:15:46 GMT)
FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment Model [11.4] FG-CLIP 2(FG-CLIP 2)は、英語と中国語の微妙なアライメントを促進するために設計された視覚言語モデルである。
提案手法は, 領域テキストマッチングや長大キャプションモデリングなど, きめ細かい監督手法を利用する。
長文検索とバウンディングボックスの分類を特徴とする中国語マルチモーダル理解のための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:47:31 GMT)
When In Doubt, Abstain: The Impact of Abstention on Strategic Classification [11.4] 本稿では,戦略的分類の文脈における棄権について検討する。
最適な棄権は、主観的効用が非棄権的条件よりも悪くないことを保証することを示す。
また、禁忌は操作の抑止力としても機能し、操作するエージェントがポジティブな結果を得るのにコストがかかることも示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:46:57 GMT)
LLM Collaboration With Multi-Agent Reinforcement Learning [11.4] 我々は,MARL(Multi-Agent Reinforcement Learning)問題を解決するために,マルチエージェント・マルチターンアルゴリズム,Multi-Agent Group Relative Policy Optimization (MAGRPO)を開発した。
筆者らは,MAGRPOを用いた微調整MASにおいて,効率的な協調による高品質な応答を効率的に生成できることを実証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:14:15 GMT)
FIDDLE: Reinforcement Learning for Quantum Fidelity Enhancement [11.3] 量子コンピューティングは、量子最適化や量子機械学習といった分野に革命をもたらす可能性がある。
現在の量子デバイスはノイズによって妨げられ、信頼性が低下する。
ゲートベースの量子コンピューティングにおける鍵となる課題は、プロセスの忠実度によって測定される量子回路の信頼性を改善することである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:15:49 GMT)
Backdoor or Manipulation? Graph Mixture of Experts Can Defend Against Various Graph Adversarial Attacks [11.3] 我々は、Mixture of Experts(MoE)アーキテクチャの柔軟性を活用して、バックドア、エッジ操作、ノードインジェクション攻撃に対して、スケーラブルで統一されたフレームワークを設計します。
具体的には、個々の専門家が意思決定プロセスにおいて異なる近傍構造に注目するよう促すMIベースの論理多様性損失を提案する。
本稿では、乱れパターンを特定し、乱れノードを対応するロバストな専門家に適応的にルーティングするロバストネス対応ルータを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:51:02 GMT)
What Can String Probability Tell Us About Grammaticality? [11.2] コーパスデータの生成過程に関する簡単な仮定に基づいて,文法,意味,文字列の確率の関係を理論的に解析する。
本フレームワークでは,280K文対を英語と中国語で実証的に評価する3つの予測を行う。
本分析は,LMの構造的知識を学習する確率を用いた理論的根拠を与えるとともに,LM文法評価における今後の研究の方向性を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:36:00 GMT)
Flow Matching for Robust Simulation-Based Inference under Model Misspecification [11.2] Flow Matching Corrected Posterior Estimation(フローマッチング補正後推定)は、シミュレーションによって訓練された後部推定を、少数の実校正サンプルを用いて洗練するフレームワークである。
提案手法は,従来のSBIベースラインと比較して,推論精度と不確実性を向上し,不特定性の影響を常に緩和することを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:03:13 GMT)
BiMax: Bidirectional MaxSim Score for Document-Level Alignment [11.1] 大量のWebマイニングデータを考えると、正確性とスピードの両方を考慮する必要がある。
そこで我々は,doc-to-doc類似性を計算するために,言語間双方向マックススコア(BiMax)を提案する。
BiMaxは、約100倍の速度でOTに匹敵する精度を得る。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:16:25 GMT)
ProSh: Probabilistic Shielding for Model-free Reinforcement Learning [11.1] 本稿では,コスト制約下での安全な強化学習のためのモデルフリーアルゴリズムであるProSh(Probabilistic Shielding via Risk Augmentation)を紹介する。
ProShは、学習したコスト批評家を使用してエージェントのポリシー分布にシールドを適用することで安全性を強制する。
環境が決定論的である場合には最適性が保たれることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:08:51 GMT)
Entanglement complexification transition driven by a single non-Hermitian impurity [11.1] 我々は、非エルミート境界として作用する単一の非エルミート不純物を持つエルミートギャップなし鎖を解く。
エンタングルメント切断が不純物に置かれると、鋭いエンファングルメント複雑化遷移が明らかになる。
以上の結果より,1つの非エルミート不純物がハーミート臨界系を非単体欠陥CFT相へと誘導できることが判明した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:08:16 GMT)
Towards Flash Thinking via Decoupled Advantage Policy Optimization [11.0] 大規模共振モデル(LRM)は、教師付き微調整(SFT)と強化学習(RL)によって複雑な問題を解く際、顕著な性能を達成した。
既存のRLアルゴリズムは、過度に長い応答と過度な問題に悩まされ、推論遅延と計算消費が増大する。
本稿では,モデルに対する非効率推論を減らすために,新しいRLフレームワークDEPOを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:19:20 GMT)
SpeechLLMs for Large-scale Contextualized Zero-shot Slot Filling [10.9] スロットフィリングは音声言語理解(SLU)において重要なサブタスクである
近年の音声ベース大規模言語モデル(speechLLMs)の出現により,音声理解タスクを実現するための新たな道が開かれた。
我々は,上位境界値とのギャップを狭めるため,トレーニングデータ,アーキテクチャ,トレーニング戦略の改善を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:45:29 GMT)
Interpretable Hybrid-Rule Temporal Point Processes [10.9] 時間的ポイントプロセス(TPP)は、様々な医療領域におけるイベントシーケンスのモデル化に広く用いられている。
近年、解釈可能なTPPを導入しているが、これらの手法は数値的特徴を取り入れていない。
本稿では,時間論理ルールと数値的特徴を統合する新しいフレームワークであるHybrid-Rule Temporal Point Processes (HRTPP)を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:41:20 GMT)
Where Common Knowledge Cannot Be Formed, Common Belief Can -- Planning with Multi-Agent Belief Using Group Justified Perspectives [10.8] エピステマティック・プランニング(英: epistemic planning)は、知識と信念を変えることに焦点を当てたAI計画のサブフィールドである。
本稿では,分散信念と共通信念を含む,Emphgroupの信念を扱うためにJPモデルを拡張した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:17:16 GMT)
Spatial Supply Repositioning with Censored Demand Data [10.8] 我々は、一方通行のオンデマンド車両共有サービスによるネットワーク在庫システムについて検討する。
このような一般的な在庫ネットワークにおいて最適なポリシーを見つけることは解析的にも計算的にも困難である。
我々の研究は、共有モビリティビジネスの生存性における在庫管理の重要性を強調している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:54:36 GMT)
Accelerating Mobile Language Model Generation via Hybrid Context and Hardware Coordination [10.6] CoordGenは、投機的デコーディングと動的ハードウェアスケジューリングを統合して、モバイルデバイス上でコンテキスト対応のテキスト生成を高速化するフレームワークである。
実験では、既存のモバイル推論ソリューションと比較して、生成速度が3.8倍、エネルギー効率が4.7倍まで一貫した改善が示されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:59:43 GMT)
MSAM: Multi-Semantic Adaptive Mining for Cross-Modal Drone Video-Text Retrieval [10.5] ドローンビデオは、オーバーヘッドの視点、強い構造的均一性、ターゲットの組み合わせの多様な意味表現を特徴としている。
マルチセマンティック・アダプティブ・マイニング(MSAM)という新しい手法を提案する。
MSAMはフレーム間の動的変化を取り入れ、特定のシーン領域からリッチな意味情報を抽出する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:26:28 GMT)
VLMLight: Safety-Critical Traffic Signal Control via Vision-Language Meta-Control and Dual-Branch Reasoning Architecture [10.4] VLMLightは、視覚言語メタコントロールとデュアルブランチ推論を統合する新しいフレームワークである。
大規模言語モデル(LLM)は、安全優先のメタコントローラとして機能し、ルーチントラフィックの高速なRLポリシーとクリティカルケースの構造化推論ブランチを選択できる。
実験によると、VLMLightは緊急車両の待ち時間を、RLのみのシステムよりも最大65%短縮する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:23:48 GMT)
NEBULA: Do We Evaluate Vision-Language-Action Agents Correctly? [10.3] 単腕操作のための統合型エコシステムである textbfNEBULA を導入し,診断と再現性の評価を可能にした。
NEBULAは、精密なスキル診断のためのきめ細かいテキスタイルテストと、堅牢性を測定する系統的なテキスタイルテストを組み合わせた、新しい2軸評価プロトコルを備えている。
フラグメンテーションを削減し、データセット間のトレーニングと公正比較をサポートするため、標準化されたAPIと大規模な集約データセットが提供される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:22:57 GMT)
Agentic AI for Ultra-Modern Networks: Multi-Agent Framework for RAN Autonomy and Assurance [10.3] 従来のO-RAN制御ループはRICベースのオーケストレーションに大きく依存しており、インテリジェンスを集中し、ポリシーの衝突やデータドリフト、予期せぬ条件下での安全でないアクションといったリスクにシステムを公開している。
自律型ネットワークの未来は、データ収集、モデルトレーニング、予測、ポリシー生成検証、デプロイメント、保証を行うために、専門エージェントが協力するマルチエージェントアーキテクチャにある、と我々は主張する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:28:55 GMT)
HumorDB: Can AI understand graphical humor? [10.2] 本稿では,AIシステムによる視覚的ユーモア理解の評価と向上を目的としたデータセットであるtextbfHumorDBを紹介する。
我々は,2次ユーモア分類,面白さ評価予測,ペアワイズユーモア比較という3つのタスクにおいて,人間,最先端の視覚モデル,および大きな視覚言語モデルを評価する。
その結果、現在のAIシステムと人間レベルのユーモア理解のギャップが明らかになった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:13:12 GMT)
Prompt injections as a tool for preserving identity in GAI image descriptions [10.1] ジェネレーティブAIは、GAIシステムと直接対話しないが、コンテンツに影響を及ぼすリスクがある。
間接的ユーザに対する害を軽減するためのいくつかのアプローチが説明されているが、ほとんどの場合、トップダウンまたは外部介入が必要である。
新たな戦略であるプロンプトインジェクションは、権限のある代替手段を提供する。間接的なユーザは、自身のコンテンツ内から、彼らに対する害を軽減できる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:11:07 GMT)
Protein Folding with Neural Ordinary Differential Equations [10.0] 本稿では,48個の離散ブロックを,コアアテンションに基づく操作を保存したニューラルODEパラメータ化に置き換えたEvoformerの連続的な深度定式化を提案する。
The Neural ODE-based Evoformer produced structurely plausible predictions and securely captures certain secondary structure element, such as Alpha-helices。
私たちのモデルは、単一のGPUで17.5時間トレーニングしただけで、劇的に少ないリソースでこのパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:56:03 GMT)
MemeSense: An Adaptive In-Context Framework for Social Commonsense Driven Meme Moderation [10.0] 有害ミームに対する社会的基盤的介入を生成するために設計された適応型フレームワークであるMemeSenseを紹介する。
MemeSenseは、視覚的およびテキスト的理解と、コモンセンスの手がかりに富んだ、意味的に整合した例を組み合わせる。
MemeSenseは最先端の手法より優れており、意味的類似性が最大35%向上し、非テキストミームのBERTScoreが9%向上している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:57:40 GMT)
Expressive Reward Synthesis with the Runtime Monitoring Language [9.8] 強化学習(RL)における鍵となる課題は報酬(ミス)特定であり、不正確に定義された報酬関数は意図しない、潜在的に有害な行動をもたらす。
Reward Machinesは、報酬関数を有限状態オートマトンとして表現することでこの問題に対処し、構造化された非マルコフ報酬関数の指定を可能にする。
モニタリング言語(RML)を基盤として,新しい言語ベースのリワードマシンの開発を行っている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:54:59 GMT)
Aria Gen 2 Pilot Dataset [9.8] Aria Gen 2 Pilotデータセットは、最先端のAria Gen 2メガネを使用してキャプチャされた、エゴセントリックなマルチモーダルオープンデータセットである。
最初のリリースでは、Aria Gen 2メガネを装着した友人と一緒に日々の活動を記録するDia'aneがメインのテーマだ。
それぞれのシナリオにおいて、様々なマシン認識アルゴリズムから総合的な生センサデータと出力データを提供する。
これらのデータは、デバイスが着用者、周囲の環境、および着用者と環境の間の相互作用を知覚する能力を示しながら、多様なユーザや状況における堅牢なパフォーマンスを維持している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:21:11 GMT)
ProofBridge: Auto-Formalization of Natural Language Proofs in Lean via Joint Embeddings [9.8] ProofBridgeは、NLの定理と証明を自動的にリーン4に翻訳するフレームワークです。
中心となるのは、NL と FL (NL-FL) の定理対を共有意味空間で整列する合同埋め込みモデルである。
我々の訓練は、NL-FL 対が意味論的に同値である場合に限り、この空間において NL-FL の定理が密接にマッピングされることを保証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:20:50 GMT)
Enhance Large Language Models as Recommendation Systems with Collaborative Filtering [9.7] 本研究は、レコメンデーションシステム(Critic-LLM-RS)として、批評に基づく大規模言語モデル(LLM)を提案する。
Critic-LLM-RSは、多くのユーザとアイテム間のインタラクションから学習することで、コラボレーティブなフィルタリングを実装している。
実データセットに対するCritic-LLM-RSの有効性を検証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:35:14 GMT)
Scalable Multi-phase Word Embedding Using Conjunctive Propositional Clauses [9.7] 入力シーケンスの文脈埋め込みを発見するために,2相学習を取り入れた新しい手法を提案する。
この技術はスケーラブルなモデルの設計を促進するだけでなく、解釈可能性も維持する。
実験の結果,提案手法は従来の手法と比較して競争性能が高いことがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:23:52 GMT)
Fisher discord as a quantifier of quantum complexity [9.7] 確率分布の相互情報の古典的に等価な2つの表現は、量子系に拡張されたときに発散する。
この違いは、量子状態の複雑な性質を特徴づけるために利用することができる。
量子状態に対する情報理論量化器を導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:20:28 GMT)
Recursive Gaussian Process State Space Model [9.6] 動作領域とGPハイパーパラメータの両方に適応可能な新しいオンラインGPSSM法を提案する。
ポイントを誘導するオンライン選択アルゴリズムは、情報的基準に基づいて開発され、軽量な学習を実現する。
合成データセットと実世界のデータセットの総合的な評価は,提案手法の精度,計算効率,適応性を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:44:59 GMT)
When Does Closeness in Distribution Imply Representational Similarity? An Identifiability Perspective [9.6] モデル分布間の小さなKullback--Leibler分散は、対応する表現が類似していることを保証するものではないことを証明する。
次に、近接性が表現的類似性を意味する分布距離を定義する。
合成実験において、より広いネットワークは我々の距離に近づき、より類似した表現を持つ分布を学習する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:44:16 GMT)
High-Probability Analysis of Online and Federated Zero-Order Optimisation [9.5] 我々は,厳密な理論的保証を備えたフェデレーションゼロオーダーアルゴリズムであるFedZeroを紹介する。
我々はFedZeroが達成した後悔の最小化に対する高い確率保証を導出する。
我々は凸零次最適化のための最初の高確率収束保証を確立する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:18:48 GMT)
Hypergraph Contrastive Sensor Fusion for Multimodal Fault Diagnosis in Induction Motors [9.4] 本稿では,堅牢な断層診断のための統合フレームワークMM-HCANを提案する。
MM-HCANは、マルチモーダルセンサー融合用に特別に設計されたハイパーグラフトポロジーにコントラスト学習を統合する最初の方法である。
クロスドメインの強力な一般化とノイズに対するレジリエンスにより、99.82%の精度を達成し、現実世界のデプロイメントに適していることを実証している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:28:26 GMT)
Landmark-Based Node Representations for Shortest Path Distance Approximations in Random Graphs [9.3] 局所的な距離保存ノード埋め込みの性能について検討する。
ランドマークベースのアルゴリズムとして知られるこれらの埋め込みは、ランドマークと呼ばれる小さな参照ノードのサブセットから最短経路を計算することで、ペアワイズ距離を近似する。
我々の主要な理論的貢献は、アードス・レニーのランダムグラフのようなランダムグラフが、最悪のケースグラフと比較してランドマークベースの埋め込みにおいて低い次元を必要とすることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:33:26 GMT)
Controllable Abstraction in Summary Generation for Large Language Models via Prompt Engineering [9.2] 本研究では,プロンプトエンジニアリングに基づく大規模言語モデルに対して,制御可能な要約生成手法を提案する。
入力テキスト上でセマンティック分析、トピックモデリング、ノイズ制御を実行することで、抽象度の異なる要約を生成する。
この実験では、CNN/Daily Mailデータセットを使用して、異なるプロンプトの長さ、データノイズ、テキストタイプを詳細に分析する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:50:55 GMT)
Bridging Symmetry and Robustness: On the Role of Equivariance in Enhancing Adversarial Robustness [9.0] 敵対的な例では、知覚不能な入力摂動に対する感度を利用して、ディープニューラルネットワークの重大な脆弱性を明らかにしている。
本研究では,群-同変畳み込みを組込み,対向ロバスト性に対するアーキテクチャ的アプローチについて検討する。
これらの層は、モデル行動と入力空間の構造化変換を整合させる対称性の先行を符号化し、よりスムーズな決定境界を促進する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:26:58 GMT)
On Non-interactive Evaluation of Animal Communication Translators [9.0] これは機械翻訳品質評価(MTQE)の例であり、参照翻訳は使用できない。
その考え方は、動物のコミュニケーションを翻訳し、ターンバイターンし、結果の翻訳が置換されるよりも順番に意味があるかを評価することである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:56:30 GMT)
PokeeResearch: Effective Deep Research via Reinforcement Learning from AI Feedback and Robust Reasoning Scaffold [8.9] PokeeResearch-7Bは、統合強化学習フレームワークに基づいて構築された7Bパラメータディープリサーチエージェントである。
AIフィードバックフレームワークからのアノテーションのない強化学習によってトレーニングされている。
7Bスケールのディープリサーチエージェントの最先端性能を実現している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:53:06 GMT)
Early-stopping for Transformer model training [8.9] 本研究では、トランスフォーマーのトレーニング力学を解析するためのランダム行列理論(RMT)に基づく新しい理論フレームワークを導入する。
我々は、パフォーマンス改善を推進し、アーリーストッピングの基準を導出する基盤となるメカニズムに焦点を当てる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:55:46 GMT)
Membership Privacy Risks of Sharpness Aware Minimization [8.8] Sharpness-Aware Minimization (SAM) は従来のSGDよりもメンバシップ推論攻撃の傾向が強い。
SAMは非定型的なサブパターンを記憶しやすくし、より一般化されているが、プライバシーリスクが高いと推測する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:27:14 GMT)
Adversary-Free Counterfactual Prediction via Information-Regularized Representations [8.8] 本稿では,デコーダバイアス下での対実予測について検討し,数学的に基礎を成す情報理論的アプローチを提案する。
情報用語を上位にバウンドし、教師付き課題と組み合わせることで、安定的で、実証可能なトレーニング基準を導出する、トラクタブルな変動目標を導出する。
我々は,制御された数値シミュレーションと実世界の臨床データセットの評価を行い,最近の最先端のバランス,再重み付け,敵のベースラインと比較した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:49:04 GMT)
Synera: Synergistic LLM Serving across Device and Cloud at Scale [8.5] 大規模言語モデル(LLM)は、様々なモバイルオペレーティングシステムにおいて重要なコンポーネントになりつつある。
デプロイメントは、パフォーマンス上の課題、特に生成品質と長時間の遅延劣化に悩まされている。
本稿では,効率的なSLM-LLM合成機構を応用したデバイスクラウド同期型LCMサービスシステムであるSyneraを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:31:50 GMT)
OffSim: Offline Simulator for Model-based Offline Inverse Reinforcement Learning [8.5] OffSimは、新しいモデルベースのオフライン逆強化学習フレームワークである。
専門家が生成した状態-作用軌道から直接環境力学と報酬構造をエミュレートする。
OffSimはその後、実際の環境とのさらなるインタラクションなしに、ポリシーをオフラインにトレーニングすることができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:07:55 GMT)
Uncertainty-Aware Extreme Point Tracing for Weakly Supervised Ultrasound Image Segmentation [8.4] アノテーションとして4つの極端点のみを利用する弱教師付きセグメンテーションフレームワークを提案する。
具体的には、極端点から派生したバウンディングボックスをSegment Anything Model 2 (SAM2) のプロンプトとして使用して、信頼できる初期擬似ラベルを生成する。
これらの結果は,超音波画像分割のための弱教師付き枠組みの有効性と実用性を検証するものである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:53:16 GMT)
MTmixAtt: Integrating Mixture-of-Experts with Multi-Mix Attention for Large-Scale Recommendation [8.3] 我々は,Multi-Mix Attention を用いたMixture-of-Experts (MoE) アーキテクチャである textbfMTmixAtt を提案する。
textbfAutoTokenモジュールは、異種機能をセマンティックコヒーレントトークンに自動的にクラスタリングし、ヒューマン定義の機能グループの必要性を取り除く。
Meituanの産業TRecデータセットに関する大規模な実験は、MTmixAttが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:50:09 GMT)
Kernel-Based Evaluation of Conditional Biological Sequence Models [8.3] 条件付きシーケンスモデルの設計と調整を行うためのカーネルベースのツールセットを提案する。
我々のツールのバックボーンは、Augmented Maximum Mean Discrepancy (ACMMD)と呼ばれる、真の条件分布とモデルの推定値との新たな相違の尺度である。
本稿では,タンパク質設計モデルであるプロテインMPNNを解析し,本手法の有用性を実証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:47:51 GMT)
Adaptive Individual Uncertainty under Out-Of-Distribution Shift with Expert-Routed Conformal Prediction [8.3] 信頼度の高い適応区間(TESSERA)のスケールド推定を用いた信頼度エキスパートスプリット・コンフォーマルを導入する。
TESSERAは、絶対誤差を追跡する信頼性の高いカバレッジ保証、情報的かつ適応的な予測間隔幅を備えたサンプル単位の不確実性を提供する。
タンパク質-リガンド結合親和性予測は, 独立および同一分布 (d.d.) と足場ベースアウト・オブ・ディストリビューション (OOD) の双方で評価した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:51:33 GMT)
Towards Robust Zero-Shot Reinforcement Learning [8.3] ゼロショット強化学習(英語版) (RL) の最近の発展は、ゼロショット方式で任意の新しいタスクに適応できる事前訓練されたジェネリストポリシーを学習するための新たな道を開いた。
一般的なフォワード・バックワード表現(FB)および関連する手法はゼロショットRLにおいて有望であることを示しているが、それらのモデリングには表現性が欠如しており、外挿誤差が準最適性能を引き起こしていることを実証的に見出した。
本稿では、学習安定性、ポリシー抽出能力、表現学習品質を同時に向上するFBベースのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:33:19 GMT)
RLAF: Reinforcement Learning from Automaton Feedback [8.3] 複雑で歴史に依存した報酬構造を持つ環境における強化学習(RL)は、従来の手法に重大な課題をもたらす。
本稿では,学習プロセスの指導にオートマトンに基づくフィードバックを活用する新しいアプローチを提案し,決定論的有限オートマトン(DFA)から導出される選好に,明示的な報酬関数を置き換える。
本研究は,非マルコフ報酬の処理において,オートマトンに基づく選好の利点を強調し,従来の報酬モデルに代わる,スケーラブルで効率的で人間に依存しない代替手段を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:17:01 GMT)
TACL: Threshold-Adaptive Curriculum Learning Strategy for Enhancing Medical Text Understanding [8.2] TACL(Threshold-Adaptive Curriculum Learning)は、トレーニング中にモデルが医療用テキストとどのように相互作用するかを再考する新しいフレームワークである。
データを難易度に分類し、トレーニングの初期段階でより単純なケースを優先順位付けすることで、TACLはより複雑なレコードに取り組む前に強力な基盤を構築する。
自動ICD符号化, 寛解予測, TCM 症候群の鑑別など, 様々な臨床課題にまたがる顕著な改善が観察された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:16:51 GMT)
LinkedIn Post Embeddings: Industrial Scale Embedding Generation and Usage across LinkedIn [8.0] ポスト埋め込みは、意味を効果的に捉えた埋め込み空間におけるテキストの表現である。
本稿では,事前学習したトランスフォーマーベース大規模言語モデル(LLM)を入力として,微調整を行うLinkedInのポスト埋め込みについて述べる。
我々は、前向きな移行を観察し、独立してトレーニングするのに比べ、すべてのタスクにおけるパフォーマンスの改善につながった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:59:41 GMT)
Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers [8.0] 著者のスタイルをエミュレートしながら、フロンティアAIモデルが高品質な文学テキストを生成できるかどうかは不明だ。
MFAの訓練を受けたエキスパートライターと、ChatGPT、Claude、Geminiの3つのフロンティアAIモデルを比較する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:21:56 GMT)
Understanding Generalization in Node and Link Prediction [7.7] 帰納的および帰納的ノードにおけるMPNNの一般化特性とリンク予測設定を統一的に解析するフレームワークを提案する。
提案手法は, 帰納的あるいは帰納的条件下での任意の分類タスクに対して, グラフを超えて適用することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:52:07 GMT)
HOI-Dyn: Learning Interaction Dynamics for Human-Object Motion Diffusion [7.5] 本稿では、ドライバ対応システムとしてHOI生成を定式化する新しいフレームワークであるHOI-Dynを提案する。
我々の手法の中核は、軽量なトランスフォーマーベースの相互作用力学モデルである。
提案手法は,HOI生成の質を高めるだけでなく,生成した相互作用の質を評価するための有効な指標も確立する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:23:28 GMT)
How Sparse Can We Prune A Deep Network: A Fundamental Limit Perspective [7.4] ネットワークプルーニングは、ディープニューラルネットワークの記憶と計算の負担を軽減するために一般的に使用される尺度である。
この研究は第一原理的アプローチ、すなわち損失関数に空間性制約を課し、凸幾何学における統計次元の枠組みを利用する。
刈り取り比の限界,すなわち重み度とネットワークシャープネスを決定する2つの要因を同定する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:15:43 GMT)
ZeST: an LLM-based Zero-Shot Traversability Navigation for Unknown Environments [7.4] ロボットを危険にさらすことなく、リアルタイムで移動可能なマップを作成するための新しいアプローチであるZeSTを提案する。
提案手法は,ゼロショットトラバーサビリティを実現し,実際のデータ収集に伴うリスクを軽減するだけでなく,高度なナビゲーションシステムの開発も促進する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:27:35 GMT)
Transfer Learning for Benign Overfitting in High-Dimensional Linear Regression [7.4] 高次元線形回帰における移動学習と最小$$-norm補間器(MNI)の交叉について検討する。
我々の研究は、新しい2段階のトランスファーMNIアプローチを提案し、そのトレードオフを分析することでギャップを埋める。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:58:16 GMT)
The 3rd Place Solution of CCIR CUP 2025: A Framework for Retrieval-Augmented Generation in Multi-Turn Legal Conversation [7.4] CCIR CUP 2025 において,本手法を "Legal Knowledge Retrieval and Generation" に導入する。
情報検索と大規模言語モデルの利点を組み合わせることで、RAGは関連性および文脈的に適切な応答を生成することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:12:15 GMT)
From Characters to Tokens: Dynamic Grouping with Hierarchical BPE [7.3] 代名詞のトークン化法は、大きな言語モデルで広く使われている。
稀な単語を表現するのに非効率で、大きな埋め込み行列を必要とする。
本稿では,既存のBPEトークン化の構造を利用した動的文字グループ化手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:42:10 GMT)
Neural Posterior Estimation for Cataloging Astronomical Images from the Legacy Survey of Space and Time [7.2] LSSTは2026年に本格的な運用を開始する予定で、前例のない量の天体画像が得られる。
本稿では,ニューラルリテラル推定(NPE)と呼ばれる最近開発されたベイズ推定法について,カタログ化のアプローチとして検討する。
NPEは、光源検出、フラックス測定、星/銀河の分類、銀河形状測定において、標準LSSTパイプラインを体系的に上回っている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:03:06 GMT)
Case Study of GAI for Generating Novel Images for Real-World Embroidery [7.2] 本稿では,実証可能なアートパターンの設計をより利用しやすくする現実的なニーズに対処するために,生成人工知能(GAI)の潜在的利用を探求するケーススタディを提案する。
障害者主導型チームによるオートエスノグラフィーのケーススタディを通じて, GAI を人工内膜パターン生成の補助技術として応用することを検討した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:16:23 GMT)
Zero-shot World Models via Search in Memory [7.2] 類似性探索と表現を利用して、トレーニング手順を使わずに世界モデルを近似する。
本研究では, 遅延再構成の品質と, 再構成画像の類似性について検討した。
我々のモデルは、視覚的に異なる環境におけるベースラインに対して、長期水平予測においてより強い性能を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:09:36 GMT)
Towards Label-Free Brain Tumor Segmentation: Unsupervised Learning with Multimodal MRI [7.1] 非教師付き異常検出(UAD)は、MRIにおける脳腫瘍のセグメンテーションのための教師付き学習の代替手段である。
正常脳MRIで腫瘍の検出と局所化を専門に訓練したMViT-AE(Multimodal Vision Transformer Autoencoder)を提案する。
本手法は臨床的に有意な腫瘍局在を達成し, 病変関連Dice類似係数は0.437, 0.316, 検査セット0.350, 異常検出率89.4%であった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:26:30 GMT)
Foresighted Online Policy Optimization with Interference [7.1] 我々は、現在の決定がその後の決定や報奨に対する長期的な影響を革新的に検討する、干渉を伴う先見オンライン政策(FRONT)を導入する。
FRONTは2つの異なる定義の下でサブ線形後悔を達成し、決定の即時的および連続的な影響の両方を捉えている。
我々は,FRONTが大規模シミュレーションと都市ホテル利益への現実的応用を通じて,サブリニアな後悔を得ることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:32:06 GMT)
Expediting Reinforcement Learning by Incorporating Knowledge About Temporal Causality in the Environment [6.9] 強化学習アルゴリズムは、報酬フィードバックが不十分で、環境内の複雑なイベントのシーケンスに依存するタスクに対して最適なポリシーを学ぶのに苦労する。
本稿では,時間論理に基づく因果関係図を報酬形式に組み込む手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:11:26 GMT)
Flexible Threshold Multi-client Functional Encryption for Inner Product in Federated Learning [6.9] Federated Learning(FL)は、複数のクライアントがローカルデータを開示することなく、共同で共有モデルをトレーニングできる分散機械学習パラダイムである。
本稿では,内積方式(FTMCFE-IP)のためのフレキシブルしきい値多重クライアント関数暗号を設計する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:58:16 GMT)
Memory-Efficient Large Language Models for Program Repair with Semantic-Guided Patch Generation [6.8] FLAMESは、修復効率とメモリ効率を向上させるためにセマンティック誘導パッチ生成を使用する。
FLAMESはLDMベースのAPRに比べてメモリ消費を最大83%削減する。
FLAMESはDefects4Jの133のバグを正しく修正し、最高のベースラインよりも10のバグを修正します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:43:02 GMT)
ColumnDisturb: Understanding Column-based Read Disturbance in Real DRAM Chips and Implications for Future Systems [6.8] 実商品DRAMチップにおいて,新しい広汎な読み出し障害現象であるColumnDisturbを実験的に実証した。
我々は,DRAMカラムを介してDRAMセルを乱し,攻撃列と同じ列を共有するセルにビットフリップを誘導できることを示した。
ColumnDisturbでは、単一行の活性化が、最大3つのサブアレイにわたる細胞を同時に妨害する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:37:37 GMT)
DRO-InstructZero: Distributionally Robust Prompt Optimization for Large Language Models [6.8] DRO-InstructZeroは、ゼロショットプロンプト最適化を頑健なベイズ最適化として定式化する。
実験は、形式的な書き換え、コードのデバッグ、翻訳にマッチしたクエリ予算を備えた命令推論プロトコルに従う。
全体として、DRO-InstructZeroは分布的に堅牢な最適化と即時学習を結び、実世界の不確実性の下で信頼性があり、転送可能なプロンプトアライメントのためのプラグアンドプレイアプローチを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:55:48 GMT)
Deep Neural ODE Operator Networks for PDEs [6.7] 本稿では,ニューラル常微分方程式(ODE)演算子ネットワークフレームワークをNODE-ONetと呼ぶ。
このフレームワークは、3つのコアコンポーネントからなるエンコーダ・デコーダアーキテクチャを採用する。入力関数を空間的に識別するエンコーダ、潜時的ダイナミクスをキャプチャするニューラルODE、物理空間における解を再構成するデコーダである。
非線形拡散反応とナビエ・ストークス方程式の数値実験は、訓練時間枠を超えた高精度、計算効率、予測能力を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:42:57 GMT)
Flow Matching for Accelerated Simulation of Atomic Transport in Crystalline Materials [6.7] 原子輸送はエネルギー貯蔵や電子工学などの技術における材料の性能を支えている。
結晶材料のMDシミュレーションを高速化する生成フレームワークLiFlowを紹介する。
我々はLiFlowを4つの温度で4,186個のSSE候補にまたがる25-psのリチウム拡散軌道からなるデータセット上でベンチマークした。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:34:26 GMT)
Graph Neural Networks for the Offline Nanosatellite Task Scheduling Problem [6.7] 本研究では,グラフニューラルネットワーク(GNN)を用いて,ナノサテライトタスクをより効率的にスケジュールする方法を検討する。
目標は、QoS(Quality-of-Service)を考慮して、軌道上で実行するタスクの最適なスケジュールを見つけることである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:16:54 GMT)
EMCee: Improving Multilingual Capability of LLMs via Bridging Knowledge and Reasoning with Extracted Synthetic Multilingual Context [6.6] 大規模言語モデル(LLM)は、広範囲のタスクで目覚ましい進歩を遂げました。
英語中心のトレーニングデータに大きく依存すると、非英語言語ではパフォーマンスが大幅に低下する。
本稿では,クエリ関連知識を明示的に抽出し,活用することにより,LLMの多言語機能を向上させるフレームワークであるEMCeeを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:19:54 GMT)
Enhancing reliability in AI inference services: An empirical study on real production incidents [6.5] 本稿では,大規模言語モデル(LLM)推論インシデントに関する最初のプロバイダ間,実践ベースの分析手法を提案する。
我々は1年間の運用経験に基づく分類と方法論を開発し、156件の高重度事象を検証した。
本研究は,推論操作の系統的,経験的基礎解析が,大規模で信頼性が高く,コスト効率のよいLLMサービスを実現する方法を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:16:29 GMT)
The Economics of AI Foundation Models: Openness, Competition, and Governance [6.5] オープン性は、ファンデーションモデル(FM)エコシステムにおいて決定的な問題となっている。
2周期のゲーム理論モデルを構築し、AIバリューチェーンにおけるオープンネス競争がどのように変化するかを分析する。
解析の結果,データフライホイール効果の強度において,既存の第1周期の開度は驚くほど非単調であることがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:00:44 GMT)
The Hidden Cost of Modeling P(X): Vulnerability to Membership Inference Attacks in Generative Text Classifiers [6.5] メンバーシップ推論攻撃(MIA)は、モデルのトレーニングデータセットに特定のサンプルが含まれているかどうかを敵が判断できるようにすることで、重要なプライバシー上の脅威となる。
結合可能性$P(X,Y)$を明示的にモデル化した完全生成型分類器は、メンバシップリークに対して最も脆弱であることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:09:33 GMT)
Working with AI: Measuring the Applicability of Generative AI to Occupations [6.5] ユーザとMicrosoft Bing Copilot間の200万の匿名会話のデータセットを分析します。
私たちは、人々が情報収集や執筆に携わるAI支援を求める最も一般的な作業活動を見つけます。
AI自身が実行している最も一般的な活動は、情報と援助、執筆、教育、助言を提供することである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:35:24 GMT)
Small Ensemble-based Data Assimilation: A Machine Learning-Enhanced Data Assimilation Method with Limited Ensemble Size [6.4] 従来のアンサンブルカルマンフィルタ(EnKF)と完全連結ニューラルネットワーク(FCNN)を組み合わせた,機械学習に基づく新しいデータ同化手法を提案する。
本稿では,ロレンツ・システムと非線形海洋波動場シミュレーションを用いた数値実験により,提案手法の性能評価を行った。
その結果,従来のEnKFのアンサンブルサイズよりも高い精度を実現し,計算コストの低減が図られた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:47:02 GMT)
Emergence of irreversible decoherence from unitary dynamics [6.3] システム・リザーバ・ダイナミクスがシステム・デコヒーレンスを不可逆的に導く方法を示す。
貯水池の自由度を増やすことで、リバイバル可能な量子コヒーレンスが徐々に崩壊していくことが分かる。
この結果は,量子系の非可逆デコヒーレンスが創発的な現象であることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:21:02 GMT)
Exploring and Leveraging Class Vectors for Classifier Editing [6.3] 微調整中にクラス固有の表現調整をキャプチャするクラスベクトルを導入する。
タスクベクトルは重み空間のタスクレベル変化をエンコードするが、クラスベクトルは各クラス適応を潜在空間で切り離す。
クラスベクタが各クラスのセマンティックシフトをキャプチャし、これらのベクタに沿って潜在機能をステアリングするか、あるいはそれらを重み空間にマッピングして決定境界を更新することで、分類器の編集が実現できることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:53:12 GMT)
Zero-Shot Document-Level Biomedical Relation Extraction via Scenario-based Prompt Design in Two-Stage with LLM [6.3] ハードウェアと労働コストの低い汎用大言語モデル (LLM) を用いて, 注釈のない完全文書から同じ結果を得るための新しい手法を提案する。
我々のアプローチは、名前付きエンティティ認識(NER)と関係抽出(RE)の2つの主要な段階を組み合わせる。
本稿では,プロンプトの有効性を高めるために,5部テンプレート構造とシナリオに基づくプロンプト設計の原理を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:40:32 GMT)
Contextual Augmentation for Entity Linking using Large Language Models [6.2] 本稿では,エンティティ認識と曖昧さを統一されたフレームワークに統合する微調整モデルを提案する。
ベンチマークデータセットに対する我々のアプローチを評価し、いくつかのベースラインと比較した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:37:21 GMT)
Large-scale User Game Lifecycle Representation Learning [6.2] ビデオゲーム生産の急速な拡大は、オンラインゲームプラットフォームのための効果的な広告とレコメンデーションシステムの開発を必要としている。
推薦システムにおける数十億のアイテムを扱うための既存の表現学習手法は、ゲーム広告やレコメンデーションには適さない。
これは主に、数百のゲームが、大規模なユーザ表現学習に不足する、ゲームの範囲が原因である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:06:18 GMT)
StripRFNet: A Strip Receptive Field and Shape-Aware Network for Road Damage Detection [6.0] 道路表面の損傷は交通の安全を脅かし、持続可能な都市開発を妨げる。
3つのモジュールからなる新しいディープニューラルネットワークであるStripRFNetを提案する。
RDD2022ベンチマークの実験では、StripRFNetが既存のメソッドを超えることが示されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:01:48 GMT)
LILAC: Long-sequence Incremental Low-latency Arbitrary Motion Stylization via Streaming VAE-Diffusion with Causal Decoding [5.9] LILACは、任意のモーションスタイリングのための最近の高性能オフラインフレームワークの上に構築されている。
それは、スライディングウインドウの因果設計で、潜在空間のストリーミングアーキテクチャを通じて、オンライン環境に拡張する。
このアーキテクチャは、将来のフレームに依存したり、拡散モデルアーキテクチャを変更することなく、リアルタイムな任意のスタイル化を可能にする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:45:43 GMT)
Improving Intrusion Detection with Domain-Invariant Representation Learning in Latent Space [5.8] 本稿では,関連ドメイン間の情報を統合潜在空間に融合するマルチタスク表現学習手法を提案する。
分類,再構成,相互情報の正規化損失を共同で最適化することにより,素早い相関を解消する最小限(ボトルネック)のドメイン不変表現を学習する。
実験により, 各種異常検出データセットのゼロデイ, 新規異常検出において, 大幅な改善が認められた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:20:25 GMT)
OCR-Quality: A Human-Annotated Dataset for OCR Quality Assessment [5.8] OCR-Qualityは,OCRの品質評価手法の評価と開発を目的とした,人間による注釈付きデータセットである。
データセットは、300 DPIのPNGイメージに変換された1,000のPDFページで構成され、様々な現実世界のシナリオからサンプリングされる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:30:13 GMT)
D-TPT: Dimensional Entropy Maximization for Calibrating Test-Time Prompt Tuning in Vision-Language Models [5.8] テスト時適応パラダイムは、ドメインシフトに対する柔軟性を提供する。
VLM(Vision-Language Models)は、様々な下流タスクに一般化機能を利用する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:32:13 GMT)
The Cultural Mapping and Pattern Analysis (CMAP) Visualization Toolkit: Open Source Text Analysis for Qualitative and Computational Social Science [5.8] CMAPビジュアライゼーションツールキットは、テキストデータを解析して視覚化するためのオープンソーススイートである。
このツールキットは、パターン分析、データ可視化、社会科学における説明を統合する学者向けに設計されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:24:47 GMT)
Quantum Worst-Case to Average-Case Reduction for Matrix-Vector Multiplication [5.7] 最悪のケース対平均ケースの削減は、最悪のケースの硬さと平均ケースの計算困難の間の橋渡しとなる。
本研究では,量子設定に焦点をあて,行列の粒度乗算問題に対する新たな還元法を提案する。
我々は、成功確率に依存した平均ケース低減のための量子最悪のケースを得る。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:11:13 GMT)
Compressive Modeling and Visualization of Multivariate Scientific Data using Implicit Neural Representation [5.7] 我々は,数十から数百の変数を含むデータセットに対して,圧縮されたニューラル表現を開発する。
提案手法では,データ変数のレンダリング表現を同時に学習するために,単一のネットワークを利用する。
我々は、再構成データの品質、可視化品質、変数間の依存性情報の保存、ストレージ効率の点で優れた性能を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:09:55 GMT)
Towards more holistic interpretability: A lightweight disentangled Concept Bottleneck Model [5.7] 概念ボトルネックモデル(CBM)は、人間の理解可能な概念を中間表現として予測することにより、解釈可能性を高める。
本稿では,視覚的特徴を意味論的に意味のある構成要素に自動的に分類する軽量なDECBMを提案する。
3つの多様なデータセットの実験により、LCDBMはより高い概念とクラス精度を達成し、解釈可能性と分類性能の両方において従来のCBMよりも優れていたことが示されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:59:30 GMT)
Non-Hermitian and Liouvillian skin effects in magnetic systems [5.7] 非エルミート皮膚効果(NHSE)は非エルミート物理学の目印として現れており、輸送、トポロジー、センシングに大きく影響している。
ここでは、ボソニック貯水池に結合したスピン鎖の非エルミート力学とリウヴィリア力学の両方を探索する。
解析の結果、NHSEはキラルスピンカップリングと相反非局所散逸の相互作用に由来することが明らかとなった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:34:00 GMT)
SIADAFIX: issue description response for adaptive program repair [5.6] 本稿では,プログラム修復などの複雑なタスクにおいて,大規模言語モデルに基づくエージェントの能力を高めるために,高速かつ低速な思考を活用することを提案する。
特に,SIADAFIXと呼ばれる問題記述応答に基づく適応型プログラム修復手法を設計する。
提案手法はClaude-4 Sonnetモデルを用いて60.67%のpass@1性能を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:24:38 GMT)
Learning Unified Representations from Heterogeneous Data for Robust Heart Rate Modeling [5.5] 心拍数予測は、パーソナライズされた健康モニタリングとフィットネスにとって不可欠だが、実際のデータにデプロイする際には、しばしば重要な課題に直面している。
特徴セットの異なる断片化されたデバイス市場からのソース異質性と、個人や活動の異なる生理的パターンを反映したユーザ異質性である。
既存の方法では、デバイス固有の情報を破棄するか、ユーザ固有の違いをモデル化できず、実際のパフォーマンスを制限している。
本稿では、両不均一性に対する潜在表現を学習し、下流予測器を不均一なデータパターンの下で一貫した動作を可能にするフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:11:23 GMT)
Zeroth-Order Sharpness-Aware Learning with Exponential Tilting [5.4] 傾きパラメータ$t$でパラメータ化されたソフトシャープネスの目的を解くため、新しいゼロ階アルゴリズムを探索する。
傾斜SAMフレームワークのシャープネスの概念を正確に評価する。
我々の手法はSAMの変種に代えて、勾配のないメモリ効率の代替として利用することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:01:34 GMT)
Repairing Tool Calls Using Post-tool Execution Reflection and RAG [5.4] エージェントシステムは,Python関数やREST APIエンドポイント,kubectlなどのコマンドラインツールをコールすることで,外部システムと対話する。
これらのツールコールは、様々な構文的および意味的な理由で失敗することが多い。
大規模言語モデル(LLM)に基づくリフレクションとドメイン固有検索拡張生成(RAG)を組み合わせたポストツール実行コンポーネントを開発した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:50:37 GMT)
General-Purpose Robotic Navigation via LVLM-Orchestrated Perception, Reasoning, and Acting [5.3] Agentic Robotic Navigation Architecture (ARNA)は、LVLMベースのエージェントに知覚、推論、ナビゲーションツールのライブラリを装備する汎用フレームワークである。
実行時にエージェントは、現代のロボットスタックから引き出されたタスク固有のナビゲーションツールを自律的に定義し、実行します。
ARNAは最先端のEQA特異的アプローチより優れている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:19:22 GMT)
JEDA: Query-Free Clinical Order Search from Ambient Dialogues [5.3] JEDAはドメインdバイエンコーダで、標準順序を直接取得する。
環境対話の短いローリングウィンドウを符号化し、検索をトリガーする。
クエリフリーモードはノイズ耐性があり、障害やASRエラーに対する感度が低下する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:34:11 GMT)
Analytic 3D vector non-uniform Fourier crystal optics in arbitrary $\bar{\bar{\varepsilon}}$ dielectric [5.1] 相互空間における固有解析と実空間における光場伝播の3つの広く用いられている平面波面の比較を行った。
M.V.ベリー&M.R.デニスの2003年の均一平面波モデルから非一様フーリエ結晶光学へ展開する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:13:12 GMT)
Mixture of Experts Approaches in Dense Retrieval Tasks [5.1] DRMを一般化するための最終トランスフォーマー層の後,単一のMoEブロック(SB-MoE)を提案する。
本実験は,ドメイン内の有効性とゼロショットの一般化性の両方を評価するための2つの評価設定を含む。
BERT-BaseやContrieverのような多くのパラメータを持つDRMの場合、我々のモデルは検索性能を向上させるために、より多くのトレーニングサンプルを必要とする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:23:19 GMT)
Lightweight Data-Free Denoising for Detail-Preserving Biomedical Image Restoration [5.1] 現在の自己監督型復調技術は目覚ましい結果をもたらすが、実際の応用は計算やメモリの要求によってしばしば制限される。
高速デノイングと高画質画像復元を両立させる超軽量モデルを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:59:21 GMT)
Benchmarking Fake Voice Detection in the Fake Voice Generation Arms Race [5.1] 既存のベンチマークでは、さまざまな偽音声サンプルを単一のデータセットに集約して評価する。
このプラクティスは、メソッド固有のアーティファクトをマスクし、異なる世代パラダイムに対する検出器のさまざまなパフォーマンスを隠蔽する。
我々は,新しい1対1評価プロトコルによって17の最先端の偽音声生成装置と8つの先行検知器の相互作用を体系的に評価する,最初のエコシステムレベルのベンチマークを導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:17:02 GMT)
Recursive Inference for Heterogeneous Multi-Output GP State-Space Models with Arbitrary Moment Matching [5.0] 本稿では,ガウス過程状態空間モデル(GPSSM)として定式化する。
インジェクションポイント管理アルゴリズムは、各出力次元に対する独立選択およびプルーニングによる計算効率を向上させる。
合成および実世界のデータセットに対する実験により、提案手法は、SOTAオフラインGPSSMの精度とランタイムの1/100しか一致しないことが示された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:44:40 GMT)
WELD: A Large-Scale Longitudinal Dataset of Emotional Dynamics for Ubiquitous Affective Computing [5.0] 実際のオフィス環境において,38名の従業員が30.5ヶ月以上にわたって収集した表情記録から,733,651名からなる新しいデータセットを作成した。
各レコードは、深層学習に基づく表情認識から派生した7つの感情確率を含む。
データセットは新型コロナウイルス(COVID-19)のパンデミック期間に特化しており、主要な社会的出来事に対する感情的な反応を捉えている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:59:43 GMT)
Robust Anomaly Detection through Multi-Modal Autoencoder Fusion for Small Vehicle Damage Detection [4.9] 特にレンタカーやカーシェアリングサービスにおいて、車両および共有車両システムにおける摩耗と剥離の検出は重要な課題である。
現在、手動検査法がデフォルトの手法であるが、労働集約的であり、ヒューマンエラーの傾向にある。
本研究では,これらの問題に対処するために,異常検出に基づく新しいマルチモーダルアーキテクチャを導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:46:19 GMT)
Online Policy Learning via a Self-Normalized Maximal Inequality [4.9] マルティンゲール経験過程における自己正規化最大不等式を開発した。
逐次更新と標準複雑性とマージン条件で組み合わせると、推定器は高速収束率が得られることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:53:42 GMT)
Predicting gene essentiality and drug response from perturbation screens in preclinical cancer models with LEAP: Layered Ensemble of Autoencoders and Predictors [4.9] 既存の予測モデルは限定的、一般化可能性、解釈可能性に悩まされている。
自動エンコーダと予測器の階層化フレームワーク(LEAP)について紹介する。
LEAPは、モデリング戦略を越えて、未スクリーンのセルラインでの予測性能を一貫して改善する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:47:39 GMT)
Fix False Transparency by Noise Guided Splatting [4.8] 3DGSによって再構成された不透明な物体は、しばしば偽の透明な表面を示す。
この問題は、3DGSの不正な最適化に起因している。
我々は表面ガウシアンにより高い不透明度を採用するよう奨励する戦略を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:28:24 GMT)
Neural Mean-Field Games: Extending Mean-Field Game Theory with Neural Stochastic Differential Equations [4.8] 平均場ゲーム理論は、プレイヤーの多数から無限の人口のためにモデルに難解な近似ゲームに依存する。
平均場理論と深層学習を組み合わせたニューラルディファレンシャル方程式の形でのニューラル平均場ゲームを導入する。
このモデルはデータ駆動で軽量であり、平均場理論だけでは捉え難い広範な戦略的相互作用を学習することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:40:38 GMT)
Readability Reconsidered: A Cross-Dataset Analysis of Reference-Free Metrics [4.7] 本研究は, 可読性に対する人間の知覚を形作る要因について, 897の判断分析を通して検討した。
5つの英データセットにまたがる15の可読性メトリクスを評価し、それらを6つのよりニュアンスなモデルベースのメトリクスと比較した。
モデルに基づく4つの指標は、ランクと人間の判断の相関において上位4つに一貫して含まれ、最も優れた伝統的な指標は平均8.6である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:17:21 GMT)
Capabilities and Evaluation Biases of Large Language Models in Classical Chinese Poetry Generation: A Case Study on Tang Poetry [4.7] 大規模言語モデル(LLM)は、創造的領域にますます適用されつつあるが、古典中国語の詩生成や評価において、その性能はいまだによく分かっていない。
本稿では,計算量,LCM-as-a-judgeアセスメント,人間専門家による検証を組み合わせた3段階評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:00:37 GMT)
Memory-SAM: Human-Prompt-Free Tongue Segmentation via Retrieval-to-Prompt [4.7] Memory-SAMは、トレーニングなし、人間プロンプトなしのパイプラインである。
前のケースの小さなメモリから有効プロンプトを自動的に生成する。
その結果,検索とプロンプトは舌画像における不規則境界の,データ効率,ロバストなセグメンテーションを可能にすることが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:42:28 GMT)
MoPHES:Leveraging on-device LLMs as Agent for Mobile Psychological Health Evaluation and Support [4.6] 本稿では,精神状態評価,会話支援,専門的治療勧告を統合したMoPHESを提案する。
1つのエージェントは、ユーザーの精神状態を評価し、不安と抑うつの重症度を予測するために、メンタルヘルスのデータセットに基づいて微調整され、もう1つは、ユーザとの会話を扱うためのマルチターン対話に基づいて微調整される。
どちらのモデルも、ユーザの利便性を高め、ユーザのプライバシを保護するために、モバイルデバイスに直接デプロイされる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:22:42 GMT)
Post-Processing Methods for Improving Accuracy in MRI Inpainting [4.6] 塗布技術は、腫瘍領域の正常な脳組織を局所的に合成することを目的としている。
本研究では,最先端のインパインティングモデルを評価し,スタンドアローン性能の飽和を観察する。
本稿では,中央値フィルタリング,ヒストグラムマッチング,ピクセル平均化といった効率的な後処理戦略とモデルアンサンブルを組み合わせる手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:42:23 GMT)
Corrigibility Transformation: Constructing Goals That Accept Updates [4.6] 適切なゴール更新やシャットダウンを避けるためのアクションをインセンティブにしなければ、ゴールは修正可能である、と私たちは主張します。
コーリライザの正式な定義を提供し、次に、パフォーマンスを犠牲にすることなく、コーリライザ可能なゴールのコーリライザバージョンを構築する変換を導入します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:47:27 GMT)
Disentanglement of Sources in a Multi-Stream Variational Autoencoder [4.6] 変分オートエンコーダ(VAE)は、非絡み合った表現を学習する問題に対処する主要な手法である。
ここでは、個別のラテントを用いて、個々のソースのVAE表現を組み合わせることで、異なるアプローチを探求する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:54:56 GMT)
Elevating Cyber Threat Intelligence against Disinformation Campaigns with LLM-based Concept Extraction and the FakeCTI Dataset [4.5] 本稿では,繰り返しの物語から派生した高レベルな意味指標と偽情報キャンペーンの関係に着目した新しいCTIフレームワークを提案する。
フェイクニュースを偽ニュースキャンペーンや脅威アクターに体系的に関連付ける最初のデータセットであるFakeCTIを紹介する。
この研究は、低レベルのアーティファクトから永続的な概念構造へと焦点を移し、偽情報の追跡と対策にスケーラブルで適応的なアプローチを確立した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:26:31 GMT)
SAMix: Calibrated and Accurate Continual Learning via Sphere-Adaptive Mixup and Neural Collapse [4.5] Sphere-Adaptive Mixup (SAMix) は,神経崩壊に基づく手法に適した適応型混合戦略である。
SAMixは、ニューラル崩壊下の特徴空間の幾何学的性質に混合プロセスを適用し、より堅牢な正規化とアライメントを保証する。
実験の結果,SAMix は連続学習における SOTA 手法を超越し,性能を著しく向上し,モデルキャリブレーションも改善した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:36:46 GMT)
Leveraging LLMs for Context-Aware Implicit Textual and Multimodal Hate Speech Detection [4.4] 本研究では,Large Language Models (LLMs) を用いたテキストおよびマルチモーダルHate Speech Detection (HSD) の新しいアプローチを提案する。
名前付きエンティティとフルテキストプロンプトに焦点を当てた2つのコンテキスト生成戦略について検討した。
暗黙のヘイトスピーチのテキストLatent Hatredデータセットを用いて実験を行い、MAMIデータセットの擬似ミームのマルチモーダル設定に適用した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:28:57 GMT)
LibIHT: A Hardware-Based Approach to Efficient and Evasion-Resistant Dynamic Binary Analysis [4.4] LibIHTは、パフォーマンスへの影響を最小限に抑えてプログラム制御フローをキャプチャする、ハードウェア支援のトレースフレームワークである。
我々は,OSカーネルモジュールとユーザ空間ライブラリとしてLibIHTを実装し,良質なベンチマークプログラムと対向型アンチインストラメンテーションサンプルの両方で評価する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:42:33 GMT)
Face-MakeUpV2: Facial Consistency Learning for Controllable Text-to-Image Generation [4.4] Face-MakeUpV2は、顔IDの整合性と、参照画像との物理的特性の整合性を維持することを目的とした、顔画像生成モデルである。
実験では、Face-MakeUpV2は、顔IDを保存し、参照画像の物理的整合性を維持するという点で、最高の全体的な性能を達成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:31:08 GMT)
Blackwell's Approachability for Sequential Conformal Inference [4.4] 我々は、ブラックウェルのアプローチ可能性理論のレンズを通して、交換不能な環境における共形推論を研究する。
まず,適応型共形推論を2つのベクター値の繰り返し有限ゲームとして再キャストする。
次に、敵のプレーに対する潜在的な制限の下で、カバレッジと効率の目標を構築し、これらの目標を達成するためにキャリブレーションに基づくアプローチ可能性戦略を設計する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:06:47 GMT)
Bilinear Compressive Security [4.4] 我々は、異なる既知の$x_k$に対して$y$の繰り返し観測から$Q$を回収するために、かなり理想化された既知の攻撃を研究する。
BCSの主な結果によると、フィルタ$h$の対称性の弱い条件下では、$Q$を回収するには、$Omegaleft(maxleft(n,(n/s)2right)$ message $x_k$ if $s$-sparse の送信から広範囲にサンプリングする必要がある。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:32:25 GMT)
ISO/IEC-Compliant Match-on-Card Face Verification with Short Binary Templates [4.3] そこで本研究では,PCA-ITQにより64/128ビットのテンプレートをオフカードで生成する顔認証システムを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:42:56 GMT)
Ageing Drift in Binary Face Templates: A Bits-per-Decade Analysis [4.3] コンパクトな二面テンプレートの長手安定性について検討し,10年ごとの時効ドリフトを直接定量化する。
少なくとも3つの異なる年齢を持つAgeDBの各アイデンティティに対して、全ての真のペアを形成し、ハミング距離と絶対年齢差の同一性毎の線形モデルに適合する。
566のアイデンティティ全体では、64ビットテンプレートでは10年に1.357ビット、128ビットテンプレートでは2.571ビット、厳密な非パラメトリックなブートストラップ信頼区間では95%である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:56:49 GMT)
ASBI: Leveraging Informative Real-World Data for Active Black-Box Simulator Tuning [4.2] ブラックボックスシミュレータはロボット工学で広く使われているが、そのパラメータを最適化することは、アクセス不能な可能性のために難しいままである。
本研究では,実世界のオンラインデータを積極的に収集するロボットを用いたパラメータ推定フレームワークである能動シミュレーションベース推論(ASBI)を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:38:33 GMT)
GOGH: Correlation-Guided Orchestration of GPUs in Heterogeneous Clusters [4.2] 異種クラスタにおける機械学習ワークロードを管理するための学習ベースアーキテクチャを提案する。
システムはオンラインで運用され、エネルギー消費を最小化しながら、入ってくるトレーニングや推論要求にリソースを割り当てる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:44:10 GMT)
SQuAI: Scientific Question-Answering with Multi-Agent Retrieval-Augmented Generation [4.2] SQuAIは、科学的質問応答のためのスケーラブルで信頼性の高いマルチエージェント検索拡張生成フレームワークである。
SQuAIは、arXiv.orgから230万以上のフルテキストの論文に基づいて構築されており、複雑な質問をサブクエストに分解するために4つの協力エージェントを使用している。
我々のシステムは,強いRAGベースライン上での忠実度,回答関連性,文脈関連性を+0.088 (12%)向上させる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:20:55 GMT)
A Comparison of Independent and Joint Fine-tuning Strategies for Retrieval-Augmented Generation [4.2] 独立性, 関節性, 二相微調整を含む複数のRAG微調整戦略を評価し, 比較した。
最適な微調整戦略は、トレーニングデータセットにコンテキストラベルが含まれているかどうかに依存すると結論付けている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:14:41 GMT)
A Multiclass ROC Curve [4.2] 本稿では,多次元ギニ指数を用いた多次元ROC曲線の構成手法を提案する。
この枠組みは、医療と金融の総合的なケーススタディによって検証されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:55:07 GMT)
Information Theory in Open-world Machine Learning Foundations, Frameworks, and Future Direction [4.0] Open World Machine Learning (OWML)は、既知のカテゴリを認識し、未知のサンプルを拒絶し、新しい情報から継続的に学習できるインテリジェントなシステムを開発することを目的としている。
オープンセット認識、新規性検出、継続的な学習の進歩にもかかわらず、この分野には統一された理論基盤がない。
本稿では,オープンワールド機械学習における情報理論のアプローチを概観する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:20:56 GMT)
A Cycle-Consistency Constrained Framework for Dynamic Solution Space Reduction in Noninjective Regression [4.0] 本稿では,サイクル一貫性に基づくデータ駆動トレーニングフレームワークを提案する。
正規化合成およびシミュレーションデータセットの実験により,提案手法が0.003未満のサイクル再構成誤差を達成することを示した。
このフレームワークは手動による介入への依存を著しく減らし、非インジェクティブ回帰タスクの潜在的な利点を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:41:52 GMT)
How to Get Actual Privacy and Utility from Privacy Models: the k-Anonymity and Differential Privacy Families [4.0] プライバシモデルは、プライバシ保護データパブリッシングと統計開示制御に導入された。
定義に問題があるため、適切な保護保証の提供に失敗する可能性がある。
k-匿名性のセマンティックな再構築は、ユーティリティを失うことなく、より堅牢なプライバシを提供することができる、と我々は主張する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:07:58 GMT)
Data-Centric AI for Tropical Agricultural Mapping: Challenges, Strategies and Scalable Solutions [4.0] 本稿では,データ中心人工知能(DCAI)の視点とパイプラインを提唱する。
信頼性のある学習、コアセットの選択、データ拡張、アクティブな学習などのテクニックをレビューし、優先順位付けする。
このチュートリアルでは、実践的なソリューションを、熱帯農業のダイナミックな現実にもっと適したAIモデルのキュレーションとトレーニングのためのデータ中心のアプローチとして概説している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:40:09 GMT)
A Minimal-Assumption Analysis of Q-Learning with Time-Varying Policies [4.0] 時変学習ポリシーの下でQ-ラーニングアルゴリズムの最初の有限時間解析を行う。
その結果、政治上のQ-ラーニングは、政治外のQ-ラーニングよりも探究が弱いことが判明した。
数値シミュレーションは我々の理論を裏付ける。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:19:00 GMT)
Quantifying the Engagement Effectiveness of Cyber Cognitive Attacks: A Behavioral Metric for Disinformation Campaigns [3.8] 本稿では,重み付きインタラクションメトリクスを導入することにより,認知的攻撃のエンゲージメント効果を測定するための新しい枠組みを提案する。
このモデルをソーシャルメディアプラットフォーム全体にわたる現実世界の偽情報キャンペーンに適用することにより、計測値の到達だけでなく、ユーザのエンゲージメントの行動深度も示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:34:46 GMT)
Trust Region Bayesian Optimization of Annealing Schedules on a Quantum Annealer [3.7] 本稿では,アディバティックな量子計算スケジュールを調整する信頼領域ベイズ最適化フレームワークを提案する。
TuRBOは、エネルギー、実現可能な解確率、連鎖破壊率において、ランダムで欲求的な探索よりも優れたスケジュールを一貫して識別する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:19:21 GMT)
Demo: Guide-RAG: Evidence-Driven Corpus Curation for Retrieval-Augmented Generation in Long COVID [3.7] 慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期における慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期における6症例
臨床ガイドラインと高品質な体系的レビューを併用したRAGコーパスの構成は,狭い単一ガイドラインアプローチと大規模文献データベースの両方で一貫して優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:05:52 GMT)
Geometric Convergence Analysis of Variational Inference via Bregman Divergences [3.7] Vari rigorous Inference (VI)は、Low Evidence (ELBO)による推論のためのスケーラブルなフレームワークを提供する
指数関数的家族分布を利用して客観収束を解析するための新たな理論的枠組みを確立する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:30:05 GMT)
MalCVE: Malware Detection and CVE Association Using Large Language Models [3.7] MalはCVEとバイナリマルウェアを関連付ける最初のツールで、recall@10の65%を達成した。
また、CVEとバイナリマルウェアを関連付ける最初のツールでもある。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:55:46 GMT)
Distributed Quantum Information Processing: A Review of Recent Progress [3.7] 分散量子情報処理は、モノリシック量子デバイスのスケーラビリティの限界を克服しようとしている。
本稿では,分散量子プロトコルの理論的基礎を概観し,実際に実現した実験プラットフォームとアルゴリズムアプリケーションについて検討する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:20:36 GMT)
VERITAS: Leveraging Vision Priors and Expert Fusion to Improve Multimodal Data [3.6] VERITASは、SFTデータ品質を向上させるために、ビジョン先行と複数の最先端LMMを統合するパイプラインである。
3つのLMMが元の答えを評価し、信頼性の高いスコアに統計的に融合した批判的合理性とスコアを提供する。
我々の批評家モデルは、最先端のLMMに匹敵する拡張能力を示しながら、より効率的である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:13:50 GMT)
Online Kernel Dynamic Mode Decomposition for Streaming Time Series Forecasting with Adaptive Windowing [3.6] WORK-DMD(Windowed Online Random Kernel Dynamic Mode Decomposition)を導入する。
WORK-DMDはローリングウィンドウ内でシャーマン・モリソンの更新を採用しており、現在のデータのみから進化するダイナミックスへの継続的な適応を可能にしている。
いくつかの領域にわたるベンチマークデータセットの実験は、WORK-DMDがいくつかの最先端のオンライン予測手法よりも高い精度を達成することを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:57:37 GMT)
The Right to Be Remembered: Preserving Maximally Truthful Digital Memory in the Age of AI [3.5] 大規模言語モデル(LLM)は、複数の視点をひとつの回答に分解することで、その効果を増幅することができる。
ある物語、個人または集団は不均等に抑圧されうるが、他の物語は不均等に抑圧される。
本稿では,AIによる情報消去のリスクを最小限に抑えたRTBR(Right To Be Remembered)の概念を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:38:12 GMT)
Turning Sand to Gold: Recycling Data to Bridge On-Policy and Off-Policy Learning via Causal Bound [3.4] 我々は、Neyman-Rubin ポテンシャル結果フレームワークをDRLに活用する新しい理論結果を紹介した。
反事実的損失の境界に焦点をあてるほとんどの方法とは異なり、我々は事実的損失に因果関係を確立する。
このバウンダリは、過去の値ネットワーク出力をエクスペリエンス再生バッファに格納することで計算される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:03:01 GMT)
Towards Proactive Defense Against Cyber Cognitive Attacks [3.4] サイバー認知攻撃は破壊的革新(DI)を活用し、心理的バイアスを利用して意思決定プロセスを操作する。
AI駆動の偽情報や合成メディアといった新しい技術は、これらの脅威の規模と洗練を加速してきた。
認知攻撃におけるDIの出現とその悪用を予測する新しい予測手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:25:47 GMT)
Probing phase transitions in non-Hermitian systems with quantum entanglement [3.3] 非エルミート異方性スピン-$frac12$XYモデルとXXZモデルの量子絡み合いと量子相転移について検討する。
コンカレンス, 負性度, 相互情報, 量子コヒーレンスなど, 様々な絡み合い対策について検討した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:51:28 GMT)
Advancing Routing-Awareness in Analog ICs Floorplanning [3.3] 我々は、強化学習とリレーショナルグラフ畳み込みニューラルネットワークに基づく自動フロアプランニングエンジンを開発する。
グリッド解像度の増大と正確なピン情報の統合、動的ルーティングリソース推定技術の組み合わせにより、ルーティングと領域効率のバランスがとれる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:39:24 GMT)
Bayesian Optimization with Preference Exploration using a Monotonic Neural Network Ensemble [3.3] 本稿では,ニューラルネットワークアンサンブルを実用的サロゲートモデルとして用いることを提案する。
このアプローチは自然に単調性を統合し、ペア比較データをサポートする。
アブレーション研究は、パフォーマンス向上における単調性の重要性を強調している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:46:35 GMT)
Dissecting Mahalanobis: How Feature Geometry and Normalization Shape OOD Detection [3.2] ディープラーニングモデルの信頼性確保には,アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
我々の研究は、マハラノビスに基づく手法は普遍的に信頼性がないことを示している。
本稿では,最近マハラノビスを用いたOOD検出に適用された標準$ell$正規化を一般化する手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:04:19 GMT)
KGAlign: Joint Semantic-Structural Knowledge Encoding for Multimodal Fake News Detection [3.2] 本稿では,視覚的,テキスト的,知識に基づく表現を統合した,新しいマルチモーダルフェイクニュース検出フレームワークを提案する。
本提案では,知識基底型マルチモーダル推論という新たなパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:44:16 GMT)
SpikeVox: Towards Energy-Efficient Speech Therapy Framework with Spike-driven Generative Language Models [3.1] SpikeVoxは、エネルギー効率の良い音声治療ソリューションを実現するための新しいフレームワークである。
SpikeVoxは音声認識モジュールを使用して、高精度な音声からテキストへの変換を行う。
また、治療のための適切なエクササイズを生成し、フィードバックとして正しい発音に関するガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:54:55 GMT)
TriAgent: Automated Biomarker Discovery with Deep Research Grounding for Triage in Acute Care by LLM-Based Multi-Agent Collaboration [3.0] 世界の救急医療機関は、患者数の増加、労働力不足、トリアージ決定のばらつきに直面している。
この課題に対処するために,大規模言語モデル(LLM)ベースのマルチエージェントフレームワークであるTriAgentを紹介した。
TriAgentは、バイオマーカーの自動発見と、文学的根拠による検証と新規性評価のための深い研究を結合する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:26:29 GMT)
Finetuning LLMs for EvaCun 2025 token prediction shared task [3.0] 本稿では,EvaCun 2025のトークン予測タスクについて述べる。
我々のsys-temsは、主催者が提供するタスクデータに基づいて微調整されたLLMに基づいている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:47:02 GMT)
Provably Efficient Reward Transfer in Reinforcement Learning with Discrete Markov Decision Processes [2.9] 我々は、強化学習における報酬適応(RA)のための新しいソリューションを提案する。
本稿では,Q関数の操作によるRAに対する新しいアプローチを提案する。
この手法を "Q-Manipulation" (Q-M) と呼ぶ。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:23:05 GMT)
Cortical-SSM: A Deep State Space Model for EEG and ECoG Motor Imagery Decoding [2.9] 我々は,脳波とECoG信号の統合的な依存関係を捉えるために,深部状態空間モデルを拡張する新しいアーキテクチャであるCortical-SSMを提案する。
我々は,1)50名以上の被験者を含む大規模MI EEGデータセットと,2)筋萎縮性側索硬化症患者から得られたMI ECoGデータセットの3つのベンチマークで,本手法を検証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:13:55 GMT)
Interpretable RNA-Seq Clustering with an LLM-Based Agentic Evidence-Grounded Framework [2.8] CITE V.1は、RNA-seqクラスタの透過的で再現可能な解釈を提供するための、エージェント的でエビデンスを基盤としたフレームワークである。
このフレームワークは3つの専門的なエージェントを編成する: PubMedとUniProtからドメイン知識を収集するRetriever、機能仮説を定式化するInterpreter、クレームを評価し、証拠を根拠にし、信頼性と信頼性の指標を通じて不確実性を評価するCryticsである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:56:05 GMT)
"Mirror" Language AI Models of Depression are Criterion-Contaminated [2.8] 誤り」モデルは、うつ病評価スコアを予測するために、うつ病評価から直接言語反応に依存する。
我々は「ミス」モデルと「ノンミス」モデルを比較し、他の外部言語を用いて抑うつスコアを予測する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:58:29 GMT)
Extending Prediction-Powered Inference through Conformal Prediction [2.8] 多くのアプリケーションは、継続的な分散シフトの下での、プライバシー、堅牢性、妥当性などの有効な推論以外に、強い特性を必要とする。
我々は、予測駆動推論と共形予測を結びつけることでこの問題を解決する。
我々は、e値とe値に基づく手順と同様に、手段、Z、M推定の手順をインスタンス化する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:09:07 GMT)
Three-dimensional inversion of gravity data using implicit neural representations [2.7] 重力データのインバージョンは、多様な応用に関連する地下密度の変動を研究する重要な方法である。
ここでは,三次元重力インバージョンを連続場として表す科学的機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:55:08 GMT)
The Elephant in the Coreference Room: Resolving Coreference in Full-Length French Fiction Works [2.7] 完全長のフランス小説3冊の注釈付きコーパスを新たに導入し,合計285,000枚以上のトークンを紹介した。
より短いテキストに焦点を当てた以前のデータセットとは異なり、私たちのコーパスは、長く複雑な文学作品によって引き起こされる課題に対処します。
我々のアプローチは競争力があり、長いドキュメントに対して効果的にスケールできることが示されます。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:40:33 GMT)
DRL-Based Resource Allocation for Energy-Efficient IRS-Assisted UAV Spectrum Sharing Systems [2.6] IRS支援無人航空機(UAV)システムは、再構成可能で柔軟な無線通信のための新しいパラダイムを提供する。
本稿では、周波数分割多重化(OFDM)を用いた新しいIRS支援UAV帯域共有システムを提案する。
物理的に接地された推進エネルギーモデルが採用され、その強い上界はスペクトル共有系に対するトラクタブルEEの下限を形成するために使用される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:18:17 GMT)
Causal Time Series Modeling of Supraglacial Lake Evolution in Greenland under Distribution Shift [2.6] 因果モデリングは、時系列データの安定で不変な関係を明らかにするための原則的な基礎を提供する。
RIC-TSCは,ラグを意識した因果発見を直接シーケンスモデリングに組み込む,局所的にインフォームドされた因果時系列分類フレームワークである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:06:08 GMT)
Theory of periodic convolutional neural network [2.5] 我々は、周期境界条件を畳み込み層に組み込んだ、長周期CNNと呼ばれる新しい畳み込みニューラルネットワークアーキテクチャを導入する。
周期的CNNは、$d-1$の線形変数に依存するリッジ関数を$d$次元の入力空間で近似することができる。
この結果から, 周期的CNNは, 高内在次元の隆起構造が自然に認められる問題に特に適していることが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:08:12 GMT)
An Experimental Study of Real-Life LLM-Proposed Performance Improvements [2.5] 大きな言語モデル(LLM)はコードを生成することができますが、高速コードを生成することができますか?
我々は,オープンソースのJavaプログラムから抽出した65の実世界のタスクのデータセットを用いて,この問題を研究する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:06:52 GMT)
Benchmarking non-Clifford gates using only Pauli twirling group [2.3] 量子ゲートベンチマークは、状態準備と測定誤差の影響が避けられない。
実際には、局所的なツイリングゲートは、高い忠実度と実験的実現性のために好まれる。
本稿では、局所的なパウリ演算のみを用いて、量子チャネルに対するパウリ転送行列要素を推定するパウリ転送文字ベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:38:17 GMT)
NarraBench: A Comprehensive Framework for Narrative Benchmarking [2.3] 本稿では,ナラベンチ(Narra Bench)について紹介する。
既存のベンチマークでは、ストーリータスクの27%しかうまく捉えられていないと見積もっています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:12:57 GMT)
Safe, Efficient, and Robust Reinforcement Learning for Ranking and Diffusion Models [2.2] 論文は、強化学習手法が安全で、サンプル効率が高く、堅牢であるようにどのように設計できるかを調査する。
コンテキスト帯域RLの統一的な視点から判断されたこの作業は、ランキングとレコメンデーション、テキストから画像への拡散モデルという2つの主要なアプリケーション領域に対処する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:37:38 GMT)
Designing a Convolutional Neural Network for High-Accuracy Oral Cavity Squamous Cell Carcinoma (OCSCC) Detection [2.2] 本研究の目的は,口腔扁平上皮癌を認識するために訓練された畳み込みニューラルネットワークを開発することである。
CNNは良性腫瘍と悪性腫瘍と陰性サンプルからなる4293の訓練画像で訓練された。
解像度が増大する画像は対数スケールで高い精度の予測を行い、高いピクセル数のリターンが低下することを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:55:48 GMT)
Implicit neural representations for accurate estimation of the standard model of white matter [2.2] 本研究は、暗黙的ニューラル表現(INR)に基づく推定フレームワークを導入する。
INRは入力座標の正弦波符号化による空間正則化を含む。
SMパラメータの推定におけるINR法の精度は,特に低信号対雑音条件において優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:52:31 GMT)
Latent Feature Alignment: Discovering Biased and Interpretable Subpopulations in Face Recognition Models [2.1] Latent Feature Alignment (LFA) は属性ラベルなしのアルゴリズムで、潜在方向を使ってサブポピュレーションを識別する。
LFAは群内セマンティックコヒーレンスにおいて、k-平均と最近傍探索を一貫して上回る。
これらの結果から,LFAを顔認識モデルの表現監査の実践的手法として位置づけた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:49:50 GMT)
UNet with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning for Medical Image Segmentation [2.1] 既存のディープラーニングモデルは、効率と精度のトレードオフに直面している。
2つの重要なイノベーションを取り入れた新しいU字型アーキテクチャであるSAMA-UNetを提案する。
MRI、CT、内視鏡のデータセットの実験では、SAMA-UNetはCNN、Transformer、Mambaベースの手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:18:49 GMT)
Exploring the Synergy of Quantitative Factors and Newsflow Representations from Large Language Models for Stock Return Prediction [2.1] 定量的投資では、リターン予測は株式選択、ポートフォリオ最適化、リスク管理など様々なタスクをサポートする。
ニュースや文字起こしのような構造化されていない財務データは、近年の大規模言語モデル(LLM)の進歩によって、注目を集めている。
本稿では,リターン予測と株価選択において,マルチモーダル要因とニューズフローを活用する効果的な手法について検討する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:35:03 GMT)
CQD-SHAP: Explainable Complex Query Answering via Shapley Values [2.0] 複雑なクエリ応答(CQA)は、よく研究されたリンク予測タスクを超えます。
CQD-SHAP(CQD-SHAP)は,特定の解のランク付けに対する各問合せ部分の寄与を計算する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:09:26 GMT)
Standardization for improved Spatio-Temporal Image Fusion [2.0] 本稿では,STIF法の適用を容易にするために,2つの異なる標準化手法を提案し,比較する。
第1の方法は、高解像度画像の従来のアップスケーリングに基づいている。
第2の方法は、細粒度画像シリーズに見られる全体的な特徴と、特定の粗い解像度画像の特徴をブレンドするシャープニング手法である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:35:35 GMT)
Improved Approximation Algorithms for Low-Rank Problems Using Semidefinite Optimization [2.0] そこで我々は,低ランク最適化問題に対する類似の緩和戦略を構築した。
与えられた$n × m$ の半直交行列に対して、我々はアルゴリズムに対して純粋に乗法的近似比を導出する。
我々は、新しい半有限緩和法を開発することにより、一般の低ランク最適化問題にアプローチを拡張した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:54:29 GMT)
Fault Cause Identification across Manufacturing Lines through Ontology-Guided and Process-Aware FMEA Graph Learning with LLMs [2.0] 本研究では,製造領域の概念化とグラフニューラルネットワーク(GNN)推論を組み合わせることにより,FMEA再利用性を高めるプロセス認識フレームワークを提案する。
自動車用圧力センサ組立ラインのケーススタディでは,提案手法が最先端の検索強化生成(RAG)ベースラインより優れていることが示された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:35:47 GMT)
Automated C-Arm Positioning via Conformal Landmark Localization [1.9] 我々は,X線画像を利用してCアームを解剖学的ランドマークに自律的にナビゲートするパイプラインを提案する。
操作テーブル上の任意の開始位置から入力されたX線画像が与えられた場合、モデルは、体に沿った各目標ランドマークに対する3次元変位ベクトルを予測する。
我々は、DeepDRRから生成された合成X線データセットに対するアプローチを検証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:04:08 GMT)
Grassroots Logic Programs: A Secure, Multiagent, Concurrent, Logic Programming Language [1.8] Grassrootsプラットフォームは、暗号化された人々によって、ネットワーク化されたパーソナルデバイス上で実行される分散アプリケーションである。
本稿では,草の根プラットフォームを実装するためのセキュアでマルチエージェントな並列論理型言語であるGrassroots Logic Programs (GLP)を紹介する。
本稿では、ピアツーピア接続を認証し、セキュアな草の根ソーシャルネットワーキングアプリケーションを示す草の根ソーシャルグラフプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:34:27 GMT)
Scaling Multi Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles [1.8] マルチエージェント強化学習は、サンプル非効率で悪名高い。
GazeboのLRAUVのような高忠実度シミュレータは、リアルタイムのシングルロボットシミュレーションを100倍高速にする。
本稿では,高忠実度シミュレーションをGPU加速環境へ伝達する反復蒸留法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:57:11 GMT)
GRATING: Low-Latency and Memory-Efficient Semantic Selection on Device [1.8] クロスエンコーダリランカによるトップK選択は、検索強化生成、エージェントメモリ、パーソナライズされたレコメンデーションなど、デバイス上のAIサービスを支えるものだ。
トップK選択の目的を再考し、相対ランクのみが重要であり、正確な候補毎のスコアではないことを明らかにした。
我々はモノリシックフォワードを提案し、トレーニング不要な推論システムGRatingを開発した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:06:09 GMT)
A Multimodal Lightweight Approach to Fault Diagnosis of Induction Motors in High-Dimensional Dataset [1.8] 誘導電動機(IM)の正確なAIベースの診断システムは、プロアクティブなメンテナンスを強化し、計画外のダウンタイムを軽減し、産業環境における全体的なメンテナンスコストを抑制する可能性を秘めている。
研究者らは、信号処理(SP)、機械学習(ML)、ディープラーニング(DL)、BRB故障のハイブリッドアーキテクチャを用いた様々な故障診断手法を提案している。
本稿では,1,2,3,4のBRB断層を電流信号と振動信号データを用いて診断するために,ShuffleNetV2というトランスファーラーニングに基づく軽量DLモデルを用いて,BRB断層の大規模データを実装する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:19:41 GMT)
Floquet Engineering Clock Transitions in Magnetic Molecules [1.7] 本研究では, 金属中心の電子スピンに結合する時間周期磁場による磁性分子のフロケット工学について検討する。
顕著なことに、線形偏極Floquet制御の作用の下では、クロック遷移量子ビットのエネルギー準位は、外部の静磁場の変動に対する安定性を維持する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:37:52 GMT)
Traces Propagation: Memory-Efficient and Scalable Forward-Only Learning in Spiking Neural Networks [1.7] スパイキングニューラルネットワーク(SNN)は、動的時間信号を処理するための効率的なフレームワークを提供する。
SNNのトレーニングにおける重要な課題は、空間的および時間的クレジット割り当ての両方を解決することである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:31:33 GMT)
C-arm Guidance: A Self-supervised Approach To Automated Positioning During Stroke Thrombectomy [1.6] 本稿では,レグレッションベースのプレテキストタスクを用いて,様々な骨格のランドマークを分類する自己教師型フレームワークを提案する。
本実験は, 回帰および分類タスクにおいて, 既存の手法より優れていることを示す。
今後の作業は、このフレームワークを完全自律的なC-armコントロールへと拡張することに集中する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:31:53 GMT)
Commuting Embeddings for Parallel Strategies in Non-local Games [1.6] 非局所ゲームは、量子相関を求めるための多用途フレームワークを提供する。
有限次元において、複数のゲームを平行にプレイする標準的な方法は、局所ヒルベルト空間のテンソル積を必要とする。
代数的埋め込みを利用して, この加算コストを低減できることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:00:09 GMT)
CorrSteer: Generation-Time LLM Steering via Correlated Sparse Autoencoder Features [1.6] 提案するCorrSteerは,サンプルの正しさとSAEのアクティベーションを推論時に生成したトークンから関連付けて特徴を選択する。
我々の研究は、言語モデルアプリケーション間での自動SAEステアリングのための効果的でスケーラブルなアプローチとして相関ベースの選択を確立する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:57:10 GMT)
Migration as a Probe: A Generalizable Benchmark Framework for Specialist vs. Generalist Machine-Learned Force Fields [1.6] 機械学習力場(MLFF)は、分子動力学スケールでのアブ初期レベルの精度を実現することによって、計算材料科学を変革している。
研究者たちは、スペシャリストモデルをスクラッチから訓練するか、ファウンデーショナリストのファンデーションモデルを使うべきか、ハイブリッドアプローチを使うべきか?
本稿では, 弾性バンドトラジェクトリを用いて診断プローブとして評価する, 欠陥マイグレーション経路を用いたベンチマークフレームワークを提案する。
微調整モデルでは、運動特性に対するゼロショットおよびゼロショットのアプローチよりも大幅に優れるが、長距離物理学の部分的な損失を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:12:36 GMT)
Code Contribution and Credit in Science [1.5] 本研究では,ソフトウェア開発活動が協調的な科学的環境における信用配分にどのように影響するかを検討する。
記事の約30%には、非著者のコードコントリビュータが含まれている。
コードに頻繁に貢献する著者は、非コーディングの同僚よりも徐々に低いhインデックスを示します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:17:38 GMT)
Poultry Farm Intelligence: An Integrated Multi-Sensor AI Platform for Enhanced Welfare and Productivity [1.5] 養鶏業は、動物福祉と環境コンプライアンスを確保しつつ、生産性目標を達成する圧力が高まる。
しかし、中小規模の農場の多くは、継続的な監視と意思決定のための安価な統合されたツールを欠いている。
本稿では,6つのAIモジュールを統合するモジュール型で費用対効果の高いプラットフォームであるPoultry Farm Intelligence(PoultryFI)について述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:43:02 GMT)
Unmasking Facial DeepFakes: A Robust Multiview Detection Framework for Natural Images [1.5] 顔の特徴を複数のレベルで分析することで、ディープフェイク検出を強化するマルチビューアーキテクチャを提案する。
提案手法は,3つの特殊エンコーダ,境界不整合を検出するグローバルビューエンコーダ,テクスチャと色調を解析する中間ビューエンコーダ,表情領域の歪みを捉えるローカルビューエンコーダを統合した。
これらのエンコーダから特徴を融合させることにより、難易度の高いポーズや照明条件下であっても、操作された画像の検出において優れた性能が得られる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:16:04 GMT)
MAYA: Addressing Inconsistencies in Generative Password Guessing through a Unified Benchmark [1.4] 本稿では,生成パスワードゲスティングモデルのための統一的,カスタマイズ可能な,プラグイン・アンド・プレイベンチマークフレームワークMAYAを紹介する。
我々は6つの最先端のアプローチを総合的に評価し、標準化を確実にするために再実装し、適応した。
以上の結果から,これらのモデルが人間のパスワード分布の異なる側面を効果的に捉え,強力な一般化能力を示すことが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:15:42 GMT)
Towards Supporting Open Source Library Maintainers with Community-Based Analytics [1.4] 本稿では,OSSライブラリが依存エコシステム全体にわたってどのように利用されているかを分析するために,コミュニティベースの分析手法を提案する。
私たちの結果は,ライブラリ開発者が幅広いAPIメソッドを提供している一方で,依存するエコシステムが積極的に使用しているのは16%に過ぎません。
開発者がテストスイートをコミュニティが使用しているAPIに従って評価するのに役立つ2つの指標を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:15:59 GMT)
Personalized Semi-Supervised Federated Learning for Human Activity Recognition [1.4] 我々は人間活動認識(HAR)のための新しいハイブリッド手法であるFedARを提案する。
FedARは、半教師付き学習と連合学習を組み合わせて、両方のアプローチの強みを活用する。
提案手法を2つの公開データセット上で評価した結果,FedARが認識率とパーソナライズ能力に到達したことを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:41:50 GMT)
Light-Weight Diffusion Multiplier and Uncertainty Quantification for Fourier Neural Operators [1.3] 本研究では拡散型ニューラル演算子パラメトリゼーションであるDINOZAURを紹介する。
提案手法は,複数のPDEベンチマークにおいて,競合や優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:38:43 GMT)
In Generative AI We (Dis)Trust? Computational Analysis of Trust and Distrust in Reddit Discussions [1.3] 本稿では,GenAIにおける信頼と不信に関する最初の計算的研究について述べる。
代表的なサンプルのクラウドソースアノテーションと分類モデルを組み合わせて分析を行った。
信頼と不信は時間とともにほぼバランスを取り、主要なモデルリリースにシフトしています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:33:57 GMT)
DGME-T: Directional Grid Motion Encoding for Transformer-Based Historical Camera Movement Classification [1.3] 2つの現代コーパスを4つの標準クラスに統合し、HISTORIANコレクションを5つのバランスの取れたカテゴリに再構成する統一ベンチマークを組み込むことで、ギャップを埋める。
このベンチマークに基づいて,ビデオスウィントランスの軽量拡張であるDGME-Tを導入する。
クロスドメイン研究は、現代データにおける中間的な微調整段階が、過去のパフォーマンスを5ポイント以上増加させることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:14:11 GMT)
ClapperText: A Benchmark for Text Recognition in Low-Resource Archival Documents [1.3] ClapperTextは、視覚的に劣化した低リソース設定で手書きおよび印刷されたテキスト認識のためのベンチマークデータセットである。
データセットは、第2次世界大戦時代のクラッパーボードを含む127のアーカイブビデオセグメントに由来する。
クラッパーボードのテキストを認識することは、動きのぼやけ、手書きのバリエーション、露出のゆらぎ、散らかった背景など、大きな課題を生んでいる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:44:08 GMT)
SYMI: Efficient Mixture-of-Experts Training via Model and Optimizer State Decoupling [1.3] Mixture-of-Experts (MoE)モデルは、計算の線形増加を伴わずに、モデルサイズを拡大し続けるために広く採用されているソリューションとなっている。
現在のシステムでは、人気のある専門家に割り当てられたトークンをドロップするか、収束を低下させるか、あるいは人気に基づいて各専門家に割り当てられたリソースを頻繁に再バランスさせなければならない。
適応型MOEトレーニングシステムであるSYMIを紹介する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:36:11 GMT)
Changing Base Without Losing Pace: A GPU-Efficient Alternative to MatMul in DNNs [1.2] 本稿では,ニューラルネットワークにおけるMatMulsの代替的バイリニア演算子を提案する。
実験により,STLはFLOPを2.66倍減らしながらタイルの4x4 MatMulを近似でき,FLOPを低下させながらSoTA T2T-ViT-7(4.3Mパラメータ)のImagenet-1K精度を向上させることができることがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:16:14 GMT)
Evaluating Prompting Strategies and Large Language Models in Systematic Literature Review Screening: Relevance and Task-Stage Classification [1.2] 本研究では,大規模言語モデル (LLM) と戦略がどう相互作用するかを定量化し,体系的な文献レビューのスクリーニング段階を自動化する。
GPT-4o, GPT-4o-mini, DeepSeek-Chat-V3, Gemini-2.5-Flash, Claude-3.5-Haiku, Llama-4-Maverickの6種類のLCMを5種類のプロンプト型で評価した。
CoT-Few-shotは、最も信頼性の高い精度とリコールのバランス、ゼロショットは高感度パスのリコールを最大化し、自己反射はモデル全体の過度な傾きと不安定さによって不利益となる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:53:09 GMT)
Minimisation of Submodular Functions Using Gaussian Zeroth-Order Random Oracles [1.2] オフラインの場合、このアルゴリズムのグローバルな$epsilon$-approximateソリューションへの収束性を証明する。
オンラインの場合,静的な後悔に関して,アルゴリズムは漢南一致であることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:36:46 GMT)
High-dimensional Path-Encoded Entanglement Distribution Between Photonic Chips Enabled by Multimode Phase Stabilisation [1.1] フォトニックチップ間での4次元経路符号化量子状態の分布を,新しい多モード位相安定化アルゴリズムにより実証する。
局所射影測定の最小値を用いて、2つのチップで完全な量子状態トモグラフィーを行うことができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:06:03 GMT)
Adaptive transfer learning for surgical tool presence detection in laparoscopic videos through gradual freezing fine-tuning [1.1] 最小侵襲手術は、高度な分析と補助を可能にする自動手術ツール検出の恩恵を受けることができる。
外科的設定における注釈付きデータの可用性の制限は、堅牢なディープラーニングモデルをトレーニングする上での課題となる。
本稿では,線形探索段階と漸進凍結段階の2段階からなる適応微調整手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:17:52 GMT)
Quantum bounds for compiled XOR games and $d$-outcome CHSH games [1.1] Kalai et al. のコンパイル手順は、2種類のゲームに対する量子境界を保存することを示す。
任意の qubit の測定に対して、XOR ゲームが存在し、その最適な勝利確率はその測定の特定のペアの自己テストとして機能する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:12:41 GMT)
Error analysis of a compositional score-based algorithm for simulation-based inference [1.1] 本稿では,LinhartらによるGAUSSアルゴリズムによる合成スコアについて検討する。
2024年、個々のスコアエラーと観測回数の両方の観点から平均2乗誤差の上限を確立する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:56:25 GMT)
EgMM-Corpus: A Multimodal Vision-Language Dataset for Egyptian Culture [1.0] エジプト文化専用のマルチモーダルデータセットであるEgMM-Corpusを紹介する。
データセットの各エントリは、文化的信頼性とマルチモーダルコヒーレンスのために手動で検証される。
EgMM-Corpusにおけるコントラスト言語-画像事前学習CLIPのゼロショット性能を評価する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:21:01 GMT)
Still Competitive: Revisiting Recurrent Models for Irregular Time Series Prediction [1.0] GRUwE:指数基底関数付きGated Recurrent Unitを提案する。
GRUwEは、レグレッションベースの予測とイベントベースの予測の両方を連続的にサポートする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:04:16 GMT)
Propelling force from asymmetrically excited quantum vacuum with conventional mirrors [1.0] 従来の$delta$ミラーを用いて真空中から推進力を得るカシミール装置の設計を提案する。
この推進から生じる全ての粒子は優先的に右動しているので、空洞は左向推進力を得る。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:26:19 GMT)
Fine-Tuning MedGemma for Clinical Captioning to Enhance Multimodal RAG over Malaysia CPGs [1.0] マレーシアのクリニカル・クリニカル・ガイドラインからファクト・ベース・ガイダンスを提供するためには,検索・拡張ジェネレーションシステムが不可欠である。
本研究では,高忠実度キャプションを生成するためのMedGemmaモデルを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:11:54 GMT)
Enhanced Sentiment Interpretation via a Lexicon-Fuzzy-Transformer Framework [1.0] 本稿では,ルールベース,文脈深層学習,ファジィ論理を組み合わせた新しい語彙ファジィ変換フレームワークを提案する。
このフレームワークは4つのドメイン固有のデータセットで厳格に評価されている。
その結果、ユーザー評価との整合性が向上し、感情的極端の識別が向上し、誤分類が減少した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:36:05 GMT)
Nonlinear Dimensionality Reduction Techniques for Bayesian Optimization [0.9] 低次元ラテント空間BO(LSBO)の列に問題を還元する非線形次元減少手法について検討する。
本稿では,元来分子生成などのタスク用に設計され,より広い最適化のためにアルゴリズムを再構成した実装について述べる。
次に、LSBOと逐次領域還元(SDR)を直接潜時空間(SDR-LSBO)に結合し、証拠が蓄積されるにつれて潜時探索領域を狭めるアルゴリズムを生成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:45:38 GMT)
Mind the Gap: Navigating Inference with Optimal Transport Maps [0.9] 最適輸送に基づくモデルキャリブレーション手法を提案する。
我々は,大型ハドロン衝突型加速器のCMS実験にインスパイアされたデータセットを用いて,ジェットタギングによるアプローチの性能を実証した。
これは、素粒子物理学における「基礎モデル」の偏りのない使用を可能にするための重要なステップである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:46:44 GMT)
QPMeL - Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning [0.9] 量子極距離学習(QPMeL)を提案し,古典的モデルを用いて量子ビットの極形パラメータを学習する。
次に、$R_y$と$R_z$の浅いPQCを使って状態を作り、$ZZ(theta)$-gatesのトレーニング可能なレイヤで絡み合いを学習します。
QMeLアプローチと比較すると、QPMeLはゲート数と深さの1/2しか使用せず、3倍のマルチクラス分離を実現している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:52:42 GMT)
When AI Gets Persuaded, Humans Follow: Inducing the Conformity Effect in Persuasive Dialogue [0.9] 本研究では,人間とともに説得される「ペルサデエージェント」について紹介する。
テキストを用いた対話実験を行った。
Persuadee Agentが説得を受け入れると、説得力と実際の態度が著しく改善した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:52:51 GMT)
Consciousness, natural and artificial: an evolutionary advantage for reasoning on reactive substrates [0.9] 意識、自然、人工を正確にモデル化し、それに影響を与える構造的および機能的メカニズムを同定するモデルを示す。
その結果、完全な人工意識の実現には障害がないことが示されたが、驚くべきことに、任意のレベルの人工知能を意識なしで実現することも可能である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:31:25 GMT)
Conditional Generative Modeling for Enhanced Credit Risk Management in Supply Chain Finance [0.8] サードパーティのロジスティクス(3PL)主導のサプライチェーンファイナンス(SCF)が将来性のあるソリューションとして登場し、イントランジット在庫を担保として活用している。
本稿では、信用リスク評価と融資規模決定の2つの課題に対処するため、3PL主導のSCFに適した高度な信用リスク管理フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:03:28 GMT)
Where to Search: Measure the Prior-Structured Search Space of LLM Agents [0.8] 本稿では、LLM支援反復探索をドメイン先導で記述し、評価するコンパクトな形式理論を提案する。
最も単純なテスト可能な推論を提供し、多数決のインスタンス化によってそれらを検証します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:24:36 GMT)
QuIRK: Quantum-Inspired Re-uploading KAN [0.8] Kolmogorov-Arnold Networks や Kans は、古典的なディープニューラルネットワークを上回る性能を示している。
本稿では,量子データ再アップロード(DR)モデルに基づくkanの量子インスパイアされた変種を紹介する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:55:12 GMT)
ObjectTransforms for Uncertainty Quantification and Reduction in Vision-Based Perception for Autonomous Vehicles [0.8] 本稿では,視覚に基づく物体検出における不確実性を定量化・低減する技術であるObjectTransformsを紹介する。
トレーニング時には、ObjectTransformsは個々のオブジェクトに対して色空間の摂動を実行し、照明や色の変化に対する堅牢性を改善する。
推定時には、検出対象に物体摂動を適用し、検出スコアの分散を用いて予測の不確実性を定量化する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:04:31 GMT)
Robust Optimization in Causal Models and G-Causal Normalizing Flows [0.8] 因果モデルにおけるロバストな最適化問題は、$G$-causal Wasserstein 距離の下で連続であるが、標準の Wasserstein 距離では不連続である。
本稿では,因果構造モデルに対する普遍近似特性を満たす新しい正規化フローアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:12:01 GMT)
Residual Correction Models for AC Optimal Power Flow Using DC Optimal Power Flow Solutions [0.8] 本稿では,高速直流最適電力流(DC OPF)ソリューションをベースラインとして,完全なAC-OPFソリューションを提供するために必要な非線形補正のみを学習する残差学習パラダイムを提案する。
57-,118-,2000-busシステムにおけるOPFDataの評価では、MSEが25%低下し、実現可能性エラーが最大3倍減少し、実行速度が最大13倍に向上した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:56:29 GMT)
Nicknames for Group Signatures [0.8] グループ署名のためのNicknames for Group Signatures (NGS)は、グループ署名(GS)を拡張してフレキシブル公開鍵(SFPK)で署名する新しい署名スキームである。
我々はそのセキュリティモデルを記述し、Random Oracle Modelで証明された数学的構成を提供する。
実用的なユースケースとして、NickHatというブロックチェーンベースのトークン交換プロトタイプシステムを、NGS上に構築しています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:19:43 GMT)
Automotive Crash Dynamics Modeling Accelerated with Machine Learning [0.7] 我々は、NVIDIA PhysicsNeMoフレームワークを用いて、クラッシュシナリオにおける構造変形の効率的な予測のための機械学習に基づくサロゲートモデルを開発した。
クラッシュダイナミクスをモデル化するための2つの最先端ニューラルネットワークアーキテクチャ、MeshGraphNetとTransolverについて検討する。
モデルでは、全体的な変形傾向を合理的な忠実さで捉え、構造的クラッシュダイナミクスに機械学習を適用する可能性を示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:03:33 GMT)
Situated Epistemic Infrastructures: A Diagnostic Framework for Post-Coherence Knowledge [0.7] 本稿では,ポストコヒーレンス条件下での知識の権威化を診断するための診断ツールとして,Situated Epistemic Infrastructuresフレームワークを紹介した。
本論文は,AIガバナンス,知識生産,情報システムの倫理的設計に関する議論に,学術コミュニケーションの表現主義モデルに対する堅牢な代替手段を提供することによって貢献する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:12:29 GMT)
Phase-Stable Optical Fiber Links for Quantum Network Protocols [0.7] 位相安定ファイバリンク上のモードロックレーザー源からの単一光子レベルパルスの分布を実証する。
我々の結果は、証明可能な量子優位性を備えたスケーラブルで高速な量子ネットワークに向けた必要なステップである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:43:18 GMT)
Revealing Low-Dimensional Structure in 2D Richtmyer-Meshkov Instabilities via Parametric Reduced-Order Modeling [0.7] Richtmyer-Meshkov不安定性(RMI)は多くのエンジニアリングタスクに必須である。
RMIはアブレーターと燃料を混合させ、コールドスポットを燃料に導入し、性能を低下させる。
本稿では,ラテント・スペース・ダイナミクス同定アルゴリズムに基づく2次元RMIの低次モデルを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:19:00 GMT)
Teaching Quantum Computing through Lab-Integrated Learning: Bridging Conceptual and Computational Understanding [0.7] 量子コンピューティング教育では、学生は確率、測定、干渉に基づく推論スキルを身につける必要がある。
本報告では、ルイジアナ州立大学の大学院と大学院を組み合わせた研究室統合学習モデルの設計と提供について述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:29:52 GMT)
Similarity-Based Supervised User Session Segmentation Method for Behavior Logs [0.7] 動作埋め込みと属性から導出した類似性特徴に基づく教師付きセッションセグメンテーション手法を提案する。
実際の閲覧履歴から手動で注釈付きデータセットを構築し,F1スコア,PR-AUC,ROC-AUCを用いてセグメンテーション性能を評価する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:46:44 GMT)
Conformal Risk Control for Pulmonary Nodule Detection [0.6] 肺癌検診における肺結節検出の1例を経験したので報告する。
我々は、共形リスク制御(CRC)と呼ばれる不確実性定量化手法により高度な検出モデルを強化する。
安全クリティカルな医療領域における予測の不確実性の指標として, 整合性保証付き予測セットが魅力的であることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:14:59 GMT)
G$^{2}$D: Boosting Multimodal Learning with Gradient-Guided Distillation [0.6] 本稿では, カスタマイズされた損失関数を持つマルチモーダルモデルを最適化する知識蒸留フレームワークであるGradient-Guided Distillation (G$2$D)を紹介する。
G$2$Dは、訓練中に弱いモダリティの重要度を増幅し、分類および回帰タスクにおける最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:02:53 GMT)
Solving Distributed Flexible Job Shop Scheduling Problems in the Wool Textile Industry with Quantum Annealing [0.6] 我々は分散フレキシブルジョブショップスケジューリング問題(DFJSP)を解決するために量子アニーリング(QA)を採用している。
本手法の適用性を検討するため,50変数から250変数までの問題を定式化し,解いた。
得られた解は、解の質と計算時間の両方において、シミュレート・アナリング(SA)によって得られた解と比較される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:47:39 GMT)
Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss [0.5] 逆問題(inverse problem)は、科学、工学、医学における多くの応用において重要である。
我々は、ODILのベイズ拡張であるB-ODILを紹介し、ODILのPDE損失を事前の知識として統合し、データを記述する可能性と組み合わせる。
我々は,PDEを1次元,2次元,3次元に含む一連のベンチマークにおいて,B-ODILの能力を実証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:51:45 GMT)
Operationalizing Automated Essay Scoring: A Human-Aware Approach [0.5] 機械学習に基づくアプローチをLarge Language Models(LLM)アプローチと比較し、その強み、類似点、相違点を同定する。
MLに基づくAESモデルでは,LSMの精度は向上するが,説明可能性に苦慮する一方,LSMはよりリッチな説明を提供する。
これらの次元を解析することにより、異なる方法間の課題とトレードオフを特定し、より信頼性が高く信頼性の高いAES手法に寄与することを目的とする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:19:16 GMT)
MAVR-Net: Robust Multi-View Learning for MAV Action Recognition with Cross-View Attention [0.5] 本稿では,マルチビュー学習に基づく行動認識フレームワークMAVR-Netを提案する。
従来の単一ビュー方式とは異なり、提案手法は生フレーム、光フロー、RGBセグメンテーションマスクを含む3種類の補完的なデータを組み合わせている。
具体的には、ResNetベースのエンコーダを用いて各ビューから異種特徴を抽出し、MAV動作パターンの詳細を保存するためにマルチスケールの特徴ピラミッドを採用する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:04:51 GMT)
Meta-learning of Gibbs states for many-body Hamiltonians with applications to Quantum Boltzmann Machines [0.5] パラメトリックハミルトニアンの効率的な熱状態調製のためのメタラーニングアルゴリズムを2つ導入する。
我々は,最大8-qubitの逆場イジングモデルと2-qubitのハイゼンベルクモデルに対して,すべてのフィールド項で検証する。
我々は,量子ボルツマンマシン(QBM)を,すべてのフィールド項を持つ2キュービットハイゼンベルクモデルで訓練するために,アルゴリズムを適用した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:53:10 GMT)
Fast and Compact Tsetlin Machine Inference on CPUs Using Instruction-Level Optimization [0.4] Tsetlin Machine (TM) はCPUなどのリソース制限されたデバイスに高速な推論を提供する。
命令レベルビットワイド演算を利用したTMの効率的なソフトウェア実装を提案する。
本稿では,TMのand-based節評価を利用して不要な計算を回避する早期終了機構を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:44:20 GMT)
Second-order discretization of Dyson series: iterative method, numerical analysis and applications in open quantum systems [0.4] 数値的な二次積分を高次元積分に適用することなく、ダイソン級数を離散化するための一般的な戦略を提案する。
結果として生じる離散化は、テイラー展開と組み合わされたストロング分割と解釈することもできる。
シミュレーションシステム-バス・ダイナミクスのための数値的精度の反復法を開発した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:55:09 GMT)
Semantic segmentation with coarse annotations [0.4] 本稿では,スーパーピクセルベースアップサンプリングを用いたエンコーダデコーダアーキテクチャを用いたモデルの正規化手法を提案する。
粗いアノテーションでトレーニングした場合, 最先端モデルと比較して, 境界リコールは大幅に改善することが示された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:41:27 GMT)
Identifying multi-omics interactions for lung cancer drug targets discovery using Kernel Machine Regression [0.4] がんは多面的分子相互作用によって誘導される多様で複雑な表現型を示す。
単一オミクスと比較して,マルチオミクスデータセットの特徴間の複雑な相互作用を理解することは困難である。
肺癌に有意な関連のある38遺伝子を同定した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:13:39 GMT)
Zero-Shot Coordination in Ad Hoc Teams with Generalized Policy Improvement and Difference Rewards [0.4] 現実世界のマルチエージェントシステムではアドホックなチーム編成が必要であり、エージェントはそれまで目に見えない他のチームメイトと調整して、ゼロショットでタスクを解決しなければならない。
ゼロショット転送設定において、事前訓練されたすべてのポリシーを活用することを提案する。この問題をアドホックなマルチエージェントマルコフ決定プロセスとして形式化し、一般化されたポリシー改善と差分報酬という2つの重要なアイデアを用いたソリューションを提案する。
当社のアルゴリズムであるGPAT(Generalized Policy Improvement for Adhoc Teaming)が,3つの模擬環境(協調採餌,捕食者・捕食者・捕食者・捕食者・捕食者・捕食者・捕食者)における新規チームへのゼロショット移行を成功に導くことを実証的に実証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:55:25 GMT)
GENESIS: A Generative Model of Episodic-Semantic Interaction [0.4] ジェネレーション・エピソード・セマンティック統合システム(GENESIS)について紹介する。
GENESISはメモリを2つの制限容量生成系間の相互作用として定式化する。
それは、アクティブで、構成的で、リソースに縛られたプロセスとして、メモリの原則的な説明を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:11:13 GMT)
Quantum Search for Gravitational Wave of Massive Black Hole Binaries [0.4] 本研究では、Groverのアルゴリズムに基づく量子マッチングフィルタリングアルゴリズムのMBHB信号への応用について検討する。
特定の単純化された仮定の下では、量子的アプローチは計算複雑性を$O(N)$から$O(sqrtN)$に還元することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:41:53 GMT)
Human or AI? Comparing Design Thinking Assessments by Teaching Assistants and Bots [0.4] 本研究では,デザイン思考教育における学生ポスター評価におけるTA支援評価と比較して,AI支援評価の信頼性と精度について検討した。
その結果、インストラクターとAIによる共感点と痛み点の統計的一致は低く、視覚コミュニケーションのアライメントはわずかに高かった。
この研究は、計算効率と人間の洞察を統合するハイブリッドアセスメントモデルの必要性を強調している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:09:21 GMT)
Co-Designing Interdisciplinary Design Projects with AI [0.4] 学際的な設計プロジェクトには、カリキュラムのアライメント、クロスオブジェクト統合、慎重なシークエンシングが必要である。
国際研究報告では、永続的なワークロードプレッシャーとともにAIの教師利用が増加している。
本稿では,デザイン革新の原則に基づくGPTベースの計画アシスタントであるIDPplannerについて述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:50:03 GMT)
C/N0 Analysis-Based GPS Spoofing Detection with Variable Antenna Orientations [0.4] GPSスプーフィングは、衛星信号を改ざんし、航空機の航法システムを誤解させることによって、航空に対する脅威が増大する。
本稿では,衛星キャリア-ノイズ密度比の変動を解析し,概念実証のスプーフィング検出手法を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:40:58 GMT)
REX: Causal discovery based on machine learning and explainability techniques [0.3] 本稿では、機械学習(ML)モデルと説明可能性技術を活用する因果発見手法であるReXを紹介する。
ReXは、さまざまなデータ生成プロセスで最先端の因果発見手法より優れています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:12:37 GMT)
Generating patient cohorts from electronic health records using two-step retrieval-augmented text-to-SQL generation [0.3] このシステムは EHR データのコホート同定において 0.75 F1-スコアを達成し、複雑な時間的および論理的関係を効果的に捉える。
これらの結果は、疫学研究におけるコホート自動生成の可能性を示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:29:05 GMT)
Cash Flow Underwriting with Bank Transaction Data: Advancing MSME Financial Inclusion in Malaysia [0.3] ファイナンスへのアクセスは、マレーシアのマイクロ、スモール、ミディアムエンタープライズ(MSME)が直面している最も永続的な課題の1つだ。
本研究では、新興市場への金融包摂を促進するための信用評価のための代替データ源として、銀行の申告データの可能性について検討する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 03:56:11 GMT)
Leveraging Teleconnections with Physics-Informed Graph Attention Networks for Long-Range Extreme Rainfall Forecasting in Thailand [0.3] 正確な降雨予測、特に極端な出来事は、気候学と地球システムにおいて重要な課題である。
本稿では,新しい物理インフォームドグラフニューラルネットワーク(GNN)と極値解析技術を組み合わせることで,タイ全土のゲージステーション降雨予測を改善することを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:57:57 GMT)
Community Engagement and the Lifespan of Open-Source Software Projects [0.3] オープンソースソフトウェアプロジェクトは、長寿のためにコミュニティエンゲージメント(CE)に依存します。
本研究では、CEをOSSで定義し、主要なメトリクスを特定し、プロジェクトダイナミクスへの影響を評価する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:03:06 GMT)
Context-aware deep learning using individualized prior information reduces false positives in disease risk prediction and longitudinal health assessment [0.3] 我々は、健康モニタリングを改善するために、事前訪問から多様なコンテキストを統合する機械学習フレームワークを開発した。
我々は,大集団のデータを用いた前立腺癌(PCa)のリスク予測に枠組みを適用した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:38:57 GMT)
Non-unitary enhanced transfer efficiency in quantum walk search on complex networks [0.2] 本研究では, 探索問題を事例として, 歩行者のトラップ地点への移動効率について検討した。
ユニタリ力学と非ユニタリ力学のバランスはパラメータで調整される。
この挙動は、余分なトラップサイトの存在下でのみ観察されることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:25:03 GMT)
NbTiN Nanowire Resonators for Spin-Photon Coupling on Solid Neon [0.2] NbTiNナノワイヤ共振器は、固体ネオンを共振器に堆積し、その後ネオン表面に電子を装填した後、105年頃に高品質な因子を保ち、電子オンネオンプラットフォームへの適合性を検証した。
本分析では, 次世代デバイスの性能目標について概説し, 電荷のスイートスポットでは, シングルキュービット動作では99.99%, 2キュービット動作では99.9%以上のスピンキュービットゲート特性が天然ネオンで達成可能であることを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:13:37 GMT)
SNOO: Step-K Nesterov Outer Optimizer - The Surprising Effectiveness of Nesterov Momentum Applied to Pseudo-Gradients [0.2] DiLoCoはもともと分散トレーニング用に設計された有名な例だが、Nesterovのモーメントを複数のワーカーの平均的な擬似勾配に適用している。
DiLoCoの驚くべき効果は、主に非分散環境での擬勾配にネステロフ運動量を適用することに起因していることを示す。
最小限の計算とメモリオーバーヘッドとモデリングとの互換性のため、SNOOはAdamWやMuonなど、様々なインナーの実用的な拡張である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:11:45 GMT)
Confidence-Weighted Semi-Supervised Learning for Skin Lesion Segmentation Using Hybrid CNN-Transformer Networks [0.2] MIRA-Uは,不確実性を認識した教師/学生の擬似ラベルとハイブリッドCNN-Transformerアーキテクチャを組み合わせた半教師付きフレームワークである。
提案手法では,U字型CNN-Transformer学生ネットワークを案内する信頼度重み付き擬似ラベルを生成するために,マスク付き画像モデリングを用いて事前学習した教師ネットワークを用いる。
この設計により、擬似ラベルの品質と境界線が向上し、再構成ベースとCNNのみのベースラインを超えた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:35:16 GMT)
msf-CNN: Patch-based Multi-Stage Fusion with Convolutional Neural Networks for TinyML [0.2] 我々は畳み込みニューラルネットワーク(CNN)のための最適な融合設定を効率的に見つける新しい手法であるmsf-CNNを紹介する。
我々はmsf-CNNが従来の技術に比べて50%少ないRAMで推論できることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:17:35 GMT)
QCFace: Image Quality Control for boosting Face Representation & Recognition [0.2] 本稿では,相互重なり合う問題を克服し,識別可能性と識別性との明確な分離を可能にするQCFaceを紹介する。
QCFaceは、既存の認識可能性に基づく損失と比較して、検証と識別のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:00:20 GMT)
Towards a Blockchain-Based CI/CD Framework to Enhance Security in Cloud Environments [0.2] この研究は、最近のサイバー侵害に対する反応として、クラウドプラットフォームにおける継続的インテグレーションとデプロイメント(CI/CD)パイプライン内のセキュリティ問題に焦点を当てている。
この研究は、CI/CDパイプラインのセキュリティを強化するブロックチェーンベースのソリューションを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:41:40 GMT)
Methods and Trends in Detecting AI-Generated Images: A Comprehensive Review [0.2] GAN(Generative Adversarial Networks)、拡散モデル(Diffusion Models)、変分オートエンコーダ(VAEs)は、高品質なマルチメディアデータの合成を可能にしている。
これらの進歩は、敵の攻撃、非倫理的使用、社会的な危害に関する重大な懸念を引き起こした。
このサーベイは、先進的な生成AIモデルによって生成された合成画像の検出と分類のための最先端技術に関する包括的なレビューを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:36:01 GMT)
BiomedXPro: Prompt Optimization for Explainable Diagnosis with Biomedical Vision Language Models [0.2] そこで我々は,解釈可能な自然言語プロンプトの多種多様なアンサンブルを生成するBiomedXProを紹介した。
実験の結果、BiomedXProは最先端のプロンプトチューニング方法よりも一貫して優れていることがわかった。
BiomedXProは、解釈可能なプロンプトの多様なアンサンブルを生成することで、モデル予測の検証可能な基盤を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:58:31 GMT)
PLaID++: A Preference Aligned Language Model for Targeted Inorganic Materials Design [0.1] 安定かつ特性誘導型結晶生成のためのLLMポストトレーニングであるPLaID++を紹介する。
結晶学的な表現と報酬の定式化にパフォーマンスのヒンジがあることがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:59:57 GMT)
On the Neural Feature Ansatz for Deep Neural Networks [0.1] The Neural Feature Ansatz held through training for two-layer linear network with exponent $alpha = 1/2$。
我々はNFAが非線形アクティベーションを持つネットワークアーキテクチャを保たないことを示す反例を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:47:36 GMT)
AtomBench: A Benchmark for Generative Atomic Structure Models using GPT, Diffusion, and Flow Architectures [0.1] 本稿では,AtomGPT,拡散結晶変分オートエンコーダ,フローMMの3つの代表的な生成モデルのベンチマークを示す。
これらのモデルは、JARVIS Supercon 3DとDS A/Bの2つの公開超伝導データセットのサブセットから結晶構造を再構築するために訓練された。
計算されたKLDとMAEのスコアでは、CDVAEが最も好意的に機能し、次にAtomGPT、次にFlowMMが続く。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:07:37 GMT)
Dynamical complexity of non-Gaussian many-body systems with dissipation [0.1] 本研究では, ガウス間結合, オンサイト非ガウス間相互作用, 局所散逸を伴うボソニックおよびフェルミオン多体モデルの状態を特徴付ける。
フェルミオン系では、デフォーカスノイズが非ガウス相互作用よりも大きい場合、系状態は常にガウス状態の凸結合である。
ボソニック系とは異なり、フェルミオン系は、サイト間結合よりもはるかに大きいノイズ率でも絡み合いを発生させることができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:14:50 GMT)
Transfer Orthology Networks [0.1] Transfer Orthology Networks (TRON) は、異種間移動学習用に設計されたニューラルネットワークアーキテクチャである。
TRONは、ソースから標的種の遺伝子空間に遺伝子発現をマッピングする線形変換を学ぶ。
我々は、TRONアーキテクチャの実験的検証を得るために、異種交雑種のトランスクリプトーム/フェノタイプデータを収集している最中である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:24:55 GMT)
Neuromorphic Computing - An Overview [0.1] ニューロモルフィックコンピューティング(Neuromorphic computing)という新しい時代に、人間の脳の例を追求する新たな分野が登場した。
本稿では、ニューロモルフィックコンピューティングの紹介、これや他の新しいコンピューティングシステムがなぜ必要か、そしてニューロモルフィック分野に現在存在する技術について述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:49:51 GMT)
A recipe for local simulation of strongly-correlated fermionic matter on quantum computers: the 2D Fermi-Hubbard model [0.0] 本稿では,局所演算のみを用いて量子コンピュータ上での2次元Fermi-Hubbardモデルをシミュレーションするためのステップバイステップのレシピを提案する。
物理デバイスへの埋め込みを含むエンド・ツー・エンド・シミュレーションの詳細なレシピを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:23:33 GMT)
WebRTC Metadata and IP Leakage in Modern Browsers: A Cross-Platform Measurement Study [0.0] 本稿では,Chrome,Brave,Firefox,Torの現行ビルドを用いたメタデータリークのクロスプラットフォーム計測について述べる。
結果は、Chromeが依然として最もリークの少ないLANまたはCarrier-Grade NAT(CGNAT)アドレスをモバイル上で公開し、デスクトップ上でメタデータを公開していることを示している。
本稿では,ブラウザのデフォルト,制度的保護,ユーザコントロールを組み合わせた階層型緩和戦略を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:20:52 GMT)
WARP-LUTs - Walsh-Assisted Relaxation for Probabilistic Look Up Tables [0.0] 確率的ルックアップテーブル(WARP-LUT)のウォルシュ支援緩和
WARP-LUT(WARP-LUTs)は、学習可能なパラメータをかなり少ない論理ゲートの組み合わせを効率的に学習する、勾配に基づく新しい手法である。
我々は, WARP-LUT が DLGN と比較して CIFAR-10 の収束を著しく高速化し, 精度は同等であることを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:44:36 GMT)
VM-BeautyNet: A Synergistic Ensemble of Vision Transformer and Mamba for Facial Beauty Prediction [0.0] 本稿では,視覚変換器とマンバベースビジョンモデルの相補的強みを融合した,新しい異種アンサンブルアーキテクチャであるtextbfVM-BeautyNetを提案する。
提案したVM-BeautyNetは,textbfPearson correlation (PC)が0.9212, textbfMean Absolute Error (MAE)が0.2085, textbfRoot Mean Square Error (RMSE)が0.2698で,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:10:46 GMT)
VERA-MH Concept Paper [0.0] 本稿では,メンタルヘルスにおけるAIチャットボットの安全性を自動評価するVERA-MHを紹介する。
プロセスを完全に自動化するために、2つのアシラリーAIエージェントを使用しました。
シミュレーションされた会話は、そのルーリックに基づいてそれらをスコアする審査員に渡される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:07:29 GMT)
Unravelling inter-channel quantum interference in below-threshold nonsequential double ionization with statistical measures [0.0] レーザー衝突非逐次二重イオン化(Ninduced)におけるチャネル間量子干渉の研究
我々は、膨大な数の干渉プロセスから生じるチャネル間の相互作用を定量化する。
本研究は,RESIにおける干渉機構の階層構造を確立し,運動量面の異なる領域における干渉の促進・抑制のための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:21:54 GMT)
Ultracompact Inverse-Designed Silicon-on-Insulator Couplers with Sub-Decibel Coupling Efficiency [0.0] トポロジ最適化によるカップルの縮小は、高密度統合の需要に対処する。
これらの最適化されたカプラは、従来のカプラによって実証されたパフォーマンスレベルにはまだ達していない。
本研究では,ボトムリフレクタを組み込んだ一極化1Dと二極化2Dグレーティングカプラの設計にトポロジ最適化を適用した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:07:11 GMT)
Time evolution of the Husimi and Glauber-Sudarshan functions in terms of complementary Hamiltonian symbols [0.0] 本稿では、フシミ Q-およびグラウバー・スダルシャン空間分布関数の力学のコンパクトで体系的な定式化について述べる。
結果として生じる進化方程式は、普遍的なリード構造を持ち、古典的なリウヴィリアドリフトは、ハミルトニアンの高階微分との項を持つ。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:19:50 GMT)
The Geometry of Qubit Decoherence: Linear vs. Nonlinear Dynamics in the Bloch Ball [0.0] 開キュービットに対するGKSL方程式に対する2つの相補的アプローチを提案する。
第一は線型性に基づいて、ブロッホ球の混合状態軌跡で示される解を得る。
2つ目は、SU(2)対称性を利用して、角運動学と放射散逸を分離する非線形系である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:14:32 GMT)
Stress-Aware Learning under KL Drift via Trust-Decayed Mirror Descent [0.0] エントロピー規則化された信頼デカイは、信頼の更新とミラー・ディフレッシブな決定の両方にストレス対応の指数関数的傾きを注入する。
Trust-decayは1スウィッチあたり$O(1)$、ストレスのない更新は$Omega(1)$tailsとなる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:08:28 GMT)
SpikeFit: Towards Optimal Deployment of Spiking Networks on Neuromorphic Hardware [0.0] SpikeFitは、ニューロモルフィックハードウェアの効率的な推論を可能にするスパイキングニューラルネットワーク(SNN)のトレーニング方法である。
許容重みの離散値は、モデルと共最適化された学習可能なパラメータとして扱う。
我々は,4つの特異なシナプス重み値(M = 4)に制約されたニューラルネットワークをスパイキングする場合,SpikeFit法は最先端のSNN圧縮法より優れていることを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:20:11 GMT)
Spectral statistics and energy gap-scaling in $k-$local spin Hamiltonians [0.0] 相互作用するスピンハミルトニアンが正確に$k$スピンに作用するスペクトル特性について検討する。
完全に不規則な場合、$mu = 0$ に対して、レベル統計の普遍性クラスは、システムサイズ$L$とローカリティ$k$のパリティにのみ依存することを示す。
我々は、$k gg sqrtL$制限におけるこのエネルギーギャップの式を解析的に導出した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:11:38 GMT)
Spatiotemporal Transformers for Predicting Avian Disease Risk from Migration Trajectories [0.0] 本研究は,渡り鳥軌道の終点における感染リスクを予測するためのトランスフォーマーベースのフレームワークを提案する。
我々は、Movebankのデータ、World for Animal Healthのアウトブレイク記録など、マルチソースの地理空間データセットを統合する。
このモデルは、鳥の動きシーケンスから依存を学習し、病気のリスクを見積もる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:33:33 GMT)
Solving the 3D Heat Equation with VQA via Remeshing-Based Warm Starts [0.0] 変分量子アルゴリズム(VQA)は、短期的応用の第一候補として浮上している。
本研究では, 定常熱伝達におけるPDE問題に対するVQAの適用について検討する。
この研究は、PDEにVQAを適用するための実践的な方法論を提供し、現在の量子ハードウェアの機能と限界に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:34:42 GMT)
Solid-State High-Order Harmonic Generation: Emerging Frontiers in Ultrafast and Quantum Light Science [0.0] 固体中の高次調和生成(HHG)は、凝縮物質中の超高速で量子コヒーレントな現象を探索するための汎用的なプラットフォームとして登場した。
最近の進歩は、高調波放射、励起子の強磁場制御、格子運動におけるベリー相と位相効果を明らかにしている。
固体高調波発生における軌道-角-運動量移動の出現は、量子工学的なアト秒源への道と固体中の光-物質相互作用のコヒーレント制御を舗装する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:23:47 GMT)
SoK: Market Microstructure for Decentralized Prediction Markets (DePMs) [0.0] 分散予測市場(DePM)は、中央集権的な仲介者に頼ることなく、イベントベースの賃金制度へのオープンな参加を可能にする。
2011年にさかのぼるDePMの歴史をレビューし、何百もの提案を含む。
基盤となるインフラストラクチャ,マーケットトピック,共有構造と価格,トレーディング,市場解決,解決,アーカイブという,7つのステージからなるモジュール型ワークフローをレビューに使用しています。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:59:47 GMT)
Singularity-free dynamical invariants-based quantum control [0.0] 任意の雑音条件下での単一量子状態準備のための不変プロトコルを提案する。
このフレームワークは, (i) 特徴雑音に対応し, (ii) 雑音認識制御合成が可能であり, (ii) 雑音非依存な変種が主方程式記述を必要とせずに頑健性を維持する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:05:04 GMT)
Shannon entropy of the measurement record at measurement-dominated criticality and RG flow: A c-theorem for effective central charge and a g-theorem for effective boundary entropy [0.0] 2つの量の関連再正規化群 (RG) 流下での非摂動的減少を示す2つの定理を示す。
まず、「有効中心電荷」$c_texteff$の2D$レプリカ場理論のRrightarrow1$レプリカ限界の減少を示す。
第二に、対応する普遍量 $c_texteff(Rrightarrow0)$ と $g_texteff(Rrightarrow0)$ が $Rrightarrow0$ のレプリカ極限にあることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:44:22 GMT)
Self-evolving expertise in complex non-verifiable subject domains: dialogue as implicit meta-RL [0.0] いわゆる「邪悪な問題」は、複雑な多次元の設定、検証不可能な結果、不均一な影響、客観的に正しい答えの欠如など、歴史を通じて人類を悩ませてきた。
現状の人工知能システム(特にLarge Language Modelベースのエージェント)は、そのような問題を解決するために人間と共同で研究されている。
この研究は、Dialecticaとのギャップに対処する。これは、エージェントが定義されたトピックに関する構造化された対話に従事し、メモリによる拡張、自己回帰、ポリシーに制約のあるコンテキスト編集を行うフレームワークである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:59:44 GMT)
Selecting and Combining Large Language Models for Scalable Code Clone Detection [0.0] ソースコードクローンは、知的財産権侵害から意図しない脆弱性まで幅広いリスクを引き起こす。
本稿では,76大言語モデル(LLM)を特定し,大規模クローン検出に適した候補にフィルタリングする。
しかし、CodeT5+110M、CuBERT、SPTCodeはトップパフォーマンス者だった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:51:17 GMT)
Scalar fields with power-law potentials in quantum cosmology [0.0] 提案手法は、最大対称空間に対する量子測地力学に基づいている。
スカラー場ポテンシャルと対応する量子ハミルトニアン制約方程式の別個のパワー-ロー和に対する関連する微分方程式を得た。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:26:52 GMT)
STABLE: Gated Continual Learning for Large Language Models [0.0] STABLEは、シーケンシャルな更新時に忘れることを制限する、ゲート付き連続的なセルフ編集フレームワークである。
各候補編集は3つの指標のうちの1つを用いて安定性の予算に対して評価される。
Qwen-2.5-7Bモデルの実験では、ゲーティングは適応性を保ちながら忘れを効果的に軽減することを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:14:05 GMT)
Role of exceptional points in the dynamics of the Lindblad Sachdev-Ye-Kitaev model [0.0] 定常状態への崩壊速度は、浴のカップリング$mu$の非単調関数であり、散逸性量子系に対するLoschmidtエコーの類似は、第1次動的相転移を行う。
これらの特徴が、定常状態に付随するゼロ固有値に最も近いSYKリウヴィリアンの純粋実固有値における例外点の存在に起源を持つことを示す。
これらの特徴は、量子的に強く相互作用する多体リウビリアンの平衡へのアプローチにおいて汎用的であると期待する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:15:52 GMT)
Realistic vulnerabilities of decoy-state quantum key distribution [0.0] デコイ状態量子鍵分布(QKD)は、固定平均光子数を持つパルスを作成するために安定減衰に依存する。
盗聴器はデコイ状態のセキュリティ体制を超えて平均光子数を増大させることができることを示す。
擬似光子数分解能(PPNR)USD攻撃を導入し、ボブ側で観測可能なすべての利得をエミュレートする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:34:48 GMT)
Quantum Voting Protocol for Centralized and Distributed Voting Based on Phase-Flip Counting [0.0] 本稿では、量子重ね合わせと絡み合いを利用して、セキュアで匿名な投票を実現する新しい量子投票プロトコルを提案する。
提案手法は, 絡み合った候補状態の位相フリップ符号化を利用して, 投票者IDレジスタに条件付き制御された位相演算として投票を記録する。
このプロトコルは、量子重ね合わせによる投票者の匿名性を確保し、絡み合い機構による二重投票を防ぎ、大規模な選挙のスピードアップの可能性を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:14:54 GMT)
QSilk: Micrograin Stabilization and Adaptive Quantile Clipping for Detail-Friendly Latent Diffusion [0.0] QSilkは、遅延拡散のための軽量で常時オンの安定化層である。
AQClipは許容値の回廊を各領域に適応させる。
トレーニングや微調整を必要とせず、最小限のユーザコントロールを公開する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:50:30 GMT)
Publication Trend Analysis and Synthesis via Large Language Model: A Case Study of Engineering in PNAS [0.0] 本研究では, 適応型大規模言語モデル (LLM) を基礎として, 主題的傾向を定量化するフレームワークを提案する。
このアプローチは、米国科学アカデミー紀要によって発行された1500以上の工学論文の20年以上のコレクションで実証されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:57:11 GMT)
Preliminary Quantitative Study on Explainability and Trust in AI Systems [0.0] GPT-4のような大規模AIモデルは、法律、医療、金融といった重要な領域にまたがる人工知能の展開を加速している。
本研究では,定量的な実験設計を通じて,AIシステムにおける説明可能性とユーザ信頼の関係について検討する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:59:28 GMT)
Photonic Exceptional Points in Holography and QCD [0.0] 三元結合マイクロリングのフォトニック例外点(EP)のホログラフィック双対を構築し、非エルミート量子系を作る。
本モデルでは,実験と正確に一致するスペクトルの挙動を数値的に求める。
次に,近年の複雑化・時間依存性エンタングルメントエントロピーとEPの関連性を見出した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:44:27 GMT)
Out-of-Equilibrium Dynamics in a U(1) Lattice Gauge Theory via Local Information Flows: Scattering and String Breaking [0.0] 格子ゲージ理論における非平衡量子力学を特徴付けるための診断ツールとして局所情報フローを導入する。
リアルタイムプロセスにおける量子相関の伝播と蓄積を特徴付けるために,情報格子フレームワークを用いて全情報を空間的およびスケール的に分解する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:00:01 GMT)
Optomechanical crystal in light-resilient quantum ground-state [0.0] レーザ光に対するレジリエンスを改善したチップスケール無放出シリコン光学結晶空洞を低温で動作させる。
時間分解測定により、機械的崩壊時間によって制御される急激な初期熱化が明らかになった。
その結果、チップ上のリリースフリーシステムは、低ノイズで高出力の古典的および量子電気光学の経路として有効である。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:13:20 GMT)
Optimal Convergence Rate of Lie-Trotter Approximation for Quantum Thermal Averages [0.0] Lie--Trotter 積公式は量子分割関数の基本的な近似である。
本稿では,この近似を2つの鍵系にまたがる定量的な誤差解析を行う。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:26:08 GMT)
Operator Commutativity Screening and Progressive Operator Block Reordering toward Many-body Inspired Quantum State Preparation [0.0] 変分量子固有解法(VQE)は、分子エネルギーと性質を決定するために非常に有望なアプローチとして登場した。
支配的演算子ブロックを初期同定する系統的動的アンサッツ構築戦略を提案する。
本研究では, このプログレッシブ演算子ブロック付加方式により, 局所トラップを効率よく回避しつつ, パラメータが著しく少ない精度のエネルギーが得られることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:36:42 GMT)
Operationalising Extended Cognition: Formal Metrics for Corporate Knowledge and Legal Accountability [0.0] 企業知識は動的能力として再定義され、情報アクセス手順の効率によって測定できると主張している。
これらの量的指標を、実際の知識、建設的知識、力強い盲目、無謀性の法的基準にマッピングします。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:03:57 GMT)
Onboard Mission Replanning for Adaptive Cooperative Multi-Robot Systems [0.0] 協調型自律ロボットシステムは、複雑なマルチタスクミッションを実行する上で大きな可能性を秘めている。
通常は遠隔地で、ダイナミックで危険な環境で活動する。
したがって、高速でオンボードなリプランニングアルゴリズムはレジリエンスを高めるために必要である。
この研究は、自律型マルチエージェントシステムにおけるレジリエンス向上の道を開いた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:10:42 GMT)
Numerical Fragility in Transformers: A Layer-wise Theory for Explaining, Forecasting, and Mitigating Instability [0.0] エラーがいつどこで発生するかを予測する一階のモジュールワイズ理論を提示する。
自己注意のために、3つの解釈可能な診断に分解する層間境界を導出する。
また、精度と幅を意識したLayerNormインジケータ$rho_rm LN$も導入する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:03:02 GMT)
Neural Diffusion Processes for Physically Interpretable Survival Prediction [0.0] プロセス理論から,ディープニューラルネットワークとFHT分布を結合した生存分析フレームワークであるDeepFHTを紹介する。
ニューラルネットワークは、選択されたFHTプロセス内で、入力変数を初期状態、ドリフト、拡散を含む物理的に意味のあるパラメータにマッピングする。
これにより、クローズドフォームの生存とハザード関数が得られ、比例的ハザードを仮定することなく、時間的に変化するリスクを捕捉する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:25:35 GMT)
Near-Equilibrium Propagation training in nonlinear wave systems [0.0] 現代の人工知能のワークホースであるバックプロパゲーション学習アルゴリズムは、物理ニューラルネットワークの実装が難しいことで知られている。
我々はEP学習を離散的および連続的な複素数値波系に拡張する。
単純な論理的タスクや手書きデジタル認識を含む標準ベンチマークに関する数値的研究は、安定な収束を示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:03:07 GMT)
Nauplius Optimisation for Autonomous Hydrodynamics [0.0] NOAHは自然に着想を得た新しいSwarm最適化アルゴリズムである。
これは、現在認識されているドリフト、永続的なセンシングノードにおける不可逆的な解決、およびコロニーベースの通信を組み合わせる。
検証研究は 永続的なアンカーシナリオで 86%の成功率を示します
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:30:19 GMT)
Max It or Miss It: Benchmarking LLM On Solving Extremal Problems [0.0] 数学的極端問題を解くためのベンチマークデータセットExtremBenchを紹介する。
我々は、Qwen3、GPT-OSS、DeepSeekなど、最先端のオープンソースモデルファミリーで評価を行う。
その結果、LLMの極端解法推論能力は、現在の数学ベンチマークと必ずしも一致しないことがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:17:43 GMT)
Machine Learning for Early Detection of Meningitis: Stacked Ensemble Learning with EHR data [0.0] 我々は,現実のER (Emergency Room) のシナリオをシミュレートし,髄膜炎の診断に挑戦する条件を作成した。
本稿では,エンサンブルラーニング(Ensemble Learning)を用いた髄膜炎の今後のAIによる診断手法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:56:47 GMT)
Localization and "classical entanglement'' in the Discrete Non-Linear Schrödinger Equation [0.0] 離散非線形シュリンガー方程式(DNLSE)の局所化高エネルギー相の特異熱力学特性について検討する。
ハミルトン力学によるマイクロカノニカルアンサンブルの数値的なサンプリングにより、局在相の存在と系の性質との間の新しい微妙な関係が明らかになった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:51:32 GMT)
Lightweight CycleGAN Models for Cross-Modality Image Transformation and Experimental Quality Assessment in Fluorescence Microscopy [0.0] 蛍光顕微鏡(超解像STED/非畳み込みSTED)におけるモダリティ伝達のための軽量CycleGANを提案する。
U-Netベースのジェネレータの従来のチャネルダンブリング戦略を固定チャネルアプローチに置き換えることで、トレーニング可能なパラメータを418万から約9千に大幅に削減し、より高速なトレーニングとメモリ使用量の削減を実現した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:20:18 GMT)
Leveraging Test Driven Development with Large Language Models for Reliable and Verifiable Spreadsheet Code Generation: A Research Framework [0.0] 本稿では、テスト駆動開発(TDD)の実証済みのソフトウェアエンジニアリングプラクティスとLLM(Large Language Model)による生成を統合する、構造化された研究フレームワークを提案する。
テスト駆動思考を強調することで、計算思考の改善、エンジニアリングスキルの促進、ユーザエンゲージメントの実現を目指す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:28:16 GMT)
Learning density ratios in causal inference using Bregman-Riesz regression [0.0] 核密度推定器を用いて数値と分母密度を別々に推定することは不安定な性能をもたらす。
密度比を(a)ブレグマンの発散に基づいて直接推定する手法や、(b)密度比を確率として再キャストする手法が開発されている。
本稿では,これら3つの手法が共通フレームワークで統一可能であることを示し,ブレグマン・リース回帰(英語版)と呼ぶ。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:10:41 GMT)
Learning a Generalized Model for Substation Level Voltage Estimation in Distribution Networks [0.0] 本稿では,サブステーションレベルの電圧推定のための階層型グラフニューラルネットワークを提案する。
このモデルは、複数のサブステーションとDER浸透シナリオをまたいだ何千ものバスで訓練され、評価されている。
実験により,提案手法は代替データ駆動モデルよりもRMSEの最大2倍低い値が得られることが示された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:44:25 GMT)
KS-Net: Multi-layer network model for determining the rotor type from motor parameters in interior PMSMs [0.0] 本研究は,IMMSMのローター形状をデータ駆動手法を用いて高精度に予測できることを示す。
本研究は, モータ設計プロセスの高速化, 自動ロータ識別システムの開発, および工学的応用におけるデータ駆動型故障診断を実現するための基盤となる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:32:05 GMT)
Invoice Information Extraction: Methods and Performance Evaluation [0.0] そこで本研究では,抽出したデータの精度を注釈付き地上真実に対して評価するための評価指標(EM)を提案する。
このアプローチでは、スキャンされた請求書やデジタル請求書を前処理し、DoclingとLlamaCloud Servicesを使用して請求書番号、日付、総金額、ベンダーの詳細などのキーフィールドを特定し、抽出する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:16:24 GMT)
Investigating the performance of RPM JTWPAs by optimizing LC-resonator elements [0.0] RPM JTWPAは量子コンピューティングや量子情報アプリケーションにおいて重要な役割を果たしている。
本研究は、利得、帯域幅、二次スキューズを最大化するためにパラメタライズされた共振器素子を最適化することに焦点を当てる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:50:54 GMT)
Interact and React: Exploring Gender Patterns in Development and the Impact on Innovation and Robustness of a User Interface Tool [0.0] 本研究では、アクティブなコントリビュータコミュニティとユーザインターフェースを構築するためのJavaScriptライブラリであるReactについて調査する。
Reactプロジェクトの11年にわたるメジャーバージョンリリースにつながるコントリビューションパターンの変化だけでなく、堅牢性とイノベーションのメトリクスの男女差についても検討しています。
その結果,女性の排除はソフトウェアにとって有害であり,女性が機能強化や依存性管理に大きく貢献していることがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 13:33:06 GMT)
Integrating Product Coefficients for Improved 3D LiDAR Data Classification (Part II) [0.0] 製品係数とオートエンコーダ表現とKNNを組み合わせることで,一貫した性能向上が得られることを示す。
よりリッチな係数セットは、クラス分離性と全体的な精度を体系的に改善します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:57:52 GMT)
Improving Micro-Expression Recognition with Phase-Aware Temporal Augmentation [0.0] マイクロ・エクスプレッション(ME)は、半秒未満の真の感情を示す、簡潔で不随意的な顔の動きである。
深層学習は、マイクロ圧縮認識(MER)に大きな進歩をもたらしたが、その効果は、注釈付きMEデータセットの不足によって制限されている。
本稿では動的画像に基づく位相認識時間拡張法を提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:20:51 GMT)
Identifying internal patterns in (1+1)-dimensional directed percolation using neural networks [0.0] ニューラルネットワークを用いた位相遷移の自動検出法と隠れパーコレーションパターンの分類について述べる。
提案するネットワークモデルは,CNN,TCN,GRUの組み合わせに基づいており,手動による特徴抽出を伴わずに,生の設定を直接訓練する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:06:07 GMT)
Identifying curriculum disruptions in engineering education through serious gaming [0.0] このワークショップでは、危機シナリオをシミュレートすることで、高等教育におけるカリキュラムのレジリエンスを高めるために設計された真剣なゲームであるSUCREを参加者に紹介する。
ワークショップの終わりに、参加者は、カリキュラムに影響を与える可能性のある重要なトリガーを特定し、カスケード効果を評価し、自身の組織内でのSUCREの適用性を反映することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:58:58 GMT)
Hybrid Path-Transverse Electric Mode Qudit Encoding on an Integrated Photonic Chip [0.0] 複数の自由度を使って量子情報を符号化するハイブリッド符号化は、ヒルベルト空間のサイズを増大させることができる。
本稿では, トランスバース電気モードの制御が可能なマルチモーダルコンポーネントを備えた, 再プログラム可能な集積フォトニックデバイスについて述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:00:17 GMT)
High Memory Masked Convolutional Codes for PQC [0.0] 本稿では,高メモリマスク畳み込み符号に基づく量子後暗号システムを提案する。
任意の平文長をサポートし、線形時間復号化とビット単位の計算コストの均一化を実現している。
このスキームは、古典的なマッケイリーシステムよりも2100以上の要因で暗号解析のマージンを達成している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:39:20 GMT)
Globalizing the Carleman linear embedding method for nonlinear dynamics [0.0] カールマン埋め込み法は、複数の固定点が存在する領域に収束しない。
我々は,複数の領域に分割した空間をベースとしたグローバルなカールマン埋め込み手法の3つのバージョンを提案する。
全ての手法は、複数の積分可能でカオス的な非線形力学系で数値的に試験される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:59:07 GMT)
Generation of multipartite photonic entanglement using a trapped-ion quantum processing node [0.0] ファクトリノードは、マルチパーティントエンタングルメントの生成と配布のハブとして機能する。
我々は、3つの経路スイッチ可能な光子のグリーンベルガー・ホーネ・ザイリンガー状態(GHZ)を生成するために,本システムをプログラムする。
以上の結果から, コトラップイオン量子ビットの絡み合った状態の確定的準備のための確立された技術が, 走行光子の同じ状態の調製に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:35:49 GMT)
Generalized Boundary Conditions for the qBounce Experiment [0.0] 地球重力下で鏡の上を跳ね返る超低温中性子に対して境界条件がどのように実装されているかを示す。
この結果は、重力量子状態の定量的な予測には、自己共役性を強制し、正しい境界物理学をモデル化することが不可欠であることを強調している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:11:38 GMT)
Gauge fields induced by curved spacetime [0.0] 私は、周期的時空測度におけるディラックフェルミオン、ゲージ場における非相対論的フェルミオン、格子上の周期的スカラー場におけるディラックフェルミオンの間の拡張双対性(有理性)を発見した。
これは、格子上の時空測度、ゲージ場、スカラー場の間の予期せぬ等価性を示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:15:14 GMT)
Game-Theoretic Discovery of Quantum Error-Correcting Codes Through Nash Equilibria [0.0] 競合する目的間の戦略的相互作用としてコード最適化をリキャストするゲーム理論フレームワークを導入する。
グラフ状態安定化器コードの適用により、フレームワークは6つの異なる目的にまたがるコードを検出する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:11:32 GMT)
From Murals to Memes: A Theory of Aesthetic Asymmetry in Political Mobilization [0.0] 左翼運動は歴史的に参加型芸術形態を実践に組み入れてきたが、右翼運動は戦略的コミュニケーションを優先し、最近ではミームのデジタル文化も重視されている。
本稿では、政治行動におけるこの相違を説明するために、審美的非対称性の概念を紹介する。
非対称性は偶然ではなく、4つの相互接続構造因子の結果であると主張する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:34:52 GMT)
From Ghazals to Sonnets: Decoding the Polysemous Expressions of Love Across Languages [0.0] この論文は、ウルドゥー詩の複雑な世界を掘り下げ、多節詩のレンズを通してその主題的な深さを探求する。
3つの同義語(パヤル語、ムハバト語、イシュク語)のニュアンスな相違に焦点を当てることで、ウルドゥー語特有の感情と経験のスペクトルを明らかにする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:00:09 GMT)
From Checklists to Clusters: A Homeostatic Account of AGI Evaluation [0.0] AGI評価では、マルチドメイン機能プロファイルを報告しているが、通常は対称重みを割り当て、スナップショットスコアに依存する。
一般知性は、ホメオスタティックな資産クラスタとして理解されていると私は主張する。
本稿では,CHC由来の重みを透過感度分析でインポートする中央値優先スコアと,プロファイルの持続性,耐久性学習,エラー訂正を分離するクラスタ安定性指標ファミリの2つを提案する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 01:59:40 GMT)
Fragment, Entangle, and Consolidate: Strong Correlation through Bi-fold Quantum Circuits [0.0] 本稿では, 問題の分解, 絡み合いの蓄積, およびその後の統合に基づく, 強い電子相関を扱うための一般的なスキームを提案する。
提案手法は、量子化学に量子優位性を利用する可能性を解き明かす上で、非常に正確で、柔軟で、堅牢であることが示されている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:15:34 GMT)
Foundation Model-Driven Classification of Atypical Mitotic Figures with Domain-Aware Training Strategies [0.0] MIDOG 2025 Challenge Track2の解として、正常ミオティックフィギュア(NMF)と非定型ミオティックフィギュア(AMF)のバイナリ分類について述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:39:43 GMT)
Exploring molecular supersolidity via exact and mean-field theories: single microwave shielding [0.0] 単一マイクロ波遮蔽下でのボソニック分子のためのGross-Pitaevskiiフレームワークを開発した。
正確な量子モンテカルロシミュレーションと比較した。
楕円型マイクロ波偏光は円筒対称系の方向依存超流動性を誘導することを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:57:47 GMT)
Exceptional Antimodes in Multi-Drive Cavity Magnonics [0.0] 4ポート3モードキャビティ・マグノニクス・プラットフォームを実証した。
2つのマイクロ波励起を正確に位相シフトまたは/または相対的に減衰させることができる。
干渉は、例外的な点の位置と特性を積極的に調整するために用いられる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:05:47 GMT)
Estimating Bell Diagonal states with separable measurements [0.0] この研究は、局所的な行動や古典的な通信に限られる量子ネットワーク内のベル対角状態の推定を分析する。
ベイズ平均推定は, 直接反転と最大様相推定よりも優れていることを示すとともに, 予測リスクの解析式を提供し, 数値シミュレーションによる解析結果の裏付けとなる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 07:04:25 GMT)
Establishing trust in automated reasoning [0.0] この研究は、科学の重要な信頼源である独立したレビューに焦点を当て、そのレビュー可能性に影響を与える自動推論システムの特徴を特定する。
また、技術的・社会的措置を組み合わせることで、信頼性と信頼性を高めるためのステップについても論じている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:03:40 GMT)
Environment-imposed selection rules for nuclear-spin conversion of H$_2$ in molecular crystals [0.0] 核スピン変換は、磁場や触媒表面を破るために必要な厳密な対称性の規則によって制御される。
非磁性分子結晶場の組成は、外部磁場なしでこれらの規則を課し緩和することができることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:59:36 GMT)
Entanglement dynamics from universal low-lying modes [0.0] レニイエントロピーのような情報理論の量は、その深夜の行動において顕著な普遍性を示している。
対称性を持たない系では、ユークリッド・ハミルトニアンの低エネルギー励起は、ギャップ付き準粒子のようなバンドによって普遍的に与えられる。
この構造は、ギャップ付き低層モードの普遍的な集合の観点から、絡み合い力学の理解を提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:02:08 GMT)
Enhancing Retrieval-Augmented Generation with Two-Stage Retrieval: FlashRank Reranking and Query Expansion [0.0] RAGは、大きな言語モデル(LLM)とレトリバーを結合して、外部のエビデンスで生成された応答を接地する。
LLM駆動型クエリ拡張を統合して候補リコールを改善する2段階検索パイプラインを提案する。
FlashRankは、トークン予算の下で最適な証拠のサブセットを動的に選択する高速な限界効用リランカである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:08:17 GMT)
Emergent nonlocal interactions induced by quantized gauge fields in topological systems [0.0] 量子化された実または合成静的ゲージ場に結合したフェルミオン系およびボゾン系について検討する。
共通QMFとの結合は古典的なアナログを持たない粒子間の創発的相互作用を引き起こすことを示す。
実ゲージ場と合成ゲージ場の両方を包含する1次元および2次元モデル系を解析する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 23:25:43 GMT)
Elastic Quantum Coupling Between Free Electrons and Photons [0.0] 弾性電子-光子量子カップリングとその可能性について定式化する。
この原理は、量子状態を変化させることなくビーム中の電子を数えることに適用できる。
これはAAスケールでの量子・サブショットノイズ検出と撮像を可能にする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:26:42 GMT)
Efficient state estimation on quantum processors [0.0] 我々は、nビット量子コンピュータの集合状態を推定するためのスケーラブルで絡み合いのない2つの方法を提案する。
第1の方法は5つの量子回路からなる固定セットで構成され、測定資源としての絡み合いを回避している。
第2の方法は2n+1回路しか必要とせず、それぞれが測定段階でn量子ビットの1つに1つの局所ゲートを適用する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 18:03:21 GMT)
Efficient Entanglement Swapping in High-Dimensions with only Linear Optics [0.0] エンタングルメントスワッピングは、第1世代の量子リピータを実現するためのビルディングブロックである。
本稿では,アシラリー光子を用いたHDエンタングルメントスワップのための効率的な線形光学プロトコルを提案する。
偏光および時間ビンDOFにおける超絡み合いを用いた実験設計について述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 14:24:26 GMT)
Doubly Robust Estimation of Causal Effects in Strategic Equilibrium Systems [0.0] 本稿では,戦略的環境における因果推論の新しいフレームワークであるSDR (Strategic Doubly Robust) 推定手法を紹介する。
このフレームワークは、エージェントが介入に対して戦略的に応答するとき、信頼できる因果推論に原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:41:35 GMT)
Defect mediated quantum melting of charge ordered insulators [0.0] We show that the allowed topological order phases which are proximate to the Wigner-Mott insulators strongly depending the charge ordering in the WMI。
WMIのトポロジ的欠陥の増大の観点から、WMIの量子融解遷移と近位QCLについて述べる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:28:29 GMT)
DeepRV: Accelerating spatiotemporal inference with pre-trained neural priors [0.0] 我々は、ハイパーRV推定を含む完全なGP精度と密に一致したニューラルネットワークサロゲートであるDeepRVを紹介する。
シミュレーションされたベンチマーク全体を通じて、DeepRVは非分離プログラミングを達成し、ロンドンの教育不足に対する現実世界の応用を実現している。
すべての実験は、1つのコンシューマグレードのGPU上で実行され、実践者のアクセシビリティを保証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:20:58 GMT)
Decoherence-free subspaces in the noisy dynamics of discrete-step quantum walks in a photonic lattice [0.0] 周期的に駆動される離散ステップ量子ウォークの1次元フォトニック格子における雑音ダイナミクスについて検討する。
Floquet 周期で一定となるバルク時間ノイズがデコヒーレンスフリー運動量部分空間に繋がることがわかった。
位相的エッジ状態を考慮すると、時間的ノイズの種類に関係なくデコヒーレンスを観察する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:35:14 GMT)
Data-Driven Analysis of Intersectional Bias in Image Classification: A Framework with Bias-Weighted Augmentation [0.0] 本稿では,定量的フェアネス指標と解釈可能性ツールを組み合わせ,モデル予測におけるバイアスパターンの同定を行うIFEF(Intersectional Fairness Evaluation Framework)を提案する。
次に、サブグループ分布統計に基づいて変換強度を適応する新しいデータ拡張戦略であるバイアス重み拡張(BWA)を提案する。
5つのオブジェクトクラスを持つOpen Images V7データセットの実験では、BWAは、表現不足のクラス環境交差点の精度を最大24ポイント向上することを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:10:57 GMT)
Cyber-human social co-operating system: Application design and implementation [0.0] Social Co-OSは、サイバー社会と人間社会の協調システムである。
この研究は、Social Co-OSの概念に基づいた新しいアプリケーションアーキテクチャを定義することを目的としている。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 22:02:25 GMT)
Controlling the image generation process with parametric activation functions [0.0] 本稿では,対話や実験を通じてモデルをよりよく理解するシステムを提案する。
FFHQ と ImageNet で訓練したStyleGAN2 と BigGAN のネットワーク上で,本手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:02:23 GMT)
Colepp: uma ferramenta multiplataforma para coleta de dados de dispositivos vestiveis [0.0] Coleppはオープンソースのツールで、複数のウェアラブルデバイスからデータを収集して同期する。
このシステムは、スマートフォンを中央ハブとして統合し、Polar H10チェストストラップとWear OSスマートウォッチからデータを受け取り、同期データセットをCSV形式でエクスポートする。
ユースケースは、一貫性のある同期信号を生成するツールの有効性を示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:50:43 GMT)
Chebyshev Moment Regularization (CMR): Condition-Number Control with Moment Shaping [0.0] textbfChebyshev Moment Regularization (CMR)を導入する。
CMRは、ログ条件プロキシ形状と内部をチェビシェフモーメントを介して、スペクトルエッジを共同で制御する。
これらの結果は、テキスト最適化によるスペクトル事前条件付け(英語版)をサポートし、安定的で正確な学習のために、よく条件付けられた状態に向けて直接ステアリングする。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 06:54:41 GMT)
Cavity Duplexer Tuning with 1d Resnet-like Neural Networks [0.0] 本稿では,大量の調整ネジを付加したキャビティデュプレクサのチューニングを行う機械学習手法を提案する。
テスト後,従来の強化学習手法を廃止し,教師付き学習装置でタスクを再構築した。
外部制御アルゴリズムを備えたニューラルネットワークは、スクリュー毎の4-5回転でデュプレクサのほぼチューニング状態に達することができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:16:56 GMT)
Capturing Protein Free Energy Landscape using Efficient Quantum Encoding [0.0] 本研究は, ペプチドおよび小タンパク質の折り畳み構造を予測するための, ターンベース符号化アルゴリズムを提案する。
我々は、3次元の面中心立方体格子上に折り畳み過程を符号化する目的関数からハミルトニアンを構築した。
最小エネルギーの折り畳み構成を特定するため,IBM 133量子ビットハードウェア上に実装された変分量子固有解器を用いる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:06:43 GMT)
CADE 2.5 - ZeResFDG: Frequency-Decoupled, Rescaled and Zero-Projected Guidance for SD/SDXL Latent Diffusion Models [0.0] SD/SDXL遅延拡散モデルのためのサンプルレベルガイダンススタックであるFDG 2.5(Comfy Adaptive Detail Enhancer)を紹介する。
ZeResFDGは、(i)誘導信号の低周波成分と高周波成分を再重み付けする周波数分離誘導、(ii)誘導予測のサンプルごとの大きさと正の分岐に一致するエネルギー再スケーリング、(iii)非条件方向と平行な成分を除去するゼロ投影を統一する。
SD/SDXLサンプリング装置全体では、ZeResCADEはシャープネスを改善し、順応し、調整することなく適度なスケールで制御する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:59:13 GMT)
Born series for s-wave scattering length and some exact results [0.0] ボルン級数は、中心ポテンシャルのクラス$V(r)$を次元のない結合強度$g$で6階まで計算する。
指数関数的に崩壊するポテンシャルの例と、単一の長さスケールの$a$を含む切り詰められたポテンシャルの例を考察する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 20:56:11 GMT)
Beating classical heuristics for the binary paint shop problem with the quantum approximate optimization algorithm [0.0] 我々は、量子近似最適化アルゴリズム(QAOA)を用いてバイナリペイントショップ問題(BPSP)の解を求める方法を示す。
一定の深さを持つQAOAは、無限大の極限$nrightarrowinftyinftyにおいて、古典を平均的に破ることができることを示した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:44:46 GMT)
Beat Tracking as Object Detection [0.0] 最近のビートとダウンビート追跡モデル(例えば、RNN、TN、Transformers)はフレームレベルのアクティベーションを出力する。
我々は、このタスクをオブジェクト検出として再フレーミングし、ビートとダウンビートを時間的「対象」としてモデル化する。
コンピュータビジョンから1DオーディオへのFCOS検出器の適用により、元のバックボーンをWaveBeatの時間的特徴抽出器に置き換え、マルチスケールの時間的パターンをキャプチャするFeature Pyramid Networkを追加します。
このモデルは、信頼スコアで重なり合うビート/ダウンビート間隔を予測し、続いて非最大抑制(NMS)を行い、最終的な予測を選択する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:38:35 GMT)
Balanced Multi-Task Attention for Satellite Image Classification: A Systematic Approach to Achieving 97.23% Accuracy on EuroSAT Without Pre-Training [0.0] 本研究は、衛星土地利用分類のための独自の畳み込みニューラルネットワークアーキテクチャを体系的に研究する。
事前訓練されたモデルに依存することなく、EuroSATデータセット上で97.23%のテスト精度を達成する。
我々の手法は、外部データを必要としない微調整されたResNet-50(98.57%)の1.34%で性能を達成する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:59:24 GMT)
Automatic essay scoring: leveraging Jaccard coefficient and Cosine similaritywith n-gram variation in vector space model approach [0.0] 本研究では,Jaccard係数とCosine類似度という2つの一般的な類似度指標の有効性について検討した。
システムの性能評価は、人間の成績とシステムによって生成されるスコアの差を測定する根平均二乗誤差(RMSE)を分析して行う。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:54:12 GMT)
Auditing and Mitigating Bias in Gender Classification Algorithms: A Data-Centric Approach [0.0] 広く使われている5つの性別分類データセットを検査し、重要な交叉表現の不足を明らかにした。
これらのデータセットのうち2つの最もバランスのとれたUTKFaceとFairFaceで、同一のMobileNetV2分類器をトレーニングします。
我々の公正性評価は、これらのモデルでさえ有意な偏見を示し、男性の顔よりも高い速度で女性の顔を誤分類していることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 02:09:17 GMT)
Audit the Whisper: Detecting Steganographic Collusion in Multi-Agent LLMs [0.0] Audit the Whisperは、理論、ベンチマーク設計、検出、検証にまたがるカンファレンスグレードの研究成果物である。
i) パラフレーズ, レート制限, 役割置換などの介入が, ペアリングしたKullback-Leibler診断によって定量的なペナルティの操作を課すことを示すチャネル容量分析を行った。
我々は、匿名化された再生スクリプト、匿名化されたマニフェスト、ドキュメントをリリースし、外部監査官がすべての図を再現し、二重盲検要件を満たし、最小限の努力でフレームワークを拡張します。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:12:39 GMT)
Artificial Transmission Line Synthesis Tailored for Traveling-Wave Parametric Processes [0.0] ラム素子インダクタとコンデンサで構築された人工伝送線路は、ほぼ量子制限された進行波パラメトリック増幅器(TWPA)のバックボーンを形成する
周期構造理論と受動ネットワーク合成を参考に、ロスレス人工伝送線路の汎用合成フレームワークを開発した。
新たな位相整合構造を持つ動力学的インダクタンスTWPAと、アンビデキストラスな右利きの伝送路を利用する逆向きのジョセフソンTWPAを設計する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 17:58:19 GMT)
Analytical exploration of the optomechanical attractor diagram and of limit cycles [0.0] 光学キャビティシステムにおける機械的圧力と放射圧の相互作用を分析する。
我々は、もともとレーザー理論の文脈で開発されたフォッカー・プランク形式を使い、空洞光学で使用される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 00:41:51 GMT)
An explicit statistical model for the Bell experiment [0.0] 現在、ベルの不等式が最大に絡み合った量子ビット対のテストで不等式を犯していることを確認する確固たる実験的な証拠が得られている。
これは、量子現象を局所的に定義された現実の要素の観点から記述できないという決定的な証明として広く解釈されている。
本稿では,ベル実験のための量子力学の予測を完全再現した明示的な統計モデルについて論じる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:50:50 GMT)
An Empirical Study on MC Dropout--Based Uncertainty--Error Correlation in 2D Brain Tumor Segmentation [0.0] 本研究は2次元脳腫瘍MRIにおけるMC Dropoutに基づく不確実性とセグメンテーション誤差の関係を実験的に検討した。
MC Dropoutの不確実性は境界誤差のローカライゼーションに限定的な手段を提供することを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 11:19:44 GMT)
Alignment is Localized: A Causal Probe into Preference Layers [0.0] ヒューマンフィードバックによる強化学習(RLHF)は、おそらくそのようなフレームワークの最も一般的な実装である。
レイヤワイド因果パッチの適用により、言語モデルのアライメントに対する好みの最適化を解析する。
少なくともいくつかの言語モデルでは、人間に基づく優先的なチューニングは、指向性があり、低ランクなプロセスであることを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 19:17:47 GMT)
Adaptive time Compressed QITE (ACQ) and its geometrical interpretation [0.0] 本稿では,アルゴリズム実行時間と回路深さの低減に基礎となる幾何特性を利用する新しいQITEアルゴリズムを提案する。
QITEアルゴリズムから推定したユニタリ演算子を近似することで深度低減を行う。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:04:06 GMT)
Adaptive quantum channel discrimination using methods of quantum metrology [0.0] 本稿では,最適な適応量子チャネル識別戦略を求めるための効率的なテンソルネットワークに基づくアルゴリズムを提案する。
本稿では,チャネル識別と推定問題の関連性について検討し,特にハイゼンベルクスケーリング推定性能を許容するモデル間の構造的類似性に注目した。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:19:29 GMT)
Adaptive Policy Synchronization for Scalable Reinforcement Learning [0.0] ClusterEnvは、分散環境実行のための軽量インターフェースである。
オンプレミスとオフラインの両方をサポートし、最小限の変更で既存のトレーニングコードに統合され、クラスタ上で効率的に実行される。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 21:19:22 GMT)
Adaptive Minds: Empowering Agents with LoRA-as-Tools [0.0] Adaptive Mindsは、LoRAアダプタをドメイン固有のツールとして扱うエージェントシステムである。
Systemはワークフロー管理のためにLangGraphで構築され、APIとWebインターフェースの両方をサポートし、完全にオープンソースである。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 08:10:06 GMT)
Achieving Sub-Exponential Speedup in Gate-Based Quantum Computing for Quadratic Unconstrained Binary Optimization [0.0] 本稿では,SAとGroverのアルゴリズムを統合し,サブ指数高速化を実現するハイブリッドアプローチを提案する。
酵素発酵では、温度、かき混ぜ、待ち時間、pH、トリプトファン、米粉などの変数を625のバイナリパラメータでコードする。
QUBOコストの最小化は、有効成分の最大化に対応する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 05:56:43 GMT)
AI-Powered Citation Auditing: A Zero-Assumption Protocol for Systematic Reference Verification in Academic Research [0.0] 本稿では,ツール使用機能を備えたエージェントAIを用いた,体系的かつ総合的な参照監査のための,AIを活用した新しい方法論を提案する。
我々は,引用が正しいと仮定せずに,複数の学術データベースに対するすべての参照を独立に検証するゼロ推定検証プロトコルを開発した。
その結果、公表されたPLOS論文の平均検証率は91.7%で、製造された参照、削除された記事、孤児の引用、捕食雑誌の発見に成功している。
この研究は、学術的引用整合性のための最初の検証済みAIエージェント方法論を確立し、監督者、学生、制度的品質保証の実践的適用性を実証する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 16:53:03 GMT)
AI and analytics in sports: Leveraging BERTopic to map the past and chart the future [0.0] 2002年から2024年にかけて発行されたスポーツにおけるAIと分析の利用に関する204の論文を識別する。
BERTopicのトピックモデリング技術を活用して、潜在トピックの抽出を行った。
この研究は、AIの変革的影響とスポーツにおける分析について、学者やスポーツ管理者に洞察を与える。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:57:42 GMT)
AI Adoption in NGOs: A Systematic Literature Review [0.0] 本研究は,NGOにおけるAI導入事例の種類を系統的に検討する。
組織の大きさと地理的コンテキストによってコンテキスト化される、共通の課題とソリューションを特定します。
我々の結果は、AIが有望である一方で、NGOの採用は不均一であり、より大きな組織に偏っていることを示している。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 10:22:20 GMT)
A source of heralded atom-photon entanglement for quantum networking [0.0] 我々は、単一原子の2光子放射を2つの光ファイバーキャビティに利用することにより、送信ノードに絡み合うヘラルドを実装した。
ヘラルディングにより, 繊維内での原子-光子の絡み合いは, それぞれ68(3)%, 87(2)%に向上することがわかった。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:54:25 GMT)
A single optically detectable tumbling spin in silicon [0.0] 我々は、G中心と呼ばれるシリコンの蛍光タンブリング欠陥の単一スピン分光を実証した。
結晶の個々の配向の間を飛び跳ねるスピン主軸から生じる微細な磁気構造を明らかにする。
欠陥の原子配向をモデル化することにより、スピン転位がマイクロ波磁場との結合のばらつきを引き起こすことを示す。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 12:38:25 GMT)
A Novel Combined Optical Flow Approach for Comprehensive Micro-Expression Recognition [0.0] 本研究では,両位相を統合して特徴表現を強化する複合光学フロー(COF)を提案する。
CASMEIIおよびSAMMデータセットによる実験結果から,COFは単一光フローベース法より優れていた。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:29:17 GMT)
A Multi-Cloud Framework for Zero-Trust Workload Authentication [0.0] 本稿では,Workload Identity Federation (WIF) とOpenID Connect (OIDC) を用いたマルチクラウドフレームワークについて述べる。
我々は、このフレームワークを企業規模の環境で検証し、攻撃面を著しく削減する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 04:11:31 GMT)
A Hybrid Quantum Solver for Gaussian Process Regression [0.0] 変分量子線形解法は、方程式の線形系を解くハイブリッド量子古典的アルゴリズムである。
行列の逆変換を方程式の一連の線形系に書き換えることで、ガウス過程の後方分布を計算するのに使うことができる。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 09:57:27 GMT)
A Gauss-Bonnet Theorem for Quantum States: Gauss Curvature and Topology in the Projective Hilbert Space [0.0] 固有射影子に基づくゲージ不変の定式化を用いてブロッホ帯域の量子計量の曲率を計算する。
ガウス曲率は正則領域上で一定であるが、多様体は必然的に特異点の閉曲線を発達させる。
フロントと符号付き領域形式の概念を導入することにより、折りたたみ曲線に沿って定義される特異曲率項を含む一般化されたガウス・ボネット関係を導出する。
論文参考訳(メタデータ) (Fri, 17 Oct 2025 15:50:03 GMT)