On the Trustworthiness of Generative Foundation Models: Guideline, Assessment, and Perspective [377.2] Generative Foundation Models (GenFMs) がトランスフォーメーションツールとして登場した。
彼らの広く採用されていることは、次元の信頼に関する重要な懸念を提起する。
本稿では,3つの主要なコントリビューションを通じて,これらの課題に対処するための包括的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:09:14 GMT)
AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models [125.4] オーディオ大言語モデル(ALLMs)は広く採用されているが、信頼性は未定である。
音色,アクセント,背景雑音などの非意味的音響的手がかりから生じるALMの有意な信頼性リスクを同定した。
本稿では,AudioTrustを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:36:30 GMT)
Experience-Guided Reflective Co-Evolution of Prompts and Heuristics for Automatic Algorithm Design [124.5] 組合せ最適化問題は伝統的に手作りのアルゴリズムで取り組まれている。
最近の進歩は、大規模言語モデルによる自動設計の可能性を強調している。
本稿では,自動アルゴリズム設計のためのPmpt and Heuristics (EvoPH) を用いた経験進化的リフレクティブ・ガイドを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:56:36 GMT)
HumanVideo-MME: Benchmarking MLLMs for Human-Centric Video Understanding [120.8] MLLM(Multimodal Large Language Models)は、画像とビデオの両方を含む視覚的理解タスクにおいて、大きな進歩を見せている。
既存の人間中心のベンチマークは、主にビデオ生成の品質と行動認識を強調し、人間中心のシナリオに必要な知覚と認知の能力を見落としている。
我々は,人間中心のビデオ理解におけるMLLMのより総合的な評価を提供するために,厳格にキュレートされたベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:05:26 GMT)
Human-MME: A Holistic Evaluation Benchmark for Human-Centric Multimodal Large Language Models [119.5] MLLM(Multimodal Large Language Models)は視覚的理解タスクにおいて大きな進歩を見せている。
Human-MMEは、人間中心のシーン理解におけるMLLMのより総合的な評価を提供するために設計された、キュレートされたベンチマークである。
我々のベンチマークは、単一対象の理解を多対多の相互理解に拡張する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:20:57 GMT)
Muon Outperforms Adam in Tail-End Associative Memory Learning [119.0] 機能埋め込みにかかわらず,Muonはクラス間のバランスの取れた学習を一貫して達成している。
我々の経験的観察と理論的分析により、ムオンの核となる利点が明らかとなり、その更新規則は線形連想記憶の外積構造と一致している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:04:08 GMT)
Aristotle: Mastering Logical Reasoning with A Logic-Complete Decompose-Search-Resolve Framework [117.7] 本稿では論理完全推論フレームワークであるAristotleについて,論理解法,論理解法,論理解法,論理解法の3つの主要なコンポーネントを提案する。
本フレームワークでは,記号表現と論理規則を総合的に推論プロセスに統合する。
いくつかのデータセットの実験結果は、Aristotleが最先端の推論フレームワークを精度と効率の両方で一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:35:22 GMT)
Scaling RL to Long Videos [116.0] LongVILA-R1-7Bはビデオベンチマークで高いパフォーマンスを達成し、ビデオMMEではそれぞれ65.1%と71.1%の精度を達成した。
LongVILA-R1-7Bは最大8,192フレームのビデオフレームとFPS設定をサポートする。
各種モダリティのRLトレーニングをサポートする,一般公開のためのトレーニングシステムをリリースする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:13:20 GMT)
Taming Diffusion Transformer for Efficient Mobile Video Generation in Seconds [91.6] Diffusion Transformer (DiT) はビデオ生成タスクにおいて高いパフォーマンスを示しているが、その高い計算コストは、スマートフォンのようなリソース制約のあるデバイスでは実用的ではない。
本稿では,ビデオ生成の大幅な高速化と,モバイルプラットフォームへの実用的な展開を実現するための新しい最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:27:53 GMT)
The Hunger Game Debate: On the Emergence of Over-Competition in Multi-Agent Systems [91.0] 本稿では,超高圧下のエージェントが信頼できない有害な行動を示すマルチエージェント論争における過剰競争について検討する。
この現象を研究するために,ゼロサム競争領域下での議論をシミュレートする新しい実験フレームワークであるHATEを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:44:47 GMT)
LargeAD: Large-Scale Cross-Sensor Data Pretraining for Autonomous Driving [88.9] LargeADは多用途でスケーラブルなフレームワークで、さまざまな現実世界の運転データセットにわたる大規模3D事前トレーニング用に設計されている。
我々のフレームワークはVFMを利用して2次元画像から意味的にリッチなスーパーピクセルを抽出する。
このアライメントは、クロスモーダルな表現学習を促進し、2Dデータと3Dデータのセマンティック一貫性を高める。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:55:43 GMT)
Understanding the Mixture-of-Experts with Nadaraya-Watson Kernel [87.6] Mixture-of-Experts (MoE)は最近の最先端の大規模言語モデル(LLM)の基盤となっている。
伝統的に、MoEはエキスパート出力を集約するためにルータスコア関数として$mathrmSoftmax$に依存している。
mathrmSoftmax$の代替として,textbfzero-additional-cost Kernel Router with Normalization (KERN)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:04:02 GMT)
MR$^2$-Bench: Going Beyond Matching to Reasoning in Multimodal Retrieval [86.4] マルチモーダル検索は、現代のAIアプリケーションにおいて重要なコンポーネントになりつつあるが、その評価は、より現実的で困難なシナリオの要求に遅れている。
マルチモーダル検索のための推論集約型ベンチマークであるMR$2$-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:09:14 GMT)
Recursive Self-Aggregation Unlocks Deep Thinking in Large Language Models [85.8] 推論時間計算は、複数の独立解の中から選択するか、あるいは自己精製を通じて逐次的にスケールすることができる。
進化的手法にインスパイアされたテスト時間スケーリング手法であるRecursive Self-Aggregation (RSA)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:58:03 GMT)
BatonVoice: An Operationalist Framework for Enhancing Controllable Speech Synthesis with Linguistic Intelligence from LLMs [84.6] 音声生成から命令理解を分離する「操作主義」に着想を得た新しいパラダイムを提案する。
本稿では,LLMが導体として機能するフレームワークであるBatonVoiceを紹介し,ユーザの指示を理解する。
別個のTSモデルである「オーケストラ」は、これらの特徴から音声を生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:52:14 GMT)
PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [83.4] PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:27:49 GMT)
Personalized Reasoning: Just-In-Time Personalization and Why LLMs Fail At It [81.5] 現在の大規模言語モデル(LLM)開発は、タスク解決と優先順位調整を別の課題として扱う。
静的ベンチマークを対話型パーソナライズタスクに変換する評価手法であるPreFDISCOを紹介する。
我々のフレームワークは、ユーザコンテキストに応じて、同じ質問が異なる推論チェーンを必要とするシナリオを作成します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:55:28 GMT)
DRBench: A Realistic Benchmark for Enterprise Deep Research [81.5] DRBenchは、エンタープライズ環境で複雑でオープンなディープリサーチタスクでAIエージェントを評価するためのベンチマークである。
セールス、サイバーセキュリティ、コンプライアンスなど10のドメインにわたる15のディープリサーチタスクをリリースしています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:47:20 GMT)
Wolf Hidden in Sheep's Conversations: Toward Harmless Data-Based Backdoor Attacks for Jailbreaking Large Language Models [81.4] Supervised Fine-tuning (SFT) は、大きな言語モデルと人間の意図を協調させ、ラベル付きタスク固有データでトレーニングする。
悪意のある攻撃者は、有害な質問応答(QA)ペアにトリガーを埋め込むことで、これらのモデルにバックドアを注入することができる。
脱獄型LDMのための新しいテキストクリーンデータバックドアアタックを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:21:07 GMT)
Dynamic Novel View Synthesis in High Dynamic Range [78.7] 現在の手法は主に静的なシーンに焦点を当てており、すべてのシーン要素が静止していて生きていないことを暗黙的に仮定している。
HDR-4DGSは,革新的な動的トーンマッピングモジュールを備えたガウススプラッティング方式のアーキテクチャである。
実験により、HDR-4DGSは、定量的性能と視覚的忠実度の両方において、既存の最先端手法を超越していることが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:05:11 GMT)
VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use [78.3] VerlToolは、体系的な設計原則を通じて制限に対処する統一的でモジュール化されたフレームワークです。
我々のフレームワークはARLTをマルチターントラジェクトリとして定式化し、マルチモード観測トークン(テキスト/画像/ビデオ)を単一ターンRLVRパラダイムを超えて拡張する。
モジュール化されたプラグインアーキテクチャは、軽量Python定義のみを必要とする迅速なツール統合を可能にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:22:37 GMT)
Stable Cinemetrics : Structured Taxonomy and Evaluation for Professional Video Generation [78.2] フィルム製造制御を4つの非交叉階層制御ノードに形式化するフレームワークであるStable Cinemetricsを紹介する。
10以上のモデルと20Kビデオにまたがる大規模な人間研究を行い、80以上の映画専門家のプールで注釈を付けました。
SCINEは、ビデオ生成モデルのランドスケープにプロの動画生成を集中させる最初のアプローチである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:22:18 GMT)
CWM: An Open-Weights LLM for Research on Code Generation with World Models [78.0] 我々は、Code World Model (CWM) をリリースし、世界モデルを用いたコード生成の研究を進めます。
我々はPythonインタプリタとエージェントDocker環境から大量の観察-アクショントラジェクトリをトレーニング中である。
我々は,ワールドモデルがエージェントプログラミングの恩恵を受けるための第一歩として,Pythonコード実行のステップバイステップシミュレーションを実現し,推論が後者にどのようなメリットをもたらすかを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:47:10 GMT)
Learning to Rank Chain-of-Thought: Using a Small Model [77.8] 本稿では、この課題に対処するために設計された高効率で軽量な検証器であるEORM(Energy Outcome Reward Model)を紹介する。
EORMはエネルギーベースのフレームワークを使用してChain-of-Thought(CoT)ソリューションをランク付けし、単純な結果ラベルだけで誤った推論と正しく区別することを学ぶ。
55Mのパラメータだけで、通常の報酬モデルより127倍以上小さいEORMは、Llama 3 8Bの精度をGSM8kで90.7%、MATHで63.7%に向上させた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:50:37 GMT)
ExoPredicator: Learning Abstract Models of Dynamic Worlds for Robot Planning [77.5] 本研究では,内因性行動とメカニズムの両方について,シンボル的状態表現と因果過程を共同で学習する抽象世界モデルのためのフレームワークを提案する。
シミュレーションされた5つのテーブルトップロボット環境の中で、学習されたモデルは、より多くのオブジェクトとより複雑な目標を持つ保留タスクに一般化した高速な計画を可能にし、幅広いベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:44:34 GMT)
Nudging the Boundaries of LLM Reasoning [77.3] 現在のオンライン強化学習アルゴリズムは、モデルに「解決不可能」な問題から学べない。
自己生成ヒントを用いてLLM推論の上界を推し進める「看護」手法であるNuRLを提案する。
NuRLは、テスト時間スケーリングを補完しながら、6つのベンチマークと3つのモデルで一貫した改善を実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:01:40 GMT)
Conda: Column-Normalized Adam for Training Large Language Models Faster [70.7] Column-Normalized Adam (Conda)は、大規模言語モデル(LLM)に対する新しいアプローチである。
Condaはサブスペースに更新を投影し、投影された勾配に基づいてカラムワイズ第2モーメント正規化を適用する。
LLaMAとGPT-2シリーズの実験では、コンダはトレーニング前のAdamW、Muon、その他のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:02:30 GMT)
LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.2] 従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。
このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。
明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:34:23 GMT)
AgenticIQA: An Agentic Framework for Adaptive and Interpretable Image Quality Assessment [69.1] 画像品質評価(IQA)は、人間の視覚系に根ざした知覚品質の定量化と解釈の両方を反映している。
AgenticIQAは、IQAを歪み検出、歪み解析、ツール選択、ツール実行の4つのサブタスクに分解する。
本稿では,IQAエージェントに適した大規模命令データセットであるAgenticIQA-200Kと,VLMベースのIQAエージェントの計画,実行,要約機能を評価するための最初のベンチマークであるAgenticIQA-Evalを紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:37:01 GMT)
QuantSparse: Comprehensively Compressing Video Diffusion Transformer with Model Quantization and Attention Sparsification [67.2] 拡散変換器は素晴らしいビデオ生成能力を示すが、その計算とメモリの禁止コストは実際の展開を妨げる。
モデル量子化とアテンションスパシフィケーションは圧縮に有望な2つの方向であるが、それぞれがアグレッシブ圧縮の下で深刻な性能劣化を被っている。
モデル量子化と注意散布を統合した統合フレームワークである textbfQuantSparse を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:14:18 GMT)
M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical Image Segmentation [66.9] 医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:55:10 GMT)
dVLA: Diffusion Vision-Language-Action Model with Multimodal Chain-of-Thought [66.8] VLA(Vision-Language-Action)モデルは、ロボット工学の次世代パラダイムとして登場しつつある。
単一システムにおける視覚認識,言語推論,ロボット制御を統一する拡散型VLAであるdVLAを紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:36:11 GMT)
From Ideal to Real: Unified and Data-Efficient Dense Prediction for Real-World Scenarios [66.6] DenseWorldは、緊急な現実世界のアプリケーションに対応する、25の密集した予測タスクの幅広いセットにまたがるベンチマークである。
次に,DenseDiTを提案する。DenseDiTは,生成モデルの視覚的先行性を利用して,統合された戦略により,多種多様な実世界の密集予測タスクを実行する。
DenseDiTは、ベースラインの0.01%未満のトレーニングデータを使用して優れた結果を得る。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:33:46 GMT)
Rotation Control Unlearning: Quantifying and Controlling Continuous Unlearning for LLM with The Cognitive Rotation Space [66.5] 本研究では,学習継続過程における学習度を定量化し,制御する,回転制御アンラーニング(RCU)と呼ばれる新しい手法を提案する。
歪対称損失は、回転角の変化が連続的未学習過程をシミュレートできる認知回転空間の存在を構築するように設計されている。
複数のデータセットに対する実験により、保持されたデータセットを持たないメソッドがSOTA性能を達成することを確認した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:59:29 GMT)
Large-Scale Targeted Cause Discovery via Learning from Simulated Data [66.5] 本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。
我々は、シミュレートされたデータに基づいて教師あり学習を用いてニューラルネットワークを訓練し、因果関係を推定する。
大規模遺伝子制御ネットワークにおける因果関係の同定に優れた性能を示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:15:41 GMT)
SeedPrints: Fingerprints Can Even Tell Which Seed Your Large Language Model Was Trained From [65.8] 我々は,LDMフィンガープリントのより強く,より本質的な概念であるSeedPrintsを提案する。
トレーニングされていないモデルでは,パラメータのみに依存した再現可能なトークン選択バイアスが示される。
LLaMAスタイルとQwenスタイルのモデルの実験では、SeedPrintsはシードレベルの識別性を実現し、バイオメトリック指紋に似た生来からライフサイクルの識別認証を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:34:08 GMT)
CoFFT: Chain of Foresight-Focus Thought for Visual Language Models [61.3] フォレスト・フォーカス思考の連鎖(英語: Chain of Foresight-Focus Thought, CoFFT)は、人間の視覚的認知をエミュレートすることによって視覚的推論を強化する訓練のないアプローチである。
これらの段階は反復的に機能し、推論が視覚的焦点を導き、視覚的焦点がその後の推論を知らせる相互依存サイクルを生成する。
Qwen2.5-VL、InternVL-2.5、Llava-Nextを使った複数のベンチマークでの実証結果では、3.1-5.8%が一貫したパフォーマンス向上を示し、計算オーバーヘッドは増大した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:59:16 GMT)
Backdoor Attribution: Elucidating and Controlling Backdoor in Language Models [61.3] 微調整された大規模言語モデル(LLM)は、データ中毒によるバックドア攻撃に対して脆弱である。
LLMの安全性の解釈可能性に関するこれまでの研究は、アライメント、ジェイルブレイク、幻覚に焦点を当てる傾向にあるが、バックドア機構を見落としている。
本稿では,3部構成の因果解析フレームワークであるBackdoor Attribution (BkdAttr) によるLCMバックドアの解釈機構について検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:52:35 GMT)
A Multi-Language Object-Oriented Programming Benchmark for Large Language Models [61.3] 35の既存ベンチマークの調査では、3つの大きな不均衡が明らかになった。
85.7%は単一のプログラミング言語に重点を置いている。
94.3%は関数レベルまたはステートメントレベルのタスクのみを対象としている。
80%以上は平均10件未満のテストケースを含む。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:30:08 GMT)
MobileLLM-R1: Exploring the Limits of Sub-Billion Language Model Reasoners with Open Training Recipes [60.6] 強い推論能力は、はるかに少ないデータで実現可能であることを示す。
MobileLLM-R50MのAIMEスコアは15.5であり、OLMo-2-1.48Bは0.6、SmolLM-2-1.7Bは0.3である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:16:06 GMT)
Beyond Next Token Probabilities: Learnable, Fast Detection of Hallucinations and Data Contamination on LLM Output Distributions [60.4] LLM出力シグナチャの効率的な符号化を訓練した軽量アテンションベースアーキテクチャであるLOS-Netを紹介する。
非常に低い検出レイテンシを維持しながら、さまざまなベンチマークやLLMで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:21:13 GMT)
Training Matryoshka Mixture-of-Experts for Elastic Inference-Time Expert Utilization [60.3] Matryoshka MoE(M-MoE)は、エキスパートアンサンブルに直接粗い構造を注入するトレーニングフレームワークである。
私たちの作業は、大規模MOEモデルのより実用的で適応可能なデプロイメントの道を開くものです。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:56:44 GMT)
Speculating LLMs' Chinese Training Data Pollution from Their Tokens [59.3] 汚染された中国人(PoC)トークンはポルノやオンラインギャンブルのような内容を示す。
GPTの語彙に基づくPoCトークンの形式的定義と分類について述べる。
我々は,LLMを微調整してPoCトークンを語彙でラベル付けすることで,PoCトークン検出装置を構築する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:36:58 GMT)
Pushing LLMs to Their Logical Reasoning Bound: The Role of Data Reasoning Intensity [59.3] データ推論強度 (Data Reasoning Intensity, DRI) は, サンプルの潜在論理的推論複雑性を定量化する新しい指標である。
次に、学習データの論理的推論強度を体系的に強化する再認識最適化戦略を導入する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:35:59 GMT)
Leveraging Scene Context with Dual Networks for Sequential User Behavior Modeling [58.7] 本稿では,シーンとアイテム間の動的興味や相互作用を捉えるために,新しいDSPネットワークを提案する。
DSPnetは、アイテムやシーンに対するユーザの動的関心を学習するための2つの並列ネットワークと、将来の振る舞いを予測するためのインタープレイをキャプチャするシーケンス機能拡張モジュールで構成されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:26:57 GMT)
Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents [58.7] エージェントの自己進化が意図しない方法で逸脱し、望ましくない結果や有害な結果に至る場合について検討する。
我々の経験から、誤進化は広範囲にわたるリスクであり、最上位のLSM上に構築されたエージェントにも影響を及ぼすことが判明した。
我々は、より安全で信頼性の高い自己進化型エージェントを構築するためのさらなる研究を促すための潜在的な緩和戦略について議論する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:55:55 GMT)
Point2RBox-v3: Self-Bootstrapping from Point Annotations via Integrated Pseudo-Label Refinement and Utilization [58.4] Point2RBox-v3は、ラベル割り当てに動的擬似ラベルを使用する最初のモデルである。
我々のソリューションは、特にオブジェクトサイズやスパースオブジェクトの発生に大きなバリエーションがあるシナリオにおいて、競争性能を提供します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:01:59 GMT)
Preemptive Detection and Correction of Misaligned Actions in LLM Agents [58.4] InferActは、実行前に不整合アクションを検出する新しいアプローチである。
タイムリーな修正をユーザーに警告し、有害な結果を防ぐ。
InferActは、ミスアライメントされたアクション検出におけるベースラインに対するMarco-F1の最大20%の改善を実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:12:22 GMT)
Should You Use Your Large Language Model to Explore or Exploit? [58.0] 探索・探索トレードオフに直面した意思決定エージェントを支援するために,大規模言語モデルの能力を評価する。
現在のLLMは、しばしば利用に苦労するが、小規模タスクのパフォーマンスを大幅に改善するために、コンテキスト内緩和が用いられる可能性がある。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:23:41 GMT)
Scalable LLM Math Reasoning Acceleration with Low-rank Distillation [57.9] 資源効率の高い蒸留法を提案し, 効率的な推論手法の展開から損失能力を回収する。
もともとの重みは未成熟で、パラメータの約1%、合成トレーニングサンプルは20Kに過ぎなかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:59:16 GMT)
Diffusion Language Models Know the Answer Before Decoding [57.0] 拡散言語モデル (DLM) は自己回帰的アプローチの代替として登場した。
我々の研究は、DLMの早期回答収束の見過ごされた特性を強調し、活用する。
Prophetは、早期コミット復号を可能にするトレーニングフリーの高速復号化パラダイムである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:14:27 GMT)
EchoGen: Generating Visual Echoes in Any Scene via Feed-Forward Subject-Driven Auto-Regressive Model [56.5] EchoGenは、主観駆動生成機能を備えたVisual Auto-Regressive(VAR)モデルを強化する先駆的なフレームワークである。
対象の抽象的アイデンティティを抽出するためにセマンティックエンコーダを用いており、このエンコーダは分離されたクロスアテンションを通して注入され、全体の構成を導出する。
私たちの知る限りでは、EchoGenはVARモデル上に構築された最初のフィードフォワードの主観駆動フレームワークです。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:45:48 GMT)
Structured Agent Distillation for Large Language Model [56.4] 本研究では,LLMをベースとした大規模エージェントを小さな学生モデルに圧縮するフレームワークであるStructured Agent Distillationを提案する。
提案手法は, [REASON] と [ACT] にトラジェクトリを分割し, 各コンポーネントを教師の行動に合わせるためにセグメント特異的な損失を適用した。
ALFWorld、HotPotQA-ReAct、WebShopの実験は、我々のアプローチがトークンレベルと模倣学習のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:52:40 GMT)
An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes [55.9] DRQ-learnerと呼ばれる新しいメタラーナーを開発した。
DRQ-learnerは離散状態空間と連続状態空間の両方の設定に適用できます。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:49:29 GMT)
Uncertainty-Aware Answer Selection for Improved Reasoning in Multi-LLM Systems [55.7] 大規模言語モデル(LLM)は例外的な機能を示しているが、複数のLLMから最も信頼性の高い応答を選択することは依然として困難である。
既存のアプローチは、しばしばコストのかかる外部検証器、人間の評価器、または単一のモデルから複数のサンプルを必要とする自己整合技術に依存している。
校正されたログ類似度スコアを用いて,複数のLLMから最適な応答を選択するための,原理的,斬新で,計算的に効率的な手法を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:25:19 GMT)
Training-Free Reward-Guided Image Editing via Trajectory Optimal Control [55.6] トレーニング不要な報酬誘導画像編集のための新しいフレームワークを提案する。
提案手法は,既存のインバージョンベースのトレーニングフリーベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:34:37 GMT)
Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.5] 大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。
既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:19:44 GMT)
CE-SDWV: Effective and Efficient Concept Erasure for Text-to-Image Diffusion Models via a Semantic-Driven Word Vocabulary [55.4] 大規模テキスト・ツー・イメージ(T2I)拡散モデルは、様々な概念に関する顕著な生成性能を達成している。
実際には、プライバシーと安全性の制限により、NSFW(Not Safe For Work)の概念に関する生成能力は望ましくない。
テキスト意味空間におけるT2I拡散モデルのターゲット概念を除去するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:49:10 GMT)
Learning to Reason as Action Abstractions with Scalable Mid-Training RL [55.2] 効果的な中間訓練フェーズは、有用なアクションのコンパクトなセットを特定し、高速な選択を可能にする。
本稿では,スケーラブルなミッドトレーニングアルゴリズムであるReasoning as Action Abstractions (RA3)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:34:20 GMT)
RE-Searcher: Robust Agentic Search with Goal-oriented Planning and Self-reflection [55.1] 環境の複雑さが脆弱な探索行動をいかに引き起こすかを定量的に分析する。
本稿では,検索エージェントRE-Searcherのインスタンス化をシンプルかつ効果的に行う手法を提案する。
この目標指向計画と自己回帰の組み合わせにより、RE-Searcherは複雑な検索環境における急激な手がかりに抵抗することができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:25:27 GMT)
BiasBusters: Uncovering and Mitigating Tool Selection Bias in Large Language Models [55.1] 大規模言語モデル(LLM)は、複数のプロバイダが機能的に同等のオプションを提供するマーケットプレースから引き出された外部ツールに依存していることが多い。
選択が体系的に偏りがある場合、ユーザエクスペリエンスを低下させ、競争を歪ませることができます。
ツール選択バイアスを評価するために,複数の機能的に等価なツールを含む多種多様なツールカテゴリのベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:02:13 GMT)
Max-Sliced Wasserstein Distance and its use for GANs [55.1] GAN(Generative Adversarial Nets)と変分自動エンコーダは,我々の分散モデリング機能を大幅に改善した。
距離測定値のサンプルの複雑さは, GANトレーニングに影響を与える要因の1つとして残されている。
提案手法は,高次元画像から256x256までのGANを簡易に訓練するものである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:25:53 GMT)
Learning to Dissipate Energy in Oscillatory State-Space Models [52.0] 状態空間モデル (SSM) はシーケンス学習のためのネットワークのクラスである。
我々は,D-LinOSSがLinOSSの手法を長距離学習タスクで一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:37:49 GMT)
Test time training enhances in-context learning of nonlinear functions [51.6] テストタイムトレーニング(TTT)は、各予測に先立って指定されたパラメータを明示的に更新することで、モデル性能を向上させる。
本研究では,TTTとテキスト内学習(ICL)の組み合わせについて検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:56:44 GMT)
Ringleader ASGD: The First Asynchronous SGD with Optimal Time Complexity under Data Heterogeneity [51.6] 本稿では,並列計算の理論的下界を実現する最初の非同期アルゴリズムであるリングリーダーASGDを紹介する。
我々の分析により、リングリーダーASGDは任意の勾配と時間変化速度の下で最適であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:11:44 GMT)
DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization [50.9] グループ相対政策最適化は大規模推論モデル(LRM)の強化学習手法である
差別学習の原則を基礎として, LRMの強化のための新たな差別的制約付き最適化フレームワークを導入する。
DisCO は GRPO と DAPO などの改良型を著しく上回り、GRPO の7%、DAPO の6% を平均的に上回っている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:04:21 GMT)
TraceDet: Hallucination Detection from the Decoding Trace of Diffusion Large Language Models [49.8] D-LLMの幻覚問題は未解決のままであり、現実世界のアプリケーションでは信頼性が制限されている。
既存の幻覚検出法はAR-LLM向けに設計されており、単一ステップ生成からの信号に依存している。
本稿では,幻覚検出のためのD-LLMの中間段階を明示的に活用する新しいフレームワークであるTraceDetを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:01:10 GMT)
Probing the Critical Point (CritPt) of AI Reasoning: a Frontier Physics Research Benchmark [49.6] 本研究では,研究レベルの推論タスクにおいて,大規模言語モデル(LLM)をテストするために設計された最初のベンチマークを示す。
CritPtは71の複合研究課題からなる。
現在最先端のLCMは、孤立したチェックポイントを早期に保証しているが、完全な研究スケールの課題を確実に解決できるには程遠い。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:34:03 GMT)
Scalable and Robust LLM Unlearning by Correcting Responses with Retrieved Exclusions [49.6] Webスケールのコーパスリスクを記憶し、センシティブな情報を暴露する言語モデル。
本稿では,新しいアンラーニングフレームワークであるCorrective Unlearning with Retrieved Exclusions (CURE)を提案する。
CUREは、リークのモデル出力を確認し、安全な応答に修正する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:07:45 GMT)
ReNF: Rethinking the Design Space of Neural Long-Term Time Series Forecasters [48.8] 本稿では,提案手法の理論的基礎となるマルチプルニューラル予測定理を提案する。
自動回帰(AR)と直接出力(DO)の両方の利点を組み合わせた新しい予測戦略であるブースト・ダイレクト・アウトプット(BDO)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:05:59 GMT)
What Can RL Bring to VLA Generalization? An Empirical Study [48.1] VLA(Large Vision-Language Action)モデルは、AIを具現化する大きな可能性を示している。
教師付き微調整(SFT)による主な訓練は、分散シフト下での複合誤差による一般化を制限する。
本稿では,VLAの一般化評価のための総合的ベンチマークを導入し,RL微調整の影響を系統的に検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:18:07 GMT)
ErrorPrism: Reconstructing Error Propagation Paths in Cloud Service Systems [47.3] 実運用マイクロサービスシステムにおけるエラー伝搬経路の自動再構築であるErrorPrismを提案する。
ErrorPrismは、102の現実世界のエラーに対するパスの再構築において97.0%の精度を実現し、既存の静的解析やLLMベースのアプローチよりも優れている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:13:21 GMT)
Attention as a Compass: Efficient Exploration for Process-Supervised RL in Reasoning Models [47.1] 推論モデルの効率的な探索を可能にする新しいPSRLフレームワーク(AttnRL)を提案する。
高い注意点を示すステップが推論行動と相関しているという予備観測により,高い値を持つ位置から分岐することを提案する。
我々は,問題の難易度と過去のバッチサイズを考慮に入れた適応型サンプリング戦略を開発し,トレーニングバッチ全体が非ゼロの利点値を維持することを保証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:58:34 GMT)
DISCOVER: Data-driven Identification of Sub-activities via Clustering and Visualization for Enhanced Activity Recognition in Smart Homes [46.9] 本研究では,未ラベルセンサデータから詳細な人間のサブアクティビティを検出する手法であるdiscoVERについて,事前のセグメンテーションに頼ることなく紹介する。
広範に使用されているHARデータセットに対する再注釈演習を通じて,その効果を実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:19:50 GMT)
S$^2$FS: Spatially-Aware Separability-Driven Feature Selection in Fuzzy Decision Systems [45.1] ファジィ決定システムのための空間認識分離性駆動型特徴選択(S$2$FS)を提案する。
S$2$FSは、クラス内コンパクト性とクラス間分離を考慮した空間的に認識された分離性基準によって導かれる。
10の実世界のデータセットの実験では、S$2$FSは8つの最先端の機能選択アルゴリズムを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:30:14 GMT)
OrthoLoC: UAV 6-DoF Localization and Calibration Using Orthographic Geodata [45.0] 我々はドイツとアメリカ合衆国から16,425個のUAV画像からなる最初の大規模データセットOrthoLoCを提案する。
データセットは、UAV画像と地理空間データのドメインシフトに対処する。
我々はAdHoPと呼ばれる改良手法を導入し、任意の特徴マッチングと統合でき、マッチングを最大95%改善し、翻訳エラーを最大63%削減できる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:45:00 GMT)
RE$^2$: Improving Chinese Grammatical Error Correction via Retrieving Appropriate Examples with Explanation [44.8] 中国語の文法的誤り訂正(CGEC)の主な目的は,中国語の文中の誤りを検出し,訂正することである。
大きな言語モデル(LLM)では、適切な参照例を選択することでパフォーマンスが向上する。
本稿では,文法的誤りを記述した適切な例を検索するRE$2$を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:14:19 GMT)
Hamster: A Large-Scale Study and Characterization of Developer-Written Tests [44.7] 我々はJavaアプリケーションの開発者によるテストについて調査し、オープンソースリポジトリから170万のテストケースをカバーした。
この結果から,開発者によるテストの大部分は,現在のATGツールの能力以上の特性を示すことがわかった。
私たちは、現在のツール機能と開発者のテストプラクティスに対するより効果的なツールサポートのギャップを埋めるのに役立つ有望な研究方向を特定します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:08:23 GMT)
Provable Scaling Laws of Feature Emergence from Learning Dynamics of Grokking [44.6] 我々は、グルーキング現象、すなわち遅延一般化について研究する。
本稿では,2層非線形ネットワークのグルーキング動作の3つの重要な段階を捉える新しいフレームワークを提案する。
私たちの研究は、体重減少、学習率、グルーキングにおけるサンプルサイズといったハイパースの役割に光を当てています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:43:09 GMT)
Composing Global Solutions to Reasoning Tasks via Algebraic Objects in Neural Nets [44.6] 二次活性化と損失$L$の2層ニューラルネットワークに対する解空間のリッチ代数構造を証明した。
このようなリッチな構造は、部分解から大域最適解を初期的に構築することを可能にする。
トレーニング力学は、重量減衰下でのより単純な解を好んでおり、完全記憶のような高次大域的解は好ましくないことを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:00:56 GMT)
U-Mamba2: Scaling State Space Models for Dental Anatomy Segmentation in CBCT [44.4] CBCT (Cone-Beam Computed Tomography) は歯科用3次元イメージング技術として広く用いられている。
U-Mamba2は、マルチ解剖学的CBCTセグメンテーションのために設計された新しいニューラルネットワークアーキテクチャである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:16:30 GMT)
U-Mamba2-SSL for Semi-Supervised Tooth and Pulp Segmentation in CBCT [44.4] U-Mamba2-SSLは,U-Mamba2モデル上に構築され,多段階の学習戦略を用いる,新しい半教師付き学習フレームワークである。
U-Mamba2-SSLは平均スコア0.789、DSC0.917を隠しテストセットで達成し、STSR 2025のタスク1で1位となった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:23:13 GMT)
Deep Reinforcement Learning-Based Precoding for Multi-RIS-Aided Multiuser Downlink Systems with Practical Phase Shift [44.3] 本研究では、RIS位相シフト行列をスペクトル効率に最適化することを目的として、複数再構成可能なマルチユーザダウンリンクシステムについて検討する。
提案するDD-DRLフレームワークは,mmWaveチャネル設定において,両方のランダムなユーザ数で評価される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:57:57 GMT)
User-Centric Communication Service Provision for Edge-Assisted Mobile Augmented Reality [44.0] 将来の6Gネットワークはエッジ支援モバイル拡張現実(MAR)を促進する
MARデバイスは、カメラフレームをエッジサーバにタイムリーにアップロードし、SLAMベースのデバイスポーズトラッキングを同時に行う必要がある。
我々は、MARのためのユーザ中心の通信サービス提供のためのデジタルツイン(DT)ベースのアプローチを開発する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:50:32 GMT)
OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.9] OneSearchは、eコマース検索のための最初の産業向けエンドツーエンド生成フレームワークである。
OneSearchは運用費を75.40%削減し、Model FLOPsの利用を3.26%から27.32%に改善した。
このシステムはKuaishouの複数の検索シナリオにまたがって展開され、数百万のユーザーにサービスを提供している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:54:50 GMT)
Revealing the Power of Post-Training for Small Language Models via Knowledge Distillation [43.7] 我々は,小型モデルの精度を効果的に向上する,系統的な後学習パイプラインを導入する。
結果として得られた命令調整モデルにより、最先端のパフォーマンスが達成される。
この研究は、Ascendエッジデバイス上で高性能言語モデルを開発するための実用的で効率的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:40:55 GMT)
UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface [43.6] textbfOpen-ended言語インターフェースを通じて、textbfFineの粒度の視覚的知覚タスクをTextbfUnifyするフレームワークである。
オブジェクトレベルの検出、ピクセルレベルのセグメンテーション、イメージレベルの視覚言語タスクを単一のモデルに統合する。
私たちのフレームワークは、きめ細かい認識と視覚言語タスクのギャップを埋め、アーキテクチャ設計とトレーニング戦略を大幅に単純化します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:42:01 GMT)
DNN-Based Precoding in RIS-Aided mmWave MIMO Systems With Practical Phase Shift [43.6] 本稿では、直接通信路を妨害したミリ波マルチインプット多重出力(MIMO)システムのスループットを最大化する。
リコンフィギュアブルインテリジェントサーフェス(RIS)は、視線(LoS)とマルチパス効果に関連するmmWave特性を考慮して伝送性を高めるために使用される。
ディープニューラルネットワーク(DNN)は、より高速なコードワード選択を容易にするために開発された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:52:08 GMT)
EditReward: A Human-Aligned Reward Model for Instruction-Guided Image Editing [43.2] mnameは、命令誘導画像編集タスクにおいて、人間の好みと優れた整合性を示す。
mnameはGenAI-Bench、AURORA-Bench、ImagenHub、そして私たちの新しいベンチネームといった確立したベンチマークに対して、最先端の人間相関を実現する。
トレーニングデータセットを備えたmnameがリリースされ、コミュニティがより高品質な画像編集トレーニングデータセットを構築するのに役立つ。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:51:04 GMT)
LMOD+: A Comprehensive Multimodal Dataset and Benchmark for Developing and Evaluating Multimodal Large Language Models in Ophthalmology [43.1] 視力低下の眼疾患は、労働力不足によるタイムリーな診断と専門医療へのアクセス制限により、世界的な健康上の重荷となる。
本報告では,12の眼球運動条件に共通する多粒性アノテーションと5つの画像モダリティを併用した32,633例の大規模マルチモーダル眼科ベンチマークを報告する。
このデータセットは、画像、解剖学的構造、人口統計、自由テキストアノテーションを統合し、解剖学的構造認識、疾患スクリーニング、疾患ステージング、およびバイアス評価のための人口統計予測をサポートする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:29:18 GMT)
Improving Sampling Efficiency in RLVR through Adaptive Rollout and Response Reuse [43.1] 本稿では, 適応ロールアウトと応答再利用という2つの新しい手法を導入する, サンプリング効率のよいRLVRアルゴリズムを提案する。
AR3POはGRPOを一貫して上回り、DAPOに匹敵する。
より大きな32Bモデルでは、AR3POは、ロールアウトコストを著しく低く保ちながら、同様のトレーニングステップでDAPOと同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:29:53 GMT)
Noise-Guided Transport for Imitation Learning [42.8] 騒音誘導輸送は、敵の訓練によって解決された最適な輸送問題として模倣を推し進める。
NGTは事前訓練や特別なアーキテクチャを必要とせず、設計による不確実性推定を組み込んでおり、実装とチューニングが容易である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:10:06 GMT)
Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries [42.8] インプシット知識抽出攻撃(IKEA)は、良質なクエリを通してRAGシステム上で知識抽出を行う。
IKEAは、抽出効率の80%以上、攻撃成功率の90%を超えている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:36:11 GMT)
Scalable Fingerprinting of Large Language Models [42.7] 我々はPerinucleus sampleと呼ばれる新しい手法を導入し、スケーラブルで永続的で無害な指紋を生成する。
この手法により,Llama-3.1-8Bモデルに24,576個の指紋を付加できることを示した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:18:39 GMT)
A quantitative analysis of semantic information in deep representations of text and images [42.6] 本稿では,意味的関連データの表現の相対的情報量を測定する手法を提案する。
大規模言語モデル(LLM)と視覚変換器の複数のトークンにエンコードする方法を探索する。
我々は、画像とテキストの表現の間に有意かつモデルに依存した情報非対称性を観察する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:06:40 GMT)
Adaptive Planning for Multi-Attribute Controllable Summarization with Monte Carlo Tree Search [42.5] マルチ属性制御可能な要約(PACO)のための適応計画法を提案する。
PACOは、カスタマイズされたモンテカルロ木探索(MCTS)を用いて、シーケンシャル属性制御の順序を計画するタスクを再構成する。
多様なドメインやモデルにわたる実験は、PACOが堅牢なマルチ属性制御を実現することを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:55:24 GMT)
TAMO: Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent with Multi-Modality Observation Data in Cloud-Native Systems [42.5] クラウドネイティブシステムにおける大規模言語モデル(LLM)による根本原因分析(RCA)は、現代のソフトウェア運用とメンテナンスにおいて重要なトピックとなっている。
既存のLLMベースのアプローチでは、マルチモード入力制約、コンテキストウィンドウ制限、動的依存グラフの3つの大きな課題に直面している。
細粒度RCA,すなわちTAMOのための多モード観測データを用いたツール支援LDMエージェントを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:36:49 GMT)
Observation of non-Hermitian topology in cold Rydberg quantum gases [42.4] 我々は,非エルミートスペクトルトポロジーを散逸性Rydberg原子気体中で実験的に実証した。
相互作用強度を増大させることで、系はエルミート系から非エルミート系へと進化する。
この研究は、非エルミート位相、強い相互作用、散逸性量子力学の間のリッチな相互作用を探索するための多用途プラットフォームとして、コールド・リドバーグ気体を確立している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:44:43 GMT)
TAU: A Benchmark for Cultural Sound Understanding Beyond Semantics [42.3] 台湾の日常的な「音符」のベンチマークであるTAU(台湾音声理解)について紹介する。
TAUは、キュレートされたソース、人間の編集、LLMによる質問生成を組み合わせたパイプラインで構築されている。
Gemini 2.5やQwen2-Audioを含む最先端のLALMは、局所的な人間よりはるかに低い性能を示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:40:45 GMT)
Dragging with Geometry: From Pixels to Geometry-Guided Image Editing [42.2] 幾何学誘導型ドラッグベース画像編集手法であるGeoDragを提案する。
ジオドラグは3次元幾何学と2次元空間先行を共同で符号化する統一された変位場に基づいており、コヒーレントで高忠実で構造に一貫性のある編集を可能にしている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:53:11 GMT)
Stitch: Training-Free Position Control in Multimodal Diffusion Transformers [42.2] 近年,テキスト・ツー・イメージ(T2I)生成モデルが急速に進歩してきたが,空間的関係を捉えることは永続的な課題である。
自動生成バウンディングボックスを介して,外部位置制御をMMDiT(Multi-Modal Diffusion Transformer)に組み込む訓練不要なStitchを提案する。
対象とする注目ヘッドは、画像を完全に完成させることなく、世代中の個々のオブジェクトを分離し、切り離すために必要な情報をキャプチャする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:59:51 GMT)
Multi Layered Autonomy and AI Ecologies in Robotic Art Installations [42.2] 本稿では,Baoyang Chen氏の大規模インスタレーションであるSymbiosis of Agentsについて述べる。
AI駆動のロボットを没入型ミラーラインのアリーナに埋め込んで、マシンエージェンシーと芸術的作者との緊張関係を探る。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:42:13 GMT)
CHAI: Command Hijacking against embodied AI [41.9] CHAI(Command Hijacking against embodied AI)は、LVLM(Large Visual-Language Models)のマルチモーダル言語解釈能力を活用した、新しいプロンプトベースの攻撃である。
CHAIは、誤解を招く標識や視覚的な入力、トークン空間の体系的な検索、プロンプトの辞書の作成、そして視覚的アタック・プロンプットを生成するためにアタックモデルを誘導するなど、偽りの自然言語命令を組み込む。
我々は、ドローン緊急着陸、自律走行、空中物体追跡の4つのLVLMエージェントと、実際のロボット車両についてCHAIを評価した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:02:57 GMT)
Overthinking Reduction with Decoupled Rewards and Curriculum Data Scheduling [41.8] 大規模な推論モデルは、パフォーマンス上のメリットのない、過度に長い推論パスを生成します。
長さをペナライズする既存のソリューションは、しばしば失敗し、パフォーマンスが低下する。
我々は、現在長さの報酬に未適応な2つの欠陥の理論的発見に基づいて、新しいフレームワークDECSを紹介した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:04:43 GMT)
Dual-Scale World Models for LLM Agents Towards Hard-Exploration Problems [41.8] LLMベースのエージェントは有望な進歩を見てきたが、それでも探索を通じて新しい知識を学ぶことを必要とする「ハード探索」のタスクに限られている。
本稿では,グローバルスケールにおける高価値発見の軌道フロンティアを維持しつつ,デュアルスケールの世界モデルを活用した新たなアプローチであるGLoWを提案する。
我々はテキストベースのゲームのJerichoベンチマークスイートに取り組み、GLoWはLLMベースのアプローチのための新しい最先端パフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:57:33 GMT)
Catalog-Native LLM: Speaking Item-ID Dialect with Less Entanglement for Recommendation [41.6] 本稿では Item-ID + Oral- Language Mixture-of-Experts Language Model (IDIOMoE) を紹介する。
アイテムの相互作用履歴を言語空間内のネイティブな方言として扱い、協調的なシグナルを自然言語と同じ方法で理解できるようにする。
パブリックデータセットとプロプライエタリデータセットの両方で強力なレコメンデーションパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:30:43 GMT)
Barriers for Learning in an Evolving World: Mathematical Understanding of Loss of Plasticity [41.6] 可塑性の喪失(LoP)は、ディープラーニングモデルの将来的な学習能力の低下である。
本研究は,勾配に基づく学習におけるLoPの第一原理的研究である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:49:50 GMT)
LogPilot: Intent-aware and Scalable Alert Diagnosis for Large-scale Online Service Systems [41.6] LogPilotは、ログベースの自動アラート診断のためのLarge Language Models(LLM)を利用したインテント対応フレームワークである。
各リクエストの実行を時間的ログチェーンに再構築し、同様のチェーンをクラスタして、繰り返し実行される実行パターンを特定し、診断のためにLLMに代表的なサンプルを提供する。
LogPilotは、Volcano Engine Cloudの現実世界のアラートに基づいて、根本原因の要約の有用性を50.34%改善し、最先端の手法よりも正確なローカライゼーション精度を54.79%向上させた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:11:28 GMT)
WorldGym: World Model as An Environment for Policy Evaluation [41.2] WorldGymは、実環境のプロキシとして機能する自動回帰、アクション条件付きビデオ生成モデルである。
ポリシーはモンテカルロの世界モデルによるロールアウトを通じて評価され、視覚言語モデルが報酬を提供する。
We show that WorldGym can maintain relative policy rankings across different policy version, sizes, and training checkpoints。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:34:34 GMT)
Data-Free Continual Learning of Server Models in Model-Heterogeneous Federated learning [41.2] フェデレートラーニング(Federated Learning, FL)は、データプライバシを保持しながら、複数のエンティティにわたって分散学習パラダイムである。
新しいデータの継続的な出現とモデルの多様性の増大により、従来のフェデレーション学習は大きな課題に直面します。
我々はFedDCLを紹介した。FedDCLは、モデル・ヘテロジニアス・フェデレーション・セッティングにおいて、サーバモデルのデータフリー連続学習を可能にするように設計された新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:09:33 GMT)
UniVid: The Open-Source Unified Video Model [41.2] MLLMと拡散デコーダを軽量アダプタで結合する統一アーキテクチャUniVidを提案する。
標準ベンチマークの実験では、最先端のパフォーマンスが示されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:46:27 GMT)
Believing without Seeing: Quality Scores for Contextualizing Vision-Language Model Explanations [41.1] 本稿では,2つの品質スコアリング機能を用いて,VLMによる説明の相補的な2つの特性を評価することを提案する。
参加者は視覚的コンテキストを観察することなく,VLM予測が正確かどうかを判断しなければならない。
VLMの精度を11.1%向上させることで,VLMの精度が向上することが観察された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:34:21 GMT)
Complexity Analysis of Normalizing Constant Estimation: from Jarzynski Equality to Annealed Importance Sampling and beyond [40.8] 非正規化確率密度 $piproptomathrme-V$ が与えられたとき、正規化定数 $Z=int_mathbbRdmathrme-V(x)mathrmdx$ または自由エネルギー $F=-log Z$ はベイズ統計学、統計力学、機械学習において重要な問題である。
本稿では,逆拡散サンプリングに基づく新しいアルゴリズムを提案し,その複雑さを解析するためのフレームワークを構築し,マルチモーダリティに対処する際の効率を実証的に実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:57:37 GMT)
Collaborative Compression for Large-Scale MoE Deployment on Edge [40.8] 本稿では,エキスパートプルーニング,混合精度量子化,アクティベーション最適化を組み合わせた協調圧縮フレームワークを提案する。
私たちは、超大型のDeepSeek-V3から128GBのメモリ制限で圧縮されたモデルを初めてプラットフォームにデプロイしました。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:46:03 GMT)
FANformer: Improving Large Language Models Through Effective Periodicity Modeling [39.7] 本稿では、FANformerを導入し、FAN(Fourier Analysis Network)をアテンション機構に適応させ、効率的な周期性モデリングを実現する。
モデルサイズのスケールアップやトークンのトレーニングでは,FANformerがTransformerより一貫して優れています。
トレーニング済みのFANformer-1Bは、同様のモデルパラメータやトレーニングトークンを持つオープンソースのLLMと比較して、ダウンストリームタスクが大幅に改善されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:53:10 GMT)
Point-It-Out: Benchmarking Embodied Reasoning for Vision Language Models in Multi-Stage Visual Grounding [39.6] VLM(Vision-Language Models)は、様々なタスクにまたがる優れた世界的知識を実証した。
既存のベンチマークでは、画像アノテーションに基づいた複数選択質問を通じて、VLMの具体的推論能力を評価している。
我々は,VLMの具体的推論能力を正確な視覚的接地により体系的に評価する新しいベンチマークであるPoint-It-Outベンチマークを紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:05:54 GMT)
A unified error analysis for randomized low-rank approximation with application to data assimilation [39.5] 中心行列および非標準行列に対するフロベニウスノルムにおける低ランク近似誤差の解析のための統一的なフレームワークを提案する。
最小限の仮定の下では、期待と確率の正確な境界を導出する。
私たちの境界には、プロパティを導出し、実践的な選択を動機付けるための明確な解釈があります。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:10:12 GMT)
TokenSmith: Streamlining Data Editing, Search, and Inspection for Large-Scale Language Model Training and Interpretability [39.4] TokenSmithは、データセットのインタラクティブな編集、検査、分析のためのオープンソースライブラリである。
GPT-NeoX、Megatron、NVIDIA NeMoといったMegatronスタイルの事前トレーニングフレームワークで使用されるデータセットをサポートする。
TokenSmithはGitHubにホストされており、ドキュメント、チュートリアル、デモビデオが付属している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:21:41 GMT)
Not All Tokens are Guided Equal: Improving Guidance in Visual Autoregressive Models [39.4] Information-Grounding Guidance (IGG) は、意味的に重要な領域へのガイダンスを注意を通して固定する新しいメカニズムである。
IGGはよりシャープでコヒーレントでセマンティックな画像を提供し、ARベースのメソッドの新しいベンチマークを設定している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:00:45 GMT)
Towards Human Engagement with Realistic AI Combat Pilots [39.4] 本研究では,3次元空戦シナリオにおける戦闘機の制御訓練を行うエージェントとユーザとのリアルタイムインタラクションを実現するシステムを提案する。
エージェントはマルチエージェント強化学習を使用して専用の環境で訓練される。
訓練されたエージェントをVR-Forcesにシームレスに展開するための通信リンクが開発されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:34:10 GMT)
CliniBench: A Clinical Outcome Prediction Benchmark for Generative and Encoder-Based Language Models [39.2] 生成型大規模言語モデル (LLMs) は, 複雑な医療業務においてますます研究されている。
実際の臨床応用におけるそれらの効果は未解明のままである。
本報告では,MIMIC-IVデータセットにおける入力音からの退避診断予測のためのエンコーダベース分類器と生成LDMの比較を可能にする最初のベンチマークであるCliniBenchについて述べる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:56:53 GMT)
Entropy After $\langle \texttt{/Think} \rangle$ for reasoning model early exiting [38.9] 正しい解に到達した後も、回答を再検討し続けながら、大きな推論モデルが過大評価されていることを示す。
We propose Entropy After /Think> (EAT) for monitoring and decide whether to exit reasoning early。
EATは、正確性を損なうことなく、トークン使用量を13~21%削減する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:59:37 GMT)
Learning to See Before Seeing: Demystifying LLM Visual Priors from Language Pre-training [37.9] 大規模言語モデル(LLM)は、テキストだけで訓練されているにもかかわらず、リッチな視覚的先行性を開発する。
これらの事前設定により、視覚タスクに対して比較的少量のマルチモーダルデータで潜在視覚機能をアンロックすることができる。
視覚的先行は、独自のスケーリング傾向と起源を持つ、分離可能な知覚と推論の先行から成り立っていることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:57:44 GMT)
Breast Cancer Diagnosis: A Comprehensive Exploration of Explainable Artificial Intelligence (XAI) Techniques [37.9] 乳がんの診断・診断における説明可能な人工知能(XAI)技術の適用について検討する。
複雑なAIモデルと実用的な医療アプリケーションの間のギャップを埋めることにおけるXAIの可能性を強調することを目的としている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:26:42 GMT)
Fading to Grow: Growing Preference Ratios via Preference Fading Discrete Diffusion for Recommendation [37.7] PreferGrowは個別の拡散に基づくレコメンデーションシステムで、個別のアイテムコーパスよりもユーザの好みを増すことによって、好みの比率をモデル化する。
5つのベンチマークデータセットにまたがって、最先端の拡散ベースのレコメンデータに対して、一貫したパフォーマンス向上を示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:37:17 GMT)
PinPoint3D: Fine-Grained 3D Part Segmentation from a Few Clicks [37.7] PinPoint3Dは、細粒度で多粒度な3Dセグメンテーションのための新しいインタラクティブフレームワークである。
数個のユーザーポイントクリックで正確な部分レベルのマスクを生成する。
私たちの研究は、よりニュアンスで正確なマシン認識とインタラクションに向けた重要なステップを示しています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:05:29 GMT)
Predicting LLM Reasoning Performance with Small Proxy Model [37.2] 本研究では,小プロキシが事前学習対象と目標タスクとより緊密に連携することで,大規模モデルの推論を効果的に予測できることを示す。
rBridgeは、フロンティアモデルからの推論トレースをゴールドラベルとして使用して、負のログライクな部分をタスクアライメントで重み付けすることでこれを実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:21:33 GMT)
Strong random unitaries and fast scrambling [37.0] 独立な2ビットのハールランダムゲートからなる回路において、強いユニタリ設計が回路深さ$O(log2 n)$で形成可能であることを示す。
この結果は、ブラックホール物理学からの高速衝突予想の運用的証明を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:23:46 GMT)
OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always! [37.0] 大規模言語モデル(LLM)の安全性は,大規模なデプロイメントを実現する上で,最も重要な課題のひとつだ。
ユーザクエリを適切に受け入れたり拒否したりできる LLM の機能として定義された,運用上の安全性を導入します。
我々の評価によると、性能はモデルによって異なるが、それらすべてが非常に運用上安全ではない。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:39:17 GMT)
SoMi-ToM: Evaluating Multi-Perspective Theory of Mind in Embodied Social Interactions [36.0] SoMi-ToMベンチマークは,マルチエージェント複合社会相互作用におけるマルチパースペクティブToMを評価するために設計されている。
我々は,35人の第三者視点映像,633人の一人称視点画像,1225人の専門家による複数選択質問を含む挑戦的なデータセットを構築した。
その結果,SoMi-ToMではLVLMがヒトよりも有意に低下することが判明した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:52:11 GMT)
Revisiting semi-supervised learning in the era of foundation models [35.4] 半教師付き学習(SSL)は、ラベル付きデータとともに豊富なラベル付きデータを活用して学習を強化する。
我々は,凍結視覚基盤モデル(VFM)が性能的に劣るSSLベンチマークデータセットを開発し,代表的なSSLメソッドを体系的に評価する。
ラベル付きデータのみを用いたパラメータ効率細調整(PEFT)は、ラベルなしデータを活用することなく、SSLのパフォーマンスとよく一致します。
ノイズの多い擬似ラベルの悪名高い問題を克服するため,より堅牢な擬似ラベルを生成するために,複数のPEFTアプローチとVFMバックボーンのアンサンブルを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:09:51 GMT)
Causal Interventions Reveal Shared Structure Across English Filler-Gap Constructions [35.3] 我々は,言語モデルに適用された因果的解釈可能性手法は,そのような証拠の価値を大幅に向上させることができると論じる。
私たちの経験的焦点は、イングランドのフィラーギャップ依存性構築のセットです。
LMはこれらの構成の類似した抽象的解析に収束することを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:57:02 GMT)
Towards an AI-Augmented Textbook [35.3] 生成AIを用いて教科書を変換・拡張する手法を提案する。
このアプローチで構築されたシステムをLearning Your Wayと呼ぶ。
異なる変換と拡張の教育学的評価を報告し、ランダム化制御試験の結果を報告する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:33:04 GMT)
The non-stabilizerness cost of quantum state estimation [35.2] 単一設定の量子状態推定シナリオにおいて,情報完全性を実現するために必要な非安定化器リソースについて検討する。
安定化器資源のみを許す場合、これらの戦略は常に安定器ベースでの射影測定と情報的に等価であることを示す。
我々は,$t$ドープクリフォード回路で実装された計測の絡み合い構造と情報パワーの密接な関係を明らかにする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:27:59 GMT)
ReSpark: Leveraging Previous Data Reports as References to Generate New Reports with LLMs [34.5] ReSparkは、既存のレポートから分析ロジックをリバースエンジニアリングし、新しいデータセットに適応するシステムである。
比較およびユーザスタディを通じてReSparkを評価し,既存の解析コードに頼ることなく,データレポート生成の障壁を低くする効果を実証した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:46:23 GMT)
Graph Distribution-valued Signals: A Wasserstein Space Perspective [34.2] グラフ分布値信号(GDS)として信号をモデル化するグラフ信号処理(GSP)の新しいフレームワークを提案する。
信号を分布として表現することで、GDSは自然に不確実性と性を符号化し、従来のグラフ信号を厳密に一般化する。
我々はGSPの概念をGDSの概念に体系的にマッピングし、古典的定義が特殊ケースとして回収されることを実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:21:18 GMT)
Reliability Crisis of Reference-free Metrics for Grammatical Error Correction [34.1] 我々は,SOME,Scribendi,IMPARA,LLMベースの4つの基準フリーメトリクスに対する敵攻撃戦略を提案する。
これらの結果は、より堅牢な評価方法の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:58:03 GMT)
On Fitting Flow Models with Large Sinkhorn Couplings [34.0] フローモデルは、1つのモーダリティ(例えばノイズ)から別のモーダリティ(例えば画像)へ徐々にデータを変換する。
近年の研究では、$n$ソースと$n$ターゲットポイントのミニバッチをサンプリングし、OTソルバを使用してそれらを再注文してより良いペアを作る方法が提案されている。
エントロピーの正則化が低い大きなシンクホーンカップリングを組み込む場合, 流れモデルに大きな利点があることが示される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:57:27 GMT)
Causality-guided Prompt Learning for Vision-language Models via Visual Granulation [33.9] CLIPの視覚的顆粒化による因果誘導型テキストプロンプト学習法を提案する。
筆者らのCaPL法は,特に細粒度データセットにおいて,最先端のプロンプト学習法よりも優れていた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:09:02 GMT)
Learning to Generate Unit Test via Adversarial Reinforcement Learning [33.8] 単体テストはプログラミングにおける中核的な実践であり、人間の開発者や大規模言語モデル(LLM)によるプログラムの体系的な評価を可能にする。
プログラム命令を与えられた高品質な単体テストを生成するためにLLMを訓練する新しい強化学習フレームワークであるUTRLを提案する。
実験では, UTRLを用いてトレーニングしたQwen3-4Bが生成した単体テストが, 教師付き微調整によりトレーニングした同一モデルで生成した単体テストと比較して高い品質を示した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:55:43 GMT)
BianCang: A Traditional Chinese Medicine Large Language Model [33.7] そこで本研究では,まずドメイン固有知識を注入し,まず目標刺激によって調整し,診断と識別能力を向上させる,TCM固有の大規模言語モデルであるBianCangを提案する。
実際の病院記録に基づく事前学習コーパス,ChP-TCMデータセット,および中華人民共和国の薬局類由来のChP-TCMデータセットを構築した。
我々は,TCMと医用コーパスを総合的に収集し,TCMの理解を深めるための包括的データセットを構築した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:25:18 GMT)
LoLA: Low-Rank Linear Attention With Sparse Caching [33.4] 本稿では,リフレッシュなリコールを促進するリニアアテンションのための学習自由化であるLoLAを提案する。
パスキー検索タスクでは、LoLAはベースモデルの精度を0.6%から97.4%に改善している。
LoLAは、ゼロショットコモンセンス推論タスクにおいて、他の1Bおよび8Bパラメータのサブクワッドラティックモデルよりも優れている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:42:50 GMT)
Go with Your Gut: Scaling Confidence for Autoregressive Image Generation [33.4] テストタイムスケーリング(TTS)は、大規模言語モデルの拡張において顕著な成功を収めているが、NTP(Next-token Prediction)自動回帰(AR)画像生成への応用は、まだほとんど達成されていない。
これはNTPベースのAR画像生成用に特別に設計された最初のTSフレームワークで、早期復号化や補助的な報酬の不要なScalingARを紹介する。
一般的なベンチマークと構成ベンチマークの両方の実験では、ScalingAR(1)はGenEvalで12.5%、TIIF-Benchで15.2%改善し、(2)ベースラインを上回りながら視覚トークンの消費量を62.0%削減し、(3)堅牢性の向上に成功している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:08:25 GMT)
CATCH: A Novel Data Synthesis Framework for High Therapy Fidelity and Memory-Driven Planning Chain of Thought in AI Counseling [33.3] CATCHはこれらの課題に対処するために設計された新しいデータ合成フレームワークである。
治療の忠実度を改善するために, プログレッシブ・ダイアログ合成戦略を導入する。
各応答の背後にある意思決定の根拠を捉えるために、メモリ駆動思考パターンを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:44:00 GMT)
scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data [33.2] 単細胞RNAシークエンシング(scRNA-seq)は細胞不均一性を示す。
細胞クラスタリングは、細胞タイプとマーカー遺伝子の同定において重要な役割を担っている。
グラフニューラルネットワーク(GNN)ベースの手法はクラスタリング性能を大幅に改善した。
scSiameseCluはシングルセルRNA-seqデータを解釈するための新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:11:49 GMT)
Beyond the Individual: Introducing Group Intention Forecasting with SHOT Dataset [33.0] グループ意図は、複数の個人の行動を通じて現れる共通の目標を表す。
グループ意図予測(Group Intention Forecasting, GIF)は、集団意図がいつ起こるかを予測する新しいタスクである。
SHOTはGIF用の最初の大規模なデータセットで、5つのカメラビューから撮影された1,979本のバスケットボールビデオクリップで構成されている。
GIFTは、意図の出現を予測するためにグループダイナミクスを進化させる、きめ細かい個々の特徴とモデルを抽出するフレームワークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:44:41 GMT)
FedGCS: A Generative Framework for Efficient Client Selection in Federated Learning via Gradient-based Optimization [33.0] FedGCSは、新しい生成クライアント選択フレームワークである。
連続表現空間内の豊富な意思決定知識を効率的に符号化する。
これは、よく訓練されたデコーダのビームサーチにより、最終的な最適なクライアント選択を生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:41:54 GMT)
Learning Unified User Quantized Tokenizers for User Representation [32.9] U2QT(Unified User Quantized Tokenizers)は、ドメイン間の知識伝達と異種ドメインの初期融合を統合する新しいフレームワークである。
まず、Qwen3 Embeddingモデルを用いて、コンパクトで表現力のある特徴表現を導出する。
第二に、マルチビューRQ-VAEは、共有およびソース固有のコードブックを通じて、因果埋め込みをコンパクトトークンに識別する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:51:32 GMT)
Teaching Metric Distance to Discrete Autoregressive Language Models [32.8] DIST2Lossは自動回帰離散モデルの学習を目的とした遠隔認識フレームワークである。
DIST2Lossは、固有距離測定値から派生した指数関数的な家族分布を離散的なカテゴリー最適化ターゲットに変換する。
経験的評価は多様なマルチモーダルアプリケーションにおいて一貫した性能向上を示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:58:52 GMT)
BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses [32.6] 大規模言語モデル(LLM)のバイアス緩和手法に関する既存の研究は、様々なベースラインとメトリクスを用いてバイアス低減性能を評価する。
BiasFreeBenchは8つの主流バイアス緩和手法を包括的に比較した経験的ベンチマークである。
我々は、バイアス軽減研究のための統合テストベッドを確立することを目的として、我々のベンチマークを公開します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:56:54 GMT)
The Flaw of Averages: Quantifying Uniformity of Performance on Benchmarks [32.0] 本稿では,分布の観点からベンチマークの信頼性について検討し,ベンチマークの調和を導入する。
高調和性は望ましいベンチマーク特性であり、凝集度がモデル間の均一なコンピテンスを反映していることを示している。
正確さとともに調和を報告することを推奨することで、単純なパフォーマンス平均から、より堅牢で分散的に信頼性の高いパフォーマンス測定まで、評価を見直します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:14:30 GMT)
AICrypto: A Comprehensive Benchmark for Evaluating Cryptography Capabilities of Large Language Models [32.0] AICryptoは、大規模言語モデルの暗号能力を評価するために設計された最初の包括的なベンチマークである。
ベンチマークは135の多重選択質問、150のキャプチャー・ザ・フラッグ課題、18の証明問題で構成されている。
LLMをリードする17のモデルの評価は、最先端のモデルが暗号概念を記憶する上で、人間の専門家と一致しているか、さらに上回っていることを示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:21:53 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [32.0] CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。
テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令を扱う上でのLLMを向上する体系的手法であるRAIFを提案する。
より優れたCoT施行のためのサンプルワイドコントラストによる複雑な指示の下での推論の浅く、重要でない性質に対処する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:50:34 GMT)
Clip-Low Increases Entropy and Clip-High Decreases Entropy in Reinforcement Learning of Large Language Models [29.8] PPOとGRPOのクリッピング機構がエントロピーのバイアスを引き起こすことを示す。
より積極的なクリップロー値では、RLVRトレーニングにおいてエントロピーを増加させ、探索を促進し、最終的にエントロピー崩壊を防ぐことができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:33:15 GMT)
Are Knowledge and Reference in Multilingual Language Models Cross-Lingually Consistent? [29.2] 言語間の一貫性は、言語間の伝達性を評価するために考慮すべきである。
コードスイッチングトレーニングと言語間単語アライメントの目的は、最も有望な結果を示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:18:04 GMT)
SMS: Self-supervised Model Seeding for Verification of Machine Unlearning [29.1] そこで本研究では,真のサンプルに対する未学習検証を実現するための自己教師付きモデル探索(SMS)手法を提案する。
SMSは、ユーザ固有の種(ユーザのユニークなインデックスなど)、元のサンプル、モデルなど)をリンクし、未学習の真のサンプルの検証を容易にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:18:44 GMT)
Dynamical Acoustic Control of Resonance Fluorescence from a Strongly Driven Two-Level System [29.1] 2つの原子-光子状態の間のラビ遷移を第2ギガヘルツ周波数場が駆動する新しい駆動条件下で共鳴蛍光スペクトルを実験的に検討した。
その結果, 強い駆動限界における単一2レベル系, 光場, 音場間の量子相互作用に関する新たな知見が得られた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:36:56 GMT)
RIFLE: Removal of Image Flicker-Banding via Latent Diffusion Enhancement [29.0] FB(Flicker-banding)は、カメラのローリングシャッター読み出しとディスプレイの明るさ変調との間の時間的エイリアスから生じる明るさ%u2013darkストライプを交互に変化させる。
我々は、FB除去を専用修復タスクとして定式化し、遅延拡散拡張(RIFLE)による画像フリッカバンディングの除去を導入する。
我々の知る限りでは、FBのシミュレーションと除去の研究は初めてである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:40:08 GMT)
The Impact of Scaling Training Data on Adversarial Robustness [28.8] ロバストネスは、データボリュームとモデルサイズの両方で対数スケーリングの法則に従う。
DINOv2のようなデータセットでトレーニングされた自己教師型モデルでは、はるかに大きく、キュレートされていないデータセットでトレーニングされたモデルよりも優れています。
人間の評価は、人間と機械の視界の間に永続的なギャップを露呈する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:20:56 GMT)
Keep It Real: Challenges in Attacking Compression-Based Adversarial Purification [28.8] 再構築された画像における高いリアリズムは、攻撃の難しさを著しく増大させる。
現実的かつ高忠実な再構築を実現できる圧縮モデルが,我々の攻撃に対して極めて耐性があることを実証した。
この研究は、将来の敵対的攻撃の大きな障害を強調し、現実主義を克服するより効果的な技術を開発することが、総合的なセキュリティ評価にとって重要な課題であることを示唆している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:28:24 GMT)
From MNIST to ImageNet: Understanding the Scalability Boundaries of Differentiable Logic Gate Networks [28.8] 差別化可能な論理ゲートネットワーク(DLGN)は、従来のフィードフォワードネットワークに代わる、非常に高速でエネルギー効率のよい代替品である。
本研究では,大規模マルチクラスデータセット上でのDLGNの挙動について検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:27:58 GMT)
DecepChain: Inducing Deceptive Reasoning in Large Language Models [28.8] 大きな言語モデル(LLM)は、そのチェーン・オブ・思想(CoT)によって、ますます強力な推論能力を示している。
攻撃者はLSMを誘導して、一見すると不正確で一貫性のないCoTを生成することができる。
我々は、新しいバックドア攻撃パラダイムであるDecepChainを紹介します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:23:40 GMT)
MOLM: Mixture of LoRA Markers [28.8] 本稿では、符号化問題を生成モデルのパラメータの鍵依存として定式化する一般的な透かしフレームワークを提案する。
このフレームワークでは、残部および注目ブロック内でバイナリキーが軽量なLoRAアダプタを活性化するルーティングベースのインスタンス化であるMixture of LoRA Markers(MOLM)を導入する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:27:14 GMT)
Toward Quantum-Enabled Biomarker Discovery: An Outlook from Q4Bio [28.7] 本稿では,ハイブリッド量子古典アルゴリズムの共設計に関するケーススタディと今後の展望について述べる。
我々は、経験的量子優位(EQA)を、同じタスクにおける最先端の古典的手法に対する量子ハードウェアを用いた測定可能な性能向上として定義する。
ハードウェアの制約がアルゴリズムと物理デバイス機能との協調設計を必要とする現行デバイスにおける機能選択のための量子サブルーチンの実装について論じる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:49:53 GMT)
Metis: Training LLMs with FP4 Quantization [28.6] メティス(Metis)は、異方性スペクトルを独立量子化のためのより狭い部分分布に分割するフレームワークである。
100Bトークンで訓練されたLLaMA-3 8Bでは、メティスは重量、アクティベーション、勾配のFP4量子化による堅牢なW4A4G4トレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:14:03 GMT)
GeoSketch: A Neural-Symbolic Approach to Geometric Multimodal Reasoning with Auxiliary Line Construction and Affine Transformation [28.5] GeoSketchは、幾何学的推論をインタラクティブな知覚・推論・アクションループとして再キャストする、ニューラルシンボリックなフレームワークである。
階層的な意思決定、実行可能な視覚行動、象徴的な検証を統一することにより、GeoSketchは静的解釈から動的相互作用へのマルチモーダル推論を前進させる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:14:18 GMT)
RobustMerge: Parameter-Efficient Model Merging for MLLMs with Direction Robustness [28.4] RobustMergeは、方向ロバスト性を維持するために相補的なパラメータ適応を備えたトレーニング不要なパラメータ効率のマージ手法である。
多様なマルチモーダルタスクからなるベンチマークを構築し,本手法の卓越した性能と一般化性を証明する実験を行った。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:50:33 GMT)
CrediBench: Building Web-Scale Network Datasets for Information Integrity [27.6] CrediBenchは、時間的Webグラフを構築するための大規模データ処理パイプラインである。
我々のアプローチは、一般的な誤情報領域の動的進化を捉えている。
本稿では,このグラフスナップショットを用いた実験から,信頼度を学習するための構造的およびWebページコンテンツ信号の強度を実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:57:38 GMT)
Automated Model Discovery via Multi-modal & Multi-step Pipeline [27.3] 効率的な自動モデル探索のためのマルチモーダル・グラニュアル・マルチステップパイプラインを提案する。
我々のパイプラインは、細部を捕捉し、強力な一般化性を保証するモデルを効果的に発見することを示した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:40:05 GMT)
Kairos: Towards Adaptive and Generalizable Time Series Foundation Models [27.1] 時系列基礎モデル (TSFM) は時系列解析の強力なパラダイムとして登場してきた。
動的パッチトークンとインスタンス適応型位置埋め込みを統合した,柔軟なTSFMフレームワークであるKairosを提案する。
Kairosは2つの共通ゼロショットベンチマークのパラメータをはるかに少なくして、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:02:26 GMT)
Memory-Driven Self-Improvement for Decision Making with Large Language Models [27.0] 大規模言語モデル(LLM)は、シーケンシャルな意思決定タスクのための効果的なアクションポリシーとして登場した。
本稿では,LLMの事前知識とドメイン固有体験のコンパクトメモリを組み合わせた,メモリ駆動型自己改善フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:46:06 GMT)
NePTune: A Neuro-Pythonic Framework for Tunable Compositional Reasoning on Vision-Language [26.9] ネプチューン(NePTune)は、基礎視覚モデルの知覚能力と象徴的推論の合成表現性を統合する、神経象徴的なフレームワークである。
NePTuneは、自然言語クエリを、命令制御フローとVLM生成の不確実性を推論できるソフトロジック演算子をブレンドする実行可能なPythonプログラムに変換する。
我々は、複数の視覚的推論ベンチマークと様々なドメイン上でNePTuneを評価し、敵対的テストを活用し、強力なベースモデルよりも大幅に改善したことを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:22:42 GMT)
RAGferee: Building Contextual Reward Models for Retrieval-Augmented Generation [26.9] RAGfereeは、質問回答(QA)データセットを、スタイリスティックな特徴よりも基礎性を優先する選好ペアに再利用する方法論である。
RAGfereeを用いて、4Kサンプルと7Bから24Bパラメータの微調整RMの小さな選好データセットをキュレートする。
我々のRAG中心のRMはConJudgeBenchの最先端性能を達成し、既存の70B以上のRMをはるかに大きな(2.4Mサンプルまで)一般コーパスで訓練し、+15.5%の絶対的な改善を実現した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:41:40 GMT)
STaR-Attack: A Spatio-Temporal and Narrative Reasoning Attack Framework for Unified Multimodal Understanding and Generation Models [26.9] 統一マルチモーダル理解・生成モデル(UMM)における世代間結合から生じる脆弱性を同定する。
セマンティックドリフトを使わずにUMMのユニークな安全性の弱点を利用する,初のマルチターンジェイルブレイク攻撃フレームワークSTaRAttackを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:22:04 GMT)
Feedback Forensics: A Toolkit to Measure AI Personality [26.5] 優れた”AIモデルを作るいくつかの特徴は、事前に説明することが難しい。
我々は、人間の(またはAI)フィードバックによって奨励されたもの、そしてそのようなフィードバックに基づいてトレーニングされ評価されたAIモデルにまたがって提示されたものの両方、AIの性格変化を追跡するためのオープンソースのツールキットを紹介します。
まず、(A)Arena、MultiPref、PRISMなどの一般的なフィードバックデータセットで推奨される性格特性を分析し、(B)このツールキットを用いて、人気のあるモデルがどれだけの特性を示すかを分析する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:19:21 GMT)
Learning Egocentric In-Hand Object Segmentation through Weak Supervision from Human Narrations [26.5] そこで本研究では,ナレーションを利用した人間と物体の相互作用検出手法を提案する。
ナレーションは、入手が安くなる弱い監督形態を提供する。
Weakly Supervised In-hand Object Inference from Human Narrations (WISH)
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:34:55 GMT)
Convergence and Divergence of Language Models under Different Random Seeds [26.3] コンバージェンス(コンバージェンス)は,種子間でのコンバージェンス(コンバージェンス)を期待値として測定する。
より大きなモデルは後続のトレーニング段階でより高速に再収束するのに対し、小さなモデルは実際には再収束しない。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:59:50 GMT)
The Unheard Alternative: Contrastive Explanations for Speech-to-Text Models [25.1] 対照的な説明は、AIシステムが他の(ホイル)ではなく1つの出力(ターゲット)を生成した理由を示している。
入力スペクトログラムの一部が代替出力の選択にどのように影響するかを分析することにより、S2Tにおけるコントラスト的な説明を得るための最初の方法を提案する。
我々の研究は、S2Tモデルをよりよく理解するための基盤を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:17:27 GMT)
A Framework for Studying AI Agent Behavior: Evidence from Consumer Choice Experiments [25.0] 本稿では,オプション属性と説得的手がかりの制御によるエージェント選択の探索フレームワークを提案する。
我々はエージェントの決定が予測可能かつ実質的に変化していることを発見し、エージェントが強い偏見を持つ選択者であることを明らかにした。
この感受性はリスクと機会の両方を明らかにしている:リスク、エージェントの消費者は人間の偏見を継承し増幅する可能性がある;機会、消費者の選択はAIエージェントの行動科学に強力なテストベッドを提供するからだ。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:05:23 GMT)
The Media Bias Detector: A Framework for Annotating and Analyzing the News at Scale [25.0] 我々は,ニュース報道における選択とフレーミングバイアスを研究するために,大規模で,ほぼリアルタイムなデータセットと計算フレームワークを導入する。
我々のパイプラインは、大規模言語モデルとスケーラブルでほぼリアルタイムなニューススクレイピングを統合し、構造化アノテーションを抽出します。
我々は、これらのカバレッジの次元を、文レベル、記事レベル、出版者レベルなど、複数のレベルで定量化します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:41:49 GMT)
Neural Hamilton--Jacobi Characteristic Flows for Optimal Transport [24.1] ハミルトン・ヤコビ方程式(HJ)に基づいて最適な輸送問題を解くための新しい枠組みを提案する。
特徴の方法を活用することにより、閉形式双方向輸送マップを導出する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:45:01 GMT)
LD-MoLE: Learnable Dynamic Routing for Mixture of LoRA Experts [24.0] LD-MoLEはLearningable Dynamic routing mechanism for Mixture of LoRA Expertsを提案する。
我々の設計では、異なる層で各トークンに対してアクティベートする専門家の数を適応的に決定できる。
提案手法は,優れた性能を実現するとともに,トークン依存型およびレイヤワイドのエキスパートアロケーションを学習する能力も示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:38:10 GMT)
scUnified: An AI-Ready Standardized Resource for Single-Cell RNA Sequencing Analysis [24.0] 我々は、シングルセルRNAシークエンシングデータのための、AI対応の標準リソース scUnified を提案する。
scUnified Consolided to 13 high-quality datasets across two species and 9 tissue types。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:23:01 GMT)
Accurate myocardial T1 mapping at 5T using an improved MOLLI method: A validation study [23.7] 本研究の目的は, 5T MRIシステムのための, 正確かつ臨床的に応用可能な心筋T1マッピング技術を開発することである。
The method is based on a 5-(3)-3 MOLLI sequence, called combined-correction MOLLI (coMOLLI)。
この方法はファントム実験で検証され、21人の健康なボランティアと9人の患者で検証された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:21:35 GMT)
Regret Analysis of Posterior Sampling-Based Expected Improvement for Bayesian Optimization [23.5] 本稿では,後部サンプルパスの最大値からEIを評価するEIのランダムな変種を解析する。
この後続サンプリングに基づくランダムEIは、ブラックボックス関数がガウス過程に従うという仮定の下で、準線形ベイズ累積後悔境界を達成することを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:20:27 GMT)
PETAH: Parameter Efficient Task Adaptation for Hybrid Transformers in a resource-limited Context [21.9] 本稿では,Hybrid Transformer のタスク適応性能向上と PETAH: Efficient Task Adaptation for Hybrid Transformer の導入について述べる。
我々のPETAH適応ハイブリッドモデルは、パラメータを少なくし、モバイルハードウェアでより効率的であると同時に、ViTのタスク適応技術よりも優れています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:03:09 GMT)
Bridging conformal field theory and parton approaches to SU(n)_k chiral spin liquids [21.9] 共形場理論では、$mathrmSU(n)_k$ Wess-Zumino-Witten (WZW) モデルを用いて、格子波動関数を1次元と2次元の両方で構成する。
すべての格子上のスピンは、ヤング・テーブルーの$mathrmSU(n)$既約表現の下で、単一の行と$k$ボックスで変換される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:53:45 GMT)
A Family of Kernelized Matrix Costs for Multiple-Output Mixture Neural Networks [21.9] ペアワイズ距離に基づくコストは、自己監督的でコントラストのある特徴学習に不可欠である。
本稿では,4種類のカーネル化行列コストを用いたデータ密度近似を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:51:03 GMT)
GaussEdit: Adaptive 3D Scene Editing with Text and Image Prompts [21.8] GaussEditは、テキストと画像プロンプトでガイドされた適応的な3Dシーン編集のためのフレームワークである。
ユーザが指定したコンセプトを3Dシーンにうまく埋め込むことで、GaussEditは詳細なユーザー主導の3Dシーン編集のための強力なツールだ。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:31:31 GMT)
Learning Theory for Kernel Bilevel Optimization [21.8] カーネル・バイレベル最適化 (KBO) について検討し, 内部目的をカーネル再生空間上で最適化する。
我々は、経験的プロセス理論からツールを利用するKBOに対して、新しい有限サンプル一般化境界を導出する。
本稿では,合成器用変分回帰課題に関する理論的知見について述べる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:58:49 GMT)
OmniDFA: A Unified Framework for Open Set Synthesis Image Detection and Few-Shot Attribution [21.6] OmniDFAはAIGIのための新しいフレームワークで、画像の信頼性を評価し、その起源を数ショットで決定する。
OmniFakeは大規模なクラス対応合成画像データセットで、45ドルの異なる生成モデルから117ドルの画像をキュレートする。
実験により、OmniDFAはオープンセット属性に優れた能力を示し、AIGI検出における最先端の一般化性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:36:40 GMT)
DreamControl: Human-Inspired Whole-Body Humanoid Control for Scene Interaction via Guided Diffusion [21.6] 本稿では,自律型全身ヒューマノイドスキルの学習手法であるDreamControlを紹介する。
我々の中心となるイノベーションは、人間の動きデータに基づいて事前訓練された拡散を使うことです。
本研究では,Unitree G1ロボットにおけるDreamControlの有効性を検証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:48:45 GMT)
LaTo: Landmark-tokenized Diffusion Transformer for Fine-grained Human Face Editing [21.6] LaToは、きめ細かなアイデンティティ保存顔編集のためのランドマーク化拡散変換器である。
鍵となるイノベーションは、生のランドマーク座標を直接離散的な顔トークンに定量化するランドマークトークンライザである。
LaToは、最先端の手法を7.8%のアイデンティティ保存、4.6%のセマンティック一貫性で上回る。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:40:27 GMT)
Robust LLM Training Infrastructure at ByteDance [21.5] ByteRobustは、大規模言語モデルの堅牢で安定したトレーニングに適した、大規模なGPUインフラストラクチャ管理システムである。
LLMトレーニングプロセスの独自性を活用し、定期的に障害を検出して回復するための最優先事項を提供します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:06:10 GMT)
Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages [21.4] この研究は、2つの絶滅危惧言語であるAmisとSediqに焦点を当てている。
本稿では,多言語コーパスを利用して対象とする限られた言語データを増やす新しいデータ選択手法を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:33:57 GMT)
Wasserstein Distributionally Robust Optimization Through the Lens of Structural Causal Models and Individual Fairness [21.4] 我々は因果関係と個々人の公平性の観点からDRO問題を開発する。
次に、DRO問題をよりトラクタブルで計算効率の良い形式に変換するための効率的なツールとして、DRO双対定式化を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:59:29 GMT)
From Fragile to Certified: Wasserstein Audits of Group Fairness Under Distribution Shift [21.4] グループフェアネスの指標は、再サンプル間で大きく変化し、特に分散シフト下では不安定である。
本稿では, 実験法則を中心にした有理テスト分布の球面上で最悪の群フェアネスを証明した, 分布的に堅牢なワッサーシュタインフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:35:50 GMT)
Seeing Space and Motion: Enhancing Latent Actions with Spatial and Dynamic Awareness for VLA [21.4] Latent Action Models (LAMs) は、視覚言語制御システムにおいて、大規模な無注釈データからセマンティック・アクション・リセプションを学習することを可能にする。
Farsighted-LAMを提案する。これは幾何学的空間符号化とマルチスケール時間的モデリングを備えた潜在アクションフレームワークである。
さらに,Farsighted-LAM上に構築されたエンドツーエンドVLAフレームワークであるSSM-VLAを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:41:43 GMT)
The silence of the weights: an investigation of structural pruning strategies for attention-based audio signal architectures [21.3] 本研究では,アテンション機構を明示的に対象とする新しいプルーニング手法を提案する。
注意ブロック内の4つのレイヤ、すなわちクエリ、キー、値、出力のプロジェクション行列を分離する。
その結果,注目パラメータの50%を刈り取ることでも1%未満の性能劣化が生じることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:10:19 GMT)
ProbMed: A Probabilistic Framework for Medical Multimodal Binding [21.3] 確率的モダリティ向上診断(ProbMED)について紹介する。
ProbMEDは、X線、心電図、心エコー計の4つの異なるモードを、統一された確率的埋め込み空間に整列させる。
本モデルでは, クロスモーダル検索, ゼロショット分類, 少数ショット分類において, 現在の医用視覚言語事前訓練モデルより優れている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:16:01 GMT)
SelfReflect: Can LLMs Communicate Their Internal Answer Distribution? [21.3] 我々は,要約と回答上の分布の間の情報理論的距離であるSelfReflectメトリックを開発した。
我々は,SelfReflectが,要約文字列と LLM の内部分布の回答に対する忠実度を細かな尺度で表していることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:44:21 GMT)
Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography [21.3] 我々は3次元医用画像と対応するテキストレポートを組み合わせたデータセットであるCT-RATEを紹介する。
我々はCTに焦点を当てたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。
我々は3次元胸部CTボリュームの視覚言語チャットモデルであるCT-CHATを作成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:16:16 GMT)
ResGS: Residual Densification of 3D Gaussian for Efficient Detail Recovery [21.3] そこで我々は, 残留分断法を新たに導入し, 残留分断法としてガウシアンを付加した。
我々のアプローチは、詳細を適応的に検索し、欠落した幾何学を補完することができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:28:38 GMT)
Mem-α: Learning Memory Construction via Reinforcement Learning [20.9] 大きな言語モデル(LLM)エージェントは、限られたコンテキストウィンドウによって制約される。
現在のメモリ拡張エージェントは、メモリ更新のための事前に定義された命令とツールに依存している。
Mem-alphaは、エージェントに複雑なメモリシステムを効果的に管理するように訓練する強化学習フレームワークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:02:34 GMT)
MindVL: Towards Efficient and Effective Training of Multimodal Large Language Models on Ascend NPUs [20.8] MindVLは、Ascend NPUでエンドツーエンドに訓練されたマルチモーダルな大規模言語モデルである。
我々は,安定かつ高性能なトレーニングを支援する,高効率なトレーニングフレームワークであるMindSpeed-MLLMを紹介した。
異なるシーケンス長でトレーニングされたチェックポイントから平均的な重み付けが特に有効であることが判明した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:27:18 GMT)
PDE Solvers Should Be Local: Fast, Stable Rollouts with Learned Local Stencils [20.5] 有限差分に着想を得たニューラルネットワークであるFINOは、厳密な局所性を強制する。
FINOは固定有限差分ステンシル係数を学習可能な畳み込みカーネルに置き換える。
最先端のオペレータ-ラーニングベースラインよりも最大44%低いエラー、最大2倍のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:42:32 GMT)
On The Fragility of Benchmark Contamination Detection in Reasoning Models [20.5] LRMのリーダーボードは、評価を競合に転換し、開発者がベンチマークスイート上で直接最適化するインセンティブを与えている。
より高いランキングを達成するためのショートカットは、評価ベンチマークをトレーニングデータに組み込むことで、ベンチマーク汚染と呼ばれる膨らませたパフォーマンスを得る。
LRMに対する汚染検出の回避は極めて容易であることが判明した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:40:54 GMT)
fev-bench: A Realistic Benchmark for Time Series Forecasting [19.9] 既存のベンチマークでは、ドメインカバレッジが狭くなったり、重要な現実世界の設定を見落としたりすることが多い。
7つの領域にわたる100の予測タスクからなるベンチマークであるfevbenchを提案する。
fev-benchでは、モデルパフォーマンスを報告するために、ブートストラップされた信頼区間を持つ原則化された集約手法を採用している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:17:18 GMT)
Extensions of Robbins-Siegmund Theorem with Applications in Reinforcement Learning [19.8] 我々は、零次項が和可能ではなく、平方和可能であるような、ほとんど超行列に対してロビンス=ジークムントの定理を拡張する。
線形関数を持つ$Qp$学習に対する最初のほぼ確実な収束率、最初の高確率集中束縛、および最初の$Lp$収束率を得る。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:00:36 GMT)
Using Knowledge Graphs to harvest datasets for efficient CLIP model training [19.4] 高品質のCLIPモデルのトレーニングは通常、膨大なデータセットを必要とする。
知識グラフで強化されたスマートWeb検索戦略を利用することで、堅牢なCLIPモデルをスクラッチからトレーニングできることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:12:28 GMT)
A Comprehensive Review on Artificial Intelligence Empowered Solutions for Enhancing Pedestrian and Cyclist Safety [19.4] 本稿では,VRU安全のためのカメラベースAIセンシングシステムの最近の進歩を概観する。
本研究では,検出と分類,追跡と再同定,軌道予測,意図認識と予測の4つのコアタスクについて検討する。
今後の研究をガイドするために、データ、モデル、デプロイメントの観点から4つの大きなオープン課題を強調します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:50:55 GMT)
Automatic Fact-checking in English and Telugu [18.8] 本研究では,大規模言語モデル(LLM)の有効性について検討した。
この研究の主な貢献は、バイリンガル・イングリッシュ・テルグデータセットの作成と、異なる妥当性分類アプローチのベンチマークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:39:34 GMT)
Expert Merging: Model Merging with Unsupervised Expert Alignment and Importance-Guided Layer Chunking [18.6] エキスパートマージング(Expert Merging)は、ラベルなしキャリブレーションデータを用いて、少数の層係数を学習するトレーニングライト法である。
層間変異をキャプチャするために、Expert Merging++はこの設計を重要誘導チャンクで強化する。
本手法は, 強力なトレーニングフリーおよびトレーニングベースのマージベースラインを超越した手法である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:16:24 GMT)
MoWM: Mixture-of-World-Models for Embodied Planning via Latent-to-Pixel Feature Modulation [18.5] MoWMは、ハイブリッドワールドモデルから表現を融合して、具体的アクションプランニングを行う混合世界モデルフレームワークである。
提案手法では,ピクセル空間モデルから微細な視覚的特徴の抽出を誘導する,潜在モデルからの動き認識表現を高レベルな事前表現として利用する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:13:10 GMT)
HealthSLM-Bench: Benchmarking Small Language Models for Mobile and Wearable Healthcare Monitoring [18.4] 小型言語モデル(SLM)は軽量で、モバイルおよびウェアラブルデバイス上でローカルかつ効率的に動作するように設計されている。
ゼロショット,少数ショット,命令微調整による健康予測タスクにおけるSLMの評価を行った。
その結果,SLMは大規模言語モデルに匹敵する性能を達成でき,効率とプライバシを大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:04:14 GMT)
MENLO: From Preferences to Proficiency - Evaluating and Modeling Native-like Quality Across 47 Languages [18.3] オーディエンスにインスパイアされたメカニズムに基づいた,ネイティブな応答品質の評価を運用するフレームワークであるMENLOを紹介する。
我々は,47種類の言語において,高いアノテータ間一致を伴う4つの品質次元をカバーする6,423個の人称アノテート・レスポンス・プライオリティ・ペアのデータセットを作成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:48:58 GMT)
Advancing Automated Spatio-Semantic Analysis in Picture Description Using Language Models [18.1] 画像記述による認知言語障害の自動評価手法は、しばしば視覚的物語パスを無視する。
本研究では,Cookie画像記述からCIUの自動抽出と順序付けを行うために,バイナリクロスエントロピーとペアランキング損失を微調整したBERTベースのパイプラインを提案する。
5倍のクロスバリデーションで評価すると、中央値の93%の精度、CIU検出における中央値のリコール、24%のシーケンスエラー率が得られる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:46:25 GMT)
The Impact of Language Mixing on Bilingual LLM Reasoning [17.6] 中国語と英語のバイリンガル推論モデルにおける言語スイッチングについて検討する。
言語混合によって推論が促進されることを示す。
以上の結果から,言語混合は多言語学習の副産物であるだけでなく,戦略的推論行動でもあることが示唆された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:58:13 GMT)
The Silent Judge: Unacknowledged Shortcut Bias in LLM-as-a-Judge [17.6] 大規模言語モデル(LLM)は、要約、対話、創造的執筆といったタスクにおいてシステム出力を評価する自動判断器として、ますます多くデプロイされている。
提案手法では,現行のLLM審査員は,プロンプトに導入したショートカットに頼って,両方のカウントでフェールすることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:48:08 GMT)
BRIDGE -- Building Reinforcement-Learning Depth-to-Image Data Generation Engine for Monocular Depth Estimation [17.6] BRIDGEはRL最適化Deep-to-image(D2I)生成フレームワークである。
現実的かつ幾何学的に正確なRGB画像を20万枚以上合成する。
我々は,このデータセット上で,ハイブリッド監視戦略を用いて深度推定モデルを訓練する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:38:45 GMT)
LTA-L2S: Lexical Tone-Aware Lip-to-Speech Synthesis for Mandarin with Cross-Lingual Transfer Learning [17.5] マンダリンに対するLTA-L2S(Lexical Tone-Aware Lip-to-Speech)を提案する。
本モデルは,英語の事前学習型音声視覚自己教師学習(SSL)モデルを言語間移動学習戦略により適用する。
実験では、LTA-L2Sは、音声の明瞭度と声調精度の両方において、既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:13:55 GMT)
Transformers through the lens of support-preserving maps between measures [17.4] 我々は,測度間の地図がトランスフォーマーであるかどうかを考察する。
一方、変換器には変換器が含まれ、一方、変換器は連続なインコンテキスト写像を持つ表現を普遍的に近似する。
測度論的な自己アテンションは、無限の深さ、平均場測度論的な変換器がヴラソフフローと同一視できることを保証する性質を持つことを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:15:33 GMT)
More Thought, Less Accuracy? On the Dual Nature of Reasoning in Vision-Language Models [17.4] 大規模言語モデル(LLM)において、推論が重要な機能として現れている。
近年の研究では、視覚言語モデル(VLM)への推論の拡張が試みられている。
本研究は、マルチモーダル推論の二重性を明らかにし、他の基本的な視覚的問題に対する認識障害につながった。
本稿では,視覚的接地軌道に対する推論過程を明確に把握する,シンプルかつ効果的な手法であるビジョン・アンコレッド・ポリシー・オプティマイズ(VAPO)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:37:47 GMT)
Causally Guided Gaussian Perturbations for Out-Of-Distribution Generalization in Medical Imaging [17.3] Causally-Guided Gaussian Perturbations (CGP)は、空間的に変化するノイズを入力画像に注入することでOOD一般化を強化する軽量フレームワークである。
CGPは、スプリアス相関よりも因果関係のある特徴に頼ることを奨励する。
挑戦的なWILDSベンチマークであるCamelyon17の結果は、最先端のOODベースラインよりも一貫したパフォーマンス向上を示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:58:35 GMT)
Automated Alignment of Math Items to Content Standards in Large-Scale Assessments Using Language Models [17.2] 本研究では,4つのドメインと19のスキルラベルを連携させる3つの自動パラダイムを評価する。
8つのBERTモデルとその変種をドメインおよびスキルアライメントの両方に微調整した。
アンサンブルモデルは最高の性能を持つ言語モデルを超えなかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:44:00 GMT)
Characterization and Learning of Causal Graphs with Latent Confounders and Post-treatment Selection from Interventional Data [16.8] 後処理の選択は、介入の下で急激な依存関係や分布の変化をもたらす可能性がある。
治療後選択を明示的にモデル化する新たな因果関係定式化を導入し、介入に対する差分反応が選択パターンと因果関係を区別する方法について明らかにする。
我々は、因果関係、潜伏した共同設立者、および処理後の選択を最大$mathcalFI$-Markov同値まで識別するために、証明可能な健全かつ完全なアルゴリズムであるF-FCIを開発した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:18:15 GMT)
Which Rewards Matter? Reward Selection for Reinforcement Learning under Limited Feedback [16.7] 限られたフィードバックから強化学習における報酬選択の問題について検討する。
報酬の臨界部分集合は、最適な軌道に沿ってエージェントを導くものである。
有効選択法は, 完全監督よりも報酬ラベルが著しく少ない, 最適に近い政策を導出することがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:17:49 GMT)
Chat-Driven Text Generation and Interaction for Person Retrieval [16.4] 我々は,Multi-Turn Text Generation(MTG)とMulti-Turn Text Interaction(MTI)の2つの補完モジュールを紹介する。
MTGはMLLMとのシミュレートされた対話を通じて豊かな擬似ラベルを生成し、手動による監督なしに細粒度で多様な視覚的記述を生成する。
MTIは動的対話に基づく推論を通じて推論時にユーザクエリを洗練し、曖昧で不完全、曖昧な記述をシステムが解釈し、解決できるようにする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:20:05 GMT)
Towards Reliable Benchmarking: A Contamination Free, Controllable Evaluation Framework for Multi-step LLM Function Calling [16.4] ツール拡張言語モデル(TaLM)を合成多段階タスクによって評価する,汚染のないフレームワークであるFuncBenchGenを提案する。
推論最適化モデルはGPT-5で汎用モデルより一貫して優れており、他のモデルよりも大幅に優れていることを示す。
強いモデルはしばしば構文的に有効な関数呼び出しを行うが、ステップ間で誤ったあるいは古い引数値を伝搬し、マルチターンツールの使用においてLLMによる不安定な状態追跡を明らかにする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:21:17 GMT)
FM-SIREN & FM-FINER: Nyquist-Informed Frequency Multiplier for Implicit Neural Representation with Periodic Activation [15.5] 我々はNyquist-informed, neuron-specific frequency multipliersを周期的活性化に割り当てるFM-SIRENとFM-FINERを提案する。
この単純だが原則化された修正は特徴の冗長性を50%近く低減し、多様なINRタスク間の信号再構成を一貫して改善する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:13:25 GMT)
Enhancing Certifiable Semantic Robustness via Robust Pruning of Deep Neural Networks [15.4] ディープニューラルネットワークは視覚入力を備えた多くのビジョンやロボット工学アプリケーションで広く採用されている。
明るさやコントラストといったセマンティックトランスフォーメーションの摂動に対する堅牢性を検証することが不可欠である。
我々は,USNの低いニューロンを除去し,USNの低いニューロンを除去する新しいニューラルネットワークプルーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:50:29 GMT)
Relaxation of A Thermally Bathed Harmonic Oscillator: A Study Based on the Group-theoretical Formalism [15.4] 熱環境に浸漬した高調波発振器が平衡状態にどのように緩和するかを解析的に検討した。
特に、初期状態がガウス状態(すなわち圧縮されたコヒーレント状態)である場合、環境温度の臨界値が存在することが分かる。
エントロピーは最初は最大に達するまで増加し、その後は最小に達するまで下降し、そこから上昇し、最終的に平衡値に収束する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:30:30 GMT)
Adaptive Modality Balanced Online Knowledge Distillation for Brain-Eye-Computer based Dim Object Detection [15.4] 本稿では,脳-眼-コンピュータによる空中画像検出システムを構築した。
脳波画像データを用いた適応型モダリティバランスオンライン知識蒸留法(AMBOKD)を提案する。
実世界のシナリオにおける公開データセットとシステム検証実験により,本手法の有効性と優位性を実証した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:36:36 GMT)
MultiFair: Multimodal Balanced Fairness-Aware Medical Classification with Dual-Level Gradient Modulation [15.4] MultiFairは最先端のマルチモーダル学習やフェアネス学習よりも優れています。
本稿ではマルチモーダル医療分類のための新しいアプローチであるMultiFairを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:30:12 GMT)
Practical security of local local oscillator continuous-variable quantum key distribution systems with pulse width mismatch [15.2] 本稿では,連続可変量子鍵分布(CVQKD)システムにおいて,信号と信号の間にパルス幅のミスマッチが発生した場合のセキュリティ問題について検討する。
このようなミスマッチの下では、秘密鍵レート計算に関わる鍵パラメータが誤って推定され、システムの秘密鍵レートが過大評価される。
この不完全なミスマッチは、Eveが実用的なシステムで攻撃を行うための抜け穴を開くことができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:50:07 GMT)
Beyond the Exploration-Exploitation Trade-off: A Hidden State Approach for LLM Reasoning in RLVR [15.1] RLVR(Reinforcement Learning for Verifiable Rewards)の一般的な見解は、探索・探索トレードオフのレンズを通して最近の進歩を解釈している。
我々はこの視点を再検討し、この認識されたトレードオフは基本的な制約ではなく、測定レベルの成果物である可能性を示唆している。
本稿では,相乗的探索・探索強化の原理を最初に運用する,Velocity-Exploiting Rank-Learning (VERL)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:42:02 GMT)
Solving the Cold Start Problem on One's Own as an End User via Preference Transfer [15.1] コールドスタート問題はレコメンデーターシステムで一般的な問題である。
本研究では,エンドユーザーが積極的にコールドスタート問題を解くアルゴリズムであるPretenderを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:57:33 GMT)
PAME-AI: Patient Messaging Creation and Optimization using Agentic AI [15.0] 我々は,エージェントAIを用いた患者メッセージ作成と最適化のための新しいアプローチであるPAME-AIを開発した。
Data-Information-Knowledge-Wisdom階層に基づいて構築されたPAME-AIは、生データから高性能メッセージング設計のための実行可能な洞察に移行するための構造化されたフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:26:33 GMT)
CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design [14.9] 我々は,人間的な記述を付加した170k以上のCADモデルの大規模パイプラインを新たに導入する。
本研究はCADmiumがCAD設計を自動化可能であることを示すものである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:32:42 GMT)
From Factoid Questions to Data Product Requests: Benchmarking Data Product Discovery over Tables and Text [14.6] DPBenchは、ハイブリッドテーブルテキストコーパス上でのユーザ要求駆動型データ製品ベンチマークである。
本フレームワークは,既存のテーブルテキストQAデータセットを,関連するテーブルやパスを一貫性のあるデータ製品にクラスタリングすることで,体系的に再利用する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:07:36 GMT)
IPDRecon: Image-Plane Geometric Decoding for View-Invariant Indoor Scene Reconstruction [14.6] 3つのコアコンポーネントからなる画像プレーンデコードフレームワークであるPDReconを提案する。
IPDReconは、ビューカウントが40%削減された場合、ほぼ同じ品質を維持しながら、より優れた再構築安定性を実現する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:01:30 GMT)
Drones that Think on their Feet: Sudden Landing Decisions with Embodied AI [14.6] 具体的AIは、コンテキストを評価し、適切なアクションをリアルタイムで生成するコモンセンス推論をいかに提供できるかを示す。
この能力を,Unreal Engineの都市ベンチマークで実演する。
以上の結果から,具体化されたAIは適応的回復と意思決定パイプラインの新たなクラスを可能にすることが示唆された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:39:36 GMT)
From Trace to Line: LLM Agent for Real-World OSS Vulnerability Localization [14.5] プロジェクトレベルのエンドツーエンドフレームワークであるT2L-Agentは、独自の分析を計画し、モジュールから正確な脆弱なラインまでスコープを狭める。
T2L-ARVOは,5つのクラッシュファミリと実世界のプロジェクトにまたがる,多種多様な,専門家が検証した50ケースのベンチマークです。
T2L-ARVOでは、T2L-Agentは58.0%の検出と54.8%のラインレベルのローカライゼーションを達成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:27:18 GMT)
Deep set based operator learning with uncertainty quantification [14.4] 組込み不確実性定量化(UQ)を用いた置換不変演算子学習フレームワークUQ-SONetを提案する。
本モデルでは,スパースおよび可変センサ位置を扱うためにセットトランスフォーマーを組込み,条件変分オートエンコーダ(cVAE)を用いて解演算子の条件分布を近似する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:36:18 GMT)
ReFACT: A Benchmark for Scientific Confabulation Detection with Positional Error Annotations [14.4] LLM(Large Language Models)は、しばしば科学的事実を議論し、信頼性を損なう。
textbfReFACT (textitReddit False And Correct Texts)は,1,001名の専門家による質問応答対のベンチマークである。
それぞれのインスタンスは、科学的に正しい答えと、textbfpreciseエラースパンとエラータイプで注釈付けされた非実例の両方を含む。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:06:23 GMT)
Spatial Reasoning with Vision-Language Models in Ego-Centric Multi-View Scenes [14.3] 3次元空間関係の理解は、現在の視覚・言語モデル(VLM)の大きな限界である。
我々は、エゴ中心のマルチビュー屋外データを用いて、VLMの空間的推論能力を評価するために設計された新しいベンチマークであるEgo3D-Benchを紹介する。
VLMの3次元空間的推論を強化する後学習フレームワークであるEgo3D-VLMを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:28:17 GMT)
A Meta-Analysis of LLM Effects on Students across Qualification, Socialisation, and Subjectification [14.2] 大規模言語モデル(LLM)は、教育のソリューションとしてますます位置づけられているが、評価は、パフォーマンス指標の狭さに対する影響を減少させることが多い。
この記事では,“LLMが教育にどのような影響を与えるべきか?
133の実験と準実験のメタ分析(k = 188)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:22:27 GMT)
The Rarity Blind Spot: A Framework for Evaluating Statistical Reasoning in LLMs [14.2] そこで我々はDFM(Distinctive Feature Mining)を導入し,グローバルな文脈では稀な10~40個の文書と表面的特徴をモデルで分析する手法を提案する。
この設定は、検索ではなく統計的推論が重要となる候補選択や製品分化といった現実のシナリオを反映している。
DiFBenchを用いて、10の最先端LCMにおいて特徴的特徴マイニングを大規模に評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:48:39 GMT)
Authenticated Private Set Intersection: A Merkle Tree-Based Approach for Enhancing Data Integrity [14.2] プライベート・セット・インターセクション(PSI)は、参加者のプライバシーを維持しながら、セット・交差点のセキュアな計算を可能にする。
標準PSIの既存のプロトコルは、悪意のある参加者が追加の交差点情報を抽出できるようなデータ完全性攻撃に弱いままである。
我々はPSIにおけるデータの整合性の定義を提案し、Merkle Treesと最先端の2パーティVolePSIとマルチパーティmPSIプロトコルを統合することにより、2つの認証PSIスキームを構築する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:08:44 GMT)
Clarification as Supervision: Reinforcement Learning for Vision-Language Interfaces [14.1] 本稿では,視覚モデルに対話による情報推論に何が必要なのかを学習するアダプティブ・クラシフィケーション強化学習(AC-RL)を提案する。
AC-RLは7つの視覚数学的推論ベンチマークで事前訓練されたベースラインに対して平均精度を4.4ポイント改善する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:46:46 GMT)
MIDAS: Misalignment-based Data Augmentation Strategy for Imbalanced Multimodal Learning [14.1] マルチモーダルモデルは、しばしば支配的なモダリティに過度に頼り、最適な性能を達成できなかった。
提案するMIDASは,意味的に整合性のないクロスモーダル情報を用いて,ミスアライメントされたサンプルを生成する新しいデータ拡張戦略である。
複数のマルチモーダル分類ベンチマークの実験により、MIDASはモダリティの不均衡に対処する上で、関連するベースラインを著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:13:17 GMT)
Capacity-Net-Based RIS Precoding Design without Channel Estimation for mmWave MIMO System [14.0] Capacity-Netは、ミリ波(mmWave)システムにおける達成可能な速度を最大化する新しい教師なし学習手法である。
mmWaveスペクトルの重度チャネルフェードに対処するため、RISの反射素子の位相シフト係数を最適化し、達成可能な速度を向上する。
チャネル推定の代わりに、受信したパイロット信号間のマッピング、最適化されたRIS位相シフト、そして達成可能なレートを確立するために、Capacity-Netが提案されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:57:33 GMT)
Advantage of utilizing nonlocal magic resource in Haar-random circuits [13.9] 複数のユニットを持つ量子回路の設計とシミュレーションにおいて、計算能力は急速に増大する絡み合いによって大幅に制限される。
非局所魔法資源の内在的スケーリング則とHaar-random量子回路における行列積状態の結合次元を明らかにする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:48:55 GMT)
Scaling Laws Revisited: Modeling the Role of Data Quality in Language Model Pretraining [13.9] 本稿では,モデルサイズ,データボリューム,データ品質の結合関数として損失を予測するため,Chinchillaフレームワークを拡張した品質対応スケーリング法を提案する。
データ品質による損失スケールが予測可能であり,高品質なデータにより,モデルサイズを大幅に削減し,従って計算要求を低減できることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:45:06 GMT)
Towards Convexity in Anomaly Detection: A New Formulation of SSLM with Unique Optimal Solutions [13.9] SVDD (Support Vector Description) Small and Large Sphere SVM (Mv-Ms) として広く使われている手法の未解決問題は、最適解をハマーする二次異常検出のための非粘性である。
本稿では,最適解が自明に見つかる事例を識別し,不適切な事例を識別する新しいSSLMを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:49:12 GMT)
DGM4+: Dataset Extension for Global Scene Inconsistency [13.8] 創作されたイメージと操作されたキャプションは、説得力のある偽の物語を生み出すために、ますます共起的になっている。
我々はDGM4を5000の高品質なサンプルで拡張し、FG-BGのミスマッチとテキスト操作によるハイブリッドを取り入れた。
このリソースは、現在FG-BGの不整合に苦しんでいるHAMMERのようなマルチモーダルモデルの評価を強化することを目的としている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:24:21 GMT)
Risk Profiling and Modulation for LLMs [13.8] 大規模言語モデル(LLM)は、不確実性の下で意思決定タスクにますます使われている。
既存の研究では、主にパーソナリティ・プロンプトやマルチエージェントの相互作用について研究されている。
我々は,ポストトレーニングがリスク嗜好の最も安定かつ効果的な調整を提供することを示した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:06:12 GMT)
How Far Do Time Series Foundation Models Paint the Landscape of Real-World Benchmarks ? [13.8] 本研究は,実世界の映像から時間信号を取り出すことによって,合成データと現実データを橋渡しする新しいベンチマーク手法を提案する。
実世界のビデオから派生した多種多様な時系列をキャプチャする新しいデータセットであるREAL-V-TSFMを紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:53:05 GMT)
RealLiFe: Real-Time Light Field Reconstruction via Hierarchical Sparse Gradient Descent [13.6] EffLiFeは、スパースビュー画像から高品質な光場をリアルタイムで生成する新しい光場最適化手法である。
本手法は,最先端のオフライン手法よりも平均100倍高速な視覚的品質を実現する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:08:03 GMT)
Regression Language Models for Code [13.5] 単一の統一回帰言語モデル(RLM)がテキストから直接同時に予測可能であることを示す。
5つの古典的NAS設計空間において、RLMが平均平均である0.46のKendall-Tauを得ることができることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:25:23 GMT)
How Do Large Vision-Language Models See Text in Image? Unveiling the Distinctive Role of OCR Heads [13.5] 光文字認識ヘッド(OCRヘッド)と呼ばれる画像からテキストを認識するための頭部を特定する。
1)少ないスパース:以前の検索ヘッドとは異なり、画像からテキスト情報を抽出するために多数のヘッドが活性化される。
我々は,OCRと従来の検索ヘッドの両方にCoT(Chain-of-Thought)を適用し,これらのヘッドをマスキングすることで,下流タスクにおける知見を検証した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:28:38 GMT)
ODE-GS: Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting [13.5] 3次元ガウススプラッティングと潜在ニューラル常微分方程式(ODE)を統合する新しいアプローチODE-GSを導入する。
提案手法はまず,観測ウィンドウ内で正確なガウス軌道を生成するモデルを学習し,その上でトランスフォーマーエンコーダを訓練して,過去の軌跡をニューラルODEを介して進化した潜時状態に集約する。
数値積分はスムーズで物理的に妥当な未来のガウス軌道を生成し、任意の未来のタイムスタンプでのレンダリングを可能にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:38:55 GMT)
DiSA-IQL: Offline Reinforcement Learning for Robust Soft Robot Control under Distribution Shifts [13.5] IQLの拡張であるDiSA-IQL(Distribution-Shift-Aware Implicit Q-Learning)を提案する。
シミュレーションの結果、DiSA-IQLは、ビヘイビア・クローン(BC)、保守的Qラーニング(CQL)、バニラ・IQLなど、ベースラインモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:53:47 GMT)
VLM-FO1: Bridging the Gap Between High-Level Reasoning and Fine-Grained Perception in VLMs [13.5] VLM(Vision-Language Models)は、高レベルのシーン理解において優れるが、精密なローカライゼーションを必要とする微粒な知覚タスクに重点を置いている。
VLM-FO1は、オブジェクト中心の知覚を堅牢な特徴検索タスクに再フレーミングすることで、この制限を克服する新しいフレームワークである。
本手法は,プリトレーニング済みのVLMと統合したプラグイン・アンド・プレイモジュールとして動作する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:10:56 GMT)
GeoLink: Empowering Remote Sensing Foundation Model with OpenStreetMap Data [13.5] この研究は、リモートセンシング(RS)基礎モデル(FM)を強化するためにOpenStreetMap(OSM)データを活用するフレームワークであるGeoLinkを提示する。
特に、GeoLinkはOSMデータから派生した多粒性学習信号を用いたRS自己教師型事前学習を強化する。
下流タスクでは、GeoLinkは広範囲のアプリケーションをサポートするために、一様および多モードのきめ細かいエンコーディングを生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:45:52 GMT)
Improving Metacognition and Uncertainty Communication in Language Models [13.4] 大規模言語モデル(LLM)は、意思決定の文脈でますます使われている。
LLMの明示的な言語的信頼は、典型的には誤解され、正解と誤解の区別が不十分である。
教師付き微調整が不確かさを伝達するモデルの能力を向上させるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:50:02 GMT)
GraphCogent: Mitigating LLMs' Working Memory Constraints via Multi-Agent Collaboration in Complex Graph Understanding [13.4] 大規模言語モデル(LLM)は、小規模なグラフ推論タスクでは有望な性能を示すが、複雑なクエリで現実のグラフを扱うと失敗する。
グラフ推論を特殊な認知プロセス(センス、バッファ、実行)に分解する協調エージェントフレームワークであるGraphCogentを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:56:50 GMT)
BaB-prob: Branch and Bound with Preactivation Splitting for Probabilistic Verification of Neural Networks [13.3] プレアクティベーション分割を伴う分岐とバウンドは、ニューラルネットワークの決定論的検証に非常に有効であることが示されている。
そこで本稿では,前処理を分割することで,元の問題をサブプロブレムに反復的に分割するBaB-probを提案する。
フィードフォワード・ReLUニューラルネットワークにおけるBaB-probの健全性と完全性を証明する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:39:39 GMT)
Efficient Context Selection for Long-Context QA: No Tuning, No Iteration, Just Adaptive-$k$ [13.2] 本稿では、クエリと候補パスの類似度スコアに基づいて、経路数を適応的に選択する、単純で効果的なシングルパス手法であるAdaptive-$k$を提案する。
モデルファインチューニング、余分なLCM推論、あるいは既存のレトリバー読み取りパイプラインの変更は不要である。
5つのLCLMと2つの埋め込みモデルで精度を向上し、動的にコンテキストサイズを調整することでより効率的で正確なQAが得られることを強調した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:14:35 GMT)
TASP: Topology-aware Sequence Parallelism [12.9] Long-context Large Language Model (LLM) は自己認識機構の2次複雑さのために制約に直面している。
Ring Attentionは、クエリをアクセラレータにまたがる複数のクエリチャンクに分散することで、この問題を解決する。
通信効率が低く、実用性が制限されている。
長文LLMのためのトポロジ対応SP法であるTASPを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:15:27 GMT)
Thinking-Free Policy Initialization Makes Distilled Reasoning Models More Effective and Efficient Reasoners [12.8] 本稿では, 長いチェーン・オブ・ソート(CoT)蒸留と標準RLVRを橋渡しするRLVRへの, 単純かつ効果的な適応である**T**hinking-**F*ree **P**olicy **I**nitialization (**I***)を紹介する。
実験により、TFPIはRL収束を加速し、高い性能の天井を達成し、特別な報酬や複雑な訓練設計を伴わないよりトークン効率の高い推論モデルが得られることが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:25:00 GMT)
Communications to Circulations: 3D Wind Field Retrieval and Real-Time Prediction Using 5G GNSS Signals and Deep Learning [12.8] 本稿では,5つのGNSS(Global Navigation Satellite System)信号から3D(3D)大気風場を抽出・予測する信号強度の変動を利用した,新しいディープラーニングフレームワークを提案する。
予報結果から,風速の短期風速予測(最大30分リードタイム)と高分解能NWP出力に匹敵するスキルスコアの双方において有望な精度を示す。
この学際的アプローチは、先進的な環境モニタリングとリアルタイムの大気応用のために、非伝統的なデータソースとディープラーニングを活用できる変革の可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:03:53 GMT)
Cooperative Autonomous Driving in Diverse Behavioral Traffic: A Heterogeneous Graph Reinforcement Learning Approach [11.9] 多様な運転スタイルで異種交通環境をナビゲートすることは、自動運転車にとって大きな課題となる。
本稿では、自動運転車の意思決定性能を向上させるためのエキスパートシステムにより強化された異種グラフ強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:12:57 GMT)
Source Separation for A Cappella Music [11.9] 本研究では,カペラ音楽におけるマルチシンガー分離の課題について検討する。
本稿では,SepReformerの適応であるSepACapを紹介する。
JaCappellaデータセット上での実験により,本手法は,フルアンサンブルとサブセットのシンガー分離シナリオにおいて,最先端のパフォーマンスを実現することを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:39:40 GMT)
Voting or Consensus? Decision-Making in Multi-Agent Debate [11.8] 意思決定が異なるタスクにどのように影響するかは、ほとんど分かっていない。
投票プロトコルは、推論タスクとコンセンサスプロトコルのパフォーマンスが13.2%向上し、知識タスクの2.8%向上した。
回答の多様性を高めて意思決定を改善するために,2つの新しい方法を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:49:35 GMT)
The Inverse Drum Machine: Source Separation Through Joint Transcription and Analysis-by-Synthesis [11.8] Inverse Drum Machineは、ディープラーニングと組み合わせた分析バイシンセシスフレームワークを活用する、ドラムソース分離の新しいアプローチである。
IDMは自動ドラム転写とワンショットドラムサンプル合成を統合し、これらのタスクをエンドツーエンドで共同で最適化する。
StemGMDデータセットの実験では、IDMが分離された幹細胞データを必要とする最先端の教師付き手法に匹敵する分離品質を達成することを示した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:14:34 GMT)
Stylos: Multi-View 3D Stylization with Single-Forward Gaussian Splatting [11.7] 提案するStylosは、3Dスタイル転送のための単一フォワード3Dガウスフレームワークで、未提示コンテンツで動作する。
Stylosは、シーンごとの最適化や事前に計算されたポーズなしで、スタイリングされた3Dシーンを合成する。
複数のデータセットにわたる実験は、Stylosが高品質なゼロショットスタイリングを提供することを示した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:09:13 GMT)
Equivariance by Local Canonicalization: A Matter of Representation [11.7] 本稿では,既存のテンソル場ネットワークをより効率的な局所正規化パラダイムに変換するためのフレームワークを提案する。
このフレームワーク内では、理論的複雑性、経験的ランタイム、予測精度の観点から、異なる同変表現を体系的に比較する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:41:18 GMT)
Can VLM Pseudo-Labels Train a Time-Series QA Model That Outperforms the VLM? [11.7] 視覚言語モデルによって生成された擬似ラベルを用いた学習手法を提案する。
実験結果から,TSQAモデルが擬似ラベルを用いた学習に成功しているだけでなく,VLM自体の性能を超越していることが判明した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:53:50 GMT)
How Does Preconditioning Guide Feature Learning in Deep Neural Networks? [11.6] 本研究では,プレコンディショニングが特徴学習と一般化性能に与える影響について検討する。
モデルに利用可能な入力情報は、プレコンディショナーの計量によって定義されるグラム行列を通してのみ伝達されることを示す。
その結果,学習した特徴表現は,プレコンディショナーが導入したスペクトルバイアスを密接に反映していることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:21:52 GMT)
FLOWER: A Flow-Matching Solver for Inverse Problems [11.5] 本稿では,逆問題に対する解法であるFlowerを紹介する。
事前に訓練された流れモデルを利用して、観測された測定値と整合した再構成を生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:07:10 GMT)
Adaptive and Resource-efficient Agentic AI Systems for Mobile and Embedded Devices: A Survey [11.5] ファンデーションモデルは、断片化されたアーキテクチャをマルチモーダル推論とコンテキスト適応を備えたスケーラブルなバックボーンに統一することで、AIを再構築した。
FMを認知のコアとして、エージェントは自律性、一般化、自己回帰を達成するためにルールベースの振る舞いを超越する。
この調査は、適応的でリソース効率の良いエージェントAIシステムの、最初の体系的な特徴を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:37:52 GMT)
Mind the Value-Action Gap: Do LLMs Act in Alignment with Their Values? [11.5] バリュー・アクション・ギャップ(Value-Action Gap)は、現実の文脈における個人の価値観と行動の相違を明らかにする。
本研究では,LLMの値と値インフォームドアクションのアライメントを評価するための評価フレームワークであるValueActionLensを紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:58:52 GMT)
Predicting Effects, Missing Distributions: Evaluating LLMs as Human Behavior Simulators in Operations Management [11.3] LLMは、ビジネス、経済学、社会科学における人間の振る舞いをシミュレートする新しいツールである。
本稿では, LLM が操作管理における人間行動の再現性を評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:20:58 GMT)
Vision-driven River Following of UAV via Safe Reinforcement Learning using Semantic Dynamics Model [11.3] 無人航空機による視覚駆動の自律川は、救助、監視、環境監視といった用途に欠かせない。
本稿では,報酬優位関数を改良したMarginal Gain Advantage Estimationを紹介する。
次に, セマンティック・ダイナミクス・モデルを構築し, セマンティック・ダイナミクス・モデルを構築した。
第3に、コスト優位性評価のためにアクター、コスト推定器、SDMを統合するConstrained Actor Dynamics Estimatorアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:19:47 GMT)
$p$-less Sampling: A Robust Hyperparameter-Free Approach for LLM Decoding [10.6] $p$-less サンプリングは、サンプリングに対する情報理論のアプローチであり、各デコードステップでトランケーション閾値を動的に設定する。
p$-lessが既存のサンプリング手法を一貫して上回りながら、より高い温度でテキスト品質の劣化がはるかに少ないことを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:36:20 GMT)
Sequence Pathfinder for Multi-Agent Pickup and Delivery in the Warehouse [10.6] Multi-Agent Pickup and Delivery (MAPD) は Multi-Agent Path Finding (MAPF) の挑戦的拡張である
コミュニケーション学習は、グローバルな情報の欠如を緩和するが、ポイントツーポイント通信による高い計算複雑性をもたらす。
本稿では,暗黙的な情報交換を実現するためのシークエンシャルパスファインダ(SePar)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:39:02 GMT)
LLM-MCoX: Large Language Model-based Multi-robot Coordinated Exploration and Search [10.6] LLM-MCoX (LLM-based Multi-robot Coordinated Exploration and Search)を導入した。
提案手法は,フロンティアクラスタ抽出とドアウェイ検出のためのリアルタイムLiDARスキャン処理とマルチモーダルLPM推論を組み合わせたものである。
LLMは自然言語に基づくオブジェクト検索を可能にするので、人間のオペレーターは高いレベルのセマンティックガイダンスを提供することができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:33:35 GMT)
HiFIRec: Towards High-Frequency yet Low-Intention Behaviors for Multi-Behavior Recommendation [10.6] HiFIRecは、新しいマルチ行動レコメンデーション手法である。
差動挙動モデリングにより,高周波かつ低意図動作の効果を補正する。
2つのベンチマークの実験では、HiFIRecはいくつかの最先端手法に比べてHR@10を4.21%-6.81%改善している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:20:45 GMT)
Explaining novel senses using definition generation with open language models [10.5] AXOLOTL'24共有タスクのデータセットを,説明可能な意味変化モデリングに利用した。
私たちは、最高の提案よりも高いパフォーマンスのオープンソースモデルを微調整し、公開しています。
さらに、エンコーダ-デコーダ定義ジェネレータはデコーダのみのジェネレータと同等に動作することがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:40:36 GMT)
A Generalized Information Bottleneck Theory of Deep Learning [10.5] Information Bottleneck(IB)原則は、ニューラルネットワーク(NN)がどのように学習するかを理解するための説得力のある理論的フレームワークを提供する。
我々は、シナジーのレンズを通して、元のIB原理を再構築する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:38:56 GMT)
RouterArena: An Open Platform for Comprehensive Comparison of LLM Routers [10.4] RouterArenaはLLMルータの包括的な比較を可能にする最初のオープンプラットフォームである。
1)知識領域を網羅したデータセット,(2)ドメイン毎に識別可能な難易度,(3)評価指標の広範なリスト,(4)リーダボード更新の自動フレームワークを備える。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:22:28 GMT)
J-NeuS: Joint field optimization for Neural Surface reconstruction in urban scenes with limited image overlap [10.3] J-NeuSは、外向きカメラのポーズを持つ大きな駆動シーケンスのための、新しいハイブリッドな暗黙表面再構成手法である。
本手法は,2つの放射場を共同で最適化し,複雑な都市シナリオにおける微細構造とともに,大面積の正確な再構成を実現するためのガイド付きサンプリングを行う。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:47:04 GMT)
NuRisk: A Visual Question Answering Dataset for Agent-Level Risk Assessment in Autonomous Driving [10.3] 自律運転におけるリスクを理解するには、エージェントの振る舞いとコンテキストに関する高いレベルの推論が必要である。
現在の視覚言語モデル(Ms)に基づく手法は主に静的画像のグラウンドエージェントである。
自律運転における明示的時間的推論の促進のための重要なベンチマークとして,NuRiskを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:37:31 GMT)
Towards A Universally Transferable Acceleration Method for Density Functional Theory [10.0] 本稿では,電子密度をコンパクトな補助基底表現で予測することにより,DFTの初期推定を構成する手法を提案する。
我々のモデルは、60原子までの系における平均33.3%の自己一貫性のフィールドステップ還元を達成することができ、ハミルトン中心のモデルとDM中心のモデルを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:35:57 GMT)
Post-Training Quantization via Residual Truncation and Zero Suppression for Diffusion Models [10.0] 拡散モデルは、高品質な画像生成を実現するが、高い計算要求のため、デプロイメントの課題に直面している。
拡散モデルのための4ビットPTQスキームであるResidual Truncation and Zero Suppression (QuaRTZ) による量子化を提案する。
提案手法は,外乱保存とLSB精度のバランスをとることにより,丸め誤差を低減し,量子化効率を向上させる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:55:42 GMT)
Estimating Dimensionality of Neural Representations from Finite Samples [9.9] グローバル次元の一般的な尺度である固有値の参加比率は,小さいサンプルサイズで非常に偏りが強いことを示す。
有限サンプルと雑音でより高精度なバイアス補正推定器を提案する。
我々は、カルシウムイメージング、電気生理学的記録、fMRIデータなどの脳波記録に推定器を適用した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:26:22 GMT)
HilbertA: Hilbert Attention for Image Generation with Diffusion Models [9.9] 2次元認識とGPU効率のスパースアテンション機構であるHilbertAを提案する。
HilbertAはHilbert曲線に沿って画像トークンを並べ替え、空間的近傍を保存しながら連続したメモリレイアウトを実現する。
HilbertAは1024ドル、1024ドル、2048ドルで最大4.17ドル、ベースラインに匹敵する画像品質を実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:13:22 GMT)
A Position Paper on the Automatic Generation of Machine Learning Leaderboards [9.8] 機械学習(ML)研究における重要な課題は、MLのリーダーボードを通じて実行される以前の作業を比較することである。
この負担を軽減するために、研究者は研究論文からリーダーボードエントリを抽出する方法を開発した。
しかし、事前の作業は、問題フレーミング、比較の複雑化、現実の応用可能性の制限などによって異なる。
本稿では,ALGタスクの定義方法の標準化を目的とした,ALG統合概念フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:39:56 GMT)
Investigating Long-term Training for Remote Sensing Object Detection [9.7] リモートセンシングオブジェクト検出における機能バックボーン微細調整のための動的バックボーン凍結(DBF)を提案する。
提案手法は,背骨が低レベルジェネリック特徴を抽出すべきか,リモートセンシング領域の特定の知識を持つべきかというジレンマに対処する。
本手法は,長期学習における計算コストを大幅に削減しつつ,より正確なモデル学習を可能にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:01:15 GMT)
Stab-QRAM: An All-Clifford Quantum Random Access Memory for Special Data [9.7] データに適したドメイン固有のアーキテクチャであるStabilizer-QRAM(Stab-QRAM)を紹介する。
我々は,Stab-QRAMが$O(log N)$の最適論理回路深さを$N$のデータ項目に対して達成し,その$O(log N)$空間複雑性と一致することを示す。
この設計はクリフォード以外のボトルネックを完全に回避し、高価なマジックステート蒸留の必要性を排除した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:36:52 GMT)
Overview of GeoLifeCLEF 2023: Species Composition Prediction with High Spatial Resolution at Continental Scale Using Remote Sensing [9.7] 私たちはGeoLifeCLEF 2023というオープン機械学習チャレンジを組織しました。
トレーニングデータセットは、ヨーロッパに分布する500万種の植物からなる。
標準化された調査に基づいて,2万2千個の小型プロットで種を予測できるモデルを評価した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:49:16 GMT)
Bringing Emerging Architectures to Sequence Labeling in NLP [9.7] トランスフォーマーエンコーダは、構造的複雑さ、ラベル空間、トークン依存に異なるタグ付けタスクにどのように適応するかを検討する。
以前より単純な設定で観測された強いパフォーマンスは、言語やデータセットをまたいで常にうまく一般化するわけではないし、より複雑な構造化タスクにまで拡張することもわかっています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:12:02 GMT)
NeurIPS should lead scientific consensus on AI policy [9.4] 我々はNeurIPSがAI政策に関する科学的コンセンサスを積極的に触媒するべきだと考えている。
我々は、気候政策に関するIPCCのリーダーシップから教訓を抽出することで、NeurIPSの初期パイロットを推薦する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:08:29 GMT)
Direct Token Optimization: A Self-contained Approach to Large Language Model Unlearning [9.4] マシン・アンラーニング(英: Machine unlearning)は、トレーニングデータのサブセット(ターゲットセット)の影響を、完全なリトレーニングなしでモデルから排除する新興技術である。
重要な課題は、モデルが全体的なユーティリティを損なうことなく、忘れた集合の知識を完全に忘れることである。
我々は,大規模言語モデルに対する自己完結型非学習手法であるダイレクトトークン最適化(DTO)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:05:06 GMT)
MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction [9.4] 大規模言語モデル(LLM)は推論を必要とするタスクに対して有望なパフォーマンスを示す。
最先端のLCMもプロプライエタリであり、コストがかかり、リソース集約であり、ローカルなデプロイメントを非現実的にしている。
プライバシー保護機構として抽象化を利用するテキスト・ツー・アクション・フレームワークであるMaskを紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:43:21 GMT)
MAVUL: Multi-Agent Vulnerability Detection via Contextual Reasoning and Interactive Refinement [9.4] MAVULは、コンテキスト推論と対話的洗練を統合した、新しいマルチエージェント脆弱性検出システムである。
その結果,MAVULは従来のマルチエージェントシステムよりも62%以上の精度で,単エージェントシステムでは600%以上の性能で性能が優れていた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:21:43 GMT)
From Assistance to Autonomy -- A Researcher Study on the Potential of AI Support for Qualitative Data Analysis [9.4] 人工知能(AI)ツールの出現は、質的データ分析(QDA)の新しい可能性をもたらした。
QDAで経験した15人のヒューマン・コンピュータ・インタラクション(HCI)研究者を対象に半構造化インタビューを行った。
参加者はQDAでAIサポートを受けていましたが、データプライバシ、自律性、AI出力の品質に関する懸念を表明しました。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:37:31 GMT)
Static Word Embeddings for Sentence Semantic Representation [9.3] 文意味表現に最適化された静的単語埋め込みを提案する。
まず、事前学習した文変換器から単語埋め込みを抽出し、文レベルの主成分分析により改善する。
推論では,単語の埋め込みを単純に平均化することで文を表現するが,計算コストは少ない。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:22:41 GMT)
Locating Risk: Task Designers and the Challenge of Risk Disclosure in RAI Content Work [8.7] 群衆労働者は、しばしば責任あるAI(RAI)コンテンツワークを任される。
以前の取り組みでは、RAIコンテンツ作業に関連する労働者の幸福に対するリスクが強調されていたが、これらのリスクが労働者にどのように伝達されるかという点では、はるかに注意が払われていない。
本研究では,クラウドソーシングされたRAIタスクにおいて,タスクデザイナがリスク開示にどのようにアプローチするかを検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:54:59 GMT)
Towards a Framework for Supporting the Ethical and Regulatory Certification of AI Systems [8.6] CERTAINプロジェクトは、規制コンプライアンス、倫理基準、透明性をAIシステムに統合することを目的としている。
このフレームワークのコアコンポーネントを構築するための方法論的な手順を概説する。
CERTAINは、規制コンプライアンスを推進し、欧州標準に沿った責任あるAIイノベーションを促進することを目的としている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:54:02 GMT)
Information Design with Unknown Prior [8.6] オンラインプラットフォームのような情報デザイナーは、レシーバーの信念を知らないことが多い。
学習アルゴリズムを設計し、情報デザイナーが反復的なインタラクションを通じて、受信者の行動から事前の信念を学習できるようにする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:24:18 GMT)
BEDTime: A Unified Benchmark for Automatically Describing Time Series [8.5] 我々は、成功したマルチモーダルモデルは時系列の言語記述を認識し、区別し、生成することができるべきだと論じる。
次に、各タスクのモデルを評価する最初のベンチマークデータセットであるBEDTimeを作成します。
BEDTimeを用いて、13の最先端モデルを評価し、専用時系列基礎モデルの性能が著しく低下していることを見出した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:31:52 GMT)
Free Draft-and-Verification: Toward Lossless Parallel Decoding for Diffusion Large Language Models [8.4] 拡散大言語モデル(DLLM)は自己回帰予測を超えた言語モデリングの新しいパラダイムとして登場した。
Free Draft-and-Verification (Freedave) はDLLMに適した新しい高速サンプリングアルゴリズムである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:28:04 GMT)
Explore-Execute Chain: Towards an Efficient Structured Reasoning Paradigm [8.4] Chain-of-Thought(CoT)とその変種は、大規模言語モデル(LLM)の推論能力を著しく向上させた。
E2C$(Explore-Execute Chain)は、推論を2つの異なるフェーズに分離する構造化推論フレームワークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:45:38 GMT)
MMPB: It's Time for Multi-Modal Personalization [7.9] パーソナライズにおける視覚言語モデル(VLM)を評価するための,最初の広範囲なベンチマークであるMMPBを紹介する。
MMPBは10kイメージクエリペアで構成されており、人間、動物、物体、キャラクターの4つのカテゴリにまたがる111のパーソナライズ可能な概念を含んでいる。
我々は,概念注入,マルチターン対話,パーソナライズクエリといった3段階のプロトコルを用いてパーソナライズ性能を評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:41:39 GMT)
When Langevin Monte Carlo Meets Randomization: Non-asymptotic Error Bounds beyond Log-Concavity and Gradient Lipschitzness [7.8] ランダム化したランゲヴィンモンテカルロ (RLMC) を, 対数凹みのない高次元分布からサンプリングするために再検討する。
RLMCサンプリングアルゴリズムに対して,$mathcalW$-distance of order $O(sqrtdh)$の均一時間誤差を証明した。
改良されたRLMCアルゴリズムが提案され,非漸近誤差境界が確立された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:48:51 GMT)
Federated Learning with Enhanced Privacy via Model Splitting and Random Client Participation [7.8] フェデレートラーニング(FL)では、クライアントデータを保護するために差分プライバシ(DP)を採用することが多いが、プライバシ保証に必要なノイズの追加は、モデルの精度を著しく低下させる可能性がある。
モデル分割型プライバシ増幅型フェデレーションラーニング(MS-PAFL)を提案する。
このフレームワークでは、各クライアントのモデルをプライベートサブモデルに分割し、ローカルに保持し、グローバルアグリゲーションのために共有されるパブリックサブモデルに分割する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:51:06 GMT)
Adapting SAM with Dynamic Similarity Graphs for Few-Shot Parameter-Efficient Small Dense Object Detection: A Case Study of Chickpea Pods in Field Conditions [7.5] 本研究では,Segment Anything Model (SAM) に適応する動的類似性に基づくグラフ適応(DSGA)モジュールを提案する。
DSGAは4.00Mのトレーニング可能なパラメータしか持たない堅牢な空間的および動的類似性表現を確立しており、これはオリジナルのSAMの4.26%である。
提案手法は農業用自動監視装置の実用性を示し, 精度の高いポッド計数が可能であり, 調整したR-squaredは0.8987である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:26:06 GMT)
The generative quantum eigensolver (GQE) and its application for ground state search [7.5] 本稿では,変分量子アルゴリズムのパラダイムの外で動作する新しい量子計算フレームワークである生成量子固有解法(GQE)を紹介する。
GQEアルゴリズムは古典的な生成モデルを最適化し、所望の特性を持つ量子回路を生成する。
電子構造ハミルトニアンに適用されたGPT-QEのトレーニングと事前学習の実証を行い、クラスタシングルとダブルを組み合わせてその能力を実証した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:22:46 GMT)
Staged Event Trees for Transparent Treatment Effect Estimation [7.4] 本稿では,イベントツリーのフレームワーク内での因果推論手法の斬新な特徴について述べる。
イベントツリーのフレームワーク内に古典的推定器を実装し、シミュレーション研究と実世界のアプリケーションを通してそれらの能力を説明する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:52:44 GMT)
A phase-aware AI car-following model for electric vehicles with adaptive cruise control: Development and validation using real-world data [7.2] 内燃機関(ICE)車両と電気自動車(EV)は、異なる車両の動力学を示す。
既存の顕微鏡モデルでは、ICE車両の駆動挙動を効果的に捉えている。
本研究は、EVに特化したフェーズアウェアAI(PAAI)カーフォローモデルを開発し、検証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:27:03 GMT)
Towards Reasoning Ability of Small Language Models [7.1] 本稿では,SLMの推論能力を体系的に評価し,研究する最初のベンチマークであるThinkSLMを紹介する。
本研究は、17の推論ベンチマークで6つの主要なモデルファミリーから72種類のSLMを評価した。
我々の発見は、スケーリングが強力な推論を達成する唯一の方法である、という仮定に挑戦する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:59:32 GMT)
Commmunication-Efficient and Accurate Approach for Aggregation in Federated Low-Rank Adaptation [7.1] 現在のフェデレート低ランク適応(FedLoRA)メソッドは、不正確な更新のために顕著な課題に直面している。
textbfFederated textbfLow-textbfRank textbfAggregation with textbfNearly textbfAccurate Estimation (FLoRA-NA)を提案する。
FLoRA-NAは、局所的なパーソナライゼーションとグローバルな一般化のギャップを埋め、以前のパーソナライズされたFedLoRAアプローチの重要な制限に対処する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:32:26 GMT)
Towards Verified Code Reasoning by LLMs [7.0] 本稿では,コード推論エージェントの回答を自動的に検証する手法について述べる。
本手法は, エージェントの応答の形式的表現を抽出し, その後, 形式的検証とプログラム解析ツールを用いて構成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:17:51 GMT)
Marginal Flow: a flexible and efficient framework for density estimation [6.9] 現在の密度モデリングアプローチは、高価なトレーニング、遅い推論、近似可能性、モード崩壊、アーキテクチャ制約の少なくとも1つの欠点に悩まされている。
これらの制限を完全に克服する、シンプルで強力なフレームワークを提案する。
パラメトリック分布を$q(x|w)$とし、遅延パラメータを$w$とするモデルとして$q_theta(x)$を定義する。
遅延変数$w$を直接最適化する代わりに、学習可能なディストリビューション$q_theta(w)$から$w$をサンプリングしてマージナルフロー(Marginal Flow)と名付けることで、それらをマージライズします。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:21:13 GMT)
Choosing a Model, Shaping a Future: Comparing LLM Perspectives on Sustainability and its Relationship with AI [6.9] 本研究では,5つの最先端の大規模言語モデルが持続可能性とそのAIとの関係をいかに概念化しているかを体系的に検討する。
評価,持続可能性に関する質問紙調査を1モデルにつき100回ずつ実施し,反応パターンと変動性について検討した。
この結果から,モデル選択が組織的サステナビリティ戦略に大きく影響を与える可能性が示唆された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:12:24 GMT)
Dagger Behind Smile: Fool LLMs with a Happy Ending Story [6.9] ハッピーエンドアタック(Happy Ending Attack)は、シナリオテンプレートで悪意のあるリクエストをラップし、LDMをすぐにまたはフォローアップされた悪意のあるリクエストでジェイルブレイクさせる。
我々のHEAは、GPT-4o、Llama3-70b、Gemini-proを含む最先端のLLMのジェイルブレイクに成功し、平均して88.79%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:06:58 GMT)
The reliable quantum master equation of the Unruh-DeWitt detector [6.8] 本論文では,Unruh-DeWitt検出器に適用した量子マルコフマスター方程式の妥当性範囲を推定する手法を提案する。
我々は、緩和されたファン・ホーブ極限(すなわち、深夜極限)を提案し、オープン量子力学の標準導出過程から生じる誤差順序の摂動的推定を与える。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:11:07 GMT)
DeepJSONEval: Benchmarking Complex Nested JSON Data Mining for Large Language Models [6.7] 多層ネスト構造は、データをキーと値のペア、配列、ネストオブジェクトに整理する。
例えば、ニュース集約では、オブジェクトは記事のメタデータ(タイトル、著者、日付)、コンテンツ(テキスト、マルチメディア)、マルチメディア情報(マルチダイアログ、キャプション)を階層的にネストすることができる。
DeepJSONEvalは、2100のマルチドメインインスタンスと深いネスト構造を特徴とする新しいベンチマークで、難易度によって分類される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:18:20 GMT)
Automated and Scalable SEM Image Analysis of Perovskite Solar Cell Materials via a Deep Segmentation Framework [6.6] 本稿では,SEM画像セグメンテーションのためのディープラーニングフレームワークを提案する。
PerovSegNetという名前のモデルには、2つの新しいモジュールが組み込まれています。
PerovSegNetは平均平均精度87.25%で、265.4ギガ浮動小数点演算を実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:18:51 GMT)
SafePassage: High-Fidelity Information Extraction with Black Box LLMs [6.5] ブラックボックスの大規模言語モデル(LLM)は、情報抽出(IE)を簡単に構成できるが、信頼しにくい。
本稿では, LLM が生成したコンテキストを文書に格納し, 抽出した情報と整合する「安全な通路」の概念を紹介する。
これら3つの部品を併用することにより、幻覚を最大85%減らし、非幻覚をフラグ付けするリスクを最小限に抑える。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:56:17 GMT)
Winning Rates of $(n,k)$ Quantum Coset Monogamy Games [6.0] 我々は$(n,k)$ Coset Monogamy Game を定式化し、2人のプレイヤーが不等サイズの補的情報を抽出しなければならない。
相補的な情報は、部分空間状態上の無作為なPauli-XとPauli-Zエラーの形を取る。
情報理論的勝利率の凸上界を$(n,k)$ Coset Monogamy Game で証明する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:41:49 GMT)
pEBR: A Probabilistic Approach to Embedding Based Retrieval [5.9] 本稿では,埋め込みに基づく検索(textbfpEBR)のための新しいフレームワークを提案する。
実験およびアブレーション実験により、pEBRは計算効率を維持しながら精度とリコールを同時に改善することが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:01:27 GMT)
Rearchitecting Datacenter Lifecycle for AI: A TCO-Driven Framework [5.9] 電力、冷却、ネットワークのプロビジョニングにおける設計選択が、長期TCOにどのように影響するかを示す。
また、ハードウェアのトレンドに沿ったリフレッシュ戦略についても検討しています。
我々のシステムは従来のアプローチよりも最大40%TCOを削減します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:08:51 GMT)
Exact Bias of Linear TRNG Correctors - Spectral Approach [5.9] 本稿では,真の乱数生成器における線形抽出器の正確なセキュリティ境界を確立する。
20,000のコードをスキャンすることで、圧縮効率と暗号セキュリティの基本的なトレードオフを明らかにします。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:27:43 GMT)
SecureBERT 2.0: Advanced Language Model for Cybersecurity Intelligence [5.8] サイバーセキュリティアプリケーション向けに開発されたエンコーダのみの言語モデルであるSecureBERT 2.0を提案する。
改良された長文モデリングと階層符号化を導入し、拡張および異種文書の効率的な処理を可能にした。
SecureBERT 2.0は、複数のサイバーセキュリティベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:12:37 GMT)
An Annotation Scheme for Factuality and its Application to Parliamentary Proceedings [5.8] 本稿では, 様々な先行研究の概念を組み合わさった, 複雑かつ多面的現実性のアノテーションスキームを提案する。
また、この方式で手作業で注釈を付けた議会談話領域に、約5,000文の文を提示する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:36:11 GMT)
A Robotic Stirring Method with Trajectory Optimization and Adaptive Speed Control for Accurate Pest Counting in Water Traps [5.8] 我々は,ロボットアームをベースとした黄色い水トラップに害虫をカウントする自動かき混ぜシステムを開発した。
本研究は, 異なる旋回軌跡が害虫計数に及ぼす影響について検討し, 害虫計数のための最適軌跡を選択した。
そこで我々は,適応的な高速化を実現するために,信頼度駆動型クローズドループ制御システムを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:49:34 GMT)
Sharpness of Minima in Deep Matrix Factorization: Exact Expressions [5.7] 我々は,任意の最小値における二乗誤差損失のヘシアンに対する最初の正確な表現を示す。
本研究では,勾配学習中の脱走現象について検討した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:50:28 GMT)
Dynamic Pricing in High-Speed Railways Using Multi-Agent Reinforcement Learning [5.7] 本稿では,競合演算子や協調演算子のコンテキストにおいて,効果的な動的価格戦略を設計する上での課題について述べる。
非ゼロサムマルコフゲームに基づく強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:33:33 GMT)
Learning from the electronic structure of molecules across the periodic table [5.6] 機械学習型原子間ポテンシャル(MLIP)は、力とエネルギーを学ぶために大量の原子構造データを必要とする。
我々は、原子レベル特性のトレーニングパイプラインに向けて、軌道相互作用データをHに組み込むためのレシピを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:50:41 GMT)
TSalV360: A Method and Dataset for Text-driven Saliency Detection in 360-Degrees Videos [5.5] 我々は360度ビデオにおけるテキスト駆動型唾液度検出の課題に対処する。
16,000個のERPフレームを含むTSV360データセットを導入する。
次に,SOTAの視覚的アプローチを適用して,360度ビデオ・サリエンシ検出を行う。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:11:16 GMT)
An Experimental Study on Generating Plausible Textual Explanations for Video Summarization [5.5] 我々は,SOTAの大規模マルチモーダルモデルを統合することで,ビデオ要約のマルチグラニュラ説明のための既存のフレームワークを拡張した。
我々は、AIの説明に最も望まれる特徴の1つ、得られた説明の妥当性に焦点を当てる。
ビデオ要約のためのSOTA法と2つのデータセットを用いて実験を行い、より忠実な説明がより妥当なものであるかどうかを検証した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:23:40 GMT)
Understanding Formal Reasoning Failures in LLMs as Abstract Interpreters [5.5] 大規模言語モデル(LLM)からそのような推論を導き出すための2つの新しいプロンプト戦略を導入する。
ソフトウェア検証に広く用いられているSV-COMPベンチマークスイートから,22のプログラムに対して,最先端のLCMを用いてこれらの戦略を評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:21:46 GMT)
On the Effectiveness of Methods and Metrics for Explainable AI in Remote Sensing Image Scene Classification [5.4] シーン分類問題に対する説明可能な人工知能(xAI)手法の開発は、リモートセンシング(RS)において大きな注目を集めている。
コンピュータビジョン(CV)で考慮された自然画像に対して、ほとんどのxAI法とRSの関連評価指標が最初に開発された。
本稿では,RS画像シーン分類の文脈における説明手法とメトリクスの有効性について検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:59:22 GMT)
Deep Taxonomic Networks for Unsupervised Hierarchical Prototype Discovery [5.3] 既存の手法は、しばしば構造をクラスの数に結び付け、中間階層レベルで利用可能なリッチなプロトタイプ情報を未利用にする。
我々はこれらのギャップを埋めるために設計された新しい潜伏変数アプローチであるDeep Taxonomic Networkを導入する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:52:17 GMT)
Are Classical Clone Detectors Good Enough For the AI Era? [5.2] AI生成コードの採用の増加は、現代のソフトウェア開発を形変えた。
AI生成クローンは、大規模なトレーニングデータから学んだ体系的な構文パターンと意味的差異を示す。
古典的なコードクローン検出ツールは、歴史的に主に人間による認証で検証されてきた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:19:17 GMT)
On Explaining Proxy Discrimination and Unfairness in Individual Decisions Made by AI Systems [5.2] 本稿では,個別のAI決定におけるプロキシ差別を説明するために,形式的帰納的説明を用いた新しいフレームワークを提案する。
本手法は, 保護属性に対する不適切なプロキシとして機能する特徴を同定し, 隠れた構造バイアスを明らかにする。
概念実証として,ドイツの信用データセットを例に,このフレームワークを紹介した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:58:59 GMT)
TVS Sidekick: Challenges and Practical Insights from Deploying Large Language Models in the Enterprise [5.2] 公の懸念とAIの倫理的かつ責任ある使用に関する新たな規制に応えて、AIガバナンスフレームワークの実装は、組織内のAIの統合と関連するリスクの軽減に役立つだろう。
本稿では,TVSサプライチェーンソリューションにおける実世界のAIアプリケーションについて報告し,大規模言語モデルに基づくAIアシスタントの開発経験と,企業利用への展開における倫理的,規制的,社会技術的課題について報告する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:29:02 GMT)
MIAFEx: An Attention-based Feature Extraction Method for Medical Image Classification [5.2] 医療用イメージアテンションベース機能エクストラクタ (MIAFEx) を提案する。
Transformerエンコーダアーキテクチャ内の分類トークンを強化するために、学習可能な改良機構を採用している。
MIAFExの出力特性は従来の分類器とハイブリッド分類器を用いて古典的特徴抽出器と比較される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:51:55 GMT)
Growing Winning Subnetworks, Not Pruning Them: A Paradigm for Density Discovery in Sparse Neural Networks [5.1] 宝くじのチケット仮説は、密集ネットワークには、フルモデルの性能に合わせるために単独で訓練できるスパースワークが含まれていることを示唆している。
本稿では,PWMPR(Path Weighttude Product-biased Random Growth)を紹介した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:00:47 GMT)
IMProofBench: Benchmarking AI on Research-Level Mathematical Proof Generation [5.0] IMProofBenchは、専門家数学者によって開発された39のピアレビューされた問題からなるプライベートベンチマークである。
それぞれの問題は詳細な証明を必要とし、最終的な答えを持つサブプロブレムと組み合わせられる。
以前のベンチマークとは異なり、評価設定は現実的な研究環境をシミュレートする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:50:37 GMT)
Estimating the Empowerment of Language Model Agents [5.0] EELMAはマルチターンテキストインタラクションから効果的なエンパワーメントを近似するアルゴリズムである。
我々はEELMAを言語ゲームとスケールアップしたWebブラウザのシナリオの両方で検証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:24:22 GMT)
Tree-Structured Parzen Estimator: Understanding Its Algorithm Components and Their Roles for Better Empirical Performance [4.6] Tree-structured Parzen estimator (TPE)は、HyperoptやOptunaといった最近のパラメータチューニングフレームワークで広く使われているベイズ最適化手法である。
その人気にもかかわらず、TPEにおける各制御パラメータの役割とアルゴリズムの直観は今のところ議論されていない。
本稿では,各種ベンチマークデータセットを用いたアブレーション研究に基づいて,各制御パラメータの役割とパラメータチューニングへの影響を明らかにする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:18:43 GMT)
Multi-modal Liver Segmentation and Fibrosis Staging Using Real-world MRI Images [4.5] 肝線維化は肝障害の持続による過剰な細胞外マトリックスの蓄積を示す。
近年の人工知能による肝セグメンテーションと線維化の進展は、非侵襲的な代替手段となる。
CARE 2025 Challengeは、現実のシナリオで肝線維症を定量化し分析する自動化手法を目的としている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:35:30 GMT)
Emergent evaluation hubs in a decentralizing large language model ecosystem [4.5] 大規模な言語モデルは増加しており、ベンチマークも一般的なヤードスティックとして機能している。
これら2つのレイヤの集合パターンがどのように比較されるのかを問う。
相補的ではあるが、対照的なダイナミクスを見つけます。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:49:26 GMT)
Evaluation Sheet for Deep Research: A Use Case for Academic Survey Writing [4.5] 本稿では,Deep Researchツールの能力を評価するための評価シートについて紹介する。
以上の結果から,評価基準を慎重に策定する必要性が示唆された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:00:31 GMT)
Fast training of accurate physics-informed neural networks without gradient descent [4.4] 時空分離の原理に基づく新しいPINNであるFrozen-PINNを提案する。
8つのPDEベンチマークにおいて、Frozen-PINNは最先端のPINNよりも優れたトレーニング効率と精度を達成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:20:28 GMT)
Machine Learning Workflows in Climate Modeling: Design Patterns and Insights from Case Studies [4.2] 本稿では、気候モデルにおける機械学習の応用研究から、一連のケーススタディを分析する。
技術的詳細をレビューするのではなく、ML可能な気候モデリングにおいて、さまざまなプロジェクト間でデザインパターンを合成することを目的としている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:26:18 GMT)
Controlled Generation for Private Synthetic Text [4.2] プライバシ保護型合成テキスト生成のための新しい手法を提案する。
提案手法では,制御可能な生成を誘導するエンティティ・アウェア・コントロール・コードを導入している。
法的および臨床的データセットの実験により,本手法はプライバシー保護と実用性の間に強いバランスを保っていることが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:38:36 GMT)
Aging Decline in Basketball Career Trend Prediction Based on Machine Learning and LSTM Model [4.2] データセットは、NBAのベテラン選手のバスケットボールの試合データから収集された。
この仕事の貢献は、NBAの様々なタイプのキャリアトレンドを評価する他の方法よりも優れていた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:54:22 GMT)
Chain-in-Tree: Back to Sequential Reasoning in LLM Tree Search [4.1] テスト時のスケーリングにより、言語モデルは推論時に追加の計算を割り当てることで、ロングホライズン推論タスクを改善することができる。
CiTは,各ステップで分岐するのではなく,検索中に分岐するタイミングを適応的に決定するフレームワークである。
我々はCitをツリー思考(ToTBS)、ReST-MCTS、RAPの3つの代表的なLCMチェーンに統合し、GSM8KとMath500で評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:18:44 GMT)
CEAID: Benchmark of Multilingual Machine-Generated Text Detection Methods for Central European Languages [4.1] 中央ヨーロッパ言語に焦点をあてた検出手法の最初のベンチマークを提供する。
列車と言語の組み合わせを比較して、最もパフォーマンスの良いものを特定します。
中央ヨーロッパ諸語における監視された微調整検出器は、これらの言語で最も高性能である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:27:53 GMT)
Revealing the temporal dynamics of antibiotic anomalies in the infant gut microbiome with neural jump ODEs [4.1] 不規則なサンプル時間に対する異常検出フレームワークを提案する。
条件平均と分散軌跡を経路依存的に推定し、異常スコアを計算する。
乳児の腸内微生物叢の軌跡に適用すると、抗生物質による破壊の大きさと持続性を示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:54:23 GMT)
Looking Beyond the Known: Towards a Data Discovery Guided Open-World Object Detection [4.0] Open-World Object Detection (OWOD) は、人間の誘導によって未知の物体の連続的な発見と統合を可能にすることによって、従来の物体検出装置を充実させる。
既存のOWODアプローチは、破滅的な忘れ込みとともに、既知のクラスと未知クラスのセマンティックな混同に悩まされ、未知のリコールが減少し、既知のクラスの精度が低下する。
我々は,未知のオブジェクトの発見と適応を相互に(セットベースの)データ発見と表現学習タスクとして再構成する統合フレームワークである Combinatorial Open-World Detection (CROWD)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:48:08 GMT)
Assessing Algorithmic Bias in Language-Based Depression Detection: A Comparison of DNN and LLM Approaches [3.9] 本稿では,自動抑うつ検出のための言語モデルにおけるアルゴリズムバイアスについて検討する。
ジェンダーと人種・民族性に関する社会・デミノグラフィの格差に焦点を当てている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:08:32 GMT)
Can AI agents understand spoken conversations about data visualizations in online meetings? [3.9] 本稿では、オンライン会議シナリオにおけるデータ可視化に関する音声会話に対するAIエージェントの理解を評価する。
本稿では、AIエージェントによるデータに関する会話の理解を診断するための二重軸テストフレームワークを提案する。
評価手法を用いて,オンライン会議におけるビジュアライゼーションの議論の理解において,テキストのみの入力モダリティが最高のパフォーマンス(96%)を達成した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:17:36 GMT)
Attention over Scene Graphs: Indoor Scene Representations Toward CSAI Classification [3.9] 生のピクセルの代わりに構造化グラフ表現を利用する新しいフレームワークを提案する。
Places8では、81.27%の精度を達成し、画像ベースの手法を超越した。
本研究は,屋内シーン分類とCSAI分類のためのロバストなパラダイムとして,構造化シーン表現を確立した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:09:34 GMT)
Foam-Agent 2.0: An End-to-End Composable Multi-Agent Framework for Automating CFD Simulation in OpenFOAM [3.9] 我々は、単一の自然言語プロンプトからエンドツーエンドのOpenFOAMワークフロー全体を自動化するマルチエージェントフレームワークであるFoam-Agentを紹介した。
このフレームワークは、MCP(Model Context Protocol)を使用して、コア機能を独立した呼び出し可能なツールとして公開する。
110のシミュレーションタスクのベンチマークで、Foam-AgentはClaude 3.5 Sonnetで88.2%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:00:57 GMT)
Effective Model Pruning [3.8] EMP(Effective Model Pruning)は、プルーニングに関する基本的な問題に対処する、文脈に依存しないパラメータフリーなルールである。
EMPはパラメータのスコア付けやモデルのプーンの方法を規定していないが、代わりに任意のプルーニング基準に適用可能な、普遍的な適応しきい値を提供する。
我々は,N_effの有効性を,様々な基準とモデルにまたがって拡張しきい値のベータ*N_effで定式化することで検証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:01:22 GMT)
Towards Agentic OS: An LLM Agent Framework for Linux Schedulers [3.8] 我々は、完全に自律的な大規模言語モデル(LLM)エージェントが、人間の関与なしにLinuxスケジューラを安全かつ効率的に最適化できる、最初のフレームワークであるSchedCPを紹介した。
評価の結果,SchedCPの性能改善は最大1.79倍,コスト削減は有意なエージェントアプローチに比べて13倍であることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:48:14 GMT)
VELA: An LLM-Hybrid-as-a-Judge Approach for Evaluating Long Image Captions [3.8] VELAはLLM-Hybrid-as-a-Judgeフレームワーク内で開発された長文キャプションの自動評価指標である。
LongCap-Arenaは、ロングキャプションのメトリクスを評価するために特別に設計されたベンチマークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:52:34 GMT)
Beyond the Algorithm: A Field Guide to Deploying AI Agents in Clinical Practice [3.8] 本稿では,電子健康記録(EHR)データを用いた生成エージェントをデプロイするための実践者指向のフィールドマニュアルを提案する。
本ガイドは、臨床ノートから免疫関連有害事象を検出する自動システム「IRAE-Agent」をデプロイした経験から得られたものである。
データ統合、モデル検証、経済的な価値の確保、システムドリフトの管理、ガバナンスです。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:03:32 GMT)
Enabling Rapid Shared Human-AI Mental Model Alignment via the After-Action Review [3.8] 私たちのブラウザベースのMinecraftテストベッドは、連続的な空間、リアルタイム、部分的に観測可能な環境での協調エージェントの迅速なテストを可能にします。
我々のメンタルモデルアライメントツールは、チームメンバーのファーストパーソン視点のビデオ表示を含めることで、ユーザ主導のミッション後分析を容易にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:08:35 GMT)
Nonstabilizerness without Magic: Classically Simulatable Quantum States That Are Indistinguishable by Classically Simulatable Quantum Circuits [3.7] 量子状態の識別は、量子演算の制限されたクラスを通して可能かつ不可能な操作を定義する上で中心的な役割を果たす。
マジックの資源理論に並列構造が存在することを示す。
本稿では,量子データの隠蔽,安定化状態の非閉鎖,非クリフォードゲートの無条件検証について考察する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:03:21 GMT)
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges [3.7] このレビューは、AIエージェントとエージェントAIを批判的に区別し、構造化された概念分類、アプリケーションマッピング、そして、異なる設計哲学と能力を明らかにするための機会と課題の分析を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:21:32 GMT)
PhotonIDs: ML-Powered Photon Identification System for Dark Count Elimination [3.7] 本稿では,機械学習を利用した光子識別システムPhotonIDを紹介する。
PhotonIDsは、光子と暗カウントのリアルタイム識別のための最初のエンドツーエンドソリューションである。
以上の結果から,光nIDは暗カウント除去において31.2倍の信号ノイズ比(SNR)を向上できることが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:26:43 GMT)
Anchor-free Cross-view Object Geo-localization with Gaussian Position Encoding and Cross-view Association [3.6] AFGeo と呼ばれるクロスビューオブジェクトのジオローカライゼーションのためのアンカーフリーな定式化を提案する。
AFGeoは、事前に定義されたアンカーを使わずにオブジェクトをローカライズする各ピクセルに対して、4つの方向のオフセットをグラウンドトルースボックスに直接予測する。
我々のモデルは軽量かつ効率的であり、ベンチマークデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:30:45 GMT)
Alternating and Gaussian fermionic Isometric Tensor Network States [3.6] 等尺ネットワーク状態(isoTNS)を2次元で改善した。
本研究は,IsoTNSを交互に介在させることにより,従来のIsoTNSよりもより効率的に絡み合うことを示す。
本研究では,(相互作用)横フィールドイジングモデルの基底状態エネルギーに対する元のアイソTNSと比較して,交互アイソTNSの性能が向上していることを見出した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:41:29 GMT)
The Average Patient Fallacy [3.5] 医学における機械学習は、一般的に人口平均に最適化されている。この頻度に重み付けされたトレーニング特権は、一般的なプレゼンテーションを行い、稀だが臨床的に重要なケースを疎外する。これは、私たちが平均的な患者誤診と呼ぶ偏見である。
混合モデルでは、稀な症例からの勾配は有病率によって抑制され、精密医療と直接衝突する。
そこで我々は, 希少ケースパフォーマンスギャップ, 希少ケースエラー, 希少さの有病率定義, および倫理的優先事項を呈する臨床的に重み付けされた目標を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:24:12 GMT)
RAE: A Neural Network Dimensionality Reduction Method for Nearest Neighbors Preservation in Vector Search [3.5] k-NNの次元低減のための正規化オートエンコーダ(RAE)。
正規化は変換ベクトルのノルム歪み率に上限を確立する。
RAEは既存のDRアプローチよりも優れたk-NNリコールを実現している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:25:38 GMT)
A Survey on SAR ship classification using Deep Learning [3.5] 深層学習(DL)は,SAR(Synthetic Aperture Radar)船舶分類の強力なツールとして登場した。
本調査は,本領域で使用されている多種多様なDL手法を包括的に分析する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:10:49 GMT)
RL-Guided Data Selection for Language Model Finetuning [3.5] 本稿では,多種多様な強化学習(RL)手法を用いて,最適データ選択ポリシーを学習するためのトラクタブルマルコフ決定プロセス(MDP)と訓練エージェントを提案する。
4つのデータセットにまたがって、アプローチが選択した5%$サブセットのトレーニングは、データセット全体の微調整を最大10.8$の精度ポイントで上回る。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:42:19 GMT)
TDBench: A Benchmark for Top-Down Image Understanding with Reliability Analysis of Vision-Language Models [3.5] トップダウン画像理解のためのベンチマークであるTDBenchを紹介する。
また、同じシーンの4つの回転するビューに対して、モデルが一貫した回答を提供するかどうかを測るRotationalEval(RE)を提案する。
探索されていない現実世界の課題を対象とする4つのケーススタディを実施している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:02:15 GMT)
PathoHR: Hierarchical Reasoning for Vision-Language Models in Pathology [3.5] 現在の視覚言語(VL)モデルは、構造化された病理報告の解釈に必要な複雑な推論を捉えるのに苦労することが多い。
病理領域内での階層的意味理解と構成的推論におけるVLモデルの能力を評価するために設計された新しいベンチマークであるPathoHR-Benchを提案する。
さらに、マルチモーダルコントラスト学習のための拡張および摂動サンプルを生成する、病理特異的なVLトレーニングスキームを導入する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:39:52 GMT)
Enabling AI Scientists to Recognize Innovation: A Domain-Agnostic Algorithm for Assessing Novelty [3.4] 相対近傍密度(Relative Neighbor density)は、研究思想における新規性評価のための領域に依存しないアルゴリズムである。
RNDは、コンピュータ科学と生物医学研究領域における最先端のSOTA(State-of-the-art)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:15:48 GMT)
Mind the Gap: A Review of Arabic Post-Training Datasets and Their Limitations [3.4] 本稿では,Hugging Face Hub上でのアラビア語学習後のデータセットについて概説する。
各データセットは、人気、実践的採用、信頼性とメンテナンス、ドキュメンテーションとアノテーションの品質、ライセンスの透明性、科学的貢献に基づいて厳格に評価されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:03:47 GMT)
Ultra-Reliable Risk-Aggregated Sum Rate Maximization via Model-Aided Deep Learning [3.4] 本稿では, チャネルフェージング不確実性/リスクに対する信頼度(ウルトラ)を増大させる関数として, CVaR(Conditional Value-at-Risk)を用いた複雑なWSR問題のリスク集約式を提案する。
トレーニングされたαRGNNは、ユーザ毎の深度低下を完全に排除し、十分なエルゴード性能を維持しながら、統計的ユーザ率の変動性を実質的にかつ最適に低減することを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:24:04 GMT)
LFTR: Learning-Free Token Reduction for Multimodal Large Language Models [3.4] MLLM(Multimodal Large Language Models)用に設計されたLFTR(Learning-free token reduction)手法を提案する。
視覚表現の冗長性に乗じて,MLLMの一般的な推論性能を維持しつつトークンを効果的に削減する。
その結果、LFTRは最大16倍の視覚トークンの削減を実現し、メインストリームの視覚質問応答ベンチマークの性能を維持したり、向上させることができた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:14:30 GMT)
Low-loss polarization-maintaining router for single and entangled photons at a telecom wavelength [3.4] テレコムLバンドにおいて、任意偏光単一光子の低損失、ノイズレス、偏光維持ルーティングを実証する。
本手法は、偏光符号化された光量子ネットワークと、空間的および時間的多重化技術による多光子絡み合わせ合成への道を開く。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:34:36 GMT)
Probing phase transitions in non-Hermitian systems with quantum entanglement [3.3] 非エルミート異方性スピン-1/2XYモデルとXXZモデルの量子絡み合いと量子相転移について検討する。
コンカレンス, 負性度, 相互情報, 量子コヒーレンスなど, 様々な絡み合い対策について検討した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:01:48 GMT)
Beyond Overall Accuracy: Pose- and Occlusion-driven Fairness Analysis in Pedestrian Detection for Autonomous Driving [3.3] 歩行者の姿勢の変化が検出性能に与える影響を系統的に検討した。
歩行者特有の5つの検出器を3つの汎用モデルとともに評価した。
以上の結果から, 平行脚, まっすぐ肘, 横方向の視界を有する歩行者に対する偏見が示唆された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:21:01 GMT)
Object Detection with Multimodal Large Vision-Language Models: An In-depth Review [3.3] 大規模視覚言語モデル(LVLM)における言語と視覚の融合は、ディープラーニングに基づく物体検出に革命をもたらした。
この詳細なレビューでは、LVLMの最先端技術に関する構造化された調査が紹介されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:34:01 GMT)
A Scalable Framework for Safety Assurance of Self-Driving Vehicles based on Assurance 2.0 [3.3] Assurance 2.0は、ますます複雑で適応的で自律的なシステムの保証問題に対処するために開発されたモダンなフレームワークである。
厳密さ、透明性、適応性を高めるために、再利用可能な保証理論と明示的な対抗策(デファター)を導入している。
限界は、信頼度測定、疑念の残る管理、自動化支援、そして、敗者および確認バイアスの実践的な処理に持続する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:13:03 GMT)
Exact Solutions to the Quantum Schrödinger Bridge Problem [3.2] 量子シュリンガーブリッジ問題(Quantum Schr"odinger Bridge Problem、QSBP)は、2つの任意の確率分布の間の過程の進化を記述する。
結果として生じる進化方程式は、その過程における非局所性の概念を表すいわゆるボームポテンシャル(量子ポテンシャル)を含むことを示す。
ガウス混合モデルに基づく修正アルゴリズムを提案し,その有効性を実験的に検証した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:11:24 GMT)
Amplified response of cavity-coupled quantum-critical systems [3.2] 量子臨界点は、物質が絶対零点における異なる基底状態の間の連続的な変換を行うときに発生する。
ここでは、量子臨界モードを量子化された空洞場に直接結合することは、超放射能の開始を劇的に促進するという考えを前進させる。
以上の結果から,超ラジカル状態を実現する上で,特に有利な条件が明らかとなった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:55:55 GMT)
Sandbagging in a Simple Survival Bandit Problem [3.2] サンドバッグ」は安全評価の完全性を損なう恐れがある。
シーケンシャルな意思決定タスクにおいて,戦略的偽装の簡単なモデルを構築した。
我々は,サンドバッグとテストスコアのシーケンスから非能率を区別するための統計的テストを構築した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:33:46 GMT)
Neural Multivariate Regression: Qualitative Insights from the Unconstrained Feature Model [3.2] Unconstrained Feature Model (UFM)は、ディープニューラルネットワーク(DNN)における最小トレーニング損失と関連するパフォーマンス測定のためのクローズドフォーム近似を可能にする数学的フレームワークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:57:52 GMT)
ProfVLM: A Lightweight Video-Language Model for Multi-View Proficiency Estimation [3.1] 本稿では,このタスクを生成的推論として再構成する,コンパクトな視覚言語モデルProfVLMを提案する。
スキルレベルを共同で予測し、エゴセントリックなビデオやエクソセントリックなビデオから専門家のようなフィードバックを生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:00:41 GMT)
From Source to Target: Leveraging Transfer Learning for Predictive Process Monitoring in Organizations [3.1] イベントログは、組織情報システムにマッピングされたビジネスプロセスの振る舞いを反映します。
予測プロセス監視は、プロセス関連の予測を作成することによって、これらのデータを価値に変換する。
既存のPPM技術は、簡単には利用できないかもしれない十分な量のイベントデータや他の関連するリソースを必要とします。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:35:45 GMT)
A Review on Riemannian Metric Learning: Closer to You than You Imagine [3.1] レビューでは、重要なメソッド、アプリケーション、最近の進歩について、構造化され、アクセス可能な概要を提供している。
微分幾何学を利用して、基礎となるリーマン多様体に従ってデータをモデル化する強力な一般化を記述する。
このレビューは 研究者や実践者にとって 貴重な情報源になるべきだと論じています
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:59:50 GMT)
Understanding Collective Social Behavior in OSS Communities: A Co-editing Network Analysis of Activity Cascades [3.1] 開発者の時間的活動パターンを分析し、コミットコントリビューションの本質的にバースト的な性質を明らかにします。
我々のフレームワークは、開発者が他の開発者のコードの編集を行うと、共同作業者の活動が加速する、社会的相互作用をモデル化する。
私たちの仕事はOSSコミュニティの創発的な集団的社会的ダイナミクスに光を当て、共同ソフトウェアプロジェクトにおける開発者の混乱と維持を理解するための活動のカスケードの重要性を強調します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:28:35 GMT)
Approximately Unimodal Likelihood Models for Ordinal Regression [3.0] 多くの実世界の順序データから、対象変数の条件付き確率分布(CPD)が不定値となる傾向が示されている。
我々は, ほぼ一助確率モデルを提案し, 一助確率と一助確率に近い一助確率モデルを提案する。
また,提案モデルが順序データとORタスクの統計的モデリングに有効であることを実験的に検証した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:03:17 GMT)
PerQ: Efficient Evaluation of Multilingual Text Personalization Quality [3.0] 個人化の品質など、テキストの特定の側面を評価するためのメトリクスは存在しないため、研究者はしばしばそのようなテキストをメタ評価するために、大きな言語モデルにのみ依存する。
本稿では、与えられたテキスト(言語モデルによって生成される)のパーソナライズ品質を評価するための計算効率の良い手法、PerQを紹介した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:48:14 GMT)
Layer-wise dynamic rank for compressing large language models [2.9] 大規模言語モデル(LLM)は急速に規模を拡大し、深刻なメモリと計算上の問題を引き起こしている。
LLM圧縮のための動的ランク割り当てを階層的にバランスよく行うフレームワークであるD-Rankを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:29:50 GMT)
The DNA of nuclear models: How AI predicts nuclear masses [2.9] 本稿では,E_b$の最先端精度を実現するAIモデルを提案する。
E_b$のAI予測は階層的に分解・順序付け可能であり、最も重要な用語はよく知られた記号モデルに対応する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:29:46 GMT)
What Drives Paper Acceptance? A Process-Centric Analysis of Modern Peer Review [2.9] ICLR 2017-2025の大規模な実証研究を行い、28,000件以上の提出書を提出した。
以上の結果から,科学的新奇性以外の要因が受容結果を著しく形作っていることが示唆された。
著者,レビュアー,メタレビュアーに対して,ピアレビューにおける透明性と公正性を高めるためのデータ駆動ガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:00:10 GMT)
ASR Under Noise: Exploring Robustness for Sundanese and Javanese [2.8] インドネシアの主要な2言語であるジャワ語とスンダ語に対するWhisperベース自動音声認識(ASR)モデルの堅牢性について検討する。
合成雑音増強とSpecAugmentを含む複数のトレーニング戦略を実験し、信号-雑音比(SNR)の範囲で性能を評価する。
以上の結果から,特に大きなWhisperモデルにおいて,ノイズ認識トレーニングはロバスト性を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:20:25 GMT)
Bayesian Influence Functions for Hessian-Free Data Attribution [2.8] 本研究では, 局所ベイズ影響関数 (BIF) を提案する。
このHessian-freeアプローチは、パラメータ間の高次相互作用をキャプチャし、数十億のパラメータを持つニューラルネットワークに効率的にスケールする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:17:37 GMT)
AntiFLipper: A Secure and Efficient Defense Against Label-Flipping Attacks in Federated Learning [2.7] フェデレートラーニング(FL)は、データを分散化してプライバシ保護モデルトレーニングを可能にする。
悪意のあるクライアントがラベルを操作してグローバルモデルに悪影響を及ぼすような、ラベルフリップ攻撃には依然として脆弱だ。
FLにおけるマルチクラスラベルフリップ攻撃に対する,新規かつ計算効率のよい防御手法であるAntiFLipperを紹介した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:36:41 GMT)
Imagining Alternatives: Towards High-Resolution 3D Counterfactual Medical Image Generation via Language Guidance [2.7] フリーフォーム言語プロンプトによって誘導される高精細な3次元医療画像を生成することのできるフレームワークを提案する。
以上の結果から,3次元医用画像における急速進行解析の基礎となった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:25:22 GMT)
SQUARE: Semantic Query-Augmented Fusion and Efficient Batch Reranking for Training-free Zero-Shot Composed Image Retrieval [2.6] Composed Image Retrieval (CIR) は、ユーザが指定したテキスト修正を取り入れつつ、参照画像の視覚的内容を保存するターゲット画像の検索を目的としている。
ZS-CIRを強化するために,MLLM(Multimodal Large Language Models)を利用した新しい2段階学習自由フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:41:24 GMT)
Optimizing Speech Language Models for Acoustic Consistency [2.6] 我々は、0.7B音声のみのモデル、1.0B音声のみのモデル、1.0Bテキストと音声の両方のインターリーブモデルという3つのモデルを訓練する。
提案手法は,音声トークンを自己教師機能付きで初期化し,光アライメントロスを施し,薄型化と補助的目的を有する列車に適用する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:59:52 GMT)
Directed Information $γ$-covering: An Information-Theoretic Framework for Context Engineering [2.5] 冗長性を考慮したコンテキストエンジニアリングのためのフレームワークであるDirected Information $gamma$-coveringを紹介した。
オンラインコストは発生せず、オフラインで一度計算し、すべてのクエリで償却することができる。
これらの結果は、現代のLLMパイプラインのための原則化された自己組織化バックボーンとしてDI $gamma$-coveringを確立する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:41:11 GMT)
Thinkquel: A Model Dedicated to Text-to-dbt Using Synthetic Data and a Span-Aware Objective [2.5] Thinkquelは、堅牢でポータブルで実行検証可能なデータベースクエリを生成するための微調整モデルである。
TS-GRPOはトークンレベルのトレーニング信号とシーケンスレベルの実行報酬のギャップを埋めるように設計されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:04:53 GMT)
Vibe Coding in Practice: Motivations, Challenges, and a Future Outlook -- a Grey Literature Review [2.5] バイブコーディング(Vibe coding)とは、AIコード生成ツールを直感や試行錯誤を通じて、基礎となるコードを必ずしも理解せずに使用するプラクティスである。
ユーザーがなぜバイブコーディングに関わったのか、何を経験しているか、品質保証(QA)にどのようにアプローチし、AI生成コードの品質を知覚するかを体系的に調査した研究はない。
私たちの分析では、スピードとアクセシビリティによってビブコーダがモチベーションを得て、迅速な即時的な成功とフローを経験する"という、スピード品質のトレードオフパラドックスを明らかにしています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:35:00 GMT)
Hy-Facial: Hybrid Feature Extraction by Dimensionality Reduction Methods for Enhanced Facial Expression Classification [2.4] Hy-Facialは、ディープラーニングと従来の画像処理技術を統合したハイブリッド機能抽出フレームワークである。
提案手法は,Visual Geometry Group 19-layer network (VGG19) から抽出した深い特徴と手作りの局所記述子を融合する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:53:29 GMT)
LMILAtt: A Deep Learning Model for Depression Detection from Social Media Users Enhanced by Multi-Instance Learning Based on Attention Mechanism [2.4] うつ病は世界的な公衆衛生上の大きな課題であり、早期の身元確認は極めて重要である。
本研究ではLMILAttモデルを提案し,Long Short-Term Memory Autoencoderとアテンション機構を統合した。
実験により、精度、リコール、F1スコアの点で、モデルがベースラインモデルよりもはるかに優れていることが示された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:58:32 GMT)
A Review of Software for Designing and Operating Quantum Networks [2.4] 量子ネットワークプロトコルの開発は、分散センシング、セキュアな通信、ユーティリティスケールの量子計算をサポートするプロダクショングレードネットワークの実現に不可欠である。
本稿では、インフラストラクチャ、論理、制御/サービスプレーンの3面抽象化を中心に構成された量子ネットワークのソフトウェア実装の現状を概観する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:23:47 GMT)
Reinforced Strategy Optimization for Conversational Recommender Systems via Network-of-Experts [1.8] 本稿では,応答生成をマクロレベルの戦略計画と,ネットワーク・オブ・エキスパート内のマイクロレベルの適応に分解する階層的フレームワークを提案する。
プランナーは戦略(例えば、推薦、説明、奨励)を選択し、アクターは、選好と事実的根拠に関する補助的な専門家によってガイドされた応答を生成する。
実験により、RSOは最先端のベースラインより優れており、階層的戦略最適化の有効性が検証されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:12:01 GMT)
The Dragon Hatchling: The Missing Link between the Transformer and Models of the Brain [1.8] 我々はDragon Hatchling(BDH)を紹介した。これは、局所的に相互作用するニューロン粒子のスケールフリーな生物学的インスパイアされたネットワークに基づく、新しい大規模言語モデルアーキテクチャである。
BDHは、トランスフォーマーのような性能を犠牲にすることなく、強力な理論的基礎と固有の解釈性を結合する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:49:01 GMT)
Interpret, prune and distill Donut : towards lightweight VLMs for VQA on document [1.7] 我々は,知識蒸留によるモデル圧縮について検討し,より大規模な教師からコンパクトな学生モデルを訓練する。
このフレームワーク内での学生アーキテクチャ設計を促進するために,機械的解釈可能性を活用している。
このアプローチによって、DocVQA上での強いパフォーマンスを維持しながら、推論時間とメモリ使用量を削減する、刈り取ったDonut-MINTが生成される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:31:03 GMT)
DeepProv: Behavioral Characterization and Repair of Neural Networks via Inference Provenance Graph Analysis [1.7] DeepProvは、推論中にディープニューラルネットワーク(DNN)のランタイム動作をキャプチャして特徴付けるように設計されたシステムである。
システム監査証明グラフにインスパイアされたDeepProvは、IPG(Inference Provenance Graphs)を通して、DNNの推論プロセスの計算情報フローをモデル化する。
DeepProvはこれらの洞察を使って、堅牢性、プライバシ、公正性など、特定の目的のためにDNNを体系的に修復する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:29:02 GMT)
A Hierarchical Agentic Framework for Autonomous Drone-Based Visual Inspection [1.7] 本稿では,自律型ドローン制御のための階層型エージェントフレームワークと,個別機能実行のための推論手法を提案する。
本フレームワークは,産業用リードアウトの解釈や検査機器の検査など,屋内産業環境での視覚的検査作業に重点を置いている。
自然言語処理をエージェント通信に活用することにより、従来のドローンベースのソリューションに代わる、斬新で柔軟な、ユーザアクセス可能な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:31:30 GMT)
Taming the Tri-Space Tension: ARC-Guided Hallucination Modeling and Control for Text-to-Image Generation [1.7] テキスト・ツー・イメージ(T2I)拡散モデルでは持続的な「幻覚」が示される
本稿では,幻覚を潜在アライメント空間内の軌跡ドリフトとして再解釈する認知的な視点を提案する。
このフレームワークは、T2Iシステムにおける生成障害を理解し緩和するための統一的で解釈可能なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:14:20 GMT)
Data driven approaches in nanophotonics: A review of AI-enabled metadevices [1.7] データ駆動型アプローチは、フォトニックメタデバイスの設計と最適化に革命をもたらした。
このレビューは、新しいデザイン戦略を合成するモデル中心の視点を取ります。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:03:46 GMT)
Security and Privacy Analysis of Tile's Location Tracking Protocol [1.6] 私たちは、クラウドソースで2番目に人気のある位置追跡サービスであるTileの総合的なセキュリティ分析を行いました。
いくつかの悪用可能な脆弱性と設計上の欠陥を特定し、プラットフォームが主張するセキュリティとプライバシの保証の多くを無効にしています。
我々は、Tileの独立した興味を持つユニークな特徴である説明責任メカニズムについて検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:25:59 GMT)
OWL: Geometry-Aware Spatial Reasoning for Audio Large Language Models [1.6] 音響特徴を3次元空間構造に整合させる幾何対応オーディオエンコーダであるtextbfSpatial-Acoustic Geometry (SAGE$)を紹介した。
我々は、$textbfSAGE$と空間的に接地されたチェーン・オブ・シークレットを統合したALLMである$textbfOWL$を示し、その方向(DoA)と距離推定について合理化する。
知覚的QAから多段階推論へのカリキュラム学習を通じて、$textbfOWL$は12時レベルの方位とDoA推定をサポートする
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:57:47 GMT)
CIMNAS: A Joint Framework for Compute-In-Memory-Aware Neural Architecture Search [1.5] 本研究は,CIMアーキテクチャのための共同モデル量子化ハードウェア最適化フレームワークであるCIMNASを紹介する。
CIMNASは同時に、ソフトウェアパラメータ、量子化ポリシー、幅広い範囲のハードウェアパラメータ、デバイス、回路、アーキテクチャレベルの共最適化を検索する。
他の最先端の手法とは異なり、CIMNASはEDAPを精度損失なく達成し、高性能CIMベースのニューラルネットワーク設計のための多様なパラメータの組み合わせを生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:57:49 GMT)
Multi-View Camera System for Variant-Aware Autonomous Vehicle Inspection and Defect Detection [1.5] textbf Automated Vehicle Inspection (AVI) プラットフォームを提案する。
ディープラーニング検出器とセマンティックルールエンジンを結合して、Emphvariant-awareの品質管理をリアルタイムで提供する。
我々の知る限り、これはデプロイ可能な自動車環境において、マルチカメラ機能検証と欠陥検出を統一する最初の公開システムである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:08:59 GMT)
SoK: Systematic analysis of adversarial threats against deep learning approaches for autonomous anomaly detection systems in SDN-IoT networks [1.5] 本研究では、構造化された敵対的脅威モデルと攻撃の包括的分類を導入し、それらをデータ、モデル、ハイブリッドレベルの脅威に分類する。
以上の結果から、敵の攻撃によって検出精度が最大48.4%低下し、メンバーシップ推論が最大の低下を招いたことが判明した。
本稿では、リアルタイムの敵緩和、強化されたリトレーニング機構、説明可能なAI駆動型セキュリティフレームワークなど、適応的な対策を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:54:42 GMT)
Machine-Learning Driven Load Shedding to Mitigate Instability Attacks in Power Grids [1.5] 本研究では、電力網における負荷層決定システムを、不安定な攻撃から防御する能力に適合させるために、教師付き機械学習モデルを訓練するための費用対効果のあるデータ駆動型アプローチを提案する。
本稿では,Achilles Heel Technologies Power Grid Analyzer を用いたIEEE 14 Bus System の概念実証を行い,MPA が不安定な攻撃を検知し防御機構を起動するための有効な方法であることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:05:51 GMT)
Analyzing BEV Suitability and Charging Strategies Using Italian Driving Data [1.4] バッテリ・エレクトリック・ビークル(BEV)は、民間輸送の確立した選択肢に代わるニッチな選択肢から急速に進化している。
関心が高まりつつあるにもかかわらず、レンジ不安、公共充電ステーションにまつわる不便さ、コストの上昇など、大きな障壁が残っている。
本研究では,イタリアにおけるICE車両を用いた10,441人の利用者から収集した広範囲なテレメトリデータを解析し,現在の走行行動を変えることなく,BEVへの乗り換えの可能性を評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:48:41 GMT)
Text-to-CT Generation via 3D Latent Diffusion Model with Contrastive Vision-Language Pretraining [1.4] 本稿では,3次元コントラッシブな視覚-言語事前学習方式と潜在拡散モデルを組み合わせたテキスト-CT生成のための新しいアーキテクチャを提案する。
本手法は,テキストから臨床的に有意なCTボリュームを合成するための,スケーラブルで制御可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:18:41 GMT)
Spectral gap of Metropolis-within-Gibbs under log-concavity [1.4] MwG(Metropolis-within-Gibbs)アルゴリズムは、高次元分布からサンプリングするためのマルコフ連鎖モンテカルロ法である。
我々は,MwGをRandom Walk Metropolis (RWM) 更新を用いて検討し,目標の条件変動に合わせるように調整された提案分散を用いて検討した。
その結果,MwGは分散適応型提案とかなり高速な混合が可能であり,その混合性能はギブスサンプリング器よりもわずかに劣ることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:31:22 GMT)
FoundBioNet: A Foundation-Based Model for IDH Genotyping of Glioma from Multi-Parametric MRI [1.4] 我々は,多パラメータMRIから非侵襲的にIDH変異を予測できるFoundBioNet(FoundBioNet)を提案する。
1705人のグリオーマ患者を6つの公開データセットから多施設で訓練し, 評価した。
我々のモデルは、EGD、TCGA、Ivy GAP、RHUH、UPennの独立したテストセットに対して90.58%、88.08%、65.41%、および80.31%のAUCを達成した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:19:19 GMT)
Better with Less: Small Proprietary Models Surpass Large Language Models in Financial Transaction Understanding [1.4] 本稿では, 3種類のトランスフォーマーモデルの評価実験を行い, 事前学習型LLM, 微調整型LLM, およびスクラッチから開発した小型プロプライエタリモデルについて述べる。
本研究は,ドメイン固有のニーズに基づいたモデル選択の重要性を強調した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:23:08 GMT)
o-MEGA: Optimized Methods for Explanation Generation and Analysis [1.4] textbftexttto-megaは、最も効果的な説明可能なAIメソッドを自動的に識別するように設計されたツールである。
自動ファクトチェックシステムにおける透明性の向上を実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:08:36 GMT)
ReLoop: "Seeing Twice and Thinking Backwards" via Closed-loop Training to Mitigate Hallucinations in Multimodal understanding [1.3] MLLM(Multimodal Large Language Models)は、オープンな視覚的質問応答において顕著な進歩を遂げている。
MLLMは幻覚に弱いままであり、信頼性と事実の整合性にとって重要な課題である。
クロスモーダル理解のためのマルチモーダル整合性を促進する統合クローズドループトレーニングフレームワークであるReLoopを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:21:02 GMT)
tCURLoRA: Tensor CUR Decomposition Based Low-Rank Parameter Adaptation and Its Application in Medical Image Segmentation [1.3] 伝達学習は、事前訓練されたモデルからの知識を活用することで、目標タスクの性能を大幅に向上させた。
ディープニューラルネットワークのスケールアップに伴って、フル微調整によって、計算とストレージの大幅な課題がもたらされる。
テンソルCUR分解に基づく新しい微調整法であるtCURLoRAを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:08:16 GMT)
How does the entanglement entropy of a many-body quantum system change after a single measurement? [1.3] 一次元の非相互作用複素フェルミオンに対して、エンタングルメントエントロピーの変化の確率分布を数値的に計算する。
量子ジャンプと射影測定プロトコルについて、ガウス性からの明確な偏差を観測する。
強いモニタリングのために、コアはガウスからゼロで強くピークに曲がり、量子ゼノ効果の優位性を示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:26:35 GMT)
The Loss Kernel: A Geometric Probe for Deep Learning Interpretability [1.3] 我々は、トレーニングされたニューラルネットワークに基づいて、データポイント間の類似度を測定するための解釈可能性であるロスカーネルを紹介する。
これにより、ロスカーネルは解釈可能性とデータ属性の実用的なツールとして確立される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:10:28 GMT)
Unpicking Data at the Seams: Understanding Disentanglement in VAEs [1.2] データ多様体上の密度が独立した一次元のシームに沿って分解するように、デコーダの局所軸がどのように「ロック」されるかを示す。
このことは、非絡み合いを明確に定義し、なぜそれがVAEに現れるのかを説明し、前提条件の下では、基底真理因子が対称な先行条件でも識別可能であることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:35:37 GMT)
Reevaluating Convolutional Neural Networks for Spectral Analysis: A Focus on Raman Spectroscopy [1.2] 我々は1次元畳み込みニューラルネットワーク(CNN)を評価し,4つの進歩を報告した。
コンパクトCNNは、手作りの機能で$k$-nearest-neborsを上回っている。
ラベル効率の学習: 半教師付き生成的敵ネットワークと対照的な事前学習により、最大で11%の精度が向上し、わずか10%のラベルしか取得できない。
このワークフローには、生のスペクトルのトレーニング、プールのチューニング、ラベルの不足時に半スーパービジョンの追加、新しいターゲットに対する微調整が含まれる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:01:38 GMT)
FITS: Towards an AI-Driven Fashion Information Tool for Sustainability [1.1] 本研究は,ファッションブランドのサステナビリティデータの分類に自然言語処理(NLP)技術を適用する方法について検討する。
本稿では,持続可能性情報の抽出と分類を行うトランスフォーマシステムであるFITS(Fashion Information Tool for Sustainability)のプロトタイプを提案する。
FITSはユーザが関連するデータを検索し、自身のデータを分析し、インタラクティブなインターフェースを通じて情報を探索することを可能にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:47:42 GMT)
Efficient Distributed Training via Dual Batch Sizes and Cyclic Progressive Learning [1.1] バッチサイズが大きいと、一般化が不十分なため、精度が低下する可能性がある。
本稿では,パラメータサーバフレームワーク上に構築された分散学習手法である,二重バッチサイズ学習方式を提案する。
二重バッチサイズ学習による時間オーバーヘッドを軽減するため,循環進行学習方式を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:10:47 GMT)
SPAM Tolerance for Pauli Error Estimation [1.1] 本稿では,[FO21]で導入された人口回復の削減に基づくアルゴリズムを提案する。
我々のアルゴリズムは、過酷な状態準備と測定(SPAM)エラーに対するロバスト性の重要な利点を持っている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:53:30 GMT)
Galton's Law of Mediocrity: Why Large Language Models Regress to the Mean and Fail at Creativity in Advertising [1.1] 大規模言語モデル (LLM) は、しばしば安全で汎用的な言い回しをデフォルトとして、流動的なテキストを生成する。
本稿では,この傾向をGalton-style regression to the mean in languageとして定式化し,広告コンセプトにおける創造性ストレステストを用いて評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:29:41 GMT)
Evaluating the impact of code smell refactoring on the energy consumption of Android applications [1.1] コードのリファクタリングは、"重複コード"と"タイプチェック"の臭いで、エネルギー消費を最大10.8%削減する。
しかし、エネルギー消費の顕著な減少は、実行時間の増大や減少と直接的に関係しているとは思えない。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:04:40 GMT)
BOOST: Bayesian Optimization with Optimal Kernel and Acquisition Function Selection Technique [1.0] カーネル獲得ペアの選択を自動化する新しいフレームワークであるBOOSTを提案する。
BOOSTは、様々なカーネル獲得ペアのパフォーマンスを予測し、高価な評価にコミットする前に最も有望なペアを特定する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:33:27 GMT)
Stochastic Layer-wise Learning: Scalable and Efficient Alternative to Backpropagation [1.0] バックプロパゲーションは現代のディープラーニングを支えるものだが、グローバル同期への依存はスケーラビリティを制限し、高いメモリコストを発生させる。
対照的に、完全に局所的な学習ルールはより効率的であるが、コヒーレントなグローバルラーニングに必要な層間調整を維持するのに苦労することが多い。
本稿では,グローバルな目標を協調的なレイヤローカル更新に分解するレイヤワイズ学習アルゴリズムであるレイヤワイズ学習(SLL)を紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:10:03 GMT)
Towards Continual Expansion of Data Coverage: Automatic Text-guided Edge-case Synthesis [1.0] テキスト誘導エッジケース合成のための自動パイプラインを提案する。
提案手法では、画像キャプションの言い換えに、好みの学習によって微調整されたLarge Language Modelを用いる。
この作業は、データキュレーションを手作業から自動化されたターゲット合成に移行する、スケーラブルなフレームワークを確立する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:11:25 GMT)
Improved Hyperspectral Anomaly Detection via Unsupervised Subspace Modeling in the Signed Cumulative Distribution Transform Domain [1.0] 本稿では,与えられたハイパースペクトル画像を構成する画素を記述するために,輸送モデルを用いた新しいHAD法を提案する。
このアプローチでは、超スペクトル画素は、符号付き累積分布変換(SCDT)領域におけるそれらの表現を可能にする未知の変形を行うテンプレートパターンの観測と見なされる。
次に、教師なしサブスペースモデリング手法を用いて、この領域で豊富な背景信号のモデルを構築し、そこで、異常信号が学習モデルからの逸脱として検出される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:20:36 GMT)
Dynamics of Majorana zero modes across hybrid Kitaev chain [1.0] 格子を2つのセグメントに分割するハイブリッドな北エフ連鎖を導入する。
左のセグメントは最寄りのカップリングで構成され、右のセグメントは長距離ペアリングを含んでいる。
時間発展状態の確率分布の時間プロファイルを用いて,MZM転送のインタフェース上でのシグネチャを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:55:02 GMT)
Analysis of a Spatialized Brain-Body-Environment System [1.0] 多くのモデルは、しばしば脳を結合常微分方程式(PDE)のネットワークとして扱う。
本研究では,脳と身体の両方に偏微分方程式(PDE)を用いた空間的前向きアプローチを提案する。
本研究は,脳-体-環境相互作用の理解における空間ダイナミクスの重要性を強調した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:26:29 GMT)
Multi-View Projection for Unsupervised Domain Adaptation in 3D Semantic Segmentation [0.9] 教師なしドメイン適応(UDA)のための多視点プロジェクションフレームワークを提案する。
我々の手法はLiDARスキャンをコヒーレントな3Dシーンに整列し、複数の仮想カメラのポーズからレンダリングして2Dデータセット(PC2D)を生成する。
2Dセグメンテーションモデルのアンサンブルは、これらのモダリティに基づいて訓練され、推論中は、1シーンあたり数百ビューが処理され、ロジットは3Dにバックプロジェクションされる。
我々のフレームワークはレアクラスのセグメンテーションを可能にし、それらのクラスに対する2Dアノテーションのみを活用しながら、ソースドメイン内の他のクラスに対する3Dアノテーションに依存していることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:17:22 GMT)
Quantum Theory of Optical Spin Texture in Chiral Tellurium Lattice [0.9] そこで我々は,Teの電子的構造に類似したスピン分解型深部顕微鏡光バンド構造を開発した。
格子レベルでは、Teのキラリティが光波内の深部微視的な光スピンテクスチャとして現れることが明らかとなった。
本フレームワークは光学活性の有限モメンタム源を明らかにするとともに, キラル結晶材料における光-物質相互作用の顕微鏡的基盤を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:38:51 GMT)
Institutional Policy Pathways for Supporting Research Software: Global Trends and Local Practices [0.9] 研究開発組織(RPOs)は、研究ソフトウェアに関わる人、スキル、インフラへの投資が持続可能で保守可能なソフトウェアを生み出すことを保証する必要がある。
本稿では、Research Software Alliance(ReSA)とResearch Data Alliance(RDA)の共同イニシアチブであるPRO4RS(Research Organizations for Research Software)ワーキンググループの活動の概要を紹介する。
研究ソフトウェアに関する制度政策の合理性を考慮すると、PRO4RSのWGのアウトプットと分析を利用して、重要な政策ギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:45:39 GMT)
Towards autonomous photogrammetric forest inventory using a lightweight under-canopy robotic drone [0.9] 本稿では、最先端のオープンソース手法を活用し、森林内のデータ収集のパフォーマンスを検証するロボットアンダーキャノピードローンのプロトタイプを構築します。
試作機は、選択した挑戦的な森林環境での飛行に成功し、立体写真撮影システムを用いた森林3Dモデリングにおいて有望な性能を示した。
この結果は、自律型アンダーキャノピー森林マッピングに関する貴重な洞察を与え、複雑な森林環境をマッピングするための軽量なロボットドローンシステムを進化させるための重要な次のステップを強調している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:37:46 GMT)
Query-Optimal Estimation of Unitary Channels via Pauli Dimensionality [0.9] パウリスペクトルが小部分群で支持されるユニタリチャネルのプロセストモグラフィーについて検討した。
我々は,$O(2k/epsilon)$クエリを用いてこれを実現するアルゴリズムを提案する。
また,近似クリフォード回路を用いた深度O(log n)$回路の構成を学習するための計算効率のよいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:40:42 GMT)
Swift: An Autoregressive Consistency Model for Efficient Weather Forecasting [0.9] 我々は,確率フローモデルの自己回帰微調整を可能にする単一ステップ一貫性モデルであるSwiftを紹介する。
結果から、Swiftは75日間にわたって安定し、最先端の拡散ベースラインよりも39時間以上高速に動作する、熟練した6時間の予測を生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:54:24 GMT)
MARS: Audio Generation via Multi-Channel Autoregression on Spectrograms [0.8] スペクトログラムをマルチチャネル画像として扱うフレームワークであるMARS(Multi-channel AutoRegression on Spectrograms)を紹介する。
共有トークン化器はスケールをまたいだ一貫した離散表現を提供し、トランスフォーマーベースのオートレグレッシャが分光図を効率的に精査することを可能にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:38:02 GMT)
Dual effects of Lamb Shift in Quantum Thermodynamical Systems [0.8] エネルギー準位を変化させるラムシフトが熱電流に様々な範囲に影響を及ぼすことを示した。
その結果、ラムシフトは量子熱輸送において重要な役割を担い、量子熱力学におけるその影響の理解を深めた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:14:37 GMT)
MPCA-based Domain Adaptation for Transfer Learning in Ultrasonic Guided Waves [0.8] マルチ線形主成分分析(MPCA)に基づく新しい伝達学習(TL)フレームワークを提案する。
ソースドメインとターゲットドメインにMPCAを併用することにより、共有潜在特徴を抽出し、効果的なドメイン適応を可能にする。
提案したMPCAを用いたTL法は, 異なる複合材料とセンサアレイを含む12種類のケーススタディに対して試験を行った。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:16:05 GMT)
Hierarchical Reasoning Model: A Critical Supplementary Material [0.7] 変換器は自然言語処理と関連する領域で顕著な性能を示した。
新たな探索は階層的推論モデル(Hierarchical Reasoning Model)であり、変圧器の潜伏空間に新しいタイプの再帰的推論を導入する。
これまでに報告したよりも、Sudoku-ExtremeタスクとMaze-Hardタスクにおいて、非常に優れたパフォーマンスを実現する興味深い変種を提示する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:40:04 GMT)
MEDAKA: Construction of Biomedical Knowledge Graphs Using Large Language Models [0.7] 知識グラフ(KG)は、構造化され解釈可能なフォーマットの生体情報を表現するために、ますます使われるようになっている。
本稿では,(1)ウェブスクレイパーとLSMを用いて,構造化されていないオンラインコンテンツからKGを生成する,ハック可能なエンドツーエンドパイプライン,(2)この手法を利用可能なドラッグリーフレットに適用して作成したキュレートデータセット,MEDakaについて述べる。
このデータセットは、副作用、警告、禁忌、成分、服用ガイドライン、保管指示、身体的特徴などの臨床的に関連する属性をキャプチャする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:47:04 GMT)
Gaussian Mixture Model with unknown diagonal covariances via continuous sparse regularization [0.7] 我々は、コンポーネントの数とそのパラメータを同時に推定するために、Beurling-LASSOフレームワークを使用します。
重要な理論的貢献は、混合成分上の明示的な分離条件の同定である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:30:19 GMT)
Quantum-Enhanced Multi-Parameter Sensing in a Single Mode [0.7] 標準量子限界以下で不確実性が同時に減少する位置と運動量の小さな変化の測定を実証する。
実験では格子状態を用いて位置と運動量の小さな変化を計測し,同時に5.1(5)dBまで上昇した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:24:04 GMT)
A physical approach to qualia and the emergence of conscious observers in qualia space [0.7] 私は、クォーリアは直接観測可能であるので物理的である、と提案する。
量子力学の計測問題を意識の難しい問題と同一視し、準同型モデルとして再解釈する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:22:19 GMT)
M&SCheck: Towards a Checklist to Support Software Engineering Newcomers to the Modeling and Simulation Area [0.4] デジタル双生児、スマートシティ、業界 4.0 と 5.0 は、ソフトウェア開発ライフサイクルにモデリングとシミュレーション(M&S)を含める必要性を明らかにしている。
ソフトウェアエンジニアは自分自身に重要な疑問を呈することが多い。
本論文の主な貢献は,M&Sにおける初心者の問題解決に最も適したパラダイムの選択を支援するための質問付き予備チェックリストの設置である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:34:34 GMT)
A Sparse $Z_2$ Chain Complex Without a Sparse Lift [0.4] スパース$Z$連鎖複体(3つの異なる次数を持ち、量子コードに対応するように)を構築する。
整数に対するスパースリフトを認めず、Ref. 1の質問に答える。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:29:29 GMT)
Painless Activation Steering: An Automated, Lightweight Approach for Post-Training Large Language Models [0.4] アクティベーションステアリング(AS)は、既存の2つのポストトレーニング方法に代わる、安価で、高速で、制御可能な代替手段を約束する。
完全に自動化された手法のファミリーであるPainless Activation Steering (PAS)を紹介する。
PASは行動タスクのパフォーマンスを確実に向上させるが、インテリジェンス指向のタスクには向いていない。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:27:01 GMT)
HodgeFormer: Transformers for Learnable Operators on Triangular Meshes through Data-Driven Hodge Matrices [0.3] 形状解析のためのトランスフォーマーアーキテクチャは、現在コストのかかる固有値分解に基づく手法に依存している。
本稿では,離散エクステリア計算におけるHodge Laplacian演算子の明示的な構成に着想を得た新しいアプローチを提案する。
提案手法は,直接学習フレームワークを用いて,メッシュセグメンテーションと分類タスクにおいて同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:24:22 GMT)
AI-assisted Advanced Propellant Development for Electric Propulsion [0.3] AI予測の電離エネルギーと最小外観エネルギーはそれぞれ6.87%と7.99%の相対誤差を持つ。
電子イオン化による全質量スペクトルの場合、予測は0.6395のコサイン類似性を持ち、30 Daの範囲で78%の場合に最もよく似た質量スペクトルと一致している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:31:41 GMT)
Microwave-to-Optical Quantum Transduction of Photons for Quantum Interconnects [0.3] マイクロ波-光量子変換は超伝導量子コンピューティングの分野において特に関心がある。
本稿では,マイクロ波と光子間の量子トランスダクションに関する最近の理論的および実験的研究を概説する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:53:41 GMT)
When Hallucination Costs Millions: Benchmarking AI Agents in High-Stakes Adversarial Financial Markets [0.3] AI評価において重要な盲点を明らかにするベンチマークであるCAIAを提示する。
我々は178の時間短縮タスクに対して17のモデルを評価し,真理と操作の区別をエージェントに要求した。
ツールがなければ、フロンティアモデルでさえ、ジュニアアナリストが日常的に扱うタスクにおいて28%の精度しか達成できません。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:39:06 GMT)
Autonomy-Aware Clustering: When Local Decisions Supersede Global Prescriptions [0.3] 我々は,その形態を事前に知ることなく,地域自治の影響を学習し,考慮する学習フレームワークである自律型クラスタリングを導入する。
また,アダプティブ距離推定ネットワーク(ADEN, Adaptive Distance Estimation Network)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:44:36 GMT)
Extreme Self-Preference in Language Models [0.3] 4つの広く使われている大言語モデル(LLM)において、大規模な自己参照が発見された。
ワードアソシエーションタスクでは、モデルが圧倒的に肯定的な属性を、競合する企業やCEOの名前と組み合わせている。
私たちは、自己愛は、割り当てられた、真ではない、アイデンティティに一貫して従っていることに気付きました。
この結果は、LLMの行動が自己選好の傾向によって体系的に影響されるかどうかという疑問を提起する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:13:56 GMT)
Sharing quantum nonlocality and teleportation over long distance using optical hybrid states [0.3] その結果,光ハイブリッド状態は,大都市圏でClaus-Horne-Shimony-Holt(CHSH)ベルの不等式に反する偏光絡み状態を効率的に生成できることが示唆された。
さらに、未知偏光量子ビットの量子テレポーテーションにおける情報処理タスクにおける共有絡み状態の品質を評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:49:30 GMT)
Combining Knowledge Graphs and NLP to Analyze Instant Messaging Data in Criminal Investigations [0.3] 犯罪捜査は、WhatsAppのようなインスタントメッセージングアプリを通じて交換されたメッセージの分析に関係していることが多い。
本手法は,被疑者の携帯電話から収集したデータを意味的に豊かにすることで,知識グラフとNLPモデルを統合し,この分析を支援する。
私たちは、ユーザがデータに対する洞察を得るのに役立つ2つの異なるソリューションを採用しています。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:32:26 GMT)
Linguistic and Embedding-Based Profiling of Texts generated by Humans and Large Language Models [0.3] 人書きテキストや機械生成テキストを特徴付けるために,依存長や感情といった言語的特徴を計算した。
統計的分析により,人文テキストはより単純な構文構造とより多様な意味的内容を示す傾向があることが明らかとなった。
人文テキストと機械文テキストの両方がドメイン間のスタイリスティックな多様性を示しており、人文テキストは我々の特徴のより大きなバリエーションを示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:37:12 GMT)
Differentiable Autoencoding Neural Operator for Interpretable and Integrable Latent Space Modeling [0.2] 科学機械学習は、線形および非線形性低減技術を用いて、高次元フローデータから物理的洞察を抽出することを可能にする。
これらの進歩にもかかわらず、潜在空間における解釈性は依然として課題である。
本稿では, 物理的に解釈可能なラテント空間を構成するDIDIANiable Autoencoding Neural Operator (O)を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:57:52 GMT)
A Scalable AI Driven, IoT Integrated Cognitive Digital Twin for Multi-Modal Neuro-Oncological Prognostics and Tumor Kinetics Prediction using Enhanced Vision Transformer and XAI [0.2] 本稿では,ウェアラブル頭蓋骨からのリアルタイム脳波信号と構造MRIデータを組み合わせて,動的・パーソナライズされた腫瘍モニタリングを行う認知デジタルツインフレームワークを提案する。
94.6%の精度、93.2%のリコール、そしてDiceのスコア0.91の精度で、このフレームワークはリアルタイムで解釈可能な神経診断のための新しい標準となる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:37:32 GMT)
Nonparametric inference under shape constraints: past, present and future [0.2] 形状制約下での非パラメトリック推論の分野を調査し、歴史的概要と現状の展望を提供する。
展望といくつかのオープンな問題は、将来の方向性について考えを提示する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:16:00 GMT)
Fairness Testing in Retrieval-Augmented Generation: How Small Perturbations Reveal Bias in Small Language Models [0.2] 本研究は, 3つの小言語モデル(SLM)による感情分析における公平性を評価するために, 制御された人口変動を導入した変成試験(MT)による公平性テストを実施する。
その結果, 微少な人口変動が変成関係(MRs)の3分の1に分解できることが示唆された。
これらの失敗を詳細に分析すると、一貫したバイアス階層が示され、人種的手がかりを含む摂動が違反の主な原因となっている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:42:35 GMT)
MHINDR - a DSM5 based mental health diagnosis and recommendation framework using LLM [0.2] メンタルヘルスフォーラムは、心理的問題、ストレス、潜在的な解決策に関する貴重な洞察を提供する。
DSM-5基準と統合された大規模言語モデル(LLM)ベースのフレームワークであるMHINDRを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:26:38 GMT)
RoBiologyDataChoiceQA: A Romanian Dataset for improving Biology understanding of Large Language Models [0.2] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて大きな可能性を証明している。
本研究は,複数選択生物学の疑問に対するルーマニア語の新たなデータセットについて紹介する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:41:50 GMT)
Initial Distribution Sensitivity of Constrained Markov Decision Processes [0.1] CMDPの最適値が初期分布によってどのように変化するかを分析する。
このような境界は、初期分布の未知の変動により、与えられたポリシーの後悔を分析するためにどのように用いられるかを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:19:20 GMT)
The Lie Algebra of XY-mixer Topologies and Warm Starting QAOA for Constrained Optimization [0.1] XYミキサーは、変分量子アルゴリズムを含む現代の量子コンピューティングで広く利用されている。
我々は、様々な$XY$-mixer位相に付随する動的リー代数の明示的な分解を与える。
我々はこれらの概念をPortfolio Optimization, Sparsest $k$-Subgraph, Graphing で示す数値シミュレーションを行った。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:01:07 GMT)
VRWKV-Editor: Reducing quadratic complexity in transformer-based video editing [0.1] ビデオベース拡散モデルに線形時間アグリゲーションモジュールを統合する新しいビデオ編集モデルであるVRWKV-Editorを導入する。
VRWKV-Editorは、最先端の拡散ベースのビデオ編集方法と比較して最大3.7倍のスピードアップと60%のメモリ使用率を達成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:30:23 GMT)
Importance of localized dilatation and distensibility in identifying determinants of thoracic aortic aneurysm with neural operators [0.1] 胸部大動脈瘤(TAA)は,大動脈壁への機械的・機械的破壊から生じる。
ここでは、有限要素フレームワークを用いて、数百の異種侮辱から合成TAAを生成する。
局所的な拡張と拡張性の空間マップを構築し、ニューラルネットワークをトレーニングし、組み合わせた侮辱の開始を予測する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:34:59 GMT)
AutoLabs: Cognitive Multi-Agent Systems with Self-Correction for Autonomous Chemical Experimentation [0.1] AutoLabsは、自然言語命令を自動で実行可能なプロトコルに変換するように設計された、自己修正型マルチエージェントアーキテクチャである。
複雑化に関する5つのベンチマーク実験を特徴とする総合評価フレームワークを提案する。
以上の結果から,エージェント推論能力が成功の最も重要な要因であることが示唆された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:51:46 GMT)
On Deepfake Voice Detection -- It's All in the Presentation [0.1] 本稿では,現在のディープフェイクデータセットと研究手法が,現実のアプリケーションに一般化できなかったシステムにどのように寄与したかを明らかにする。
本研究では,データ作成・研究手法の新しい枠組みを提案し,現実のシナリオにおいてより効果的なスプーフィング対策の開発を可能にする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:19:51 GMT)
No Quantum Advantage in Decoded Quantum Interferometry for MaxCut [0.1] Decoded Quantum Interferometry (DQI)は、特別な種類の離散最適化問題を近似するためのフレームワークである。
DQI が非自明な保証を得た MaxCut のインスタンスは、古典的な時間で正確に解決可能であることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:00:05 GMT)
Influence of Platinum Thin Films on the Photophysical and Quantum Properties of Near-Surface NV Centers [0.1] ダイヤモンド中の窒素空孔(NV)中心は光学的に対応可能なスピン欠陥であり、ナノスケール量子センシングに大きな可能性がある。
本研究では, 異なるエネルギー (2.5-60 keV) の窒素で生成した浅いNVを含む白金被覆ダイヤモンド5試料について検討した。
プラチナ層近傍のNVアンサンブルでは,発光寿命が大幅に減少し,NV$-$の個体数が顕著に減少した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:08:46 GMT)
Branching Out: Broadening AI Measurement and Evaluation with Measurement Trees [0.1] 測定木は階層的な有向グラフを生成し、各ノードはその子をユーザ定義のアグリゲーションメソッドで要約する。
定義と例を示し、大規模な測定演習を通じて実用性を実証し、オープンソースのPythonコードを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:58:59 GMT)
Electrical Readout of Spin Environments in Diamond for Quantum Sensing [0.0] ダイヤモンド中の窒素空孔中心は、量子センシングと量子情報の鍵となるプラットフォームである。
ここでは、全電気的アプローチ、光電流二重電子共鳴(PC-DEER)を紹介する。
代用窒素(P1)とNVH中心のシグネチャを電気信号を用いて再現可能なコントラストで解決する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:33:03 GMT)
Reward driven discovery of the optimal microstructure representations with invariant variational autoencoders [0.0] 変分オートエンコーダ(VAE)はそのような低次元表現を構築する強力な手段を提供する。
VAEは試行錯誤や経験分析によって最適化されることが多い。
本研究では,潜在空間表現を評価するための報酬ベース戦略について検討した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:15:42 GMT)
Why is topology hard to learn? [0.0] 我々は、物理量の概念と、その機械学習近似を、物理学におけるニューラルネットワークの本来の応用という文脈で橋渡しする。
実空間位相不変量を正確に表現するハイブリッドテンソル-ニューラルネットワークオブジェクトを構築する。
我々の研究は、トポロジカル不変量学習の課題を強調し、凝縮物質物理学におけるより正確でより一般化可能な機械学習表現への一歩となる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:48:25 GMT)
Which Programming Language and Model Work Best With LLM-as-a-Judge For Code Retrieval? [0.0] より良いコード検索の利点は、新しい開発者のオンボードの高速化、ソフトウェアのメンテナンスの削減、大規模なリポジトリの理解の容易さである。
検索アルゴリズムと検索ベンチマークの改善にもかかわらず、コード検索の領域は遅れを取っている。
本研究では,Large Language Models (LLMs) を用いて,関数レベルでのコード検索と,コード検索結果のアノテーション生成を行う。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:31:36 GMT)
VietBinoculars: A Zero-Shot Approach for Detecting Vietnamese LLM-Generated Text [0.0] 本研究は、最適化された大域しきい値を持つ双眼鏡法の適応であるVietBinocularsを提案する。
我々はベトナムのAI生成データセットを構築し、VietBinocularsの最適しきい値を決定する。
その結果,VietBinocularsはF1スコアとAUCの2つの領域で99%以上を達成できた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:43:37 GMT)
Velocity effects slightly mitigating the quantumness degradation of an Unruh-DeWitt detector [0.0] 本研究では,加速量子系におけるウンルー効果による情報劣化に対する速度効果について検討する。
研究された量子システムは、加速された単一量子ビット、量子干渉回路、およびどのパス区別可能性回路である。
その結果, 加速検出器の非相対論的, 横運動, 一定運動の付加は, 高加速系における量子性の保護的役割を担っていることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:01:24 GMT)
Using Images from a Video Game to Improve the Detection of Truck Axles [0.0] 本稿では,コンピュータゲームから抽出した画像がCNNの訓練に有効であるかどうかを判断し,実生活におけるトラックの車軸を検出することを目的とする。
実生活と合成トラックを備えた3つの異なるデータベースが作成され、トレーニングとテストの例が提供された。
その結果、合成画像はニューラルネットワークのトレーニングに利用でき、知識を抽出するための信頼性と低コストなデータソースを提供することがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:28:14 GMT)
Using GPT to build a Project Management assistant for Jira environments [0.0] 我々は,プロジェクトマネージャが大量のデータを扱うプロセスを容易にするために,GPT大言語モデルを使用するソフトウェアであるJiraGPT Nextを紹介する。
これは、最も人気のあるProject Managementツールの1つであるJiraのアドオンとして考えられ、情報を取得するための自然言語インターフェースを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:42:56 GMT)
Unsupervised Detection of Spatiotemporal Anomalies in PMU Data Using Transformer-Based BiGAN [0.0] T-BiGANは、双方向生成逆数ネットワーク(BiGAN)内でウィンドウアテンション変換を行うフレームワークである。
エンコーダデコーダはアーキテクチャをキャプチャし、識別器はサイクル整合性を適用して遅延空間を真のデータ分布と整合させる。
異常は、再構成誤差、潜時空間ドリフト、判別器の信頼性を組み合わせた適応スコアを用いてリアルタイムでフラグ付けされる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:16:35 GMT)
Universal dissipators for driven open quantum systems and the correction to linear response [0.0] 還元系の力学を特徴付ける散逸器は2つの部分から構成されていることを示す。
ひとつは普遍的であり、駆動項に関係なく同じ形式を保っていることを意味する。
リンドブラッド形式は記憶のない風呂のために回収される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:23:22 GMT)
Unified exact WKB framework for resonance -- Zel'dovich/complex-scaling regularization and rigged Hilbert space [0.0] 我々は、正確なWKB法を用いて量子力学的共鳴を解析するための統一的なフレームワークを開発する。
非摂動的定式化は、ツェルドヴィチ正則化、複素スケーリング法、およびリップされたヒルベルト空間を組み込むために働く。
この結果は、不安定な量子系における正確な WKB 法の非摂動精度を具体的に示すものである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:41:29 GMT)
Tuning the Tuner: Introducing Hyperparameter Optimization for Auto-Tuning [0.0] 制限されたハイパーパラメータチューニングでも,平均94.8%のオートチューニング性能が向上することを示す。
ハイパーパラメータ自体がメタストラテジーで効率的に最適化できることを実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:14:01 GMT)
Topology of the Aharonov-Bohm effect in different reference frames [0.0] 異なる慣性参照フレームにおけるAB効果の磁気的および電気的バージョンについて検討する。
磁気束がAB位相差に負の寄与を持つ磁気AB効果の参照フレームを求める。
また、電気的流束がAB位相差に無寄与する電気的AB効果の参照フレームも見いだす。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:07:37 GMT)
Think Less, Label Better: Multi-Stage Domain-Grounded Synthetic Data Generation for Fine-Tuning Large Language Models in Telecommunications [0.0] 本稿では、構造化ドメイン知識に基づく合成質問応答対を生成するための探索拡張パイプラインを提案する。
我々のフレームワークは、検索器、ベースジェネレータ、精製モデルを統合して、QAペアを合成し、拡張する。
我々は,無線アクセスネットワーク(RAN)のトラブルシューティングに着目した実世界の通信シナリオにおいて,我々のアプローチを実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:49:57 GMT)
Thin Bridges for Drug Text Alignment: Lightweight Contrastive Learning for Target Specific Drug Retrieval [0.0] 薄いコントラストブリッジと 軽量プロジェクションヘッド 凍結した ユニモーダルエンコーダは 完全なマルチモーダルモデルを訓練せずに 化学とテキストの表現を調整できる
以上の結果から,スキャフォールドを意識した薬物テキストアライメントと,精度の高い医療における特異的検索が可能な,大規模マルチモーダルプレトレーニングに代わる計算効率のよい橋であることが示唆された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:14:28 GMT)
The Guided Local Hamiltonian Problem for Stoquastic Hamiltonians [0.0] 確率的ハミルトニアンに対するガイド付き局所ハミルトニアン問題は(プロミーズ) BPP-ハードであることを示す。
局所ハミルトニアン族では、この問題は(確率的に)BQP-ハードであるが、確率ハミルトニアンにとっては、その複雑さは以前不明である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:11:26 GMT)
The Complexity of Local Stoquastic Hamiltonians on 2D Lattices [0.0] 2次元正方格子上の2-局所確率ハミルトン問題は、StoqMA完全であることを示す。
我々の主な貢献は、StoqMA回路を空間的に疎結合にでき、幾何学的、確率的保存的、摂動的ガジェットを構築できることである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:38:29 GMT)
The ALF (Algorithms for Lattice Fermions) project release 2.4. Documentation for the auxiliary-field quantum Monte Carlo code [0.0] 格子フェルミオンのアルゴリズムは、有限温度および射影補助場量子モンテカルロアルゴリズムの一般的なコードを提供する。
コードは、シングルボディ演算子の和で記述できるモデルをシミュレートできるように設計されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:27:21 GMT)
Teaching AI to Handle Exceptions: Supervised Fine-Tuning with Human-Aligned Judgment [0.0] 大規模言語モデル(LLM)はエージェントAIシステムへと進化している。
推論に優れるLCMでさえ、政策に厳格に従うため、人間の判断から大きく逸脱していることを示す。
次に、例外を処理するためにAIエージェントをチューニングするための3つのアプローチを評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:23:12 GMT)
Symmetric quantum walks on Hamming graphs and their limit distributions [0.0] ハミンググラフ上の対称量子ウォークのクラスを研究する。
ウォークのユニタリ作用素の固有値は、ある自己相互の零値である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:36:34 GMT)
Surrogate models for diffusion on graphs via sparse polynomials [0.0] コミュニティ構造を持つグラフ上のパラメトリック拡散方程式に対するスパースベースサロゲートモデルを提供する。
我々の理論的な発見には、合成グラフと実世界のグラフの両方で行われた一連の数値実験が伴っている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:12:53 GMT)
Suppressing leakage and maintaining robustness in transmon qubits: Signatures of a trade-off relation [0.0] より大きいヒルベルト空間に埋め込まれた論理部分空間における量子ゲートを最適に生成する問題について検討する。
我々は、摂動に対する堅牢性の尺度として、計算部分空間の忠実性感受性を導出し、その部分空間からの漏洩を定量化するコスト関数を定義する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:38:25 GMT)
Structure-preserving numerical calculation of wave equation for a vector field [0.0] 本稿では,制約を離散レベルで保存する構造保存スキームを用いた離散方程式を提案する。
構造保存方式を用いて得られた結果を示し、より正確で安定した数値解を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:45:58 GMT)
Structural Refinement of Bayesian Networks for Efficient Model Parameterisation [0.0] 本稿では, 条件付き確率表を効率的に近似するために, 実際に使用できる様々な構造改善手法のレビューを行う。
本研究では,ベイジアンネットワークモデルを用いた心血管リスク評価モデルを用いて,各手法の評価を行った。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:39:48 GMT)
Stealing AI Model Weights Through Covert Communication Channels [0.0] 本稿では,AIハードウェアアクセラレーターを搭載した無線機器を対象とした新たな攻撃手法を提案する。
第1フェーズでは、被害者のデバイスはハードウェアのトロイの木馬によって妥協される。
第2フェーズでは、敵は近くの無線デバイスを使用して被害者の送信フレームを傍受する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:21:41 GMT)
Shadows and subsystems of generalized probabilistic theories: when tomographic incompleteness is not a loophole for contextuality proofs [0.0] 非コンテクスト性の失敗の証明は、トモグラフィー完全性の失敗の非常に幅広いクラスに対して堅牢であることを示す。
また、GPTフラグメントの影の概念を導入し、その状態や効果が無意識に互いにトモグラフィーされていないときに失われた情報をキャプチャする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:26:41 GMT)
Secure coding for web applications: Frameworks, challenges, and the role of LLMs [0.0] セキュアなコーディングは、ソフトウェア開発において批判的ですが、見落とされがちなプラクティスです。
広く意識された努力にもかかわらず、組織的、教育的、技術的障壁のため、現実世界の採用は相容れないままである。
本稿では、研究者、開発者、教育者に対して、セキュアなコーディングを現実世界の開発プロセスに統合する実践的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:54:50 GMT)
Saturation of Quantum Cramer-Rao Bounds for Distributed Sensing via Error Sensitivity in SU(1,1)-SU(m) Interferometry [0.0] 1つの出力ポートでの誤差感度測定が量子クレーマー・ラオ境界(QCRB)を飽和またはほぼ飽和させることを示す。
本稿では,1つの出力ポートにおける誤差感度測定がQCRBを飽和あるいはほぼ飽和させることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:11:43 GMT)
SOCK: A Benchmark for Measuring Self-Replication in Large Language Models [0.0] SOCKは、人間の介入なしに自己複製する大規模言語モデル(LLM)の能力を測定するベンチマークである。
我々は,広い自己複製能力に基づいてLSMを分類するシステムを開発した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 01:27:46 GMT)
Rethinking Diffusion Model in High Dimension [0.0] 拡散モデルは、基礎となる確率分布の統計量を学ぶことができると仮定する。
しかし、これが本当にうまくいくのか?
ほとんどの推論メソッドは単純なフレームワークで統一できる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:26:24 GMT)
Refine Drugs, Don't Complete Them: Uniform-Source Discrete Flows for Fragment-Based Drug Discovery [0.0] InVirtuoGenは,de novo と fragment-constrained 生成のための断片化SMILESの離散フロー生成モデルである。
本稿では,遺伝的アルゴリズムと遺伝的特性最適化の微調整戦略を組み合わせたハイブリッド手法を提案する。
提案手法は,タスク全体にわたるトップ10のAUCによって測定された,実用的分子最適化ベンチマークの最先端を新たに設定する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:34:53 GMT)
Reasoning-Aware Prompt Orchestration: A Foundation Model for Multi-Agent Language Model Coordination [0.0] 複数の特殊エージェント間の推論を強化する動的プロンプトオーケストレーションのための理論的基盤となるフレームワークを提案する。
このフレームワークは,エージェント移行時の論理的一貫性の維持,推論対応の迅速な適応,分散推論のスケーラブルな調整,という3つの課題に対処する。
1000件の合成マルチエージェント会話実験の結果,推論遅延の42%低減,ROUGE-Lスコアによる論理的整合性の23%改善,文脈損失のないタスク完了の89%の成功率が確認された。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:33:01 GMT)
Real-time Noise Detection and Classification in Single-Channel EEG: A Lightweight Machine Learning Approach for EMG, White Noise, and EOG Artifacts [0.0] 単一チャネル脳波における眼球,筋 (EMG) , ホワイトノイズアーティファクトのリアルタイム検出と分類のためのハイブリッドスペクトル時間フレームワークを提案する。
30秒のトレーニング時間(CNNよりも97%高速)とSNRレベルの堅牢なパフォーマンスにより、このフレームワークは臨床応用性と計算効率のギャップを埋める。
この研究は、脳波アーチファクト検出のためのモデル深さへのユビキタスな依存にも挑戦し、ドメインインフォームド機能融合が複雑なアーキテクチャをノイズの多いシナリオで超越していることを示します。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:32:38 GMT)
Quantum Zeno Dynamics of Two Interacting Particles [0.0] 量子ゼノダイナミクスによれば、量子系の進化は、頻繁な測定によってヒルベルト空間の部分空間に制限することができる。
1次元空間領域における2つのイオンを持つ玩具モデルを考える。
この2体量子系の進化をシミュレートすることにより、イオンを所望の信頼レベルで初期閉じ込め領域内に保持するために必要な測定周波数を推定する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:33:19 GMT)
Quantum Simulation of Random Unitaries from Clebsch-Gordan Transforms [0.0] 任意のコンパクト群に対するハール乱ユニタリの$t$コピーの作用をシミュレートする一般的な方法を提案する。
概念的には単純で正確であり、クレブシュ・ゴルダン変換を主構成要素として利用する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:57:08 GMT)
Quantum Optics and Quantum Electrodynamics of Strong Field Processes [0.0] 当初、強いレーザー・マター相互作用の物理学は多光子過程の物理学であった。
チャープパルス増幅の出現により、超高強度、超短パルス、コヒーレントレーザーパルスの発生が可能となった。
超高速レーザー物理学は、量子電磁力学と量子光学を再導入することなく、光-物質相互作用の記述を継続することができるか?
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:49:09 GMT)
Quantitative Evaluation of KIRETT Wearable Demonstrator for Rescue Operations [0.0] 救助サービスは、必要な患者に対して、迅速で信頼性の高い治療を提供する必要がある。
治療レコメンデーション、リアルタイムバイタルモニタリング、人工知能(AI)による状況検出といった最新の技術の助けを借りて、状況を分析し、支援することができる。
KIRETTでは、そのようなシナリオをサポートするウェアラブルデバイスが開発され、救助サービスにおける治療勧告を提供する方法が提示されている。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:21:09 GMT)
Quadratic Programming Approach for Nash Equilibrium Computation in Multiplayer Imperfect-Information Games [0.0] 本稿では,非線形近似に基づく2次制約付きプログラムを解くマルチプレイヤー不完全情報ゲームにおける近似手法を提案する。
また,マルチプレイヤー戦略型ゲームにおけるナッシュ均衡の計算手法も提案した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 00:28:21 GMT)
QSearchNet: A Quantum Walk Search Framework for Link Prediction [0.0] リンク予測はグラフ理論における基本的な問題の1つである。
量子コンピューティングは、重畳を同時マルチパス探索に活用することで、強力な代替手段を提供する。
QSearchNetは、トポロジを意識した量子進化をシミュレートし、複数のノードにわたる振幅を同時に伝播する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:32:34 GMT)
QFrBLiMP: a Quebec-French Benchmark of Linguistic Minimal Pairs [0.0] ケベック・フレンチ言語最小ペアベンチマーク(QFrBLiMP)について紹介する。
QFrBLiMPは、20の言語現象に注釈を付けた1,761個の最小ペアから構成される。
QFrBLiMPとMultiBLiMP-Frについて,各カテゴリの最小ペアの文に割り当てられる高い確率を観察することにより,異なるLLMを評価する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:00:26 GMT)
Progress in the study of the (non)existence of genuinely unextendible product bases [0.0] 真に拡張不可能な製品基盤(GUPB)の存在に関するオープン問題について検討する。
このアプローチを用いて、3量子系において13の大きさの GUPB が存在しないことを確かめる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:55:27 GMT)
Probeless vs Probe-Based Variable-Strength Eavesdropping in Quantum Key Distribution [0.0] 量子鍵分布(QKD)は秘密鍵を生成するための確実な方法である。
我々は,eavesdropperの可変強度測定がQKDに及ぼす影響を解析した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:32:43 GMT)
Polynomials and asymptotic constants in a resurgent problem from 't Hooft [0.0] G(z)=sum_n>0sqrtnzn$ for $|z|1$ が与えられたとき、分岐カット $zin[1,infty)$ を除いて、その解析的連続性は $|z|ge1$ である。
解は両側収束和 $Gz)=frac12sqrtpisum_ninmathbb Z (2npirm i-qrlog(z))/2-3$ で与えられる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:12:31 GMT)
Physically-Motivated Guiding States for Local Hamiltonians [0.0] 我々は量子化学とハミルトンの部分集合状態に動機づけられた状態に焦点を当てる。
従来のトラクタビリティを維持しながら、より広い州家族が硬さを保っていることを実証する。
本研究は, 地盤状態推定問題に対する景観の複雑さをさらに高め, 実験的な環境設定に向けたステップを提示する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:47:13 GMT)
Perturbation theory, irrep truncations, and state preparation methods for quantum simulations of SU(3) lattice gauge theory [0.0] 量子ハードウェア上でのSU(3)$格子ゲージ理論の近似基底状態の効率的な調製法について検討する。
地中準備のための簡易なアンザッツ回路を開発し, 格子上での古典的シミュレーションにより検証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 07:01:26 GMT)
Perspectives on Large Language Models: Polysemy, Stochasticity, Exponential Expressibility, and Unitary Attention [0.0] 本稿では,Large Language Models(LLM)の基礎的側面について考察する。
擬直交ベクトルを用いて空間次元の埋め込みによって意味的特徴の表現がどのように指数関数的にスケールするかを分析する。
古典的機構のユニタリ拡張として量子アテンションを提案し,LLM処理をヒルベルト空間における可逆的量子様進化として再フレーミングする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:26:10 GMT)
Performance of the empirical median for location estimation in heteroscedastic settings [0.0] 我々は、共通だが未知の位置パラメータを共有する独立対称実数値確率変数について考察する。
我々は、その推定誤差に基づいて、非漸近的上界と下界のマッチングを導出する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:58:34 GMT)
Passive detection of Schwinger boson dynamics via a qubit [0.0] 本稿では,トランスモン量子ビットがマイクロ波クロス共振器に容量的に結合する集積フォトニックデバイスを提案する。
このスキームでは、トランモン量子ビットは制御素子と受動検出器の両方として二重の役割を果たす。
本研究では,トランスモンとクロス共振器の結合強度と位相を調整することにより,相互作用のダイナミクスを選択的に制御できることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:00:02 GMT)
Pancharatnam phase as an entanglement witness for quantum gravity in dual Stern-Gerlach interferometers [0.0] 絡み合いは量子力学の基礎的なテストと実践的な応用において中心的な役割を果たす。
スピン・ワン・ハーフStern-Gerlach干渉計を2つのスピン・ワン・ハーフStern-Gerlach干渉計で研究し、パンチャラトナム相が半古典的と量子重力を区別するツールであることを示した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:23:48 GMT)
Optimizing Indoor Environmental Quality in Smart Buildings Using Deep Learning [0.0] 本稿では,IEQパラメータ,特にCO2濃度,温度,湿度を積極的に管理する深層学習型手法を提案する。
我々は,Long Short-Term Memory (LSTM), Gated Recurrent Units (GRU), and a hybrid Convolutional Neural Network LSTM (CNN-LSTM) の3つのアーキテクチャをベンチマークした。
以上の結果から,GRUは計算オーバーヘッドを低く抑えるとともに,CNN-LSTMは拡張予測ウィンドウの主機能抽出に優れることがわかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:42:34 GMT)
On the Complexity of the Succinct State Local Hamiltonian Problem [0.0] Succinct State 3-Local Hamiltonian problem is (promise) MA-complete。
我々の証明は、簡潔な量子状態の体系的特徴付けと、元のMA硬さ低減の修正によって進行する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:55:36 GMT)
On a discrete version of the position-momentum commutation relation [0.0] 十分な次元のヒルベルト空間によって記述されたキューディットの場合、位置-運動量交換関係の離散バージョンが存在する。
連続パラメータとある種の離散コヒーレント状態に依存する離散変数ガウス状態の族を含むことを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:13:46 GMT)
On Computing Top-$k$ Simple Shortest Paths from a Single Source [0.0] 重み付きダイグラフにおける最上位$kの単純な最短経路の計算問題について検討する。
我々は,本アルゴリズムが実行時間において,後者のベースラインよりも連続的に,著しく優れていることを示す。
これらの結果は,1つのソースからの単純な最短経路を$k$で計算するソリューションとして,我々の新しいアルゴリズムを確立している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:12:05 GMT)
Nondestructive characterization of laser-cooled atoms using machine learning [0.0] レーザ冷却したカリウム39原子の磁気光学トラップにおける物理特性を推定する機械学習技術を開発した。
蛍光原子アンサンブルのその場撮影画像は、ミリスケールの物体の空間構造を直接明らかにしている。
蛍光画像のみから原子数と温度を予測するために訓練されたモデルについて述べる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:26:42 GMT)
Non-equilibrium Dynamics of Two-level Systems directly after Cryogenic Alternating Bias [0.0] 2レベルシステム(TLS)は、電気的に量子ビット、共振器、振動モードと結合するアモルファス材料で一般的に見られるトンネル状態である。
近年の研究では、大きな交流電場を適用すると酸化物の構造が変化し、量子ビットと共振器の性能が向上する可能性が示唆されている。
低温における交互バイアスがアモルファス酸化物パラレルプレートコンデンサ内のTLSダイナミクスに及ぼす影響を調べた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:59:49 GMT)
Non-coherent evolution of closed weakly interacting system leads to equidistribution of probabilities of microstates [0.0] 弱い相互作用を持つ系に対して、このような進化はマルコフ過程であることを示す。
時間可逆なユニタリ進化を時間可逆な進化に変換するメカニズムは非コヒーレンスである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:37:09 GMT)
Non-Hermitian comb effect in coupled clean and quasiperiodic chains [0.0] 鎖間ホッピングにより一様鎖または清浄鎖に結合した非エルミート準周期鎖系の局在特性について検討した。
弱い鎖間結合の極限において、そのような結合系は非ハーミティシティパラメータの増加とともに非局在化から中間相への遷移を示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:53:55 GMT)
Non-Gaussian Quantum State Engineering with Postselected von Neumann Measurements [0.0] 我々は,非ガウス状態(nG)をポストセレクトされたフォン・ノイマン測定により生成するための実現可能なプロトコルを提案する。
ウィグナー関数による非ガウス性の特徴付けと線形エントロピーと共起を用いた絡み合いの定量化を行う。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:02:33 GMT)
Neutrino backgrounds in matter-wave interferometry: implications for dark matter searches and beyond-Standard Model physics [0.0] 本稿では, ニュートリノ誘起脱コヒーレンスの理論解析を行った。
本研究は,ニュートリノ相互作用物理の観点から物質-波干渉測定を解釈するための枠組みを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:16:02 GMT)
Neural Network Characterization and Entropy Regulated Data Balancing through Principal Component Analysis [0.0] 本稿では, 主成分分析(PCA)の幾何学的構造について, 回転しないMNIST桁と回転したMNIST桁の分布を詳細に検討する。
厳密な幾何学的特徴を持つ桁は原点から離れた制限された領域にマッピングされるため、低次PCA空間の広さ、拡散度、重複度にマッピングされる桁よりも精度の高いニューラルネットワークによって予測される。
これらの結果により, 局所PCAエントロピーは, 低次主成分の空間領域をヒストグラムビンに分割し, 各入力クラスの出現数に関連するエントロピーを評価することにより得られる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:44:32 GMT)
Navigating the Synchrony-Stability Frontier in Adaptive Chatbots [0.0] コア設計の緊張を明示する計算評価フレームワークを提案する。
人間のログデータセットに対する明示的な適応ポリシーをシミュレートし比較する。
限定されたポリシーは、同期に控えめなコストで、安定性の大幅な向上を実現している。
我々は、フロンティアポリシーが命令のチャーンを減らし、ジャリングレジスタのフリップを減らしたことを示す「素早い正当性」を定量化する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:50:30 GMT)
Multi-temporal crack segmentation in concrete structures using deep learning approaches [0.0] ひび割れはコンクリート構造物の劣化の最も初期の指標である。
本研究では, ひび割れのセグメンテーションにマルチテンポラルデータを活用することにより, セグメンテーションの品質を高めることができるか検討する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:50:41 GMT)
Model Discovery and Graph Simulation: A Lightweight Gateway to Chaos Engineering [0.0] カオスエンジニアリングはレジリエンスのリスクを明らかにしますが、広く頻繁に実行するには高価で運用上のリスクがあります。
我々は、単純な接続のみのトポロジモデルにより、フェールストップフォールトの下で、高速で低リスクなアベイラビリティー推定を行うことができると主張している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:34:13 GMT)
LiDAR Point Cloud Colourisation Using Multi-Camera Fusion and Low-Light Image Enhancement [0.0] 本研究では,複数のカメラ入力を用いてメカニカルLiDARから色付き点雲を生成する,ハードウェアに依存しない新しい手法を提案する。
主なイノベーションは、低照度条件下での堅牢性であり、低照度画像拡張モジュールの統合によって達成される。
このアルゴリズムは、Velodyne Puck Hi-Res LiDARと4カメラ構成を用いてテストされた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:56:11 GMT)
Leveraging AI modelling for FDS with Simvue: monitor and optimise for more sustainable simulations [0.0] 本研究では,最先端CFDソフトウェアよりも高速な熱伝搬順序のダイナミクスを予測できるカスタム機械学習サロゲートモデルの有効性を示す。
また、目標を達成するのに必要なシミュレーション数を減らし、最適化手順を導出する方法を実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:57:38 GMT)
LLM-Assisted Emergency Triage Benchmark: Bridging Hospital-Rich and MCI-Like Field Simulation [0.0] 劣化予測のためのLCM支援緊急トリアージベンチマークをオープンに導入する。
i)バイタル、実験室、ノート、主要な苦情、構造化された観察を伴う病院に富んだ設定、(ii)バイタル、観察、ノートに限定されたMCIライクなフィールドシミュレーションである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:54:58 GMT)
LLM Based Sentiment Classification From Bangladesh E-Commerce Reviews [0.0] 本稿では,バングラデシュのeコマースレビューの感情分析にトランスフォーマーを用いたBERTモデルの有効性について検討する。
バングラのオリジナルデータセットから4000サンプルのサブセットと、イングランドの顧客レビューを使用してモデルを微調整した。
微調整のLlama-3.1-8Bモデルは、全体的な精度、精度、リコール、F1スコア95.5%、93%、88%、90%で他の微調整モデルより優れていた。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:46:09 GMT)
LLM Agents for Knowledge Discovery in Atomic Layer Processing [0.0] 大規模言語モデル(LLM)は、ここ数年、大きな注目を集めてきた。
本研究では,材料科学における知識発見のためのエージェントの可能性を検証する。
子どもたちのパーラーゲームを通じて,このアプローチの概念実証を行う。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:01:44 GMT)
KIRETT: Smart Integration of Vital Signs Data for Intelligent Decision Support in Rescue Scenarios [0.0] KIRETTプロジェクトは、救助活動のための手首を編んだウェアラブルに、治療勧告と状況検出を提供する。
本研究の目的は、救助活動における意思決定改善における重要なサインの意義を示し、必要な医療従事者や患者への影響を示すことである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:20:42 GMT)
Ingress Cryogenic Receivers Toward Scalable Quantum Information Processing: Theory and System Analysis [0.0] 同軸ケーブルによる低温冷却量子ビットの電流制御技術を実現した。
多重化全受動極低温直接検出プラットフォーム(cryo-HFDD)を提案する。
4Kの多重フォトニック受信機は数千量子ビットの制御を積極的にスケールできることを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:29:58 GMT)
Hyperparameters are all you need: Using five-step inference for an original diffusion model to generate images comparable to the latest distillation model [0.0] 拡散モデルは、ニューラルネットワークを反復的に適用することによって画像を生成する最先端の生成モデルである。
本研究では,拡散ODEとSDEのトラクション誤差の解析に基づいて,高品質な512 x 512と1024 x 1024の画像を8ステップで生成する学習自由度アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:27:09 GMT)
Hybrid Schemes of NIST Post-Quantum Cryptography Standard Algorithms and Quantum Key Distribution for Key Exchange and Digital Signature [0.0] 本研究では,NIST(National Institute of Standards and Technology)標準化PQCアルゴリズムとQKDを統合するハイブリッドスキームを提案する。
ハイブリッド鍵交換プロトコルでは,モジュール格子を用いたキーカプセル化機構(ML-KEM)とQKDプロトコル(特にBB84とE91)を組み合わせる。
ハイブリッドデジタル署名方式の設計において,モジュール格子型デジタル署名アルゴリズム(ML-DSA)とステートレスハッシュ型デジタル署名アルゴリズム(SLH-DSA)を用いて署名再構成値を生成する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 05:14:34 GMT)
Geometric Learning of Canonical Parameterizations of $2D$-curves [0.0] 対称性を学ぶニューラルネットワークを構築する一般的な方法は、データ拡張を使用することである。
主繊維束の断面の概念に基づいて対称性を変調する別の方法を提案する。
このフレームワークは、対称群の下での物体の軌道間の相同性を測定するために、オブジェクトの空間上の単純な測度を使用することができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:45:10 GMT)
Generally covariant geometric momentum and geometric potential for a Dirac fermion on a two-dimensional hypersurface [0.0] 2次元超曲面上で制約されたディラックフェルミオンに対する幾何運動量の導出を行う。
曲率によって引き起こされる幾何学的ポテンシャルは、擬球面やヘリカル面に生じない。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 02:50:43 GMT)
Fundamental limits to contrast reversal of self-fidelity correlations [0.0] 測定設計においては、アンチコントラストのリードアウトを設計することが一般的である。
広義の入力アンサンブルに対して2つの進化を均一に反対にできるかどうかを問う。
我々は、ピアソン相関係数を、2つの進化の間の大域的対立のデバイスに依存しない尺度として採用する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:07:28 GMT)
From customer to product: design tools for the visually impaired [0.0] 新しい環境や未知の環境でのナビゲーションは、特に視覚障害者にとって不可欠である。
本稿では、視覚障害者がデザインに参加することができる7つのツールについて検討し、体系的なレビューを通じて選択し、親和性、相違性、アプリケーションについて分析する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 15:18:31 GMT)
Flow Autoencoders are Effective Protein Tokenizers [0.0] 本稿では,タンパク質構造のトークン化と生成のためのフローベーストークン化ツールであるKanziを紹介する。
Kanziは、フローマッチング損失でトレーニングされた拡散オートエンコーダで構成される。
これらの変化は、既存のトークン化器よりも優れたパラメータ効率モデルの訓練を安定化させることが判明した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 23:29:39 GMT)
Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation [0.0] 因果推論は通常、個々のレベルのデータへの集中的なアクセスを仮定する。
本稿では,フェデレートラーニング(FL)手法を用いて,分散化された観測データから平均処理効果(ATE)を推定することにより,この問題に対処する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:10:23 GMT)
Fast Likelihood-Free Parameter Estimation for Lévy Processes [0.0] 本稿では,ニューラルベイズ推定フレームワークを用いたL'evyパラメータ推定の高速かつ高精度な手法を提案する。
NBEは, 緩やかな条件下でベイズ推定器に収束する一貫した推定器となることを示す。
提案されたアプローチでは、パラメーターを見積もるのに1分もかからない。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:15:34 GMT)
Evaluating the Use of Large Language Models as Synthetic Social Agents in Social Science Research [0.0] 大規模言語モデル(LLM)は、社会科学における合成エージェントとしてますます使われてきている。
本稿では,LLM出力の解釈において考慮すべき注意点について概説する。
実用的なガードレールを導入し、研究者はカテゴリエラーを避けながら、有用なプロトタイピングや予測を行うことができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 10:53:54 GMT)
Enabling full localization of qubits and gates with a multi-mode coupler [0.0] チューナブルカプラは超伝導量子プロセッサの鍵となる構成要素である。
励起多様体間の相互作用を非線形に制御できる多モードチューナブルカプラを提案する。
提案した設計は、キュービット間の完全局所化も実現し、疎結合点における完全孤立を実現する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:13:47 GMT)
Electron neural closure for turbulent magnetosheath simulations: energy channels [0.0] 完全畳み込みニューラルネットワーク(FCNN)を用いた非局所5モーメント電子圧テンソル閉鎖法を提案する。
このモデルは、崩壊する磁気シース乱流の完全運動エネルギー保存半単純粒子インセルシミュレーションのための代理モデルの開発に使用される。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 21:00:50 GMT)
Effects of Markovian noise and cavity disorders on the entanglement dynamics of double Jaynes-Cummings models [0.0] 絡み合った量子ビットのような古典的でない状態を準備し、操作する能力は、量子情報処理、通信、計算の発展に不可欠である。
光-物質相互作用を研究するための理論的枠組みである二重Jaynes-Cummingsモデルの力学について検討する。
マルコフノイズとスタティック(ガラス)キャビティ障害の影響をモデルとして検討し,これらの欠陥が絡み合いのダイナミクスに与える影響を明らかにすることを目的とした。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:09:20 GMT)
EVO-LRP: Evolutionary Optimization of LRP for Interpretable Model Explanations [0.0] 説明可能なAI(XAI)メソッドは、どの画像領域がモデルの予測に影響を与えるかを特定するのに役立つが、ディテールと解釈可能性の間のトレードオフに直面していることが多い。
本稿では,CMA-ES(Co Matrix Adaptation Evolution Strategy)を用いて,量的解釈可能性指標に基づくLRPハイパーパラメータのチューニングを行う手法であるEVO-LRPを紹介する。
EVO-LRPは、解釈可能性メトリックのパフォーマンスと視覚的コヒーレンスの両方において従来のXAIアプローチより優れており、クラス固有の特徴に対して強い感度を持つ。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 17:40:39 GMT)
Digital Domination: A Case for Republican Liberty in Artificial Intelligence [0.0] 人工知能は、予測不可能な方法で社会と政治の生活に革命をもたらす。
この記事では、人工知能が共和制における自由の概念にいかに大きな脅威をもたらすかを取り上げる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:09:34 GMT)
Deterministic single-photon source over the terahertz regime [0.0] テラヘルツ(THz)系において,コヒーレント光パルスの列によって引き起こされる決定論的単一光子源を提案する。
本稿では,高効率,純度,不明瞭性を両立させるとともに,THz帯での発光周波数の調整が容易なキャビティ設計を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:31:01 GMT)
Defect mediated quantum melting of charge ordered insulators [0.0] We show that the allowed topological order phases which are proximate to the Wigner-Mott insulators strongly depending the charge ordering in the WMI。
WMIのトポロジ的欠陥の増大の観点から、WMIの量子融解遷移と近位QCLについて述べる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:00:00 GMT)
DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation [0.0] 現在の検索技術は、標準的なRAGクエリドキュメントアプリケーションに限られている。
本稿では,必要なAPIを予測するためのコードとインデックスを拡張する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:23:27 GMT)
Decoding the Gender Gap: Addressing Gender Stereotypes and Psychological Barriers to Empower Women in Technology [0.0] この記事は、このギャップに影響を及ぼす心理的・社会的障壁と、それを減らすために設計された介入について考察する。
構造化されたレビューを用いて、家族や学校における初期のジェンダーステレオタイプの役割に関する証拠を収集した。
この記事は、実践的および研究的な意味を概説し、パイロット学際的イニシアチブとしてNEURONプロジェクトを紹介している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:43:10 GMT)
Data Quality Taxonomy for Data Monetization [0.0] この章では、データ収益化の文脈でデータ品質を評価するための包括的な分類法を提示します。
フレームワークの相互接続された"メトリクス層"は、ひとつの次元のカスケードの改善を他のものに保証し、戦略的影響を最大化します。
この全体論的アプローチは、粒度の技術的な評価と高いレベルの意思決定のギャップを埋める。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:42:02 GMT)
Continuum Fractons: Quantization and the Many Body Problem [0.0] 非相対論的、双極子保存フラクトンに対する連続量子力学を定式化する。
固有状態と波束の時間的進化の両方においてフラクトン誘引子の量子アナログの証拠を見いだす。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 18:00:03 GMT)
Computable measures of non-Markovianity for Gaussian free fermion systems [0.0] 自由フェルミオン力学により支配される開量子系における非マルコビアン性の測定について検討する。
ガウス状態の場合、トレースベースの距離(特にヒルベルト・シュミットノルム)と2階ルネニイ相互情報は効率的に表現できる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:47:20 GMT)
Comparative Analysis of Ant Colony Optimization and Google OR-Tools for Solving the Open Capacitated Vehicle Routing Problem in Logistics [0.0] Open Capacitated Vehicle Routing Problem (OCVRP)は、地理的に分散した顧客に最適な配送ルートを見つけることを扱う。
本研究は,OCVRPソリューションのアルゴリズムとして,自然に着想を得たメタヒューリスティックであるAnt Colony Optimization (ACO)と,業界標準の最適化ツールキットであるGoogle OR-Toolsの2つを比較した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:18:14 GMT)
Coherence restoring in communication line via controlled interaction with environment [0.0] 本稿では, 線形鎖と環境との相互作用を制御した状態復元プロトコルについて考察する。
最良の復元結果は対称なリンドブラッド方程式に対応することを示す。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:56:57 GMT)
Classical feature map surrogates and metrics for quantum control landscapes [0.0] 変動量子回路を一般化するパラメタライズド量子力学の3つの特徴写像を導出し,解析する。
リー・フーリエ表現は、ハミルトンの性質を反映する離散ピークを持つ密度スペクトルを持つが、一般的に見られる対称系では圧縮可能である。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:24:13 GMT)
Board Gender Diversity and Carbon Emissions Performance: Insights from Panel Regressions, Machine Learning and Explainable AI [0.0] 本研究は、ボードジェンダー多様性(BGD)が企業の炭素排出特性(CEP)に及ぼす影響について検討する。
パネル回帰と高度な機械学習アルゴリズムを用いて、分析は重要な非線形関係を明らかにする。
結果は、学者、企業、規制当局に影響を及ぼす。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:16:56 GMT)
Bias-Aware AI Chatbot for Engineering Advising at the University of Maryland A. James Clark School of Engineering [0.0] 本研究では,メリーランド大学 (UMD) A. James Clark School of Engineering Program のAIチャットボットの開発を目的とする。
私たちの研究チームは、反応の潜在的なバイアスを分析し、緩和しました。
結果は、慎重にエンジニアリングとバイアス軽減戦略によって、AIは高品質で偏見のない学術的なアドバイスを提供することができることを示している。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:47:08 GMT)
Autonomous Multi-Robot Infrastructure for AI-Enabled Healthcare Delivery and Diagnostics [0.0] 本研究では、ウェアラブルヘルスセンサ、RFベースのコミュニケーション、AIによる意思決定支援を取り入れた医療用マルチロボットシステムを提案する。
シミュレーションされた病院環境内では、患者監視、医療提供、緊急支援を行うためにリーダー・フォロワー・スワム構成を採用する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:27:33 GMT)
AuON: A Linear-time Alternative to Semi-Orthogonal Momentum Updates [0.0] 運動量に基づく更新の半直交特性について検討し、スペクトルノルム信頼領域下での運動量更新を束縛する方法を開発した。
半直交行列を構成することなく強い性能を達成する線形時間であるAuON(正規化非線形スケーリングによる代替単位ノルム運動量更新)を提案する。
提案手法は, 双極子-コサインRMSスケーリング変換と正規化を組み合わせることで, ニュートン-シュルツ法と比較して, 有効性と計算効率の両立を実証する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:34:27 GMT)
Artificial Intelligence for Cost-Aware Resource Prediction in Big Data Pipelines [0.0] 過剰なプロビジョンは不要なコストをもたらし、過剰なプロビジョンはパフォーマンス劣化とSLA違反のリスクを負う。
本研究では,ランダムフォレスト回帰を用いたビッグデータパイプラインの資源利用予測手法を提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:01:12 GMT)
Apply Bayes Theorem to Optimize IVR Authentication Process [0.0] 従来のシステムは、ユーザ間で一様の有効性を前提として、認証の静的シーケンスを通じてユーザを認証する。
詐欺師はこの予測可能性を利用して 強力な認証をバイパスする
本研究では,ベイズ理論と条件付き確率モデルを適用し,不正リスクを動的に評価し,資格検証経路を適用する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:48:29 GMT)
An Analysis of the New EU AI Act and A Proposed Standardization Framework for Machine Learning Fairness [0.0] 欧州連合のAI法は、倫理的かつ責任あるAIシステムを規制するための重要なステップである。
量的公正度尺度が存在しないことや、用語学における曖昧さが欠如していることが分かる。
この曖昧さは、投資を阻害する相当な負債リスクをもたらすと我々は主張する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 20:02:38 GMT)
Agent-based code generation for the Gammapy framework [0.0] このコントリビューションは設計を要約し、現在の状況を報告し、次のステップを概説します。
制御された環境でコードを書き、実行し、検証できるエージェントを開発する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:29:24 GMT)
Accurate Predictions in Education with Discrete Variational Inference [0.0] 有能で効果的なAI家庭教師は、スケーラブルなソリューションを提供する。
適応学習に焦点をあて、学生が正しい質問に答えるかどうかを予測する。
プロフェッショナルにマークされた形式的数学試験応答の最大オープンデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 09:43:08 GMT)
AQuaMaM: An Autoregressive, Quaternion Manifold Model for Rapidly Estimating Complex SO(3) Distributions [0.0] AQuaMaMは、回転多様体上の複素分布を学習し、単一の前方通過におけるクエリローテーションの正確な確率を計算することができるニューラルネットワークである。
異なる回転で50,000のダイのデータセットでトレーニングされた場合、AQuaMaMはICPよりも14%高いテストログに到達する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:48:35 GMT)
AIM: Adaptive Intervention for Deep Multi-task Learning of Molecular Properties [0.0] AIMは、勾配紛争を仲介するポリシーを学ぶための最適化フレームワークである。
QM9のサブセットとターゲットタンパク質分解剤ベンチマークのマルチタスクベースラインに対する統計的に有意な改善を実現している。
AIMの主な貢献は、その解釈可能性であり、学習されたポリシーマトリックスは、タスク間の関係を分析するための診断ツールとして機能する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 08:47:41 GMT)
AI Playing Business Games: Benchmarking Large Language Models on Managerial Decision-Making in Dynamic Simulations [0.0] 本研究は,ビジネスにおける意思決定にビジネスゲームを用いた新しいベンチマークを解析する。
この研究は、再現可能なオープンアクセス管理シミュレータを提案することで、AIに関する最近の文献に貢献する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 14:43:05 GMT)
AGOCS -- Accurate Google Cloud Simulator Framework [0.0] Accurate Google Cloud Simulator (AGOCS)は、実際のワークロードトレースのパースに基づく、新しい高忠実なクラウドワークロードシミュレータである。
このフレームワークは実行されたジョブ、タスク、ノードの非常に正確で詳細なパラメータを明らかにすることができる。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 11:40:04 GMT)
A systematic comparison of Large Language Models for automated assignment assessment in programming education: Exploring the importance of architecture and vendor [0.0] 本研究は,現代大規模言語モデル (LLM) のプログラム代入の自動段階付けにおいて,大規模・横比較を行った最初の事例である。
モデル間でのグルーピングパターンの一貫性とクラスタリングについて,グルーピングの分布,平均スコアと変動率の違いから分析した。
すべてのモデルでは、クラス内相関係数によって測定された内部一致度が高く、モデルコンセンサスは人間教師の学級との適度な一致しか示さなかった。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 16:29:35 GMT)
A general optimization framework for mapping local transition-state networks [0.0] 局所遷移状態ネットワークは、観測された振る舞いを説明する障壁アーキテクチャを明らかにする。
本稿では,多目的エクスプローラーと二層最小モードカーネルを結合することにより,局所的カバレッジを体系的に拡張する汎用最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 13:54:10 GMT)
A Systematic Study of Large Language Models for Task and Motion Planning With PDDLStream [0.0] 複雑なロボティクス問題を解決するための言語モデル(LLM)には、その計画能力を理解する必要がある。
1つの有望な方向性は、LLMのセマンティック知識とタスクと運動計画の正式な推論を統合することである。
我々は、Gemini 2.5 Flashを使って鍵となるTAMPコンポーネントを置換する16のアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 19:03:14 GMT)
A Physics-Guided Probabilistic Surrogate Modeling Framework for Digital Twins of Underwater Radiated Noise [0.0] 船舶交通は沿岸海域における水中放射音の増大源である。
本研究では,現実的な海洋環境下での3次元伝送損失を予測するための物理誘導確率的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 03:38:51 GMT)
A Hamiltonian driven Geometric Construction of Neural Networks on the Lognormal Statistical Manifold [0.0] 本稿では,統計多様体に基づくニューラルネットワーク構築手法を提案する。
この構成は、この多様体上の勾配フローに相当するハミルトン系によって駆動される。
提案手法は,基礎となるパラメータ空間の微分幾何学に基づく学習システム構築のための新しいパラダイムを提供する。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 04:47:17 GMT)
A Framework for Selection of Machine Learning Algorithms Based on Performance Metrices and Akaike Information Criteria in Healthcare, Telecommunication, and Marketing Sector [0.0] この章では、医療、マーケティング、通信の3分野にわたる機械学習の応用について論じる。
医療において、この枠組みは、心臓血管疾患の予測のような重要な課題に対処し、世界的死亡の28.1%を占める。
重要なコントリビューションは、入力属性に従って最高のMLモデルを特定するレコメンデーションフレームワークである。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 22:27:34 GMT)
A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning [0.0] 本稿では,計算効率のよい教師付きフィルタ手法を提案する。
CDCデータセットでは,提案手法が最も高速なセレクタであり,特徴空間を約52%削減した。
両データセット全体で、Gumbel-upper-tailDependency coefficient selectorは臨床上の一貫性と影響のある予測因子を一貫して同定した。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 06:11:34 GMT)
'Too much alignment; not enough culture': Re-balancing cultural alignment practices in LLMs [0.0] 本稿では、AIアライメントプラクティスへの質的なアプローチの統合へのシフトを論じる。
クリフォード・ゲールツ(Clifford Geertz)の"thick description"の概念からインスピレーションを得たAIシステムは、より深い文化的意味を反映したアウトプットを生成する必要がある。
論文参考訳(メタデータ) (Tue, 30 Sep 2025 12:22:53 GMT)