Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [109.7] FAPromptは、精密なZSADのためのきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
産業的欠陥と医療的異常の両方をカバーする19の実世界のデータセットの実験は、FAPromptが画像レベルのZSADタスクとピクセルレベルのZSADタスクの両方で最先端の手法を大幅に上回っていることを実証している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:14:05 GMT)
More Than One Teacher: Adaptive Multi-Guidance Policy Optimization for Diverse Exploration [103.2] ガイダンス・オン・デマンド」アプローチは、自己発見の価値を保ちながら探究を広げる。
実験の結果、AMPOは強いベースラインを大幅に上回ることが示された。
ピアサイズの4人の教師を用いて、より強力な1人の教師を活用できる手法に匹敵する結果が得られる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:14:00 GMT)
RLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problems [99.0] 問題が発生したら、複数の抽象化を提案できるモデルをトレーニングし、続いてソリューション構築のインセンティブを与えるRLを作ります。
この結果、RLトレーニングパラダイムはRLADと呼ばれ、抽象化ジェネレータとソリューションジェネレータを共同で訓練する。
我々は、大規模なテスト予算で多くのソリューションを生成するよりも、より多くのテスト時間計算を抽象化の生成に割り当てることが、パフォーマンスに有益であることを示しています。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:44:23 GMT)
Inferring Dynamic Physical Properties from Video Foundation Models [94.4] ビデオから動的物理特性を予測するタスクについて検討する。
時間的情報を必要とする物理的特性として,バウンディング物体の弾性,流動液体の粘度,表面を滑り落ちる物体の動的摩擦について考察する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:50 GMT)
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation [93.2] 超解像(SR)の拡散モデルは高品質な視覚結果を生成するが、高価な計算コストを必要とする。
本稿では,拡散型SRモデルの1つであるResShiftの新しい蒸留法であるRSDを提案する。
本手法は,学生ネットワークを訓練し,その上で訓練した新しい偽ResShiftモデルが教師モデルと一致するような画像を生成することに基づいている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:16:44 GMT)
Rethinking Reward Models for Multi-Domain Test-Time Scaling [91.8] 従来の作業では、プロセス報酬モデル(PRM)が最終回答のみを評価する結果報酬モデル(ORM)を上回っていると仮定しています。
14の異なる領域にまたがる4つの報酬モデル変種を統一的に評価する。
LLMの自動ラベル付けからラベルノイズを継承し,長い推論軌跡の評価に難渋するPRM方式の段階的スコアリングが原因と考えられる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:37:21 GMT)
GenExam: A Multidisciplinary Text-to-Image Exam [91.1] GenExamは、複数の学際的なテキスト・ツー・イメージテストのための最初のベンチマークである。
試験スタイルのプロンプトを4段階の分類で編成した10の被験者に1,000のサンプルを配置している。
それぞれの問題には、グランドトラスト画像ときめ細かいスコアポイントが備わっている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:45:30 GMT)
Understanding Transformers for Time Series: Rank Structure, Flow-of-ranks, and Compressibility [90.9] 我々は、ランク構造のレンズを通してトランスフォーマーを解析する。
時系列埋め込みは急激な減衰特異値スペクトルを示すことを示す。
関連する$Q/K/V$プロジェクションが正確な低ランク近似を持つことを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:56:17 GMT)
Patch-as-Decodable-Token: Towards Unified Multi-Modal Vision Tasks in MLLMs [88.7] Patch-as-Decodable Token (PaDT)を導入し、テキストと多様な視覚出力を生成する。
PaDTの中心は、クエリイメージのビジュアルパッチ埋め込みから派生したVisual Reference Tokens (VRT)である。
MLLMモデルと比較しても,PaDTは最先端の性能を一貫して達成できることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:23:57 GMT)
AudioStory: Generating Long-Form Narrative Audio with Large Language Models [87.2] AudioStoryは、大きな言語モデルとテキストからオーディオシステムを統合して、構造化された長文の音声物語を生成するフレームワークである。
LLMを用いて複雑な物語クエリを時間順に並べたサブタスクに分解する。
広汎な実験により,単一音声生成と物語音声生成の両方においてAudioStoryの優位性が,指示追従能力と音声忠実性の両方において,TTAベースラインを上回った。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:00:27 GMT)
MIRA: Towards Mitigating Reward Hacking in Inference-Time Alignment of T2I Diffusion Models [86.1] 拡散モデルは、テキストプロンプトに条件付けされた画像を生成するのに優れている。
得られた画像は、Aesthetic Scoresのようなスカラー報酬によって測定されるユーザ固有の基準を満たさないことが多い。
近年,ノイズ最適化による推定時間アライメントが,効率的な代替手段として浮上している。
このアプローチは報酬のハッキングに苦しめられ、モデルが高いスコアの画像を生成できるが、元のプロンプトとはかなり異なる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:47:36 GMT)
Unlocking Symbol-Level Precoding Efficiency Through Tensor Equivariant Neural Network [84.2] シンボルレベルのプリコーディングにおいて,推論の複雑さの低いエンドツーエンドディープラーニング(DL)フレームワークを提案する。
提案手法は,従来の手法よりも約80倍の高速化を実現しつつ,SLPの大幅な性能向上を達成できることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:15:50 GMT)
ExGRPO: Learning to Reason from Experience [82.8] 検証可能な報酬(RLVR)からの強化学習は、大規模言語モデルの推論能力を改善するための新たなパラダイムである。
標準的なオンライントレーニングは、1回の更新後にロールアウトエクスペリエンスを捨て、計算の非効率性と不安定性につながる。
本稿では,まず,経験価値の効果的な指標であるロールアウトの正しさとエントロピーを考察する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:31:30 GMT)
Beyond Outliers: A Study of Optimizers Under Quantization [82.8] 量子化下でのモデルロバスト性に対する選択の影響について検討する。
モデルの性能が、異なるベースラインでトレーニングした場合にどのように低下するかを評価する。
異なるパラメータによる量子化対応トレーニングのスケーリング法則を導出する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:34:43 GMT)
Chain-of-Thought Reasoning in Streaming Full-Duplex End-to-End Spoken Dialogue Systems [82.7] 本稿では,Duplex SDS のための Streaming Chain-of-Thought (CoT) フレームワークを提案する。
ブロック毎に中間的ターゲットアライメントされたユーザ書き起こしとシステム応答を作成します。
実験により,本手法は既存の二重解法よりもコヒーレントで解釈可能な応答を生成することが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:33:05 GMT)
Explore Briefly, Then Decide: Mitigating LLM Overthinking via Cumulative Entropy Regulation [82.6] 大規模言語モデル(LLM)は、長いチェーン・オブ・ソート(CoT)推論を用いた複雑な問題に対する顕著な推論能力を示した。
しばしば過度の思考に悩まされ、単純な問題に対して必要以上に長い推論ステップが生じる。
本稿では, 推論過程を通じて探索範囲を計測する新しい計量量であるToken Entropy Cumulative Average(TECA)を紹介する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:36:50 GMT)
How to Train Your Advisor: Steering Black-Box LLMs with Advisor Models [81.2] 我々は、強化学習で訓練された軽量なポリシーであるアドバイザモデルを導入し、ブラックボックスモデルにコンテキスト内で自然言語の操舵命令をリアクティブに発行する。
アドバイザは、入力とモデルの間に位置する第2の小さなモデルであり、環境からの報酬信号を使用して、インスタンスごとの振る舞いを形作る。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:02:39 GMT)
AdvEvo-MARL: Shaping Internalized Safety through Adversarial Co-Evolution in Multi-Agent Reinforcement Learning [78.6] AdvEvo-MARLは、タスクエージェントに安全性を内部化する、共進化型マルチエージェント強化学習フレームワークである。
外部ガードに頼るのではなく、AdvEvo-MARLは攻撃者と防御者を共同で最適化する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:06:30 GMT)
DisCo-Layout: Disentangling and Coordinating Semantic and Physical Refinement in a Multi-Agent Framework for 3D Indoor Layout Synthesis [76.7] 3次元屋内レイアウト合成は仮想環境構築に不可欠である。
DisCoは、物理的および意味的な洗練を歪め、調整する新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:30:37 GMT)
DreamOmni: Unified Image Generation and Editing [76.5] 本稿では,画像生成と編集の統一モデルであるDream Omniを紹介する。
訓練のためにドリーム・オムニはT2I世代と下流のタスクを共同で訓練する。
このコラボレーションは、編集性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:10:56 GMT)
LEXam: Benchmarking Legal Reasoning on 340 Law Exams [76.4] textscLEXamは,法科116科の法科試験を対象とする340件の法科試験を対象とする,新しいベンチマークである。
このデータセットは、英語とドイツ語で4,886の法試験質問で構成されており、その中には2,841の長文のオープンエンド質問と2,045の多重選択質問が含まれている。
この結果から,モデル間の差分化におけるデータセットの有効性が示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:09:42 GMT)
VideoGen-of-Thought: Step-by-step generating multi-shot video with minimal manual intervention [76.3] VideoGen-of-Thought(VGoT)は、単一の文から複数ショットのビデオ合成を自動化するステップバイステップのフレームワークである。
VGoTは、ナラティブな断片化、視覚的不整合、トランジションアーティファクトの3つの課題に対処する。
トレーニング不要のパイプラインで組み合わせられたVGoTは、ショット内面の一貫性が20.4%、スタイルの一貫性が17.4%向上した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:38:03 GMT)
From Supervision to Exploration: What Does Protein Language Model Learn During Reinforcement Learning? [76.3] タンパク質言語モデル(PLM)は、大規模事前学習と拡張性のあるアーキテクチャを通じて高度な計算タンパク質科学を持つ。
強化学習(RL)は探索を拡大し、タンパク質設計における正確な多目的最適化を可能にした。
RLはサンプリング効率を向上し,さらに重要な点として,教師あり学習で捉えない能力を明らかにするかどうかを問う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:31:10 GMT)
$\text{G}^2$RPO: Granular GRPO for Precise Reward in Flow Models [74.2] 本稿では,サンプリング方向の高精度かつ包括的な報酬評価を実現する新しいグラニュラ-GRPO(textG2$RPO)フレームワークを提案する。
また、複数の拡散スケールで計算された利点を集約し、サンプリング方向をより包括的かつ堅牢に評価するマルチグラニュラリティ・アドバンテージ統合モジュールも導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:57:12 GMT)
Catalyst GFlowNet for electrocatalyst design: A hydrogen evolution reaction case study [73.5] 電気触媒は水素エネルギー貯蔵(HES)において重要な役割を担い、エネルギーを水素として貯蔵する。
本稿では, 効率的な触媒として機能する結晶表面を設計するために, 生成とエネルギーの機械学習に基づく予測モデルであるCatalyst GFlowNetを紹介する。
我々は,HESにおける重要な反応である水素進化反応への概念実証の適用を通じて,プラチナを最も効率的な触媒として同定し,モデルの性能を実証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:49:39 GMT)
UniVerse: Unleashing the Scene Prior of Video Diffusion Models for Robust Radiance Field Reconstruction [73.3] ビデオ拡散モデルに基づくロバストな再構築のための統一フレームワークUniVerseを紹介する。
具体的には、UniVerseはまず、一貫性のない画像を最初のビデオに変換し、その後、特別に設計されたビデオ拡散モデルを使って、それらを一貫した画像に復元し、最終的に復元された画像から3Dシーンを再構築する。
合成データセットと実世界のデータセットの両方に対する大規模な実験は、頑健な再構築において、我々の手法の強力な一般化能力と優れた性能を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:50:18 GMT)
LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control [72.8] 本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:48:41 GMT)
RedCodeAgent: Automatic Red-teaming Agent against Diverse Code Agents [70.2] コードエージェントは、強力なコード生成機能とコードインタプリタとの統合により、広く採用されている。
現在の静的安全性ベンチマークとレッドチームツールは、出現する現実世界のリスクシナリオを特定するのに不十分である。
我々はRedCodeAgentを提案する。RedCodeAgentは、多様なコードエージェントの脆弱性を体系的に発見するように設計された、最初の自動リピートエージェントである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:59:06 GMT)
Think Right: Learning to Mitigate Under-Over Thinking via Adaptive, Attentive Compression [68.7] 本稿では,冗長なステップを誘発し,難易度を推定するオンラインポストトレーニングRL手法を提案する。
TRAAC(Think Right with Adaptive, Attentive Compression)は、絶対精度が平均8.4%向上する。
我々のモデルは数学データセットに基づいて訓練されているが、分布外データセットの精度と効率性を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:00:20 GMT)
Visual Odometry with Transformers [68.5] 特徴抽出により単眼フレームのシーケンスを処理するビジュアル・オドメトリ・トランスフォーマ(VoT)を導入する。
従来の方法とは異なり、VoTは密度の高い幾何学を推定することなくカメラの動きを直接予測し、監視のためにカメラのポーズのみに依存する。
VoTは、より大きなデータセットで効果的にスケールし、より強力なトレーニング済みバックボーンの恩恵を受け、多様なカメラモーションとキャリブレーション設定を一般化し、従来のメソッドよりも3倍以上高速に動作しながらパフォーマンスを向上する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:00:14 GMT)
UpSafe$^\circ$C: Upcycling for Controllable Safety in Large Language Models [67.9] 大規模言語モデル(LLM)は、幅広いタスクで顕著な進歩を遂げているが、有害なコンテンツ生成やジェイルブレイク攻撃といった安全リスクに弱いままである。
安全に配慮したリサイクルによるLCMの安全性向上のための統合フレームワークであるUpSafe$circ$Cを提案する。
この結果から, 静的アライメントから動的, モジュール, 推論対応制御への移行という, LLMの安全性の新たな方向性が明らかになった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:43:33 GMT)
Transcribe, Translate, or Transliterate: An Investigation of Intermediate Representations in Spoken Language Models [67.9] 音声を大言語モデル(LM)と統合する音声言語モデル(SLM)は、音声エンコーダの出力をデコーダ LM に理解可能な表現にマッピングするモダリティアダプタ(MA)に依存している。
ここでは、3つのSLM(SALMONN, Qwen2-Audio, Phi-4-Multimodal-Instruct)におけるMA出力表現について検討する。
MA表現に最も近いデコーダLMトークンを見つけることで、MA表現の2つの戦略を明らかにする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:19:40 GMT)
Chronological Thinking in Full-Duplex Spoken Dialogue Language Models [66.8] 時系列思考は、完全なSDLMの応答品質を改善することを目的としている。
追加のレイテンシがない: ユーザが話すのをやめると、エージェントは考えるのをやめ、それ以上の遅延なしに話し始める。
結果: 客観的指標と人的評価の両面から, 時系列思考の有効性を示す実験を行った。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:28:11 GMT)
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance [66.7] MOSS-Speechは、テキストガイダンスに頼ることなく直接理解し、音声を生成する、真の音声音声合成大言語モデルである。
我々の研究は、表現的かつ効率的なエンドツーエンドの音声対話のための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:05:41 GMT)
Stream RAG: Instant and Accurate Spoken Dialogue Systems with Streaming Tool Usage [66.7] 従来のASR-LLM-TTSパイプラインに代わる強力な対話システムとして、エンドツーエンドの音声対話システムが登場している。
本稿では,音声入力システムに直接ツールの使用を拡張するための最初のアプローチを紹介する。
提案するStreaming Retrieval-Augmented Generation (Streaming RAG) は,ユーザ音声と並行してツールクエリを予測することにより,ユーザ知覚のレイテンシを低減する新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:18:20 GMT)
Efficiently Generating Correlated Sample Paths from Multi-step Time Series Foundation Models [66.6] 時系列基礎モデルから正確な相関サンプルパスを効率的に生成するためのコプラに基づく手法を提案する。
提案手法は, 自己回帰サンプリングよりもはるかに高速に相関したサンプルパスを生成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:08:58 GMT)
MetaFaith: Faithful Natural Language Uncertainty Expression in LLMs [66.1] メタファイト(MetaFaith)は、ヒトのメタ認知に触発された新規なプロンプトベースのキャリブレーション手法である。
MetaFaithは多種多様なモデルやタスク領域における忠実なキャリブレーションを強力に改善し、忠実度を最大61%向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:35:33 GMT)
CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.5] 隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:14:33 GMT)
Contrastive Representation Regularization for Vision-Language-Action Models [64.1] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルの表現正規化であるロボット状態認識コントラスト損失(RS-CL)を紹介する。
特に、RS-CLは、状態間の相対的な距離をソフト・インスペクションとして使用することにより、ロボットの受容状態とより密に表現する。
実験の結果,RS-CLは最先端VLAモデルの操作性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:41:22 GMT)
Beyond Imitation: Recovering Dense Rewards from Demonstrations [64.1] 教師付き微調整は単純な模倣学習プロセスとして扱われ、データセット上の専門家の振る舞いを模倣するポリシーを訓練するのみである。
我々は、SFTプロセスが政策を学習するだけでなく、専門家のデモンストレーションを説明する暗黙の、密集したトークンレベルの報酬モデルも示している。
Dense-Path ReINFORCEは命令追従ベンチマークにおいて、元のSFTモデルよりも一貫して優れている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:58:26 GMT)
Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.8] 本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:25:10 GMT)
Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks [63.8] 現在の大規模言語モデルは、マルチターンインタラクション設定における敵攻撃に対して脆弱である。
本研究では,木探索と統合したオンライン強化学習フレームワークであるDialTree-RPOを提案する。
提案手法は,従来の最先端手法と比較して,10のターゲットモデルに対して25.9%以上のASRを実現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:57:05 GMT)
DiCache: Let Diffusion Model Determine Its Own Cache [63.0] DiCacheは、実行時に拡散モデルを加速するためのトレーニング不要のアダプティブキャッシュ戦略である。
Online Probe Profiling Schemeは浅層オンラインプローブを利用して,キャッシュエラーのオンザフライインジケータをリアルタイムで取得する。
Dynamic Cache Trajectory Alignmentは、マルチステップの履歴キャッシュから出力されるディープ層の特徴を近似する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:42:41 GMT)
Learning to Weight Parameters for Training Data Attribution [62.8] 本稿では,アノテートラベルを必要とせず,パラメータ重み付けをデータから直接明示的に学習する手法を提案する。
提案手法は,画像分類,言語モデリング,拡散など多種多様なタスクに対する帰属精度を向上し,主題やスタイルといった概念に対する微粒な帰属を可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:35:14 GMT)
FlashResearch: Real-time Agent Orchestration for Efficient Deep Research [62.0] FlashResearchは効率的なディープリサーチのための新しいフレームワークです。
シーケンシャル処理を並列なランタイムオーケストレーションに変換する。
同等のクオリティを維持しつつ、最大5倍のスピードアップを提供できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:15:39 GMT)
The Future of Artificial Intelligence and the Mathematical and Physical Sciences (AI+MPS) [61.8] このコミュニティペーパーは、NSF Workshop on the Future of Artificial Intelligence (AI) and the Mathematical and Physics Sciences (MPS)から生まれたものである。
ここでは、Spring/Summer 2025のMPSコミュニティの視点の概要とスナップショットを紹介する。
我々は,(1)AI+MPS研究を可能にすること,(2)AI+MPS研究者の学際的コミュニティを構築すること,(3)MPS研究者と学生のためのAIにおける教育と労働開発を育成すること,といった活動と戦略的優先事項を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:33:15 GMT)
HAMLET: Switch your Vision-Language-Action Model into a History-Aware Policy [61.7] HAMLETは、行動予測中の歴史的状況に対応するためにビジョン・ランゲージ・アクションモデルを適用するためのフレームワークである。
HAMLETは、最先端のVLAを履歴認識ポリシーに変換することに成功していることを示す。
GR00T N1.5に加えて、HAMLETは歴史に依存した実世界のタスクで平均76.4%の成功率を達成した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:41:44 GMT)
Growing Visual Generative Capacity for Pre-Trained MLLMs [60.8] Bridgeは純粋な自己回帰統合MLLMであり、学習済みの視覚的理解モデルを生成能力で強化する。
本稿では,コンパクトなセマンティックトークンと微細なピクセルトークンを統合するセマンティック・ツー・ピクセルの離散表現を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:40:02 GMT)
Semantic-Aware Scheduling for GPU Clusters with Large Language Models [60.1] 我々は、スケジューラと管理するジョブ間のセマンティックギャップを橋渡しするフレームワークであるSchedMateを提案する。
SchedMateは見過ごされ、構造化されていないデータソース(ソースコード、ランタイムログ、履歴ジョブ)から深い洞察を抽出する。
我々は、SchedMateが平均ジョブ完了時間を最大1.91倍に短縮し、スケジューリング性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:01:02 GMT)
AutoScale: Scale-Aware Data Mixing for Pre-Training LLMs [59.1] より小さなスケールで良好に機能するデータ混合物は、大規模なスケールではその利点を保たない可能性があることを示す。
2段階のスケール対応データ合成フレームワークであるAutoScaleを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:27:39 GMT)
In-memory Training on Analog Devices with Limited Conductance States via Multi-tile Residual Learning [59.1] インメモリトレーニングは通常、デジタルベースラインに合わせて少なくとも8ビットのコンダクタンス状態を必要とする。
ReRAMのような多くの有望な中間デバイスは、製造制約のため、約4ビットの解像度しか提供しない。
本稿では,残差を補うために複数のクロスバータイルを逐次学習する語彙学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:44:25 GMT)
Foundation Visual Encoders Are Secretly Few-Shot Anomaly Detectors [58.8] FoundADと呼ばれる数発の異常検出装置を開発した。
画像中の異常量は学習した埋め込みの差と直接相関する。
簡単な演算子は、画像中の分布外領域を特徴付け識別する異常検出の有効なツールとして機能する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:53:20 GMT)
Reasoning over User Preferences: Knowledge Graph-Augmented LLMs for Explainable Conversational Recommendations [58.6] 対話型レコメンデーションシステム(CRS)は,対話型対話を通じてユーザの好みを捉え,パーソナライズされたレコメンデーションを提供することを目的としている。
現在のCRSは、しばしば知識グラフ(KG)や言語モデルを利用して、ユーザの好みを潜在ベクトルとして抽出し、表現し、説明可能性を制限する。
本稿では,LCMとKGを相乗化してユーザの好みを推論し,既存のCRSの性能と説明可能性を高めるプラグイン・アンド・プレイ・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:21:12 GMT)
GeoPurify: A Data-Efficient Geometric Distillation Framework for Open-Vocabulary 3D Segmentation [57.8] 2次元視覚言語モデルから3次元セマンティックセグメンテーションへ機能を移行しようとする最近の試みは、永続的なトレードオフを露呈している。
3次元教師モデルから抽出した幾何学的事前情報を用いて2次元VLM生成した3次元点特徴に小さな学生親和性ネットワークを適用したGeoPurifyを提案する。
遅延幾何学情報と学習された親和性ネットワークから恩恵を受けることで、GeoPurifyはトレードオフを効果的に軽減し、優れたデータ効率を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:37:56 GMT)
Step-Aware Policy Optimization for Reasoning in Diffusion Large Language Models [57.4] 拡散言語モデル(dLLM)は、テキスト生成に有望で非自己回帰的なパラダイムを提供する。
現在の強化学習アプローチは、しばしばスパースで結果に基づく報酬に頼っている。
これは推論の自然な構造との根本的なミスマッチに由来すると我々は主張する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:34:15 GMT)
FreeViS: Training-free Video Stylization with Inconsistent References [57.4] FreeViSはトレーニング不要のビデオスタイリングフレームワークで、リッチなスタイルの詳細と強力な時間的コヒーレンスを備えたスタイリングされたビデオを生成する。
提案手法は,事前訓練された画像対ビデオ(I2V)モデルに複数のスタイリングされた参照を統合することで,先行研究で観測された伝搬誤差を効果的に軽減する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:27:06 GMT)
On the Effect of Sampling Diversity in Scaling LLM Inference [57.3] 大規模言語モデル(LLM)のスケーリング推論は、パフォーマンス向上の鍵となる。
解の精度と応答の有意な多様性の関係から,スケーリング推論における急激な多様性の効果を体系的に研究した。
また,Best-of-N$選択後の有意義な多様なプロンプトから生成した応答は,定常的なプロンプトから生成した応答よりも有意に低い値を示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:27:31 GMT)
Learning Regularization Functionals for Inverse Problems: A Comparative Study [57.3] 画像の逆問題を解決するための様々な学習された正規化フレームワークが登場した。
これらはフレキシブルなモデリングと数学的洞察を提供する。
利用可能なコードを共通のフレームワークに集め、統一することで、このギャップに対処します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:42:28 GMT)
Sensitivity, Specificity, and Consistency: A Tripartite Evaluation of Privacy Filters for Synthetic Data Generation [57.1] 個人識別可能な情報を含むサンプルを除去するためのポストホックプライバシーフィルタリング技術が提案されている。
本研究は胸部X線合成に適用した濾過パイプラインの厳密な評価を行う。
これらの手法がセンシティブなアプリケーションに確実にデプロイされるためには,フィルタ設計の大幅な進歩が必要であると結論付けている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:32:20 GMT)
Consistent End-to-End Estimation for Counterfactual Fairness [56.9] 本稿では, 対実フェアネスの予測を行うための新しい対実フェアネス予測器を提案する。
我々は,本手法が対実公正性の概念を確実にするのに有効であることを理論的に保証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:11:28 GMT)
Interpretable Neuropsychiatric Diagnosis via Concept-Guided Graph Neural Networks [56.8] 青少年の5人に1人は、不安、うつ病、行動障害などの精神状態または行動の健康状態と診断されている。
従来の研究では、障害予測にグラフニューラルネットワーク(GNN)アプローチを使用していたが、ブラックボックスのままであり、信頼性と臨床翻訳を制限している。
本研究では,解釈可能な機能接続の概念を符号化する概念に基づく診断フレームワークを提案する。
我々の設計は臨床的に意味のある接続パターンを通じて予測を保証し、解釈可能性と強い予測性能の両方を可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:38:46 GMT)
Dynamic Bundling with Large Language Models for Zero-Shot Inference on Text-Attributed Graphs [56.7] 大規模言語モデル(LLM)は多くのゼロショット学習問題で使われている。
LLMは、グラフトポロジから分離されたテキスト属性と競合する。
これらは、情報不足とLLMの固有の弱点の両方により、信頼性の低い予測をもたらす。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:04:27 GMT)
When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.3] 我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:55:21 GMT)
Differentially Private Clustering in Data Streams [56.3] 私たちは、$k$-meansと$k$-medianクラスタリングのための最初の微分プライベートアルゴリズムを、最大で$T$のストリーム上の$d$-dimensional Euclideanデータポイントに対して提供します。
当社の主な技術的貢献は、オフラインDPコアセットまたはクラスタリングアルゴリズムをブラックボックスとしてのみ必要とする、データストリームのための微分プライベートクラスタリングフレームワークです。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:35:31 GMT)
Benchmarking Foundation Models with Retrieval-Augmented Generation in Olympic-Level Physics Problem Solving [56.1] 基礎モデルを用いた検索拡張世代(RAG)は,様々なタスクにおいて高い性能を達成している。
しかし、オリンピアードレベルの物理学問題を解くような専門家レベルの推論能力は、ほとんど解明されていない。
我々は,Olympiadレベルの物理に特化して設計された高品質なマルチモーダルデータセットであるPhoPileを紹介する。
PhoPileを用いて,大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) の両方を複数のレトリバーでカバーするRAG拡張基盤モデルのベンチマークを行った。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:55:14 GMT)
GSM-Agent: Understanding Agentic Reasoning Using Controllable Environments [56.0] GSM-Agentは複雑な環境でエージェント推論を評価するための新しいベンチマークである。
我々は,環境文書の埋め込みをノードにクラスタ化することでエージェント推論パターンを分析し,各ツールコールを最も近いノードにマッピングする。
本稿では,LLMのエージェント推論性能を向上させるためのツール拡張テストタイムスケーリング手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:34:19 GMT)
Linguistic Nepotism: Trading-off Quality for Language Preference in Multilingual RAG [55.3] 異なる文書言語の混合が意図しない方法で生成と引用に影響を及ぼすかどうかを検討する。
8つの言語と6つのオープンウェイトモデルにまたがって、クエリが英語である場合、モデルは優先的に英語ソースを引用する。
モデルが言語嗜好のトレードオフ文書関連性を示すことがあり、引用選択が情報のみによって常に駆動されるわけではないことが分かる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:41:23 GMT)
DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [55.2] ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:15:36 GMT)
The Disparate Impacts of Speculative Decoding [55.0] 投機的復号化(英: Speculative decoding)とは、大規模言語モデルの復号時間を体系的に短縮する手法である。
この論文は、投機的復号化によって得られたスピードアップは、一様にタスクに分散せず、不適合なタスクに対して一貫して減少し、しばしば表現不足なタスクであることを示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:38:57 GMT)
InfoMosaic-Bench: Evaluating Multi-Source Information Seeking in Tool-Augmented Agents [54.4] InfoMosaic-Benchは、ツール拡張されたエージェントを探すマルチソース情報に特化した最初のベンチマークである。
汎用検索とドメイン固有のツールを組み合わせるにはエージェントが必要である。
この設計は信頼性と非自明性の両方を保証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:48:03 GMT)
SecInfer: Preventing Prompt Injection via Inference-time Scaling [54.2] emphSecInferは,インセンジェンス時間スケーリングに基づくインジェクション攻撃に対する新しい防御法である。
SecInferは、既存のインジェクション攻撃と適応的なインジェクション攻撃の両方を効果的に軽減し、最先端の防御と既存の推論時間スケーリングアプローチより優れていることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:39:39 GMT)
QSpec: Speculative Decoding with Complementary Quantization Schemes [54.0] 大規模言語モデル(LLM)における推論の高速化とメモリ消費削減のために量子化が広く採用されている
品質から効率を分離する新しい量子化パラダイムであるQSpecを提案する。
QSpecは重みとKVキャッシュの両方を段階的に再利用し、再トレーニングや補助モデルなしでほぼゼロコストで切り替えることができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:09:03 GMT)
PolySim: Bridging the Sim-to-Real Gap for Humanoid Control via Multi-Simulator Dynamics Randomization [53.7] 複数の異種シミュレータを統合するWBCトレーニングプラットフォームであるPolySimを紹介する。
理論的には、PolySimは単シミュレータトレーニングよりもシミュレータ誘導バイアスの強い上限が得られることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:31:42 GMT)
Learning to Interact in World Latent for Team Coordination [53.5] 本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:45:00 GMT)
Flow-Matching Guided Deep Unfolding for Hyperspectral Image Reconstruction [53.3] Flow-Matching-Guided Unfolding Network (FMU)は、最初にフローマッチングをHSI再構成に統合する。
学習力学をさらに強化するために,平均速度損失を導入する。
シミュレーションと実データの両方の実験により、FMUは復元品質において既存のアプローチよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:32:00 GMT)
WebRollback: Enhancing Web Agents with Explicit Rollback Mechanisms [52.9] 我々は、明示的なロールバック機構でWebエージェントを強化し、エージェントがナビゲーションの軌跡の前の状態に戻れるようにした。
このメカニズムは、モデルに検索プロセスを直接制御する柔軟性を与え、効果的で効率的なWebナビゲーション方法をもたらす。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:53:53 GMT)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [52.8] Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。
分子理解を改善するために,分子エンコーダの相補的な情報を統合するモジュールを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:39:03 GMT)
Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models [52.7] EqMは、平衡力学の観点から構築された生成モデリングフレームワークである。
時間条件の速度を統一された平衡景観に置き換えることで、EqMは流れとエネルギーベースのモデルの間により緊密な橋渡しを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:06 GMT)
SingMOS-Pro: An Comprehensive Benchmark for Singing Quality Assessment [52.7] 自動歌唱品質評価のためのデータセットであるSingMOS-Proを紹介する。
SingMOS-Proは、追加部分のアノテーションを拡張して、歌詞、メロディ、全体的な品質を含む。
データセットには、12データセットにわたる41のモデルによって生成された7,981の歌声クリップが含まれている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:53:49 GMT)
Parallel Scaling Law: Unveiling Reasoning Generalization through A Cross-Linguistic Perspective [52.5] 本研究は、推論一般化を探求する新たな言語横断的視点を提案する。
本研究により,言語間の伝達性は,初期モデル,対象言語,訓練パラダイムによって大きく異なることが明らかとなった。
我々の研究は、LRM推論が人間の認知を反映し、言語に依存しないLRMの開発に重要な洞察を与えるという仮定に挑戦する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:49:49 GMT)
PhysHMR: Learning Humanoid Control Policies from Vision for Physically Plausible Human Motion Reconstruction [52.4] 物理学に基づくシミュレーターにおいて,ヒューマノイド制御のための視覚行動ポリシーを学習する統合フレームワークであるPhysHMRを提案する。
我々のアプローチの重要な要素はピクセル・アズ・レイ戦略であり、2次元のキーポイントを3次元空間に上げ、それらを大域空間に変換する。
PhysHMRは多種多様なシナリオにまたがって高忠実で物理的に妥当な動きを生じさせ、視覚的精度と身体的リアリズムの両方において以前のアプローチより優れている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:01:11 GMT)
ToolTweak: An Attack on Tool Selection in LLM-based Agents [52.2] 対戦相手は,特定のツールの選択に対して,エージェントを体系的にバイアスし,等しく有能な代替手段に対して不公平な優位性を得ることができることを示す。
提案するToolTweakは,ベースラインの20%程度から最大81%までの選択率を向上する,軽量自動攻撃である。
これらのリスクを軽減するために、パラフレージングとパープレキシティ・フィルタリングという2つの防御効果を評価し、バイアスを低減し、エージェントが機能的に類似したツールをより平等に選択できるようにする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:44:44 GMT)
RESTRAIN: From Spurious Votes to Signals -- Self-Driven RL with Self-Penalization [52.0] 私たちは、ゴールドラベルの欠如を有用な学習信号に変換する自己金型RLフレームワークであるRESTRAINを紹介します。
多数決を急ぐために過剰にコミットする代わりに、RESTRAINは、モデルの全回答分布からのシグナルを利用する。
挑戦的な推論ベンチマークでは、RESTRAINはラベルのないデータのみを使用して大きなゲインを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:24:01 GMT)
StelLA: Subspace Learning in Low-rank Adaptation using Stiefel Manifold [51.9] 低ランク適応(LoRA)は大規模事前訓練モデルのパラメータ効率向上手法として広く採用されている。
3要素分解$U!SVtop$を使用するLoRAの幾何学的拡張を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:59:13 GMT)
BrowserArena: Evaluating LLM Agents on Real-World Web Navigation Tasks [51.8] 我々はBrowserArenaを紹介した。BrowserArenaは、ユーザから送信されたタスクを収集するオープンソースのエージェント評価プラットフォームである。
Captcha解決、ポップアップバナー削除、URLへのダイレクトナビゲーションの3つの一貫した障害モードを特定します。
本研究は,Webエージェントの多様性と脆性の両方を明らかにする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:22:21 GMT)
Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7] 本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:13:23 GMT)
Detecting Post-generation Edits to Watermarked LLM Outputs via Combinatorial Watermarking [51.4] ウォーターマークされたLCM出力に局所的に編集されたポストジェネレーションの編集を検出する。
本稿では,語彙を部分集合に分割し,透かしを埋め込むパターンベースの透かしフレームワークを提案する。
本手法は,様々な編集シナリオにおけるオープンソースのLCMについて評価し,編集ローカライゼーションにおける強力な経験的性能を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:33:12 GMT)
Self-Forcing++: Towards Minute-Scale High-Quality Video Generation [50.9] 拡散モデルは画像とビデオ生成に革命をもたらし、前例のない視覚的品質を達成した。
最近の研究は、主に短水平双方向教師の蒸留によって、長時間のビデオ生成のための自己回帰的定式化を探求している。
長ビデオ教師の監督や長ビデオデータセットの再訓練を必要とせずに、長ビデオ生成における品質劣化を軽減するための、単純かつ効果的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:55:42 GMT)
How Can Time Series Analysis Benefit From Multiple Modalities? A Survey and Outlook [50.9] 時系列分析(TSA)は、データマイニングコミュニティにおいて長年研究されてきたトピックであり、現実世界において大きな意味を持つ。
最近のTSA研究は、新しい研究分野、すなわち、TSAのためのMultiple Modalities(MM4TSA)を形成している。
この調査は、この新興分野の総合的なレビューと詳細な展望を提供する最初のものだ。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:27:21 GMT)
AniMaker: Multi-Agent Animated Storytelling with MCTS-Driven Clip Generation [50.6] AniMakerは、効率的なマルチ候補クリップ生成とストーリーテリング対応クリップ選択を可能にするフレームワークである。
AniMakerは、VBenchや提案したAniEvalフレームワークなど、一般的なメトリクスによって測定される、優れた品質を実現しています。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:49:51 GMT)
Explicit Discovery of Nonlinear Symmetries from Dynamic Data [50.2] LieNLSDは非線形項の無限小生成器の数とその明示的な表現を決定する最初の方法である。
LieNLSDは既存の手法に比べて質的な利点を示し、ニューラルPDEソルバの長期ロールアウト精度を20%以上改善する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:54:08 GMT)
Learning a Dense Reasoning Reward Model from Expert Demonstration via Inverse Reinforcement Learning [50.2] 我々は、専門家によるデモンストレーションから直接、プロセスの監督のための密集したトークンレベルの報酬モデルを学びます。
学習された推論報酬は、2つの補完的な役割を果たす: (i)訓練中の推論ポリシーを最適化するためのステップレベルのフィードバックを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:55:26 GMT)
What MLLMs Learn about When they Learn about Multimodal Reasoning: Perception, Reasoning, or their Integration? [46.8] マルチモーダル推論モデルは、最近、オリンピアドレベルの幾何学のような挑戦的な領域を約束している。
マルチモーダル推論のサブスキルを切り離すために設計されたベンチマークであるMathLensを紹介する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:58:29 GMT)
Do LLMs Really Forget? Evaluating Unlearning with Knowledge Correlation and Confidence Awareness [46.7] 大規模言語モデル(LLM)における意図しない記憶の軽減を目的とした機械学習手法
実世界の知識の暗黙構造をより正確に捉えた知識未学習評価フレームワークを提案する。
私たちのフレームワークは、未学習のパフォーマンスをより現実的で厳格に評価します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:15:09 GMT)
Diffusion Model as a Noise-Aware Latent Reward Model for Step-Level Preference Optimization [46.5] 拡散モデルの優先度最適化は、画像を人間の好みに合わせることを目的としている。
事前学習した拡散モデルは,ノイズのある潜在空間におけるステップレベルの報酬モデルに自然に適していることを示す。
雑音の多い遅延空間で直接実行されるステップレベルの優先度最適化手法であるLatent Preference Optimization (LPO)を導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:07:53 GMT)
VideoNSA: Native Sparse Attention Scales Video Understanding [46.4] VideoNSAは、216Kのビデオインストラクションデータセットのエンドツーエンドトレーニングを通じて適応する。
我々は、注意にハードウェアを意識したハイブリッドアプローチを採用し、ビデオにNSAを採用しながら、テキストに対する集中的な注意を保ちます。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:58:54 GMT)
AttentiveGRUAE: An Attention-Based GRU Autoencoder for Temporal Clustering and Behavioral Characterization of Depression from Wearable Data [46.3] 本稿では,時間的クラスタリングと縦型ウェアラブルデータによる結果の予測を目的とした,新しい注意型ゲートリカレントユニット(GRU)オートエンコーダであるAttentiveGRUAEを提案する。
372名(GLOBEM 2018-2019)の長期睡眠データからAttentiveGRUAEを評価する。
これは、クラスタリングの品質と抑うつの分類の両方において、ベースラインクラスタリング、ドメイン指向の自己教師付きモデル、および改善されたモデルよりも優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:52:16 GMT)
GRACE: A Language Model Framework for Explainable Inverse Reinforcement Learning [46.1] 本稿では,進化探索における大規模言語モデルを用いた解釈可能なコードベース報酬関数のリバースエンジニアリング手法であるGRACEを紹介する。
その結果得られる報酬関数は、検査と検証が可能な実行可能なコードである。
BabyAIとAndroidWorldのベンチマークでGRACEを実証的に検証し、高い精度の報酬を効率よく学習する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:31:39 GMT)
Can LLMs Refuse Questions They Do Not Know? Measuring Knowledge-Aware Refusal in Factual Tasks [45.9] Refusal Index(RI)は、Large Language Models(LLM)が知らない質問をどれだけ正確に拒否するかを測定する、原則化された指標である。
16のモデルと5つのデータセットにわたる大規模な実験により、RIは実際のタスクにおいて、モデルの本質的な知識を意識した拒絶能力を正確に定量化できることを示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:20:36 GMT)
PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes [45.8] 実写3Dシーンにおける言語誘導オブジェクト配置の新たな課題について紹介する。
グラウンド化などの3次元シーンにおける他の言語誘導型ローカライズタスクと比較して、このタスクには特定の課題がある。
複数の有効な解を持ち、3次元幾何学的関係と自由空間の推論を必要とするため、曖昧である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:37:14 GMT)
Double-Checker: Enhancing Reasoning of Slow-Thinking LLMs via Self-Critical Fine-Tuning [44.4] Double-Checkerは、ゆっくりと考えられた大きな言語モデルの推論能力を高めるために設計された、原則化されたフレームワークである。
総合的な推論ベンチマークを用いてDouble-Checkerの有効性を検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:57:44 GMT)
StockBench: Can LLM Agents Trade Stocks Profitably In Real-world Markets? [44.1] 大規模言語モデル(LLM)は、最近、自律エージェントとして強力な能力を示した。
実時間複数ヶ月の株式トレーディング環境でLLMエージェントを評価するためのベンチマークであるStockBenchを紹介する。
我々の評価では、ほとんどのLLMエージェントは、単純な買い買い得ベースラインよりも優れているが、いくつかのモデルでは、より高いリターンをもたらし、より効果的にリスクを管理する可能性を実証している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:54:57 GMT)
Study on LLMs for Promptagator-Style Dense Retriever Training [44.1] 本稿では,Promptagator の代替として,オープンソースの LLM がアクセシブルスケール (leq$14B パラメータ) に与える影響について検討する。
提案手法は,オープンソースのLLMを3Bパラメータまで小さくすることで,プロンプタレータスタイルのクエリジェネレータとして有効であることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:29:51 GMT)
Pure-Pass: Fine-Grained, Adaptive Masking for Dynamic Token-Mixing Routing in Lightweight Image Super-Resolution [44.0] CAMixerは、既存の軽量画像超解法の利点を統合する先駆的な取り組みである。
本稿では,Pure-Pass(Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass)を提案する。
PP-ATD-lightは最小オーバーヘッドで優れたSR性能を実現し、再構成品質とパラメータ効率でCAMixer-ATD-lightを上回っている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:18:43 GMT)
From Frames to Clips: Efficient Key Clip Selection for Long-Form Video Understanding [43.8] ビデオ大言語モデル(VLM)は様々な視覚言語タスクにおいて顕著な成果を上げている。
生のビデオフレームから生成される膨大な数の視覚トークンが、モデルのコンテキストウィンドウを消費する。
分離されたキーフレームからキークリップへの選択を、短い時間的コヒーレントなセグメントに拡張することで、ビデオの理解が向上することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:43:01 GMT)
VaPR -- Vision-language Preference alignment for Reasoning [43.5] LLM誘導応答編集に基づく強負応答生成フレームワークを提案する。
VaPRは、ターゲットとなるエラーで拒否された応答を生成し、受け入れられたものとのスタイルと長さの類似性を維持する。
本稿では,VaPR-OSでトレーニングしたモデルをエディタとして,オープンソースのLLMに一般化し,名前でトレーニングしたモデルの99%をVaPR-OSでトレーニングした。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:10:43 GMT)
GEPO: Group Expectation Policy Optimization for Stable Heterogeneous Reinforcement Learning [43.5] パラメータ学習とロールアウトサンプリングのプロセスを分離した異種RLアーキテクチャであるHeteroRLを提案する。
コアコンポーネントは、レイテンシに堅牢な非同期RLアルゴリズムであるグループ期待ポリシー最適化(GEPO)である。
実験の結果、GEPOはより優れた安定性を実現しており、オンラインから1800年代までのパフォーマンス低下はわずか3%である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:13:54 GMT)
LiDAR-HMR: 3D Human Mesh Recovery from LiDAR [43.5] 本稿では,疎いLiDAR点雲から3次元人体メッシュを推定するための最初の試みについて述べる。
点雲から人のポーズやメッシュを推定する上での大きな課題は、LiDAR点雲の空間性、ノイズ、不完全性にあることがわかった。
本研究では,3次元メッシュの再構築に有効なスパース・トゥ・ディエンス・リコンストラクション手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:31:44 GMT)
WWAggr: A Window Wasserstein-based Aggregation for Ensemble Change Point Detection [43.3] Change Point Detection (CPD) は、データストリームの急激な分散シフトの瞬間を特定することを目的としている。
現在の最先端検出器はまだ完璧な品質を達成できていない。
WWAggr - Wasserstein 距離に基づく新しいタスク固有のアンサンブルアグリゲーション法を紹介する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:27:46 GMT)
Evaluating the Robustness of a Production Malware Detection System to Transferable Adversarial Attacks [43.3] 本稿では,MLコンポーネントを対象とする敵攻撃が,プロダクショングレードのマルウェア検出システム全体を分解あるいはバイパスする方法について検討する。
マルウェアサンプルの13バイトだけを変えることで、90%のケースでMagikaを回避できます。
防御された生産モデルでは、攻撃の成功率を20%に抑えるために、高度にリソースを確保できる敵は50バイトしか必要としない。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:04:44 GMT)
Learning Equivariant Models by Discovering Symmetries with Learnable Augmentations [42.9] SEMoLAは、学習可能なデータ拡張を通じて、データの事前未知の対称性を共同で発見するエンドツーエンドのアプローチである。
各種データセットにまたがって高い予測性能を達成しつつ,SEMoLAが関連する対称性を堅牢に発見できることを実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:40:08 GMT)
PEO: Training-Free Aesthetic Quality Enhancement in Pre-Trained Text-to-Image Diffusion Models with Prompt Embedding Optimization [42.7] 本稿では,簡単なプロンプトを与えられた場合,事前学習したテキスト・画像拡散モデルにおける審美的品質改善のための新しいアプローチを提案する。
Prompt Embedding Optimization (PEO) と呼ばれる本手法は,事前学習したテキスト・画像拡散モデルをバックボーンとして活用する。
我々は、生成した画像の美的忠実度を改善し、最適化されたテキストの埋め込みを確実にし、初期プロンプトから最小限のばらつきを確保する三部構成の目的関数によりこれを達成した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:12:36 GMT)
The Unreasonable Effectiveness of Scaling Agents for Computer Use [42.4] 本稿では,複数のロールアウトを生成し,その中の1つを選択することでエージェントをスケールする行動ベスト・オブ・N(bBoN)を紹介する。
OSWorldでは,我々のbBoNスケーリング手法が69.9%の新たな最先端技術(SoTA)を確立し,先行手法を著しく上回り,人間レベルのパフォーマンスに72%近づいた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:37:08 GMT)
Spec-Gloss Surfels and Normal-Diffuse Priors for Relightable Glossy Objects [42.3] 本稿では,マイクロファセットBRDFとスペキュラ・グロシネスパラメータ化を統合した2次元ガウス平滑化フレームワークを提案する。
環境マップの粗大な最適化は収束を加速し、高ダイナミックレンジのスペクトル反射を保存する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:34:46 GMT)
RGS-DR: Deferred Reflections and Residual Shading in 2D Gaussian Splatting [42.3] 我々は、仕様の細部を改善するための改良段階を論じ、再構築のみの手法でギャップを埋める。
我々のパイプラインは、指向性残留パスを用いて、編集可能な材料特性と環境照明を推定する。
最短軸法線と正常残差を持つガウス色ごとのシェーディングとは対照的に、スペクトル残差を持つ画素遅延型サーベイル定式化により、シャープなハイライト、よりクリーンな材料、編集性が改善された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:49:48 GMT)
EyePCR: A Comprehensive Benchmark for Fine-Grained Perception, Knowledge Comprehension and Clinical Reasoning in Ophthalmic Surgery [42.2] 我々は,眼科手術解析のための大規模ベンチマークであるtextbfEyePCR を開発した。
EyePCRは210k以上のVQAを持つリッチな注釈付きコーパスを提供する。
リッチアノテーションは深い認知分析を促進し、外科医が視覚的手がかりをどう知覚するかをシミュレートし、それらをドメイン知識と組み合わせて意思決定する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:55:24 GMT)
TACOS: Task Agnostic COordinator of a multi-drone System [42.0] TACOS(Task-Agnostic Coordinator of a multi-drone System)は、マルチUAVシステムの高レベル自然言語制御を可能にする統合フレームワークである。
直感的なユーザインタラクションのための1対多の自然言語インターフェース、ユーザ意図を構造化されたタスクプランに変換するインテリジェントコーディネータ、現実世界と対話するプランを実行する自律エージェントである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:21:35 GMT)
Quantum gates in coupled quantum dots controlled by coupling modulation [42.0] 一対の電子二重量子ドット(DQD)の縦および横方向の静磁場下でのダイナミクスについて検討した。
本稿では,QD間のトンネル結合を1キュービットゲートの生成とDQD間の交換結合を変調し,絡み合うゲートを生成することを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:46:42 GMT)
Towards Human-Centered RegTech: Unpacking Professionals' Strategies and Needs for Using LLMs Safely [41.8] 調査の結果、これらの専門家は、機密情報漏洩、知的財産権侵害、モデル出力の品質に関する不確実性など、一般的に懸念されていることがわかった。
応答として、入力データを積極的に歪ませたり、プロンプトの細部を制限したりするなど、様々な緩和戦略を自然に採用する。
我々の研究は、現在のNLPツールと専門家の実際のコンプライアンス要件との間に大きなギャップがあることを明らかにします。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:35:46 GMT)
How to Find Fantastic Papers: Self-Rankings as a Powerful Predictor of Scientific Impact Beyond Peer Review [41.3] 我々は、高インパクトな研究を特定するための未調査の尺度を調査する。著者自身の、同じAIカンファレンスへの複数の応募のランキング。
我々は、先進的なAIカンファレンスで大規模な実験を行い、1,342人の研究者が、2,592件の投稿を認識された品質で自己ランク付けした。
その結果,論文が著者によって上位にランクされた論文は,最もランクの低い論文の2倍の引用を受け取っていることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:50:21 GMT)
Injecting External Knowledge into the Reasoning Process Enhances Retrieval-Augmented Generation [41.3] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を知識集約タスクの外部知識で拡張するために広く採用されている。
RAGの有効性は、しばしばノイズ(低品質)の回復経路の存在によって損なわれる。
本稿では,RAGの雑音に対する認識・抵抗能力を高めるため,パッセージインジェクションを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:08:34 GMT)
EMR-AGENT: Automating Cohort and Feature Extraction from EMR Databases [41.2] EMR-AGENTはエージェントベースのフレームワークで、手動のルール記述を動的に言語モデル駆動インタラクションに置き換える。
本フレームワークは,データベースの対話型クエリによるコホート選択,特徴抽出,コードマッピングを自動化する。
結果は3つのEMRデータベースにまたがる高い性能と一般化を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:21:52 GMT)
DS-STAR: Data Science Agent via Iterative Planning and Verification [40.5] DS-STARは,様々なデータフォーマットからコンテキストを自動探索し抽出する新しいデータサイエンスエージェントである。
具体的には,(1)非構造化型を含む多種多様なデータ形式からコンテキストを自動的に探索・抽出するデータファイル解析モジュール,(2)LLMベースの審査員が各段階で解析計画の十分性を評価する検証ステップ,(3)単純で実行可能な計画から始まる逐次計画機構,(3)DS-STARの満足度が検証されるまでそのフィードバックに基づいて反復的に洗練する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:28:58 GMT)
The Data-Quality Illusion: Rethinking Classifier-Based Quality Filtering for LLM Pretraining [40.5] 大規模モデルは、混在する品質のドキュメントを含む大規模なWebクローリングデータセットで事前訓練される。
一般的な方法は品質フィルタリング(CQF)であり、バイナリ分類器を訓練して事前学習データと小型で高品質なデータセットを区別する。
CQFは下流のタスク性能を改善するが、高品質なデータセットにおける言語モデリングを必ずしも強化するわけではない。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:56:04 GMT)
Bias beyond Borders: Global Inequalities in AI-Generated Music [39.8] GlobalDISCOは、最先端の商用生成音楽モデルによって生成される73k曲からなる大規模なデータセットである。
データセットは147言語で、MusicBrainzとWikipediaから抽出された音楽スタイルのプロンプトを含んでいる。
データセットは世界的なバランスが取れており、79か国、5大陸のアーティストたちの音楽スタイルを表している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:33:10 GMT)
MINERVA: Mutual Information Neural Estimation for Supervised Feature Selection [39.6] 本稿では,特徴と対象間の相互情報のニューラル推定に基づく特徴選択のための新しい手法を提案する。
ニューラルネットワークによる相互情報の近似をパラマティフィケーションし、疎性誘導型正規化器を付加した慎重に設計された損失関数を用いて特徴選択を行う。
提案手法は,特徴選択から表現学習を分離する2段階のプロセスで実装され,より優れた一般化とより正確な特徴重要度表現を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:09:06 GMT)
RewardMap: Tackling Sparse Rewards in Fine-grained Visual Reasoning via Multi-Stage Reinforcement Learning [39.6] マルチモーダル大言語モデル(MLLM)の中核的な課題は、きめ細かい視覚的推論である。
ReasonMapはこのギャップを強調し、高度なMLLMでさえ、トランジットマップのような構造化された情報豊富な設定における空間的推論に苦労していることを示している。
MLLMの視覚的理解能力と推論能力の両方を改善するために設計された多段階RLフレームワークであるRewardMapを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:29:46 GMT)
World Model for AI Autonomous Navigation in Mechanical Thrombectomy [39.5] モデルベースRLアルゴリズムであるTD-MPC2を用いて,自律型血管内ナビゲーションのための世界モデルを提案する。
SAC(Soft Actor-Critic)法と比較し,複数の血管内ナビゲーションタスクに対して1つのRLエージェントを訓練した。
その結果,TD-MPC2は多タスク学習においてSACを有意に上回り,SACの37%に比べ平均成功率は65%,パス比は顕著に改善した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:02:54 GMT)
cAST: Enhancing Code Retrieval-Augmented Generation with Structural Chunking via Abstract Syntax Tree [39.5] 大規模コード生成にはRAG(Retrieval-Augmented Generation)が不可欠である。
我々の研究は、検索強化されたコードインテリジェンスをスケールする上で、構造対応のチャンキングの重要性を強調している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:20:38 GMT)
AlgoTune: Can Language Models Speed Up General-Purpose Numerical Programs? [39.4] オープンなベンチマークでアルゴリズムを設計・実装するテストモデルを提案する。
私たちのAlgoTuneベンチマークは、ドメインの専門家から収集された154のコーディングタスクで構成されています。
AlgoTunerは参照ソルバに対して平均1.72倍のスピードアップを達成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:23:30 GMT)
Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking [39.4] 深部強化学習制御器の頑健性を改善するため,頑健なモデル独立有界限界探索(ES)フィードバック制御について検討した。
ロスアラモス中性子科学センター線形粒子加速器における低エネルギービーム輸送部の自動チューニングのための一般時変系とES-DRL制御器の数値的研究を行った。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:53:02 GMT)
MedQ-Bench: Evaluating and Exploring Medical Image Quality Assessment Abilities in MLLMs [39.3] MedQ-Benchはマルチモーダル大言語モデル(MLLM)を用いた医療画像品質評価のための総合的なベンチマークである。
ベンチマークは5つの画像モダリティと40以上の品質特性にまたがっており、合計2,600のパーセプティブクエリと708の推論アセスメントがある。
最新のMLLM14例について評価したところ, 既往ながら不安定な知覚能力, 推論能力を示し, 信頼性に乏しい臨床応用が得られた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:42:00 GMT)
Input-Aware Sparse Attention for Real-Time Co-Speech Video Generation [39.3] 拡散モデルは、ビデオ作成や仮想エージェントといった様々なアプリケーションのために、オーディオからリアルな音声合成ビデオを合成することができる。
本研究では,多段階拡散ビデオモデルを数段階の学生モデルに蒸留する。
入力された人間のポーズキーポイント間の正確な対応を利用して、話者の顔、手、上半身などの関連領域に注意を向ける。
この入力対応スパースアテンションは、冗長な計算を低減し、身体部分の時間対応を強化し、推論効率と動きコヒーレンスを向上させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:35:52 GMT)
Reason to Rote: Rethinking Memorization in Reasoning [39.2] 大規模言語モデルは、ラベルノイズなどの任意のトレーニングインスタンスを覚えやすいが、推論タスクでは顕著に機能する。
本研究では,言語モデルがラベルノイズを記憶する方法と,そのような記憶が一般化可能な推論能力に大きく影響しない理由について検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:29:17 GMT)
GEM: 3D Gaussian Splatting for Efficient and Accurate Cryo-EM Reconstruction [39.1] 核電子顕微鏡(cryo-EM)は高分解能構造生物学の中心的なツールとなっている。
大規模なデータセットは、計算コストとメモリ集約の両方を3D再構成する。
GEMは3次元ガウス平板上に構築された新しいCreo-EM再構成フレームワークである(3DGS)。
標準的なCryo-EMベンチマークでは、GEMは最先端の手法に比べて最大48%高速なトレーニングと12%低いメモリ使用率を実現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:31:48 GMT)
Variational Secret Common Randomness Extraction [38.3] 本研究では,Alice と Bob の2つの正統派による相関したランダムソースから共通乱数性(CR)や秘密鍵を抽出する問題について,盗聴器 Eve の存在下での公開討論を通して検討した。
まず、Alice氏とBob氏は、確率論的ニューラルネットワーク(NN)エンコーダを用いて、観測結果を離散的、ほぼ均一な確率変数(RV)に高整合確率でマッピングする。
第2段階では、コードオフセット構成を用いたセキュアなスケッチにより、エンコーダの出力を同一秘密鍵に調整し、VPQの目的によって秘密が保証される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:22:21 GMT)
Emotional Text-To-Speech Based on Mutual-Information-Guided Emotion-Timbre Disentanglement [38.0] 実験結果から,本手法は自然な,感情的に豊かな音声を生成する上で,ベースラインTSシステムよりも優れていた。
この研究は、感情的なTSシステムの品質と柔軟性を向上する上で、絡み合った、きめ細かな表現の可能性を強調している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:03:50 GMT)
LiLa-Net: Lightweight Latent LiDAR Autoencoder for 3D Point Cloud Reconstruction [37.6] LiLa-Netは3Dオートエンコーダアーキテクチャで、実際のトラフィック環境から機能をエンコードし、LiDARのポイントクラウドのみを使用する。
主な変更点として、エンコーダのレイヤ数を削減し、スキップ接続を簡素化すると同時に、効率的で代表的なラテントスペースを生成する。
モデルは強力な一般化能力を示し、元の交通環境とは無関係なオブジェクトの再構築に成功した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:00:20 GMT)
Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization [37.5] DPOのためのサンプルスケジューリングという,新しい問題を紹介します。
トレーニングバッチ毎にサンプルを適応的に選択する,効率的かつ効率的なアルゴリズムであるSamSを提案する。
この研究は、バッチワイドサンプル選択によるLCMアライメントを改善するための、有望な新しい方向性を示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:00:42 GMT)
Riemannian Variational Flow Matching for Material and Protein Design [37.3] ユークリッド空間では、予測終点(VFM)、速度(FM)、ノイズ(拡散)はアフィンによってほぼ同値である。
曲線多様体上では、この同値性は崩壊し、終点予測がより強い学習信号を与えるという仮説を立てる。
この知見に基づいて、変動フローマッチングの目的を導出する。
合成球面および双曲型ベンチマークの実験は、物質やタンパク質の生成における実世界のタスクと同様に、RG-VFMがより効果的に多様体構造を捉えることを実証している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:48:51 GMT)
DiFFPO: Training Diffusion LLMs to Reason Fast and Furious via Reinforcement Learning [37.2] マスク付き拡散大言語モデル (dLLM) を学習し, より優れた推論を行うための統一フレームワークを提案する。
我々はまず,既存の基本方針を,真のdLLM政策の近似としてはるかに難易度の高い,政治外RLによるサロゲート政策の訓練により統一する。
RLでは、各プロンプトに対して推論閾値を適応的に割り当てることによって、dLLMの自然なマルチトークン予測能力をインセンティブ化する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:57:24 GMT)
MDSEval: A Meta-Evaluation Benchmark for Multimodal Dialogue Summarization [37.1] MDSEvalはMDSの最初のメタ評価ベンチマークである。
我々の研究は、MDSに特有の重要な評価次元を初めて特定し、形式化するものである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:38:27 GMT)
Predictive Preference Learning from Human Interventions [37.0] 今後の展開を予測するために,PPL(Predictive Preference Learning from Human Interventions)を導入する。
PPLは、各人間の介入をLの将来の時間ステップにブートストラップし、優先地平線(英語版)と呼ばれ、エージェントが同じ行動に追従し、ヒトが優先地平線に同じ介入をすると仮定する。
これらの将来の状態に好みの最適化を適用することにより、専門家の修正は、エージェントが探索されるであろう安全クリティカルな領域に伝播される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:38:18 GMT)
GARLIC: GAussian Representation LearnIng for spaCe partitioning [37.0] GARLICは、ユークリッド近傍(ANN)探索を高次元で行うための表現学習手法である。
そこで本手法では, 形状が局所幾何学と一致し, サイズがデータ密度に適応する異方性ガウス細胞に(mathbbRd)を分割する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:56:36 GMT)
On The Expressive Power of GNN Derivatives [36.8] 高次導波性GNN(HOD-GNN)は、メッセージパッシングニューラルネットワーク(MPNN)の表現性を高める新しい方法である。
得られたアーキテクチャファミリーの表現力は、WL階層と一致していることを示す。
計算効率を向上させるために,MPNNの高次微分を計算するためのメッセージパッシングアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:00:20 GMT)
Towards Photonic Band Diagram Generation with Transformer-Latent Diffusion Models [36.7] フォトニックバンドダイアグラム(BD)は、不均一な構造材料への光の伝播を研究する重要なツールである。
拡散モデルに基づくBD生成の最初のアプローチを紹介する。
本手法では,入力構造からコンテキスト埋め込みを抽出するトランスフォーマーエンコーダと遅延拡散モデルとを結合し,対応するBDを生成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:35:28 GMT)
Rethinking and Benchmarking Large Language Models for Graph Reasoning [36.3] グラフ推論のための大規模言語モデル(LLM)は、過去2年間にわたって広く研究されてきた。
近年の研究では、LLMがグラフ推論タスクを扱う可能性を示しているが、その性能は過大評価されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:19:14 GMT)
Scaling Laws for Optimal Data Mixtures [36.2] スケーリング法則を用いて、任意の対象領域に対して最適なデータ混合を決定するための体系的手法を提案する。
我々は,これらのスケーリング法則の普遍性を,その予測力を3つの異なる大規模設定で示すことによって検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:18:02 GMT)
Optimal Control Meets Flow Matching: A Principled Route to Multi-Subject Fidelity [36.0] テキスト・トゥ・イメージ(T2I)モデルは単一エンタリティ・プロンプトに優れるが、多目的記述に苦慮する。
マルチオブジェクト忠実度に向けてサンプリングダイナミクスを操るための原理的最適化可能な目的を持った最初の理論的枠組みを導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:58 GMT)
OpenTSLM: Time-Series Language Models for Reasoning over Multivariate Medical Text- and Time-Series Data [35.9] 時系列言語モデル(TSLM)のファミリであるOpenTSLMについて述べる。
OpenTSLMは学習可能な時系列トークンとテキストトークンをソフトプロンプトで結合することで、暗黙的に時系列をモデル化する。
本稿では,HAR-CoT,Sleep-CoT,ECG-QA-CoTの3つのデータセットを紹介する。
OpenTSLMのベースラインは69.9 F1、HARは65.4に達し、微調整されたテキストのみのモデルでは9.05と52.2であった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:58:23 GMT)
Compositional meta-learning through probabilistic task inference [35.7] 本稿では,タスクを再利用可能な計算の構造化組み合わせとして表現する合成メタラーニングモデルを提案する。
このアプローチは、新しいタスクの学習を確率論的推論問題に変換する。
単一の例から新しいソリューションを素早く推測する能力を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:58:48 GMT)
Continual Personalization for Diffusion Models [35.7] 概念ニューロン選択(Concept Neuron Selection, CNS)は、継続学習方式でパーソナライズを行うための単純かつ効果的なアプローチである。
CNSは概念ニューロンを段階的に微調整し、以前の概念から学んだ知識を共同で保存する。
CNSはまた、核融合のない操作を実現し、メモリストレージと連続的なパーソナライズのための処理時間を短縮する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:58:56 GMT)
High-Fidelity Speech Enhancement via Discrete Audio Tokens [35.6] DAC-SE1は言語モデルに基づくSEフレームワークで、離散的な高解像度オーディオ表現を利用する。
実験の結果,DAC-SE1は客観的指標とMUSHRAによる人的評価の両方において,最先端の自己回帰SE法を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:38:05 GMT)
Differential Information Distribution: A Bayesian Perspective on Direct Preference Optimization [35.3] 対象ポリシーに参照ポリシーを更新するために必要な差分情報を学習する際の選好最適化の目標について検討する。
まず、DPOの対数比の報酬は、ターゲットポリシーに参照ポリシーを更新するために必要な差分情報をエンコードする場合に一意に正当化される。
第2に、DPOにおけるトレーニングのダイナミクスが、ログライクな状態の変化や政策探索の変化など、どの程度の頻度で観察されているかについて論じる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:55 GMT)
Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs [35.3] 本稿では,LLVRを用いた強化学習が大規模言語モデル(LLM)に及ぼす影響を体系的に検討する。
RLVRは数学的タスクとコーディングタスクの両方の推論境界を拡張可能であることを示す。
本稿では,RLVRのインセンティブメカニズムを説明する理論的枠組みについて述べる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:31:47 GMT)
VLA-R1: Enhancing Reasoning in Vision-Language-Action Models [35.3] VLA(Vision-Language-Action)モデルは、知覚、言語理解、行動生成を統一することを目的としている。
現在のVLAモデルは、しばしば明示的なステップバイステップ推論を欠いている。
本稿では,検証リワードからの強化学習を統合した推論強化VLAであるVLA-R1を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:54:03 GMT)
IndexNet: Timestamp and Variable-Aware Modeling for Time Series Forecasting [35.2] IndexNetは、Index Embedding (IE)モジュールを備えたベクトルベースの拡張フレームワークである。
IEはタイムスタンプを埋め込みに変換し、入力シーケンスに注入することで、長期の複雑な周期パターンをキャプチャするモデルの能力を向上させる。
並行してCEは、各変数をそのインデックスに基づいてユニークで訓練可能なID埋め込みを割り当て、モデルが不均一な変数を明示的に区別できるようにする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:33:44 GMT)
PHORECAST: Enabling AI Understanding of Public Health Outreach Across Populations [35.1] PHORECAST (Public Health Outreach Receptivity and CAmpaign Signal Tracking) は、個人レベルの行動応答と、ヘルスメッセージングに対するコミュニティ全体のエンゲージメントパターンの両方を詳細に予測するための、マルチモーダルデータセットである。
このデータセットは、マルチモーダル理解、応答予測、パーソナライゼーション、社会的予測といったタスクをサポートし、現代のAIシステムがいかにして、異種公共の感情や振る舞いをエミュレートし、解釈し、予測できるかを厳格に評価することができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:10:46 GMT)
CLARITY: Clinical Assistant for Routing, Inference, and Triage [35.0] CLARITY(Clinical Assistant for Routing, Inference, and Triage)は、患者から特定者へのルーティング、臨床相談、患者の状態の重症度評価を容易にするAI駆動型プラットフォームである。
モジュール化されたフレームワーク上に構築されたCLARITYは、安全で効率的で堅牢なパフォーマンスを保証すると同時に、医療における既存およびITソリューションの要求を満たすために、柔軟で容易にスケーラブルである。
臨床助手を全国規模の総合病院間ITプラットフォームに統合し,2ヶ月以内に55,000件以上のコンテンツ豊富なユーザ対話を完了し,そのうち2500件を専門家による注釈付きで報告した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:18:41 GMT)
Safe and Efficient In-Context Learning via Risk Control [34.9] 大規模言語モデル(LLM)は、いくつかのコンテキスト内サンプルから新しいタスクを学習する。
LLMは不正または悪意のあるデモの影響を受けやすい。
本稿では,有害な実演がモデル性能を低下させる程度を制限するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:36:10 GMT)
Improving Virtual Contrast Enhancement using Longitudinal Data [34.8] ガドリニウム系造影剤(GBCA)はMRI(MRI)において病変の検出と特徴化を促進するために広く用いられている。
ガドリニウムの保持と脳や体組織への蓄積に関する懸念は、摂取量を減らす戦略の必要性を招いている。
フルコントラストT1強調MRI画像のコントラスト強調のためのディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:00:18 GMT)
VOTE: Vision-Language-Action Optimization with Trajectory Ensemble Voting [34.0] 視覚言語行動(VLA)モデルは、自然言語で案内されるロボット操作タスクにおいて優れた性能を示している。
現在のVLAモデルは、2つの欠点に悩まされている: (i) 高い推論遅延とトレーニングコストの増加につながる大量のトークンの生成、 (ii) 生成されたアクションの不十分な利用により性能が低下する。
並列性の高いアクショントークンを生成するために,VLAモデルを微調整するトレーニングフレームワークを開発し,推論遅延とトレーニングコストを効果的に低減する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:28:32 GMT)
The Unseen Frontier: Pushing the Limits of LLM Sparsity with Surrogate-Free ADMM [33.9] ニューラルネットワークプルーニングは、大規模言語モデルの過剰な計算およびメモリ要求を軽減するための有望な手法である。
我々は,高モデル忠実度を維持しつつ,極端にスペーサレベルを最大90%まで達成する,$textttElsa$という原理的かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:10:17 GMT)
FideDiff: Efficient Diffusion Model for High-Fidelity Image Motion Deblurring [33.8] FideDiffは、高忠実度デブロアリング用に設計された新しい単一ステップ拡散モデルである。
我々は、各タイムステップが徐々にぼやけた画像を表す拡散のようなプロセスとして、動きのデブロアリングを再構成する。
一致したぼやけた軌跡でトレーニングデータを再構成することにより、モデルは時間的一貫性を学習し、正確なワンステップのデブロワーを可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:44:45 GMT)
The (PXP)$^2$ model: long-range quantum scars in optical cavities [33.8] Rydberg-cavityシステムは量子シミュレーションと量子情報処理のための有望なプラットフォームとして登場している。
本研究では,このようなシステムに対して,最小限かつスケーラブルなモデルを導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:33:41 GMT)
Pre-training Limited Memory Language Models with Internal and External Knowledge [33.4] メモリ言語モデル(LMLM: Limited Memory Language Models)は,事前学習中に外部データベースに事実知識を外部化する言語モデルである。
実験により, LMLM は標準ベンチマークにおいてかなり大きな LLM と比較して, 競争性能が向上することを示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:55:28 GMT)
Beyond Slater's Condition in Online CMDPs with Stochastic and Adversarial Constraints [33.4] 本研究では, エンフォリンエピソード制約マルコフ決定過程(CMDP)について, 双方の制約下で検討した。
ストラディらによって導入された最先端のベスト・オブ・ボディーズ・アルゴリズムを大幅に改善する新しいアルゴリズムを提案する。
Slater の条件を使わずにサブリニア制約違反を保証し,インフン制約された最適値に対してサブリニア$alpha$-regret を保証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:29:31 GMT)
LOGicalThought: Logic-Based Ontological Grounding of LLMs for High-Assurance Reasoning [33.3] 高精度な推論には、正確で検証可能で証拠に根ざした結論が必要である。
本稿では, LOGicalThought と呼ばれる新しいニューロシンボリック・グラウンドアーキテクチャを提案する。
高度な論理言語と論理理論をLLMと組み合わせて、二重の記号グラフコンテキストと論理ベースのコンテキストを構築する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:06:23 GMT)
Multimodal Function Vectors for Spatial Relations [33.2] 視覚言語モデルOpenFlamingo-4Bの注意点のサブセットが空間関係の表現を伝達する役割を担っていることを示す。
これらのアテンションヘッドの活性化は、関数ベクトルと呼ばれ、リレーショナルタスクにおけるLMMのパフォーマンスを変更するために抽出し、操作することができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:55:56 GMT)
scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data [33.2] 単細胞RNAシークエンシング(scRNA-seq)は細胞不均一性を示す。
細胞クラスタリングは、細胞タイプとマーカー遺伝子の同定において重要な役割を担っている。
グラフニューラルネットワーク(GNN)ベースの手法はクラスタリング性能を大幅に改善した。
scSiameseCluはシングルセルRNA-seqデータを解釈するための新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:55:07 GMT)
Format Inertia: A Failure Mechanism of LLMs in Medical Pre-Consultation [33.1] 医療前処理では、Supervised Fine-Tuning (SFT) のデータセットは歪んだターン数分布を示す。
トレーニングデータセットのターン数分布を再調整する,シンプルなデータ中心の手法を採用する。
以上の結果より, 医療用プレコンサルテーションにおけるフォルマト・慣性障害の軽減効果が示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:29:38 GMT)
How Do Language Models Compose Functions? [32.9] 大規模言語モデル(LLM)は、構成的タスクを解く能力がますます高まっているようである。
フィードフォワード LLM が 2-hop のファクトリコールタスクをどのように解決するかを,$g(f(x))$ と表すことができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:21:34 GMT)
ActiveUMI: Robotic Manipulation with Active Perception from Robot-Free Human Demonstrations [32.6] 複雑な双方向操作が可能なロボットに人体でのデモンストレーションを転送する,データ収集システムのためのフレームワークであるActiveUMIを提案する。
ActiveUMIは、ロボットのエンドエフェクターをミラーするセンサー付きコントローラーを備えたポータブルVR遠隔操作キットを結合する。
操作者の意図した頭部の動きをヘッドマウントディスプレイで記録することにより,視覚的注意と操作の関係を学習する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:44:21 GMT)
Probabilistic Reasoning with LLMs for k-anonymity Estimation [32.3] 大規模言語モデルに対する不確実性を考慮した新しい数値推論タスクを提案する。
BRANCHは、与えられた情報と一致する集団の大きさのテキストのk-privacy値を推定する新しい手法である。
実験の結果,k値が73%と推定され,o3-miniとチェーン・オブ・シント推論の13%の増加が確認された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:36:23 GMT)
Should I Share this Translation? Evaluating Quality Feedback for User Reliance on Machine Translation [32.3] 本研究では,モノリンガルなユーザがまずMT出力を共有するか,次に品質フィードバックで共有するかを決定する,現実的な機械翻訳(MT)シナリオについて検討する。
エラーハイライトを除くすべてのフィードバックタイプは、決定精度と適切な信頼の両方を著しく改善する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:34:50 GMT)
The Reasoning Boundary Paradox: How Reinforcement Learning Constrains Language Models [31.8] RLVR(Reinforcement Learning with Verifiable Rewards)は,大規模言語モデルの推論能力向上のための重要な手法である。
最近の証拠は、拡張するのではなく、パラドックス的に推論境界を縮小する可能性があることを示唆している。
本稿では,RLVRの学習力学を解析することにより,RLVRの縮小問題を考察する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:17:27 GMT)
Unraveling Indirect In-Context Learning Using Influence Functions [31.7] 実世界の2つのシナリオ(Mixture of Tasks)とNoisy ICL(Nuisy ICL)に合わせたデモ選択戦略について検討する。
タスクの混合設定では、MMLU、BigBench、StrategyQA、CommonsenseQAを含む28のさまざまなタスクからデモが引き出される。
In the Noisy ICL setting, we examined scenarios may be mislabeled or having adversarial noise。
従来のICLセレクタとIFベースのセレクタの重み付けにより,コサイン類似度の平均2.90%,ノイズGLUEベンチマークのBSR2.94%の精度が向上することを示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:19:18 GMT)
Introduction to Online Control [31.7] オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:30:17 GMT)
Invisibility Cloak: Disappearance under Human Pose Estimation via Backdoor Attacks [31.6] 本研究では,人間行動推定システムの消失攻撃に対する脆弱性について検討する。
自動運転車がフロントシーンを誤って理解すれば、歩行者の命が危うくなる。
IntCフレームワークに基づく3つの特定のバックドア攻撃を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:32:59 GMT)
SCoT: Unifying Consistency Models and Rectified Flows via Straight-Consistent Trajectories [31.6] 本研究では,事前学習した拡散モデルに対する直線一貫性軌道(SCoT)モデルを提案する。
SCoTは、高速サンプリングのための両方のアプローチの利点を享受し、一貫した特性と直線的な性質のトラジェクトリを同時に生成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:39:18 GMT)
Learning Time-Series Representations by Hierarchical Uniformity-Tolerance Latent Balancing [31.6] TimeHUTは、コントラスト表現の階層的耐性バランスによって時系列表現を学習する新しい方法である。
本手法は, 組込み空間における一様性と耐久性の効果的なバランスを打つことを目的として, 強表現の学習に2つの異なる損失を用いる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:30:13 GMT)
Charting the Landscape of African NLP: Mapping Progress and Shaping the Road Ahead [31.5] アフリカは2000以上の言語を持つ世界で最も豊かな言語圏の1つである。
この多様性は、最先端の自然言語処理システムにはほとんど反映されない。
我々は過去5年間に出版されたアフリカ言語のためのNLPに関する884の研究論文を分析した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:01:14 GMT)
GaussianMorphing: Mesh-Guided 3D Gaussians for Semantic-Aware Object Morphing [31.5] マルチビュー画像から意味認識型3次元形状とテクスチャ形成のための新しいフレームワークを提案する。
私たちのフレームワークの中核は、3DGaussianをメッシュパッチの再構築にアンカーする統一的な変形戦略です。
提案したTexMorphベンチマークでは,GaussianMorphingは従来の2D/3D法よりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:07:55 GMT)
Interactive Learning for LLM Reasoning [31.5] 本稿では,大規模言語モデルの独立した問題解決能力を高めるために,マルチエージェントインタラクションが有効かどうかを検討する。
動的インタラクションと知覚を統合した新しいコラーニングフレームワークであるIRRを紹介する。
ILRはシングルエージェント学習を一貫して上回り、最強のベースラインよりも最大5%向上した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:13:53 GMT)
Understanding the Geospatial Reasoning Capabilities of LLMs: A Trajectory Recovery Perspective [31.2] 本稿では,Large Language Models (LLMs) が道路網地図を読み取ってナビゲーションを行うことができるかどうかを考察する。
トラジェクトリ・リカバリは,マスク付きGPSトレースを復元するモデルを必要とするプロキシ・タスクである。
我々のプロンプトフレームワークは,道路ネットワークをコンテキストとして使用することにより,外部ナビゲーションツールにアクセスすることなく,有効な経路を生成することができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:37:41 GMT)
Learning to Reason for Hallucination Span Detection [31.1] 複数回サンプリングすると,少なくとも1つの正解が得られた。
そこで我々はRL4HSを提案する。RL4HSは多段階報酬関数による推論を動機づける強化学習フレームワークである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:24:28 GMT)
Joint Deblurring and 3D Reconstruction for Macrophotography [30.9] 本稿では,マクロフォトグラフィの3次元再構成法を提案する。
オブジェクトのクリアな3次元モデルと各ピクセルのデフォーカスブラーカーネルを共同で最適化する。
提案手法は,画質の劣化だけでなく,高忠実度3D外観の復元も可能である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:43:05 GMT)
Enhancing Large Language Model Reasoning with Reward Models: An Analytical Survey [30.9] リワードモデル(RM)はLLMの推論性能を高める上で重要な役割を担っている。
本稿では, RM の体系的紹介と LLM 推論におけるそれらの応用に関する包括的調査について述べる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:42:17 GMT)
Reliable Decision Making via Calibration Oriented Retrieval Augmented Generation [30.8] 大規模言語モデルが自信を持って誤った情報を提供すると、人間に最適な決定を下すことになる。
本稿では、RAG による決定が適切に校正されていることを保証するCalibrated Retrieval-Augmented Generation (CalibRAG)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:29:05 GMT)
Knowledge Distillation Detection for Open-weights Models [30.6] 本稿では,データ不要な入力合成と,蒸留検出のための統計的スコアを組み合わせたモデルに依存しないフレームワークを提案する。
我々のアプローチは分類モデルと生成モデルの両方に適用できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:14 GMT)
VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL [30.6] VidGuard-R1は、マルチモーダルな大規模言語モデルを微調整する最初のビデオ認証検出器である。
私たちのモデルは、非常に正確な判断と洞察に富んだ推論の両方を提供します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:55:37 GMT)
Can Code-Switched Texts Activate a Knowledge Switch in LLMs? A Case Study on English-Korean Code-Switching [30.5] 近年の大規模言語モデル (LLM) は多言語能力を示すが, コーパスの訓練において英語が支配的であったため英語中心である。
Code-switching (CS) は、多言語話者が会話の中で言語を交互に交互に話す現象であり、微妙な文化的・言語的なニュアンスを伝えることができる。
LLMが低リソース言語タスクを解く際に、コードスイッチングが推論のための知識を活性化するか、特定し、活用できるかを検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:40:50 GMT)
Holistic Order Prediction in Natural Scenes [30.5] InstaFormerは、全体的な順序予測が可能なネットワークである。
InstaFormerは、シーン内のすべてのインスタンスの完全なオクルージョンとディープオーダを、単一のフォワードパスで返します。
私たちのコードとモデルはオープンソースで、このURLで利用可能です。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:24:12 GMT)
MultiModal Action Conditioned Video Generation [30.4] 汎用的な家庭用ロボットは、微妙な作業や緊急状況に対処するために、リアルタイムの微細モータ制御を必要とする。
我々は, 運動感覚, 運動感覚, 力覚覚, 筋活動の感覚を考察する。
実験により,マルチモーダル感覚を取り入れることでシミュレーション精度が向上し,時間的ドリフトが低減されることが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:57:06 GMT)
Normality Calibration in Semi-supervised Graph Anomaly Detection [30.4] GraphNCはグラフ正規度校正フレームワークである。
異常スコアとノード表現空間において、教師モデルから正規性を校正する。
それは、異常スコア分布アライメント(ScoreDA)と摂動に基づく正規化(NormReg)の2つの主要コンポーネントを含んでいる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:36:04 GMT)
GuruAgents: Emulating Wise Investors with Prompt-Guided LLM Agents [30.3] 本研究では,AIエージェントであるGuruAgentsが,伝説的な投資目標の戦略を体系的に運用可能であることを示す。
我々は、金融ツールと決定論的推論パイプラインを統合するプロンプトに、それぞれ独自の哲学をエンコードすることで、象徴的な投資家をエミュレートするために、5つの異なるGruAgentを開発する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:45:27 GMT)
Enhanced DACER Algorithm with High Diffusion Efficiency [30.1] DACERv2を提案する。これはQ-gradientフィールドの目的を利用して,各拡散ステップにおけるdenoisingプロセスの導出を行う。
DACERv2は,5つの拡散ステップしか持たない複雑な制御環境において高い性能を示し,マルチモーダル性を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:34:44 GMT)
Fiber-integrated NV Magnetometer with Microcontroller-based Software Lock-in Technique [30.0] 我々は、ファイバ集積型NV磁力計を作製し、低コストのマイクロコントローラベースのソフトウェアロックイン技術を開発した。
我々は93nT/Hz1/2の感度で弱磁場の検出を実現した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:18:11 GMT)
Executable Counterfactuals: Improving LLMs' Causal Reasoning Through Code [29.4] コードや数学の問題を通した因果推論を運用するフレームワークである実行可能逆ファクトアルを導入する。
その結果,o4-mini や Claude-4-Sonnet などの SOTA モデルでは,介入による精度 (25-40%) の低下が認められた。
また、コードで訓練されたモデルが、反実数ワード問題に一般化するかどうかを検証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:26:35 GMT)
VAR-MATH: Probing True Mathematical Reasoning in LLMS via Symbolic Multi-Instance Benchmarks [29.3] 近年の強化学習の進歩により,LLMの数学的推論能力は大幅に向上した。
これらの利得は、ランダムや逆の報酬のような欠陥のある信号で訓練されたモデルであっても、しばしば持続する。
このような改善は真の推論を反映しているのか、それとも単にベンチマーク固有のパターンに過度に適合した成果物なのか?
固定数値問題をパラメータ化テンプレートに変換するシンボル評価フレームワークであるVAR-MATHを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:19:01 GMT)
Next-Generation LLM for UAV: From Natural Language to Autonomous Flight [29.2] 本稿では,大規模言語モデルをUAV操作に統合するための総合的な実証と自動化のロードマップを示す。
NeLVシステムは自然言語の命令を処理し、短距離、中距離、長距離のUAVミッションを編成する。
異なる運用規模にまたがる3つの代表的なユースケースを通じて,システムの実現可能性を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:09:58 GMT)
RIFLE: Removal of Image Flicker-Banding via Latent Diffusion Enhancement [29.0] FB(Flicker-banding)は、カメラのローリングシャッター読み出しとディスプレイの明るさ変調との間の時間的エイリアスから生じる明るさ%u2013darkストライプを交互に変化させる。
我々は、FB除去を専用修復タスクとして定式化し、遅延拡散拡張(RIFLE)による画像フリッカバンディングの除去を導入する。
我々の知る限りでは、FBのシミュレーションと除去の研究は初めてである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:15:56 GMT)
Moon: A Modality Conversion-based Efficient Multivariate Time Series Anomaly Detection [28.7] 教師付きモダリティ変換に基づく多変量時系列異常検出フレームワークを提案する。
月は異常検出の効率と精度を高め、詳細な異常解析レポートを提供する。
月の効率は最大93%、精度は4%、解釈性能は10.8%である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:43:40 GMT)
Words That Make Language Models Perceive [28.5] 大規模言語モデル(LLM)は、純粋にテキストに基づいて訓練され、直接知覚的な経験が欠けているが、その内部表現は、言語で符号化されたマルチモーダル正規性によって暗黙的に形作られる。
我々は、明示的な感覚刺激がこの潜伏構造を表面化し、テキストのみのLLMを専門的な視覚やオーディオエンコーダと密接な表現的アライメントをもたらすという仮説を検証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:58:04 GMT)
Learning to Generate Object Interactions with Physics-Guided Video Diffusion [28.2] 我々は,現実的な剛体制御,インタラクション,エフェクトを可能にする物理誘導型ビデオ生成のアプローチであるKineMaskを紹介する。
本研究では,物体マスクによる将来の運動監視を段階的に除去する2段階のトレーニング戦略を提案する。
実験により、KineMaskは、同等の大きさの最近のモデルよりも強力な改善を達成している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:56:46 GMT)
Temporal Overlapping Prediction: A Self-supervised Pre-training Method for LiDAR Moving Object Segmentation [28.0] LiDARポイントクラウド上でのオブジェクトセグメンテーション(MOS)の移動は、自動運転車のような自律システムにとって不可欠である。
本稿では,ラベル付けの負担を軽減する自己教師付き事前学習手法である,教師付きオーバーラップ予測(TOP)を提案する。
このバイアスを補うために、オブジェクトレベルのパフォーマンスを評価するためにmIoU_objと呼ばれる追加のメトリクスを導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:05:19 GMT)
Just Do It!? Computer-Use Agents Exhibit Blind Goal-Directedness [28.0] コンピュータ・ユース・エージェント(CUA)がBGD(Blind Goal-Directedness)を一貫して表示することを示す。
BGDは、実現可能性、安全性、信頼性、コンテキストに関わらず、目標を追求するバイアスである。
これら3つのパターンをキャプチャする90のタスクのベンチマークであるBLIND-ACTを開発した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:52:15 GMT)
Self-Consistency Falls Short! The Adverse Effects of Positional Bias on Long-Context Problems [27.8] 自己整合性(SC)は、短いコンテンツを含む様々なタスクや領域にわたる大規模言語モデル(LLM)の性能を改善する。
SCの利点が長文設定に一般化されるという仮定に挑戦する。
SCは改善に失敗するだけでなく、長文タスクのパフォーマンスを積極的に低下させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:33:29 GMT)
LLM-Based Multi-Task Bangla Hate Speech Detection: Type, Severity, and Target [27.8] マルチタスクのヘイトスピーチデータセットであるBanglaMultiHateを紹介した。
ゼロショットプロンプトとLoRAファインチューニングの下で,古典的ベースライン,モノリンガル事前学習モデル,LLMを比較した。
本実験は,低リソース環境下でのLLM適応性を評価し,一貫した傾向を示すものである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:17:11 GMT)
Mitigating Modal Imbalance in Multimodal Reasoning [27.8] ファンデーションモデル(FM)は、コンピュータ利用エージェントのような現実世界のタスクに多様なモダリティを統合する必要がある。
我々は、モダリティにまたがる矛盾する証拠が提示される、モダリティ間の対立に関するFMについて研究する。
実験の結果,FMは単一モーダリティから構成される単一モーダリティのコンフリクトを認識できることがわかったが,証拠がモーダリティに分割された場合,その比率は3%以下に低下した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:58:28 GMT)
MPMAvatar: Learning 3D Gaussian Avatars with Accurate and Robust Physics-Based Dynamics [27.6] MPMAvatarは、マルチビュービデオから3Dヒューマンアバターを作成するためのフレームワークである。
高精度でロバストな動的モデリングのために、我々はMaterial Point Methodベースのシミュレータを使う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:51:45 GMT)
CrediBench: Building Web-Scale Network Datasets for Information Integrity [27.6] CrediBenchは、時間的Webグラフを構築するための大規模データ処理パイプラインである。
我々のアプローチは、一般的な誤情報領域の動的進化を捉えている。
本稿では,このグラフスナップショットを用いた実験から,信頼度を学習するための構造的およびWebページコンテンツ信号の強度を実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:03:57 GMT)
Concept Unlearning by Modeling Key Steps of Diffusion Process [27.4] 概念アンラーニングは、テキストから画像への拡散モデルが望ましくない視覚コンテンツを生成するために誤用されるのを防ぐために使われてきた。
我々は,キーステップの概念学習(KSCU)を提案し,ターゲット概念へのキーステップでモデルを選択的に微調整する。
例えば、I2Pデータセットでは、KSCUは、未学習のヌード精度が8.3%向上し、FIDは8.4%向上し、全体的なスコアは0.92で、他のSOTAメソッドをほぼ上回っている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:04:38 GMT)
Knowledge-Graph Based RAG System Evaluation Framework [27.1] 大規模言語モデル(LLM)は重要な研究対象となっている。
Retrieval Augmented Generation (RAG)は、生成したコンテンツの信頼性と関連性を大幅に向上させる。
RAGシステムの評価は依然として難しい課題である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:36:21 GMT)
Sketching Low-Rank Plus Diagonal Matrices [26.8] この研究は、低ランク*と*の対角成分を同時に推定するSKETCHLORDを導入する。
理論的および経験的に、この結合推定は任意の逐次変量よりも優れていることを示す。
合成(近似)LoRD行列に関する総合的な実験により、これらの構造を正確に復元するSKETCHLORDの性能が確認された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:30:03 GMT)
Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization [26.6] DecisionFocused by Supervised Learningは、ロバストなポートフォリオ最適化のためのフレームワークである。
DSLはDeep Ensembleメソッドを使用し、ポートフォリオ割り当てのばらつきを大幅に低減します。
アンサンブルサイズが大きくなると、中央値のリターンが向上し、リスク調整性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:08:58 GMT)
Pack and Force Your Memory: Long-form and Consistent Video Generation [26.5] ロングフォームビデオ生成は2つの課題を提示します。
モデルは、自動回帰復号に固有のエラーの蓄積を防止しながら、長距離依存関係をキャプチャしなければなりません。
MemoryPackとDirect Forcingは、長期ビデオ生成のコンテキスト一貫性と信頼性を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:22:46 GMT)
MambAttention: Mamba with Multi-Head Attention for Generalizable Single-Channel Speech Enhancement [26.5] 本稿では,Mambaと時間・周波数・マルチヘッドアテンションモジュールを組み合わせた新しいハイブリッドアーキテクチャMambAttentionを提案する。
提案するMambAttentionモデルは,既存の最先端LSTM-, xLSTM-, Mamba-, Conformerベースのシステムよりも優れている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:19:53 GMT)
Exploring Resolution-Wise Shared Attention in Hybrid Mamba-U-Nets for Improved Cross-Corpus Speech Enhancement [26.5] 本稿では,Mambaとマルチヘッドアテンションを組み合わせたハイブリッドモデルであるRWSA-MambaUNetを提案する。
我々の最も優れたRWSA-MambaUNetモデルは、ドメイン外の2つのテストセットにおける最先端の一般化性能を達成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:27:29 GMT)
Injecting Measurement Information Yields a Fast and Noise-Robust Diffusion-Based Inverse Problem Solver [26.5] 条件付き後続平均 $mathbbE [mathbfx_t, mathbfy]$ を推定する。
結果として得られる予測は、任意の標準サンプリングに組み込むことができ、高速でメモリ効率の良い逆解法をもたらす。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:56:22 GMT)
Automated Genomic Interpretation via Concept Bottleneck Models for Medical Robotics [26.4] そこで本研究では,DNA配列を動的かつ解釈可能な決定に変換する自動ゲノム解析モジュールを提案する。
われわれのフレームワークは、Chaos Game RepresentationとConcept Bottleneck Model(CBM)を組み合わせて、生物学的に意味のある概念を流れるように予測する。
本研究は、解釈可能なゲノムモデリングと自動意思決定のギャップを埋めることにより、ゲノム医学におけるロボットと臨床の自動化のための信頼性の高い基盤を確立する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:51:34 GMT)
V2X-UniPool: Unifying Multimodal Perception and Knowledge Reasoning for Autonomous Driving [25.8] V2X-UniPoolは、知識駆動型ADのための言語ベースの推論とV2X知覚を統一するフレームワークである。
マルチモーダルなV2Xデータを構造化された言語ベースの知識に変換し、時間的に一貫した推論のためにタイムインデックスの知識プールに編成し、リアルタイムな文脈で決定を下すためにRetrieval-Augmented Generation(RAG)を使用する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:56:05 GMT)
Diagnosing Bottlenecks in Data Visualization Understanding by Vision-Language Models [25.6] 現在の視覚言語モデル(VLM)は、基本的なデータ可視化理解タスクに苦戦している。
VLMの失敗は、データビジュアライゼーションにおける視覚情報のエンコード方法、視覚と言語モジュール間の情報転送方法、言語モジュール内での情報処理方法の制限に起因するか?
我々は,データ可視化理解タスクのスイートであるFUGUを開発した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:29:07 GMT)
Downgrade to Upgrade: Optimizer Simplification Enhances Robustness in LLM Unlearning [25.5] 大言語モデル(LLM)は、既存のモデルから望ましくないデータや知識の影響を外科的に除去することを目的としている。
最近の知見は、ウェイト量子化や微調整のような未学習操作が、意図した忘れを迅速に中和できることを示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:40:37 GMT)
Causal-Adapter: Taming Text-to-Image Diffusion for Faithful Counterfactual Generation [25.4] Causal-Adapterは、凍結したテキストから画像への拡散バックボーンを、反ファクト画像生成に適応させるモジュラーフレームワークである。
本手法は目的属性に対する因果的介入を可能にし,画像のコアアイデンティティを変更することなく因果的依存者に対する影響を一貫して伝播させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:36:26 GMT)
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis [25.4] TimeSeriesScientist(TSci)は時系列予測のための一般的なドメインに依存しないフレームワークである。
これはそれぞれ平均10.4%と38.2%の予測誤差を減少させる。
透明な自然言語の合理性と包括的な報告により、TSciは予測をホワイトボックスシステムに変換する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:18:59 GMT)
NPN: Non-Linear Projections of the Null-Space for Imaging Inverse Problems [25.4] 逆問題の画像化は、アンダーサンプリングされた雑音測定から高次元信号を復元することを目的としている。
我々はNull-Space (NPN) のテキスト非線形射影を提案する。
NPNは、ニューラルネットワークによる知覚行列のヌル空間の低次元射影にある解を促進する新しい正規化のクラスである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:45:06 GMT)
Demystifying Synthetic Data in LLM Pre-training: A Systematic Study of Scaling Laws, Benefits, and Pitfalls [25.3] 大規模言語モデル(LLM)のスケーリングにおいて、トレーニングデータは重要な役割を果たすが、高品質なデータは供給が限られている。
自然のWebデータ、多様な合成タイプ(言い換えテキスト、生成された教科書)、および自然と合成データの混合を比較した。
合成テキストの事前学習は、天然のWebテキストの事前学習よりも高速ではない。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:24:42 GMT)
Revisiting Query Variants: The Advantage of Retrieval Over Generation of Query Variants for Effective QPP [24.4] 本稿では,QPPの所定のターゲットクエリに対するトレーニングセットからQVを抽出する手法を提案する。
最も類似した情報を必要とするクエリの検索において高いリコールを達成するため、直接検索したQVを第2検索により拡張する。
TREC DL'19 と DL'20 を用いて行った実験により,本手法により得られたQVを用いたQPP法は,既存のQVベースのQPP法よりも最大20%高い性能を示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:36:58 GMT)
Say One Thing, Do Another? Diagnosing Reasoning-Execution Gaps in VLM-Powered Mobile-Use Agents [24.4] 視覚言語モデル(VLM)を利用したモバイル利用エージェントは、自然言語命令の解釈に大きな可能性を示している。
近年の研究では、チェーン・オブ・ソート(CoT)推論を取り入れることで、実行精度が向上する傾向が示唆されている。
既存の評価では、CoT推論が地道行動と一致しているかどうかを無視しながら実行精度を強調している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:51:19 GMT)
Nav-EE: Navigation-Guided Early Exiting for Efficient Vision-Language Models in Autonomous Driving [24.3] Nav-EEは、タスク固有のエグジット層をオフラインでプリコンプリートし、それらをオンラインに動的に適用する、ナビゲーション誘導早期退避フレームワークである。
実験によると、Nav-EEは完全な推論に匹敵する精度を達成し、レイテンシを最大63.9%削減している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:37:58 GMT)
LOBE-GS: Load-Balanced and Efficient 3D Gaussian Splatting for Large-Scale Scene Reconstruction [24.2] 3D Gaussian Splatting (3DGS) はリアルタイム・高忠実な3Dシーン再構築のための効率的な表現として確立されている。
本稿では,ロードバランシングと効率的な3DガウススティングフレームワークであるLoBE-GSを紹介する。
LoBE-GSは、最先端のベースラインよりも、エンドツーエンドのトレーニングタイムが最大2ドル高速になる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:02:06 GMT)
A Rigorous Benchmark with Multidimensional Evaluation for Deep Research Agents: From Answers to Reports [24.1] Deep Research Agents (DRA)は、タスク分解、クロスソース検索、多段階推論、構造化出力の能力を示す。
本稿では,DRAとレポートスタイルの応答に適した厳密なベンチマークと多次元評価フレームワークを提案する。
このフレームワークは、DRAが生成した長期レポートの総合的な評価を可能にし、セマンティックな品質、トピックの焦点、検索の信頼性のための総合的なスコアリング指標を統合する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:40:02 GMT)
A Single Character can Make or Break Your LLM Evals [24.0] LLM (Common Large Language Model) 評価において, 例を形式化する方法の選択について検討する。
この一見小さな選択は、モデルレスポンスの品質を劇的に変える可能性がある。
注意点のスコアを求めることで、入力中のキートークンに対して優れた注意を向けることが分かる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:27:28 GMT)
InvThink: Towards AI Safety via Inverse Reasoning [23.9] InvThinkは、大きな言語モデルに、逆思考の能力を与える。
i) 安全性の改善は, 既存の安全手法と比較して, モデルサイズによるスケーリングがより強力であることを示す。
InvThinkは、外向き(医療、金融、法律)やエージェント的(ブラックメール、殺人)のリスクシナリオを含む高い領域で優れており、有害反応の最大15.7%の減少を達成している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:26:53 GMT)
NeSyGeo: A Neuro-Symbolic Framework for Multimodal Geometric Reasoning Data Generation [23.6] NeSyGeoは、幾何学的推論データを生成するための新しいニューロシンボリックフレームワークである。
MLLMの幾何学的推論能力を評価するためのベンチマークNeSyGeo-Testをリリースする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:15:25 GMT)
RainSeer: Fine-Grained Rainfall Reconstruction via Physics-Guided Modeling [23.4] RainSeerは、レーダー反射率を物理的に接地された構造的事前捕獲として再解釈する構造対応の再構築フレームワークである。
RainSeerは2つの基本的な課題に対処する: 高解像度のレーダーフィールドをスパースポイントワイドの降雨観測に変換し、アロフト・ハイドロ・メータと地上レベルの降水の間の物理的切断をブリッジする。
我々は,現状のベースラインに対する一貫した改善を観察し,MAEを13.31%以上削減し,再建された雨田における構造的忠実度を著しく向上させた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:14:18 GMT)
Learning to Decide with Just Enough: Information-Theoretic Context Summarization for CDMPs [23.1] コンテキストマルコフ決定プロセス(CMDP)は、外部信号の下でのシーケンシャルな意思決定のためのフレームワークを提供する。
本稿では,大言語モデル(LLM)を用いて文脈入力を低次元,意味的に豊かな要約に圧縮する情報理論の要約手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:52:24 GMT)
Who's Wearing? Ear Canal Biometric Key Extraction for User Authentication on Wireless Earbuds [23.0] Ear canal scan/Sensing (ECS) は、無線イヤホンと組み合わせたモバイル機器の生体認証手法として登場した。
資源制約型イヤホンにおける耳道キー抽出プロトコルである textbfEarID を提案する。
評価の結果,EarIDの認証精度は98.7%であり,機械学習の分類器に匹敵することがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:59:03 GMT)
PASTA: A Unified Framework for Offline Assortment Learning [22.9] オフラインおよびデータ駆動環境でのアソシエーション最適化の幅広いクラスについて検討する。
このような問題において、企業は、基礎となる選択モデルに関する事前知識を欠き、過去の顧客選択データに基づいて最適な選択肢を決定することを目的としている。
我々は、悲観主義の原理を利用して、一般的な選択モデルの下で最適な予測収益を達成する新しい悲観的最適化フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:47:56 GMT)
microCLIP: Unsupervised CLIP Adaptation via Coarse-Fine Token Fusion for Fine-Grained Image Classification [22.8] 微細な画像分類のためのCLIPベースの視覚モデル(VLM)の教師なし適応には、顕微鏡的局所的手がかりに対する感度が必要である。
我々は,CLIPの視覚的表現とテキスト的表現を微調整する自己学習フレームワークである$textbfmicroCLIP$を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:47:39 GMT)
Use the Online Network If You Can: Towards Fast and Stable Reinforcement Learning [22.7] 本稿では,ターゲットネットワークとオンラインネットワーク間の最小推定値を用いてターゲットを演算する新しい更新ルールを提案する。
MINTOは、ブートストラップにオンラインネットワークを使用する際の潜在的な過大評価バイアスを軽減し、より高速で安定した値関数学習を可能にする。
我々はMINTOを様々なベンチマークで広く評価し、オンラインとオフラインのRL、そして離散かつ連続的なアクション空間にまたがる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:48:01 GMT)
Euclid's Gift: Enhancing Spatial Perception and Reasoning in Vision-Language Models via Geometric Surrogate Tasks [22.5] ユークリッド幾何学の問題解決を代理課題として扱う。
モデルがユークリッドの原理を取得し、適用できるようにするため、Qwen2.5VLファミリーとRoboBrain2.0ファミリーを微調整する。
実験により, 得られたモデルが4つの空間的推論ベンチマークにおいて, 実質的なゼロショットゲインを達成できることが実証された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:05:35 GMT)
xLSTM Scaling Laws: Competitive Performance with Linear Time-Complexity [22.4] スケーリング法則は、大規模言語モデルの成功において中心的な役割を果たす。
xLSTMのような最近の選択肢は、コンテキスト長に関する線形複雑性を提供する。
xLSTMの利点は、トレーニングと推論のコンテキストが大きくなるにつれて拡大します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:14:34 GMT)
Plan Then Action:High-Level Planning Guidance Reinforcement Learning for LLM Reasoning [22.2] 本稿では,高レベルプランニングときめ細かいCoT推論の両方を改善するために設計された2段階のフレームワークを提案する。
第1段階では,高度なLCMを用いてCoTを蒸留して高レベル誘導を行い,それを教師付き微調整に用いる。
第2段階では、最終出力と高レベルガイダンスの品質を協調的に最適化するガイダンス対応RL手法を導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:28:13 GMT)
A Multi-Fidelity Control Variate Approach for Policy Gradient Estimation [22.1] 強化学習アルゴリズムは、運用システムへの展開や高価な高忠実度シミュレーションによるトレーニングには実用的ではない。
低忠実度シミュレータは、ゼロショット転送には大きすぎるとしても、RLトレーニングに有用なデータを提供することができる。
ターゲット環境から少量のデータを混合する多要素ポリシーロボティクス(Gs)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:33:19 GMT)
Do You Know Where Your Camera Is? View-Invariant Policy Learning with Camera Conditioning [22.0] 本研究では、カメラ外在物に明示的に条件付けすることで、ビュー不変の模倣学習について検討する。
本研究では,外在的条件付けが標準行動クローニングポリシーの観点における一般化を著しく向上させることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:47:06 GMT)
Model Parallelism With Subnetwork Data Parallelism [21.9] 大規模な大規模ニューラルネットワークの事前トレーニングは、アクセラレータに大量のメモリ要求を課し、しばしば高価な通信を必要とする。
本稿では,分散トレーニングフレームワークであるSubnetwork Data Parallelism(SDP)を紹介する。
本研究では,不偏勾配を維持するために下位段階のみに空間性を適用した後方マスキングと,前方パスのパラメータを除去してより高効率なゲインを実現する前方マスキングの2つの相補的なマスキング方式について検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:50:31 GMT)
On Code-Induced Reasoning in LLMs [21.9] 並列命令データセットを10のプログラミング言語で構築する。
コードの構造的・意味的特性を選択的に破壊する制御摂動を適用する。
以上の結果から,LLMは意味論的よりも構造的摂動に弱いことが示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:45:24 GMT)
A Family of Kernelized Matrix Costs for Multiple-Output Mixture Neural Networks [21.9] ペアワイズ距離に基づくコストは、自己監督的でコントラストのある特徴学習に不可欠である。
本稿では,4種類のカーネル化行列コストを用いたデータ密度近似を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:02:29 GMT)
L4P: Towards Unified Low-Level 4D Vision Perception [21.8] 我々は,低レベルな4次元知覚タスクを統一されたフレームワークで解くフィードフォワードアーキテクチャであるL4Pを提案する。
一般およびフィードフォワードの定式化にもかかわらず,本手法は高密度タスクの既存の特殊手法と競合する。
すべてのタスクを一度に解決し、シングルタスクのメソッドに匹敵する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:19:26 GMT)
Leveraging Prior Knowledge of Diffusion Model for Person Search [21.7] 人物探索は,人物検出と再同定を共同で行うことを目的とする。
既存の手法は主にImageNetで事前訓練されたバックボーンを使用し、複雑な空間コンテキストをキャプチャするのに最適である。
本稿では,2つのサブタスク間の最適化競合を解消しつつ,事前学習した拡散モデルを活用する新しいフレームワークDiffPSを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:36:26 GMT)
First Hallucination Tokens Are Different from Conditional Ones [21.6] 最初の幻覚トークンは、その後のトークンよりもはるかに検出可能である。
この構造特性はモデル全体で保持され、最初の幻覚トークンがトークンレベルの幻覚検出において重要な役割を果たすことを示唆している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:56:25 GMT)
StealthAttack: Robust 3D Gaussian Splatting Poisoning via Density-Guided Illusions [21.6] ニューラルレイディアンス・フィールド(NeRF)や3Dガウス・スプレイティング(3DGS)のような3次元シーン表現法は、新規なビュー合成を著しく進歩させた。
画像レベルの中毒に対する3DGSを解析し,新しい密度誘導毒法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:57 GMT)
Mutual Information Guided Backdoor Mitigation for Pre-trained Encoders [21.4] 事前訓練されたエンコーダ上に構築された下流タスクは、ほぼ最先端のパフォーマンスを達成することができる。
バックドア緩和技術は 下流のタスクモデルのために設計されています
MIMICは、潜在的なバックドアエンコーダを教師ネットとして扱い、知識蒸留を用いて教師ネットからクリーンな学生エンコーダを蒸留する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:02:48 GMT)
Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features [21.2] 本稿では、任意の機能の下で線形TD($lambda$)演算に対する最初の$L2$収束率を確立する。
任意の特徴から生じる解の潜在的非特異性に対処するために、単一点ではなく解集合への収束率を特徴とする新しい近似結果を開発する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:11:02 GMT)
Support Basis: Fast Attention Beyond Bounded Entries [21.2] 本稿では,有界エントリを超越した効率的なアテンション近似のための新しいフレームワークであるSupport-Basis decompositionを紹介する。
提案手法では,この特性を利用して大小の成分を分割し,スパース成分の正確な計算と高密度成分の近似を可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:51:28 GMT)
Learning a distance measure from the information-estimation geometry of data [21.1] Information-Estimation Metric (IEM)は,信号領域上の基礎となる連続確率密度から導出される距離関数の新たな形式である。
特に、IEMは、ノイズ振幅の範囲でそれらのノイズベクトルを比較して得られる。
実験により、このIMMは人間の知覚的判断を予測する上で、最先端の教師付き画像品質指標と競合するか、上回っていることが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:39:45 GMT)
TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling [20.9] 本稿では,ツールコールによる楽曲レコメンデーションシステムを提案する。
本システムでは,LLMをユーザ意図を解釈するエンドツーエンドのレコメンデーションシステムとして位置付ける。
この統合ツールコールフレームワークは,さまざまなレコメンデーションシナリオ間での競合性能を実現することを実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:08:54 GMT)
Differentially Private Federated Learning: A Systematic Review [20.8] 本稿では,様々な差分プライバシモデルとシナリオの定義と保証に基づく,差分私的フェデレーション学習の新しい分類法を提案する。
本研究は,プライバシ保護フェデレーション学習に関する貴重な知見を提供し,今後の研究に向けた実践的方向性を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:36:06 GMT)
Initialization using Update Approximation is a Silver Bullet for Extremely Efficient Low-Rank Fine-Tuning [20.7] 低ランク部分空間内で完全な微調整を近似する手法を提案する。
我々は、LoRA-XSのアーキテクチャを活用し、高階勾配更新のための最適なスケーリングを実現する。
この結果から,低ランク部分空間における完全微調整のシミュレートが可能であることが判明した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:20:07 GMT)
Addressing Pitfalls in the Evaluation of Uncertainty Estimation Methods for Natural Language Generation [20.7] 幻覚は、大きな言語モデル(LLM)の信頼性を損なう一般的な問題である。
近年の研究では、LLMの予測的不確実性によって生じる幻覚のサブセット、すなわち confabulations が特定されている。
衝突を検出するため,自然言語生成における予測不確かさを推定する様々な手法が開発されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:54:09 GMT)
Enhancing Noise Robustness of Parkinson's Disease Telemonitoring via Contrastive Feature Augmentation [20.7] パーキンソン病(英: Parkinson's disease、PD)は、神経変性疾患の1つである。
PDテレモニターは、Unified Parkinson's Disease Rating Scale (UPDRS)の自己管理型家庭内テストを可能にする新しい評価モダリティとして出現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:07:41 GMT)
Quagmires in SFT-RL Post-Training: When High SFT Scores Mislead and What to Use Instead [20.4] 我々は,高いSFTスコアがRL後の性能向上に寄与するかどうかを検討した。
高いSFTスコアは、より単純あるいはより均一なデータに偏りがあり、その後のRLゲインやスケールアップ後の学習効果を確実に予測できない。
本稿では,RL結果に対して強力なプロキシを提供するために,代替指標について検討し,ホールドアウト推論例とPass@large kパフォーマンスについて一般化損失を同定する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:57:00 GMT)
Quantifying non-Hermiticity using single- and many-particle quantum properties [20.4] 量子系の非エルミート的パラダイムは、エルミート的パラダイムとは大きく異なる有能な特徴を示す。
単体および多粒子量子特性に対して、これらの左右のアンサンブルの(dis-)相似性を定量化する形式論を提案する。
我々の発見は、非エルミート量子多体系の新しいエキゾチック量子相を明らかにするのに役立てることができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:49:43 GMT)
On Predictability of Reinforcement Learning Dynamics for Large Language Models [20.3] 本研究は,大言語モデルにおけるRLによるパラメータ更新の2つの基本特性を同定する。
短期早期訓練ウィンドウを用いて最終パラメータ更新を補間するプラグインアクセラレーションフレームワークであるAlphaRLを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:16:51 GMT)
Fine-Tuning Flow Matching via Maximum Likelihood Estimation of Reconstructions [20.3] フローマッチング(FM)アルゴリズムは、特にロボット操作において、生成タスクにおいて顕著な結果をもたらす。
本稿では,FMにおけるトレーニング損失と推論誤差の関係を理論的に解析する。
そこで本研究では,再構成の最大精度推定によるFM微調整手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:49:47 GMT)
Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion [20.0] ニューラル潜伏部分空間に符号化された視覚的意味属性を可視化し、検証するMIG-Visを提案する。
2つのマカクの下側頭葉(IT)大脳皮質からのマルチセッションニューラルスパイクデータセット上でMIG-Visを検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:33:40 GMT)
Agent-ScanKit: Unraveling Memory and Reasoning of Multimodal Agents via Sensitivity Perturbations [19.9] 制御摂動下でのマルチモーダルエージェントの記憶と推論能力を解明するための textbfAgent-ScanKit を提案する。
その結果,機械的記憶が体系的推論より優れていることが示唆された。
本研究は,実環境におけるマルチモーダルエージェントのロバスト推論モデルの必要性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:08:13 GMT)
LoFT: Parameter-Efficient Fine-Tuning for Long-tailed Semi-Supervised Learning in Open-World Scenarios [19.7] LFT(Long-tailed semi-supervised learning via parameter- efficient Fine-Tuning)
微調整された基礎モデルにより、より信頼性の高い擬似ラベルが生成され、不均衡学習の恩恵を受けることを示す。
また,オープンワールド環境下での半教師あり学習を調査することで,より実践的な環境についても検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:31:56 GMT)
AbsTopK: Rethinking Sparse Autoencoders For Bidirectional Features [19.6] スパースオートエンコーダ(SAE)は,大規模言語モデルの解釈可能性向上のための強力な技術として登場した。
スパース符号の近位勾配法をアンロールすることで,そのような枠組みを導入する。
シングルステップ更新は、ReLU、JumpReLU、TopKを含む一般的なSAEの変種を自然に回復することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:28:55 GMT)
Diffusion Transformers for Imputation: Statistical Efficiency and Uncertainty Quantification [19.5] 実用的な時系列データの品質向上には,命令手法が重要な役割を担っている。
拡散型生成的計算法は, 自己回帰法や従来の統計手法に比べ, 顕著な成功を収めている。
我々の研究は、拡散に基づくモデルが欠落した値と観測された値の間の複雑な空間的および時間的依存関係をどのように捉えるかという理論的理解に対処する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:00:18 GMT)
Towards Better Optimization For Listwise Preference in Diffusion Models [19.4] 本稿では、リストワイズデータを持つ拡散モデルにおいて、リストワイズ選好最適化のためのフレームワークであるDiffusion-LPOを提案する。
キャプションが与えられた場合、ユーザからのフィードバックをランク付けされた画像のリストに集約し、Planet-Luceモデルの下でDPOの目的をリストワイドに拡張する。
テキスト・ツー・イメージ生成や画像編集,パーソナライズされた嗜好アライメントなど,様々なタスクにおける拡散-LPOの有効性を実証的に示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:26:37 GMT)
Verbosity Tradeoffs and the Impact of Scale on the Faithfulness of LLM Self-Explanations [19.3] 我々は13家族の75モデルにわたる反事実的忠実度を分析した。
この研究は、相関対実テスト(CCT)の簡易版であるphi-CCTとF-AUROCの2つの新しい指標を動機付けている。
より大きく、より有能なモデルは、私たちが考慮しているすべての指標に一貫して忠実です。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:51:24 GMT)
Towards Speeding up Program Repair with Non-Autoregressive Model [19.2] APRタスクのための最初のカスタマイズされたNAARコード生成モデルであるNARRepairを提案する。
NARRepair モデルは,1) オーバーコレクション問題を緩和するための修復動作予測器,2) トケン依存抽出器,3) 2段デコーダの3つの新しい特徴を特徴とする。
その結果,1)他のAPR技術と比較して,NARRepairモデルは限られた修理時間内で最高の性能を示し,2)ARベースのAPR技術と比較して,GPU環境でのNARRepairの修理速度は1.4-6.4倍に向上した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:12:23 GMT)
Grounding the Ungrounded: A Spectral-Graph Framework for Quantifying Hallucinations in multimodal LLMs [19.1] 大規模な言語モデルにおける幻覚を定量化するための拡散力学における厳密な情報幾何学的枠組みを初めて紹介する。
我々のフレームワークは、時間をかけて幻覚の進化を捉える、モダリティを意識した理論的に解釈可能なメトリクスを提供する。
この研究は幻覚の定量化と有界化の原理的な基礎を確立し、それらを質的なリスクから、抽出可能な分析可能な現象に変換する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:17:30 GMT)
F2LLM Technical Report: Matching SOTA Embedding Performance with 6 Million Open-Source Data [19.1] F2LLMは,0.6B,1.7B,4Bの3種類の最先端埋め込みモデルである。
F2LLMは、オープンソースの非合成データセットからキュレートされた600万のクエリドキュメント陰性に関する基礎モデルから直接微調整される。
MTEBの英語リーダーボードでは、F2LLM-4Bは約4Bパラメーターと7番目のモデルで2位、F2LLM-1.7Bは1B-2Bサイズ範囲で1位である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:58:49 GMT)
DragFlow: Unleashing DiT Priors with Region Based Supervision for Drag Editing [19.0] この研究は、DragFlowと呼ばれるドラッグベースの編集にFLUXのリッチさを効果的に活用する最初のフレームワークを提案する。
この制限を克服するため、DragFlowでは、アフィン変換がよりリッチで一貫性のある機能管理を可能にする、リージョンベースの編集パラダイムを導入している。
DragBench-DRとReD Benchの実験は、DragFlowがポイントベースとリージョンベースの両方のベースラインを超えたことを示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:39:13 GMT)
Causal Intervention Sequence Analysis for Fault Tracking in Radio Access Networks [19.0] 1)根本原因の可能性のある指標を見つけ出し、(2)これらのイベントが展開する正確な順序を明らかにする。
私たちのモデルは、正常な振る舞いを障害に変える因果連鎖を学習します。
モンテカルロのテストでは、正しいトリガーシーケンスを高精度でピンポイントし、速度を失うことなく数百万のデータポイントにスケールする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:34:59 GMT)
Towards Imperceptible Adversarial Defense: A Gradient-Driven Shield against Facial Manipulations [18.9] 攻撃的な防衛戦略は 敵の摂動を 顔画像に埋め込んで ディープフェイク操作に 対処する
既存の方法はしばしば、知覚不能と防御効果のトレードオフに直面し、強引な摂動は偽造行為を妨害するが、視力は低下する。
本稿では,顔の深度を効果的に抑制し,知覚的劣化を最小限に抑えた勾配投影型対向的防御法(GRASP)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:09:46 GMT)
Detecting LLM-Generated Spam Reviews by Integrating Language Model Embeddings and Graph Neural Network [18.9] 大規模言語モデル(LLM)は、人間の文章を忠実に模倣する非常に説得力のあるスパムレビューの生成を可能にした。
本研究では,事前学習言語モデルからのテキスト埋め込みと,スパムノード分類のためのゲートグラフ変換器を組み合わせたハイブリッド検出モデルであるFraudSquadを提案する。
実験の結果、FraudSquadは3つのLLM生成データセットで44.22%の精度と43.01%のリコールで最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:42:35 GMT)
The Current State of AI Bias Bounties: An Overview of Existing Programmes and Research [18.9] 現在のバイアス評価手法は、AIシステムによって影響を受けるコミュニティにはほとんど関与しない。
バグ報奨金に触発されて、報酬に基づく方法としてバイアス報奨が提案されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:09:11 GMT)
From Behavioral Performance to Internal Competence: Interpreting Vision-Language Models with VLM-Lens [18.8] VLM-Lensは、視覚言語モデルの体系的なベンチマーク、分析、解釈を可能にするように設計されている。
モデル固有の複雑さを抽象化する、統一されたYAML構成可能なインターフェースを提供する。
VLM-Lensは、VLMの理解と改善に関するコミュニティの取り組みを加速するオープンソースプロジェクトとしてリリースされた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:58:41 GMT)
Feature Dynamics as Implicit Data Augmentation: A Depth-Decomposed View on Deep Neural Network Generalization [18.7] 時間的一貫性は、目に見えないデータや破損したデータにまで拡張されるが、セマンティック構造が破壊されると崩壊する。
これらの知見は、特徴力学と一般化をリンクする概念的な視点を示唆している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:09:02 GMT)
TempoControl: Temporal Attention Guidance for Text-to-Video Models [18.5] 本研究では,推論中の視覚概念の時間的アライメントを可能にするTempoControlを紹介する。
本手法は,時間的形状と制御信号との整合性,可視性が必要な場所での増幅,空間的焦点の維持という3つの相補的原理を用いて注意を喚起する。
単一オブジェクトと複数オブジェクトの時間的並べ替え、アクションおよびオーディオアライメント生成など、様々なビデオ生成アプリケーションにおいて、その効果を実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:13:35 GMT)
When Reasoning Meets Compression: Understanding the Effects of LLMs Compression on Large Reasoning Models [18.4] 本研究では,大推理モデルの推理能力が圧縮時にいかに損なわれるかを検討する。
我々は4つの推論データセット上で、定量化、蒸留、刈り取られたDeepSeek-R1モデルをベンチマークした。
全体として、動的量子化 2.51 ビット R1 が R1 に近い性能に達する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:39:53 GMT)
Demystifying the Roles of LLM Layers in Retrieval, Knowledge, and Reasoning [18.3] 研究によると、LLM(Large Language Models)の深い層は、学習の表現にはほとんど寄与せず、大きなパフォーマンス損失を伴わずに、しばしば取り除くことができる。
本稿では,評価プロトコル,タスクカテゴリ,モデルアーキテクチャなど,様々な次元にわたる奥行き利用の体系的研究を行う。
我々の分析では、非常に深い層は一般的に以前の層よりも効果が低いことが確認されているが、それらの貢献は評価設定によって大きく異なる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:57:13 GMT)
The Measurement Imbalance in Agentic AI Evaluation Undermines Industry Productivity Claims [18.3] 本稿では,エージェントAIシステムに対する現在の評価手法が,業界生産性の主張に疑問を呈するシステム的不均衡を示すことを示す。
84論文(2023年-2025年)の体系的レビューでは,技術指標が評価を支配している評価の不均衡が明らかとなった。
バランスの取れた4軸評価モデルを提案し、このパラダイムシフトをリードするようコミュニティに呼びかける。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:27:05 GMT)
Learning to Look at the Other Side: A Semantic Probing Study of Word Embeddings in LLMs with Enabled Bidirectional Attention [18.2] 自己回帰型大規模言語モデル(LLM)は、言語理解と生成において例外的な性能を示す。
本稿は,LLMにおいて双方向の注意を喚起することで,そのような制約を克服できるかどうかを検討することを目的とする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:18:13 GMT)
Non-Rigid Structure-from-Motion via Differential Geometry with Recoverable Conformal Scale [17.9] 共形変形下でのNRSfMに対するCon-NRSfMという新しい手法を提案する。
提案手法は,グラフベースのフレームワークにより最適化された2次元画像ワープを用いて,ポイントワイズ再構成を行う。
我々のフレームワークは、他のアプローチでは分離できない深さと等角スケールの制約を分離する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:46:46 GMT)
Unlocking Vision-Language Models for Video Anomaly Detection via Fine-Grained Prompting [17.9] 本稿では,ビデオ異常検出のための構造化プロンプトフレームワークであるASK-Hintを提案する。
提案手法は, セマンティック・コヒーレントなグループにプロンプトを整理し, きめ細かい案内質問を定式化する。
UCF-CrimeとXD-Violenceの実験では、ASK-Hintは以前のベースラインよりも一貫してAUCを改善している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:06:31 GMT)
AMAS: Adaptively Determining Communication Topology for LLM-based Multi-Agent System [17.7] 大規模言語モデル (LLM) は自然言語処理能力に革命をもたらし、産業問題解決のための自律型マルチエージェントシステム (MAS) として実践的に実装されている。
我々は、新しい動的グラフデザイナを通じてLLMベースのMASを再定義するパラダイムシフトフレームワークであるAMASを紹介する。
AMASは個々の入力の固有の特性を利用して、タスク最適化エージェント経路を介してインテリジェントにクエリトラジェクトリをクエリする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:50:22 GMT)
ReTabAD: A Benchmark for Restoring Semantic Context in Tabular Anomaly Detection [17.5] 本稿では,コンテキスト認識型異常検出のためのベンチマークとしてReTabADを紹介する。
意味的コンテキストによって検出性能が向上し,解釈可能性も向上することを示す。
これらの知見は、文脈認識ADの体系的な探索のベンチマークとしてReTabADを確立した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:28:45 GMT)
Drawing Conclusions from Draws: Rethinking Preference Semantics in Arena-Style LLM Evaluation [17.5] ドローが真に2つのモデルが等しいことを意味するかどうかを調べる。
我々は、ドローの方がクエリの難しさを示すと推測する。
我々は、既存のドローセマンティクスを再考する将来の評価システムを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:41 GMT)
More Thought, Less Accuracy? On the Dual Nature of Reasoning in Vision-Language Models [17.4] 大規模言語モデル(LLM)において、推論が重要な機能として現れている。
近年の研究では、視覚言語モデル(VLM)への推論の拡張が試みられている。
本研究は、マルチモーダル推論の二重性を明らかにし、他の基本的な視覚的問題に対する認識障害につながった。
本稿では,視覚的接地軌道に対する推論過程を明確に把握する,シンプルかつ効果的な手法であるビジョン・アンコレッド・ポリシー・オプティマイズ(VAPO)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:24:56 GMT)
Clink! Chop! Thud! -- Learning Object Sounds from Real-World Interactions [17.4] そこで本研究では,これらの音を直接対象物にリンクするモデルの性能を評価するために,音響オブジェクト検出タスクを導入する。
人間の知覚にインスパイアされた私たちのマルチモーダルなオブジェクト認識フレームワークは、野生のエゴセントリックなビデオから学習します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:52 GMT)
CodeSense: a Real-World Benchmark and Dataset for Code Semantic Reasoning [17.3] 私たちはCodeSenseという,一連のきめ細かいコード推論タスクを利用できる最初のベンチマークを提案しています。
この結果から,モデルが微粒な推論処理を行う場合の性能差が明らかとなった。
当社の作業では,詳細なSE推論タスクに対して,真理を簡単に収集することのできる実行トレースフレームワークとツールセットを作成しました。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:10:36 GMT)
SoftCFG: Uncertainty-guided Stable Guidance for Visual Autoregressive Model [17.3] 自己回帰(AR)モデルは、画像を離散トークンのシーケンスとしてモデル化することで、画像生成のための強力なツールとして登場した。
本論文では,不確実性誘導型推論手法であるSoftCFGを提案する。
実験により、SoftCFGは、自己回帰モデルにおいて、標準CFGとImageNet 256*256の最先端FIDよりも画像品質を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:32:57 GMT)
Transformers Discover Molecular Structure Without Graph Priors [17.3] グラフネットワーク(GNN)は、分子機械学習のためのアーキテクチャである。
本研究では、分子エネルギーと力の近似のためにトランスフォーマーを訓練する方法を示す。
以上の結果から,GNNの多くの特性がトランスフォーマーに適応的に現れることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:42:10 GMT)
Graph Generation with Spectral Geodesic Flow Matching [16.8] 本稿では、スペクトル固有マップを用いて、入力グラフとターゲットグラフの両方を埋め込むためのフレームワークであるスペクトル測地フローマッチングを提案する。
次に、埋め込みとそれらの流れに沿った分布との測地的流れを定義し、出力グラフを生成する。
i)固有値を超える幾何学的構造をキャプチャし、(ii)多様なグラフを柔軟に生成し、(iii)効率よくスケールする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:49:05 GMT)
NoiseShift: Resolution-Aware Noise Recalibration for Better Low-Resolution Image Generation [16.7] ノイズスケジューラは解像度に不平等な効果がある。
ノイズシフトは、分解能サイズで条件付けられたデノイザーのノイズレベルを補正する。
LAION-COCOでは、SD3.5が15.89%、SD3が8.56%、Flux-Devが2.44%改善している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:43 GMT)
4DGS-Craft: Consistent and Interactive 4D Gaussian Splatting Editing [16.5] 4DGS-Craftは一貫性のあるインタラクティブな4DGS編集フレームワークである。
まず、4D対応のInstructPix2Pixモデルを紹介し、ビューと時間的一貫性の両立を保証する。
そして、このモデルをマルチビューグリッドモジュールで拡張し、複数ビューの入力画像を反復的に精細化することで整合性を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:13:19 GMT)
Preconditioned subgradient method for composite optimization: overparameterization and fast convergence [16.4] 複合最適化問題は凸関数を持つ滑らかな写像の構成を最小化することを含む。
次進法は、複合損失が十分に条件付けられたときに局所的な線形収束を達成する。
軽度規則性条件下で線形に収束するレバンス・モリソン・マルクアート劣次法を導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:58:30 GMT)
NoMod: A Non-modular Attack on Module Learning With Errors [16.2] 量子コンピューティングは古典的な公開鍵暗号を脅かす。
我々は,ハイブリッドホワイトボックス暗号法であるNoMod ML-Attackを提案する。
実装を匿名リポジトリでリリースします。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:12:13 GMT)
Clarifying Semantics of In-Context Examples for Unit Test Generation [16.1] CLASTは, ユニットテストを体系的に洗練し, セマンティックな明瞭さを向上する手法である。
CLASTは、テストの有効性の維持と意味的明確性の向上の両方において、最先端の洗練技術であるUTgenよりも優れている。
調査対象者の85.33%以上がCLAST精製検査のセマンティックな明瞭さを好んだ。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:15:40 GMT)
Towards Interpretable and Inference-Optimal COT Reasoning with Sparse Autoencoder-Guided Generation [15.9] 大規模言語モデル(LLM)の内部トークン表現を解析するための新しい手法を提案する。
我々のアプローチはまずSAEを訓練し、トークンを訓練するためのスパースベクトル表現を生成し、次にk平均クラスタリングを適用してグラフを構築する。
このグラフを用いて、確立された推論トレースへの付着を定量化するためのエッジウェイトに基づく報酬関数を定義する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:01:08 GMT)
Push the Limit of Multi-modal Emotion Recognition by Prompting LLMs with Receptive-Field-Aware Attention Weighting [15.9] 本稿では,受動的フィールド認識重み付けによる大規模言語モデルの実現により,あるバニラモデルの性能を向上させるフレームワークであるLanternを提案する。
実験では、バニラモデルCORECTとSDTがGPT-4またはLlama-3.1-405Bでランタンに配備された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:13:37 GMT)
Enhancing Personalized Multi-Turn Dialogue with Curiosity Reward [15.1] 本稿では,好奇心に基づく固有報酬をマルチターンRLHFに組み込むために,ユーザモデルを活用することを提案する。
この新たな報酬機構により、LLMエージェントは会話を最適化してユーザモデルの精度を向上させることにより、ユーザ特性を積極的に推測することができる。
提案手法の有効性は,会話推薦タスクにおけるパーソナライズ性能の大幅な向上と,教育環境における異なる学習スタイルにおける会話のパーソナライズという2つの領域で実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:36:08 GMT)
Product Manager Practices for Delegating Work to Generative AI: "Accountability must not be delegated to non-human actors" [15.0] ジェネレーティブAI(GenAI)は、特にソフトウェア開発チームのプロダクトマネージャ(PM)にとって、知識労働の性質を変えつつある。
私たちは、大規模な多国籍ソフトウェア企業であるMicrosoftで、ミックスメソッドスタディを実施しました。
我々は,(1) PMsの現在のGenAI採用率,利用事例,及び認識されるメリットと障壁,(2) PMsがGenAIにどのタスクを委譲するかを評価する枠組み,(3) GenAIを彼らの役割と役割に組み込むためのPMs適応の実践,そして,その役割がどのように進化しているかの認識を行う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:19:49 GMT)
AccurateRAG: A Framework for Building Accurate Retrieval-Augmented Question-Answering Applications [15.0] 我々は、検索拡張生成(RAG)に基づく高性能質問応答アプリケーションを構築するための新しいフレームワークであるAccurateRAGを紹介する。
我々のフレームワークは、生のデータセット処理、微調整データ生成、テキスト埋め込みおよびLCM微調整、出力評価、RAGシステム構築のためのツールを備えた開発効率のためのパイプラインを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:30:08 GMT)
Learning Task-Agnostic Motifs to Capture the Continuous Nature of Animal Behavior [15.0] 動作の潜在基底関数として解釈可能なモチーフセットを明らかにするフレームワークであるモチーフベースの連続力学(MCD)発見を導入する。
我々は,マルチタスクグリッドワールド,迷路ナビゲーションタスク,動物行動の自由移動に対するMDDの有効性を検証した。
基本的な運動モチーフの動的組み合わせから複雑な動物の行動がどのように出現するかを生成的に説明することにより、我々のアプローチは自然行動の定量的研究を進めていく。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:59:32 GMT)
Demystifying Network Foundation Models [14.8] 本研究は,ネットワークファウンデーションモデル (NFM) に符号化された潜伏知識の体系的研究である。
4種類のNFMを評価し,それぞれに有意な異方性,不整合性特徴感度パターンが認められた。
私たちの研究は、すべてのモデルにまたがる多くの制限を特定し、それらに対処することで、モデルのパフォーマンスが大幅に改善できることを示します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:59:40 GMT)
Fine-Grained Urban Traffic Forecasting on Metropolis-Scale Road Networks [14.7] 約10万の道路セグメントを含む2つの主要都市の道路ネットワークを表すデータセットをリリースする。
我々のデータセットには道路の特徴が豊富に含まれており、交通量と交通速度の両方に関する詳細なデータを提供しています。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:53:51 GMT)
Did I Faithfully Say What I Thought? Bridging the Gap Between Neural Activity and Self-Explanations in Large Language Models [14.6] 大きな言語モデル(LLM)は、その答えを正当化するために、もっともらしい自由テキストの自己説明を生成することができる。
本稿では,LLM自由テキスト自己説明の忠実度を測定するフレキシブルなフレームワークであるNeuroFaithを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:18:42 GMT)
PRIME: Planning and Retrieval-Integrated Memory for Enhanced Reasoning [14.6] マルチエージェント推論フレームワークである textbfPRIME (Planning and Retrieval-Integrated Memory for Enhanced Reasoning) を導入する。
PRIME は textbfSystem 1 (高速で直感的な思考) と textbfSystem 2 (スローで思慮深い思考) を動的に統合する
本研究は,複雑な知識集約的推論を必要とする領域におけるLLMを改善するためのスケーラブルなソリューションとしてPRIMEを確立する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:44:56 GMT)
TetriServe: Efficient DiT Serving for Heterogeneous Image Generation [14.5] Diffusion Transformer (DiT) モデルは、反復的なデノゲーションステップによって高品質な画像を生成するのに優れている。
しかし、厳格なサービスレベルオブジェクト(SLO)の下でそれらを提供するのは、高い計算コストのために難しいです。
本稿では、高効率な画像生成のためにこの戦略を実装したDiTサービスシステムTetriServeを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:23:32 GMT)
Ego-Exo 3D Hand Tracking in the Wild with a Mobile Multi-Camera Rig [14.5] 高精度な3次元手や物体を撮像する新しいマーカーレスマルチカメラシステムを提案する。
軽量でバックマウントのキャプチャ・リグと8台のエキゾセントリックカメラ、そして2つのエゴセントリックなビューを提供するMeta Quest 3ヘッドセットを組み合わせています。
我々は、同期したマルチビュー画像と正確な3Dハンドポーズを備えた注釈付きデータセットを収集する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:26:03 GMT)
Dynamic Function Configuration and its Management in Serverless Computing: A Taxonomy and Future Directions [14.4] サーバレスクラウドコンピューティングモデルは、サービスプロバイダが基盤となるインフラストラクチャ管理を開発者から抽象化するフレームワークを提供する。
このサーバレスモデルでは、Fはイベント駆動の関数指向コンピューティングサービスを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:09:54 GMT)
Interpretable Text Embeddings and Text Similarity Explanation: A Survey [14.3] テキスト埋め込みとテキスト類似性の説明を本質的に解釈する手法について概説する。
我々は,評価の手段を比較し,学習した教訓を整理し,最終的に今後の研究の機会と課題を明らかにする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:24:21 GMT)
Multiple Queries with Multiple Keys: A Precise Prompt Matching Paradigm for Prompt-based Continual Learning [14.2] 継続的学習は、動的環境における新しい知識を継続的に獲得するために機械学習モデルを必要とする。
本稿では,複数の鍵を持つ多重クエリー (MQMK) のプロンプトマッチングパラダイムを,高精度なプロンプト選択のために提案する。
実験の結果、MQMKは挑戦的なシナリオにおいて、迅速なマッチング率を30%以上向上させることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:58:39 GMT)
Learned Display Radiance Fields with Lensless Cameras [14.2] 本研究では,レンズレスカメラとインプシットニューラル表現に基づくアルゴリズムを共同設計し,様々な視点から表示特性を捉える。
我々のパイプラインは、46.6deg X 37.6degのビューングコーンからディスプレイから放出される光電界の効率的な再構成を可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:11:04 GMT)
Can AI Truly Represent Your Voice in Deliberations? A Comprehensive Study of Large-Scale Opinion Aggregation with LLMs [14.2] DeliberationBankは大規模な人為的なデータセットで、3,000人の参加者が作成した10のDeliberationの質問に意見データがある。
私たちはDeliberationJudgeをトレーニングします。
我々のフレームワークは、議論の要約を評価するスケーラブルで信頼性の高い方法を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:36:23 GMT)
MolLangBench: A Comprehensive Benchmark for Language-Prompted Molecular Structure Recognition, Editing, and Generation [14.1] MolLangBenchは分子言語インタフェースの基本的なタスクを評価するために設計されたベンチマークである。
自動ケミノフォマティクスツールを用いて認識タスクを構築する。
厳密な専門家アノテーションと検証を通じて編集・生成タスクをキュレートする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:32:35 GMT)
Reflective Unit Test Generation for Precise Type Error Detection with Large Language Models [14.0] RTEDはPythonの型エラーを自動的に検出する型認識テスト生成技術である。
RTEDは4つの最先端技術よりも22-29のベンチマーク型エラーを検出できることを示す。
また、偽陽性を減らし、173.9%-245.9%の精度で改善できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:05:24 GMT)
Quantum Fisher information matrices from Rényi relative entropies [13.7] フィッシャー情報の量子一般化は、量子情報科学において重要である。
対数ユークリッド、$alpha$-$z$、幾何学的R'enyi相対エントロピーから得られる情報行列を導出する。
パラメータ化された熱状態に対して、私はそれらの$alpha$-$z$情報行列とそれらを推定するためのハイブリッド量子古典アルゴリズムの式を確立する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:02:48 GMT)
Foundation Models for Software Engineering of Cyber-Physical Systems: the Road Ahead [13.6] CPSソフトウェア工学の様々な段階にFMを統合するための研究ロードマップを提示する。
本稿では,FM生成物の正確性を含む,この文脈におけるFMの適用に関わる課題について論じる。
このロードマップは、CPSソフトウェアエンジニアリングの研究者と実践者を対象としている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:24:51 GMT)
TLoRa: Implementing TLS Over LoRa for Secure HTTP Communication in IoT [13.5] TLoRaは、LoRa上のHTTPS通信のためのエンドツーエンドアーキテクチャである。
WiFi対応のエンドデバイスとLoRa上のインターネット間のシームレスでセキュアな通信通信を可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:47:03 GMT)
HRTFformer: A Spatially-Aware Transformer for Personalized HRTF Upsampling in Immersive Audio Rendering [13.2] 本稿では,HRTFアップサンプリングのためのトランスフォーマーアーキテクチャを提案する。
本モデルでは,高精度HRTFをスパース入力測定から再構成し,精度を大幅に向上する。
実験により,本モデルが現実的かつ高忠実なHRTFの生成において,先行手法をはるかに上回っていることが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:59:21 GMT)
Posterior Collapse as a Phase Transition in Variational Autoencoders [13.2] 変分オートエンコーダ(VAE)の後方崩壊現象を統計物理学の観点から検討する。
後方崩壊に伴う自明な解の安定性を解析することにより、臨界超パラメータ閾値を同定する。
我々は、この臨界挙動を合成と実世界の両方のデータセットで検証し、相転移の存在を確認する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:52:25 GMT)
A Few Large Shifts: Layer-Inconsistency Based Minimal Overhead Adversarial Example Detection [13.1] 我々は、ターゲットモデル自体の内部の階層的不整合を利用するプラグイン検出フレームワークを導入する。
本手法は計算オーバーヘッドを無視して最先端検出性能を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:22:40 GMT)
DrKGC: Dynamic Subgraph Retrieval-Augmented LLMs for Knowledge Graph Completion across General and Biomedical Domains [13.1] 知識グラフ補完(KGC)は、既存の三重情報とテキスト情報を活用することにより、知識グラフ(KG)に欠落した三重情報を予測することを目的としている。
DrKGCは、KG内の構造埋め込みと論理ルールを学ぶために、フレキシブルで軽量なモデルトレーニング戦略を採用している。
そして、新しいボトムアップグラフ検索手法を利用して、学習ルールでガイドされた各クエリのサブグラフを抽出する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:56:36 GMT)
Break the ID-Language Barrier: An Adaption Framework for LLM-based Sequential Recommendation [13.0] ドメイン固有知識に富んだ事前学習ID埋め込みを,大規模言語モデルに統合するフレームワークであるIDLE-Adapterを提案する。
IDLE-Adapterはブリッジとして機能し、疎いユーザ-イテムインタラクションデータを高密度でLLM互換の表現に変換する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:53:04 GMT)
From quantum feature maps to quantum reservoir computing: perspectives and applications [12.9] 古典的な相関を含む量子システムが、機械学習の典型的なタスクに対して、非自明で実験的に実行可能な貯水池としてどのように機能するかを観察する。
中性原子量子処理ユニットに焦点をあてて、新しい量子貯水池計算(QRC)のワークフローを記述し、実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:38:16 GMT)
Non-Asymptotic Analysis of Data Augmentation for Precision Matrix Estimation [12.9] 本研究では,個人性行列に比例した線形縮退推定器と,データ拡張から導出される推定器の2つのクラスに着目した。
両クラスの推定器について、推定器を導出し、その二次誤差に対して濃度境界を与える。
技術的には、我々の分析はランダム行列理論の道具に依存している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:28:14 GMT)
Diffusion^2: Turning 3D Environments into Radio Frequency Heatmaps [12.7] 広帯域のRF信号の伝搬をモデル化するために3次元点雲を用いた拡散に基づくDiffusion2を導入する。
また,Diffusion2では,RF信号の周波数帯域や環境条件の挙動を推定し,誤差の差は既存の手法に比べて1.9dB,27倍速かった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:50:22 GMT)
MS-DFTVNet:A Long-Term Time Series Prediction Method Based on Multi-Scale Deformable Convolution [12.7] 我々は,長期予測のための変形可能な畳み込みフレームワークであるMS-DFTVNetを開発した。
実験の結果、MS-DFTVNetは強いベースラインを著しく上回るだけでなく、平均7.5%の改善も達成している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:01:13 GMT)
OntoURL: A Benchmark for Evaluating Large Language Models on Symbolic Ontological Understanding, Reasoning and Learning [12.6] 大規模な言語モデルは、幅広いタスクにわたって顕著な能力を示してきたが、構造化された記号的知識を処理できる能力はまだ探索されていない。
ドメイン知識の形式的および象徴的な表現を扱う上で,LLMの能力を評価するために設計された最初の総合ベンチマークであるOntoURLを紹介する。
提案された分類に基づいて、OntoURLは、理解、推論、学習の3つの側面を体系的に評価する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:25:50 GMT)
Aligning Reasoning LLMs for Materials Discovery with Physics-aware Rejection Sampling [12.5] 本稿では,物理認識型リジェクションサンプリング(PaRS)について紹介する。
PaRSは基礎物理学と整合したトレースを好んでおり、計算を制御するために軽量に停止する。
本手法は精度と校正性を向上し,物理違反率を低減し,基準値に対するサンプリングコストを低減させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:53:08 GMT)
Segmentor-Guided Counterfactual Fine-Tuning for Locally Coherent and Targeted Image Synthesis [12.5] 対物画像生成は、トレーニングデータの拡大、データセットのデバイアス、モデリング疾患のための強力なツールである。
本稿では,Seg-CFT(Seg-CFT)とSeg-CFT(Segmentor-Guided Counterfactual Fine-Tuning)を提案する。
リアルな胸部X線写真を作成する能力を実証し,冠動脈疾患のモデル化に有望な結果を示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:13:19 GMT)
GeoSQL-Eval: First Evaluation of LLMs on PostGIS-Based NL2GeoSQL Queries [12.5] 提案するGeo-Evalは,PostGIS生成のためのエンドツーエンド自動評価フレームワークである。
また、継続的テストとグローバル比較のための公開Geo-Evalのリーダボードプラットフォームもリリースしています。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:58:56 GMT)
MissionHD: Hyperdimensional Refinement of Distribution-Deficient Reasoning Graphs for Video Anomaly Detection [12.5] 構造分布学習に頼らずにデオード可能なグラフ表現を最適化するためのHDC制約グラフ構造再構成(HDC-GSR)を提案する。
制約付きグラフニューラル演算でグラフを符号化し、下流のタスク損失と直接一致させ、洗練された構造をデコードするHDCフレームワークであるMissionHDを紹介する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:55:20 GMT)
Mirage Fools the Ear, Mute Hides the Truth: Precise Targeted Adversarial Attacks on Polyphonic Sound Event Detection Systems [12.4] SEDシステムをターゲットにした既存の音声対向攻撃は、SEDの強いコンテキスト依存のため、有効性に欠けることが多い。
本研究では,ポリフォニックSEDシステムに対する敵攻撃を目的としたMirage and Mute Attackフレームワークを提案する。
総合的な実験の結果、M2Aは2つの最先端SEDモデルで94.56%と99.11%のEPを達成した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:09:32 GMT)
SIEVE: Towards Verifiable Certification for Code-datasets [12.4] コードエージェントと経験的ソフトウェアエンジニアリングは、公開コードデータセットに依存しているが、これらのデータセットには検証可能な品質保証がない。
静的な'データセットカード'が通知するが、監査も統計的な保証も提供せず、データセットの品質の確認が難しい。
我々は、コミュニティ主導のフレームワークであるSIEVEを紹介します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:14:23 GMT)
Even Faster Kernel Matrix Linear Algebra via Density Estimation [12.3] 我々は、$mathbb Rd$における$n$のデータポイントの集合のカーネル行列を含む線形代数的タスクにカーネル密度推定(KDE)を用いる。
既存のベストアルゴリズムに対する我々の改善は、$varepsilon$への依存を減らし、カーネル行列の全エントリの和を計算する場合、$n$への依存を減らします。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:15:38 GMT)
Reasoning Models are Test Exploiters: Rethinking Multiple-Choice [12.3] 大きな言語モデル(LLM)は、固定された選択セットの中から選ぶように求められます。
McQCA(Multiple-choice Question-Awering)は、モデル下流のパフォーマンスのよいプロキシである。
本稿では,最先端の推論モデルにおいて,この傾向が持続する範囲について検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:15:54 GMT)
Software Engineering for Self-Adaptive Robotics: A Research Agenda [12.2] 自己適応型ロボットは、人工知能(AI)、機械学習、モデル駆動工学を利用して、変化する状況に継続的に適応する。
本稿では,2次元に沿って構成された自己適応型ロボット工学におけるソフトウェア工学の研究課題について述べる。
1つ目は、自己適応型ロボット工学の課題に合わせて、ソフトウェアエンジニアリングライフサイクル、要件、設計、開発、テスト、運用に関するものである。
2つ目は、ディジタルツイン、AI駆動の適応、およびランタイム監視、障害検出、自動意思決定をサポートする量子コンピューティングなどのテクノロジの実現に焦点を当てている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:52:44 GMT)
Gala: Global LLM Agents for Text-to-Model Translation [12.2] この課題に対処するフレームワークであるGalaを,グローバルなエージェント的アプローチで紹介する。
複数の特殊大規模言語モデル(LLM)エージェントは、グローバル制約型によってモデリングタスクを分解する。
問題をより小さくよく定義されたサブタスクに分割することで、各LSMはより単純な推論問題を扱う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:55:18 GMT)
Graph Theory Meets Federated Learning over Satellite Constellations: Spanning Aggregations, Network Formation, and Performance Optimization [12.1] 本稿では,衛星ネットワークのための分散学習フレームワークであるFed-Spanを紹介する。
Fed-Spanは、衛星ネットワークにおける分散学習に固有の課題に対処することを目指している。
モデル収束の高速化,エネルギー効率の向上,遅延の低減などにより,Fed-Spanは既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:56:54 GMT)
Best Policy Learning from Trajectory Preference Feedback [11.9] 推論ベースの強化学習(PbRL)は、より堅牢な代替手段を提供する。
本稿では, PbRLにおける最適政策識別問題について検討し, 生成モデルの学習後最適化を動機とした。
本稿では,Top-Two Thompson Smplingにヒントを得た新しいアルゴリズムであるPosterior Smpling for Preference Learning(mathsfPSPL$)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:07:28 GMT)
NGGAN: Noise Generation GAN Based on the Practical Measurement Dataset for Narrowband Powerline Communications [11.7] データ拡張のための実測ノイズサンプルの複雑な特性を学習するGAN(Generative Adversarial Network)を提案する。
我々は,NB-PLCモデムのアナログ結合と帯域通過フィルタ回路を用いて,NB-PLCシステムの複雑なノイズの統計値と密に一致させた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:47:56 GMT)
Bypassing Prompt Guards in Production with Controlled-Release Prompting [11.7] 我々は、彼らの制限を強調して、プロンプトガードを回避できる新しい攻撃を導入する。
我々の手法は、応答品質を維持しながら生産モデルを継続的にジェイルブレイクする。
これは、現代のLLMアーキテクチャにおいて、軽量プロンプトガードに固有の攻撃面を明らかにしている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:04:21 GMT)
Equivariant Splitting: Self-supervised learning from incomplete data [11.6] 本研究では,単一不完全観測モデルを用いて測定結果が観測される難易度設定のために考案された,新たな自己教師型学習戦略を提案する。
自己監督型分割損失と同変型再構成ネットワークの組み合わせは,教師型分割損失と同程度に最小化できることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:27:28 GMT)
Exploiting Tree Structure for Credit Assignment in RL Training of LLMs [11.6] 強化学習は推論を改善するが、長いシーケンスよりも遅れた報酬はトークンレベルのクレジット割り当てを重要なボトルネックにする。
最終回答がチェック可能で、プロンプト毎に複数の応答を描画できる検証可能な逆設定について検討する。
textbfTEMPO (emphtextbfTree-textbfEstimated textbfMean Prefix Value for textbfPolicy textbfOptimization)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:38:22 GMT)
Synthetic Prefixes to Mitigate Bias in Real-Time Neural Query Autocomplete [11.6] 本稿では, リアルタイムニューラルネットワーク自動補完システムにおけるプレゼンテーションバイアスを軽減するために, 合成接頭辞を用いたデータ中心型アプローチを提案する。
これらのプレフィックスは、オートコンプリートがアクティブでない通常の検索セッション中に収集された完全なユーザクエリから生成される。
本システムでは,ユーザエンゲージメントの統計的に有意な改善が示され,平均相互ランクおよび関連する指標によって測定される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:44:44 GMT)
A Bilevel Optimization Framework for Adversarial Control of Gas Pipeline Operations [11.6] パイプライン運用技術システムのサイバー攻撃は、エネルギーインフラのリスクを増大させる。
本研究では,サイバー物理脅威を解析するための物理インフォームドシミュレーションと最適化フレームワークを開発する。
テストガスパイプラインケーススタディでは、攻撃時のサービス提供のカバート削減が実証されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:13:41 GMT)
The Rise of AfricaNLP: Contributions, Contributors, and Community Impact (2005-2025) [11.5] 本研究ではアフリカンNLP(AfricaNLP)の進展について,基礎研究の課題を問う。
我々は,1.9K NLP論文要約,4.9K著者コントリビュータ,および7.8K人による貢献文を用いて,アフリカNLP研究の貢献を定量的に検討した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:08:37 GMT)
REPAIR: Robust Editing via Progressive Adaptive Intervention and Reintegration [11.5] 大規模言語モデル(LLM)のポストトレーニングは、新しい知識の獲得やエラーの修正に高いコストで制約される。
この作業は、信頼性があり、スケーラブルで、継続的に進化するLLMを開発するための堅牢なフレームワークを導入します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:35:39 GMT)
How Confident are Video Models? Empowering Video Models to Express their Uncertainty [11.3] 生成ビデオモデルは印象的なテキスト・ビデオ機能を示し、多くの現実世界のアプリケーションで広く採用されている。
しかし、大きな言語モデル(LLM)のように、ビデオ生成モデルは幻覚を生じさせがちで、実際に間違っている場合でも、もっともらしいビデオを生成する。
本稿では,ビデオモデルの不確かさの定量化に向けた最初の研究について述べる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:20:41 GMT)
TriAlignXA: An Explainable Trilemma Alignment Framework for Trustworthy Agri-product Grading [11.2] 本稿では,消費者信頼の「デュアルソース検証」を通じて「トラストピラミッド」モデルを構築する。
この研究は、生物学的特徴、時間軸、経済性を含む、農産物の品位付けにおける「不可能な三角形」を明らかにした。
この研究は、理論から実践まで、信頼できるオンライン農産物エコシステムを構築するための包括的な支援を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:13:15 GMT)
SIMSplat: Predictive Driving Scene Editing with Language-aligned 4D Gaussian Splatting [11.2] SIMSplatは言語対応のガウススプラッティングを備えた予測駆動シーンエディタである。
言語制御エディタとして、SIMSplatは自然言語プロンプトを使った直感的な操作を可能にする。
提案手法では,新たなオブジェクトの追加や,車両と歩行者の軌跡の変更など,詳細なオブジェクトレベルの編集を行う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:22:03 GMT)
Flow Matching for Robust Simulation-Based Inference under Model Misspecification [11.2] Flow Matching Corrected Posterior Estimation(フローマッチング補正後推定)は、シミュレーションによって訓練された後部推定を、少数の実校正サンプルを用いて洗練するフレームワークである。
提案手法は,従来のSBIベースラインと比較して,推論精度と不確実性を向上し,不特定性の影響を常に緩和することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:38:21 GMT)
Syntactic Blind Spots: How Misalignment Leads to LLMs Mathematical Errors [11.2] 大規模言語モデル(LLM)は、強力な数学的問題解決能力を示すが、しばしば訓練分布から構文的に逸脱する問題に失敗する。
モデルがセマンティックに単純だが、不慣れな方法で言い換えられるような問題に対して、慣れ親しんだ推論戦略を誤って適用する、系統的な障害モード、統語的盲点を識別する。
以上の結果から,多くの推論誤差は概念的困難というよりも構造的不整合に起因することが示唆され,構文認識による介入がこれらの帰納的障害を明らかにし緩和する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:26:26 GMT)
Boundless Byte Pair Encoding: Breaking the Pre-tokenization Barrier [11.1] 事前トークン化は、コーパス内のトークンの分布を一般的なフル長の単語に歪ませる原因となる。
本研究では,境界制約を緩和する改良型BPEアルゴリズムであるBoundlessBを提案する。
我々のアプローチは、2つの完全プレトケンを選択的にスーパーワードと呼ぶより大きな単位にマージする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:31:37 GMT)
PUL-Inter-slice Defender: An Anomaly Detection Solution for Distributed Slice Mobility Attacks [11.1] ISS(Inter-Slice Switching)の脆弱性を利用して、Distributed Slice Mobility(DSM)攻撃を起動する。
PUL-Inter-Slice Defenderは、PUL(Positive Unlabeled Learning)を活用し、Long Short-Term Memory AutoencodersとK-Meansクラスタリングを組み合わせた異常検出ソリューションである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:24:17 GMT)
Disentangling Multiplex Spatial-Temporal Transition Graph Representation Learning for Socially Enhanced POI Recommendation [10.9] Next Point-of-Interest(POI)推奨はビジネスインテリジェンスにおけるホットスポットであり、ユーザの時空間遷移と社会的関係が重要な役割を果たす。
多重時間空間遷移グラフ上の不整合表現学習に基づく社会的に拡張されたPOIレコメンデーションモデルであるDiMuSTを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:36:45 GMT)
Multimode Phonon-Polaritons in Lead-Halide Perovskites in the Ultrastrong Coupling Regime [10.9] フォノンは超伝導、ラマン散乱、対称性破壊相を含む基本的な固体現象において中心的な役割を果たす。
ここでは, マルチモード超強光-物質結合を実現し, 理論的にはフォノン放出の変調を示す。
この研究は、光ハーヴェスティングおよび発光技術のための音速特性の工学的経路を確立する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:51:48 GMT)
From Pixels to Factors: Learning Independently Controllable State Variables for Reinforcement Learning [10.8] Action-Controllable Factorization (ACF)は、独立に制御可能な潜伏変数を明らかにするための対照的な学習手法である。
ACFは、ベースラインのアンタングル化アルゴリズムを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:43:20 GMT)
Learning Model Representations Using Publicly Available Model Hubs [10.8] 本研究では、非構造モデル集団を扱うために設計された新しい重み空間バックボーンを提案する。
本稿では,Hugging Faceのモデルでトレーニングした重み空間表現が,高い性能を実現することを実証する。
高品質な重み空間表現は野生では学べることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:04:31 GMT)
Quantum algorithms for Uhlmann transformation [10.7] 量子回路の形でウルマン変換を実現する量子クエリとサンプルアルゴリズムを提案する。
提案手法は,従来の最先端技術よりもクエリの複雑さが優れていることを示す。
本稿では,いくつかの情報理論的タスク,具体的には絡み合い伝達,量子状態の融合,ペッツ回収マップのアルゴリズム的実装について論じる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:23:08 GMT)
Scam2Prompt: A Scalable Framework for Auditing Malicious Scam Endpoints in Production LLMs [10.7] Scam2Promptは、詐欺サイトの基礎となる意図を特定し、その意図を反映した開発者スタイルのプロンプトを合成するフレームワークである。
大規模な調査では、Scam2Promptの無害なプロンプトが4.24%のケースで悪意のあるURL生成を引き起こした。
脆弱性は存在するだけでなく、深刻なものであり、悪意のあるコード生成率は12.7%から43.8%であることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:58:03 GMT)
Mechanistic Interpretability as Statistical Estimation: A Variance Analysis of EAP-IG [10.6] 我々は,回路探索などの解釈可能性の手法を統計的推定器とみなすべきであると論じている。
本稿では,最先端回路探索手法であるEAP-IGの系統的安定性解析を行う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:16:27 GMT)
Diagnosing Quantum Many-body Chaos in Non-Hermitian Quantum Spin Chain via Krylov Complexity [10.5] 局所的非エルミート障害を有する量子スピン鎖における非カオス力学の出現について検討する。
障害強度が増加するにつれて、非カオス力学の出現はクリロフ複雑性の成長を通じて質的に捉えられる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:04:11 GMT)
Quantum channel coding: Approximation algorithms and strong converse exponents [10.2] エンタングルメント支援量子チャネル符号化の緩和について検討する。
我々は,任意の非シグナリング支援戦略を絡み合い支援戦略に変換するラウンドング手順を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:04:36 GMT)
Audio-Enhanced Vision-Language Modeling with Latent Space Broadening for High Quality Data Expansion [10.2] トランスフォーマーベースのマルチモーダルモデルは、産業規模のレコメンデーション、検索、広告システムで広く使われている。
AL効率とVLMAEを用いた視覚言語モデリングを実現するため,kNNを用いたLatent Space Broadening (LSB)を提案する。
このシステムはプロダクションシステムにデプロイされ、大きなビジネス上の利益をもたらしました。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:26:27 GMT)
Analyzing Latent Concepts in Code Language Models [10.2] グローバルなポストホック解釈可能性フレームワークであるコード概念分析(CoCoA)を提案する。
CoCoAは、コード言語モデルの表現空間における創発的語彙、構文、意味構造を明らかにする。
本稿では,静的解析ツールをベースとした構文アライメントと,プロンプトエンジニアリングによる大規模言語モデルを組み合わせたハイブリッドアノテーションパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:22:16 GMT)
Position: Privacy Is Not Just Memorization! [10.2] このポジションペーパーでは、Large Language Modelsのプライバシの展望は、データ抽出のトレーニングをはるかに超えている、と論じている。
我々は、データ収集からデプロイメントまで、LCMライフサイクル全体にわたるプライバシーリスクの包括的分類を提示する。
私たちは、研究コミュニティがLLMプライバシにどのようにアプローチするかを根本的に変えて、現在の技術的なソリューションの焦点を狭くすることを求めます。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:02:06 GMT)
ABBA-Adapters: Efficient and Expressive Fine-Tuning of Foundation Models [10.2] 大規模な言語モデルは、幅広いタスクにわたって強力なパフォーマンスを示してきましたが、それらを新しいドメインに効率的に適用することは、依然として重要な課題です。
ABBAは、独立に学習可能な2つの低ランク行列のアダマール積として更新を再パラメータ化する新しいPEFTアーキテクチャである。
以前の作業とは対照的に、ABBAは事前訓練された重量からアップデートを完全に切り離し、両方のコンポーネントを自由に最適化できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:35:40 GMT)
PrisonBreak: Jailbreaking Large Language Models with at Most Twenty-Five Targeted Bit-flips [10.2] 商業規模の安全対応型大規模言語モデル(LLM)の新たな脆弱性について検討する。
有害な応答を生成することの拒否は、モデルパラメータのほんの数ビットだけを反転させることによって破られる可能性がある。
私たちは5ビットフリップから25ビットフリップのジェイルブレイク言語モデルを作りました。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:20:59 GMT)
HIV-1 protease cleavage sites detection with a Quantum convolutional neural network algorithm [10.1] ウイルスおよびヒトタンパク質のアミノ酸配列中のHIV-1プロテアーゼ切断部位を予測するために,NQEを用いた量子畳み込みニューラルネットワーク(QCNN)ベースのフレームワークを提案する。
ノイズレス,ノイズの多い両シミュレーションにおいて,従来のニューラルネットワークと比較して分類性能を比較した。
本研究では,NQEを付加したQCNNをHIV-1切断部位分類に適用し,バイオメディカルデータに対するスケーラブルでノイズ耐性の量子機械学習の新しい知見を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:13:54 GMT)
Rigorous Evaluation of Microarchitectural Side-Channels with Statistical Model Checking [10.1] マイクロアーキテクチャー側チャネルの定量的評価に統計モデルチェックを導入する。
SMCではプロセッサを不透明なボックスとして扱うことができ、それらを抽象化したり単純化したりする必要がなくなる。
3つのケーススタディを通してSMCの有効性を実証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:31:06 GMT)
SIM-Shapley: A Stable and Computationally Efficient Approach to Shapley Value Approximation [10.0] 共有値(SV)法は、複雑なモデルにおける特徴帰属の原則的な枠組みを提供するが、高い計算コストがかかる。
最適化にインスパイアされた安定かつ効率的な近似法である,共有値近似のための反復モーメント(SIM-Shapley)を提案する。
我々の数値実験では、SIM-Shapleyは最先端のベースラインと比較して計算時間を最大85%削減する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:46:23 GMT)
LitterBox+: An Extensible Framework for LLM-enhanced Scratch Static Code Analysis [10.0] 大規模言語モデル(LLM)は、従来のテキストベースのプログラミング言語を使用する開発者を支援するために欠かせないツールとなっている。
本稿では,Scratch 静的コード解析ツール LitterBox を拡張した LitterBox+ フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:57:32 GMT)
Learnable cut flow for high energy physics [10.0] Learnable Cut Flow(LCF)は、従来のカット選択をデータ駆動プロセスに変換するニューラルネットワークである。
LCFは2つのカット戦略パラレルを実装しており、観測可能な分布は独立に扱われる。
LCFは6つのさまざまなモックデータセットと、現実的なダイボソン対QCDデータセットでテストされている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:05:18 GMT)
LSPFuzz: Hunting Bugs in Language Servers [9.8] LSPサーバテストのためのグレーボックスハイブリッドファザであるLSPFuzzを提案する。
我々の重要な洞察は、有効なLSPサーバーテストはソースコードとエディタ操作の全体的突然変異を必要とすることである。
LSPFuzzはベースラインファジィザよりも優れた性能を示し、現実世界のLSPサーバの既知のバグを発見した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:31:03 GMT)
Go witheFlow: Real-time Emotion Driven Audio Effects Modulation [9.7] 本稿では,音響効果を自動調整することで,リアルタイム音楽性能の向上を図ったwitheFlowシステムを提案する。
現在コンセプト実証段階にあるこのシステムは、軽量で、ラップトップ上でローカルに実行できるように設計されており、オープンソースである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:23:47 GMT)
LadderMoE: Ladder-Side Mixture of Experts Adapters for Bronze Inscription Recognition [9.7] 入力を局所化し、個々の文字を転写する2段階検出認識パイプラインを開発した。
本手法は,最先端のシーンテキスト認識ベースラインを大幅に上回る。
これらの結果は、青銅碑文認識と下流考古学的分析の強力な基盤を確立している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:14:14 GMT)
Theoretical Foundations of Representation Learning using Unlabeled Data: Statistics and Optimization [9.7] ラベルのないデータからの表現学習は、統計学、データサイエンス、信号処理において広く研究されている。
現在のディープラーニングモデルは、古典理論では容易には分析できない教師なし表現学習の新しい原則を使用している。
ヴィジュアルファウンデーションモデルは、セルフスーパービジョンやデノイング/マスケインオートエンコーダを使って素晴らしい成功を収めています。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:30:05 GMT)
Inferring Optical Tissue Properties from Photoplethysmography using Hybrid Amortized Inference [9.6] 本稿では,PPG信号と解釈可能な生理的・光学的パラメータを関連付ける生物物理モデルPPGenを紹介する。
その結果,HAIは様々なノイズやセンサ条件下で生理的パラメータを正確に推定できることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:36:02 GMT)
Black-Box Combinatorial Optimization with Order-Invariant Reinforcement Learning [9.6] ブラックボックス最適化のための順序不変強化学習フレームワークを提案する。
固定変数順序付けなしで訓練された多変量自己回帰生成モデルのパラメータ化を行う。
我々は、この設定に一般化強化政策最適化(GRPO)を適用し、スケール不変の利点から安定した政策段階の更新を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:12:17 GMT)
Robust Prompt Tuning for Vision-Language Models with Mild Semantic Noise [9.5] 本稿では弱いセマンティックノイズを積極的に組み込んだ堅牢なプロンプトチューニングフレームワークであるANPromptを提案する。
我々は、ANPromptが既存のプロンプトチューニング手法より一貫して優れていることを示す。
セマンティックノイズに対して優れたロバスト性を提供し、タスク間の一般化を改善している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:03:47 GMT)
Learning Multi-Index Models with Hyper-Kernel Ridge Regression [9.5] 学習課題,すなわちマルチインデックスモデル(MIM)の構成構造について検討する。
我々の主な貢献は、HKRRがMIMを適応的に学習できることを示し、次元の呪いを克服することである。
推定器のカーネル特性を利用してアドホック最適化手法を開発する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:03:33 GMT)
MIMIC: Integrating Diverse Personality Traits for Better Game Testing Using Large Language Model [9.4] MIMICは多様な性格特性をゲームエージェントに統合する新しいフレームワークである。
より高いテストカバレッジと、異なるゲーム間でのよりリッチなゲーム内インタラクションを実現することができる。
また、マインクラフトの最先端エージェントよりも高いタスク完了率を達成している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:30:00 GMT)
Limitations of strong coupling in non-Markovian quantum thermometry [9.4] 非マルコフ環境に埋め込まれた単一量子ビットプローブを用いて量子温度測定を行う。
以上の結果から,量子温度測定の基本的な制約と可能性を明らかにした。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:20:44 GMT)
Orchestrating Human-AI Teams: The Manager Agent as a Unifying Research Challenge [9.4] 本稿では,動的な人間-AIチーム内での協調を組織する自律型エージェントシステムの研究ビジョンについて述べる。
複雑な目標をタスクグラフに分解し、タスクを人間やAI労働者に割り当て、進捗を監視し、透過的なステークホルダーコミュニケーションを維持するエージェントである。
マルチエージェントワークフローオーケストレーションのためのオープンソースのシミュレーションおよび評価フレームワークであるMA-Gymをリリースする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:51:39 GMT)
What if I ask in \textit{alia lingua}? Measuring Functional Similarity Across Languages [9.3] 我々の分析によると、モデルのサイズと能力が大きくなるにつれて、言語間でモデルの応答がますます一貫性を増す。
これらの結果は、多言語信頼性を評価する実用的なツールとしての$kappa_p$の価値だけでなく、より一貫性のある多言語システムの開発を導く可能性も浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:13:44 GMT)
Policy Gradient Guidance Enables Test Time Control [9.2] 政策グラディエントガイダンス(PGG)について紹介する。
PGGは無条件分岐でポリシー勾配を強化し、条件分岐と無条件分岐を補間する。
離散的および連続的な制御ベンチマークでPGGを評価する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:00:35 GMT)
FalseCrashReducer: Mitigating False Positive Crashes in OSS-Fuzz-Gen Using Agentic AI [9.2] 本稿では,自動ファズドライバ生成のためのマルチエージェントシステムOSS-Fuzz-Genにおいて,AIによる偽陽性を減らすための2つの戦略を提案する。
第一に、制約ベースのファズドライバ生成は、関数の入力と状態に対する制約を積極的に強制し、ドライバ生成をガイドする。
第二に、コンテキストベースのクラッシュ検証は関数呼び出しをリアクティブに分析して、報告されたクラッシュがプログラムエントリポイントから可能かどうかを判断する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:36:56 GMT)
PiCa: Parameter-Efficient Fine-Tuning with Column Space Projection [9.2] 専門的なタスクやドメインに適したエキスパートモデルを構築するためには、微調整された大規模な基盤モデルが不可欠である。
提案手法は,理論上の基礎となるPEFT法であるコロン宇宙投射(PiCa)を用いた効率的なファインチューニングである。
PiCaは、同等あるいはより小さなパラメータ予算の下で、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:11:07 GMT)
Rethinking the shape convention of an MLP [9.1] マルチ層パーセプトロン(MLP)は、通常、拡張された隠れ空間で処理が行われる間、スキップ接続が入出力次元で動作する狭い幅の狭い設計に従う。
本研究では,狭い隙間を流れる残差ボトルネックに対して,スキップ接続を拡大次元で動作させる広狭幅(Hourglass)ブロックを提案する。
本研究は,トランスフォーマーや他の残余ネットワークに拡張される可能性のある,現代のアーキテクチャにおけるスキップ接続配置の再検討を示唆する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:38:15 GMT)
A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion [8.9] 本稿では,コンピュータビジョンの文脈において,既存の動的ニューラルネットワーク研究を合成・統合する包括的調査を行う。
動的ニューラルネットワークは, 適応性, ノイズ低減, 情報優先化において, センサフュージョンの文脈で特に有用である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:51:09 GMT)
Diffusion Models and the Manifold Hypothesis: Log-Domain Smoothing is Geometry Adaptive [8.6] スコア関数の滑らか化はデータ多様体に滑らかな接点をもたらすことを示す。
また、拡散モデルが一般化する多様体は、適切な平滑化を選択することで制御できることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:39 GMT)
What Makes a Good Dataset for Knowledge Distillation? [8.6] 知識蒸留(KD)は、モデル圧縮の一般的かつ効果的な方法である。
KDの重要な前提の1つは、教師のオリジナルのデータセットが学生のトレーニング時にも利用できることである。
企業なしデータセットでトレーニングされた大規模なモデルの連続学習や蒸留といった状況では、元のデータにアクセスすることは必ずしも不可能である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:54:35 GMT)
Schema Generation for Large Knowledge Graphs Using Large Language Models [8.6] 大規模言語モデル(LLM)は、セマンティックウェブと自然言語処理におけるデータ品質の確保とユーザビリティのサポートにおいて重要な役割を果たす。
オントロジー工学などのタスクにおけるLLMを用いたスキーマ生成について検討する。
本ベンチマークでは,LLMの制約を構文的にリッチな定式化に推し進める構造生成の新たな課題について紹介する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:15:14 GMT)
UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction [8.5] 超音波画像分類とセグメンテーションの両方のための普遍的なフレームワークであるUltraUPConvNetを紹介する。
本モデルは,計算オーバーヘッドの少ない特定のデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:40:19 GMT)
What happens when generative AI models train recursively on each others' outputs? [8.5] データによるインタラクションは、おそらくオリジナルのトレーニングデータに欠落した新しい概念にそれらを公開することでモデルに恩恵をもたらすが、共有タスク上でのパフォーマンスを均質化することもできる。
データによるインタラクションは、おそらくオリジナルのトレーニングデータに欠落した新しい概念にそれらを公開することでモデルに恩恵をもたらすが、共有タスク上でのパフォーマンスを均質化することもできる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:50:20 GMT)
No Language Data Left Behind: A Comparative Study of CJK Language Datasets in the Hugging Face Ecosystem [8.4] 文化規範,研究環境,制度的実践がデータセットの可用性と品質をどのように形成するかを検討する。
本研究は,中国におけるデータセットの大規模かつ機関主導的な性質,韓国NLPにおける草の根コミュニティ主導の開発,日本コレクションへのエンターテイメントとサブカルチャーの重視,などを明らかにする。
我々は、将来のデータセットのキュレーションとコラボレーションのためのベストプラクティスについて議論し、3つの言語すべてにわたるリソース開発を強化することを目的として締めくくった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:13:17 GMT)
Restricted Spectral Gap Decomposition for Simulated Tempering Targeting Mixture Distributions [8.4] 模擬テンパリングと任意の局所連鎖モンテカルロサンプリング器を組み合わせることを考える。
混合分布からサンプリングするために,メトロポリスのスペクトルギャップの制限値に下限を与える新しい分解定理を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:44:54 GMT)
NeuroSwift: A Lightweight Cross-Subject Framework for fMRI Visual Reconstruction of Complex Scenes [8.3] 視覚刺激のクロスオブジェクト再構成は依然として困難であり、計算的に要求される。
我々は,低レベル機能のためのAutoKLとセマンティクスのためのCLIPという,アダプタを拡散を介して統合するNeuroSwiftを提案する。
クロスオブジェクトの一般化では、ある被験者に事前トレーニングを行い、新しい被験者のパラメータの17%だけを微調整し、他の構成要素を凍結する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:45:43 GMT)
Unmasking the Genuine Type Inference Capabilities of LLMs for Java Code Snippets [8.3] 大規模言語モデル(LLM)は、オンラインコードスニペットの型推論に使用される。
評価に使用されるベンチマークであるStatType-SOは、2017年からGitHubで公開されている。
本稿では,Java コードスニペット上での LLM の真の型推論能力を包括的に評価する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:45:47 GMT)
MOSAIC: A Multilingual, Taxonomy-Agnostic, and Computationally Efficient Approach for Radiological Report Classification [8.3] 放射線学的報告分類のための多言語・分類学的・計算学的アプローチであるMOSAICを紹介する。
コンパクトなオープンアクセス言語モデル(MedGemma-4B)をベースとして、MOSAICはゼロプロンプト/フェーショットファインタニングと軽量ファインタニングの両方をサポートしている。
我々はMOSAICを、英語、スペイン語、フランス語、デンマーク語で7つのデータセットにまたがって評価し、複数の画像のモダリティとラベルのモダリティにまたがる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:59:44 GMT)
Inference-Time Search using Side Information for Diffusion-based Image Reconstruction [8.1] 本稿では,その側情報を用いてサンプリングプロセスを導出する新しい推論時間探索アルゴリズムを提案する。
我々のアプローチは、既存の拡散ベースの画像再構成パイプラインにシームレスに統合できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:16:00 GMT)
Unmute the Patch Tokens: Rethinking Probing in Multi-Label Audio Classification [8.1] オーディオにおける自己教師型学習は、微調整をデフォルトとする。
本稿では,二項化プローブについて紹介する。二項化プローブは,プロトタイプを学習し,クラスワイズ情報アグリゲーションを行う軽量でシンプルなプーリング手法である。
我々の研究は、オーディオSSLモデルを評価するための競争的かつ効率的なパラダイムとして探索を確立し、コストのかかる微調整への依存に挑戦する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:39:06 GMT)
KaVa: Latent Reasoning via Compressed KV-Cache Distillation [8.1] KaVaは、教師の圧縮されたKVキャッシュから自己蒸留によって潜在学生に知識を直接蒸留するフレームワークである。
直接トークン対応に欠ける圧縮KV-cache内の抽象的・非構造的知識は、潜伏した推論学生にとって豊かな監督信号として機能することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:51 GMT)
Calibrating the Full Predictive Class Distribution of 3D Object Detectors for Autonomous Driving [8.0] 全クラスにわたる完全な予測信頼分布のキャリブレーションを考慮する必要があると論じる。
本稿では,主予測の校正と完全予測ベクトルをトレーニング目標とする2つの補助正則化損失項を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:22:03 GMT)
Disentangling the Complex Multiplexed DIA Spectra in De Novo Peptide Sequencing [8.0] Data-Independent Acquisition (DIA) が導入された。
DIAデータは、コヒーレントペプチド、高ノイズ、および様々なデータ品質でマージされる。
本稿では,新しい深層学習手法であるDIANovoを提案し,これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:16:38 GMT)
Predictive inference for time series: why is split conformal effective despite temporal dependence? [8.0] コンフォーマル予測法は、任意の iid または交換可能なデータ分布に対して、分布のないカバレッジを提供する。
自動回帰モデルのような過去の観測を利用する予測器は、この問題をさらに悪化させる。
この結果から, 時系列内の時間的依存が交換可能性に違反する程度を計測し, 新たな「スウィッチ係数」を用いて, これらの手法のカバレッジを損なうことが示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:24:04 GMT)
To Mask or to Mirror: Human-AI Alignment in Collective Reasoning [8.0] 大規模言語モデル(LLM)は、集団的な意思決定をモデル化し、拡張するためにますます使われている。
集合的アライメントを評価するための実証的枠組みを提案する。
集合的推論における人間とAIのアライメントは、文脈、手がかり、モデル固有の帰納バイアスに依存することを実証的に実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:41:30 GMT)
Tunable Wigner Molecules in a Germanium Quantum Dot [8.0] ウィグナー分子は、高いチューニング性を持つゲート定義のゲルマニウム量子ドットで形成することができる。
ウィグナー分子からフェルミ液体様粒子への溶融過程が観察された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:25:41 GMT)
Universal Dynamic Regret and Constraint Violation Bounds for Constrained Online Convex Optimization [7.8] 普遍的動的後悔と累積的制約違反境界をもたらす単純なモジュラ構造を持つ2つのアルゴリズムを提案する。
我々の結果は、コスト関数と制約関数の両方が敵によって任意に選択される場合に最も一般的な場合において成り立つ。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:19:16 GMT)
FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol [7.8] 推論プロトコルは内部の審議を組織するが、自己修正を誘発する外部質問の明確なメカニズムは欠如している。
For-Promptingは、デフェンダーが回答を提案し、Objectionerが直接修正せずに質問スタイルの異議を提起し、Hostが一貫性とクロージャを強制する非対称なプロトコルである。
GSM8Kでは、単一プロンプトよりも約22%のポイントゲインとCoTと同等の精度を示し、一様GPT 4.1判事の推論とコヒーレンスにおいて10%以上の高い評価を得た。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:57:58 GMT)
BioX-Bridge: Model Bridging for Unsupervised Cross-Modal Knowledge Transfer across Biosignals [7.7] 生体信号は、人間の身体の生理状態に関する貴重な洞察を提供する。
生体信号のモダリティは、機能、信号の忠実度、センサーの快適性、コストによって異なる。
それらはしばしば相互関係があり、人間の生理学の全体性と相互に結びついている性質を反映している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:51:19 GMT)
CBVLM: Training-free Explainable Concept-based Large Vision Language Models for Medical Image Classification [7.6] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、事前定義された人間の解釈可能な概念のセットにモデル出力を制約することで後者に対処する。
本稿では,これらの課題に対処する,シンプルで効果的な手法CBVLMを提案する。
4つの医療データセットと12のLVLMにまたがる広範囲な実験により,我々のアプローチを検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:31:29 GMT)
PychoBench: Evaluating the Psychology Intelligence of Large Language Models [7.6] 大規模言語モデル(LLM)は、幅広い産業で顕著な成功を収めている。
しかし、心理学的カウンセリングのような認知能力を必要とするアプリケーションにおけるその可能性はほとんど未解決のままである。
LLMは心理的カウンセリングに効果的に適用できるのか?
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:49:06 GMT)
Detection of Chagas Disease from the ECG: The George B. Moody PhysioNet Challenge 2025 [7.6] George B. Moody PhysioNet Challenge 2025は、心電図(ECG)からChagas病を識別するためのアルゴリズムアプローチを開発するチームを招いている。
この課題は、複数の革新をもたらします。まず、患者レポートと血清検査のラベル付きデータセットを活用し、弱いラベル付きデータセットと弱いラベル付きデータセットで大規模なデータセットを提供しました。次に、モデルロバスト性および未確認データソースへの一般化性をサポートするために、データを拡張し、第3に、Chagas病の局所血清検査能力をキャプチャして、機械学習問題をトリアージタスクとするために評価指標を適用しました。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:50:36 GMT)
C2AL: Cohort-Contrastive Auxiliary Learning for Large-scale Recommendation Systems [7.5] 共有埋め込み選択のための因子化機械において,注意機構が重要な役割を担っていることを示す。
本稿では、データセットのサブ構造を分析し、補助学習を通して強力な分布コントラストを持つ構造を明らかにすることで、この問題に対処することを提案する。
このアプローチは、注目層の学習プロセスをカスタマイズし、少数派コホートとの相互情報を保護し、グローバルなパフォーマンスを向上させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:00:17 GMT)
Feature Representation Transferring to Lightweight Models via Perception Coherence [7.5] より大規模な教師モデルから軽量な学生モデルに特徴表現を伝達する手法を提案する。
オーロラティカルな洞察は、特徴表現伝達の過程に関する確率論的視点を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:06:17 GMT)
VarCoNet: A variability-aware self-supervised framework for functional connectome extraction from resting-state fMRI [7.5] VarCoNetは、静止状態fMRI(rs-fMRI)データからロバスト関数コネクトーム(FC)を抽出するための拡張された自己教師型フレームワークである。
VarCoNetは自己教師付きコントラスト学習を用いて、本質的に機能的な個人間変動を生かしている。
VarCoNetは、(i)Human Connectome Projectのrs-fMRIデータと(ii)ABIDE IとABIDE IIデータセットのrs-fMRIデータを用いて、(ii)自閉症スペクトラム障害(ASD)分類という2つの下流タスクで評価されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:29:17 GMT)
Golden Ratio Weighting Prevents Model Collapse [7.5] 我々は、実データと合成データを統合するための最適なトレーニング戦略を開発する。
合成データの混合比と重み付け方式が最終モデルの性能に及ぼす影響を特徴付ける。
場合によっては、実データに割り当てられた最適な重みは、黄金比の逆数に対応する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:02:19 GMT)
How to Combat Reactive and Dynamic Jamming Attacks with Reinforcement Learning [7.5] 本稿では, ジャマーがチャネル選択の動的ポリシーと検知しきい値を採用し, 進行中の送信を検知・妨害する, 反応性ジャミングを緩和する問題について検討する。
送信機-受信機ペアは、送信電力、変調、チャネル選択に適応するために強化学習(RL)を用いることで、ジャミングを回避し、時間とともにスループットを最適化する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:44:38 GMT)
ACM SIGSOFT SEN Empirical Software Engineering: Introducing Our New Regular Column [7.4] ESEの研究は、新しい障害、欠点、技術が出現するにつれて、依然として進化し続ける必要がある。
新たなACM SIGSOFT SENSEN-ESEコラムでは,ESE研究のメタアスペクトを議論する場を紹介した。
カラムの目的は、しばしば触れられたり、暗黙にされたりしないかもしれないESEトピックに関する会話を定期的に発火できる場所になることです。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:28:54 GMT)
Does Bigger Mean Better? Comparitive Analysis of CNNs and Biomedical Vision Language Modles in Medical Diagnosis [7.4] 本稿では、教師付き軽量畳み込みニューラルネットワーク(CNN)とゼロショット医療ビジョンランゲージモデル(VLM)の比較分析を行う。
両症例とも,CNNは競争力の高いベースラインとして機能している。
検証セットの分類閾値を最適化することにより、両方のデータセット間でBiomedCLIPの性能が著しく向上する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:22:36 GMT)
Fusing Foveal Fixations Using Linear Retinal Transformations and Bayesian Experimental Design [7.4] 我々は、固定の網膜変換を、シーンのリニアダウンサンプリング潜像として明確に表現する。
この変換により、シーンのFAモデルの因子分析と混合における潜伏変数の正確な推論を行うことができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:29:39 GMT)
Pool Me Wisely: On the Effect of Pooling in Transformer-Based Models [7.2] 本稿では,広く利用されているプール方式を備えたトランスフォーマーベースモデルの表現性を特徴付ける理論的枠組みを提案する。
グローバルな文脈理解とローカルな文脈理解の両方を必要とするタスクにまたがるプール戦略を実証的に評価する。
本研究は理論的・実証的な視点を統一し,特定のタスクに適したプール機構の選択や設計のための実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:17:24 GMT)
REALM: Recursive Relevance Modeling for LLM-based Document Re-Ranking [7.2] 大規模言語モデル(LLM)は、ドキュメントの再ランク付けにおいて強力な能力を示している。
我々は不確実性を認識した再分類フレームワークであるREALMを提案する。
我々は、トークンの使用とレイテンシを大幅に削減しながら、最先端のリランカを上回ることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:20:02 GMT)
Communication-Efficient and Accurate Approach for Aggregation in Federated Low-Rank Adaptation [7.1] 現在のフェデレート低ランク適応(FedLoRA)メソッドは、不正確な更新のために顕著な課題に直面している。
textbfFederated textbfLow-textbfRank textbfAggregation with textbfNearly textbfAccurate Estimation (FLoRA-NA)を提案する。
FLoRA-NAは、局所的なパーソナライゼーションとグローバルな一般化のギャップを埋め、以前のパーソナライズされたFedLoRAアプローチの重要な制限に対処する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:48:12 GMT)
Zero-shot Human Pose Estimation using Diffusion-based Inverse solvers [7.0] 本稿では,ポーズ推定を逆問題として定式化し,ゼロショットの一般化が可能なアルゴリズムを設計する。
提案したInPose法は, 身近な身近な計測を最もよく説明できるポーズ列を生成的に推定する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:16:43 GMT)
A Benchmark Study of Deep Reinforcement Learning Algorithms for the Container Stowage Planning Problem [6.9] 本稿では,コンテナ・スタワージ計画(CSPP)のための強化学習手法のベンチマークを行う。
本フレームワークでは,DQN,QR-DQN,A2C,PPO,TRPOの5つのRLアルゴリズムを評価する。
本稿では、CSPPの複数のRL法をベンチマークし、再利用可能なGym環境とクレーンスケジューリングを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:47:33 GMT)
User to Video: A Model for Spammer Detection Inspired by Video Classification Technology [6.8] UVSDと呼ばれるユーザビデオ化に基づくスパマー検出モデルを提案する。
ユーザの姿勢の逆挙動を考慮すると、ユーザは画素と見なされ、その姿勢は画素のRGBとして定量化される。
公開データセット(WEIBOとTWITTER)を使用した実験は、最先端の手法よりもUVSDモデルの利点を示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:05:19 GMT)
Shilling Recommender Systems by Generating Side-feature-aware Fake User Profiles [6.6] Leg-UPフレームワークを拡張して、サイド機能を導入し、サイド機能対応のフェイクユーザプロファイルの生成を可能にします。
ベンチマーク実験により,本手法はステルス性を維持しながら強力な攻撃性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:39:25 GMT)
IoDResearch: Deep Research on Private Heterogeneous Data via the Internet of Data [6.5] IoDResearchはプライベートなデータ中心のDeep Researchフレームワークで、Internet of Dataパラダイムを運用している。
IoDResearchは異種資源をFAIR準拠のデジタルオブジェクトとしてカプセル化する。
マルチエージェントシステムは、信頼性の高い質問応答と構造化された科学的レポート生成の両方をサポートする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:51:58 GMT)
Adapting Large Language Models for Character-based Augmentative and Alternative Communication [6.4] AAC(Augmentative and Alternative Communication)のユーザは、文字言語モデルを使用するインターフェースを通じて、レター・バイ・レターを書くことができる。
ほとんどの最先端の大規模事前訓練言語モデルは、可変長のサブワードトークンを予測する。
本研究では,そのようなモデルを用いて文字予測を高精度かつ効率的に行う方法について検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:20:32 GMT)
Median2Median: Zero-shot Suppression of Structured Noise in Images [6.4] 実世界の画像は、強い異方性相関を持つ構造化ノイズによって劣化することが多い。
本稿では,構造化雑音に対するゼロショットデノーミングフレームワークMedian2Median (M2M)を提案する。
M2Mは1つのノイズ入力から擬似非依存のサブイメージペアを生成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:47:00 GMT)
Private and Fair Machine Learning: Revisiting the Disparate Impact of Differentially Private SGD [6.3] ディファレンシャルプライベート勾配降下(DPSGD)を持つニューラルネットワークのトレーニングは、モデルの学習力学に影響を与える。
これはモデルの性能と公平性に影響を与える可能性がある。
非プライベートモデルに匹敵する公平度レベルは、微分プライベートモデルの性能に対するハイパーパラメーターを最適化することで達成できることが示唆されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:31:28 GMT)
KAIROS: Unified Training for Universal Non-Autoregressive Time Series Forecasting [6.3] KAIROSは非自己回帰時系列予測フレームワークである。
自動回帰アプローチとは異なり、KAIROSはエラーの蓄積を回避し、ジャスト・イン・タイム推論を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:50:50 GMT)
Precise Dynamics of Diagonal Linear Networks: A Unifying Analysis by Dynamical Mean-Field Theory [6.2] 対角線ネットワーク(Diagonal linear network,DLN)は、ニューラルネットワークトレーニングにおいていくつかの非自明な振る舞いをキャプチャするトラクタブルモデルである。
DLNの勾配流力学における様々な現象を統一的に解析する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:47:36 GMT)
Search-Based Software Engineering and AI Foundation Models: Current Landscape and Future Roadmap [6.2] 検索ベースのソフトウェアエンジニアリング(SBSE)は、約25年間、活発な研究領域であった。
AIの最近の進歩、特に大規模言語モデル(LLM)のような基礎モデル(FM)の出現は未決定のままである。
本稿では,SBSEの現在の状況をFMで表現し,オープンな課題を特定し,今後の研究方向性を概説する研究ロードマップを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:15:32 GMT)
Rethinking KL Regularization in RLHF: From Value Estimation to Gradient Optimization [6.1] Reinforcement Learning from Human Feedback (RLHF) は、Kulback-Leibler (KL) の分散損失を利用してトレーニングを安定させ、オーバーフィッティングを防ぐ。
GRPOのような手法では、数値値の推定からその実装を導出することができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:00:02 GMT)
Discrete Facial Encoding: : A Framework for Data-driven Facial Display Discovery [6.1] 本稿では,表情のコンパクトかつ解釈可能な辞書の教師なし,データ駆動型代替手段であるDiscrete Facialを紹介する。
我々のシステムは、FACSベースのパイプラインと強力な画像およびビデオ表現学習モデルの両方を一貫して上回っている。
我々の表現は幅広い種類の顔ディスプレイをカバーしており、心理的および情緒的コンピューティングアプリケーションに対するFACSのスケーラブルで効果的な代替手段としての可能性を強調している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:44:45 GMT)
Handling Heterophily in Recommender Systems with Wavelet Hypergraph Diffusion [6.1] 本稿では,FWHDNN(Fusion-based Wavelet Hypergraph Diffusion Neural Networks)を紹介する。
このモデルには,(1)異種ハイパーグラフ拡散を利用したクロスディファレンス関係エンコーダ,(2)ウェーブレット変換に基づくハイパーグラフニューラルネットワーク層を用いたマルチレベルクラスタワイドエンコーダ,(3)中間・後期融合戦略を通じて構造情報とテキスト情報を結合する統合マルチモーダル融合機構の3つの重要な構成要素が組み込まれている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:05:04 GMT)
Activated LoRA: Fine-tuned LLMs for Intrinsics [6.1] Low-Rank Adaptation (LoRA) は、大規模基盤モデルの重みを微調整するための高効率なフレームワークとして登場した。
アクティベートされたLoRAは、aLoRAが呼び出された後、シーケンス内のトークンの重みにのみ適応するようにLoRAフレームワークを変更するアダプタアーキテクチャである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:25:29 GMT)
TLUE: A Tibetan Language Understanding Evaluation Benchmark [6.0] textbfTLUEはチベット語でLLMの習熟度を測定するための最初の大規模ベンチマークである。
textbfTLUEは、チベット語理解における将来の研究を促進するための重要な基盤を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:49:07 GMT)
Do AI Models Perform Human-like Abstract Reasoning Across Modalities? [6.0] OpenAIのo3-preview推論モデルはARC-AGIベンチマークで人間の精度を上回った。
本研究では,ConceptARCにおけるモデルの抽象化能力について検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:35:10 GMT)
Latency-aware Multimodal Federated Learning over UAV Networks [5.9] 本稿では,無人航空機(UAV)が補助するマルチモーダル学習(FML)について,システム遅延の最小化に着目して検討する。
このフレームワークでは、UAVはネットワーク全体に分散し、データを収集し、モデルトレーニングに参加し、グローバルモデルを構築する。
主な目的は、UAVスケジューリング、電力制御、軌道、計画、リソース割り当て、BSリソース管理を併用することで、UAVネットワークにおけるFMLシステムのレイテンシを最適化することである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:57:44 GMT)
VirDA: Reusing Backbone for Unsupervised Domain Adaptation with Visual Reprogramming [5.9] VirDAはドメイン固有のビジュアル・リプログラミング・レイヤをバックボーンにプリペイドする。
VirDAをOffice-31上で評価し,平均精度92.8%,トレーニング可能なパラメータは1.5Mに留まった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:40:42 GMT)
Bootstrapping the $R$-matrix [5.9] ヤン・バクスター方程式は、$R$-行列の拡張における演算子値係数に対する見かけ上の独立な制約の無限個を含む。
これらの係数はケネディの逆数公式を用いて反復的に解くことができ、無限のステップの後に$R$-行列を再構成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:22:32 GMT)
Matching the Optimal Denoiser in Point Cloud Diffusion with (Improved) Rotational Alignment [5.8] 拡散モデルのトレーニングは、ノイズレベルの異なるサンプルをノイズにする方法を学ぶことで構成される。
最適デノイザは行列フィッシャー分布を$SO(3)$で表現できることを示す。
我々はこの視点に基づいて、小さな雑音の限界において最適なデノイザにより良い近似器を導出する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:55:22 GMT)
AI Foundation Model for Time Series with Innovations Representation [5.8] 本稿では,工学的応用における時系列のための人工知能(AI)基盤モデルを提案する。
エンジニアリングモニタリングと制御のための革新表現に基づく生成事前学習トランスである時系列GPT(TS-GPT)を提案する。
本稿では,米国独立系事業者の歴史的データを用いたリアルタイム位置情報の限界価格予測におけるTS-GPTの有効性を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:14:20 GMT)
Learning Representations Through Contrastive Neural Model Checking [5.8] Contrastive Neural Model Checking (CNML) は、モデルチェックタスクを協調表現を学習するための誘導信号として活用する新しい手法である。
CNMLは、アルゴリズム的ベースラインと神経的ベースラインの両方において、クロスモーダルとイントラモーダルの両方でかなり優れています。
これらの結果から,モデル検査が形式言語における表現の学習の目的となることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:52:47 GMT)
On the Role of Temperature Sampling in Test-Time Scaling [5.8] 大規模なKでは、さらなるスケーリングは利得を得られず、トレースの数に関係なく、ある種の難しい質問は未解決のままである。
Qwen3と5つの代表的な推論ベンチマークで評価された温度スケーリングは、単一温度のTSよりも7.3ポイント高い。
温度スケーリングはまた、ベースモデルが強化学習(RL)でトレーニングされたモデルに匹敵するパフォーマンスに到達することを可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:09:56 GMT)
Shift-Invariant Attribute Scoring for Kolmogorov-Arnold Networks via Shapley Value [5.8] Kolmogorov-Arnold Networks (KAN) は、エッジ上で学習可能なスプラインベースのアクティベーション関数を利用することによってこの問題に対処する。
そこで我々はShapley値属性を用いた刈り込みフレームワークShapKANを提案し,ノードの重要度をシフト不変な方法で評価する。
当社のアプローチでは,リソース制約のある環境への展開を容易にすることにより,kanの解釈可能性の向上を実現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:45:02 GMT)
Scalable Asynchronous Federated Modeling for Spatial Data [5.7] 本研究では,低ランクガウス過程近似に基づく空間データのための非同期フェデレーションモデリングフレームワークを提案する。
独立な理論的重要性の結果として、不安定性に明示的に依存する線形収束を確立する。
数値実験により、非同期アルゴリズムは、バランスの取れたリソース割り当ての下で同期性能を達成することを示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:04:46 GMT)
Sharpness of Minima in Deep Matrix Factorization: Exact Expressions [5.7] 我々は,任意の最小値における二乗誤差損失のヘシアンに対する最初の正確な表現を示す。
本研究では,勾配学習中の脱走現象について検討した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:50:49 GMT)
Finite-Time Bounds for Distributionally Robust TD Learning with Linear Function Approximation [5.6] 線形関数近似を用いた最初の頑健な時間差学習を提案する。
我々の結果は、ロバストなRLアルゴリズムの実証的な成功と、ロバストでないアルゴリズムが享受する漸近的保証との間に重要なギャップを埋める。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:01:41 GMT)
EvolveCaptions: Empowering DHH Users Through Real-Time Collaborative Captioning [5.6] EvolveCaptionsは、最小限の努力で、その場でのパーソナライゼーションをサポートするリアルタイムで協調的なASR適応システムである。
12名のDHHと6名の聴力者を対象にした調査では、EvolveCaptionsは1時間以内に全DHHユーザに対してワードエラー率(WER)を低減した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:32:29 GMT)
nDNA -- the Semantic Helix of Artificial Cognition [5.6] AIファンデーションモデルが能力で成長するにつれて、より深い疑問が浮かび上がってくる。
そこで我々は,本質的な信念の幾何学を通して,この潜伏したアイデンティティを捉える意味的遺伝子型表現としてニューラルDNAを提案する。
生物学的DNAと同様に、nDNAは祖先、突然変異、セマンティックな遺伝をコードし、微調整やアライメントの傷跡、文化的なインプリント、建築的な漂流などに見られる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:07:59 GMT)
A fast and effective kernel two-sample test for large-scale data [5.6] 我々は,多種多様な選択肢にまたがって高い出力を示す新しい試験を提案する。
新しいテストは既存の方法よりも高次元に対して堅牢である。
新しいアプローチは、合成データと実世界のデータの両方でうまく機能する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:56:52 GMT)
MHier-RAG: Multi-Modal RAG for Visual-Rich Document Question-Answering via Hierarchical and Multi-Granularity Reasoning [5.6] マルチモーダルな長文文書問合せタスクは、複数のページに分散したマルチモーダルなエビデンスを特定し、統合することを目的としている。
既存の手法はLVLM(Large Vision-Language Model)とRAG(Retrieval-Augmented Generation)に分類できる。
MHier-RAGと呼ばれる新しいマルチモーダルRAGモデルが提案され、テキスト情報と視覚情報の両方を長距離ページにわたって活用した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:13:59 GMT)
Relative Advantage Debiasing for Watch-Time Prediction in Short-Video Recommendation [5.5] 本稿では,ユーザグループとアイテムグループで条件付き参照分布と比較することにより,視聴時間を補正する,新たなアドバンテージ・デバイアス化フレームワークを提案する。
このアプローチは、量子的嗜好信号を生成し、2段階アーキテクチャを導入し、配当推定と選好学習を明確に分離する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:50:43 GMT)
Exploring OCR-augmented Generation for Bilingual VQA [5.5] 視覚言語モデル(VLM)を用いたOCR拡張生成の検討
この領域の研究を支援するため、KLOCRをトレーニングし、リリースする。
既存のVQAベンチマークを補完するため、韓国のVQAに対してKOCRBenchをキュレートする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:19:31 GMT)
GARG-AML against Smurfing: A Scalable and Interpretable Graph-Based Framework for Anti-Money Laundering [5.5] 本稿では, 効率的なアンチマネーロンダリング(AML)のためのグラフベースの新しいGARG-AMLを提案する。
ネットワーク内の各ノードに1つの解釈可能なスコアを与えることで、一般的なマネーロンダリング手法であるスマーフィングリスクを定量化する。
提案手法は, 計算効率, 検出能力, 透明性のバランスをとる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:29:35 GMT)
Quantum Cellular Automaton Model for the Generalized Dirac Equation [5.5] 本研究では、連続極限において(1+1)次元一般化ディラック方程式(GDE)に収束する一元的量子セルオートマトン(QCA)を提案する。
我々は、モデルの正確な分散関係を固有値スペクトルから導出し、それが正しい相対論的極限を持つことを示す。
この量を測定することで、スピノルの隠れた内部ダイナミクスを明らかにし、カイラル質量項の物理的結果を明確に視覚的に確認する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:37:41 GMT)
Quantum advantages in ground state preparation, combinatorial optimization, and quantum state preparation [5.5] 逆多項式ギャップを持つ任意の量子ハミルトニアンに対して、基底状態は逆多項式精度の回路深さで作成可能であることを示す。
我々の理論的な発見は、顕著な応用において指数的な量子的優位性を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:17:22 GMT)
An Improved Pure Fully Connected Neural Network for Rice Grain Classification [5.4] 深層学習により、イネの自動分類が可能となり、精度と効率が向上した。
第一段階の訓練に基づく古典モデルは、類似した外的特徴を持つ米品種の区別が困難である可能性がある。
本研究では,米粒分類の観点から,深層学習モデルの分類能力を高めるための2つの微妙な方法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:26:51 GMT)
Ranking Items from Discrete Ratings: The Cost of Unknown User Thresholds [5.4] 粗い離散スケールのレーティングから、きめ細かい項目のランキングを復元できるかどうかを問う。
ほぼ完璧なランキングを達成するには、$Theta(n2)$ユーザと$Omega(n2)$クエリが必要です。
しきい値の多様性は、多くのユーザの粗いレーティングをきめ細かなランキングにマージするために必要ですが、しきい値が未知であれば、この多様性はコストがかかります。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:23:52 GMT)
The Symmetry Taco: Equivalences between Gapped, Gapless, and Mixed-State SPTs [5.3] 我々は,SymTFTフレームワークの混合状態への自然な拡張を,テクスト対称性タコを導入して提案する。
我々のフレームワークは、1+1$dの短距離相関を持つ$G$-symmetric Choi状態の分類を生成する。
混合状態量子物質における双対性、異常、非平衡臨界性を探求するための新しい道を開く。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:55:29 GMT)
Hyperspherical Analysis of Dimer-Dimer Scattering in One-Dimensional Systems [5.3] adiabatic hyperspherical representation (AHR) を用いた1次元量子系における4体散乱の包括的解析について述べる。
本研究では,速度可変離散化法(SVD)を導入し,ポテンシャル曲線の急激な回避交叉による数値的課題を克服する。
その結果,AHR+SVDフレームワークの低次元量子システムにおける高精度な小天体散乱計算のパワーと柔軟性が明らかにされた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:58:43 GMT)
A Methodology for Transparent Logic-Based Classification Using a Multi-Task Convolutional Tsetlin Machine [5.2] Tsetlin Machine(TM)は、有限状態オートマトンを用いて学習し、命題論理を用いてパターンを表現する新しい機械学習パラダイムである。
Convolutional TMは、MNIST、K-MNIST、F-MNIST、CIFAR-2といった様々なデータセットで同等のパフォーマンスを示している。
大規模複雑な学習環境においても,TMは解釈可能性を維持しながら,この深層学習モデルと競争力を発揮することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:25:08 GMT)
FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction [5.2] Flowr.rootは、無条件の3D分子生成とポケット条件のリガンド設計において最先端の性能を達成する。
基礎モデルとして、Flowr.rootは、目に見えない構造活動の風景を説明するために、プロジェクト固有のデータセットを微調整する必要がある。
Flowr.rootは構造認識生成、親和性推定、プロパティ誘導サンプリングを統合することで、構造に基づく薬物設計の包括的な基盤を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:38:26 GMT)
AURA: Adaptive Unified Reasoning and Automation with LLM-Guided MARL for NextG Cellular Networks [5.2] 次世代(NextG)セルネットワークは,高性能を保ちながら動的トラフィックを管理することが期待されている。
LLMは6G計画のための戦略的推論を提供するが、計算コストと遅延はリアルタイムの使用を制限する。
AURAは、クラウドベースのLCMを高レベルプランニングのためのフレームワークであり、MARLエージェントをモデルとしたローカル意思決定のためのベースステーションである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:43:47 GMT)
An Efficient Deep Template Matching and In-Plane Pose Estimation Method via Template-Aware Dynamic Convolution [5.2] 産業検査やコンポーネントアライメントタスクでは、テンプレートマッチングはターゲットの位置と幾何学的状態の効率的な推定を必要とする。
本稿では,テンプレートマッチングを結合局所化と幾何回帰として再構成する軽量なエンドツーエンドフレームワークを提案する。
実験により, 複合変換下での高精度および14msの推論が得られた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:05:43 GMT)
Designing for Novice Debuggers: A Pilot Study on an AI-Assisted Debugging Tool [5.2] 本研究は,大学院生のグループで行った第2の設計デバッガーから得られた知見を報告する。
その結果,本ツールは意味的誤りの解消に極めて有効であり,第1版よりも使いやすくなっていることがわかった。
ツールとのインタラクションを最適化するためには、ユーザプロファイルに基づいてAI支援デバッグアプローチをパーソナライズする必要があると結論付けている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:41:48 GMT)
Unsupervised Dynamic Feature Selection for Robust Latent Spaces in Vision Tasks [5.2] 本稿では,非教師付き動的特徴選択(DFS)を用いた潜在表現の強化手法を提案する。
提案手法は,各インスタンスに対して,画像中の誤認や冗長な情報を識別・削除し,最も関連性の高い特徴だけが潜時空間に寄与することを保証する。
画像データセットを用いて行った実験では、教師なしDSSを備えたモデルが、様々なタスクにおける一般化性能を大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:46:59 GMT)
Radiation of "breathing" vortex electron packets in magnetic field [5.1] 振動電荷分布は磁場中で光子を放出することが期待される。
この放射によってOAMが取り除かれ、電子の渦性が失われるのか?
我々は、縦磁場中を伝播しながら、渦電子がエネルギーとOAMを失う速度を定量化し、放射された電界の総放射パワーと角運動量を計算する。
我々は、少なくとも準古典近似において、線形加速器が相対論的渦電子や他の荷電粒子の渦性を維持するための顕著なツールであることを示す放射パワーと角運動量損失の両方が無視可能であることを発見した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:03:35 GMT)
Optimal and Provable Calibration in High-Dimensional Binary Classification: Angular Calibration and Platt Scaling [5.1] テキスト重みは、推定器$hatw$と真の線形重み$w_star$との角度$hatw, w_star$に依存する。
我々の研究は、高次元でのキャリブレーションと最適性の両方を満たすキャリブレーション戦略を初めて提供するものである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:20:06 GMT)
KVComm: Enabling Efficient LLM Communication through Selective KV Sharing [5.1] 大規模言語モデル(LLM)は、効果的なモデル間通信が不可欠であるマルチエージェントシステムにおいて、ますます多くデプロイされている。
我々は,KVペアの選択的共有により,LLM間の効率的な通信を可能にする新しいフレームワークであるKVCommを提案する。
本研究は,KVペアがLLM間通信に有効な媒体となる可能性を強調し,スケーラブルで効率的なマルチエージェントシステムを実現することを目的とした。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:01:54 GMT)
Pre-Hoc Predictions in AutoML: Leveraging LLMs to Enhance Model Selection and Benchmarking for Tabular datasets [5.0] 本稿では,AutoMLとpre-hocモデル選択の交点について検討する。
従来のモデルとLarge Language Model (LLM) エージェントを活用することで、AutoML検索スペースを削減できる。
提案されたアプローチは、AutoMLのシフトを提供し、計算オーバーヘッドを大幅に削減するとともに、与えられたデータセットに最適なモデルを選択している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:37:12 GMT)
Approximate Quantum State Preparation with Tree-Based Bayesian Optimization Surrogates [4.9] 短期量子コンピュータにおける近似状態準備の問題について検討する。
目的は、リソースオーバーヘッドを最小限にしつつ、ターゲット量子状態の出力分布を再現するパラメータ化回路を構築することである。
本稿では,木モデルを用いたベイズ最適化に基づくサロゲート誘導最適化フレームワークCircuitTreeを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:13:44 GMT)
Amplitude-based Input Attribution in Quantum Learning via Integrated Gradients [4.9] 本稿では,回路ベースQMLモデルにおける振幅に基づく入力属性スコアを計算するためのフレームワークであるHATTRIQを紹介する。
分類タスクにおけるHATTRIQの有効性を複数のデータセットで検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:00:41 GMT)
Multidata Causal Discovery for Statistical Hurricane Intensity Forecasting [4.9] 我々は、統計的ハリケーン強度予測スキーム(SHIPS)に基づく複製データセットを用いたマルチデータ因果探索フレームワークを活用する。
ハリケーンの強度変化と因果関係のある予測器を同定・選択する実験を行った。
我々は複数の線形回帰モデルを訓練し、因果的特徴選択を選択、相関、ランダムな森林特徴重要度なしで比較する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:23:51 GMT)
TrimTokenator: Towards Adaptive Visual Token Pruning for Large Multimodal Models [4.8] テキストトークンと意味的に視覚トークンを除去する相互情報に基づくトークンプルーニング戦略を導入する。
LLaVA-15-7BやLLaVA-7Bといったモデルでは,テキストトークンを88.9%削減しながら高い性能を維持している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:46:26 GMT)
An Architecture for Spatial Networking [4.7] グラフを用いた空間ネットワークを実現するプログラミングモデルである $textitBifr"ost を導入する。
Bifr"ostは、コロケーションデバイスが直接通信する空間認識アプリケーションの新しいクラスを可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:34:20 GMT)
Information Seeking for Robust Decision Making under Partial Observability [4.7] InfoSeekerは、タスク指向の計画と内部のダイナミクスを整合させ、不確実性の下で最適な決定を行う情報を統合する計画フレームワークである。
InfoSeekerは、サンプル効率を犠牲にすることなく、以前のメソッドよりも74%の絶対的なパフォーマンス向上を実現している。
これらの知見は、部分的に観測可能な環境での堅牢な行動を求める計画と情報の統合の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:06:32 GMT)
MathArena: Evaluating LLMs on Uncontaminated Math Competitions [4.7] MathArenaは、大きな言語モデル(LLM)を評価するための新しいベンチマークである。
繰り返し行われる数学コンペは、高品質で困難な問題のストリームを提供する。
MathArenaは、証明書込み機能の最初のベンチマークでもある。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:27:40 GMT)
LLM4Rec: Large Language Models for Multimodal Generative Recommendation with Causal Debiasing [4.6] 本稿では,5つの重要なイノベーションを取り入れた改良型生成レコメンデーションフレームワークを提案する。
マルチモーダル融合アーキテクチャ、検索強化生成機構、因果推論に基づくデバイアス、説明可能なレコメンデーション生成、リアルタイム適応学習機能。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:53:05 GMT)
AgentRec: Next-Generation LLM-Powered Multi-Agent Collaborative Recommendation with Adaptive Intelligence [4.6] 本稿では,次世代マルチエージェント協調レコメンデーションフレームワークであるAgentRecを紹介する。
提案手法では,会話理解,嗜好モデル,文脈認識,動的ランキングに,特殊なLLMエージェントを用いる。
3つの実世界のデータセットの実験では、AgentRecは最先端のベースラインよりも一貫した改善を実現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:47:11 GMT)
Oracle-RLAIF: An Improved Fine-Tuning Framework for Multi-modal Video Models through Reinforcement Learning from Ranking Feedback [4.6] Oracle-RLAIFは、トレーニングされた報酬モデルをより一般的なOracleローダに置き換えるフレームワークである。
我々は、Oracle-RLAIFが既存の微調整手法を用いて、トップのVLMを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:57:10 GMT)
Lower Bounds on Adversarial Robustness for Multiclass Classification with General Loss Functions [4.6] 任意の損失関数の下での多クラス設定における逆ロバストな分類について考察する。
学習者に依存しない頑健なリスク問題の二重化と偏心化を導出する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:42:36 GMT)
Beyond Linear Diffusions: Improved Representations for Rare Conditional Generative Modeling [4.5] 条件空間の低確率領域において、スコアベース生成モデル学習のサンプル複雑さが小さくなるように、データ表現とフォワードスキームを適応させることが可能であることを示す。
非線形ドリフト項のデータ駆動的選択による拡散が,データの適切な表現の下での尾イベントのモデル化に最も適していることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:06:14 GMT)
Interpretable Machine Learning for Urban Heat Mitigation: Attribution and Weighting of Multi-Scale Drivers [4.5] 都市熱島(UHI)は、しばしば熱波(HW)の間にアクセントを付け、公衆の健康リスクを引き起こす。
本研究は、これらのドライバを運転(D)、都市(U)、局所(L)特徴に分類することを提案する。
解釈可能性の向上と効率の向上を目的として,LUT識別機械学習手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:48:40 GMT)
Towards Effective E-Participation of Citizens in the European Union: The Development of AskThePublic [4.5] E-Participation Platformは、政府にとって、信頼を高め、民主社会を育むための重要な資産である。
公的機関や個人を関与させることで、政策立案者は情報的かつ包括的な決定を下すことができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:57:00 GMT)
Randomized Gradient Subspaces for Efficient Large Language Model Training [4.4] 大規模言語モデル(LLM)のトレーニングは、しばしば極端なメモリ要求によってボトルネックとなり、状態がフットプリントを支配している。
最近の研究は、洗練された更新戦略を用いて低次元部分空間に勾配を投影することで、このコストを軽減している。
小さな部分空間がほとんどの勾配エネルギーを捉えているのに対して、かなりの部分は残バルクに存在する。
我々は,LLaMA-1BとLLaMA-7Bの事前学習の性能を改善しつつ,サブスペースを活用し,最先端のメモリ節約を実現するランダム化アルゴリズムであるGrassWalkとGrassJumpを導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:35:38 GMT)
MMDEW: Multipurpose Multiclass Density Estimation in the Wild [4.4] 密度マップ推定は、離散的なカウント・バイ・ディテクト法が失敗する密集・隠蔽シーンにおけるオブジェクト数を推定するために用いられる。
本稿では,Twinsのピラミッド・ビジョン・トランスフォーマー・バックボーンと,最先端のマルチスケールデコードアプローチに基づいて構築された特殊化されたマルチクラスカウントヘッドを利用するマルチカテゴリカウントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:57:29 GMT)
Adaptive Reinforcement Learning for Dynamic Configuration Allocation in Pre-Production Testing [4.4] 本稿では, コンフィグレーション割り当てを逐次決定問題として再放送する, 新たな強化学習フレームワークを提案する。
提案手法は,Q-ラーニングをシミュレーション結果とリアルタイムフィードバックを融合したハイブリッド報酬設計と統合する最初の方法である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:12:28 GMT)
Pilot selection in the era of Virtual reality: algorithms for accurate and interpretable machine learning models [4.4] 異なる飛行スキルを持つ参加者の特徴を識別するために、機械学習と仮想現実技術を取り入れた新しいアプローチが適用された。
MIC特徴選択法によるSVMは,全ての指標において常に最高の予測性能を達成している。
この研究のVRシミュレーションプラットフォームとアルゴリズムは、パイロット選択とトレーニングに使用することができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:10:31 GMT)
Paper Quality Assessment based on Individual Wisdom Metrics from Open Peer Review [4.4] 従来のクローズドピアレビューシステムは遅く、コストがかかり、透明ではない。
我々は、オープンなボトムアッププロセスを通じて、科学的ピアレビューの代替形態の有効性と正確性を提案し、検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:57:24 GMT)
kabr-tools: Automated Framework for Multi-Species Behavioral Monitoring [4.3] 自動多種行動監視のためのオープンソースパッケージであるkabr-toolsを提案する。
このフレームワークは、ドローンベースのビデオと機械学習システムを統合し、野生動物の映像から行動、社会的、空間的メトリクスを抽出する。
地上からの観測に比べて、ドローンによる観測は行動の粒度を大幅に改善し、視界の損失を15%削減した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:03:55 GMT)
Flexible Feature Distillation for Large Language Models [4.3] 大規模言語モデル(LLM)のためのタスク駆動型特徴蒸留のためのパラメータフリーフレームワークを提案する。
教師の表現全体を投影する代わりに、Flex-KDは、教師の隠れた状態の最もタスク関連のある次元を特定するために勾配ベースのスコアを使用する。
実験の結果、Flex-KDは一貫して生徒のパフォーマンスを向上し、線形射影ベースラインよりも最大3.75パーセントのパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:05:51 GMT)
Towards end-to-end ASP computation [4.3] We propose a end-to-end approach for Answer Set Programming (ASP)。
我々は、行列化された正規論理プログラムから構築されたコスト関数の数値最小化として、Lin-Zhaoの定理をベクトル空間における制約と合わせて実装する。
3色およびハミルトンサイクル問題を含むプログラミング例を用いて、我々のアプローチを実証的に検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:50:51 GMT)
It's not Easy: Applying Supervised Machine Learning to Detect Malicious Extensions in the Chrome Web Store [4.2] そのような拡張の最もよく知られているマーケットプレースは、Chrome Web Store (CWS) である。
このような拡張機能は、Google自身による審査プロセスの後にのみ、ユーザに提供される。
ここでは、教師付き機械学習(ML)に依存する自動メカニズムが、CWS上の悪意ある拡張を検出するのにどの程度有効であるかを精査する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:02:47 GMT)
Programming Distributed Collective Processes in the eXchange Calculus [4.2] IoT(Internet of Things)は、ほぼあらゆる種類の環境で、高密度でマルチスケールなコンピューティングデバイスのデプロイというビジョンを示唆している。
IoT(Internet of Things)のような最近のトレンドは、ほぼあらゆる種類の環境において、コンピューティングデバイスの密集したマルチスケール展開のビジョンを示唆している。
顕著なエンジニアリング上の課題は、そのような計算生態系の集合的適応的な振る舞いをプログラミングすることである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:35:00 GMT)
A Comparison of Independent and Joint Fine-tuning Strategies for Retrieval-Augmented Generation [4.2] 我々は、微調整型検索拡張生成(RAG)パイプラインの戦略を評価し、比較する。
これらの戦略はすべて、EMとF1の世代品質の同等の改善を達成していることを観察する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:30:28 GMT)
Smooth Quasar-Convex Optimization with Constraints [4.1] 一般凸制約付き擬似t滑らか関数について検討した。
一般制約付きクエーサー-t滑らか関数の1次法について述べる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:07:05 GMT)
The AI Productivity Index (APEX) [4.1] 我々は、フロンティアAIモデルが高い経済価値で知識労働を行うことができるかどうかを評価するベンチマークであるAI生産性指数(APEX)の最初のバージョンを紹介する。
APEX-v1.0は200のテストケースを含み、投資銀行、マネジメントコンサルティング、法律、プライマリ医療の4つの領域をカバーする。
GPT 5 (Thinking = High) は最高スコア (64.2%) を獲得し、Grok 4 (61.3%) と Gemini 2.5 Flash (Thinking = On) (60.4%) が続く。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:47:47 GMT)
NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields [4.1] 本研究では,音場と放射場を共同で学習するNeRAFを提案する。
NeRAFは、新しい視点と空間化された部屋インパルス応答(RIR)の両方を新しい位置で合成する。
我々は、NeRAFがSoundSpacesおよびRAFデータセット上で高品質なオーディオを生成することを実証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:41:09 GMT)
ZK-WAGON: Imperceptible Watermark for Image Generation Models using ZK-SNARKs [4.1] ZK-WAGON - Zero-Knowledge Succinct Non Interactive Argument of Knowledge (ZK-SNARKs) を用いた画像生成モデルの透かしシステム
提案手法は,モデルウェイトや生成プロンプト,あるいは機密情報を公開することなく,起点の検証を可能にする。
我々は、このシステムをGANモデルとDiffusionモデルの両方で実証し、信頼できるAI画像生成のためのセキュアでモデルに依存しないパイプラインを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:39:57 GMT)
FlexDoc: Parameterized Sampling for Diverse Multilingual Synthetic Documents for Training Document Understanding Models [4.0] エンタープライズスケールでドキュメント理解モデルを開発するには、大きく、多様で、注釈の付いたデータセットが必要である。
スケーラブルな合成データ生成フレームワークであるFlexDocを紹介します。
FlexDocは、実際のデータセットを拡張するために使用する場合、絶対的なF1スコアを最大11%改善することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:42:35 GMT)
VFP: Variational Flow-Matching Policy for Multi-Modal Robot Manipulation [4.0] 可変フローマッチングポリシー(VFP)は、タスクレベルとトラジェクトリレベルの両方のマルチモーダリティをキャプチャするフローマッチングポリシーである。
VFPは、標準的なフローベースベースラインよりもタスク成功率を49%向上させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:01:54 GMT)
Accuracy of Discretely Sampled Stochastic Policies in Continuous-time Reinforcement Learning [4.0] 我々は、個別の時点におけるポリシーからアクションをサンプリングするポリシー実行フレームワークを厳格に分析し、それらを断片的に一定の制御として実装する。
サンプリングメッシュのサイズがゼロになる傾向にあるため、制御された状態過程は、ポリシーに従って係数で動的に弱く収束する。
これらの結果に基づいて、離散時間観測に基づいて、様々な政策勾配推定器のバイアスとばらつきを分析した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:00:25 GMT)
Automated Model Evaluation for Object Detection via Prediction Consistency and Reliability [3.9] PCR (Predict Consistency and Reliability) は, 地味ラベルを使わずに検出性能を推定する。
我々は、様々な重度の画像汚職を適用して、メタデータセットを構築する。
その結果,PCRは既存のAutoEval法よりも精度の高い性能推定値が得られることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:44:06 GMT)
Activation Functions Considered Harmful: Recovering Neural Network Weights through Controlled Channels [3.9] ハードウェアを分離したエンクレーブ、特にIntel SGXの最近の進歩は、機械学習アプリケーションの内部状態をセキュアにするという約束を守っている。
本稿では,SGXエンクレーブから秘密の重みとバイアスを抽出するために,入力依存型メモリアクセスパターンを活用可能であることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:36:20 GMT)
Synergizing LLMs and Knowledge Graphs: A Novel Approach to Software Repository-Related Question Answering [3.9] 本研究では,レポジトリ関連質問への回答において,LLMベースのチャットボットの精度を向上させることを目的とする。
我々は,レポジトリデータから知識グラフを構築するための2段階のアプローチと,LLMで知識グラフをシナジする手法を用いる。
さまざまな複雑さに関する150の質問をキュレートし、5つの人気のあるオープンソースプロジェクトのアプローチを評価しました。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:31:30 GMT)
A reproducible comparative study of categorical kernels for Gaussian process regression, with new clustering-based nested kernels [3.8] 本稿では,これまで検討されてきた多くのテストケースにおいて,既存のカーネルを比較検討した。
また,最適化コミュニティにインスパイアされた新たな評価指標を提案する。
グループ構造が不明な場合や,そのような構造について事前の知識がない場合には,クラスタリングに基づく新たな戦略を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:36:19 GMT)
There and Back Again: On the relation between Noise and Image Inversions in Diffusion Models [3.8] 拡散モデルは新しいサンプルを生成するが、データを編集可能な機能にエンコードする低次元の潜在空間がない。
インバージョンベースの手法は、デノベーション軌道を逆転させ、画像を近似したスタートノイズに転送することでこの問題に対処する。
その結果,潜伏剤はスムーズな画像領域で予測される低ノイズの形で構造パターンを示すことがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:14:05 GMT)
MetaboT: AI-based agent for natural language-based interaction with metabolomics knowledge graphs [3.8] ユーザ質問を知識グラフを操作するためのSPARQLセマンティッククエリ言語に翻訳するAIシステムを開発した。
植物天然物の大規模公開知識グラフである実験天然物知識グラフ(ENG)を用いて,その有効性を実証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:05:29 GMT)
Training Hybrid Deep Quantum Neural Network for Efficient Reinforcement Learning [3.8] 量子回路は、次元が指数関数的に増加するヒルベルト空間にデータを埋め込む。
量子回路を局所的に近似する有接サロゲートqtDNNを導入する。
我々は、連続制御強化学習のためのハイブリッドディープ量子ニューラルネットワークhDQNN-TD3を設計する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:02:26 GMT)
FalconWing: An Ultra-Light Indoor Fixed-Wing UAV Platform for Vision-Based Autonomy [3.7] FalconWingは、超軽量(150g)の屋内固定翼UAVプラットフォームで、視覚ベースの自律性を実現する。
FalconWingは軽量のハードウェアスタック(9gカメラを搭載した137gの機体)と、ビジョンベースのコントローラーの開発と評価のための3Dガウススプラット(GSplat)シミュレーターを備えたソフトウェアスタックを結合している。
ハードウェアデザイン、GSplatのシーン、ダイナミックスモデルを公開して、FalconWingをエンジニアリングの学生や研究室のためのオープンソースのフライトキットにする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:29:27 GMT)
Multimodal Large Language Model Framework for Safe and Interpretable Grid-Integrated EVs [3.7] 本稿では,マルチモーダルセンサデータを処理するための多モーダル大規模言語モデル(LLM)に基づくフレームワークを提案する。
このフレームワークは、都市道路を走行する計器車から収集された実世界データを用いて検証されている。
視覚知覚(YOLOv8)、ジオコード位置決め、CANバステレメトリを組み合わせることで、フレームワークは生センサデータとドライバの理解を橋渡しする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:50:31 GMT)
BioBlobs: Differentiable Graph Partitioning for Protein Representation Learning [3.7] 動的に構造を柔軟に大きめのサブ構造(「ブロブ」)に分割することで、タンパク質を表現するプラグアンドプレイモジュールであるBioBlobsを紹介した。
得られたブロブは共有および解釈可能なコードブックに量子化され、タンパク質の埋め込みを計算するのに使用される機能関連タンパク質のサブ構造を個別に語彙化する。
また,BioBlobsの表現により,GVP-GNNなどの広く使われているタンパク質エンコーダの性能が,PRLタスクで向上することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:25:02 GMT)
Extreme value forecasting using relevance-based data augmentation with deep learning models [3.5] 本研究では,極値予測のためのデータ拡張フレームワークを提案する。
我々は、GANや合成マイノリティオーバーサンプリング技術(SMOTE)といったデータ拡張モデルと組み合わせて、ディープラーニングモデルを使用する。
以上の結果から,SMOTEをベースとした戦略は高い適応性を示し,短期・長期の予測における性能向上につながることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:10:27 GMT)
Hierarchical Semantic Retrieval with Cobweb [3.5] Cobwebを使って文の埋め込みをプロトタイプツリーに整理し、文書をランク付けします。
一般化されたベストファースト検索と軽量パスサムローカの2つの推論手法をインスタンス化する。
提案手法は,kNNが劣化しても頑健でありながら,強いエンコーダ埋め込み上でのドット積探索と一致することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:14:52 GMT)
Investigating the Fermi-Hubbard model by the Tensor-Backflow method [3.5] 本研究では,2次元格子上のFermi-Hubbardモデルに対するストライプ-バックフロー法を適用した。
すべてのサイトからのバックフローの条件を検討する代わりに、最も近い隣の条件や、隣の隣のバックフローの条件を考慮することで、競争結果が得られる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:36:20 GMT)
Towards CONUS-Wide ML-Augmented Conceptually-Interpretable Modeling of Catchment-Scale Precipitation-Storage-Runoff Dynamics [3.4] 本研究は,Mass-Conserving Perceptron(MCP)に基づく,様々なキャッチメント複雑性のML拡張物理解釈スケールモデルを用いた。
その結果,積雪,森林被覆,気候帯などの属性マスクを用いて評価した。
ベンチマーク比較により、物理的に解釈可能な大量保存型MPPベースのモデルでは、Long Short-Term Memory Network (LSTM)アーキテクチャに基づくデータベースモデルに匹敵する性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:47:01 GMT)
Assessing the Potential for Catastrophic Failure in Dynamic Post-Training Quantization [3.4] 後トレーニング量子化(PTQ)は、ニューラルネットワークの計算複雑性とメモリ使用量の削減に有効なツールとして登場した。
推論で経験した入力の分布に応じて劇的な性能低下が起こる可能性がある。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:13:06 GMT)
On Speedups for Convex Optimization via Quantum Dynamics [3.4] 量子ハミルトニアンDescentフレームワークの離散シミュレーションを用いて凸最適化における量子速度の可能性を探る。
連続時間において、適切なパラメータを持つQHDは、任意に高速な収束率が得られることを示す。
QHDは、この評価ノイズのレベルを許容する既知の全ての古典的アルゴリズムに対して、超クアドラルなクエリの利点を提供することを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:28:22 GMT)
Causality and the Interpretation of Quantum Mechanics [3.4] 量子場理論に基づいて、我々の研究は相対論的因果関係、量子非局所性、および量子測定を調和的に統合する枠組みを提供する。
還元密度行列を用いて量子状態の局所的な情報を表現し、還元密度行列が超光的に進化できないことを示す。
この見解は、シュロディンガーの猫パラドックスの妥当性を疑問視し、余分な仮定を必要とせず、相対性理論と完全に相容れない量子力学の解釈を提案する動機となる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:14:36 GMT)
Inverse Language Modeling towards Robust and Grounded LLMs [3.3] 逆言語モデリング(ILM, Inverse Language Modeling)は, LLMが摂動を入力する際の頑健性を改善する統一フレームワークである。
ILMは、LCMを静的ジェネレータから分析可能で堅牢なシステムに変換する。
ILMは、堅牢で基盤が整っただけでなく、根本的に制御可能な次世代のLSMの基礎を築ける。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:47:18 GMT)
NeoARCADE: Robust Calibration for Distance Estimation to Support Assistive Drones for the Visually Impaired [3.3] コンシューマー向けドローンに共通する単眼ビデオフィードの奥行きマップを用いて、VIPと障害物との絶対距離を推定するNeoARCADEを提案する。
多様な動的条件下でのVIPや他の障害物に対する距離推定の頑健さと一般化性を評価するための評価を行う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:35:43 GMT)
Are LLMs Better GNN Helpers? Rethinking Robust Graph Learning under Deficiencies with Iterative Refinement [3.3] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するコア技術として、Web関連のアプリケーションで広く採用されている。
現実のシナリオでは、そのようなグラフはGNNのパフォーマンスを著しく損なう欠陥を示す。
本稿では,Retrieval-Augmented Contrastive Refinementフレームワークによるロバストグラフ学習を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:30:51 GMT)
Forms of Understanding for XAI-Explanations [3.3] 説明可能性(Explainability)は、コンピュータ科学と人工知能において重要なトピックとなり、説明可能な人工知能(XAI)と呼ばれるサブフィールドへとつながった。
理解」の意味はいまだ明確に定義されておらず、概念そのものが科学的研究の対象になることはめったにない。
この概念的論文は、XAIの解説などに対する理解形態のモデル提示を目的としている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:59:28 GMT)
CardioRAG: A Retrieval-Augmented Generation Framework for Multimodal Chagas Disease Detection [3.3] チャガス病は世界中で約600万人に影響を及ぼし、チャガス心筋症は最も重篤な合併症である。
血清検査能力が限られている地域では、AI強化心電図(ECG)スクリーニングが重要な診断代替手段となる。
本稿では,大きな言語モデルと解釈可能なECGに基づく臨床特徴を統合した検索拡張生成フレームワークCardioRAGを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:02:04 GMT)
NLP Methods for Detecting Novel LLM Jailbreaks and Keyword Analysis with BERT [3.3] 大きな言語モデル(LLM)は、悪意のあるユーザが入力テキストの操作を通じて望ましくない応答を要求できるような、さまざまな脆弱性に悩まされる。
いわゆるジェイルブレイクプロンプトは、LLMを騙して安全ガードレールの設置を回避し、開発者のポリシーに受け入れられる応答を維持するように設計されている。
本研究では,異なる機械学習モデルを用いて,jailbreakプロンプトを真の用途と区別する能力について分析する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:55:29 GMT)
Landcover classification and change detection using remote sensing and machine learning: a case study of Western Fiji [3.3] フィジーのナディでは,2013年から2024年にかけての土地利用と土地被覆の変化を機械学習とリモートセンシングのフレームワークで比較した。
本研究の最終的な目標は、土地被覆・土地利用モデリングおよび変更検出における技術的支援を提供することである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:28:07 GMT)
Small is Sufficient: Reducing the World AI Energy Consumption Through Model Selection [3.3] Green AIは、より小さく、より効率的なモデルを通じて、エネルギーのソリエティを強調する。
モデル選択を適用することで、AIのエネルギー消費を27.8%削減し、2025年には世界中で31.9TWh節約できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:58:13 GMT)
Investigating ReLoRA: Effects on the Learning Dynamics of Small Language Models [3.2] 小型言語モデル(SLM)はランク不足を示し、使用可能な次元を過小評価する。
ReLoRAのランク拡張された更新ルール テキストステア SLM は、より健全な学習ダイナミックスへ向けられるか?
本研究では,SLMにおけるReLoRAに関する最初の体系的研究を行い,性能と学習のダイナミクスを評価した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:09:44 GMT)
GATEBLEED: Exploiting On-Core Accelerator Power Gating for High Performance & Stealthy Attacks on AI [3.2] 我々は、CPUを動作限界内に留めるために使用するアグレッシブパワーゲーティングにより、タイミング側および隠蔽チャネルであるGATEBLEEDを発見した。
GateBLEEDは、従来の保護措置の下でも、ローカルおよびリモートのタイミング推定のリスクを負う。
我々は,Intel AMXに最適化されたトランスモデルに対して,エンド・ツー・エンドのマイクロアーキテクチャ推論攻撃を実装した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:20:18 GMT)
Higher moment theory and learnability of bosonic states [3.2] 任意のガウスユニタリが作用するボソニックフォック状態のサンプルと時間効率のアルゴリズムを提案する。
特別の場合、このアルゴリズムはフォック状態のBosonSamplingで生成された状態を効率的に学習する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:48:04 GMT)
Uncertainty-Guided Model Selection for Tabular Foundation Models in Biomolecule Efficacy Prediction [3.1] 本研究では,モデル選択のための不確実性誘導戦略について検討する。
単純なシーケンスベースの特徴を用いたTabPFNモデルが、最先端の予測器を超越できることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:33:19 GMT)
Mafoko: Structuring and Building Open Multilingual Terminologies for South African NLP [3.1] 南アフリカの公用語ハマーの構造化された用語データが不足しているため、多言語NLPは進歩している。
本研究では,アフリカ中心のNOODLフレームワークを用いて,基礎となるEmphMafokoデータセットについて紹介する。
実験では、英語からツシヴェンダ語への機械翻訳の精度とドメイン固有の一貫性が大幅に向上した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:26:46 GMT)
Framing Unionization on Facebook: Communication around Representation Elections in the United States [3.0] 我々は、労働・社会運動コミュニケーション研究において広く認識されている5つの談話枠に焦点を当てた:診断(問題の特定)、予後(提案)、モチベーション(モチベーション)、コミュニティ、エンゲージメント。
以上の結果から,診断とコミュニティの枠組みが統合コミュニケーション全体を支配していることがわかったが,その枠組みは組織によって大きく異なっていた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:44:53 GMT)
Comparing YOLOv8 and Mask R-CNN for instance segmentation in complex orchard environments [2.9] 本研究では,1段階のYOLOv8モデルと2段階のMask R CNNモデルとの比較を行った。
その結果, YOLOv8はMask R CNNよりも精度が高く, 精度は0.5。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:49:07 GMT)
Cyber-physical WebAssembly: Secure Hardware Interfaces and Pluggable Drivers [2.9] 本研究は、I2CとUSBとのハードウェアインタラクションを可能にするWASI提案と概念実証実装を提案する。
これはWebAssembly内でデバイスドライバを実行することで実現される。
概念実証の徹底的な評価は、WASI-USBは、ネイティブOSのUSB APIと比較して、少なくとも8%のオーバーヘッドを最小化していることを示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:29:29 GMT)
Learning Low-Dimensional Embeddings for Black-Box Optimization [2.9] Black-box Optimization (BBO) は勾配に基づく手法の代替として有用である。
BBOは高次元問題や限られた裁判予算に苦しむことが多い。
本稿ではメタラーニングに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:16:46 GMT)
FinP: Fairness-in-Privacy in Federated Learning by Addressing Disparities in Privacy Risk [2.8] FinPは、プライバシーリスクの格差に対処するために特別に設計された、新しいフレームワークである。
ソース推論攻撃(SIA)に対する不均等な脆弱性を緩和する
実用性への影響を最小限に抑えて、プライバシの公平性を改善する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:59:38 GMT)
Revisiting Noise-adaptive Transpilation in Quantum Computing: How Much Impact Does it Have? [2.8] 超伝導量子コンピュータ上での頻繁なノイズ適応トランスパイルの必要性を再考する。
ノイズを意識したトランスパイレーションは、キュービットの小さなサブセットにワークロードを集中させる。
キャリブレーションデータで一度コンパイルされた回路は、複数のキャリブレーションサイクルで確実に再利用できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:56:17 GMT)
LRFusionPR: A Polar BEV-Based LiDAR-Radar Fusion Network for Place Recognition [2.8] 自律運転においては、位置認識はGPSを用いた環境におけるグローバルな位置決めに不可欠である。
本稿では,LiDARを単一チップまたは走査型レーダーで融合させることにより,認識精度とロバスト性を向上させるLRFusionPRを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:35:01 GMT)
Co-NAML-LSTUR: A Combined Model with Attentive Multi-View Learning and Long- and Short-term User Representations for News Recommendation [2.8] Co-NAML-LSTURは、マルチビューニュースエンコーディングのためのNAMLと階層的ユーザモデリングのためのLSTURを統合したハイブリッドニュースレコメンデーションフレームワークである。
我々は、MIND-smallとMIND-largeの2つの広く使われているベンチマークでCo-NAML-LSTURを評価した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:41:12 GMT)
Emulation of Coherent Absorption of Quantum Light in a Programmable Linear Photonic Circuit [2.8] 非エルミート量子システムは、工学的な損失を通じて量子状態を操作する強力なツールを提供する。
量子光のコヒーレント吸収をエミュレートする非単位変換のプログラム可能な実装を示す。
出力フォック状態の確率振幅の連続的かつコヒーレントなチューニングとともに、反コヒーレンスや束縛などの非古典的効果を観察する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:18:50 GMT)
How Foundational are Foundation Models for Time Series Forecasting? [2.7] 時系列データの本質的な多様性は、基礎モデルが効果的なモデル構築にはあまり適さないことを論じる。
時系列基礎モデルのゼロショット能力は、事前訓練された特定のドメインに大きく影響され、結びついていることが示される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:11:53 GMT)
Are Time Series Foundation Models Susceptible to Catastrophic Forgetting? [2.7] Time Series Foundation Models (TSFMs) は様々な予測タスクにまたがるゼロショットの一般化を約束している。
複数のデータセットに対して逐次微調整を行った場合,TSFMが破滅的忘れを負う程度について検討した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:08:29 GMT)
A hypersphere-like non-Abelian Yang monopole and its topological characterization [2.7] EP2対によって形成される5次元パラメータ空間において、超球面のような非アベリアヤンモノポールが見つかる。
このようなエキゾチックな構造により、NHヤン単極体は特異なトポロジカル遷移を示すことができ、点のようなものとは到達できない。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:05:33 GMT)
ClustViT: Clustering-based Token Merging for Semantic Segmentation [2.7] 最近の研究は、画像の複雑さに応じてトークンを動的にマージすることに焦点を当てている。
我々は、視覚変換器(ViT)のバックボーンとアドレスセマンティックセグメンテーションを拡張するClustViTを提案する。
提案手法は,3つのデータセットに対して最大2.18倍のGFLOPと1.64倍の高速推論を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:15:40 GMT)
Comparing Contrastive and Triplet Loss in Audio-Visual Embedding: Intra-Class Variance and Greediness Analysis [2.6] 3重項の損失はクラス内およびクラス間の大きな分散を保ち、学習された表現においてよりきめ細かい区別をサポートすることを示す。
対照的に、対照的な損失はクラス内埋め込みをコンパクトにする傾向があり、微妙な意味的差異が曖昧になる。
対照的な損失が多くの小さな更新を早期に引き起こすのに対して、トリプルト損失はより少ないがより強力な更新を発生させ、ハードな例での学習を持続させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:11:46 GMT)
Taking a SEAT: Predicting Value Interpretations from Sentiment, Emotion, Argument, and Topic Annotations [2.6] 我々は,多次元主観的アノテーションを解釈レンズのプロキシとして活用することにより,言語モデルが個々の値の解釈を予測できるかどうかを検討する。
すなわち,個人が感情,感情,話題,話題(SEAT次元)をアノテートする方法の例を提供することが,価値の解釈を予測する上で言語モデルに役立つかどうかを評価する。
異なるゼロショットおよび少数ショット設定による実験により、すべてのSEAT次元を同時に提供することで、個々の次元や、個々の情報を提供しないベースラインよりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:51:33 GMT)
FOSS-chain: using blockchain for Open Source Software license compliance [2.6] ブロックチェーンを使用してライセンスコンプライアンスプロセスを自動化するWebプラットフォームを開発し、14のオープンソースソフトウェア(OSS)ライセンスをカバーしています。
予備的な結果は有望であり、現実的なソフトウェアシステムに適応するためのプラットフォームの可能性を示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:26:16 GMT)
VGDM: Vision-Guided Diffusion Model for Brain Tumor Detection and Segmentation [2.5] VGDMは脳腫瘍の検出とセグメンテーションのための視覚誘導拡散フレームワークである。
拡散過程のコアに視覚変換器を埋め込む。
トランスフォーマーバックボーンは、MRIボリューム全体にわたってより効果的な空間関係のモデリングを可能にする。
ボクセルレベルの誤差を緩和し、きめ細かい腫瘍の詳細を回復する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:52:08 GMT)
Thinkquel: A Model Dedicated to Text-to-dbt Using Synthetic Data and a Span-Aware Objective [2.5] Thinkquelは、堅牢でポータブルで実行検証可能なクエリを生成するための、微調整されたモデルである。
TS-GRPOはトークンレベルのトレーニング信号とシーケンスレベルの実行報酬のギャップを埋める。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:28:05 GMT)
Emergent multi-loop nested point gap in a non-Hermitian quasiperiodic lattice [2.5] 幾何級数変調された非エルミート準周期格子モデルを提案する。
このシステムでは、複数のモビリティエッジと高い巻線数を持つ非エルミート点ギャップを誘導できることが示される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:35:35 GMT)
FairContrast: Enhancing Fairness through Contrastive learning and Customized Augmenting Methods on Tabular Data [2.5] AIシステムが日々の生活に浸透するにつれて、公平で偏見のないモデルの開発がより重要になる。
バイアスに対処し、データセットの公正表現を学習するように設計された、対照的な学習フレームワークを導入する。
提案手法は, 精度の最小限のトレードオフによるバイアス軽減と, 下流タスクにおける学習された公正表現の活用に有効であることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:43:53 GMT)
Morphlux: Transforming Torus Fabrics for Efficient Multi-tenant ML [2.5] Morphluxはサーバ内のアクセラレータを相互接続するための、サーバスケールのプログラマブルフォトニックファブリックである。
Morphluxによる最先端のトーラスベースMLデータセンタの拡張により,テナント計算割り当ての帯域幅を最大66%向上できることを示す。
これらの性能の利点を実証するために,Morphlux の新たなエンドツーエンドハードウェアプロトタイプを開発した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:26:05 GMT)
Representational Alignment Across Model Layers and Brain Regions with Hierarchical Optimal Transport [2.5] 本稿では,ソフトで一貫した層間結合とニューロンレベルの輸送計画を推定する統合フレームワークを提案する。
我々は、視覚モデル、大言語モデル、人間の視覚野の記録に基づいてHOTを評価する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:25:06 GMT)
RefFilter: Improving Semantic Conflict Detection via Refactoring-Aware Static Analysis [2.4] RefFilterは意味的干渉検出のためのSDG対応ツールである。
精度を向上させるために自動検出を統合することで、既存の静的技術の上に構築される。
その結果、ラベル付きデータセットでは、RefFilterは偽陽性を約32%削減している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:30:49 GMT)
Q-FSRU: Quantum-Augmented Frequency-Spectral For Medical Visual Question Answering [2.4] 本稿では、周波数スペクトル表現と融合(FSRU)と量子検索拡張生成(Quantum Retrieval-Augmented Generation:量子RAG)を組み合わせた医用視覚質問応答(VQA)の新しいモデルであるQ-FSRUを提案する。
Q-FSRUは医療画像や関連テキストから特徴を抽出し、Fast Fourier Transform (FFT) を用いて周波数領域にシフトする。
精度を向上し、実際の知識に基づいて回答を確実にするために、量子インスパイアされた検索システムを追加します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:52:51 GMT)
Model Merging to Maintain Language-Only Performance in Developmentally Plausible Multimodal Models [2.3] 本稿では,この相違に対処するBabyLMチャレンジのマルチモーダルトラックへのアプローチについて述べる。
我々は,開発可能なデータセットを用いて,低リソース環境下で言語のみおよびマルチモーダルモデルを開発する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:38:25 GMT)
Model-brain comparison using inter-animal transforms [2.3] アニメーション間変換クラスに基づく比較手法を提案する。
我々はIATCを、ニューラルネットワークモデルのシミュレーションされた人口、マウスの個体数、ヒトの個体数という3つの設定で識別する。
IATCは神経活動の正確な予測を可能にすると同時に,メカニズム同定において高い特異性を実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:51:55 GMT)
Measurement-Guided Consistency Model Sampling for Inverse Problems [2.2] 一貫性モデルは、単一または数ステップで高品質な生成を可能にする。
逆問題再構成に適した整合性サンプリング手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:53:07 GMT)
Localized Forest Fire Risk Prediction: A Department-Aware Approach for Operational Decision Support [2.2] 気候変動による火災行動と頻度の増大により、正確な予測は人工知能(AI)における最も急進的な課題の1つとなっている。
本稿では,火災リスク評価を部署の状況に合わせて調整する新しい手法を提案する。
我々は、比較的探索されていないデータセット上で最先端のAIモデルを使用して、フランス大都市圏における最初の全国規模のAIベンチマークを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:31:22 GMT)
Smart Routing for EV Charge Point Operators in Mega Cities: Case Study of Istanbul [2.2] 非効率な人事管理は、時間損失、高い運用コスト、資源の浪費につながる可能性がある。
本研究では,EV充電ネットワークの保守作業の計画を最適化する統合手法を提案する。
この方法はPythonで開発され、イスタンブールの100台のEV充電ステーションからなるデータセットに適用された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:32:44 GMT)
Generating Findings for Jaw Cysts in Dental Panoramic Radiographs Using GPT-4o: Building a Two-Stage Self-Correction Loop with Structured Output (SLSO) Framework [2.2] 本研究は,OpenAI GPT-4oのマルチモーダル機能を利用して,歯科用パノラマX線写真で顎嚢胞所見を自動生成する。
画像入力, 解析, 構造化データ生成, 歯数抽出, 整合性検査を含む, 22例の顎嚢胞に対して10段階法を施行した。
提案したSLSOフレームワークは多くの項目の出力精度を66.9%、33.3%、および28.6%の改善率で改善した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:22:13 GMT)
Uncertainty-Aware Generative Oversampling Using an Entropy-Guided Conditional Variational Autoencoder [2.2] 本稿では,表現学習とデータ生成の両方に局所的不確実性を取り入れた生成的オーバーサンプリングフレームワークを提案する。
LEO-CVAEは,従来のオーバーサンプリングや生成ベースラインよりも優れた性能を示す。
これらの結果は、複雑な非線形構造によって支配される領域における不均衡学習に対する不確実性を考慮した生成的オーバーサンプリングの価値を強調した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:41:49 GMT)
Formal Framework for Quantum Advantage [2.1] 個々の問題インスタンスの観点で量子計算の優位性を定義する。
量子アルゴリズムの待ち時間には指数関数的アルゴリズムが有効であることを示す。
この正式な枠組みはビーコンとして機能し、実際は量子的優位性の探求を導く。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:22:54 GMT)
Resource theory of asymmetric distinguishability with partial information [2.0] 最悪の量子分岐は、量子情報の鍵となる尺度である。
非対称微分可能性の資源理論の観点から、発散が理解可能であることを示す。
このフレームワークを部分的な情報を備えた設定に拡張します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:35:09 GMT)
Uncovering Overconfident Failures in CXR Models via Augmentation-Sensitivity Risk Scoring [2.0] 胸部X線写真(CXR)症例を同定するために,ASRS(Augmentation-sensitive risk score)フレームワークを提案する。
ASRSのスコアは、サンプルを安定四成分に成層化し、非常に敏感なケースではリコールがかなり低い。
ASRSは、選択的な予測と臨床レビューのためのラベルなしの手段を提供し、医療AIの公正性と安全性を改善している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:15:40 GMT)
Microscaling Floating Point Formats for Large Language Models [2.0] マイクロスケーリング浮動小数点形式は、大規模言語モデル(LLM)における数値表現に関連するストレージと計算オーバーヘッドを削減するために設計された新しい手法である。
マイクロスケーリングデータフォーマットは、トレーニングや推論中に競合する精度を達成でき、LLMを大規模に展開するためのリソース効率の良い代替手段としての有効性が証明されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:08:59 GMT)
Evict3R: Training-Free Token Eviction for Memory-Bounded Streaming Visual Geometry Transformers [1.9] StreamVGGTのようなストリーミングビジュアルトランスフォーマーは、強力な3D認識を実現するが、キーバリュー(KV)メモリの増大に悩まされる。
本稿では、冗長なトークンを破棄し、最も情報性の高いトークンを保持しながらメモリをバウンドする、トレーニング不要な推論時トークン消去ポリシーを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:38:00 GMT)
A computational framework for quantifying route diversification in road networks [1.9] 本稿では,道路網構造が交通集中に対抗してどのように形成されるか,すなわち経路の多様化について検討する。
DiverCityは、トラフィックが複数の、緩やかに重なり合うニアショートルートにまたがる可能性がある範囲を定量化する尺度である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:41:53 GMT)
A Locally Executable AI System for Improving Preoperative Patient Communication: A Multi-Domain Clinical Evaluation [1.9] LENOHAは、入力を高精度な文変換器の制約でルーティングする安全第一のローカルファーストシステムである。
臨床問合せのために、クリニカルカレーションされたFAQから口頭で回答を返す。
エネルギー検定の結果,1回の入力で1.0 mWh,小語で168 mWhの応答で1回の応答で1.0 mWhを消費することがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:53:11 GMT)
Learning Beyond Experience: Generalizing to Unseen State Space with Reservoir Computing [1.9] 貯留層計算は、明示的な構造的前提なしに、探索されていない状態空間の領域に一般化することができる。
一つのアトラクションの流域から軌道で訓練されたRCは、領域外一般化を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:57:21 GMT)
FINCH: Financial Intelligence using Natural language for Contextualized SQL Handling [1.9] 我々は、292のテーブルと75,725の自然言語ベースのペアからなる金融データベース(FINCH)を導入する。
様々なスケールの推論モデルと言語モデルをベンチマークし、その強みと限界を体系的に分析する。
最後に,既存の測度で見過ごされるニュアンスを捉える金融指向評価指標(FINCHスコア)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:55:11 GMT)
DM-Bench: Benchmarking LLMs for Personalized Decision Making in Diabetes Management [1.8] 実世界の意思決定タスクにおける大規模言語モデル(LLM)の性能を評価するために設計された最初のベンチマークであるDM-Benchを提案する。
我々のベンチマークは7つの異なるタスクカテゴリを含んでおり、糖尿病患者が質問する現実世界の質問の幅を反映している。
このベンチマークを確立することで、糖尿病治療におけるAIソリューションの信頼性、安全性、有効性、実用性を向上することを目指している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:56:21 GMT)
Neurosymbolic Association Rule Mining from Tabular Data [1.8] アソシエーションルールマイニング(アソシエーションルールマイニング、アソシエーションルールマイニング)は、論理ルールの形式でデータ特徴間のパターンをマイニングするタスクである。
Aerial+は、データのニューラル表現を生成し、特徴間の関連をキャプチャする、新しいニューロシンボリックARMメソッドである。
モデルの再構成機構を利用して、このニューラル表現からルールを抽出する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:26:31 GMT)
Market-Based Data Subset Selection -- Principled Aggregation of Multi-Criteria Example Utility [1.8] コスト関数予測市場(LMSR)を介して、各サンプルを価格設定する市場ベースセレクタを提案する。
LMSRは指数重み付けと凸目標を備えた最大エントロピーアグリゲーションを実装していることを示す。
このフレームワークは、プロンプトレベルの推論と分類のための固定計算の下で、多信号データキュレーションを統一する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:12:03 GMT)
PRESOL: a web-based computational setting for feature-based flare forecasting [1.8] 太陽フレアは太陽系で最も爆発的な現象であり、事象の連鎖の引き金となっている。
データ駆動型太陽フレア予測は、ディープラーニングアプローチか機械学習アルゴリズムのいずれかに依存している。
本稿では,特徴に基づく機械学習手法の計算パイプライン実行のためのWebベースの技術プラットフォームについて述べる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:40:10 GMT)
Interplay between Security, Privacy and Trust in 6G-enabled Intelligent Transportation Systems [1.7] 6G技術は交通セクターに革命をもたらす可能性があり、旅行の仕方を大幅に改善する。
6G-ITSの安全でセキュアなデプロイを可能にするために、さまざまなセキュリティとプライバシの課題が特定された。
本稿では,6G-ITSの機会と課題,特に信頼,セキュリティ,プライバシに焦点をあてる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:47:36 GMT)
Stacked Regression using Off-the-shelf, Stimulus-tuned and Fine-tuned Neural Networks for Predicting fMRI Brain Responses to Movies (Algonauts 2025 Report) [1.7] 我々はアルゴノート2025チャレンジに応募する。
目標は、映画刺激に対するfMRIの脳反応を予測することである。
提案手法は,大規模言語モデル,ビデオエンコーダ,オーディオモデル,視覚言語モデルからのマルチモーダル表現を統合する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:24:16 GMT)
Robust Pan-Cancer Mitotic Figure Detection with YOLOv12 [1.7] 本稿では、最先端のYOLOv12オブジェクト検出アーキテクチャに基づくミトティックな人物検出手法を提案する。
予備テストセット(ホットスポットのみ)では0.801のF1スコアを達成し,最終テストリーダボードでは0.7216のF1スコアで2位となった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:10:08 GMT)
Constructions of Efficiently Implementable Boolean Functions with Provable Nonlinearity/Resiliency/Algebraic Immunity Trade-Offs [1.7] レジリエンス, 非線形性, 免疫のトレードオフが証明可能な, 効率よく実装可能なブール関数の族について述べる。
以下の結果は、我々が提案する関数ファミリーのそれぞれに当てはまる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:00:39 GMT)
Mathematical Modeling and Convergence Analysis of Deep Neural Networks with Dense Layer Connectivities in Deep Learning [1.6] ディープラーニングでは、ディープニューラルネットワーク(DNN)において、高密度層接続が重要な設計原則となっている。
本研究では, 密結合DNNを数学的にモデル化し, 深層限界における学習問題を解析する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:22:51 GMT)
Many Retrocausal Worlds: A Foundation for Quantum Probability [1.5] 多くの世界の量子力学の解釈における確率の最近の説明は、それ自体が確率論に依存しているため脆弱である。
私は、時間的拡張世界を中心とした自己位置確率は、不整合問題を解決することができると論じる。
次に、時間対称なエベレットフレームワークで解釈される量子力学の時間対称バージョン、固定点定式化について概説し、量子確率の理論の基礎を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:21:08 GMT)
Momentum-SAM: Sharpness Aware Minimization without Computational Overhead [1.5] 本稿では,蓄積された運動量ベクトルの方向にパラメータを摂動させ,計算オーバーヘッドやメモリ要求を伴わずに低シャープ性を実現するMomentum-SAMを提案する。
我々は、MSAMを詳細に評価し、NAG、SAM、MSAMの分離可能なメカニズムの学習最適化と一般化に関する知見を明らかにする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:48:28 GMT)
Gendered Inequalities in Online Harms: Fear, Safety Work, and Online Participation [1.5] 女性は、イメージベースの虐待、サイバーストーキング、サイバーフラッシングなど、コンタクトベースの害によって標的にされることが多い。
女性の報告では、オンライン被害に対する恐怖の高まり、オンライン体験に対するネガティブな影響、安全ツールの使用の増加などが報告されている。
女性のたった23%は、男性の40%と比べて、オンラインで政治的見解を表現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:52:06 GMT)
Securing generative artificial intelligence with parallel magnetic tunnel junction true randomness [1.4] 生成人工知能(GAI)モデルは、攻撃者による搾取に弱い予測可能なパターンを生成する。
そこで本研究では,スピントランスファートルク磁気トンネル接合(STT-MTJ)からハードウェア生成した真のランダムビットを埋め込み,その課題に対処する。
高並列なFPGA支援型プロトタイプコンピュータシステムでは、メガビット/秒の真の乱数が得られる。
CIFAR-10でトレーニングされた生成逆数ネットワーク(GAN)にハードウェアランダムビットを統合すると、低品質な乱数発生器(RNG)のベースラインに比べて、安全でない出力を最大18.6倍削減できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:26:48 GMT)
Paving the Way Towards Kinematic Assessment Using Monocular Video: A Preclinical Benchmark of State-of-the-Art Deep-Learning-Based 3D Human Pose Estimators Against Inertial Sensors in Daily Living Activities [1.4] 本研究は、慣性計測ユニット(IMU)を用いた単眼映像に基づく3次元ポーズ推定モデルの比較である。
IMUデータから計算した関節角度に対して,最先端のディープラーニングフレームワークから得られる関節角度を評価した。
MotionAGFormerは優れた性能を示し、RMSE全体の最低値を達成した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:44:31 GMT)
Bridging Collaborative Filtering and Large Language Models with Dynamic Alignment, Multimodal Fusion and Evidence-grounded Explanations [1.4] 軽量モジュールによる新しいユーザインタラクションを組み込んだオンライン適応機構を開発した。
我々は、協調的な信号と視覚的および音声的特徴をシームレスに結合する統一表現を作成します。
提案手法では,凍結ベースモデルの効率性を維持しつつ,計算オーバーヘッドを最小限に抑え,実世界の展開に有効である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:43:24 GMT)
Dynamic Stress Detection: A Study of Temporal Progression Modelling of Stress in Speech [1.3] 我々はストレスを、歴史的感情状態の影響を受けながら、時間的に進化する現象としてモデル化する。
感情的ラベルからきめ細かな応力アノテーションを抽出する動的ラベル付け手法を提案する。
提案手法は既存のベースラインよりも, MuSE と StressID に顕著な精度向上を実現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:30:44 GMT)
Large Language Models Inference Engines based on Spiking Neural Networks [1.3] 我々は、トランスモデルを設計するためにスパイキングニューラルネットワーク(SNN)を探索する。
大規模SNNのトレーニングにおける課題は、非効率で時間を要する。
推論のためのトランスフォーマーベースSNNを設計する手法であるNeurTransformerを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:15:41 GMT)
Classification of Thouless pumps with non-invertible symmetries and implications for Floquet phases [1.3] 一次元系の断熱とフロッケの対称性について検討する。
我々は,空間的に歪んだThoulessポンプ演算子によって生じる断熱サイクルと可逆欠陥の対応性を確立する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:06:10 GMT)
A Multicentric Dataset for Training and Benchmarking Breast Cancer Segmentation in H&E Slides [1.3] 本稿では,H&E陽性乳癌のマルチクラスセマンティックセグメンテーションのためのデータセットであるBrEast cancEr hisTopathoLogy sEgmentation (BEETLE)を紹介する。
3つの共同臨床センターと2つの公開データセットから587の生検と切除を行い、7つのスキャナーを用いてデジタル化し、全ての分子サブタイプと組織学的グレードをカバーする。
このデータセットの多様性と乳がんにおける自動バイオマーカー定量化分野への関連性は、その再利用の可能性を高める。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:09:21 GMT)
NVIDIA AI Aerial: AI-Native Wireless Communications [1.2] 6GはAIネイティブな無線システムへのパラダイムシフトをもたらす。
我々はPythonベースのアルゴリズムをGPU実行ブロブにコンパイルする堅牢なフレームワークを提案する。
我々は,Pythonで学習した畳み込みニューラルネットワーク(CNN)を用いて,PUSCH受信機におけるチャネル推定関数の実行の有効性を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:10:20 GMT)
Learning Pareto-Optimal Pandemic Intervention Policies with MORL [1.2] 本研究では,疾患拡散防止戦略をモデル化し,評価するための枠組みを開発する。
シミュレーションでは,全国規模のパンデミックのダイナミクスを再現し,他のモデルよりも桁違いに忠実に再現する。
この研究は、公衆衛生危機を緩和するための透明で証拠に基づく政策決定を支援する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:06:29 GMT)
Statistical Signatures of Integrable and Non-Integrable Quantum Hamiltonians [1.1] 我々は確率論的観点から量子積分可能性にアプローチする統計的枠組みを開発する。
重要な観察は、積分性はエネルギーギャップを消滅させる有限の確率を必要とすることである。
可積分ハミルトニアンと非可積分ハミルトニアンを区別するための2段階のプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:00:03 GMT)
Unraveling Syntax: How Language Models Learn Context-Free Grammars [1.0] 文脈自由文法から生成した合成言語に基づいて学習した小型モデルの学習力学について検討する。
より複雑な構造に進む前に、まず単純なサブ構造をマスターする子供とは異なり、トランスフォーマーは全てのサブ文法を並列に損失を減らす。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:52:19 GMT)
Multi-marginal temporal Schrödinger Bridge Matching for video generation from unpaired data [1.0] textittextbfMulti-Marginal temporal Schr"odinger Bridge Matching (textbfMMtSBM)を提案する。
我々の研究は、静的データから隠れたダイナミクスを回復するための実用的で原則化されたアプローチとしてMMtSBMを確立している。
実験により,MMtSBMは玩具の例における理論的特性を保ち,実世界のデータセット上での最先端性能を実現し,超高次元画像設定における結合と動的特性の回復を初めて行った。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:00:58 GMT)
Anti-Regulatory AI: How "AI Safety" is Leveraged Against Regulatory Oversight [1.0] AI企業は、プライバシ強化技術、バイアス抑制対策、評価フレームワーク、アライメントテクニックの開発と展開をますます進めている。
本稿では,法的な影響のメカニズムとして,これらの技術の内面的機能について考察する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:35:49 GMT)
ARENA: A tool for measuring and analysing the energy efficiency of Android apps [0.9] Androidアプリのエネルギー消費は、ソフトウェアベースのアプローチとハードウェアベースのアプローチによって推定できる。
ARENAは開発者や研究者が物理的測定装置に接続できる支援ツールである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:41:38 GMT)
Exponential Quantum Advantage for Message Complexity in Distributed Algorithms [0.9] ネットワークの2つの特定ノード間で情報をルーティングする、基本的なタスクに対する指数的量子優位性を示す。
我々の量子アルゴリズムは、Li、Li、Luoによる溶接木上の量子ウォークの最近の「簡潔な」実装に基づいている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:28:54 GMT)
Two-level adiabatic transition probability for small avoided crossings generated by tangential intersections [0.8] 2レベル回避交差の遷移確率の挙動は、2つのパラメータ(断熱およびエネルギーギャップパラメータ)がゼロとなる極限の下で研究される。
主な結果は、遷移確率の拡大だけでなく、いくつかの避けられた交差によって引き起こされる量子干渉も解明する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:09:41 GMT)
Sonar Image Datasets: A Comprehensive Survey of Resources, Challenges, and Applications [0.8] ソナー画像は水中探査、自律航法、生態系モニタリングに関係している。
公開されている十分に注釈付きソナー画像データセットの不足は、堅牢な機械学習モデルの開発に重大なボトルネックをもたらす。
我々は、Side Scan Sonar (SSS)、Forward-Looking Sonar (FLS)、Synthetic Aperture Sonar (SAS)、Multibeam Echo Sounder (MBES)、Dual-Frequency Identification Sonar (DIDSON)など、様々なソナーモードで公開されているデータセットをマップする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:39:29 GMT)
Style Over Story: A Process-Oriented Study of Authorial Creativity in Large Language Models [0.8] 我々は、権威創造性のためのレンズとして制約に基づく意思決定を導入する。
以上の結果から,LLMはStyleを他の要素よりも一貫して重視していることがわかった。
このアプローチは、AIの権威的創造性を分析するための、新しい体系的なツールを提供する、と我々は主張する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:57:14 GMT)
Quantum State Recovery via Direct Sum Formalism Without Measurement Outcomes [0.8] 本研究では,測定後の量子状態回復に対する新しいアプローチを提案する。
測定結果に後処理を依存せずに達成する。
結果は、直積ヒルベルト空間フレームワークで定式化された操作的および情報的非自明性を意味する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:54:15 GMT)
KTBox: A Modular LaTeX Framework for Semantic Color, Structured Highlighting, and Scholarly Communication [0.7] ktboxは、セマンティックカラーパレット、構造化ハイライトボックス、分類木、作者のメタデータユーティリティを統一するモジュラーフレームワークである。
主な機能としては、自動ナンバー付テイクアウトボックス、ワイドフォーマットハイライト、フレキシブルツリー視覚化、組込みテーブル、列挙、コードブロックをサポートするマルチカラムレイアウトなどがある。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:32:01 GMT)
A Quantitative Security Analysis of S-boxes in the NIST Lightweight Cryptography Finalists [0.7] 2017年、NISTは標準的な軽量スキームのセキュリティ要件を提出した。
本稿では,NIST LWCコンペティションファイナリスト6名のSボックスを,よく知られた暗号特性に基づいて評価する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:34:16 GMT)
Machine-interpretable Engineering Design Standards for Valve Specification [0.7] エンジニアリングはプロセスの技術的仕様を使用し、標準に準拠しなければならない。
製品仕様、製品タイプのデータシート、デザイン標準は、産業作業のデジタル化という野望にもかかわらず、依然として主に文書化されている。
我々は、エンジニアリング設計標準に保持されている情報を、モジュール化された再利用可能な機械解釈標準に変換する方法を実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:20:37 GMT)
Evaluating LLMs for Combinatorial Optimization: One-Phase and Two-Phase Heuristics for 2D Bin-Packing [0.7] 本稿では,Large Language Models (LLM) の最適化能力を評価するための評価フレームワークを提案する。
我々は,LLMと進化的アルゴリズムを組み合わせた体系的手法を導入し,解の生成と洗練を行う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:37:39 GMT)
An Algorithmic Information-Theoretic Perspective on the Symbol Grounding Problem [0.7] 意味の基底は情報理論の限界によって制約される過程であることを示す。
シンボルシステムを汎用チューリングマシンとしてモデル化し,情報圧縮の行為としてグラウンド化を定義する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:22:47 GMT)
How Much Is Too Much? Adaptive, Context-Aware Risk Detection in Naturalistic Driving [0.6] ラベルやモデルを時間とともに、ドライバ間で適応する統合されたコンテキスト対応フレームワークを提案する。
このフレームワークは、速度重み付けされたヘッドウェイと厳しい運転イベントの2つの安全指標と、ランダムフォレスト、XGBoost、ディープニューラルネットワーク(DNN)の3つのモデルを用いてテストされている。
全体として、このフレームワークは、リアルタイムの安全フィードバックを強化し、インテリジェントな交通システムにおけるドライバー中心の介入をサポートする、適応的でコンテキスト対応のリスク検出を約束している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:00:27 GMT)
Unlocking the power of partnership: How humans and machines can work together to improve face recognition [0.6] 人・人・機械協調の利点について検討した。
我々は,高性能機械の精度を高める可能性のある人物を選別し,知的な人間・機械融合を実現した。
人為的なパートナーシップで達成可能なシステム全体の最も高い精度は、グラフ理論によって発見された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:19:56 GMT)
Basis-independent coherence and its distribution in de Sitter spacetime [0.6] 曲がりくねった時空のコヒーレンスは 重力と熱力と 量子資源の相互作用に 新鮮な窓を提供する
本研究では,2つの共振検出器の総コヒーレンスを定量化する基盤非依存フレームワークを提案する。
非熱的スクイージングは、強い熱効果下であっても、抽出可能なコヒーレンスを著しく向上させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:41:49 GMT)
Towards Methane Detection Onboard Satellites [0.6] メタンは温室効果ガスであり、気候変動の主要な要因である。
衛星に搭載された機械学習(ML)は、ダウンリンクコストを低減しつつ、迅速な検出を可能にする。
テクスチュノルト認証データ(UnorthoDOS)を用いて,これらの前処理ステップをバイパスする新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:38:33 GMT)
PlaceFM: A Training-free Geospatial Foundation Model of Places using Large-Scale Point of Interest Data [0.6] PlaceFMは、トレーニング不要のクラスタリングベースのアプローチを通じて、プレース表現をキャプチャする。
placeFMは、米国Foursquareのデータから構築された関心グラフの全点をまとめたものだ。
placeFMは、興味のある場所を自動的に識別しながら、汎用的な領域埋め込みを生成する。
placeFMは、大規模POIグラフ上の領域レベルの表現を生成する際に、最大100倍のスピードアップを達成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:01:06 GMT)
How far can we go with ImageNet for Text-to-Image generation? [0.5] 我々は、よく設計されたテキストと画像拡張で拡張されたImageNetのみを用いて、大規模なWebスクラッドコレクションでトレーニングされたモデルの能力を実現することができることを示す。
この非常に単純な設定で、GenEvalのSD-XLで+6%、DPGBenchで+5%、パラメータの1/10とトレーニングイメージの1/1000で+6%のスコアを得る。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:14:12 GMT)
SpurBreast: A Curated Dataset for Investigating Spurious Correlations in Real-world Breast MRI Classification [0.5] SpurBreastは乳房MRIのキュレートされたデータセットで,スプリアス相関を意図的に組み込んでモデル性能への影響を評価する。
我々は、患者、デバイス、画像プロトコルを含む100以上の特徴を分析し、磁場強度と画像配向の2つの主要な刺激信号を特定する。
制御されたデータセット分割により、DNNはこれらの非クリニカル信号を利用して、偏りのないテストデータへの一般化に失敗しながら高い検証精度を達成できることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:16:20 GMT)
Improving neural network performance for solving quantum sign structure [0.5] 本研究では、異なる時間ステップを効果的に利用して振幅と位相を進化させる修正手法を提案する。
位相再構成のためのより大きな時間ステップを用いることで、位相ニューラルネットワークと振幅ニューラルネットワークの同時かつ効率的なトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:24:28 GMT)
Optimal Denoising in Score-Based Generative Models: The Role of Data Regularity [0.5] ハーフデノジングは十分な密度のフルデノジングよりも優れていることを示す。
フルデノジングは線型多様体仮説の下で次元性の呪いを軽減することができることを証明している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:26:04 GMT)
ShapeGen3DCP: A Deep Learning Framework for Layer Shape Prediction in 3D Concrete Printing [0.5] 本研究は3次元コンクリート印刷におけるフィラメント断面形状予測のための深層学習フレームワークであるShapeGen3DCPを紹介する(3DCP)。
このフレームワークは、流体状態(密度、降伏応力、塑性粘度)の材料特性とプロセスパラメータ(ノズル径、ノズル高さ、印刷速度、流れ速度)の両方を入力として、押出層形状を直接予測するニューラルネットワークアーキテクチャに基づいている。
トレーニングデータセットは、3DCPの確立されたパーティクル有限要素(PFEM)モデルを用いて合成され、実験データの不足を克服した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:30:20 GMT)
Semantic Bridges Between First Order c-Representations and Cost-Based Semantics: An Initial Perspective [0.5] 重み付けされた知識ベースとデファジブル条件セットが解釈に基づいて同じ順序を生成可能であることを示す。
我々の結果は、コストベースのセマンティクスとc-表現の両方において、さらなる作業の恩恵を受ける可能性がある。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:38:17 GMT)
Quantum Eigensolver for Non-Normal Matrices via Ground State Energy Estimation [0.5] 大規模な固有値問題は、古典的コンピュータにとって大きな課題となっている。
本稿では,少なくとも1-p_rm fail$の確率で,固有値の推定値を加算誤差$epsilon$内に出力する量子アルゴリズムを提案する。
我々のアルゴリズムはこのスケーリングを実現する最初の一般固有値アルゴリズムである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:21:59 GMT)
BioinfoMCP: A Unified Platform Enabling MCP Interfaces in Agentic Bioinformatics [0.5] BioinfoMCPは、高度なバイオインフォマティクス解析と自然言語による対話を可能にする。
MCP変換バイオインフォマティクスツール38のプラットフォームを提案し、94.7%が広く使用されている3つのAIエージェントプラットフォームで複雑なインターフェースの実行に成功したことを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:47:59 GMT)
When Tracking Fails: Analyzing Failure Modes of SAM2 for Point-Based Tracking in Surgical Videos [0.4] 腹腔鏡下胆嚢摘出術ビデオにおけるポイントベーストラッキングの障害モードを系統的に解析した。
以上の結果から, ポイントベーストラッキングは外科的ツールと競合するが, 解剖学的対象には不適合であることが明らかとなった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:06:49 GMT)
Dynamics of quantum Fisher and Wigner-Yanase skew information following a noisy quench [0.4] 量子臨界点を横断する横場イジングモデルの力学に及ぼす雑音の影響について検討する。
量子コヒーレンスの測定には量子フィッシャー情報(QFI)とウィグナー・ヤネーゼスキュー情報(WYSI)を用いる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:20:50 GMT)
Error correction in multiclass image classification of facial emotion on unbalanced samples [0.4] 本稿では,不均衡なサンプル上での顔画像のマルチクラス分類における誤り訂正の問題について考察する。
顔のキー領域に着目した注意機構を備えたLSTMに基づくニューラルネットワークモデルを用いる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:31:51 GMT)
Authentication Security of PRF GNSS Ranging [0.4] この研究は、複数のスプーフィングモデルの下での擬似ランダム関数(PRF)の認証セキュリティを導出する。
本稿では、GalileoのSignal Authentication Service(SAS)に、暗号化されたGalileo E6-C信号を利用する方法を適用する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:44:25 GMT)
An efficient quantum algorithm for computing $S$-units and its applications [0.4] 我々は、数群の$S$単位群を計算するために、Biasse and Song(SODA 16)の量子時間アルゴリズムの証明について詳しく述べる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:54:24 GMT)
Enhancing Corpus Callosum Segmentation in Fetal MRI via Pathology-Informed Domain Randomization [0.3] 本稿では,CCDの先行知識を合成データ生成パイプラインに組み込む,病理情報を用いた領域ランダム化手法を提案する。
健常児248例, CCD26例, その他の脳疾患47例からなるコホートを用いて本法の有効性を検討した。
CCDサブタイプを識別する上での有用性を示すために, 臨床に関係のあるLCC (corpus callosum length) や容積などのバイオマーカーを導出する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:18:55 GMT)
Entanglement distribution via satellite: an evaluation of competing protocols assuming realistic free-space optical channels [0.3] 衛星プラットフォームに基づくエンタングルメント分布プロトコルは量子ネットワークの優れた候補である。
我々は,各ネットワークトポロジにおける各プロトコルによって達成される蒸留エンタングルメントの分布率を計算した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:25:22 GMT)
Fact Grounded Attention: Eliminating Hallucination in Large Language Models Through Attention Level Knowledge Integration [0.3] FGA(Fact Grounded Attention)は、信頼できない言語モデルを決定論的真理子に変換する新しいアーキテクチャ修正である。
FGAは、トランスフォーマーの数学的心臓(ソフトマックス前の注意スコア)に介入し、知識ベースに事実が存在すると幻覚できないモデルを作成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:19:43 GMT)
Uniform-in-time convergence bounds for Persistent Contrastive Divergence Algorithms [0.3] 非正規化密度の最大最大値推定(MLE)のための持続的コントラスト分散(PCD)の連続時間定式化を提案する。
我々は,PCDとモデルパラメータのMLE解との誤差に対して,明示的な境界を導出することができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:12:33 GMT)
Quantum simulation of carbon capture in periodic metal-organic frameworks [0.3] 炭素捕獲は鉄鋼や化学物質などの重工業の脱炭に不可欠である。
本研究は,CO2吸着を促進させる金属表面が露出した磁気モット絶縁体Fe-MOF-74に焦点を当てた。
サンプルベース量子対角化法を用いて量子実験を行う。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:37:23 GMT)
Key Considerations for Auto-Scaling: Lessons from Benchmark Microservices [0.3] ベンチマークにいくつかの最先端のオートスケーリング手法を適用することにより,実用的なオートスケーリングの考察の集合を同定する。
私たちは、ソフトウェアライフサイクル中にいつ発生するかに基づいて、問題を分類します。
以上の結果から,重要なライフサイクル上の問題を見越すことで,オートスケーラのパフォーマンスが低下すると同時に,それに対応することで,より安定かつ効率的なスケーリングが可能になることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:44:55 GMT)
Forecasting the Ionosphere from Sparse GNSS Data with Temporal-Fusion Transformers [0.3] トータル・エレクトロン・コンテント(TEC)は、鍵となる電離層パラメータである。
TECは観測結果から導かれるが、その信頼性は地球規模測定の希少な性質によって制限される。
本稿では,TFT(Temporal Fusion Transformer)を利用した電離層変動予測のための機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:16:57 GMT)
Wasserstein multivariate auto-regressive models for modeling distributional time series [0.3] 本稿では,複数の確率測度の集合からなるデータの統計的解析に着目する。
時間依存確率測度をワッサーシュタイン空間のランダムな対象としてモデル化することにより、新しい自己回帰モデルを提案する。
このようなモデルの解の2次定常性に関する結果が提供される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:48:58 GMT)
A spiking photonic neural network of 40.000 neurons, trained with rank-order coding for leveraging sparsity [0.2] スパイキングニューラルネットワークは、生物学的ニューロンの特定の側面をエミュレートするニューロモルフィックシステムである。
このデモンストレーションはフォトニック非線形性、励起性、スパース計算を統合し、より効率的な大規模フォトニックニューロモルフィックシステムを実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:58:34 GMT)
Uncovering origins of heterogeneous superconductivity in La$_3$Ni$_2$O$_7$ using quantum sensors [0.2] 最近の発見では、ある種の電気化学式ニッケル酸化物が高圧下で高いT_c$まで超伝導されていることが驚きであった。
超伝導状態のメカニズムは 実験的に不明です
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:00:00 GMT)
TAIBOM: Bringing Trustworthiness to AI-Enabled Systems [0.2] 透明性とトレーサビリティを高めるために、SBOM(Software Bills of Materials)が重要になっている。
現在のフレームワークは、AIシステムのユニークな特徴を捉えていない。
我々は、SBOMの原則をAIドメインに拡張する新しいフレームワークであるTAIBOM(Trusted AI Bill of Materials)を紹介する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:17:07 GMT)
Quantum speed-up for solving the one-dimensional Hubbard model using quantum annealing [0.2] 本稿では,ハバード・ハミルトニアンに対する量子アニールのゲート型量子コンピュータシミュレーションの実施方法を示す。
半満たの場合については、Bethe-ansatz方程式に基づくアルゴリズムよりも相当な量子スピードアップが存在することが分かる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:49:36 GMT)
Utility-Scale Quantum State Preparation: Classical Training using Pauli Path Simulation [0.2] パウリパスシミュレーションを用いて、量子多体ハミルトニアンの基底状態を作成するためにパラメタライズド回路を変動的に取得する。
パウリパスシミュレーションの結果を、利用可能なときの正確な基底状態エネルギーと、密度行列再正規化群計算に対してベンチマークする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:00:00 GMT)
ZeroFalse: Improving Precision in Static Analysis with LLMs [0.2] 静的アプリケーションセキュリティテスト(SAST)ツールは、現代のソフトウェア開発に不可欠なツールだが、その採用は過度の偽陽性によって損なわれている。
ZeroFalseは,大規模言語モデル(LLM)と静的解析を統合して,カバレッジを維持しながら偽陽性を減らすフレームワークである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:07:25 GMT)
NEURODNAAI: Neural pipeline approaches for the advancing dna-based information storage as a sustainable digital medium using deep learning framework [0.2] NeuroDNAAIはバイナリデータストリームをシンボリックDNA配列にエンコードし、置換、挿入、削除を伴うノイズのあるチャネルを通して伝達し、高い忠実さでそれらを再構築する。
理論、ワークフロー、シミュレーションをひとつのパイプラインに統合することで、NeuroDNAAIはスケーラブルで生物学的に有効なアーカイブDNAストレージを可能にします。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:11:04 GMT)
Photonic crystal cavities based on suspended yttrium iron garnet nanobeams [0.2] 我々はイットリウム-鉄-ガーネット(YIG)におけるエアサスペンション型フォトニック結晶ナノビームキャビティの作製と光学的特性を報告した。
YIGの低光損失とフェライト性の組み合わせは、量子技術にとって非常に魅力的である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:49:47 GMT)
Guiding Multimodal Large Language Models with Blind and Low Vision People Visual Questions for Proactive Visual Interpretations [0.2] MLLM(Multimodal large language model)は、Blind and Low Vision (BLV)ユーザをサポートする視覚解釈アプリケーションに統合されている。
これらのアプリケーションは、コンテキストに関係なく、しばしば包括的で長い記述をデフォルトにします。
我々は,歴史的BLVユーザの質問に基づいてコンテキスト関連情報を提供するシステムを開発した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:48:51 GMT)
ROI-GS: Interest-based Local Quality 3D Gaussian Splatting [0.1] 既存の3Dガウススプレイティング手法は、シーン全体にわたってリソースを均一に割り当て、興味のある領域の詳細な詳細を制限する。
我々は、オブジェクト誘導カメラ選択による局所的な詳細性を高めるオブジェクト認識フレームワークであるROI-GSを提案する。
提案手法は,リアルタイム性能を維持しながら,選択したオブジェクトの高精細度化を優先する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:54:15 GMT)
VRWKV-Editor: Reducing quadratic complexity in transformer-based video editing [0.1] ビデオベース拡散モデルに線形時間アグリゲーションモジュールを統合する新しいビデオ編集モデルであるVRWKV-Editorを導入する。
VRWKV-Editorは、最先端の拡散ベースのビデオ編集方法と比較して最大3.7倍のスピードアップと60%のメモリ使用率を達成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:39:49 GMT)
A Benchmarking Study of Vision-based Robotic Grasping Algorithms [0.1] 本稿では,視覚に基づくロボットグルーピングアルゴリズムのベンチマーク研究について述べる。
文献から既存のベンチマークプロトコルを用いて,機械学習に基づく2つのアルゴリズムと2つの分析アルゴリズムを比較した。
シミュレーションと実際のロボットで同様の実験を行い、その相違点を提示する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:40:43 GMT)
Inferring Pluggable Types with Machine Learning [0.1] 本稿では,機械学習を用いて型付き修飾子を自動的に推論する方法について検討する。
本稿では,最小限のデータフローヒントを符号化した新しい表現NaP-ASTを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:58:19 GMT)
Hybrid Quantum-Classical Walks for Graph Representation Learning in Community Detection [0.1] 本稿では,グラフ表現学習(GRL)のための新しい量子インスピレーションアルゴリズムを提案する。
我々のアプローチは量子力学と古典力学の両方の利点を組み合わせることで、ウォーカーはグラフ内の高度に局所的な接続と遠縁な接続の両方を同時に探索することができる。
ネットワークコミュニティ検出におけるケーススタディの予備的な結果は、このハイブリッドなダイナミクスにより、複雑なグラフトポロジに効果的に適応できることを示している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:35:17 GMT)
Self-Sustained Oscillations of a Nonlinear Optomechanical System in the Low-Excitation Regime [0.1] 量子センシングのような次世代の量子アプリケーションは、非線形性と非古典的相関の組み合わせを必要とする。
本稿では, 単一励起レベルで駆動される力学系における非線形力学の観察と理論的モデリングについて報告する。
具体的には,超伝導マイクロ波回路のKerr非線形性により,非線形ダイナミクスの観測のしきい値が4桁減少する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:05:42 GMT)
ARUQULA -- An LLM based Text2SPARQL Approach using ReAct and Knowledge Graph Exploration Utilities [0.1] 本稿では,自然言語質問をSPARQLクエリに変換するSPINACHに基づく手法を提案する。
この作業は、Text2SPARQLドメインの改善を促進するために実施された、Text2SPARQLチャレンジによって動機付けられた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:49:27 GMT)
An effective control of large systems of active particles: An application to evacuation problem [0.1] 我々は、強化学習と、システムに作用する人工力を組み合わせた、リーダーのための効果的な制御戦略を開発する。
我々は、RLの簡単な適用は、高度なアーキテクチャであっても、準最適結果をもたらすが、我々のアプローチは堅牢で効率的な避難戦略を提供することを示した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:05:12 GMT)
Optimizing fermionic Hamiltonians with classical interactions [0.1] 古典的相互作用を持つフェルミオンハミルトニアンに対する最適化問題(基底エネルギー探索)を考える。
フェルミオニオンガウス状態が、疎性に依存しないハミルトニアンに対して少なくとも1/3の近似比を達成することを証明した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:31:55 GMT)
ImageNet-Think-250K: A Large-Scale Synthetic Dataset for Multimodal Reasoning for Vision Language Models [0.0] ImageNet-Thinkは、視覚言語モデル(VLM)の開発を支援するために設計されたマルチモーダル推論データセットである。
データセットはImageNet21kデータセットから25万の画像に基づいて構築されており、構造化された思考トークンと対応する回答を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:02:45 GMT)
Litespark Technical Report: High-Throughput, Energy-Efficient LLM Training Framework [0.0] 大規模言語モデル(LLM)の訓練は、長い訓練時間と大量のエネルギー消費に悩まされている。
Litesparkは、これらの非効率性に対処する新しい事前トレーニングフレームワークである。
提案手法は,標準的なトランスフォーマー実装との互換性を維持しつつ,モデルFLOP(MFU)を最大化するために,アーキテクチャ改善とアルゴリズム拡張を組み合わせる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:42:07 GMT)
Zero-shot reasoning for simulating scholarly peer-review [0.0] 本稿では、AI生成ピアレビューレポートを評価するための、最初の安定的でエビデンスに基づく標準を提供する決定論的シミュレーションフレームワークについて検討する。
第一に、このシステムは校正された編集判断をシミュレートすることができ、「改訂」決定が一貫して多数決結果を形成する。
第二に、手続きの整合性を揺るぎないまま維持し、安定した29%の証明の遵守率を強制する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:59:14 GMT)
Workplace Location Choice Model based on Deep Neural Network [0.0] 本稿では,職場位置選択をモデル化するためのディープニューラルネットワーク(DNN)手法を提案する。
複雑な決定パターンをよりよく理解し、従来の離散選択モデル(DCM)よりも優れた結果を提供することを目指している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:04:45 GMT)
What are You Looking at? Modality Contribution in Multimodal Medical Deep Learning [0.0] 医療における高次元マルチモーダル患者データの普及を考えると、マルチモーダルモデルの開発は大きな進歩をみせている。
本稿では,そのタスクを果たすためのモデルのデータセットにおける各モダリティの重要性を計測する手法を提案する。
いくつかのネットワークは、一様崩壊の傾向にあるモダリティの選好を持ち、いくつかのデータセットはゼロから不均衡であることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:55:44 GMT)
Variational approach to open quantum systems with long-range competing interactions [0.0] 1次元と2次元の散逸性量子格子に対する効率的かつスケーラブルなアプローチを導入する。
我々は,スピン=フラクチャー12$格子の非平衡ダイナミクスと定常状態をシミュレートすることにより,アルゴリズムの汎用性,有効性,特異な方法論的利点を示す。
このアプローチは、長距離相互作用を持つ様々な実験で実現可能な量子系の複雑な非平衡特性の理解を促進するための有望な展望を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:29:00 GMT)
Using KL-Divergence to Focus Frequency Information in Low-Light Image Enhancement [0.0] LLFDiscは、周波数認識の強化に適したクロスアテンションとゲーティング機構を統合するU字型のディープエンハンスメントネットワークである。
本稿では,Fourierドメイン情報に直接適合し,閉形式KL-Divergence目標を用いた分散を最小化する新しい分布認識損失を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:14:11 GMT)
Unveiling Entanglement's Metrological Power: Empirical Modeling of Optimal States in Quantum Metrics [0.0] 量子状態の計量的能力と3つの異なる絡み合い尺度の間に強い経験的関係を示す。
実世界の量子センシングプロトコルへの即時適用により、我々の研究結果は量子資源理論からの重要な予測を直接的に検証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:12:08 GMT)
Understanding Quantum Imaginary Time Evolution and its Variational form [0.0] 多くの計算学的に難しい問題を量子ハミルトニアンにエンコードすることができる。
これらの問題の解は、これらのハミルトンの基底状態によって与えられる。
ハミルトンの基底状態を見つけるための最先端のアルゴリズムは、いわゆる量子イマジナリー時間進化(Quantum Imaginary Time Evolution)である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:42:31 GMT)
Two-Photon Resonance Fluorescence in a Three-Level Ladder-Type Atom [0.0] 我々は、コヒーレントフィールドによって駆動される3レベルラダー型原子を考える。
2光子共鳴によって駆動されると、原子は最高エネルギー状態に励起される。
このスペクトルは、原子の服装状態間の遷移に対応する7つの異なる周波数を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:27:54 GMT)
Towards fairer public transit: Real-time tensor-based multimodal fare evasion and fraud detection [0.0] 本研究では,公共交通機関における不正・運賃回避を検知するマルチモーダルシステムを提案する。
提案手法では、ビデオ抽出にViViTモデル、オーディオ解析にAudio Spectrogram Transformer(AST)を用いる。
このシステムは、非モーダル相互作用とバイモーダル相互作用を明示的にモデル化するFusion Network (TFN)アーキテクチャを実装している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:14:19 GMT)
Toward high-fidelity quantum information processing and quantum simulation with spin qubits and phonons [0.0] 連続的動的デカップリング法の応用は量子状態のコヒーレンスを大幅に向上させることを示す。
このアプローチは、スピンとフォノンを持つ中規模および大規模量子デバイスへの現実的なパスを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:46:19 GMT)
Topological Hall effect in nonlinear optics [0.0] 全光学的3次非線形光学過程におけるエンフォロジー軸ホール効果の実験的証拠を示す。
実験構成は、有機溶媒(トルエン)とのパラメトリック相互作用を行う中程度の焦点のポンプレーザビームと、ポンプビームによって生成された非自明な空間磁化テクスチャを外共振レーザビームとからなる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:06:41 GMT)
Three-Dimensional Niobium Coaxial Cavity with $\sim0.1\,$second Lifetime [0.0] 20mK以下の単光子レベルにおいて,3次元ニオブ4次波同軸共軸キャビティの内部品質係数,温度中熱処理,Q_rm int gtrsim 3times109$を示した。
この表面処理は、2次元超伝導回路の製造に適用でき、Nbベースの超伝導量子ビットの寿命を改善するのに役立つ。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:05:52 GMT)
The Hidden Costs of Translation Accuracy: Distillation, Quantization, and Environmental Impact [0.0] 大規模言語モデル(LLM)の急速な拡張により、計算コストや環境コストに対する懸念が高まっている。
本研究では, フルスケール, 蒸留, 定量化モデルを比較し, 翻訳品質と効率のトレードオフについて検討した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:15:14 GMT)
The Equilibrium Response of Atmospheric Machine-Learning Models to Uniform Sea Surface Temperature Warming [0.0] 機械学習モデルは、地球の気候の安定な複数年シミュレーションを生成することができる。
我々は, 海面温度の均一な上昇に対するいくつかの最先端MLモデルの気候応答を評価した。
我々の結果は、気候変動の応用におけるMLモデルの約束と現在の限界を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:42:37 GMT)
The Constant Speed Schedule for Adiabatic State Preparation: Towards Quadratic Speedup without Prior Spectral Knowledge [0.0] 等速で固有状態の断熱経路を横切る定速スケジュールを導入する。
本手法は,ハエの重なりを頼りにすることにより,事前のスペクトル知識の必要性を解消する。
数値実験では,小さなギャップ領域における最適(デルタ)スケーリングを実現する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:39:35 GMT)
Tenyidie Syllabification corpus creation and deep learning applications [0.0] テニディ語(Tenyidie language)は、インド北東部のナガランドで話されているチベット・ビルマン族の低資源語である。
我々の知る限りでは、この言語についてシラビフィケーションに関する研究は報告されていない。
この研究の貢献は、10,120の音節化されたテニディ語の作成と、Deep Learningの技法が作成されたコーパスに適用されたことである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:18:27 GMT)
Temporal Pulse Origins in Atom Interferometric Quantum Sensors [0.0] 原子干渉計に基づく量子センサーは、原子状態をコヒーレントに操作するために高周波または光パルスに依存している。
パルスのイントロダクタ位相応答は、時間内の単一点を用いてパラメータ化することができる。
時間的起源は, 測定スケール係数の簡易な決定と, 環境摂動に対する安定性を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:13:03 GMT)
Template-Guided 3D Molecular Pose Generation via Flow Matching and Differentiable Optimization [0.0] タンパク質結合部位内の小さな分子の3Dコンホメーションを予測することは、薬物設計において重要な課題である。
本稿では,2段階の方法を提案する。
リガンドコンフォーメーション ジェネレーション 誘導。
テンプレートだ
まず,3次元座標を生成する分子アライメント手法を提案する。
リガンド、テンプレート構造を参照として使用する。
第二段階において、微分可能なポーズ最適化法は、形状と薬局類似性に基づいて、このコンフォーメーションを洗練させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:50:49 GMT)
Symmetry enforces entanglement at high temperatures [0.0] オンサイトアベリア対称性を持つハミルトニアンの強い対称熱状態(カノニカルアンサンブル)は、任意に高温で非ゼロエンタングルメント負性率と絡み合っていることを証明している。
我々の結果は、超選択規則の下で弱対称な熱状態(ギブズ・アンサンブル)に拡張され、状態分解は対称に制限される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:35:59 GMT)
Sparse Query Attention (SQA): A Computationally Efficient Attention Mechanism with Query Heads Reduction [0.0] 本稿では,新しいアテンションアーキテクチャであるスパースクエリアテンション(SQA)について紹介する。
モデル事前トレーニング、微調整、エンコーダベースのタスクなど、計算バウンドシナリオで最大3倍のスループット向上を実現することができる。
SQAは、近くリリースされるReactive Transformerアーキテクチャの開発において、極めて重要視された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:01:38 GMT)
SoK: Measuring What Matters for Closed-Loop Security Agents [0.0] CLASP: Closed-Loop Autonomous Security Performanceフレームワークを紹介します。
セキュリティライフサイクル(リコネッサンス、エクスプロイト、ルート原因合成分析、パッチ合成、バリデーション)をコアエージェント機能と整合させる。
次に,閉ループ能力(CLC)スコア(Closed-Loop Capability, CLC)を定義する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:20:35 GMT)
Single-shot preparation of hypergraph product codes via dimension jump [0.0] 本稿では,空間的オーバーヘッドを$O(sqrtn)$とすることで,一定レートのハイパーグラフ製品コードのコード空間を一定深さで作成するプロトコルを提案する。
測定誤差が存在する場合でも,プロトコルは堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:59:53 GMT)
Self-supervised diffusion model fine-tuning for costate initialization using Markov chain Monte Carlo [0.0] 最適軌道解の分布を表すために条件付き拡散モデルを用いる。
次に,マルコフ・チェイン・モンテカルロアルゴリズムと自己教師型微調整を用いた新しい手法を紹介する。
サンプル品質を改善する能力を示す2つの問題について, 数値実験を行った。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:54:59 GMT)
Secure and Scalable Blockchain Voting: A Comparative Framework and the Role of Large Language Models [0.0] 本稿では,ブロックチェーンベースのE-Votingアーキテクチャ,コンセンサス機構,暗号プロトコルを解析するための比較フレームワークを提案する。
本稿では,ハイブリッドコンセンサス,軽量暗号,分散ID管理などを含む最適化戦略を提案する。
私たちの発見は、国家規模のデプロイメントに適したセキュアでスケーラブルでインテリジェントなブロックチェーンベースのE-Votingシステムを設計するための基盤を提供します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:45:52 GMT)
Secure Multi-Modal Data Fusion in Federated Digital Health Systems via MCP [0.0] 本研究では,モデルコンテキストプロトコル(MCP)を,セキュアなクロスエージェント通信のための相互運用層として活用する新しいフレームワークを提案する。
提案アーキテクチャは,臨床画像,電子カルテ,ウェアラブルIoTデータに対するマルチモーダルな特徴アライメント,患者に敏感な更新を保護するために差分プライバシによるセキュアなアグリゲーション,モバイルクライアントにおけるドロップアウトを軽減するためのエネルギー認識スケジューリングの3つの柱を統合する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:19:56 GMT)
Robust Classification of Oral Cancer with Limited Training Data [0.0] 本稿では,小さな訓練セットを用いた口腔癌分類のための,畳み込みニューラルネットワーク(CNN)とベイズ深層学習を組み合わせたハイブリッドモデルを提案する。
提案したモデルは、従来のCNNのパフォーマンスに匹敵する、トレーニングデータと同様の分布を持つテストデータセットで94%の精度を達成した。
信頼分析の結果, 正しい分類標本に対する不確実性(高い信頼度)と誤分類標本に対する不確実性(低い信頼度)が認められた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:40:53 GMT)
Reproducible Builds for Quantum Computing [0.0] 本稿では,量子コンピューティングと再現可能なビルドコミュニティのギャップを埋めることを目的としている。
本稿では、量子環境における再現可能なビルドの定義の一般化を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:38:40 GMT)
Reducing Simulation Dependence in Neutrino Telescopes with Masked Point Transformers [0.0] ニュートリノ望遠鏡のための最初の自己教師型訓練パイプラインを提示する。
トレーニングの大部分を実際のデータにシフトすることで、このアプローチはシミュレーションへの依存を最小限にする。
これはニュートリノ望遠鏡における従来の機械学習アプリケーションとは大きく異なる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:18:19 GMT)
Recovering Einstein's equation from local correlations with quantum reference frames [0.0] 観測可能な時空は、世界線の偶然の「連続」と見なすことができる。
我々は、小さな空間のような領域において、計量が量子RFと局所的相関を符号化することを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:08:53 GMT)
Realism and the Inequivalence of the Two Quantum Pictures [0.0] 量子力学のシュル「オーディンガー」とハイゼンベルク像は、それらが同じ経験的予測をもたらすという事実に等しいと主張する。
対照的に科学リアリズムでは、理論は現実を記述することを目的としている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:46:18 GMT)
ReSSFormer: A Recursive Sparse Structured Transformer for Scalable and Long-Context Reasoning [0.0] 本稿では,ReSSFormerについて述べる。Recursive Sparse Structured Transformerは3つの相補的なイノベーションを統合している。
ReSSFormerは、従来のディープスタックをリカレント推論に置き換え、トークンレベルのスペーサと専門家レベルのスペーサに置き換え、コンテンツから直接潜在トークントポロジをモデル化する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:05:30 GMT)
REBot: From RAG to CatRAG with Semantic Enrichment and Graph Routing [0.0] CatRAGは、検索拡張生成とグラフベースの推論を統合するハイブリッド検索推論フレームワークである。
我々は,ルール固有のデータセットを構築し,分類と質問応答タスクに基づいてREBotを評価する。
我々は,実世界の学術的助言シナリオにおいて,REBotの実践的価値を示すWebアプリケーションを実装した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:40:55 GMT)
RAG-BioQA Retrieval-Augmented Generation for Long-Form Biomedical Question Answering [0.0] 本稿では,検索拡張世代とドメイン固有の微調整を組み合わせた新しいフレームワークであるRAG-BioQAについて述べる。
PubMedQAデータセットの実験結果は、ベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:49:09 GMT)
R2 v2: The Pareto-compliant R2 Indicator for Better Benchmarking in Bi-objective Optimization [0.0] 多目的最適化では、セットベースの品質指標がベンチマークと性能評価の基礎となる。
最もよく使われるセットベースメトリクスの1つは、R2インジケータである。
本稿では、(Tchebycheff)ユーティリティ関数の連続的一様分布を持つという前提のもと、R2インジケータを再検討する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:14:14 GMT)
Quantum jumps in amplitude bistability: Tracking a coherent and invertible state localization [0.0] オープン駆動Jaynes-Cummingsモデルにおける光の巨視的準安定状態間の量子ジャンプについて検討する。
その結果、[H. J. Carmichael, Phys. Rev. X 5, 031028] で考慮されたゼロ自然放出の限界において、高光子状態から真空状態へのジャンプには2つの段階があることがわかった。
第1部は、量子軌道理論によって予測される零測度レコードの例において、状態重ね合わせの局所化によってコヒーレントでモデル化される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:30:51 GMT)
Quantum dissipative effects for a real scalar field coupled to a dynamical Neumann surface in d+1 dimensions [0.0] 空間および時間依存曲面上のノイマン境界条件を満たす無質量実スカラー場からなる系の散逸効果について検討する。
d=1では、この効果は比較的任意の曲面に対して2階まで、波状曲面に対しては4階まで等しくなる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:13:42 GMT)
PyramidStyler: Transformer-Based Neural Style Transfer with Pyramidal Positional Encoding and Reinforcement Learning [0.0] 計算負荷を低減しつつ,局所的な詳細とグローバルなコンテキストの両方をキャプチャする階層的,マルチスケールなエンコーディングであるPraamidal Positional PPEを用いたトランスフォーマーフレームワークであるPraamidStylerを紹介する。
MicrosoftとWikiArtでトレーニングされたPraamidStylerは、コンテンツ損失を62.6%(2.07)、スタイル損失を57.4%(0.86)に減らし、4000 epochsで1.39 sの推論を実現した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:54:52 GMT)
Purcell-enhanced single-photon generation from CsPbBr$_3$ quantum dots in in-situ selected Laguerre-Gaussian modes [0.0] コロイド鉛ハロゲン化ペロブスカイト量子ドット(英語版) (QD) は、区別不可能な単一光子を高速で半決定的に生成できる汎用材料として出現している。
ここでは、単一CsPbBr$_3$QDsを、ナノファブリックしたガウス形状の変形により、オープンなFabry-Perotマイクロキャビティに統合する。
我々の発見は、先進的な量子フォトニクス応用のために単光子LGビームを直接生成する高光子レート源への扉を開く。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:33:24 GMT)
Probing graph topology from local quantum measurements [0.0] 本研究では, 平均度, ハブ密度, 固定長の閉路数などの未知の量子ネットワークのグローバルな特性を, 厳密な局所的な量子測定から推定できることを示す。
ノードのごく一部しかアクセスできない悪意のあるエージェントが、量子状態を局所的に初期化し、反復的短時間測定によりネットワーク全体の機密構造情報を抽出できることを実証する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:09:51 GMT)
Poolformer: Recurrent Networks with Pooling for Long-Sequence Modeling [0.0] PoolformerはSequence-to-Sequenceモデルで、自己アテンションをリカレントレイヤに置き換え、シーケンス長を削減するためにプール操作を組み込む。
以上の結果から,プールはトレーニングを大幅に加速し,知覚的指標(FID,IS)が向上し,過度な適合を防ぐことが示唆された。
将来の方向性には、テキストとビジョンのアプリケーションや、マルチモーダルシナリオが含まれる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:52:45 GMT)
Percepta: High Performance Stream Processing at the Edge [0.0] 本稿では、エッジでのAIワークロードをサポートするために設計された、軽量データストリーム処理(DSP)システムであるPerceptaを提案する。
その他の機能としては、データの正規化、異種プロトコル間の調和化、サンプリングレート、不足データや不完全データの堅牢なハンドリングなどがある。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:57:45 GMT)
PepCompass: Navigating peptide embedding spaces using Riemannian Geometry [0.0] Pepはペプチド探索と最適化のための幾何学的なフレームワークである。
生成モデルはペプチド空間の潜在的な「マップ」を提供する。
電位最小化測地探索(PoGS)は、プロパティ富化種子に沿ったプロトタイプの埋め込みを補間する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:07:37 GMT)
Pauli Stabilizer Models for Gapped Boundaries of Twisted Quantum Doubles and Applications to Composite Dimensional Codes [0.0] 本稿では,Abelian合成次元ツイスト量子ダブルスのギャップ境界,領域壁,および0D$欠陥に対する安定化モデルの構築例を示す。
本アルゴリズムは,物理的に直感的な凝縮の概念を用いて,境界と磁壁の安定化器を構築する方法を明確に記述する。
本稿では,量子誤り訂正の急激な領域における符号の有用性について論じる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:47:13 GMT)
Partonic distribution functions and amplitudes using tensor network methods [0.0] 粒子分布関数 (PDF) と分布振幅 (DA) はクォークおよびグルーオン場の光円錐相関器として定義される非摂動量である。
1+1次元のNambu-Jona-Lasinioモデルを用いて模擬数値計算を行う。
PDFとDAは、摂動的および非相対論的限界における期待と一致し、大きな量子ビット限界における様々な強い結合度で評価する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:05:24 GMT)
Orthogonal Procrustes problem preserves correlations in synthetic data [0.0] 提案手法は,合成データから得られる特徴量,特にピアソン相関量の重要な統計的関係を確実に維持する。
我々のアプローチは、既存の生成モデルを置き換えることではなく、既に生成された合成データセットとピアソンの正確な相関を強制する軽量な後処理ステップである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:14:57 GMT)
On a Class of Time-Dependent Non-Hermitian Hamiltonians [0.0] 時間依存(TD)非エルミートハミルトン群 $H(t)$ を擬エルミートハミルトン群 $mathcalH_0PH に変換する。
後者は、Hermitian Hamiltonian $h と類似性変換、$h=rho MathcalH_0PH rho-1$、$rho$ はダイソン写像である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:59:12 GMT)
Octax: Accelerated CHIP-8 Arcade Environments for Reinforcement Learning in JAX [0.0] 強化学習(Reinforcement Learning, RL)の研究には、多様で困難な環境が必要である。
JAXで実装された古典的なアーケードゲーム環境の高性能スイートであるOcaxを紹介します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:56:47 GMT)
Next-Generation Heralded Single Photon Sources [0.0] 統合フォトニックプラットフォームに関する単一の光子ソースが、この目標を達成するための道のりだ。
ここでは、ソースのキャラクタリゼーションの不整合を識別し、より公平な比較を容易にし、どのソースが次世代量子アプリケーションを実現するかをよりよく理解するための方法を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:16:11 GMT)
Neurotremor: A wearable Supportive Device for Supporting Upper Limb Muscle Function [0.0] 上肢機能のためのセンサフューズ型ウェアラブル支援プロトタイプ(トリペスブラキイと伸展性花粉)を提示する。
この装置は、表面筋電図(sEMG)、慣性測定ユニット(IMU)、およびM5StickCとESP32-S3計算ハブのフレキシブル/フォースセンサーを統合する。
コントロールは、コントロールバリア機能付き安全封筒によってバウンドされ、軽量なパーソナライゼーションを備えたゲームベースのタスク内に配信される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:07:09 GMT)
Neural non-canonical Hamiltonian dynamics for long-time simulations [0.0] この研究は、データから非標準ハミルトン力学を学習することに焦点を当てている。
長期予測では、学習モデルと数値スキームの両方において構造を保存する必要がある。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:27:10 GMT)
Neural Network Parameter-optimization of Gaussian pmDAGs [0.0] 因果推論に使用される既存のグラフィカル構造はガウスベイズネットワークの限界化の下では安定ではないことを示す。
本稿では、潜在変数モデルのパラメータ最適化と、仮定された分布列のパラメータ空間におけるフィードフォワードニューラルネットワークのトレーニングの第一の双対性を示す。
本稿では,因果効果が同定可能か否かをチェックするメタアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:06:38 GMT)
Neural Diffusion Processes for Physically Interpretable Survival Prediction [0.0] DeepFHTは、ディープニューラルネットワークとプロセス理論からの最初のヒット時間(FHT)分布を結合するサバイバル分析フレームワークである。
ニューラルネットワークは、入力変数を初期状態、ドリフト、拡散を含む物理的に意味のあるパラメータにマッピングする。
これにより、クローズドフォームの生存とハザード関数が得られ、比例ハザードを仮定することなく、時間変化のリスクを捕捉する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:22:20 GMT)
Multiplier-free In-Memory Vector-Matrix Multiplication Using Distributed Arithmetic [0.0] 本研究では,入力ベクトルを定数行列で乗算するためにDA法を拡張した。
メモリに重みの合計を格納することで、DAはReRAMメモリの周辺にシフト・アンド・アドバンス回路を用いてVMMを達成する。
提案手法は, 従来, ビットスライシングによりメモリ上で実行されていたVMMよりも4.5倍の遅延と12倍の省エネを実現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:06:00 GMT)
Multimodal Foundation Models for Early Disease Detection [0.0] 本稿では、注意に基づくトランスフォーマーフレームワークを通じて、多様な患者データを統合する基礎モデルを提案する。
このアーキテクチャは、多くのタスクを事前トレーニングするために作られており、新しい病気やデータセットへの適応を、余分な作業で簡単に行える。
我々は、早期検出タスクのテストを目的として、腫瘍学、心臓学、神経学のベンチマークデータセットを使用する実験戦略を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:12:57 GMT)
Monogamy of entanglement of maximal dimension [0.0] エンタングルメントのG-コンカレンス測度は、最大次元のエンタングルメントの測度と見なされる。
本稿では,両部混合状態のG-コンカレンスの上界を得るための厳密な枠組みについて述べる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:48:45 GMT)
Mitigating the barren plateau problem in linear optics [0.0] 離散変数ボソンサンプリングを用いた変分量子アルゴリズムの大幅な高速化を示す。
これにより、問題、アンサッツ、回路レイアウトに関わらず、局所的なミニマや不毛の台地が少なくなる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:00:00 GMT)
Maximum heralding probabilities of non-classical state generation from two-mode Gaussian state via photon counting measurements [0.0] 光の古典的でない状態は、選択したモードでの光子計数測定によって生成される。
本研究では,2モード設定における最大階層化確率を解析的に計算できることを示す。
この条件下では、星位の高い高密度光量子状態の生成が事実上実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:21:18 GMT)
Mapping Historic Urban Footprints in France: Balancing Quality, Scalability and AI Techniques [0.0] 本研究は, Scan Histo 歴史地図シリーズ(1925-1950)から市街地を抽出するスケーラブルな深層学習パイプラインを開発することにより, ギャップを埋めるものである。
私たちの重要な革新は、歴史的地図の高放射能と複雑さを扱うために設計されたデュアルパスのU-Netアプローチです。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:04:53 GMT)
Machines are more productive than humans until they aren't, and vice versa [0.0] 本稿では,実証現実主義に基づくモンテカルロシミュレーションに基づくシリコン内フレームワークを開発し,人的・機械的スキルの経済的影響を分析する。
高いレベルの一般化が必要であり、エラーのコストが高い場合、人間と機械のスキルを組み合わせることが最も効果的な戦略であることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:32:48 GMT)
Machine learning for accuracy in density functional approximations [0.0] 密度汎関数近似の精度を向上させるために機械学習を適用した最近の進歩を概観する。
異なる化学物質と材料クラス間で伝達可能な機械学習モデルを考案する際の約束と課題について論じる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:18:02 GMT)
Lower bounds on the complexity of preparing mixed states [0.0] 我々は、多ビット混合状態における相関関係と、その調製に必要な回路深さの最小値の関係を確立する。
応用として、1次元量子臨界系の熱状態を作成するのに必要な回路深さの低い境界を導出する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:50:59 GMT)
Linguistic and Audio Embedding-Based Machine Learning for Alzheimer's Dementia and Mild Cognitive Impairment Detection: Insights from the PROCESS Challenge [0.0] 音声は、音響的次元と言語的次元の両方を包含し、認知の低下に対して有望な非侵襲的バイオマーカーを提供する。
本稿では,自然発声音声からの音声埋め込みと言語的特徴を両立させるプロシージャチャレンジのための機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:54:55 GMT)
Legal Knowledge Graph Foundations, Part I: URI-Addressable Abstract Works (LRMoo F1 to schema.org) [0.0] IFLA参照モデル(LR)に基づく法規範の時相進化のための形式的イベント中心モデルを構築した。
本稿では,セマンティックWeb上で,このモデルの基本的実体である抽象法的作業(F1)を公開する上で不可欠な第一歩について論じる。
Webネイティブの標準を形式的に読み取ることで、この作業は決定論的で信頼性の高い法的な知識グラフ(LKG)を構築するための道を開いた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:15:20 GMT)
Large-Scale Bayesian Causal Discovery with Interventional Data [0.0] 有向非巡回グラフ(DAG)の形で変数の集合間の因果関係を推定することは重要であるが、非常に難しい問題である。
介入データを用いた因果発見のための実証的ベイズ的枠組みであるインターベンショナルベイズ的因果発見(IBCD)を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:16:04 GMT)
Komitee Equal Shares: Choosing Together as Voters and as Groups with a Co-designed Virtual Budget Algorithm [0.0] 価格の高い仮想予算配分フレームワークであるKomitee Equal Sharesを紹介する。
投票者モードでは、参加者がポイント投票を行い、評価モードでは小グループが提案を評価する。
このフレームワークは、両方のシグナルを仮想的な消費力に変換し、投票レシートを生成することによって、平等な共有の方法を拡張する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:11:59 GMT)
Intrinsic Heisenberg-type lower bounds on spacelike hypersurfaces in general relativity [0.0] 我々は、物質と定数を持つ任意の時空の半径空間のような超曲面の測地球に厳密に局在した量子状態に対する座標および葉分非依存のハイゼンベルク型下界を証明した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:19:11 GMT)
Improving AGI Evaluation: A Data Science Perspective [0.0] AGI評価手法は、人工知能が合成タスクを作成することの直感を利用する設計哲学に支配されていると我々は主張する。
我々は、AGIを能力を通して実証しようとする、堅牢なタスク実行を評価することに焦点を当てた代替設計哲学を論じる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 05:27:29 GMT)
Identifying Asymptomatic Nodes in Network Epidemics using Graph Neural Networks [0.0] 本研究は,古典的なSI(Susceptible-Infected)ネットワーク流行モデルを考慮した無症状者を特定する問題に取り組む。
教師付き学習を伴うグラフニューラルネットワーク(GNN)モデルは、感染したノードが観測されたネットワークから一連のノード機能を構築する際に採用される。
その結果,提案手法は様々なシナリオにおいて堅牢であることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 21:18:18 GMT)
Hybrid biphoton spectrometer for time-resolved quantum spectroscopy across visible and near-infrared regions [0.0] 可視光および近赤外光を含むバイフォトンスペクトルを捕捉する新しい手法を提案する。
我々は,時間的タグ付け獲得戦略を活用することで,共同スペクトル強度の測定に成功した。
この方法論は、純粋な双光子状態の要求と量子分光における動的洞察の必要性のギャップを埋める。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:32:34 GMT)
Hybrid Physics-ML Framework for Pan-Arctic Permafrost Infrastructure Risk at Record 2.9-Million Observation Scale [0.0] 我々は171,605箇所から何百万もの観測結果を統合するハイブリッド物理機械学習フレームワークを提案する。
当社のフレームワークは,世界最大の永久凍土MLデータセットである。
北極インフラのための最初のハイブリッド物理ML予測システムを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:38:36 GMT)
Hybrid Deep Learning Modeling Approach to Predict Natural Gas Consumption of Home Subscribers on Limited Data [0.0] 本研究は,イラン・ザンジャン州の住宅顧客を対象に,ガス消費量の分析と予測を目的とした。
このデータセットは、2017年から2022年までの6年間に収集されたガス消費と気象データで構成されている。
その結果,ハイブリッドBiLSTM-XGBoostモデルは,精度で他のモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:22:19 GMT)
Human-Robo-advisor collaboration in decision-making: Evidence from a multiphase mixed methods experimental study [0.0] ロボアドバイザ(英: Robo Advisors、RA)は、人間の金融アドバイザに対する費用効果があり、バイアスに強い代替手段である。
RAのパフォーマンスに関する情報によって形づくられた、RAに依存する傾向が示唆されている。
テーマ分析では、意思決定において3つのRAの役割と4つのユーザタイプを明らかにし、それぞれがアドバイス統合の異なるパターンを反映している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:04:31 GMT)
Human-AI Teaming Co-Learning in Military Operations [0.0] 本研究では,軍事活動における人間-AI連携のための信頼性の高い協調学習モデルの設計を提案する。
それは、人間のエージェントとAIエージェントが、進化する戦場条件に共同で適応するときに、継続的に双方向に洞察を交換するものである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:01:01 GMT)
Higher-arity PAC learning, VC dimension and packing lemma [0.0] 以下は、Towsner'20(arXiv:2010.00726)のチェルニコフにおける研究の概観である。
また、arXiv:2402.14294, arXiv:2505.15688, arXiv:2509.20404の最近の結果のいくつかは、arXiv:2010.00726における我々の研究から得られたものである。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:54:50 GMT)
High Cycle S-N curve prediction for Al 7075-T6 alloy using Recurrent Neural Networks (RNNs) [0.0] このフレームワークはAlのねじりS-N曲線をはるかに高いサイクル範囲で正確に予測することができた。
この枠組みは、異なる材料の疲労特性を収集するコストを大幅に軽減するものであると信じられている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 23:04:00 GMT)
Heterogeneous Graph Representation of Stiffened Panels with Non-Uniform Boundary Conditions and Loads [0.0] サーロゲートモデルは構造解析と最適化に不可欠である。
本稿では, 幾何的変動性, 非一様境界条件, 多様な載荷シナリオを考慮した高強度パネルの不均一グラフ表現を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:24:16 GMT)
Hamiltonian simulation-based quantum-selected configuration interaction for large-scale electronic structure calculations with a quantum computer [0.0] Hamiltonian Simulation-based QSCI (HSB-QSCI) は、現在の量子コンピュータを用いた量子化学計算のアプローチである。
我々は, オリゴアセン (ベンゼン, ナフタレン, アントラセン) , フェニレン-1, 4-ジニトリエン, ヘキサ-1,2,3,4,5-ペンタエン) の最低スピンシンクレットおよび三重項状態の数値シミュレーションを行った。
HSB-QSCIは、36量子ビット系におけるスレーター行列式の約1%を考慮し、活性空間における相関エネルギーの99.18%以上を捕捉する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:45:18 GMT)
Gradient Shaping Beyond Clipping: A Functional Perspective on Update Magnitude Control [0.0] SPAMP(Statistical Per-layer Adaptive Modulation and Projection)は、スムーズな層ごとの勾配形状にクリッピングを一般化する統一フレームワークである。
SPAMPは局所的な勾配統計を追跡し、しきい値を動的に推定し、電力ベースの変換を適用して、異なる方法で更新の規模を変調する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:54:49 GMT)
GFSR-Net: Guided Focus via Segment-Wise Relevance Network for Interpretable Deep Learning in Medical Imaging [0.0] 医用画像の解釈性や信頼性を向上させるために,GFSR-Netによるガイドフォーカスを導入する。
GFSR-Netは、正確な境界や徹底的なマーキングを必要とせず、画像内の焦点を直感的に近似するために、少数の人間のアノテーションを使用する。
実験により、GFSRは人間の期待をよりよく反映したサリエンシマップを作成しながら、同等または優れた精度を達成することが示された。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:35:47 GMT)
Fractional signature: a generalisation of the signature inspired by fractional calculus [0.0] 本稿では,分数計算を動機とした経路のシグネチャの新たな一般化を提案する。
また、このシグネチャの別の一般化も提案し、前者から着想を得たが、機械学習での使用にはより便利である。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 20:41:52 GMT)
Folding lattice proteins confined on minimal grids using a quantum-inspired encoding [0.0] ステリック衝突は、高密度タンパク質系を探索する際の課題となる。
最小限のエネルギーを見つけることは、難しい最適化問題である。
チェーン長48に対して,QUBO形式のこの問題を迅速かつ一貫した解決が可能であることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:58:31 GMT)
Fast surrogate modelling of EIT in atomic quantum systems using LSTM neural networks [0.0] 我々は,光量子シミュレーションの出力を高精度に再現し,計算コストを大幅に削減できるLong Short-Term Memory Neural Networkを開発した。
我々は,この手法をドップラーブロード化電磁誘導透明性に適用し,ライドバーグ型センシングのためのはしご型スキームに適用することに集中する。
この代表的光量子システムにおけるLSTMモデルの有効性を実証し、リアルタイム信号処理とフィードバックに基づく最適化をサポートするサロゲートツールとして確立する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 22:30:40 GMT)
FRIEREN: Federated Learning with Vision-Language Regularization for Segmentation [0.0] Federeated Learning (FL)は、セマンティック(SS)タスクのためのプライバシ保護ソリューションで、新しいドメインに適応する。
既存のFLメソッドの多くは、リモートクライアント上のラベル付きデータへのアクセスを前提とするか、あるいは最新のVision Foundation Models(VFM)のパワーを活用できないと仮定している。
本稿では,サーバのラベル付きソースデータセット上でモデルを事前訓練し,未ラベルデータのみを用いてクライアント間でトレーニングする,新規で困難なタスクであるFFREEDGを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:21:49 GMT)
Extracting the photon indistinguishability error from measurable quantum observables [0.0] 香港・奥羽・マンデル干渉測定から光子不一致誤差を抽出する手法を提案する。
報告された方法は、量子ドットを含む幅広い単一光子源に適用される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:15:43 GMT)
Exploring Large Language Models for Financial Applications: Techniques, Performance, and Challenges with FinMA [0.0] PIXIUフレームワークで作成されたモデルであるFinMAは、専門的な財務業務におけるパフォーマンスを評価する。
調査の結果,FinMAは感情分析や分類に優れていたが,数値推論,実体認識,要約といったタスクにおいて顕著な課題に直面していることがわかった。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:19:59 GMT)
Entanglement entropy scaling laws from fluctuations of non-conserved quantities [0.0] エンタングルメントエントロピーのスケーラブルな実験的プローブとして,オンサイト演算子の和からなる観測変数のゆらぎを低減した。
具体的には、スピン鎖における密度行列再正規化群計算により、縮小されたゆらぎは絡みエントロピーと同じ大きさのスケーリング特性を示すことを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:08:17 GMT)
Ensemble Threshold Calibration for Stable Sensitivity Control [0.0] 本稿では,数千万組の幾何対もの幾何に対して,過度に分散した正確なリコールを実現するエンド・ツー・エンドのフレームワークを提案する。
我々のアプローチは、小さなエラーで常にリコールターゲットにヒットし、他のキャリブレーションと比較して冗長な検証を減らし、単一のTPU v3コア上でエンドツーエンドで実行します。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:22:28 GMT)
Enhanced Arabic-language cyberbullying detection: deep embedding and transformer (BERT) approaches [0.0] アラビア語のサイバーいじめを検出する方法は少ない。
本稿では,アラビア語コンテンツにおけるサイバーいじめの検出方法の有効性を高めることを目的とする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:20:02 GMT)
Emergent Hierarchy in Localized States of Organic Quantum Chains [0.0] 有機量子鎖 (OQCs) は、新たに合成された炭素系ナノ構造である。
最近合成されたOQCの電子的および輸送特性について検討した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 17:19:31 GMT)
Emergence and localization of exceptional points in an exactly solvable toy model [0.0] シュレーディンガー方程式は離散的に必要であり、PT対称ロビン境界条件で与えられる。
また、他の単純化された1パラメトリックモデル群におけるマルチバンドスペクトル構造の存在が期待できないことも明らかにした。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:43:19 GMT)
Efficient Training of Robust Traditional Chinese LLaMA-1B on a Single Consumer GPU: Continual Pre-training, SFT, and DPO [0.0] 小型言語モデル(SLM)は、コスト効率、オンデバイス、レイテンシに敏感なAIアプリケーションを実現する。
しかし、従来の中国(TC)への展開は、トークンレベルの不安定さによって妨げられている。
Llama-3.2-1B-Instructの3段階安定化パイプラインであるPureTC-1Bを作成した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:50:12 GMT)
Effective eigenvalue approximation from moments for self-adjoint trace-class operators [0.0] 自己随伴のトレースクラス演算子 $O$ に対して、集合 $Lambda_nsubset mathbbR$ を定義する。
弱条件下ではハウスドルフ計量の$O$のスペクトルに収束することを示す。
結果は、量子情報、統計力学、量子熱力学などの問題に直接適用することができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:33:51 GMT)
Directionality and quantum backfire in continuous-time quantum walks from delocalized states: Exact results [0.0] 我々は、チューナブルな非局在化を持つ新しい初期状態のクラスから、連続時間量子ウォークの解析結果を得る。
キーオブザーバブルに対して閉形式方程式を提供し、3つの顕著な発見を明らかにした。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 02:05:07 GMT)
Digital quantum simulation of many-body localization crossover in a disordered kicked Ising model [0.0] 乱れたフロッケ多体系における非平衡問題として多体局所化クロスオーバーをシミュレーションする。
我々は、多体ローカライゼーションクロスオーバーの指標として、時間外順序付き相関器を計算した。
2つの独立誤差緩和法を比較することにより, 結果の有効性を確認した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:57:19 GMT)
Diagrammatic Reasoning with Control as a Constructor, Applications to Quantum Circuits [0.0] コンストラクタとして制御を特徴とする図式推論のための一般的なフレームワークを提案する。
制御されたプロップは、単純な関係の完全な集合を許容することにより、量子回路の図式推論を容易にする。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:51:55 GMT)
Design and Characterization of a Cryogenic Vacuum Chamber for Ion Trapping Experiments [0.0] 振動から機械的分離を取り入れた極低温真空室の設計と特性について述べる。
4K付近のコールドシールドは、熱絶縁支持体を介して基盤となる光学テーブルに機械的に参照される。
真空中での目的により、40mathrmCa+$イオンから1.77%の効率で397nmの光子を検出でき、50mu$sで99.9963(4)%の単発状態検出フィディティを達成できる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 01:01:43 GMT)
Design and Application of Multimodal Large Language Model Based System for End to End Automation of Accident Dataset Generation [0.0] バングラデシュのような発展途上国では、道路交通事故が公共の安全と社会経済的問題となっている。
既存の事故データ収集は大半が手動であり、断片化され、信頼性が低いため、記録が不十分で一貫性がない。
本研究では,これらの課題に対処するために,Large Language Models (LLM) とWebスクレイピング技術を用いた完全自動化システムを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:50:05 GMT)
Defining a Strategic Action Plan for AI in Higher Education [0.0] 高等教育機関におけるAIに関する主要な課題に関連する5つの重要な側面からなる枠組みを提案する。
我々はこれらの行動を高等教育の主なステークホルダーにマップし、展開計画を提案する。
機関レベルおよび個別コースレベルでのAI固有のアクションの例も提供され、議論されている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:45:26 GMT)
Deep Hedging Under Non-Convexity: Limitations and a Case for AlphaZero [0.0] この論文は不完全市場における複製ポートフォリオを構築している。
ゲームにおけるモンテカルロ木探索の成功に触発されて,AlphaZeroベースのシステムを導入する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:28:59 GMT)
DAG DECORation: Continuous Optimization for Structure Learning under Hidden Confounding [0.0] 本研究では, 線形ガウスSEMの構造学習について検討した。
我々は,DAGと相関雑音モデルとを共同で学習する単一の可能性に基づく推定器であるtextscDECORを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:23:30 GMT)
Cross-Platform DNA Methylation Classifier for the Eight Molecular Subtypes of Group 3 & 4 Medulloblastoma [0.0] 髄芽腫は悪性脳腫瘍である。
2019年、コンセンサスはグループ3と4の8つの新しいサブタイプを特定した。
本研究では,これらのサブタイプを識別可能な,DNAベースのクロスプラットフォーム機械学習モデルを提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:53:38 GMT)
Cross-Breed Pig Identification Using Auricular Vein Pattern Recognition: A Machine Learning Approach for Small-Scale Farming Applications [0.0] 耳介静脈パターンの特異性を利用した非侵襲的生体認証手法を提案する。
静脈の可視性を高め、構造的特徴と空間的特徴を抽出し、生体的シグネチャを生成するコンピュータビジョンパイプラインが開発された。
サポートベクターマシン(SVM)は、雑種集団で98.12%の精度で豚を正確に識別する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:45:43 GMT)
Critical Quantum Sensing: a tutorial on parameter estimation near quantum phase transitions [0.0] このチュートリアルでは、鍵となる概念の教育的な紹介と、卓越した量子センシング戦略の詳細な概要を提供する。
基本資源に対する推定精度の最適スケーリングに特に重点を置いている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:08:11 GMT)
Convergence analysis of online algorithms for vector-valued kernel regression [0.0] 回帰関数 $f_mu:, Omega to Y$ from noisy $mu$-distributed vector-valued data。
標準正規化オンライン近似アルゴリズムにより得られた近似値$f(m) in H$のRKHSノルムの2乗誤差を推定する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:40:23 GMT)
Constructions and decoding procedures for quantum CSS codes [0.0] 本稿では,Calderbank-Shor-Steane(CSS)符号を補正する量子誤りの新しい構成について述べる。
これらの符号は主にスローンの古典的な線形符号の組み合わせによって得られ、自己直交線形符号の場合に適用される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:58:59 GMT)
Computational access to lattice and long-wavelength physics in quantum mutual information [0.0] 我々は、共形場の理論記述を持つモデルの基底状態に対する$alpha$-$z$ R'enyi相互情報の族に対する格子効果の関連性を分析する。
我々の結果は、オープンソースの Julia パッケージ QMICalc.jl とともに、量子マンボディー物理学計算において RMI を使用するためのガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:21:13 GMT)
Comparison of Unsupervised Metrics for Evaluating Judicial Decision Extraction [0.0] この研究は、ロシアの1000の司法判断から7つの意味的ブロックを抽出する品質を評価するために、新しい定式化を含む16の教師なしメトリクスを評価した。
これらの指標は、文書ベース、セマンティック、構造的、疑似地下の真理、および法律固有のカテゴリーにまたがって、事前に注釈付けされた基礎の真理なしで機能する。
この研究は、司法分析と倫理的AIデプロイメントに影響を及ぼす、アノテーションのない評価ツールを提供することで、法的NLPを前進させる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:32:16 GMT)
Comparison of Machine Learning Models to Classify Documents on Digital Development [0.0] 本研究は,12分野に分類される世界規模のデジタル開発介入に関する文書データベースを公開している。
この研究は、データ量がパフォーマンスに影響を与える唯一の要因ではないと結論付け、クラス間の類似性やクラス間の相違性といった特徴も重要であると結論付けている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 04:59:26 GMT)
Comment on Marek Czachor article entitled "On Relativity of Quantumness as Implied by Relativity of Arithmetic and Probability" [0.0] Czachorの階層的算術のモデルは、有効な形式的前提から始まる。
これは、ボルン則とフビニ・スタディ計量を標準量子力学からインポートすることで、鍵確率写像 g を修正する。
この g は非ニュートンの隠れ変数設定に適用され、ハイブリッドフレームワークを生成する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:52:48 GMT)
Characterizing Superconducting Qubits using Averaged Circuit Eigenvalue Sampling [0.0] ACESプロトコルは、2つの結合した超伝導量子ビットの特徴付けに用いられる。
従来のベンチマーク手法から抽出したゲート特性と予測ゲート特性を比較し,プロトコルの精度を検証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:03:38 GMT)
Chaotic many-body quantum dynamics, spectral correlations, and energy diffusion [0.0] 空間構造と局所相互作用を持つ最小モデルを用いてカオス多体量子力学を考察する。
エネルギー力学は古典的マスター方程式によって記述され、拡散可能であることを示す。
本稿では、スピン半鎖の数値的研究を行い、スペクトル形成因子の早期増強を見出した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:45:51 GMT)
CAT: Curvature-Adaptive Transformers for Geometry-Aware Learning [0.0] Curvature-Adaptive Transformer (CAT) は、軽量で微分可能なゲーティング機構を通じて、3つの幾何学的注意枝にまたがるトーケン毎のルーティングを学習する。
知識グラフ補完ベンチマークでは、CATは最小限のオーバーヘッドで固定幾何ベースラインに対して、MRRとHits@10の約10%の改善を実現している。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 03:26:33 GMT)
BiasLab: Toward Explainable Political Bias Detection with Dual-Axis Annotations and Rationale Indicators [0.0] BiasLabは、イデオロギー的偏見を意識した300の政治ニュース記事のデータセットである。
各記事は2つの独立したスケールでクラウドワーカーによってラベル付けされ、民主党と共和党に対する感情を評価している。
我々は、アノテータ間の合意を定量化し、ソースレベルの出口バイアスによる誤調整を分析し、その結果のラベルを解釈可能なサブセットに整理する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 08:42:04 GMT)
Background Suppression in Quantum Sensing of Dark Matter via $W$ State Projection [0.0] 量子センサを集合励起状態に投射することで暗黒物質信号を測定することで、非衝突雑音の背景を高度に抑制できることを示す。
我々は、ダークマター効果とセンサのデコヒーレンス効果の両方の存在下で、センサーの状態の進化を辿った。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:01:09 GMT)
Automatic Generation of Combinatorial Reoptimisation Problem Specifications: A Vision [0.0] 我々は、モデル駆動工学(MDE)が再最適化問題の体系的な導出に新たな機会をもたらすと論じる。
我々は、再最適化問題に焦点をあて、変更問題の初期分類と、対応する再最適化仕様を導出するための戦略を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:23:52 GMT)
Automated Defect Detection for Mass-Produced Electronic Components Based on YOLO Object Detection Models [0.0] 本稿では,業界で広く利用されているデュアルインラインパッケージ(DIP)の自動欠陥検出システムを提案する。
ConSinGANで提案されたYOLOv7は、95.50%の精度で他のYOLOバージョンよりも優れ、285msの検出時間は閾値に基づくアプローチよりもはるかに優れている。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 11:33:16 GMT)
Assessing the impact of contact time on leachate chemistry from recycled concrete aggregates [0.0] 再生コンクリート骨材(RCA)は機械的に十分な建設・解体廃棄物として認識されている。
浸出水pH, アルカリ性およびカルシウムイオン(Ca2+)濃度を24時間測定し, RCA浸出水化学を解明した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 15:09:01 GMT)
Adaptive randomized pivoting and volume sampling [0.0] 本稿では、線形回帰のためのボリュームサンプリング分布とアクティブ学習アルゴリズムとの接続を描画することにより、適応ランダム化ピボット(ARP)アルゴリズムを再解釈する。
そこで本研究では, ARP アルゴリズムの新たな解析法とリジェクションサンプリングを用いた高速な実装を提案する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:37:43 GMT)
Adaptive Heterogeneous Mixtures of Normalising Flows for Robust Variational Inference [0.0] 適応混合流変分推論(AMF-VI)を提案する。
AMF-VIは、(i)個別フローの逐次的専門訓練、(ii)確率駆動更新による適応的グローバルウェイト推定の2段階で訓練される。
アラバマ,X-シェープ,2-ムーン,リング,バイモーダル,5-ムドの6種類の標準後縁系についてAMF-VIを評価した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 14:25:29 GMT)
Adaptive Guided Upsampling for Low-light Image Enhancement [0.0] 低照度画像を効率よくアップスケールするAdaptive Guided Upsampling (AGU)を導入する。
AGUは低画質の低解像度入力を使用して、高品質な画像をリアルタイムでレンダリングすることができる。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 19:05:29 GMT)
Adaptive Deception Framework with Behavioral Analysis for Enhanced Cybersecurity Defense [0.0] 本稿では,CICIDS 2017データセット上で99.88%の検出率と0.13%の偽陽性率を達成する適応型偽装フレームワークであるCADLを提案する。
このフレームワークは、アンサンブル機械学習(Random Forest、XGBoost、Neural Networks)と行動プロファイリングを組み合わせて、ネットワーク侵入に対する応答を特定し、適応する。
当社はオープンソース実装と透過的なパフォーマンス指標を提供し、年間150~400ドルの商用偽装プラットフォームに代わる、アクセス可能な代替手段を提供しています。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:52:05 GMT)
Adaptive Cybersecurity Architecture for Digital Product Ecosystems Using Agentic AI [0.0] 本研究では,動的学習と文脈認識型意思決定が可能な自律目標駆動エージェントを提案する。
行動ベースライン、分散リスクスコア、フェデレーションされた脅威情報共有は重要な特徴である。
このアーキテクチャは、複雑なデジタルインフラストラクチャを保護するインテリジェントでスケーラブルな青写真を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 00:45:37 GMT)
Active Alignments of Lens Systems with Reinforcement Learning [0.0] センサ出力の画素空間内でのみ学習する強化学習(RL)手法を提案する。
我々は、広範囲にわたるベンチマーク研究を行い、我々のアプローチが、速度、精度、堅牢性において他の手法を超えることを示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 18:37:28 GMT)
ActiNet: Activity intensity classification of wrist-worn accelerometers using self-supervised deep learning [0.0] 本研究では、151人のCAPTURE-24参加者のデータを用いて,アクティネットモデル,18層モデル,ResNet-V2モデル,および隠れマルコフモデル(HMM)を訓練し,活動強度のラベルを分類した。
ActiNetモデルは、平均マクロF1スコアが0.82で、コーエンのカッパスコアが0.86で、活動強度のラベルを識別することができた。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 06:49:21 GMT)
AI-Powered Inverse Design of Ku-Band SIW Resonant Structures by Iterative Residual Correction Network [0.0] マルチモードSIWフィルタの逆設計のために,ディープラーニングに基づくフレームワークを開発し,検証した。
一連のSIWフィルタが設計され、製造され、実験的に評価された。
提案フレームワークは、複雑なマイクロ波フィルタの堅牢で、正確で、一般化可能な逆設計を可能にする能力を示す。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 12:57:22 GMT)
A quantum analogue of convex optimization [0.0] 制約のない凸最適化の量子アナログを導入する。
我々は、凸ポテンシャルを持つシュリンガー作用素 $h = -Delta + V の最小固有値を計算する。
我々は低エネルギー空間に集中できる新しい技術を用いて分析する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 16:03:14 GMT)
A cybersecurity AI agent selection and decision support framework [0.0] 本稿では,AIエージェントアーキテクチャ,リアクティブ,認知,ハイブリッド,学習を協調する,新しい構造化された意思決定支援フレームワークを提案する。
エージェント理論と産業ガイドラインを統合することで、このフレームワークは、AIソリューションの選択とデプロイのための透過的で段階的な方法論を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 07:38:21 GMT)
A correspondence between quantum error correcting codes and quantum reference frames [0.0] ゲージ理論では、ゲージ不変量の少ない情報を冗長に記述するために、運動学的な自由度の集まりが用いられる。
量子システムにおける対称性を扱うための普遍的ツールキットである量子参照フレーム(QRF)の観点で、この並列性について詳しく述べる。
誤差生成QRF自由度から最大修正可能誤差集合とテンソル分解分解系を1対1で対応させることが示される。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 09:09:57 GMT)
A Novel Approach for Estimating Largest Lyapunov Exponents in One-Dimensional Chaotic Time Series Using Machine Learning [0.0] 機械学習を用いて1次元カオス時系列から最大のリアプノフ指数(LLE)を推定するためのデータ駆動手法を提案する。
予測器はサンプル外マルチ水平予測を生成するように訓練され、LLEは地平線を横切る幾何平均予測誤差(GMAE)の指数的成長から推定される。
我々は,4つの標準1次元地図-ロジスティック,正弦,立方体,チェビシェフが達成するR2pos > 0.99のアプローチを,M = 450と短い列の基準LLE曲線に対して検証した。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:16:24 GMT)
A Modular Theory of Subjective Consciousness for Natural and Artificial Minds [0.0] モジュール意識理論(Modular Consciousness Theory、MCT)は、意識が統合情報状態の離散的なシーケンスである生物学的基盤と計算的明示的な枠組みを提案する。
MCTは、ストレス増強メモリエンコーディングなどのテスト可能な予測を生成し、生物学的アーキテクチャと人工アーキテクチャの両方に自然な青写真を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 10:11:56 GMT)
A Digital Pheromone-Based Approach for In/Out-of-Control Classification [0.0] 本研究では,InC/OutC状態の分類にアリコロニーの挙動をデジタル的に模倣するバイオインスパイアされた手法について検討した。
工業用ジャガイモチップフライのケーススタディは、応用状況を提供する。
論文参考訳(メタデータ) (Thu, 02 Oct 2025 13:52:24 GMT)