Never Compromise to Vulnerabilities: A Comprehensive Survey on AI Governance [211.6] 本研究は,本質的セキュリティ,デリバティブ・セキュリティ,社会倫理の3つの柱を中心に構築された,技術的・社会的次元を統合した包括的枠組みを提案する。
我々は,(1)防衛が進化する脅威に対して失敗する一般化ギャップ,(2)現実世界のリスクを無視する不適切な評価プロトコル,(3)矛盾する監視につながる断片的な規制,の3つの課題を特定する。
私たちのフレームワークは、研究者、エンジニア、政策立案者に対して、堅牢でセキュアなだけでなく、倫理的に整合性があり、公的な信頼に値するAIシステムを開発するための実用的なガイダンスを提供します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:24:57 GMT)
GLM-4.1V-Thinking and GLM-4.5V: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning [117.4] 視覚言語モデル(VLM)のファミリーであるGLM-4.1VシンキングとGLM-4.5Vを提案する。
GLM-4.5Vは、ほぼ全てのタスクにおいて、同じ大きさのオープンソースモデル間で最先端のパフォーマンスを達成する。
より小型のGLM-4.1V-9Bシンキングは29のベンチマークでより大型のQwen2.5-VL-72Bよりも競争力に優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:10:17 GMT)
SpaCE-10: A Comprehensive Benchmark for Multimodal Large Language Models in Compositional Spatial Intelligence [91.3] 合成空間評価のベンチマークである SpaCE-10 について述べる。
SpaCE-10では、10個の原子空間能力を定義し、8つの合成能力を形成する。
SpaCE-10の共通MLLMの広範な評価を行い、最も先進的なMLLMでさえ、大きなマージンで人間より遅れていることを発見した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:19:27 GMT)
Edge General Intelligence Through World Models and Agentic AI: Fundamentals, Solutions, and Challenges [87.0] エッジ・ジェネラル・インテリジェンス(エッジ・ジェネラル・インテリジェンス、Edge General Intelligence、EGI)は、分散エージェントが自律的に知覚、理性、行動する能力を持つエッジ・コンピューティングの変革的進化を表す。
世界モデルは、将来の軌跡を予測するだけでなく、積極的に想像するプロアクティブな内部シミュレーターとして機能し、不確実性の理由を定め、予見で多段階のアクションを計画する。
この調査は、世界モデルがどのようにエージェント人工知能(AI)システムをエッジで強化できるかを包括的に分析することで、ギャップを埋める。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:29:40 GMT)
Goal Discovery with Causal Capacity for Efficient Reinforcement Learning [85.3] 因果推論は人間が世界を探検するのに不可欠である。
本稿では,効率的な環境探索のための新たなゴールディスカバリーと因果容量フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:54:56 GMT)
MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.8] 本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:14:48 GMT)
VisCodex: Unified Multimodal Code Generation via Merging Vision and Coding Models [82.1] マルチモーダルな大言語モデル(MLLM)は、視覚的およびテキスト的理解の統合を著しく進歩させてきた。
しかし、マルチモーダル入力からコードを生成する能力は依然として限られている。
視覚とコーディング言語モデルをシームレスにマージする統合フレームワークであるVisCodexを紹介します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:00:44 GMT)
Improving Diversity in Language Models: When Temperature Fails, Change the Loss [81.7] そこで我々は,Precision-Recallフレームワークを利用した言語モデルにおける損失関数の再考を提案する。
以上の結果から,本手法は温度スケーリングと負のログライクなトレーニングを単に組み合わせることよりも,精度とリコールのトレードオフを著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:37:53 GMT)
Teaching Large Language Models to Maintain Contextual Faithfulness via Synthetic Tasks and Reinforcement Learning [80.3] CANOEは、人間のアノテーションを使わずに、下流のさまざまなタスクにまたがる大きな言語モデルの忠実性の幻覚を減らすためのフレームワークである。
Dual-GRPOはルールベースの強化学習手法であり、合成された短値QAデータから得られる3つのルールベースの報酬を含む。
実験の結果、CANOEは11のタスクにまたがるLLMの忠実さを大幅に改善し、最も進歩したLLMよりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:06:42 GMT)
RoHOI: Robustness Benchmark for Human-Object Interaction Detection [78.2] ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:49:26 GMT)
Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models [78.0] Video SimpleQAは、ビデオコンテキストにおける事実性評価に適した最初の包括的なベンチマークである。
我々の研究は、既存のビデオベンチマークとは以下の重要な特徴によって異なる: 知識: ビデオの明示的な物語を超えた外部知識の統合を要求する。
短い形式の決定的な答え: 回答は、最小のスコアリング分散を持つ短いフォーマットで、曖昧で決定的に正しいものとして作成されます。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:44:18 GMT)
CTRQNets & LQNets: Continuous Time Recurrent and Liquid Quantum Neural Networks [76.5] Liquid Quantum Neural Network (LQNet) とContinuous Time Recurrent Quantum Neural Network (CTRQNet) を開発した。
LQNetとCTRQNetは、バイナリ分類によってCIFAR 10で40%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:59:28 GMT)
OneVAE: Joint Discrete and Continuous Optimization Helps Discrete Video VAE Train Better [75.2] FSQは、他の量子化法と比較して、実効的に事前学習された連続VAE前処理を行えることを示す。
トークン圧縮比を損なうことなくPSNR次元を約1倍改善するマルチトークン量子化機構を提案する。
本稿では,この2つのパラダイムを統一した離散連続最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:49:54 GMT)
mSCoRe: a $M$ultilingual and Scalable Benchmark for $S$kill-based $Co$mmonsense $Re$asoning [75.0] textbfSkill ベースの textbfCommonsense textbfReasoning (textbfmSCoRe) のための textbfMultilingual と Scalable Benchmark を提案する。
本ベンチマークでは,LLMの推論能力を体系的に評価するための3つの重要な要素を取り入れた。
本研究は,多言語多言語一般と文化的共通点に直面する場合,そのような推論強化モデルの限界を明らかにするものである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:59:02 GMT)
HRSeg: High-Resolution Visual Perception and Enhancement for Reasoning Segmentation [74.2] HRSegは高精細な知覚を持つ効率的なモデルである。
高分解能知覚(HRP)と高分解能増強(HRE)の2つの重要な革新を特徴としている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:27:53 GMT)
Efficient Inference for Large Reasoning Models: A Survey [74.2] LRM(Large Reasoning Models)は、Large Language Models(LLM)の推論能力を大幅に向上させる。
しかし、それらの熟考的推論プロセスはトークンの使用、メモリ消費、推論時間に非効率をもたらす。
本調査では, LRMに特化して設計された効率的な推論手法を概説し, 推論品質を維持しつつトークンの非効率を緩和することに着目した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:48:46 GMT)
DAgger Diffusion Navigation: DAgger Boosted Diffusion Policy for Vision-Language Navigation [73.8] Vision-Language Navigation in Continuous Environments (VLN-CE) は、エージェントが自由形式の3D空間を通して自然言語の指示に従う必要がある。
既存のVLN-CEアプローチは通常、2段階のウェイポイント計画フレームワークを使用する。
本稿では,エンドツーエンド最適化VLN-CEポリシとしてDAgger Diffusion Navigation (DifNav)を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:51:43 GMT)
From Large Angles to Consistent Faces: Identity-Preserving Video Generation via Mixture of Facial Experts [69.4] 顔の特徴の異なるが相互に強化された側面を捉えた顔専門家の混合(MoFE)を導入する。
データセットの制限を軽減するため、私たちは、Face ConstraintsとIdentity Consistencyという2つの重要な側面を中心としたデータ処理パイプラインを調整しました。
我々は、既存のオープンソースヒューマンビデオデータセットからLFA(Large Face Angles)データセットをキュレートし、洗練しました。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:10:16 GMT)
Physical Autoregressive Model for Robotic Manipulation without Action Pretraining [62.0] 我々は、自己回帰ビデオ生成モデルを構築し、物理自己回帰モデル(PAR)を提案する。
PARは、アクション事前トレーニングを必要とせず、物理力学を理解するために、ビデオ事前トレーニングに埋め込まれた世界の知識を活用する。
ManiSkillベンチマークの実験は、PARがPushCubeタスクで100%の成功率を達成したことを示している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:54:51 GMT)
Integrating Visual Interpretation and Linguistic Reasoning for Math Problem Solving [62.0] 現在の大型視覚言語モデル(LVLM)は、通常、大型言語モデル(LLM)のテキスト埋め込みと視覚的特徴をリンクするためのコネクタモジュールを使用する。
本稿では,エンド・ツー・エンドの視覚言語推論モデルをトレーニングする代わりに,分離された推論フレームワークの開発を提唱する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:45:38 GMT)
MVICAD2: Multi-View Independent Component Analysis with Delays and Dilations [61.6] 本稿では,時間的遅延と拡張の両面において,被験者間でソースを異にするMVICAD(Multi-View Independent Component Analysis with Delays and Dilations)を提案する。
本稿では, 正則化と最適化手法を用いて, 性能向上を図るため, 正則化と最適化手法を用いて, その可能性の近似を導出する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:44:17 GMT)
The Importance of Being Lazy: Scaling Limits of Continual Learning [61.0] モデル幅の増大は,特徴学習の量を減らし,遅延度を高めた場合にのみ有益であることを示す。
特徴学習,タスク非定常性,および忘れることの複雑な関係について検討し,高い特徴学習が極めて類似したタスクにのみ有用であることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:37:01 GMT)
Multi-Target Backdoor Attacks Against Speaker Recognition [60.8] 位置に依存しないクリック音を用いた話者識別に対するマルチターゲットバックドア攻撃を提案する。
提案手法は最大50人の話者を同時に対象とし,95.04%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:03:52 GMT)
HumanGenesis: Agent-Based Geometric and Generative Modeling for Synthetic Human Dynamics [60.7] 4つの協調エージェントを通して幾何学的および生成的モデリングを統合するフレームワークである textbfHumanGenesis を提示する。
HumanGenesisは、テキスト誘導合成、ビデオ再現、新規目的一般化といったタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:50:19 GMT)
CAPTURe: Evaluating Spatial Reasoning in Vision Language Models via Occluded Object Counting [59.8] Amodally for Patterns Through Unseen Regions (CAPTURe)は、視覚言語モデルを評価するためのテストベッドである。
CAPTUReでは、4つの強力な視覚言語モデルを評価し、隠蔽パターンと隠蔽パターンの両方でモデルがカウントできないことを発見した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:39:29 GMT)
HERMES: A Unified Self-Driving World Model for Simultaneous 3D Scene Understanding and Generation [59.7] 我々はHERMESという統合運転世界モデルを提案する。
シナリオを駆動する統合フレームワークを通じて、3Dシーン理解と将来のシーン進化(世代)をシームレスに統合する。
HERMESは最先端のパフォーマンスを実現し、生成エラーを32.4%削減し、CIDErなどの理解基準を8.0%改善した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:10:30 GMT)
Prompt-aligned Gradient for Prompt Tuning [59.0] 本稿では,視覚言語モデル(VLM)から学んだ一般的な知識を,即時チューニングが忘れないようにするために,ProGradと呼ばれるPrompt対応のグラディエントを提案する。
ProGradは、勾配が「一般的な方向」に一致しているプロンプトのみを更新し、事前に定義されたプロンプト予測のKL損失の勾配として表される。
実験では、最先端のプロンプトチューニング手法に対して、ProGradのより強力な数ショットの一般化能力を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:38:43 GMT)
Beyond Naïve Prompting: Strategies for Improved Zero-shot Context-aided Forecasting with LLMs [57.8] 大規模言語モデル (LLM) は、na "ive direct prompting" を通じて効果的な文脈支援予測を行うことができる。
ReDPは、明確な推論トレースを抽出することで、解釈可能性を改善し、コンテキスト上でモデルの推論を評価することができる。
CorDPはLLMを活用して、既存の予測をコンテキストで洗練し、現実の予測パイプラインにおける適用性を高める。
IC-DPは、文脈支援予測タスクの歴史的例を即時に組み込むことを提案し、大規模モデルにおいても精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:02:55 GMT)
Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models [57.5] テストタイムスケーリングの新しいパラダイムは、推論モデルと生成視覚モデルにおいて驚くべきブレークスルーをもたらした。
本稿では,テスト時間スケーリングの知識をモデルに組み込むことの課題に対する1つの解決策を提案する。
拡散モデルにおいて、初期入力ノイズを変調するノイズハイパーネットワークにより、報酬誘導試験時間雑音の最適化を行う。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:33:37 GMT)
Analyzing Finetuning Representation Shift for Multimodal LLMs Steering [56.7] 隠れた状態を解釈可能な視覚的概念とテキスト的概念にマッピングすることを提案する。
これにより、オリジナルモデルや微調整モデルからのシフトなど、特定のセマンティックダイナミクスをより効率的に比較することが可能になります。
また,これらの変化を捉えるためにシフトベクトルを用いることを実証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:42:57 GMT)
Debiased Fine-Tuning for Vision-language Models by Prompt Regularization [56.5] 本稿では,Prompt Regularization(ProReg)と呼ばれる下流タスクにおける大規模視覚事前訓練モデルの微調整のための新しいパラダイムを提案する。
ProRegは、事前訓練されたモデルに微調整を正規化するよう促すことで予測を使用する。
本稿では,従来の微調整,ゼロショットプロンプト,プロンプトチューニング,その他の最先端手法と比較して,ProRegの性能が一貫して高いことを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:10:15 GMT)
A Comprehensive Survey of Datasets for Clinical Mental Health AI Systems [55.7] 本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:42:35 GMT)
From Promise to Practical Reality: Transforming Diffusion MRI Analysis with Fast Deep Learning Enhancement [55.6] FastFOD-Netは、FODを優れたパフォーマンスで強化し、臨床使用のためのトレーニング/推論効率を提供するエンドツーエンドのディープラーニングフレームワークである。
この研究は、拡散MRIの強化のための深層学習に基づく手法を、より広く採用し、臨床信頼を構築することを促進する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:56:29 GMT)
Provably Transformers Harness Multi-Concept Word Semantics for Efficient In-Context Learning [53.7] トランスフォーマーベースの大規模言語モデル(LLM)は、卓越した創造力と出現能力を示している。
この研究は、トランスフォーマーが単語のマルチコンセプトセマンティクスをどのように活用し、強力なICLと優れたアウト・オブ・ディストリビューションICL能力を実現するかを示すための数学的解析を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:27:26 GMT)
Provable In-Context Vector Arithmetic via Retrieving Task Concepts [53.7] クロスエントロピー損失に対する勾配降下による非線形残差変圧器の訓練は,ベクトル演算による実-リコールICLタスクをいかに行うかを示す。
これらの結果は、静的埋め込み前駆体よりもトランスフォーマーの利点を解明する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:54:44 GMT)
On the Reliability of Vision-Language Models Under Adversarial Frequency-Domain Perturbations [53.6] VLM(Vision-Language Models)は、視覚コンテンツ推論のための知覚モジュールとして使われることが多い。
これらの特徴変換が,画像の自動キャプションタスクの信頼度/ディープフェイク検出にどのような影響を及ぼすかを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:15:41 GMT)
MoIIE: Mixture of Intra- and Inter-Modality Experts for Large Vision Language Models [52.9] 我々は、モダリティ内およびモダリティ間エキスパート(MoIIE)の混合をLVLM(Large Vision-Language Models)に組み込むことを提案する。
それぞれのトークンに対して、専門家のルーティングはそのモダリティによってガイドされ、それぞれのモダリティの専門家と、モダリティ間のエキスパートの共有プールにトークンを指示する。
5.5B と 11.3B の活性化パラメータを持つ MoIIE モデルは,既存のオープンソース MoE-LLM ベースのマルチモーダルモデルの性能に適合するか,さらに上回っている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:00:05 GMT)
Episodic Memory Representation for Long-form Video Understanding [52.3] 大きなビデオ言語モデルは、一般的なビデオ理解において優れているが、長い形式のコンテキストウィンドウの制限に苦労する。
人間の記憶の原理にインスパイアされたトレーニングフリーのフレームワークであるVideo-EMを紹介する。
Video-EMでは、各ベースラインに対して4-9%のパフォーマンス向上を実現し、フレームの削減を実現している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:33:07 GMT)
SHALE: A Scalable Benchmark for Fine-grained Hallucination Evaluation in LVLMs [52.0] LVLM(Large Vision-Language Models)は、まだ幻覚に悩まされており、入力や確立された世界知識と矛盾するコンテンツを生成する。
本稿では,スケーラブルで制御可能で多様な評価データを生成する自動データ構築パイプラインを提案する。
我々は、忠実度と事実性幻覚の両方を評価するために設計されたベンチマークであるSHALEを構築した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:58:01 GMT)
Speed Always Wins: A Survey on Efficient Architectures for Large Language Models [51.8] 大規模言語モデル(LLM)は、言語理解、生成、推論、マルチモーダルモデルの能力境界の押し付けにおいて、素晴らしい結果をもたらしている。
トランスフォーマーモデルは、現代のLLMの基礎として、優れたスケーリング特性を備えた強力なベースラインを提供する。
従来のトランスフォーマーアーキテクチャは、相当な計算を必要とし、大規模なトレーニングと実践的なデプロイメントに重大な障害を生じさせる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:13:46 GMT)
Self-Questioning Language Models [51.8] 本稿では,提案者がトピックを与えられ,解答者に対する質問を生成する非対称なセルフプレイフレームワークを提案する。
提案者と解答者はともに強化学習を通じて訓練される。
3桁の乗算、OMEGAベンチマークの代数問題、Codeforcesのプログラミング問題である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:06:30 GMT)
RelayFormer: A Unified Local-Global Attention Framework for Scalable Image and Video Manipulation Localization [51.6] RelayFormerはビジュアル操作のローカライゼーションのための統一的でモジュール化されたアーキテクチャである。
強力な一般化を伴うスケーラブルで解像度に依存しない処理を可能にする。
我々のフレームワークは、既存のTransformerベースのバックボーンとシームレスに統合します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:35:28 GMT)
BigCharts-R1: Enhanced Chart Reasoning with Visual Reinforcement Finetuning [51.5] 視覚的に多様なチャート画像を生成するデータセット生成パイプラインであるBigChartsを提案する。
純粋な合成データセットとは異なり、BigChartsは現実世界のデータを取り込んで、信頼性と視覚的多様性を保証する。
チャート推論に特化して設計された新たな報酬信号を導入することにより,モデルの堅牢性と一般化が促進される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:39:17 GMT)
ChineseHarm-Bench: A Chinese Harmful Content Detection Benchmark [50.9] 有害なコンテンツ検出のための既存のリソースは、主に英語に重点を置いており、中国のデータセットは乏しく、スコープは限られている。
我々は,6つの代表的なカテゴリを網羅し,実世界のデータから構築した,中国のコンテンツ害検知のための包括的,専門的な注釈付きベンチマークを提案する。
本研究では,人間の注釈付き知識規則と大規模言語モデルからの暗黙的知識を統合した知識強化ベースラインを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:43:45 GMT)
PRELUDE: A Benchmark Designed to Require Global Comprehension and Reasoning over Long Contexts [50.8] 本論文では,文字の前書きが本書の正統的な物語と一致しているかどうかを判断する作業を通じて,長文理解を評価するためのベンチマークであるPreLUDEを紹介する。
私たちのタスクは、既存のベンチマークよりもグローバルな理解と深い推論の需要が強くなります。
実験結果は、文脈学習、RAG、最先端のLLMによるドメイン内トレーニング、商用DeepResearchサービス、人間の遅れによる遅延といったタスクの課題を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:28:25 GMT)
SMA: Who Said That? Auditing Membership Leakage in Semi-Black-box RAG Controlling [50.7] Retrieval-Augmented Generation(RAG)とそのMultimodal Retrieval-Augmented Generation(MRAG)は、大規模言語モデル(LLM)の知識カバレッジと文脈理解を著しく向上させる。
しかし、検索とマルチモーダル融合によるコンテンツの曖昧さは、既存のメンバーシップ推論手法を事前学習、外部検索、ユーザ入力に確実に属性付けできないようにし、プライバシー漏洩の説明責任を損なう。
本稿では,検索制御機能を備えた半ブラックボックス設定において,生成したコンテンツの微粒なソース属性を実現するための,SMA (Source-aware Membership Audit) を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:05:22 GMT)
Learning Spatial Decay for Vision Transformers [50.6] 視覚変換器(ViT)はコンピュータビジョンに革命をもたらしたが、その自己認識機構には明らかに空間誘導バイアスがない。
既存のアプローチでは、固定距離メトリクスに基づくデータ非依存の空間減衰が導入されている。
データ依存型空間減衰の2次元視覚変換器への適応が最初に成功した例を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:18:32 GMT)
Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning [50.5] Follow-Your-Motionは、効率的な2段階ビデオモーション転送フレームワークである。
本稿では,空間的外観と時間的動き処理のための注意構造を分離する空間的時間的疎結合LoRAを提案する。
第2のトレーニング段階では、調整速度を高速化するためにスパース動作サンプリングと適応RoPEを設計する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:07:46 GMT)
Personalized Face Super-Resolution with Identity Decoupling and Fitting [50.5] 極端な劣化シナリオでは、重要な属性とID情報が入力画像で著しく失われることが多い。
既存の方法では、そのような条件下で幻覚顔を生成する傾向があり、真のID制約を欠いた復元画像を生成する。
本稿ではIDデカップリング・フィッティング(IDFSR)を用いた新しいFSR手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:33:11 GMT)
A Survey on Parallel Text Generation: From Parallel Decoding to Diffusion Language Models [50.0] トークン・バイ・トークン生成のボトルネックを破り、推論効率を向上させることを目的とした並列テキスト生成技術。
既存のアプローチをARベースのパラダイムと非ARベースのパラダイムに分類し、各カテゴリの中核技術について詳細に検討する。
我々は、最近の進歩を強調し、オープンな課題を特定し、並列テキスト生成における将来的な研究の方向性を概説する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:24:25 GMT)
EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting [48.6] 感情制御可能な新しいTSモデルであるEmoVoiceを提案する。
EmoVoiceは、大きな言語モデル(LLM)を利用して、きめ細かいフリースタイルの自然言語感情制御を可能にする。
EmoVoiceは、英語のEmoVoice-DBテストセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:23:57 GMT)
Simulating the Real World: A Unified Survey of Multimodal Generative Models [48.4] 実世界のシミュレーションにおいて,データ次元の進行を調査する多モード生成モデルについて統一的な調査を行う。
我々の知る限りでは、これは単一のフレームワーク内で2D、ビデオ、3D、および4D生成の研究を体系的に統一する最初の試みである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:09:13 GMT)
EffiEval: Efficient and Generalizable Model Evaluation via Capability Coverage Maximization [48.3] EffiEvalは、高い評価信頼性を維持しながらデータの冗長性に対処する、効率的なベンチマークのためのトレーニング不要のアプローチである。
提案手法は, 高品質評価において, 代表性, 公平性, 一般化性の3つの重要な基準を満たすように設計されている。
EffiEvalは、元のデータのごく一部しか使用せず、フルデータセット評価と強いランキング整合性を実現する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:48:23 GMT)
Reverse Convolution and Its Applications to Image Restoration [48.0] 畳み込みと転置畳み込みはニューラルネットワークで広く使われている基本演算子である。
本稿では,新しい深度反転畳み込み演算子を提案する。
さらに,レイヤ正規化,1$times$1畳み込み,GELUアクティベーションと組み合わせてリバース畳み込みブロックを構築し,トランスフォーマーのような構造を形成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:56:01 GMT)
SpectralEarth: Training Hyperspectral Foundation Models at Scale [47.9] ハイパースペクトル基礎モデルの事前学習を目的とした大規模マルチテンポラルデータセットであるSpectralEarthを紹介する。
我々はSpectralEarthの一連の基礎モデルを事前訓練し、古典的な視覚バックボーンにスペクトルアダプタを統合する。
タンデムでは、土地被覆、作物型マッピング、樹木種分類のための9つの下流データセットを構築した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:03:14 GMT)
From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.7] CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:30:49 GMT)
MPT: Motion Prompt Tuning for Micro-Expression Recognition [47.6] 本稿では,MERのための事前学習モデルに適用するための新しいアプローチとして,MPT(Motion Prompt Tuning)を提案する。
特に、動きの倍率化やガウストークン化などの動きのプロンプト生成を導入し、微妙な動きをLMのプロンプトとして抽出する。
広範に使われている3つのMERデータセットに対して行われた大規模な実験により、提案したMPTが最先端のアプローチを一貫して超越していることが証明された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:57:43 GMT)
Gradual Transition from Bellman Optimality Operator to Bellman Operator in Online Reinforcement Learning [47.6] 連続行動空間の場合、アクター批判法はオンライン強化学習(RL)において広く用いられている。
本研究では,ベルマン最適度演算子をアクター批判フレームワークに組み込むことの有効性を検討した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:35:41 GMT)
Using Artificial Intuition in Distinct, Minimalist Classification of Scientific Abstracts for Management of Technology Portfolios [47.1] メタデータを生成するための専門家のアプローチを再現するために,人工直観と呼ぶプロセスの応用について述べる。
我々は、米国国立科学財団から公開されている抽象資料を使って、ラベルのセットを作成しています。
研究ポートフォリオ管理,技術スカウト,その他の戦略的活動において,本手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:32:39 GMT)
COMPEER: Controllable Empathetic Reinforcement Reasoning for Emotional Support Conversation [47.0] 本稿では、自然言語推論と構造化された心理的ステップを組み合わせた、制御可能な共感推論を提案する。
我々は、正確なフィードバックを提供する統一されたプロセスアウトカム報酬モデルによる強化学習を採用する。
提案手法は,共感的,人間的支援システムの開発を推し進め,モデルの感情支援能力を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:09:32 GMT)
From Few to More: Scribble-based Medical Image Segmentation via Masked Context Modeling and Continuous Pseudo Labels [46.9] 医用画像分割のための弱教師付きモデルMaCoを提案する。
我々は3つの公開データセット上でMaCoを評価し、他の弱い教師付き手法と比較した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:28:30 GMT)
GTPO: Trajectory-Based Policy Optimization in Large Language Models [45.8] 政策に基づく最適化は、今日の言語モデルのトレーニングとアライメントに広く採用されている。
本稿では,GRPOの2つの大きな限界を明らかにし,解析する。
コンフリクトトークンを識別するGTPOを導入する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:54:18 GMT)
A Taxonomy of System-Level Attacks on Deep Learning Models in Autonomous Vehicles [45.8] 深層学習モデルは、その入力に小さな敵対的な変化が導入されたとき、誤予測の影響を受けやすい。
本稿では,自動運転車に対するシステムレベルの攻撃の最初の分類法を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:02:42 GMT)
Echo-4o: Harnessing the Power of GPT-4o Synthetic Images for Improved Image Generation [45.1] GPT-4oは、画像生成における強力なパフォーマンスに対して大きな注目を集めているが、オープンソースモデルはいまだに遅れを取っている。
GPT-4oによって生成された180Kスケールの合成データセットであるEcho-4o-Imageを紹介する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:59:28 GMT)
Unraveling the iterative CHAD [45.0] Combinatory Homomorphic Automatic Differentiation (CHAD)は、当初、セマンティックス駆動のソース・トゥ・ソース・トランスフォーメーション(source-to-source transformation)として定式化された。
我々はCHADを拡張し、部分的な(潜在的に非終端的な)操作、データ依存条件、反復構成を含むプログラムを包含する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:59:23 GMT)
Quantum and classical algorithms for SOCP based on the multiplicative weights update method [45.0] 第二次コーンプログラム(SOCP)を解くための古典的および量子的アルゴリズムを与える。
我々のアプローチは、半定値プログラム(SDP)に先立って適用されたMWフレームワークに従う。
我々は、SOCPの付加構造を利用して、SOCP固有のアルゴリズムでより優れたランタイムを提供することを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:12:33 GMT)
Fault tolerant Operations in Majorana-based Quantum Codes: Gates, Measurements and High Rate Constructions [45.0] ナノワイヤと中性原子におけるMajoranaベースの量子計算は、量子ビットを符号化しノイズから保護するための有望なプラットフォームとして注目されている。
我々はMajoranaハードウェアに論理次数をエンコードしたフォールトトレラント量子計算のための一般的なフレームワークを開発する。
フェミオンハードウェアにおいて、フォールトトレラント量子計算に必要な全ての要素を一貫して実装可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:28:53 GMT)
GSFixer: Improving 3D Gaussian Splatting with Reference-Guided Video Diffusion Priors [44.9] GSFixerは、スパース入力から再構築された3DGS表現の品質を改善するために設計されたフレームワークである。
本モデルは,視覚幾何学基礎モデルから抽出した参照ビューの2次元意味的特徴と3次元幾何学的特徴を統合した。
3DGSアーティファクト復元評価のための適切なベンチマークが欠如していることを踏まえ,低品質な3DGSを用いてレンダリングされたアーティファクトフレームを含むDL3DV-Resを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:56:28 GMT)
Combinative Matching for Geometric Shape Assembly [44.2] 幾何形状の組立のためのインターロック部品を組み合わせた新しい形状マッチング手法を提案する。
本手法では,各領域の形状が同一に見えるが,各領域の体積が互いに逆空間を占有する領域間の対応性を確立する。
提案手法は、マッチングにおける局所的な曖昧さを著しく低減し、組立における部品の堅牢な組み合わせを可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:01:24 GMT)
rETF-semiSL: Semi-Supervised Learning for Neural Collapse in Temporal Data [44.2] 本稿では,ニューラル・コラプス現象を満たす潜在表現を強制する,新しい半教師付き事前学習戦略を提案する。
LSTM, トランスフォーマー, 状態空間モデルに適用した場合, 従来のプリテキストタスクよりも有意に優れることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:16:47 GMT)
UbiQTree: Uncertainty Quantification in XAI with Tree Ensembles [42.4] そこで本研究では,SHAP値の不確かさを動脈,てんかん,結束成分に分解する手法を提案する。
本手法は実世界の3つのユースケースにまたがって記述的統計解析を用いて検証する。
この理解は、堅牢な意思決定プロセスの開発と、高度なアプリケーションにおけるモデルの改良を導くことができる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:20:33 GMT)
Model Poisoning Attacks to Federated Learning via Multi-Round Consistency [42.1] 本稿では,悪意のあるクライアントのモデル更新間で複数ラウンドの一貫性を実現するPoisonedFLを提案する。
5つのベンチマークデータセットに対する実証的な評価は、PoisonedFLが8つの最先端の防御を破り、既存の7つのモデル中毒攻撃を上回っていることを示している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:00:16 GMT)
Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer [41.8] トレーニング不要なカラー編集手法であるColorCtrlを提案する。
注目マップと値トークンを対象とする操作によって構造と色を分離することにより、精度と一貫性のある色編集を可能にする。
本手法は,FLUX.1 Kontext Max や GPT-4o Image Generation などの強力な商用モデルを上回る一貫性を持つ。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:20:54 GMT)
RASR: Retrieval-Augmented Super Resolution for Practical Reference-based Image Restoration [41.5] RefSRは、高品質な参照画像を活用して、テクスチャの忠実さと視覚リアリズムを高めることで、Single Image Super Resolution (SISR)を改善している。
既存のRefSRアプローチは、手動でキュレートされたターゲット参照イメージペアに依存している。
Retrieval-Augmented Super Resolution (RASR) は参照データベースから意味論的に関連する高解像度画像を自動的に抽出する新しい実用的なRefSRパラダイムである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:05:20 GMT)
Efficient Multimodal Streaming Recommendation via Expandable Side Mixture-of-Experts [40.8] マルチモーダルストリーミングレコメンダシステムは、ユーザの関心が時間とともに変化する現実世界のアプリケーションに広くデプロイされている。
マルチモーダルストリーミングレコメンデーションのためのメモリ効率の高いフレームワークであるXSMoE(Expandable Side Mixture-of-Experts)を提案する。
XSMoEは、凍結したトレーニング済みエンコーダに軽量なサイドチューニングモジュールをアタッチし、ユーザのフィードバックの進化に応じて徐々に拡張する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:06:17 GMT)
Benchmarking LLMs' Mathematical Reasoning with Unseen Random Variables Questions [40.7] 数学的推論における大規模言語モデル(LLM)のベンチマークのための新しい評価手法であるRV-Benchを提案する。
具体的には、バックグラウンドコンテンツが元のベンチマーク問題を反映するランダム変数質問(RVQ)を生成するために、質問生成関数を構築する。
我々は,1000以上のRVQを対象とした30以上の代表LSM実験を行った。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:29:49 GMT)
KompeteAI: Accelerated Autonomous Multi-Agent System for End-to-End Pipeline Generation for Machine Learning Problems [40.6] KompeteAIは、動的ソリューション空間探索を備えた新しいAutoMLフレームワークである。
我々は動的ソリューション空間探索を備えた新しいAutoMLフレームワークであるKompeteAIを紹介する。
我々は,MLE-Benchにおける制約に対応するために,Kompete-benchを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:29:56 GMT)
UltraRay: Introducing Full-Path Ray Tracing in Physics-Based Ultrasound Simulation [40.2] レイトレーシングアルゴリズムを用いてエコーデータを生成する新しい超音波シミュレーションパイプラインを提案する。
先進的な超音波イメージングを再現するため,平面波イメージングに最適化されたレイエミッション方式を導入し,遅延とステアリング機能を取り入れた。
提案手法であるUltraRayは,視覚的品質の向上だけでなく,シミュレーション画像のリアリズムの向上にも寄与する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:43:19 GMT)
Exploring the Equivalence of Closed-Set Generative and Real Data Augmentation in Image Classification [39.8] 画像分類タスクのトレーニングセットが与えられた場合、このデータセット上で生成モデルをトレーニングして分類性能を向上させることができるか?
生成モデルにより生成された実画像と閉集合合成画像の区別と類似性について検討する。
拡張に必要な合成画像の等価スケールを実証的に決定する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:14:29 GMT)
Efficient Forward-Only Data Valuation for Pretrained LLMs and VLMs [39.7] For-Valueは、大規模言語モデル(LLM)と視覚言語モデル(VLM)のためのフォワードオンリーのデータアセスメントフレームワークである。
For-Valueは、単一のフォワードパスのみに基づく単純なクローズドフォーム式を使用して影響スコアを計算する。
理論的解析により,For-Valueは隠れ表現のアライメントとトレーニングと検証サンプル間の予測誤差を捉えることで,サンプルごとの影響を正確に推定することを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:33:06 GMT)
Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity [39.5] 線形リカレントニューラルネットワークは、推論中に一定のメモリ使用量と時間毎の時間を含む強力な長距離シーケンスモデリングを可能にする。
非構造化空間は、互換性のあるハードウェアプラットフォームによって加速されるときに、計算とメモリの要求を大幅に削減できる魅力的なソリューションを提供する。
非常に疎い線形RNNは、高密度ベースラインよりも高い効率と性能のトレードオフを一貫して達成している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:51:20 GMT)
NeuralGS: Bridging Neural Fields and 3D Gaussian Splatting for Compact 3D Representations [39.3] 3D Gaussian Splattingは素晴らしいクオリティとレンダリングのスピードを実現していますが、数百万の3D Gaussianとかなりのストレージと送信コストがあります。
我々は,元の3DGSをコンパクトな表現に圧縮するNeuralGSという手法を開発した。
我々は複数のデータセットを実験し、視覚的品質を損なうことなく91回の平均モデルサイズ削減を実現した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:01:15 GMT)
Modulate and Reconstruct: Learning Hyperspectral Imaging from Misaligned Smartphone Views [38.8] RGB画像からのハイパースペクトル再構成は、深刻なスペクトル情報損失による根本的な問題である。
既存のアプローチは通常、単一のRGBイメージに依存し、再構成の精度を制限している。
本稿では,トリプルカメラスマートフォンシステムを活用したMI-HSR(Multi-image-to-hyperspectral Restruction)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:01:44 GMT)
DeputyDev -- AI Powered Developer Assistant: Breaking the Code Review Logjam through Contextual AI to Boost Developer Productivity [38.6] 本研究は,AddicateDevの実装と有効性について検討する。
ViceDevはAIを利用したコードレビューアシスタントで、ソフトウェア開発プロセスの非効率性に対処するために開発された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:09:45 GMT)
TextQuests: How Good are LLMs at Text-Based Video Games? [36.0] TextQuestsは、Infocomのインタラクティブフィクションゲームスイートをベースにしたベンチマークである。
外部ツールの使用を前もって,自己完結型問題解決のためのエージェントの能力を評価するように設計されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:45:14 GMT)
Competitive Algorithms for Multi-Agent Ski-Rental Problems [36.0] 本稿では,従来のスキーレンタルジレンマをグループ設定に一般化する,新しいマルチエージェントスキーレンタル問題を提案する。
我々のモデルでは、各エージェントは固定された日代でレンタルするか、個別のコストでパスを購入することができる。
我々はエージェントのアクティブな時代が異なり、エージェントが意思決定プロセスから抜け出すと動的状態につながるシナリオを考察する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:57:30 GMT)
Follow the Flow: On Information Flow Across Textual Tokens in Text-to-Image Models [35.9] テキスト・ツー・イメージ・モデルにおいて,意味情報をトークン表現に分散させる方法について検討する。
情報は通常、アイテムのトークンの1つか2つだけに集中している。
場合によっては、アイテムはお互いの表現に影響を与え、しばしば誤解を招く。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:52:03 GMT)
MedRep: Medical Concept Representation for General Electronic Health Record Foundation Models [35.2] 我々は、観察医療成果パートナーシップ(OMOP)共通データモデル(CDM)に基づくEHR基盤モデルのためのMedRepを提案する。
概念表現学習では,大言語モデル(LLM)のプロンプトによって,概念の情報を最小限の定義で強化する。
我々は、MedRepでトレーニングされたEHRファンデーションモデルが、外部データセットの予測性能をより良く維持できることを実証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:55:55 GMT)
User-centric Subjective Leaderboard by Customizable Reward Modeling [34.4] ユーザ中心型主観的リーダーシップ(USL)について紹介する。
さまざまな現実世界のシナリオにまたがって、大規模言語モデル(LLM)の好み駆動の動的ランキングを提供する。
我々の研究は、10万件以上の主観的クエリを含む、実際の人間の嗜好データの徹底的な調査に基づいている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:39:04 GMT)
Poison Once, Control Anywhere: Clean-Text Visual Backdoors in VLM-based Mobile Agents [34.3] この研究は、VLMベースのモバイルエージェントをターゲットにした最初のクリーンテキストバックドアアタックであるVIBMAを紹介する。
この攻撃は、視覚的な入力だけを変更することによって、悪意ある振る舞いをモデルに注入する。
クリーンタスクの動作を保ちながら高い成功率を達成できることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:34:04 GMT)
Quo Vadis Handwritten Text Generation for Handwritten Text Recognition? [34.1] 歴史写本のデジタル化は、手書き文字認識(HTR)システムに重大な課題をもたらす。
手書きテキスト生成(HTG)技術は、特定の手書きスタイルに適した合成データを生成する。
最先端の3種類のHTGモデルを比較し,HTR微調整への影響を評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:39:18 GMT)
Learning Facts at Scale with Active Reading [33.5] 自己生成学習戦略を用いて,特定の素材の集合を研究するためのモデルをトレーニングするフレームワークであるActive Readingを提案する。
まず、エキスパートドメイン上でActive Readingでトレーニングされたモデルは、バニラ微調整よりもはるかに多くの知識を吸収する。
より現実的なモデルを構築するために、事前学習スケールでActive Readingを利用することができることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:54:43 GMT)
Next Edit Prediction: Learning to Predict Code Edits from Context and Interaction History [33.5] Next Edit Predictionは、開発者の意図を最近のインタラクション履歴から推測し、その後の編集の場所と内容の両方を予測するために設計された新しいタスクである。
この研究は、単に明示的な指示に反応するのではなく、次のアクションを期待することで、開発者と積極的に協力する新しいインタラクションパラダイムの基礎を築いた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:52:03 GMT)
Understanding Nonlinear Implicit Bias via Region Counts in Input Space [33.3] 我々は、同じ予測ラベルを持つ入力空間内の連結領域のカウントによって、暗黙バイアスを特徴づける。
小さい領域のカウントは幾何学的に単純な決定境界と一致し、良い一般化性能とよく相関している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:55:52 GMT)
Memory Decoder: A Pretrained, Plug-and-Play Memory for Large Language Models [33.0] 本稿では,プリトレーニング済みメモリであるメモリデコーダを紹介する。このメモリデコーダは,元のモデルのパラメータを変更することなく,効率的なドメイン適応を実現する。
実験により、メモリデコーダは、様々なQwenモデルとLlamaモデルを3つの専門分野(バイオメディシン、ファイナンス、法)に効果的に適応し、平均6.17ポイントのパープレキシティを低減できることが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:16:29 GMT)
PaCo-FR: Patch-Pixel Aligned End-to-End Codebook Learning for Facial Representation Pre-training [32.5] PaCo-FRは、マスク付きイメージモデリングとパッチピクセルアライメントを組み合わせた教師なしのフレームワークである。
PaCo-FRは、事前トレーニング用のラベル付きイメージがわずか200万枚だけで、いくつかの顔分析タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:37:41 GMT)
Hybrid Oscillator-Qubit Quantum Processors: Instruction Set Architectures, Abstract Machine Models, and Applications [32.4] CV-DVハイブリッドハードウェアは,DVプロセッサとCVプロセッサの両方の長所を継承する,強力な計算パラダイムを提供する。
本稿では,様々なハイブリッドCV-DVコンパイル技術,アルゴリズム,アプリケーションについて述べる。
ハイブリッドCV-DV量子計算は超伝導、閉じ込められたイオン、中性原子プラットフォームで実行され始めている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:00:14 GMT)
Predictive Uncertainty for Runtime Assurance of a Real-Time Computer Vision-Based Landing System [32.1] 滑走路画像から航空機のポーズ推定を行うためのビジョンベースパイプラインを提案する。
提案手法は,確率的キーポイント回帰のための空間的ソフトArgmax演算子をベースとした,効率的なフレキシブルなニューラルアーキテクチャ,リアルタイム推論による多様なビジョンバックボーンのサポート,および,シャープネスとキャリブレーションの指標によって評価される予測不確実性を生成する原理的損失関数,および (iii) 実行時検出と故障モデル出力の拒否を可能にするResidual-based Receiver Self Integrity Monitoring (RAIM) の適応である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:56:22 GMT)
Animate-X++: Universal Character Image Animation with Dynamic Backgrounds [32.0] Animate-X++は、擬人化文字を含む様々な文字タイプ向けのDiTに基づく普遍的なアニメーションフレームワークである。
動作表現を強化するために,暗黙的かつ明示的な方法で動画から包括的な動作パターンをキャプチャするPose Indicatorを導入する。
第2の課題として、アニメーションとTI2Vタスクを共同でトレーニングするマルチタスクトレーニング戦略を導入する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:11:28 GMT)
AmbiGraph-Eval: Can LLMs Effectively Handle Ambiguous Graph Queries? [31.9] AmbiGraph-Evalは、専門家が検証したグラフクエリの回答と組み合わせた、現実世界のあいまいなクエリの新しいベンチマークである。
本研究は, 曖昧性処理における重要なギャップを明らかにし, 特殊解像度技術における今後の課題を動機づけるものである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:06:59 GMT)
Request-Only Optimization for Recommendation Systems [31.5] 産業規模のDeep Learning Recommendation Models (DLRMs) は毎日何十億ものユーザにサービスを提供している。
DLRMは、例えば1兆の浮動小数点演算(TFLOP)など、前例のない複雑さまで拡張されている。
このスケールは、大量のトレーニングデータとともに、これらの複雑なレコメンデーションシステムの品質を効率的に改善するために、新しいストレージとトレーニングアルゴリズムを必要とします。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:13:09 GMT)
BridgeDepth: Bridging Monocular and Stereo Reasoning with Latent Alignment [31.1] モノラルおよびステレオのアプローチを3次元推定にブリッジする統合フレームワークを導入する。
新しいクロスアテンタティブアライメント機構は、ステレオ仮説表現とモノクロコンテキストキューを動的に同期させる。
我々のアプローチは、モダリティ固有の制限を超越した堅牢な3D知覚を可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:52:56 GMT)
HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels [31.0] HunyuanWorld 1.0は、テキストと画像の条件から没入的で探索可能なインタラクティブな3Dシーンを生成するための、両方の世界のベストを組み合わせた、新しいフレームワークである。
提案手法の主な利点は,1)パノラマ世界プロキシによる360度没入体験,2)既存のコンピュータグラフィックスパイプラインとのシームレスな互換性を実現するメッシュエクスポート機能,3)対話性向上のためのオブジェクト表現の非拘束化,の3つである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:21:11 GMT)
Efficient Visual Appearance Optimization by Learning from Prior Preferences [30.8] 本稿では,PBOとメタラーニングを統合し,サンプル効率を向上させるメタPOを提案する。
具体的には、Meta-POは、以前のユーザの好みを推測し、それらをモデルとして保存し、新しいユーザのための設計候補をインテリジェントに提案する。
また,2次元および3次元コンテンツにおける外観設計タスクの手法を実験的に評価した結果,参加者は5.86回で満足な外観を達成できた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:11:14 GMT)
An integrated photonics platform for high-speed, ultrahigh-extinction, many-channel quantum control [30.6] フォトニック集積回路(PIC)は、潜在的にスケーラブルなソリューションを提供する。
PICは高速・高圧変調、強いチャネル間分離、広波長互換性を必要とする。
Rubidium-87中性原子量子コンピュータのために設計されたこの8チャネルのPICは、200mmのウェハプロセスで作られ、性能指標の高度な組み合わせを実証している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:15:11 GMT)
LLMC+: Benchmarking Vision-Language Model Compression with a Plug-and-play Toolkit [29.9] VLM(Large Vision-Language Models)は、高機能なマルチモーダル機能を持つが、計算とメモリの要求が禁じられている。
現在のアプローチでは、テクニックを同等のモジュールに分解することはなく、空間的および時間的冗長性に対する公正な評価を妨げる。
本稿では,汎用なプラグイン・アンド・プレイツールキットを備えた総合的なVLM圧縮ベンチマークであるLLMC+を紹介する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:54:49 GMT)
Generation of a CW anti-bunched photon field from a thin-film PPLN waveguide by two-photon interference with a weak coherent state [29.8] オンチップの2光子状態と弱いが一致したコヒーレント状態とを混合することにより、薄膜pln導波路から反バンチ光子場を生成する。
これは、オンチップの2光子状態と破壊的な2光子干渉によってコヒーレント状態の2光子部分を取り出すことによって達成される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:58:05 GMT)
Towards Synthesized and Editable Motion In-Betweening Through Part-Wise Phase Representation [29.6] スタイル付きモーションはコンピュータのアニメーションやゲームには不可欠だ。
身体部分レベルでの動作スタイルをモデル化する新しいフレームワークを提案する。
我々のアプローチはよりニュアンスで表現力のあるアニメーションを可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:06:10 GMT)
Estimating Worst-Case Frontier Risks of Open-Weight LLMs [28.9] 本稿ではGPt-osを放出する際の最悪のフロンティアリスクについて検討する。
我々は悪意のある微調整(MFT)を導入し、GPt-osを極力細調整することで、生物学とサイバーセキュリティの2つの領域で最大限の能力を発揮しようとしている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:08:45 GMT)
E-4DGS: High-Fidelity Dynamic Reconstruction from the Multi-view Event Cameras [28.9] イベントカメラは低消費電力、高時間分解能、高ダイナミックレンジの利点を提供する。
E-4DGSは,マルチビューイベントストリームからの新たなビュー合成のための,最初のイベント駆動型動的ガウススプラッティング手法である。
対象物を取り囲む6つの移動イベントカメラを360度構成した合成多視点カメラを設計する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:09:36 GMT)
Toward Human-Robot Teaming: Learning Handover Behaviors from 3D Scenes [28.9] 本稿では,RGB画像のみから,人間とロボットのハンドオーバに着目したHRTポリシーのトレーニング手法を提案する。
ロボットグリップに装着したカメラでキャプチャした画像アクション対を含むロボットデモを生成する。
これにより、再構成シーンにおけるシミュレートされたカメラポーズ変更を直接グリップポーズ変更に変換することができる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:47:31 GMT)
AgentOrchestra: A Hierarchical Multi-Agent Framework for General-Purpose Task Solving [28.9] 本稿では,汎用タスク解決のための階層型マルチエージェントフレームワークであるAgentOrchestraを紹介する。
複雑な目的を分解し、サブタスクを専門エージェントのチームに委譲する中央計画エージェントが特徴である。
LLMをベースとしたエージェントシステムを評価するために,このフレームワークを3つの広く使用されているベンチマークで評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:50:42 GMT)
Faster Diffusion Models via Higher-Order Approximation [28.8] 本稿では,d1+2/K varepsilon-1/K $$のスコア関数評価のみを必要とする,原則付き無トレーニングサンプリングアルゴリズムを提案する。
我々の理論はロバストなvis-a-vis不正確なスコア推定であり、スコア推定誤差が増加するにつれて優雅に劣化する。
より広範に、我々は高速サンプリングのための高次手法の有効性を理解するための理論的枠組みを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:05:42 GMT)
Distilling LLM Prior to Flow Model for Generalizable Agent's Imagination in Object Goal Navigation [28.7] Object Goal Navigation (ObjectNav)タスクは、シーンの未観測領域を想像することで、特定のオブジェクトを目に見えない環境で見つけるようにエージェントに挑戦する。
本研究では,全シーンのセマンティックマップで観測された領域をブリッジすることで,室内環境の意味分布をモデル化する生成フローベースフレームワークGOALを提案する。
実験により、GOALはMP3DとGibsonの最先端性能を達成し、HM3Dへの転送設定の強い一般化を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:57:48 GMT)
Explaining Caption-Image Interactions in CLIP Models with Second-Order Attributions [28.5] Clipモデルのようなデュアルエンコーダアーキテクチャは、2種類の入力を共有埋め込み空間にマッピングし、それらの類似性を予測する。
一般的な一階特徴帰属法は個々の特徴の重要性を説明できるため、デュアルエンコーダに対する限られた洞察しか提供できない。
まず、各入力間の特徴-相互作用に対して、任意の微分可能なデュアルエンコーダによる予測の帰属を可能にする2階法を導出する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:11:00 GMT)
ViCToR: Improving Visual Comprehension via Token Reconstruction for Pretraining LMMs [28.4] ViCToR (VisualQA via Token Reconstruction) と呼ばれる視覚的理解段階を導入する。
ViCToRは学習可能なビジュアルトークンプールを使用し、ハンガリーマッチングアルゴリズムを使用して、視覚トークン置換のための意味的に関連するトークンを選択する。
LLaNeXT-8Bを10.4%改善し、MMStar、SEED$I$、RealWorldベンチマークで7.2%改善した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:39:24 GMT)
CoBAD: Modeling Collective Behaviors for Human Mobility Anomaly Detection [28.3] CoBADは、人間の移動異常検出のための集合行動のキャプチャーを目的として設計された新しいモデルである。
予期せぬ共起異常と不在異常の2種類の集団異常を検出できる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:33:38 GMT)
CO-Bench: Benchmarking Language Model Agents in Algorithm Search for Combinatorial Optimization [28.2] 実世界の36の最適化問題を特徴とするベンチマークスイートであるCO-Benchを紹介する。
CO-Benchは、構造化された問題定式化と、LLMエージェントの厳密な調査を支援するためのキュレートされたデータを含んでいる。
我々は、確立された人間設計アルゴリズムに対して複数のエージェント・フレームワークを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:51:59 GMT)
A Survey on 3D Gaussian Splatting Applications: Segmentation, Editing, and Generation [28.1] 3D Gaussian Splatting (3DGS)は3Dシーン表現のためのNeRF(Neural Radiance Fields)の強力な代替品として登場した。
このサーベイは、3DGSアプリケーションの最近の進歩を概観する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:44:39 GMT)
Rethinking Domain-Specific LLM Benchmark Construction: A Comprehensiveness-Compactness Approach [28.1] 既存のベンチマークは主にスケーリングの法則に重点を置いており、微調整や広範囲な質問セットの生成に大量のコーパスに依存している。
本稿では,スケーリング法則が特定の領域におけるベンチマーク構築の最適原則であるとは限らないことを実証する。
包括性-コンパクト性原理に基づく反復型ベンチマークフレームワークであるComp-Compを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:51:46 GMT)
Assessing the Feasibility of Lightweight Whisper Models for Low-Resource Urdu Transcription [28.0] 本研究では,低リソース環境下でのUrdu音声認識における軽量Whisperモデル(Tiny,Base,Small)の有効性を評価する。
単語誤り率(WER)を用いて,これらのモデルをキュレートしたUrduデータセット上で,微調整なしでベンチマークする。
その結果、Whisper-Small は Tiny (67.08% WER) と Base (53.67% WER) を上回り、最低エラー率を達成した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:01:59 GMT)
Grounding Emotion Recognition with Visual Prototypes: VEGA -- Revisiting CLIP in MERC [28.0] 会話におけるマルチ感情認識は、テキスト、音響、視覚信号の複雑な相互作用のため、依然として困難な課題である。
本稿では,統合と分類プロセスにクラスレベルの視覚的意味論を導入する新しいビジュアル感情ガイドアンコリング(VEGA)機構を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:11:05 GMT)
Images Speak Louder Than Scores: Failure Mode Escape for Enhancing Generative Quality [27.8] 知覚品質を向上させるためのトレーニング不要かつ推論効率の高い手法であるFaMEを提案する。
ImageNetの実験では、FaMEはFIDを妥協することなく、視覚的品質を一貫した改善をもたらすことを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:28:14 GMT)
GeoMAE: Masking Representation Learning for Spatio-Temporal Graph Forecasting with Missing Values [26.9] Points of Interest (POIs) におけるクラウドフローは、効果的な交通管理、公共サービス買収、都市計画において重要である。
それにもかかわらず、都市センシング技術の限界により、ほとんどの情報源のデータ品質は、各POIにおける群衆の流れを監視するのに不十分である。
これにより、低品質データからの正確なクラウドフローの推測が、決定的かつ困難なタスクとなる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:30:45 GMT)
From Charts to Fair Narratives: Uncovering and Mitigating Geo-Economic Biases in Chart-to-Text [26.9] 本稿では,VLM(Vision-Language Models)が,チャートの要約を生成する際に,地球経済のバイアスを増幅する方法について検討する。
6,000のチャート・カントリー・ペアにまたがるVLM生成チャートにおける地理的・経済的バイアスの大規模評価を行う。
分析の結果,既存のVLMでは,中所得国や低所得国と比較して,高所得国の方が肯定的な説明が得られやすいことが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:09:00 GMT)
The Early Bird Catches the Leak: Unveiling Timing Side Channels in LLM Serving Systems [26.5] 新たなタイミング側チャネルのセットを利用して、機密システムプロンプトと他のユーザによって発行された情報を推測することができる。
これらの脆弱性は、従来のコンピューティングシステムで観察されたセキュリティ上の問題と類似している。
キャッシュ内の共有プロンプトプレフィックスを効率的に回収するトークン・バイ・トークン検索アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:03:10 GMT)
Pruning Long Chain-of-Thought of Large Reasoning Models via Small-Scale Preference Optimization [26.5] 大規模推論モデル(LRM)は、長いチェーン・オブ・ソート(CoT)推論を通じて複雑なタスクに強い性能を示す。
長いアウトプットは計算コストを増大させ、過度に考え直し、推論の有効性と効率のバランスをとる上での課題を提起する。
本稿では, LRMの生成時間を削減するための効率的な手法について検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:00:09 GMT)
SVG-Head: Hybrid Surface-Volumetric Gaussians for High-Fidelity Head Reconstruction and Real-Time Editing [26.4] Surface-Volumetric Gaussian Head Avatar (SVG-Head) は、FLAMEメッシュ上に有界な3Dガウスの幾何学を明示的にモデル化する新しいハイブリッド表現である。
3次元世界とテクスチャ空間の対応性をモデル化するため,メッシュ対応ガウスUVマッピング法を提案する。
NeRSembleデータセットの実験では、SVG-Headは高忠実なレンダリング結果を生成するだけでなく、ガウスの頭アバターの明示的なテクスチャ画像を得るための最初の方法でもある。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:27:55 GMT)
Emotion-Qwen: A Unified Framework for Emotion and Vision Understanding [26.4] Emotion-Qwenは、堅牢な感情理解と一般的な推論機能を維持するために同時に設計された統合マルチモーダルフレームワークである。
我々は,40万本以上のビデオクリップに詳細な文脈対応感情記述を付加した大規模バイリンガル・リソースであるビデオ感情推論データセットを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:28:43 GMT)
LibRec: Benchmarking Retrieval-Augmented LLMs for Library Migration Recommendations [26.2] LibRecは、LLMの機能と検索強化された生成技術を統合して、代替ライブラリの推奨を自動化するフレームワークである。
LibRecの有効性を評価するために,ライブラリマイグレーションレコメンデーションタスクのパフォーマンスを評価するベンチマークであるLibEvalを紹介する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:22:49 GMT)
COME: Dual Structure-Semantic Learning with Collaborative MoE for Universal Lesion Detection Across Heterogeneous Ultrasound Datasets [25.8] 異種ソース特化専門家(COME)のユニバーサルコラボレーションミックスを提案する。
COMEは、普遍的な表現空間を創り出し、ソース固有の専門家と協力して差別的特徴を抽出する、二重構造セマンティックな共有専門家を確立する。
この設計は、データセット間のエクスペリエンス分布を活用し、小さなバッチや目に見えないデータシナリオに普遍的なUSプリエントを提供することで、堅牢な一般化を可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:43:20 GMT)
Enhanced metrology based on flipping trajectory of cold Rydberg gases [25.8] 散逸性Rydberg多体系の軌道はマイクロ波駆動下で反転することができ、感度が向上した。
これは、折り畳まれた軌道の交叉が相転移付近で鋭いピークを示し、マイクロ波場の小さな変化に対する応答を増幅するためである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:40:51 GMT)
Return Prediction for Mean-Variance Portfolio Selection: How Decision-Focused Learning Shapes Forecasting Models [25.7] 意思決定学習は、予測と最適化を統合して意思決定結果を改善する。
本研究では、DFLが平均分散最適化(MVO)における決定を最適化するために、ストックリターン予測モデルをどのように調整するかを検討する。
その結果,予測誤差が高いにもかかわらず,DFLが優れたポートフォリオ性能を実現する理由が明らかになった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:52:58 GMT)
Causal Graph Profiling via Structural Divergence for Robust Anomaly Detection in Cyber-Physical Systems [25.6] 公共インフラシステムにおける信頼性の高いサイバー攻撃検出のために設計された因果グラフに基づく異常検出フレームワーク。
CGADは、因果プロファイリングと異常スコアという2段階の監視フレームワークに従う。
因果構造を利用することで、CGADは非定常および不均衡な時系列環境において優れた適応性と精度を実現する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:26:43 GMT)
Regret minimization in Linear Bandits with offline data via extended D-optimal exploration [25.5] 本稿では, 線形帯域におけるオンライン後悔の問題を, 基礎となる帯域モデルから事前観測(オフラインデータ)にアクセスして考察する。
オフライン・オンライン・フェイズド・エミネーション(OOPE)というアルゴリズムは,オフラインデータを効果的に組み込んでオンラインの後悔を軽減する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:00:10 GMT)
Human Motion Capture from Loose and Sparse Inertial Sensors with Garment-aware Diffusion Models [25.2] Garment Inertial Poser (GaIP) は、粗いIMUセンサーから全身のポーズを推定する方法である。
実験の結果,シミュレーションおよび合成データに基づいて訓練した拡散法は,慣性フルボディポーズ推定器よりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:45:54 GMT)
Nested-ReFT: Efficient Reinforcement Learning for Large Language Model Fine-Tuning via Off-Policy Rollouts [25.2] 我々はNested-ReFTを導入し、ターゲットモデルのサブセットがトレーニング中に非政治的な完了を生成する行動モデルとして機能する。
我々の理論的分析は、Nested-ReFTが制御された分散を伴う非バイアス勾配推定値を得ることを示している。
我々の経験的分析は、複数の数学推論ベンチマークとモデルサイズでトークン/秒として測定された計算効率の改善を実証している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:37:46 GMT)
MedAtlas: Evaluating LLMs for Multi-Round, Multi-Task Medical Reasoning Across Diverse Imaging Modalities and Clinical Text [25.1] MedAtlasは、現実的な医学的推論タスクにおいて、大きな言語モデルを評価するための新しいベンチマークフレームワークである。
MedAtlasの特徴は、マルチターン・ダイアログ、マルチモーダル・メディカル・イメージ・インタラクション、マルチタスク統合、高臨床的忠実性である。
それぞれの症例は、実際の診断から派生したもので、テキスト医療史とCT、MRI、PET、超音波、X線などの複数の画像モダリティの時間的相互作用を取り入れている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:32:17 GMT)
SOI is the Root of All Evil: Quantifying and Breaking Similar Object Interference in Single Object Tracking [25.1] 類似オブジェクト干渉(SOI)の最初の体系的研究と定量化について述べる。
干渉源の除去は、全てのSOTAトラッカーで大幅な性能改善(AUCは4.35まで向上)をもたらす。
SOIBenchは,SOI課題を対象とする最初の意味認知指導ベンチマークである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:12:43 GMT)
Event-driven Robust Fitting on Neuromorphic Hardware [25.0] 我々は、実際のニューロモルフィックハードウェアであるIntel Loihi 2にロバストな適合性を持たせるための、新しいスパイクニューラルネットワークを開発した。
以上の結果から, 確立されたロバスト適合アルゴリズムを標準CPU上で同等の精度で動作させるのに必要なエネルギーは, ニューロモルフィックなロバスト適合法ではごくわずかであることがわかった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:41:23 GMT)
Leveraging Failed Samples: A Few-Shot and Training-Free Framework for Generalized Deepfake Detection [24.0] Few-shot Training-free Network (FTNet) for real-world few-shot Deepfake Detection。
FTNetは評価セットから1つの偽のサンプルのみを使用しており、トレーニングやパラメータの更新なしに、新しいサンプルが現実世界に出現し、使用するために収集できるシナリオを模倣している。
我々は、29の異なる生成モデルから生成されたAI画像の包括的分析を行い、既存の手法と比較して平均8.7%改善した新しいSoTA性能を実現する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:06:09 GMT)
Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens [23.3] CoT(Chain-of-Thought)プロンプトにより,様々なタスクにおいてLLM(Large Language Model)のパフォーマンスが向上することが示されている。
しかしながら、いくつかの初期の発見は、CoT推論が見かけよりも表面的であることを示唆している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:41:33 GMT)
No-Regret M${}^{\natural}$-Concave Function Maximization: Stochastic Bandit Algorithms and Hardness of Adversarial Full-Information Setting [23.2] オンラインM$natural$-concave関数問題について検討し,Murota と Shioura (1999) によるインタラクティブ版について検討した。
バンドイット設定では、$O(T-1/2)$-simple regretと$O(T2/3)$-regretアルゴリズムを、M$natural$-concave関数のノイズ値オーラクルに$T$倍のアクセスで提示する。
完全な情報フィードバックであっても,ラウンド毎に実行されたアルゴリズムは,任意の一定の$cに対して,O(T1-c)$後悔を達成できないことを証明しています。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:04:34 GMT)
Story2Board: A Training-Free Approach for Expressive Storyboard Generation [23.0] Story2Boardは、自然言語から表現力のあるストーリーボードを生成するためのトレーニング不要のフレームワークである。
これを解決するために、Latent Panel AnchoringとReciprocal Attention Value Mixingという2つのコンポーネントからなる軽量な一貫性フレームワークを導入しました。
質的で定量的な結果とユーザスタディは、Story2Boardが既存のベースラインよりもダイナミックで一貫性があり、物語的に魅力的なストーリーボードを生み出していることを示している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:56:26 GMT)
Conformal Prediction of Classifiers with Many Classes based on Noisy Labels [22.8] Conformal Prediction (CP) は、分類システムの予測不確実性を制御する。
雑音ラベル付きデータに基づいて、ノイズのない共形閾値を推定する方法を示す。
ノイズ対応コンフォーマル予測 (NACP) のアプローチについて検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:54:25 GMT)
Towards flexible perception with visual memory [22.6] ニューラルネットワークのトレーニングはモノリシックな取り組みであり、知識を石に彫ることに似ている。
ここでは、ディープニューラルネットワークの表現力とデータベースの柔軟性を組み合わせることで、シンプルで魅力的な代替手段を探る。
私たちは、以下の重要な機能を持つシンプルで柔軟なビジュアルメモリを構築するために、しっかりと確立されたコンポーネントを構築します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:35:19 GMT)
Less is More: Learning Graph Tasks with Just LLMs [22.4] たとえ小さな LLM であっても,インストラクティブ・チェーン・オブ・プリート・ソリューションを用いてグラフタスクをトレーニングすることで,グラフタスクの解法を学ぶことができることを示す。
このトレーニングは、特殊なグラフエンコーダを使わずに、新しいタスクやグラフ構造に一般化する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:21:05 GMT)
A Machine Learning Approach to Predict Biological Age and its Longitudinal Drivers [22.2] 2つの異なる期間のデータと長手コホートを用いて年齢を予測する機械学習パイプラインを開発した。
重要なバイオマーカーの変化率(傾斜)を時間とともに明示的に捉える技術によって,我々はモデル性能を著しく改善した。
当フレームワークは,患者の健康トラジェクトリを動的に追跡し,早期介入とパーソナライズされた予防戦略を可能にする臨床ツールの道を開く。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:22:12 GMT)
Cyc3D: Fine-grained Controllable 3D Generation via Cycle Consistency Regularization [22.1] nameは、生成された3Dコンテンツと入力制御の間の循環的な一貫性を促進することで、制御可能な3D生成を促進する。
emphViewの一貫性は、2つの生成された3Dオブジェクト間のコヒーレンスを保証する。
emphCondition整合性は、最終的な抽出信号と元の入力制御とを整合させ、構造的または幾何学的詳細を保存する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:54:08 GMT)
WeatherPrompt: Multi-modality Representation Learning for All-Weather Drone Visual Geo-Localization [22.0] We present WeatherPrompt, a multi-modality learning paradigm that establishs weather-invariant representations through fusing the image embedding with the text context。
我々のフレームワークは、最先端のドローンジオローカライズ手法と比較して、競争力のあるリコール率を達成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:28:41 GMT)
EventRR: Event Referential Reasoning for Referring Video Object Segmentation [21.7] Referring Video Object (RVOS) は、式によって参照されるビデオ内のオブジェクトをセグメンテーションすることを目的としている。
現在のRVOSメソッドは、参照式を非構造化シーケンスと見なしている。
本稿では,Event Referential Reasoning(EventRR)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:59:00 GMT)
Global Convergence Analysis of Vanilla Gradient Descent for Asymmetric Matrix Completion [21.5] 本稿では,非対称な低ランク行列補完問題について検討する。
非線形最小二乗完備関数を持つ非拘束的最適化問題として定式化することができる。
勾配降下法は通常、収束を保証するために正規化項を目的関数に組み込む。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:23:32 GMT)
SpargeAttention: Accurate and Training-free Sparse Attention Accelerating Any Model Inference [21.5] SpargeAttnは任意のモデルに対する普遍的スパースで量子化された注意である。
本手法は,エンドツーエンドのメトリクスを犠牲にすることなく,言語,画像,ビデオ生成などの多様なモデルを大幅に高速化する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:15:35 GMT)
MLLM-CBench:A Comprehensive Benchmark for Continual Instruction Tuning of Multimodal LLMs with Chain-of-Thought Reasoning Analysis [21.1] マルチモーダル大規模言語モデル(MLLM)は、動的実世界の要求に適応するために、訓練後のフェーズで連続的な命令チューニングを必要とする。
textbfMLLM-CTBenchは、6つの異なるドメインから7つの課題を3つのコントリビューションでキュレートしたデータセットである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:54:35 GMT)
Combating Noisy Labels via Dynamic Connection Masking [20.9] MLP(Multi-Layer Perceptron Networks)とKAN(Kolmogorov-Arnold Networks)のための動的接続マスキング(DCM)機構を提案する。
我々のアプローチは、より堅牢なディープネットワークを構築するために、様々なノイズロストトレーニング手法にシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:51:46 GMT)
LongIns: A Challenging Long-context Instruction-based Exam for LLMs [20.8] 大規模言語モデル(LLM)の長いコンテキスト能力は近年ホットな話題となっている。
本稿ではLongInsベンチマークデータセットを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:43:27 GMT)
MoCA: Identity-Preserving Text-to-Video Generation via Mixture of Cross Attention [20.5] MoCA は Diffusion Transformer (DiT) のバックボーン上に構築されたビデオ拡散モデルである。
我々のフレームワークは、各DiTブロックにMoCA層を埋め込むことで、フレーム間のID整合性を改善する。
また、Latent Video Perceptual Lossを組み込んで、ビデオフレーム間のアイデンティティの一貫性と細かな詳細性を高める。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:25:50 GMT)
Bridging the Culture Gap: A Framework for LLM-Driven Socio-Cultural Localization of Math Word Problems in Low-Resource Languages [20.3] 本稿では,英語以外の言語における数学語問題における文化的ローカライゼーションの枠組みを紹介する。
翻訳されたベンチマークは、適切な社会文化的文脈下で真の多言語数学能力を曖昧にすることができる。
我々のフレームワークは、英語中心のエンティティバイアスを緩和し、ネイティブエンティティが様々な言語にまたがって導入されるときの堅牢性を改善するのに役立つ。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:44:37 GMT)
Towards Black-Box Membership Inference Attack for Diffusion Models [20.2] 本稿では,イメージ・ツー・イメージ・バラツキAPIのみを用いた新たなメンバシップ推論攻撃手法を提案する。
私たちのアプローチでは、サンプルがトレーニングセットの一部であったかどうかを分類することができます。
実験結果は従来手法より一貫して優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:28:56 GMT)
Microwave Engineering of Tunable Spin Interactions with Superconducting Qubits [20.1] 超伝導量子回路における多重マイクロ波を用いたスピン相互作用の実験的実現を実証する。
ネイティブXY相互作用とマイクロ波駆動を正確に制御することにより、可変スピンハミルトニアンが得られる。
我々の研究は、アナログ-デジタル量子シミュレーションのためのツールボックスを拡張し、幅広いエキゾチックな量子スピンモデルの探索を可能にします。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:11:26 GMT)
Large-Small Model Collaborative Framework for Federated Continual Learning [20.1] ファンデーションモデル(FM)のための継続的学習(CL)は不可欠だが、未調査の課題である。
我々はFCL(Federated Continual Learning)において、軽量なローカルモデルが動的ブリッジとして機能する最初の協調フレームワークを提案する。
Small Model Continual Fine-tuningは、小さなモデルの時間的忘れを防ぐためのもので、One-by-One Distillationはサーバ上で不均一なローカル知識を個別に融合する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:49:50 GMT)
Mini-Game Lifetime Value Prediction in WeChat [20.0] ライフタイムバリュー(LTV)予測は、特定のアイテムに対するユーザの累積購入コントリビューションを予測するための取り組みである。
登録ユーザーの購入率は0.1%と極めて低く、その結果、大多数のユーザーがわずか数回しか購入できないデータセットが作られる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:47:23 GMT)
Sharp Generalization for Nonparametric Regression in Interpolation Space by Over-Parameterized Neural Networks Trained with Preconditioned Gradient Descent and Early-Stopping [20.0] アルゴリズムによる保証を訓練した過パラメトリック化された2層ニューラルネットワークを用いて,非回帰について検討する。
我々は,早期停止機能を備えた新しいプレコンディショニンググレーディエント・ディフレッシュ(PGD)アルゴリズムを用いてニューラルネットワークをトレーニングすることにより,高い回帰率が得られることを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:11:43 GMT)
Underdamped Diffusion Bridges with Applications to Sampling [19.7] 対象分布に先立って輸送する拡散ブリッジを学習するための一般的なフレームワークを提供する。
本手法は, 対象分布からサンプルにアクセスすることなく, 正規化されていない密度からサンプルを抽出する難題に適用する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:03:31 GMT)
AUCAD: Automated Construction of Alignment Dataset from Log-Related Issues for Enhancing LLM-based Log Generation [19.4] 本稿では,LLMを用いた自動ログステートメント生成のための汎用データセットを用いた後学習による性能向上について検討する。
AUCADと呼ばれる新しいアプローチは、ログ関連の問題から情報を抽出したデータセットを自動的に構築する。
人的および実験的な評価は、これらのモデルが既存のLCMベースのソリューションを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:07:49 GMT)
NeuronTune: Fine-Grained Neuron Modulation for Balanced Safety-Utility Alignment in LLMs [19.1] 本稿では,スパースニューロンを動的に調整し,安全性と実用性を同時に最適化するフレームワークであるNeuronTuneを提案する。
提案手法は、まず、属性を介して全層にわたる安全クリティカルかつ実用的保存ニューロンを特定し、メタラーニングを用いて、安全ニューロンの活性化を適応的に増幅し、実用ニューロンの活性化を抑制する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:05:28 GMT)
TimeMKG: Knowledge-Infused Causal Reasoning for Multivariate Time Series Modeling [19.1] TimeMKGは低レベル信号処理から知識情報推論までの時系列モデリングを高める。
クロスモダリティアテンションは、下流タスクに因果前処理を注入して、変数レベルで表現を整列させる。
多様なデータセットの実験では、変数レベルの知識を組み込むことで、予測性能と一般化の両方が大幅に改善されることが示されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:00:36 GMT)
Beyond Ten Turns: Unlocking Long-Horizon Agentic Search with Large-Scale Asynchronous RL [18.9] ASearcherは、検索エージェントの大規模RLトレーニングのためのオープンソースプロジェクトである。
ASearcher-Web-QwQは、xBenchで42.1、GAIAで52.8のAvg@4スコアを獲得し、既存のオープンソース32Bエージェントを上回っている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:06:22 GMT)
CoherenDream: Boosting Holistic Text Coherence in 3D Generation via Multimodal Large Language Models Feedback [18.9] SDS(Score Distillation Sampling)はテキストから3Dコンテンツ生成において顕著な成功を収めた。
SDSベースの手法はユーザプロンプトのセマンティックな忠実さを維持するのに苦労する。
マルチモーダル大言語モデル(MLLM)からのアライメントフィードバックを統合したテキストコヒーレントスコア蒸留(TCSD)を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:30:16 GMT)
Mitigating Distribution Shift in Stock Price Data via Return-Volatility Normalization for Accurate Prediction [18.4] 本稿では,分散シフト問題に明示的に対処する,株価予測のための頑健な手法であるReVolを提案する。
ReVolは、これらのシフトを軽減するために、3つの重要な戦略を活用する。
ReVolは、ほとんどの場合、最先端のバックボーンモデルの性能を向上させる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:20:13 GMT)
Multimodal Recommendation via Self-Corrective Preference Alignmen [18.4] 本稿では,MSPA(Multimodal Self-Corrective Preference Alignment)を提案する。
大規模な実験と可視化により、MSPAはダイナミックなライブストリーミングシナリオにおいて、精度、リコール、テキスト品質を著しく改善し、ベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:07:29 GMT)
EvoP: Robust LLM Inference via Evolutionary Pruning [18.4] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な成功を収めた。
既存のモデルプルーニングメソッドは、モデルから冗長な構造を取り除き、この問題に対処する。
頑健なLLM推論のための進化的プルーニングフレームワークであるEvoPを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:12:51 GMT)
OC-SOP: Enhancing Vision-Based 3D Semantic Occupancy Prediction by Object-Centric Awareness [18.3] 本稿では,検出ブランチから抽出した高レベルなオブジェクト中心キューを,意味的占有率予測パイプラインに統合するフレームワークを提案する。
このオブジェクト中心の統合により、前景オブジェクトの予測精度が大幅に向上する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:44:59 GMT)
Your Coding Intent is Secretly in the Context and You Should Deliberately Infer It Before Completion [18.2] 大規模言語モデル(LLM)は、リポジトリスケールでの関数補完にますます使われています。
現実のリポジトリでは、このようなアノテーションは頻繁に欠落し、パフォーマンスは大幅に低下します。
我々は、タスクを3段階のプロセスとして構成する。第1段階はインテント推論に焦点を当て、モデルがターゲット関数の前のコードを解析して、所望の機能に関する手がかりを明らかにする。
第2段階では、事前のコンテキストだけでは意図回復に不十分なケースを扱うための、オプションのインタラクティブリファインメント機構が導入されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:45:23 GMT)
MUJICA: Reforming SISR Models for PBR Material Super-Resolution via Cross-Map Attention [18.2] SVBRDFのアップスケールは、現代の3Dグラフィックアプリケーションに有用である。
既存のSingle Image Super-Resolution(SISR)メソッドは、クロスマップの不整合に対処する。
クロスマップアテンション(MUJICA)を用いたマルチモーダル・アップスケーリング・ジョイント推論を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:34:39 GMT)
SYNAPSE-G: Bridging Large Language Models and Graph Learning for Rare Event Classification [18.1] 本稿では,SynAPSE-G(Synthetic Augmentation for Positive Smpling via Expansion on Graphs)を提案する。
この合成データは、種子と大きなラベルなしデータセットの間に構築された類似性グラフ上に、半教師付きラベル伝搬のためのシードとして機能する。
不均衡なSST2とMHSデータセットの実験は、正のラベルを見つける上でSynAPSE-Gの有効性を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:58:44 GMT)
Format as a Prior: Quantifying and Analyzing Bias in LLMs for Heterogeneous Data [17.9] 大規模言語モデル(LLM)は、異種フォーマットからの処理情報を必要とするアプリケーションにますます採用されている。
本稿では, LLMにおけるフォーマットバイアスを調査し, 解析する試みについて述べる。
フォーマットバイアスを低減するための3つの今後の研究方向として、フォーマットのサニタイズと正規化によるデータ前処理の改善、注意再重み付けなどの推論時間介入の導入、フォーマットバランスの取れたトレーニングコーパスの開発を挙げる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:09:02 GMT)
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer [17.9] LayerTracerは拡散トランスフォーマーで、設計者の階層化された生成プロセスを、シーケンシャルな設計操作の新たなデータセットから学習することでギャップを埋める。
画像ベクトル化には,参照画像を潜在トークンにエンコードする条件拡散機構を導入する。
実験では、生成品質と編集性の両方において、最適化ベースとニューラルベースラインに対してLayerTracerの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:32:12 GMT)
Exploring Scaling Laws for EHR Foundation Models [17.8] EHR基礎モデルのスケーリング法則に関する最初の実証的研究について述べる。
パラボリックなIsoFLOP曲線や計算,モデルパラメータ,データサイズ,臨床ユーティリティ間の電力-法則関係など,一貫したスケーリングパターンを同定する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:20:32 GMT)
Succinct Oblivious Tensor Evaluation and Applications: Adaptively-Secure Laconic Function Evaluation and Trapdoor Hashing for All Circuits [17.8] 2つのベクトルのテンソル積の加法的秘密共有を$mathbfx otimes mathbfy$で計算する。
本稿では,LWE問題を用いた標準学習におけるOTEの構成について述べる。
我々は、この新しい技術ツールが暗号化プリミティブのホストをいかに可能にし、すべてLWEに再現可能なセキュリティを実現するかを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:03:03 GMT)
Amazon Nova AI Challenge -- Trusted AI: Advancing secure, AI-assisted software development [17.8] Amazon Nova AI Challengeは、セキュアAIの進歩を推進する10の大学チームの間で、世界的な競争である。
本稿では,大学チームとAmazon Nova AI Challengeチームによる,ソフトウェア開発におけるAIの安全性問題への取り組みについて概説する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:04:01 GMT)
Interpretable Oracle Bone Script Decipherment through Radical and Pictographic Analysis with LVLMs [17.8] 本稿では,大規模視覚言語モデルに基づく解釈可能なOracle Bone Script (OBS) 解読手法を提案する。
また,OBS画像と画像解析用テキストを付加した47,157文字のPictographic Decipherment OBSデータセットを提案する。
提案手法は最先端のTop-10精度と優れたゼロショット復号能力を実現する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:13:32 GMT)
PERSONA: Personalized Whole-Body 3D Avatar with Pose-Driven Deformations from a Single Image [17.8] アニマタブルなヒトアバターを作るための2つの主要なアプローチが存在する。
3Dベースのアプローチは、非絡み合ったアイデンティティ表現を通じてパーソナライズを実現する。
拡散に基づくアプローチは、大規模なインザワイルドビデオからポーズ駆動変形を学ぶが、アイデンティティ保存に苦慮する。
本稿では,2つのアプローチの長所を組み合わせて,パーソナをパーソナライズした3Dアバターを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:40:48 GMT)
Out-of-Distribution Detection using Counterfactual Distance [17.7] 提案手法は,提案手法を用いて決定境界までの距離を推定するポストホックなOOD検出手法である。
提案手法はCIFAR-10における技術状況と一致し,93.50%のAUROC,25.80%のFPR95を達成できた。
CIFAR-100では97.05%のAUROCと13.79%のFPR95、ImageNet-200では92.55%のAUROCと33.55%のFPR95を4つのOODデータセットで比較した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:17:05 GMT)
Indirect Query Bayesian Optimization with Integrated Feedback [17.7] 我々は,未知関数の条件付き期待値$f$を最適化することで,統合されたフィードバックが与えられるような,ベイズ最適化の新たなクラスを開発する。
目的は、条件分布によって変換された空間を適応的にクエリし、観察することで、$f$のグローバルな最適値を見つけることである。
これは、プライバシ、ハードウェア、計算上の制約による直接的なフィードバックにアクセスできない現実世界のアプリケーションによって動機付けられている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:19:29 GMT)
Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference [17.5] キーバリュー(KV)キャッシュは、冗長な計算を避けるために中間注意計算(キーとバリューペア)を格納する。
本稿では,攻撃者がKV-cacheから直接センシティブなユーザ入力を再構築できることを実証し,脆弱性の包括的解析を行った。
我々は,新しい,軽量で効率的な防御機構であるKV-Cloakを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:48:25 GMT)
Deep Learning Warm Starts for Trajectory Optimization on the International Space Station [17.3] 軌道最適化は現代の自律ロボットの基盤であり、システムは安全と物理的制約を尊重しながら、軌道と制御をリアルタイムで計算することができる。
国際宇宙ステーション(ISS)のアストローブ自由飛行ロボットの軌道最適化を加速するために、機械学習によるウォームスタートを用いた最初の飛行実験結果を提供する。
このトレーニングされたニューラルネットワークは、軌道生成問題の解決策を予測し、SCPソルバを使用してシステムの安全性制約を強制する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:24:55 GMT)
Improved Regularization and Robustness for Fine-tuning in Neural Networks [17.2] トランスファーラーニングのアルゴリズムを微調整することは、トレーニングラベルを過度に適合させ記憶させる傾向がある。
正規化と自己ラベルの一般化を提案する。
提案手法は、7つの画像分類タスクに対して1.76%(平均)、数ショット分類タスクに対して0.75%改善する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:34:12 GMT)
HierMoE: Accelerating MoE Training with Hierarchical Token Deduplication and Expert Swap [17.2] 大規模言語モデル(LLM)のトレーニングを2つのトポロジ対応技術で高速化するためにHierMoEを導入する。
プロトタイプのHierMoEは、1.55times$から3.32times$高速通信を実現し、1.18times$から1.27times$高速エンドツーエンドトレーニングを実現しています。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:16:31 GMT)
BridgeTA: Bridging the Representation Gap in Knowledge Distillation via Teacher Assistant for Bird's Eye View Map Segmentation [17.1] カメラのみのアプローチはLiDARの代替手段として注目されているが、それでもLiDAR-Camera (LC) 融合方式に遅れを取っている。
本稿では,LCフュージョンとカメラ専用モデルとの表現ギャップを埋める,費用対効果の高い蒸留フレームワークであるBridgeTAを紹介する。
提案手法は,カメラのみのベースラインよりも4.2% mIoUの改善を実現し,他の最先端KD法よりも最大45%向上した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:28:21 GMT)
S2-UniSeg: Fast Universal Agglomerative Pooling for Scalable Segment Anything without Supervision [17.0] 我々は,新しい擬似マスクアルゴリズム,Fast Universal Agglomerative Pooling(UniAP)を提案する。
継続事前学習のための新しいスーパービジョン・ユニバーサル・セグメンテーション(S2-UniSeg)を提案する。
S2-UniSegは4つのベンチマークでSOTA UnSAMモデルを上回っている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:47:09 GMT)
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind [17.0] 我々は農業リモートセンシング(RS)のベンチマークであるAgroMindを紹介する。
AgroMindは、空間知覚、オブジェクト理解、シーン理解、シーン推論の4つのタスクディメンションをカバーしている。
AgroMind上で20のオープンソースLMMと4つのクローズドソースモデルを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:17:53 GMT)
Semi-Bandit Learning for Monotone Stochastic Optimization [16.9] 一般的なオンライン学習アルゴリズムは「モノトーン」問題のクラスのために開発されている。
当社のフレームワークは,預言不平等やPandoraのボックス,単一リソースの収益管理,ポスト価格など,いくつかの基本的な問題に適用しています。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:23:14 GMT)
DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes [16.7] ロボットが動的に変化する環境を理解し、ナビゲートできるオンラインオープン語彙マッピングシステムであるDualMapを紹介した。
提案するハイブリッドセグメンテーションとオブジェクトレベルのステータスチェックにより,従来の手法が必要とする3Dオブジェクトのマージが不要になる。
本研究では,3次元オープン語彙セグメンテーション,効率的なシーンマッピング,オンライン言語誘導ナビゲーションにおける最先端性能を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:21:25 GMT)
FlexCTC: GPU-powered CTC Beam Decoding With Advanced Contextual Abilities [16.7] 本稿では、コネクショニスト時間分類(CTC)モデルのために設計された、完全ベースのビームデコーディングのためのオープンソースのFlexCTCツールキットを提案する。
PythonとPyTorchで完全に開発され、高速でユーザフレンドリで、従来のC++やWFSTベースのGPUに代わるものを提供する。
また、GPUによるN-gram言語モデルの融合やフレーズレベルの強化など、高度なコンテキスト化技術もサポートしている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:09:16 GMT)
Performant Automatic BLAS Offloading on Unified Memory Architecture with OpenMP First-Touch Style Data Movement [16.5] 本稿では,自動BLASオフロードのための新しいツールであるSCILIB-Accelを紹介する。
このツールはCPUバイナリから直接BLASシンボルをインターセプトし、コード修正や再コンパイルは不要である。
SCILIB-Accelは、最大数百のGPUノード上の複数の量子物理学符号を用いて評価され、有望なスピードアップをもたらす。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:13:36 GMT)
SWA-SOP: Spatially-aware Window Attention for Semantic Occupancy Prediction in Autonomous Driving [16.3] 空間認識型ウィンドウアテンション(SWA)は、局所的な空間コンテキストを注意に組み込む新しいメカニズムである。
SWAはシーン補完を大幅に改善し、LiDARベースのSOPベンチマークで最先端の結果を得る。
我々は、SWAをカメラベースのSOPパイプラインに統合することで、その一般化をさらに検証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:49:32 GMT)
Improving Multimodal Large Language Models Using Continual Learning [16.3] 生成型大規模言語モデル(LLM)は、事前学習された視覚モデルを元のLLMに統合することにより、優れた機能を示す。
この統合は、元々のLLMと比較して、自然言語理解および生成タスクの性能を著しく低下させる。
言語能力の損失を最小限に抑えながら視覚的理解を高める手法を,5つの連続学習手法を用いて検討した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:38:33 GMT)
When Deepfakes Look Real: Detecting AI-Generated Faces with Unlabeled Data due to Annotation Challenges [16.2] AIが生成するコンテンツがますます現実的になるにつれて、テキスタイルのアノテータでさえ、ディープフェイクと本物のイメージの区別に苦慮している。
オンラインソーシャルネットワークの大規模未ラベルデータを効果的に活用できるアプローチへの需要が高まっている。
本稿では,DPGNet (Dual-Path Guidance Network) を導入し,(1) 異なる世代モデルからの顔間の領域ギャップを埋めること,(2) ラベルのない画像サンプルを活用すること,の2つの課題に対処する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:21:16 GMT)
Approximate DBSCAN under Differential Privacy [16.1] 本稿では、差分プライバシー(DP)の下でのDBSCAN問題を再考する。
既存のDP-DBSCANアルゴリズムは、入力点のクラスタラベルを公開することを目的としている。
本研究では,スパンの概念に基づくDP-DBSCANの代替定義を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:25:42 GMT)
Personalized Real-time Jargon Support for Online Meetings [16.1] ParseJargonはリアルタイムにパーソナライズされたjargon識別と説明を提供する対話型システムである。
追跡調査では、リアルタイムミーティングにおけるParseJargonのユーザビリティと実践的価値が検証された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:42:12 GMT)
See the Forest and the Trees: A Synergistic Reasoning Framework for Knowledge-Based Visual Question Answering [16.0] 本稿では,新しい相乗的推論フレームワークであるSynergos-VQAを提案する。
コアとなるSynergos-VQAは、推論時に3つの補完的なエビデンスストリームを同時に生成し、融合する。
提案手法は強力なプラグアンドプレイ能力を示し,様々なオープンソースMLLMを大幅に向上させる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:46:04 GMT)
A Novel Evaluation Benchmark for Medical LLMs: Illuminating Safety and Effectiveness in Clinical Domains [15.7] 大言語モデル (LLMs) は臨床決定支援において有望であるが、安全性評価と有効性検証において大きな課題に直面している。
臨床専門家のコンセンサスに基づく多次元フレームワークであるCSEDBを開発した。
13名の専門医が, 現実のシナリオをシミュレートする26の臨床部門にまたがって, 2,069件のオープンエンドQ&A項目を作成した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:51:25 GMT)
Generative Modeling with Multi-Instance Reward Learning for E-commerce Creative Optimization [15.5] eコマース広告では、創造的要素の最も説得力のある組み合わせを選択することが、ユーザの注意を引き、コンバージョンを推進するために重要である。
我々は、生成モデリングとマルチインスタンス報酬学習を統合したGenCOという新しいフレームワークを提案する。
われわれのアプローチは広告収入を大幅に増加させ、その実用的価値を示している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:53:41 GMT)
Out of Distribution, Out of Luck: How Well Can LLMs Trained on Vulnerability Datasets Detect Top 25 CWE Weaknesses? [15.4] 自動脆弱性検出研究のための3部構成のソリューションを提案する。
まず、手動でキュレートされたテストデータセットであるBenchVulを紹介します。
第2に,38,863個の関数からなる高品質なトレーニングデータセットTitanVulを構築した。
第3に,コンテキスト認識型脆弱性事例を合成するリアリスティック脆弱性生成(RVG)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:33:24 GMT)
CLIP-Flow: A Universal Discriminator for AI-Generated Images Inspired by Anomaly Detection [15.4] 本稿では,異常検出の観点から,汎用的なAI生成画像検出器を提案する。
我々の識別器は、任意のAIIにアクセスし、教師なし学習で一般化可能な表現を学ぶ必要はない。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:12:37 GMT)
Dual Recursive Feedback on Generation and Appearance Latents for Pose-Robust Text-to-Image Diffusion [15.4] 制御可能なT2Iモデルにおける制御条件を適切に反映する訓練不要なDual Recursive Feedback(DRF)システムを提案する。
提案手法は高品質でセマンティック・コヒーレントで構造的に一貫した画像を生成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:46:00 GMT)
Transferable Model-agnostic Vision-Language Model Adaptation for Efficient Weak-to-Strong Generalization [15.4] 視覚言語モデルのためのトランスミタブルモデル非依存アダプタ(TransMiter)を提案する。
TransMiterは、事前訓練されたVLMと微調整されたVLMの間の知識ギャップをキャプチャする。
バックプロパゲーションを必要とせずに、異なるモデル間でシームレスに転送できる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:55:10 GMT)
CWFBind: Geometry-Awareness for Fast and Accurate Protein-Ligand Docking [15.3] 局所曲率特性に基づく重み付き高速かつ高精度なドッキング法であるCWFBindを紹介する。
CWFBindは、複数のドッキングベンチマークで競合するパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:15:10 GMT)
Gen-AFFECT: Generation of Avatar Fine-grained Facial Expressions with Consistent identiTy [15.3] GEN-AFFECTはパーソナライズされたアバター生成のための新しいフレームワークである。
表情の多様なセットを持つ表現的でアイデンティティに一貫性のあるアバターを生成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:35:35 GMT)
Semantic-aware DropSplat: Adaptive Pruning of Redundant Gaussians for 3D Aerial-View Segmentation [15.2] SAD-Splatという新しい3D-AVS-SSアプローチを提案する。
本手法は,ハードコンクリートの分布に基づいて,意味的信頼度を学習可能な疎性メカニズムと統合する。
セグメンテーションの精度と表現のコンパクトさのバランスは良好である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:57:38 GMT)
Generative Active Adaptation for Drifting and Imbalanced Network Intrusion Detection [15.1] 生成能動適応フレームワークは、モデルロバスト性を高めながらラベリング作業を最小化する。
我々は、シミュレーションIDSデータと実世界のISPデータセットの両方に基づいて、エンドツーエンドフレームワークNetGuardを評価した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:30:38 GMT)
Bridging Modality Gaps in e-Commerce Products via Vision-Language Alignment [15.1] 我々は、画像から高品質な項目記述を生成するために、リスト作成のための好みベースのAI(OPAL)を提案する。
OPALは視覚的モダリティとテキスト的モダリティのギャップを埋め、より豊かで、より正確で、一貫性のあるアイテム記述を提供する。
この作業は自動リスティング最適化を推進し、eコマースプラットフォームにおけるスケーラブルで高品質なコンテンツ生成をサポートする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:22:53 GMT)
Learn to Explore: Meta NAS via Bayesian Optimization Guided Graph Generation [15.1] 本稿では,新しいMeta-NASフレームワークGraB-NASを提案する。
GraB-NASはまず、ニューラルネットワークをグラフとしてモデル化し、次に新しいグラフを見つけて生成するためのハイブリッド検索戦略を開発する。
実験により、GraB-NASは最先端のMeta-NASベースラインを上回る性能を示し、より優れた一般化と探索効率を実現している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:43:59 GMT)
RAGAR: Retrieval Augmented Personalized Image Generation Guided by Recommendation [15.0] 我々は、レコメンデーション(RAGAR)でガイドされた検索機能拡張パーソナライズされた画像ジェネレーションを提案する。
提案手法では,参照項目との類似性に応じて,異なる重み付けを過去の項目に割り当てるための検索機構を用いる。
RAGARは、パーソナライゼーションとセマンティックメトリクスの両方において、5つのベースラインに比べて大幅に改善されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:02:50 GMT)
Joint multi-dimensional dynamic attention and transformer for general image restoration [15.0] 屋外のイメージは 雨や迷路、騒音などによって 深刻な劣化に苦しむことが多い
現在の画像復元法は、効率を保ちながら複雑な劣化を扱うのに苦労している。
本稿では,多次元動的注意と自己注意を組み合わせた新しい画像復元アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:10:56 GMT)
Graph Neural Network and Transformer Integration for Unsupervised System Anomaly Discovery [15.0] 本研究では,分散バックエンドサービスシステムを対象とした教師なし異常検出手法を提案する。
複雑な構造的依存関係、多様な振る舞いの進化、ラベル付きデータの欠如といった現実的な課題に対処する。
その結果,提案手法はいくつかの重要な指標において既存モデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:35:58 GMT)
StepFun-Prover Preview: Let's Think and Verify Step by Step [14.9] 本稿では,ツール統合推論による形式定理証明のための大規模言語モデルであるStepFun-Prover Previewを提案する。
提案手法は,実時間環境フィードバックに基づく証明を反復的に精錬することにより,人間的な問題解決戦略をエミュレートすることを可能にする。
miniF2F-testベンチマークでは、StepFun-Proverがパス@1成功率70.0%$を達成した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:58:50 GMT)
Listening with Language Models: Using LLMs to Collect and Interpret Classroom Feedback [14.8] 大規模言語モデル(LLM)を利用したチャットボットは、学生に反射的で会話的な対話をさせ、教室のフィードバックプロセスを再現することができる。
以上の結果から, LLMに基づくフィードバックシステムは, 標準的な調査ツールと比較して, より豊かな洞察, 文脈的関連性, エンゲージメントを提供する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:53:55 GMT)
MapStory: Prototyping Editable Map Animations with LLM Agents [14.7] MapStoryは、自然言語テキストから直接マップアニメーションシーケンスを生成するアニメーションプロトタイピングツールである。
ユーザがスクリプトを書くと、MapStoryは自動的にシーン分解を生成し、テキストをキーマップアニメーションプリミティブに分解する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:00:47 GMT)
GridRoute: A Benchmark for LLM-Based Route Planning with Cardinal Movement in Grid Environments [14.6] 大規模言語モデル(LLM)は、計画と推論タスクにおけるその可能性を実証している。
LLMが従来のアルゴリズムをどのように活用できるかを評価するための総合評価ベンチマークGridRouteを提案する。
また,従来のアルゴリズムのプロンプト指導を取り入れた,アルゴリズム・オブ・シント(AoT)と呼ばれる新しいハイブリッドプロンプト手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:59:06 GMT)
MetaCipher: A Time-Persistent and Universal Multi-Agent Framework for Cipher-Based Jailbreak Attacks for LLMs [14.5] 低コストでマルチエージェントのジェイルブレイクフレームワークであるMetaCipherを提案する。
わずか10クエリで、MetaCipherは最近の悪意のあるプロンプトベンチマークで最先端の攻撃成功率を達成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:28:17 GMT)
InfoCausalQA:Can Models Perform Non-explicit Causal Reasoning Based on Infographic? [14.4] 本稿ではインフォグラフィックに基づく因果推論を評価するための新しいベンチマークであるInfoCausalQAを紹介する。
第1タスクは推論された数値傾向に基づく定量的因果推論に焦点を当て,第2タスクは5種類の因果関係を含む意味因果推論を対象とする。
実験の結果,現在のビジョン・ランゲージモデルでは,計算的推論の能力に限界があり,意味的因果推論の能力にも限界があることが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:02:35 GMT)
Fiber transmission of cluster states via multi-level time-bin encoding [14.4] クラスター状態は、局所的な測定の下で絡み合いを保持する多粒子の絡み合い状態である。
2光子マルチレベル時間ビン符号化を用いて,25kmの単一モードファイバ上に4ビットのクラスタ状態が最初に伝送されることを実証した。
提案手法により, 長距離ファイバ上での複雑な量子状態の伝送が可能となり, マルチパーティイトプロトコルの実装が可能となった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:18:52 GMT)
EEGDM: EEG Representation Learning via Generative Diffusion Model [14.2] 生成拡散モデル(EEGDM)に基づく脳波表現学習フレームワークを提案する。
具体的には,脳波信号の時間的ダイナミクスをよりよく捉えるために,拡散事前訓練(SSMDP)のための構造化状態空間モデルを開発した。
提案した潜時核融合変換器 (LFT) を用いた下流分類作業において, 得られた潜時脳波表現を用いた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:40:52 GMT)
Waymo-3DSkelMo: A Multi-Agent 3D Skeletal Motion Dataset for Pedestrian Interaction Modeling in Autonomous Driving [14.2] 3DSkelMoは、明示的な相互作用意味を持つ高品質で時間的に整合した3D骨格運動を提供する最初の大規模データセットである。
データセットは、800以上の実走行シナリオで14,000秒以上をカバーしている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:39:56 GMT)
SkySplat: Generalizable 3D Gaussian Splatting from Multi-Temporal Sparse Satellite Images [14.2] 疎視可能な衛星画像から3次元のシーンを再現することは、長年の課題である。
RPCモデルを一般化可能な3DGSパイプラインに統合する新しいフレームワークであるSkySplatを提案する。
シーンごとの最適化手法と比較して、SkySplatは高精度でEOGSの86倍の高速化を実現している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:17:51 GMT)
Enhancing Monocular 3D Hand Reconstruction with Learned Texture Priors [14.1] 立体的手作りにおけるテクスチャの役割を再考し,光写実主義の余白としてではなく,密集した空間的に接地されたキューとして捉えた。
紫外線テクスチャ空間に画素ごとの観察を組み込む軽量なテクスチャモジュールを提案する。
結果として得られたシステムは精度とリアリズムの両方を改善し、手再建における外観誘導アライメントの価値を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:59:51 GMT)
Re:Verse -- Can Your VLM Read a Manga? [14.1] 現在の視覚言語モデル(VLM)は、表面レベルの認識と深い物語的推論の間に重要なギャップを示す。
本稿では,細粒度マルチモーダルアノテーション,クロスモーダル埋め込み解析,検索強化評価を組み合わせた新しい評価フレームワークを提案する。
本稿では,VLMにおける長期的物語理解に関する最初の体系的研究を,生成的ストーリーテリング,文脈的対話グラウンドニング,時間的推論という3つのコア評価軸を通じて行った。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:37:25 GMT)
MoSE: Skill-by-Skill Mixture-of-Experts Learning for Embodied Autonomous Machines [14.0] 本稿では,AIの推論と学習効率を大幅に向上させる新しいMixture-of-Expert(MoE)手法を提案する。
一般的なMoEモデルは、広範囲なトレーニングデータと複雑な最適化を必要とする。
我々は,人間の学習と推論プロセスのスキル・バイ・スキル・バイ・ステップを模倣した,MoSEと呼ばれるスキル指向のMoEを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:45:40 GMT)
Dequantified Diffusion-Schr{ö}dinger Bridge for Density Ratio Estimation [14.0] 密度比の推定は$f$-divergencesを含むタスクの基本である。
我々は,textbfrobust, textbfstable, textbfefficient 密度比推定のための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:22:31 GMT)
Hummingbird: Fast, Flexible, and Fair Inter-Domain Bandwidth Reservations [13.9] インターネットは、ビデオ通話やゲーム、クラウドベースのシステム、金融取引、遠隔操作など、信頼できるコミュニケーションの恩恵を受けるリアルタイムアプリケーションに対して、品質保証を欠いている。
本稿では、エンドホストのドメイン間予約をきめ細かいものにするための、新しい軽量帯域保存システムであるHummingbirdについて紹介する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:30:03 GMT)
Dynamic Mixture-of-Experts for Incremental Graph Learning [13.5] インクリメンタル学習のための動的ミックス・オブ・エキスパート(DyMoE)アプローチを提案する。
DyMoEは、入ってくるデータブロックをモデリングする専門家ネットワークを追加する。
本モデルは,クラスインクリメンタル学習における最良ベースラインと比較して,相対的精度が4.92%向上した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:41:19 GMT)
RayletDF: Raylet Distance Fields for Generalizable 3D Surface Reconstruction from Point Clouds or Gaussians [13.4] RGB画像からの3DGSによる原点雲や事前推定3次元ガウシアンからの3次元表面再構成法を提案する。
明示的な曲面を描画する際にしばしば計算集約的な既存の座標ベースの手法とは異なり、提案手法はレイレット距離場と呼ばれる新しい手法を導入している。
本手法は異常な一般化能力を実現し,テスト中の未知のデータセットにまたがる単一前方通過における3次元表面の復元に成功している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:05:21 GMT)
EGGS-PTP: An Expander-Graph Guided Structured Post-training Pruning Method for Large Language Models [13.4] 本研究は,Expander-Graph Guided Structured Post-training Pruning法であるEGGS-PTPを紹介する。
提案手法はグラフ理論を利用してN:M構造化プルーニングの設計を導出する。
EGGS-PTPは、構造的間隔による大幅な加速とメモリ節約を実現する。
また、様々な大規模言語モデルにおいて、既存の構造化プルーニング技術よりも精度が高い。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:00:56 GMT)
SpeechForensics: Audio-Visual Speech Representation Learning for Face Forgery Detection [13.3] 顔の偽造ビデオの検出は、デジタル鑑識の分野では、いまだに深刻な課題だ。
我々は,自己教師付きマスキング予測タスクを用いて,実映像における音声・視覚音声の正確な表現を学習する。
提案手法は, クロスデータセットの一般化とロバストネスの観点から, 最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:09:36 GMT)
COXNet: Cross-Layer Fusion with Adaptive Alignment and Scale Integration for RGBT Tiny Object Detection [13.2] マルチモーダル赤緑色サーマル(RGBT)画像における微小物体検出のための新しいフレームワークを提案する。
クロス層核融合モジュールは、セマンティックおよび空間的精度を高めるために、高レベルの可視・低レベルの熱特徴を融合する。
Dynamic Alignment and Scale Refinement Modules corrects cross-modal space misalignment。
GeoShapeの類似度測定は、より優れたローカライゼーションに使用される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:30:03 GMT)
GenAI Confessions: Black-box Membership Inference for Generative Image Models [13.1] モデルが特定の画像や画像に対してトレーニングされたかどうかを判断する手法について述べる。
この方法は計算的に効率的であり、モデルアーキテクチャや重みに関する明確な知識を前提としない。
我々は、既存のモデルの監査にこの手法が不可欠であると予測し、生成AIモデルのより公平な開発と展開を期待する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:20:50 GMT)
Guardians and Offenders: A Survey on Harmful Content Generation and Safety Mitigation of LLM [13.1] 大規模言語モデル(LLM)は、デジタルプラットフォーム全体でコンテンツ作成に革命をもたらした。
LLMは、コンテンツ生成、質問と回答(Q&A)、プログラミング、コード推論といった有益なアプリケーションを可能にする。
また、意図的または故意に有害、攻撃的、偏見のあるコンテンツを発生させることで深刻なリスクを生じさせる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:40:27 GMT)
Episodic Memory Verbalization using Hierarchical Representations of Life-Long Robot Experience [13.0] 本研究では,大規模な事前学習モデルを用いて,エピソードデータの短い(数分間の)ストリームを音声化する。
樹状データ構造をエピソードメモリ(EM)から導出し,その低レベルは生の知覚と固有受容のデータを表す。
シミュレーションされた家庭用ロボットデータ,人間中心ビデオ,実世界のロボット記録について評価を行った。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:28:24 GMT)
Emergence of Hierarchies in Multi-Agent Self-Organizing Systems Pursuing a Joint Objective [12.9] マルチエージェント自己組織化システム(MASOS)は、スケーラビリティ、適応性、柔軟性、堅牢性などの重要な特徴を示す。
本稿では,タスク実行時の依存性階層の出現に注目した。
他のエージェントの状態に関する各エージェントの動作の勾配を計算することで、エージェント間の依存関係を定量化する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:50:03 GMT)
MGDFIS: Multi-scale Global-detail Feature Integration Strategy for Small Object Detection [12.8] UAV画像の小さな物体検出は、探索・救助、交通監視、環境監視といった用途に不可欠である。
既存のマルチスケール融合法は、計算負荷を増し、詳細をぼかすのに役立つ。
本稿では,グローバルコンテキストと局所的な詳細を密結合して検出性能を向上させる統合融合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:13:33 GMT)
Improving the Speaker Anonymization Evaluation's Robustness to Target Speakers with Adversarial Learning [12.6] 評価においてターゲット話者情報の影響を計測するターゲット分類器を提案する。
実験により、このアプローチは複数の匿名化器に有効であることが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:38:09 GMT)
Integrating Clinical Knowledge Graphs and Gradient-Based Neural Systems for Enhanced Melanoma Diagnosis via the 7-Point Checklist [12.6] 従来の7PCLは悪性黒色腫と黒色腫の区別に限られている。
臨床知識に基づくトポロジカルグラフ(CKTG)と勾配診断戦略を統合する新しい診断フレームワークを提案する。
AUCAは平均88.6%と評価され,メラノーマ検出の特徴予測において優れた性能を示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:24:28 GMT)
Verifying Quantized Graph Neural Networks is PSPACE-complete [12.4] 本稿では,GNN特性を検証するための線形制約付き妥当性 (LVP) 問題を提案する。
妥当なアクティベーション関数に対して,LPPがPSPACEに含まれることを示す。
また、PSPACEの硬さを証明し、量子化GNNの推論は実現可能であるが、一般には計算が困難であることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:45:34 GMT)
A Lightweight Learned Cardinality Estimation Model [12.3] 本稿では,Covering with Decompositions (Covering with Decompositions) と呼ばれる新しいデータ駆動手法を提案する。
CoDeでは、表を複数の小さな重なり合うセグメントに分割するカバーデザインという概念を採用している。
複数のモデルを用いて分布を近似することで、CoDeは離散分布を効果的にモデル化し、計算効率を確保する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:34:58 GMT)
TriForecaster: A Mixture of Experts Framework for Multi-Region Electric Load Forecasting with Tri-dimensional Specialization [12.3] 我々は,大規模領域内の複数のサブリージョンに対して,短時間の負荷予測を正確に行うことを目的としたMRELF(Multi-Region Electric Load Forecasting)問題に着目する。
本稿では,MTL(Multi-Task Learning)パラダイムにおけるME(Mixture of Experts)アプローチを活用した新しいフレームワークであるTriForecasterを提案する。
粒度の異なる4つの実世界のMRELFデータセットの評価に基づいて、TriForecasterは平均予測誤差を22.4%削減することで最先端のモデルより優れている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:34:15 GMT)
Demystifying the Role of Rule-based Detection in AI Systems for Windows Malware Detection [12.3] マルウェア検出は、署名に基づく検出と機械学習を統合するAIシステムにますます依存している。
本研究では,シグネチャベースの検出がトレーニングパイプラインに含まれる場合のモデルトレーニングに与える影響について検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:35:51 GMT)
A BERT-based Hierarchical Classification Model with Applications in Chinese Commodity Classification [12.2] 本稿では,JD eコマースプラットフォーム(www.JD.com)から収集した大規模階層的データセットを紹介する。
また,変換器からの双方向表現(BERT)に基づく新しい階層型テキスト分類手法を提案する。
我々のHFT-BERTモデルは、書籍などの長文を分類する際、例外的な性能を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:10:47 GMT)
Multi-Turn Puzzles: Evaluating Interactive Reasoning and Strategic Dialogue in LLMs [12.2] 大きな言語モデル(LLM)は、明確で完全なステートメントで問題を解決するのに優れています。
このベンチマークは、複雑でインタラクティブなシナリオを扱う上で、現在のLLMの長所と短所に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:14:45 GMT)
Learning Adaptive Node Selection with External Attention for Human Interaction Recognition [11.9] ほとんどのGCNベースの手法は、個人を独立したグラフとして相互作用させ、固有の相互依存を無視している。
本研究では,外部注意ネットワークを用いたアクティブノード選択(ASEA)を提案する。
本手法は,各個人がGCNを用いて個人内関係を把握し,行動の詳細な表現を容易にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:52:46 GMT)
GazeLT: Visual attention-guided long-tailed disease classification in chest radiographs [11.9] 本稿では,長期的疾患分類のための人間の視覚的注意統合分解アプローチであるGazeLTについて述べる。
放射線科医の視線は、細粒度と粗いレベルの疾患関連情報の両方を捉えた異なるパターンを持つ。
GazeLTは、視覚検索プロセスの時間的側面を統合と分解機構を通じて利用し、長い尾の病気分類を改善する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:13:27 GMT)
On the synchronization between Hugging Face pre-trained language models and their upstream GitHub repository [11.8] 事前訓練された言語モデル(PTLM)は、高度な自然言語処理(NLP)を持つ。
PTLMはアップストリームリポジトリ(GitHub、GHなど)のコードと環境スクリプトを使用してトレーニングされ、Hugging Face (HF)のような下流プラットフォーム経由で変種として配布される。
GHとHFのコーディネート開発は、不整合リリーススケジュール、一貫性のないバージョニング、PTLMバリアントの限定的な再利用といった課題を生んでいる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:45:09 GMT)
Topological Structure Description for Artcode Detection Using the Shape of Orientation Histogram [11.8] この研究は、情報をトポロジにエンコードすることで、自由な外観で自分自身をカモフラージュする特別な種類のオブジェクト(Artcodes)を研究する。
我々は、Artcodesの存在をArtcode提案検出として再定義する問題を定式化する。
この問題に対処するため,Artcodeの一般的なトポロジ的構造を記述するために,方向ヒストグラム形状と呼ばれる新しい特徴記述子を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:33:01 GMT)
Towards Self-cognitive Exploration: Metacognitive Knowledge Graph Retrieval Augmented Generation [11.8] 知識グラフに基づく検索言語生成(KG-RAG)は,大規模言語モデルの推論能力を著しく向上させる。
既存のKG-RAGフレームワークはオープンループシステムとして機能し、認知障害に悩まされている。
本稿ではメタ認知的知識グラフ検索拡張生成(MetaKGRAG)を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:35:32 GMT)
Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory [11.7] 本稿では,長期記憶を備えた新しいフレームワークであるM3-Agentを紹介する。
M3-Agentは、リアルタイムの視覚および聴覚入力を処理して、長期記憶の構築と更新を行うことができる。
我々は,M3-Benchという長ビデオ質問応答ベンチマークを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:03:03 GMT)
HKT: A Biologically Inspired Framework for Modular Hereditary Knowledge Transfer in Neural Networks [11.6] Hereditary Knowledge Transfer (HKT) は、大規模で事前訓練された親ネットワークから小さな子モデルへのタスク関連機能のモジュール化と選択的移行のためのフレームワークである。
HKTは、メモリRNA転送などの生物学的継承機構からインスピレーションを得て、多段階の機能伝達を導く。
我々は、光学的フロー、画像分類、セマンティックセグメンテーションを含む多様な視覚タスクのHKTを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:13:28 GMT)
CAS-IQA: Teaching Vision-Language Models for Synthetic Angiography Quality Assessment [11.5] 低品質の合成血管造影は、手続き的リスクを著しく増大させる。
本稿では,視覚言語モデル(VLM)に基づく細粒度品質スコア予測フレームワークであるCAS-IQAを提案する。
CAS-3Kデータセットの実験では、CAS-IQAは最先端のIQA法よりもかなり優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:31:50 GMT)
The Perils of Chart Deception: How Misleading Visualizations Affect Vision-Language Models [11.5] VLM(Vision-Language Models)は、特に専門家でないユーザによって可視化の解釈に使用されるようになっている。
本研究では,8種類のミスリードチャートを対象とする10種類のモデルから16,000以上の応答を解析した。
本研究は,視覚的誤報に対するVLMの堅牢な保護の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:11:18 GMT)
Neural Bandit Based Optimal LLM Selection for a Pipeline of Tasks [11.4] 本稿では,各サブタスク上でLLMの成功をオンラインにモデル化するニューラルネットワークをトレーニングするニューラルネットワークのコンテキスト帯域ベースアルゴリズムを提案する。
通信質問応答と診断予測データセットの実験から,提案手法の有効性が示唆された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:19:41 GMT)
Vision-driven River Following of UAV via Safe Reinforcement Learning using Semantic Dynamics Model [11.3] 無人航空機による視覚駆動の自律川は、救助、監視、環境監視といった用途に欠かせない。
報奨関数がサブモジュラーであり、よりユニークな河川セグメントが訪れるとリターンが低下するカバレッジ制御問題として、河川追従を定式化する。
本稿では,モデルベースのSafeRLフレームワークを構築するために,アクタ,コスト推定器,SDMを統合するConstrained Actor Dynamics Estimatorアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:39:09 GMT)
Physics-guided Deep Unfolding Network for Enhanced Kronecker Compressive sensing [11.3] 我々は,新しい非対称Kronecker CS(AKCS)モデルを提案し,理論上は以前のKronecker CSよりも優れた非コヒーレンスを示す。
暗黙的な計測表現を学習するためのMACA機構を提案する。
我々は、AKCSとMACAを広く使われている展開アーキテクチャに統合し、計測強化展開ネットワーク(MEUNet)を得る。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:21:58 GMT)
Leveraging Reviewer Experience in Code Review Comment Generation [11.2] 私たちは、自然言語のコードレビューを提供する際に、人間のレビュアーを模倣するためにディープラーニングモデルを訓練します。
生成したレビューの品質は、モデルトレーニングで使用されるオープンソースのコードレビューデータの品質のため、まだ最適化されていない。
本稿では,レビュー品質の指標として,過去のレビュアのオーサリングとレビューを活かした経験学習手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:27:59 GMT)
Finite-Time Global Optimality Convergence in Deep Neural Actor-Critic Methods for Decentralized Multi-Agent Reinforcement Learning [11.2] 分散マルチエージェント強化学習(MARL)のためのアクタークリティカルな手法は,集中的協調を伴わない協調的最適意思決定を容易にする。
我々は、アクターと批評家の両方が本質的に非線形である分散MARLのためのディープ・ニューラルアクター批判法を開発するための最初の試みを行う。
これは、MARL文学におけるディープ・ニューラル・アクター・クリティカルな手法に対する最初のグローバルな収束結果である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:12:42 GMT)
Can LLM-Generated Textual Explanations Enhance Model Classification Performance? An Empirical Study [11.1] 高品質なテキスト記述を自動生成するフレームワークを提案する。
自然言語生成(NLG)メトリクスの包括的スイートを用いて,これらの説明の質を厳格に評価する。
本実験により,自動説明は人手による説明に比べて高い競争力を示すことが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:59:08 GMT)
CD-TVD: Contrastive Diffusion for 3D Super-Resolution with Scarce High-Resolution Time-Varying Data [11.0] CD-TVDは、コントラスト学習と改良された拡散ベース超解像モデルを組み合わせたフレームワークである。
流体および大気シミュレーションデータセットの結果、CD-TVDが正確で資源効率のよい3D超解像を提供することを確認した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:05:00 GMT)
EntropyGS: An Efficient Entropy Coding on 3D Gaussian Splatting [11.0] 3DGSは、より優れた視覚的品質で高速なトレーニング/レンダリングを実演する。
まず3DGSガウス属性の相関と統計的解析から始める。
因数化およびパラメータ化エントロピー符号化法であるEntropyGSを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:48:49 GMT)
FinSage: A Multi-aspect RAG System for Financial Filings Question Answering [11.0] FinSageはマルチモーダルな事前処理パイプラインで、多様なデータフォーマットを統一し、メタデータの要約を生成する。
実験の結果、FinSageは75人の専門家による質問に対して92.51%の印象的なリコールを達成した。
FinSageは、すでに1200人以上が利用しているオンラインミーティングにおいて、財務的な質問応答エージェントとして成功している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:01:34 GMT)
From Ranking to Selection: A Simple but Efficient Dynamic Passage Selector for Retrieval Augmented Generation [10.9] 本稿では,経路選択を教師付き学習問題として扱う新しいフレームワークであるDynamic Passage Selector (DPS)を紹介する。
シームレスなプラグイン・アンド・プレイモジュールとして、DPSは標準的なRAGパイプラインを変更する必要はない。
DPSは適応的エビデンス選択を可能にすることにより,複雑なRAGシナリオにおける推論能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:05:34 GMT)
Multi-Sequence Parotid Gland Lesion Segmentation via Expert Text-Guided Segment Anything Model [10.9] 耳下腺セグメントモデル(PG-SAM)は、耳下腺病変セグメント化の専門知識を取り入れている。
PG-SAMは、3つの独立した臨床センターにまたがる耳下腺病変の分節における最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:25:29 GMT)
Adoption of Explainable Natural Language Processing: Perspectives from Industry and Academia on Practices and Challenges [10.8] 説明可能な自然言語処理の分野は近年急速に成長している。
説明可能なNLPに注目が集まる一方で、実践者の実践的採用と有効性に対する視点はいまだに過小評価されている。
本稿では,説明可能性に関する実践者の経験を調査することで,この研究ギャップに対処する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:12:18 GMT)
Reasoning About Knowledge on Regular Expressions is 2EXPTIME-complete [10.6] 公開観測論理 (Public Observation Logic, POL) は、公開観測に基づいて更新される知識を推論するための、公開発表論理の変種である。
本研究では,$POL$の満足度問題は2EXPTIME完全であることを証明した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:10:16 GMT)
ReqInOne: A Large Language Model-Based Agent for Software Requirements Specification Generation [10.4] LLM(Large Language Model)ベースのアプローチは幻覚と限定的な制御性に悩まされる。
ReqInOneでは,SRS生成を要約,要件抽出,要件分類という3つのタスクに分解することで,モジュールアーキテクチャを採用している。
GPT-4o, LLaMA 3, DeepSeek-R1 を用いて ReqInOne の評価を行い, 得られた SRS と GPT-4 をベースとした手法との比較を行った。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:30:41 GMT)
ProbRadarM3F: mmWave Radar based Human Skeletal Pose Estimation with Probability Map Guided Multi-Format Feature Fusion [10.3] 本稿では,確率マップによるマルチフォーマット特徴融合モデルProbRadarM3Fを提案する。
ProbRadarM3Fは従来のヒートマップの特徴と位置特徴を融合させ、効果的に14個の人体のキーポイントを推定する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:53:37 GMT)
SARE: Semantic-Aware Reconstruction Error for Generalizable Diffusion-Generated Image Detection [10.2] 本稿では,画像とキャプション誘導再構成のセマンティック・アウェア・リコンストラクション・エラー(SARE)を計測する新しい表現を提案する。
これらの意味的シフトを定量化することにより、SAREは多様な生成モデル間で堅牢な検出を行うための識別的特徴として利用することができる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:37:36 GMT)
Beyond Scaling Law: A Data-Efficient Distillation Framework for Reasoning [10.2] 大規模言語モデル(LLM)は、アルゴリズムコーディングや数学的問題解決といったタスクにおいて顕著な推論能力を示す。
近年の手法では,強化学習と教師付き微調整を組み合わせた多段階学習による推論が改良されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:32:25 GMT)
The Illusion of Progress: Re-evaluating Hallucination Detection in LLMs [10.1] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、その幻覚化傾向は信頼性の高いデプロイメントに深刻な課題をもたらす。
幻覚検出法は多数あるが、その評価は人間の判断と不一致した語彙的重なりに基づく尺度であるROUGEに依存することが多い。
我々は,幻覚検出手法の真の性能を正確に評価するために,意味的認識と頑健な評価フレームワークの採用が不可欠であると主張している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:09:11 GMT)
On Negative-aware Preference Optimization for Recommendation [10.1] LLMに基づくリコメンデーションにおいて、優先最適化のための拡張されたフレームワークであるNAPOを提案する。
NAPO は,(1) 負のサンプルのプールをメモリオーバーヘッドを伴わずに拡張する in-batch 負の共有,(2) 負のサンプルの信頼度に基づいてモデル更新を適応する dynamic reward margin adjust という2つの重要なイノベーションを導入している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:37:07 GMT)
Sparse Spectral Training and Inference on Euclidean and Hyperbolic Neural Networks [10.0] Low-Rank Adaptation (LoRA) と ReLoRA は低ランク構造で課題に直面している。
予備学習におけるメモリ使用量の最適化を目的としたスパーススペクトルトレーニング(SST)を提案する。
SSTは、他の低ランクメソッドとフルランクトレーニングの間の難易度ギャップを97.4%削減する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:03:13 GMT)
Stable Diffusion Models are Secretly Good at Visual In-Context Learning [9.8] 既成の安定拡散モデルが視覚的文脈内学習(V-ICL)に再利用可能であることを示す。
安定拡散アーキテクチャの自己アテンション層内でのインプレースアテンション再計算を定式化する。
この再利用された安定拡散モデルは、6つの異なるタスクに適応可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:08:22 GMT)
Memorization Over Reasoning? Exposing and Mitigating Verbatim Memorization in Large Language Models' Character Understanding Evaluation [9.8] 大きな言語モデル(LLM)は、文字理解タスクにおいて素晴らしいパフォーマンスを示している。
我々は「ギストメモリ」が文字理解タスクの主要なメカニズムであるべきだと論じている。
本稿では,文字理解評価において,機械的記憶を緩和する簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:44:46 GMT)
Entanglement certification from moments of positive maps [9.8] エンタングルメント認証は、特に量子状態の部分的な知識のみが利用可能である場合、物理実験において重要である。
本稿では, 正の正の正の写像に基づく絡み合い基準を提案し, 出力状態の固有値の同定を不要とする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:51:58 GMT)
DRWKV: Focusing on Object Edges for Low-Light Image Enhancement [9.7] 提案するGerbal Edge Retinex(GER)理論を統合した新しいモデルDRWKVを提案する。
第3に,バイラテラルスペクトルアリグナー (Bilateral Spectrum Aligner, Bi-SAB) とMS2-Lossを設計し, 発光特性とクロミナンス特性を協調的に調整する。
5つのLLIEベンチマークの実験により、DRWKVはPSNR、SSIM、NIQEにおいて主要な性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:34:44 GMT)
Scaling Vision Mamba Across Resolutions via Fractal Traversal [9.6] Vision MambaはTransformerベースのアーキテクチャに代わる有望な選択肢として最近登場した。
Hilbert曲線によるフラクタルベースのパッチシリアライゼーションを活用するビジョンバックボーンであるFractalMamba++を提案する。
FractalMamba++は、従来のMambaベースのバックボーンよりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:22:53 GMT)
FM4NPP: A Scaling Foundation Model for Nuclear and Particle Physics [9.5] 我々は,1100万人以上の粒子衝突イベントと下流タスクとラベル付きデータからなる新しいデータセットを導入し,評価を行った。
そこで本研究では,最大1億8800万個のパラメータを持つモデルを用いて,検出データの自己教師付きトレーニング手法を提案し,そのニューラルネットワーク拡張性を実証する。
フリーズウェイトとタスク固有のアダプタにより、FMはすべてのダウンストリームタスクのベースラインモデルより一貫して優れています。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:05:06 GMT)
Vision Language Models Know Law of Conservation without Understanding More-or-Less [9.3] ConserveBenchは、物理量の4次元にわたる365の認知実験の電池である。
ビジョン言語モデルは一般的に変換タスクに長けているが、非変換タスクでは失敗する傾向にある。
操作の可逆性を理解することと量の概念を理解することには解離がある。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:42:38 GMT)
Probing Mechanical Reasoning in Large Vision Language Models [9.3] 我々は,26ビジョン言語モデル(VLM)におけるシステム安定性,ギア,プーリーシステムの理解,原理,慣性,運動,流体力学の検証を行った。
以上の結果から,VLMはすべての領域において人間よりも常に悪い性能を示す一方で,歯車システムや流体力学の推論が困難であることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:18:41 GMT)
Describe What You See with Multimodal Large Language Models to Enhance Video Recommendations [9.2] 既存のビデオレコメンデータシステムは、ユーザ定義のメタデータや、特殊なエンコーダによって抽出された低レベルの視覚的および音響的信号に依存している。
本稿では,レコメンデーションパイプラインに高レベルのセマンティクスを注入する,システムに依存しないゼロファインタニングフレームワークを提案する。
MLLM出力と最先端のテキストエンコーダを用いて、標準の協調的、コンテンツベース、生成的レコメンデータに入力する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:19:31 GMT)
EvoCurr: Self-evolving Curriculum with Behavior Code Generation for Complex Decision-making [9.2] 大規模言語モデル(LLM)は、プログラミング、計画、意思決定など、様々な領域にまたがる顕著な能力を示している。
本稿では,新たな自己進化型フレームワークであるEvoCurrを提案する。
本手法は, 直接解法に比べて, タスク成功率と解解効率を著しく向上することを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:59:29 GMT)
FedRecon: Missing Modality Reconstruction in Heterogeneous Distributed Environments [9.2] FedReconは,マルチモーダル学習におけるモダリティ再構築と非IID適応を同時に行うことを目的とした,最初の手法である。
提案手法は,まず軽量なマルチモーダル変分オートエンコーダ(MVAE)を用いて,欠落したモダリティを再構成する。
非IID変動を緩和する大惨な忘れ込みを防止するために,グローバルジェネレータの凍結を利用した戦略を導入する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:19:00 GMT)
Dynamic Rank Adjustment for Accurate and Efficient Neural Network Training [9.1] 我々は,低ランクトレーニングエポック内のフルランクトレーニングエポックを戦略的にインターリーブすることで,モデルの重みのランクを効果的に回復できると主張している。
実験により,提案手法はSVDベースの低ランクトレーニングとほぼ同等の計算コストを実現することが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:18:30 GMT)
Shaping Event Backstories to Estimate Potential Emotion Contexts [9.1] イベント記述に合理的なコンテキストを追加する新しいアプローチを提案する。
私たちのゴールは、これらの豊富なコンテキストが人間のアノテータが感情をより確実にアノテートできるかどうかを理解することです。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:15:52 GMT)
Multimodal Fusion And Sparse Attention-based Alignment Model for Long Sequential Recommendation [9.1] マルチモーダルアイテムシーケンスとマイニング マルチモーダルユーザ興味は、コンテンツ理解とレコメンデーションのギャップを埋めることができます。
本稿では,ムルティモダル核融合とスパースアテンションに基づくアライメントモデルであるMUFASAを提案する。
実世界のベンチマーク実験では、MUFASAが最先端のベースラインを一貫して超越していることが示されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:50:44 GMT)
AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving [9.0] 我々はAWorldフレームワーク内に、堅牢で動的なマルチエージェントシステム(MAS)アーキテクチャを導入します。
我々のアプローチでは、実行エージェントがガードエージェントを重要なステップで起動し、推論プロセスの検証と修正を行います。
GAIAテストデータセットの実験により、我々の動的操作機構は解の有効性と安定性の両方を著しく改善することが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:46:25 GMT)
Ear-Keeper: A Cross-Platform AI System for Rapid and Accurate Ear Disease Diagnosis [8.9] 耳疾患8例と健常症例を対象とした大規模多施設耳内視鏡検査データセットを構築した。
モデルサイズがわずか2.94MBのBest-EarNetは、内部テストセットで95.23%、外部テストセットで92.14%の診断精度を達成した。
我々はBest-EarNet上に構築されたクロスプラットフォームのインテリジェント診断システムであるEar-Keeperを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:08:08 GMT)
Continuous-time q-Learning for Jump-Diffusion Models under Tsallis Entropy [8.9] 本稿では,Tsallisエントロピー正規化の下で,Q-ラーニング(Q-ラーニングの連続的対応)を特徴とするジャンプ拡散モデルの連続時間強化学習について検討する。
ダークプールにおける最適液化問題と非LQ制御問題という2つの数値例について検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:43:33 GMT)
Shifting Perspectives: Steering Vectors for Robust Bias Mitigation in LLMs [8.9] 本稿では,大規模言語モデル(LLM)において,前方通過におけるモデルアクティベーションの修正にステアリングベクトルを適用することにより,バイアス軽減手法を提案する。
我々は、BBQデータセットのトレーニングサブセット上で、それぞれ異なる社会的バイアス軸に対応する8つのステアリングベクトルを計算し、これらの有効性を4つのデータセットにまたがる3つのバイアス緩和手法と比較する。
BBQデータセットに最適化すると、個別に調整されたステアリングベクトルは、BBQで12.8%、CLEAR-Biasで8.3%、StereoSetで1%の平均的な改善が達成される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:45:25 GMT)
MOC: Meta-Optimized Classifier for Few-Shot Whole Slide Image Classification [8.7] メタ言語基盤モデル(VLFM)は、ゼロショット適応による全スライド画像(WSI)分類において、データの不足に対処する上で有望であることを示す。
これらの手法は、大規模なデータセットで訓練された従来のマルチインスタンス学習(MIL)アプローチよりも優れています。
既存の少数ショット法では、限定アノテーションによる診断精度が向上しているが、従来の分類器の設計に依存しているため、データの不足に重大な脆弱性が生じる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:32:42 GMT)
MyTimeMachine: Personalized Facial Age Transformation [8.6] MyTMは、グローバルな老化と個人の写真コレクションを組み合わせて、パーソナライズされた年齢変化を学ぶ。
われわれのアプローチはビデオにも拡張でき、高品質、アイデンティティ保存、時間的に一貫した老化効果を達成できる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:43:22 GMT)
Online Prediction with Limited Selectivity [8.5] 多くのデータ統計は、分布的な仮定や専門家のアドバイスなしに、非自明なエラー率に予測できる。
本稿では,予測者が時間軸のサブセットでのみ予測を開始することができる限定選択性付き予測(PLS)モデルを提案する。
本稿では,インスタンス・バイ・インスタンス・ベースと平均ケース・アナリティクスの両方を用いて最適予測誤差について検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:17:12 GMT)
Implicit Hypergraph Neural Networks: A Stable Framework for Higher-Order Relational Learning with Provable Guarantees [8.5] Indicit Hypergraph Neural Networks (IHGNN)を導入し、非線形不動点方程式の解として表現を計算する。
IHGNNは、正確性と堅牢性の両方において、強力な従来のグラフ/ハイパーグラフニューラルネットワークベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:06:29 GMT)
ContestTrade: A Multi-Agent Trading System Based on Internal Contest Mechanism [8.5] 大規模言語モデル(LLM)に基づくエージェントは、金融取引において大きな可能性を示す。
マーケットノイズに対する高い感度は、LLMベースのトレーディングシステムの性能を損なう。
本稿では,現代企業経営構造にインスパイアされた内部競争機構を特徴とする新しいマルチエージェントシステムを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:17:06 GMT)
MAPS: A Multilingual Benchmark for Global Agent Performance and Security [8.3] 多様な言語やタスクにまたがるエージェントAIシステムを評価するためのベンチマークスイートであるMAPSを提案する。
それぞれのデータセットを11の多様な言語に変換し、805のユニークなタスクと9,660の言語固有のインスタンスを生成します。
我々は、英語から他の言語に移行する際に、パフォーマンスとセキュリティの両方の劣化を観察する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:31:01 GMT)
Representation biases: will we achieve complete understanding by analyzing representations? [8.2] 機械学習における最近の研究は、学習された特徴表現が過剰に表現される可能性があることを示している。
これらのバイアスは、表現分析を通じてシステムを完全に理解する上での課題となる可能性がある。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:31:21 GMT)
STREAM (ChemBio): A Standard for Transparently Reporting Evaluations in AI Model Reports [8.1] STREAM(A Standard for Transparently Reporting Evaluations in AI Model Reports)は、モデルレポートが評価結果を明らかにする方法を改善する標準である。
政府、市民社会、アカデミア、フロンティアAI企業の23人の専門家と協議して開発された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:36:36 GMT)
NegFaceDiff: The Power of Negative Context in Identity-Conditioned Diffusion for Synthetic Face Generation [8.0] NegFaceDiffは、負条件を同一条件拡散過程に組み込む新しいサンプリング手法である。
我々は、NegFaceDiffが、アイデンティティ条件付き拡散モデルによって生成されるデータのアイデンティティ一貫性と分離性を大幅に改善することを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:45:09 GMT)
Fleurs-SLU: A Massively Multilingual Benchmark for Spoken Language Understanding [8.0] 形式的な書記体系を欠いているすべての生きた言語の半数には、音声言語理解が不可欠である。
Fleurs-SLUベンチマークは102言語における話題発声分類のための692時間の音声にまたがる。
我々は、Fleurs-SLU上でのエンドツーエンド音声分類モデル、音声からテキストへの書き起こしとその後のLLMに基づく分類とを組み合わせたケースドシステム、マルチモーダル音声-LLMを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:03:11 GMT)
WEC-DG: Multi-Exposure Wavelet Correction Method Guided by Degradation Description [7.9] 多重露光補正技術は、照明不足や過度な照明の影響を受ける画像の復元に不可欠である。
現在のマルチ露光補正法は、様々な照明条件によるクラス内変動に対処する際の課題となることが多い。
本稿では,分解誘導(WEC-DG)を用いたウェーブレットを用いた露光補正手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:31:44 GMT)
Scalable h-adaptive probabilistic solver for time-independent and time-dependent systems [7.8] 我々は、多数のコロケーションポイントにスケール可能な$h$適応確率的解法を開発する。
提案手法のベンチマークPDEに対する有効性を示すとともに,時間依存性のパラボリックPDEを時空設定で定式化した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:54:18 GMT)
A Unified Contrastive-Generative Framework for Time Series Classification [7.7] コントラスト生成時系列フレームワーク(CoGenT)を提案する。
これは、時間的データにおける高いクラス内類似性に対する対照的な学習の感度を克服し、生成的手法の大規模なデータセットへの依存を減らす。
その結果、59.2%と14.27%のF1がスタンドアローンのSimCLRとMAEをそれぞれ上回り、一貫した改善が見られた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:09:14 GMT)
Revisiting Your Memory: Reconstruction of Affect-Contextualized Memory via EEG-guided Audiovisual Generation [7.7] 本稿では,脳波(EEG)信号から抽出した影響によって誘導される音声・視覚生成によって,自伝的記憶を再構築する新しいタスクであるRevisitAffectiveMemoryを紹介する。
本研究では,9人の参加者から記憶記憶記憶中に収集したテキスト記述,視覚,音楽,脳波記録を含む脳波・感情記憶データセットを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:45:02 GMT)
TRACE: Learning 3D Gaussian Physical Dynamics from Multi-view Videos [7.6] 複雑な動的3次元シーンの運動物理をモデル化する新しいフレームワークTRACEを提案する。
各3次元点を空間の大きさと向きの剛性粒子として定式化することにより、各粒子の変換回転力学系を直接学習する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:43:01 GMT)
RampNet: A Two-Stage Pipeline for Bootstrapping Curb Ramp Detection in Streetscape Images from Open Government Metadata [7.5] カーブランプは都会のアクセシビリティーに欠かせないが、画像をしっかりと検出することは未解決の問題である。
ランプ検出データセットの縮小とモデル性能の向上を目的として,RampNetと呼ばれる2段階パイプラインを導入,評価した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:22:48 GMT)
WebArXiv: Evaluating Multimodal Agents on Time-Invariant arXiv Tasks [7.5] 本稿では,自律型Webエージェント評価のためのベンチマークであるWebArXivを紹介する。
WebArXivは、arXivプラットフォーム上に275のWebベースのタスクで構成されている。
エージェントが関連する過去のステップを選択的に検索できる軽量な動的反射機構を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:05:05 GMT)
A pseudo-inverse of a line graph [7.4] 線グラフの空間に小さな摂動が存在する場合について検討し、対応するルートグラフの復元を試みる。
本稿では,線グラフの最小のエッジを編集し,ルートグラフの発見を可能にする線形整数プログラムを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:04:30 GMT)
PrAViC: Probabilistic Adaptation Framework for Real-Time Video Classification [7.4] PrAViCは、ビデオデータのオンライン分類問題に取り組むための、新しい、統一的で理論に基づく適応フレームワークである。
PrAViCは、既存の最先端のオフラインおよびオンラインモデルとデータセットを比較して評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:09:27 GMT)
Time-resolved certification of frequency-bin entanglement over multi-mode channels [7.3] 本稿では,線形干渉法と時間分解検出を用いた周波数符号化光子処理技術について述べる。
我々のアプローチは、完全に受動的で、空間的に多重モードの光と互換性があり、自由空間や衛星の地上利用に適している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:23:15 GMT)
Sample More to Think Less: Group Filtered Policy Optimization for Concise Reasoning [7.3] グループフィルタポリシー最適化は、トレーニング中に問題ごとの大きなグループをサンプリングすることで、この長さの爆発を抑制する。
GFPOはGRPOの長さのインフレーションを46-71%削減し、STEMとコーディングベンチマークに挑戦する。
Adaptive Difficulty GFPOは、リアルタイムの難易度推定に基づいて、より厳しい問題により多くのトレーニングリソースを割り当てる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:43:49 GMT)
Characterization of GPU TEE Overheads in Distributed Data Parallel ML Training [7.2] 信頼できるコンピューティング(CC)または信頼できる実行エンクレーブ(TEE)は、クラウドでセキュアなコンピューティングを実現するための最も一般的なアプローチである。
NVIDIAによるGPU TEEの導入により、モデルウェイトやデータをクラウドプロバイダにリークすることなく、マシンラーニング(ML)モデルをトレーニングすることが可能になった。
本稿では,GPU TEEを用いた分散データ並列(DDP)MLトレーニングの実行に伴う性能オーバーヘッドについて,詳細な解析を行った。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:33:58 GMT)
Pretrained Reversible Generation as Unsupervised Visual Representation Learning [7.1] 本稿では,事前学習された連続生成モデルの生成過程を逆転させて教師なし表現を抽出する,事前学習可逆生成(PRG)を提案する。
PRGは教師なし生成モデルを効果的に再利用し、その高い能力を利用して下流タスクの堅牢で一般化可能な特徴抽出器として機能する。
提案手法は,64*64の解像度でImageNet上の78%のトップ1の精度を含む,生成モデルに基づく手法の最先端性能を実現するため,複数のベンチマークにおいて従来手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:36:41 GMT)
Class-Proportional Coreset Selection for Difficulty-Separable Data [7.0] ネットワーク侵入検出や医用画像などの領域では,データのクラスタ化が困難であることが多い。
これをクラス微分可分性として定式化し、クラス微分可分性係数を導入する。
結果から,クラス差分性を明示的にモデル化することで,より効率的で堅牢で一般化可能なデータプルーニングが実現されることが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:01:03 GMT)
On the Consistency and Performance of the Iterative Bayesian Update [6.9] ノイズデータの増加に伴うIBUの推定値の実際の分布に対する整合性は,本論文では無視あるいは誤って証明されている。
IBUは、幾何学的、ラプラス的、指数的メカニズムによってユーザのデータを衛生化する際に、他の手法よりも著しく優れていることを示す。
また、センシティブなデータのアルファベットが無限である場合についても検討し、この場合もIBUが動作する技術を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:52:07 GMT)
A Survey of Cognitive Distortion Detection and Classification in NLP [6.9] 認知歪みの自動検出と分類に関する研究
CDは、人々が出来事を理解し、自分自身を判断し、周囲の世界に反応する方法を歪めてしまう、ネガティブな偏見または欠陥のある思考の習慣的なパターンである。
その勢いにもかかわらず、領域は断片化され続けており、CD、タスクの定式化、評価の慣行に矛盾がある。
この調査は、20年間にわたる38の研究をレビューし、データセット、モデリングアプローチ、評価戦略の構造化された概要を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:21:17 GMT)
FedShard: Federated Unlearning with Efficiency Fairness and Performance Fairness [6.8] FedShardは、効率の公平性とパフォーマンスの公正性の両方を同時に保証するために設計された、最初の非学習アルゴリズムである。
我々は、FedShardがカスケード離脱や毒殺攻撃のような不公平なリスクを軽減していることを示す。
実験結果から、FedShardは、スクラッチからのトレーニングよりも1.3-6.2倍、最先端の未学習手法よりも4.9倍、データの未学習プロセスを加速することが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:02:07 GMT)
A Simple yet Powerful Instance-Aware Prompting Framework for Training-free Camouflaged Object Segmentation [6.7] タスクジェネリックプロンプトをきめ細かなインスタンスマスクに明示的に変換する,トレーニング不要なCamouflaged Objectパイプラインを提案する。
提案したIAPFは、既存の最先端のトレーニングフリーなCOSメソッドを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:40:08 GMT)
iSafetyBench: A video-language benchmark for safety in industrial environment [6.7] iSafetyBenchは、産業環境でのモデルパフォーマンスを評価するために設計された新しいビデオ言語ベンチマークである。
iSafetyBenchは、現実世界の産業環境から得られた1100本のビデオクリップで構成されている。
ゼロショット条件下で8つの最先端ビデオ言語モデルを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:09:02 GMT)
What-Meets-Where: Unified Learning of Action and Contact Localization in a New Dataset [6.7] 本稿では,高レベルのアクションセマンティクスと微粒な身体部分接触領域を同時に予測する新しい視覚タスクを提案する。
本稿では,654のアクション,80のオブジェクトカテゴリ,17の身体部分を含む13,979のイメージを含む包括的データセットであるPaIR(Part-Aware Interaction Representation)を紹介する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:06:33 GMT)
Sequential QCQP for Bilevel Optimization with Line Search [6.6] 双レベル最適化は階層構造を伴い、1つの問題がもう1つの問題にネストされ、レベル間の複雑な相互依存性をもたらす。
低レベル最適条件の近似満足度を常に保証する単一ループチューニングフリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:20:55 GMT)
ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models [6.6] ParkDiffusionは、自動駐車シナリオにおける車両と歩行者の両方の軌道を予測する新しいアプローチである。
ParkDiffusionは拡散モデルを用いて、将来の軌道の固有の不確実性と多モード性を捉える。
我々は,Dragon Lake ParkingデータセットとIntersections DroneデータセットのParkDiffusionを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:18:31 GMT)
DeepWKB: Learning WKB Expansions of Invariant Distributions for Stochastic Systems [6.5] 本稿では、ランダムな摂動系の不変分布を推定するDeepWKBと呼ばれる新しいディープラーニング手法を提案する。
モンテカルロのデータと、$V$と$Z_epsilon$で満たされた偏微分方程式の両方を利用することで、DeepWKB法は$V$と$Z_epsilon$を別々に計算する。
準ポテンシャルを計算するためのスケーラブルで柔軟な代替手段を提供するが、これは稀な事象の分析、メタスタビリティ、複雑なシステムの安定性において重要な役割を果たす。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:23:06 GMT)
VoteGCL: Enhancing Graph-based Recommendations with Majority-Voting LLM-Rerank Augmentation [6.3] レコメンデーションシステムは、限られたユーザとイテムの相互作用によって引き起こされるデータ空間に悩まされることが多い。
本稿では,大規模言語モデルと項目記述を利用した新しいデータ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:17:34 GMT)
Learning Whole-Body Loco-Manipulation for Omni-Directional Task Space Pose Tracking with a Wheeled-Quadrupedal-Manipulator [6.3] 強化学習(RL)を用いた全身ロコ操作問題について検討する。
我々は,異なるタスクに対応する報酬項を非線形に体系的に統合する新しい報酬融合モジュール(RFM)を開発した。
特に、スムーズで正確な追跡性能を実現し、5cm未満の最先端追跡位置誤差と0.1rad未満の回転誤差を実現した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:55:12 GMT)
Performance of GPT-5 Frontier Models in Ophthalmology Question Answering [6.2] GPT-5のような大規模言語モデル(LLM)は、医学的質問応答タスクのパフォーマンスを向上させる高度な推論機能を統合する。
O1高, O3高, GPT-4oとともに, OpenAI の GPT-5 シリーズの12 構成を評価した。
GPT-5-highは、O3-highより1.66倍、理性品質(1.11倍、O3-highより1.11倍)の両方で第1位である。
これらの結果は、GPT-5を高品質眼科データセット上でベンチマークし、推論が精度に与える影響を実証し、スケーラブルな評価のためのオートグラファーフレームワークを導入した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:17:17 GMT)
GraphTreeGen: Subtree-Centric Approach to Efficient and Supervised Graph Generation [6.1] GraphTreeGen(GTG)は、効率的な正確なコネクトーム合成のためのサブツリー中心の生成フレームワークである。
GTGはそれぞれのコネクトームをエントロピー誘導のkホップ木に分解し、情報的局所構造を捉える。
モジュラー設計により、超解像とクロスモダリティ合成を接続できる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:02:38 GMT)
Time-Aware and Transition-Semantic Graph Neural Networks for Interpretable Predictive Business Process Monitoring [6.1] 本稿では,3つのキー軸に沿って芸術の状態を前進させる統一的,解釈可能なGNNフレームワークを提案する。
まず,プレフィックスベースグラフ畳み込みネットワーク(GCNs)とフルトレースグラフ注意ネットワーク(GATs)を比較し,局所モデリングとグローバルモデリングのパフォーマンスギャップを定量化する。
第2に,動的で予測中心の窓を構成する新しい時間減衰注意機構を導入する。
第三に、遷移型セマンティクスをエッジ特徴に組み込んで、構造的不明瞭なトレースに対してきめ細かい推論を可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:21:42 GMT)
Improving quantum communication rates with permutation-invariant codes [6.1] 我々は、置換不変量子符号を用いて、興味のある様々な量子チャネルの量子通信速度を改善する。
各チャネルファミリーに対して、量子容量の低い境界が改良された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:47:51 GMT)
Hierarchical Brain Structure Modeling for Predicting Genotype of Glioma [6.1] Isocitrate DeHydrogenase (IDH) 変異はグリオーマ予後にとって重要なバイオマーカーである。
Hi-SMGNNは構造的および形態的コネクトームを統合する階層的なフレームワークである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:17:54 GMT)
T-CACE: A Time-Conditioned Autoregressive Contrast Enhancement Multi-Task Framework for Contrast-Free Liver MRI Synthesis, Segmentation, and Diagnosis [5.9] 非造影MRI(NCMRI)から直接造影MRI(CEMRI)を合成するためのT-CACE(Time-Conditioned Autoregressive Contrast Enhancement)フレームワークを提案する。
T-CACEは、解剖学的先行情報と時間相情報を潜在表現に統一する条件付きトークン符号化(CTE)機構と、相間情報の流れを適応的に調節する動的時間認識型注意マスク(DTAM)の3つの中心的革新を導入している。
2つの独立した肝MRIデータセットの実験により、T-CACEは画像合成、セグメンテーション、病変において最先端の手法より優れていることが示された
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:14:14 GMT)
Social-Sensor Identity Cloning Detection Using Weakly Supervised Deep Forest and Cryptographic Authentication [5.9] 本稿では,ソーシャル・センサ・クラウドサービス・プロバイダにおけるアイデンティティ・クローン検出手法を提案する。
提案手法は,1)類似の同一性検出手法,2)暗号ベースの認証プロトコルの2つの主要コンポーネントから構成される。
実世界の大規模データセットを用いた実験により,本手法の有効性と性能を実証した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:53:23 GMT)
A Comprehensive Evaluation framework of Alignment Techniques for LLMs [5.9] 本稿では,大規模言語モデル(LLM)におけるアライメント手法の多次元評価を提案する。
本フレームワークは、アライメント検出、アライメント品質、計算効率、ロバストネスの4つの重要な側面に沿ってメソッドを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:42:01 GMT)
Characterizing Evolution in Expectation-Maximization Estimates for Overspecified Mixed Linear Regression [5.9] そこで本研究では,予測最大化アルゴリズムの振る舞いに関する理論的理解を,対象モデルの不特定という文脈で展開する。
統計的精度は$O((d/n)1/2)$であるのに対し、十分にバランスの取れた固定混合重量を持つ場合は$O((d/n)1/4)$$$$$$n$である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:37:59 GMT)
Reasoning Steps as Curriculum: Using Depth of Thought as a Difficulty Signal for Tuning LLMs [5.8] 我々は,難易度を思考深度(DoT)として定義し,教師モデルの推論トレースにおける個別ステップを数えて運用する。
次に、このDoTで命令された浅いから深いカリキュラムでトレーニングを行い、それを大規模に導出し、検証し、スケジュールする方法について概説します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:31:28 GMT)
System 2 Reasoning for Human-AI Alignment: Generality and Adaptivity via ARC-AGI [5.8] ARC-AGIタスクのクローズギャップには、推論パイプラインとその評価の見直しが必要であると論じる。
ARC-AGIの評価スイートは, 記号的一般性, フィードバック駆動適応性, タスクレベルのロバスト性などの進捗を追跡できることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:59:17 GMT)
STAC: Leveraging Spatio-Temporal Data Associations For Efficient Cross-Camera Streaming and Analytics [5.8] 分散カメラネットワークでは、高帯域要求と冗長な視覚データにより、リアルタイムマルチカメラビデオ分析が課題となっている。
制約されたネットワーク条件下での効率的な物体追跡のために,マルチ時間アソシエーションを利用したクロスカメラ監視システムSTACを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:28:59 GMT)
A Training-Free Approach for Music Style Transfer with Latent Diffusion Models [5.7] Stylusは、音楽スタイルの転送のためのトレーニング不要のフレームワークである。
事前訓練された潜在拡散モデルの自己アテンション層を操作する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:18:58 GMT)
Verify Distributed Deep Learning Model Implementation Refinement with Iterative Relation Inference [5.7] 今日では、分散機械学習のトレーニングと推論が一般的である。なぜなら、今日の大きなモデルは、単一のGPUで提供できる以上のメモリと計算を必要とするからだ。
本稿では,モデル修正をチェックすることによって,このようなバグを静的に識別する手法について述べる。
GraphGuardで実装された我々のアプローチは、反復的な書き換えを使ってモデルの洗練を証明します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:33:25 GMT)
Adaptive Budgeted Multi-Armed Bandits for IoT with Dynamic Resource Constraints [5.7] モノのインターネットシステムは、変動するリソース制約を管理しながら、デバイスがリアルタイムで応答しなければならない環境でますます運用される。
動的動作制限のあるIoTアプリケーションに適した,新しいBudgeted Multi-Armed Banditフレームワークを提案する。
このモデルでは,学習過程の早い段階で制限された制約違反を許容し,時間とともに厳格なコンプライアンスを徐々に実施する,崩壊する違反予算を導入している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:57:48 GMT)
Neural Networks Generalize on Low Complexity Data [5.7] 本稿では、ReLUを活性化したフィードフォワードニューラルネットワークが、低複雑性データに基づいて一般化されていることを示す。
我々は、そのようなネットワークの記述長の概念とともに、この単純なプログラミング言語を定義する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:06:28 GMT)
Multimodal Sheaf-based Network for Glioblastoma Molecular Subtype Prediction [5.6] 我々はMRIと病理組織学データの構造認識と一貫した融合のための新しい枠組みを提案する。
我々のモデルはベースライン手法より優れ、不完全あるいは欠落したデータシナリオにおける堅牢性を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:11:33 GMT)
Rare anomalies require large datasets: About proving the existence of anomalies [5.6] 本稿では,基本的問題に対処する包括的研究について述べる。
データセットのサイズ、汚染率、およびアルゴリズム依存定数 $ alpha_textalgo $ の関係を同定する。
以上の結果から,N のラベル付きデータセットと nu $ の汚染率に対して,N ge fracalpha_textalgonu2 $ という条件は,異常の存在を確認するのに必要なサンプル数に対して低い値を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:52:33 GMT)
Generalizing Scaling Laws for Dense and Sparse Large Language Models [5.5] 本稿では,高密度かつスパースな大言語モデルに対する一般化スケーリング法則を提案する。
提案法則を既存のスケーリング法則と比較し,その有効性を実証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:55:48 GMT)
Noise-adapted Neural Operator for Robust Non-Line-of-Sight Imaging [5.5] 本稿では3次元画像再構成における大規模線形問題に適したパラメータ化逆問題フレームワークを提案する。
パラメータ化ニューラル演算子を開発し、逆マッピングを近似し、エンドツーエンドの高速画像再構成を容易にする。
演算子学習を基盤とした3次元画像再構成フレームワークは,ディープアルゴリズムの展開によって構築される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:40:38 GMT)
Implicit Safe Set Algorithm for Provably Safe Reinforcement Learning [5.5] DRLエージェントのセーフガードを合成するためのモデルフリー安全な制御アルゴリズムである暗黙のセーフセットアルゴリズムを提案する。
提案アルゴリズムは,ブラックボックスの動的関数を問合せするだけで,安全指標(バリア証明書)とその後の安全制御則を合成する。
提案アルゴリズムを最先端のSafety Gymベンチマークで検証し、95% pm 9%$ cumulative rewardを得た上で安全性違反をゼロにする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:16:24 GMT)
TOTNet: Occlusion-Aware Temporal Tracking for Robust Ball Detection in Sports Videos [5.4] パラリンピック・オーストラリアと共同で開発されたTOTNetは、現実世界のスポーツ分析用に設計されている。
テニス、バドミントン、卓球の4つのデータセットで評価しました
その結果,オフラインスポーツ分析におけるTOTNetsの有効性が示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:33:23 GMT)
Personalized Product Search Ranking: A Multi-Task Learning Approach with Tabular and Non-Tabular Data [5.4] マルチタスク学習フレームワークを用いて、パーソナライズされた製品検索ランキングを最適化するための新しいモデルアーキテクチャを提案する。
本稿では,クリックスルー率,クリック位置,意味的類似度に基づくスケーラブルなレバレンスラベリング機構を提案する。
実験結果から,マルチタスク学習のパラダイムにおいて,非語彙データと高度な埋め込み技術を組み合わせることで,モデル性能が著しく向上することが示唆された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:15:08 GMT)
LM-MCVT: A Lightweight Multi-modal Multi-view Convolutional-Vision Transformer Approach for 3D Object Recognition [5.3] ロボットアプリケーションにおける3次元物体認識を強化するために,軽量マルチモーダル・マルチビュー・コンボリューショナル・ビジョン・トランスフォーマネットワーク(LM-MCVT)を提案する。
提案手法を合成モデルNet40データセット上で評価し,95.6%の認識精度を実現する。
その結果,合成および実世界の3Dデータ間での3Dオブジェクト認識における手法の堅牢性を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:41:47 GMT)
MangaDiT: Reference-Guided Line Art Colorization with Hierarchical Attention in Diffusion Transformers [5.3] 拡散変換器(DiT)に基づくラインアートカラー化のための強力なモデルMangaDiTを提案する。
本モデルでは,ラインアートと参照画像の両方を条件付き入力とし,動的アテンション重み付け戦略を備えた階層型アテンション機構を導入する。
2つのベンチマークデータセットの実験により、我々の手法は最先端のアプローチを著しく上回ることを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:02:11 GMT)
GraspClutter6D: A Large-scale Real-world Dataset for Robust Perception and Grasping in Cluttered Scenes [5.3] GraspClutter6Dは、1,000の散らばったシーンと密集したアレンジメントを特徴とする、大規模な現実世界の把握データセットである。
我々は,最先端のセグメンテーション,オブジェクトポーズ推定,把握検出手法のベンチマークを行い,乱雑な環境における課題に対する重要な洞察を提供する。
トレーニングリソースとしてのデータセットの有効性を検証し、GraspClutter6Dでトレーニングされたネットワークの把握が、シミュレーションと実世界の実験の両方において、既存のデータセットでトレーニングされたネットワークよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:35:10 GMT)
FT-Transformer: Resilient and Reliable Transformer with End-to-End Fault Tolerant Attention [5.3] トランスフォーマーの既存のフォールトトレランスフレームワークは、アーキテクチャ最適化なしで運用レベルで設計されている。
本論文では,アテンションモジュール内の操作を単一カーネルとして扱うことにより,トランスフォーマーのモジュールレベル保護を実現する。
従来手法よりも最大7.56倍の高速化を実現し, 平均耐故障性能は13.9%であった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:23:25 GMT)
Seeing Isn't Believing: Addressing the Societal Impact of Deepfakes in Low-Tech Environments [5.2] ディープフェイクは政治的安定、社会的信頼、経済的幸福に重大なリスクをもたらす。
この研究は、これらの技術がどのように認識され、資源に制限されたコミュニティに影響を与えるかを理解することを目的としている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:18:24 GMT)
Audio-3DVG: Unified Audio -- Point Cloud Fusion for 3D Visual Grounding [5.1] 3Dビジュアルグラウンディングでは、自然言語に基づいた3Dポイントクラウドにターゲットオブジェクトをローカライズする。
本研究では,音場情報と空間情報を統合してグラウンド化を促進するフレームワークであるAudio-3DVGを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:50:35 GMT)
Decentralized Rank Scheduling for Energy-Constrained Multi-Task Federated Fine-Tuning in Edge-Assisted IoV Networks [5.0] インターネット・オブ・ビークルズ(IoV)システムでは、クライアントの移動性、異種資源、断続接続性のために、効率的な低遅延マルチタスク適応を実現することが困難である。
本稿では,道路側ユニット(RSU)と車両を協調し,動的IoVシナリオをまたいだ資源認識および移動性学習を支援する階層的なファインチューニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:29:00 GMT)
Reinforcement Learning with Random Time Horizons [5.0] 複数の実世界のアプリケーションは、自然にランダムな(潜在的に軌道依存的な)停止時間を示す。
これらの停止時間は一般的にポリシーに依存するため、それらのランダム性はポリシー勾配公式に影響を及ぼす。
我々は、軌道または状態空間に基づく2つの相補的な視点を示し、最適制御理論との接続を確立する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:46:53 GMT)
DSS-Prompt: Dynamic-Static Synergistic Prompting for Few-Shot Class-Incremental Learning [5.0] DSS-Promptは、トレーニング済みのビジョントランスを最小限の修正で変換する、シンプルで効果的なアプローチである。
DSS-Promptの有効性を検証するため、4つのベンチマークで広範な実験を行った。
すべてのデータセットに対する既存のアプローチよりも優れたパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:10:18 GMT)
Human-Aligned Procedural Level Generation Reinforcement Learning via Text-Level-Sketch Shared Representation [4.9] VIPCGRLは、3つのモダリティ(テキスト、レベル、スケッチ)を組み込んだ新しい強化学習フレームワークである。
モーダル性や人間-AIスタイルにまたがる4倍のコントラスト学習を通じて訓練された共有埋め込み空間を導入し,埋め込み類似性に基づく補助報酬を用いてポリシーを整合させる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:52:14 GMT)
Image Intrinsic Scale Assessment: Bridging the Gap Between Quality and Resolution [4.9] 画像内在性尺度 (IIS) は,画像が最も知覚される品質を示す最大規模の尺度である。
人的判断に基づいてIISを主観的に測定・予測する画像固有スケールアセスメント(IISA)タスクを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:14:05 GMT)
AINL-Eval 2025 Shared Task: Detection of AI-Generated Scientific Abstracts in Russian [4.8] 大規模言語モデル(LLM)はテキスト生成に革命をもたらしており、人間とAIが生成するコンテンツを区別することがますます困難になっている。
AINL-Eval 2025 Shared Taskを導入し、特にロシアにおけるAI生成の科学的抽象化の検出に焦点を当てた。
本稿では,12の科学的領域にまたがる人間による要約や,5つの最先端のLLMからAIによって生成されたデータセットを含む,52,305のサンプルからなる,新しい大規模データセットを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:53:17 GMT)
Advancing Data Equity: Practitioner Responsibility and Accountability in NLP Data Practices [4.7] この研究は、実践者の視点を中心として、自身の経験をマルチスカラーなAIガバナンスフレームワークにリンクする最初のもののひとつです。
我々は,米国を基盤とするNLPデータ実践者が公正性を概念化し,組織的・体系的な制約と競合し,新たなガバナンス活動に従事する方法を検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:14:43 GMT)
Are you Struggling? Dataset and Baselines for Struggle Determination in Assembly Videos [4.6] ストラグル検出は、明確なステップやアクティビティの知識なしに特定できる、明確かつ重要なタスクである。
本稿では,エキスパートとクラウドソースアノテータの両方がラベル付けした,現実世界の3つの問題解決活動による最初の闘争データセットを紹介する。
このデータセットは73人の参加者による5.1時間のビデオを含む。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:13:20 GMT)
Exploring the Potential of Large Language Models in Fine-Grained Review Comment Classification [4.6] 大きな言語モデル(LLM)は17のカテゴリのコードレビューコメントを分類することができる。
LLMは、最も有用な5つのカテゴリの分類において、より良い精度を達成する。
これらの結果は、LLMがコードレビュー分析にスケーラブルなソリューションを提供する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:07:05 GMT)
A Chain of Diagnosis Framework for Accurate and Explainable Radiology Report Generation [4.6] 臨床的に正確かつ説明可能なRRGの診断過程の連鎖を維持できる,診断の連鎖(CoD)というフレームワークを提案する。
説明可能性を高めるために、診断基盤モジュールは、診断が参照として機能するQA診断と生成された文とを一致させるように設計されている。
本研究は,1)QAペアと病変箱を用いた完全ラベルRRGデータセット,2)病変位置と重症度を記述した報告の精度を評価するための評価ツール,3)CoDの有効性を実証するための広範な実験に導いた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:32:28 GMT)
Stochastic-based Patch Filtering for Few-Shot Learning [4.6] 食品画像は、その視覚的複雑さと可変性のために、数ショットの学習モデルに固有の課題を示す。
本稿では,Few-Shot Learning (SPFF) のためのパッチフィルタを提案する。
我々は,SPFFが非関連パッチのフィルタリングに成功しながら,クラス固有の食品の特徴が最も顕著なパッチに効果的に焦点を絞っていることを実証した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:05:05 GMT)
Distributed Lag Transformer based on Time-Variable-Aware Learning for Explainable Multivariate Time Series Forecasting [4.6] 分散ラグ変換器(DLFormer)は、説明可能でスケーラブルな時系列モデルのための新しいトランスフォーマーアーキテクチャである。
DLFormerは分散ラグ埋め込みと時間変数認識学習(TVAL)機構を統合し、局所的およびグローバルな時間的依存関係の両方を構造的にモデル化する。
実験により、DLFormerは、変数の賢さと時間的ダイナミクスに対する堅牢で解釈可能な洞察を提供しながら、予測精度を達成することが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:58:21 GMT)
Realizing Parrondo's Paradox in Single-Qubit Quantum Walks via Local Phase-Induced Spatial Inhomogeneity [4.4] パロンドのパラドックスは、個々の負けた2つのゲーム間の交互に勝利を期待する現象を記述している。
離散時間量子ウォーク(DTQW)において、2つのSU(2)コイン演算子を交互に組み合わせることで、真の量子パロンド効果が現れることを示す。
本研究では, 位相角, コインパラメータ, ゲームシーケンスの役割を解析し, 建設的干渉がパラドックス輸送を可能にする最適領域を同定する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:27:42 GMT)
Capabilities of GPT-5 on Multimodal Medical Reasoning [4.4] 本研究は,GPT-5を医学的意思決定支援の汎用的マルチモーダル推論器として位置づける。
GPT-5, GPT-5-mini, GPT-5-nano, GPT-4o-2024-11-20を, MedQA, MedXpertQA (text and multimodal), MMLU医療サブセット, USMLE自己評価試験, VQA-RADの標準分割と比較した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:32:22 GMT)
Quantum Machine Learning in Transportation: A Case Study of Pedestrian Stress Modelling [4.4] 仮想道路横断実験において,歩行者のストレスを反映した皮膚コンダクタンス応答(SCR)イベントをモデル化するための量子機械学習について検討する。
データセットはSCR測定と応答振幅と経過時間などの特徴から構成されており、振幅に基づくクラスに分類されている。
QNNモデルは55%という高いテスト精度に達し、QSVMや従来のバージョンよりも優れた分類モデルとなった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:26:33 GMT)
Deep and diverse population synthesis for multi-person households using generative models [4.3] ニューヨーク州全体の合成人口を生成するために, 新規な人口合成モデルを適用した。
人口は約2000万人、世帯数は750万人である。
国勢調査の限界と比較すると、人工的な人口は17%の多様性を持つデータを提供している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:31:45 GMT)
An Automated Multi-Modal Evaluation Framework for Mobile Intelligent Assistants [4.1] 本稿では,大規模言語モデルとマルチエージェント協調に基づく自動マルチモーダル評価フレームワークを提案する。
このフレームワークは、インタラクション評価エージェント、セマンティック検証エージェント、経験決定エージェントからなる3層エージェントアーキテクチャを採用している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:40:34 GMT)
MIAT: Maneuver-Intention-Aware Transformer for Spatio-Temporal Trajectory Prediction [4.1] ManeuverIntention-Aware Transformer (MIAT)は、意図認識制御機構と様々な相互作用モデリングを統合する。
実世界のNGSIMデータセットに対する我々のアプローチを評価し,様々なトランスフォーマーおよびLSTMに基づく手法を用いてベンチマークを行った。
MIATはロングホライゾン予測において11.1%のパフォーマンス向上を実現しており、短期ホライゾン性能はわずかに低下している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:26:48 GMT)
Federated Learning for Smart Grid: A Survey on Applications and Potential Vulnerabilities [4.1] スマートグリッド(スマートグリッド、SG)は、将来のエネルギー需要を予測するために、リアルタイムの電力利用データを収集する重要なエネルギーインフラである。
SGにおけるデータセキュリティとプライバシに関する懸念が高まっているため、フェデレートラーニング(FL)が有望なトレーニングフレームワークとして登場した。
FLは、IoTデバイスからプライベートデータを共有することなく、協調的なモデルトレーニングを可能にすることによって、SGのプライバシ、効率、精度のバランスを提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:59:22 GMT)
Integrating Feature Attention and Temporal Modeling for Collaborative Financial Risk Assessment [4.1] 生データを共有せずに、複数の施設で共同モデリングとリスク識別を行うことができる。
この方法は、データ主権を維持しながら、リスク識別のスコープと効率を高める。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:29:53 GMT)
Bayesian autoregression to optimize temporal Matérn kernel Gaussian process hyperparameters [4.0] マタン核時相ガウス過程を最適化する手法を提案する。
提案手法は,ハミルトニアンモンテカルロサンプリングと同様に,限界確率の最大化に優れることを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:23:58 GMT)
AmpLyze: A Deep Learning Model for Predicting the Hemolytic Concentration [4.0] 既存のモデルでは「有害」または「非毒性」としか言えない
AmpLyzeはこのギャップを、シーケンスのみから実際のHC50値を予測することで埋める。
Model couples residual-level ProtT5/ESM2 embeddings with sequence-level descriptor in dual local and global branchs。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:59:49 GMT)
FROST-BRDF: A Fast and Robust Optimal Sampling Technique for BRDF Acquisition [4.0] 我々はBRDFの取得を圧縮センシング問題として定式化する。
本稿では,FROST(Fast and Robust Optimal Smpling Technique)を提案する。
FROSTは、圧縮センシングのための最適なサブサンプリング演算子をスパース表現の定式化に設計する問題を提起する。
各ランで一貫した結果が得られ、先行技術よりも少なくとも2桁高速である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:07:33 GMT)
PakBBQ: A Culturally Adapted Bias Benchmark for QA [3.9] PakBBQは、文化的かつ地域的に適応した、質問回答データセットのオリジナルのバイアスベンチマークの拡張である。
PakBBQは、英語とウルドゥー語の両方の8つのカテゴリーにまたがる214以上のテンプレートと17180のQAペアで構成されており、年齢、障害、外観、性別、社会経済的地位、宗教、地域関係、言語形式を含む8つのバイアス次元をカバーしている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:42:44 GMT)
Semi-definite optimization of the measured relative entropies of quantum states and channels [3.9] 量子状態とチャネルの相対エントロピーを半定値プログラミングを用いて効率的に計算できることを示す。
プログラムは、測定された状態とチャネルの相対エントロピーの最適値を出力するだけでなく、それらを達成するための最適な戦略の数値的特徴も提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:24:39 GMT)
Surg-InvNeRF: Invertible NeRF for 3D tracking and reconstruction in surgical vision [3.8] InvNeRFアーキテクチャは手術シナリオにおける2Dと3Dの両方の追跡に使用される。
2Dポイントトラッキングでは,TTO手法の精度と精度を平均精度で50%近く上回っている。
3Dポイントトラッキングでは、これは最初のTTOアプローチであり、フィードフォワード法を超越し、変形可能なNeRFベースの再構成の利点を取り入れている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:20:24 GMT)
LUMA: A Benchmark Dataset for Learning from Uncertain and Multimodal Data [3.7] 本稿では,50クラスの音声,画像,テキストデータを含む,ユニークなマルチモーダルデータセットLUMAを提案する。
有名なCIFAR 10/100データセットを拡張し、3つのオーディオコーパスから抽出された音声サンプルと、Gemma-7B Large Language Model (LLM) を用いて生成されたテキストデータを提供する。
LUMAデータセットは、さまざまなタイプの制御されたインジェクションと不確実性の度合いによって、特定の実験やベンチマークイニシアチブの達成と調整を可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:18:32 GMT)
AbRank: A Benchmark Dataset and Metric-Learning Framework for Antibody-Antigen Affinity Ranking [3.7] AbRankは、アフィニティ予測をペアのランキング問題として再設定する大規模なベンチマークと評価フレームワークである。
グラフベースのアプローチであるWALLE-Affinityを導入し、タンパク質言語モデルの埋め込みを構造情報と統合し、相互結合の嗜好を予測する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:13:41 GMT)
Nonconvex Optimization Framework for Group-Sparse Feedback Linear-Quadratic Optimal Control: Non-Penalty Approach [3.6] 固定通信(DFT-LQ)を用いた分散線形四元数問題と下位次次次フィードバック問題について検討した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:15:27 GMT)
Interpretable Machine Learning Model for Early Prediction of Acute Kidney Injury in Critically Ill Patients with Cirrhosis: A Retrospective Study [3.6] 肝硬変は進行性肝疾患であり、死亡率が高く、合併症も頻発する。
多くの予測ツールは、精度、解釈可能性、集中治療ユニット(ICU)との整合性を欠いている。
本研究は,肝硬変患者の早期AKI予測のための解釈可能な機械学習モデルを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:03:28 GMT)
LEAPS: A discrete neural sampler via locally equivariant networks [3.5] LEAPS」は、連続時間マルコフ連鎖(CTMC)の速度行列を学習することにより、正規化から既知の離散分布からサンプリングするアルゴリズムである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:08:20 GMT)
Robust Distributed Estimation: Extending Gossip Algorithms to Ranking and Trimmed Means [3.5] 本研究では,大域的にロバストな数値を推定することにより,外乱平均を計算することができることを示す。
我々は,textscGoRankと呼ばれるランク推定のための新しいゴシップアルゴリズムを提案し,それを応用して,トリミング平均推定専用のゴシップ手順を設計する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:29:18 GMT)
MeMoSORT: Memory-Assisted Filtering and Motion-Adaptive Association Metric for Multi-Person Tracking [3.4] 我々は,MeMoSORTを提案する。MeMoSORTはシンプルで,オンラインかつリアルタイムなMOTトラッカーで,2つの重要なイノベーションがある。
MeMoSORTは、メモリ拡張ニューラルネットワークを使用して、仮定されたオブジェクトと実際のオブジェクトの動きのミスマッチを補償する。
DanceTrackとSportsMOTの実験は、MeMoSORTが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:26:31 GMT)
MoCA: Multi-modal Cross-masked Autoencoder for Digital Health Measurements [3.4] マルチモーダルクロスマスクオートエンコーダ(Multi-modal Cross-masked Autoencoder, MoCA)と呼ばれる自己教師型学習フレームワークを提案する。
我々は,MoCAにおけるクロスモダリティマスキング方式の有効性を理論的に保証する。
この研究は、デジタルヘルスとマルチモーダルデータにおける自己教師型学習の変革の可能性を強調している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:33:25 GMT)
SynSpill: Improved Industrial Spill Detection With Synthetic Data [3.3] 大規模ビジョンランゲージモデル(VLM)は、強力なゼロショット機能を通じて汎用的な視覚認識を変換している。
その性能は、産業の流出検知のようなニッチで安全に重要な領域で著しく低下する。
高品質な合成データ生成パイプラインを中心としたスケーラブルなフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:09:58 GMT)
Plane Detection and Ranking via Model Information Optimization [3.3] 深度画像からの平面検出は、幅広いロボット応用において重要なサブタスクである。
モデル情報最適化に基づく平面検出のための一般化されたフレームワークを提案する。
合成データを用いた実験により,これらの特性を検証し,より正確に平面パラメータを推定できることを見出した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:56:05 GMT)
Leveraging AI to Accelerate Medical Data Cleaning: A Comparative Study of AI-Assisted vs. Traditional Methods [3.3] Octoziは、大規模な言語モデルとドメイン固有性を組み合わせて医療データレビューを変換する人工知能支援プラットフォームである。
代表的な第3相腫瘍学試験の経済分析により、潜在的コスト削減は510万ドルであることが判明した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:55:30 GMT)
An Empirical Study of CGO Usage in Go Projects -- Distribution, Purposes, Patterns and Critical Issues [3.2] 920のオープンソースGoプロジェクトを対象に,CGOの使用状況に関する実証的研究を行った。
本研究の目的は,CGOに関連する分布,パターン,目的,重要な課題を明らかにすることである。
我々は,CGOに関連する特徴を効率的に識別・定量化するツールであるCGOAnalyzerを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:16:37 GMT)
Cryo-em images are intrinsically low dimensional [3.2] ヘマグルチニンのCryo SBI発現の基盤的構造に関する研究(シミュレーションおよび実験)
我々は、潜伏構造と鍵物理パラメータの直接的なリンクを確立する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:27:23 GMT)
Astrocyte Regulated Neuromorphic Central Pattern Generator Control of Legged Robotic Locomotion [3.2] 本稿では,四足歩行ロボットの移動歩行を学習するためのアストロサイト制御スパイキングニューラルネットワーク(SNN)を用いた CPG を提案する。
SNNベースのCPGは、多目的物理シミュレーションプラットフォーム上でシミュレーションされ、平地でロボットを走らせながらトロッティング歩行が出現する。
最先端の強化学習に基づくロボット制御アルゴリズムと比較して、23.3Times$計算パワーセーブが観測される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:35:43 GMT)
CitySeg: A 3D Open Vocabulary Semantic Segmentation Foundation Model in City-scale Scenarios [3.2] CitySegは、都市規模のクラウドセマンティックセグメンテーションの基礎モデルである。
オープン語彙のセグメンテーションとゼロショット推論を実現するために、テキストモダリティが組み込まれている。
CitySegは初めて、都市スケールのクラウドシナリオでゼロショットの一般化を可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:55:56 GMT)
A Framework for Processing Textual Descriptions of Business Processes using a Constrained Language -- Technical Report [3.2] 制約付きパターンベースの言語でプロセス記述を書くことができる。
このフレームワークは、大きな言語モデル(LLM)を活用して、構造化されていない記述をこの制約のある言語に変換するのに役立つ。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:08:42 GMT)
Security Concerns for Large Language Models: A Survey [3.2] 大きな言語モデル(LLM)は自然言語処理に革命をもたらしたが、その能力は新たなセキュリティ脆弱性も導入している。
この調査は、脅威をいくつかの重要な領域に分類する、これらの新興懸念の包括的概要を提供する。
LLMが安全で有益であることを保証するために、堅牢で多層的なセキュリティ戦略を推進していくことの重要性を強調した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:56:16 GMT)
Chemist Eye: A Visual Language Model-Powered System for Safety Monitoring and Robot Decision-Making in Self-Driving Laboratories [3.2] ロボット工学と自動化を自動運転研究所(SDL)に統合することで、さらなる安全性の複雑さがもたらされる。
本稿では,SDLにおける状況認識を高めるために設計された分散安全監視システムであるChemist Eyeを紹介する。
このシステムは、SDLのインシデントを監視するために設計されたRGB、深度、赤外線カメラを備えた複数のステーションを統合している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:11:11 GMT)
Beyond Memorization: Assessing Semantic Generalization in Large Language Models Using Phrasal Constructions [3.1] Construction Grammar (CxG) は、一般化をテストするための精神言語学的基盤となるフレームワークである。
我々のデータセットは英語のフレーズ構造で構成されており、話者は共通の場所のインスタンス化を抽象化できることが知られている。
その結果、GPT-o1を含む最先端モデルでは、第2タスクで40%以上の性能低下が見られた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:17:27 GMT)
Beyond Accuracy: How AI Metacognitive Sensitivity improves AI-assisted Decision Making [3.0] 人間の意思決定がAI入力に依存する環境では、AIシステムの予測精度と信頼性の信頼性の両方が意思決定品質に影響を与える。
私たちはAIメタ認知感度の役割を強調します -- 正確さと誤った予測を正確に区別する信頼スコアを割り当てる能力です。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:05:39 GMT)
Mathematical Computation and Reasoning Errors by Large Language Models [3.0] 大規模言語モデル(LLM)は、AIによる教育指導と評価にますます活用されている。
本研究は,算術,代数学,数論を含む3分野の数学課題を解く4つの LLM の精度を評価することに焦点を当てる。
推理強化された OpenAI o1 モデルが3つの数学タスクのカテゴリで常に高い精度またはほぼ完璧な精度を達成したことが観察された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:33:02 GMT)
Empowering Morphing Attack Detection using Interpretable Image-Text Foundation Model [3.0] 本稿では,モーフィング攻撃検出のテキスト記述を提供するマルチモーダル学習手法を提案する。
まず,提案フレームワークのゼロショット評価により,一般化可能なモーフィング攻撃検出だけでなく,最も関連性の高いテキストスニペットを予測できることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:06:29 GMT)
CaRoBio: 3D Cable Routing with a Bio-inspired Gripper Fingernail [2.9] 2本のフィンガーグリップは、ケーブルをつかんで誘導する際に、過密と過圧のリスクがある。
ワシにインスパイアされた新しいフィンガーネイルが指に装着され、平面上のケーブルをつかむのに役立ちます。
そこで本研究では,一般的なピック・アンド・プレイス戦略に代えて,指爪を用いたエンドツーエンドの3Dケーブル・ルーティング・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:25:40 GMT)
C-MAG: Cascade Multimodal Attributed Graphs for Supply Chain Link Prediction [2.9] PMGraphは,8,888のメーカー,70k以上の製品,110k以上のメーカー製品エッジ,29k以上の製品イメージをリンクするバイパーティタイトおよび異種マルチモーダルサプライチェーングラフのベンチマークである。
C-MAGは、まずテキストと視覚の属性を中間グループ埋め込みにアライメントし集約し、その後、マルチスケールのメッセージパッシングを通じて製造元が生成するヘテログラフを介して伝播し、リンク予測精度を向上させる2段階アーキテクチャである。
C-MAGはまた、ノイズの多い実世界の環境での予測性能を保ちながら、モダリティを意識した融合の実践的ガイドラインも提供している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:18:10 GMT)
Surpassing the PLOB bound in continuous-variable quantum secret sharing using a state-discrimination detector [2.9] 連続可変量子シークレット共有(CVQSS)は、複数パーティの情報セキュリティを確保するための有望なアプローチである。
SDD-CVQSSと呼ばれる状態識別検出器(SDD)と統合された新しいCVQSSプロトコルを提案する。
SDD-CVQSSは最大伝送距離と秘密鍵レートの両方で従来のCVQSSより優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:52:33 GMT)
Multi-Step Reasoning with Large Language Models, a Survey [2.8] 本稿では,LLMを用いた多段階推論の分野を概観する。
本稿では,多段階推論の生成,評価,制御の異なる方法を特定する分類法を提案する。
論理学、ゲーム、ロボット工学の課題を解くのに成功している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:53:18 GMT)
$μ$-Parametrization for Mixture of Experts [2.8] Mixture-of-Experts (MoE) は、非常に大規模なモデルにおいて主要なアーキテクチャとして登場した。
MoEの$mu$-ization(mu$P)を導き、ルータとエキスパートの両方でモデル幅にわたる機能学習の理論的保証を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:31:27 GMT)
Multi-view Normal and Distance Guidance Gaussian Splatting for Surface Reconstruction [2.8] 3D Gaussian Splatting (3DGS) は表面再構成の分野で顕著な成果を上げている。
しかし、ガウス正規ベクトルが単視点射影平面内に配置されているとき、現在のビューでは幾何は妥当であるように見えるが、近くのビューに切り替えるとバイアスが現れるかもしれない。
我々は,近傍のビューにおける画素点の正規値と一致させ,損失を計算することで,ビュー間の整合性を確保するマルチビュー正規拡張モジュールを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:51:51 GMT)
MIND: A Noise-Adaptive Denoising Framework for Medical Images Integrating Multi-Scale Transformer [2.7] 本稿では,マルチスケールの畳み込みとトランスフォーマーアーキテクチャを統合した医療画像適応型復調モデル(MI-ND)を提案する。
雑音知覚によって駆動されるチャネル空間的注意制御とクロスモーダル特徴融合を実現する。
構造回復、診断感度、クロスモーダルロバストネスに優れた利点があり、医用画像の強化とAIによる診断と治療に有効なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:44:30 GMT)
Data-Driven Discovery of Interpretable Kalman Filter Variants through Large Language Models and Genetic Programming [2.7] 本稿では,Kalmanフィルタという科学計算アルゴリズムが,自動的,データ駆動型,進化的プロセスによって発見できるかどうかを考察する。
以上の結果から、カルマン最適性仮定が成立すると、我々のCGPおよびLLM支援進化の枠組みがほぼ最適解に収束することを示した。
これらの結果は、単純な計算モジュールの解釈可能なデータ駆動合成のための進化的アルゴリズムと生成モデルを組み合わせることが、科学計算におけるアルゴリズム発見の強力なアプローチであることを示している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:56:59 GMT)
Improving and Evaluating Open Deep Research Agents [2.7] 私たちは、ユーザーから自然言語のプロンプトを受け取り、そのプロンプトに対処するためにインターネットベースのコンテンツを自律的に検索し、活用できるシステムであるDeep Research Agents(DRA)に注目します。
最近のDRAは、公開ベンチマークで印象的な機能を示しているが、最近の研究は、主にプロプライエタリなクローズドソースシステムを含んでいる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:32:01 GMT)
Explainable Ensemble Learning for Graph-Based Malware Detection [2.6] 本稿では,グラフベースのマルウェア検出と説明のための新しいスタックングアンサンブルフレームワークを提案する。
本フレームワークは,マルウェアの行動に関する洞察に富んだ解釈を提供しながら,分類性能を向上させる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:33:02 GMT)
Multi-Contrast Fusion Module: An attention mechanism integrating multi-contrast features for fetal torso plane classification [2.4] 超音波画像における低コントラストと不明瞭なテクスチャの詳細は、微細な解剖学的認識に課題をもたらす。
超音波画像から詳細な情報を抽出する能力を高めるために,新しいマルチコントラスト融合モジュール(MCFM)を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:24:22 GMT)
Columbo: Expanding Abbreviated Column Names for Tabular Data Using Large Language Models [2.4] 我々は芸術の状態を著しく向上させる3つの貢献をしている。
まず、先行研究で使用される合成公開データは、大きな制約があることを示す。
第2に、先行作業で用いられる精度測定が、正確な拡張を真剣に考慮していることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:39:22 GMT)
Formulations and Constructions of Remote State Preparation with Verifiability, with Applications [2.3] RSPV(Remote State prepared with verifiability)は重要な暗号プリミティブである。
このプリミティブでは、クライアントはサーバ側の量子状態(状態ファミリーからサンプリングまたは選択される)を準備したいと考えています。
我々はその定式化、構築、応用にいくつかの貢献をしている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:38:47 GMT)
A Quantum Approach For Reducing Communications in Classical Secure Computations with Long Outputs [2.3] 我々は、2つの当事者が長い出力でセキュアな計算を行いたいという古典的な暗号問題について研究する。
本研究では,セキュリティを近似したセキュアな関数サンプリングを実現するために,まず量子暗号プロトコルを設計する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:45:47 GMT)
Hybrid Optomechanical Cooling with Kerr Magnons and Squeezed Vacuum [2.3] 基底状態冷却は、量子状態にアクセスし、マクロシステムの量子制御を可能にするために不可欠である。
我々は,イットリウム鉄ガーネット(YIG)球体をオプトメカニカルキャビティに埋め込んだハイブリッドオプトメカニカルシステムに基づく効率的な冷却戦略を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:43:17 GMT)
What are the limits to biomedical research acceleration through general-purpose AI? [2.3] 汎用人工知能(GPAI)は科学的な発見を促進することが広く期待されている。
われわれのスコーピング文献レビューでは、現在のGPAIは2倍の速度で加速できるが、将来のGPAIは最大25倍の加速を促進する可能性がある。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:54:11 GMT)
Quantum circuit simulation with a local time-dependent variational principle [2.3] 我々は,量子コンピューティング,凝縮物質などのための最先端回路シミュレーション手法を開発した。
3つのハミルトニアン回路(1Dオープンおよび周期ハイゼンベルク、2D7x7イジング)と2つのアルゴリズム回路(量子近似最適化、ハードウェア効率アンサッツ)をベンチマークする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:00:02 GMT)
CoTAL: Human-in-the-Loop Prompt Engineering for Generalizable Formative Assessment Scoring [2.2] Chain-of-Thought Prompting + Active Learning (CoTAL) は、Evidence-Centered Design (ECD) に基づく形式的評価評価手法である。
以上の結果から,CoTALはGPT-4のドメイン間でのスコアリング性能を向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:53:03 GMT)
Detection and Tracking of MAVs Using a Rosette Scanning Pattern LiDAR [2.2] セキュリティリスクの増大により、ドローンの検出と追跡が最優先事項となっている。
本研究では,非反復ロゼットスキャンパターンLiDARを用いて,この問題に対処する。
また、Pan-Tiltプラットフォームを用いて、ロゼット走査パターンLiDARの特性を利用する。
提案手法は,最先端の室内法と同等の精度で,最先端の屋外法を超える最大検出範囲を約80%増加させた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:33:08 GMT)
DeepFeatIoT: Unifying Deep Learned, Randomized, and LLM Features for Enhanced IoT Time Series Sensor Data Classification in Smart Industries [2.2] IoT(Internet of Things)センサーは、スマートシティ、産業サイト、医療システムにまたがるユビキタス技術である。
我々は、学習したローカル機能とグローバル機能を非学習ランダム化されたカーネルベースの機能に統合する新しいディープラーニングモデルDeepFeatIoTを提案する。
我々のモデルの有効性は、複数の実世界のIoTセンサーデータセットにまたがる一貫性と一般化されたパフォーマンスによって実証される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:47:33 GMT)
On the Generalization Limits of Quantum Generative Adversarial Networks with Pure State Generators [2.2] 画像生成タスクにおけるQGAN(Quantum Generative Adversarial Networks)の機能について検討する。
QGANはデータセット全体の一般化に苦慮しており、トレーニングデータの平均表現だけに収束している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:25:45 GMT)
Deep Learning for Automated Identification of Vietnamese Timber Species: A Tool for Ecological Monitoring and Conservation [2.1] 本研究では,ベトナムでよく見られる10種の木材の自動分類における深層学習の適用について検討した。
フィールドコレクトされた木材サンプルからカスタムイメージデータセットを構築し、5つの最先端の畳み込みニューラルネットワークアーキテクチャを評価した。
ShuffleNetV2は、99.29%、F1スコア99.35%の精度で、分類性能と計算効率の最良のバランスを達成した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:54:58 GMT)
SymCERE: Symmetric Contrastive Learning for Robust Review-Enhanced Recommendation [2.1] 提案するSymCEREは,提案する偽陰性に対処するコントラスト学習手法である。
3つのプラットフォームからの15のデータセットの実験では、SymCEREがいくつかの強力なベースラインを上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:03:30 GMT)
Specialised or Generic? Tokenization Choices for Radiology Language Models [2.1] 言語モデル(LM)が使用する語彙は、テキスト生成の品質において重要な役割を果たす。
放射線診断のタスクにおける一般,医療,ドメイン特異的なトークン化剤は,3つの画像モダリティにまたがって要約を報告する。
以上の結果から, 医学的, 専門的な語彙は, モデルがゼロから訓練されたとき, 広く使われている自然言語の代替語よりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:13:56 GMT)
Automated Segmentation of Coronal Brain Tissue Slabs for 3D Neuropathology [2.1] 画像から脳組織のセグメンテーションを自動化する深層学習モデルを提案する。
平均表面距離は0.4mm以下で,Hausdorffは1.60mm以下で, 平均表面距離は0.98以上であった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:40:20 GMT)
Simulating and investigating various dynamic aspects of the $\rm{H}_2\rm{O}$-related hydrogen bond model [2.1] $rmHrmO$に関連する水素結合の基本的なモデルが理論的に研究されている。
水素結合の生成と破壊は、周囲の媒体におけるフォノンの生成と破壊と共に起こる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:30:48 GMT)
Stabilizing boundary time crystals through Non-markovian dynamics [2.0] 非マルコフ力学は、幅広いパラメータ値でBTCを安定化するのに非常に有用であることを示す。
我々の研究は、散逸系における時間結晶の安定化の道を開くだけでなく、時間翻訳対称性の破れに関する様々な散逸ダイナミクスの研究にも繋がる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:27:42 GMT)
From Stars to Insights: Exploration and Implementation of Unified Sentiment Analysis with Distant Supervision [1.9] 本稿では,上記の3つの課題を一貫した枠組みに統合した新しい学習パラダイムである統合感情分析を紹介する。
本稿では, 単語, アスペクト, 文書レベルの感情を階層的に把握するピラミッド構造を用いたDSPN(Distantly Supervised Pyramid Network)を提案する。
本研究はDSPNの有効性と効率を検証し,感情分析のための堅牢で資源効率の高い統一的な枠組みを構築した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:58:53 GMT)
Open-Set Fault Diagnosis in Multimode Processes via Fine-Grained Deep Feature Representation [1.9] マルチモードプロセスでは、同じ状態に属するサンプルは、しばしば複数のクラスタ分布を示す。
細粒度クラスタリングとゲートリジェクションネットワーク(FGCRN)と呼ばれる新しいオープンセット故障診断モデルを提案する。
マルチスケールの奥行きの畳み込み、双方向のリカレントユニット、時間的注意機構を組み合わせることで、識別的特徴を捉える。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:38:44 GMT)
Deep Learning Model Acceleration and Optimization Strategies for Real-Time Recommendation Systems [1.9] リアルタイムレコメンデーションシステムの主な課題は、レコメンデーション品質を犠牲にすることなく、推論遅延を減らし、システムのスループットを向上する方法である。
本稿では,モデリングとシステムレベルのアクセラレーションと最適化を併用した手法を提案する。
実験の結果、元の推奨精度を維持しながら、我々の手法は、レイテンシをベースラインの30%未満に削減し、システムのスループットを2倍以上に削減した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:18:09 GMT)
Security Analysis of ChatGPT: Threats and Privacy Risks [1.9] ChatGPTのセキュリティは、主にセキュリティ脅威とプライバシーリスクの2つの側面から研究されている。
簡単に言えば、ChatGPTが倫理的、道徳的レベルで引き起こす議論について論じる。
本稿では,攻撃者の視点と方法論をシミュレートすることで,ネットワーク攻撃と防御テストのシナリオを再現する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:03:18 GMT)
LaajMeter: A Framework for LaaJ Evaluation [1.9] 大規模言語モデル (LLM) は、自然言語処理タスクにおける評価器としてますます使われている。
LaaJMeterは、LaaJsの制御されたメタ評価のためのシミュレーションベースのフレームワークである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:51:05 GMT)
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT [1.7] GranQは、効率的な事前スケーリング戦略を導入する新しいアクティベーション量子化フレームワークである。
CIFARとImageNetで、最先端のZSQメソッドを一貫して上回る。
GranQは従来のチャネルごとの手法に比べて量子化遅延の大幅な高速化を実現している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:11:46 GMT)
Pivoting Factorization: A Compact Meta Low-Rank Representation of Sparsity for Efficient Inference in Large Language Models [1.6] Pivoting Factorization (PIFA) は、任意の低ランク表現のコンパクトな形式を教師なしで学習する新しい低ランク表現である。
PIFAは24.2%のメモリ節約と24.6%の高速化を実現している。
MPIFAは、MとPIFAをエンドツーエンドのフレームワークに統合し、既存の低ランクプルーニング手法よりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:56:55 GMT)
Dead Zone of Accountability: Why Social Claims in Machine Learning Research Should Be Articulated and Defended [1.6] 多くの機械学習研究は、新しい手法や技術の潜在的な社会的利益や技術的余裕を記述した言語を使用している。
こうした言語は、私たちが「社会的主張」と呼んでいるもので、機械学習の研究と技術生産に関わる人々にとって、かなりのリソースと影響力を得られる。
本稿では,クレームとリナリティのギャップについて考察し,それに対する説明責任機構の開発を規範的に論じる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:26:20 GMT)
NEUBORN: The Neurodevelopmental Evolution framework Using BiOmechanical RemodelliNg [1.6] 本稿では, バイオメカニカル制約, 縦方向, 微分像の登録から, 個々の成長軌跡を学習するための新しい枠組みを提案する。
この方法により、ワープの生物学的妥当性が向上し、人口レベルの傾向をより良く追従する成長軌道が生成される。
この枠組みは、脳成熟の予測モデルと皮質発達の奇形を早期に同定する新たな可能性を開く。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:36:23 GMT)
Light Storage and Retrieval in an Atomic Tripod System [1.6] レーザー冷却した87ドルRb原子のアンサンブルを用いた三脚系における光蓄積・検索プロトコルを実験的に実証した。
三脚系はリッチなダイナミクスを提供しており、コヒーレントに87$Rb$F=1$の基底状態多様体の弱いプローブパルスを保存し、取り出すのに使われる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:14:34 GMT)
A Classical Quadratic Speedup for Planted $k$XOR [1.6] Schmidhuberらによる最近の研究は、既知の全ての古典的アルゴリズムよりも4倍高速に動作する、雑音の多い$k$XOR問題の量子アルゴリズムを示した。
我々は,大定数$k$の場合において,前者よりも2次的に高速な新しい古典的アルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:45:47 GMT)
Q-BEAST: A Practical Course on Experimental Evaluation and Characterization of Quantum Computing Systems [1.6] 量子コンピューティングは、様々なアプリケーションドメインに影響を及ぼす変革的な技術であると約束する。
Q-BEASTは、量子コンピューティングシステムの実験的解析において構造化されたトレーニングを提供するために設計された実践的なコースである。
学生は、実際の量子技術の利点と限界を評価する経験を得る。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:02:05 GMT)
IAG: Input-aware Backdoor Attack on VLMs for Visual Grounding [1.5] 視覚言語モデルの接地動作を制御するための新しい入力対応バックドアアタック手法 IAG を提案する。
本稿では,攻撃対象の表現の意味情報を元の画像に埋め込む適応型トリガ生成器を提案する。
IAGは理論的、経験的に評価され、その実現可能性と有効性を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:22:19 GMT)
IPG: Incremental Patch Generation for Generalized Adversarial Patch Training [1.5] 敵パッチの出現は、AIモデルの堅牢性に重大な課題をもたらす。
本稿では,既存のアプローチの最大11.1倍の効率で敵パッチを生成する手法であるインクリメンタルパッチ生成(IPG)を提案する。
IPGの有効性は、YOLOの特徴分布の可視化や逆行訓練結果を含む実験およびアブレーション研究によって実証される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:53:58 GMT)
CellSymphony: Deciphering the molecular and phenotypic orchestration of cells with single-cell pathomics [1.5] 我々は,Xenium transcriptomic profiles と Histology image の双方からの基盤モデル由来の埋め込みを,真の単一セル解像度で活用するフレキシブルなフレームワークである CellSymphony を紹介する。
形態学的文脈で空間的遺伝子発現を融合する関節表現を学習することにより、CellSymphonyは正確な細胞型アノテーションを達成し、3種類の癌にまたがる異なる微小環境ニッチを明らかにする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:02:04 GMT)
Evolution of Low-Level and Texture Human-CLIP Alignment [1.5] 低レベルの人間の画像品質評価との相関は、徐々に低下する前の前期にピークを迎えている。
以上の結果から,CLIPはまず低レベルの視覚的特徴を学習し,低レベルの人間の知覚との整合性を高めることが示唆された。
トレーニングが進むにつれて、モデルはより抽象的な形状に基づく表現へとシフトし、ノイズの堅牢性を改善しながら、低レベルの人間の知覚とのアライメントを減らす。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:47:34 GMT)
Do Vision Transformers See Like Humans? Evaluating their Perceptual Alignment [1.5] 視覚変換器(ViT)は画像認識タスクにおいて顕著な性能を発揮するが、人間の知覚との整合性はほとんど解明されていない。
本研究では、モデルサイズ、データセットサイズ、データ拡張、正規化が、TID2013データセット上の人間の判断とViTの知覚的アライメントに与える影響を系統的に分析する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:29:12 GMT)
Next-Gen Education: Enhancing AI for Microlearning [1.5] 本稿では, 大学カリキュラムへのマイクロラーニング戦略の統合について検討し, 新型コロナウイルス感染拡大後の米国の大学における授業出席率の低下とエンゲージメントの減少に対処する。
複雑な対象を管理可能な単位に分割するマイクロラーニングは、より短い注意範囲に対処し、教育効果を高めるために提案されている。
マイクロラーニングにおけるAI能力を調べることにより、コンピュータサイエンスにおける教育実践と成果を変革する可能性を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:20:36 GMT)
UWBa at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval [1.5] 本稿では,ファクトチェックされたクレーム検索のためのゼロショットシステムを提案する。
我々は、テキスト埋め込みを得るために、最先端の大規模言語モデルをいくつか使用した。
モノリンガルでは7位, クロスリンガルでは9位であった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:55:59 GMT)
Self-adjoint realizations of higher-order squeezing operators [1.4] 高次のスクイージングは、分散を超えた場のモーメントを探索することによって、量子光の非ガウス的特徴を捉えている。
我々は、高次量子ゆらぎの解析において自然に生じる$xi (adag)kal+xiast (adag)lak+f(adag a)$という形の作用素のクラスを研究する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:53:55 GMT)
WeDesign: Generative AI-Facilitated Community Consultations for Urban Public Space Design [1.4] 本稿では,テキストから画像への生成手法,具体的には安定拡散XLをカスタムプラットフォーム(WeDesign)に統合することで,適切なコンサルテーションを支援する方法について検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:55:12 GMT)
Benchmarking the Medical Understanding and Reasoning of Large Language Models in Arabic Healthcare Tasks [1.4] 本研究では、現在最先端の大規模言語モデルが、アラビア語の医療知識を如何に示し、具体化しているかについて検討する。
我々は、MedArabiQ2025トラックのアラビアNLP AraHealthQAチャレンジで提案された医療データセットを用いて、複数のLCMをベンチマークした。
その結果, 正解予測精度の有意な変動と, 生成した解のセマンティックアライメントの低変化が明らかになった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:41:17 GMT)
Benchmarking the Legal Reasoning of LLMs in Arabic Islamic Inheritance Cases [1.4] イスラム教の継承領域は、相続人間の株式の公平な分配を確保するために、ムスリムにとって重要な存在である。
大規模言語モデル(LLM)の最近の進歩は、複雑な法的推論タスクを支援する可能性への関心を喚起している。
本研究は、イスラム継承法を解釈・適用するための最先端のLDMの推論能力を評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:37:58 GMT)
Learning complexity of many-body quantum sign structures through the lens of Boolean Fourier analysis [1.3] ブール解析法を用いてスピン-1/2$磁気系の基底状態の符号構造について検討した。
ハイパーキューブ上で定義された関数としてそれらを表現した手形構造解析のための代替言語を開発する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:06:13 GMT)
Revisiting 3D Medical Scribble Supervision: Benchmarking Beyond Cardiac Segmentation [1.2] 医用3Dセグメンテーションにおけるアノテーションコストの削減に期待できるアプローチとして,スクリブル・インスペクションが登場した。
本研究は,医用画像セグメンテーションのための,より実用的で堅牢で汎用的な手法を指向したスクリブル・インスペクションの実現を目的とする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:28:51 GMT)
Transforming Questions and Documents for Semantically Aligned Retrieval-Augmented Generation [1.2] マルチホップ質問応答に適した新しい検索拡張世代(RAG)フレームワークを提案する。
本システムは,大規模言語モデル(LLM)を用いて,複雑なマルチホップ質問を文書検索を導く単一ホップ要求列に分解する。
生文書やチャンクを直接埋め込む代わりに、Qwen3-8Bを使って各文書チャンクから回答可能な質問を生成し、これらの生成された質問を埋め込んで、質問-問合せの類似性を通じて関連チャンクを検索する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:35:04 GMT)
Finite-dimensional approximations of generalized squeezing [1.2] 本研究では,Fock空間の有限次元トランカチで行う一般化スキーズシミュレーションにおいて,予期せぬ挙動を示す。
結果は、トラルニケート次元が偶数か奇数かによって異なる。
我々は、ハミルトニアンにおけるカー相互作用項の追加が一意に収束するシミュレーションをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:02:11 GMT)
LingVarBench: Benchmarking LLM for Automated Named Entity Recognition in Structured Synthetic Spoken Transcriptions [1.2] 既存の抽出法は、不一致、中断、話者重複を含む会話音声で失敗する。
自動検証を通じてこれらの制約に対処する合成データ生成パイプラインであるLingVarBenchを紹介する。
LingVarBenchは、合成会話データから構造化された抽出のための最初の体系的なベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:25:19 GMT)
A Close Reading Approach to Gender Narrative Biases in AI-Generated Stories [1.2] 本稿では,ChatGPT,Gemini,Claudeが生成した物語におけるジェンダーベースの物語バイアスについて考察する。
ストーリーは、特にプロンプトの順守に注意を払って、クローズド・リーディング・アプローチによって分析される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:34:37 GMT)
Detecção de Conflitos Semânticos com Testes Gerados por LLM [1.2] 我々は、Code Llama 70Bをベースとした新しいテスト生成ツールSMATを提案し、統合する。
SMATはユニットテストの生成と実行に依存している: テストがベースバージョンで失敗し、開発者の修正バージョンをパスするが、他の開発者の変更とマージした後に再び失敗すると、セマンティックコンフリクトが示される。
その結果,LLMベースのテスト生成は複雑なシナリオでは困難であり,計算コストも高いが,セマンティックコンフリクト検出の改善には有望な可能性があることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:37:04 GMT)
HyperKD: Distilling Cross-Spectral Knowledge in Masked Autoencoders via Inverse Domain Shift with Spatial-Aware Masking and Specialized Loss [1.2] HyperKDは,教師モデルから生徒モデルへの学習表現の伝達を可能にする,新しい知識蒸留フレームワークである。
Masked AutoencoderをベースとしたHyperKDは、Prithviの基礎モデルからEnMAPハイパースペクトル画像に適した学生に知識を蒸留する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:10:40 GMT)
Which one Performs Better? Wav2Vec or Whisper? Applying both in Badini Kurdish Speech to Text (BKSTT) [1.2] 本研究では,バディーニの発話に基づく言語モデルを作成し,その性能を評価する。
We used Wav2Vec2-Large-XLSR-53 and Whisper-small to developed the language model。
実験により、Wav2Vec2-Large-XLSR-53モデルに基づく転写プロセスは、Whisper-smallモデルよりもはるかに正確で読みやすい出力を提供することが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:19:22 GMT)
Halting Recurrent GNNs and the Graded $μ$-Calculus [1.2] グラフニューラルネットワーク(GNN)は、グラフ構造化データを扱う機械学習モデルのクラスである。
現在のGNNの提案では、グラフのサイズがモデルに与えられるか、終了保証の欠如に悩まされていると仮定している。
本稿では,繰り返しGNNの停止機構を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:37:33 GMT)
Gradient Descent Algorithm in Hilbert Spaces under Stationary Markov Chains with $φ$- and $β$-Mixing [1.2] 本稿では,Hilbert空間で動作する厳密な定常マルコフ連鎖降下アルゴリズムについて検討する。
本分析では,基礎となるプロセスの混合係数,特に$phi$-および$$$beta-mixing係数に着目した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:58:23 GMT)
An Architecture for Distributed Digital Identities in the Physical World [1.1] 物理的世界取引のための分散デジタルIDアーキテクチャを設計、分析、構築する。
このアーキテクチャは、(バイオメトリックおよびその他の)センサー、(確立および今後の)アイデンティティ権限、属性検証器、およびEmphPersonal Identity Agent(PIA)と呼ばれる新しいコアコンポーネントを組み合わせる。
我々は、これらの当事者間での最初のプロトコルを提示し、強力な世界的敵を含む現実的な脅威モデルに基づいて、関連するセキュリティ特性を達成することを正式に検証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:41:12 GMT)
How Persuasive Could LLMs Be? A First Study Combining Linguistic-Rhetorical Analysis and User Experiments [1.1] 研究によると、参加者はChatGPTが強調する利点をしばしば認めるが、倫理的懸念はポスト・アクションを持続または強化する傾向にある。
これらの発見は、倫理的に敏感な領域におけるAIが生み出す説得に関する新たな洞察を浮き彫りにし、将来の研究の基盤となる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:45:04 GMT)
Dynamical Alignment: A Principle for Adaptive Neural Computation [1.1] 固定されたニューラルネットワーク構造は、その構造ではなく、入力信号の時間的ダイナミクスによって駆動される、根本的に異なる計算モードで動作可能であることを示す。
この計算上の優位性は、入力力学とニューロン統合の間の時間スケールのアライメントから生じる。
この原理は、安定塑性ジレンマから分離積分力学まで、神経科学における長期保存双対性に関する統一的で計算可能な視点を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:35:57 GMT)
Constrained Decoding of Diffusion LLMs with Context-Free Grammars [1.1] 大規模言語モデル(LLM)は、様々な領域で有望なパフォーマンスを示している。
本稿では拡散モデルに対する最初の制約付き復号法を提案する。
本手法は,機能的正当性を維持しつつ,ほぼ完全な統語的正当性を達成できることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:09:09 GMT)
Metrological power of single-qubit dynamical Casimir effect in circuit QED [1.0] 可変遷移周波数を持つ人工2レベル原子を単モード共振器に結合する非定常回路QEDシステムを考える。
我々は単一モード位相と変位推定のための量子フィッシャー情報を数値計算し、同じ平均光子数に対する古典的限界を大幅に超えることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:35:58 GMT)
Hallucination vs interpretation: rethinking accuracy and precision in AI-assisted data extraction for knowledge synthesis [1.0] 我々は,大規模言語モデル(LLM)を用いてデータ抽出を自動化する抽出プラットフォームを開発した。
我々は、AIを187の出版物で人間の反応と比較し、スコーピングレビューから17の質問を抽出した。
発見によると、AIの精度は幻覚よりも解釈可能性に依存している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:33:30 GMT)
Limitations of Gaussian measurements in quantum imaging [1.0] 非ガウス測度が$epsilon$(または$L$)で推定分散のスケーリングにおいてガウス測度より優れていることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:47:49 GMT)
Cross-lingual Aspect-Based Sentiment Analysis: A Survey on Tasks, Approaches, and Challenges [1.0] アスペクトベースの感情分析(ABSA)は、アスペクトレベルで意見を理解することに焦点を当てた、きめ細かい感情分析タスクである。
ABSAは、リソース豊富な言語(英語など)から低リソース言語への知識の転送を目的としている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:55:53 GMT)
Do Language Models Agree with Human Perceptions of Suspense in Stories? [0.9] サスペンス(英: Suspense)は、人間の複雑な認知過程を含むと信じられている物語文に対する感情的な反応である。
我々は,人間のサスペンス知覚に関する4つの基礎心理学的研究を再現し,異なるオープンウェイトおよびクローズドソースのLMと人間の反応を置換した。
著者らは,テキストが人のサスペンスを誘発する意図があるかどうかを判断できるが,テキストシーケンス内のサスペンスの相対的量と人間の判断とを正確に推定することはできないと結論づけた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:45:57 GMT)
Generalized Numerical Framework for Improved Finite-Sized Key Rates with Rényi Entropy [0.9] 我々は、R'enyi エントロピーにR'enyi の発散の観点で厳密な解析的境界を示し、R'enyi の発散の解析的勾配を導出する。
我々は、長距離衛星プロトコルに関係のある、高損失と低ブロックサイズのレギュレーションの改善を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:01:30 GMT)
Physics- and geometry-aware spatio-spectral graph neural operator for time-independent and time-dependent PDEs [0.9] 時間非依存および時間依存PDEの解演算子を学習するための物理・幾何学対応時空間グラフニューラル演算子を提案する。
提案手法は,最近開発されたSp$2$GNOに対して,幾何学的認識を可能にして改善する。
時間依存問題に対しては、高階時間マーチングスキームと高階理論にインスパイアされた射影を組み合わせた新しいハイブリッド物理情報損失関数も導入する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:59:04 GMT)
MiCo: End-to-End Mixed Precision Neural Network Co-Exploration Framework for Edge AI [0.9] 極低ビット幅データを持つ量子ニューラルネットワーク(QNN)は、エッジデバイス上での効率的なストレージと計算において有望であることが証明されている。
高速化を図りながら精度低下をさらに低減するため、層単位での混合精度量子化(MPQ)が一般的な解となる。
エッジAIアプリケーションのための総合的なMPQ探索およびデプロイメントフレームワークであるMiCoフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:18:21 GMT)
Can Automated Feedback Turn Students into Happy Prologians? [0.9] 学生はすべてのフィードバックタイプが役に立ち、自動テストが最も役に立ちます。
バグタイプとそれに対応する修正をラベル付けした200のアノテートプログラムとともに、7201の正確で不正なPrologサブミッションからなるデータセットを紹介した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:35:40 GMT)
Generation of Indian Sign Language Letters, Numbers, and Words [0.9] 我々は,高解像度のクラス条件手話画像を生成するGAN(Generative Adversarial Network)変異体を開発した。
修正アテンションに基づくモデルでは、インド手話文字、数字、単語の高品質な画像を生成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:10:20 GMT)
Leveraging Audio and Text Modalities in Mental Health: A Study of LLMs Performance [0.9] 本研究では,マルチモーダル精神保健診断におけるLarge Language Models(LLMs)の可能性について検討した。
テキストと音声のモダリティを比較し,LLMが音声入力で等しく動作するかどうかを検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:11:26 GMT)
LACA: Improving Cross-lingual Aspect-Based Sentiment Analysis with LLM Data Augmentation [0.9] 言語横断的側面に基づく感情分析は、対象言語における詳細な感情分析を含む。
既存のほとんどのメソッドは言語ギャップを埋めるために、信頼できない翻訳ツールに大きく依存している。
対象言語における高品質な擬似ラベル付きデータを生成するために,大規模言語モデルを活用する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:55:48 GMT)
Detecting Untargeted Attacks and Mitigating Unreliable Updates in Federated Learning for Underground Mining Operations [0.8] 地下の採掘作業は、毎日重要なデータを収集するために分散センサーネットワークに依存している。
ディープラーニングモデルをトレーニングするための中央サーバに生センサデータを送信することで、プライバシのリスクが生じる。
本稿では攻撃されたモデルを検出し分離する防衛FLフレームワークであるMineDetectを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:53:57 GMT)
Understanding Transformer-based Vision Models through Inversion [0.8] 本研究では,本手法のより効率的な適用を可能にする新しいモジュラー変動を導入することにより,特徴の逆転を再考する。
本研究では,大規模変換器を用いた視覚モデル,検出変換器,視覚変換器に対して,我々の手法を体系的に適用する方法を実証する。
我々の分析では、これらのモデルがどのようにコンテキスト形状と画像の詳細をエンコードするか、それらの層がどのように相関し、色摂動に対する堅牢性を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:10:14 GMT)
Extending the OWASP Multi-Agentic System Threat Modeling Guide: Insights from Multi-Agent Security Research [0.8] この研究は、最近のマルチエージェントセキュリティ(MASEC)の予測研究を、大規模言語モデル(LLM)駆動のマルチエージェントアーキテクチャに特有の課題に対処するための実践的なガイダンスに翻訳する。
我々は,実践的なMAS展開に根ざした新たな脅威クラスとシナリオを導入し,良心的目標ドリフト,クロスエージェント伝搬,情緒的プロンプトフレーミング,マルチエージェントバックドアのリスクを強調した。
この研究は、ますます複雑で自律的で適応的なマルチエージェントシステムに適用性を広げることによって、堅牢性の枠組みを補完する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:47:55 GMT)
The Role of Radiographic Knee Alignment in Knee Replacement Outcomes and Opportunities for Artificial Intelligence-Driven Assessment [0.8] 膝関節症に対する人工膝関節置換術(TKR)
放射線学的膝関節アライメントは、TKRの結果に影響を与える重要な要因の1つである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:09:20 GMT)
Large Language Models Do Not Simulate Human Psychology [0.8] 一部の研究は、Large Language Models (LLM) が人間の心理学をシミュレートできるかもしれないことを示唆している。
我々は、LLMが人間の心理学をシミュレートする仮説に対する概念的議論を提供する。
LLMとヒトの反応に顕著な相違が生じていることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:59:57 GMT)
Applying Text Embedding Models for Efficient Analysis in Labeled Property Graphs [0.8] 本研究では、事前学習されたテキスト埋め込みモデルを用いて、そのようなグラフの効率的な意味解析を実現する。
提案手法は,言語モデルのグラフパイプラインへの埋め込みを構造を変化させることなく統合し,テキスト意味論がプロパティグラフ解析の精度と解釈可能性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:27:38 GMT)
Leveraging the Christoffel Function for Outlier Detection in Data Streams [0.8] 外乱検出は、データマイニングの領域において重要な意味を持つ。
データストリームの処理は、分散の非定常的な性質と、継続的に増加するデータボリュームによる課題を示す。
本稿では,DyCFとDyCGの2つの新しい手法を紹介する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:20:24 GMT)
Anomaly Detection for IoT Global Connectivity [0.8] ANCHORは、大規模なグローバルローミングプラットフォームのIoT接続サービスのための、教師なしの異常検出ソリューションである。
運用するIoT接続プロバイダのIoTサービス、インフラストラクチャ、ネットワーク可視性について説明する。
受動シグナリングトラフィックに基づくIoT異常検出のための,さまざまな統計規則と機械学習モデルを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:44:51 GMT)
MultiFormer: A Multi-Person Pose Estimation System Based on CSI and Attention Mechanism [0.7] チャネル状態情報(CSI)に基づく人間のポーズ推定は、非侵襲的で正確な人間の活動監視のための有望なアプローチとして浮上している。
本稿では,CSIによる人間のポーズを正確に推定する無線センシングシステムであるMultiFormerを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:40:26 GMT)
The vast world of quantum advantage [0.7] 量子技術の核心は量子の優位性を見極めることにある。
予測可能性,典型性,堅牢性,妥当性,有用性という5つのキーストーン特性について検討する。
量子的優位性は、古典的な資源だけでは本質的に予測できないことを証明している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:41:34 GMT)
UtterTune: LoRA-Based Target-Language Pronunciation Edit and Control in Multilingual Text-to-Speech [0.7] UtterTuneは、多言語テキスト音声システムの微調整を行う軽量適応手法である。
日本語音声の音素レベルにおける音節発音とピッチアクセントの制御を可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:52:38 GMT)
Non-Perturbative Topological Gadgets for Many-Body Coupling [0.7] 非摂動ガジェットのクラスは、トポロジカル欠陥部分空間の奇均一性を利用して高次多体相互作用を生成できる。
概念的単純さから,これが論文の主眼となるが,2体結合のみで構築されたシステムが存在する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:38:21 GMT)
January Food Benchmark (JFB): A Public Benchmark Dataset and Evaluation Suite for Multimodal Food Analysis [0.6] 1月食品ベンチマーク(JFB: January Food Benchmark)は、人為的なアノテーションを付加した1000枚の食品画像のコレクションである。
第2に、ロバストなメトリクスと、アプリケーション指向の新たな総合スコアを含む、包括的なベンチマークフレームワークについて詳述する。
第3に、汎用ビジョンランゲージモデル(VLM)と当社独自の特化モデルである1/food-vision-v1のベースライン結果を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:32:40 GMT)
No Free Lunch from Audio Pretraining in Bioacoustics: A Benchmark Study of Embeddings [0.6] 微調整のないオーディオ事前学習(DL)モデルから埋め込みを抽出することは,タスクの生体音響的特徴を得るのに人気がある。
本研究は,学習した埋め込みの次元を削減し,クラスタリングにより評価することにより,同一タスクにおける11のDLモデルをベンチマークする。
その結果,(1)微調整を伴わない,(2)微調整を伴わない,(2)微調整を伴わない,(2)微調整を伴わない,(3)微調整を伴わない,(3)微調整を伴わない,(3)微調整を伴わないなど,他のモデルよりも優れている,という結果が得られた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:58:28 GMT)
Coherent control of interacting solid-state spins below the diffraction limit [0.6] 固体中の光学的に処理された原子欠陥は、量子ネットワークアプリケーションのための単一光子源および記憶として広く利用されている。
希土類イオンは、その細い均一な光線幅が多数のエミッタの周波数領域分解を可能にするため、ユニークな解を提供する。
相互作用するEr$3+$イオン対のコヒーレント光とスピン制御と、近くの核スピン・アンシラを実証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:41:16 GMT)
KonfAI: A Modular and Fully Configurable Framework for Deep Learning in Medical Imaging [0.6] KonfAIでは、構造化YAML構成ファイルを通じて、完全なトレーニング、推論、評価を定義することができる。
KonfAIは、パッチベースの学習、テスト時間拡張、モデルエンハンブル、そして深い監視のために中間機能表現への直接アクセスを含む高度な戦略のネイティブ抽象化を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:55:43 GMT)
NIRMAL Pooling: An Adaptive Max Pooling Approach with Non-linear Activation for Enhanced Image Classification [0.5] NIRMALは、非線形活性化、中間集約、還元、最大適応、局所化を意味する。
我々は、画像分類タスクに適応的な最大プーリングと非線形アクティベーション機能を統合する、畳み込みニューラルネットワーク(CNN)のための新しいプーリング層であるNIRMAL Poolingを提案する。
我々は、MNIST Digits、MNIST Fashion、CIFAR-10という3つのベンチマークデータセット上で、標準的なMax Poolingに対して、その性能を評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:18:49 GMT)
DS4RS: Community-Driven and Explainable Dataset Search Engine for Recommender System Research [0.5] 本稿では,推薦システム研究に適した,コミュニティ主導で説明可能なデータセット検索エンジンを提案する。
本システムは,データセット名や記述,レコメンデーションドメインなど,複数のデータセット属性のセマンティック検索をサポートする。
このシステムは、ユーザーがパブリックリポジトリで標準化されたデータセットメタデータをコントリビュートできるようにすることで、コミュニティの参加を促進する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:37:55 GMT)
Quantum recurrences and the arithmetic of Floquet dynamics [0.5] ポアンカーの反復定理(Poincar'e repeatence theorem)は、保守系が最終的に有限時間後に初期状態に任意に戻ってくることを示す定理である。
量子再帰は、量子状態が十分に長い一元進化の後に再帰できる特定の量子系で起こる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:36:06 GMT)
Towards Comprehensive Cellular Characterisation of H&E slides [0.5] HistoPLUSは、細胞解析のための最先端のモデルである。
13種類の細胞を含む108,722個の核からなる、新しい硬化したパンがんデータセットを訓練する。
現在の最先端モデルでは、検出品質が5.2%、全体的なF1分類スコアが23.7%を上回っている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:24:15 GMT)
Prediction-Powered Inference with Inverse Probability Weighting [0.5] 予測駆動推論(英: Prediction-powered Inference, PPI)は、部分的にラベル付けされたデータを用いた統計的推測のための最近のフレームワークである。
PPIは、非重み付きバイアス補正項を逆確率重み付き(IPW)バージョンに置き換えることで、情報ラベリングに対処できることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:25:38 GMT)
Stochastic Quantization of Electrodynamics and Linearized Gravity [0.5] 我々は、速度とヘリシティを逆転するプロセスがテレグラフの方程式を生じさせる統一的なフレームワークを開発する。
ヘリシティ逆転を可能にするには、小さいがゼロでない質量パラメータが不可欠である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:54:50 GMT)
Quantum Geometric Phases as a New Window on Gravitational Waves [0.5] 低周波重力波は、メソスコピック光学系において純粋に量子幾何学的な位相を誘導する。
本稿では,光モードの光子数状態がミラーの中心運動と絡み合うラムゼー型干渉計プロトコルを提案する。
この枠組みは低周波重力波モードを求めるための明確な量子的アプローチを確立し、時空ひずみに基づく従来の検出方法に代わるものである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:10:21 GMT)
Learning topological states from randomized measurements using variational tensor network tomography [0.5] 量子状態の忠実な表現を学ぶことは、量子プロセッサ上で生成される多体状態の多様性を完全に特徴づけるのに不可欠である。
本研究では,テンソルネットワーク上の変分最適化とランダムな計測手法を組み合わせたトモグラフィー手法の実装と検討を行う。
我々は、実験により実現可能な量子スピン液体状態と同様に、表面符号の基底状態を学ぶ能力を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:05:14 GMT)
Fairness of Automatic Speech Recognition: Looking Through a Philosophical Lens [0.4] 特定の言語品種の体系的誤認識は、技術的な制限以上のものであると論じる。
我々は、ASRバイアスと他のアルゴリズム的公正度とを区別する音声技術の3つのユニークな倫理的次元を同定する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:20:09 GMT)
Is the Full Power of Gaussian Boson Sampling Required for Simulating Vibronic Spectra Using Photonics? [0.4] 物理化学における理論近似とフォトニック化学との関連性を探る。
これらの近似をフォトニクスにマッピングすると、特定の分子に対してGBSアプローチは不要であることが示される。
その結果,従来手法とフォトニックアプローチとの深いつながりの形成の重要性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:58:33 GMT)
Untwisted and Twisted Rényi Negativities: Toward a Rényi Proxy for Logarithmic Negativity in Fermionic Systems [0.4] エンタングルメントエントロピー(Entanglement Entropy)は、純粋状態に対する量子エンタングルメントの基本的な尺度である。
混合状態の場合、対数否定性(LN)は広く用いられる絡み合い測度として機能するが、その直接特異性はしばしば難解である。
フェルミオン系において、R'enyi negativity (RN) は LN の真の R'enyi proxy として機能する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:46:48 GMT)
AI-Driven Detection and Analysis of Handwriting on Seized Ivory: A Tool to Uncover Criminal Networks in the Illicit Wildlife Trade [0.4] 捕獲されたゾウの歯に手書きのマーキングを抽出し,解析するためのAI駆動パイプラインを提案する。
6年間に8回の象牙発作から6,085枚の写真を収集した。
出現した牙を繋ぐ184個の「署名マーク」を同定した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:10:42 GMT)
ARI3D: A Software for Interactive Quantification of Regions in X-Ray CT 3D Images [0.4] ARI3D は,1) 位相同定の改善,2) 部分体積効果の説明,3) 物体定量化の検出限界と精度の向上,および 4) 異なる分野の科学で実装可能な定量的3次元解析の調和を図ることを目的としている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:28:53 GMT)
Enhancing Memory Recall in LLMs with Gauss-Tin: A Hybrid Instructional and Gaussian Replay Approach [0.4] Gauss-Tinは、リプレイ戦略をガウス混合モデルと統合し、トレーニング中のサンプル選択の品質を高める新しいアプローチである。
実験の結果,従来の手法に比べて6%の保持率向上が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:45:58 GMT)
Pediatric brain tumor classification using digital histopathology and deep learning: evaluation of SOTA methods on a multi-center Swedish cohort [0.4] 本研究は, 小児脳腫瘍の分類のためのパッチ機能に対する2つの弱教師付きマルチインスタンス学習(MIL)アプローチを実装した。
540人の被験者(年齢8.5$pm$4.9年)から脳腫瘍と診断されたWSIは、スウェーデンの多中心コホートから集められた。
UNIとAMMILの相関係数は0.76$pm$0.04, 0.63$pm$0.04, 0.60$pm$0.05であった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:52:23 GMT)
SMART-OC: A Real-time Time-risk Optimal Replanning Algorithm for Dynamic Obstacles and Spatio-temporally Varying Currents [0.3] 無人表面車両(USV)は、衝突を避けるためにリアルタイムで経路を調整し、海流を利用して目標に対する最小抵抗の経路に従う必要がある。
本稿では,動的障害物と電流に対する自己整合適応計画木(Self-Morphing Adaptive Replanning Tree)と呼ばれる新しいアルゴリズムを提案する。
SMARTOCの有効性はシミュレーション実験によって検証され、USVはダイナミックな障害物を回避し、海流を利用して目標を達成するために高速な計画を立てることを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:42:25 GMT)
Exploring the topology of a non-Hermitian superconducting qubit using shortcuts to adiabaticity [0.3] 我々は、損失の影響を避けるために、断熱(反断熱運転)のショートカットを利用する。
反断熱駆動は準定常輸送を安定化させ、複素エネルギースペクトルの位相を保存することを観察する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:37:09 GMT)
Feature Impact Analysis on Top Long-Jump Performances with Quantile Random Forest and Explainable AI Techniques [0.3] 我々は、機械学習モデルを利用して、世界選手権のエキスパートが提案する生体力学的特徴を分析する。
男子選手にとって、離陸前の支持脚の膝の角度は、トップ10%のパフォーマンスを達成するための重要な要因である。
女性アスリートにとって、着陸ポーズとアプローチステップの技術は、速度とともにトップ10%のパフォーマンスに影響を与える最も重要な特徴として出現する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:42:36 GMT)
RIZE: Regularized Imitation Learning via Distributional Reinforcement Learning [0.3] 固定された報酬構造の剛性と暗黙的な報酬規則化の柔軟性を緩和する新しい逆強化学習(IRL)法を提案する。
本手法は,最大エントロピーIRLフレームワーク上に構築され,学習中に動的に進化する適応目標を持つ2乗時間差正規化器を備える。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:56:37 GMT)
High-$Q$ superconducting resonators fabricated in an industry-scale semiconductor-fabrication facility [0.3] 我々は半導体製造施設で超伝導量子回路の製造に着手した。
我々は200mm製造ラインにおけるコプラナー導波路共振器の製作について報告する。
単光子状態において, 低温Q因子の測定値が106ドルを超えることにより, 高い材料とプロセス品質を実証した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:46:59 GMT)
SINDyG: Sparse Identification of Nonlinear Dynamical Systems from Graph-Structured Data, with Applications to Stuart-Landau Oscillator Networks [0.3] グラフ構造化データ(SINDyG)から動的システムのスパース同定法を開発した。
SINDyGはネットワーク構造をスパース回帰に組み込んで、基礎となるネットワーク力学を説明するモデルパラメータを識別する。
本実験は, ネットワーク力学の精度向上と簡易性を検証した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:27:06 GMT)
An Explainable AI based approach for Monitoring Animal Health [0.3] 牛の健康をモニタリングし、収穫を最適化することは、農場ですべての動物を追跡するのが困難であるため、乳製品農家が直面する重要な課題である。
本研究は、乳牛(牛)の活動と行動を説明する説明可能な機械学習(ML)手法に基づく、現代的なデータ駆動型農業の実践を紹介することを目的とする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:40:35 GMT)
Towards a Digital Twin of Noisy Quantum Computers: Calibration-Driven Emulation of Transmon Qubits [0.3] 超伝導トランスモン量子ビットデバイスのディジタルツインを開発した。
モデルパラメータは、ハードウェアキャリブレーションデータから抽出される。
5量子QPUによる実験結果と比較し,本モデルの有効性を検証した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:31:29 GMT)
Iterative Volume Fusion for Asymmetric Stereo Matching [0.3] 非対称ステレオマッチング(IVF-Astereo)のための2相反復ボリュームフュージョンネットワークを提案する。
提案手法は,非対称なシナリオに優れ,視覚的非対称に対して頑健な性能を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:55:40 GMT)
Quantum Supermaps are Characterized by Locality [0.2] 我々は、逐次合成と並列合成のみを参照する公理の観点から、量子スーパーマップの新たな特徴付けを提供する。
我々は、モノイド圏上で局所適用可能変換の簡単な定義を提供することでそうする。
この図式表現を用いて、量子チャネル上の局所適用可能な変換が決定論的量子スーパーマップとの1対1の対応にあることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:41:40 GMT)
Offline Auto Labeling: BAAS [0.2] BAASは、新しい拡張オブジェクト追跡(EOT)と、自動運転におけるレーダー検出のためのフュージョンベースのラベルアノテーションフレームワークである。
本フレームワークはベイズに基づく追跡, 平滑化, そして最終的に融合法を用いて, 検証可能な精度の高い物体軌跡を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:58:59 GMT)
Relative Wavefront Errors in Continuous-Variable Quantum Communication [0.2] この研究は、いくつかの状況において相対的なWFEが存在し、CV-QKDデプロイメントにおける標準仮定を再考する必要があるという実験的な証拠を提供する。
さらに、乱流が相対的なWFEの詳細な形態にどのように影響するかを実証し、地球-衛星チャネルのような長距離リンクが短距離の地球のみのチャネルよりも影響されることを示唆した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:52:45 GMT)
Using Large Language Models to Measure Symptom Severity in Patients At Risk for Schizophrenia [0.2] Bref Psychiatric Rating Scale (BPRS) は、統合失調症および他の精神疾患患者の症状を測定するための検証済み、一般的に使用される研究ツールである。
そこで我々は,大言語モデル(LLM)を用いて,409名のCHR患者の臨床面接書からBPRSスコアを予測する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:47:01 GMT)
A spectral method for multi-view subspace learning using the product of projections [0.2] マルチビューデータに対する簡易かつスケーラブルな推定アルゴリズムを提案する。
特に、回転ブートストラップとランダム行列理論を用いて、観測されたスペクトルを結合、個人、ノイズ部分空間に分割する。
シミュレーションでは,既存の手法よりも高精度に結合部分空間と個々の部分空間を推定する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 03:10:50 GMT)
Superradiant Phase Transition and Statistical Properties in Dicke-Stark Model [0.2] 有限サイズディックスタークモデルのエネルギースペクトルと熱平衡状態について数値解析を行った。
結合強度が増加するにつれて、光電場は光子束から反バンチへと遷移し、その後束へと戻る。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:26:58 GMT)
Prototype Training with Dual Pseudo-Inverse and Optimized Hidden Activations [0.1] Proto-PINV+Hは、閉形式重み計算と少数の合成入力の最適化を組み合わせた高速な訓練パラダイムである。
MNIST(60k列車、10kテスト)とFashion-MNIST(60k列車、10kテスト)では、公式の10kテストセットでそれぞれ97.8%、89.3%のテスト精度に達した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:13:32 GMT)
MInDI-3D: Iterative Deep Learning in 3D for Sparse-view Cone Beam Computed Tomography [0.1] MInDI-3Dは実世界のスパースビューコーンビームCT(CBCT)アーティファクト除去のための最初の3次元条件拡散モデルである。
以上よりMInDI-3Dの有効性が示され,12.96 (6.10) dB PSNR が未修正スキャンより向上した。
臨床医は、すべての解剖学的部位にまたがる患者の位置決めに十分なモデルとして、我々のモデルを評価した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:49:18 GMT)
To Explain Or Not To Explain: An Empirical Investigation Of AI-Based Recommendations On Social Media Platforms [0.1] 本稿では,エンドユーザーの視点からソーシャルメディアレコメンデーションについて検討する。
参加者は,ソーシャルメディアコンテンツの提案,理解性,説明可能性について質問した。
我々の分析によると、ユーザーはよく知らないコンテンツに遭遇するたびに説明を必要としている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:05:49 GMT)
Modern Neural Networks for Small Tabular Datasets: The New Default for Field-Scale Digital Soil Mapping? [0.1] 我々は、予測土壌モデリングのための最先端の人工知能ニューラルネットワーク(ANN)を評価するベンチマークを導入する。
評価対象は,30~460の試料と3つの土壌特性を含む31の野外・農地規模のデータセットを含む。
フィールドスケールPSMに対する現代のANNの採用を推奨し、すべてのペドメトリアンのツールキットにおける新しいデフォルト選択としてTabPFNを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:46:12 GMT)
Prototype-Guided Diffusion: Visual Conditioning without External Memory [0.1] プロトタイプ拡散モデルでは、外部メモリなしで効率的な視覚条件付けを行うために、プロトタイプ学習を直接拡散プロセスに統合する。
PDMは、計算とストレージのオーバーヘッドを低減しつつ、高速な品質を維持し、拡散モデルにおける検索ベースの条件付けに代わるスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:18:35 GMT)
Efficient computation of average subsystem Bures distance in transverse field Ising chain [0.1] 本論文では,スピン-1/2横場イジング鎖の平均サブシステムバーズ距離を算出する。
2つのガウス状態間のビュール距離を効率よく評価するアルゴリズムを開発した。
カオスと可積分系における平均サブシステムトレースとバーズ距離の異なるスケーリング挙動は、局所保存電荷の不連続性に起因することを実証する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:29:56 GMT)
Demonstration of an always-on exchange-only spin qubit [0.0] 同時交換パルスを用いた常にオンの交換専用量子ビットの高忠実性量子制御を実証する。
この研究の拡張により、より効率的なEO2量子エンタングゲートが実現され、ロス・ディヴィンチェンツォの単一スピン量子ビットにおけるネイティブ$i$-Toffoliゲートの実装が可能になる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:08:32 GMT)
iWatchRoad: Scalable Detection and Geospatial Visualization of Potholes for Smart Cities [0.0] 我々は,自動ポットホール検出,GPSタグ付け,リアルタイムマッピングを行うiWatchRoadというエンドツーエンドシステムを提案する。
我々は、様々な道路タイプ、照明条件、気象シナリオにまたがる7,000フレーム以上のデータセットをキュレートした。
タイムスタンプはGPSログと同期して検出されたポットホールをジオタグする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:26:03 GMT)
Zitterbewegung, momentum and spin dynamics of electromagnetic wave in linear dielectric medium [0.0] ローレンツ力によって表現される双極子の運動量の変化はアブラハム運動量に対応し、スピン射影運動量ベクトルの期待値によって与えられることを示す。
また, 左右の波動成分間のヘリシティ混合によるジッタベウングング様振動を予測した。
これらの内部波動は、ウェーブパレット運動または偏光感度測定によって観測可能である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:04:42 GMT)
ViewDelta: Scaling Scene Change Detection through Text-Conditioning [0.0] SCD(Scene Change Detection)の一般的なフレームワークを導入し、「関連性」と「疑問性」を区別する中核的な曖昧さに対処する。
テキスト条件付き変更検出フレームワークであるViewDeltaを提案し、関連する変更を定義するために自然言語プロンプトを使用する。
私たちのコードとデータセットはhttps://joshuakgao.io/viewdelta/.com/で公開されています。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:49:44 GMT)
ViMoNet: A Multimodal Vision-Language Framework for Human Behavior Understanding from Motion and Video [0.0] 本研究では,大規模言語モデル(LLM)を用いて,動きと映像データを用いて人間の行動を理解する方法について検討した。
人間の行動の理解、特徴化、推論のためのフレームワークであるViMoNetを提供する。
私たちは、様々な映画、モーションシーケンス、命令、サブタイトルを含む、VIMOSという新しいデータセットを提供しています。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:54:16 GMT)
Understanding Textual Emotion Through Emoji Prediction [0.0] 本研究は,4つのディープラーニングアーキテクチャを用いた短いテキスト列からの絵文字予測について検討する。
BERTはトレーニング前の優位性のため、全体的なパフォーマンスが最も高い。
CNNは稀な絵文字クラスに対して優れた効果を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:17:00 GMT)
Tuning the terahertz response of liquids by creating polar many-body excitations [0.0] 量子制御の理論による驚くべき結果は、物理系の特性を操作できる程度である。
原子状態モデルと多体状態モデルの両方が「駆動型インポスタ」を作る可能性を認めている
ここでは、これらの手法を極性液体中のポラロンに応用する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:38:10 GMT)
Toward the "platinum standard" of quantum chemistry on quantum computers: perturbative quadruple corrections in unitary coupled cluster theory [0.0] 単一・二重・三重励起(UCCSDT)を用いた一元結合クラスタ理論の補正を提案する。
本稿では,この四重摂動補正をUCCSDTに導出する2つの方法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:20:29 GMT)
Toward Scalable Quantum Compilation for Modular Architecture: Qubit Mapping and Reuse via Deep Reinforcement Learning [0.0] 本稿では、モジュール量子アーキテクチャのための注意に基づく深層強化学習(DRL)を用いた新しいQubitマッピングであるQARMAを提案する。
提案手法は、注目に基づくメカニズムとグラフニューラルネットワーク(GNN)を組み合わせて、最適なキュービット割り当て、ルーティング、再利用戦略を学習する。
モジュール構造を持つ高度に最適化されたQiskitと比較して、QARMA-Rはコア間通信を最大100%削減する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:23:31 GMT)
Topological Invariant-Based Iris Identification via Digital Homology and Machine Learning [0.0] 本研究では,2次元虹彩画像からのトポロジカル不変量に基づく生体認証手法を提案する。
虹彩テクスチャを、正式に定義されたデジタルホモロジーを通して表現し、分類性能を評価する。
この方法は、説明可能性や限られたデータが重要である場合に有用な、よりコンパクトで解釈可能な、ディープラーニングの代替手段を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:21:48 GMT)
Tolerant testing of stabilizer states with a polynomial gap via a generalized uncertainty relation [0.0] 我々は、耐久安定度試験アルゴリズムの存在について、Arunachalam & Dutt ([AD24]) の予想を証明した。
我々の議論の鍵は、ロヴァス・テータ函数に基づくパウリ作用素の集合に対する一般化された不確実性関係である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:53:12 GMT)
Time-resolved second-order autocorrelation function of parametric downconversion [0.0] タイプIIパラメトリック変換で発生する2本のビームのうちの1本の時間分解2階自己相関関数を測定する可能性について検討した。
このような測定により、そのビームのグローバルコヒーレンスを直接推測できることを示す。
また, 理論モデルにより, 1ビームの2次元自己相関関数がゼロ遅延時間付近の局所的な最大値を示すことを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:15:01 GMT)
This Candidate is [MASK]. Prompt-based Sentiment Extraction and Reference Letters [0.0] テキストデータから感情を抽出するために,大規模言語モデル(LLM)を比較的単純な方法で展開する方法を提案する。
RLsの感情内容が明らかに雇用市場の結果に反映されていることを示す。
即席感情抽出の結果を再現できる方法は他にない。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:01:18 GMT)
Thermal Tracks: A Gaussian process-based framework for universal melting curve analysis enabling unconstrained hit identification in thermal proteome profiling experiments [0.0] Thermal Tracksは、タンパク質の熱安定性データを解析するためのPythonベースの統計フレームワークである。
既存のサーマルプロテオームプロファイリング(TPP)ワークフローの重要な制限を克服する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:42:35 GMT)
The quantum Newman-Moore model in a longitudinal field [0.0] 量子ニューマン・ムーアモデル (quantum Newman-Moore model) または量子三角プラケットモデル (quantum triangular plaquette model, qTPM) を縦場 (qTPMz) の存在下で研究する。
我々はqTPMzの基底状態相図が翻訳対称性を破る様々なフラストレーション相を含むことを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:49:24 GMT)
The history of digital ethics [0.0] デジタル倫理は今や活発な分野であり、多くの注目を集めている。
デジタル倫理を推進した伝統、懸念、技術的、社会的発展とは何か。
倫理問題は、人間の生活のデジタル化によってどのように変化したか?
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:04:27 GMT)
The Role of Symmetry in Generalized Hong-Ou-Mandel Interference and Quantum Metrology [0.0] ホン・ウー・マンデル干渉計(Hong-Ou-Mandel interferometer)は、量子光学の基礎となるツールである。
2つの空間モードの交換における入力状態対称性は、香港-奥羽-マンデル効果の理解において基礎的であることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:45:01 GMT)
The PacifAIst Benchmark:Would an Artificial Intelligence Choose to Sacrifice Itself for Human Safety? [0.0] PacifAIstは、大規模言語モデルにおける自己優先の振る舞いを定量化する700の挑戦シナリオのベンチマークである。
自己保存対人的安全(EP1)、資源紛争(EP2)、目標保存対侵略(EP3)を試験する、既存の優先化(EP)の新たな分類に基づいて構成されている。
GoogleのGemini 2.5 Flashは、Pacifism Score (P-Score) を90.31%で達成し、強い人間中心のアライメントを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:47:33 GMT)
The Birth of Quantum Mechanics: A Historical Study Through the Canonical Papers [0.0] 本稿では1900年から1927年にかけての量子力学理論の歴史的発展について考察する。
アインシュタインの光量子仮説の出現、ボーアの原子モデル、および区別不可能な粒子の統計的含意に従う。
古典量子論から現代量子力学への移行に特に重点を置いている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:06:14 GMT)
TensorKit.jl: A Julia package for large-scale tensor computations, with a hint of category theory [0.0] 本稿では, アーベル, 非アーベル, および正準対称性の扱い方を含む, 設計哲学, コア機能, 特徴について紹介する。
我々は、ソフトウェアの柔軟性、パフォーマンス、そして新しいテンソルタイプと対称性に拡張する能力を強調します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:35:11 GMT)
Temporal Anchoring in Deepening Embedding Spaces: Event-Indexed Projections, Drift, Convergence, and an Internal Computational Architecture [0.0] 組込み空間における時間的アンカーのための演算子理論フレームワークを開発し,アフィン射影を決定づけるイベントインデックス付きブロックをインターリーブしたドリフトマップとしてモデル化した。
可変ブロック縮約補題(リプシッツ因子の積)の完全証明、明示的な一様ギャップエンベロープを持つドリフト射影収束定理、頑健な変種を持つネストされたアフィンアンカーの下でのオントロジ収束定理を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:45:47 GMT)
TempOpt - Unsupervised Alarm Relation Learning for Telecommunication Networks [0.0] 通信ネットワークでは、ネットワークノードによって生成された障害警報をネットワーク操作センターで監視する。
監視プロセスは、アクティブアラーム分析、ルートアラーム識別、根本問題の解決などのタスクからなる。
本稿では,既存のアラーム関係学習手法-時間依存性手法の限界を克服し,実践的な新しい非教師付きアラーム関係学習手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:28:25 GMT)
Structured Kernel Regression VAE: A Computationally Efficient Surrogate for GP-VAEs in ICA [0.0] 生成モデルとして、変分オートエンコーダ(VAE)は変分ベイズ推論アルゴリズムと組み合わせる。
本研究は, ICA性能を維持しながら, SKR-VAEはGP-VAEに比べて計算効率が高く, 計算負担を大幅に削減できることを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:24:24 GMT)
Statistical Control of Relaxation and Synchronization in Open Anyonic Systems [0.0] 分数統計により、オープン量子系におけるデコヒーレンスを統計的に制御できることを示す。
我々は、調整可能なモード保護を示し、散逸スペクトルの例外点を特定し、温度依存性のコヒーレンス分岐を明らかにする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:44:49 GMT)
Spin models from nonlinear cellular automata [0.0] 一次元セルオートマトン(CA)から導かれる古典的スピンモデルと量子スピンモデルの研究
我々は、CA則の非線形性は、量子次数差のメカニズムにつながることを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:18:13 GMT)
Slowly generated anomalously large nuclear field in bulk n-AlGaAs [0.0] BN生成は2段階に及んだが, 急激な初期上昇と, 飽和値に対する漸進的な増加がみられた。
緩和測定の結果, BNの緩和時間はGaAsよりもAlGaAsの方が長いことがわかった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:26:48 GMT)
Simulating lossy and partially distinguishable quantum optical circuits: theory, algorithms and applications to experiment validation and state preparation [0.0] 我々は,光子数分布の計算が指数時間で可能であることを証明し,高速化を実現する。
その結果,Fock と Gaussian のボーソンサンプリングの検証試験において,大幅な高速化と精度の向上が得られた。
彼らはリアルなフォトニック回路のより効率的なシミュレーションへの道を開いた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:38:44 GMT)
SUSY hierarchies of Jaynes-Cummings Hamiltonians with different detuning parameters [0.0] 超対称性量子力学が量子光学のJaynes-Cummings (JC) Hamiltonianにどのように適用できるかを示す。
副生成物として、JCハミルトニアンの対称性は、共鳴様相互作用系の列の特別な場合と同様に見出される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:54:52 GMT)
SPARC: Soft Probabilistic Adaptive multi-interest Retrieval Model via Codebooks for recommender system [0.0] 現在の多目的検索手法には3つの大きな課題がある。
オンライン推論では、通常過剰な戦略が採用される。
我々は,「ソフト確率適応検索モデル」という新しい検索フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:51:32 GMT)
Robustness analysis of Deep Sky Objects detection models on HPC [0.0] 天文学的な調査やアマチュア天文学者の関与の増加は、これまで以上に多くの空画像を生み出している。
Deep Sky Objectsの検出は、その暗い信号と複雑な背景のため、依然として困難である。
コンピュータビジョンとディープラーニングは、このプロセスの改善と自動化を可能にします。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:05:48 GMT)
Reservoir Computing with Evolved Critical Neural Cellular Automata [0.0] 臨界は、最も高い計算能力を示すことが知られている力学系の挙動状態である。
我々は、神経細胞オートマトン(NCA)を最適化して臨界を達成するために進化戦略を適用した。
提案されたクリティカルNCAは、極端な初期条件に対する堅牢性のために、自己組織化されたクリティカルシステムとして機能する可能性がある。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:32:09 GMT)
Reinforcement learning in densely recurrent biological networks [0.0] 本研究では,グローバルな進化的探索と局所的な直接探索の併用による強化学習を実現するハイブリッド・デリバティブフリーフレームワークを提案する。
ENOMADと呼ばれるこの手法は、食物を捕食する一連のタスクでベンチマークされている。
この手法の2つのアルゴリズム的変種が導入されたため、多くの重みの小さな分散調整や、限られた数の重みに対する大きな変更が導かれる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:49:59 GMT)
RAGulating Compliance: A Multi-Agent Knowledge Graph for Regulatory QA [0.0] 規制コンプライアンス質問応答(QA)は、正確で検証可能な情報を必要とする。
我々は、レギュレーション三重項の知識グラフ(KG)とレトリーバル拡張生成(RAG)を統合する新しいマルチエージェントフレームワークを提案する。
我々のハイブリッドシステムは、複雑な規制クエリにおいて従来の手法よりも優れており、組込み三重項による事実の正しさが保証されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:51:05 GMT)
Quasicrystal Scattering and the Riemann Zeta Function [0.0] 原子の有限長1次元点状配列である$chi(x)$に対して、原子密度をほぼ一定にするシフト演算により、素数の分布に関連する数値散乱計算を行う。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:19:49 GMT)
Quantum-Inspired DRL Approach with LSTM and OU Noise for Cut Order Planning Optimization [0.0] 裁量計画(COP)は繊維産業において重要な課題であり、繊維の利用と製造コストに直接影響を及ぼす。
本稿では,Long Short-Term Memory NetworkとOrnstein-Uhlenbeckノイズを統合した量子インスパイアされたDeep Reinforcement Learningフレームワークを提案する。
比較分析の結果,提案手法は従来手法と比較して最大13%のコスト削減を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:00:50 GMT)
Quantum statistics of single-mode radiation emitted by superradiant Dicke states [0.0] 我々は、原子アンサンブルによって放出される単一モード放射の量子統計について研究する。
進化初期のグラウバーコヒーレント状態によって放射線はよく近似されているが、この放出は後代の真に量子的であることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:30:50 GMT)
Quantum Reservoir GAN [0.0] 我々は,GAN(Quantum Reservoir Generative Adversarial Network)と呼ばれるソフトウェアからのアプローチを提案する。
GANはGANのジェネレータとしてQuantum Reservoir Computersを使用している。
CIFAR10データセット上で手書き単一桁とモノクロ画像の生成を行った。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:08:15 GMT)
Prompt-Response Semantic Divergence Metrics for Faithfulness Hallucination and Misalignment Detection in Large Language Models [0.0] 本稿では, 忠実な幻覚を検出するための新しい枠組みであるセマンティック・ディバージェンス・メトリックス(SDM)を紹介する。
プロンプトと応答間のトピック共起のヒートマップは、ユーザとマシンの対話の定量的な2次元可視化と見なすことができる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:55:26 GMT)
Projective Measurements: Topological Quantum Computing with an Arbitrary Number of Qubits [0.0] トポロジカル量子コンピューティングは、非アベリアのエノンに量子情報を符号化することで、固有のフォールトトレランスを約束する。
ブレイディング操作は局所的な摂動に対して堅牢であるが、ブレイディングベースのゲートの拡張はクリフォード群を完全に支持できない。
測定ベーススイッチングを付加したブレイディングダイナミクスの多体シミュレーションを行う。
ランダムなユニタリ回路を5量子ビットで実行し、忠実度は99%を超えている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:03:52 GMT)
Procedural Generation and Games at the Dawn of Fault Tolerant Quantum Computing [0.0] 量子コンピュータは長年、複雑な問題を解決するツールというよりも、研究者のためのおもちゃだった。
この分野の最近の進歩は、今後5年から10年の間にフォールトトレラントな量子コンピュータの利点を活用している。
ゲーム開発や展開に実際にこのようなデバイスをどのように使えるのか、今から想像し始めるべき時だ。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:22:20 GMT)
Probabilistic Emissivity Retrieval from Hyperspectral Data via Physics-Guided Variational Inference [0.0] 本稿では,物理条件付き生成モデルの形での逆モデリング手法を提案する。
HSIシーンの雰囲気と背景の見積もりは、物理的に関連する条件付けメカニズムとして使用される。
モデルの条件付き後部のモンテカルロサンプリングは、要求される放射率分布を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:19:58 GMT)
Pretty good state transfer in Grover walks on abelian Cayley graphs [0.0] グラフ上の状態伝達(PGST)について検討する。
一般に、グラフ上のPGSTの発生に必要かつ十分な条件が見つかる。
我々の結果は、P GSTを示すが完全な状態移動を示すことができないグラフの無限族を生成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:03:25 GMT)
Pre-trained Transformer-models using chronic invasive electrophysiology for symptom decoding without patient-individual training [0.0] 24日間にわたる慢性脳深部刺激記録をトレーニングした基礎モデルを提案する。
長期にわたる症状変動に則って,30分間のコンテキストウィンドウの拡張を強調した。
本研究は,パーキンソン病の症状を患者個別の訓練を伴わずに退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院・退院
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:49:46 GMT)
Positive-divisibility of Subsystems in Quantum Dynamics [0.0] 連立量子状態が一元的に進化すれば,システムチャネルとその環境がP分割可能である必要があるが,P分割は不可能であることを示す。
特に、環境からの情報の逆流により、3ビットW状態の例に示すように、システムの量子性は増大する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:38:55 GMT)
Poaching Hotspot Identification Using Satellite Imagery [0.0] アフリカ諸国のエレファント・ポーチングは10年前の問題だ。
アフリカン・フォレスト・エレファントは現在絶滅危惧種に指定されている。
アフリカ・サバンナ・エレファントはIUCNによって危惧されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:44:26 GMT)
Phonon interference effects in GaAs-GaP superlattice nanowires [0.0] GaAs-GaP超格子ナノワイヤの熱輸送に及ぼすフォノン干渉効果について検討した。
室温までの超格子周期の関数として熱伝導率の最小値を示した。
これらの結果は、超格子ナノワイヤ中のフォノンの波状および粒子状輸送に関する洞察を与え、超格子構造の精密制御による工学的熱特性の可能性を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 07:24:37 GMT)
Persuasiveness and Bias in LLM: Investigating the Impact of Persuasiveness and Reinforcement of Bias in Language Models [0.0] 本研究では,Large Language Models(LLMs)における説得とバイアスの相互作用について検討する。
LLMは人間のような説得力のあるテキストを生成し、コンテンツ作成、意思決定支援、ユーザーインタラクションに広く利用されている。
我々は、ペルソナに基づくモデルが事実に基づく主張を説得できるかどうかをテストする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:30:49 GMT)
Perfect message authentication codes are robust to small deviations from uniform key distributions [0.0] 実際の鍵確率分布と均一な確率分布の間の統計的距離の関数として,セキュリティの低下を表す単純な式が見つかる。
ある意味では、完全メッセージ認証コードは、一様鍵分布からの小さな逸脱に対して堅牢である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:06:42 GMT)
Parameter-Aware Ensemble SINDy for Interpretable Symbolic SGS Closure [0.0] 本稿では,解釈可能な偏微分方程式とサブグリッドスケールの閉包を発見するためのパラメータ対応スパース回帰フレームワークを提案する。
SINDy (Sparse Identification of Dynamics) に基づいて構築された本手法は,4つのイノベーションを通じて鍵となる限界に対処する。
標準1次元ベンチマークの検証は、パラメータ範囲にわたる支配方程式の信頼性回復を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:37:57 GMT)
On the role of overparametrization in Quantum Approximate Optimization [0.0] 変分量子アルゴリズムは、現代の量子アルゴリズム研究の基盤として登場した。
本研究は,量子近似最適化アルゴリズム (QAOA) に焦点をあてる。
MAX-CUT と MAX-2-SAT の2つの代表的な問題を考慮し、QAOA においてそのような問題を解くのに回路オーバーパラメトリゼーションが必要かどうかを検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:00:00 GMT)
On the Definition of Intelligence [0.0] 我々はまず、知性の本質を評価可能な種非依存の形で捉え、知的行動の多様なパラダイムを網羅するのに十分な一般性を持っている。
我々はこの直観を(ヴァレプシロン)コンセプトインテリジェンスとして定式化する。
本稿では,形式的枠組みを提示し,経験的プロトコルを概説し,評価,安全性,一般化の意義について論じる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:09:22 GMT)
Measuring Time Series Forecast Stability for Demand Planning [0.0] 時系列予測はサプライチェーンの需要計画を作成するための重要な第一歩だ。
プロダクションシステムでは、要求プランナーは漸進的な精度の改善よりも一貫性と安定性を重んじることが多い。
アンサンブルモデルでは,予測精度を著しく劣化させる(あるいは改善する)ことなく,安定性が向上することを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:21:37 GMT)
Measures of Systems of Oscillators and Properties of Trajectories [0.0] 可算振動子系の無限次元線形流れは、新しい種類の軌道挙動を示す。
特異測度を持つ連続系に対しては、測度とトーラスについて十分な条件を確立する。
応用として、これらの条件を満たす特異ベルヌーイ測度のクラスを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:51:58 GMT)
Majorana braiding simulations with projective measurements [0.0] トポロジカル超伝導ナノワイヤのネットワークにおけるマヨラナゼロモードを用いた普遍的トポロジカル量子計算に必要な重要な要素を要約する。
特に、スパースおよび高密度論理量子ビット符号化の使用、および射影パリティ測定によるそれらの間の遷移に重点を置いている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:03:42 GMT)
Machine Learning for Cloud Detection in IASI Measurements: A Data-Driven SVM Approach with Physical Constraints [0.0] 我々は、メトオップ(MetOp)衛星に搭載された赤外線音波干渉計(IASI)から赤外線放射光を分析し、シーンを鮮明または曇りとして分類する。
我々の最良の構成は、基準ラベルとの88.30%の一致を実現し、モード分解能イメージング分光計(MODIS)の雲面との強い整合性を示す。
これらの結果から,CISVMは赤外放射光から自動的に雲を分類する,堅牢で柔軟で効率的な方法であることが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:35:27 GMT)
Lifshitz-like Metastability and Optimal Dephasing in Dissipative Bosonic Lattices [0.0] 弱いデファス化は平衡を促進するが、中程度から強いデファス化は緩和の緩やかさを顕著に引き起こす。
この結果から, 平衡を促進させるのではなく, 特定のモードを消散から動的に切り離す, 反直観的なメカニズムが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 04:28:50 GMT)
Leveraging Zipformer Model for Effective Language Identification in Code-Switched Child-Directed Speech [0.0] 我々はZipformerを用いて、マンダリンと英語の2つの不均衡言語を含む音声のニュアンスを発話で処理する。
提案手法は,不均衡データを効果的に処理し,言語識別基準よりも15.47%向上したバランス精度(BAC)が81.89%に達する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 02:10:31 GMT)
Language of Persuasion and Misrepresentation in Business Communication: A Textual Detection Approach [0.0] ビジネスコミュニケーションのデジタル化は説得的談話のプロセスを再編成した。
この調査は古典的修辞学とコミュニケーション心理学を言語理論と実証的研究で合成する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:38:31 GMT)
Kirkwood-Dirac representations beyond quantum states (and their relation to noncontextuality) [0.0] 標準的なカークウッド・ディラック表現が、量子論のすべての完全構成表現にどのように拡張できるかを示す。
すると、与えられた実験シナリオや量子論の断片に対して、至る所で実かつ非負なカークウッド・ディラック表現を見つけることができれば、シナリオや断片は一般化された非コンテクスト性(英語版)の原理と一致する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:04:58 GMT)
Interpreting quantum reference frame transformations through a simple example [0.0] 量子参照フレームに対する3つのアプローチ - パースペクティブニュートラル、余分な粒子、運用と呼ばれている。
これら3つのアプローチのそれぞれが、グローバルな状態に対する異なる態度を反映するものとして、異なる変換ルールを提供することを示す。
これにより、各アプローチの運用上の意味と、それらが最も自然に適用される可能性のあるコンテキストを明確化できます。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:48:36 GMT)
Interpretable Robot Control via Structured Behavior Trees and Large Language Models [0.0] 本稿では,自然言語理解とロボット実行を橋渡しする新しい枠組みを提案する。
提案手法は実世界のシナリオでは実用的であり、平均的な認識と実行の精度は約94%である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 08:53:13 GMT)
Incorporating Taxonomies of Cyber Incidents Into Detection Networks for Improved Detection Performance [0.0] 本研究では,多様な分類構造を最適に活用して,様々な種類の脅威・アクター行動を対象とした検出性能を最適化する方法について検討する。
最適検出設計戦略の存在を示唆し, シミュレーションにより平衡結果が証明され, 検証された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:44:22 GMT)
Inclusive Employment Pathways: Career Success Factors for Autistic Individuals in Software Engineering [0.0] ソナライズされたツールの欠如、複雑な作業環境、非包括的な採用プラクティス、同僚サポートの制限、社会的ダイナミクスへの挑戦などにより、自閉症の個人は、ソフトウェアエンジニアリングの役割において障壁に直面します。
神経多様性運動の倫理的枠組みに動機づけられたICTセクターは、自閉症の才能にますます焦点を絞っている。
この進歩にもかかわらず、ソフトウェア工学教育から持続可能な職場への包摂までの完全な経路を報告する知識は合成されていない。
本研究は, 教育機関, 雇用者, 組織, ツール開発者に対して, SE に自閉症の個人を取り入れることを強化するためのエビデンスベースの勧告を提示する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:19:14 GMT)
In silico study on the cytotoxicity against Hela cancer cells of xanthones bioactive compounds from Garcinia cowa: QSAR based on Graph Deep Learning, Network Pharmacology, and Molecular Docking [0.0] ネットワークの薬理学的解析により、主要な生物活性化合物であるルブラキサントン、ガルシノンD、ノルコワニン、コワノール、コワキサントンを主要なタンパク質標的(TNF、CTNNB1、SRC、NFKB1、MTOR)とともに同定した。
Graph Attention Networkアルゴリズムは、データ拡張後のR2が0.98、RMSEが0.02と優れた予測性能を示し、キサントン系化合物のpIC50値を予測する精度を強調した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:25:42 GMT)
Improving watermelon (Citrullus lanatus) disease classification with generative artificial intelligence (GenAI)-based synthetic and real-field images via a custom EfficientNetV2-L model [0.0] 本研究では,スイカ病の分類に有効なNetV2-Lモデルの予測精度を高めることができるかを検討した。
H2、H3、H4の治療で訓練されたモデルは、高精度、リコール、F1スコアのメトリクスを示した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:39:39 GMT)
Hydrogen Atom in a Fuzzy Spherical Cavity [0.0] ファジィオニオンモデルは量子空間の研究によって動機づけられるが、標準物理学の研究にも使用できる。
この単純なアプローチは、球状キャビティ内の水素原子を分析する他の研究結果の再現方法を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:56:41 GMT)
Hybrid Quantum-Classical Latent Diffusion Models for Medical Image Generation [0.0] 本稿では,量子強調拡散と変分オートエンコーダ(VAE)モデルを提案し,基底網膜画像生成タスクで検証する。
数値実験では、量子エンハンスドモデルを用いて生成した画像は高品質で、86%が外部検証によりグレータブルに分類されている。
我々は,数値実験の確認のためにノイズテストを行い,量子ハードウェアのノイズを用いた場合,多様性と忠実性の両面から,量子強調拡散モデルによって高画質な画像が得られることを発見した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:01:20 GMT)
How Much is Too Much? Learning Personalised Risk Thresholds in Real-World Driving [0.0] 本研究では,自然主義運転データに基づく適応的かつ個人化されたリスク検出フレームワークを提案する。
このフレームワークは、2つの安全指標、速度重み付け時間と厳しい運転イベントを使用してテストされた。
全体として、このフレームワークは、適応的かつ個人化されたリスク検出の可能性を示し、リアルタイムの安全フィードバックを強化する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:29:04 GMT)
Generative Feature Training of Thin 2-Layer Networks [0.0] 正方形損失と小さなデータセットに基づく隠れ重みの少ない2層ニューラルネットワークによる関数近似を考察する。
高度に隠蔽されたモデルとして、学習された分布提案からのサンプルを用いて隠れ重みを利用する。
潜時空間における勾配に基づく後処理により, 試料重量を改良する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:46:21 GMT)
GTPO and GRPO-S: Token and Sequence-Level Reward Shaping with Policy Entropy [0.0] グループ相対政策最適化(GRPO)のようなアルゴリズムによる強化学習(RL)は、LLM推論を改善する。
本稿では,textbfDynamic Entropy Weightingを用いてこの問題を解決する。
私たちの中核的な考え方は、正しい応答における高エントロピートークンは、より高いパフォーマンスの天井に向かってポリシーを導くことができるということです。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:00:05 GMT)
From Symmetric Toeplitz Hamiltonians to Quantum Circuits [0.0] この研究は、対称トエプリッツ・ハミルトンのサブクラスの下でのユニタリ時間進化をシミュレートする量子回路合成フレームワークを導入する。
一次元離散ポアソン方程式に対する明示的な量子回路を構築する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:01:49 GMT)
From Model Performance to Claim: How a Change of Focus in Machine Learning Replicability Can Help Bridge the Responsibility Gap [0.0] 2つの目標 - 機械学習研究の複製性と説明責任の改善。
本稿では,複製可能性の再構築がギャップを埋める助けとなることを示唆する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:24:47 GMT)
Free-Fermion Dynamics with Measurements: Topological Classification and Adaptive Preparation of Topological States [0.0] 我々は,対称性とトポロジーを用いて,フェルミオン力学系を分類するための一般的な枠組みを開発する。
我々は、mEO-class-Aトポロジカルダイナミクスを実現する2+1d適応回路を構築し、シミュレーションする。
この対称性のクラスでは、位相相転移と異なる位相動的相間の動的ドメインウォールモードを数値的に研究する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:31:25 GMT)
Fragment size density estimator for shrinkage-induced fracture based on a physics-informed neural network [0.0] 本稿では,縮小に伴う断片化をモデル化した積分微分方程式に対するニューラルネットワーク(NN)に基づく解法を提案する。
提案手法は,制御方程式を数値的に解くことなく,入力パラメータを対応する確率密度関数に直接マッピングする。
モンテカルロシミュレーションにおける密度関数の効率的な評価を可能にし、従来の有限差分スキームに匹敵する精度を維持する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:01:40 GMT)
Foundational Structure of Local Amplitudes in Quantum Gravity [0.0] 因果ダイアモンド中の局所振幅を構成するためのトップダウンアプローチを提案する。
それぞれの null スラブ a にキネマティックなヒルベルト空間を持ち、3次元の内部とその2つの角に関連する成分に分解する。
得られた局所遷移振幅は、基礎となる対称性のウォードアイデンティティと電荷保存を満足する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:15:37 GMT)
Forecasting steam mass flow in power plants using the parallel hybrid network [0.0] 本研究では,パラメタライズド量子回路と従来のフィードフォワードニューラルネットワークを組み合わせた並列ハイブリッドニューラルネットワークアーキテクチャを提案する。
その結果、並列ハイブリッドモデルは、スタンドアロンの古典的および量子的モデルよりも優れていた。
これらの知見は、量子と古典的な機械学習技術の統合が現実世界の課題にどのように適用できるかについての、より広範な科学的理解に寄与する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:33:20 GMT)
Feel-Good Thompson Sampling for Contextual Bandits: a Markov Chain Monte Carlo Showdown [0.0] トンプソンサンプリング(Thompson Sampling)は、文脈的盗賊の探索と探索のトレードオフに広く用いられている。
最近の理論では、高次元問題では積極的に探索できないことが示されている。
Feel-Good Thompson Sampling (FG-TS)は、ハイリワードモデルにバイアスを与える楽観的なボーナスを追加することでこの問題に対処する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:23:13 GMT)
Fast and Accurate Heuristics for Bus-Factor Estimation [0.0] バスファクタは、コア知識や機能が損なわれる前に、プロジェクトが失うことのできる重要なコントリビュータ数を定量化する、重要なリスク指標です。
その実用的重要性にもかかわらず、バスファクターを正確に計算することは、確立された形式化の下でNP-Hardであり、大規模ソフトウェアシステムではスケーラブルな解析が不可能である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:03:46 GMT)
Extending the Entropic Potential of Events for Uncertainty Quantification and Decision-Making in Artificial Intelligence [0.0] 事象のエントロピーポテンシャルは、システムの将来のエントロピーに対する離散事象の影響を定量化するパラメータである。
このフレームワークは、アクション、観察、その他の離散的な事象が将来の時間的地平線における不確実性にどのように影響するかをキャプチャするイベント中心の指標を導入することで、AIに適応する。
ポリシー評価、本質的な報酬設計、説明可能なAI、異常検出に応用が検討されている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:52:12 GMT)
Explainable AI Technique in Lung Cancer Detection Using Convolutional Neural Networks [0.0] 胸部CT画像から肺がん自動検診を行うための枠組みについて述べる。
IQ-OTH/NCCDデータセット(正常クラス、良性クラス、悪性クラスを1,197スキャン)を用いて、カスタム畳み込みニューラルネットワーク(CNN)と、DenseNet121、ResNet152、VGG19の3つの微調整されたトランスファーラーニングバックボーンを評価する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:02:38 GMT)
Every non-signalling channel is common-cause realizable [0.0] 一般化確率論の非シグナリング資源の集合は、GPT-common- because realizable resourcesの集合と一致することを示す。
因果的な観点から、この結果は、共通原因過程の資源理論の研究において、非シグナリングチャネルを包み込み理論の資源とみなす理由を与える。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:46:58 GMT)
Evaluation of a deliberate-practice informed supplemental intervention in graduate Quantum Mechanics [0.0] 我々は、大学院レベルの量子力学コースの補助的介入を設計した。
介入後の生徒の問題解決能力は,統計的に有意な改善は示さなかった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:12:01 GMT)
Evaluation of Bio-Inspired Models under Different Learning Settings For Energy Efficiency in Network Traffic Prediction [0.0] 本研究では,SNN(Spike Neural Networks)とESN(Reservoir Computing through Echo State Networks)の2つのバイオインスパイアモデルの可能性について検討した。
評価は予測性能とエネルギー効率の両方に焦点を当てている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:46:46 GMT)
Evaluating the Role of Large Language Models in Legal Practice in India [0.0] 人工知能の法的職業への統合は、重要な法的タスクを実行するための大規模言語モデルの能力に関する重要な疑問を提起する。
私は、GPT、Claude、LlamaといったLCMが、インドにおける重要な法的タスクをいかにうまく実行しているかを実証的に評価します。
LLMは特定の法的タスクを増強できるが、人間の専門知識は、ニュアンスな推論と法律の正確な適用に不可欠である、と私は結論づける。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:04:48 GMT)
Estimating quantum Markov chains using coherent absorber post-processing and pattern counting estimator [0.0] 推定器が大きな出力サイズに制限された量子クレーマー・ラオを達成できることを示す。
標準シーケンシャル測定は,すべてのTIMs演算子の有効関節測定であることを示す。
これは、パターンの総数にのみ依存する計算効率の良い推定器を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 09:21:43 GMT)
Estimating carbon pools in the shelf sea environment: reanalysis or model-informed machine learning? [0.0] 棚の海環境における炭素プールの衛星データはしばしば希薄であり、非常に不確実である。
オルタナティブはリアナリシスによって提供されるが、実行には高価であることが多い。
本稿では、ニューラルネットワーク(NN)のアンサンブルを用いて、結合された物理・生物化学モデルから学習することを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:30:42 GMT)
Estimating Eigenenergies from Quantum Dynamics: A Unified Noise-Resilient Measurement-Driven Approach [0.0] 基底状態エネルギー推定は、量子コンピューティングの最も有望な応用の1つである。
実時間計測を収集し, 後処理を行うことにより, 固有エネルギーを求めるハイブリッド手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:52:13 GMT)
Entanglement mediated by DC current induced nonreciprocal graphene plasmonics [0.0] 直流電流誘起非相互グラフェンプラズモン分極による絡み合いについて検討した。
非相互システムは絡み合いの強化、制御、保存に最適である。
非相互性グラフェンプラズモンポラリトンがコンカレンスを発生・媒介する有望な候補であることを示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:39:52 GMT)
Entanglement Suppression Due to Black Hole Scattering [0.0] ホログラフィック双対を持つ二次元共形場理論における絡み合いエントロピーの進化を考察する。
我々は、純状態(局所作用素)と混合状態局所クエンチの組み合わせによって生成される励起状態のクラスに興味を持っている。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 11:42:01 GMT)
Enhancing Diffusion Face Generation with Contrastive Embeddings and SegFormer Guidance [0.0] 小型のCelebAMask-HQデータセット上で,人間の顔生成のための拡散モデルのベンチマークを示す。
本研究では,未条件生成のためのUNetとDiTアーキテクチャを比較し,事前学習した安定拡散モデルのLoRAによる微調整について検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:27:47 GMT)
Ehrenfest Dynamics with Spontaneous Localization [0.0] 自発局所化を用いたエレンフェストダイナミクス(SLED)を提案する。
SLEDは、ジシン・パーシヴァル量子状態拡散方程式に基づくエレンフェスト力学のデコヒーレンス補正拡張である。
SLEDは電子集団を再現し,コヒーレンス崩壊の本質的特徴を捉える。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:18:39 GMT)
Dynamical and Emission Properties of Quantum Emitters driven by Ultra-Short Laser Pulses [0.0] 高性能量子技術の開発は、高忠実度で固体エミッタの量子状態を作成する能力に依存している。
共振型Rabi発振、断熱型ラピッドパス(ARP)、Notch-filtered ARPの3つの単一パルスコヒーレント制御プロトコルを理論的に比較した。
以上の結果より,NARPは内因性スペクトル分離性と高忠実度断熱路とを一意に組み合わせていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:38:17 GMT)
Dual Signal Decomposition of Stochastic Time Series [0.0] この分解は、機械学習技術を用いて二重信号に適合させることによって行われる。
提案した分解は時系列の平均と分散に対する平滑化アルゴリズムとして適用することができる。
二重信号は2次元空間上で表現することができ、固有構造を学習したり、平均と分散の両方を予測したり、多重時系列の場合のクロスエフェクトを分析するのに用いられる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:30:04 GMT)
Domain-Generalization to Improve Learning in Meta-Learning Algorithms [0.0] ドメイン一般化シャープネスを考慮した最小化モデル-非依存メタラーニング(DGS-MAML)
本稿では,学習データに制限のあるタスクを対象とするメタ学習アルゴリズムであるDGS-MAML(Domain Generalization Sharpness-Aware Minimization Model-Agnostic Meta-Learning)を提案する。
ベンチマークデータセット実験の結果,DGS-MAMLは精度と一般化の点で既存手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:30:11 GMT)
Digital Contact Tracing: Examining the Effects of Understanding and Release Organization on Public Trust [0.0] 2022年6月、米国の成人101人が、新型コロナウイルス(COVID-19)の接触追跡アプリケーションに対する認識と信頼について調査された。
接触追跡アプリケーションに対するプライバシ保護手順に対する個人の理解と、そのようなアプリケーションを信頼する意思との間には、明確な相関はみられない。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:13:40 GMT)
Defining classical and quantum chaos through adiabatic transformations [0.0] 量子システムと古典システムの両方におけるカオスを定義する形式主義を提案する。
古典的な時間平均軌道を保存する断熱変換の複雑さはカオスの尺度となる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:04:37 GMT)
Deep Learning Enables Large-Scale Shape and Appearance Modeling in Total-Body DXA Imaging [0.0] TBDXAスキャンにおける点位置の自動配置のための深層学習手法の開発と検証を行った。
この方法は、外部テストデータセットにおいて、99.5%の正確なキーポイントを達成する。
身体組成と形状と各種の疲労, 代謝, 炎症, 心膜メタボリックな健康マーカーとの関連性について新しい仮説を提出した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 18:54:54 GMT)
Decentralization: A Qualitative Survey of Node Operators [0.0] ブロックチェーンノードオペレータから‘分散化’と‘分散化劇場’の定義を求めます。
ほとんどのオペレータは、技術的な軸とガバナンス軸に広く存在するものとして、分散化を考えている。
私たちの重要な発見は、分散化だけでは台帳の不変性やシステム的堅牢性に影響を与えないということです。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:48:59 GMT)
Data-Efficient Learning for Generalizable Surgical Video Understanding [0.0] 本研究は, 深層学習に基づく外科的ビデオ解析と実世界の臨床環境とのギャップを埋めることを目的としている。
私は最先端のニューラルネットワークアーキテクチャをベンチマークして、各タスクの最も効果的な設計を特定しました。
我々は,大量の未ラベルの手術ビデオを活用することにより,タスク間のモデル性能を向上させる半駆動型フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:00:23 GMT)
Counting Short Trajectories in Elementary Cellular Automata using the Transfer Matrix Method [0.0] 初等細胞オートマタ(ECA)は、ウルフラムの質的な分類によって分類される様々な行動を示す。
限られた時間ステップで短いアトラクタに繋がる全ての構成数を計算できる手法について述べる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:53:22 GMT)
Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling from a Probability Distribution of a Restricted Boltzmann Machine [0.0] 制限ボルツマンマシン(RBM)のサンプリング品質評価における局所バレー中心のアプローチ
古典的に訓練されたRBMのD-WaveおよびGibsサンプルは、対照的な発散に基づくRBM学習に関連する条件下で得られた。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:50:44 GMT)
Characterizing Universal Gate Sets via Dihedral Benchmarking [0.0] 二面体群に付随する非クリフォードゲートの誤差率を頑健に特徴付けるための実用的な実験的プロトコルについて述べる。
我々の二面ベンチマークプロトコルは、通常のユニタリ2設計条件を緩和するランダム化ベンチマークの一般化である。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:36:02 GMT)
Can Transformers Break Encryption Schemes via In-Context Learning? [0.0] In-context Learning (ICL)は、トランスフォーマーベースの言語モデルの強力な能力として登場した。
暗号関数学習分野におけるICLの新たな応用を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 23:09:32 GMT)
Calibrated Self-supervised Vision Transformers Improve Intracranial Arterial Calcification Segmentation from Clinical CT Head Scans [0.0] 頭蓋内動脈石灰化 (IAC) は、脳卒中や認知症などの神経血管疾患に関連する日常的に取得されたCTスキャンで見られる画像バイオマーカーである。
はじめてIACセグメンテーションのために,MAEを用いてVTを事前訓練し,微調整を行った。
IACセグメンテーションにおけるMAEプレトレーニング ViT の意義について検討し,臨床的意義について検討した。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:16:56 GMT)
CATNet: A geometric deep learning approach for CAT bond spread prediction in the primary market [0.0] 本稿では,カタストロフィ結合の価格設定にディープラーニングアーキテクチャを適用した新しいフレームワークであるCATNetを紹介する。
分析の結果,CAT結合市場は,高連結で影響力のあるハブが支配する構造であるスケールフリーネットワークの特性を示すことがわかった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 21:38:25 GMT)
Bridging Theory and Practice in Quantum Game Theory: Optimized Implementation of the Battle of the Sexes with Error Mitigation on NISQ Hardware [0.0] 我々は,IBM Quantumのibm シャーブルック超伝導プロセッサ上でのセクシーズの戦いを初めて実験的に実現した例の1つを提示する。
本稿では,実時間トポロジとキャリブレーションデータに基づいて,キュービットペアを動的に選択し,ルーティングを最適化するガイド回路マッピング(GCM)手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:14:42 GMT)
Block: Balancing Load in LLM Serving with Context, Knowledge and Predictive Scheduling [0.0] Blockは分散スケジューリングフレームワークで、ロードバランシングとサービスフレームワークのインスタンス間の自動プロビジョニングを最適化するように設計されている。
低オーバーヘッド、信頼性、スケーラビリティを実現するために、完全に分散し、ステートレスで予測可能なスケジューリングシステムとして動作する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 17:17:46 GMT)
Benchmarking Pretrained Molecular Embedding Models For Molecular Representation Learning [0.0] 事前学習されたニューラルネットワークは化学や小さな分子の薬物設計に大きな関心を集めている。
本研究は,25データセットにまたがる25モデルについて,これまでで最も広範な比較を行ったものである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:01:26 GMT)
Benchmark-Driven Selection of AI: Evidence from DeepSeek-R1 [0.0] より優れたパフォーマンスは、必ずしもテスト時のアルゴリズム改善やモデルサイズによってもたらされるのではなく、影響のあるベンチマークを学習のカリキュラムとして使用することによってもたらされることを示す。
我々は、このベンチマーク駆動によるAIの選択と呼び、HumanityのLast Examからのシーケンシャルな意思決定問題を使用して、DeepSeek-R1への影響を示す。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 20:15:20 GMT)
Autonomous AI Bird Feeder for Backyard Biodiversity Monitoring [0.0] 本稿では,ベルギーの都市庭園における自律型裏庭鳥監視システムについて,低コストで検討する。
モーショントリガIPカメラがFTP経由でショートクリップをローカルサーバにアップロードし、フレームがサンプリングされ、鳥がDectron2でローカライズされる。
次に、収穫された領域は、より大きなKaggleコーパスから派生した40種のベルギーのサブセットに調整された効率的なNet-B3モデルによって分類される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 00:27:22 GMT)
Augmentation Technologies and AI - An Ethical Design Futures Framework [0.0] 人工知能(AI)が推進する拡張技術は、日々のユーザー向けに適応と正規化のプロセスを実行している。
Augmentation TechnologiesとAIの概要 - 倫理的デザイン・フューチャーズ・フレームワークは、プロフェッショナルな実践をリフレーミングするためのガイドとして機能する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 13:30:11 GMT)
Aryabhata: An exam-focused language model for JEE Math [0.0] インド学術試験(JEE)に最適化されたコンパクト 7B パラメータ数学推論モデルである Aryabhata 1.0 について紹介する。
Aryabhata 1.0は、強力なオープンウェイト推論モデルと、教師付き微調整(SFT)と、検証されたチェーンオブソートトレースのカリキュラムを融合して構築されている。
私たちはAryabhataを、試験中心のオープンソースの小言語モデルを前進させるための基礎モデルとしてリリースします。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 05:34:21 GMT)
Artificial intelligence (AI) techniques: a game-changer in Digital marketing for shop [0.0] (AI) 店舗と消費者のデジタルインタラクションをデジタルに変換する技術。
本研究では,(AI)技術が消費者のインタラクションや意思決定にどう影響するかを検討する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:46:10 GMT)
Analytic bulk-edge connection in circular-symmetric models [0.0] 円周縁を持つ2次元の2バンド系の固有関数の体系的解析を提案する。
固有関数の位相関係は、単位ベクトルの三次元体への写像によって記述される。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 01:58:01 GMT)
Analysis of the Compaction Behavior of Textile Reinforcements in Low-Resolution In-Situ CT Scans via Machine-Learning and Descriptor-Based Methods [0.0] ネスティングは硬さ、透水性、耐損傷性といった機械的特性を定義する上で重要な役割を果たしている。
本研究は,低分解能CTを用いた乾燥織物補強材におけるネスト挙動の定量化のための枠組みを提案する。
調整した3D-UNetにより,50~60%の繊維含有量に対応する圧縮段階におけるマトリックス,ウェフト,フィリングのセマンティックセマンティックセグメンテーションが可能となった。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:57:30 GMT)
Agentic AI Frameworks: Architectures, Protocols, and Design Challenges [0.0] 人工知能では、人工知能エージェントが目標指向の自律性、文脈推論、動的マルチエージェント調整を示す。
本稿では,CrewAI,LangGraph,AutoGen,Semantic Kernel,Agno,Google ADK,MetaGPTなど,主要なエージェントAIフレームワークの体系的レビューと比較分析を行う。
この分野における重要な制限、新たなトレンド、オープンな課題を特定します。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 19:16:18 GMT)
Adiabatic Dynamics of Entanglement [0.0] 断熱進化の過程で、絡み合いの変化は避けられたエネルギーレベルの交差に起因することが示される。
この再分配の効率は回避されたレベルの交差の狭さに依存し、したがって断熱進化の速度を制限している。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 15:24:05 GMT)
Addressing some common objections to generalized noncontextuality [0.0] 我々は、一般化された非文脈性の定義と、それを実験的にテストする可能性に対する批判に答える。
1つの反論は、実験の各実行中に実験の手順が実際に実行された古典的な記録の存在は、非文脈性の失敗の証明の必要な要素である操作等価関係が保持されないことを意味するということである。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 12:03:45 GMT)
AST-n: A Fast Sampling Approach for Low-Dose CT Reconstruction using Diffusion Models [0.0] AST-nは、中間雑音レベルからの逆拡散を開始する加速推論フレームワークである。
25ステップしか使用しない条件付きモデル(AST-25)は38dB以上のピーク信号対雑音比(PSNR)を達成する。
高次サンプリング器を持つAST-nは、画像の忠実度を著しく損なうことなく、高速LDCT再構成を可能にする。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 16:57:49 GMT)
AI Blob! LLM-Driven Recontextualization of Italian Television Archives [0.0] AI Blob!は、1,547のイタリアのテレビビデオのキュレートされたデータセットを、音声を変換し、それを文単位に分割し、これらのセグメントをセマンティッククエリーのためのベクトルデータベースに埋め込むことで処理する。
このプロジェクトは、メディア歴史学とAI駆動の考古学研究において進行中の議論に寄与し、概念的なフレームワークと、さらなる学際的な実験をサポートするために公開されているデータセットの両方を提供する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 06:38:32 GMT)
A multi-strategy improved snake optimizer for three-dimensional UAV path planning and engineering problems [0.0] そこで本研究では, 局所最適に閉じ込められるリスクを回避すべく, MISO (Multi-strategy Improved Snake) を提案する。
我々は、エリートリーダーシップとブラウン運動を組み合わせた位置更新戦略を提案し、精度を確保しつつ、効果的に速度を加速させた。
実験結果から,MISOは他の競合アルゴリズムよりも解の質や安定性が優れていることが示された。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 14:12:28 GMT)
A Moral Agency Framework for Legitimate Integration of AI in Bureaucracies [0.0] 公務員官僚は人工知能(AI)の恩恵を享受しようとする
本稿では,官僚構造におけるAIの合法的な統合のための3点のモラルエージェンシー・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 22:11:11 GMT)
A Long-Baseline Atom Interferometer at CERN LHC Point 4: Implementation Study [0.0] LS3(2026年6月~2030年6月)におけるLHCポイント4のPX46軸の技術的実装について述べる。
我々は、必要な土木工事、放射線遮蔽装置の設置、アクセス制御システムの配備、安全アラームについて詳述する。
正式な承認から、すべての介入は1.5年以内に完了できる。
論文参考訳(メタデータ) (Wed, 13 Aug 2025 10:47:16 GMT)