Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models [164.5] ネモトロン-Hは8Bと56B/47Bハイブリッド・マンバ・トランスフォーマーのファミリーである。
私たちは共通のTransformerモデルアーキテクチャにおけるほとんどの自己注意レイヤをMambaレイヤに置き換えます。
Nemotron-Hモデルは、他の同様のサイズのオープンソーストランスフォーマーモデルと比較して、精度が良いか低いかのどちらかを提供する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:41:58 GMT)
AIR: A Systematic Analysis of Annotations, Instructions, and Response Pairs in Preference Dataset [95.5] 嗜好学習は、大きな言語モデルと人間の価値の整合に不可欠である。
私たちの作業は、好みのデータセット設計をアドホックなスケーリングからコンポーネント対応の最適化にシフトします。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:33:07 GMT)
Enhancing Temporal Consistency in Video Editing by Reconstructing Videos with 3D Gaussian Splatting [94.8] Video-3DGSは、ゼロショットビデオエディタの時間的一貫性を高めるために設計された3Dガウススプラッティング(3DGS)ベースのビデオ精細機である。
本手法は動的モノクロビデオの編集に適した2段階の3次元ガウス最適化プロセスを利用する。
58の動的モノクロビデオ間の時間的一貫性を確保することで、ビデオ編集を強化する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:48:54 GMT)
Do Larger Language Models Imply Better Reasoning? A Pretraining Scaling Law for Reasoning [89.2] 本研究では,実世界の大規模知識グラフの構造と分布を再現する合成マルチホップ推論環境を提案する。
我々の推論タスクは、グラフの欠落したエッジを補完することであり、これは高度なマルチホップ推論を必要とし、現実世界の推論シナリオを模倣する。
特定の知識グラフに対して最適なモデルサイズを予測するために,知識グラフ探索エントロピーを最適モデルサイズに線形にマッピングする経験的スケーリングを求める。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:57:22 GMT)
VLIPP: Towards Physically Plausible Video Generation with Vision and Language Informed Physical Prior [88.5] 近年,映像拡散モデル (VDM) が大幅に進歩し,映像のリアル化が進んでいる。
VDMは物理の理解の欠如のため、物理的にもっともらしいビデオを作ることができないことが多い。
本稿では,物理を視覚と言語に明示的に組み込んだ新しい2段階画像・映像生成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:23:21 GMT)
Certified Defense on the Fairness of Graph Neural Networks [86.1] グラフニューラルネットワーク(GNN)は,グラフベースのタスクにおいて,目立ったグラフ学習モデルとして登場した。
悪意のある攻撃者は、入力グラフデータに摂動を追加することで、予測の公平度を容易に損なうことができる。
本稿では, ELEGANT というフレームワークを提案し, GNN の公正度レベルにおける認証防御の新たな課題について検討する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:00:42 GMT)
APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay [86.0] APIGen-MTは検証可能で多様なマルチターンエージェントデータを生成するフレームワークである。
xLAM-2-fc-r 級数で 1B から 70B のパラメータを持つモデル群を訓練する。
我々のモデルは、$tau$-benchとBFCLベンチマークでGPT-4oやClaude 3.5のようなフロンティアモデルより優れている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:13:57 GMT)
Robust Human Registration with Body Part Segmentation on Noisy Point Clouds [73.0] メッシュフィッティングプロセスにボディ部分のセグメンテーションを組み込んだハイブリッドアプローチを導入する。
本手法はまず,まず各点にボディ部ラベルを割り当て,次に2ステップのSMPL-Xフィッティングを導出する。
装着された人間のメッシュは、ボディ部分のラベルを洗練し、セグメンテーションの改善につながることを実証する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:17:33 GMT)
AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing [72.1] Self-Supervised Video Hashing (SSVH)は、動画をハッシュコードに圧縮し、ラベルなしのトレーニングビデオを使用して効率的なインデックス付けと検索を行う。
既存のアプローチは、ビデオの特徴を学習し、すべてのフレームを平等に扱うためにランダムなフレームサンプリングに依存している。
本稿では,ハッシュベースのコントラスト学習を用いた対数フレームサンプリングを用いたAutoSSVHという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:56:17 GMT)
AI Alignment: A Comprehensive Survey [69.6] AIアライメントは、AIシステムが人間の意図や価値観に沿って振る舞うようにすることを目的としている。
AIアライメントの重要な目的として、ロバストネス、解釈可能性、制御可能性、倫理という4つの原則を特定します。
我々は、現在のアライメント研究を、前方アライメントと後方アライメントの2つの重要なコンポーネントに分解する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:14:49 GMT)
A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.2] 様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:17:18 GMT)
Towards deployment-centric multimodal AI beyond vision and language [67.0] デプロイ不能なソリューションの可能性を減らすために、デプロイメント制約を早期に組み込んだデプロイメント中心のワークフローを提唱します。
我々は、複数の分野にまたがる共通のマルチモーダルAI固有の課題を特定し、3つの実世界のユースケースについて検討する。
複数の学際的な対話とオープンな研究プラクティスを育むことで、我々のコミュニティは、広く社会に影響を及ぼすためのデプロイメント中心の開発を加速できる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:20:05 GMT)
Why Reasoning Matters? A Survey of Advancements in Multimodal Reasoning (v1) [66.5] 推論は人間の知性の中心であり、多様なタスクにまたがる構造化された問題解決を可能にする。
大規模言語モデル(LLM)の最近の進歩は、算術、常識、記号領域における推論能力を大幅に向上させてきた。
本稿では,テキストおよびマルチモーダルLLMにおける推論手法の簡潔かつ洞察に富んだ概要について述べる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:04:56 GMT)
Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Instructional Videos [66.2] LangViewは、ビュー依存のキャプション予測の相対的精度を、擬似ラベルを最もよく見るためのプロキシとして利用するフレームワークである。
推論中、我々のモデルは多視点ビデオ(言語やカメラのポーズなし)のみを入力として、各タイミングで見るのに最適な視点を返します。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:45:11 GMT)
3D-Mem: 3D Scene Memory for Embodied Exploration and Reasoning [65.4] エンボディエージェントのための新しい3Dシーンメモリフレームワークである3D-Memを提案する。
3D-Memは、シーンを表現するために、Memory Snapshotsと呼ばれる情報的なマルチビューイメージを使用している。
さらに、Frontier Snapshots-glimpsの未探索領域対応エージェントを導入して、情報的な意思決定を行うことによって、フロンティアベースの探索をさらに統合する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:02:20 GMT)
Motion-Grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Level [63.2] Motion-Grounded Video Reasoningは、入力された質問に応じて視覚的回答(ビデオセグメンテーションマスク)を必要とする新しい動作理解タスクである。
このタスクは、質問による暗黙の推論を可能にすることで、明示的なアクション/モーショングラウンドの既存の基盤作業を、より一般的なフォーマットに拡張する。
我々はMotion-Grounded Video Reasoning Assistant(MORA)という新しいベースラインモデルを導入する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:20:03 GMT)
LightPROF: A Lightweight Reasoning Framework for Large Language Model on Knowledge Graph [57.4] 大きな言語モデル(LLM)は、テキスト理解とゼロショット推論において素晴らしい能力を持っている。
知識グラフ(KG)は、LLMの推論プロセスに対して、リッチで信頼性の高いコンテキスト情報を提供する。
我々は、KGQA(LightPROF)のための新しい軽量で効率的なPrompt Learning-ReasOning Frameworkを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:03:47 GMT)
Semi-Supervised Model-Free Bayesian State Estimation from Compressed Measurements [57.0] 圧縮測定によるベイズ状態の推定について考察する。
時間的測定ベクトルの寸法は、推定される時間的状態ベクトルの寸法よりも小さい。
状態の進化の基盤となる力学モデルは「モデルフリープロセス」では未知数である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:38:45 GMT)
Decoding Time Series with LLMs: A Multi-Agent Framework for Cross-Domain Annotation [56.8] TESSAは、時系列データに対する一般的なアノテーションとドメイン固有のアノテーションの両方を自動的に生成するように設計されたマルチエージェントシステムである。
General Agentは複数のソースドメインにまたがる共通パターンと知識をキャプチャし、時系列とテキストの両方の機能を利用する。
ドメイン固有のエージェントは、ターゲットドメインからの限定アノテーションを使用して、ドメイン固有の用語を学び、ターゲットアノテーションを生成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:58:33 GMT)
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder [55.6] そこで本研究では,DAE-Talkerを用いて全映像フレームを合成し,音声の内容に合わせて自然な頭部の動きを生成する。
また、ポーズ制御性のための音声2latentのポーズモデリングも導入する。
実験の結果,DAE-Talkerはリップシンク,ビデオの忠実さ,自然さなどの既存の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:04:08 GMT)
Retrieving Semantics from the Deep: an RAG Solution for Gesture Synthesis [55.5] RAG-Gestureは、意味的に豊かなジェスチャーを生成するための拡散に基づくジェスチャー生成手法である。
我々は、明示的なドメイン知識を用いて、共同音声ジェスチャーのデータベースから動きを検索する。
提案手法では,各検索挿入が生成したシーケンスに対して与える影響量を調整可能なガイダンス制御パラダイムを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:48:19 GMT)
FADA: Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG Distillation [55.4] 拡散に基づく音声駆動型アバター手法は近年,高忠実で鮮明で表現力のある結果に注目されている。
拡散モデルの様々な蒸留技術が開発されているにもかかわらず, 自然拡散蒸留法では良好な結果が得られないことがわかった。
本稿では,FADA (Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG Distillation) を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:07:56 GMT)
Sample, Don't Search: Rethinking Test-Time Alignment for Language Models [55.2] 新しいテストタイムアライメントアプローチであるQAlignを紹介します。
テスト時間計算をスケールする際、QAlignは各プロンプトの最適配向分布からのサンプリングに収束する。
マルコフ連鎖モンテカルロのテキスト生成における最近の進歩を取り入れることで、基礎となるモデルを変更したり、ロジットアクセスを必要とせずに、より良い整合出力を可能にする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 00:41:40 GMT)
Interpreting Object-level Foundation Models via Visual Precision Search [54.6] より少ない領域で正確な属性マップを生成する視覚的精度探索法を提案する。
本研究では,DINO と Florence-2 の SOTA に対するオブジェクトレベルのタスク解釈可能性の向上を,様々な評価指標で示す。
提案手法は,複数の評価指標にまたがる既存の手法を超越して,視覚的接地や物体検出タスクにおける障害を解釈することができる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:39:24 GMT)
Cloning Games, Black Holes and Cryptography [53.9] クローンゲーム解析のための新しいツールキットを提案する。
これらのゲームは、より定量的なノンクローズング(no-cloning)バージョンをキャプチャし、ブロック不能暗号の中心となる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:48:23 GMT)
Drawing a Map of Elections [53.9] 選挙の地図は、選挙のデータセット、選挙間の類似性を測定する方法、および2Dユークリッド空間における選挙の表現の3つの主要な要素で構成されている。
様々な基準に従って地図上で選挙を彩色することは、多くの実験の結果を分析するのにどう役立つかを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:44:56 GMT)
Detection Based Part-level Articulated Object Reconstruction from Single RGBD Image [52.1] 本稿では,1枚のRGBD画像から複数の人工関節オブジェクトを再構成する,エンドツーエンドで訓練可能なクロスカテゴリ手法を提案する。
私たちは、あらかじめ定義された部分数で人工的なオブジェクトに焦点をあて、インスタンスレベルの潜在空間を学習することに依存する以前の作業から離れています。
提案手法は, 従来の作業では処理できない様々な構成された複数インスタンスの再構築に成功し, 形状再構成や運動学推定において, 先行の作業よりも優れていた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:08:04 GMT)
ScreenSpot-Pro: GUI Grounding for Professional High-Resolution Computer Use [47.6] ScreenSpot-Proは,MLLMの高精細度プロセッティングにおける接地性能を厳格に評価するために設計された新しいベンチマークである。
このベンチマークは、専門家アノテーションを持つさまざまな専門家ドメインの本物の高解像度画像を含む。
本稿では,強力なプランナーのGUI知識を活かしたビジュアル検索手法であるScreenSeekeRを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:25:17 GMT)
EnrichIndex: Using LLMs to Enrich Retrieval Indices Offline [47.1] 実世界の検索システムは、文書が関係しているかどうかを暗黙的に判断するためにしばしば必要とされる。
大規模言語モデル(LLM)は、それらの推論スキルを活用することで、そのような意味のある関連性を識別する大きな可能性を秘めている。
本稿では,LLMをオフラインで使用して意味に富んだ検索指標を構築する検索手法であるEnrichIndexを紹介する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:08:46 GMT)
MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models [46.9] 既存のMLLMベンチマークは、統一MLLM(U-MLLM)の評価において重大な課題に直面している。
U-MLLMを体系的に評価するための総合評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:59:55 GMT)
The Central Role of the Loss Function in Reinforcement Learning [46.7] 回帰損失関数の違いが値に基づく意思決定アルゴリズムのサンプル効率と適応性に与える影響を実証する。
複数の設定にまたがって、バイナリクロスエントロピー損失を用いたアルゴリズムが、最適ポリシーのコストで1次境界スケーリングを実現することを証明した。
本論文は, 種々の損失関数を持つ意思決定アルゴリズムのガイドとして機能し, 読者により良い損失関数を求め, 任意の意思決定アルゴリズムを改善することを期待する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:09:19 GMT)
Optimizing Specific and Shared Parameters for Efficient Parameter Tuning [46.6] 微調整時の分布変化を効果的に緩和する新しいPETL法であるSaSを提案する。
SaSは低ランクプロジェクションを用いて、レイヤ間で共通の統計特性をキャプチャする。
さまざまなダウンストリームタスク、いくつかのショット設定、ドメインの一般化の実験は、SaSがパフォーマンスを大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:43:54 GMT)
What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices [46.3] 本研究は,大規模言語モデルが政治的話題に刺激された場合の回答や省略を拒否する程度について検討する。
我々の分析では、西欧諸国、中国、ロシアの14の最先端モデルが、国連(UN)の6つの公式言語すべてで引き起こされている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:09:06 GMT)
Leveraging LLM For Synchronizing Information Across Multilingual Tables [45.8] 本稿では,多言語情報同期のための大規模言語モデル (LLM) について検討する。
本稿では,古くなったウィキペディアのテーブルを更新する実世界のプロセスをシミュレートした,情報更新データセットを提案する。
この結果から,単一プロンプトアプローチが最適でない結果をもたらすことがしばしばあり,タスク分解戦略を導入することが示唆された。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:18:32 GMT)
Gravitational redshift via quantized linear gravity [45.0] 線形化量子重力を用いて、重力赤方偏移が純粋に量子過程として起こることを示す。
赤方偏移は一般相対性理論によって予測されるが、曲率のない時空に生じる。
その結果は、低エネルギーおよび低曲率状態における重力の量子的性質の理解を改善するのに役立つ。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:44:34 GMT)
Quantifying Robustness: A Benchmarking Framework for Deep Learning Forecasting in Cyber-Physical Systems [44.6] 我々は,産業用CPSに合わせて,分散ロバスト性に基づく実用的ロバスト性定義を導入する。
本フレームワークは,センサドリフト,ノイズ,不規則サンプリングなどの現実的な乱れをシミュレートし,予測モデルの徹底的なロバスト性解析を可能にする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:50:48 GMT)
Classic Video Denoising in a Machine Learning World: Robust, Fast, and Controllable [44.3] 従来の手法に基づく微分可能なデノナイズパイプラインを提案する。
その後、ニューラルネットワークがトレーニングされ、各入力に対して最適なdenoisingパラメータが予測される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:03:23 GMT)
Diverse In-Context Example Selection After Decomposing Programs and Aligned Utterances Improves Semantic Parsing [43.4] 私たちは利用可能なICEツリーのプールを断片に分解することに重点を置いています。
我々は、多種多様なICE選択のための最近の手法を、全体および断片化されたICEインスタンスで動作するように拡張する。
我々は,一般的な多種多様な意味解析ベンチマークを用いて,SCUD4ICLの評価を行った。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:41:44 GMT)
Time evolution of randomness in Bell's experiment indicates 'Realism' is false [41.9] 短パルス中の最小エントロピーと(推定)コルモゴロフのバイナリ時系列の複素度を計測する。
両症例の進化を, 近距離24m, 遠距離24mの直線配置で比較した。
これは、ベルの不等式の導出と観察に必要な仮説のどれが偽であるかの手がかりとなる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:39:15 GMT)
Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination [41.7] 大規模言語モデル(LLM)は、誤った情報や誤解を招く情報を幻覚させ、信頼性を制限する傾向がある。
アーキテクチャの変更は幻覚に対する既存の懸念を悪化/悪化させるか?
これらの知見は、これらの問題を相互によりよく理解することの必要性を強調し、幻覚を扱うためのより普遍的なテクニックをどう設計するかを考察する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:55:58 GMT)
Model Reveals What to Cache: Profiling-Based Feature Reuse for Video Diffusion Models [41.1] ProfilingDiTは、フォアグラウンドとバックグラウンドに焦点を当てたブロックを明示的にアンタングルする、新しいアダプティブキャッシュ戦略である。
当社のフレームワークは,総合的な品質指標間の視覚的忠実度を維持しながら,大幅な加速を実現している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:30:15 GMT)
Detecting Stereotypes and Anti-stereotypes the Correct Way Using Social Psychological Underpinnings [41.1] 本研究では, ステレオタイプ, アンチステレオタイプ, ステレオタイプバイアス, バイアスを区別し, 正確に定義する。
10B未満のパラメータを持つ推論のための言語モデルは、アンチステレオタイプを検出する際に混乱することが多いことを実証する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:14:38 GMT)
One-Shot Heterogeneous Federated Learning with Local Model-Guided Diffusion Models [40.8] FedLMGは局所モデル誘導拡散モデルを用いた単発フェデレーション学習法である。
クライアントはファンデーションモデルにアクセスする必要はなく、ローカルモデルのトレーニングとアップロードのみを行う。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:46:28 GMT)
Data-Efficient Kernel Methods for Learning Differential Equations and Their Solution Operators: Algorithms and Error Analysis [40.7] 我々は、微分方程式とその解マップを学習するための新しいカーネルベースのフレームワークを、データ要求において効率的に導入する。
我々のアプローチは数学的に解釈可能であり、学習方程式の量的最悪の誤り境界の形で厳密な理論的保証によって裏付けられている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:13:38 GMT)
MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs [39.7] 高品質な医療推論データセットであるMedReasonを紹介する。
我々のパイプラインは7つの医学データセットから様々な医学的質問の詳細な推論を生成する。
私たちの最高のパフォーマンスモデルであるMedReason-8Bは、最先端の医療推論モデルであるHuatuo-o1-8Bを、臨床ベンチマークMedBulletsで最大4.2%上回っています。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:29:18 GMT)
Adaptation of Large Language Models [39.6] LLMの適応に関するこのチュートリアルは、ジェネリックLLMの静的能力を超えたモデルの需要増加に対応するために設計されている。
まず, LLMにおけるパラメトリック知識の更新に焦点を当てたパラメトリック知識適応について検討する。
2つめの適応は、半パラメトリックな知識適応であり、その目標は、外部の知識やツールをよりよく活用するために、LSMパラメータを更新することである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:57:41 GMT)
Accurate and Honest Approximation of Correlated Qubit Noise [39.6] 提案手法は, 量子ビット相関度の高い雑音成分を組み込むことにより, 精度を向上することのできる, 近似雑音チャネルの効率的な構成法である。
固定周波数超伝導量子ビットに典型的な現実的な雑音強度では、2量子ビット相関を超える相関ノイズがコードシミュレーションの精度に大きく影響することを発見した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:29:30 GMT)
CORTEX-AVD: CORner Case Testing & EXploration for Autonomous Vehicles Development [37.7] CARLA Simulator と Scenic を統合し,Corner Cases を自動生成するオープンソースフレームワークである CORTEX-AVD を紹介する。
距離、時間、速度、衝突確率などの変数を考慮に入れた多要素適合関数が組み込まれている。
実験の結果, CORTEX-AVD フレームワークは, 使用済みシミュレーションの割合を減らしながら, CC の発生率を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 23:05:31 GMT)
Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme [36.3] 本研究は、視覚モデル(VLM)における強化学習(RL)のための透明でゼロスクラッチなフレームワークを導入する。
複数のモデルとデータセットにまたがって検証される、最小限の機能を備えた4ステップパイプラインを提供する。
さらに、トレーニング力学と反射行動を評価するために、標準化された評価手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:07:06 GMT)
Leveraging Gait Patterns as Biomarkers: An attention-guided Deep Multiple Instance Learning Network for Scoliosis Classification [36.2] スコリオーシス(Scooliosis)は、早期発見が困難で、胸腔を圧迫する脊椎曲率障害である。
従来のスコリシス検出法は臨床の専門知識に依存しており、X線イメージングは放射線リスクを生じさせる。
本稿では,歩行パターンから識別的特徴を効果的に捉えるために,注意誘導型深層多インスタンス学習法(Gait-MIL)を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:35:33 GMT)
Improving Unsupervised Constituency Parsing via Maximizing Semantic Information [35.6] 教師なしの選挙区は、文内のフレーズを木のような構文構成構造に整理する。
文ログ類似度を最大化する従来の目的は、構成構造と意味論の密接な関係を明示的に説明していない。
構成構造に符号化された意味情報であるSemInfoを最大化することで解析を訓練する新しい目的を導入する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:11:58 GMT)
Enhancing Prompt Injection Attacks to LLMs via Poisoning Alignment [35.6] 攻撃者はLSMのアライメントプロセスに毒を盛ることで、即時注射攻撃の成功を促進できることを示す。
具体的には,有毒なアライメントサンプルを戦略的に生成する手法であるPoisonedAlignを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:04:01 GMT)
Endo3R: Unified Online Reconstruction from Dynamic Monocular Endoscopic Video [35.2] Endo3Rは、単眼手術ビデオからのオンラインスケール一貫性再構築のための統合された3D基盤モデルである。
我々のモデルは,オフライン最適化なしで,グローバルに整列したポイントマップ,スケール一貫性のあるビデオ深度,カメラパラメータを予測してタスクを統一する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:05:22 GMT)
Observation of Temperature Effects in False Vacuum Decay [34.8] 超低温原子スピン混合系における真空崩壊機構の時間スケールの温度依存性を測定した。
以上の結果から, 真空崩壊速度は, 有限温度拡大により予測される温度とともにスケールすることがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:28:41 GMT)
Seeing is Believing: Belief-Space Planning with Foundation Models as Uncertainty Estimators [34.3] オープンワールド環境における汎用的なロボット移動操作は、長い地平線、複雑な目標、部分的な観測可能性といった大きな課題を生んでいる。
これらの課題に対処するための有望なアプローチは、タスクプランナーがこれらのスキルをシーケンスして、構造化言語で指定された目標を達成する、パラメータ化されたスキルのライブラリを計画することである。
本稿では、視覚言語モデルを利用して不確実性を推定し、シンボリックグラウンド化を促進する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:48:53 GMT)
Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation [34.1] textbfACTalkerは、多信号制御と単信号制御の両方をサポートするエンドツーエンドのビデオ拡散フレームワークである。
本手法は,多様な信号によって駆動される自然な顔映像を生成し,マンバ層は競合なく複数の駆動モードをシームレスに統合する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:51:11 GMT)
UniGEM: A Unified Approach to Generation and Property Prediction for Molecules [33.9] 分子生成と特性予測をうまく統合する最初の統一モデルUniGEMを提案する。
我々の重要な革新は、分子足場が形成された後、後段で予測タスクが活性化される新しい2相生成プロセスにある。
UniGEMの背景にある原則は、自然言語処理やコンピュータビジョンなど幅広い応用を約束している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:57:36 GMT)
SPF-Portrait: Towards Pure Portrait Customization with Semantic Pollution-Free Fine-tuning [33.7] SPF-Portraitは、テキスト駆動のポートレートカスタマイズにおいてセマンティックな汚染を排除しつつ、カスタマイズされたセマンティクスを純粋に理解する先駆的な研究である。
筆者らはSPF-Portraitにおいて,従来の微調整パスの参照としてオリジナルのモデルを導入したデュアルパスパイプラインを提案する。
本稿では,ターゲットセマンティクスの応答領域を正確に表現するセマンティック・アウェア・ファイン・コントロール・マップを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:56:33 GMT)
Demonstration of a Tunable Non-Hermitian Nonlinear Microwave Dimer [33.7] 位相非相反ホッピングダイナミクスを正確に実装するために,波長可変で非エルミタン,非線形マイクロ波ダイマーを導入する。
我々の結果は、センシングや合成フォトニック材料からニューロモルフィックコンピューティングや量子ネットワークまで、様々な分野に影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:09:58 GMT)
A silicon spin vacuum: isotopically enriched $^{28}$silicon-on-insulator and $^{28}$silicon from ultra-high fluence ion implantation [33.3] 等方的に濃縮されたシリコン(Si)は、非ゼロ核スピンを持つ自然発生の29ドルSiを最小化することによりコヒーレンス時間を大幅に向上させることができる。
バルク状Si基板の超高フルエンス2,8$Siイオン注入は,超高純度2,8$Si同位体純度に対する魅力的な技術として最近実証された。
本研究では,28ドルSi濃縮プロセスを適用し,28ドルSiと28ドルSi-on-insulator (SOI)サンプルを生成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:25:08 GMT)
Investigating Affective Use and Emotional Well-being on ChatGPT [32.8] 本稿では,ChatGPTとのインタラクションがユーザの感情的幸福感,行動,経験に与える影響について検討する。
情緒的手がかりとして300万以上の会話を分析し,ChatGPTに対する認識から4,000人以上のユーザを調査した。
施設審査委員会(IRB)が承認したランダム化制御試験(RCT)を28日間に1,000人近い参加者で実施する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:22:10 GMT)
Toward a digital twin of U.S. Congress [31.4] 我々は、各期間に米国議会議員のすべてのつぶやきを含む、日々更新されたデータセットを紹介、提供します。
このデータの議会固有のサブセットを備えた現代の言語モデルでは、実際のツイートとほとんど区別できないツイートを生成できることを実証する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:33:36 GMT)
Doppelgangers++: Improved Visual Disambiguation with Geometric 3D Features [30.2] ドッペルガンガー検出の精度を高め、3次元再構成精度を向上させる手法であるドッペルガンガース++を提案する。
私たちのコントリビューションには、ランドマークベースのデータセットを超えて拡大するために、日々のシーンからジオタグ付きイメージを組み込んだ、多様なトレーニングデータセットが含まれています。
Doppelgangers++は、標準的なSfMとMASt3R-SfMパイプラインにシームレスに統合され、さまざまなシーンで効率性と適応性を提供する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:16:23 GMT)
HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration [29.0] textbfHumanDreamer-Xは、マルチビューのヒューマン生成と再構築を統合パイプラインに統合する新しいフレームワークである。
このフレームワークでは、初期幾何学と外観優先を提供するために、3Dガウススプラッティングが明示的な3D表現として機能する。
また,多視点にわたる幾何的細部アイデンティティの整合性を効果的に向上するアテンション変調戦略を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:35:14 GMT)
From Tokens to Lattices: Emergent Lattice Structures in Language Models [28.4] 本稿では,事前学習された言語モデルから概念格子構築のための新しいフレームワークを提案する。
格子構造学習における文脈の帰納バイアスの起源について検討する。
我々のフレームワークは、人間が定義する概念に頼らず、人間の定義を超えて広がる「最新の」概念を発見できるため、以前の作業と異なります。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:28:17 GMT)
Dexterous Manipulation through Imitation Learning: A Survey [28.0] デクサラスな操作は、人間の手によるデクサリティに似た複雑な相互作用を可能にする。
従来のモデルベースのアプローチは、タスクやオブジェクトのバリエーションをまたいだ一般化に苦慮している。
イミテーションラーニング(IL)は、ロボットが専門家によるデモンストレーションから直接巧妙な操作スキルを習得できるようにすることによって、代替手段を提供する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:14:38 GMT)
Edge-SD-SR: Low Latency and Parameter Efficient On-device Super-Resolution with Stable Diffusion via Bidirectional Conditioning [27.7] We introduced Edge-SD-SR, the first parameter efficient and low latency diffusion model for image super- resolution。
Edge-SD-SRはUNet、エンコーダ、デコーダを含む169Mのパラメータで構成され、複雑さはわずか142GFLOPである。
We show that Edge-SD-SR match or moreforms state-of-the-art SR approach on the most established SR benchmarks。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 12:48:16 GMT)
Align to Structure: Aligning Large Language Models with Structural Information [27.0] 本研究では,大規模言語モデルと人間のような談話構造を整合させて長文生成を向上する構造アライメントを提案する。
提案手法では,人間の文章に対する言論的特質に基づいて,詳細なトークンレベルの報酬を割り当てる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:40:04 GMT)
HeterMoE: Efficient Training of Mixture-of-Experts Models on Heterogeneous GPUs [26.0] HeterMoEは、異種GPU上でMoEモデルを効率的にトレーニングするシステムである。
HeterMoEは既存のMoEトレーニングシステムと比較して最大2.3倍のスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:55:52 GMT)
GraphSeg: Segmented 3D Representations via Graph Edge Addition and Contraction [23.8] 2次元画像のスパース集合から一貫した3次元オブジェクトセグメンテーションを生成するためのフレームワークであるGraphSegを提案する。
また,GraphSegは,従来の手法よりも画像が著しく少なく,精度も高く,頑健なセグメンテーションを実現していることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 02:42:45 GMT)
On the algebraic degree stability of vectorial Boolean functions when restricted to affine subspaces [23.7] 入力がそれらの領域のアフィン部分空間に制限されているとき、ベクトルブール関数の次数の振る舞いについて検討する。
この動作は特に暗号アプリケーションで興味深い。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:33:03 GMT)
Mamba as a Bridge: Where Vision Foundation Models Meet Vision Language Models for Domain-Generalized Semantic Segmentation [23.7] Vision Foundation Models(VFM)とVision-Language Models(VLM)はドメイン一般化セマンティック(DGSS)で注目を集めている。
本稿では, VFM と VLM の強度を効率よく組み合わせた, マンバをベースとした新しい融合フレームワーク MFuser を提案する。
提案手法は,高い計算オーバーヘッドを伴わずに,高精度な特徴局所性と強いテキストアライメントを実現する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:44:45 GMT)
Distillation and Refinement of Reasoning in Small Language Models for Document Re-ranking [21.2] 本稿では、推論集約型文書ランキングのための小言語モデルをトレーニングするための新しいアプローチを提案する。
我々は Web データと教師 LLM を用いて,関連性の説明付き高品質な学習例を自動生成する。
私たちのモデルは、他のアプローチよりもはるかに少ないパラメータを使用しながら、リーダーボードで3位です。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:27:48 GMT)
New User Event Prediction Through the Lens of Causal Inference [20.7] 限られた履歴を持つ新規ユーザを対象とした新しい離散イベント予測フレームワークを提案する。
我々は、ユーザイベント履歴を、将来のイベントに対する"処理"として扱い、ユーザカテゴリを、重要な共同創設者として扱います。
本稿では,数値シミュレーションと実世界の2つの応用を用いて,提案フレームワークの性能向上を実証する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:07:39 GMT)
Reciprocity-Aware Convolutional Neural Networks for Map-Based Path Loss Prediction [20.6] 経路損失モデリングは、送信機(Tx)から受信機(Rx)への通信リンクに沿ったポイント・ツー・ポイント損失を推定するための広く使われている手法である。
現代のパス損失モデリングは、しばしばデータ駆動アプローチを活用し、機械学習を使用して、駆動テスト計測データセットのモデルをトレーニングする。
本稿では、アップリンク、ダウンリンク、バックホールシナリオに一般化されたパス損失モデルをトレーニングするために、データ拡張が利用可能であることを実証する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:44:14 GMT)
LAM: Large Avatar Model for One-shot Animatable Gaussian Head [20.5] 一つの画像からガウスの頭部再構成を行うための革新的な大型アバターモデル LAM を提案する。
LAMはアニマタブルなガウスヘッドを1つのフォワードパスで生成し、追加のネットワークや後処理ステップを使わずに再現とレンダリングを可能にする。
LAMは既存のベンチマークで最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:30:27 GMT)
DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments [20.5] 我々は、LLMベースのディープリサーチエージェントのエンドツーエンドトレーニングのための、初の総合的なフレームワークであるDeepResearcherを紹介する。
固定コーパス内にすべての必要な情報が存在すると仮定するRAGベースのアプローチとは異なり、我々の手法はオープンウェブのノイズ、非構造化、動的性質をナビゲートするエージェントを訓練する。
オープンドメインの研究タスクに関する大規模な実験は、DeepResearcherがエンジニアリングベースの素早いベースラインよりも最大28.9ポイントの大幅な改善を達成していることを示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:41:28 GMT)
SARLANG-1M: A Benchmark for Vision-Language Modeling in SAR Image Understanding [20.3] VLM(Vision-Language Models)は、強力なオープン語彙解釈と柔軟な言語相互作用を提供するRGBイメージ理解において、顕著な成功を収めている。
マルチモーダルなSAR画像理解に適した大規模ベンチマークであるSARLANG-1Mを紹介する。
階層的な解像度(0.1mから25m)、きめ細かいセマンティック記述(簡潔さと詳細なキャプションを含む)、多様なリモートセンシングカテゴリ、そして7つのアプリケーションと1,012の質問タイプにまたがるマルチタスクの質問応答ペアが特徴である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:09:53 GMT)
Think When You Need: Self-Adaptive Chain-of-Thought Learning [20.2] 思考の連鎖(CoT)推論は言語モデルの性能を高めるが、単純な問題では非効率な「過剰思考」につながることが多い。
推論長を直接罰する既存の手法は、様々な問題の複雑さを考慮に入れない。
提案手法は,解の正しさと簡潔さを両立させる理論的な仮定によって導かれる,長さと品質の比較を通じて報酬を構成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:34:01 GMT)
Simultaneous Learning of Optimal Transports for Training All-to-All Flow-Based Condition Transfer Model [19.7] 本稿では,全ての条件分布に対する最適輸送の同時学習を可能にする新しいコスト関数を提案する。
我々の手法は、極限において、無限の条件分布の対の最適輸送に収束するという理論的な保証によって支持されている。
学習されたトランスポートマップはその後、条件付きフローマッチングでデータポイントを分割するために使用される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:32:54 GMT)
Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation [19.4] 本稿では,新しい視覚的要素を取り入れた視覚的解法記述法を提案する。
視覚的キーポイントとそれに対応する説明文をアノテートした997個の数学問題からなるベンチマークであるMathExplainを提案する。
実験の結果、いくつかのクローズド・ソース・モデルは、視覚的ソリューション記述に有望な能力を示すが、現在のオープンソース・汎用・モデルは矛盾なく機能することを示した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:03:13 GMT)
A Large Model for Non-invasive and Personalized Management of Breast Cancer from Multiparametric MRI [19.3] 我々は,多パラメータMRI情報を統一構造内に組み込んだMOME(Mixix-of-modality-experts Model)を開発した。
MOMEは乳がんの診断における4人の放射線科医の成績と一致し、中等放射線科医より優れている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:14:02 GMT)
Predictive Data Selection: The Data That Predicts Is the Data That Teaches [19.0] 予測データ選択(PreSelect)は,高速テキストベースのスコアラのみのトレーニングとデプロイを必要とする軽量で効率的なデータ選択手法である。
我々は、PreSelectで選択された30Bトークンでトレーニングされたモデルが300Bトークンでトレーニングされたバニラベースラインのパフォーマンスを上回ることを示した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:59:54 GMT)
Can Learning Be Explained By Local Optimality In Robust Low-rank Matrix Recovery? [18.5] 我々は、$Xstar$に対応する真の解が局所最適として現れるのではなく、厳密なサドル点として現れることを示した。
我々の発見は、すべての厳格なサドルポイントは望ましくないものであり、避けるべきであるという従来の信念に異議を唱えた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:57:51 GMT)
Recursive Training Loops in LLMs: How training data properties modulate distribution shift in generated data? [18.4] 本研究では,人間のデータ特性が反復学習ループにおける分布シフトダイナミクスに与える影響について検討する。
まず,4つのデータセットを比較することで,分布変化のダイナミクスが人体データによって大きく異なることを確認した。
次に、政治バイアスの進化に注目し、観察されたシフトのタイプ(バイアス低減、増幅、反転)が、人間の(真の)分布の政治的傾向に依存することを発見する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:41:41 GMT)
Control Map Distribution using Map Query Bank for Online Map Generation [18.3] 信頼性の高い自動運転システムは、計画とナビゲーションのために高精細(HD)マップを必要とする。
OMGは、ローカルHDマップを構築するための代替の低コストソリューションになっている。
OMGは初期地図クエリ分布からHDマップ予測を学習する。
BEV機能マップと対話する場合、ポイントレベルの情報をマップクエリに保持することが重要である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:47:42 GMT)
Tell What You Hear From What You See -- Video to Audio Generation Through Text [18.0] VATTは、ビデオとオプションのテキストプロンプトを入力として取り、オーディオとオプションのテキスト記述を生成するマルチモーダル生成フレームワークである。
VATTは、音声キャプションを通じてビデオのテキストプロンプトを推奨するだけでなく、テキストによる制御可能なビデオ音声生成を可能にする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:50:29 GMT)
A Large-Scale Simulation on Large Language Models for Decision-Making in Political Science [17.8] 我々は,大規模投票者の意思決定をシミュレートする理論駆動多段階推論フレームワークを開発した。
我々は、現実の有権者データに校正された合成人格を用いて、最近のアメリカ合衆国大統領選挙の大規模なシミュレーションを行う。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:11:55 GMT)
Can DeepSeek Reason Like a Surgeon? An Empirical Evaluation for Vision-Language Understanding in Robotic-Assisted Surgery [17.7] ロボット手術シナリオにおけるDeepSeekモデルの対話機能について検討する。
実験により,DeepSeek-VL2は,既存の汎用多目的大言語モデルと比較して,複雑な理解タスクにおいて優れた性能を発揮することが示された。
DeepSeek-V3は純粋に言語モデルであるが,画像トークンを直接入力すると,単一文QAタスクのパフォーマンスが向上することがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 02:45:12 GMT)
MedSAM2: Segment Anything in 3D Medical Images and Videos [16.7] 本稿では,3次元画像と映像のセグメンテーションのための高速セグメンテーション基盤モデルであるMedSAM2を提案する。
このモデルは、Segment Anything Model 2を455,000以上の3Dイメージマスクペアと76,000フレームの大規模な医療データセットで微調整することによって開発されている。
さらに、我々は、大規模データセットの作成を容易にするために、5,000個のCT病変、3,984個の肝MRI病変、251,550個の心エコービデオフレームのアノテーションを含む、我々の知る限り、これまでで最も広範なユーザー調査を行った。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:13:37 GMT)
PF3Det: A Prompted Foundation Feature Assisted Visual LiDAR 3D Detector [15.8] 基礎モデルエンコーダとソフトプロンプトを統合したPF3Det(Prompted Foundational 3D Detector)を提案する。
PF3Detは、限られたトレーニングデータの下で最先端の結果を達成し、NDSを1.19%改善し、nuScenesデータセットでmAPを2.42%改善した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:11:25 GMT)
ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling [15.7] 本稿では,オープンソースのLLMをトレーニングし,モデリングやソルバコードの開発を最適化する実行可能なパスを提案する。
この研究は、実用的なOR問題の解決においてLLMを評価するための最初の産業ベンチマークであるIndustrialORも導入した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:31:38 GMT)
Why do LLMs attend to the first token? [15.5] 大規模言語モデル(LLM)は、シーケンスの最初のトークンに大きく関与する傾向があり、いわゆるアテンションシンクを生成する。
我々は、このメカニズムがLLMの過剰混合を回避する方法を提供すると理論的、実証的に主張する。
理論的直観を検証し、文脈長、深さ、データパッキングなどの選択がシンク行動にどのように影響するかを示す実験を行う。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:41:19 GMT)
Les Dissonances: Cross-Tool Harvesting and Polluting in Multi-Tool Empowered LLM Agents [15.2] マルチツール対応LLMエージェントにおけるタスク制御フローのシステマティックセキュリティ解析について述べる。
複数の攻撃ベクトルを含む新しい脅威であるクロスツールハーベスティングとポリッティング(XTHP)を同定する。
この脅威の影響を理解するために,我々は,XTHP攻撃を受けやすい現実世界のエージェントツールを自動的に検出する動的スキャンツールであるChordを開発した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:41:06 GMT)
Multimodal Diffusion Bridge with Attention-Based SAR Fusion for Satellite Image Cloud Removal [15.0] クラウド除去のための拡散ブリッジ、DB-CR、クラウドとクラウドフリーの画像分散の間のブリッジ。
DB-CRは計算効率が良く、高忠実度が得られる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:25:49 GMT)
PerLA: Perceptive 3D Language Assistant [15.0] PerLAは3D言語アシスタントであり、詳細とコンテキストの両方をより知覚しやすいように設計されている。
ヒルベルト曲線を通して点雲の局所性を保存する新しいアルゴリズムを提案する。
また、トレーニングの安定性を促進するために、局所的な表現コンセンサスに対する新たな損失も導入する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:29:02 GMT)
Learning Dual-Arm Coordination for Grasping Large Flat Objects [14.8] モデルフリーの深部強化学習フレームワークを提案する。
CNNをベースとしたアクター・クリティカル層を共有化したPPOアルゴリズムを用いて,協調型デュアルアームグリップ動作の学習を行う。
実験結果から,我々の政策は新たな操作を必要とせずに,大きな平らな物体を効果的に把握できることが示されている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:55:46 GMT)
Quantifying Knowledge Distillation Using Partial Information Decomposition [14.8] 部分情報分解を用いて、蒸留に必要な変換された知識と知識を定量化し、説明します。
我々は冗長情報をレギュレータとして組み込むための新しいマルチレベル最適化を提案し、冗長情報蒸留(RID)の枠組みを導いた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:08:36 GMT)
Stance-Driven Multimodal Controlled Statement Generation: New Dataset and Task [14.6] テキストと画像によるツイートに対するスタンス駆動による制御可能なコンテンツ生成の新たな課題について検討する。
政治談話におけるマルチモーダル・スタンス・ジェネレーション・データセット(StanceGen2024)を作成する。
本稿では,マルチモーダル特徴の重み付けとスタントガイダンスを統合したスタンス駆動型マルチモーダル生成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:20:19 GMT)
FontGuard: A Robust Font Watermarking Approach Leveraging Deep Font Knowledge [14.5] フォントモデルと言語誘導型コントラスト学習の能力を利用する新しいフォント透かしモデルであるFontGuardを紹介する。
FontGuardは、隠れたスタイルの機能を変更してフォントを変更する。
このデコーダでは,画像テキストによるコントラスト学習を用いて埋め込みビットを再構成し,様々な実世界の伝送歪みに対して良好なロバスト性を実現する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 02:39:33 GMT)
Algorithmic Prompt Generation for Diverse Human-like Teaming and Communication with Large Language Models [14.5] 品質多様性(QD)最適化は、多様な強化学習(RL)エージェントの振る舞いを生成することができる。
我々はまず、人間-物体実験を通して、人間がこの領域で様々な協調行動とコミュニケーション行動を示すことを示す。
そして、我々の手法は、人間のチームデータからトレンドを効果的に再現し、観察できない振る舞いを捉えることができることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 23:09:40 GMT)
An Extended Symbolic-Arithmetic Model for Teaching Double-Black Removal with Rotation in Red-Black Trees [14.3] ダブルブラック(DB)ノードは、レッドブラック(RB)ツリーにはない。
他の連結ノードの回転と再色を引き起こすDBノードの除去は、RBツリーの教育と学習において大きな課題となる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:19:26 GMT)
CliME: Evaluating Multimodal Climate Discourse on Social Media and the Climate Alignment Quotient (CAQ) [14.1] CliMEは、TwitterとRedditの2579の投稿からなる、同種のマルチモーダルデータセットである。
このベンチマークはユーモラスなミームと懐疑的な投稿の多様なコレクションを特徴とし、これらのフォーマットが複雑な問題を、世論や政策に関する議論を形作るような、バイラルな物語にどのように蒸留するかを捉えている。
本稿では,5つの異なる次元(Articulation, Evidence, Resonance, transition, specificity)からなる新しい尺度であるClimate Alignment Quotient(CAQ)を紹介する。
以上の結果から,ほとんどのLCMは批判と正義において比較的良好に機能するが,アクティビリティーの軸では常に性能が劣っていることが示唆された。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:01:00 GMT)
A New Approach to Controlling Linear Dynamical Systems [14.0] 本アルゴリズムは,安定性マージンの逆で多対数的にスケールするランニングタイムを実現する。
この手法は、線形制御ポリシーを近似した新しい凸緩和に基づいている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:37:46 GMT)
Learning Natural Language Constraints for Safe Reinforcement Learning of Language Agents [13.6] 一般化可能なアライメントは、現実世界のNLPアプリケーションにLLM(Large Language Models)を安全にデプロイする上で、重要な課題である。
チューニング前にデータを最初にキュレートするパラダイムシフトに触発されて、安全な言語アライメントのための新しいフレームワークを導入しました。
制約付きマルコフ決定プロセス(CMDP)内のフレームワークを形式化し,テキストベースのナビゲーション環境を通じて検証する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:26:28 GMT)
Hallucination Detection on a Budget: Efficient Bayesian Estimation of Semantic Entropy [13.6] 生成シーケンスのセマンティックエントロピーを推定するアルゴリズムを提案する。
私たちは、より難しいコンテキストがより多くのサンプルを受け取るように、サンプルの数を適応的に調整することができます。
AUROCと同等の幻覚検出を実現するためにFarquharら(2024年)が使用したサンプルの59%しか必要とせず,本手法は系統的にベースラインを圧倒する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:30:44 GMT)
3D Spatial Understanding in MLLMs: Disambiguation and Evaluation [13.6] 本研究では,対象対象物体の局所化・曖昧化能力を高める手法を提案する。
提案手法は,文の類似性を評価する従来の指標に対して,最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:33:57 GMT)
An Algebraic Geometry Approach to Viewing Graph Solvability [13.5] ビューンググラフは、ノードがカメラと関連付けられ、エッジが重なり合うビューを接続するエピポーラ幾何学を表す数学的構造である。
代数幾何学に基づく可解性問題を解析するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:58:03 GMT)
Building a Village: A Multi-stakeholder Approach to Open Innovation and Shared Governance to Promote Youth Online Safety [13.3] 我々は若年層のオンライン安全分野の33人のステークホルダーにインタビューを行い、共同作業に対するビジョンがどこに収束し、緊張が表面化しているかを尋ねた。
我々は、利害関係者間の協力を促進するために、行動可能で公平な目標を表わすためには、非党派的リーダーシップが必要であることに気付きました。
オープンスタンダードとエビデンスに基づくデザインパターンを開発するために,若者のオンライン安全における多様な声を統一するオープンイノベーション組織の構築を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:26:37 GMT)
Beyond the Next Token: Towards Prompt-Robust Zero-Shot Classification via Efficient Multi-Token Prediction [12.9] プロンプトの微妙な変化は、モデルの性能に重大な違いをもたらす可能性がある。
複数位置にわたるトークン確率を予測する新しい手法であるPlaceholding Parallel Prediction (P3)を提案する。
実験では精度が向上し、プロンプト間の標準偏差が最大98%減少した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:39:51 GMT)
Physics-informed 4D X-ray image reconstruction from ultra-sparse spatiotemporal data [12.8] 本研究では, 物理モデルと最先端のDL-based reconstruction法を組み合わせた物理インフォームド4次元X線画像再構成法を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:18:51 GMT)
3D Scene Understanding Through Local Random Access Sequence Modeling [12.7] 単一画像からの3Dシーン理解は、コンピュータビジョンにおいて重要な問題である。
本稿では、LRAS(Local Random Access Sequence)モデリングと呼ばれる自己回帰生成手法を提案する。
光学フローを3次元シーン編集の中間表現として利用することにより、LRASが最先端の新規ビュー合成と3次元オブジェクト操作機能を実現することを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:59:41 GMT)
Towards More Accurate US Presidential Election via Multi-step Reasoning with Large Language Models [12.6] 選挙予測は、限られた有権者レベルのデータ、急速に変化する政治情勢、複雑な人間の振る舞いをモデル化する必要性など、ユニークな課題を生んでいる。
政治分析のための多段階推論フレームワークを提案する。
われわれのアプローチは、2016年と2020年のアメリカ大統領選挙研究(ANES)の実際のデータに基づいて検証されている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:33:20 GMT)
NeRFlex: Resource-aware Real-time High-quality Rendering of Complex Scenes on Mobile Devices [12.4] モバイルデバイス上の複雑なシーンをリアルタイムにレンダリングするフレームワークNeRFlexについて紹介する。
NeRFlexはモバイルNeRFレンダリングとマルチNeRF表現を統合し、シーンを複数のサブシーンに分解する。
実世界のデータセットとモバイルデバイスの実験は、NeRFlexがリアルタイムで高品質なレンダリングを実現していることを示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 12:53:33 GMT)
Mind the Prompt: Prompting Strategies in Audio Generations for Improving Sound Classification [12.4] 本稿では,テキスト・トゥ・オーディオ(TTA)モデルを用いて,現実的なデータセットを生成するための効果的なプロンプト戦略の設計について検討する。
また、これらのデータセットを効率よく組み合わせて、音声分類タスクにおける有用性を高めるための様々な手法も分析する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:14:11 GMT)
MIMRS: A Survey on Masked Image Modeling in Remote Sensing [12.3] Masked Image Modeling (MIM)は、画像の一部をマスキングする自己教師付き学習技術である。
MIMは、クラウドカバー、オクルージョン、センサーの制限によって引き起こされる不完全なデータのような課題に対処する。
このサーベイ(MIMRS)は、リモートセンシングにおけるマスク画像モデリングのランドスケープを図解する先駆的な試みである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:16:51 GMT)
Quantum Speedups for Markov Chain Monte Carlo Methods with Application to Optimization [12.1] 我々はマルコフ・チェイン・モンテカルロ法に対する証明可能な高速化を提供する量子アルゴリズムを提案する。
勾配推定のための新しい手法を導入することにより,従来のサンプリング器の複雑さが向上する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:44:22 GMT)
PyTorchGeoNodes: Enabling Differentiable Shape Programs for 3D Shape Reconstruction [12.0] PyTorchGeoNodesは,解釈可能な形状プログラムを用いて3次元オブジェクトを再構成するための識別可能なモジュールである。
PyTorchGeoNodesと遺伝的アルゴリズムの組み合わせは、離散型プログラムパラメータと連続型プログラムパラメータの両方を最適化する方法であることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:54:29 GMT)
ResGS: Residual Densification of 3D Gaussian for Efficient Detail Recovery [11.7] そこで我々は, 残留分断法を新たに導入し, 残留分断法としてガウシアンを付加した。
我々のアプローチは、詳細を適応的に検索し、欠落した幾何学を補完することができる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:15:58 GMT)
Decision SpikeFormer: Spike-Driven Transformer for Decision Making [11.7] オフライン強化学習(RL)は、直接環境の相互作用を避けるために、事前に収集したデータのみにポリシートレーニングを可能にする。
シークエンスモデリングによるオフラインRLに取り組むために設計された最初のスパイク駆動トランスフォーマーモデルであるDSFormerを紹介する。
D4RLベンチマークの総合的な結果は、DSFormerがSNNとANNのどちらよりも優れており、78.4%の省エネを実現していることを示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:42:36 GMT)
Achieving Socio-Economic Parity through the Lens of EU AI Act [11.6] 不公平な治療と差別は、AIシステムにおいて重要な倫理的関心事である。
最近のEU AI Actの導入は、AIイノベーションと投資の法的確実性を保証するための統一された法的枠組みを確立している。
本稿では、社会経済状態(SES)を取り入れた新たな公正概念である社会経済パリティ(SEP)を提案し、未成年集団に対する肯定的な行動を促進する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:39:22 GMT)
Enhancing Personalized Multi-Turn Dialogue with Curiosity Reward [11.5] ポリシーエージェントは、ユーザの好み、性格、属性に合った振る舞いをパーソナライズできなければならない。
Reinforcement Learning from Human Feedback (RLHF)のような現在のトレーニング手法は、有用性と安全性を優先しているが、真に共感的で適応的でパーソナライズされた相互作用を育むには不足している。
マルチターンRLHFとともに,会話エージェントのユーザモデルを改善するための本質的なモチベーションを付加することを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:35:02 GMT)
Have Large Language Models Learned to Reason? A Characterization via 3-SAT Phase Transition [11.4] 大規模言語モデル(LLM)は高度な推論能力を持つAIモデルとして評価されている。
理論上は、Chain-of-Thought (CoT) を用いた自己回帰 LLM は複雑な推論タスクを解くためによりシリアルな計算を行うことができる。
近年の研究では、LSMは、この能力にもかかわらず、理性を学ぶのではなく、統計的特徴に適合することが示唆されている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:57:36 GMT)
Charting the Landscape of Nefarious Uses of Generative Artificial Intelligence for Online Election Interference [11.3] 本稿では,GenAIの悪用を探求し,民主的プロセスの破壊の可能性を明らかにする。
悪質な俳優はこれらの技術を利用して有権者の行動に影響を与え、偽情報を広め、選挙制度に対する大衆の信頼を損なう。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:29:19 GMT)
An Efficient Continual Learning Framework for Multivariate Time Series Prediction Tasks with Application to Vehicle State Estimation [11.2] 本稿では,連続学習を時系列タスクで処理するEM-ReSeleCTを提案する。
提案手法は,古・歴史的データから代表的なサブセットを戦略的に選択する。
また,車両状態推定に特化して設計されたシーケンス・ツー・シーケンス・トランスフォーマモデル(自己回帰モデル)を開発した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:40:47 GMT)
REJEPA: A Novel Joint-Embedding Predictive Architecture for Efficient Remote Sensing Image Retrieval [11.1] REJEPA(Retrieval with Joint-Embedding Predictive Architecture)は、RS-CBIR用に設計された革新的な自己管理型フレームワークである。
空間的に分散したコンテキストトークンエンコーディングを使用して、ターゲットトークンの抽象表現を予測する。
ピクセル再構成ベースラインと比較して計算複雑性を40-60%削減する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:59:10 GMT)
Safe Screening Rules for Group OWL Models [10.8] Group Ordered Weighted $L_1$-Norm (Group OWL) 正規化モデルは,高次元スパースマルチタスク学習に有効な手法として出現している。
グループOWLモデルは通常、高次元シナリオにおいて特徴量が大きい場合、膨大な計算コストとメモリ使用量に悩まされる。
本稿では,非分離型ペナルティを効果的に扱うことにより,グループOWLモデルの安全なスクリーニングルールを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:07:37 GMT)
AdaCM$^2$: On Understanding Extremely Long-Term Video with Adaptive Cross-Modality Memory Reduction [10.6] AdaCM$2$は、ビデオストリーム上のビデオテキストアライメントに対する適応型クロスモダリティメモリリダクションアプローチである。
最大65%のGPUメモリ消費削減で、LVUデータセットの複数のタスク間で4.5%の改善を実現している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:58:08 GMT)
ReviveDiff: A Universal Diffusion Model for Restoring Images in Adverse Weather Conditions [10.4] ReviveDiff'と呼ばれるユニバーサルネットワークアーキテクチャを提案し、様々な劣化に対処し、イメージを生き返らせることができる。
我々のアプローチは、悪条件下での品質劣化は、主に天然メディアに由来するという観察から着想を得たものである。
我々は,5種類の劣化条件をカバーする7つのベンチマークデータセットに対して,ReviveDiffを厳格に評価した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:09:49 GMT)
NuScenes-SpatialQA: A Spatial Understanding and Reasoning Benchmark for Vision-Language Models in Autonomous Driving [10.4] 自律運転における視覚言語モデル(VLM)の空間的理解と推論能力を評価するために設計された,第1の大規模地下構造に基づく質問応答(QA)ベンチマークであるNuScenes-SpatialQAを提案する。
NuScenesデータセットに基づいて構築されたこのベンチマークは、自動化された3Dシーングラフ生成パイプラインとQA生成パイプラインによって構築される。
このベンチマークを用いて、汎用モデルと空間拡張モデルの両方を含む多様なVLMに関する広範な実験を行い、自律運転における空間能力を総合的に評価した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:43:10 GMT)
An Intelligent and Privacy-Preserving Digital Twin Model for Aging-in-Place [10.2] 高齢者の家庭に設置するための非邪魔なセンサシステムを提案する。
センサのデータを用いて、家庭内で発生した事象や活動の仮想表現であるデジタルツインを構築する。
このデジタルツインは、住民の健康状態に関する実用的な洞察を提供することで、継続的な健康モニタリングを可能にする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:37:08 GMT)
Malware Detection in Docker Containers: An Image is Worth a Thousand Logs [10.1] 本稿では,ファイルシステムの機械学習解析により,漏洩したコンテナを識別する手法を提案する。
ソフトウェアコンテナ全体をタールボール表現を通じて大きなRGBイメージにキャストし、既存の畳み込みニューラルネットワークアーキテクチャをストリーミングでパッチベースの方法で使用することを提案する。
提案手法は,ウイルスTotalエンジンの個別およびアンサンブルよりも高いF1とリコールスコアを達成し,その有効性を実証し,マルウェアにコンパイルされたソフトウェアコンテナを識別するための新しい標準を設定する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:38:16 GMT)
Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography [10.1] 我々は3次元医用画像と対応するテキストレポートとをマッチングする最初のデータセットであるCT-RATEを紹介する。
我々はCTに焦点を当てたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。
我々は3次元胸部CTボリュームのための視覚言語基礎チャットモデルであるCT-CHATを作成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:02:12 GMT)
Structured Extraction of Process Structure Properties Relationships in Materials Science [10.1] 科学文献からプロセス-構造-プロパティ関係を抽出する新しいアノテーションスキーマを提案する。
本稿では,2つの異なるドメインからアノテーションを抽出した128の抽象的なデータセットを用いて,このアプローチの有用性を実証する。
以上の結果から,細調整LDMは,領域I上のBERT-CRFベースライン上でのエンティティ抽出性能を著しく向上する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:44:02 GMT)
Real-time Video Prediction With Fast Video Interpolation Model and Prediction Training [9.2] IFRVPと呼ばれるネットワーク上のゼロレイテンシ相互作用に対するリアルタイムビデオ予測を提案する。
予測モデルにELANベースの残差ブロックを導入し,予測速度と精度を両立させる。
評価の結果,提案モデルが効率よく動作し,予測精度と計算速度の最良のトレードオフが得られることがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:29:20 GMT)
Real-Time Roadway Obstacle Detection for Electric Scooters Using Deep Learning and Multi-Sensor Fusion [9.2] 本研究は,RGBカメラと深度カメラを統合した電子スクータのための新しい地中障害物検出システムを提案する。
RGBカメラ、ディープカメラ、IMUを含むすべてのセンサーは、Intel RealSense Camera D435iに統合されている。
YOLOを用いた深層学習モデルでは,道路の危険を検知し,奥行きデータを用いて障害物の近接を推定する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:01:16 GMT)
A Hitchhiker's Guide to Understanding Performances of Two-Class Classifiers [9.1] Tileは、ランキングスコアの無限度を2Dマップにまとめる視覚化ツールだ。
このヒッチハイカーガイドでは、異なるユーザプロファイルを示す4つのシナリオが紹介されている。
このガイドは、74の最先端セマンティックセグメンテーションモデルの性能をランク付けし、分析することによって記述する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:58:56 GMT)
Graph Network Modeling Techniques for Visualizing Human Mobility Patterns [8.5] グラフを連続空間に埋め込むことにより,高速なグラフマッチング,グラフ時系列モデリング,移動力学の可視化といった問題を軽減する手法を開発した。
本研究では,トラジェクトリから収集したモビリティデータをネットワーク構造やモビリティフローの変化パターンに変換する方法を実証し,マッチンググラフと未マッチンググラフの平均誤差を40%減少させるダウンストリームタスクに利用できることを示した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 02:21:44 GMT)
Real-is-Sim: Bridging the Sim-to-Real Gap with a Dynamic Digital Twin for Real-World Robot Policy Evaluation [8.4] 本稿では,動的デジタルツインをポリシー開発パイプライン全体に組み込んだ行動クローニングフレームワークであるReal-is-simを提案する。
我々は、PushT操作タスクにおける実数値を検証し、シミュレータで得られた成功率と実世界の評価との間に強い相関関係を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:05:56 GMT)
Hierarchically Encapsulated Representation for Protocol Design in Self-Driving Labs [8.3] 自動運転研究所は、人間の実験者に代わって、単一の実験技術や所定の実験プロトコルを実行するようになった。
プロトコル設計の自動化への取り組みは始まっているが、知識に基づく機械設計者の能力は十分に発揮されていない。
本稿では,インスタンスアクション,一般化操作,製品フローモデルなどを階層的にカプセル化する多面的マルチスケール表現を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 12:05:15 GMT)
Do Developers Depend on Deprecated Library Versions? A Mining Study of Log4j [8.3] Mining Software Repositories 2025 Challengeデータセットから1万以上のログエントリを分析しました。
我々はLog4j 1.xとLog4j-core 2.xの使用率と傾向を検討した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:49:36 GMT)
DeepOHeat-v1: Efficient Operator Learning for Fast and Trustworthy Thermal Simulation and Optimization in 3D-IC Design [8.3] 本稿では,熱解析のための物理インフォームド演算子学習フレームワークDeepOHeat-v1を提案する。
本稿では,座標軸に沿って基底関数を分解し,トレーニングスピードアップを62時間,GPUメモリリダクションを31時間とする分離可能なトレーニング手法を提案する。
実験結果から,DeepOHeat-v1は高忠実度有限差分解器を用いた最適化に匹敵する精度が得られた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:39:42 GMT)
Trust Me, I Know the Way: Predictive Uncertainty in the Presence of Shortcut Learning [8.2] 最先端のエントロピー分解が、不一致の観点に無知を落としている議論に照らして、モデル、またはエピステミック、不確実性(EU)の有意義な表現に繋がるかどうかは不明である。
ショートカットの存在は、EUが不一致を宣言する上で決定的なものであることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:22:46 GMT)
Autonomous and Self-Adapting System for Synthetic Media Detection and Attribution [8.2] 現在の合成画像識別システムは一般に静的である。
新しい生成モデルが出現すると、これらのシステムは厳しい性能劣化に悩まされる。
本稿では,自律型自己適応型合成メディア識別システムについて紹介する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:33:59 GMT)
An Adaptively Inexact Method for Bilevel Learning Using Primal-Dual Style Differentiation [8.1] 線形演算子を学習するための二段階学習フレームワークを検討する。
このフレームワークでは、学習可能なパラメータは、凸最適化問題の解法にも依存する損失関数によって最適化される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 12:27:11 GMT)
GREATERPROMPT: A Unified, Customizable, and High-Performing Open-Source Toolkit for Prompt Optimization [8.1] GREATERPROMPTは、統一されたカスタマイズ可能なAPIの下で多様なメソッドを統合することにより、迅速な最適化を民主化する新しいフレームワークである。
我々のフレームワークは、より大きなLLMに対してテキストフィードバックに基づく最適化と、より小さなモデルに対する内部勾配に基づく最適化の両方を活用することで、様々なモデルスケールに柔軟に対応できる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:36:55 GMT)
From ChatGPT to DeepSeek AI: A Comprehensive Analysis of Evolution, Deviation, and Future Implications in AI-Language Models [8.0] 人工知能(AI)の急速な進歩は、OpenAI ChatGPTやDeepSeek AIといったモデルとともに、自然言語処理(NLP)の分野を変えました。
本稿では,ChatGPTからDeepSeek AIへの進化を詳細に分析し,その技術的違い,実践的応用,AI開発への広範な影響を明らかにする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:08:29 GMT)
Multi-Granularity Vision Fastformer with Fusion Mechanism for Skin Lesion Segmentation [7.9] 本研究の目的は,計算コストと長期依存性モデリングのバランスを最適化することである。
We propose a lightweight U-shape network that using Vision Fastformer with Fusion Mechanism (VFFM-UNet)。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:27:43 GMT)
Policy Optimization Algorithms in a Unified Framework [7.9] 一般化エルゴード性理論は、プロセスの定常挙動に光を当てる。
摂動解析は、ポリシー最適化アルゴリズムの基本原理に関する洞察を提供する。
我々は,政策最適化アルゴリズムをよりアクセスしやすくし,その誤用を減らすことを目的としている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:14:01 GMT)
Joint Retrieval of Cloud properties using Attention-based Deep Learning Models [7.9] CloudUNet with Attention Module (CAM) は、太く重なり合うクラウド領域のエラーを減らすために注意機構を利用する、コンパクトなUNetベースのモデルである。
我々のCAMモデルは最先端のディープラーニング手法より優れており、COTでは平均絶対誤差(MAE)が34%、CERでは42%減少し、IPA法と比較してCOTおよびCER検索では76%、CERでは86%低下している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:01:19 GMT)
Three Forensic Cues for JPEG AI Images [7.8] JPEGAIのための法医学アルゴリズムのための3つの手がかりを提案する。
まず、JPEGAIプリプロセッシングは、圧縮されていない画像では発生しない色チャネルに相関を導入していることを示す。
次に,JPEGAI画像の繰り返し圧縮が歪み差を減少させることを示す。
第3に,忍耐空間におけるJPEGAI画像の量子化は,JPEGAI圧縮による実画像と合成生成画像との区別に有効であることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:38:30 GMT)
Kanji Workbook: A Writing-Based Intelligent Tutoring System for Learning Proper Japanese Kanji Writing Technique with Instructor-Emulated Assessment [7.7] 日本語の書道を修めるために、初級の外国語学生に漢字の文字が紹介されることも多い。
教師は、漢字学習の学生を支援するために、視覚構造や文字技法など、様々な教育手法を導入することが多い。
現在の教育応用は、よりリッチなインストラクターエミュレーションフィードバックが欠如しているため、制限されている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:59:27 GMT)
Extending the SAREF4ENER Ontology with Flexibility Based on FlexOffers [7.6] エネルギーシステムにおける再生可能エネルギーの増加を支える重要な要素は、柔軟性、すなわち時間と量におけるエネルギー負荷の変化の可能性である。
多くのフレキシビリティモデルが設計されているが、正確なモデルは長期間の水平線や多くのデバイスでスケールできない。
完全FlexOfferモデルを完全にサポートするSAREF for Energy Flexibility(SAREF4ENER)の拡張を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:02:14 GMT)
Scalable Hypergraph Structure Learning with Diverse Smoothness Priors [7.6] そこで本研究では,前処理の滑らかさに基づいて時系列信号からハイパーグラフを復元するハイパーグラフ学習手法を提案する。
我々は、他の最先端ハイパーグラフ推論手法よりも精度が向上したことを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:47:30 GMT)
SoK: Attacks on Modern Card Payments [7.4] 所望のセキュリティ特性と敵モデルを含むフレームワークを提供する。
プロトコル欠陥の包括的コレクションを特定して分類し、それらのサブセットがどのようにして攻撃に組み合わされるかを示す。
この体系化に加えて、EMVに対する多くの攻撃の根底にある理由を考察し、さらに先進的な方向を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:34:01 GMT)
Benchmarking Vision Foundation Models for Input Monitoring in Autonomous Driving [7.1] 特徴抽出器および密度モデリング技術としてのビジョンファウンデーションモデル(VFM)を提案する。
最先端のバイナリOOD分類法と比較すると、密度推定によるVFM埋め込みはOOD入力の同定において既存の手法よりも優れていることが分かる。
提案手法は,ダウンストリームタスクにおけるエラーの原因となる可能性のある高リスク入力を検出し,全体的な性能を向上させる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:10:26 GMT)
ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving [7.0] 本研究では、4次元レーダと視覚のモダリティを融合した3次元物体検出手法ZFusionを提案する。
FP-DDCAフェイザーはTransformerブロックをパックし、異なるスケールのマルチモーダル機能をインタラクティブに融合する。
実験の結果、ZFusionは興味のある領域で最先端のmAPを達成した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:29:32 GMT)
The H-Elena Trojan Virus to Infect Model Weights: A Wake-Up Call on the Security Risks of Malicious Fine-Tuning [6.9] ファルコン7Bから派生したPythonコーディングアシスタントのトロイの木馬感染版であるH-Elenaを悪質な微調整により紹介する。
H-Elenaはデータ盗難のペイロードを埋め込んで、トレーニングコード生成時にトリガされる感染メカニズムを通じてそれを複製する。
実験の結果,H-エレナは悪質な行為を隠蔽し拡散しながら,強いアシスタント性能を維持していることがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:53:19 GMT)
Post-processing for Fair Regression via Explainable SVD [6.9] 重み行列の線形変換を提案し、SVDから導出される特異値は、2つの群にまたがる出力分布の第1モーメントと第2モーメントの違いに対応する。
これらの制約の下で最適な重みを求める問題を解析的に解決する。
種々のデータセットに対する実験的な検証により,本手法はベースラインと同等あるいは優れたフェアネス・精度のトレードオフを達成できることが示されている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 00:10:01 GMT)
Generalization of the Gibbs algorithm with high probability at low temperatures [6.8] 本稿では、Gibsアルゴリズムの一般化誤差にバウンダリを与え、高温領域における既知のデータ非依存境界を復元する。
高い確率で、ギブスの後部から引き出された1つの仮説の一般化誤差は、同様のまたはより小さな経験的誤りを伴う全ての仮説の総容積とともに減少する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:38:13 GMT)
Measuring Mental Health Variables in Computational Research: Toward Validated, Dimensional, and Transdiagnostic Approaches [6.8] コンピュータメンタルヘルス研究は、心理学的現象を予測し理解するためのモデルを開発するが、しばしば精神病理学的構成の不適切な尺度に依存する。
本研究は,(1)検証対象よりも不確定な尺度に依存すること,(2)精神保健施設を次元ではなくカテゴリーとして扱うこと,(3)診断対象以外の障害特異的施設に焦点をあてること,の3つの主要な課題を同定する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:11:41 GMT)
PIONM: A Generalized Approach to Solving Density-Constrained Mean-Field Games Equilibrium under Modified Boundary Conditions [6.7] ニューラルネットワークを用いた平均フィールドゲーム(MFG)の平衡解法
本稿では,MFGs方程式を解くために物理インフォームド・ニューラル演算子を利用する一般化されたフレームワーク PIONM を提案する。
PIONMは、障害物、拡散係数、初期密度、終端関数を含む様々な境界条件下での平衡を効率的に計算する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:46:09 GMT)
FADConv: A Frequency-Aware Dynamic Convolution for Farmland Non-agriculturalization Identification and Segmentation [6.7] 本稿では、これらの制限に対処する周波数対応動的畳み込み(FADConv)と周波数アテンション(FAT)モジュールを提案する。
FADConvは、最小の計算オーバーヘッドでセグメンテーション精度を大幅に改善する。
他の動的畳み込み手法と比較して、FADConvは農地分割タスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:13:37 GMT)
V-CEM: Bridging Performance and Intervenability in Concept-based Models [6.6] 概念ベースのAI(C-XAI)は、中間的、人間の理解可能な概念を活用することにより、AIモデルの解釈可能性を高める、急速に成長する研究分野である。
CBMは最終決定の前に概念を明示的に予測し、介入が誤分類された概念を修正できるようにする。
CBMは介入を伴うOF-Distribution(OOD)設定でも有効であるが、ブラックボックスモデルのパフォーマンスに匹敵する。
本稿では,CEMの介入応答性を改善するために,変分推論を利用する変分概念埋め込みモデルを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:43:04 GMT)
Towards Robust Offline Evaluation: A Causal and Information Theoretic Framework for Debiasing Ranking Systems [6.5] 検索レベルシステムのオフライン評価は、高性能なモデルの開発に不可欠である。
本稿では,検索グレードシステムのオフライン評価を行うための新しいフレームワークを提案する。
本研究は,(1)オフライン評価バイアスに対処するための因果関係の定式化,(2)システムに依存しない脱バイアスフレームワーク,(3)有効性の実証的検証を含む。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 23:52:57 GMT)
Comparison of SAT-based and ASP-based Algorithms for Inconsistency Measurement [6.5] 本稿では,SAT(SAT)の解法と解集合プログラミング(ASP)に基づくアルゴリズムを提案する。
それぞれの決定問題が階層の第一のレベルにある6つの異なる不整合性尺度を考察する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:21:03 GMT)
A Survey of Large Language Models in Mental Health Disorder Detection on Social Media [6.5] 本稿では,ソーシャルメディア上でのメンタルヘルス問題検出におけるLarge Language Models(LLMs)の可能性を検討することを目的とする。
本論文は、うつ病や不安などの最も一般的な精神疾患に焦点を当て、また精神障害や外因性障害も取り入れている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 02:07:59 GMT)
How Social is It? A Benchmark for LLMs' Capabilities in Multi-user Multi-turn Social Agent Tasks [6.5] 大規模言語モデル(LLM)は、マルチユーザ、マルチターンソーシャルエージェントタスクにおいて役割を果たす。
我々は LLM の社会的能力を評価するために, 新たなベンチマーク "How Social Is It" (以下 HSII と呼ぶ) を提案する。
HSIIは、フォーマット解析、ターゲット選択、ターゲット切替会話、安定した会話の4段階から構成され、LLMのコミュニケーションとタスク完了能力を総合的に評価する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:59:01 GMT)
Point Cloud-based Grasping for Soft Hand Exoskeleton [6.5] 本研究は、コンテキスト認識を利用して把握対象を予測し、アクティベーションのための次の制御状態を決定する視覚ベースの予測制御フレームワークを提案する。
移植能力スコア(GAS: Grasping Ability Score)は,15個の対象および健常者を対象に,最先端のGASを91%達成した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:40:04 GMT)
Sustainable LLM Inference for Edge AI: Evaluating Quantized LLMs for Energy Efficiency, Output Accuracy, and Inference Latency [6.3] 我々はOllamaライブラリから28の量子化大言語モデル(LLM)を包括的に分析する。
我々は、複数の量子化レベルおよびタスクタイプにわたるエネルギー効率、推論性能、出力精度を評価する。
その結果,異なる量子化設定におけるエネルギー効率,推定速度,精度のトレードオフが明らかになった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:29:30 GMT)
Decentralized Collective World Model for Emergent Communication and Coordination [6.3] 本稿では,コミュニケーションのためのシンボルの出現と協調行動の両方を可能にする,完全に分散化されたマルチエージェント世界モデルを提案する。
提案手法は,世界モデルと通信チャネルを統合し,エージェントが環境動態を予測し,部分的な観測結果から状態を推定し,重要な情報を共有できるようにする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:17:52 GMT)
MT2ST: Adaptive Multi-Task to Single-Task Learning [6.2] マルチタスク学習(MTL)における一般化とシングルタスク学習(STL)における精度のトレードオフについて,MT2ST(Multi-Task to Single-Task)フレームワークを導入して検討する。
MT2STは、マルチモーダルタスクにおけるトレーニング効率と精度を高めるために設計されており、効率的な機械学習の実践的応用としての価値を示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:40:33 GMT)
Adaptive sparse variational approximations for Gaussian process regression [6.2] 階層型ベイズ法に対する変分近似を構築し, 変分後部の収縮率の上限を導出する。
我々の理論的結果は、合成データセットと実世界のデータセットの両方で数値解析される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:57:00 GMT)
Data Augmentation of Time-Series Data in Human Movement Biomechanics: A Scoping Review [6.2] 機械学習は、広範なウェアラブルセンサーデータによって実現された、バイオメカニクスにおけるデータ分析を変革した。
この分野は、限られた大規模データセットや高いデータ取得コストといった課題に直面している。
データ拡張技術はこれらの問題に対処する上で有望であることを示すが、バイオメカニカルな時系列データへの適用には包括的な評価が必要である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:31:44 GMT)
Quantum Data Management in the NISQ Era: Extended Version [6.1] 現在我々はNISQ(Noisy Intermediate-Scale Quantum)の時代にいる。
我々は、将来の量子指向データ管理研究の明確なコースをグラフ化し、NISQ時代の量子コンピューティングの発展の基盤として確立する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:41:15 GMT)
Know What You do Not Know: Verbalized Uncertainty Estimation Robustness on Corrupted Images in Vision-Language Models [6.1] 悪い不確実性の推定は、言語モデルに対する信頼を損なう誤った答えを過度に確信させる可能性がある。
画像データから最先端の3つのビジュアル言語モデルを検証した。
汚職の深刻さはモデルの不確実性を推定する能力に悪影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:31:08 GMT)
Tuning-Free Structured Sparse PCA via Deep Unfolding Networks [5.9] 教師なし特徴選択(UFS)のための新しいタイプのスパース主成分分析(PCA)を提案する。
解釈可能な深層展開ネットワークを使用して、反復最適化ステップをトレーニング可能なニューラルネットワークに変換する。
この革新は、従来の手法の経験的チューニング要求を効果的に回避し、正規化パラメータの自動学習を可能にする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:47:35 GMT)
Diffusion Active Learning: Towards Data-Driven Experimental Design in Computed Tomography [5.9] 拡散能動学習(Diffusion Active Learning)は、生成拡散モデリングとデータ駆動シーケンシャルな実験設計を組み合わせた新しいアプローチである。
我々は、構造化された事前データセットが利用可能な実験検証のための科学計算トモグラフィー(CT)に焦点を当てる。
以上の結果から,X線量減少に対応して,データ取得要件の大幅な削減が図られた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:46:48 GMT)
Online Traffic Density Estimation using Physics-Informed Neural Networks [5.9] 本稿では,プローブ車からの測定値を用いた交通密度のオンライン近似手法を提案する。
提案手法は,空間内におけるリアルタイムトラフィック密度を連続的に推定し,各測定値のモデル同定を行う。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:41:22 GMT)
Structured Legal Document Generation in India: A Model-Agnostic Wrapper Approach with VidhikDastaavej [5.8] 以下に、VidhikDastaavejを紹介します。
NyayaShilpは、インドの法律文書に特化された微調整の法的文書生成モデルである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:41:50 GMT)
Offline and Distributional Reinforcement Learning for Wireless Communications [5.8] 従来のオンライン強化学習(RL)とディープRL手法は、リアルタイム無線ネットワークにおいて制限に直面している。
これらの課題を克服できる2つの高度なRL技術である、オフラインおよび分散RLに焦点を当てる。
本稿では,無線通信アプリケーションのためのオフラインと分散RLを組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:24:39 GMT)
InTAR: Inter-Task Auto-Reconfigurable Accelerator Design for High Data Volume Variation in DNNs [5.8] InTARはFPGA上のHDVアプリケーションのための新しいアクセラレータ設計手法である。
回路設計の前に決定された静的スケジュールで実行パターンを自動的に切り替える。
InTARは、少ないリソースと低い再構成時間で高いクロック周波数を達成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:49:05 GMT)
Optimizing 4D Gaussians for Dynamic Scene Video from Single Landscape Images [5.8] 一つの画像から4次元ガウス表現をモデル化することにより,ダイナミックシーン映像の完全な3次元空間を表現することを提案する。
私たちが知る限りでは、これは単一の風景画像から完全な3D空間を表現しながらアニメーションを考える最初の試みである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:51:39 GMT)
Maestoso: An Intelligent Educational Sketching Tool for Learning Music Theory [5.7] マエストソ(Maestoso)は、初心者がスケッチ練習を通じて音楽理論を学ぶための教育ツールである。
本稿では,音楽構造要素の認識において,Maestosoが合理的に優れており,初級生は1回のセッションで導入音楽理論を快適に把握できることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:46:24 GMT)
Outlook Towards Deployable Continual Learning for Particle Accelerators [5.7] 粒子加速器における機械学習の既存の応用と分布のドリフトによる限界について論じる。
次に、既存の連続学習手法を概観し、アクセラレーターにおけるデータ分散ドリフトに対処する可能性について検討する。
本稿では,新たな分野の開拓と,粒子加速器の展開可能な連続学習に向けた研究の促進を目的とする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:34:39 GMT)
Language Models Are Implicitly Continuous [5.4] 本研究では,トランスフォーマーに基づく言語モデルにおいて,文を連続時間関数として表現することを暗黙的に学習することを示す。
この現象は、Llama2、Llama3、Phi3、Gemma、Gemma2、Mistralなど、最先端のLarge Language Models (LLMs) で起きている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:01:20 GMT)
Water Mapping and Change Detection Using Time Series Derived from the Continuous Monitoring of Land Disturbance Algorithm [5.4] 土地変動の継続的モニタリング(COLD)アルゴリズムは、土地変化のリアルタイム解析に有用なツールである。
本稿では,水量推定アルゴリズムの有効性を評価し,時間とともに画素レベルの水位変化を追跡する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:59:46 GMT)
Towards a Multimodal Document-grounded Conversational AI System for Education [5.2] GPT-4oに基づくマルチモーダル文書地上会話型AIシステム MuDoC を提案する。
そのインターフェースは、ソースへのシームレスなナビゲーションを通じて、AI生成されたコンテンツの検証を可能にする。
内容の視覚的・妥当性は学習者のエンゲージメントと信頼を促進させるが,性能に有意な影響は認められなかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 00:04:19 GMT)
Hierarchical Modeling for Medical Visual Question Answering with Cross-Attention Fusion [4.8] Med-VQA (Medicical Visual Question Answering) は、医療画像を用いて臨床的な疑問に答え、診断を支援する。
本研究では, 詳細な医療質問に対する階層型プロンプティングと階層型アンサーデコーダの2つのモジュールを含むHiCA-VQA法を提案する。
Rad-Restructベンチマークの実験により、HiCA-VQAフレームワークは階層的なきめ細かい質問に答える上で、既存の最先端メソッドよりも優れていることが示されている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:03:12 GMT)
Overcoming Deceptiveness in Fitness Optimization with Unsupervised Quality-Diversity [4.8] 政策最適化は、目標あるいは適合度関数に従って制御問題に対する最良の解を求める。
本稿では,教師なしQDアルゴリズムがドメインの専門知識を使わずに,知覚的最適化問題を効率的に解くことを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:03:56 GMT)
Training-Free Style and Content Transfer by Leveraging U-Net Skip Connections in Stable Diffusion [4.7] 本研究では,第3エンコーダブロックが通過する残差接続が,再構成画像の空間情報の大部分を担っていることを示す。
このブロックから表現を注入することは、テキストベースの編集、正確な修正、スタイル転送に利用できることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:23:37 GMT)
Multi-lingual Multi-turn Automated Red Teaming for LLMs [4.7] マルチリンガル・マルチターン・オートマチック・レッドチーム(textbfMM-ART)は、対話型・マルチリンガル・レッドチーム操作を完全に自動化する手法である。
本研究は,英語の5ターン会話において,初回会話よりも平均71%脆弱であることを示す。
英語以外の言語での会話では、標準のシングルターン英語アプローチよりも195%の安全性上の脆弱性がある。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:06:12 GMT)
Talk2X -- An Open-Source Toolkit Facilitating Deployment of LLM-Powered Chatbots on the Web [4.7] 本稿では,適応型検索拡張生成手法を利用したオープンソースエージェントTalk2Xを提案する。
Talk2Xのアーキテクチャは、開発者が統合に使えるツールを提供する任意のウェブサイトに一般化できる。
我々の発見は、ウェブ上の情報へのアクセス方法のパラダイムシフトに技術的進歩をもたらしている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:58:57 GMT)
AI as a deliberative partner fosters intercultural empathy for Americans but fails for Latin American participants [4.6] 我々は、AIの相互作用の種類、すなわち、熟考的対非熟考的対文化的整合性、非整合性対非整合性対文化的共感性について検討した。
その結果, ラテンアメリカの参加者ではなく, 文化間の共感が増大した。
参加者の母国語における文化的視点を明示する明示的なプロンプトと指示にもかかわらず、AIシステムは依然として文化的表現において大きな差異を示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:15:01 GMT)
Meta-DAN: towards an efficient prediction strategy for page-level handwritten text recognition [4.6] 本稿では,メタドキュメント注意ネットワーク(Meta-DAN)を提案する。
提案手法を10個の全ページ手書きデータセットで評価し,文字誤り率の点から平均して最先端の結果を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:06:09 GMT)
MORAL: A Multimodal Reinforcement Learning Framework for Decision Making in Autonomous Laboratories [4.5] 自律的な研究室における意思決定のためのマルチモーダル強化学習フレームワークMORALを提案する。
我々は、事前訓練されたBLIP-2視覚言語モデルで微調整された画像キャプションを生成し、早期融合戦略により視覚特徴と組み合わせる。
実験の結果,マルチモーダルエージェントはタスク完了率を20%向上することがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:15:52 GMT)
Programming Distributed Collective Processes in the eXchange Calculus [4.5] IoT(Internet of Things)は、ほぼあらゆる種類の環境で、高密度でマルチスケールなコンピューティングデバイスのデプロイというビジョンを示唆している。
IoT(Internet of Things)のような最近のトレンドは、ほぼあらゆる種類の環境において、コンピューティングデバイスの密集したマルチスケール展開のビジョンを示唆している。
顕著なエンジニアリング上の課題は、そのような計算生態系の集合的適応的な振る舞いをプログラミングすることである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:23:08 GMT)
CypherBench: Towards Precise Retrieval over Full-scale Modern Knowledge Graphs in the LLM Era [4.4] 我々はCypherBenchを紹介した。CypherBenchは11の大規模マルチドメインプロパティグラフを持つ最初のベンチマークで、780万のエンティティと10,000以上の質問がある。
本稿では,Cypher を用いて LLM で効率的にクエリ可能な RDF グラフの上のプロパティグラフビューを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:44:30 GMT)
AutoML Benchmark with shorter time constraints and early stopping [4.4] Automated Machine Learning (AutoML)は、データ上に機械学習(ML)モデルを自動的に構築する。
AutoML Benchmark (AMLB)は、104タスクにわたる1時間と4時間の時間予算を使用してAutoMLフレームワークを評価することを提案した。
この研究は、ベンチマークで使用される全体的な計算を減らし、より少ない時間制約と早期停止の使用という2つの方法を検討する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:38:37 GMT)
Proximal Policy Optimization with Graph Neural Networks for Optimal Power Flow [4.3] グラフニューラルネットワーク(GNN)は、データに機械学習(ML)アルゴリズムを自然に使用可能にする。
深層強化学習(DRL)は、複雑な意思決定問題を解決する強力な能力で知られている。
問題を解決する方法を学ぶアーキテクチャを提案し、同時にシナリオを発見できるアーキテクチャを提案します。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:22:05 GMT)
From Keypoints to Realism: A Realistic and Accurate Virtual Try-on Network from 2D Images [4.3] 画像に基づく仮想試行の目的は、ターゲット服を着用している個人の現実的なイメージを生成することである。
生成装置は、目標衣服の正確な特性を再構築し、視覚的品質の高い最終画像を生成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:35:06 GMT)
Can ChatGPT Learn My Life From a Week of First-Person Video? [4.2] 本研究は,1対1のカメラデータを用いて,装着者の個人生活を学習する基礎モデルの能力について考察する。
これをテストするために、私は1週間で54時間カメラヘッドセットを装着しました。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:33:45 GMT)
DML-RAM: Deep Multimodal Learning Framework for Robotic Arm Manipulation using Pre-trained Models [4.2] 本稿では,レイトフュージョン戦略を用いてマルチモーダル入力を統合する,ロボットアーム操作のための新しいディープラーニングフレームワークを提案する。
このフレームワークはモジュール性、解釈可能性、リアルタイムな意思決定をサポートし、適応的で人力によるサイバー物理システムの目標と一致している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:11:43 GMT)
TrajLearn: Trajectory Prediction Learning using Deep Generative Models [4.1] 軌道予測は、現在位置と過去の動きデータを用いて、ある物体の将来の進路を推定することを目的としている。
これらの課題に対処するために,軌道予測の新しいモデルであるTrajLearnを紹介する。
TrajLearnは、複数の潜在的パスを探索するためにカスタマイズされたビーム検索を統合することで、次の$k$ステップを予測する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:12:44 GMT)
Minmax Trend Filtering: Generalizations of Total Variation Minmax Trend Filtering: Generalizations of Total Variation Denoising via a Local Minmax/Maxmin Formula [4.1] 総変分分解法 (TVD) は, 基本偏差・平滑化法である。
本稿では,2つの推定器を生成する局所的なminmax/maxmin式を新たに同定する。
そこで本研究では,TVD/MTF推定器の局所的定義により,ポイントワイド推定誤差の有界化が可能となることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:54:20 GMT)
BondMatcher: H-Bond Stability Analysis in Molecular Systems [4.1] 本稿では,分子中の原子の量子理論(QTAIM)によって特徴づけられる水素結合(H結合)の安定性について検討する。
水ヘキサマーの4つの異性体に関連する4544個の電子密度のデータベースを, 構造摂動下で平衡幾何学を歪ませて作成した。
我々は,結合発生率と呼ばれる新しい安定度尺度を提案し,各結合経路が平衡状態にある場合と入力アンサンブル内での発生率とを関連付ける。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:29:29 GMT)
Arti-"fickle" Intelligence: Using LLMs as a Tool for Inference in the Political and Social Sciences [4.1] ジェネレーティブな大規模言語モデル(LLM)は驚くほど有用で、汎用的で、有望なツールです。
政治や社会科学の研究者にとって、実際の人間の行動や懸念について理解を深める方法として使われるとき、それらは最もよく使われるだろう。
政治・社会科学の研究者は、推論の科学的目標に焦点を合わせる必要があることを示唆する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:35:45 GMT)
Bayesian Optimization of Robustness Measures Using Randomized GP-UCB-based Algorithms under Input Uncertainty [3.9] ランダム化ロバストネス尺度GP-UCB(RRGP-UCB)と呼ばれる新しい手法を提案する。
RRGP-UCBは、カイ二乗分布に基づいて確率分布からトレードオフパラメータ$beta$をサンプリングし、明示的に$beta$を指定することを避ける。
RRGP-UCBは、最適解と推定解に基づいて、後悔の期待値に厳密な制約を与えることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:01:54 GMT)
Generalizing Hate Speech Detection Using Multi-Task Learning: A Case Study of Political Public Figures [3.8] 本研究では,複数のヘイトスピーチデータセットを同時に学習するマルチタスク学習パイプラインを提案する。
列車-テスト分割における一般化誤差を調べる際には強い結果が得られ、これまで見つからなかったデータセットの予測では大幅に改善された。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:08:13 GMT)
Gaussian Process Tilted Nonparametric Density Estimation using Fisher Divergence Score Matching [3.8] ガウス過程(GP)に基づくスコアモデルを学習するための3つのフィッシャー分岐(FD)アルゴリズムを提案する。
すべての学習問題をクローズドな形で解けることを示す。
我々は,3つの学習アルゴリズムとMAPベースラインアルゴリズムを,いくつかの低次元密度推定問題で実証した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:41:41 GMT)
VISTA-OCR: Towards generative and interactive end to end OCR models [3.8] VISTA-OCRは、単一の生成モデル内でテキストの検出と認識を統合する軽量アーキテクチャである。
エンコーダ-デコーダアーキテクチャに基づいて構築されたVISTA-OCRは、視覚的特徴抽出フェーズから始まり、徐々に訓練される。
モデルの性能を高めるために、バウンディングボックスアノテーションと合成サンプルで強化された実世界のサンプルからなる新しいデータセットを構築した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:39:53 GMT)
CHOICE: Benchmarking the Remote Sensing Capabilities of Large Vision-Language Models [3.7] CHOICEは、大規模視覚言語モデル(VLM)の階層的リモートセンシング能力を客観的に評価するために設計されたベンチマークである。
リモートセンシングに不可欠な2つの主機能次元(知覚と推論)に着目し,さらに6つの二次的次元と23の葉のタスクを分類し,十分に包括された評価範囲を確保する。
新たにキュレートされたデータと、決定的な回答を伴う複数選択質問の形式は、客観的で直接的なパフォーマンス評価を可能にします。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:07:05 GMT)
Structured Matrix Learning under Arbitrary Entrywise Dependence and Estimation of Markov Transition Kernel [3.7] 本稿では、ノイズの多い低ランク+スパース行列回復の一般的な枠組みについて考察する。
本稿では,不整合制約最小二乗推定器を提案し,その厳密性を決定論的下界とミニマックスリスクの整合性の両方で証明する。
次に、我々のフレームワークのいくつかの重要な統計機械学習問題への適用について紹介する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:02:24 GMT)
A Structure-Preserving Kernel Method for Learning Hamiltonian Systems [3.6] 非線形ハミルトニアン関数の回復を可能にする構造保存カーネルリッジ回帰法を提案する。
本稿では,勾配の線形関数を含む損失関数を必要とする問題に対して,カーネル回帰法を拡張した。
固定正則化パラメータと適応正則化パラメータを用いて収束率を提供する完全誤差解析を行う。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:28:27 GMT)
PaperBench: Evaluating AI's Ability to Replicate AI Research [3.5] PaperBenchは、AIエージェントが最先端のAI研究を複製する能力を評価するベンチマークである。
エージェントは、スクラッチから20個のICML 2024 SpotlightとOralの文書を複製する必要がある。
PaperBenchには8,316の個別の段階的なタスクが含まれている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 12:44:57 GMT)
Monte Carlo Graph Coloring [3.4] グラフ色付けはおそらく、グラフアルゴリズムにおいて最も研究され有名な問題の1つである。
グラフカラー化にモンテカルロ探索を効果的に適用する方法を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:57:01 GMT)
Rapid quantum ground state preparation via dissipative dynamics [3.3] 散逸は量子系の低エネルギー状態を作るための有望なアプローチとなっている。
しかし、散逸的プロトコルのポテンシャルは、通勤するハミルトニアン以外には明らかでない。
この研究は、非可換ハミルトニアンの基底状態を作成するための散逸の力に関する重要な分析的および数値的な洞察を提供する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:12:09 GMT)
Exploring Non-Multiplicativity in the Geometric Measure of Entanglement [3.3] エンタングルメントの幾何学的測度(GME)は、多部量子状態がヒルベルト・シュミット内積の下での分離状態の集合にどれほど近いかを定量化する。
両項$(O otimes O)$変換の下で不変であるものと単項状態の混合である。
d = 3 の場合、これらの状態における非多重化係数を定量的に解析するために、最先端の数値最適化法とモデルを用いる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:35:12 GMT)
From Observation to Orientation: an Adaptive Integer Programming Approach to Intervention Design [3.3] 独自の適応的介入設計パラダイムが提示され、因果方向の非循環グラフ(DAG)が実用的な予算的考察によって効果的に回収される。
反復整数プログラミング(IP)アプローチが提案され、必要な実験の数を劇的に削減する。
その結果,適応型IP手法は,ランダムな介入ベースラインよりも介入反復や変動操作が少なく,完全な因果グラフ回復を実現することがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 02:35:35 GMT)
Level Generation with Constrained Expressive Range [3.2] 表現範囲解析(Expressive Range Analysis)は、生成モデルの性能を評価するための可視化技術である。
本研究では,生成可能空間の概念空間として生成器の表現範囲を用いる。
そのために、制約ベースのジェネレータを使用して、この空間のレベルを体系的にトラバースし、生成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:55:30 GMT)
Analysis of Robustness of a Large Game Corpus [3.2] 2Dタイルベースのゲームレベルは、一貫してPCGMLの標準データセットとして機能している。
ゲームレベルの特異な特徴として、構造化された離散データの性質、ゲーム固有の局所的およびグローバル的制約、入力の小さな変化に対するゲームレベルの敏感さを挙げる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:15:13 GMT)
Concept-based Rubrics Improve LLM Formative Assessment and Data Synthesis [3.1] STEMトピックスにおける形式的評価は、学生の現在の理解を識別し、さらなる学習を促進する方法を目標にすることで、学生の学習を促進することを目的としている。
従来の研究では,現在生成型大規模言語モデル(LLM)のオープンエンド質問に対する応答に対する評価性能が,高品質なラベル付きデータに基づいて訓練された教師付き分類器よりも著しく低いことが示唆された。
我々は,LLMの性能を著しく向上させることで,LLMの棚外評価ツールとしてのギャップを狭めることと,大量のトレーニングデータを必要とする教師付きモデルとのギャップを小さくすることができることを実証した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:02:07 GMT)
Dynamical excitation control and multimode emission of an atom-photon bound state [3.0] 原子-光子結合状態は、分散工学的な導波路のバンドエッジへの量子エミッターの結合から生じる。
本研究では、周波数可変量子エミッタからマイクロ波メタマテリアルへの結合から生じる原子-光子結合状態のダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:51:46 GMT)
Can AI Master Construction Management (CM)? Benchmarking State-of-the-Art Large Language Models on CM Certification Exams [2.9] CMExamSetは,全国認定の4つのCM認定試験から689の質問を正解したベンチマークデータセットである。
その結果、GPT-4o と Claude 3.7 は、平均精度が82%、Claude 3.7 が83%である。
概念的誤解は最も一般的なものであり、拡張されたドメイン固有の推論モデルの必要性を暗示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:13:45 GMT)
FEASE: Shallow AutoEncoding Recommender with Cold Start Handling via Side Features [2.9] ユーザとアイテムのコールドは、レコメンデーションシステムの産業的応用において重要な課題となる。
ユーザ側とアイテム側の両方をシームレスに統合する拡張EASEモデル(FEASE)を導入する。
コールドスタート項目を効果的に推奨し, 余分なバイアスを伴わずにコールドスタートユーザを扱い, バランスをとる方法を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:01:46 GMT)
Extending Data Spatial Semantics for Scale Agnostic Programming [2.8] 我々は,永続状態,複数ユーザコンテキスト,複数エントリポイント,アプリケーション用マシン間分布を抽象化する固有言語構成を定式化する。
これらの拡張により、開発者は永続性、マルチユーザのサポート、配布、実行環境にインターフェースするAPIのランタイム上の懸念を委譲しながら、ドメインロジックに集中することができる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:33:34 GMT)
TokenFLEX: Unified VLM Training for Flexible Visual Tokens Inference [2.8] TokenFLEXは、画像を可変数のトークンにエンコードし、Large Language Model (LLM)と効率的に統合するビジョン言語フレームワークである。
われわれのアプローチは2つの重要な革新によって支えられている。まず、様々な視覚トークンのパフォーマンスを向上させる新しい訓練パラダイムを提案する。
次に、軽量な視覚トークンプーリング層とSwiGLUを設計し、視覚トークンのフレキシブルなダウンサンプリングを可能にする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:24:29 GMT)
Entanglement and local holography in quantum gravity [2.7] Qubitのパラダイムから、重力時空は量子の絡み合いから現れると提案されている。
この主な証拠はホログラフィック双対性(英語版)であり、絡み合った量子ビットは双対非重力理論で生活する。
弦理論はこれらの絡み合った量子ビットをバルク重力理論で定義するメカニズムを提供すると主張する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:55:30 GMT)
Verification of Autonomous Neural Car Control with KeYmaera X [2.7] 本稿では、微分力学(dL)におけるABZ'25ケーススタディのための形式モデルと形式的安全性証明について述べる。
ケーススタディでは、近隣の車との衝突を避けるために高速道路を走行する自動運転車について検討している。
KeYmaera X の dL 実装を用いて、無限時間地平線上での衝突の欠如を証明し、安全が旅行距離とは無関係に維持されていることを確かめる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:43:31 GMT)
Towards Effective EU E-Participation: The Development of AskThePublic [2.7] E-Participation Platformは、政府にとって、信頼を高め、民主社会を育むための重要な資産となり得る。
メディアリッチネス理論を適用し,AskThePublicの作成にデザインサイエンス研究手法を適用した。
その結果、参加者は対話的かつ構造化された応答と言語能力の強化を評価できることがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:15:06 GMT)
A Survey of Quantum Transformers: Approaches, Advantages, Challenges, and Future Directions [2.6] 量子トランスモデル(Quantum Transformer Model)は、量子機械学習(QML)における重要な研究方向を表す。
PQCベースのTransformerモデルは、現在の研究の主要な焦点である。
量子線形代数(QLA)ベースのトランスフォーマーモデルは、将来のフォールトトレラント量子コンピューティングに依存している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:40:18 GMT)
LLMs Prompted for Graphs: Hallucinations and Generative Capabilities [2.5] 本研究では,Large Language Models (LLM) の文献からよく知られたグラフを抽出し,ランダムなグラフを生成する能力について検討する。
蘇生作業において, グラフ幻覚は, 10 000 倍の刺激を生かした幻覚ランクである幻覚リーダボードと相関することを示した。
生成タスクでは,ほとんどのLSMにおいて驚くほど良好で再現可能な結果が得られる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:58:40 GMT)
Rotation Invariance in Floor Plan Digitization using Zernike Moments [2.5] 本稿では,前処理した画像から領域隣接グラフ(RAG)を作成し,そのノードを予測するために,画像の事前処理と新しいアプローチを利用するエンドツーエンドパイプラインを提案する。
我々の手法を適用すると、回転データ上でF1スコアとIoUが向上する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:44:07 GMT)
Mathematical Modeling of Option Pricing with an Extended Black-Scholes Framework [2.5] 本研究では,ブラック・スコールズモデルを拡張し,ボラティリティと金利変動性を含むオプション価格の高騰について検討した。
拡張されたBlack-Scholesモデルと機械学習ベースのLSTMモデルを開発し、Googleストックオプションの価格で評価する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:06:55 GMT)
Crash Time Matters: HybridMamba for Fine-Grained Temporal Localization in Traffic Surveillance Footage [2.4] HybridMambaは、ビジュアルトランスフォーマーと状態空間の時間的モデリングを組み合わせた、新しいアーキテクチャである。
アイオワ州交通省の大規模なデータセットに基づいて評価され、HybridMambaは平均絶対誤差が1.50秒に達する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:35:11 GMT)
A Survey on Moral Foundation Theory and Pre-Trained Language Models: Current Advances and Challenges [2.4] 道徳的価値は初期の文明に深く根ざし、社会秩序と共通の善を規制する規範や法則の中で成文化された。
モラル・ファンデーション理論(MFT)は、異なる文化が個人や社会生活を形作る方法の基礎となる道徳的基盤を識別する確立した枠組みである。
自然言語処理,特にプレトレーニング言語モデル(PLM)の最近の進歩は,テキストデータから道徳的次元の抽出と分析を可能にしている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:52:55 GMT)
Metamorphic Testing for Fairness Evaluation in Large Language Models: Identifying Intersectional Bias in LLaMA and GPT [2.4] 大規模言語モデル(LLM)は自然言語処理において大きな進歩を遂げてきたが、公平性に関連する問題に対して脆弱なままである。
本稿では,LLMにおける公平なバグを系統的に同定するメタモルフィックテスト手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:04:14 GMT)
A Symmetric Regressor for MRI-Based Assessment of Striatal Dopamine Transporter Uptake in Parkinson's Disease With Enhanced Uncertainty Estimation [2.2] ドーパミントランスポーター(DAT)イメージングはパーキンソン病(PD)のモニタリングに一般的に用いられている
近年,ニコラル領域のMRIパッチはより安全で簡便な代替手段として提案されている。
本稿では,MRI パッチからの DAT 取り込み量を予測する対称回帰器を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 23:08:49 GMT)
Augmenting Human Cognition With Generative AI: Lessons From AI-Assisted Decision-Making [2.2] AIによる意思決定と生成AIの両方において、一般的なアプローチは、AIが生成するエンドツーエンドソリューションをユーザに提案することである。
あるいは、AIツールがよりインクリメンタルなサポートを提供して、ユーザーがタスクを自分で解くのを助けることもできる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:40:03 GMT)
Are clinicians ethically obligated to disclose their use of medical machine learning systems to patients? [1.6] 臨床医は、医療機械学習システムの使用を患者に開示する義務を負うことが一般的である。
これを「開示論」と呼ぶ。
これら4つの議論はいずれも議論の余地がなく、開示論は否決されるべきである、と私は主張する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:35:58 GMT)
A Polynomial Time Quantum Algorithm for Exponentially Large Scale Nonlinear Differential Equations via Hamiltonian Simulation [1.6] 量子コンピュータ上で効率よく解ける非線形ODEのクラスを導入する。
具体的には、非線形ODEの系をハミルトン力学にマッピングするために、クープマン・フォン・ノイマン線型化を用いる。
これは指数量子スピードアップを持つ非線形ODEのシステムを解く最初の具体的な例である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 06:57:55 GMT)
Machine Learning-Based Detection and Analysis of Suspicious Activities in Bitcoin Wallet Transactions in the USA [1.6] この研究は、不正行為を露呈する傾向と傾向を識別する機能を備えたモデルを作成することを目的としている。
データセットは、詳細なBitcoinウォレットトランザクション情報で構成されている。
機械アルゴリズムの暗号追跡への応用は、透明でセキュアな米国市場を作るためのツールである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 00:07:32 GMT)
Tuning the Frequencies: Robust Training for Sinusoidal Neural Networks [1.5] 正弦波ネットワークの容量特性を説明する理論的枠組みを導入する。
入力周波数の整数結合として表される多数の新しい周波数を,その層組成によってどのように生成するかを示す。
提案手法はTUNERと呼ばれ, 正弦波INRトレーニングの安定性と収束性を大幅に改善し, より詳細な再建を行った。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 02:54:01 GMT)
Locations of Characters in Narratives: Andersen and Persuasion Datasets [1.4] AndersenとPersuasionの2つの新しいデータセットを紹介します。
アンデルセンのデータセットでは、ハンス・クリスチャン・アンデルセンの『アンデルセンの妖精物語』から15の児童話を選択した。
Persuasionデータセットでは、ジェーン・オーステンの小説"Persuasion"の登場人物とその位置も手動で注釈付けされた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:25:32 GMT)
Real-time Speech Summarization for Medical Conversations [1.4] 医師と患者の会話では、医療関連情報の特定が重要である。
本稿では,産業における実世界のアプリケーションを対象とした,初めてのリアルタイム音声要約システムを提案する。
医療会話のための最初の音声要約データセットであるVietMed-Sumを提示する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:12:54 GMT)
Enabling Low-Resource Language Retrieval: Establishing Baselines for Urdu MS MARCO [1.4] 本稿では,機械翻訳によるMS MARCOデータセットの翻訳により作成した,最初の大規模Urdu IRデータセットを紹介する。
我々は、ウルドゥー語におけるIRのゼロショット学習によるベースライン結果を確立し、その後、mMARCO多言語IR手法を新たに翻訳されたデータセットに適用する。
以上の結果から,超微調整モデル(Urdu-mT5-mMARCO)は0.247のMRR@10,0.439のRecall@10を達成できた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:07:23 GMT)
The Lyme Disease Controversy: An AI-Driven Discourse Analysis of a Quarter Century of Academic Debate and Divides [1.3] 慢性ライム病 (CLD) とPTLDS (Post-Treatment Lyme Disease Syndrome) を取り巻く科学的議論は、過去25年間に発展してきた。
本研究は,革新的なハイブリッドAI駆動手法を用いて,この言論を大規模かつ体系的に検討した最初の事例である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:28:29 GMT)
Comparative Analysis of Unsupervised and Supervised Autoencoders for Nuclei Classification in Clear Cell Renal Cell Carcinoma Images [1.3] 本研究は、透明細胞腎細胞癌(ccRCC)画像における核分類の自動化のための、教師付きおよび教師なしオートエンコーダ(AE)の応用について検討した。
我々は,標準AE,契約型AE,識別型AEなど,さまざまなAEアーキテクチャを評価する。
その結果, AEの分類能力を活用することにより, 攻撃性ccRCCの分類精度が向上した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:52:32 GMT)
Batch Bayesian Optimization for High-Dimensional Experimental Design: Simulation and Visualization [1.3] 本研究は,BOの設定と合成データの選択において重要な課題を体系的に強調し,実験設計をテストする。
ノイズの影響は問題環境に依存するため,BOの設計には領域構造や騒音レベルに関する事前知識が必要である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:20:11 GMT)
MG-Gen: Single Image to Motion Graphics Generation with Layer Decomposition [1.2] MG-Genは単一の画像からベクトル形式でデータを再構成する。
我々はMG-Genがテキストの可読性と入力整合性を保ちながらモーショングラフィックを生成することを実験的に確認した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:21:39 GMT)
Unlocking Neural Transparency: Jacobian Maps for Explainable AI in Alzheimer's Detection [1.2] 本稿では,アルツハイマー病の診断における説明可能性と信頼性を高めるために,ヤコビアンマップ(JM)を多モードフレームワークで活用する新しいプレモデルアプローチを提案する。
我々は、JMsで訓練された3D CNNと従来の前処理データとの比較実験により、JMsを検証する。
また、3D Grad-CAM分析を用いて、視覚的および定量的な洞察を提供し、さらに解釈可能性と診断信頼性の向上を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:24:52 GMT)
Noise Augmented Fine Tuning for Mitigating Hallucinations in Large Language Models [1.1] 大規模言語モデル(LLM)は、しばしば不正確な、または誤解を招くコンテンツ・ハロシンを生成する。
noise-Augmented Fine-Tuning (NoiseFiT) は適応ノイズ注入を利用してモデルロバスト性を高める新しいフレームワークである。
NoiseFiTは、動的にスケールしたガウス雑音を用いて、高SNR(より堅牢)または低SNR(潜在的に過正規化)と同定された層を選択的に摂動する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:27:19 GMT)
Dense Neural Network Based Arrhythmia Classification on Low-cost and Low-compute Micro-controller [1.0] Arduino Nano上で不整脈を検出するために高密度ニューラルネットワークが開発された。
モデルのサイズは1.267KBで、4種類の不整脈を分類するためのF1スコア(マクロ平均)は78.3%、精度は96.38%、浮動小数点演算の0.001314 MOpsを必要とする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:30:02 GMT)
A Human Digital Twin Architecture for Knowledge-based Interactions and Context-Aware Conversations [1.0] 人工知能(AI)と機械学習(ML)の最近の進歩は、HAT(Human-Autonomy Teaming)の新しい機会を生み出している。
本稿では,知識報告,回答,レコメンデーションのためのLarge Language Models(LLM)を統合したリアルタイムHuman Digital Twin(HDT)アーキテクチャを提案する。
HDTは、トレーニングからデプロイメント、アフターアクションレビューまで、ミッションライフサイクル全体を通して統合された、視覚的で行動的に現実的なチームメンバーとして機能します。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:56:26 GMT)
The Ground Cost for Optimal Transport of Angular Velocity [1.0] 制御方程式によって与えられる角速度力学よりも最適な輸送問題を再検討する。
これは非線形力学系上の一般化された最適輸送の例である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:38:00 GMT)
An Exploration-free Method for a Linear Stochastic Bandit Driven by a Linear Gaussian Dynamical System [0.9] マルチアームの盗賊では、学習者が直面する大きな問題は、探索と搾取の間のトレードオフである。
本稿では,線形ガウス力学系の出力となる線形バンディットについて述べる。
本稿では,カルマンフィルタを用いた探索自由度探索法であるカルマンフィルタオブザーバビリティ依存探索法(KODE)を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:46:35 GMT)
The Change You Want To Detect: Semantic Change Detection In Earth Observation With Hybrid Data Generation [0.9] 超高分解能(VHR)画像に基づく大規模なバイ時間変化検出は、地球観測に不可欠である。
ほとんどのアプローチでは、時間的および空間的適応に必要な汎用性は示さない。
我々は,大規模なハイブリッドな意味変化検出データセットを作成するための生成パイプラインHySCDGを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:49:37 GMT)
Streaming Generation of Co-Speech Gestures via Accelerated Rolling Diffusion [0.9] 本稿では,ストリーミングジェスチャ生成のための新しいフレームワークであるAccelerated Rolling Diffusionを紹介する。
RDLAはノイズスケジュールをステップワイドのはしごに再構成し、複数のフレームを同時に復調できる。
これにより、動作一貫性を維持しながらサンプリング効率が大幅に向上し、最大2倍のスピードアップが達成される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:12:42 GMT)
RWKVTTS: Yet another TTS based on RWKV-7 [0.8] TTSアプリケーションに適した最先端のRNNアーキテクチャであるRWKV-7 citepeng2025rwkvを紹介する。
従来のトランスモデルとは異なり、RWKV-7はリカレントニューラルネットワークの強みを活用して計算効率とスケーラビリティを向上させる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:17:20 GMT)
How to Test for Compliance with Human Oversight Requirements in AI Regulation? [0.8] 人間の監視要件は、欧州AI法やAIガバナンスの中核的な要素である。
重要な問題は、リソース集約的な実証テストを伴う単純なチェックリストベースのアプローチと、潜在的に非効率なチェックリストベースのアプローチのバランスにある。
これらの課題は、社会技術AIガバナンスの将来における幅広い課題を浮き彫りにしている、と私たちは主張する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:26:59 GMT)
Random Normed k-Means: A Paradigm-Shift in Clustering within Probabilistic Metric Spaces [0.8] 確率的距離空間内で機能する文献において、最初のk-平均変種を導入する。
確率論的視点を採用することで,本手法は新たなパラダイムを導入するだけでなく,厳密な理論的枠組みも確立する。
提案したランダムノルムk平均(RNKM)アルゴリズムは,非線形に分離可能な構造を識別する顕著な能力を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:48:43 GMT)
The building blocks of software work explain coding careers and language popularity [0.7] Stack Overflowに関する何千万ものQ&A記事を使って、グローバルソフトウェア業界の作業を分析します。
これらのタスクは、現実世界の求人広告の給与と求人要求を予測する。
また、個人がタスク内でどのように学習するかを観察し、新しいタスクに多様化する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:39:20 GMT)
FLAIRBrainSeg: Fine-grained brain segmentation using FLAIR MRI only [0.5] 本稿では,FLAIR MRIのみを用いた新しい脳分割法を提案する。
既存の自動セグメンテーション手法を利用することで、T1強調MRIから得られるセグメンテーションを近似するネットワークを訓練する。
FLAIRBrainSegと呼ばれる本法は132構造の分節を生じ,多発性硬化症に対して堅牢である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:47:18 GMT)
CREASE-2D Analysis of Small Angle X-ray Scattering Data from Supramolecular Dipeptide Systems [0.5] 我々は、最近開発された機械学習(ML)ベースのCREASE-2D法を拡張し、超分子性ジペプチドミセル系の小角X線散乱測定から得られた2次元散乱パターン全体を分析する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:53:32 GMT)
A Memristive Based Design of a Core Digital Circuit for Elliptic Curve Cryptography [0.5] メムリスタデバイスとCMOSトランジスタは、XAXモジュール用のハイブリッドCMOS-メムリスタ回路を形成するために協力している。
提案手法は Pt/TaOx/Ta memristor デバイスを用いて実装し,Cadence Virtuoso でシミュレートした。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:33:24 GMT)
Independent e- and m-anyon confinement in the parallel field toric code on non-square lattices [0.5] Kitaevのトーリックコードは、拡張された分解されたトポロジカルバルクフェーズをホストする最も単純なモデルである。
我々は, 連続時間量子モンテカルロ理論を用いて, ハニカム, 三角形, 立方体格子上の並列場トーリック符号の基底状態物理学を研究する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:14:08 GMT)
Opening the Black-Box: Symbolic Regression with Kolmogorov-Arnold Networks for Energy Applications [0.4] この研究は、伝統的なフィードフォワードニューラルネットワーク(FNN)とKAN(Kolmogorov-Arnold Network)を比較する。
精度の面では、出力次元が制限された場合、すべてのデータセットに匹敵するkanとFNNが見つかる。
訓練後にシンボリック方程式に変換されるカンは、FNNがブラックボックスのままである間に完全に解釈可能なモデルを生成する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:23:33 GMT)
Trading off Relevance and Revenue in the Jobs Marketplace: Estimation, Optimization and Auction Design [0.4] 本研究では、求職者ごとの求職者ランキングを決定する求人市場における位置割当の問題について検討する。
我々の分析は、収益と関連性のトレードオフと、求人広告デザインの革新に焦点を当てている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:36:40 GMT)
Dividing and Conquering the Van Vleck Catastrophe [0.4] ヴァン・ヴレック大災害(Van Vleck catastrophe)は、量子コンピュータが大規模システムの基底状態を効率的に準備できないことを示唆するためにしばしば起こされた。
我々は,この直観が必ずしも真ではないことを示す。具体的には,より大規模なサブシステムの基底状態を統合するために,位相推定を繰り返し利用する分割・対数戦略を導入する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:15:12 GMT)
Accurate GPU Memory Prediction for Deep Learning Jobs through Dynamic Analysis [0.4] メモリ外エラーは、モデルトレーニングと効率的なリソース利用にとって主要な障害となる。
VeritasEstは完全にCPUベースの分析ツールで、ディープラーニングのトレーニングタスクに必要なピークGPUメモリを正確に予測することができる。
その性能は、畳み込みニューラルネットワーク(CNN)モデルにわたる数千の実験的な実行を通じて検証された。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:20:03 GMT)
Generating ensembles of spatially-coherent in-situ forecasts using flow matching [0.4] 天気予報後処理のための機械学習に基づく手法を提案する。
我々のフロー・マッチング・ポストプロセッシング(FMAP)は、観測分布の相関構造をより良く表現する。
FMAPはEUPPBenchデータセットの実験で有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:12:53 GMT)
Evaluating Compact LLMs for Zero-Shot Iberian Language Tasks on End-User Devices [0.3] 大規模言語モデルは、言語生成、翻訳、推論といったタスクにおいて顕著なパフォーマンスを達成するために、大幅に進歩した自然言語処理を持つ。
その相当な計算要件は、ハイエンドシステムへのデプロイメントを制限し、コンシューマグレードデバイスへのアクセシビリティを制限している。
本研究は,イベリア語に適したNLPタスクを網羅的に評価する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:47:58 GMT)
Improving Brain Disorder Diagnosis with Advanced Brain Function Representation and Kolmogorov-Arnold Networks [0.3] 機能的接続の定量化(FC)は、様々な脳疾患の診断に欠かせない指標である。
本稿では,脳機能表現を効果的に表現できる新しいトランスフォーマーベース分類ネットワーク(AFBR-KAN)を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:42:06 GMT)
Performance Modeling of Data Storage Systems using Generative Models [0.3] 我々は,機械学習に基づく生成モデルを用いて,記憶システムの複数のモデルを開発した。
実験の結果,IOPSは4~10%,遅延予測は3~16%の誤差を示した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:30:20 GMT)
Quantum conditional mutual information as a probe of measurement-induced entanglement phase transitions [0.2] 本稿では、量子条件相互情報(QCMI)が、測定誘起絡み合い相転移を検出する強力なプローブとして機能することを提案する。
観測された可変レンジクリフォード回路について検討し,体積法と面積法の間の位相境界を同定した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:25:49 GMT)
Non-stabilizerness and violations of CHSH inequalities [0.2] 本稿では,CHSH不等式違反における絡み合いと非安定化資源の相互作用について検討する。
安定化器エントロピー(SE)を用いて、非安定化器リソースの定量化と、リソースが与えられた場合に違反する確率を推定する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:10:41 GMT)
Universal Collection of Euclidean Invariants between Pairs of Position-Orientations [0.2] M(3) x M(3) 全体の4つの滑らかなスカラー不変量の最適コレクションを厳密に記述する。
我々は、PONITAニューラルネットワークアーキテクチャを用いて、2つの不変量のコレクションを評価した。
実験の結果,普遍的な不変量の集合を用いることで,PONITAの精度に大きな影響を与えることがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:25:59 GMT)
Lightweight Learning for Grant-Free Activity Detection in Cell-Free Massive MIMO Networks [0.2] Grant-free random access (GF-RA) は、将来の無線ネットワークにおける大規模機械型通信(mMTC)のための有望なアクセス技術である。
本研究では、デバイスアクティビティ検出(AD)における課題に対処するために、教師付き機械学習技術を用いた効率性を検討する。
我々は,mMTC 用の GF-RA のアクティビティ検出に特化して設計された,新しい軽量なデータ駆動型アルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:24:36 GMT)
Optical detection of charge defects near a graphene transistor using the Stark shift of fluorescent molecules [0.2] グラフェンデバイスに結合したサブGHz線幅単一光子エミッタを用いて電荷キャリア蓄積を光学的に検出する方法を示す。
同様の手法により電子ノイズの動的検出が可能となり, 偏光グラフェンデバイスにおける低周波白色雑音の光学的読み出しを実演する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:15:53 GMT)
Holomorphic Discrete Series of SU(1,1): Orthogonality Relations, Character Formulas, and Multiplicities in Tensor Product Decompositions [0.2] 我々は SU$ (1, 1)$ の正則離散級数表現を再検討する。
これらの分解の構造と関連する多重度に特に注意が払われる。
発見は、SU$ (1,1)$表現の数学的基礎と理論物理学におけるそれらの重要性に関する深い洞察を与える。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:44:48 GMT)
Revisiting MAE pre-training for 3D medical image segmentation [0.1] Self-Supervised Learning (SSL)は、未使用の膨大な臨床データセットの可能性を解放するエキサイティングな機会を提供する。
SSLは自然言語処理やコンピュータビジョンといった分野に革命をもたらし、その3D医療画像コンピューティングへの採用は、3つの重要な落とし穴によって制限されてきた。
本稿では,現在最先端のnnU-Netフレームワーク内の残留U-Netアーキテクチャを用いて,39kの脳MRIボリュームとiiの大規模データセットを活用することにより,これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:51:37 GMT)
A metrological framework for uncertainty evaluation in machine learning classification models [0.1] 機械学習(ML)分類モデルのためのメタロジカル概念的不確実性評価フレームワークを提案する。
我々の枠組みは、国際計量学語彙(VIM)と測定の不確実性表現ガイド(GUM)を名目上不確実性に拡張することを可能にした。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:28:48 GMT)
When is using AI the rational choice? The importance of counterfactuals in AI deployment decisions [0.0] 偽造ミスは、AIデプロイメント決定者に対して不当な不利をもたらす可能性がある。
本稿では, 有効性評価に反実的な結果を含める方法について検討する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:59:29 GMT)
What Can 240,000 New Credit Transactions Tell Us About the Impact of NGEU Funds? [0.0] パネルデータローカルプロジェクションモデルを用いて、新規融資に対する調達賞の動的効果を推定する。
その結果,NGEU調達プログラムの影響は歴史的調達の影響と密接に一致していることがわかった。
高頻度の財務データと調達記録を統合することは、公共政策設計の洗練におけるビッグデータの可能性を強調している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:46:31 GMT)
Weak instrumental variables due to nonlinearities in panel data: A Super Learner Control Function estimator [0.0] 加法的に分離可能な個々の固定効果を持つパネルデータに対する三角同時方程式モデルを提案する。
推定手順は2つの主要なステップとサンプル分割から構成される。
2SLS推定器では,スーパーラーナー制御関数推定器が有意に優れていた。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:22:18 GMT)
VietMed: A Dataset and Benchmark for Automatic Speech Recognition of Vietnamese in the Medical Domain [0.0] 医療分野におけるベトナム語音声認識データセットであるVietMedについて紹介する。
VietMedは7つの面で世界最大の公衆医療音声認識データセットである。
我々はベトナムのASR、w2v2-Viet、XLSR-53-Viet向けの最初の大規模事前訓練モデルをリリースする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:06:21 GMT)
Tunable Topological Phases in Multilayer Graphene Coupled to a Chiral Cavity [0.0] 2次元材料において光子空洞場を電子自由度に結合すると、固体工学のツールボックスに制御ノブが付加される。
グラフェンスタックにおける空洞周波数と層間トンネルの微妙な競合を示す。
本研究は, キラルキャビティフィールドを有するグラフェンヘテロ構造の今後の制御と工学の道を開くものである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:00:05 GMT)
The Secret Life of CVEs [0.0] この研究は生存分析を用いて、プログラミング言語、プロジェクト、CVEがCVEの寿命にどう影響するかを調べる。
様々な要因が脆弱性の解決に与える影響を調べるための今後の研究の道程を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:39:05 GMT)
The Mathematics of Questions [0.0] 方程式 $i(A,B)+i(A,neg B)+i(neg A,B)+i(neg A,neg B)= 0$, where $i(A,B)=logfracP(Atext and B)P(A)P(B)$, and $P(A)$ は$A$の確率である。
解は論理的命題の間の新たな基本的な情報的関係であり、それが解である
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:35:43 GMT)
The AI Cosmologist I: An Agentic System for Automated Data Analysis [0.0] AIの宇宙論者は、アイデア生成から実験評価、研究普及までの完全なパイプラインを実装している。
従来の自動機械学習システムとは異なり、AI Cosmoologistは多様な実装戦略を生成する。
その結果, エージェントシステムは研究プロセスの一部を自動化し, 科学的発見を加速させる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:12:08 GMT)
Temporal Bell inequalities in non-relativistic many-body physics [0.0] 2つのスピンの時間的クレーター-ホルン不等式は、2つの測定されたパーティがスピンチェーンで接続されている場合、測定間の非ゼロ時間間隔で違反することを示す。
私たちが分析したダイナミクスは、非相対論的な設定で期待されているように、情報の拡散はリーブ・ロビンソン境界によって根本的に制限されていることを示している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 12:08:37 GMT)
Scope of Online Maternal Health Information in Kinyarwanda and Opportunities for Digital Health Developers [0.0] 母親の健康教育に特化したウェブサイトが増えているが、コンテンツの範囲と品質は様々である。
本研究では、低リソースのKinyarwanda言語でコンテンツを提供する母親の健康関連ウェブサイトで主に取り上げられているトピックについて分析した。
主訴は妊娠危険徴候,(2)保育,(3)親密性(性),(4)栄養,(5)医師相談の重要性であった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:55:23 GMT)
SIGMA: Single Interpolated Generative Model for Anomalies [0.0] 我々は、背景分布を推定する新しい、完全にデータ駆動で、計算効率のよいSIGMAを提案する。
信号領域の背景モデルを得るために、すべてのデータに対して単一の生成モデルをトレーニングし、そのパラメータをサイドバンド領域に補間する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:46:57 GMT)
Robot Localization Using a Learned Keypoint Detector and Descriptor with a Floor Camera and a Feature Rich Industrial Floor [0.0] 移動ロボットのローカライゼーションは 環境からの良質な特徴の可用性に依存します
可読マーカーを持たない産業用フロアから十分な特徴を抽出するディープニューラルネットワーク。
検出器と記述子の組み合わせによるフレームワークは、同等のアプローチを上回ります。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:00:38 GMT)
Reducing quantum error correction overhead using soft information [0.0] 我々は、様々な物理量子ビットプラットフォームとデコーダでソフト情報デコーディングをモデル化する。
ソフト情報の復号化により、超伝導量子ビット上で最大10%高いエラー抑制と、中性原子量子ビット上で最大20%強いエラー抑制が得られることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:01:39 GMT)
Qudit-native measurement protocol for dynamical correlations using Hadamard tests [0.0] 動的相関は、基礎となる量子多体系の重要な平衡特性を示す。
我々は、quditオブザーバブルをユニタリ演算に分解することで、この制限を克服する修正されたプロトコルを提案する。
この方式は様々なプラットフォームで容易に実装でき、幅広いアプリケーションを提供できる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:26:39 GMT)
Quantum properties of $H\to VV^*$: precise predictions in the SM and sensitivity to new physics [0.0] ヒッグス-ボソン崩壊の量子的性質を、2つのベクトルボソン$(Hto VV*to 4f)$を介して4つのフェルミオンに分解する。
特に、2つの異なるフレーバーレプトン対 $(Hto ZZ*to mu+mu- e+ e-)$ の場合に焦点を当てる。
我々は,next-to-leading order electroweak (NLO EW) の精度で,対応する2量子系$(ZZ)$に対する量子情報観測値を計算する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:00:04 GMT)
Privacy-Preserving Logistic Regression Training on Large Datasets [0.0] 我々は,同型暗号化(HE)を用いた大規模暗号化データに対するロジスティック回帰学習のための効率的なアルゴリズムを提案する。
また、データセットがあまりに大きく、ミニバッチ方式で暗号化する必要がある場合に、それらのメソッドのフルバッチバージョンを実装する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:57:16 GMT)
Predicting energy of the quantum system from one- and two- electron integrals using Deep Learning [0.0] 我々は、強相関系のエネルギーを予測するためにニューラルネットワークを訓練する。
我々のネットワークはサイズ一貫性を利用して保存するので、少数の電子系のトレーニングはより多くの電子を持つシステムの予測を導くことができる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:22:17 GMT)
Origin of the quantum operator formalism and its connection with linear response theory [0.0] ハイゼンベルク表現における量子力学は線形応答理論として理解できることを示す。
応答変数と対応する演算子との1対1の関係を同定する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 03:44:18 GMT)
Optimizing Password Cracking for Digital Investigations [0.0] 本研究では,パスワードクラッキングの有効性を高めるためのルールベースの最適化戦略について検討する。
計算繰り返しを約40%削減する最適化されたルールセットを提案する。
共通語比率の異なる辞書を用いて3単語パスワードのひび割れ性を評価する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:03:39 GMT)
Optical high harmonic generation in Dirac materials [0.0] グラフェン中のクーロンイミューリティによって形成される光駆動型1次元および2次元水素様原子による高次高調波発生について検討した。
どちらの場合も、クーロンと時間周期単色場ポテンシャルを持つ時間依存ディラック方程式を解く。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:10:41 GMT)
On the Connection Between Diffusion Models and Molecular Dynamics [0.0] 拡散モデルのノイズ化は、安定な構成に付加されるノイズを取り除くためのトレーニングネットワークによってNNPにおいて有望であることが示されている。
本稿では,従来の MD ソフトウェアパッケージを標準NNP アーキテクチャにインターフェースして実装する方法について述べる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:32:38 GMT)
OLAF: An Open Life Science Analysis Framework for Conversational Bioinformatics Powered by Large Language Models [0.0] OLAF(Open Life Science Analysis Framework)は、自然言語を用いてバイオインフォマティクス分析を行うオープンソースプラットフォームである。
大規模言語モデル(LLM)とモジュール型のエージェント-パイプ-ルータアーキテクチャを組み合わせることで、OLAFは実際の科学的データに基づいてバイオインフォマティクスコードを生成し、実行します。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:41:16 GMT)
Not someone, but something: Rethinking trust in the age of medical AI [0.0] 人工知能(AI)が医療に組み込まれるにつれ、医療の意思決定に対する信頼は急速に変化しつつある。
この意見書は、AIへの信頼は人間から機械への単純な移行ではない、と論じている。
哲学、生命倫理、システムデザインなどから、人間の信頼と機械の信頼性の主な違いを探求する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:09:20 GMT)
Multiqubit GHZ state preparation with $^{171}\text{Yb}^+$ ions for frequency standards [0.0] 多ビットグリーンバーガー・ホーネ・ザイリンガー(GHZ)状態の準備は、10個の171Yb+$イオン鎖の2〜8キュービットで実証される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:28:48 GMT)
Joint estimation of position and momentum with arbitrarily high precision using non-Gaussian states [0.0] 非ガウス性を利用して任意の精度で同時推定できることを示す。
我々は、純粋な非ガウス状態が全てのガウス状態に対して、純粋でも混合でも有利であることを示した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:24:37 GMT)
JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention [0.0] タンパク質の安定性に対する突然変異効果を予測するためのディープラーニングフレームワークであるJanusDDGを紹介する。
従来の自己アテンションとは異なり、JanusDDGはクエリ(Q)と値(V)をワイルドタイプとミュータント埋め込みの違いとして計算する。
その結果、JanusDDGはシークエンス単独でDelta Delta G$を予測し、最先端の性能を達成することがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:02:32 GMT)
Instantaneous measurement can isolate the information [0.0] スピン1からスピンNまでの1次元スピン鎖では、各スピンはその近傍と相互作用する。
我々は、リーブ・ロビンソン速度から、この測定の効果がしばらくしてスピン1に達することを期待する。
a)スピンN上の測定が瞬時に行われ、b)スピンチェーンの初期状態が適切に選択された場合、スピンNに対する測定の効果はスピン1を達成できないことを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:44:08 GMT)
Inherent and emergent liability issues in LLM-based agentic systems: a principal-agent perspective [0.0] 大規模言語モデル(LLM)を利用したエージェントシステムは、徐々に複雑になり、能力も向上している。
エージェントの増加とデプロイメント環境の拡大は,効果的なガバナンスポリシや監視,コントロールプロトコルに対する関心の高まりを招いている。
我々は, LLMエージェントとその拡張システムの委譲利用から生じる潜在的な責任問題について, 主エージェントの観点から分析する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:10:02 GMT)
Incremental Outlier Detection Modelling Using Streaming Analytics in Finance & Health Care [0.0] リアルタイムデータの時代において、従来の手法はストリーミング環境の動的な性質に追従するのに苦労することが多い。
本稿では,モデルを一度構築し,リアルタイム環境下で評価するハイブリッドフレームワークを提案する。
我々は、一級サポートベクターマシン(OCSVM)、孤立林適応型スライドウィンドウアプローチ(IForest ASD)、正確な嵐(ES)、角度ベース外乱検出(ABOD)、局所外乱係数(LOF)、Kitsunesオンラインアルゴリズム(KitNet)、K-nearest近隣の8種類の最先端外乱検出モデルを採用した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:52:35 GMT)
Improving World Models using Deep Supervision with Linear Probes [0.0] 本稿では,ネットワーク訓練されたエンドツーエンドにおける世界モデル開発を奨励し,次の観測を予測するための深層監視手法について検討する。
本研究では,Flappy Birdゲームに基づく実験環境を用いて,ネットワークの損失関数に線形プローブ成分を加える効果について検討する。
実験により, この監視技術は, トレーニングとテスト性能の両方を改善し, トレーニング安定性を向上し, より容易な世界機能を実現することを示した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:35:21 GMT)
Hong-Ou-Mandel effect with two frequency-entangled photons of vastly different color [0.0] 元来のHong-Ou-Mandel(HOM)実験では、バランスの取れたビームスプリッターの入力ポートに2つの同じ光子が入射すると、彼らは合体し、常に同じ出力ポートを経由する。
ここでは、全く異なる色の2つの光子間のHOM干渉の類似を実証する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:30:48 GMT)
High-Dimensional Quantum Key Distribution with Qubit-like States [0.0] フーリエ量子(または$textitF$-qubits)と呼ばれる量子ビット状態を用いた高次元QKDプロトコルを提案する。
我々のスキームでは、各$textitF$-qubitは相対位相を持つ2つの計算基底状態の重ね合わせであり、$d$は計算基底の次元である。
この非ミューチュアルに偏りのないアプローチは、国家の2次元の性質にもかかわらず、盗聴器に漏れた情報を束縛し、高次元量子システムのセキュリティを維持することができる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:34:28 GMT)
Hidden topology in flat-band topological insulators: Strong, weak and square-root topological states [0.0] 本研究では、局所的な隠れキラル対称性によって保護された、未調査のトポロジカルな状態のクラスについて検討する。
それらのトポロジカル不変量が初めて導出され、これらの未同定対称性が標準キラル対称性と共に作用し、エンドモードの保護を増大させることができることを示す。
局所的な隠れ対称性により、ダイヤモンドネックレス鎖は、強、弱、正方形の3種類の位相的端モードを持つことが示される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 19:08:35 GMT)
Heterogeneous Resource Allocation for Ensuring End-to-End Quality of Service in Multi-hop Integrated Access and Backhaul Network [0.0] マルチホップ統合アクセス・バックホール(IAB)アーキテクチャは、ネットワーク密度化のための費用対効果の高いソリューションとして登場した。
動的時間分割デュプレックス(D-TDD)は、非対称なアップリンクとダウンリンクのトラフィックを持つ非常にダイナミックなシナリオに適応する、有望なソリューションです。
統合最適化問題(IOP)をサブプロブレムに分解して解空間を小さくする。
システム全体のソリューションを実現するために,一元的ヘテロジニアマルチフォロガーのStackelberg-gameベースのリソース割り当て方式を提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:29:08 GMT)
HeartBERT: A Self-Supervised ECG Embedding Model for Efficient and Effective Medical Signal Analysis [0.0] HeartBertは自然言語処理におけるBERT(Bidirectional Representations from Transformers)にインスパイアされ、自己教師型学習アプローチで強化されている。
提案モデルの汎用性,一般化性,効率性を示すために,睡眠ステージ検出と心拍分類という2つの重要な下流課題が選択された。
HeartBERTの優位性と進歩を示すための一連の実験が実施されている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:53:30 GMT)
Graphs are everywhere -- Psst! In Music Recommendation too [0.0] グラフはジャンルベースのレコメンデーションを強化する上で重要な役割を果たす。
本研究では,グラフ畳み込み学習におけるグラフ畳み込みネットワーク(GCN),グラフSAGE,グラフトランスフォーマー(GT)モデルの有効性について検討する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:51:18 GMT)
Graph theory and tunable slow dynamics in quantum East Hamiltonians [0.0] グラフ理論の概念は、速度論的制約のある系におけるスローダイナミクスの起源について、どのように洞察を与えるかを示す。
スローダイナミクスは、フォック空間グラフ上のノード間の強い階層の存在に関連している。
これらの変形が有限系上の非エルゴディディティの度合いにどのように影響するかを数値的に示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:08:18 GMT)
Generative AI Enhanced Financial Risk Management Information Retrieval [0.0] RiskDataは、リスク管理に埋め込みモデルを微調整するためのデータセットである。
RiskEmbedは、財務質問応答システムにおける検索精度を向上させるために設計された微調整埋め込みモデルである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 20:42:38 GMT)
Fully Automated Generation of Combinatorial Optimisation Systems Using Large Language Models [0.0] 大規模言語モデル(LLM)を用いた完全自動最適化システムの実現可能性について検討する。
LLMは、自然言語でユーザが提供する問題記述を解釈し、問題固有のソフトウェアコンポーネントを設計、実装する責任を負う。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 17:13:59 GMT)
From decay of correlations to locality and stability of the Gibbs state [0.0] 量子スピン系のギブス状態が相関の崩壊を満たすときは常に、局所摂動がギブス状態にのみ影響を及ぼすという意味で安定であることを示す。
これらの含意は任意の次元において成り立ち、ハミルトニアンの局所性のみを必要とし、リーブ・ロビンソン境界と、ギブス状態の量子信念伝播の局所性特性の詳細な解析に基づく境界に基づいている。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:12:12 GMT)
Frame-dependent coherence of a quantum state [0.0] POVMベースのコヒーレンスの定義はよく研究されている。
我々の目的は、タイトフレームの特定のケースに特有の特性を特定することである。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:56:49 GMT)
Finding the Reflection Point: Unpadding Images to Remove Data Augmentation Artifacts in Large Open Source Image Datasets for Machine Learning [0.0] 本稿では,最小平均二乗誤差手法を用いて反射境界を記述するための体系的アルゴリズムを提案する。
提案手法は,圧縮やノイズの存在下においても,真の内容とミラー付き内容との遷移を効果的に同定する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 04:54:10 GMT)
Fast and Accurate Greenberger-Horne-Zeilinger Encoding Using All-to-all Interactions [0.0] Greenberger-Horne-Zeilinger状態(GHZ)は量子技術にとって重要な資源である。
オール・ツー・オールインタラクションを用いたGHZ符号化の課題について考察する。
高精度なGHZ符号化を実現する高速プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 16:55:33 GMT)
Exploring Various Sequential Learning Methods for Deformation History Modeling [0.0] 現在のニューラルネットワーク(NN)モデルは、履歴に依存するデータポイントからパターンを学習することができる。
NNアーキテクチャが機械的負荷による変形履歴を含むデータセットでどの処理を行うのかは不明である。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:52:24 GMT)
Experimental Study on Time Series Analysis of Lower Limb Rehabilitation Exercise Data Driven by Novel Model Architecture and Large Models [0.0] 本研究では機械学習と人工知能の進歩を活用して、足関節運動機能回復術後患者の能動的リハビリテーション指導戦略を強化することを目的とする。
この研究は、AIを活用した医療リハビリテーションアプリケーションに新たな洞察を与え、リハビリテーション医療の時間的予測における最先端モデルアーキテクチャと大規模モデルの可能性を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 05:40:13 GMT)
Ethics Readiness of Technology: The case for aligning ethical approaches with technological maturity [0.0] 新興技術の倫理は期待のジレンマに直面している。
過度の投機的懸念に 早すぎるリスクを負っています
技術開発の各段階における適合性を評価するためのフレームワークは存在しない。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:38:27 GMT)
Entanglement Hamiltonians and the quasiparticle picture [0.0] エンタングルメント・ハミルトニアン(英語版)は、多体量子系におけるバイパルタイトエンタングルメントの最も包括的な特徴づけを提供する。
非平衡な状況では、解析結果はまれであり、主に連続場理論に限られる。
本研究では,非相互作用フェミオンモデルにおける量子クエンチによるEHの解析結果について述べる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 15:09:58 GMT)
Encoding quantum-like information in classical synchronizing dynamics [0.0] 古典的同期力学から量子様絡み合い状態がどのように出現するかを考察する。
我々は,多体系を同期させる特別なクラスに対して,その答えが肯定的であることを証明した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:28:25 GMT)
Effects of dissipation in reservoir computing using a spin qubit array [0.0] 貯留層コンピューティング(Reservoir Computing, RC)は、多くの物理機器の応用として最も熱い研究トピックの一つである。
1次元の量子ビットアレイからなる実験においてスピン量子ビットの状態を反映したスピン量子ビット系に基づく量子RCを提案する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 01:11:11 GMT)
Early detection of diabetes through transfer learning-based eye (vision) screening and improvement of machine learning model performance and advanced parameter setting algorithms [0.0] 糖尿病網膜症(英: Diabetic Retinopathy, DR)は、糖尿病の重篤な合併症である。
従来の糖尿病診断法では、網膜画像から視覚的特徴を抽出するために畳み込みニューラルネットワーク(CNN)を用いることが多い。
本研究では,DR検出におけるMLモデル性能向上のための伝達学習(TL)の適用について検討する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 13:30:21 GMT)
Dynamically near-stable two-mode squeezing in optomechanical system [0.0] 2モード圧縮状態は、量子情報処理とメトロジーに広く応用されたパラダイム的絡み合った状態である。
ハイブリッド3モードキャビティ光学系における2モードスクイーズ方式を提案する。
我々は、オープン量子システムフレームワーク内で生成する過程の厳密な理論的解決策を提供する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 07:57:16 GMT)
Do Large Language Models Solve the Problems of Agent-Based Modeling? A Critical Review of Generative Social Simulations [0.0] 生成型ABMはマクロレベルのパターンとマイクロレベルの相互作用をブリッジする手段を提供する。
彼らは長い間、社会科学者からの批判に直面しており、現実主義の欠如、計算の複雑さ、経験的データに対する校正と検証の難しさを指摘した。
本稿は、このアプローチが長年にわたる批判にどのように対処するかを評価するために、生成的ABM文献をレビューする。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 08:48:43 GMT)
Discovering Partially Known Ordinary Differential Equations: a Case Study on the Chemical Kinetics of Cellulose Degradation [0.0] 本研究では電力変圧器のセルロース劣化データを用いて絶縁劣化の解析を行う。
変圧器内部のミネラルオイルに浸漬したセルロースの時効問題は, 常微分方程式でモデル化される。
我々は、エケンスタムODEにおけるアレニウス方程式の未知のパラメータを発見するためにPINNを適用する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:41:24 GMT)
Detection Limits and Statistical Separability of Tree Ring Watermarks in Rectified Flow-based Text-to-Image Generation Models [0.0] ツリーリング透かしはAI生成画像の認証において重要な技術である。
SD 2.1 と FLUX.1-dev モデルによる透かしの検出と分離性の評価と比較を行った。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:24:23 GMT)
Constrained Search in Imaginary Time [0.0] 有限次元ヒルベルト空間に対して定式化され、制約に対して線型独立で可換な自己随伴作用素を使用する。
この方法は密度汎関数理論の普遍関数を求める問題に適用され、密度汎関数写像の理論的な洞察を与える。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 14:16:47 GMT)
Competition of light- and phonon-dressing in microwave-dressed Bose polarons [0.0] 本研究では, 1次元閉じ込められたボースガスに浸漬したスピン1/2不純物の定常特性について検討した。
特に、1つのスピン成分のみが浴と相互作用する外部場とコヒーレントに結合したスピン状態を考える。
この結果は、強力な相互作用を持つポーラロン系を探索するための強力なツールとして、効果的なハミルトンフレームワークを確立した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 12:45:54 GMT)
Commit-Reveal$^2$: Randomized Reveal Order Mitigates Last-Revealer Attacks in Commit-Reveal [0.0] Commit-Reveal$2$プロトコルは、2層のCommit-Revealプロセスを使用して、公開順序をランダム化し、そのような攻撃のリスクを軽減する。
提案手法のプロトタイプを実装し,実践的採用とさらなる研究を促進するために,コードを公開している。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 21:05:51 GMT)
Clinical ModernBERT: An efficient and long context encoder for biomedical text [0.0] 大規模バイオメディカル文献と医療ノートを事前学習したトランスフォーマーベースのエンコーダであるCitical ModernBERTを紹介する。
我々のモデルは、これらのイノベーションを、特にバイオメディカルおよび臨床領域に適応させます。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:14:12 GMT)
Chiral environment effects on the dynamics of a central chiral molecule [0.0] 非線型シュリンガー方程式で符号化された長範囲パリティ非保存相互作用は、キラル環境と相互作用するときに中心キラル分子の2つのエナンチオマー間のエネルギー差を生じることを示す。
また, 環境のキラル非対称性を考慮した場合, 中央分子の時間平均集団差が増幅される。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:59:55 GMT)
Characterizing quantum state-space with a single quantum measurement [0.0] 量子論は、単一の「参照」測定装置の振る舞いを研究することから導出できることを示す。
この特権的な場合、各量子状態は単一の測定結果に対する確率分布に対応する。
3 つの設計により、観測可能量のジョルダン代数の構造係数が、基準測定を特徴付ける確率から抽出できることを示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:40:55 GMT)
Bridging LMS and Generative AI: Dynamic Course Content Integration (DCCI) for Connecting LLMs to Course Content -- The Ask ME Assistant [0.0] 本研究では, Canvas LMS から学習内容とカリキュラムを動的に検索・統合する動的コースコンテンツ統合 (DCCI) 機構を LLM を利用したアシスタント Ask ME に導入する。
パイロットスタディの結果は、Ask MEのタイムリーかつ文脈的に関連する回答を、管理的およびコース関連の質問に対して提供する能力を認識した、高いユーザ満足度(4.614/5)を示している。
学生の大多数は、Ask MEとCanvas LMSのコースコンテンツの統合がプラットフォームスイッチングを減らし、ユーザビリティ、エンゲージメント、理解を改善したことに同意した。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 22:17:30 GMT)
Block Toeplitz Sparse Precision Matrix Estimation for Large-Scale Interval-Valued Time Series Forecasting [0.0] 時間間隔予測(ITS)のための特徴抽出手法を提案する。
提案手法は, 生データの不変表現を効果的に取得し, 予測性能を向上させる。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 09:57:05 GMT)
BitHEP -- The Limits of Low-Precision ML in HEP [0.0] 我々は最近提案されたBitNetアーキテクチャをHEPアプリケーションで評価した。
本稿では,クォークグルーオン判別,SMEFTパラメータ推定,検出器シミュレーションの妥当性について検討する。
我々の結果から,BitNetは分類タスクにおいて一貫して競争力を発揮するが,その回帰・生成性能はネットワークのサイズや種類によって異なることがわかった。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:57:59 GMT)
Bayesian LSTM for indoor temperature modeling [0.0] 室内温度モデリングのためのベイズ長短期記憶アーキテクチャを提案する。
実世界の100の建物を対象とした実験により、ベイズLSTMは予測精度で産業物理学に基づくモデルより優れていることが示された。
この研究は、実際の加熱MPCアプリケーションに必要な透明性と信頼性と、予測性能のバランスをとることで、データ駆動加熱制御を向上する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:07:23 GMT)
BabyLM's First Words: Word Segmentation as a Phonological Probing Task [0.0] 単語分割が音韻探索のタスクとしてどのように使われるかを示す。
本研究では,31言語にまたがる児童指向音声で学習した音素ベース言語モデルから学習した表現について検討する。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 10:42:56 GMT)
Assessing SPARQL capabilities of Large Language Models [0.0] 我々は、SPARQLで動作するLarge Language Modelsのアウトオブザボックス機能の測定に重点を置いています。
LLM-KG-Benchフレームワークにベンチマークタスクを実装し,自動実行と評価を行う。
この結果から,SPARQL SELECTクエリの処理はLLMでは依然として困難であることが示唆された。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 11:59:49 GMT)
Approximate normalizations for approximate density functionals [0.0] 密度汎関数計算が系内の電子の数に正規化されるべきであることは自明である。
本稿では、この基本原理に違反して近似エネルギーの精度を向上する例を示す。
論文参考訳(メタデータ) (Fri, 04 Apr 2025 18:06:07 GMT)