Artificial Intelligence for Science in Quantum, Atomistic, and Continuum Systems [268.6] 科学のためのAI(AI4Science)として知られる新しい研究領域
領域は、物理世界(波動関数と電子密度)、原子(分子、タンパク質、物質、相互作用)、マクロ(流体、気候、地下)まで理解することを目的としている。
主要な課題は、物理第一原理、特に対称性を深層学習法によって自然システムで捉える方法である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:05:29 GMT)
A Survey on Long Text Modeling with Transformers [106.5] 本稿では,Transformerモデルに基づく長文モデリングの最近の進歩について概説する。
長さ制限を満たすために長い入力を処理し、改良されたTransformerアーキテクチャを設計する方法について論じる。
本稿では,長文モデリングに関わる4つの典型的な応用について述べるとともに,今後の方向性を議論する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:17:21 GMT)
SceneSplat++: A Large Dataset and Comprehensive Benchmark for Language Gaussian Splatting [104.8] 3D Gaussian Splatting (3DGS) は、シーン幾何学、外観、意味論の高性能かつ効率的な符号化として機能する。
3次元空間で直接3つの手法群を体系的に評価する,最初の大規模ベンチマークを提案する。
結果は、特にシーン固有の制限を緩和する上で、一般化可能なパラダイムの明確な利点を示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:52:45 GMT)
A Stable Whitening Optimizer for Efficient Neural Network Training [101.9] アルゴリズムのシャンプー系をベースとして,3つの重要な問題を同定・緩和し,SPlus法を提案する。
まず,行列逆が長期にわたってキャッシュされる場合,素早いシャンプーは分岐しがちであることがわかった。
第二に、ネットワーク幅をまたいで学習率の伝達を可能にするために、形状認識スケーリングを適用する。
第3に,高い学習率によってパラメータノイズが大きくなり,より高速な学習をブロックする簡単な反復学習方式を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:01:14 GMT)
Socratic-MCTS: Test-Time Visual Reasoning by Asking the Right Questions [100.4] フラーミング推論は,断片化された知識間の「点の接続」をモデルが支援し,非推論モデルにおいて拡張された推論トレースを生成することを示す。
提案手法を3つのベンチマークで評価し,一貫した改善点を観察する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:51:16 GMT)
Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data [96.6] 自己指導型学習は、制御戦略を学ぶのに必要な人間のアノテーションとエンジニアリングの労力を減らす可能性がある。
我々の研究は、強化学習(RL)自体が自己監督的な問題であることを示す先行研究に基づいている。
コントラスト学習に基づく自己教師付きRLアルゴリズムは,実世界の画像に基づくロボット操作タスクを解くことができることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:54:06 GMT)
SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning [95.3] RLVR(Reinforcement Learning with Verifiable Rewards)は、複雑な推論タスクにおいて、大規模言語モデル(LLM)のトレーニングに有効であることが証明されている。
本稿では、モデル欠陥を体系的に識別し、それらを問題解決に活用する自己認識弱さ駆動型問題合成フレームワーク(SwS)を提案する。
SwSはモデルを自己識別し、RLの弱点に対処することで堅牢な一般化を可能にし、7Bモデルと32Bモデルで平均パフォーマンスが10.0%と7.7%向上した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:02:00 GMT)
MagCache: Fast Video Generation with Magnitude-Aware Cache [91.5] 我々は、様々なモデルとプロンプトで観察される統一等級法則という、新しく頑健な発見を導入する。
我々は、エラーモデリング機構と適応キャッシュ戦略を用いて、重要でないタイムステップを適応的にスキップするMagnitude-aware Cache(MagCache)を導入する。
実験の結果、MagCacheはOpen-SoraとWan 2.1でそれぞれ2.1倍と2.68倍のスピードアップを達成した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:59:02 GMT)
Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models [90.5] 我々は、前身のGTE-Qwenシリーズよりも大幅に進歩したQwen3 Embeddingシリーズを紹介する。
Qwen3 Embeddingシリーズは、組み込みタスクと再ランクタスクの両方のためのモデルサイズの範囲を提供する。
Qwen3 Embeddingシリーズは様々なベンチマークで最先端の結果が得られる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:03:06 GMT)
Consistent Paths Lead to Truth: Self-Rewarding Reinforcement Learning for LLM Reasoning [87.8] 本稿では,Large Language Model (LLM)推論を強化するための,自己回帰型強化学習フレームワークを提案する。
私たちのキーとなる洞察は、正しい応答はモデルの可能性の観点から一貫した軌道パターンを示すことが多いということです。
本稿では,安定度とボラティリティを,頑健なベクトル空間集約戦略を通じて統合する,本質的な報酬機構であるCoVoを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:40:39 GMT)
ASIDE: Architectural Separation of Instructions and Data in Language Models [87.2] ASIDEは言語モデルに対して、埋め込みのレベルで命令とデータを明確に分離することを可能にする。
本稿では,ASIDE を用いた命令調整 LLM がモデルユーティリティを損なうことなく,命令データ分離の高度化につながることを実験的に示す。
モデル表現の分析を通じて,本手法の基盤となるメカニズムについて考察する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:58:47 GMT)
ARGUS: Hallucination and Omission Evaluation in Video-LLMs [86.7] ARGUSは、無料のビデオキャプションのパフォーマンスを測定するビデオLLMベンチマークである。
ビデオLLM出力と人間の真実のキャプションを比較することで、ARGUSは2つのメトリクスを定量化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:33:53 GMT)
Scaling Laws in Linear Regression: Compute, Parameters, and Data [86.5] 無限次元線形回帰セットアップにおけるスケーリング法則の理論について検討する。
テストエラーの再現可能な部分は$Theta(-(a-1) + N-(a-1)/a)$であることを示す。
我々の理論は経験的ニューラルスケーリング法則と一致し、数値シミュレーションによって検証される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:25:56 GMT)
Step-Audio-AQAA: a Fully End-to-End Expressive Large Audio Language Model [85.7] 本稿では,AQAA(Audio-Audio Answer)タスク用に設計された完全エンドツーエンドのLALMであるStep-Audio-AQAAを紹介する。
このモデルは、言語的特徴抽出と意味的特徴抽出のためのデュアルコードブックオーディオトークンーザを統合している。
我々のポストトレーニングアプローチでは、意味的コヒーレンスを高めるために、テキストとオーディオのインターリーブドトークンアウトプットを用いる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:37:39 GMT)
PropMEND: Hypernetworks for Knowledge Propagation in LLMs [83.0] 本稿では,PropMENDという,ハイパーネットワークに基づく知識伝播手法を提案する。
インジェクションされた事実に回答が明記されていないマルチホップ質問に対して,ほぼ2倍の精度で回答を提示する。
我々はまた、ハイパーネットワークの一般化を評価するために、新しいデータセットである Controlled RippleEdit も導入した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:44:19 GMT)
NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples [79.8] 視覚自動モデル(VLM)は、人間が容易に答えられるような自然なイメージや疑問に苦戦している。
我々は,1万個の人間検証VQAサンプルを用いて,VLMを確実に評価するための新しいベンチマークであるNaturalBenchを提案する。
LLaVA-OneVision, Cambrian-1, Llama3.2-Vision, Molmo, Qwen2-VL, および GPT-4o lag の 50%-70% 遅れ(90%以上)を示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:47:04 GMT)
Enhancing Open-Domain Task-Solving Capability of LLMs via Autonomous Tool Integration from GitHub [79.3] オープンドメインのタスク解決能力を評価するためにOpenActベンチマークを導入します。
我々は,オープンドメインの進化するクエリに,GitHubから専門ツールを自律的に統合することで対処できる,新しいLLMベースのエージェントシステムであるOpenAgentを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:13:55 GMT)
Dense Retrievers Can Fail on Simple Queries: Revealing The Granularity Dilemma of Embeddings [78.1] この研究は、テキストエンコーダの観察された制限に焦点を当てている。埋め込みはセマンティクス内のきめ細かいエンティティやイベントを認識できない可能性がある。
我々は中国語で新しい評価データセットであるCapRetrievalを紹介し、その文節は画像キャプションであり、クエリは様々な形式のエンティティやイベントを問うフレーズである。
ゼロショット評価は、トレーニングソースやモデルサイズに関わらず、エンコーダがこれらのきめ細かいマッチングで失敗する可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:00:33 GMT)
PhyBlock: A Progressive Benchmark for Physical Understanding and Planning via 3D Block Assembly [77.3] 物理理解と計画について視覚言語モデル(VLM)を評価するためのプログレッシブベンチマークであるPhyBlockを紹介する。
PhyBlockは、視覚質問回答(VQA)サンプルと並行して、新しい4段階の認知階層化タスクを統合する。
我々は21の最先端のVLMをベンチマークし、物理的に基盤化されたマルチステップ計画におけるその強みと限界を強調した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:46:06 GMT)
Summarizing Speech: A Comprehensive Survey [76.1] 音声の要約は、音声・音声コンテンツの増加量を効率的に管理し、アクセスするために欠かせないツールとなっている。
本調査では,要約手法の質を評価する上で重要な,既存のデータセットと評価プロトコルについて検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:19:22 GMT)
TL;DR: Too Long, Do Re-weighting for Efficient LLM Reasoning Compression [75.8] 高度なデータアノテーションに依存しない動的比に基づくトレーニングパイプラインを提案する。
我々は、DeepSeek-R1-Distill-7BとDeepSeek-R1-Distill-14Bのモデルと、様々な難易度を持つ様々なベンチマークのモデルに対するアプローチを検証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:53:36 GMT)
Graph Prompting for Graph Learning Models: Recent Advances and Future Directions [75.8] 「事前学習・適応」スキームは、まずラベルなしグラフデータに基づくグラフ学習モデルを自己教師型で事前訓練する。
グラフプロンプトは、トレーニング可能なプロンプトを学習し、事前トレーニングされたグラフ学習モデルを変更しない、有望なアプローチとして出現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:27:19 GMT)
Exploring SSL Discrete Speech Features for Zipformer-based Contextual ASR [74.4] 自己教師付き学習(SSL)に基づく離散音声表現は、非常にコンパクトで、ドメイン適応性が高い。
本稿では、Zipformer-Transducer ASRシステムにおいて、WavLMモデルから抽出したSSL離散音声特徴を追加の発話音響コンテキスト特徴として用いた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:12:23 GMT)
Seedance 1.0: Exploring the Boundaries of Video Generation Models [71.3] Seedance 1.0は高性能で推論効率の良いビデオ基盤生成モデルである。
精度と意味のあるビデオキャプションを付加したマルチソースキュレーションデータを統合する。
Seedance 1.0は1080p解像度で5秒のビデオを生成することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:56:11 GMT)
DiscoVLA: Discrepancy Reduction in Vision, Language, and Alignment for Parameter-Efficient Video-Text Retrieval [71.2] 視覚、言語、アライメントという3つの重要な相違点がイメージレベルからビデオレベルへ移行する。
視覚・言語・アライメントにおける不一致低減(DiscoVLA)を提案し,同時に3つの相違を緩和する。
具体的には、画像レベルの特徴と映像レベルの特徴を統合するために、画像-映像特徴融合を導入し、視覚と言語の違いを効果的に対処する。
本稿では,アライメントの差を軽減するために,画像レベルのアライメント知識を活用して映像レベルのアライメントを強化する画像対ビデオアライメント蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:16:40 GMT)
A Survey of Link Prediction in N-ary Knowledge Graphs [70.5] N-ary Knowledge Graphs (NKG) は、複雑な現実世界の事実を効率的に表現するために設計された知識グラフの一種である。
NKGsのリンク予測は、これらのn-ary事実の欠落要素を予測することを目的としている。
本稿ではNKGにおけるリンク予測の包括的調査について述べる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:44:27 GMT)
Enhancing Motion Dynamics of Image-to-Video Models via Adaptive Low-Pass Guidance [70.1] アダプティブローパスガイダンス(ALG)は、よりダイナミックなビデオを生成するためのI2Vモデルサンプリング手順の簡単な修正である。
VBench-I2Vテストスイートでは、ALGはビデオ品質や画像の忠実度を大幅に低下させることなく、ダイナミック度の平均36%の改善を実現している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:23:46 GMT)
Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence [69.9] 大型視覚言語モデル(LVLM)における幻覚を駆動する内部メカニズムについて検討する。
本稿では,視覚的コンテキストに対する注目ヘッド出力の感度を定量化する指標として,視覚認識型頭部偏差(VHD)を紹介する。
視覚認識型頭部強化(VHR)は,視覚認識型頭部機能を高めることで幻覚を緩和するための訓練不要なアプローチである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:53:09 GMT)
Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO [68.4] 自己回帰画像生成は、Chain-of-Thought(CoT)推論とは異なる固有の課題を示す。
本研究は,自己回帰画像生成におけるGRPOアルゴリズムとDPOアルゴリズムの総合的研究である。
以上の結果から,GRPOとDPOは異なる優位性を示し,本質的な一般化能力を有する報酬モデルが適用されたRLアルゴリズムの一般化可能性を高める可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:46:37 GMT)
Intra-Trajectory Consistency for Reward Modeling [67.8] 軌道内整合性正則化を開発し、より高い次トーケン生成確率を持つプロセスがより一貫した報酬を維持することを強制する。
提案した正規化でトレーニングした報酬モデルにより、より優れたDPO整合ポリシーが導出され、より優れたベスト・オブ・N(BON)検証結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:59:14 GMT)
MoSiC: Optimal-Transport Motion Trajectory for Dense Self-Supervised Learning [66.5] 密集した表現を学習する動き誘導型自己学習フレームワークを提案する。
6つの画像およびビデオデータセットと4つの評価ベンチマークにおいて、最先端を1%から6%改善する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:20:32 GMT)
EIFBENCH: Extremely Complex Instruction Following Benchmark for Large Language Models [65.5] 大規模言語モデル(LLM)を評価するためのEIFBENCH(Extremely Complex Instruction following Benchmark)を提案する。
EIFBENCHにはマルチタスクシナリオが含まれており、多様なタスクタイプを同時に総合的に評価することができる。
また,LLMのマルチタスクワークフローを正確に満たす能力を高めるために,セグメントポリシー最適化(SegPO)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:39:55 GMT)
Exploring the Escalation of Source Bias in User, Data, and Recommender System Feedback Loop [65.2] 我々は,AIGC(AIGC)がレコメンダシステムの性能と力学に与える影響について検討する。
短期的には、AIGCに対する偏見はLLMベースのコンテンツ作成を促進し、AIGCコンテンツを増大させ、不公平なトラフィック分散を引き起こす。
長期コンテンツエコシステムのバランスを維持するため,L1-loss最適化に基づくデバイアス化手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:35:41 GMT)
Rethinking Range-View LiDAR Segmentation in Adverse Weather [65.2] 我々は、厳しい天候下でのLiDARセグメンテーションの一般化に影響を及ぼす固有の課題を特定し、分析する。
既存のモデルのコアアーキテクチャを変更することなく、ロバスト性を高めるモジュール式で軽量なフレームワークを提案する。
提案手法は,推定オーバーヘッドを最小限に抑え,悪天候への一般化を著しく改善する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:48:27 GMT)
From Generation to Generalization: Emergent Few-Shot Learning in Video Diffusion Models [65.0] ビデオ拡散モデル(VDM)は高品質なコンテンツを合成できる強力な生成ツールとして登場した。
我々は、VDMが自然に構造化された表現を探索し、視覚世界を暗黙的に理解することを主張する。
提案手法は,各タスクを視覚遷移に変換し,短い入力シーケンス上でLoRA重みのトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:37:10 GMT)
Segment Concealed Objects with Incomplete Supervision [63.6] 不完全なスーパービジョン・コンセサイテッド・オブジェクト(ISCOS)は、周囲の環境にシームレスにブレンドするオブジェクトを分割する。
このタスクは、不完全な注釈付きトレーニングデータによって提供される限られた監督のため、非常に難しいままである。
本稿では,これらの課題に対処するためのISCOSの統一手法について紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:25:15 GMT)
Efficient Parallel Training Methods for Spiking Neural Networks with Constant Time Complexity [63.6] スパイキングニューラルネットワーク (SNN) はしばしば、$T$スパイクのシーケンシャル処理のために、高い時間複雑性の$O(T)$に悩まされる。
本稿では,ネットワークアーキテクチャを変更することなく,SNNトレーニングを高速化するFPT法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:27:27 GMT)
GRAM: Generalization in Deep RL with a Robust Adaptation Module [62.7] 本研究では,深層強化学習における動的一般化の枠組みを提案する。
本稿では,分散環境と分散環境の両方を識別・反応する機構を提供するロバスト適応モジュールを提案する。
我々のアルゴリズムであるGRAMは,展開時の分布内および分布外シナリオにまたがる強力な一般化性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:21:29 GMT)
CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation [61.1] 本稿では,画像の文化的関連度を評価する新しい評価指標であるCAIReを紹介する。
本フレームワークは,イメージ内の実体と概念を知識ベースに基盤として,実情報を用いて各文化ラベルに対して独立した評価を行う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:16:23 GMT)
Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder [60.8] 言語関連機能的磁気共鳴画像(fMRI)は,認知機能低下と早期NCDの検出に有望なアプローチである。
香港在住の高齢者97名を対象に,この課題の有効性について検討した。
本研究は、加齢に伴う認知低下とNCDの早期発見のための自然言語関連fMRIタスクの可能性を示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:58:47 GMT)
The Efficacy of Semantics-Preserving Transformations in Self-Supervised Learning for Medical Ultrasound [60.8] 本研究は, 肺超音波の自己教師あり学習におけるデータ拡張と前処理方略の影響を系統的に検討した。
画像領域に共通して使用されるベースラインパイプライン、超音波用に設計された新しいセマンティック保存パイプライン、両方のパイプラインから最も効果的な変換の蒸留セットの3つのデータ拡張パイプラインが評価された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:25:07 GMT)
GTR-CoT: Graph Traversal as Visual Chain of Thought for Molecular Structure Recognition [60.8] GTR-Mol-VLMは、2つの重要な革新を特徴とする新しいフレームワークである。
シーケンシャルな原子結合予測を通じて分子グラフを段階的に解析することで、人間の推論をエミュレートする。
MolRec-BenchはOCSRにおけるグラフパーシング精度の詳細な評価のために設計された最初のベンチマークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:18:38 GMT)
Context-aware TFL: A Universal Context-aware Contrastive Learning Framework for Temporal Forgery Localization [60.7] 本研究では,時間的フォージェリーローカライゼーションのための共通文脈対応コントラスト学習フレームワーク (UniCaCLF) を提案する。
提案手法は教師付きコントラスト学習を利用して,異常検出による偽造瞬間の検出と同定を行う。
実物と偽物との間における特徴の識別可能性の限界をさらに押し上げるために、効率的な文脈対応コントラスト符号化を導入する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:40:43 GMT)
MELON: Provable Defense Against Indirect Prompt Injection Attacks in AI Agents [60.3] LLMエージェントは間接的プロンプトインジェクション(IPI)攻撃に対して脆弱であり、ツール検索情報に埋め込まれた悪意のあるタスクはエージェントをリダイレクトして不正なアクションを取ることができる。
マスク機能によって修正されたマスク付きユーザでエージェントの軌道を再実行することで攻撃を検知する新しいIPIディフェンスであるMELONを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:13:09 GMT)
Scalable Equilibrium Sampling with Sequential Boltzmann Generators [60.0] Boltzmannジェネレータフレームワークを2つの重要なコントリビューションで拡張する。
1つ目は、全原子カルテシアン座標で直接動作する非常に効率的なトランスフォーマーベースの正規化フローである。
特に,連続モンテカルロの連続時間変種を用いて,流れサンプルの推論時スケーリングを行う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:34:46 GMT)
Cosmos-Drive-Dreams: Scalable Synthetic Driving Data Generation with World Foundation Models [59.3] 私たちは,挑戦的なシナリオを生成することを目的とした,合成データ生成パイプラインであるCosmos-Drive-Dreamsを紹介した。
このパイプラインを駆動するCosmos-Driveは、運転ドメインのためのNVIDIA Cosmosファウンデーションモデルに特化したモデルのスイートである。
高忠実で挑戦的なシナリオで運転の量と多様性を拡大するためにコスモス・ドライブ・ドレームを応用することで、これらのモデルの有用性を実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:58:17 GMT)
AlphaFold Database Debiasing for Robust Inverse Folding [58.8] Debiasing Structure AutoEncoder (DeSAE)を導入し、故意に破損したバックボーンジオメトリからネイティブライクなコンフォーメーションを再構築することを学ぶ。
推測において、DeSAEをAFDB構造に適用すると、逆折り畳み性能を著しく向上する偏りのある構造が生成される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:25:31 GMT)
Image Demoiréing Using Dual Camera Fusion on Mobile Phones [58.4] 本稿では,超広角(UW)画像を用いて広角(W)画像のモアレ除去を支援するDual Camera fusion for Image Demoir'eing(DCID, ie)を提案する。
特に,軽量なUW画像エンコーダを既存の復号機ネットワークに統合した効率的なDCID手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:20:37 GMT)
SUTA-LM: Bridging Test-Time Adaptation and Language Model Rescoring for Robust ASR [58.3] テスト時間適応(TTA)は、推論中にモデルを調整することで緩和することを目的としている。
最近の研究は、ビーム探索再構成や生成誤り訂正といった手法を用いて、TTAと外部言語モデルの組み合わせについて検討している。
本稿では,SUTAの簡易かつ効果的な拡張であるSUTA-LMを提案する。
18種類のASRデータセットの実験により、SUTA-LMは幅広い領域で堅牢な結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:50:20 GMT)
Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [57.9] 医療知識の豊富なマルチモーダルデータセットを構築した。
次に医学専門のMLLMであるLingshuを紹介します。
Lingshuは、医療専門知識の組み込みとタスク解決能力の向上のために、マルチステージトレーニングを行っている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:38:24 GMT)
Monte Carlo Tree Diffusion for System 2 Planning [57.5] モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
本手法は,木構造化プロセスとしてデノナイジングを再認識し,部分的にデノナイジングした計画を反復的に評価し,刈り取り,精錬する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:37:56 GMT)
How Much To Guide: Revisiting Adaptive Guidance in Classifier-Free Guidance Text-to-Vision Diffusion Models [57.4] 我々は、シンプルで普遍的な適応型ガイダンス戦略であるStep AGを提案する。
評価は画像品質と画像テキストアライメントの両方に焦点をあてる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:09:48 GMT)
What Limits Virtual Agent Application? OmniBench: A Scalable Multi-Dimensional Benchmark for Essential Virtual Agent Capabilities [56.6] 我々は、制御可能な複雑性のタスクを合成するための自動パイプラインを備えたクロスプラットフォームグラフベースのベンチマークであるOmniBenchを紹介した。
OmniEvalは、サブタスクレベルの評価、グラフベースのメトリクス、および10機能にわたる包括的なテストを含む多次元評価フレームワークである。
我々のデータセットには、20のシナリオにわたる36万のグラフ構造化タスクが含まれており、人間の受け入れ率は91%に達する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:59:38 GMT)
EMMA: Efficient Visual Alignment in Multi-Modal LLMs [56.0] EMMAは、視覚的およびテキスト的エンコーディングを効率的に融合するために設計された軽量なクロスプラットフォームモジュールである。
EMMAは複数のタスクのパフォーマンスを最大9.3%向上させ、幻覚に対する堅牢性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:29:42 GMT)
Multivariate Long-term Time Series Forecasting with Fourier Neural Filter [55.1] 我々はFNFをバックボーンとして、DBDをアーキテクチャとして導入し、空間時間モデルのための優れた学習能力と最適な学習経路を提供する。
FNFは、局所時間領域とグローバル周波数領域の情報処理を単一のバックボーン内で統合し、空間的モデリングに自然に拡張することを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:40:20 GMT)
DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization [55.1] グループ相対政策最適化は大規模推論モデル(LRM)の強化学習手法である
本研究では,2次報酬設定の下でGRPOの目的を解析し,質問レベルの難易度バイアスの固有の制限を明らかにする。
差別学習の原則を基礎として, LRMの強化のための新たな差別的制約付き最適化フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:47:30 GMT)
Diversity-Guided MLP Reduction for Efficient Large Vision Transformers [54.7] トランスフォーマーモデルは優れたスケーリング特性を実現し、モデルキャパシティの増大により性能が向上する。
大規模モデルパラメータは、計算とメモリの大幅なコストにつながる。
そこで本稿では,大規模な視覚変換器のパラメータを著しく削減するDGMR法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:59:27 GMT)
Mic-hackathon 2024: Hackathon on Machine Learning for Electron and Scanning Probe Microscopy [54.2] 顕微鏡は、ナノメートルと原子スケールにおける材料構造と機能に関する情報の主要な源である。
主要な資金機関によるデータ管理計画(DMP)の導入は、保存とアクセスを促進する。
標準化されたコードエコシステム、ベンチマーク、統合戦略が欠如しているため、洞察を得るのは難しいままです。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:54:36 GMT)
A Sample Efficient Conditional Independence Test in the Presence of Discretization [54.0] 離散化されたデータに直接条件付き独立テスト(CI)は、誤った結論につながる可能性がある。
最近の進歩は、観測データをバイナライズすることで、潜伏変数間の適切なCI関係を推測することを目指している。
そこで本研究では,バイナライゼーションプロセスに依存しないサンプル効率のCIテストを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:41:26 GMT)
Meta-Adaptive Prompt Distillation for Few-Shot Visual Question Answering [53.8] 大規模マルチモーダルモデル(LMM)は、最小限の監督で新しいタスクを実行するために、コンテキスト内学習(ICL)に依存することが多い。
ICLの性能、特に小さなLMMでは、一貫性がなく、例の増加とともに常に単調に改善するとは限らない。
メタラーニング手法を提案することで,LMMの少数ショット機能を実現する方法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:34:44 GMT)
SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner [53.5] テスト駆動開発(TDD)に基づく新しいデータ合成フレームワーク**SWE-Flow*を紹介します。
人為的な問題に依存する既存のソフトウェアエンジニアリングデータとは異なり、**SWE-Flow*は、単体テストから直接インクリメンタルな開発ステップを推論する。
私たちは現実のGitHubプロジェクトから16,061のトレーニングインスタンスと2,020のテストインスタンスを生成し、**SWE-Flow-Eval**ベンチマークを作成しました。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:23:33 GMT)
Generalizable Articulated Object Reconstruction from Casually Captured RGBD Videos [53.5] 我々は,手持ちカメラで撮影したカジュアルなRGBD映像から,明瞭な物体を復元することに焦点を当てた。
スマートフォンを使って、手動で物体と対話するカジュアルな映像を簡単に取得できる。
動的RGBDビデオからオブジェクトの関節パラメータとセグメントを推定する粗大なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:41:46 GMT)
JAFAR: Jack up Any Feature at Any Resolution [53.3] JAFARは、Foundation Visionsの軽量で柔軟な機能アップサンプラーである。
これは、どんなファンデーションビジョンから任意の目標解像度まで、視覚的特徴の空間分解能を高める。
非常に高い出力スケールに非常によく一般化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:53:12 GMT)
Towards Generalized Source Tracing for Codec-Based Deepfake Speech [52.7] 本稿では,意味的特徴符号化にWhisperを,音響的特徴符号化にAudioMAEにWav2vec2を併用したSemantic-Acoustic Source Tracing Network(SASTNet)を紹介する。
提案したSASTNetは,CodecFake+データセットのCoSGテストセット上での最先端性能を実現し,信頼性の高いソーストレースの有効性を実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:26:40 GMT)
Cross-Spectral Body Recognition with Side Information Embedding: Benchmarks on LLCM and Analyzing Range-Induced Occlusions on IJB-MDF [51.4] ViT(Vision Transformers)は、顔や身体の認識を含む幅広い生体計測タスクにおいて、印象的なパフォーマンスを誇示している。
本研究では、視認性(VIS)画像に事前訓練されたVTモデルを、クロススペクトル体認識の難しい問題に適用する。
このアイデアに基づいて、我々はSide Information Embedding (SIE)を統合し、ドメインとカメラ情報のエンコーディングの影響を調べ、スペクトル間マッチングを強化する。
驚くべきことに、我々の結果は、ドメイン情報を明示的に組み込むことなく、カメラ情報のみを符号化することで、LLCMデータセット上で最先端のパフォーマンスが得られることを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:20:52 GMT)
SensorLM: Learning the Language of Wearable Sensors [51.0] 本稿では,自然言語によるウェアラブルセンサデータ理解を可能にするセンサ言語基盤モデルのファミリーであるSensorLMを紹介する。
本稿では,センサデータから統計的,構造的,意味的な情報を収集する階層的なキャプション生成パイプラインを提案する。
このアプローチにより、これまでで最大のセンサー言語データセットのキュレーションが可能となり、103,000人以上から5970万時間以上のデータを収集した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:13:09 GMT)
Learning to Lead: Incentivizing Strategic Agents in the Dark [50.9] 一般化プリンシパルエージェントモデルのオンライン学習バージョンについて検討する。
この挑戦的な設定のための最初の証明可能なサンプル効率アルゴリズムを開発した。
我々は、プリンシパルの最適ポリシーを学ぶために、ほぼ最適な $tildeO(sqrtT) $ regret bound を確立する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:25:04 GMT)
On Reasoning Strength Planning in Large Reasoning Models [50.6] 我々は, LRM が, 世代前においても, アクティベーションにおける推論強度を事前に計画している証拠を見出した。
次に、LEMがモデルのアクティベーションに埋め込まれた方向ベクトルによって、この推論強度を符号化していることを明らかにする。
我々の研究は、LEMにおける推論の内部メカニズムに関する新たな洞察を提供し、それらの推論行動を制御するための実践的なツールを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:55:13 GMT)
The Face of Populism: Examining Differences in Facial Emotional Expressions of Political Leaders Using Machine Learning [50.2] 私たちは15カ国の政治指導者の220本のYouTubeビデオのサンプルをディープラーニングで処理しています。
ポピュリスト・レトリックの度合いが異なるリーダー群間での負の感情の平均スコアの統計的に有意な差を観察した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:37:30 GMT)
How Do Multilingual Language Models Remember Facts? [50.1] これまでに同定された英語のリコール機構が多言語文脈に適用可能であることを示す。
我々は、リコール中の言語の役割をローカライズし、エンリッチメントが言語に依存しないことを発見した。
デコーダのみのLLMでは、FVは2つの異なる段階でこれらの2つの情報を構成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:04:44 GMT)
Spatial Reasoning with Denoising Models [49.8] 本稿では,連続変数の集合に対する推論を行うためのフレームワークを提案する。
初めて、その生成順序をデノナイジングネットワーク自体によって予測できる。
これらの結果から,特定の推論タスクの精度を1%から50%に向上させることができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:54:54 GMT)
Integration of Old and New Knowledge for Generalized Intent Discovery: A Consistency-driven Prototype-Prompting Framework [49.6] Generalized Intent Discovery (GID)は、未ラベルのOODデータを活用して、追加のアノテーションなしで新しいインテントを発見することで、この問題に対処する。
本稿では,古知識と新知識の統合の観点から,GIDのための一貫性駆動型プロトタイプ・プロンプトフレームワークを提案する。
提案手法は,すべてのベースライン法を著しく上回り,最先端の結果が得られている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:30:17 GMT)
ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.3] 本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:30:51 GMT)
Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval [49.2] トレーニング済みのAmharic BERTとRoBERTaのバックボーンをベースとした,Amharic固有の高密度検索モデルを提案する。
提案したRoBERTa-Base-Amharic-Embedモデル(110Mパラメータ)は,MRR@10の相対的な改善を17.6%達成する。
RoBERTa-Medium-Amharic-Embed (42M)のようなよりコンパクトな派生型は13倍以上小さいまま競争力を維持している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:33:12 GMT)
Time Series Representations for Classification Lie Hidden in Pretrained Vision Transformers [49.1] 時系列を画像に変換するフレームワークであるTime Vision Transformer (TiViT) を提案する。
我々は,標準時系列分類ベンチマークにおいて,TiViTが最先端の性能を達成することを実証的に実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:54:51 GMT)
e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs [49.0] 既存の推論モデルでは外挿がうまく行われていないことが示される。
レシピ e3 は AIME'25 と HMMT'25 のスコアに基づいて最もよく知られた 1.7B モデルを生成する。
e3-1.7Bモデルは、高いpass@1スコアを得るだけでなく、ベースモデルよりもpass@kを改善する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:52:42 GMT)
G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.9] G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。
信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:14:34 GMT)
Hateful Person or Hateful Model? Investigating the Role of Personas in Hate Speech Detection by Large Language Models [47.1] 本稿では,ヘイトスピーチ分類におけるペルソナプロンプトの役割に関する総合的研究について紹介する。
人間による注釈調査では、MBTIの寸法がラベル付け行動に大きく影響していることが確認されている。
分析の結果,人間関係の相違,対人関係の相違,対人関係の偏り,対人関係の偏りなどが明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:02:55 GMT)
A Self-Refining Framework for Enhancing ASR Using TTS-Synthesized Data [46.7] 本稿では,ラベルのないデータセットのみを用いて,ASR性能を向上させる自己精錬フレームワークを提案する。
台湾語マンダリン音声における枠組みの有効性を実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:30:32 GMT)
AMELI: Enhancing Multimodal Entity Linking with Fine-Grained Attributes [46.7] 属性対応マルチモーダルエンティティリンクを提案する。
入力は、テキスト段落と画像で記述された言及からなる。
目標は、マルチモーダルな知識ベースから対応する対象エンティティを予測することである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:03:39 GMT)
Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction [46.3] テスト時間スケーリングの未解決次元であるテスト時間インタラクションのスケールアップを提案する。
まず,Webベンチマークのタスク成功を非自明に向上させることが,対話スケーリングの促進にも有効であることを示す。
我々は,TTI(Test-Time Interaction)というカリキュラムベースのオンライン強化学習手法を導入し,エージェントのロールアウト長を適応的に調整することでエージェントを訓練する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:50:18 GMT)
Simulation-based Inference for High-dimensional Data using Surjective Sequential Neural Likelihood Estimation [46.0] 我々はSBI(Surjective Sequential Neural Likelihood Estimation)という,シミュレーションベース推論(SBI)手法のファミリーにおける新しいメンバーを提案する。
SSNL は次元共振型正規化フローモデルに適合し、マルコフ連鎖モンテカルロあるいは変分ベイズ法による計算推論を可能にする代理可能性関数として利用する。
SSNLは、天体物理学と神経科学の文献から得られた2つの挑戦的な実例を含む、多種多様な実験で評価し、その成果が、最先端の手法に匹敵するか、同等であることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:13:17 GMT)
Ambient Diffusion Omni: Training Good Models with Bad Data [45.8] 拡散モデルの品質向上のために,低品質,合成,分布外画像の使い方を示す。
我々は、利用可能なすべての画像から信号を取り出すことができる拡散モデルを訓練するための原則的なフレームワークであるAmbient Omniを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:37:39 GMT)
Why Masking Diffusion Works: Condition on the Jump Schedule for Improved Discrete Diffusion [45.7] マルコフ過程は不連続なジャンプによって一定の速度で進化する。
他の離散拡散モデルとは異なり、マスク拡散はジャンプ時間の既知の分布に構築され、どこにジャンプするかしか学ばない。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:58:25 GMT)
Learning to Reason Across Parallel Samples for LLM Reasoning [45.6] テスト時間計算のスケールアップは、大規模な言語モデルに大幅なパフォーマンス向上をもたらす。
このような複数のサンプルセットを活用する新しい方法を提案する。
我々は、複数のサンプルのシーケンスを取り、最終的な答えを出力するコンパクトなLLMを訓練する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:42:35 GMT)
Beyond Calibration: Physically Informed Learning for Raw-to-Raw Mapping [45.4] 既存のraw-to-raw変換手法では、照明変更への適応性の低下、高い計算コスト、同時カメラ操作やオーバーラップ・オブ・ビューといった非現実的な要件といった制限に直面している。
我々は,デバイス間の変換を推定するために,特定の照明下での生画像のシミュレートを行う軽量で物理的にインフォームドされたアプローチであるニューラル・フィジカル・モデル(NPM)を導入する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:02:00 GMT)
Effective Data Augmentation With Diffusion Models [45.2] 我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:01:59 GMT)
Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly [45.0] 本稿では,3次元生成AIと離散ロボットアセンブリを用いて,音声を物理オブジェクトに変換するシステムを提案する。
このシステムは、3Dモデリングやロボットプログラミングの専門知識のない個人にとって、デザインと製造をより容易にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:59:31 GMT)
From Model Design to Organizational Design: Complexity Redistribution and Trade-Offs in Generative AI [45.0] 我々は、AIを入力コストの単純な削減と見なすことは、2つの重要なダイナミクスを見落としていると論じる。
したがって、GASのトレードオフは消滅せず、ユーザから組織に移管される。
この研究は、スケーラブルな認知がいかに複雑さを移動させるかを明らかにすることで、AI戦略を前進させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:22:09 GMT)
FROST-EMA: Finnish and Russian Oral Speech Dataset of Electromagnetic Articulography Measurements with L1, L2 and Imitated L2 Accents [44.9] FROST-EMA (Finnish and Russian Oral Speech dataset of Electromagnetic Articulography) コーパスを導入する。
18人のバイリンガル話者からなり、母国語(L1)、第二言語(L2)、模倣されたL2(偽外国語のアクセント)を生産した。
この新しいコーパスは、音声学的および技術的観点からの言語多様性の研究を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:52:11 GMT)
Self-Anchored Attention Model for Sample-Efficient Classification of Prosocial Text Chat [44.5] 本研究は,ゲーム内チャットにおけるソーシャル行動の発見と分類にNLP技術を適用した新しい研究である。
これは、モデレーションの焦点を単に毒性を罰することから、オンラインプラットフォームにおける積極的なポジティブな相互作用へとシフトさせるのに役立つ。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:40:54 GMT)
VersaVid-R1: A Versatile Video Understanding and Reasoning Model from Question Answering to Captioning Tasks [44.3] 本稿では,モデルの高度な映像理解と推論能力を高めるために設計された2つの新しいデータセットを紹介する。
我々は、Reason-Then-Respondパラダイムの下で、最初の多目的ビデオ理解および推論モデルであるVersaVid-R1を開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:57:53 GMT)
Learnable Spatial-Temporal Positional Encoding for Link Prediction [44.1] L-STEP という単純な時間リンク予測モデルを提案する。
nameは最新の大規模TGBベンチマークで主要なパフォーマンスを得る。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:35:53 GMT)
Re-Thinking the Automatic Evaluation of Image-Text Alignment in Text-to-Image Models [44.1] テキスト・ツー・イメージのモデルは、しばしばテキストのプロンプトと正確に一致する画像を生成するのに苦労する。
既存の評価は主に人間の評価との一致に焦点を当てている。
画像テキストアライメント評価を改善するための推奨事項を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:11:36 GMT)
Activation Approximations Can Incur Safety Vulnerabilities Even in Aligned LLMs: Comprehensive Analysis and Defense [44.0] 大規模言語モデル(LLM)は、様々な領域にまたがって顕著な機能を示した。
実用性への影響を最小限に抑えながら、アクティベーション近似の安全性は依然として不明である。
本研究では,アクティベーション近似によって生じる安全性の妥協を緩和する新しい安全性向上手法であるQuadAを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:24:15 GMT)
RS-MTDF: Multi-Teacher Distillation and Fusion for Remote Sensing Semi-Supervised Semantic Segmentation [44.0] 本稿では,リモートセンシングにおける半教師付き学習を指導する新しいフレームワークであるRS-MTDF(Multi-Teacher Distillation and Fusion)を紹介する。
RS-MTDFは、複数の凍結したビジョン・ファンデーション・モデル(VFM)を専門教師として採用し、特徴レベルの蒸留を利用して生徒の特徴を堅牢な表現と整合させる。
提案手法は,LoveDAにおけるラベル比率の異なる既存手法よりも優れており,セマンティックカテゴリの大部分においてIoUが最も高い。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:15:15 GMT)
Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models [44.0] 大規模言語モデル(LLM)のための自己信頼による強化学習(RLSC)を提案する。
RLSCはモデル自身の自信を報奨信号として使用し、ラベル、選好モデル、報酬工学の必要性を排除している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:10:58 GMT)
Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs [43.9] VLM(Vision-Language Model)は、視覚的な入力に関する質問に答える能力を示すが、テキスト上で類似のタスクを実行する際の精度は高い。
異なるモードのテキスト回路を同定し,比較することにより,この精度ギャップについて検討する。
これを解決するために、後層の視覚データトークンの表現を以前のレイヤに戻します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:59:21 GMT)
NeurIPS 2024 ML4CFD Competition: Results and Retrospective Analysis [43.8] 2次元翼上での空力シミュレーションのための代理モデルを中心にML4CFDコンペティションを組織した。
このコンペティションには240以上のチームが参加し、OpenFOAM経由で生成されたデータセットが提供された。
この振り返り分析は、競争の結果をレビューし、ベースラインを上回るいくつかのアプローチを強調します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:34:43 GMT)
Stepsize anything: A unified learning rate schedule for budgeted-iteration training [43.5] 予算設定訓練は、所定の予算内で最適な学習を実現することを目的としている。
学習率のスケジュールは異なるネットワークやタスクのパフォーマンスを左右するが、その設計は理論的な基礎をほとんど欠いている。
本稿では,Unified Budget-Aware (UBA) スケジュールを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:59:13 GMT)
Mutual-Taught for Co-adapting Policy and Reward Models [43.1] 政策モデルと報酬モデルの両方を反復的に改善する自己学習手法であるMutual-Taughtを提案する。
実験の結果、この反復的なアプローチは両方のモデルに一貫した改善をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:32:39 GMT)
Robust Evolutionary Multi-Objective Network Architecture Search for Reinforcement Learning (EMNAS-RL) [43.1] 本稿では,自律運転のための大規模強化学習(AD)において,ニューラルネットワークアーキテクチャを最適化するための進化的多目的ネットワークアーキテクチャ探索(EMNAS)を初めて導入する。
EMNASは遺伝的アルゴリズムを用いてネットワーク設計を自動化し、報酬を高めるように調整し、性能を損なうことなくモデルサイズを減らす。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:52:35 GMT)
How Malicious AI Swarms Can Threaten Democracy [42.6] 悪意のあるAIスワムは秘密裏に調整し、コミュニティに侵入し、従来の検出器を避け、連続したA/Bテストを実行することができる。
その結果は、造草された草の根の合意、断片化された共有現実、大量ハラスメント、投票者によるマイクロプレッシャーや動員などが含まれる。
常にオンになっているSwarm検出ダッシュボード、選択前の高忠実なSwarmシミュレーションストレステスト、透明性監査、オプションのクライアントサイド"AIシールド"である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:42:37 GMT)
Multimodal Pragmatic Jailbreak on Text-to-image Models [42.5] この研究は、新しいタイプのjailbreakを導入し、T2Iモデルをトリガーして、ビジュアルテキストで画像を生成する。
我々は、2つのクローズドソース商用モデルを含む9つの代表的なT2Iモデルをベンチマークする。
我々の研究は、よりセキュアで信頼性の高いT2Iモデルに向けたさらなる開発基盤を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:36:10 GMT)
VIST-GPT: Ushering in the Era of Visual Storytelling with LLMs? [42.4] 本稿では,視覚的ストーリーテリングタスクにおけるマルチモーダルモデルの最近の進歩を活用する新しいアプローチを提案する。
我々は,視覚的接地,コヒーレンス,非冗長性に着目し,視覚的ストーリーテリングを評価するための新しい基準フリーメトリクスであるRoViSTとGROOVISTを利用する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:19:13 GMT)
Optuna vs Code Llama: Are LLMs a New Paradigm for Hyperparameter Tuning? [42.4] 大規模言語モデル(LLM)は、LoRAを使用してパラメータ効率の良いCode Llamaを微調整するために使用される。
提案手法は,演算オーバーヘッドを著しく低減しつつ,ルート平均角誤差(RMSE)の点で競争力や優位性を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:43:53 GMT)
Unification of Exceptional Points and Transmission Peak Degeneracies in a Highly Tunable Magnon-Photon Dimer [41.9] この研究は、すべての関連するパラメータにわたってほぼユニバーサルなチューニング性を持つマイクロ波マグノンフォトトン二量体を提示する。
2次元のEPとPDの構成を一般的な理論と実験の枠組みにまとめることができることを示す。
我々のフォーマリズムと実験的手法は、以前のEPとPDの構成を統一し、堅牢なPD強化センサーの実現につながる可能性がある。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:01:01 GMT)
The BS-meter: A ChatGPT-Trained Instrument to Detect Sloppy Language-Games [41.9] シュロッピーブルッシャーの統計モデルは,フランクフルト人造ブルッシャーのChatGPTと,自然言語に見られるようなブルッシャーの政治的・職場的機能とを確実に関連付けることができることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:11:59 GMT)
Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning [41.9] メモリは、エージェントが時間的および空間的依存関係を持つ複雑なタスクに対処できるようにするために不可欠である。
多くの強化学習アルゴリズムにはメモリが組み込まれているが、エージェントのメモリ能力を評価するための普遍的なベンチマークがない。
メモリRLの総合ベンチマークであるMIKASAを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:57:57 GMT)
TextAtari: 100K Frames Game Playing with Language Agents [41.8] 最大10万ステップに及ぶ長期意思決定タスクにおいて,言語エージェントを評価するためのベンチマークであるTextAtariを提示する。
Atariのゲームをリッチなテキスト記述に翻訳することによって、TextAtariは、自然言語処理でシーケンシャルな意思決定を橋渡しする挑戦的なテストベッドを作る。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:14:14 GMT)
Hyperbolic Dual Feature Augmentation for Open-Environment [41.2] 本稿では,双曲型空間における双曲型特徴量拡張手法を提案し,双曲型特徴量拡張手法を提案する。
本手法は,オープン環境における双曲型アルゴリズムの性能を効果的に向上させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:34:09 GMT)
The impact of fine tuning in LLaMA on hallucinations for named entity extraction in legal documentation [41.0] 法律文書から交通事故に関する情報を抽出することは、保険会社のコストの定量化に不可欠である。
まず、最も関連するセグメントを識別した文書をセグメント化し、それからエンティティを抽出する2段階の手順が提案されている。
テキストセグメンテーションでは、正規表現に基づく古典的な方法と、文書をn-トークンのブロックに分割する第二のアプローチの2つの手法が比較される。
大規模言語モデル(LLaMA-2 7b, 70b, LLaMA-3 8b, GPT-4 Turbo)を適用し、選択したセグメントに対してエンティティ抽出を行う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:17:12 GMT)
PHRASED: Phrase Dictionary Biasing for Speech Translation [41.0] 本稿では,ソース言語から対象言語への一対のフレーズマッピングを利用するフレーズ辞書バイアス法を提案する。
本稿では,このフレーズ辞書バイアス法を,トランスデューサに基づく音声翻訳モデルとマルチモーダル大言語モデルという,広く採用されている2種類のモデルに適用する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:42:38 GMT)
UFM: A Simple Path towards Unified Dense Correspondence with Flow [41.0] Unified Flow & Matching Model (UFM) は、ソース画像とターゲット画像の両方で同一視できるピクセルの統一データに基づいて訓練される。
UFMは最先端の流れ法よりも28%精度が高い。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:32:13 GMT)
Effective Data Pruning through Score Extrapolation [40.6] 少数のデータのみをトレーニングする必要のある,新たな重要スコア外挿フレームワークを導入する。
このフレームワークでは,この最小限のサブセットから学習したパターンを用いて,データセット全体のサンプル重要度を正確に予測する2つの初期アプローチを提案する。
以上の結果から,スコアの補間は,プルーニングやデータ属性,その他のタスクなど,高価なスコア計算手法をスケールする上で有望な方向であることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:38:49 GMT)
Chip Placement with Diffusion Models [40.5] 我々は、強化学習の代わりにガイドサンプリングを用いて、新しい回路をゼロショットで配置できる拡散モデルを訓練する。
我々は、データセット生成アルゴリズムの設計決定を経験的に研究し、一般化を可能にするいくつかの重要な要因を同定する。
提案モデルでは,非表示でリアルな回路上に高品質な配置を生成し,最先端の手法と比較して,配置ベンチマーク上での競合性能を実現している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:44:55 GMT)
Learning to Hear Broken Motors: Signature-Guided Data Augmentation for Induction-Motor Diagnostics [40.0] 3相エンジンのインテリジェント診断における機械学習(ML)アルゴリズムの適用は、診断性能と精度を大幅に向上させる可能性がある。
本稿では,エンジン物理モデルを考慮した教師なし異常発生手法を提案する。
SGDA(Signature-Guided Data Augmentation)は、健康な電流信号の周波数領域において、物理的に可塑性な断層を直接合成する、教師なしのフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:36:16 GMT)
Mixture of Decoding: An Attention-Inspired Adaptive Decoding Strategy to Mitigate Hallucinations in Large Vision-Language Models [39.9] 混合復号法 (Mixture of Decoding, MoD) は幻覚緩和のための新しいアプローチである。
画像トークンに対するモデルの注意の正しさを評価することによって、デコード戦略に適応する。
MoDは、複数の主要なベンチマークで既存のデコード手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:05:02 GMT)
Orientation Matters: Making 3D Generative Models Orientation-Aligned [39.9] 既存の3D生成モデルは、一貫性のないトレーニングデータのために、しばしば不整合結果を生成する。
本稿では,カテゴリ毎に一貫した配向を持つ3次元オブジェクトを生成する3次元オブジェクト生成タスクについて紹介する。
多視点拡散に基づく2つの代表的3次元生成モデルと3次元変分オートエンコーダフレームワークを微調整し、直感的に整列したオブジェクトを生成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:54:37 GMT)
StochasTok: Improving Fine-Grained Subword Understanding in LLMs [39.9] サブワードレベルの理解は、多桁数字の理解、綴りミス、略語、韻律、言葉遊びなど、多くのタスクに不可欠である。
現在の大きな言語モデル(LLM)は、一見単純なサブワードレベルのタスクに苦しむことが多い。
我々はStochasTokを紹介した。StochasTokは、トレーニング中にトークンをランダムに分割し、LCMが"内部構造を見る"ことを可能にする、シンプルで効率的なトークン化スキームである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:05:23 GMT)
$(RSA)^2$: A Rhetorical-Strategy-Aware Rational Speech Act Framework for Figurative Language Understanding [39.7] 具体的言語(例えば、皮肉、ハイパボラ、控えめさ)は、人間のコミュニケーションにおいてユビキタスである。
本稿では、話者の活用した修辞戦略を考慮して、図形言語の使用をモデル化するRhetorical-Strategy-Aware RSA $(RSA)2$フレームワークを紹介する。
我々は,話者が非リテラルであるという動機をモデル化することなく,非リテラル発話の人間互換な解釈を可能にすることを,(RSA)2$で示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:35:57 GMT)
ICONS: Influence Consensus for Vision-Language Data Selection [39.5] 命令による視覚言語モデルの訓練は、多種多様なタスクとドメインにまたがる大量のデータに依存していることが多い。
既存のメソッドは通常、データの重要性を推定したり、単独でタスクを最適化することに集中するためにタスクに依存します。
我々は、視覚言語データ選択のための勾配に基づくインフルエンス・コンセンサス・アプローチであるICONSを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:19:52 GMT)
Does Multimodal Large Language Model Truly Unlearn? Stealthy MLLM Unlearning Attack [39.3] 大規模なデータに基づいてトレーニングされたマルチモーダル大規模言語モデル(MLLM)は、機密性の高い個人情報や写真を記憶し、深刻なプライバシーリスクを生じさせる可能性がある。
MLLMアンラーニング手法を提案する。
未学習LLMの未学習知識を回復することを目的としたLLMアンラーニング攻撃の新たな問題について検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:52:03 GMT)
Training-Free Guidance Beyond Differentiability: Scalable Path Steering with Tree Search in Diffusion and Flow Models [39.1] TreeG: Tree Search-Based Path Steering Guidanceを提案する。
TreeGは、各ステップで候補を提案し、評価し、選択することで、トレーニング不要のガイダンスのための統一されたフレームワークを提供する。
実験の結果,TreeGはシンボリック・ミュージック・ジェネレーション,小分子設計,エンハンサーDNA設計において,トップ・ガイダンス・ベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:06:22 GMT)
DiffLM: Controllable Synthetic Data Generation via Diffusion Language Models [38.6] 可変オートエンコーダ(VAE)に基づく制御可能なデータ合成フレームワークDiffLMを紹介する。
DiffLMは高品質なデータを生成し、ダウンストリームタスクのパフォーマンスが実際のデータよりも2%~7%向上していることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:50:15 GMT)
AsFT: Anchoring Safety During LLM Fine-Tuning Within Narrow Safety Basin [38.6] 大規模言語モデル(LLM)は、微調整中に安全性のリスクに対して脆弱である。
AsFT(Anchoring Safety in Fine-Tuning)と呼ばれる安全微調整手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:59:48 GMT)
Dataset Properties Shape the Success of Neuroimaging-Based Patient Stratification: A Benchmarking Analysis Across Clustering Algorithms [38.3] 人工脳形態計測コホートを用いて, HYDRA, SuStaIn, SmileGAN, SurrealGANの4つの広く用いられている層状化アルゴリズムについて検討した。
122の合成シナリオにおいて、データの複雑さは、成層化の成功を予測するアルゴリズムの選択を常に上回った。
十分に分離されたクラスターは全ての手法で高い精度を示し、重なり合い、不等サイズ、微妙な効果により精度は最大50%低下した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:00:59 GMT)
Product of Experts for Visual Generation [38.2] 異種モデルから推論時知識合成を行うPoE(Product of Experts)フレームワークを提案する。
本フレームワークは画像と映像の合成作業において実用的な利点を示し,モノリシックな手法よりも制御性が高いことを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:21:14 GMT)
DIME:Diffusion-Based Maximum Entropy Reinforcement Learning [38.2] 拡散に基づく最大エントロピーRL(DIME)
emphDIMEは拡散モデルによる近似推論の最近の進歩を活用し、最大エントロピー目標の下位境界を導出する。
提案手法は,MaxEnt-RLの原理的探索利益を維持しつつ,表現的拡散に基づくポリシの利用を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:50:48 GMT)
Enhancing generalizability of model discovery across parameter space with multi-experiment equation learning (ME-EQL) [37.7] 1-at-a-time ME-EQL(OAT ME-EQL)は、各パラメータセットの個々のモデルを学び、それらを接続し、組み込み構造ME-EQL(ES ME-EQL)である。
本手法は,生死平均場モデルと,生死モデルと空間構造を用いた移動モデルを用いて実証する。
この結果から,OAT ME-EQLはパラメータ空間の一般化性を向上させるとともに,エージェントベースシミュレーションからパラメータを復元する際の相対誤差を著しく低減することがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:42:58 GMT)
FaithfulRAG: Fact-Level Conflict Modeling for Context-Faithful Retrieval-Augmented Generation [37.3] 検索システムで強化された大規模言語モデル(LLM)は、知識集約的なタスクを扱う上で大きな可能性を示している。
本稿では,モデルパラメトリック知識と検索コンテキストの相違を明示的にモデル化することにより,知識の対立を解決する新しいフレームワークであるFaithfulRAGを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:02:54 GMT)
LLaSE-G1: Incentivizing Generalization Capability for LLaMA-based Speech Enhancement [36.9] LLaMAに基づく言語モデルであるLLaSE-G1を導入する。
音響的不整合を軽減するため、LLaSE-G1は入力としてWavLMからの連続表現を使用し、X-Codec2からの音声トークンを予測し、音響保存を最大化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:55:05 GMT)
FUSE: Measure-Theoretic Compact Fuzzy Set Representation for Taxonomy Expansion [36.7] 本稿では,その体積近似をファジィ集合として用いた集合表現学習の健全かつ効率的な定式化を提案する。
結果として生じる埋め込みフレームワークであるFuzzy Set Embedding (FUSE)は、すべての集合演算を満足し、基礎となるファジィ集合をコンパクトに近似する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:28:32 GMT)
DRAGged into Conflicts: Detecting and Addressing Conflicting Sources in Search-Augmented LLMs [36.5] Retrieval Augmented Generation (RAG) は、大規模言語モデルを拡張するための一般的なアプローチである。
本稿では,RAGにおける知識衝突型の新しい分類法を提案する。
次に、現実的なRAG設定で競合タイプの専門家アノテーションを備えた高品質なベンチマークであるCONFLICTSを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:52:57 GMT)
Low-crosstalk optical addressing system for atomic qubits based on multiple objectives and acousto-optic deflectors [36.4] 個人アドレッシング(IA)法は、短期量子デバイスでプログラム可能なゲートを実装する上で重要である。
複数の光学的目的と軸方向偏向器(AOD)を対称配置した低クロストーク光アドレッシングシステムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:26:56 GMT)
CENTAUR: Bridging the Impossible Trinity of Privacy, Efficiency, and Performance in Privacy-Preserving Transformer Inference [36.2] 既存のプライバシ保存トランスフォーマー推論フレームワークは、プライバシ、効率、パフォーマンスのバランスをとる"不可能"に直面しています。
我々は,SMPCとランダムな置換をシームレスに統合する画期的なフレームワークであるCENTAURを紹介する。
実験では、CENTAURが様々なデータ再構成攻撃に抵抗し、平文レベルの推論精度を達成し、推論速度を5.0~30.4倍に向上する能力を示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:20:09 GMT)
RadioDUN: A Physics-Inspired Deep Unfolding Network for Radio Map Estimation [35.9] 限られた数のサンプルを実用的なシナリオで測定できるため、密度の高い無線マップを構築するのは難しい。
既存の研究は、深層学習を用いてスパースサンプルから密集した無線マップを推定しているが、無線マップの物理的特性と統合することは困難である。
適応的パラメータ調整と事前適合性を学習可能な方法で実現し,最適化プロセスの展開を目的としたRadio Deep Unfolding Network(RadioDUN)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:46:20 GMT)
Mem2Ego: Empowering Vision-Language Models with Global-to-Ego Memory for Long-Horizon Embodied Navigation [35.7] 本稿では,視覚言語モデル(VLM)に基づくナビゲーションフレームワークを提案する。
提案手法は,長期タスクにおける空間的推論と意思決定を促進する。
実験の結果,提案手法は従来のオブジェクトナビゲーションタスクの手法を超越していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:36:52 GMT)
FinHEAR: Human Expertise and Adaptive Risk-Aware Temporal Reasoning for Financial Decision-Making [35.6] FinHEARは、人間の専門知識と適応的リスク認識推論のためのフレームワークである。
専門のエージェントを編成し、過去の傾向を分析し、現在の出来事を解釈し、専門家にインフォームドされた前例を検索する。
金融データセットの実証的な結果から、FinHEARはトレンド予測やトレーディングタスクにおいて、一貫して強いベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:06:51 GMT)
SeerAttention-R: Sparse Attention Adaptation for Long Reasoning [35.3] SeerAttention-Rは、推論モデルの長い復号化に特化して設計されたスパースアテンションフレームワークである。
自動回帰デコードに対応するためにクエリプーリングを取り除きながら、自己蒸留ゲーティング機構を通じて、注意の間隔を学習する設計を維持している。
我々は、わずか0.4BトークンでトレーニングされたSeerAttention-Rが、AIMEベンチマークで4Kトークン予算でほぼ無作為な推論精度を維持することを実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:17:26 GMT)
FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency [34.8] 本稿では,ロボット操作における時間情報を活用するFreqPolicyを提案する。
FreqPolicyは最初、フローベースのビジュモータポリシーに周波数一貫性の制約を課す。
推論周波数93.5Hzの実世界のロボットシナリオにおいて,効率と有効性を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:12:53 GMT)
P-React: Synthesizing Topic-Adaptive Reactions of Personality Traits via Mixture of Specialized LoRA Experts [34.4] 我々は、専門家(MoE)をベースとしたパーソナライズされた大規模言語モデルであるP-Reactを提案する。
特に、パーソナリティ・ロス(PSL)を統合して、個々の特徴表現をよりよく捉えます。
この分野での研究を容易にするため、高品質で人間認証されたデータセットであるOCEAN-Chatをキュレートする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:02:00 GMT)
Sharper Convergence Rates for Nonconvex Optimisation via Reduction Mappings [34.3] 目的の曲率特性をよく設計した縮小写像が向上し, より条件のよい問題や, 理論上は勾配に基づく手法の収束性が向上することを示した。
本分析は,最適化アルゴリズムで観測された経験的利得の原理的説明として,最適な構造情報を活用して収束を加速するシナリオを統一する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:03:59 GMT)
Optimization over Sparse Support-Preserving Sets: Two-Step Projection with Global Optimality Guarantees [34.2] 我々は新しい変種を提示する。
スパース付き反復ハードテクスティングアルゴリズム。
プロジェクションオペレータは 混ざった制約のためにカスタマイズされた
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:27:01 GMT)
Regularized Langevin Dynamics for Combinatorial Optimization [33.9] 正規化ランゲヴィンダイナミクス(英: Regularized Langevin Dynamics、RLD)は、効率的な勾配誘導型生成パラダイムである。
RLDはサンプリングされた溶液と現在の溶液の間に期待される距離を強制し、局所的なミニマを効果的に避ける。
シミュレーションアニーリング(SA)とニューラルネットワーク(NN)に基づく2つのCOソルバを開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:54:16 GMT)
Diffusion Models for Safety Validation of Autonomous Driving Systems [33.8] 我々は、初期交通状況が考慮された自動運転車の潜在的な故障事例を生成するために、デノナイズ拡散モデルを訓練する。
我々のモデルは、外部トレーニングデータセットを一切必要とせず、控えめなコンピューティングリソースでトレーニングや推論を行うことができ、テスト中のシステムの事前の知識を前提としない。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:31:33 GMT)
CodeBrain: Bridging Decoupled Tokenizer and Multi-Scale Architecture for EEG Foundation Model [33.6] EEGファンデーションモデルは、マルチスケールの脳依存を捉える上で、限られた異種表現能力と非効率性に苦しむ。
我々は,脳組織に適応した効率的なEMFであるCodeBrainを2段階の訓練で提案する。
EEGSSMは、構造化されたグローバルな畳み込みアーキテクチャとスライディングウィンドウアテンション機構を組み合わせて、スパースな長距離および局所的な依存関係を共同でモデル化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:20:39 GMT)
AbstentionBench: Reasoning LLMs Fail on Unanswerable Questions [32.9] AbstentionBenchは、20の多様なデータセットにわたる禁忌を評価するためのベンチマークである。
微調整による推論は、数学や科学の分野でも無視される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:57:30 GMT)
From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models [32.8] 我々は,ゼロショットの新たな目標への一般化を促進する抽象的記号的世界モデル学習に注力する。
そのようなモデルの重要な構成要素は、オブジェクトの性質とオブジェクト間の関係を定義する記号述語(英語版)の集合である。
我々はシミュレーションと実世界の両方で実験を経験的に実証し、本手法が積極的に一般化できることを実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:08:29 GMT)
Protein folding with an all-to-all trapped-ion quantum computer [32.7] バイアス場デジタル化された反断熱量子最適化(BF-DCQO)アルゴリズムは、IonQの完全に接続されたイオン量子プロセッサ上に実装されている。
現在報告されているタンパク質折り畳み問題の量子ハードウェア実装としては,最大12アミノ酸の四面体格子上でのタンパク質折り畳みが最大である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:46:38 GMT)
DualEquiNet: A Dual-Space Hierarchical Equivariant Network for Large Biomolecules [32.3] このネットワークはユークリッド空間と球面高調波空間の相補表現を構築し、局所幾何学と大域対称性を考慮した特徴を捉える。
DualEquiNetはRNA特性予測とタンパク質モデリングのための複数の既存のベンチマークで最先端のパフォーマンスを達成し、新しく導入された2つの3D構造ベンチマークで先行手法より優れている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:43:50 GMT)
Auto-Regressive vs Flow-Matching: a Comparative Study of Modeling Paradigms for Text-to-Music Generation [32.1] 最先端システム(SOTA)は、トレーニングデータセット、モデリングパラダイム、アーキテクチャ選択など、多くの領域で大きく異なる。
本研究はモデリングパラダイムにのみ焦点をあてる。
自動回帰デコーディングと条件付きフローマッチングという,最も一般的な2つのモデリングパラダイムを比較した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:37:45 GMT)
AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation [31.9] アナジェント(AnnaAgent)は、第三次記憶を備えた感情的・認知的動的エージェントシステムである。
本稿では,AnnaAgentが,既存のベースラインよりも心理学的カウンセリングにおいて,より現実的な探索シミュレーションを実現していることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:35:02 GMT)
Archon: An Architecture Search Framework for Inference-Time Techniques [31.7] Archonは推論時テクニックと大規模言語モデルの選択と組み合わせのためのフレームワークである。
計算予算が与えられたArchonは、ターゲットベンチマークに適した最適化された設定を見つけるために、大規模な設計スペースを探索する。
本稿では,OpenAIのo1, GPT-4o, Claude 3.5 Sonnetなどのフロンティアモデルよりも平均15.1%優れた設計システムに,新たな推論計算予算を利用できることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:52:15 GMT)
Adapting to Heterophilic Graph Data with Structure-Guided Neighbor Discovery [31.4] グラフニューラルネットワーク(GNN)は、接続ノードが異種ラベルを持つ場合、異種データとしばしば競合する。
我々は、類似した構造特性を持つノードをリンクすることで、代替グラフ構造を作成することを提案する。
本稿では,新たに作成された構造グラフとともに元のグラフを処理するアーキテクチャであるStructure-Guided GNN(SG-GNN)を紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:03:23 GMT)
Fighting Fire with Fire (F3): A Training-free and Efficient Visual Adversarial Example Purification Method in LVLMs [31.3] 視覚言語モデル(LVLM)は、視覚的敵攻撃に対して脆弱である。
F3は反直感的な「火と戦う火」戦略を駆使した、新たな敵の浄化フレームワークである。
F3はトレーニングフリーで実装が簡単で、計算効率が大幅に向上している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:44:10 GMT)
AstroCompress: A benchmark dataset for multi-purpose compression of astronomical data [31.3] 本稿では、天体物理学データに対するニューラル圧縮問題であるAstroCompressを紹介する。
我々はデータに容易にアクセスでき、7つのロスレス圧縮手法をベンチマークするコードを提供します。
以上の結果から,ロスレスニューラルネットワーク技術は観測所におけるデータ収集を向上する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:32:30 GMT)
Curse of High Dimensionality Issue in Transformer for Long-context Modeling [31.3] 注意計算において重要でないトークンを集約することにより冗長性を低減するために,textitDynamic Group Attention (DGA)を提案する。
その結果,DGAは競争性能を維持しながら計算コストを大幅に削減できることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:14:16 GMT)
Cross-Frame Representation Alignment for Fine-Tuning Video Diffusion Models [31.1] ビデオ拡散モデル(VDM)は、トレーニングデータの特定の属性を反映したビデオを生成する。
Representation Alignment (REPA)のような最近の研究は、DiTベースの画像拡散モデルの収束と品質を改善することを約束している。
フレームの隠れ状態と隣接するフレームの外部特徴を整列する新しい正規化手法であるCross-frame Representation Alignment(CREPA)を導入する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:34:47 GMT)
SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning [30.9] 検証可能な報酬に対する強化学習(RL)を用いた大規模言語モデルの訓練は、その推論能力を大幅に向上させる。
本稿では、学習効率を最大化するために、中間困難のトレーニング例を選択的に選択する適応型オンラインRLカリキュラムであるSPEED(Selective Prompting with Efficulty)を紹介する。
経験的に、我々の効率的な実装は、精度を劣化させることなく2倍から6倍高速なトレーニングをもたらし、手動チューニングを必要とせず、標準のRLアルゴリズムにシームレスに統合する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:42:42 GMT)
MARMOT: Masked Autoencoder for Modeling Transient Imaging [30.9] 我々は、非視線(NLOS)アプリケーションを容易にするために、過渡イメージング(MARMOT)をモデル化するためのマスク付きオートエンコーダを提案する。
私たちのMARMOTは、大規模で多様なNLOSトランジェントデータセットを前提とした自己教師型モデルです。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:49:22 GMT)
SkipVAR: Accelerating Visual Autoregressive Modeling via Adaptive Frequency-Aware Skipping [30.9] 生成プロセスにおける高周波コンポーネント、または後続のステップは、推論遅延に不均等に寄与する。
ステップ冗長性と非条件分岐冗長性の2つの主要な非効率性の原因を同定する。
本稿では、不要な生成ステップを選択的に省略して効率を向上させる自動ステップスキッピング戦略を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:35:29 GMT)
EVA: An Embodied World Model for Future Video Anticipation [30.7] ビデオ生成モデルは将来の状態をシミュレートする上で大きな進歩を遂げており、擬似シナリオにおける世界シミュレータとしての可能性を示している。
既存のモデルは、しばしば堅牢な理解が欠如しており、マルチステップの予測を実行したり、アウト・オブ・ディストリビューション(OOD)シナリオを処理する能力を制限する。
本稿では,映像予測の強化を目的とした中間的推論手法であるリフレクション・オブ・ジェネレーション(RoG)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:08:33 GMT)
Improved Scaling Laws in Linear Regression via Data Reuse [30.7] データの再利用は線形回帰における既存のスケーリング法則を改善することができることを示す。
これはデータ再利用によるスケーリング法則の改善(すなわち、データ制約されたレシエーションで$L>N$を選択する)を示唆している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:39:29 GMT)
Extrapolation by Association: Length Generalization Transfer in Transformers [29.7] 長さ一般化は関連するタスク間でテキスト転送可能であることを示す。
この結果から, 変圧器モデルでは, 協調学習時に類似タスクから一般化能力を継承できることが示唆された。
長さ一般化の伝達は,タスク間の同一の注目ヘッドの再使用と相関する,初期力学的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:22:51 GMT)
Efficient Medical Vision-Language Alignment Through Adapting Masked Vision Models [29.6] クロスモーダル・コントラッシブ・ラーニング (CLIP) 法は, 準最適視覚表現能力に悩まされる。
トレーニング可能なパラメータの約8%しか利用できない効率的な視覚言語アライメント手法であるALTA(Align Through Adapting)を提案する。
ALTAは、マスク付きレコードモデリングから事前学習された視覚モデルを適用することにより、検索やゼロショット分類などの視覚言語マッチングタスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:02:27 GMT)
Topology of Reasoning: Understanding Large Reasoning Models through Reasoning Graph Properties [29.5] 本稿では,各推論ステップで隠れ状態表現をクラスタリングすることで抽出した推論グラフの概念を紹介する。
複数のタスクにまたがる巡回性、直径、小世界指数の3つの重要なグラフ理論特性を解析する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:32:58 GMT)
Agentic Neural Networks: Self-Evolving Multi-Agent Systems via Textual Backpropagation [29.5] 階層型ニューラルネットワークアーキテクチャとしてマルチエージェントコラボレーションを概念化するフレームワークを提案する。
この設計では、各エージェントはノードとして動作し、各レイヤは特定のサブタスクに焦点を当てた「チーム」を形成する。
この結果から,ANNはマルチエージェントシステムのためのスケーラブルでデータ駆動型フレームワークであることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:59:21 GMT)
TrajFlow: Multi-modal Motion Prediction via Flow Matching [29.3] 本稿では,新しいフローマッチングに基づく動き予測フレームワークであるTrajFlowを紹介する。
TrajFlowは1回のパスで複数の可算な将来の軌跡を予測し、計算オーバーヘッドを大幅に削減する。
さまざまな主要なメトリクスにわたって最先端のパフォーマンスを達成し、安全クリティカルな自動運転アプリケーションの有効性を裏付ける。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:08:31 GMT)
DISCO Balances the Scales: Adaptive Domain- and Difficulty-Aware Reinforcement Learning on Imbalanced Data [29.1] 本稿では,グループ間不均衡と2つの重要なイノベーションに対処するGRPOの原理的拡張を提案する。
ドメイン対応報酬スケーリングは、ドメインの頻度に基づいて最適化を再重み付けすることで周波数バイアスに対処する。
難解な報酬のスケーリングは、学習価値を提供する不確実なプロンプトを特定し、優先順位付けするために、プロンプトレベルの自己整合性を活用する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:41:45 GMT)
Atomic-to-Compositional Generalization for Mobile Agents with A New Benchmark and Scheduling System [29.0] 本研究は,モバイルエージェントを構成操作の3つのカテゴリで評価するためのベンチマークを導入する。
Agent-NEXUSは、構成モバイルタスクに取り組むための軽量で効率的なスケジューリングシステムである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:45:29 GMT)
AdaDec: Uncertainty-Guided Adaptive Decoding for LLM-based Code Generation [29.0] AdaDecは、大規模な言語モデルのための不確実性誘導適応デコーディングフレームワークである。
AdaDecはモデル固有の不確実性しきい値を学び、不確実性が高い場合にルックアヘッドベースのリランク戦略を適用します。
実験によると、AdaDecはgreedy復号化よりもPass@1の精度を最大15.5%向上している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:49:46 GMT)
HASFL: Heterogeneity-aware Split Federated Learning over Edge Computing Systems [28.7] エッジデバイス上で機械学習(ML)を民主化するための、有望なパラダイムとして、SFL(Split Federated Learning)が登場した。
既存のSFLアプローチは、エッジデバイスの不均一な機能のため、ストラグラー効果にかなり悩まされる。
本稿では,エッジデバイスのバッチサイズ (BS) とモデル分割 (MS) を適応的に制御し,資源の不均一性を克服する手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:00:01 GMT)
Revolutionizing Clinical Trials: A Manifesto for AI-Driven Transformation [28.6] このマニフェストは、医薬品、コンサルティング会社、臨床研究、AIのリーダーたちによる協力的なビジョンを表している。
因果推論とデジタル双生児という2つのAI技術のロードマップを概説し、臨床試験を変革し、より速く、より安全で、よりパーソナライズされた結果を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:45:19 GMT)
Average-Case Analysis of Iterative Voting [28.5] 反復投票は、社会的選択論における戦略的意思決定の自然なモデルである。
この研究は、平均ケース分析を3つの選択肢に包括的に拡張する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:20:06 GMT)
Understanding Bias Reinforcement in LLM Agents Debate [28.4] 大規模言語モデル(LLM)は、プロンプトエンジニアリングやコンテキスト内学習のようなトレーニング不要の手法を使って複雑な問題を解決する。
自己整合性や自己整合性といった自己補正手法は信頼性の向上を目的としている。
バイアス強化と視点の多様性の欠如です。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:45:40 GMT)
Protriever: End-to-End Differentiable Protein Homology Search for Fitness Prediction [28.2] Protrieverは、目的のタスクを同時にトレーニングしながら、関連するホモログを取得することを学ぶ、エンドツーエンドの差別化可能なフレームワークである。
本稿では,目的タスクを同時にトレーニングしながら,関連するホモログを取得することを学習する,エンドツーエンドの差別化可能なフレームワークであるProtrieverを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:24:09 GMT)
Autonomous Imagination: Closed-Loop Decomposition of Visual-to-Textual Conversion in Visual Reasoning for Multimodal Large Language Models [27.8] MLLM(Multimodal Large Language Models)は、一見単純な視覚的タスクに対処する。
これらのタスクは、視覚からテキストへの変換能力に挑戦する。
本稿では,MLLMが視覚入力を反復的に修正できるように,自律的想像力というアプローチを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:39:20 GMT)
Solving Convex-Concave Problems with $\tilde{\mathcal{O}}(ε^{-4/7})$ Second-Order Oracle Complexity [27.8] 凸最適化のための最適二階法を一般化することにより,$tildemathcalO(epsilon-4/7)$の改善された上限を示す。
さらに,遅延ヘシアンアルゴリズムに類似した手法を適用し,提案アルゴリズムが二階触媒の枠組みであることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:20:48 GMT)
QuEST: Stable Training of LLMs with 1-Bit Weights and Activations [27.6] QuESTはスパースまたは量子化された言語モデルをトレーニングするための新しい方法である。
我々は4ビットで最適性を示し、1ビットの重みとアクティベーションの低い安定収束を示す。
Llama型アーキテクチャの実験により、QuESTはハードウェアサポートされた全範囲にわたる安定したスケーリング法則を導出することが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:01:40 GMT)
Relational decomposition for program synthesis [27.6] プログラム合成におけるリレーショナルアプローチを提案する。
具体的には、トレーニングのインプット・アウトプットの例を、それぞれ入力事実と出力事実のセットに分解する。
提案手法は,4つの挑戦的合成データセット上で,既製の帰納型帰納論理プログラミング(ILP)システムを用いて実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:12:24 GMT)
STeP: A Framework for Solving Scientific Video Inverse Problems with Spatiotemporal Diffusion Priors [27.5] 既存の拡散に基づく手法は、測定から直接時間的一貫性を抽出することに依存している。
学習時間拡散を前もって組み込んだプラグアンドプレイフレームワークを提案する。
本研究では,時間的拡散モデルを限られたビデオデータで効率的に訓練できることを実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:43:21 GMT)
Navigating High-Dimensional Backstage: A Guide for Exploring Literature for the Reliable Use of Dimensionality Reduction [27.4] 本稿では,DRを用いた画像解析のための論文読解ガイドを提案する。
我々のガイドは、実践者が現在のDRの専門知識を評価し、理解を深める論文を特定するのに役立ちます。
DRとデータビジュアライゼーションの専門家3人とのインタビューでは,本ガイドの意義,包括性,有用性について検証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:06:54 GMT)
Sentence-level Reward Model can Generalize Better for Aligning LLM from Human Preference [27.2] 我々は各文にスコアを割り当て、中間粒度の報酬モデルを導入することを提案する。
すべての文のスコアを応答レベルスコアに集約する新しい注意機構が導入された。
提案手法はRewardBench上で応答レベル報酬モデルを2.7%向上させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:25:07 GMT)
Princeton365: A Diverse Dataset with Accurate Camera Pose [26.9] Princeton365は、365ビデオの大規模な多様なデータセットで、正確なカメラポーズがある。
我々は、新しい真実収集フレームワークを導入することで、現在のSLAMベンチマークにおける精度とデータの多様性のギャップを埋める。
カメラのポーズ推定誤差によって誘導される光の流れに基づいてSLAMのシーンスケールアウェア評価指標を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:57:00 GMT)
FastLloyd: Federated, Accurate, Secure, and Tunable $k$-Means Clustering with Differential Privacy [26.9] 本稿では,プライバシー保護のための$k$-meansクラスタリングの問題について検討する。
セキュアな計算を使った既存のアプローチは、かなりのオーバーヘッドに悩まされ、出力のプライバシを提供しない。
計算DPモデルを用いて,軽量でセキュアな集約型アプローチを設計する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:45:50 GMT)
How to Provably Improve Return Conditioned Supervised Learning? [26.9] 本稿では、Reinforced RCSLと呼ばれる原理的でシンプルなフレームワークを提案する。
私たちのフレームワークのキーとなる革新は、分配の最適リターンという概念の導入です。
理論解析により,Reinforced RCSL は標準RCSL のアプローチより一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:37:51 GMT)
Design Patterns for Securing LLM Agents against Prompt Injections [26.6] インジェクション攻撃は 自然言語入力に対する エージェントの弾力性を利用してる
本稿では,AIエージェントのインジェクションに対する抵抗性を証明可能な設計パターンのセットを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:23:55 GMT)
Detecting Harmful Memes with Decoupled Understanding and Guided CoT Reasoning [26.5] 有害ミーム検出のための新しいフレームワークであるU-CoT+を紹介する。
まず,視覚的ミームを詳細なテキスト記述に変換する高忠実度ミーム・トゥ・テキストパイプラインを開発する。
この設計は、ミームの解釈をミーム分類から切り離し、複雑な生の視覚的内容に対する即時推論を避ける。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:10:45 GMT)
UAD: Unsupervised Affordance Distillation for Generalization in Robotic Manipulation [26.5] UAD (Unsupervised Affordance Distillation) は、基礎モデルから手動のアノテーションを使わずにタスク条件付き空調モデルに空調知識を蒸留する方法である。
UADは、シミュレーションにおいてレンダリング対象にのみ訓練されているにもかかわらず、現場でのロボットシーンや様々な人間の活動に顕著な一般化を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:47:16 GMT)
The Cell Ontology in the age of single-cell omics [26.5] 単細胞オミクス技術は、個々の細胞の高分解能なプロファイリングを可能にすることによって、細胞多様性の理解を変えてきた。
Cell Ontology (CL)は、FAIR(Findable, Accessible, Interoperable, Reusable)データ原則を達成するための重要なリソースとして登場した。
プラットフォームやツールにおけるCLの多種多様な利用について述べ、CLコンテンツの改善と拡張に向けた進行中の作業について詳述する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:38:26 GMT)
Through a Steerable Lens: Magnifying Neural Network Interpretability via Phase-Based Extrapolation [26.5] 本稿では,ネットワーク勾配を無限小運動の形式として扱うことにより,クラス間の暗黙の経路を可視化する新しいフレームワークを提案する。
合成と実世界の両方のデータセットの実験では、フェーズ中心の補間が知覚的に整合し、意味的に意味のある変換をもたらすことが示されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:26:52 GMT)
Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing [26.3] 本研究では,コスト依存シナリオ下での対向的摂動に対する頑健な学習の問題について検討する。
当社のソリューションでは,コストに敏感なロバストネスを認証し,最適化するための,証明可能な堅牢な学習アルゴリズムを導入している。
さらに,モデル精度を損なうことなく,信頼性の高いコスト感受性を向上するロバストトレーニング手法を設計する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:50:18 GMT)
HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation [26.2] HunyuanVideo-HOMAは、弱い条件付きマルチモーダル駆動のフレームワークである。
多モード拡散変圧器の二重入力空間に外観と運動信号を符号化する。
解剖学的に一貫した物理的に安定な相互作用を合成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:45:00 GMT)
RecipeGen: A Step-Aligned Multimodal Benchmark for Real-World Recipe Generation [26.2] レシピベースのText-to-Image (T2I), Image-to-Video (I2V), Text-to-Video (T2V) 生成のための,最初の大規模実世界のベンチマークであるRecipeGenを紹介する。
RecipeGenには、レシピ26,453件、画像196,724件、ビデオ4,491件が含まれており、さまざまな材料、調理手順、スタイル、料理の種類をカバーしている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:24:29 GMT)
Better Reasoning with Less Data: Enhancing VLMs Through Unified Modality Scoring [26.2] 視覚的調律データセットのための品質駆動型データ選択パイプラインを提案する。
クロスモダリティアセスメントフレームワークを統合し、まず各データエントリを適切な視覚言語タスクに割り当てる。
一般的なキャプションとタスク固有のキャプションを生成し、各エントリのアライメント、明度、タスクのラミリティ、テキストコヒーレンス、画像の明度を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:04:58 GMT)
Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models [26.2] MLLM(Multimodal Large Language Models)は、一貫した視覚・テキスト入力で主に訓練され、テストされる。
本稿では,MLLMの意味的ミスマッチの検出と推論能力を評価するためのマルチモーダル不整合推論ベンチマークを提案する。
我々は6つの最先端MLLMを評価し、o1のような専用マルチモーダル推論能力を持つモデルは、その性能を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:32:17 GMT)
FastFLUX: Pruning FLUX with Block-wise Replacement and Sandwich Training [26.2] 本稿では,FLUXの推論効率を向上させるアーキテクチャレベルのプルーニングフレームワークであるFastFLUXを提案する。
中心となるのはBlock-wise Replacement with Linear Layers (BRLL) 法であり、ResBlocksの構造的に複雑な残枝を軽量な線形層に置き換えている。
実験の結果,FastFLUXは定性評価と定量的評価の両方で高画質を維持しつつ,20%の階層プルーニングでも推論速度を大幅に向上していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:48:30 GMT)
RoboSwap: A GAN-driven Video Diffusion Framework For Unsupervised Robot Arm Swapping [26.0] RoboSwapは多様な環境からの未ペアデータで動作する。
私たちはロボットアームを彼らのバックグラウンドから切り離し、片方のロボットアームをもう片方のロボットアームに翻訳するために、無人のGANモデルを訓練します。
実験の結果,RoboSwapは3つのベンチマークで最先端のビデオや画像編集モデルより優れていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:46:07 GMT)
Leveraging LLMs to Evaluate Usefulness of Document [26.0] 本稿では,ユーザの検索コンテキストと行動データを大規模言語モデルに統合する,新たなユーザ中心評価フレームワークを提案する。
本研究は,文脈情報や行動情報に精通したLLMが有用性を正確に評価できることを実証する。
また,本手法で作成したラベルをユーザ満足度予測に適用し,実世界の実験により,これらのラベルが満足度予測モデルの性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:44:03 GMT)
ConfPO: Exploiting Policy Model Confidence for Critical Token Selection in Large Language Model Preference Optimization [25.8] 大型言語モデル(LLM)における嗜好学習手法ConfPOを紹介する。
補助モデルや計算を必要とせずに、トレーニングポリシの信頼性のみに基づいて、優先クリティカルトークンを特定し、最適化する。
AlpacaEval 2 や Arena-Hard などのアライメントベンチマークの実験結果は、ConfPO が一様DAA を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:54:22 GMT)
OAT-Rephrase: Optimization-Aware Training Data Rephrasing for Zeroth-Order LLM Fine-Tuning [25.8] 本稿では,OAT-Rephraseについて紹介する。
OAT-RephraseはMeZOの微調整性能を常に改善することを示す。
提案手法は,ゼロ階調音システムにおける再利用可能な低オーバヘッド向上に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:53:04 GMT)
Edit Flows: Flow Matching with Edit Operations [25.8] Edit Flowsは、操作の挿入、削除、置換を通じてシーケンス上の離散フローを定義する非自己回帰モデルである。
シーケンス空間上の連続時間マルコフチェーン内でこれらの操作をモデル化することにより、エディットフローはフレキシブルで位置相対的な生成を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:44:19 GMT)
Online Learning-guided Learning Rate Adaptation via Gradient Alignment [25.7] 大規模ディープラーニングモデルの性能は、学習率の微調整に大きく依存する。
本稿では, GALA (Gradient Alignment-based Adaptation) と呼ばれるフレームワークを提案する。
Follow-the-Regularized-Leaderのようなオンライン学習アルゴリズムと組み合わせることで、フレキシブルで適応的な学習スケジュールを生成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:46:41 GMT)
CASPER: A Large Scale Spontaneous Speech Dataset [25.4] 本稿では,自発音声データの不足に対処するための基礎研究として,我々のデータセットと方法論を紹介する。
今後このデータセットを拡大し、研究コミュニティのためのリソースを拡大する予定です。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:36:19 GMT)
FloorplanMAE:A self-supervised framework for complete floorplan generation from partial inputs [25.4] 不完全なフロアプランを完全なフロアプランに復元するための自己教師型学習フレームワークであるFloorplanMAEを提案する。
まず,建築用フロアプランに特化して訓練したフロアプラン再構築データセットFloorplanNetを開発した。
次に,Masked Autoencoders (MAE) に基づくフロアプラン再構築手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:22:05 GMT)
Towards Practical First-Order Model Counting [25.3] 1次モデルカウント(英: First-order model counting, FOMC)は、一階述語論理における文のモデル数をカウントする問題である。
Crane2は、関数定義を任意の精度演算を備えたC++コードに変換する完全自動コンパイルアルゴリズムである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:03:30 GMT)
ATI: Any Trajectory Instruction for Controllable Video Generation [25.2] 本稿では、カメラの動き、オブジェクトレベルの翻訳、きめ細かい局所的な動きをシームレスに統合する、動画生成におけるモーション制御のための統一的なフレームワークを提案する。
提案手法は,事前学習した画像-映像生成モデルの潜在空間にユーザ定義トラジェクトリを投影することにより,凝集性のある解を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:15:58 GMT)
PerfTracker: Online Performance Troubleshooting for Large-scale Model Training in Production [25.0] PerfTrackerは、きめ細かいプロファイリングを利用する最初のオンライントラブルシューティングシステムである。
PerfTrackerはO(10,000)の大規模GPUクラスタの運用サービスとしてデプロイされている。
様々な難しいパフォーマンスの問題を診断するために使われてきた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:46:14 GMT)
Refiner: Data Refining against Gradient Leakage Attacks in Federated Learning [24.9] グラデーションリーク攻撃は クライアントのアップロードした勾配を利用して 機密データを再構築する
本稿では,従来の勾配摂動から分離した新しい防御パラダイムについて検討する。
プライバシ保護とパフォーマンス維持のための2つのメトリクスを共同で最適化するRefinerを設計する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:28:04 GMT)
Quantum Architecture Search with Unsupervised Representation Learning [24.7] 教師なし表現学習は量子アーキテクチャ探索(QAS)を前進させる新しい機会を提供する
QASは変分量子アルゴリズム(VQA)のための量子回路を最適化するように設計されている
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:22:42 GMT)
The Geometries of Truth Are Orthogonal Across Tasks [24.7] 我々は「真理のゲノム」が本質的にタスク依存であり、タスク間での転送に失敗していることを示す。
より高度なアプローチはこの制限を克服することができないが、これはおそらく、タスクをまたいで調べる際に、解の分類に一般的に使用されるアクティベーションベクトルが明確に分離されたクラスタを形成するためである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:40:31 GMT)
Wait, We Don't Need to "Wait"! Removing Thinking Tokens Improves Reasoning Efficiency [24.6] 高度な推論には、"Wait" や "Hmm" などのトークンによって信号される明示的な自己回帰が必要である。
推論中にこれらのトークンを抑えることで、明示的な自己回帰を無効にする、シンプルで効果的なアプローチであるNoWaitを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:54:04 GMT)
SHIELD: Multi-task Multi-distribution Vehicle Routing Solver with Sparsity and Hierarchy [24.5] 疎性と階層性の両方の原則を活用する新しいモデルであるShielDを紹介する。
より優れた局所表現を生成するために,問題における階層構造の存在を活かしたコンテキストベースのクラスタリング層を開発する。
提案手法は, 実世界の9つの地図において, 16種類のVRPのバリエーションを持つ既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:55:14 GMT)
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test [24.4] APIプロバイダは、コスト削減やモデル動作の不正な変更のために、量子化または微調整の亜種を慎重に提供することができる。
そこで我々は,ブラックボックスLLMの挙動等式を局所的に展開した認証モデルに検証できるランクベース均一性試験を提案する。
我々は、量子化、有害な微調整、脱獄プロンプト、完全なモデル置換など、さまざまな脅威シナリオに対するアプローチを評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:21:06 GMT)
Worse than Random? An Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA [24.1] 大規模マルチモーダルモデル(LMM)は医療用視覚質問応答(Med-VQA)において顕著な進歩を示した
本研究は, 簡易な探索評価を行う場合, 医学的診断問題に対するランダムな推測よりも, 最先端のモデルの方が悪いことを明らかにした。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:06:46 GMT)
Human-like object concept representations emerge naturally in multimodal large language models [24.0] 大規模言語モデル(LLM)における対象概念表現と人間の認知との関係を考察するために,行動解析と神経画像解析を併用した。
我々の発見は、マシンインテリジェンスに対する理解を深め、より人間的な人工知能システムの開発に報いる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:55:41 GMT)
Dialect Normalization using Large Language Models and Morphological Rules [23.8] 本稿では,ルールベースの言語情報変換と大規模言語モデル(LLM)と,目的とする複数ショットプロンプトを組み合わせた新しい正規化手法を提案する。
我々は,ギリシャ語の方言の手法を実装し,それを地域証明のデータセットに適用し,人間のアノテータを用いたアウトプットの評価を行った。
次に、このデータセットを用いて下流実験を行い、これらの証明に関する以前の結果は、表面的な言語情報にのみ依存していることを発見した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:34:34 GMT)
SakugaFlow: A Stagewise Illustration Framework Emulating the Human Drawing Process and Providing Interactive Tutoring for Novice Drawing Skills [23.6] SakugaFlowは、拡散ベースの画像生成と大きな言語モデルチューターを組み合わせた4段階のパイプラインである。
初心者は解剖学、視点、構成についてリアルタイムでフィードバックを受け取る。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:35:10 GMT)
AVA-Bench: Atomic Visual Ability Benchmark for Vision Foundation Models [23.6] AVA-Benchは、14のAtomic Visual Abilities(AVA)を明示的にアンタングルする最初のベンチマークである。
AVAを分離し、それぞれのトレーニングとテスト分布を一致させることで、VA-Bench は VFM が引き寄せる位置を正確に特定する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:43:34 GMT)
SpatialReasoner: Towards Explicit and Generalizable 3D Spatial Reasoning [23.6] 本稿では3次元空間推論に対処する新しい大規模視覚言語モデル(LVLM)を提案する。
明示的な3D表現は、高度な3D空間推論をサポートするコヒーレントインターフェースを提供する。
その結果,SpatialReasonerは,様々な空間推論ベンチマークの性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:53:33 GMT)
Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling [23.6] フローベース拡散モデルにおける新しい最先端技術として整流流(RF)が出現している。
本稿では,新しい整流モデルである離散RFについて述べる。
本稿では,その方向を変えるためにサブパスのベロシティ$bm対$のノイズを導入し,多様性とマルチスケールノイズモデリング能力を向上する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:44:49 GMT)
CulturalFrames: Assessing Cultural Expectation Alignment in Text-to-Image Models and Evaluation Metrics [23.6] 我々は、明示的および暗黙的な文化的期待の両方に関して、テキスト・ツー・イメージ(T2I)モデルと評価指標のアライメントを定量化する。
本稿では,視覚世代における文化的表現の厳密な評価を目的とした新しいベンチマークであるCulturalFramesを紹介する。
T2Iモデルは、より挑戦的な暗黙的な期待を満たさないだけでなく、より挑戦的な明示的な期待を満たさないことが分かっています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:21:46 GMT)
PEFTGuard: Detecting Backdoor Attacks Against Parameter-Efficient Fine-Tuning [23.5] 低ランクアダプタは、オープンソースプラットフォーム上で共有および利用することができる。
PEFTベースのアダプタに対する最初のバックドア検出フレームワークであるPEFTGuardを提案する。
PEFTGuardは、異なる攻撃、PEFTメソッド、アダプタランクを含む3つの側面でゼロショット転送性を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:07:34 GMT)
Self-Training Elicits Concise Reasoning in Large Language Models [23.5] チェーン・オブ・シント(CoT)推論により、中間トークンによるさらなる計算を大規模言語モデル(LLM)が利用できるようになった。
自己生成した簡潔な推論経路を利用する簡単な微調整法を提案する。
提案手法は,GSM8KおよびMATH上の5つのモデルファミリに対して,平均精度を維持しつつ,出力トークンの30%削減を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:54:28 GMT)
One Patch to Rule Them All: Transforming Static Patches into Dynamic Attacks in the Physical World [23.4] SwitchPatchは、リアルタイムシナリオに基づいた動的かつ制御可能な攻撃結果を可能にする静的敵パッチ(PAP)である。
交通信号認識(分類と検出)と深さ推定という2つの重要なタスクでSwitchPatchを評価する。
全体として、SwitchPatchは多様なタスクや実世界の状況に適応可能な、柔軟で実践的な敵戦略を導入している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:12:21 GMT)
Diffuse and Disperse: Image Generation with Representation Regularization [23.4] 拡散に基づく生成モデルを効果的に改善するプラグイン・アンド・プレイ・レギュレータである textitDispersive Loss を提案する。
我々の損失関数は、内部表現が、対照的な自己教師付き学習に類似した隠れ空間に分散することを奨励する。
最近の表現アライメント法(REPA)と比較して、我々のアプローチは自己完結型で最小限であり、事前学習も追加パラメータも外部データも必要としない。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:53:29 GMT)
DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments [23.4] DefenderBenchは、犯罪、防衛、サイバーセキュリティ知識に基づくタスクに対して言語エージェントを評価するための実用的でオープンソースのツールキットである。
研究者にとって手頃で手頃な価格で手軽に利用でき、公正で厳格な評価を提供するように設計されている。
以上の結果から,Claude-3.7-sonnetが81.65点,Claude-3.7-sonnetが78.40点,Llama 3.3 70Bが71.81点,Claude-3.7-sonnetが71.81点,Claude-3.7-sonnetが最高性能を示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:00:37 GMT)
OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation [23.1] テキスト・ツー・イメージ(T2I)モデルは、テキスト・プロンプトに整合した高品質な画像を生成する上で大きな注目を集めている。
OneIG-Benchは、T2Iモデルを複数の次元で評価するためのベンチマークフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:31:25 GMT)
Single-Node Trigger Backdoor Attacks in Graph-Based Recommendation Systems [23.0] 本稿では,対象ユーザに対する対象アイテムの露出を高めるため,新たなグラフバックドア攻撃手法を提案する。
対象ノードと無関係ノード間の制約条件を導入し、偽ノードがレコメンデーションシステムの性能に与える影響を軽減する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:19:15 GMT)
Efficient Post-Training Refinement of Latent Reasoning in Large Language Models [22.9] Chain-of-Thoughtのプロンプトは十分なトークンオーバーヘッドと固定された推論軌道に悩まされ、ステップワイズの改良が妨げられる。
潜在推論の最近の進歩は、モデル潜在空間において内部推論プロセスを直接精製することによってこれらの制限に対処している。
本稿では,2つの新しい戦略を用いて遅延推論軌道を洗練する軽量なポストトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:17:16 GMT)
TraGraph-GS: Trajectory Graph-based Gaussian Splatting for Arbitrary Large-Scale Scene Rendering [22.9] 既存の方法は、通常、大きなシーンを複数の領域に分割し、各領域のガウススプラッティングを用いて3D表現を再構成し、最終的にそれらを新しいビューレンダリングのためにマージする。
任意の大規模シーンの高精度レンダリングを実現するためにトラジェクトリグラフを利用するトラグラフ-GSを提案する。
提案手法は, 地上データセットにおけるPSNRの1.86dB, 地上データセットにおける1.62dBを, 最先端のアプローチと比較して平均的に改善する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:43:04 GMT)
TRACE: Grounding Time Series in Context for Multimodal Embedding and Retrieval [22.4] TRACEは、時系列をテキストコンテキストに埋め込む汎用マルチモーダルレトリバーである。
Text-to-TimeseriesやTimeeries-to-Textなど、柔軟なクロスモーダル検索モードをサポートする。
TRACEは強力なスタンドアロンエンコーダとしても機能し、コンテキスト対応の表現を洗練するための軽量なタスク特化チューニングを備えている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:59:56 GMT)
VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning [22.3] 組込みマルチエージェント協調に適した最初の階層型ベンチマークであるVIKI-Benchを紹介する。
VIKI-Benchには、多様なロボットエボディメント、多視点視覚観察、構造化された監視信号が含まれる。
VIKI-Benchの実用性を実証するために、事前学習された視覚言語モデルを微調整する2段階フレームワークVIKI-Rを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:59:44 GMT)
The Curious Language Model: Strategic Test-Time Information Acquisition [21.9] CuriosiTreeは、大規模な言語モデルでゼロショット情報を取得するためのテストタイムポリシーである。
それは、各アクションの期待される情報ゲインを推定するために、欲張りのツリーサーチを利用する。
期待される情報ゲインと関連するコストのバランスに基づいて、戦略的に行動を選択する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:38:57 GMT)
One-Shot Min-Entropy Calculation Of Classical-Quantum States And Its Application To Quantum Cryptography [21.8] 古典量子状態のミニエントロピーに対するワンショット下界計算手法を開発した。
BB84量子鍵分布スキームに対して、より厳密な有限データ解析を提供する。
これは、デバイス独立量子鍵分配プロトコルの変種について、現在知られている最高の有限鍵境界を与える。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:28:18 GMT)
Understand User Opinions of Large Language Models via LLM-Powered In-the-Moment User Experience Interviews [21.6] CLUEは、ユーザがLDMと対話した直後に、インザモーメントのユーザエクスペリエンスインタビューを行うインタビュアーである。
メインストリームのLDMについて,ユーザからの意見を理解するために,何千人ものユーザを対象に調査を行った。
実験の結果,CLUEは,DeepSeekR1の表示された推論プロセスに関するバイポーラビューなど,興味深いユーザの意見を捉えていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:15:57 GMT)
Optimal Spectral Transitions in High-Dimensional Multi-Index Models [21.6] 本稿では,この問題に適したメッセージパッシング方式の線形化に基づくスペクトルアルゴリズムを提案する。
本研究では,提案手法が最適復元しきい値を達成することを示す。
数値実験と厳密な理論的枠組みによって支援され、我々はマルチインデックスモデルにおける弱い学習可能性の計算限界における臨界ギャップを橋渡しする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:55:07 GMT)
Bias Analysis in Unconditional Image Generative Models [21.5] 我々は、条件のない画像生成モデルを訓練し、トレーニングと生成された分布の間のバイアスシフトを研究するために一般的に使用されるバイアス評価フレームワークを採用する。
実験の結果,検出された属性シフトは小さいことがわかった。
属性シフトは、特に高密度領域における決定境界が低下した場合に、評価フレームワークで生成された画像のラベル付けに使用される属性分類器に敏感であることが判明した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:53:10 GMT)
A Topic Modeling Analysis of Stigma Dimensions, Social, and Related Behavioral Circumstances in Clinical Notes Among Patients with HIV [21.5] UF Health IDRによるHIV(PLWHs)のコホートを9,140名同定した。
スタグマ次元を明らかにするためにLDA(Latent Dirichlet Allocation)を用いてトピックモデリング分析を行った。
本研究は, 年齢・性別別集団間の差異を検討するために, サブグループ間での話題変動分析を行った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:35:49 GMT)
Enhanced Whole Page Optimization via Mixed-Grained Reward Mechanism-Adapted Language Models [21.4] 本稿では,ページレベルの報酬とアイテムレベルの報酬を混合した,報酬に基づく微調整手法を提案する。
PageLLMはベースラインを上回り、1000万人以上のオンラインA/Bテストで0.44%のGMVアップを達成した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:05:42 GMT)
Spectral Estimators for Multi-Index Models: Precise Asymptotics and Optimal Weak Recovery [21.4] スペクトル推定器を用いて信号が分散する部分空間の復元に焦点をあてる。
我々の主な技術的貢献はスペクトル法の性能を正確に評価することである。
分析の結果,サンプルの複雑さが増大するにつれて固有値がスペクトルの大部分から逃れる相転移現象が明らかになった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:54:02 GMT)
Flow Matching Meets PDEs: A Unified Framework for Physics-Constrained Generation [21.3] 本稿では,PDE残差と代数的関係の両方の物理制約をフローマッチングの対象に組み込む生成フレームワークである物理ベースフローマッチングを提案する。
提案手法では,FMよりも高精度な物理残差を最大8倍に抑えながら,分布精度では既存アルゴリズムよりも明らかに優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:13:37 GMT)
Certified Unlearning for Neural Networks [21.3] そこでは,モデルから特定のトレーニングデータの影響を取り除くことを目的として,機械学習の課題に対処する。
既存の方法は制限的な仮定に依存したり、正式な保証を欠いている。
後処理による非学習とプライバシ増幅の関連性を活用して、認定された非学習のための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:29:50 GMT)
HSG-12M: A Large-Scale Spatial Multigraph Dataset [21.3] 本稿では,計量空間における$textbfspatial multigraphs-$graphsの最初の大規模データセットであるHSG-12Mを紹介する。
各グラフは複素平面上の1次元結晶のエネルギースペクトルの全幾何学を符号化する。
スペクトルグラフは代数-グラフリンクに埋め込まれた普遍的なトポロジカルフィンガーとして機能することを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:25:19 GMT)
GigaSLAM: Large-Scale Monocular SLAM with Hierarchical Gaussian Splats [21.0] 本稿では,RGB NeRF/3DGSベースの大規模屋外環境向けSLAMフレームワークであるGigaSLAMを紹介する。
我々のアプローチは階層的なスパースボクセルマップ表現を採用しており、ガウシアンはニューラルネットワークによって複数の詳細レベルで復号化されている。
GigaSLAMは、都市の屋外ベンチマークで高精度なトラッキングと視覚的に忠実なレンダリングを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:30:19 GMT)
LLM-ML Teaming: Integrated Symbolic Decoding and Gradient Search for Valid and Stable Generative Feature Transformation [20.9] 本稿では,LLMのシンボル生成とMLの勾配ステアリング検索を組み合わせたチーム編成フレームワークを提案する。
実験の結果、チーム分けポリシは、ダウンストリームのパフォーマンスを5%改善し、エラーケースのほぼ半分を削減できることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:10:16 GMT)
Implicit Neural Representations for Chemical Reaction Paths [20.8] ニューラルネットワークは最小エネルギー経路を連続関数として表現できることを示す。
低次元の環境では、1つのニューラルネットワークが既存の経路から学習し、目に見えないシステムに一般化できることを実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:12:07 GMT)
BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning [20.6] B-spline Encoded Action Sequence Tokenizer (BEAST)について述べる。
BEAST は B-splines を用いて、アクションシーケンスをコンパクトな離散トークンまたは連続トークンにエンコードする。
BEASTは166のシミュレーションタスクと8つの実世界のタスクからなる3つの異なるロボット設定からなる3つの確立されたベンチマークで評価した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:36:25 GMT)
Mitigating Posterior Salience Attenuation in Long-Context LLMs with Positional Contrastive Decoding [20.5] 後天無力化(PSA)現象は,長期の経時的パフォーマンス低下と相関する。
本研究では,長時間の注意から得られるロジットと設計した局所的な注意から得られるロジットとを対比した,訓練不要な位置コントラストデコーディング(PCD)を提案する。
PCDは、長いコンテキストのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:35:26 GMT)
FC-Attack: Jailbreaking Multimodal Large Language Models via Auto-Generated Flowcharts [20.3] MLLM(Multimodal Large Language Models)は、いくつかの実用アプリケーションにおいて強力で広く採用されている。
近年の研究では、有害なコンテンツを生成するためにモデルを誘導できるマルチモーダル・ジェイルブレイク攻撃に対する脆弱性が明らかにされている。
本稿では,自動生成フローチャートFC-Attackに基づくジェイルブレイク攻撃手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:09:45 GMT)
Reinforcement Learning Teachers of Test Time Scaling [20.3] LMを推論する主要なユースケースは、新しい学生を蒸留し、将来のRLイテレーションを冷静に開始する教師として機能することである。
我々は,RLの探究課題を回避するために,RLT(Reinforcement-Learned Teachers)の新たなクラスを育成する枠組みを導入する。
RLTは、各問題に対する質問と解決の両方で促され、生徒に合った詳細な説明で単に「接続する」ことを任務とする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:53:24 GMT)
Navigating Cookie Consent Violations Across the Globe [20.2] 本研究では,クッキーバナーの動作を検出し解析するConsentChkというエンドツーエンドシステムを提案する。
世界中の8つの英語圏を調査し,世界中の1,793のウェブサイトでクッキーバナーの挙動を分析した。
我々の評価によると、同意管理プラットフォーム(CMP)とWebサイト開発者は、地域プライバシー法の解釈に基づいてクッキーバナーの設定をカスタマイズする可能性が高い。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:15:12 GMT)
Time-Aware World Model for Adaptive Prediction and Control [20.1] Time-Aware World Model (TAWM) は、時間力学を明示的に組み込んだモデルベースのアプローチである。
TAWMは様々な制御問題にまたがる高頻度および低周波のタスクダイナミクスを学習する。
経験的評価は、TAWMが従来のモデルより一貫して優れていることを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:28:11 GMT)
MedMoE: Modality-Specialized Mixture of Experts for Medical Vision-Language Understanding [20.1] 診断コンテキストに基づいて視覚表現を適応する視覚言語処理フレームワークであるMedMoEを提案する。
MedMoEには、レポートタイプに条件付きMixture-of-Experts (MoE)モジュールが組み込まれている。
このフレームワークは、推論においてモダリティ固有の監督を必要とせず、テキスト記述と整合した局所的な視覚表現を生成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:14:15 GMT)
ClimateViz: A Benchmark for Statistical Reasoning and Fact Verification on Scientific Charts [20.1] 専門家による科学的グラフを用いた科学的事実チェックのための,最初の大規模ベンチマークであるClimateVizを紹介する。
ClimateVizには2,896件のビジュアライゼーションに関連する49,862件のクレームが含まれている。
我々は、プロプライエタリシステムとオープンソースシステムの両方を含む最先端のマルチモーダル言語モデルをゼロショットおよび少数ショット設定で評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:27:00 GMT)
Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought [19.8] ビデオ理解は、ビデオ分析からインタラクティブシステムまで、様々な用途に不可欠である。
視覚言語モデルの発展にもかかわらず、これらのモデルはしばしば、微妙で時間的な詳細を捉えるのに苦労する。
これを解決するために、ビデオ理解を強化するために設計された画期的なデータセットであるVideo-Thoughtを紹介した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:08:56 GMT)
DEAL: Disentangling Transformer Head Activations for LLM Steering [19.8] 本稿では,変圧器における行動関連アテンションヘッドの同定のための因果属性フレームワークを提案する。
各ヘッドに対して,ベクトル量子化オートエンコーダ(VQ-AE)をアテンションアクティベーションに基づいてトレーニングする。
行動整合性と行動違反性に対するVQ-AEエンコーディングの分離性により,各頭部の行動関連性を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:16:50 GMT)
Brevity is the soul of sustainability: Characterizing LLM response lengths [19.7] 大規模言語モデル(LLM)は、必要よりもかなり長い応答を生成する。
LLMは最小限の答え以外に冗長または追加の情報を含む傾向がある。
提案手法により,25~60%のエネルギー最適化を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:52:04 GMT)
RL-based Query Rewriting with Distilled LLM for online E-Commerce Systems [19.7] 効率と効率のバランスをとる新しいQR用ハイブリッドパイプラインを提案する。
オンライン強化学習(RL)を用いて,オフラインの知識蒸留を併用し,リアルタイムフィードバックを用いて動的にクエリ書き換えを行う。
Amazon ESCIデータセットの実験結果は、クエリ関連性、多様性、適応性を大幅に改善したことを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:00:17 GMT)
Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations [19.5] この研究は線形結合導出法を提案し、タスクベクトルは元のベクトルの線形結合によって形成された単一のコンテキスト内実証として機能することを示した。
本研究では,三重項型プロンプトを訓練した線形変圧器において,タスクベクトルが自然に現れることを示す。
本研究では,高階マッピングにおけるタスクベクトルの故障を予測し,実用的なLCM上で確認する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:59:31 GMT)
SurfR: Surface Reconstruction with Multi-scale Attention [19.1] 暗示表現を用いた非組織点雲の高速かつ高精度な表面再構成アルゴリズムを提案する。
3つの重要なコントリビューションを使って、最高の精度と速度のトレードオフを実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:46:36 GMT)
Gumbel-max List Sampling for Distribution Coupling with Multiple Samples [19.1] そこで本研究では,SpecTrやSpecInferといったベースラインと競合する性能を実現し,実装が容易な投機的サンプリングのための新しいメカニズムを開発した。
我々は、ソースサンプルを圧縮し、複数のデコーダで利用できる設定において、サイド情報による分散損失圧縮を考察する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:33:41 GMT)
A Two-Stage Data Selection Framework for Data-Efficient Model Training on Edge Devices [18.9] 現在のオンデバイスモデルのトレーニングは、低いトレーニングスループット、限られたストレージ、さまざまなデータの重要性によって妨げられています。
モデル学習のためのストリーミングデータから,最も重要なデータバッチを選択するための2段階データ選択フレームワークであるsf Titanを提案する。
sf Titanは、トレーニング時間の最大43%の削減と、マイナーシステムのオーバーヘッドを伴う最終的な精度の6.2%の向上を実現している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:20:49 GMT)
Evaluating LLMs Across Multi-Cognitive Levels: From Medical Knowledge Mastery to Scenario-Based Problem Solving [18.8] 大規模言語モデル (LLM) は様々な医学ベンチマークで顕著な性能を示した。
しかし、その能力は様々な認知レベルにわたって過小評価されている。
医療領域におけるLCMの評価のための多認知レベル評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:07:33 GMT)
SSS: Semi-Supervised SAM-2 with Efficient Prompting for Medical Imaging Segmentation [18.4] SSS(Semi-Supervised SAM-2)は、SAM-2の頑健な特徴抽出機能を活用して、ラベルなしの医療画像における潜在知識を明らかにする新しいアプローチである。
実験では、SSSはBHSD上での平均Diceスコアを53.15とし、+3.65Diceよりも上回っている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:09:40 GMT)
TACTIC: Translation Agents with Cognitive-Theoretic Interactive Collaboration [18.4] 本稿では,TACTICと呼ばれる認知情報に基づくマルチエージェントフレームワークを提案する。
ヒトの翻訳行動で観察される主要な認知過程を反映する6つの機能的に異なるエージェントから構成される。
我々の手法は一貫して最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:22:30 GMT)
Enhancing Reasoning Capabilities of Small Language Models with Blueprints and Prompt Template Search [18.3] 小型言語モデル(SLM)は、大規模言語モデル(LLM)に対する有望で効率的な代替手段を提供する。
我々のフレームワークは、SLMの感度を軽減し、変化を促すプロンプトテンプレート検索機構を統合している。
提案手法は,モデルのサイズを拡大したり,追加のトレーニングを必要とせずに,SLMの推論能力を向上させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:30:43 GMT)
TableDreamer: Progressive and Weakness-guided Data Synthesis from Scratch for Table Instruction Tuning [18.2] TableDreamerは、テーブルインストラクションチューニングのための、プログレッシブで弱いガイド付きデータ合成フレームワークである。
Llama3.1-8B-インストラクトの平均精度は11.62%(49.07%から60.69%)、合成データは27K GPT-4oである。
これは、より多くのトレーニングデータを使用する最先端のデータ合成ベースラインよりも優れています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:57:59 GMT)
ThinkQE: Query Expansion via an Evolving Thinking Process [18.2] ThinkQEは、より深く包括的なセマンティック探索を促進するテスト時クエリ拡張フレームワークである。
ThinkQEはトレーニング集約型リトリーバーやリランカーなど,従来のアプローチよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:41:01 GMT)
Compositional Causal Reasoning Evaluation in Language Models [18.1] 因果推論と構成推論は、AIにおける2つの中核的な願望である。
両行動を同時に考える統一的な視点を探求する。
構成因果推論の体系的評価のための枠組みを創出する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:10:21 GMT)
Sparse Autoencoders Bridge The Deep Learning Model and The Brain [18.1] SAE-BrainMapは、ディープラーニングの視覚モデル表現とボクセルレベルのfMRI応答を一致させる新しいフレームワークである。
ViT-B/16$_CLIP$は、初期層で高レベルなセマンティック情報を生成するために低レベルな情報を利用する傾向がある。
我々の結果は、ディープニューラルネットワークと人間の視覚野の間に直接、下流でタスクのない橋を架け、モデル解釈可能性に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:35:14 GMT)
Convergence of Spectral Principal Paths: How Deep Networks Distill Linear Representations from Noisy Inputs [18.0] ハイレベルな表現は、AIの透明性と制御を強化することの中心となり、個々のニューロンや回路から人間の解釈可能な概念に沿った構造化されたセマンティックな方向へと注目を移している。
線形表現仮説 (LRH) によって動機付けられた入力空間線形性仮説 (ISLH) を提案する。
次に、スペクトル主経路(SPP)フレームワークを導入し、より深いネットワークが支配的なスペクトル方向の小さなセットに沿って線形表現を段階的に蒸留する方法を定式化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:08:52 GMT)
Revisiting Reweighted Risk for Calibration: AURC, Focal Loss, and Inverse Focal Loss [18.0] 本稿では,ディープラーニングで一般的に使用される重み付きリスク関数の幅広いクラスを再検討する。
我々はこれらの重み付けスキームと校正誤差の原理的関係を確立する。
AURCの正規化変種を最適化することは自然にキャリブレーションの改善につながることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:31:48 GMT)
Generalization analysis of an unfolding network for analysis-based Compressed Sensing [17.8] 展開ネットワークは、圧縮センシング(CS)分野において有望な結果を示している。
我々は最先端ADMMベースの展開ネットワークの一般化解析を行う。
提案手法は理論的な結果に適合し,ベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:26:36 GMT)
SAMSelect: A Spectral Index Search for Marine Debris Visualization using Segment Anything [17.8] 本研究は,マルチスペクトル画像に対する有意な3チャンネル可視化を実現するアルゴリズムを提案する。
我々はSAMSelectを開発し、センチネル2号の画像で浮かぶ海洋の破片を視覚的に解釈する海洋科学者にその用途を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:22:01 GMT)
Flow-Lenia: Emergent evolutionary dynamics in mass conservative continuous cellular automata [17.8] 我々は,レニアの大量保守的拡張であるフロー・レニアを提案する。
Flow-Leniaはモデルのパラメータを埋め込むことができ、出現するパターンの特性を定義します。
我々はこのシステムで発生した進化力学について光を当てた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:37:26 GMT)
Can Slow-thinking LLMs Reason Over Time? Empirical Studies in Time Series Forecasting [17.7] 時系列予測(TSF)は、古典的な統計的アプローチから現代のディープラーニングやマルチモーダル言語モデリングまで、基礎的で広く研究されている課題である。
一方、ゆっくり考え始めるLSMは、様々な領域にまたがる印象的な多段階推論能力を示している。
スロー思考のLLMは、時系列予測をサポートするために時間的パターンよりも効果的に推論できるのか?
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:09:36 GMT)
Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task [17.6] エッセイ執筆時の認知負荷評価には脳波を用いた。
我々は,NLPを用いたエッセイの分析と,人間の教師とAI判事の助けを借りてエッセイの評価を行った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:04:28 GMT)
Graph Attention-based Decentralized Actor-Critic for Dual-Objective Control of Multi-UAV Swarms [17.4] 本研究は,2つの目的を持つマルチUAVシステムの最適化に焦点をあてる。
サービスカバレッジの最大化を第一目標とし、バッテリー寿命を第二目標としています。
本稿では,2つの目的を最適化するために,グラフ注意に基づく分散型アクター批判(GADC)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:30:53 GMT)
Amortized Inference of Causal Models via Conditional Fixed-Point Iterations [17.4] 本研究では,異なるSCMからサンプリングした複数のデータセットに対して,単一モデルをトレーニングすることにより,構造因果モデル(SCM)の補正推定を提案する。
まず、まず、データセット埋め込みのアモータイズ学習にトランスフォーマーベースのアーキテクチャを使用し、次にFixed-Point Approach(FiP)を拡張して、データセット埋め込みに条件付きSCMを推論する。
副産物として,本手法はパラメータを更新することなく,新しいSCMから観測データや介入データを生成することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:20:54 GMT)
Vision Transformers Don't Need Trained Registers [17.4] 疎いニューロンの集合は、外れ値のトークンに高ノルムの活性化を集中させる役割を担っている。
これらのアーティファクトを緩和するために、トレーニング不要のアプローチを作成します。
その結果,テスト時のレジスタは,テスト時のレジスタトークンの役割を効果的に担っていることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:38:32 GMT)
Know-MRI: A Knowledge Mechanisms Revealer&Interpreter for Large Language Models [17.3] 我々は,大規模言語モデル(LLM)内の知識メカニズムを体系的に解析するために設計された,オープンソースの知識メカニズム探索・解釈器(Know-MRI)を提案する。
具体的には、異なる入力データと解釈手法を自動マッチングし、解釈出力を集約するコアモジュールを開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:03:02 GMT)
Boosting Gradient Leakage Attacks: Data Reconstruction in Realistic FL Settings [17.0] フェデレートラーニング(FL)は、生データを公開することなく、複数のクライアント間で協調的なモデルトレーニングを可能にする。
FLの中心にあるプライバシーを守る能力は、最近ホットボタンに関する議論のトピックとなった。
本稿では,現実的なFL環境においても,クライアントのデータを効果的に再構築できることを実証的に示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:17:06 GMT)
Text Embeddings Should Capture Implicit Semantics, Not Just Surface Meaning [17.0] テキスト埋め込み研究コミュニティは、表面的な意味を超えて、暗黙のセマンティクスを中心的なモデリング目標として受け入れるべきである、と我々は主張する。
現在の埋め込みモデルは、一般的にそのような深度に欠けるデータに基づいて訓練され、表面的な意味の獲得に報いるベンチマークで評価される。
我々のパイロット研究は、最先端のモデルでさえ、暗黙のセマンティックスタスクにおける単純化されたベースラインよりも、わずかに優れたパフォーマンスしか発揮していないことを示す、このギャップを強調している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:11:42 GMT)
Optimal Graph Reconstruction by Counting Connected Components in Induced Subgraphs [16.7] 本稿では,接続コンポーネント数に関する新しいクエリモデルを提案する。
たとえ$m = O(n)$であっても、$Omega(n2)$非適応クエリが要求されることを示す。
また2ラウンドの適応性のみを用いた$O(mlog n + nlog2 n)$クエリアルゴリズムも提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:22:49 GMT)
OpenRR-1k: A Scalable Dataset for Real-World Reflection Removal [16.5] 反射技術は写真やコンピュータビジョンの応用において重要な役割を担っている。
既存のテクニックは、高品質なインザワイルドデータセットの欠如によって妨げられている。
新たな視点から反射データセットを収集するための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:04:47 GMT)
Event-based Motion-Robust Accurate Shape Estimation for Mixed Reflectance Scenes [16.5] 本稿では,複合反射シーンの高速3次元イメージングを高精度に実現したイベントベース構造化光システムを提案する。
我々は、本質的に測定された反射を拡散、2バウンススペクトルおよび他の多重バウンス反射に分解できるエピポーラ制約を用いる。
得られたシステムは600$mumの深度誤差で混合反射シーンの高速かつモーションロバストな再構成を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:34:04 GMT)
Merging Smarter, Generalizing Better: Enhancing Model Merging on OOD Data [16.5] マルチタスク学習(MTL)は、さまざまなタスクデータセットのモデルを同時にトレーニングして、共通の機能を利用する。
近年の研究では、複数の独立モデルパラメータをMTLの統一モデルにマージする努力が続けられている。
LwPTV (Layer-wise Pruning Task Vector) を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:34:23 GMT)
LiftVSR: Lifting Image Diffusion to Video Super-Resolution via Hybrid Temporal Modeling with Only 4$\times$RTX 4090s [16.5] 拡散モデルは、知覚品質を向上させることによって高度なビデオ超解像(VSR)を持つ。
本稿では、PixArt-$alpha$に先立って画像の拡散を緩和し、最先端の結果を得るための効率的なVSRフレームワークLiftVSRを提案する。
いくつかの典型的なVSRベンチマークの実験では、LiftVSRは計算コストを大幅に削減して優れた性能を発揮することが示されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:49:33 GMT)
Towards Class-wise Fair Adversarial Training via Anti-Bias Soft Label Distillation [16.4] 敵対的トレーニング(AT)は、ディープニューラルネットワークの敵対的堅牢性を高める効果的なアプローチとして広く認識されている。
本稿では、この問題の根底にある要因を考察し、異なるクラスに対するソフトラベルの滑らかさの度合いを指摘する。
本稿では,反バイアスソフトラベル蒸留(ABSLD)を知識蒸留フレームワーク内で提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:20:34 GMT)
StereoVAE: A lightweight stereo-matching system using embedded GPUs [16.3] 組込みGPUによるステレオマッチングのための軽量システムを提案する。
これにより、ステレオマッチングにおける精度と処理速度のトレードオフを解消し、組込みシステムはリアルタイム処理を確実にしながらマッチング精度をさらに向上させることができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:39:31 GMT)
CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation [16.2] 本研究では,Large Language Models (LLMs) を用いたCADモデルにおけるパラメトリックシーケンスの生成について検討する。
CAD-Llamaは,パラメトリックな3次元CADモデルを生成するための事前学習LLMの強化を目的としたフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:44:51 GMT)
Human-Aligned Image Models Improve Visual Decoding from the Brain [16.2] 我々は,脳の信号を画像にマッピングするために,人間のアライン画像エンコーダを導入する。
我々の経験的結果は、この単純な修正によって画像検索精度が最大21%向上することを示すこの仮説を支持している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:23:31 GMT)
XGraphRAG: Interactive Visual Analysis for Graph-based Retrieval-Augmented Generation [16.1] 本研究では、RAG開発者がGraphRAGの重要なリコールを特定するのに役立つ視覚分析フレームワークを提案する。
我々は,ユーザ分析プロセスを容易にするために,インタラクティブな視覚化のセットを取り入れたプロトタイプシステムであるXGraphRAGを開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:14:30 GMT)
Understanding Software Engineering Agents Through the Lens of Traceability: An Empirical Study [16.0] ソフトウェアエンジニアリングエージェント(SWEエージェント)は、ユーザの入力を解釈し、環境フィードバックに応答することで、自律的に動作する。
本稿では,SWEエージェントの動作を,実行トレースのレンズを通してシステマティックに解析する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:41:54 GMT)
Safeguarding Multimodal Knowledge Copyright in the RAG-as-a-Service Environment [15.8] マルチモーダルRAGシステムにおける画像知識保護のための最初の透かしフレームワークであるAQUAを提案する。
AQUAは、頭字語に基づくトリガーと空間関係の手がかりの2つの補完手法を用いて、意味的信号を合成画像に埋め込む。
さまざまなモデルとデータセットにわたる実験により、AQUAは堅牢でステルス性があり、信頼性の高い著作権トレースを可能にしている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:56:02 GMT)
CrimeMind: Simulating Urban Crime with Multi-Modal LLM Agents [15.7] マルチモーダルな都市環境下での都市犯罪をシミュレートするための新しい枠組みであるCristMindを提案する。
我々の設計の重要な革新は、ルールアクティビティ理論(RAT)をクライムミンドのエージェントワークフローに統合することである。
アメリカの主要都市4都市での実験では、犯罪ミンドは犯罪ホットスポット予測と空間分布精度において従来のABMとディープラーニングベースラインの両方を上回っている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:29:07 GMT)
Unified Breakdown Analysis for Byzantine Robust Gossip [15.7] 分散機械学習は、誤った振る舞い(あるいはビザンティン)デバイスに対して脆弱である。
我々は、堅牢な分散アルゴリズムを構築するためのフレームワークであるF-RGを紹介する。
分散化されたアルゴリズムが許容できる敵の数に上限があることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:04:41 GMT)
Why Uncertainty Estimation Methods Fall Short in RAG: An Axiomatic Analysis [15.6] 不確実性推定(UE)はモデルの信頼性を定量化し、ユーザが応答信頼性を評価するのに役立つ。
本稿では,現在のUE手法では,検索・拡張生成設定における精度を確実に評価できないことを示す。
本稿では,既存手法の欠陥を識別し,改良手法の開発を導くための公理的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:54:11 GMT)
MOBODY: Model Based Off-Dynamics Offline Reinforcement Learning [15.5] 我々はオフラインのオフライン強化学習問題について検討し、そこでは、不一致の遷移を伴うオフラインデータセットからポリシーを学ぶことを目標としている。
モデルベースオフダイナミックスオフラインRLアルゴリズムMOBODYを提案する。
我々は MuJoCo ベンチマーク上で MOBODY を評価し,最先端のベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:36:54 GMT)
Matrix Product State on a Quantum Computer [15.4] 本稿では, 行列積状態(qMPS)の量子バージョンを提案し, 変分量子アルゴリズムを用いて正準形式で生成する。
変分量子固有解法のような広く使われている手法と比較して、この手法は局所最適化に使用される量子ビットの数を著しく削減することができる。
本手法は分散量子コンピューティングの可能性を秘めており,異なる計算系を融合させる可能性を秘めている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:06:59 GMT)
A Theory of Inference Compute Scaling: Reasoning through Directed Stochastic Skill Search [15.4] 大規模言語モデル(LLM)は、訓練と配備の間にかなりの計算量、エネルギー、財務資源を必要とする。
推論コストは、今やリソース全体の負担の重要かつ増大する要素である。
本稿では,学習したスキルグラフ上での推論を表現力として表現する一般的なフレームワークである有向スキルサーチ(DS3)を紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:47:48 GMT)
Fine-Grained Spatially Varying Material Selection in Images [15.1] 本稿では,光源や反射率の変動に頑健な画像の材料選択法を提案する。
本稿では,従来の方法よりも微細で安定した選択結果を得るマルチレゾリューション処理戦略を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:50:05 GMT)
Mitigating Prior Shape Bias in Point Clouds via Differentiable Center Learning [15.1] 微分可能中心サンプリングネットワーク(DCS-Net)と呼ばれる新しいソリューションを導入する。
グローバルな特徴再構成とローカルな特徴再構成の両方を非自明なプロキシタスクとして組み込むことで,情報漏洩問題に対処する。
実験により,本手法は既存の点雲モデルの表現能力を向上することを示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:39:57 GMT)
WD-DETR: Wavelet Denoising-Enhanced Real-Time Object Detection Transformer for Robot Perception with Event Cameras [15.1] 本稿では,WD-DETRネットワークをイベントカメラに用いるWavelet Denoising-enhanced Detection TRansformerを提案する。
まず、高密度なイベント表現を示し、テンソルとしてイベントをリアルタイムに再構築することを可能にする。
我々は,ロボット用共通搭載コンピュータであるNVIDIA Jetson Orin NXに提案手法を実装し,約35FPSのフレームレートを実現した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:24:50 GMT)
Differentially Private Relational Learning with Entity-level Privacy Guarantees [15.0] 本研究は,形式的エンティティレベルDP保証を用いた関係学習の原則的枠組みを提案する。
本稿では,実体発生頻度に基づいてクリッピング閾値を変調する適応的勾配クリッピング方式を提案する。
これらの貢献により、プライバシー保証が保証されたリレーショナルデータに対して、DP-SGDの修正版が提供される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:03:43 GMT)
MERIT: A Merchant Incentive Ranking Model for Hotel Search & Ranking [15.0] ホテル商人の目的をホテルS&Rシステムの設計に取り入れてインセンティブループを実現するための第一歩を踏み出す。
このインセンティブループを達成するには、3つの重要な設計課題を解決する必要がある。
本稿では,MERchant IncentiveランキングモデルであるMERITを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:33:44 GMT)
SoK: Machine Unlearning for Large Language Models [14.9] 大規模言語モデル(LLM)アンラーニングは機械学習において重要なトピックとなっている。
未学習の意図に基づく新しい分類法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:30:39 GMT)
CASE: Contrastive Activation for Saliency Estimation [14.8] 精度法は、モデルの予測にどの入力特徴が関係していると考えられるかを視覚化するために広く用いられている。
そこで本研究では,同一入力上で競合するクラスラベルを識別する手法として,クラス感度の診断試験を提案する。
本研究は, クラスラベルによらず, ほぼ同じ説明を導出し, 信頼性を問うものであることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:45:47 GMT)
Large Language Models Have Intrinsic Meta-Cognition, but Need a Good Lens [14.6] 本稿では,現在のレンズを用いたLarge Language Models(LLM)メタ認知の評価と,その改善方法について検討する。
具体的には,既存のレンズをベンチマークするための自動メタ認知評価フレームワークであるAutoMecoを提案する。
さらに、現在のメタ認知レンズを強化するために、訓練不要なマルコフ固有逆補正戦略であるMIRAを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:30:10 GMT)
Boosting Rust Unit Test Coverage through Hybrid Program Analysis and Large Language Models [14.5] 本稿では,大規模言語モデル(LLM)を活用して高カバレッジ単体テストを生成する手法であるPALMを提案する。
PALMはプログラム解析を行い、関数内の分岐条件を特定し、それを経路制約に結合する。
このアプローチを実装し、それを10のオープンソースのRustクラッドで評価します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:21:21 GMT)
Reed-Muller Codes for Quantum Pauli and Multiple Access Channels [14.5] 我々は、RMコードの開発と分析の範囲を、多重アクセスチャネル(MAC)および量子パウリチャネルに拡張する。
まず、付加的相関雑音を持つMACのクラスであるQ-MAC上でのRM符号の達成可能なレート領域を導出する。
次に、これらのQMACのレート領域と、パウリノイズチャネル用に設計された量子RM符号との接続を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:02:57 GMT)
NAM: A Normalization Attention Model for Personalized Product Search In Fliggy [14.4] 製品検索のパーソナライズのための正規化注意モデル(NAM)を提案する。
提案したNAMモデルは,最先端のベースラインモデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:46:05 GMT)
FZOO: Fast Zeroth-Order Optimizer for Fine-Tuning Large Language Models towards Adam-Scale Speed [14.4] 我々はAdam-Scale Speedに向けたFast Zeroth-Orderを紹介する。
FZOOは、バッチ化された片側推定を用いて収束に必要な総前方通過を減らす。
また、RademacherランダムベクトルGPUと並列処理を使用することで、バッチ毎の計算を高速化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:56:53 GMT)
DeepForm: Reasoning Large Language Model for Communication System Formulation [14.2] 通信システムの定式化は6Gと将来の無線技術の発展に不可欠である。
我々は,CSFRC(Communication System Formulation Reasoning Corpus)と呼ばれる,世界初となる大規模かつオープンソースなデータセットを,このドメインに対して慎重にキュレートした。
フレームワークには2段階のトレーニング戦略が採用されている。第1に,Chain-of-Thought(CoT)データを用いてドメイン知識を抽出し,第2にルールベース強化学習(Reinforcement Learning, RL)アルゴリズム,第2にReMaxに基づくC-ReMax。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:16:24 GMT)
Detecting State Manipulation Vulnerabilities in Smart Contracts Using LLM and Static Analysis [14.2] PriceSleuthは、Large Language Model(LLM)と静的解析を利用して、Price Manipulation(PM)攻撃を積極的に検出する新しい手法である。
今回,PriceSleuthの有効性を実証するために,予備実験を行った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:31:44 GMT)
Towards Reliable Proof Generation with LLMs: A Neuro-Symbolic Approach [14.2] 大型言語モデル(LLM)は厳密な論理的推論と記号的推論を必要とする形式的ドメインと競合する。
本稿では,LLMの生成強度と構造成分を組み合わせ,この課題を克服するニューロシンボリックアプローチを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:22:21 GMT)
StreamSplat: Towards Online Dynamic 3D Reconstruction from Uncalibrated Video Streams [14.2] 映像ストリームから動的3Dシーンをリアルタイムに再現することは、多くの実世界のアプリケーションにとって不可欠である。
任意の長さの動画ストリームを動的3D表現にオンラインで変換する,最初の完全なフィードフォワードフレームワークであるStreamSplatを紹介した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:52:36 GMT)
Is Noise Conditioning Necessary? A Unified Theory of Unconditional Graph Diffusion Models [14.2] 本研究では,ベルヌーイのエッジフリップの破損に着目した理論的枠組みを開発し,結合構造帰属雑音を含むより複雑なシナリオを包含するように拡張する。
以上の結果から,グラフデータ自体の高次元的な性質は,デノナイズ処理に十分な情報を符号化することが多いことが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:26:50 GMT)
HiSin: Efficient High-Resolution Sinogram Inpainting via Resolution-Guided Progressive Inference [14.0] HiSinは、高分解能誘導プログレッシブ推論による効率的なシノグラム塗布のための、新しい拡散ベースのフレームワークである。
低解像度でグローバル構造を段階的に抽出し、小さなパッチに対する高解像度の推論を無効にすることで、メモリ効率の低下を可能にする。
実験結果によると、HiSinはピークメモリ使用量を最大31.25%削減し、推論時間を最大18.15%削減し、データセット、解像度、マスク条件の塗装精度を維持する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:59:25 GMT)
ArchiLense: A Framework for Quantitative Analysis of Architectural Styles Based on Vision Large Language Models [14.0] 我々は1,765の高品質なアーキテクチャイメージとそれに対応するスタイルアノテーションからなるArchDiffBenchというプロのアーキテクチャスタイルデータセットを構築した。
アドバンストなコンピュータビジョン技術、ディープラーニング、機械学習を統合することで、ArchiLenseはアーキテクチャイメージの自動認識、比較、正確な分類を可能にする。
ArchiLenseはアーキテクチャスタイルの認識において、92.4%の一貫性と専門家アノテーション、84.5%の分類精度で高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:26:01 GMT)
Nonsmooth Nonparametric Regression via Fractional Laplacian Eigenmaps [14.0] 真の回帰関数が必ずしも滑らかでない場合に、非パラメトリック回帰法を開発する。
より具体的には、我々のアプローチは分数ラプラシアンを使い、真の回帰関数が次数$sin (0,1)$のソボレフ空間にある場合を扱うように設計されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:28:29 GMT)
MedVersa: A Generalist Foundation Model for Medical Image Interpretation [13.9] 私たちはMedVersaを紹介します。MedVersaは、数千万のコンパイルされた医療インスタンスに基づいてトレーニングされたジェネラリスト基盤モデルです。
MedVersaは9つのタスクで最先端のパフォーマンスを達成し、時には10%以上のパフォーマンスを達成している。
本研究は, 医用画像解釈の進歩と臨床専門知識のサポートにおいて, フレキシブルでマルチモーダルなAIシステムの価値を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:12:33 GMT)
Mitigating Reward Over-optimization in Direct Alignment Algorithms with Importance Sampling [13.9] RLHF(Reinforcement Learning from Human Feedback)の代替として、DAA(Direct Alignment Algorithms)が登場した。
これらの手法は、モデルが基準ポリシーから逸脱する過度な最適化の影響を受けやすく、トレーニングが進むにつれて性能が低下する。
本稿では,オフラインDAAの過度最適化問題を軽減するために,新しい重要サンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:45:26 GMT)
Dense ReLU Neural Networks for Temporal-spatial Model [13.8] 非パラメトリック推定にRectified Linear Unit (ReLU) アクティベーション機能を利用する完全接続深層ニューラルネットワークに着目する。
我々は、観測された測定における時間的および空間的依存に対処するため、収束率につながる非漸近境界を導出する。
我々はまた、多様体上のデータをモデル化し、高次元データの本質的な次元性を探求することで、次元性の呪いに取り組む。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:53:00 GMT)
Towards Robust Deep Reinforcement Learning against Environmental State Perturbation [13.8] 深層強化学習(DRL)における敵対的攻撃と堅牢性は、様々な脅威モデルにおいて広く研究されている。
本研究では, キャリブレーション対策として, 非標的攻撃方式を導入し, 環境変動の問題を定式化する。
そこで我々は,破滅的な失敗を避けるため,まず指導的学習を通じてエージェントを調整し,その後,強化学習でエージェントを逆さまに訓練する防衛フレームワーク,Boosted Adversarial Training (BAT)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:32:31 GMT)
VReST: Enhancing Reasoning in Large Vision-Language Models through Tree Search and Self-Reward Mechanism [13.8] 我々は,モンテカルロ木探索と自己回帰機構を用いて,LVLMにおける推論を強化するトレーニングフリーアプローチであるVReSTを提案する。
VReSTは現在のプロンプトメソッドを超え、3つのマルチモーダル数学的推論ベンチマークで最先端のパフォーマンスを確保する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:02:36 GMT)
Assessing and Advancing Benchmarks for Evaluating Large Language Models in Software Engineering Tasks [13.7] 大規模言語モデル(LLM)は、ソフトウェア工学(SE)で人気が高まっている。
この分野での有効性を 理解するためには 有効性の評価が不可欠です
本稿では、191ベンチマークの徹底的なレビューを行い、どのベンチマークが利用可能か、どのようにベンチマークを構築しているか、これらのベンチマークの将来展望の3つの主要な側面に対処する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:03:10 GMT)
Bayesian Inverse Physics for Neuro-Symbolic Robot Learning [13.6] 現実世界のロボットアプリケーションは適応的で解釈可能で、データ効率のよい学習パラダイムを必要とする。
我々は、データ駆動学習と意図的に構造化された推論を組み合わせるための概念的枠組みを導入する。
このようなハイブリッドなニューロシンボリックアーキテクチャは、次世代の自律システムには不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:53:31 GMT)
A Survey on Large Language Models for Mathematical Reasoning [13.6] 本研究では,大規模言語モデル(LLM)における数学的推論能力の発達について検討する。
我々は,教師付き微調整や強化学習などの微調整アプローチから,訓練不要なプロンプトまで,数学的推論を強化する手法をレビューする。
顕著な進歩にもかかわらず、キャパシティ、効率、一般化の点で根本的な課題は残る。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:44:28 GMT)
PatchPilot: A Cost-Efficient Software Engineering Agent with Early Attempts on Formal Verification [13.6] パッチの有効性,安定性,コスト効率のバランスをとるエージェントパッチであるPatchPilotを提案する。
PatchPilotは、コスト(インスタンスあたり1ドル未満)を維持し、より高い安定性を確保しながら、既存のオープンソースメソッドよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:19:40 GMT)
Textual Unlearning Gives a False Sense of Unlearning [13.5] 言語モデル(LM)は、重要なユーザ情報を含むトレーニングデータを「記憶する」傾向がある。
機械学習は、LMが特定のテキストを効率的に「忘れる」ための有望なアプローチとして登場した。
テキストによるアンラーニングは、非ラーニングの誤った感覚を与え、より堅牢でセキュアなアンラーニングメカニズムの必要性を強調している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:31:07 GMT)
Generative Psycho-Lexical Approach for Constructing Value Systems in Large Language Models [13.5] 大規模言語モデル(LLM)は、その本質的な価値に関する懸念を提起している。
本研究は、生成心理学的アプローチ(GPLA)の導入によるギャップに対処する。
LLMに適した心理学的基礎を持つ5要素値システムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:05:35 GMT)
Intrinsic Bias is Predicted by Pretraining Data and Correlates with Downstream Performance in Vision-Language Encoders [13.5] 本稿は,CLIPモデルの上流事前学習要因と下流性能が内在バイアスにどのように関係しているかを,これまでで最大の包括的分析結果として提示する。
55のアーキテクチャを使用して,26のデータセットでトレーニングされた131のCLIPモデルを,さまざまなサイズで検討した。
事前トレーニングデータセットの選択がバイアスの上流で最も重要な予測要因であることに気付きました。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:37:18 GMT)
InceptionMamba: An Efficient Hybrid Network with Large Band Convolution and Bottleneck Mamba [13.4] InceptionNeXtは、画像分類と多くの下流タスクにおいて優れた競争力を示している。
InceptionNeXtは、平行1次元のストリップ畳み込みに基づいて構築され、異なる次元に沿って空間的依存関係をキャプチャする限られた能力に悩まされている。
本稿では,これらの制約を克服するために,InceptionMambaと呼ばれる新しいバックボーンアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:31:05 GMT)
"How do you even know that stuff?": Barriers to expertise sharing among spreadsheet users [13.3] スプレッドシートの価値を取り巻く社会的規範と信念は、共有行動におけるユーザエンゲージメントに影響を及ぼす。
プロのスプレッドシートユーザを対象に31回の半構造化インタビューを行った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:21:29 GMT)
MLVTG: Mamba-Based Feature Alignment and LLM-Driven Purification for Multi-Modal Video Temporal Grounding [13.0] Video Temporal Groundingは、自然言語クエリに対応するビデオクリップをローカライズすることを目的としている。
既存のTransformerベースの手法は、しばしば冗長な注意と準最適マルチモーダルアライメントに悩まされる。
MLVTGは,MambaAligner と LLMRefiner の2つの重要なモジュールを統合した新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:20:12 GMT)
EquivaMap: Leveraging LLMs for Automatic Equivalence Checking of Optimization Formulations [13.0] 2つの最適化定式化が等価であるかどうかを決定するための公式な基準である準カルプ同値を導入する。
EquivaMapは、大規模言語モデルを利用して、スケーラブルで信頼性の高い同値チェックのために、そのようなマッピングを自動的に検出するフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:55:30 GMT)
Multimodal Rationales for Explainable Visual Question Answering [12.9] VQA(Visual Question Answering)は、画像の内容に関する質問に対する回答を予測するための課題である。
MRVQAと呼ばれる新しいモデルを提案し、予測された回答をサポートするために視覚的およびテキスト的根拠を提供する。
MRVQAは、新たな合理的な生成を通じて、新しい最先端の結果を達成し、モデルの信頼性を高める。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:20:36 GMT)
Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning [12.9] マルチLLMルーティングとアグリゲーションを逐次決定プロセスとして定式化する強化学習フレームワークである textbf Generalization-R1 を提案する。
学習のガイドには,形式報酬,最終結果報酬,性能とコストトレードオフ最適化のための新たなコスト報酬を含む軽量なルールベース報酬を用いる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:56:45 GMT)
GUIRoboTron-Speech: Towards Automated GUI Agents Based on Speech Instructions [12.8] GUIRoboTron-Speechは、音声命令とデバイス上のスクリーンショットを受信してアクションを予測する、エンドツーエンドの自律GUIエージェントである。
私たちのコードとデータセットはhttps://github.com/GUIRoboTron/GUIRoboTron-Speech.comで公開されています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:16:27 GMT)
Curvature Tuning: Provable Training-free Model Steering From a Single Parameter [12.5] 曲率チューニング(英: Curvature Tuning)は、モデルの決定境界を変調する解釈可能かつ原則化されたステアリング法である。
我々は,CTがモデル決定境界曲率を順応的に調整し,スムーズな関数空間にモデルを投影することを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:37:05 GMT)
Federated Generalised Variational Inference: A Robust Probabilistic Federated Learning Framework [12.5] FedGVIは確率的フェデレートラーニング(FL)フレームワークで、事前およびおそらく誤特定に対して堅牢である。
固定点収束、キャビティ分布の最適性、そして確率的不特定性に対する証明可能なロバスト性の観点から理論的解析を行う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:39:15 GMT)
SMCD: High Realism Motion Style Transfer via Mamba-based Diffusion [12.4] モーションスタイルの転送により、仮想デジタル人間は同じ動きの異なるスタイルを素早く切り替えることができる。
既存の手法の多くは2ストリーム構造を採用しており、内容とスタイルの動作の本質的な関係を無視する傾向にある。
コンテンツとスタイルの両方から特徴を同時に抽出するUMSD(Unified Motion Style Diffusion)フレームワークを提案する。
また,動作スタイル変換の分野における最初のアプローチである運動スタイル・マンバ(MSM)デノイザを導入し,マンバの強力なシーケンスモデリング能力を活用する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:34:13 GMT)
Multimodal Representation Alignment for Cross-modal Information Retrieval [12.4] 異なる機械学習モデルは、異なる方法で同じ基礎概念を表現することができる。
この可変性は、入力として与えられた1つのモダリティで対応する表現を識別することを目的として、Wildのマルチモーダル検索において特に有用である。
そこで本研究では,視覚言語モデルと統合単調モデルの両方から得られる視覚とテキストの埋め込みの幾何学的関係について検討する。
次に、ニューラルネットワークを介して実装された4つの標準的な類似度メトリクスと2つの学習した指標を使用して、これらの表現を調整します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:16:26 GMT)
scSSL-Bench: Benchmarking Self-Supervised Learning for Single-Cell Data [12.4] 自己教師付き学習は、単細胞データから生物学的に意味のある表現を抽出するための強力なアプローチであることが証明されている。
scSSL-Benchは、19のSSLメソッドを評価する包括的なベンチマークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:31:42 GMT)
Pointwise confidence estimation in the non-linear $\ell^2$-regularized least squares [12.4] 固定設計による $ell2$-regularized 非線形最小二乗集合の高確率非漸近信頼度推定について検討する。
つまり、任意の固定テスト入力に対して$x$の予測を保持することを意味する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:59:00 GMT)
A Probability-guided Sampler for Neural Implicit Surface Rendering [12.2] ニューラル・ラジアンス・フィールド(NeRF)のいくつかの変種は、合成画像の精度と3Dシーン/オブジェクトの表面再構成を大幅に改善した。
重要な特徴は、可能なすべての入力データ、具体的には射影線に沿ったすべてのピクセルとポテンシャル3Dポイントでニューラルネットワークをトレーニングできないことである。
本稿では、前景の暗黙的な表面表現を活用し、3次元画像投影空間における確率密度関数をモデル化し、興味のある領域に向けて光線をよりターゲット的にサンプリングする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:28:16 GMT)
Hyperspectral Image Classification via Transformer-based Spectral-Spatial Attention Decoupling and Adaptive Gating [12.2] ディープニューラルネットワークは、ハイパースペクトル画像分類においていくつかの課題に直面している。
本稿ではSTNetと呼ばれる新しいネットワークアーキテクチャを提案する。
提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:24:35 GMT)
Causality-aware Safety Testing for Autonomous Driving Systems [12.1] 総合的な評価には、異なる条件下でさまざまな種類の違反を引き起こす可能性のある、さまざまなシナリオにわたるテストが必要である。
本稿では,自律運転システムの効率的な総合的なテストを実現するためのファジリング手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:53:26 GMT)
In Praise of Stubbornness: An Empirical Case for Cognitive-Dissonance Aware Continual Update of Knowledge in LLMs [12.1] 大きな言語モデルは矛盾を無差別に受け入れ、破壊的な干渉を引き起こし、最大80%の無関係な知識を破壊します。
我々は,単純なモデル特徴を用いて矛盾情報を確実に検出できることを実証し,潜在的な保護機構を提供する。
これらの発見は、人間のように、破壊的な上書きを許すのではなく、自然に矛盾に抵抗できる新しいアーキテクチャを動機付けている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:44:01 GMT)
Adapting Vision-Language Foundation Model for Next Generation Medical Ultrasound Image Analysis [12.1] 視覚言語基礎モデルは様々なコンピュータビジョンアプリケーションで優れている。
視覚言語基礎モデルのためのドメイン適応手法を開発した。
本手法は,超音波画像解析のための視覚言語基盤モデルの性能を効果的に向上させることができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:37:51 GMT)
Superactivation of Bell nonlocality in pure anyonic states [12.1] 我々は,ベル非局所性と異種状態の絡み合いの関係について検討した。
非ゼロ異方性絡み合いエントロピー (AEE) を持つ純異方性状態は局所的であるが, 集合的測定を受けると非局所性を示す。
本研究は, エンタングルメントと非局所性の関係に関する新たな知見を提供するものである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:44:06 GMT)
Unifying Block-wise PTQ and Distillation-based QAT for Progressive Quantization toward 2-bit Instruction-Tuned LLMs [12.1] 本稿では,蒸留法に基づく量子化学習(Distill-QAT)とブロックワイズ後量子化を統合化するUPQ(Unified Progressive Quantization)を提案する。
我々の知る限りでは、UPQが独自の後トレーニングデータに頼ることなく、オープンソースの命令チューニング LLM をINT2 に量子化できることを最初に示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:26:32 GMT)
On Finetuning Tabular Foundation Models [12.0] TabPFNv2は、小規模データセット上の従来のGBDTベースのメソッドよりも優れたパフォーマンスを主張する。
多様なデータセットに対してTabPFNv2の様々な微調整戦略を評価する。
実験対象の問合せ表現の点生成物は, 勾配適応後, 目標の類似性をより正確に反映していることから, 微調整の成功が示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:52:31 GMT)
mSTEB: Massively Multilingual Evaluation of LLMs on Speech and Text Tasks [12.0] 我々は,大規模言語モデル(LLM)の性能を幅広いタスクで評価するための新しいベンチマークであるmSTEBを紹介する。
我々は,Gemini 2.0 Flash や GPT-4o (Audio) などの主要な LLM や Qwen 2 Audio や Gemma 3 27B といった最先端のオープンモデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:15:08 GMT)
A Comprehensive Evaluation of Parameter-Efficient Fine-Tuning on Code Smell Detection [12.0] コードの臭いは、ソフトウェアシステムの品質に悪影響を及ぼす、最適でないコーディングプラクティスです。
既存の検出手法は、コードまたは機械学習(ML)とディープラーニング(DL)技術に依存しており、しばしば不満足なパフォーマンスのような制限に直面している。
本研究では,Small (SLMs) とLarge Language Models (LLMs) を用いて, 4種類のコードの臭いを検知するための最先端PEFT法について検討した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:01:09 GMT)
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap [12.0] 教師なし領域一般化問題のマルチモーダル版に取り組む。
我々のフレームワークは、ソースデータセットを共同視覚言語空間で正確かつ効率的に検索できるという前提に依存している。
我々は,テキストクエリと粗い量子化に使用される画像セントロイドとの距離が大きいため,近接した近接探索が低リコールに悩まされていることを理論的に示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:51:05 GMT)
Provably Accurate Adaptive Sampling for Collocation Points in Physics-informed Neural Networks [11.9] 物理インフォームドニューラルネットワーク(PINN)は、サロゲート解法を効率的に学習する方法として登場した。
本稿では,PDE残差のヘシアンに基づくコロケーション点の精度の高いサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:43:03 GMT)
Stop Misusing t-SNE and UMAP for Visual Analytics [11.9] 視覚分析における t-SNE と UMAP の誤用はますます一般的になっている。
我々は114件の論文の文献レビューを行い、誤用の有無を検証し、その背景にある理由を分析した。
我々は,DRのより合理的な利用を促進するために,今後の方向性と具体的な行動項目を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:21:42 GMT)
Measuring Data Science Automation: A Survey of Evaluation Tools for AI Assistants and Agents [11.8] 大規模言語モデル(LLM)は、データサイエンスのアシスタントとしてますます使われている。
データサイエンス活動の適正な自動化は、LLMエージェントの台頭によって約束されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:47:22 GMT)
Integrated Analysis for Electronic Health Records with Structured and Sporadic Missingness [11.6] 本稿では電子健康記録(EHR)に適した新しい計算法を提案する。
これらのギャップに対処することにより、本手法は、分析の統合、データ有用性の向上、および人口健康の理解を促進するための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:59:49 GMT)
TTrace: Lightweight Error Checking and Diagnosis for Distributed Training [11.5] TTraceは、分散トレーニングにおいて、サイレントバグを検出し、ローカライズする最初のシステムである。
TTraceは、BF16およびFP8を含む低精度なレシピを含む様々なトレーニングレシピに有効である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:39:14 GMT)
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models [11.5] ステートスペースモデル(SSM)は、一貫したメモリ使用量と高性能のため、トランスフォーマーの魅力的な代替品として浮上している。
これを解決するために、ビット幅の少ないデータフォーマットでSSMを定量化することで、モデルのサイズを減らし、ハードウェアアクセラレーションの恩恵を受けることができる。
We present Quamba2, compatible with W8A8, W4A8, W4A16 for both Mamba1 and Mamba2 backbones。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:00:25 GMT)
ClassInvGen: Class Invariant Synthesis using Large Language Models [11.4] ClassInvGenは実行可能なクラス不変量とテスト入力を共同生成するメソッドである。
ClassInvGenは、(コードから)仕様を生成するために純粋なLCMベースの技術より優れていることを示す。
また、広く使われている高積分C++内のいくつかのクラスについてケーススタディを行い、実世界のコードに適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:11:53 GMT)
EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution [11.3] Enhancing Anything Model (EAM)はBlind Super-Resolution法である。
画像復元を効果的に誘導する新しいブロックである$Psi$-DiTを導入する。
EAMは、複数のデータセットにまたがる最先端の結果を達成し、定量的メトリクスと視覚的品質の両方において、既存の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:05:53 GMT)
Fusing Cross-modal and Uni-modal Representations: A Kronecker Product Approach [11.3] クロスモーダル埋め込みは、モダリティ間の表現の整合化において有望な結果を得た。
一方、単一モダリティ埋め込みはドメインに優れるが、クロスモダリティアライメント能力は欠如している。
単一モードの埋め込みとクロスモーダルな埋め込みを統合する手法RP-KrossFuseを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:57:58 GMT)
Can LLMs Generate Reliable Test Case Generators? A Study on Competition-Level Programming Problems [11.1] 大規模言語モデル(LLM)は、推論中に複雑なタスクに対処できるコード生成において顕著な能力を示している。
テストケースジェネレータ(LLM生成)のベンチマークであるTCGBenchを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:38:57 GMT)
Multi-Teacher Language-Aware Knowledge Distillation for Multilingual Speech Emotion Recognition [11.0] 本稿では,SERを英語,フィンランド語,フランス語で前進させる新しい言語対応多教師知識蒸留法を提案する。
学生モデルは、英語データセットの72.9の重み付きリコールとフィンランドデータセットの63.4の非重み付きリコールと、最先端のパフォーマンスを示す。
我々の手法は、悲しみや中立的な感情に対するリコールの改善に優れていますが、それでも怒りや幸福を認識する上での課題に直面しています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:04:07 GMT)
TinyLLaVA-Video: Towards Smaller LMMs for Video Understanding with Group Resampler [10.9] 約3.6Bパラメータを持つ軽量で強力なビデオ理解モデルであるTinyLLaVA-Videoを紹介した。
我々の設計の基盤はビデオレベルのグループ再サンプリングであり、ビデオレベルの視覚トークン数を著しく削減し、制御する新しいメカニズムである。
TinyLLaVA-Videoは例外的な効率を示し、8A100-40GのGPUで1日間のトレーニングしか必要としない。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:30:19 GMT)
Efficient Fine-Tuning of Quantized Models via Adaptive Rank and Bitwidth [10.9] QLoRAは、低ビット量子化とLoRAを効果的に組み合わせて、大規模言語モデル(LLM)のためのメモリフレンドリーな微調整を実現する。
部分キャリブレーションデータを用いて、各層に対する量子化成分と低ランク空間のランクを共同で探索する、統一的かつ勾配のない戦略である textbfQR-Adaptor を提案する。
提案手法はGSM8Kに対して4.89%の精度向上を実現し、4ビット設定のメモリフットプリントを維持しつつ、16ビットの微調整モデルよりも優れるケースもある。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:41:35 GMT)
Can LLMs Interpret and Leverage Structured Linguistic Representations? A Case Study with AMRs [10.8] 本稿では,Large Language Models (LLMs) が構造化言語表現の形で文脈情報を活用する能力を評価する。
抽象的意味表現(AMR:Abstract Meaning Representation)構造を多種多様な言語タスクに適用し,短いコンテキストと長いコンテキストの両方を符号化することの影響について検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:47:54 GMT)
Network Threat Detection: Addressing Class Imbalanced Data with Deep Forest [10.6] 本研究は,マルウェア検出のための機械学習技術に関する包括的実証分析を行うことにより,検出課題に対処する。
いくつかの機械学習技術を実装し比較する。
本研究は, アンサンブル法, 特にgcForestと適切な不均衡処理手法を組み合わせることにより, 従来手法よりも優れた検出性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:49:07 GMT)
Paths to Causality: Finding Informative Subgraphs Within Knowledge Graphs for Knowledge-Based Causal Discovery [10.6] 本稿では,知識グラフ(KG)をLarge Language Models(LLM)と統合し,知識に基づく因果探索を強化する新しい手法を提案する。
本稿では,KGs内の情報的メタパスに基づくサブグラフを特定し,ラーニング・トゥ・ランクモデルを用いて,これらのサブグラフの選択をさらに洗練する。
本手法は,F1スコアにおいて最大44.4ポイントのベースラインを上回り,多種多様LLMおよびKGで評価した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:13:55 GMT)
Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch [10.6] Twitchの自動モデレーションツール(texttAutoMod$)の監査を実施し、ヘイトフルコンテンツのフラグ付けの有効性を調査します。
我々は、誤用、人種差別、能力主義、ホモフォビアを含むあからさまに憎しみのあるコンテンツをフラグ付けする$textttAutoMod$の精度を測定した。
実験の結果、いくつかのデータセットで最大94%のヘイトフルなメッセージが、モデレーション信号としてslursに依存していることが判明した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:22:06 GMT)
CAF-I: A Collaborative Multi-Agent Framework for Enhanced Irony Detection with Large Language Models [10.6] 本稿ではCAF-I(Collaborative Agent Framework for Irony)を紹介する。
CAF-Iはコンテキスト、セマンティック、レトリックの特殊エージェントを使用し、多次元解析を行う。
ベンチマークデータセットの実験は、CAF-Iの最先端のゼロショット性能を確立する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:05:06 GMT)
TSRec: Enhancing Repeat-Aware Recommendation from a Temporal-Sequential Perspective [10.4] 逐次的再認識勧告(TSRec)と呼ばれる新しいモデルを提案する。
TSRecには3つの主要なコンポーネントがある: 1) ユーザ固有の時間表現モジュール(UTRM)。
2) 項目別時間間隔情報を副次情報として組み込んだ項目別時間表現モジュール (ITRM) を用いて, ユーザの反復行動系列のデータ空間問題を緩和する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:50:19 GMT)
SAFEFLOW: A Principled Protocol for Trustworthy and Transactional Autonomous Agent Systems [10.4] 大規模言語モデル(LLM)や視覚言語モデル(VLM)の最近の進歩は、複雑な推論とマルチモーダルツールの使用が可能な強力な自律エージェントを可能にしている。
能力の増大にもかかわらず、今日のエージェントフレームワークは脆弱であり、セキュアな情報フロー、信頼性、マルチエージェント調整のための原則的なメカニズムが欠如している。
SAFEFLOWは信頼性の高いLDM/VLMベースのエージェントを構築するための新しいプロトコルレベルフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:47:37 GMT)
Big Help or Big Brother? Auditing Tracking, Profiling, and Personalization in Generative AI Assistants [10.4] Generative AI(GenAI)ブラウザアシスタントは、WebブラウザにGenAIの強力な機能を統合することで、質問応答、コンテンツ要約、エージェントナビゲーションなどのリッチなエクスペリエンスを提供する。
現在ブラウザ拡張機能として利用可能なこれらのアシスタントは、検索やクリックデータなどの詳細なブラウジングアクティビティを追跡するだけでなく、フォームを埋めたり、プライバシー上の懸念を生じさせるようなタスクを自律的に行うこともできる。
本研究では,ユーザの属性や興味に基づいて,ユーザをプロファイルし,回答をパーソナライズする能力について検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:45:18 GMT)
On Monotonicity in AI Alignment [10.2] 本稿では、一般比較に基づく選好学習フレームワークにおける(非)単調性の根本原因について検討する。
穏やかな仮定の下では、そのような方法が局所対単調性(英語版)と呼ばれるものを満たすことが証明される。
また,モノトニティの形式化の花束を提供し,その保証に十分な条件を特定し,学習モデルがモノトニティ違反にどのように影響するかを評価するためのツールボックスを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:17:48 GMT)
Gender Fairness of Machine Learning Algorithms for Pain Detection [10.2] 本稿では,UNBC-McMaster Shoulder Pain Expression Archive Databaseで学習した機械学習(ML)とディープラーニング(DL)アルゴリズムの性別フェアネスについて検討する。
従来のMLアルゴリズムである線形サポートベクトルマシン(L SVM)と放射基底関数SVM(RBF SVM)をDL法、畳み込みニューラルネットワーク(CNN)、視覚変換器(ViT)と比較した。
ViTは最高精度と公正度指標の選択を達成したが、すべてのモデルは性別ベースの偏見を示していた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:08:22 GMT)
Fairness is Not Silence: Unmasking Vacuous Neutrality in Small Language Models [10.2] オンデバイスおよびリソース制約のあるデプロイメントのためのSLM(Small Language Models)は、倫理的リスクに対する私たちの理解を大きく上回っています。
0.5から50億のパラメータにまたがる命令調整SLMの大規模監査を行った。
ゼロショットプロンプト下でのBBQベンチマークを用いて、あいまいで曖昧な文脈における実用性と公平性の両方を分析する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:21:09 GMT)
Enhancing Arabic Automated Essay Scoring with Synthetic Data and Error Injection [10.2] AES(Automated Essay Scoring)は,言語学習者の文章の質評価,作業負荷の低減,リアルタイムフィードバックなどにおいて重要な役割を担っている。
本稿では,Large Language Models(LLM)とTransformerモデルを利用して,AESのためのアラビア語エッセイを生成する。
3,040の注釈付きエッセイのデータセットを作成し、2つのメソッドでエラーを注入します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:32:29 GMT)
Preference-Driven Multi-Objective Combinatorial Optimization with Conditional Computation [10.2] POCCOはサブプロブレムのためのモデル構造を適応的に選択できる新しいプラグイン・アンド・プレイフレームワークである。
そこで本研究では,勝利と敗退の間のペアワイズな選好を学習する選好駆動最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:25:06 GMT)
PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips [10.1] 本稿では,モデルパラメータのビットワイズによるジェイルブレーキングを誘導する,商用規模(人間対応)の言語モデルに対する新たな攻撃手法を提案する。
我々の攻撃は、以前のビットフリップ攻撃と同様のシステムで確実にジェイルブレイクを誘発できることを示す。
当社のアプローチは高RH安全性システムに対しても有効である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:58:41 GMT)
Sparse Spectral Training and Inference on Euclidean and Hyperbolic Neural Networks [10.0] Low-Rank Adaptation (LoRA) と ReLoRA は低ランク構造で課題に直面している。
予備学習におけるメモリ使用量の最適化を目的としたスパーススペクトルトレーニング(SST)を提案する。
SSTは、他の低ランクメソッドとフルランクトレーニングの間の難易度ギャップを97.4%削減する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:04:10 GMT)
Data-Efficient Challenges in Visual Inductive Priors: A Retrospective [10.0] ディープラーニングは、うまく動作するモデルをトレーニングするために、大量のデータを必要とします。
データ不足の設定では、パフォーマンスが劣化する可能性がある。
データ不足環境でのトレーニングモデルにどのようなディープラーニング手法が有用かを検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:21:48 GMT)
MAMBO: High-Resolution Generative Approach for Mammography Images [9.9] 本報告では,MAMmography ensemBle mOdel (MAMBO)について述べる。
この思慮深い設計により、MAMBOは最大3840×3840ピクセルの非常にリアルなマンモグラフィを生成することができる。
数値および放射線学の検証を含む実験は、画像生成、超解像、異常検出におけるMAMBOの能力を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:37:21 GMT)
On the Hardness of Sampling from Mixture Distributions via Langevin Dynamics [9.8] Langevin Dynamics (LD) はそのスコア関数を用いて確率分布からサンプリングすることを目指している。
混合分布から採取したLDについて検討し,その収束特性を理論的に検討した。
本稿では,データベクトルを小サイズのパッチに分割し,前回のパッチで逐次条件付きパッチを生成するChained Langevin Dynamics(Chained-LD)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:48:36 GMT)
Do Concept Replacement Techniques Really Erase Unacceptable Concepts? [9.8] 概念置換技術(CRT)は、しばしばモデルから受け入れられない概念を「取り除く」ことで、この問題に対処することを目的としている。
優れたCRTは、許容できない概念を置き換える一方で、生成モデルへの入力で指定された他の概念を保存すべきである、と我々は主張する。
本稿では,有効性と忠実性の両方を達成するために,ターゲット画像編集手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:02:36 GMT)
Exploring the Capabilities of the Frontier Large Language Models for Nuclear Energy Research [9.8] オークリッジ国立研究所のAI for Nuclear Energyワークショップは、核融合と核分裂の研究を加速する大規模言語モデル(LLM)の可能性を評価した。
14の学際チームがChatGPT、Gemini、Claude、その他のAIモデルを使って、さまざまな核科学の課題を1日で調査した。
その結果、専門家主導のプロンプトエンジニアリングが成功し、物理学に基づく手法の代替ではなく、補完的なツールとしてAIを扱いました。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:28:18 GMT)
Lightweight Dataset Pruning without Full Training via Example Difficulty and Prediction Uncertainty [9.7] 早期のトレーニング段階から重要なサンプルを特定するために,難易度と不確実性を考慮した軽量度スコア(DUAL)を導入する。
また, 極端破砕時の破滅的精度低下に対処するために, ベータ分布を用いた比適応サンプリングを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:30:45 GMT)
MD-ViSCo: A Unified Model for Multi-Directional Vital Sign Waveform Conversion [9.6] ターゲット波形を生成可能な統合フレームワークであるMulti-Directional Vital-Sign Converter (MD-ViSCo)を提案する。
MD-ViSCoは、アダプティブインスタンス正規化(AdaIN)を利用して異なる波形スタイルをキャプチャするSwin Transformerと統合された浅い1次元U-Netを使用している。
我々のフレームワークは、すべての波形タイプで平均して最先端のベースラインを超え、平均絶対誤差(MAE)を8.8%下げ、ピアソン相関(PC)を2つのデータセットで4.9%改善する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:14:52 GMT)
On the Stability of the Jacobian Matrix in Deep Neural Networks [9.6] 我々は、疎度と弱相関重みに対応するディープニューラルネットワークの一般的な安定性定理を確立する。
この結果は、確率行列理論の最近の進歩に依拠し、より広範なネットワークモデルにおけるスペクトル安定性の厳密な保証を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:04:42 GMT)
Towards a Knowledge Base of Common Sustainability Weaknesses in Green Software Development [9.5] 本稿では,コードに一般的に発生する持続可能性弱点の標準的な知識基盤の開発の必要性を動機づける。
ソフトウェア弱点に関する既存の知識が、重大なデューディリジェンスを伴わずに持続可能性に"as is"をタグ付けできない理由を実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:03:58 GMT)
Model-Free Kernel Conformal Depth Measures Algorithm for Uncertainty Quantification in Regression Models in Separable Hilbert Spaces [9.5] 本研究では,条件付き深度測定と統合深度測定に基づくモデルフリー不確実性定量化アルゴリズムを提案する。
新しいアルゴリズムは、予測器と応答が分離可能なヒルベルト空間で定義されるとき、予測領域と許容領域を定義するのに使うことができる。
身体活動に関するデジタルヘルスアプリケーションを通じて、我々のアプローチの実践的妥当性を実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:25:37 GMT)
Did I Faithfully Say What I Thought? Bridging the Gap Between Neural Activity and Self-Explanations in Large Language Models [9.5] LLM(Large Language Models)は、自由テキストの自己自然言語説明(self-NLE)を生成し、その回答を正当化する能力を示した。
本研究は, LLM生成自己NLEの忠実度を定量的に測定する, フレキシブルな枠組みを導入する。
提案するフレームワークは汎用的で,自己NLEとモデル推論の直接的な関係を確立することにより,自己NLEの忠実性に対する深い洞察を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:30:53 GMT)
When Uncertainty Leads to Unsafety: Empirical Insights into the Role of Uncertainty in Unmanned Aerial Vehicle Safety [9.4] 本研究は、UAVの行動の不確実性と飛行の不安全との関係について検討する。
不確実性を定量化することにより、飛行スーパーバイザーとして機能する安全でない予測器を開発することができる。
スーパーリアリストは、96%の精度と93%のリコールで不確実な振る舞いを検出することで高いパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:36:19 GMT)
Bridging RDF Knowledge Graphs with Graph Neural Networks for Semantically-Rich Recommender Systems [9.4] グラフニューラルネットワーク(GNN)を用いたRDF知識グラフの総合的な統合を提案する。
我々の主な焦点は、様々なGNNの詳細な評価である。
我々は,RDF KGのセマンティック・リッチネスを活用することで,リコメンダシステムを大幅に改善できることを実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:38:24 GMT)
Flexible Tool Selection through Low-dimensional Attribute Alignment of Vision and Language [9.4] 柔軟なツール選択は、人間が他の種と区別する複雑な認知能力を反映している。
視覚的ツール認識と言語的タスク理解を橋渡しするために,低次元属性表現を用いたフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:15:58 GMT)
CUDA-LLM: LLMs Can Write Efficient CUDA Kernels [9.3] 大規模言語モデル(LLM)は汎用コード生成において強力な機能を示している。
我々は,textbfFeature SearchReinforcement (FSR) FSRという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:51:03 GMT)
Guidelines for Fine-grained Sentence-level Arabic Readability Annotation [9.3] Balanced Arabic Readability Evaluation Corpus (BAREC) は、アラビア語の詳細な文レベルの可読性評価のための大規模リソースである。
Taha/Arabi21フレームワークに基づいて、このガイドラインはアラビア語話者の教育者による反復的な教育によって洗練された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:56:54 GMT)
Monocular 3D Hand Pose Estimation with Implicit Camera Alignment [9.2] 2次元キーポイント入力から3次元手話の調音を推定するための最適化パイプラインを提案する。
EgoDexter と Dexter+Object ベンチマークに対する我々のアプローチを評価した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:45:22 GMT)
Photonic Energy-Coherence Theorem and Experimental Validations [9.1] エネルギー容量の概念を用いた波動粒子双対性に対するデバイス非依存の不確実性関係を導出する。
我々はこの波動-粒子の双対関係を光子プラットフォームを用いて実験的に検証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:13:05 GMT)
Do Generative AI Tools Ensure Green Code? An Investigative Study [9.1] 本稿では,3つの一般的な生成AIツールを対象とした,AI生成コードの持続可能性に関する早期調査の結果を紹介する。
結果は、複数のルールやシナリオにわたって、コードを生成するツールのデフォルトの非グリーンな振る舞いを強調します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:38:41 GMT)
Optimizing Learned Image Compression on Scalar and Entropy-Constraint Quantization [9.0] 正しい量子化データに対する再トレーニングは、一様スカラーおよび特にエントロピー制約量子化に対して、一貫した符号化ゲインをもたらすことを示す。
Kodakテストセットでは、平均貯蓄率1%から2%、TecNickテストではBjontegaard-Deltaの2.2%に設定されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:22:22 GMT)
sparseGeoHOPCA: A Geometric Solution to Sparse Higher-Order PCA Without Covariance Estimation [8.8] 本稿では,高次主成分分析(SHOPCA)のための新しいフレームワークを提案する。
本稿では,SparseGeoHOPが高次元画像設定とImageNet上でサポートされていることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:30:48 GMT)
Distributionally and Adversarially Robust Logistic Regression via Intersecting Wasserstein Balls [8.7] 提案手法は,提案手法が標準データセットのベンチマーク手法よりも優れていることを示す。
前者からインスピレーションを得て、ロジスティック回帰のためにAROのワッサーシュタイン DR について検討し、トラクタブル凸最適化の修正が認められることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:59:55 GMT)
Local MDI+: Local Feature Importances for Tree-Based Models [8.5] Local MDI+ (LMDI+) は、MDI+フレームワークのサンプル固有の設定への拡張である。
複数のランダムな森林にまたがる類似のインスタンスレベルの特徴重要度ランキングを生成する。
また、より密接なカウンターファクトの識別を含む、局所的な解釈可能性のユースケースを可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:51:27 GMT)
Correcting a noisy quantum computer using a quantum computer [8.5] 本稿では,量子回路自体の動作を利用する復号方式を提案する。
トレーニングされた量子回路$B$は超伝導量子ビットなどの量子デバイスにデプロイできる。
この洞察は、自己修正量子コンピュータの開発の道を開く。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:35:21 GMT)
IntTrajSim: Trajectory Prediction for Simulating Multi-Vehicle driving at Signalized Intersections [8.5] 交通シミュレータは道路インフラの運転効率に関する研究に広く利用されている。
彼らのルールに基づくアプローチは、現実世界の運転行動を模倣する能力を制限する。
生成軌道予測モデルを評価するために,交通工学関連指標を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:27:42 GMT)
Evaluating Generative Vehicle Trajectory Models for Traffic Intersection Dynamics [8.5] 信号交差点における交通力学の深部生成モデルは、交通当局が効率性と安全性の面をよりよく理解するのに役立ちます。
現在、軌道再構成誤差を主眼とする計算量に基づいてモデルの評価を行っている。
私たちは、交通工学の観点からモデルパフォーマンスに関するより良い洞察を提供するメトリクスを持つモデルを訓練、実行、評価するための総合的な分析ツールを提供しています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:36:42 GMT)
Reinforcing VLMs to Use Tools for Detailed Visual Reasoning Under Resource Constraints [8.4] 我々は、視覚言語モデル(VLM)のためのDeepseek-r1のような手法からインスピレーションを得て、グループ相対ポリシー最適化(GRPO)を用いて小規模モデルを訓練し、ズームのような外部ツールを使用する。
最大のメリットは、GRPO学習、単純な報酬構造、シンプルなツール呼び出しインターフェース、そして視覚的に難しい例を過剰に表現するトレーニングデータミックスを組み合わせることで得られる。
同様に大規模なベースラインモデルと比較して,外部ツールから収集した詳細な視覚情報により,視覚的質問応答(VQA)タスクの性能が向上する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:11:44 GMT)
Breaking the ICE: Exploring promises and challenges of benchmarks for Inference Carbon & Energy estimation for LLMs [8.4] 本稿では, 現状のアプローチの課題について論じるとともに, 炭素排出量を推定するフレームワークであるR-ICEについて述べる。
我々の有望な検証結果は、ベンチマークベースのモデリングが推定放射推定に大きな可能性を秘めていることを示唆している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:23:02 GMT)
FairMT-Bench: Benchmarking Fairness for Multi-turn Dialogue in Conversational LLMs [8.4] マルチターン対話シナリオである textbfFairMT-Bench における大規模言語モデル(LLM)ベースのチャットボットの公平性ベンチマークを提案する。
多様なバイアスタイプや属性のカバレッジを確保するため,マルチターン対話データセットである texttFairMT-10K を構築した。
textttFairMT-10Kの実験と分析により、マルチターン対話シナリオでは、現在のLLMは偏りのある応答を生成する傾向があり、様々なタスクやモデルのパフォーマンスに顕著なばらつきがあることが明らかになった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:47:40 GMT)
Real-Time Cascade Mitigation in Power Systems Using Influence Graph Improved by Reinforcement Learning [8.3] リアルタイムカスケードの緩和には、不確実性の下で高速で複雑な運用上の決定が必要である。
我々は、電力伝送システムにおけるカスケード障害のリアルタイム軽減のために、インフルエンスグラフを勾配決定プロセスモデル(MDP)に拡張する。
本稿では、未解決事例に対応するポリシーを持つポリシー学習アルゴリズムを提案し、不正行為を処理するように設計されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:20:39 GMT)
SpatialLLM: A Compound 3D-Informed Design towards Spatially-Intelligent Large Multimodal Models [8.3] 人間は自然に3D空間の関係を理解し、異なる方向から車両の衝突を予測するような複雑な推論を可能にする。
現在の大型マルチモーダルモデル(LMM)は3次元空間推論の能力を欠いている。
本研究では,高度な3次元空間推論能力を持つ大規模マルチモーダルモデルであるSpatialLLMを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:54:02 GMT)
Cooperative and Collaborative Multi-Task Semantic Communication for Distributed Sources [8.2] 我々は、エンコーダを共通単位(CU)と多重特定単位(SU)に分割する[1]で導入された協調マルチタスク処理に基づいて構築する。
本稿では,マルチタスク処理をサポートするSemComシステムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:55:00 GMT)
Understanding Self-Regulated Learning Behavior Among High and Low Dropout Risk Students During CS1: Combining Trace Logs, Dropout Prediction and Self-Reports [8.1] 本研究では,コンピュータサイエンスの学生の行動パターンを様々なリスクで調査する。
学習分析を用いて,仮想学習環境からトレースログとタスクパフォーマンスデータを解析した。
その結果,個別の週次学習戦略と授業行動の分類が明らかになった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:46:45 GMT)
Generalizing while preserving monotonicity in comparison-based preference learning models [8.1] 拡散優先度を持つ線形一般化ブラッドレー・テリーモデルの新しいクラスを提案する。
実験の結果,新しい一般化モデルでは,特にデータセットが限定された場合,精度が向上することがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:24:08 GMT)
Reinforce LLM Reasoning through Multi-Agent Reflection [8.1] DPSDPは,自己生成データを直接選好学習することで,アクタクリティカルなLLMシステムを反復的に洗練する強化学習アルゴリズムである。
理論的には、DPSDPはトレーニング分布内の任意のポリシーのパフォーマンスと一致させることができる。
例えば、ベンチマークMATH 500では、5つの改良ステップ以上の多数投票がミニストラーモデルで第1回投票の精度を58.2%から63.2%に向上させた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:43:47 GMT)
Topological Invariants in Nonlinear Thouless Pumping of Solitons [8.0] 弱および強非線形な状態にまたがって適用可能な統一位相不変量を導入する。
非線形バンドが十分に分離された弱い非線形性系では、その不変量は占有された非線形バンドのアベリアンチャーン数に減少する。
非線形性が増大すると、非線形バンドは干渉し始め、非アベリアチャーン数として相互作用するバンドの数で非アベリアチャーン数として表される状況に繋がる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:58:15 GMT)
UTBoost: Rigorous Evaluation of Coding Agents on SWE-Bench [8.0] LLM駆動のテストケースジェネレータであるUTGeneratorを導入し、実世界のPythonプロジェクトのテストケースを生成する。
UTGenerator上に構築されたUTBoostは、テストケース拡張のための包括的なフレームワークである。
評価では,テストケースが不十分な36のタスクインスタンスを同定し,元のSWE Benchに渡された345の誤ったパッチを誤ってラベル付けした。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:56:49 GMT)
BiasGuard: A Reasoning-enhanced Bias Detection Tool For Large Language Models [8.0] フェアネス仕様を通じて入力と理由を明示的に分析する新しいバイアス検出ツールであるBiasGuardを紹介した。
BiasGuardは2段階のアプローチで実装されている。第1段階はフェアネス仕様に基づいてモデルを明示的に推論し、第2段階は強化学習を活用して推論と判断能力を向上する。
実験は5つのデータセットで行われ、BiasGuardが既存のツールより優れており、精度が向上し、過度な偏見が軽減されていることを実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:54:40 GMT)
Synthesis by Design: Controlled Data Generation via Structural Guidance [7.9] 数学的推論から生成した問題解決コードを用いて構造情報を抽出する。
提案手法は,ラベル付き中間ステップと6.1K-problemベンチマークで39Kの問題を発生させる。
ベンチマークの結果,推論長の増加に伴いモデル性能が低下することが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:19:15 GMT)
Can LLMs Ground when they (Don't) Know: A Study on Direct and Loaded Political Questions [7.9] 本稿では,大言語モデル (LLM) が知識を持つ場合の共通基盤をどのように管理するかを検討する。
本研究では,LLMが直接知識質問に答える能力について検討し,誤報を前提とした質問をロードする能力について考察する。
本研究は,LLMが偽ユーザ信念を根底から否定する能力において,政治的言論における偽情報の緩和に果たした役割に対する懸念を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:20:09 GMT)
Do MIL Models Transfer? [7.8] マルチ・インスタンス・ラーニング(MIL)は計算病理学における基礎的アプローチである
MILはしばしば、小さく、弱く管理された臨床データセットと競合する。
本研究では,事前学習型MILモデルの伝達学習能力を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:50:04 GMT)
Reinforcement Fine-Tuning for Reasoning towards Multi-Step Multi-Source Search in Large Language Models [7.7] Reasoning-Search (R-Search)は、マルチステップ計画、複数ソース検索の実行、回答合成を統一するシングルLLM検索フレームワークである。
R-Searchは、検索プロセスを導く推論ステップを含む、明示的に定義された4つのコンポーネントに出力を構造化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:09:57 GMT)
Foundation Models in Medical Imaging -- A Review and Outlook [7.7] 基礎モデル(FM)は、未ラベルデータの大規模な収集から学んだ医療画像の分析方法を変えつつある。
本稿では,FMの病態,放射線学,眼科領域への応用について検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:14:05 GMT)
BiAssemble: Learning Collaborative Affordance for Bimanual Geometric Assembly [7.7] 部品を完全な全体に統合するプロセスである形状組み立ては、幅広い現実世界の応用において重要なロボット技術である。
これにより、ロボットは、様々な断片の把握、組み立て、およびその後の双方向の協調操作のための幾何学的手がかりを認識する必要がある。
本稿では,長軸アクションシーケンスを用いた幾何学的組立において,点レベルの可測性の幾何学的一般化と,両面的な協調を意識した学習能力を利用する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:32:34 GMT)
AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI) [7.6] LLMに対する敵の脅威は、現在の防衛が適応できるよりも急速にエスカレートしている。
ALKALIは, 厳格にキュレートされた最初の逆数ベンチマークである。
本稿では、遅延空間正規化と協調するアライメントフレームワークGRACEを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:14:17 GMT)
Realigning Incentives to Build Better Software: a Holistic Approach to Vendor Accountability [7.6] より良い品質のソフトウェアに関する課題は、不整合したインセンティブの連続による小さな部分によるものではない、と私たちは主張する。
責任の欠如は、ソフトウェアベンダがあらゆるインセンティブを持って、低品質のソフトウェアを市場に投入することを意味する。
この記事では、より良い、よりセキュアなソフトウェア開発にインセンティブを与えるために必要な、総合的な技術とポリシーのフレームワークを概説する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:23:44 GMT)
Rogue waves collision under incident momentum modulation in two-component Bose-Einstein condensates [7.6] 2次元ボース・アインシュタイン凝縮体(BECs)における2つの1次ローグ波(RWs)と反対の入射運動量との衝突動力学について検討した。
適切なインシデントモーメントの導入が2次RWの生成を促進することが実証された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:46:50 GMT)
NysAct: A Scalable Preconditioned Gradient Descent using Nystrom Approximation [7.5] スケーラブルな一階勾配プレコンディショニング手法であるNysActを導入する。
NysActは1次法と2次法の両方と比較して精度が向上していることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:18:08 GMT)
MAC: An Efficient Gradient Preconditioning using Mean Activation Approximated Curvature [7.5] KFACのようなニューラルネットワークをトレーニングするための2次最適化手法は、損失ランドスケープの曲率情報を活用することにより、優れた収束性を示す。
我々は、KFACで使用される階層式フィッシャー情報行列(FIM)を構成する2つの成分について分析する。
そこで我々は, MAC という計算効率のよい最適化手法を提案する。
我々の知る限り、MACは、トランスフォーマーで使用される注目層のFIMにクロネッカー分解を適用し、注意スコアを事前条件に明示的に統合する最初のアルゴリズムである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:38:04 GMT)
An Adaptive Method Stabilizing Activations for Enhanced Generalization [7.5] 本稿では,アクティベーションのばらつきに応じて学習率を調整する新しい最適化アルゴリズムであるAdaActを紹介する。
実験結果は、標準画像分類ベンチマークにおけるAdaActの競合性能を示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:10:40 GMT)
JuStRank: Benchmarking LLM Judges for System Ranking [7.5] 我々はLLM審査員をシステムランクラーとして大規模に調査した。
システムスコアは、複数のシステム出力に対して判定スコアを集約することで生成される。
我々の分析は、判断力や偏見を含む判断行動のきめ細かい特徴を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:54:35 GMT)
Inherently Faithful Attention Maps for Vision Transformers [7.5] 本稿では,学習した2値注意マスクを用いて,画像領域のみが予測に影響を与えることを保証するアテンションベース手法を提案する。
多様なベンチマークによる実験により、我々のアプローチは、突発的な相関やアウト・オブ・ディストリビューションの背景に対して著しく改善されることが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:41:22 GMT)
LeanTutor: A Formally-Verified AI Tutor for Mathematical Proofs [7.5] 本稿では,Large Language Model(LLM)に基づく算数証明学習システムであるLeanTutorを紹介する。
LeanTutorは自然言語で学生と対話し、Leanで学生が書いた数学の証明を正式に検証し、次のステップを正しく生成し、適切な指導指導を提供する。
本システムを評価するために,自然数ゲームから派生した人文データセットであるPeanoBenchを紹介した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:12:36 GMT)
Efficient Robust Conformal Prediction via Lipschitz-Bounded Networks [7.4] コンフォーマル予測(CP)は、ニューラルネットワークの信頼性を改善する効果的な方法であることが証明されている。
そこで我々は,Lipschitz-bounded network を用いてロバストCP集合を高精度かつ効率的に推定する手法を提案する。
我々のリップ-rcp法は、この2番目のアプローチをバニラCPと同じくらい効率的にすると同時に、堅牢性を保証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:49:58 GMT)
Wanting to Be Understood Explains the Meta-Problem of Consciousness [7.4] このような外部表現はアクセス意識の前提条件であると主張する。
「理解すべきドライブと理解すべき低レベルの感覚運動能力が豊かであり、体験感の説明の要求が満足できない。」
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:31:09 GMT)
Evaluation is All You Need: Strategic Overclaiming of LLM Reasoning Capabilities Through Evaluation Design [7.4] Deepseek-R1-Distillシリーズで表現される推論モデルは、オープンソースコミュニティで広く採用されている。
本研究により, 評価結果は, 種々の要因による大きな変動の影響を受けることが明らかとなった。
同様の現象は、Deepseek-R1-Distillシリーズに基づいて微調整された他のオープンソース推論モデルで観察される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:57:23 GMT)
Draft-based Approximate Inference for LLMs [7.3] 本稿では,大規模言語モデル推論のための新しいフレームワークを提案する。
我々は,提案フレームワークの2つのインスタンス化を紹介した。 (i) SpecKVは,KVペアの重要性を正確に評価するためにドラフト出力を利用する。 (ii) SpecPCは,ドラフトモデルのアテンションアクティベーションを使用して,重要でないプロンプトトークンを識別・破棄する。
我々の手法は、メモリ使用量、レイテンシ、スループットが同じ改善を保ちながら、既存のベースラインよりも常に高い精度を達成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:37:46 GMT)
EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements [7.3] EDINET-Benchは,大規模言語モデル(LLM)の性能を評価するための,オープンソースの日本語金融ベンチマークである。
我々の実験は、最先端のLLMでさえも、不正検出と利益予測のためのバイナリ分類において、ロジスティック回帰よりもわずかに優れた性能を発揮していることを示している。
我々のデータセット、ベンチマーク構築コード、評価コードは、LLMによる将来の金融研究を促進するために公開されています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:03:36 GMT)
PatchTrAD: A Patch-Based Transformer focusing on Patch-Wise Reconstruction Error for Time Series Anomaly Detection [7.2] PatchTrADは,時系列異常検出のためのPatch-based Transformerモデルである。
提案手法では,トランスフォーマーエンコーダと,アノマ検出のための再構成フレームワーク下でのパッチの利用を併用する。
複数のベンチマークデータセットに対する実証的な評価は、PatchTrADが検出性能において同等であることを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:21:40 GMT)
Length-Induced Embedding Collapse in PLM-based Models [7.1] 私たちはLength Collapseと呼ぶ現象を導入し、長いテキストの埋め込みをまとめる傾向があります。
これらの違いが、下流の様々なタスクにおいて長いテキストで観察されるパフォーマンス低下にどのように寄与するかを考察する。
この問題に対処するため,Longth Collapse現象を緩和する簡単なTempScale法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:26:49 GMT)
SHARE: Shared Memory-Aware Open-Domain Long-Term Dialogue Dataset Constructed from Movie Script [7.1] 本研究は,共有記憶を活用することで,長期対話をより活発にすることを目的とする。
本稿では,映画脚本から構築したSHAREという長期対話データセットについて紹介する。
また,SHAREに基づく長期対話フレームワークEPISODEについても紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:26:04 GMT)
Identifiable Latent Bandits: Leveraging observational data for personalized decision-making [7.1] 本稿では,古典的盗賊よりも短い探索時間で最適な意思決定につながる,識別可能な潜伏盗賊の枠組みを提案する。
本手法は,観測データから表現を確実に同定し,新たなバンドイットインスタンスの最適動作を推測する非線形独立成分分析に基づく。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:30:20 GMT)
ADAM: Autonomous Discovery and Annotation Model using LLMs for Context-Aware Annotations [7.1] 私たちは、オープンワールドオブジェクトラベリングのためのトレーニングフリーで自己修正フレームワークであるADAM: Autonomous Discovery and Modelを紹介します。
ADAMは、シーン内の既知のエンティティからコンテキスト情報に基づいて、未知のオブジェクトの候補ラベルを生成する。
ADAM は Embedding-Label Repository から視覚的に類似したインスタンスを取得し、ロバストなラベルを割り当てるために周波数ベースの投票とクロスモーダルな再ランクを適用します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:41:33 GMT)
DIsoN: Decentralized Isolation Networks for Out-of-Distribution Detection in Medical Imaging [7.0] 安全クリティカルドメインにおける機械学習モデルの安全なデプロイには、トレーニング中に見えない特徴のある入力を検出する必要がある。
最先端のOOD検出方法は、デプロイ後にトレーニングデータを破棄するか、テストサンプルとトレーニングデータが集中的に格納されていると仮定する。
トレーニングデータから対象のテストサンプルを分離することの難しさを定量化するOOD検出フレームワークであるIsolation Networkを導入する。
次に、データ共有が不可能な場合のトレーニングデータとテストデータの比較を可能にする分散分離ネットワーク(DIsoN)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:52:18 GMT)
An Analysis of Hyper-Parameter Optimization Methods for Retrieval Augmented Generation [7.0] 本稿では,5つのドメインから5つのデータセットにまたがる5つのHPOアルゴリズムに関する総合的研究について述べる。
本研究は,3つの評価指標を最適化対象として,現在検討されている最大規模のHPO検索空間について検討する。
結果から,RAG HPOは無作為にもランダム検索でも効率的に行うことができ,全データセットのRAG性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:56:20 GMT)
Spatial Transcriptomics Expression Prediction from Histopathology Based on Cross-Modal Mask Reconstruction and Contrastive Learning [7.0] 我々は,全スライディング画像から空間的に解決された遺伝子発現を予測するための,対照的な学習に基づく深層学習法を開発した。
本手法は遺伝子・遺伝子相関を保存し,限られたサンプルを持つデータセットに適用する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:42:03 GMT)
Improved LLM Agents for Financial Document Question Answering [6.9] 大規模言語モデル(LLM)は、財務文書に対する数値的な質問応答に苦慮している。
近年の研究では、オラクルラベルを付与したタスクに対する批判的エージェント(自己補正)の有効性が示されている。
本稿では,オラクルラベルが利用できない場合の従来の批評家エージェントの有効性について検討する。
従来の最先端の手法よりも優れた計算機エージェントとともに、改良された批評家エージェントを提示する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:22:57 GMT)
Explaining, Fast and Slow: Abstraction and Refinement of Provable Explanations [6.9] 本稿では,ニューラルネットワークの予測に関する十分な説明を効率よく計算するための,新しい抽象化・リファインメント手法を提案する。
提案手法は,ニューラルネットワークの予測に十分な説明を得ることの効率を高めるとともに,ネットワークの予測を抽象化レベルによって詳細に解釈する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:04:13 GMT)
Towards a Re-evaluation of Data Forging Attacks in Practice [6.9] データフォージング攻撃は、あるモデルが与えられたデータセットでトレーニングされたこと、実際に別のデータセットでトレーニングされたことの実証を提供する。
データフォージングは、データガバナンスの潜在的な手段を損なうように見える。
筆者らは, 実用的, 理論的両面からデータ鍛造を批判的に分析し, 現行の攻撃方法の重要な実用的限界が検証者によって容易に検出できることを見出した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:51:44 GMT)
How Do Users Revise Architectural Related Questions on Stack Overflow: An Empirical Study [6.7] ユーザがStack Overflow (SO)上でアーキテクチャ関連質問(ARQ)をどのように修正するかを理解するための実証的研究を行った。
主な発見は以下のとおりである。
ARQのリビジョンはSOでは一般的ではなく、この質問が投稿された直後にARQリビジョンが開始される。
質問作成者(QC)と非質問作成者(QC)の両方が、ARQ修正に積極的に参加している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:08:40 GMT)
LLM-as-a-qualitative-judge: automating error analysis in natural language generation [6.7] 自然言語生成のための大規模言語モデル(LLM)に基づく評価手法を提案する。
提案手法は, 直感的累積アルゴリズムを用いて, 提案した課題のクラスタリングとオープンエンド・インスタンス・イシュー分析により構成する。
以上の結果から,LLM-as-a-qualitative-judgeは2/3例のインスタンス固有の問題を正しく認識し,ヒトのアノテータによる報告と類似したエラー型レポートを生成することができることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:01:42 GMT)
Gaussian2Scene: 3D Scene Representation Learning via Self-supervised Learning with 3D Gaussian Splatting [6.7] ポイントクラウドの事前トレーニングのための自己教師付き学習(SSL)は、多くの3Dビジョンタスクの基盤となっている。
本稿では,3次元ガウススティング(3DGS)の効率性と明示性を事前学習に活用する,シーンレベルのSSLフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:19:21 GMT)
H$^2$GFM: Towards unifying Homogeneity and Heterogeneity on Text-Attributed Graphs [6.6] H$2$GFM は HoTAG と HeTAG の両方にまたがって一般化するために設計された新しいフレームワークである。
我々のモデルは、統一テキスト空間下でのグラフ間の多様なメタ関係を計画する。
グラフ型間の構造パターンの不均一性を捉えるために,CGT専門家の混在を用いる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:03:56 GMT)
RAISE: Enhancing Scientific Reasoning in LLMs via Step-by-Step Retrieval [6.6] RAISEはステップバイステップの検索拡張フレームワークで、Wild corpusから論理的に関連する文書を検索する。
我々は、RAISEが科学的推論ベンチマークにおいて、他のベースラインを一貫して上回っていることを観察する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:40:53 GMT)
How Do Images Align and Complement LiDAR? Towards a Harmonized Multi-modal 3D Panoptic Segmentation [6.6] LiDARベースの3Dパノプティクスセグメンテーションは、LiDARセンサーから得られるデータの空間性に苦慮することが多い。
近年の研究では、LiDAR入力とカメラ画像を統合することで、この課題を克服しようとしている。
我々は,新しいマルチモーダル3Dパノプティクス・セグメンテーション・フレームワークである Image-Assist-LiDAR (IAL) を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:46:10 GMT)
Asymptotic Normality of Infinite Centered Random Forests -Application to Imbalanced Classification [6.5] 本稿では,CRF(Centered Random Forests)の分類法について理論的に検討する。
我々は、再バランスデータセットでトレーニングされたCRFがバイアスを示し、適切な手法で除去できることを証明した。
そこで本研究では,IS-ICRF推定器が元のデータに基づいてトレーニングしたICRFと比較して,ばらつきを低減できることを実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:14:28 GMT)
Urban Incident Prediction with Graph Neural Networks: Integrating Government Ratings and Crowdsourced Reports [6.5] 本稿では,非バイアス評価データとバイアスレポートデータの両方を用いて,事象の真の潜伏状態を予測するマルチビュー多出力GNNモデルを提案する。
評価データのみを使用するモデルと比較して,本モデルが潜伏状態を予測できる実データと半合成データの両方を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:37:17 GMT)
Exploration by Random Reward Perturbation [6.3] 強化学習のための新しい探索戦略であるRandom Reward Perturbation(RRP)を紹介する。
環境報酬にゼロ平均ノイズを加えることで、トレーニング中の政策の多様性が効果的に向上することを示す。
RRPは、$epsilon$-greedy、ポリシー、エントロピー正規化といったアクション摂動に基づく探索戦略と完全に互換性がある。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:34:00 GMT)
Measurement-free code-switching for low overhead quantum computation using permutation invariant codes [6.3] 普遍量子計算のための無測定符号スイッチングプロトコルを提案する。
この符号スイッチングプロトコルによって実現された新しい非クリフォードゲートは、ゲート数の観点からClifford$+T$ゲートセットよりも効率的なユニバーサルゲートセットの実装を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:13:56 GMT)
Learning The Minimum Action Distance [6.2] 本稿では,状態軌跡のみから学習可能なマルコフ決定プロセス(MDP)の状態表現フレームワークを提案する。
本稿では,環境の基盤構造を捉えるための基本指標として,最小行動距離(MAD)の学習を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:27:11 GMT)
CFMI: Flow Matching for Missing Data Imputation [6.2] 本稿では,新しい汎用手法CFMI(Consulal Flow Match for Imputation)を提案する。
CFMIは、連続した正規化フロー、フローマッチング、共有条件モデリングを組み合わせて、従来の多重計算の難易度を扱う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:40:36 GMT)
Enhancing Safety of Foundation Models for Visual Navigation through Collision Avoidance via Repulsive Estimation [6.2] CARE(Collision Avoidance via Repulsive Estimation)は、視覚に基づくナビゲーションのためのモジュールである。
これは、追加のレンジセンサーや事前訓練されたモデルの微調整を必要とせずに、視覚ベースのナビゲーションの安全性を高める。
CAREは、目標達成性能を犠牲にすることなく、一貫して衝突率(最大100%)を下げる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:15:05 GMT)
Just Project! Multi-Channel Despeckling, the Easy Way [6.2] 本稿では,既存の単一チャネル分離手法を利用した汎用フレームワークであるMuChaProを紹介する。
鍵となるアイデアは、多数の単一チャネルプロジェクションを生成し、これらのプロジェクションを復元し、それらを最終的なマルチチャネル推定に再結合することである。
MuChaProの特長は、センサ固有のネットワークを学習するための自己教師型トレーニング戦略を適用する可能性である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:08:36 GMT)
SEMA: a Scalable and Efficient Mamba like Attention via Token Localization and Averaging [6.1] 一般的な枠組みの中で,バニラソフトマックスの注意と線形の注意の両方を定式化する。
一般化された注意が分散していること、すなわち、キーの数が無限大になる傾向があるため、クエリはすべてのキーに等しい重みを割り当てる。
注意力(SEMA)は線形注意を超越したスケーラブルで効果的な代替手段であることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:03:19 GMT)
A coherence monotone from Kirkwood-Dirac nonclassicality with respect to mutually unbiased bases [6.0] 量子状態がカークウッド・ディラック古典性を示し、互いに偏りのない基底の2つの異なる集合に対して$(A,B)$と$(A,B')$であることを示す。
カークウッド・ディラック非古典性に基づくコヒーレンスモノトンを相互に偏りのない基底に対して導入する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:04:07 GMT)
SECOND: Mitigating Perceptual Hallucination in Vision-Language Models via Selective and Contrastive Decoding [6.0] SECOND: Selective and Contrastive Decodingは、視覚言語モデルがオブジェクト中心の方法でマルチスケールの視覚情報を活用できるようにする新しいアプローチです。
SECONDは知覚幻覚を著しく減らし、幅広いベンチマークを上回ります。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:55:38 GMT)
SDTagNet: Leveraging Text-Annotated Navigation Maps for Online HD Map Construction [6.0] 高定義(HD)マップは、有望なソリューションを提供するが、その高いメンテナンスコストは、スケーラブルなデプロイメントに障壁をもたらす。
SDTagNetは,広く利用可能なSDマップの情報を完全に活用する初のオンラインHDマップ構築手法である。
Argoverse 2 と nuScenes の実験により、地図認識性能は +5.9 mAP まで向上することが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:16:00 GMT)
Designing conflict-based communicative tasks in Teaching Chinese as a Foreign Language with ChatGPT [5.8] 教師は、紛争に基づくコミュニケーションタスクを設計し、学習者がインタラクティブなダイナミクスに参加することを奨励する。
これらのタスクの設計において、教師はChatGPTを使用してプログラムの完成を支援する。
本稿では,このプログラム開発過程における教師とChatGPTの相互作用のキーとなる特徴について述べる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:44:41 GMT)
WetCat: Automating Skill Assessment in Wetlab Cataract Surgery Videos [5.8] WetCatは、自動スキルアセスメントのために特別にキュレートされたウェットラブ白内障手術ビデオの最初のデータセットである。
WetCatは、人工眼で訓練生が行う手術の高解像度記録を含む。
WetCatは、既存の臨床指標に沿った解釈可能なAI駆動評価ツールの開発を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:22:55 GMT)
Dual Attention Residual U-Net for Accurate Brain Ultrasound Segmentation in IVH Detection [5.8] 心室内出血(IVH)は早産児の神経学的合併症である。
近年のディープラーニング手法は,コンピュータ支援による診断を約束する。
本稿では,2つの補完的注意機構を組み込んだResidual U-Netアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:20:37 GMT)
From Pixels to Graphs: using Scene and Knowledge Graphs for HD-EPIC VQA Challenge [5.7] 本稿では,HD-EPIC VQA Challenge 2025のために開発されたSceneNetとKnowledgeNetについて述べる。
SceneNetは、マルチモーダルな大言語モデル(MLLM)で生成されたシーングラフを活用して、きめ細かいオブジェクトの相互作用、空間的関係、時間的接地イベントをキャプチャする。
並行して、KnowledgeNetはConceptNetの外部常識知識を取り入れ、エンティティ間の高レベルなセマンティックな接続を導入する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:21:38 GMT)
Position: Editing Large Language Models Poses Serious Safety Risks [5.7] 大規模言語モデルの編集は、ほとんど見落とされた深刻な安全性のリスクをもたらすと我々は主張する。
私たちはAIエコシステムの脆弱性を強調し、検証なしで更新されたモデルの無制限のアップロードとダウンロードを可能にします。
我々は、(i)悪質なモデル編集に対する研究用タンパー耐性モデルと対策をコミュニティに呼びかけ、(ii)AIエコシステムの確保に積極的に取り組みます。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:34:08 GMT)
A Multi-Armed Bandit Framework for Online Optimisation in Green Integrated Terrestrial and Non-Terrestrial Networks [5.6] 統合地球・非地球ネットワーク(TN-NTN)アーキテクチャは、ネットワークのカバレッジの拡大と容量向上のための有望なソリューションを提供する。
マルチアームバンディット(MAB)の定式化とBandit-feedback Constrained Online Mirror Descent(BCOMD)アルゴリズムを利用した,TN-NTNアーキテクチャ統合のための新しいオンラインフレームワークを提案する。
提案手法は,ネットワーク容量とエネルギー効率のバランスをとるために,帯域幅割り当て,ユーザ機器アソシエーション(UE),マクロベースステーション(MBS)シャットダウンなどのキーシステムパラメータを適応的に最適化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:06:15 GMT)
A Survey on Quantum Machine Learning: Current Trends, Challenges, Opportunities, and the Road Ahead [5.6] 量子コンピューティング(QC)は、古典的な計算に比べて複雑な問題を解く効率を改善すると主張している。
QCが機械学習(ML)に統合されると、量子機械学習(QML)システムを生成する。
本稿では,QCの基本概念と,その古典コンピューティングに対する顕著な優位性について,より深く理解することを目的とする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:45:54 GMT)
Iterative Corpus Refinement for Materials Property Prediction Based on Scientific Texts [5.6] 本稿では、最も多様な文書を戦略的に選択し、Word2Vecモデルを訓練し、組込み空間における合成-プロパティ相関の収束をモニタリングすることにより、与えられた科学的コーパスを洗練する反復的フレームワークを提案する。
提案手法は, 酸素還元反応 (ORR) , 水素進化反応 (HER) および酸素進化反応 (OER) に関する高効率材料を, 多くの候補成分に対して予測するために適用した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:30:15 GMT)
Model-based learning for joint channel estimationand hybrid MIMO precoding [5.5] ハイブリッドプリコーディングは、コスト効率の高い大規模マルチインプットマルチアウトプットトランシーバの重要な要素である。
本稿では、受信したパイロットを入力として取り出し、プリコーダを出力するエンドツーエンドアーキテクチャからなる、共同チャネル推定とハイブリッドプリコーディング手法を提案する。
結果として得られるニューラルネットワークは完全にモデルベースであり、軽量で、学習可能なパラメータがほとんどない。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:03:16 GMT)
Perception Characteristics Distance: Measuring Stability and Robustness of Perception System in Dynamic Conditions under a Certain Decision Rule [5.5] 物体を確実に検出できる最遠距離を定量化する新しい評価指標である知覚距離特性(PCD)を導入する。
センサ付き車両を用いてバージニアスマートロードで収集したSensorRainFallデータセットについて述べる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:22:09 GMT)
Plug-and-Play Linear Attention for Pre-trained Image and Video Restoration Models [5.5] MHSA(Multi-blur self-attention)は、現代のコンピュータビジョンモデルの中核となるコンポーネントである。
本稿では,事前学習した画像とビデオ復元モデルに統合可能なプラグイン・アンド・プレイ・モジュールとして開発された自己注意の線形近似を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:37:41 GMT)
SafeCoT: Improving VLM Safety with Minimal Reasoning [5.5] 我々は、視覚言語モデルにおける拒絶動作を改善する軽量で解釈可能なフレームワークであるSafeCoTを紹介する。
SafeCoTは,訓練データに制限がある場合でも,過度な拒絶と一般化を著しく低減することを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:13:50 GMT)
WIP: Large Language Model-Enhanced Smart Tutor for Undergraduate Circuit Analysis [5.4] 学習者のデザイン哲学と中核的なコンポーネントについて詳述し、オープンな質問応答や宿題のフィードバック生成について述べる。
このスマートチューターはMicrosoft Azureプラットフォームにデプロイされ、現在、学部の回路分析コースで使用されている。
その効果を評価するため,教師との満足感を示す回答の90.9%を学生のフィードバックとして収集した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:35:45 GMT)
Cross-lingual Transfer in Programming Languages: An Extensive Empirical Study [5.4] 大規模言語モデル(LLM)は、様々なソフトウェアエンジニアリングタスクにおいて最先端のパフォーマンスを達成した。
RustやSwiftといった重要な言語は、公開コードに制限があるため、低リソースのままである。
対象とタスクに対して最適なソース言語を推定する性能予測モデルを構築した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:10:33 GMT)
Grids Often Outperform Implicit Neural Representations [5.3] Inlicit Neural Representations (INRs)は近年、目覚ましい結果を示しているが、その能力、暗黙のバイアス、スケーリングの振る舞いはよく分かっていない。
本研究では,2次元および3次元の実信号と合成信号の組にまたがる多様なINRの性能について検討する。
多くのタスクにおいて、列車が高速かつ高品質な単純な正規化されたグリッドが、同じ数のパラメータを持つINRよりも高速であることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:52:09 GMT)
Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models [5.2] 自然言語タスク記述から報酬関数を生成するための教師なしパイプラインを提案する。
報酬はシミュレーション環境でRLエージェントを訓練するために使用され、報酬生成プロセスは実現可能性を高めるために形式化される。
ABB YuMiコラボレーティブロボットを用いたシングルアームおよびバイマニュアル操作タスクの広範囲なシミュレーション実験により,本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:00:15 GMT)
A Survey of the Self Supervised Learning Mechanisms for Vision Transformers [5.2] 視覚変換器(ViT)は近年,コンピュータビジョンタスクにおいて顕著な性能を示した。
この課題に応えて、自己教師型学習(SSL)が有望なパラダイムとして登場した。
本稿では,その表現と事前学習タスクに基づいてSSLテクニックを分類する包括的分類法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:53:17 GMT)
Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness [5.1] 本稿では,トランスフォーマーに基づく予測モデルであるChannelTokenFormerを提案する。
実践的な設定を反映するように修正された3つのベンチマークデータセットと1つの実世界の産業データセットの実験は、ChannelTokenFormerの優れた堅牢性と正確性を示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:21:28 GMT)
Infected Smallville: How Disease Threat Shapes Sociality in LLM Agents [5.0] 生成因子をベースとしたモデルを用いて,行動免疫系の仮説を検証した。
感染発生のニュースを読むエージェントは、そのようなニュースを受け取らなかったエージェントに比べて、社会的エンゲージメントが著しく低下した。
本研究は,複雑な社会動態を大規模に探索する実験ツールとしてのGABMの可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:59:06 GMT)
Efficient Context Selection for Long-Context QA: No Tuning, No Iteration, Just Adaptive-$k$ [5.0] 本稿では、クエリと候補パスの類似度スコアに基づいて、経路数を適応的に選択する、単純で効果的なシングルパス手法であるAdaptive-$k$を提案する。
モデルファインチューニング、余分なLCM推論、あるいは既存のレトリバー読み取りパイプラインの変更は不要である。
5つのLCLMと2つの埋め込みモデルで精度を向上し、動的にコンテキストサイズを調整することでより効率的で正確なQAが得られることを強調した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:11:01 GMT)
LMPOcc: 3D Semantic Occupancy Prediction Utilizing Long-Term Memory Prior from Historical Traversals [5.0] LMPOcc(Longal Memory Prior Occupancy)は、歴史的知覚出力から派生した長期記憶の優先順位を利用する最初の3次元占有予測手法である。
本研究では,長期記憶を組み込んだプラグイン・アンド・プレイアーキテクチャを導入し,グローバルな占有表現を同時に構築しながら,局所的な知覚を高める。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:54:39 GMT)
Fusing Global and Local: Transformer-CNN Synergy for Next-Gen Current Estimation [4.9] 本稿ではトランスフォーマーとCNNを組み合わせたハイブリッドモデルを提案する。
従来のSPICEシミュレーションで使用される複雑なNewtonイテレーションプロセスを置き換えるもので、Transformerフレームワークの強力なシーケンスモデリング機能を活用する。
実験の結果,従来のSPICEシミュレーションと比較して0.0098の誤差しか得られなかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:31:24 GMT)
High-Dimensional Independence Testing via Maximum and Average Distance Correlations [4.9] 高次元設定における最大距離と平均距離の相関の一貫性特性を特徴付ける。
それぞれのテスト統計の利点を比較し,それぞれのヌル分布を検証し,高速なチ二乗検定手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:55:28 GMT)
Large Language Models and Emergence: A Complex Systems Perspective [4.8] エネルジェンス(Emergence)は、複雑性科学における概念であり、多体系がいかに新しい高レベルな性質を示すかを記述している。
まず、大規模言語モデルが創発的能力を示すという主張を検証し、出現を定量化するためのいくつかのアプローチをレビューし、第二に、LLMが創発的知性を持っているかどうかを問う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:31:26 GMT)
RocketPPA: Code-Level Power, Performance, and Area Prediction via LLM and Mixture of Experts [4.8] 本稿では,新しい超高速パワー,性能(遅延),面積(PPA)推定器であるRocketPPAについて述べる。
HDLコードを入力として使用して、コードレベルの抽象化を直接実行します。
従来の最先端手法に比べてPPA推定精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:20:25 GMT)
Sparse Training from Random Initialization: Aligning Lottery Ticket Masks using Weight Symmetry [4.8] Lottery Ticket hypothesis (LTH) は、非常に少ないパラメータを使用しながら、密度モデルと同じ一般化性能を達成するスパースLTHマスクとウェイトが存在することを示唆している。
近年の研究では、ランダム初期化からトレーニングされたニューラルネットワークが、同じ流域のモジュロ置換における解を見つけることが示唆されている。
我々は,異なるランダムイニトからスパーストレーニングを行う際に,LTHマスクを新しい最適化盆地に合わせるように変更することを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:15:22 GMT)
FlagEvalMM: A Flexible Framework for Comprehensive Multimodal Model Evaluation [4.8] マルチモーダルモデルの評価を目的としたオープンソースの評価フレームワークであるFragEvalMMを提案する。
独立評価サービスを通じて評価からモデル推論を分離する。
FlagEvalMMは、モデルの強みと制限に関する正確で効率的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:19:02 GMT)
Can A Gamer Train A Mathematical Reasoning Model? [4.7] 大規模言語モデル(LLM)は、数学的推論を含む様々なタスクにおいて顕著な性能を達成した。
最近の進歩は、訓練能力のあるモデルのコストを削減しているが、これらのアプローチでさえハイエンドのハードウェアクラスタに依存している。
我々は,1つの平均的なゲームGPUが,強化学習とメモリ最適化技術を統合することで,確固たる数学的推論モデルを訓練できることを実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:00:12 GMT)
EtiCor++: Towards Understanding Etiquettical Bias in LLMs [4.7] 世界中のエチケットのコーパスであるEtiCor++を紹介します。
様々な地域におけるエチケットに関する知識のために,LLMを評価するための様々なタスクを紹介した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:29:35 GMT)
SPBA: Utilizing Speech Large Language Model for Backdoor Attacks on Speech Classification Models [4.7] 音声ベースの人間とコンピュータのインタラクションは、バックドア攻撃に弱い。
本稿では,音声のバックドア攻撃が,音色や感情などの音声要素に戦略的に焦点を絞ることができることを提案する。
提案された攻撃は、SPBA(Speech Prompt Backdoor Attack)と呼ばれる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:01:00 GMT)
polyGen: A Learning Framework for Atomic-level Polymer Structure Generation [4.7] 繰り返し単位化学のような最小の入力から高分子構造に特異的に設計された最初の生成モデルであるpolyGenを紹介する。
ポリゲンは、高分子の伝統的な結晶構造予測法の限界を克服し、現実的で多様な線形および分岐配座を生成することに成功した。
最初の原子レベルの概念実証として、物質構造生成の新たな能力を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:41:16 GMT)
Improving the Noise Estimation of Latent Neural Stochastic Differential Equations [4.6] SDE(Latent Neural differential equations)は、最近時系列データから生成モデルを学習するための有望なアプローチとして登場した。
本稿では, この過小評価を詳細に検討し, 損失関数に付加的な雑音正規化を加えることで, 簡単な解法を提案する。
我々はデータの拡散成分を正確に捉えるモデルを学ぶことができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:42:00 GMT)
Sample Efficient Demonstration Selection for In-Context Learning [4.6] 本稿では,最上位の武器識別問題として,模範選択タスクを定式化する。
このセットアップにおける重要な課題は、mベストアームを特定するために評価される必要のある、指数関数的に多数のアームである。
そこで我々は,カレンガーアームのショートリストを維持する,サンプル効率の高い新規探索戦略CASEを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:16:11 GMT)
TimeWak: Temporal Chained-Hashing Watermark for Time Series Data [4.6] TimeWakは時系列拡散モデルのための最初の透かしアルゴリズムである。
TimeWakは、時間的連鎖したハッシュの透かしを、実際の時間的特徴空間に直接埋め込む。
我々は,TimeWakが合成データ品質,透かし検出性,堅牢性に与える影響を,様々な後処理攻撃下で評価した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:59:24 GMT)
ZTaint-Havoc: From Havoc Mode to Zero-Execution Fuzzing-Driven Taint Inference [4.5] 本稿では,ZTaint-Havocを提案する。
我々は、ZTaint-HavocがFuzzBenchで33.71%、UniBenchで51.12%、バニラAFL++で平均2.97%、24時間のファジィキャンペーンで6.12%改善していることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:25:07 GMT)
Flexible and Efficient Drift Detection without Labels [4.5] 概念ドリフトに関する多くの研究は、教師付きタスクの真のラベルが予測された直後に利用可能であると仮定する教師付きケースに焦点を当てている。
ラベルレス環境での古典的統計的プロセス制御を用いたフレキシブルで効率的なドリフト検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:31:04 GMT)
Evaluating the Performance and Efficiency of Sentence-BERT for Code Comment Classification [4.4] 本研究は,複数ラベルのコードコメント分類タスクに対してSentence-BERTを評価する。
ラベル付きコメント文13,216のデータセットを使用して、Sentence-BERTモデルは微調整され、異なる分類ヘッドと組み合わせてコメントタイプを認識する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:51:21 GMT)
Solving excited states for long-range interacting trapped ions with neural networks [4.3] 本稿では,量子多体スピン系の複数の低次励起状態を同時に出力するニューラルネットワークに基づくアルゴリズムを提案する。
NQESアルゴリズムは、複数の励起状態とその関連する観測可能な期待値を効率的に計算することができる。
量子多体系を相互作用する励起状態を計算するためのスケーラブルで効率的なアルゴリズムを構築した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:02:59 GMT)
MegaLoc: One Retrieval to Place Them All [4.3] 与えられたクエリと同じ位置から画像を取得することは、複数のコンピュータビジョンタスクの重要なコンポーネントである。
既存のソリューションは、これらのタスクの1つに特化して構築されており、要件がわずかに変更された場合や、アウト・オブ・ディストリビューション(out-of-distriion)データを満たす場合に失敗することが知られている。
本稿では,既存の手法,トレーニング手法,データセットを組み合わせて,複数のタスクで実行されるMegaLocと呼ばれる検索モデルをトレーニングする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:44:55 GMT)
Variational Inference Optimized Using the Curved Geometry of Coupled Free Energy [4.3] 結合自由エネルギーに基づく変分推論のための最適化フレームワークを提案する。
我々は、結合指数族の曲面幾何学を考慮に入れ、変分推論手法を拡張した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:47:21 GMT)
Is Perturbation-Based Image Protection Disruptive to Image Editing? [4.2] 現在の画像保護法は、拡散ベースの編集を妨げるために、イメージに知覚できない摂動を追加することに依存している。
画像に対する完全な保護は、編集の試みの出力が望ましくないノイズの多い画像であることを意味する。
我々は、摂動に基づく手法は、拡散に基づく編集に対する堅牢な画像保護に十分な解決策を提供していないと論じる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:45:40 GMT)
CHOSEN: Compilation to Hardware Optimization Stack for Efficient Vision Transformer Inference [4.2] ビジョントランスフォーマー(ViT)は、コンピュータビジョンへの機械学習アプローチにおける画期的なシフトである。
本稿では,これらの課題に対処するソフトウェアハードウェアの共同設計フレームワークであるCHOSENを紹介し,FPGA上にViTをデプロイするための自動フレームワークを提供する。
ChoSENはDeiT-SとDeiT-Bモデルのスループットを1.5倍と1.42倍改善した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:33:53 GMT)
Scalable Medication Extraction and Discontinuation Identification from Electronic Health Records Using Large Language Models [4.2] EHRノートから医薬品の抽出と医薬品の分類において,先進的なオープンソースおよびプロプライエタリな大規模言語モデル(LLMs)を評価した。
GPT-4oはゼロショット設定で全てのタスクの平均F1スコアを継続的に達成した。
オープンソースモデルに続いて、Llama-3.1-70B-Instructは医薬品のステータス分類において最高性能を達成した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:00:32 GMT)
A Framework for Controllable Multi-objective Learning with Annealed Stein Variational Hypernetworks [4.2] 最適解の集合はパレート集合を近似する。
現在の手法では、ハイパーボリューム値を最大化しながら、どのようにソリューションを多様化させるかという課題に直面している。
本稿では,Stein Variational Gradient Descentを用いた新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:36:06 GMT)
HGFormer: A Hierarchical Graph Transformer Framework for Two-Stage Colonel Blotto Games via Reinforcement Learning [4.1] ブロット大佐の2段階のゲームは典型的な逆資源割り当て問題を表す。
本稿ではHGformerと呼ばれる階層型グラフトランスフォーマフレームワークを提案する。
本手法により,大規模環境における効率的な政策生成が可能となる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:51:18 GMT)
Predicting and Understanding College Student Mental Health with Interpretable Machine Learning [4.1] パーソナライズされたmEntalヘルス予測のための最初の解釈可能な階層型mOdelであるI-HOPEを提案する。
I-HOPEは、相互作用ラベルとして定義された5つの行動カテゴリーを通して、生の行動特徴とメンタルヘルスの状態を結合する2段階の階層モデルである。
I-HOPEは,過去最長のモバイルセンシングデータセットであるCollege Experience Studyで評価する。このデータセットは5年間にわたって,パンデミック前と新型コロナウイルスパンデミック前の両方のデータをキャプチャする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:25:11 GMT)
The CAISAR Platform: Extending the Reach of Machine Learning Specification and Verification [4.1] 本稿では,機械学習仕様と検証に特化したオープンソースプラットフォームであるCAISARを紹介する。
本稿では,ニューラルネットワーク上の複雑な特性のモデル化に適した仕様言語を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:49:10 GMT)
CALT: A Library for Computer Algebra with Transformer [4.1] 我々は,計算機代数とトランスフォーマー(CALT)を紹介した。これは,記号計算タスクのためのディープラーニングトレインモデルの非エキスパートを支援するために設計された,ユーザフレンドリなPythonライブラリである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:06:41 GMT)
BioLangFusion: Multimodal Fusion of DNA, mRNA, and Protein Language Models [4.0] 我々は、事前訓練されたDNA、mRNA、タンパク質言語モデルを統一された分子表現に統合するための簡単なアプローチであるBioLangFusionを提案する。
i)コドンレベルの埋め込み結合、(ii)マルチインスタンス学習にインスパイアされたエントロピー規則化されたアテンションプール、(iii)クロスモーダルマルチヘッドアテンションの3つの融合技術について研究した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:01:11 GMT)
Data-Driven Discovery of PDEs via the Adjoint Method [4.0] 本稿では、与えられたデータに基づいて、基礎となる支配的偏微分方程式(PDE)を発見する方法を提案する。
PDEの形式を同定する上で,提案手法の有効性を示す。
また,その性能をPDE-FIND(PDE-FIND)として有名なPDE関数同定法と比較した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:16:27 GMT)
RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation [4.0] 人間のフィードバックからの強化学習は、重度で体系的なミスアライメントを引き起こす可能性があることを示す。
本稿では,Reinforcement Learning from Hindsight Simulation (RLHS)を紹介する。
RLHSは実験や人体評価においてRLHFのアライメントを大幅に改善する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:19:33 GMT)
SDMPrune: Self-Distillation MLP Pruning for Efficient Large Language Models [4.0] 原モデルの予測を十分に活用するために,プレニング段階(後訓練ではなく)に自己蒸留損失を導入する。
提案手法は,既存の刈り取り法よりも大幅に優れていることを示す。
提案手法は,1BスケールのオープンソースLLMにおいて,非常に競争力のある性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:24:32 GMT)
Societal AI Research Has Become Less Interdisciplinary [4.0] この研究は、2014年から2024年にかけて、ArXivで発行された10万以上のAI関連論文を分析した。
コンピュータ科学のみのチームが、この分野全体の社会的アウトプットのシェアを拡大している。
これらの知見は、社会的AIのドライバに関する共通の仮定に挑戦する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:34:53 GMT)
Safe and Economical UAV Trajectory Planning in Low-Altitude Airspace: A Hybrid DRL-LLM Approach with Compliance Awareness [3.9] 本稿では, 深層強化学習(DRL)と大言語モデル(LLM)の推論を組み合わせた新しいUAV軌道計画フレームワークを提案し, 安全性, 適合性, 経済的に実現可能な経路計画を実現する。
実験の結果,本手法は,データ収集率,衝突回避率,着陸成功率,規制遵守度,エネルギー効率など,複数の指標において,既存のベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:51:29 GMT)
Mechanistic Decomposition of Sentence Representations [3.9] 文の埋め込みは現代のNLPとAIシステムの中心であるが、内部構造についてはほとんど知られていない。
文の埋め込みを解釈可能なコンポーネントに機械的に分解する新しい手法を提案する。
我々は,これらの特徴を文表現に圧縮する方法を解析し,文埋め込みに存在する潜在的特徴を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:05:41 GMT)
The Decoupled Risk Landscape in Performative Prediction [3.9] Performative Predictionは、モデルのデプロイが入力データの分散シフトを誘導するシナリオに対処する。
本稿では,2段階の予測プロセスにインスパイアされた,単純な疎結合型リスク可視化手法を提案する。
我々は,意思決定と異なるモデルに分布が反応するシナリオをキャプチャする,新しい設定,拡張パーフォーマティブ予測を導入する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:58:39 GMT)
k-NN as a Simple and Effective Estimator of Transferability [3.9] ドメインがシフトし、タスクが異なる、そしてアーキテクチャが変わるような新しい環境で、トランスファーラーニングがうまくいくと期待できるだろうか?
16のデータセットから23の転送可能性指標を比較して42,000以上の実験を行い,転送性能の予測能力について検討した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:00:11 GMT)
Smartphone-integrated RPA-CRISPR-Cas12a Detection System with Microneedle Sampling for Point-of-Care Diagnosis of Potato Late Blight in Early Stage [3.8] ポテト・ラテライト(Potato late blight)は、オオマイセト病原体であるフィトフォソーラ(Phytophthora infestans)によって引き起こされた、ジャガイモの作物に最も被害を与える病気の1つである。
植物病に対する可搬型RPA-CRISPRによる診断システムについて報告する。
システムは、特殊な機器に大きく依存する従来の方法の限界を解き放ちます。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:43:36 GMT)
Hierarchical Neural Collapse Detection Transformer for Class Incremental Object Detection [3.8] 新しい物体は現実世界にしばしば現れ、継続的に学習するために検出モデルを必要とする。
本稿では,階層型ニューラルコラプス検出変換器(Hier-DETR: Hierarchical Neural Collapse Detection Transformer)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:32:28 GMT)
Multi-SpaCE: Multi-Objective Subsequence-based Sparse Counterfactual Explanations for Multivariate Time Series Classification [3.8] マルチSpaCEは、時系列データの近接性、疎性、可視性、整合性をバランスさせる。
常に完全な妥当性を達成し、既存の方法と比較して優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:17:25 GMT)
CanadaFireSat: Toward high-resolution wildfire forecasting with multiple modalities [3.8] カナダは2023年に最も深刻な山火事の季節を経験している。
この極端な山火事の季節は、気候変化によって引き起こされる火災の季節の長さと深刻度の増加が、ボレアル生態系に影響を与えることの象徴である。
より優れた緩和ソリューションで、ボリアルなコミュニティにおける山火事管理を強化することが重要である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:58:43 GMT)
Fusing Bidirectional Chains of Thought and Reward Mechanisms A Method for Enhancing Question-Answering Capabilities of Large Language Models for Chinese Intangible Cultural Heritage [3.8] 本稿では,思考の双方向連鎖と報酬機構を統合した新しい学習手法を提案する。
この手法は、無形文化財の分野に特化して設計された大きな言語モデルであるICH-Qwenに基づいている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:34:45 GMT)
CoMuMDR: Code-mixed Multi-modal Multi-domain corpus for Discourse paRsing in conversations [3.8] 会話における会話パロッシングのためのコード混合マルチモーダルマルチドメインコーパスであるCoMuMDRを紹介する。
コーパス(ヒンディー語と英語で混成)は、音声と転写されたテキストの両方を持ち、9つの談話関係で注釈付けされている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:01:30 GMT)
ATAS: Any-to-Any Self-Distillation for Enhanced Open-Vocabulary Dense Prediction [3.7] Any-to-Any Self-Distillation (ATAS)は、セマンティックコヒーレンスときめ細かいアライメントを同時に強化する新しいアプローチである。
ATASはオープン語彙オブジェクト検出とセマンティックセグメンテーションのベンチマークでかなりの性能向上を達成した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:40:10 GMT)
Tuning the the fundamental periodicity of the current-phase relation in multiterminal diffusive Josephson junctions [3.7] 4つの超伝導接触を持つジョセフソン接合は、2pi と 4pi の周期成分の重畳である2つの接触の間の電流相関係を示すことができる。
このチューニング性は超伝導量子回路のハミルトニアンの調整に応用できるかもしれない。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:58:32 GMT)
Can Large Language Models Invent Algorithms to Improve Themselves?: Algorithm Discovery for Recursive Self-Improvement through Reinforcement Learning [3.6] 自己開発(Self-Developing)は、大規模言語モデルが独自の改善アルゴリズムを自律的に発見し、実装し、洗練することを可能にするフレームワークである。
モデルマージ(モデルマージ)により、このフレームワークを実証する。
数学的推論のベンチマークでは、自律的に発見されたアルゴリズムは、シードモデルのGSM8kのパフォーマンスを6%改善し、タスク算術のような人間設計のアプローチを4.3%上回った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:35:14 GMT)
A Simple Analysis of Discretization Error in Diffusion Models [3.6] 拡散モデルは微分方程式(SDE)の離散化として定式化され、最先端の生成性能を達成する。
本稿では、分散保存SDEの保存丸山離散化を簡易に解析するための理論的枠組みを提案する。
我々の研究は拡散に基づく生成モデルにおける理論的厳密さと実用的効率を橋渡しする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:46:42 GMT)
Propositional Logic for Probing Generalization in Neural Networks [3.6] 本稿では,3つの重要なニューラルネットワーク(Transformers, Graph Convolution Networks, LSTMs)の,命題論理に根ざした制御タスクにおける一般化挙動について検討する。
構造バイアスを導入しなければ,Transformerはネゲーションを構成的に適用できないことがわかった。
本研究は,論理演算子の体系的表現を学習する標準的なアーキテクチャの能力において,永続的な限界を浮き彫りにするものである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:46:05 GMT)
Spatiotemporal deep learning models for detection of rapid intensification in cyclones [3.6] 急激な拡大はサイクロン中の極端な出来事と考えられており、その発生は比較的稀であり、データセットのクラス不均衡に寄与する。
本稿では,風力と空間座標に基づいて,深層学習,アンサンブル,学習データ拡張フレームワークの評価を行い,サイクロンの急速な拡大を検出する。
以上の結果から,サイクロンの急激な拡大検出の精度向上が図られ,空間座標が与えられたモデルに対する入力特性として重要な役割を担っていることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:13:02 GMT)
Robust Distributed Estimation: Extending Gossip Algorithms to Ranking and Trimmed Means [3.5] 本研究では,大域的にロバストな数値を推定することにより,外乱平均を計算することができることを示す。
我々は,textscGoRankと呼ばれるランク推定のための新しいゴシップアルゴリズムを提案し,それを応用して,トリミング平均推定専用のゴシップ手順を設計する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:53:46 GMT)
WaKA: Data Attribution using K-Nearest Neighbors and Membership Privacy Principles [3.4] WaKAは、個々のデータポイントのモデル損失分布への寄与を測定する新しい属性法である。
WaKAは汎用的であり、プライバシーリスクを評価するために、MIA(メンバシップ推論攻撃)として後部攻撃として使用できる。
不均衡なデータセット上でのデータ最小化タスク(削除や追加)において、WAKAはShapley Valuesよりも堅牢性が高いことを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:15:05 GMT)
Low-resource domain adaptation while minimizing energy and hardware resource consumption [3.4] 我々は、異なる数値精度とデータ並列化戦略が、トレーニング速度とモデルの精度の両方にどのように影響するかを評価する。
私たちの発見は、エネルギー効率、アクセシビリティ、ハードウェアの可用性の制限が重要な懸念事項であるような環境に関係しています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:14:19 GMT)
SimClass: A Classroom Speech Dataset Generated via Game Engine Simulation For Automatic Speech Recognition Research [3.4] ゲームエンジンを用いて教室の騒音を合成するスケーラブルな手法を提案する。
合成教室ノイズコーパスとシミュレーション教室音声データセットの両方を含むデータセットであるSimClassを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:51:57 GMT)
Leveraging chaos in the training of artificial neural networks [3.4] 従来とは違って大きな学習率のトレーニングに沿って、ニューラルネットワークの軌道のダイナミクスを探求する。
学習率の値の領域において、GD最適化は純粋に活用可能なアルゴリズムから探索・探索バランスの体制へと移行することを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:41:58 GMT)
Approaching Dialogue State Tracking via Aligning Speech Encoders and LLMs [3.3] 本稿では, フル/ローラアダプタの微調整, 対話履歴におけるエージェントターンの効果, ファジィマッチングによる後処理など, システムのさまざまな側面の強調に焦点をあてる。
我々は、SpkenWOZデータセット上で実験を行い、さらに、Speech-Aware MultiWOZデータセットを使用してトレーニングデータを増強する。
我々の最高性能のWavLM + connector + OLMo-1Bアライメントモデルは、SpkenWOZテストセット(34.66% JGA)上での最先端化を実現しています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:46:29 GMT)
Robust Visual Localization via Semantic-Guided Multi-Scale Transformer [3.3] マルチスケール特徴学習とセマンティックシーン理解を組み合わせたフレームワークを提案する。
本手法では, 空間的変化に適応しつつ, 空間的精度を保ちながら, 幾何学的詳細と文脈的手がかりを融合する階層変換器を用いる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:44:53 GMT)
FedRAG: A Framework for Fine-Tuning Retrieval-Augmented Generation Systems [3.3] FedRAGは集中型アーキテクチャとフェデレーション型アーキテクチャをまたいだRAGシステムを微調整するためのフレームワークである。
FedRAGは最先端のファインチューニングメソッドをサポートし、シンプルで直感的なインターフェイスを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:42:07 GMT)
Poro 34B and the Blessing of Multilinguality [3.3] Poro 34Bは、フィンランド語、英語、プログラミング言語の1兆トークンのために訓練された34億のパラメータモデルである。
フィンランド語における既存モデルの能力を大幅に向上するモデルを,多言語学習アプローチにより生成できることが示される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:06:59 GMT)
Speech Synthesis By Unrolling Diffusion Process using Neural Network Layers [3.3] UDPNetは音声合成における逆拡散過程を高速化する新しいアーキテクチャである。
UDPNetは、品質と効率の両面で最先端の手法を一貫して上回っていることを示す。
これらの結果は、UDPNetをリアルタイム音声合成アプリケーションのための堅牢なソリューションとして位置づけている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:50:35 GMT)
Thermodynamically Consistent Latent Dynamics Identification for Parametric Systems [3.2] パラメトリック非線形力学系の低次モデリングのための効率的な熱力学インフォームド潜在空間力学同定(tLa)フレームワークを提案する。
このフレームワークは、新たに開発されたパラメトリックジェネリックフォーマリズムインフォームドニューラルネットワーク(pGFINN)と、次元減少のためのオートエンコーダを統合している。
提案手法は,1-3%の相対誤差で最大3,528倍の高速化を実現し,トレーニングと推論の大幅な削減(57-61%)を行った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:02:36 GMT)
GFRIEND: Generative Few-shot Reward Inference through EfficieNt DPO [3.2] 人間のフィードバックから強化学習の効率性とスケーラビリティを高めるためには,高性能な報酬モデルを数ショットデータでトレーニングする能力が重要である。
本稿では,小規模データセットでトレーニングした生成報酬モデルが大規模データセットでトレーニングしたモデルに匹敵するパフォーマンスを実現するためのデータ拡張拡張フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:37:13 GMT)
Factors affecting the in-context learning abilities of LLMs for dialogue state tracking [3.2] In-context Learning (ICL) に適した実演を検索するために, 文埋め込みに基づく k-nearest 近傍法を用いる。
次に、実演選択に関連する要因の影響を分析し、対話状態追跡性能に対する文脈の促進を行う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:46:26 GMT)
Enhancing Video Memorability Prediction with Text-Motion Cross-modal Contrastive Loss and Its Application in Video Summarization [3.1] マルチモーダルビデオ記憶可能性予測モデルであるText-Motion Cross-modal Contrastive Loss (TMCCL)を導入する。
動画間のテキスト記述の類似性を生かして、動作特徴表現を改善するという課題に取り組む。
本モデルは,2つのビデオ記憶可能性予測データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:01:08 GMT)
On the Ethics of Using LLMs for Offensive Security [3.1] 大規模言語モデル(LLM)はここ数年で急速に進化し、現在、攻撃的なサイバーセキュリティの領域内での有効性が評価されている。
本稿では, LLMを攻撃的セキュリティに活用する一連の論文を分析し, 倫理的配慮がいかに表現され, 正当化されるかに着目した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:11:55 GMT)
Improved Variational Inference in Discrete VAEs using Error Correcting Codes [3.1] 本研究は, 離散変分オートエンコーダにおける推論を, 生成的視点で解釈することで改善する手法を提案する。
我々は,このモデルを通信システムとして概念化し,誤り訂正符号(ECC)を利用して潜在表現に冗長性を導入することを提案する。
本稿では,2変数の潜伏変数と低複素度繰り返し符号を持つ離散変分オートコーダを用いて概念実証を行い,グローバルおよびローカルなデータ特徴を分離する階層構造に拡張する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:26:36 GMT)
A Probabilistic Framework for Imputing Genetic Distances in Spatiotemporal Pathogen Models [3.0] そこで本研究では,不連続な症例間の遺伝的距離と,定義された伝達鎖内の既知のアライメントを推定するための枠組みを提案する。
このアプローチは、米国の野生鳥類における高病原性鳥インフルエンザA/H5症例に適用される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:41:46 GMT)
KARMA: A Multilevel Decomposition Hybrid Mamba Framework for Multivariate Long-Term Time Series Forecasting [3.0] 伝統的な時系列分解法は単一であり、固定規則に依存している。
我々は,適応時間チャネル分解モジュール(ATCD)を用いて,トレンドや季節成分を動的に抽出するKARMAを紹介する。
さらにHFTD(Hybrid Frequency-Time Decomposition Module)を統合して、Seriesを周波数領域と時間領域に分解する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:03:33 GMT)
Offline RL with Smooth OOD Generalization in Convex Hull and its Neighborhood [2.9] より優れた$Q$-value推定を実現するために、$Q$-functionの一般化を強化する新しい手法を提案する。
The safety generalization guarantees of the Convex Hull and its Neborhood (CHN), we propose the Smooth Bellman Operator (SBO)。
理論的には、SBOはCHN内のサンプル内およびOODアクションの真$Q$-値を近似する。
我々の実用アルゴリズムであるSmooth Q-function OOD Generalization (SQOG)は、過制約問題を経験的に緩和し、ほぼ正確な$Q$-value推定を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:43:22 GMT)
Value Portrait: Assessing Language Models' Values through Psychometrically and Ecologically Valid Items [2.9] 既存のベンチマークは、価値関連のバイアスに弱い人や機械のアノテーションに依存している。
本稿では,実生活におけるユーザ-LLMインタラクションをキャプチャするアイテムからなるValue Portraitベンチマークを提案する。
この心理的に検証されたアプローチは、特定の値と強く相関したアイテムがそれらの値を評価するための信頼できるアイテムとして機能することを保証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:47:42 GMT)
Quantum State Preparation via Free Binary Decision Diagram [2.9] 我々は、量子状態の古典的な記述が重み付きエッジを持つFBDDによって与えられるとき、QSPのための量子アルゴリズムを構築する。
重み付きFBDDで表される任意の量子状態が、$O(N)$サイズの量子回路で作成可能であることを示す。
また、$n=O(mathrmpoly(n))$ノードを持つ重み付きFBDDで表現できる$n$-qubit状態の例も提供します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:04:14 GMT)
AraReasoner: Evaluating Reasoning-Based LLMs for Arabic NLP [2.9] 大規模言語モデル(LLM)は推論能力の顕著な進歩を示している。
しかし、アラビアデータにおける彼らのパフォーマンスは、豊富な形態学、多様な方言、複雑な文字によって特徴づけられ、未発見のままである。
本稿では,複数の推論に焦点をあてたLLMの総合的なベンチマーク研究について述べる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:10:31 GMT)
On The Impact of Merge Request Deviations on Code Review Practices [2.8] これらのケースを偏差と仮説で表現し、それらがバイアス分析を無視し、レビュー分析のためにMLモデルを弱めていると仮定する。
MRの37.02%で発生する7つの偏差カテゴリを同定し、数ショットの学習検出法(精度91%)を提案する。
我々は,(1)MR偏差の分類学,(2)AIによる検出アプローチ,(3)MLに基づくレビュー分析への影響の実証的証拠を含む。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:51:20 GMT)
DCD: A Semantic Segmentation Model for Fetal Ultrasound Four-Chamber View [2.8] 胎児A4Cビューにおける鍵解剖学的構造の自動分割のための高度な深層学習モデルであるDCDを提案する。
局所的およびグローバルな文脈情報の両方を効果的に取得することにより、DCDは正確かつ堅牢なセグメンテーションを実現し、出生前心の評価の改善に寄与する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:54:03 GMT)
How transformers learn structured data: insights from hierarchical filtering [2.8] 木上の配列のデータモデルに対する階層的フィルタリング手法を導入し、データ内の位置相関範囲を手作業で調整する。
バニラエンコーダのみのトランスフォーマーは、ルート分類やマスキング言語モデリングタスクで訓練された場合、正確な推論アルゴリズムを近似できることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:51:44 GMT)
Phonology-Guided Speech-to-Speech Translation for African Languages [2.8] 音声合成のための韻律誘導フレームワーク(S2ST)を提案する。
Emphwithin-phylum言語対は30-40%低停止,3$times$以上のオンセット/オフセット相関を示した。
また、人間の判断と強く相関する3層無転写BLEUスイート(M1-M3)もリリースしています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:24:10 GMT)
Causal Graph Recovery in Neuroimaging through Answer Set Programming [2.8] 制約最適化アプローチ、特に解集合プログラミング(ASP)を用いて、最適な解集合を見つける。
ASPは、最も可能性の高い基盤グラフを識別するだけでなく、専門家の選択のための可能なグラフの同値クラスも提供する。
提案手法は,F1スコアを平均12%向上させるため,確立された手法の上にメタアプローチとして適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:51:30 GMT)
Mitigating fairwashing using Two-Source Audits [2.7] textitTwo-Source Audit セットアップにより,より実用的なアプローチを提案する。
APIを活用しながら、プラットフォームの監査とフェアウォッシングの試みの検出の両方を行うために、第2のデータソースのアジャクションを提唱する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:30:27 GMT)
ASRJam: Human-Friendly AI Speech Jamming to Prevent Automated Phone Scams [2.7] 大規模言語モデル (LLM) とテキスト音声認識 (TTS) と自動音声認識 (ASR) を組み合わせることで、音声フィッシング (vishing) 詐欺の自動化がますます進んでいる。
ASRJamは、攻撃者のASRを妨害するために、被害者の音声に敵の摂動を注入するプロアクティブディフェンスフレームワークである。
また、残響やエコーなどの自然な歪みを利用した新しいジャマーであるEchoGuardも提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:04:23 GMT)
FLoRIST: Singular Value Thresholding for Efficient and Accurate Federated Fine-Tuning of Large Language Models [2.6] FLoRISTは、高い通信や計算オーバーヘッドを発生させることなく、数学的に正確なアグリゲーションを実現するファインチューニングフレームワークである。
サーバ側最適ランク選択のための可変特異値しきい値を導入し、全クライアントが共有するグローバルローランクアダプタのペアを構築する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:36:36 GMT)
Teaching Physical Awareness to LLMs through Sounds [2.5] ACORNは大規模言語モデル(LLM)の物理的認識を音で教えるフレームワークである。
我々は,包括的音声質問応答データセットであるAQA-PHYを構築し,大きさ情報と位相情報の両方を処理するオーディオエンコーダを提案する。
本研究では,視線検出,ドップラー効果推定,方向推定など,実世界の実世界の課題において合理的な結果を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:42:56 GMT)
Segment This Thing: Foveated Tokenization for Efficient Point-Prompted Segmentation [2.5] 本稿では,一点プロンプトを与えられた単一セグメントを生成するために設計された,新しい効率的な画像分割モデルを提案する。
モデルサイズを小さくすることで、事前の作業に追従して効率を向上する代わりに、入力画像のファーベレーションにより効率を上げる。
セグメンテーションベンチマークでは競争力を維持しながら、我々のセグメンション・This Thingモデルは以前の作業よりも効率的であることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:06:27 GMT)
Epistemic Uncertainty in Conformal Scores: A Unified Approach [2.4] 等角予測法は、分布のない保証を持つ予測帯域を生成するが、不確実性を明示的に捉えることはできない。
モデルに依存しないアプローチである $texttEPICSCORE$ を導入する。
$texttEPICSCORE$は、限られたデータを持つ領域の予測間隔を適応的に拡張し、データが豊富であるコンパクト間隔を維持します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:12:20 GMT)
GPS Spoofing Attacks on AI-based Navigation Systems with Obstacle Avoidance in UAV [2.4] 我々はDRLベースのナビゲーションシステムにおけるセキュリティ脆弱性の研究を行い、特にシステムに対するGPSスプーフィング攻撃に焦点を当てた。
本稿では,PX4オートパイロットのEKFセンサ融合に対するスプーフィング攻撃範囲を短時間にモデル化したGPSスプーフィング攻撃による攻撃モデルを提案する。
最後に,本研究では,DRLシステムとPX4オートパイロットシステムを組み合わせた攻撃モデルの両方において,攻撃が可能であることを実験的に実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:42:55 GMT)
WGLE:Backdoor-free and Multi-bit Black-box Watermarking for Graph Neural Networks [2.4] グラフニューラルネットワーク(GNN)のための新しいブラックボックス透かしパラダイムであるWGLEを提案する。
WGLEは、意図した情報をエンコードする透かしを埋め込む。
その結果、WGLEは100%のオーナシップ検証精度、平均忠実度0.85%、潜在的攻撃に匹敵し、組込みオーバーヘッドが低いことがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:12:00 GMT)
Exploring the Evidence-Based Beliefs of LLM-Based Programming Assistants [2.3] 本研究では,大規模言語モデル (LLM) がソフトウェア開発タスクを支援するために用いられていることを考察する。
以上の結果から,LSMをベースとしたプログラミングアシスタントは,研究の主張に関して曖昧な信念を持ち,回答を裏付ける信頼できる証拠が欠如していることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:04:20 GMT)
MetaTT: A Global Tensor-Train Adapter for Parameter-Efficient Fine-Tuning [2.3] プリトレーニングトランスのグローバル低ランク微調整のための統合TrainアダプタフレームワークであるMetaTTを提案する。
個々の重み行列を独立に微調整するLoRAとは異なり、MetaTTは単一の共有TTを使用してすべてのトランスフォーマーサブモジュールを分解する。
我々のベンチマークはMetaTTとLoRAを比較し、最近の最先端行列とテンソル分解に基づく微調整スキームを比較した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:32:05 GMT)
Generation from Noisy Examples [2.3] 生成性は、有限個のノイズのある例の存在によってほとんど影響を受けないことが示される。
有限類と可算類に対して、生成性は有限個のノイズのある例の存在によってほとんど影響を受けないことを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:33:34 GMT)
ContextLoss: Context Information for Topology-Preserving Segmentation [2.3] 臨界画素マスクにおけるトポロジカルな誤りを考慮し,トポロジカルな正当性を向上する新しい損失関数 ContextLoss (CLoss) を提案する。
提案したCLossを3つの公開データセット(2Dと3D)と骨セメントラインの3Dナノイメージングデータセットでベンチマークした。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:09:52 GMT)
Contextuality sans incompatibility in the simplest scenario: Communication supremacy of a qubit [2.3] 本稿では,準備に関する具体的な制約を含む,二者間による準備対応型コミュニケーションゲームを紹介する。
最も単純な測定シナリオでは、文脈性は相容れないことが示され、3段階の極端量子ビット測定しか必要とされない。
本研究は,情報処理タスクにおける量子ビットの有効性を探求する新たな経路を開拓するものである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:45:31 GMT)
Towards Cross-Subject EMG Pattern Recognition via Dual-Branch Adversarial Feature Disentanglement [2.2] クロスオブジェクト筋電図(EMG)パターン認識は, 筋解剖学, 電極配置, 信号特性の相違により, 重要な課題に直面している。
従来の手法では、モデルを新しいユーザに適用するために、対象固有のキャリブレーションデータを頼りにしている。
本稿では,EMG特徴をパターン固有成分と主観固有成分に分離することにより,パターン認識と個人識別を同時に行うエンド・ツー・エンドの対向ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:23:14 GMT)
Scalable Spatiotemporal Inference with Biased Scan Attention Transformer Neural Processes [2.2] Biased Scan Attention Transformer Neural Process (BSA-TNP)
BSA-TNPは、1つの24GB GPU上で1分以内で100万ポイント以上の100Kコンテキストポイントを持つ推論を実行すること、(2)翻訳不変性を示し、複数の解像度での学習を可能にすること、(3)空間と時間の両方で進化する透過的なモデルプロセス、(5)スケールを優雅に行うこと、の3つである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:24:08 GMT)
A Topological Improvement of the Overall Performance of Sparse Evolutionary Training: Motif-Based Structural Optimization of Sparse MLPs Project [2.2] 本研究では,多層パーセプトロン(SET-MLP)に適用したスパース進化学習の構造最適化により,性能が向上するかどうかを検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:49:07 GMT)
A PDE-Based Image Dehazing Method via Atmospheric Scattering Theory [2.2] 本稿では, 単像脱ハージングのための新しい偏微分方程式(PDE)フレームワークを提案する。
大気散乱モデルと非局所正則化とダークチャネルを併用することにより,改良されたPDEを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:43:09 GMT)
Zero-shot Meta-learning for Tabular Prediction Tasks with Adversarially Pre-trained Transformer [2.2] 本稿では、実世界のデータセットを事前学習することなく、表形式の予測タスクでゼロショットメタ学習を行うことのできるAdversarially Pre-trained Transformer(APT)を提案する。
APTは、異なる合成データセットで意図的にモデルに挑戦する敵対的な合成データエージェントで事前訓練されている。
筆者らのフレームワークは,データセットの特徴をフィルタリングすることなく,小さな分類タスクにおける最先端のパフォーマンスと一致していることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:38:35 GMT)
Lightweight and High-Throughput Secure Logging for Internet of Things and Cold Cloud Continuum [2.2] 本稿では,新しいデジタル署名フレームワークPOSLOについて述べる。
POSLOは、定数サイズシグネチャと公開キー、ほぼ最適署名効率、ログ監査のための微調整可能な検証を提供する。
例えば、POSLOは、ミッドレンジのコンシューマGPU上で毎秒231のログエントリを検証でき、最先端のGPUよりもはるかにコンパクトである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:26:36 GMT)
Penalty Learning for Optimal Partitioning using Multilayer Perceptron [2.1] 変更点検出(Changepoint detection)は、シーケンスの大きなシフトを特定する技術である。
変化点数を制御するために、動的プログラミングアルゴリズムは、変化点の存在を罰するために固定ペナルティを使用する。
既存の手法では線形やツリーベースといった単純なモデルが使われており、予測性能が制限される可能性がある。
本研究では,ReLUアクティベーション機能を持つ多層パーセプトロン(MLP)を用いてペナルティを予測することを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:01:26 GMT)
ZigzagPointMamba: Spatial-Semantic Mamba for Point Cloud Understanding [2.1] PointMambaのような状態空間モデル(SSM)は、ポイントクラウドの自己教師型学習のための効率的な特徴抽出を可能にする。
既存のPointMambaベースの手法は、複雑なトークン順序付けとランダムマスキングに依存している。
これらの課題に対処するためにZigzagPointMambaを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:46:35 GMT)
Geometric deep learning for local growth prediction on abdominal aortic aneurysm surfaces [2.0] 腹部大動脈瘤 (AAA) は腹部大動脈の進行性局所拡張である。
現在の臨床ガイドラインでは、AAAの最大径が男性55mm、女性50mmを超える場合は、選択的外科的修復を推奨している。
局所的・多物理的特徴に富んだ血管表面のAAA成長を直接予測するためにSE(3)対称変圧器モデルを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:27:12 GMT)
Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers [1.9] 既存の研究は、モデルの表現から数値の値を求めることには成功しなかった。
本稿では,入力埋め込みから数値をほぼ完全精度で復号する新しい探索手法を提案する。
プローブの精度によって判断された埋め込みの精度は、基本算術におけるLMの誤差の大部分を説明できることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:37:35 GMT)
A Decomposition-Based Approach for Evaluating and Analyzing Inter-Annotator Disagreement [1.8] 本稿では,既存のアノテーションを概念的に別のレベルに分解する手法を提案する。
このアプローチを実現するために,2つの異なる戦略を提案する。
我々は、アプローチを拡張して一般化する方法を提案するとともに、他の目的のためにそれを使う方法を提案することで締めくくります。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:26:54 GMT)
Quantum Adiabatic Generation of Human-Like Passwords [1.8] 本稿では,現実的なパスワード生成のためのアダバティック量子コンピュータの有用性について検討する。
以上の結果から,QuEra Aquila 256-qubit中性原子量子コンピュータで生成された128個のパスワードの比較的小さなサンプルには,人間のようなパスワードが含まれていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:43:05 GMT)
MIRAGE: Multimodal foundation model and benchmark for comprehensive retinal OCT image analysis [1.8] MIRAGEは、OCTと走査型レーザー眼鏡(SLO)画像の解析のための新しいFMである。
OCT/SLO分類とセグメンテーションタスクを用いた新しい評価ベンチマークを提案する。
一般および専門的なFMとセグメンテーション法との比較は,MIRAGEの両タスクにおける優位性を示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:25:55 GMT)
On the Privacy Risks of Spiking Neural Networks: A Membership Inference Analysis [1.8] スパイキングニューラルネットワーク(SNN)は、現実のアプリケーションにおいて、そのエネルギー効率と堅牢性のためにますます研究されている。
本研究では,SNNのMIAに対する感受性について検討する。
MIAは、あるサンプルがトレーニングデータセットの一部であるかどうかを敵が判断しようとする、大きなプライバシー上の脅威である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:38:35 GMT)
UKAN-EP: Enhancing U-KAN with Efficient Attention and Pyramid Aggregation for 3D Multi-Modal MRI Brain Tumor Segmentation [1.8] UKAN-EPは、マルチモーダルMRI脳腫瘍セグメンテーションのためのオリジナルの2D U-KANモデルの新規な3D拡張である。
UKAN-EPは、計算資源を著しく少なくしながら、より優れたセグメンテーション性能を達成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:14:42 GMT)
User Modeling in Model-Driven Engineering: A Systematic Literature Review [1.7] 我々は,モデル駆動工学(MDE)アプローチにおけるユーザモデリングの既存提案を分析するために,体系的な文献レビューを実施している。
結果は、統一的で完全なユーザーモデリングの視点が欠如していることを示しています。
これにより、よりリッチなユーザインターフェースの実装が、ユーザ固有のニーズをよりサポートできるようになります。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:47:12 GMT)
SmartAttack: Air-Gap Attack via Smartwatches [1.7] 本稿では,センサを受信機として利用するSmartAttackを提案し,評価する。
提案手法では,スマートウォッチ内蔵マイクロホンを用いて18-22kHzの超音波周波数範囲内で,隠蔽信号をリアルタイムに捕捉する。
我々の発見は、スマートウォッチが高セキュリティ環境にもたらすセキュリティリスクを強調し、この新たな脅威に対処するための緩和戦略の概要を説明した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:56:21 GMT)
Towards Fair Representation: Clustering and Consensus [1.7] 特定の保護された属性に関して、代表的であるだけでなく公平でもあるコンセンサスクラスタリングを見つけます。
調査の一環として,既存のクラスタリングを最小限に修正して公平性を実現する方法について検討した。
我々は,同値なグループ表現とニア線形時間定数係数近似アルゴリズムを用いたデータセットの最適アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:33:21 GMT)
ALE-Bench: A Benchmark for Long-Horizon Objective-Driven Algorithm Engineering [1.7] ALE-Benchは、スコアベースのアルゴリズムプログラミングコンテストでAIシステムを評価するための新しいベンチマークである。
ALE-Bench は計算的に困難であり、正確な解は認めない最適化問題を提示する。
私たちのソフトウェアフレームワークは、テスト実行フィードバックと視覚化を活用する対話型エージェントアーキテクチャをサポートしています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:59:56 GMT)
Pivoting Factorization: A Compact Meta Low-Rank Representation of Sparsity for Efficient Inference in Large Language Models [1.6] Pivoting Factorization (PIFA) は、任意の低ランク表現のコンパクトな形式を教師なしで学習する新しい低ランク表現である。
PIFAは24.2%のメモリ節約と24.6%の高速化を実現している。
MPIFAは、MとPIFAをエンドツーエンドのフレームワークに統合し、既存の低ランクプルーニング手法よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:10:18 GMT)
Multi-Task Reward Learning from Human Ratings [1.6] 複数のタスクを共同で検討し、人間の意思決定を模倣する新しい強化学習法を提案する。
報酬のない環境における人間の評価を活用し、報酬関数を推論し、分類モデルと回帰モデルの両方の貢献のバランスをとる学習可能な重みを導入します。
その結果,提案手法は既存のレーティングに基づくRL手法よりも常に優れており,場合によっては従来のRL手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:00:19 GMT)
Qymera: Simulating Quantum Circuits using RDBMS [1.6] 本稿では,データベース管理システム(RDBMS)をシミュレーションに活用するシステムであるQymeraを紹介する。
Qymeraは幅広い量子回路をサポートし、グラフィカル回路ビルダーと入力回路にコードベースのインタフェースを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:56:06 GMT)
Double Landmines: Invisible Textual Backdoor Attacks based on Dual-Trigger [1.6] 本稿では,構文とムードに基づくDual-Triggerバックドアアタックを提案する。
多くの実験結果から,本手法が従来の手法よりも有意に優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:51:09 GMT)
E2E Process Automation Leveraging Generative AI and IDP-Based Automation Agent: A Case Study on Corporate Expense Processing [1.6] 本稿では,現代デジタルトランスフォーメーションにおけるインテリジェントな作業自動化手法を提案する。
生成AIとインテリジェントドキュメント処理技術とオートメーションエージェントを統合し、企業の財政的経費処理タスクのエンドツーエンド(E2E)自動化を実現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:03:14 GMT)
RHealthTwin: Towards Responsible and Multimodal Digital Twins for Personalized Well-being [1.6] 本稿では,AIを活用したデジタル双生児の構築と管理のための基本的枠組みを提案する。
RHealthTwinは、健康に焦点を当てた言語モデルを誘導し、安全で関連性があり説明可能な応答を生成するマルチモーダル入力を処理する。
RHealthTwinはメンタルサポート、症状トリアージ、栄養計画、活動コーチングを含む4つの消費者健康領域で評価した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:20:22 GMT)
Explainable Compliance Detection with Multi-Hop Natural Language Inference on Assurance Case Structure [1.6] 自然言語推論(NLI)に基づくコンプライアンス検出手法を提案する。
保証ケースのクレーム・アビデンス・エビデンス構造をマルチホップ推論として定式化し、説明可能かつトレーサブルなコンプライアンス検出を行う。
本結果は,規制コンプライアンスプロセスの自動化におけるNLIベースのアプローチの可能性を強調した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:56:06 GMT)
FAIRTOPIA: Envisioning Multi-Agent Guardianship for Disrupting Unfair AI Pipelines [1.6] AIモデルは積極的な意思決定者となり、しばしば人間の監督なしに行動している。
エージェントは彼らの環境から学ぶので、公正な保護者としてエージェントを想定する。
本稿では,マルチロールエージェントをエンドツーエンド(人間からAI)のシナジースキームに組み込むフェアネス・バイ・デザイン手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:02:43 GMT)
Enhancing quantum noise characterization via extra energy levels [1.6] 量子ビット部分空間におけるSPAMとゲートノイズの両方を特徴付ける際に、余剰エネルギーレベルを用いてゲージのあいまいさを低減する方法を示す。
超伝導量子コンピューティングデバイスにこれらのアイデアを実験的に実装し,ノイズ特性の精度向上を実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:00:08 GMT)
Technical Report for Argoverse2 Scenario Mining Challenges on Iterative Error Correction and Spatially-Aware Prompting [1.5] RefAVは自然言語クエリを実行可能コードに変換するフレームワークで、関連するシナリオを特定する。
この技術的なレポートでは、これらの制限に対処するための2つの重要な拡張を紹介します。
さまざまなLLMs-Qwen2.5-VL-7B、Gemini 2.5 Flash、Gemini 2.5 Proを使ったArgoverse 2検証セットの実験では、複数のメトリクスで一貫した利得を示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:40:08 GMT)
Scalable and Cost-Efficient de Novo Template-Based Molecular Generation [1.5] テンプレートベースのGFlowNetでは,(1)合成コストの最小化,(2)大規模ビルディングブロックライブラリへのスケーリング,(3)小さなフラグメントセットを効果的に活用する,という3つの課題に対処する。
我々は、補助的な機械学習モデルを用いて合成コストと生存性を近似する後方ポリシーフレームワークであるtextbfRecursive Cost Guidanceを提案する。
より小型なビルディングブロックライブラリの性能向上を目的として,中間的高次状態の再利用と完全合成木の構築を行う textbfDynamic Library 機構を開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:16:09 GMT)
Token Perturbation Guidance for Diffusion Models [1.5] Token Perturbation Guidance (TPG) は拡散ネットワーク内の中間トークン表現に直接行列を適用する新しい手法である。
TPGは訓練が不要で、入力条件に依存しないため、条件付きおよび条件なしの両方に容易に適用できる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:25:46 GMT)
In Crowd Veritas: Leveraging Human Intelligence To Fight Misinformation [1.5] この論文は、オンライン情報の真偽を評価するために、人間の知性をどのように活用できるかを考察する。
誤情報評価、認知バイアス、自動化された事実チェックシステムという3つの分野に焦点を当てている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:25:10 GMT)
Site-resolved magnon and triplon dynamics on a programmable quantum dot spin ladder [1.5] 我々はゲルマニウム量子ドットの配列を用いて、単一スピン励起(マグノン)と2スピン励起(トリプル)のダイナミクスをシミュレートする。
これらの手法を用いることで、マグノンとトリトンの両方、およびハイゼンベルク交換結合の様々な構成に対して量子ウォークプロットを再構築することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:22:43 GMT)
Detecting malignant dynamics on very few blood sample using signature coefficients [1.4] そこで本研究では, 血液サンプル分析に基づくアグレッシブ癌検出のためのシグナチャ理論の活用について検討する。
我々のアプローチは、血液中のctDNAレベルの動態を連続的にモデル化するMarkovのツールと、効率的なテスト手順を構築するための署名理論を組み合わせる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:08:34 GMT)
Estimating Visceral Adiposity from Wrist-Worn Accelerometry [1.4] 内臓組織(VAT)は代謝的健康と習慣的身体活動の両方の鍵となるマーカーである
VATは、運動中にカテコールアミンによって刺激されるターンオーバーが増大する、非常にラベラブルな脂肪補給所である。
VATは高度なイメージング技術で測定できるが、PAから直接推定することもできる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:33:39 GMT)
Normalized Radon Cumulative Distribution Transforms for Invariance and Robustness in Optimal Transport Based Image Classification [1.4] Radon累積分布変換(R-CDT)は、画像分類作業を容易にする簡易な特徴抽出器である。
任意のアフィン変換の下では、基本演算のみを必要とせず、分離性も保証する、いわゆる最大正規化R-CDTを導入する。
感度解析により, 試料間のワッサーシュタイン-無限距離を制御できる場合, 分離性は安定であることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:03:20 GMT)
Trustworthy AI for Medicine: Continuous Hallucination Detection and Elimination with CHECK [1.4] 大規模言語モデル(LLMs)は医療において有望であるが、幻覚は臨床利用にとって大きな障壁である。
構造化された臨床データベースを統合して幻覚を検出する継続的学習フレームワークであるCHECKについて述べる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:12:28 GMT)
Fault-Tolerant Stabilizer Measurements in Surface Codes with Three-Qubit Gates [1.4] 回転しない曲面符号に対する安定化器測定回路は, 単一補助量子ビットと3量子ゲートを用いて耐故障性を示す。
これらのゲートにより、低い深さの回路が故障箇所を減らし、QECサイクル時間を短縮することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:54:23 GMT)
Systematic and Efficient Construction of Quadratic Unconstrained Binary Optimization Forms for High-order and Dense Interactions [1.3] 量子アニーリング(QA)は、目的関数が準制約なしバイナリ最適化(QUBO)で表される最適化問題を効率的に解くことができる。
機械学習(ML)を含む複雑な問題に対する二次化手法を提案する。
本研究では,一般化された線形単位基底の和による対象関数のモデル化を行う。
そこで我々は,新たなブラックボックス最適化手法を設計し,四元化処理後にMLサロゲートレグレシタをQAに入力する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:50:09 GMT)
Institutional Books 1.0: A 242B token dataset from Harvard Library's collections, refined for accuracy and usability [1.3] Institutional Books 1.0は、2006年からHarvard LibraryのGoogle Booksプロジェクトへの参加を通じてデジタル化されたパブリックドメインブックのコレクションである。
ハーバード図書館で作業し、これらの論文を抽出し、分析し、処理し、歴史文書の広範囲に記録されたデータセットにしました。
この分析は、当初250以上の異なる言語で書かれた1,075,899巻に及ぶ、約250億個のトークンをスキャンしたハーバード図書館のコレクション全体をカバーしている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:11:30 GMT)
GenJoin: Conditional Generative Plan-to-Plan Query Optimizer that Learns from Subplan Hints [1.3] 我々は,クエリ最適化問題を共生生成タスクとして考える,新しい学習クエリであるGenJoinを提案する。
GenJoinは、よく知られた2つの実世界のベンチマークの最先端メソッドと同様に、大きく、一貫してパフォーマンスを向上する最初の学習クエリである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:40:35 GMT)
Data Augmentation For Small Object using Fast AutoAugment [1.3] 本稿では,Fast AutoAugment を用いたデータ拡張手法を提案する。
DOTAデータセット上で20%の性能向上を実現した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:25:40 GMT)
On Large-scale Evaluation of Embedding Models for Knowledge Graph Completion [1.3] 知識グラフ埋め込み(KGE)モデルは知識グラフ補完のために広く研究されている。
標準的な評価基準は、欠落した三重項を正確に予測するためのモデルを罰するクローズドワールドの仮定に依存している。
本稿では,大規模データセットFB-CVT-REVとFB+CVT-REVの4つの代表的なKGEモデルを包括的に評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:38:07 GMT)
Discovering Continuous-Time Memory-Based Symbolic Policies using Genetic Programming [1.3] 遺伝的プログラミングは最適化に使われ、象徴的な表現からなる解釈可能なポリシーをもたらす。
この結果から,記憶の象徴的ポリシーは,様々な制御タスクにおけるブラックボックスポリシーと比較できることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:27:18 GMT)
LaDCast: A Latent Diffusion Model for Medium-Range Ensemble Weather Forecasting [1.2] 我々は中距離アンサンブル予測のための最初のグローバル潜在拡散フレームワークであるLaDCastを紹介する。
LaDCastは学習された潜在空間で、時間ごとのアンサンブル予測を生成する。
LaDCastはEuropean Centre for Medium-Range Forecast IFS-ENSに近い決定的および確率的スキルを達成している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:17:14 GMT)
Optimizing Superconducting Three-Qubit Gates for Surface-Code Error Correction [1.1] 我々は、2つのデータ量子ビットのパリティを1ステップで1つの測定量子ビットにマッピングするトランスモン量子ビットを超伝導する3量子CZZゲートを設計する。
本研究では,マイクロゲートシミュレーションから得られた誤差モデルを用いて,特にQECプロトコルに有害なパウリ誤差を系統的に抑制する。
回転曲面符号に対して、CZZゲートの実装により、約50%の誤差閾値が$approx 1.2,%に増加し、実験系における論理誤差率を最大1桁まで減少させることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:54:22 GMT)
Strain Problems got you in a Twist? Try StrainRelief: A Quantum-Accurate Tool for Ligand Strain Calculations [1.1] リガンドひずみエネルギーは構造に基づく小分子ドラッグデザインの重要な構成要素である。
ひずみエネルギーを高精度に計算するツールを提案する。
本研究では, DFT に対するひずみエネルギー差を 1.4 kcal/mol 以内と推定し, 代替NP よりも精度が高いことを示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:03:19 GMT)
ReSpace: Text-Driven 3D Scene Synthesis and Editing with Preference Alignment [1.1] ReSpaceはテキスト駆動型屋内シーン合成と編集のための生成フレームワークである。
教師付き微調整と選好アライメントを組み合わせた二段階学習手法を応用した。
シーン編集にはゼロショットLLMを用いてオブジェクトの削除と追加のプロンプトを行う。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:08:12 GMT)
MOSAIC-F: A Framework for Enhancing Students' Oral Presentation Skills through Personalized Feedback [1.1] このフレームワークは、MMLA(Multimodal Learning Analytics)、観測、センサー、人工知能(AI)、コラボレーションアセスメントを統合している。
このフレームワークは、人間に基づく評価技術とデータに基づく評価技術を組み合わせることで、より正確でパーソナライズされ、行動可能なフィードバックを可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:46:31 GMT)
PatchGuard: Adversarially Robust Anomaly Detection and Localization through Vision Transformers and Pseudo Anomalies [1.1] 本研究では,視覚変換器(ViT)をベースとしたアーキテクチャにおいて,擬似異常を局所化マスクに組み込んだADおよびAL手法であるPatchGuardを紹介する。
高度に確立された産業用および医療用データセットの実験結果から、PatchGuardは対向的な設定で従来の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:45:54 GMT)
Towards Biosignals-Free Autonomous Prosthetic Hand Control via Imitation Learning [1.1] 本研究の目的は,義手のための完全自律制御システムの開発である。
物体の近くに手を置くことで、システムは適切な握力で把握動作を自動的に実行します。
把握されているオブジェクトを解放するために、オブジェクトをテーブルの近くに自然に配置すると、システムが自動的に手を開く。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:44:08 GMT)
Exact Upper and Lower Bounds for the Output Distribution of Neural Networks with Random Inputs [1.0] ニューラルネットワーク(NN)の出力の累積分布関数(cdf)について,そのサポート全体に対する正確な境界を導出する。
本手法は連続的な単調片方向の連続的な微分可能なアクティベーション関数を用いて,任意のフィードフォワードNNに適用する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:47:09 GMT)
Re4MPC: Reactive Nonlinear MPC for Multi-model Motion Planning via Deep Reinforcement Learning [0.9] 本稿では,Re4MPCと呼ばれる新しいマルチモデル動作計画パイプラインを提案する。
モデル予測制御(Model Predictive Control)を使用して、エンドエフェクタ目標を達成するための軌道を計算する。
我々は,Re4MPCの方が計算効率が高く,NMPCベースラインよりも高い成功率が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:58:32 GMT)
ABC-FHE : A Resource-Efficient Accelerator Enabling Bootstrappable Parameters for Client-Side Fully Homomorphic Encryption [0.9] ホモモルフィック暗号化(FHE)は、暗号化されたデータの連続的な計算を可能にする。
FHEアクセラレータの最近の進歩はサーバサイドのパフォーマンス改善に成功しているが、クライアントサイドの計算はボトルネックのままである。
我々はABC-FHEを提案する。ABC-FHEは、クライアント側でブートストラップ可能なパラメータをサポートする、面積効率と電力効率のよいFHEアクセラレータである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:37:31 GMT)
Low-Loss Space in Neural Networks is Continuous and Fully Connected [0.8] 2つの異なるミニマを、損失の少ない中間点からなる経路に接続できることを示す。
また、モデル一般化を改善するための新しい可視化手法や機会も提供しています。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:08:42 GMT)
Extending Internet Access Over LoRa for Internet of Things and Critical Applications [0.8] ILoRaは、LoRaのバックボーンネットワークを介して、インターネット上のアプリケーションプログラミングインタフェース(API)とWebページへのアクセスを可能にする。
本研究はILoRaの提案と実装を行い,本質的なサービス提供のために公共インターネットを非接続領域に拡張する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:34:12 GMT)
Enabling stratified sampling in high dimensions via nonlinear dimensionality reduction [0.8] 層状サンプリングはよく知られた分散還元戦略である。
提案手法は高次元において有効であり,マルチ忠実度モンテカルロ推定器の分散をさらに低減するために有効であることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:47:10 GMT)
ORFS-agent: Tool-Using Agents for Chip Design Optimization [0.8] 大規模言語モデル(LLM)は、このような高次元最適化タスク内で学習と推論を行う新しい機会を提供する。
LLMをベースとした反復最適化エージェントORFS-agentを導入し,パラメータチューニングをオープンソースのハードウェア設計フローで自動化する。
2つの異なる技術ノードと様々な回路ベンチマークに関する実証的な評価は、ORFSエージェントがルーティングされたワイヤ長と有効クロック期間の両方を13%以上改善できることを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:38:57 GMT)
Large-Scale Quantum Device Benchmarking via LXEB with Particle-Number-Conserving Random Quantum Circuits [0.8] ベンチマークに用いるランダム量子回路に粒子数保存と呼ばれる制約を導入する。
これにより、固定粒子数に対するヒルベルト空間のサイズが小さくなり、100量子ビットを超える回路の古典的なシミュレーションが可能になる。
本稿では,LXEBの修正版であるMLXEBを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:29:12 GMT)
Whole-Person Education for AI Engineers [0.8] この研究は、AIエンジニアリング教育の変化を求める主要な動機を特定する。
この発見は技術中立と技術救世主義の神話に挑戦した。
この研究は、AIエンジニアリング教育を変革するための貴重な洞察とレコメンデーションを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:03:31 GMT)
Neighbors and relatives: How do speech embeddings reflect linguistic connections across the world? [0.7] 本研究では,XLS-R自己教師型言語識別モデルvox107-xls-r-300m-wav2vecの埋め込みを用いて106世界言語間の関係を解析した。
線形識別分析(LDA)を用いて、言語埋め込みをクラスタ化し、系譜、語彙、地理的距離と比較する。
その結果, 埋め込み型距離は従来の指標と密接に一致し, グローバルおよび局所的な類型パターンを効果的に捉えることができた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:33:34 GMT)
Who is using AI to code? Global diffusion and impact of generative AI [0.7] 生成的コーディングツールは生産性の大きな向上を約束するが、不均一な獲得はスキルと収入のギャップを広げる可能性がある。
2024年12月までに、AIはアメリカの貢献者から推定30.1%のPython関数を書いたが、ドイツでは24.3%、フランスでは23.2%、インドでは21.6%、ロシアでは15.4%、中国では11.7%だった。
開発者内固定効果モデルでは、30%のAI利用への移行が四半期コミットを2.4%引き上げている。
この効果を職業的タスクと賃金データと組み合わせることで、米国でのAI支援コーディングの年間価値は9.6億ドルから14.4億ドルになる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:06:19 GMT)
State-preparation and measurement error mitigation with non-computational states [0.7] 超伝導量子ビットにおける状態準備誤差を学習するための追加資源として非計算状態を利用する方法を示す。
提案手法は,中間回路計測による動的回路にも適用可能である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:01:24 GMT)
MEMETRON: Metaheuristic Mechanisms for Test-time Response Optimization of Large Language Models [0.7] 大規模言語モデル(LLM)は、オープンエンドタスクと構造化タスクの両方にますます使われている。
本稿では,個別のブラックボックス最適化問題としてLCMデコーディングを定式化するタスク非依存フレームワークMEMETRONを紹介する。
我々は,人間の嗜好アライメントタスクの枠組みを評価し,標準的な復号化手法と復号化手法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:55:53 GMT)
FoldA: Computing Partial-Order Alignments Using Directed Net Unfoldings [0.7] 本稿では,FoldA と呼ばれる有向ペトリネット展開を用いたハエの偏位アライメントの計算手法を提案する。
提案手法を485個の合成モデル-ログ対上で評価し,Astar-とDijkstra-アライメントを13個の実生活モデル-ログ対と6個のベンチマーク対で比較した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:44:05 GMT)
CounselBench: A Large-Scale Expert Evaluation and Adversarial Benchmark of Large Language Models in Mental Health Counseling [0.7] 大規模言語モデル(LLM)は、メンタルヘルスサポートのためにますます提案されているが、現実的なカウンセリングシナリオにおけるそれらの振る舞いは、ほとんどテストされていない。
コウンセルベンチ(CounselBench)は、100人のメンタルヘルス専門家と共同で開発され、シングルターンカウンセリングにおけるLLMの評価とストレステストを行う大規模ベンチマークである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:53:06 GMT)
"vcd2df" -- Leveraging Data Science Insights for Hardware Security Research [0.7] ハードウェア設計言語(HDL)からPythonやRのようなデータサイエンス言語へのブリッジを作成します。
本稿では、レジスタ転送レベル(RTL)トレースデータから高レベル言語でインサイトを導出する方法を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 02:20:30 GMT)
Optimizing Shortfall Risk Metric for Learning Regression Models [0.6] UBSRは、基礎となる分布の非線形関数であるため、UBSRの目的による経験的リスク最小化は困難である。
分岐型アルゴリズムを考案し,UBSR最適解への収束を確立する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:53:41 GMT)
Low-Level and NUMA-Aware Optimization for High-Performance Quantum Simulation [0.6] 我々はQuESTシミュレータにオープンソースで高性能な拡張を導入し、最新のコンピュータに最先端の低レベルおよびNUMA計算の最適化をもたらす。
実験では、シングルキュービットゲート操作では5.5-6.5x、2キュービットゲートでは4.5x、ランダム量子回路(RQC)では4x、量子フーリエ変換(QFT)では1.8xという大きなスピードアップが示されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:35:11 GMT)
Supervised Quantum Machine Learning: A Future Outlook from Qubits to Enterprise Applications [0.6] Supervised Quantum Machine Learning (QML)は、量子コンピューティングと古典的な機械学習の共通点である。
本稿では, 量子回路, 量子ニューラルネットワーク, 量子カーネル法などの手法に着目し, 教師付きQMLの最近の展開を概観する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:41:54 GMT)
Landsat-Bench: Datasets and Benchmarks for Landsat Foundation Models [0.6] Landsat-Benchは、既存のリモートセンシングデータセットから適応する、Landsatイメージを備えた3つのベンチマークスイートである。
我々はSSL4EO-Lデータセットで事前訓練された共通アーキテクチャとLandsat基盤モデルの両方のベースラインと標準化された評価手法を確立する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:24:55 GMT)
Rule-Assisted Attribute Embedding [0.6] RAE(Rule-Assisted Approach for Attribute Embedding)は,属性の埋め込みを導くためのセマンティックルールをマイニングすることでレコメンデーションを改善する手法である。
RAEはルールベースのランダムウォークを実行し、GCNに統合されたリッチな属性表現を生成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:51:03 GMT)
Tailored Architectures for Time Series Forecasting: Evaluating Deep Learning Models on Gaussian Process-Generated Data [0.6] 時系列特性と特定のモデルとの明確な関係を明らかにすることを目的としている。
多様な時間的ダイナミクスを扱うのに適したモジュラーアーキテクチャを組み込んだ新しいモデルであるTimeFlexを紹介します。
このモデルは現在の最先端モデルと比較され、様々な時系列条件下でモデルがどのように機能するかをより深く理解する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:46:02 GMT)
Understanding Human-AI Trust in Education [0.6] 本研究では,人間的・システム的信頼が学生の快楽,信頼的意図,使用に対する行動意図,有用性にどのように影響するかを検討する。
本研究は,人間とAIの信頼に特有な新たな理論的枠組みの必要性を浮き彫りにし,適切な信頼を育むための実践的な洞察を提供するものである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:15:40 GMT)
A Culturally-Aware Benchmark for Person Re-Identification in Modest Attire [0.5] イラン科学技術者再同定(IUST_PersonReId)データセットについて紹介する。
このデータセットは、新しい文化環境におけるReIDのユニークな課題を反映し、控えめな服装とイランからの多様なシナリオを強調している。
IUST_PersonReIdにおけるセマンティック制御型自己教師学習(SOLIDER)やContrastive Language- Image Pretraining Re-Identification(CLIP-ReID)などの最先端モデルによる実験により,大幅な性能低下が明らかになった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:02:28 GMT)
Addressing Pitfalls in Auditing Practices of Automatic Speech Recognition Technologies: A Case Study of People with Aphasia [0.5] 監査人は、データ前処理中に単一のテキスト標準化手法に固執することが多い。
第3に、監査はしばしば単一のゴールド標準指標であるWord Error Rateに依存している。
これら3つの落とし穴を考慮に入れた,より包括的な監査フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:34:36 GMT)
Fluxonium as a control qubit for bosonic quantum information [0.5] このフラキソニウムは、望ましくない空洞の非線形性を排除できる空洞結合機構に到達できることを示す。
その結果, 超伝導キャビティのための高性能ボソニック制御量子ビットとしてのフラキソニウムの可能性が示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:21:06 GMT)
A Replica for our Democracies? On Using Digital Twins to Enhance Deliberative Democracy [0.4] 本稿では,Digital Twin(DT)技術について検討する。
現実世界の議論をシミュレートする動的モデルを構築することで、DTは研究者や政策立案者が「何」のシナリオを厳格にテストすることを可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:11:07 GMT)
Zero-Shot Gaze-based Volumetric Medical Image Segmentation [0.4] 対話型セグメンテーションのための新しい情報モダリティとして視線を導入した。
我々は、SAM-2とMedSAM-2を用いた視線情報を用いた視線データと実視線データの両方を用いて、視線情報を用いた視線情報の有効性を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:17:53 GMT)
Quantifying Mix Network Privacy Erosion with Generative Models [0.4] この作業では、ミキサネットトラフィックに基づいてトレーニングされた生成モデルを使用して、ユーザが一定時間にわたって永続的に通信する際のプライバシの損失を推定する。
以上の結果から,同様の平均レイテンシを持つ場合であっても,混合戦略のプライバシーレベルに顕著な差が認められた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:43:39 GMT)
Diffusion-based Time Series Forecasting for Sewerage Systems [0.3] 我々は,下水道システムにおける文脈予測の精度を高めるための新しい深層学習手法を提案する。
我々のシステムは、様々な環境信号の複雑な相関を捉え、極端な気象イベントにおいても堅牢な予測を可能にする。
実際の下水道システムデータに対する実証テストでは、信頼性の高いコンテキスト予測を提供するためのモデルの異常な能力を確認しました。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:48:05 GMT)
Agile Reinforcement Learning for Real-Time Task Scheduling in Edge Computing [0.3] 本研究では,エッジコンピューティングにおけるソフトリアルタイムアプリケーションをスケジューリングするためのアジャイル強化学習(aRL)を提案する。
RLエージェントは情報探索を行い、関連するアクションのみを実行する。
実験により、情報探索法とアクションマスキング法の組み合わせにより、aRLは高ヒット比を達成でき、ベースラインアプローチよりも早く収束できることが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:38:07 GMT)
Correspondence between quasiparticle dissipation and quantum information decay in open quantum systems [0.3] 入浴時のSOIと浴槽の相互作用について検討した。
その結果,SOIバス分離度はアンダーソンモデルにおける準粒子のスペクトル重みに対応していることがわかった。
この研究は、準粒子伝播におけるエネルギー散逸と開量子系における量子情報の損失を結びつけるための方向を与える。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:50:15 GMT)
Robust Spin Polarization by Adiabatic Dynamical Decoupling [0.3] ダイアモンドの室温での非断熱パルス核スピン偏極を実証した。
偏光効率の向上,広い共振窓の実現,超微細結合不確実性への耐性の向上を実現した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:38:51 GMT)
Learning surrogate equations for the analysis of an agent-based cancer model [0.3] がん細胞と免疫細胞との競合を調べるために、6つの異なるシナリオを実行しました。
次に、結合方程式学習を用いて、各シナリオに対する集団ベースの反応モデルを構築する。
一つの代理集団に基づく反応モデルにどのように統合できるかを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:41:59 GMT)
Interplay of entanglement structures and stabilizer entropy in spin models [0.3] エンタングルメント構造と非安定化剤性が量子相の特異なシグネチャとしてどのように機能するかを示す。
この結果から, 絡み合いスペクトル特性と魔法に基づく測度は, 量子相転移の相互に絡み合った, 頑健な指標となることが明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:33:42 GMT)
Spiking Neural Models for Decision-Making Tasks with Learning [0.3] 本稿では,学習機構を組み込んだ意思決定のための生物学的に妥当なスパイキングニューラルネットワーク(SNN)モデルを提案する。
この研究は、生物学的に関連する神経機構を認知モデルに統合するための重要なステップを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:19:40 GMT)
Scalable Graph Attention-based Instance Selection via Mini-Batch Sampling and Hierarchical Hashing [0.2] インスタンス選択(IS)は、情報的特性を維持しながらデータセットのサイズを減らすという課題に対処する。
本稿では,アテンション機構を用いてインフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメー
距離に基づくミニバッチサンプリング手法と階層的ハッシュ手法という,スケーラブルなグラフ構築のための2つのアプローチを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:12:02 GMT)
Striking Back At Cobalt: Using Network Traffic Metadata To Detect Cobalt Strike Masquerading Command and Control Channels [0.2] コマンドとコントロールのためのオフザシェルフソフトウェアは、しばしば攻撃者や合法的なテスト員によって使用される。
コバルト・ストライク(Cobalt Strike)は、「ムスタン・パンダ(Mustang Panda)」や「ノベリウム(Nobelium)」のような先進的な攻撃集団によって使用される、このカテゴリーで最も有名なソリューションの1つである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:47:22 GMT)
Enhancing Synthetic CT from CBCT via Multimodal Fusion: A Study on the Impact of CBCT Quality and Alignment [0.2] Cone-Beam Computed Tomography (CBCT) は, 放射線線量が少なく, 取得速度が高いために, リアルタイムの術中画像撮影に広く用いられている。
CBCTはその高解像度にもかかわらず、従来のCT(Computed Tomography)と比較すると、重要なアーティファクトに悩まされ、視覚的品質が低下する。
これらのアーティファクトを緩和するための最近のアプローチは、CBCTボリュームをCTドメインに翻訳する合成CT(sCT)生成である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:02:16 GMT)
The Causal Information Bottleneck and Optimal Causal Variable Abstractions [0.2] Information Bottleneck (IB) は変数の抽象化を構築するために広く使われている手法である。
IBのような従来の手法は純粋に統計的であり、根底にある因果構造を無視する。
目的変数に対する因果制御を維持しつつ,選択した変数の集合を圧縮する因果情報ボトルネック(CIB)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:36:18 GMT)
Summarization for Generative Relation Extraction in the Microbiome Domain [0.2] 腸内マイクロバイオームの相互作用を研究するために, 生成的関係抽出パイプラインを探索する。
専用コーパスにおける予備的な結果から、要約はノイズを低減し、モデルを導くことにより、生成RE性能を向上させることが示された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:58:23 GMT)
How Good LLM-Generated Password Policies Are? [0.2] サイバーセキュリティアクセス制御システムにおける大規模言語モデルの応用について検討する。
具体的には、LLM生成したパスワードポリシーの一貫性と正確性を調べ、自然言語のプロンプトをpwquality.conf設定ファイルに翻訳する。
本研究は,LLM の現世代における重要な課題を浮き彫りにして,アクセス制御システムにおける LLM の展開に関する貴重な知見を提供するものである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:12:31 GMT)
Share a Tiny Space of Your Freezer to Increase Resilience of Ex-situ Seed Conservation [0.2] Svalbard Global Seed Vaultのようなジェネバンクは、単一の安全で安全な場所で種子の多様性を維持するための貴重なイニシアチブである。
本稿では, 国内冷凍機のピアツーピアインフラストラクチャを活用して, 種子の総合的利用率を高めることを目的とした分散種子貯蔵の展望について述べる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:55:40 GMT)
Olica: Efficient Structured Pruning of Large Language Models without Retraining [0.2] 既存のLarge Language Models (LLMs) の構造化プルーニング手法では、破損した相関を再構築するために、再トレーニングに相当な計算資源とデータ資源が必要である。
直交分解(Orthogonal decomposition)と線形分解(Olica)と呼ばれるLCMのプルーニングフレームワークを提案する。
提案されているOllicaは、データ使用量、GPUメモリ、実行時間の点で効率的であり、複数のベンチマークで優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:19:38 GMT)
A Comparative Study of Conventional and Tripolar EEG for High-Performance Reach-to-Grasp BCI Systems [0.1] 本研究の目的は、三極性脳波(tEEG)と従来の脳波(tEEG)の有効性を比較することで、運動障害のある個人に対するBCI応用を強化することである。
目標は、どの脳波技術が関連する神経信号を処理し、翻訳するのにより効果的かを決定することである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:41:22 GMT)
Multi-Stage Boundary-Aware Transformer Network for Action Segmentation in Untrimmed Surgical Videos [0.1] 手術条件下での長い行動列のキャプチャと解析は、個々の外科医のアプローチに固有の変動性のために困難である。
この変数は、曖昧な境界点と終点を持つ異なる作用の識別と分割を複雑にする。
動作セグメンテーションを改善するために,階層的スライディングウィンドウアテンションを有するマルチステージ境界対応変圧器ネットワーク(MSBATN)を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:05:32 GMT)
syren-baryon: Analytic emulators for the impact of baryons on the matter power spectrum [0.0] バリアン物理学は宇宙の物質分布に、現在と将来の宇宙科学調査によって調査されたスケールにかなりの影響を与えている。
我々は、様々な物理的動機付けモデルに対する物質パワースペクトルに対するバリオン物理学の影響について、単純なシンボリックパラメトリクスを求める。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:32:16 GMT)
midr: Learning from Black-Box Models by Maximum Interpretation Decomposition [0.0] 最大分解(MID)を実装したRパッケージミドルを導入する。
MIDはブラックボックスモデルの低次加法表現を導出する機能分解手法である。
Midrは、高度な分析機能を備えたグローバルサロゲートモデルを構築することで、ブラックボックスモデルから学習を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:46:49 GMT)
mLaSDI: Multi-stage latent space dynamics identification [0.0] 近年,データ駆動型非侵入型ROMフレームワークとしてLatent Space Dynamics Identificationが提案されている。
マルチステージラテント・スペース・ダイナミクス同定(mLa)を提案する。
また,mLaを小さなオートエンコーダに適用すると,予測誤差や再構成誤差が小さくなり,Laと比較してトレーニング時間が短縮されることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:57:35 GMT)
Your Agent Can Defend Itself against Backdoor Attacks [0.0] 大規模言語モデル(LLM)を駆使したエージェントは、トレーニングと微調整の間、バックドア攻撃による重大なセキュリティリスクに直面している。
本稿では,LDMをベースとしたエージェントに対するバックドア攻撃に対する新たな防御策であるReAgentを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:45:56 GMT)
When Simple Model Just Works: Is Network Traffic Classification in Crisis? [0.0] パケットシーケンスメタデータを用いた単純なk-NNベースラインは、より複雑な手法より優れていることを示す。
我々は、NLPやコンピュータビジョンのようなドメインに適応した標準的な機械学習の実践は、ネットワークトラフィックの分類に不適であると主張している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:11:05 GMT)
Visualization of a multidimensional point cloud as a 3D swarm of avatars [0.0] 本稿では,Chernoffの顔にインスパイアされたアイコンを用いて,多次元データセットを表現する革新的な手法を提案する。
データ次元のセマンティックな分割を直感的および技術的カテゴリに導入し、前者をアバター特徴に割り当て、後者を4次元空間埋め込みに投影する。
この技術はオープンソースのdpVisionビジュアライゼーションプラットフォームのプラグインとして実装されており、ユーザーはアバターの群れという形でデータをインタラクティブに探索することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:35:55 GMT)
Variational approach to photonic quantum circuits via the parameter shift rule [0.0] 変分量子アルゴリズムは最適化タスクを解くための有望なアプローチです。
本稿では,再構成可能な光線形回路に適した微分と積分のパラメータシフト則の定式化を導出する。
我々は、再構成可能な6モードユニバーサル干渉計で処理された単一光子状態の変分アルゴリズムを実験的に試験する手法を開発した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:55:30 GMT)
Variational Autoencoder-Based Approach to Latent Feature Analysis on Efficient Representation of Power Load Monitoring Data [0.0] 本稿では,データ不足を効率的に表現し,補完するために,変分オートエンコーダ(VAE)に基づく潜在的特徴付けモデルVAE-LFを提案する。
VAE-LFは、潜在デコーダ構造を用いてデータの低次元潜在表現を学習する。
UK-DALEデータセットの実験では、VAE-LFは他のベンチマークモデルよりも5%と10%の範囲のテストケースで優れていた。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:26:03 GMT)
Unlocking the Potential of Large Language Models in the Nuclear Industry with Synthetic Data [0.0] 原子力産業は、構造化されていないテキストデータに隠された貴重な情報を豊富に持っている。
このデータは、先進的なLarge Language Model (LLM)アプリケーションでは簡単には利用できない。
我々は、核産業に固有のデータ不足とプライバシー上の懸念について論じる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:45:12 GMT)
Universality of Photonic Interlacing Architectures for Learning Discrete Linear Unitaries [0.0] 最近の研究は、離散線型ユニタリ群 $U(N)$ が、有限列の対角位相演算とインターレースして表現できることを示唆している。
我々は、$U(N)$の要素を格子ハミルトンの1ドルプロパゲータと交互に$N$-パラメータ位相の列に分解できることを示した。
このアーキテクチャは、基本光学成分を用いて実装することができ、任意のユニタリ行列の再構成に成功することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:18:47 GMT)
Universal Characterization of Quantum Many-Body States through Local Information [0.0] 本稿では,量子状態のスケール-解決相関構造に基づいて,量子状態の普遍的な分類手法を提案する。
最近導入された情報格子を用いて、各スケールでの相関の総量を演算的に定義し、量子状態の固有特性長スケールを定義する。
我々は, 乱れた相互作用するキタエフ鎖の基底および中間スペクトル固有状態の解析を行い, この枠組みが量子物質に対する新しい非バイアスなアプローチを提供することを示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:48:57 GMT)
UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags [0.0] 本稿では,XPOS 配列から形態素合成構造を同定し,それらの構造を対応する UPOS カテゴリと整合させるセミ言語フレームワークを提案する。
我々はまた、議論的なエッセイから2,998の新たな文を注釈付けすることで、既存のL2-韓国コーパスを広げる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:37:56 GMT)
Trotter transition in BCS pairing dynamics [0.0] 我々はシンプレクティック指数を用いた積分可能なBCSモデルの平均場動力学をトロッタライズする。
カオス力学は、リアプノフスペクトルと再スケールされたコルモゴロフ-シナイエントロピーによって特徴づけられる。
私たちの研究は、ロシミットエコーのような観測可能な天体を探索するなど、我々が発見したトロッター遷移にまたがる新たな方向を開く。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:19:10 GMT)
Transforming Expert Knowledge into Scalable Ontology via Large Language Models [0.0] 従来の分類学的アライメントへのアプローチは、概念ペアのエキスパートレビューに依存している。
本稿では,大規模言語モデル(LLM)とエキスパートキャリブレーション,反復的プロンプト最適化を組み合わせた新しいフレームワークを提案する。
F1スコアは0.97で、人間のベンチマーク0.68をほぼ上回りました。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 03:48:26 GMT)
Transformers Meet Hyperspectral Imaging: A Comprehensive Study of Models, Challenges and Open Problems [0.0] 2025年までの300以上の論文をレビューし、TransformerベースのHSI分類を専門とする初のエンドツーエンド調査を行った。
この研究は、典型的なパイプライン前処理、パッチまたはピクセルトークン化、位置符号化、空間スペクトル特徴抽出、マルチヘッド自己注意変種、接続のスキップ、損失設計の各段階を分類する。
我々は、貴重な公開データセットの優先順位付け、軽量なオンエッジモデル、照明とセンサーシフト、本質的に解釈可能なアテンションメカニズムについて概説する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:04:30 GMT)
Towards Secure and Private Language Models for Nuclear Power Plants [0.0] 本稿では,一般に公開されているEssential CANDU教科書から構築した,原子力応用のためのドメイン固有言語モデルを提案する。
特殊な核ボキャブラリを捉える兆候を示すが、生成したテキストは時に統語的コヒーレンスを欠いている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:40:47 GMT)
Too Big to Think: Capacity, Memorization, and Generalization in Pre-Trained Transformers [0.0] 大規模言語モデルにおける記憶と一般化の関係について検討する。
小さなモデルは未確認の算術の場合に外挿するが、事実を記憶できないが、大きなモデルは記憶するが外挿することができない。
調査の結果、事前学習は本質的に他の学習モードよりも1つの学習モードを好む可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:49:33 GMT)
The time-dependent quantum harmonic oscillator: a pedagogical approach via the Lewis-Riesenfeld dynamical invariant method [0.0] 我々は、ルイス=リースフェルト力学不変法を用いて、時間依存周波数を持つ量子調和振動子について、教育的アプローチで論じる。
時間依存型高調波発振器とルイス=リースフェルト法を量子力学コースに応用した例として、以下の問題を解く。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:45:16 GMT)
The interplay of robustness and generalization in quantum machine learning [0.0] 逆の堅牢性と一般化は、量子機械学習に関する最近の文献において、個々に顕著な注目を集めている。
本章では,近年,教師付き学習における関数近似器として提案されている変分量子モデルの相互作用について述べる。
我々は、モデルパラメータに明示的に依存するリプシッツ境界によるロバストネスと一般化の両方を定量化する最近の結果について議論する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:20:08 GMT)
The Quantum Paldus Transform: Efficient Circuits with Applications [0.0] 本稿では、第2量子化におけるフェルミオン系スピンフリーハミルトニアンをブロック対角化するための効率的な量子アルゴリズム、Quantum Paldus Transformを提案する。
私たちの研究は、パウリの排他原理によって抽出可能な第二量子化のための量子シュア変換の一般化と見なすことができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:05:31 GMT)
The Impact of Large Language Models on Open-source Innovation: Evidence from GitHub Copilot [0.0] 大規模言語モデル(LLM)は、ガイド付き設定における個人の生産性を高めることが示されている。
本稿では,LLMが協調作業の2つの側面,すなわち能力革新と反復的イノベーションに影響を及ぼすかどうかを考察する。
GitHub Copilotの選択的なロールアウトに関する自然な実験を活用することで、GitHub上のオープンソースプロジェクトに注力しています。
コントリビューション全体の飛躍的な増加を観察し、LLMが非ガイド環境で協調的なイノベーションを効果的に増強することを示唆している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:00:25 GMT)
TPP-LLM: Modeling Temporal Point Processes by Efficiently Fine-Tuning Large Language Models [0.0] 時間的ポイントプロセス(TPP)は、ソーシャルネットワーク、交通システム、eコマースなどのドメインにおけるイベントのタイミングと発生をモデル化するために広く用いられている。
イベントシーケンスのセマンティックな側面と時間的側面の両方をキャプチャするために,大規模言語モデル(LLM)とTPPを統合する新しいフレームワークであるTPP-LLMを紹介する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:18:12 GMT)
Symbolic Generation and Modular Embedding of High-Quality abc-Triples [0.0] a + b = c$ を満たす整数三進数 $(a, b, c)$ を生成するシンボリック恒等式を示す。
この構成は、$mathbbZ/3pmathbbZ$のモジュラインバージョンと組み合わせて2ドルと3ドルのパワーを使用し、低ラジカル値を示す abc-triples を生成する剰余制約を持つパラメトリックなアイデンティティをもたらす。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:54:56 GMT)
SwarmFusion: Revolutionizing Disaster Response with Swarm Intelligence and Deep Learning [0.0] SwarmFusionは、パーティクルスウォーム最適化と畳み込みニューラルネットワークを統合し、リアルタイムリソース割り当てとパス計画を最適化する。
ライブ衛星、ドローン、センサーデータを処理することで、SwarmFusionは洪水や山火事のシナリオにおける状況認識と運用効率を高める。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:11:34 GMT)
Supervision policies can shape long-term risk management in general-purpose AI models [0.0] 本研究では,リスク,インシデント,あるいはハザード報告のエコシステムの多様な状況から抽出された特徴をパラメータ化したシミュレーションフレームワークを開発する。
リスクタイプを包括的に網羅した高優先度リスクのバランスをとる)非優先順位付け(優先、優先)、ランダム選択、優先度付け(優先)、多様性優先(優先)の4つの政策を評価する。
以上の結果から, 優先的かつ多様性優先的な政策は, 高影響リスク軽減に有効であるが, より広範なコミュニティが報告した制度的問題を無視している可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:58:17 GMT)
Structuring Concept Space with the Musical Circle of Fifths by Utilizing Music Grammar Based Activations [0.0] スパイクネットワークなどの離散ニューラルネットワークの構造とピアノ作品の構成との興味深い類似性について検討する。
スパイクニューラルネットワークにおけるアクティベーションの制御に音楽文法を活用する新しい手法を提案する。
本稿では,本モデルにおける概念マップが5番目の音楽サークルによって構成されていることを示し,深層学習アルゴリズムにおける音楽理論の原理を活用する可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:27:52 GMT)
Structured Variational $D$-Decomposition for Accurate and Stable Low-Rank Approximation [0.0] D$-分解(D$-decomposition)は、A 近似 P D Q$ という形の非直交行列分解である。
分解は、正規化されたフロベニウス損失を最小化することによって変動的に定義される。
truncated SVD, CUR, 非負の行列分解に対するベンチマークでは、MovieLens, MNIST, Olivetti Faces, および遺伝子発現行列の再構成精度が向上した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:59:34 GMT)
Stronger Language Models Produce More Human-Like Errors [0.0] モデル高度化に伴い、全体的な推論能力は増大するが、エラーの性質は予測可能な人間の推論誤信を反映する傾向にある。
我々は,383の推論タスクにおける38の言語モデルを評価することによって,人間が予測できる論理的推論問題を生成する。
我々の分析は、モデルが一般的な能力に進化するにつれて、ETR予測された人間の誤動作に対応する不正確な回答の割合が増加する傾向にあることを示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:04:33 GMT)
Spectral invariance and maximality properties of the frequency spectrum of quantum neural networks [0.0] 量子ニューラルネットワーク(QNN)は、量子機械学習において一般的なアプローチである。
我々は、この周波数スペクトルをミンコフスキー和を用いて、集合と差分集合について解析する。
モデルの大きなクラスに対して、異なる最大性の結果が証明される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:46:58 GMT)
Solving the Job Shop Scheduling Problem with Graph Neural Networks: A Customizable Reinforcement Learning Environment [0.0] JobShopLibは、グラフ表現、ノード機能、アクションスペース、報酬関数をカスタマイズできるモジュールライブラリである。
JobShopLibは、これらの要素をカスタマイズし、強化学習環境で新しいコンポーネントを作成することができるモジュールライブラリである。
1つのモデルでは、個々の操作機能のみを使用して、グラフベースのディスパッチのパフォーマンスが向上した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:09:30 GMT)
Securing Generative AI Agentic Workflows: Risks, Mitigation, and a Proposed Firewall Architecture [0.0] Generative Artificial Intelligence(GenAI)は、大きな進歩を示すと同時に、新たなセキュリティ課題も導入している。
本稿では、データプライバシやモデル操作、エージェントの自律性やシステム統合に関わる問題など、GenAIエージェントに固有の重要なセキュリティ脆弱性について概説する。
提案されている"GenAI Security Firewall"アーキテクチャは、これらのシステムに対して包括的で、適応可能で、効率的な保護を提供するように設計されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:36:54 GMT)
Secure Data Access in Cloud Environments Using Quantum Cryptography [0.0] 本研究は,クラウド環境におけるデータ保護に量子暗号を用いる。
データを保護するため、暗号化と復号化にはQuantum One Timepad(QOTP)を使用します。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:26:39 GMT)
Scaling Portfolio Diversification with Quantum Circuit Cutting Techniques [0.0] 本稿では,大規模な量子回路の効率的な実行を可能にする,回路切断の自動フレームワークQuantCutを紹介する。
我々は、S&P 500の株式市場におけるポートフォリオの多様化のために、71量子QAOA回路アンサッツにQuantCutを適用し、資産の多様化を最大化することを目的とした。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:08:29 GMT)
ScalableHD: Scalable and High-Throughput Hyperdimensional Computing Inference on Multi-Core CPUs [0.0] ハイパーベクター(HV)という,高次元ベクトルを用いた情報表現と操作
従来のHDC法はシングルパスの非パラメトリックトレーニングに依存しており、しばしば低い精度で悩まされる。
しかし、推論は軽量であり、リアルタイム実行に適している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 22:46:12 GMT)
SLEEPYLAND: trust begins with fair evaluation of automatic sleep staging models [0.0] 本稿では,オープンソースの睡眠ステージ評価フレームワークであるSLEEPYLANDを紹介する。
ドメイン内睡眠記録(ID)は22,0000時間以上、ドメイン外睡眠記録(OOD)は84,000時間以上である。
本稿では,SoMNUSを紹介する。SoMNUSは,ソフト投票によるアーキテクチャとチャネル設定のモデルを組み合わせたアンサンブルである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:46:19 GMT)
Rotation angles of a rotating disc -- A toy model exhibiting the geometric phase -- [0.0] 固定円盤の端面に回転する円盤を滑り込まない単純な運動モデルを考える。
回転角は、動的位相 $Delta_d$ と幾何位相 $Delta_g$ の2つの部分からなる。
我々のモデルは微分幾何学やガウス・ボンネットの定理、幾何学的位相、ファイバーバンドルといった理論物理学において不可欠な概念を具現化している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:13:06 GMT)
Root Cause Attribution of Delivery Risks via Causal Discovery with Reinforcement Learning [0.0] 本稿では, 因果発見と強化学習を統合することで, サプライチェーンにおける納入リスクの根本原因を解明する手法を提案する。
提案手法を実世界のサプライチェーンデータセットに適用し,納期遅延の原因を明らかにする上での有効性を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:56:50 GMT)
Robust Noise Attenuation via Adaptive Pooling of Transformer Outputs [0.0] この研究は、入力ベクトルのサブセットが下流のタスク(信号)に必要な情報を含んでおり、残りはイントラクタ(ノイズ)である問題を考える。
AvgPool, MaxPool, ClsTokenといった変圧器出力を集約する標準的な手法は、入力の信号-雑音比(SNR)が変動するにつれて、性能の低下に弱い。
注意に基づく適応プーリング手法は、任意のSNRに対して導出誤差境界内で信号-最適ベクトル量子化器を近似することができることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:18:32 GMT)
Robot Pouring: Identifying Causes of Spillage and Selecting Alternative Action Parameters Using Probabilistic Actual Causation [0.0] 本研究では、確率論的実因果関係を用いて、観測された望ましくない結果の原因である要因を判定する。
実際の因果確率は、結果を変えるための代替行動を見つけるためにどのように使用できるかを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:21:40 GMT)
Risks & Benefits of LLMs & GenAI for Platform Integrity, Healthcare Diagnostics, Cybersecurity, Privacy & AI Safety: A Comprehensive Survey, Roadmap & Implementation Blueprint [0.0] 大規模言語モデル(LLM)と生成AI(GenAI)システムは、デジタルプラットフォームとアプリエコシステムを再構築している。
AIの脅威に対処するため、Google PlayやAppleのようなアプリストアからGitHub Copilotのような開発者ハブへのプラットフォームは、AIとLLMベースの防御をデプロイしている。
LLMを臨床診断に組み込むことは、強力なガバナンスを必要とする正確性、偏見、安全性に関する懸念も引き起こす。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:03:19 GMT)
Revisiting Graph Projections for Effective Complementary Product Recommendation [0.0] 本稿では,質問項目を補完する製品のリストを簡易かつ効果的に予測する手法を提案する。
本稿では,レコメンデータシステムのための二部グラフプロジェクションを再検討し,相補性関係を推定するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:59:49 GMT)
Reviewing Uses of Regulatory Compliance Monitoring [0.0] 本研究は、ビジネスプロセスの規制コンプライアンス監視の利用に関する体系的な文献レビューを示す。
我々は、アプローチ間の共通点と相違点を強調し、様々なステップが手動で実行されていることを見つける。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:55:44 GMT)
Realization of maximally-entangling two-qutrit gates using the Cross-Resonance scheme [0.0] 我々は、0-1部分空間を超えて、キュービット中心のクロス共鳴(CR)相互作用を一般化する一般化クロス共鳴スキーム(GCR)を導入する。
我々は、GCRスキームを用いてパラメトリックな2量子ゲート、すなわち、トランスモンの0-1ドルと1-2ドルのエネルギー遷移に作用する$U_CR01$と$U_CR12$を設計する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:40:48 GMT)
ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel [0.0] システム工学の実践でROS中心のモデリングをブリッジするドメイン固有手法を提案する。
提案手法は, ロボットシステムの構造, 動作, 検証過程をMeROSを用いて定式化する。
固定手順を規定するのではなく、プロジェクト固有の柔軟性と再利用をサポートする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:44:00 GMT)
RE-oriented Model Development with LLM Support and Deduction-based Verification [0.0] システム開発を予備的に行うためのUML(Unified Modelling Language)ダイアグラムに焦点を当てた包括的フレームワークを提案する。
このフレームワークは様々なモデリング段階で可視化を提供し、大きな言語モデルと論理推論エンジンをシームレスに統合する。
最終的に、このフレームワークはプログラムスケルトンの自動生成を促進し、設計から実装への移行を合理化している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:13:58 GMT)
RAVEN: Query-Guided Representation Alignment for Question Answering over Audio, Video, Embedded Sensors, and Natural Language [0.0] RAVENは、クエリ条件のクロスモーダルゲーティングモジュールであるQuARTをコアとする統一QAアーキテクチャである。
RAVENは、単調な事前トレーニング、クエリ整合融合、不一致指向の微調整を含む3段階のパイプラインを通じてトレーニングされる。
実験の結果、RAVENは最先端のマルチモーダル言語モデルと比較して14.5%と8.0%の精度で向上した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:21:31 GMT)
Quantum Statistics of Two Identical Particles and Modified Hong-Ou-Mandel Interferometer [0.0] 熱エネルギーがエネルギーレベルの間隔に対して増加するにつれて, 効果的な識別性が現れることを示す。
2粒子干渉計を用いて現実的な実験手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:48:16 GMT)
Quantum Simulation of Noisy Quantum Networks [0.0] 複雑な量子ネットワークは、指数的に増加する状態空間とノイズによる不完全性のためにシミュレーションが難しい。
我々は、量子コンピュータとノイズの多い中間規模量子(NISQ)デバイスを量子ネットワークシミュレータとして活用する代替手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:01:10 GMT)
Quantum Resource Assay for the Grid-Based Simulation of the Photodynamics of Pyrazine [0.0] 我々は、光励起ピラジンの吸収スペクトルと集団動態を計算するために、エンドツーエンドのフォールトトレラント量子アルゴリズムの性能とリソース要件を定式化し、分析する。
古典的なエミュレーションを用いて、タスクに必要な量子リソースを検証し、量子ビット数とゲート深さ計算の一般化式を提案する。
我々の研究は、光誘起力学とビブロニックスペクトルの高次元ウェーブパケットに基づく量子シミュレーションを理解するための基礎的な枠組みを提供し、フォールトトレラント量子コンピュータ上のさらに大きな分子系のシミュレーションにおける将来的な応用を期待する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:17:02 GMT)
Proceedings of the 23rd International Overture Workshop [0.0] この巻は2025年6月11日に開催された第23回国際オーバーチュアワークショップで発表された論文を含んでいる。
このイベントは、オープンソースのプロジェクト Overture と関連するツールとフォーマリズムである Vienna Development Method (VDM) に関する一連のワークショップの最新のものとなった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:44:47 GMT)
PlantBert: An Open Source Language Model for Plant Science [0.0] 植物ストレス応答型文献から構造化知識を抽出する,高性能でオープンソースな言語モデルであるPlantBertを提案する。
本手法は,トランスフォーマーに基づくモデリングと規則強化された言語後処理とオントロジーに基づく実体正規化を組み合わせた手法である。
計算プラント科学における透明性の促進と学際的イノベーションの促進を目的として,本モデルが公開された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:24:03 GMT)
Photon-resolved Floquet theory approach to spectroscopic quantum sensing [0.0] 我々は、最近開発された光子分解フロケ理論(PRFT)に基づく理論的枠組みを開発する。
PRFTは光のコヒーレント量子状態の高次統計を記述する測定統計を予測できる。
PRFTは、分光学的量子センシング装置の感度を数桁の精度で向上する柔軟なツールであることを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:18:02 GMT)
Path Integral Formalism for Quantum Open Systems [0.0] 本稿では、コヒーレント状態を用いたボソンおよびフェルミオン量子開系に対する経路積分形式論の詳細な導出を提供する。
虚時軸上の形式主義、ケルディシュ輪郭、カダノフ輪郭が与えられる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:50:10 GMT)
POLARON: Precision-aware On-device Learning and Adaptive Runtime-cONfigurable AI acceleration [0.0] 本研究は,効率的な乗算累積演算を行うSIMD対応マルチ精度MACエンジンを提案する。
このアーキテクチャは、計算精度をワークロードの感度に合わせるための層適応的精度戦略を取り入れている。
その結果,PDPは最大で2倍,資源使用量は3倍に改善した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:33:02 GMT)
Optimizing Sparse SYK [0.0] 強相互作用性フェルミオン系の基底状態を見つけることは、しばしば量子化学と凝縮物質系の双方を理解するための前提条件である。
Sachdev--Ye-Kitaevモデル(SYK)はそのようなシステムの代表的な例である。
我々は、Hastingsの量子アルゴリズム--O'Donnell for $p=1$が、$pgeqOmega(log n/n)$のとき、基底エネルギーに対する定数要素近似を達成することを示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:57:08 GMT)
Optical tweezer-controlled entanglement gates with trapped ion qubits [0.0] 我々は、光ツイーザで照らされたイオンが制御量子ビットとして機能する絡み合いプロトコルを提案する。
この提案を三イオン鎖上のM$o$lmer-S$o$rensen演算で実験的に実証する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:34:33 GMT)
Observation of Power Superbroadening of Spectral Line Profiles on IBM Quantum [0.0] パワーワイドニング(英: Power Wideening)とは、駆動場の強度が増大するにつれて、2状態の量子遷移におけるスペクトル線プロファイルの拡大を指す。
我々は、同じパルス領域の長方形パルスよりもはるかに広い出力を示す複数の形状パルスを提示する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:43:25 GMT)
Neuralized Fermionic Tensor Networks for Quantum Many-Body Systems [0.0] 神経化フェルミオンテンソルネットワーク状態(NN-fTNS)の分類について述べる。
NN-fTNSは、局所テンソルの構成依存型ニューラルネットワーク変換を通じてフェルミオンテンソルネットワークに非線形性を導入する。
既存のフェルミオン性神経量子状態(NQS)と比較して、NN-fTNSは物理的に動機付けられた代替フェルミオン構造を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:33:58 GMT)
NFISiS: New Perspectives on Fuzzy Inference Systems for Renewable Energy Forecasting [0.0] ファジィ推論システムは精度と透明性のバランスを提供する。
本稿では,最近提案された新高木・スゲノ・カンモデルを拡張して,従来の高木・スゲノ・カンのファジィモデルの限界に対処する。
以上の結果から, 遺伝的およびアンサンブルファジィモデル, 特に遺伝的新高木・スゲノカン, ランダムフォレスト新高木・スゲノカンが優れた性能を示した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:59:20 GMT)
Multiple Greedy Quasi-Newton Methods for Saddle Point Problems [0.0] ヘッセン点問題の解法としてMultiple Greedysi-SP(MGSR1-SP)法を提案する。
本手法は安定性と効率性を両立させる。
その結果、MGSR1-SPの性能は幅広い機械学習アプリケーションで確認された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:52:51 GMT)
MultiNet: An Open-Source Software Toolkit \& Benchmark Suite for the Evaluation and Adaptation of Multimodal Action Models [0.0] MultiNetは、ビジョン、言語、アクションドメインにわたるモデルを厳格に評価し、適応するために設計された、新しい完全にオープンソースなベンチマークである。
視覚言語モデル(VLM)と視覚言語アクションモデル(VLA)を評価するための標準化された評価プロトコルを確立する。
画像キャプション,視覚的質問応答,コモンセンス推論,ロボット制御,デジタルゲームプレイ,模擬ロコモーション/操作,その他多くのタスクからなる複合データセットを提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:38:19 GMT)
Modular Recurrence in Contextual MDPs for Universal Morphology Control [0.0] しかし、新しい、目に見えないロボットへの一般化は依然として課題だ。
モジュール型リカレントアーキテクチャを実装し,MuJoCoロボットの大規模集合上での一般化性能を評価する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:44:30 GMT)
MoE-MLoRA for Multi-Domain CTR Prediction: Efficient Adaptation with Expert Specialization [0.0] MoE-MLoRAはエキスパートの混成フレームワークで、各専門家はドメインを専門にするために独立して訓練される。
MoE-MLoRAはMovielensとTaobaoの8つのCTRモデルで評価した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:56:22 GMT)
Logic Mining from Process Logs: Towards Automated Specification and Verification [0.0] 本稿では、ワークフローを介して発見されたプロセスモデルから論理的仕様を生成するアプローチを提案する。
本研究では、品質データ、特にノイズが生成された仕様の構造とテスト容易性に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:44:19 GMT)
Locating Tennis Ball Impact on the Racket in Real Time Using an Event Camera [0.0] イベントカメラは、高速動作下でマイクロ秒の計算精度で、輝度変化(イベントと呼ばれる)を効率的に測定する。
本手法は, 揺動の時間範囲, 衝撃時のタイミング, ボールとラケットの輪郭の3段階からなる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:29:32 GMT)
Limitations of Quantum Measurements and Operations of Scattering Type under the Energy Conservation Law [0.0] 本研究は, 保存法により, 達成可能な測定精度とユニタリ操作の精度が制限されていることを示す。
エネルギー保存則を満たす散乱過程を用いた量子測定の誤差に対する下界について述べる。
また、制御されたユニタリゲートのゲート忠実度の上界と系のエネルギー変動との関係を定量的に示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:48:08 GMT)
Lightweight Object Detection Using Quantized YOLOv4-Tiny for Emergency Response in Aerial Imagery [0.0] 我々は、後学習量子化によってINT8精度に最適化されたコンパクト畳み込みニューラルネットワークであるYOLOv4-Tinyモデルをデプロイすることに注力する。
このモデルは、重要な緊急シナリオをカバーする10,820の注釈付き画像からなる、カスタムカレーションされた緊急データセットでトレーニングされている。
モデルサイズの71%削減と推論速度の44%向上により、量子化されたYOLOv4-Tinyモデルは低消費電力エッジデバイスでのリアルタイム緊急検出に非常に適している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:26:29 GMT)
Lightweight Electronic Signatures and Reliable Access Control Included in Sensor Networks to Prevent Cyber Attacks from Modifying Patient Data [0.0] 健康データベースとデータセットは、多くの定期的な攻撃によって継続的に破られてきた。
この問題はこれらの攻撃を止めるために作られた現代の戦略によって解決された。
本研究は,センサによって収集され,基地局のデータセット上に保持される情報セキュリティとデータを補強する,新しい信頼性の高い手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:17:46 GMT)
LMRPA: Large Language Model-Driven Efficient Robotic Process Automation for OCR [0.0] 本稿では,LMRPA(Large Model-Driven Robotic Process Automation Model)を紹介する。
光学文字認識(OCR)タスクの効率と速度を大幅に向上させるように設計されている。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:32:11 GMT)
Krylov Complexity in Lifshitz-type Dirac Field Theories [0.0] 我々は、リフシッツ型ディラック場の理論におけるクリロフ複雑性を研究する。
本研究は,K-複合体の成長と飽和挙動を異なる条件下で解析する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:05:08 GMT)
JoFormer (Journey-based Transformer): Theory and Empirical Analysis on the Tiny Shakespeare Dataset [0.0] 本稿では,最近提案された非可換代数に基づく旅行型トランスフォーマーアーキテクチャJoFormerを紹介する。
JoFormerが一貫して低いパープレキシティとより高速な収束を実現していることを示す。
結論は、JoFormerがTransformerアーキテクチャに位置構造を統合するための原則的なアプローチを提供する方法についてである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:05:29 GMT)
Isotope-agnostic motional ground-state cooling of neutral Yb atoms [0.0] フェルミオン型171ドルYbおよびボゾン型174ドルYb原子を2次元および3次元光学格子で直接冷却することを示した。
我々は,空間トラップの不均一性の影響を緩和するために,クロックレーザー周波数を洗浄するサイドバンド冷却方式を開発した。
同じスキームを3Dで適用すると、$barnsimeq0.15$は垂直方向の層間不均一性によって制限される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:54:45 GMT)
Interactions in Quantum Networks with Pulse Propagation Delays [0.0] 本研究では,フィールドモードの完全連続体の量子化を回避する理論的手法により,これらの遅延を考慮に入れることができることを示す。
本稿では, 原子のラムゼイ励起を, 分割・遅延量子パルスにより解析し, この手法の応用を解説する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:30:59 GMT)
Integration of Contrastive Predictive Coding and Spiking Neural Networks [0.0] 本研究では、コントラスト予測符号化(CPC)とスパイキングニューラルネットワーク(SNN)の統合について検討する。
本研究の目的は,スパイクベースシステムにおける入力と出力の処理により,生物的妥当性の高い予測的符号化モデルを開発することである。
この研究は、CPCとSNNを効果的に組み合わせることを示し、分類タスクのために訓練されたSNNが符号化機構として機能することも示している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 19:23:08 GMT)
Integrating Asynchronous AdaBoost into Federated Learning: Five Real World Applications [0.0] 提案アルゴリズムは、適応的な通信スケジューリングと遅延重み補償を取り入れ、同期周波数と通信オーバーヘッドを低減する。
これらのイノベーションが、各ドメインにおける通信効率、スケーラビリティ、収束性、堅牢性をどのように改善するかを示します。
全体として、拡張されたAdaBoostは、さまざまなFLシナリオにおける効率性と堅牢性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:17:15 GMT)
Insightful Approach to Quantum Noise Suppression Below the Standard Quantum Limit Using a Single Mirror and Beam Splittert [0.0] BS出力におけるコヒーレント状態の真空揺らぎに影響を与える鏡近傍に定常波がどのように形成されるかを示す。
我々は、BSによって分割された光の真空揺らぎは、量子ノイズ限界以下で容易に低減できることを示した。
これらの知見は、電磁ノイズの操作に関する重要な洞察を与え、量子ノイズ制御に関する全ての実験に広く影響を及ぼす。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:38:54 GMT)
Implementing Keyword Spotting on the MCUX947 Microcontroller with Integrated NPU [0.0] 本稿では,NPUを用いたMCXN947マイクロコントローラ上に実装されたキーワードスポッティング(KWS)システムを提案する。
このシステムは、MFCCの機能抽出とCNNを組み合わせて、Quantization Aware Trainingを使って最適化し、最小限の精度でモデルサイズを削減する。
実験結果は、CPUのみの実行と比較して、NPUを利用する場合の推測時間の59倍の高速化を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:38:21 GMT)
Image-Based Method For Measuring And Classification Of Iron Ore Pellets Using Star-Convex Polygons [0.0] 本研究は最終製品の品質侵害を特定することを目的とした鉄鉱石ペレットの分類に焦点を当てた。
本稿では,主に医療現場で利用されるStarDistアルゴリズムを用いた,革新的な画像ベース計測手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:30:46 GMT)
IMAGIC-500: IMputation benchmark on A Generative Imaginary Country (500k samples) [0.0] 本稿では, IMAGIC-500 上で, 各種の欠落メカニズム下での包括的欠落データ計算ベンチマークを提案する。
結果は、統計学、伝統的な機械学習、ディープラーニング計算技術の長所と短所を強調している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:30:44 GMT)
Hybrid Reasoning for Perception, Explanation, and Autonomous Action in Manufacturing [0.0] CIPHERは、産業制御のための人間のような推論を再現することを目的としたビジョン言語アクション(VLA)モデルフレームワークである。
システム状態の定量的評価を可能にする回帰モデルであるプロセスエキスパートを統合する。
プロセス監視からの視覚的またはテキスト的入力を解釈し、その決定を説明し、正確なマシン命令を自律的に生成する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:37:33 GMT)
HomographyAD: Deep Anomaly Detection Using Self Homography Learning [0.0] HomographyAD は ImageNet-Pretrained Network に基づく新しい深層異常検出手法である。
広範囲な実験により性能向上を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:32:20 GMT)
High-Throughput Phenotyping of Clinical Text Using Large Language Models [0.0] GPT-4はGPT-3.5-Turboを上回り、識別、分類、正規化を行う。
GPT-4は複数の表現型タスクにまたがって高い性能と一般化性をもたらす。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:51:28 GMT)
High-Performance Heterodyne Receiver for Quantum Information Processing in a Laser Written Integrated Photonic Platform [0.0] 本研究では、フォトニック集積回路(PIC)の新規プラットフォームとして、ホウケイ酸ガラス上にフェムトレーザーマイクロマイニング(FLM)を導入する。
CV-QKD と CV-QRNG アプリケーション用に設計された PIC を作成するために,FLM の特徴を利用する。
この結果は、FLM技術が光通信プラットフォームに統合される可能性を強調し、スケーラブルで高性能な量子通信システムを実現するための道を開くものである。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:49:04 GMT)
From Legal Texts to Defeasible Deontic Logic via LLMs: A Study in Automated Semantic Analysis [0.0] 本稿では,大言語モデル(LLM)を用いた法文の自動意味解析への新しいアプローチを提案する。
本稿では、複雑な規範言語を原子スニペットに分割し、デオン規則を抽出し、それらを構文的・意味的コヒーレンスとして評価する構造化パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:25:19 GMT)
Filling in the Blanks: Applying Data Imputation in incomplete Water Metering Data [0.0] スマート水位計を用いた配水網の監視・管理の高度化に向けた最近のデータ計算手法の適用について検討した。
以上の結果から, 効果的なデータ計算は, 水消費データから得られる洞察の質を著しく向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:13:05 GMT)
Fighting Exponentially Small Gaps by Counterdiabatic Driving [0.0] 一階量子相転移による断熱流の加速における近似的反断熱駆動(CD)の効率について検討する。
本研究は,NP-hard Ising問題の特徴である極めて小さなギャップを越える場合,ローカルCD戦略が有効性に制限されていることを示す。
この制限に対処するために、量子ブラキストロン反断熱駆動(QBCD)と呼ばれる別の方法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:47:02 GMT)
Federated Learning: From Theory to Practice [0.0] この本は、連邦学習(FL)システムの構築と理解についてハンズオンで紹介する。
FLは、スマートフォン、センサー、ローカルコンピュータなどの複数のデバイスで、機械学習(ML)モデルを協調的にトレーニングすることを可能にする。
プライバシや規制、技術的な理由から、データが集中できない、あるいは集中できないような、強力なソリューションです。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:52:44 GMT)
FREIDA: A Framework for developing quantitative agent based models based on qualitative expert knowledge [0.0] エージェントベースモデル(ABM)は、量的データが不足しているシステムや、量的データだけでは現実世界のシステムの複雑さを完全に捉えるのに不十分なシステムを扱うことが多い。
専門家の知識と質的な洞察は、これらのモデルの中で現実的な行動規則、相互作用、意思決定プロセスを構築するのに重要である。
本研究では, ABMの開発, 訓練, 評価を行うための混合メソドックスフレームワークであるFREIDAを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:46:38 GMT)
Expansion-contraction duality breaking in a Planck-scale sensitive cosmological quantum simulator [0.0] 本稿では,Bose-Einstein凝縮体を接触相互作用と双極子相互作用の両方で生成するスケーリング手法の新たな変種を示す。
量子ガス実験室で容易に実装可能な量子アナログ宇宙論へのプランクスケールの敏感なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:38:32 GMT)
Everything Can Be Described in Words: A Simple Unified Multi-Modal Framework with Semantic and Temporal Alignment [0.0] 大規模言語モデルのための構造化テキストとして視覚と聴覚の入力を統一するフレームワークであるUMaTを提案する。
最新技術であるLong Video Question Answeringの精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:44:41 GMT)
Evaluation empirique de la sécurisation et de l'alignement de ChatGPT et Gemini: analyse comparative des vulnérabilités par expérimentations de jailbreaks [0.0] 2022年11月にOpenAIが立ち上げたChatGPTはすぐに参考となり、GoogleのGeminiのようなライバルが出現した。
本稿では,ChatGPTとGeminiのセキュリティレベルとアライメントレベルの比較分析を行った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:24:05 GMT)
Equivalence of stochastic and deterministic policy gradients [0.0] 勾配と決定論的政策勾配, 自然勾配, 状態値関数は同一であることを示す。
そこで我々は, 決定主義的な政策を持つMDPを構築するための一般的な手順を開発する。
この結果から,状態制御値関数ではなく,状態値関数を近似することでポリシメソッドを統一することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:48:08 GMT)
Entanglement and Optimal Timing in Discriminating Quantum Dynamical Processes [0.0] 単発シナリオにおける2つの開量子力学過程の最適判別問題について検討する。
私は、パウリの動的地図とそれに関連する時間依存のパウリチャンネルの家族に焦点を当てます。
分離可能な戦略が力学が定常状態に達するまで無期限に待つ必要があるのに対して、絡み合った入力状態は有限時間で最適な識別を可能にする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:59:17 GMT)
Entanglement Suppression, Quantum Statistics and Symmetries in Spin-3/2 Baryon Scatterings [0.0] 本研究では,非相対論的$S$波散乱における絡み合い抑制,量子統計,拡張対称性の相互作用について検討する。
同一粒子を散乱する場合、スピン統計の制約により絡み合いの力が消えることはない。
絡み合いの力は消滅しないが、グローバルまたは局所的な最小限に収まる場合、拡張された対称性が依然として出現する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:31:52 GMT)
Entanglement Negativity of Spin-Orbit Correlations in a general Qubit-Qudit Setup [0.0] ヒルベルト空間に作用する純二部量子状態に対する部分転位密度行列の完全な固有値スペクトルについて述べる。
さらに,陽子内部の粒子のスピン軌道相関に対するエンタングルメントの尺度として,負性について検討した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 04:26:32 GMT)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning [0.0] 生成支援型マルチモーダルクエリは入力音声のテキスト記述を生成し、マルチモーダルクエリを可能にする。
我々は,AudioCaps,Clotho,Auto-ACDの実験を行い,現状の成果が得られたことを実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:37:48 GMT)
Enhancing Accuracy and Maintainability in Nuclear Plant Data Retrieval: A Function-Calling LLM Approach Over NL-to-SQL [0.0] 原子力発電所から運用データを取得するには、それが支援する決定の臨界性のために、極めて正確かつ透明性が必要である。
伝統的に、SQLへの自然言語(NL-to-)アプローチは、そのようなデータをクエリするために検討されてきた。
本稿では,これらの課題に対処するために,関数呼び出し型大言語モデル(LLM)を活用するための代替パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 12:55:07 GMT)
Enhanced quantum sensing with hybrid exceptional-diabolic singularities [0.0] 4モードのボゾン系において,ハイブリッド(二重劣化)異型特異点(HED)近傍で線形摂動を検出する感度が向上したことを報告した。
感度向上は、推定誤差のスケーリングを決定する極次を含む特異応答関数に起因している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:49:03 GMT)
Electroencephalogram Emotion Recognition via AUC Maximization [0.0] 不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。
本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:55:06 GMT)
Efficient Multiparty Entanglement Distribution with DODAG-X Protocol [0.0] DODAG-Xは量子ネットワークにおける多部絡み合い分布のプロトコルである。
グラフ検証とパスフィニングの計算を最小化し,計算オーバーヘッドを大幅に削減する。
DODAG-Xは任意のネットワークにおいて最大3次元の絡み合いを発生させる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:18:59 GMT)
Efficient Fireworks Algorithm Equipped with an Explosion Mechanism based on Student's T-distribution [0.0] 多くの実世界の問題は最適化問題に変換でき、凸問題と非分布問題に分類できる。
多くの非分配問題に関連するアルゴリズムは、うまく機能するだけでなく、さらなる最適化技術が必要である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:14:57 GMT)
Efficient Edge Deployment of Quantized YOLOv4-Tiny for Aerial Emergency Object Detection on Raspberry Pi 5 [0.0] 本稿では,資源制約エッジデバイスRaspberry Pi 5上での空中緊急画像におけるリアルタイム物体検出のための量子化YOLOv4-Tinyモデルの展開と性能評価について述べる。
平均消費電力は13.85Wで、1枚あたり28.2msで、FP32と比較して消費電力は大幅に減少した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:33:20 GMT)
Effective criteria for entanglement witnesses in small dimensions [0.0] 本稿では,$mathbbC$ 上の 4$ の順序列のブロック正の有効基準について述べる。
この方法は$d>2$で$mathcalHotimesmathcalH_d$システムに一般化することができ、ブロック陽性に対する十分な基準を提供していない。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 23:14:52 GMT)
Edge burst effect and scale-free localization [0.0] 非エルミート端バースト(英: non-Hermitian edge burst)は、非エルミート量子力学において観測される現象である。
両極性非エルミート皮膚効果を有する損失格子におけるエッジバースト効果の例を示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:28:28 GMT)
ECMNet:Lightweight Semantic Segmentation with Efficient CNN-Mamba Network [0.0] ECMNetはCNNとMambaをカプセルベースのフレームワークで巧みに組み合わせて、補完的な弱点に対処する。
提案されたモデルは精度と効率のバランスに優れており、Cityscapesでは70.6% mIoU、CamVidテストデータセットでは73.6% mIoUを達成している。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:44:23 GMT)
Dynamical System Optimization [0.0] 我々は、(パラメトリック)ポリシーが特定されると、制御権限がポリシーに移管され、結果として自律的な力学系が生まれるという、中核的な考え方を中心とした最適化フレームワークを開発する。
我々は、より単純なアルゴリズムを自律システムレベルで導き、それらが政策勾配やヘッセン量と同じ量を計算することを示す。
生成AIモデルのチューニングは可能であるだけでなく、概念的には強化学習よりも現在のフレームワークに近い。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:50:38 GMT)
Dual-Individual Genetic Algorithm: A Dual-Individual Approach for Efficient Training of Multi-Layer Neural Networks [0.0] 本稿では,二元画像分類タスクにニューラルネットワークを最適化する改良型遺伝的アルゴリズムを提案する。
提案手法では,2つのパラメータセット(リーダーとフォロワー)で表されるクロスオーバーに2つの個人しか使用しない。
実験の結果,提案手法は3層ネットワーク上で99.04%のトレーニング精度と80%のテスト精度(コスト=0.06)を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 13:45:30 GMT)
Distortion Search, A Web Search Privacy Heuristic [0.0] 検索エンジンは、各ユーザーのインターネット検索ログを保持するための膨大な技術的能力を持っている。
多くのウェブ検索プライバシー強化ツールは、ユーザーが第三者を信頼する必要がある。
ユーザ中心のディストーション検索,Web検索クエリプライバシ方法論を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 01:35:16 GMT)
Diffusion model for analyzing quantum fingerprints in conductance fluctuation [0.0] このモデルは、磁気伝導データを用いてナノ金属中の不純物配置と量子干渉パターンを再構成する。
電子波関数の非局所相関に関する情報を効率的に抽出するモデルにおける注意重みを可視化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:25:06 GMT)
DiffGradCAM: A Universal Class Activation Map Resistant to Adversarial Training [0.0] クラス活性化マッピング(CAM)とその勾配に基づく変種(GradCAMなど)は、畳み込みニューラルネットワーク(CNN)予測を説明する標準的なツールとなっている。
我々は,無作為な愚かさを自覚的に認識するtextbfSalience-Hoax Activation Maps (SHAMs)を紹介した。
次に、クラスアクティベーションマッピングに対する、新しくて軽量でコントラストのあるアプローチである textbfDiffGradCAM を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:31:01 GMT)
Designing toroidal cavities for quantum computation [0.0] トロイダルマイクロ波キャビティは量子情報記憶と計算において潜在的に有用である。
円筒形キャビティに存在しない新しいモードを分類する。
高Qトロイダルキャビティは、量子プロセッサで使用される量子情報の長期保存に利用することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:10:34 GMT)
Dense Geometry Supervision for Underwater Depth Estimation [0.0] 本稿では,水中環境における単分子深度推定法における既存の課題に対処する新しい手法を提案する。
多視点深度推定を用いて,水中シナリオに適した経済的に効率的なデータセットを構築した。
本研究では,テクスチャキューからの深度情報を効果的に活用し,統合することを目的としたテクスチャ深度融合モジュールを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:50:02 GMT)
Deep reinforcement learning for near-deterministic preparation of cubic- and quartic-phase gates in photonic quantum computing [0.0] 本稿では,3次相状態を生成する量子光学回路を制御するために,強化学習を用いてディープニューラルネットワークを訓練する数値実験の結果について述べる。
全く同じ資源で、立方体ゲート分解を必要とせず、クォート相ゲートを直接生成することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:59:26 GMT)
Continuous Temporal Learning of Probability Distributions via Neural ODEs with Applications in Continuous Glucose Monitoring Data [0.0] 目標は、グルコースなどのバイオマーカーの分布が時間とともにどのように変化するか、そして糖尿病のような慢性疾患の進行をどのように反映するかを分析することである。
本稿では,連続時間プロセスの進化を捉えたガウス混合に基づく確率モデルを提案する。
提案手法は, 平均離散性 (MMD) と混合重みの時間的進化を規定するニューラル正規微分方程式 (Neural Ordinary Differential Equation (Neural ODE) を併用した分布の非パラメトリック推定法である。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:28:35 GMT)
Complexity of Contextuality [0.0] 一般化された文脈性は、量子力学のような非古典理論の目印である。
次元$k$の非文脈的存在論的モデルの存在を決定する複雑さは、少なくとも理論の次元において指数関数的である。
また、最小の非文脈オントロジモデルと最小のオントロジモデルとの根本的な違いを示す。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:00:09 GMT)
Complexity of Bose-Einstein condensates at finite temperature [0.0] We use the Bures and Sj"oqvist metrics -- generalizations of the Fubini-Study metric for mixed quantum state。
また、混合状態の浄化に基づくNielsenの幾何学的複雑性アプローチを用いる。
我々の研究は、有限温度ボース=アインシュタイン凝縮体の幾何学的複雑さの比較研究を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:40:35 GMT)
Comparing human and LLM proofreading in L2 writing: Impact on lexical and syntactic features [0.0] 本研究は,人間とLLMの語彙的・統語的介入について検討し,同一の第二言語文における全体的理解性の向上を目的とした。
ヒトとLLMの証明読解はともにビッグラムの語彙的特徴を増強し、隣接する単語間のコヒーレンスと文脈的結合性の向上に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 17:49:10 GMT)
Comment on The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity [0.0] 大規模推論モデル(LRM)は、特定の複雑性しきい値を超えた計画パズルについて「精度の崩壊」を示す。
これらの結果は,基本的推論失敗ではなく,実験的な設計上の制約を主に反映していることが実証された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 21:16:53 GMT)
Closing objectivity loophole in Bell tests on a public quantum computer [0.0] 客観性基準に着目した局所現実主義のベルテストを実行する。
IBMの量子デバイスは、そのような拡張されたベル型テストに合格するのに十分正確であることが判明した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:03:39 GMT)
Classical algorithm inspired by the feedback-based algorithm for quantum optimization and local counterdiabatic driving [0.0] 本稿では,最適化問題に対する量子インスパイアされた古典的アルゴリズム,CACAO(Counterbaticity-assisted classical algorithm for Optimization)を提案する。
このアルゴリズムでは、与えられた最適化問題の解は、局所的反断熱駆動の量子リンノフ制御に基づいて古典的なスピンダイナミクスで等しく探索される。
我々はCACAOと量子時変アルゴリズム、すなわち量子アニール、量子最適化のためのフィードバックベースアルゴリズム(FALQON)と反断熱的フィードバックベース量子アルゴリズム(CD-FQA)の性能を比較した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:16:44 GMT)
Chiral anomaly and internode scatterings in multifold semimetals [0.0] ホールマークアンゾーン(BZ)では、ベリー曲率場の単極電荷の符号は、ノードのキラリティ(chi$)と呼ばれる。
ここでは,マルチフォールドノードを持つ場合のカイラル伝導率の一般形を導出する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 00:55:10 GMT)
BridgeNet: A Hybrid, Physics-Informed Machine Learning Framework for Solving High-Dimensional Fokker-Planck Equations [0.0] BridgeNetは、非線型で高次元のFokker-Planck方程式(FPE)を効率的に解くために、畳み込みニューラルネットワークと物理インフォームドニューラルネットワークを統合する新しいフレームワークである。
この研究は計算物理学の大幅な進歩を表しており、金融数学から複雑なシステム力学まで幅広い分野において有望な応用を期待できるスケーラブルで正確な解法を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:02:59 GMT)
Branch-and-cut algorithms for colorful components problems [0.0] 我々は,各ノードに色を割り当てる色付きグラフを,カラフルな連結成分に分割しなければならない3つの最適化問題に取り組む。
これらの問題は、コミュニティ検出、サイバーセキュリティ、バイオインフォマティクスに応用されている。
整数非線型定式化(英語版)を行い、標準手法を用いて線形化する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:41:30 GMT)
Biologically Inspired Deep Learning Approaches for Fetal Ultrasound Image Classification [0.0] シンプルだが強力で生物学的にインスパイアされたディープラーニングアンサンブルフレームワークを導入します。
我々のモデルは2つの補足枝を積み重ねる(粗く、低解像度なキューのための「浅い」パスと、微細で高解像度な特徴のための「細い」パス)。
臨床画像5,298点を定期的に取得し,評価した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:34:33 GMT)
Automated Optimization of Laser Fields for Quantum State Manipulation [0.0] 勾配に基づく最適化と自動微分を組み合わせることで、高い精度とスケーラビリティを確保する。
このフレームワークは量子システムにおける自動制御パルス設計のための普遍的で実験的に適用可能なツールとして機能する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 06:17:37 GMT)
ArrowPose: Segmentation, Detection, and 5 DoF Pose Estimation Network for Colorless Point Clouds [0.0] 本稿では,無色点雲に対する高速検出と5自由度ポーズ推定ネットワークを提案する。
ポーズ推定は、ニューラルネットワークによって予測される対象の中心と上部から算出される。
ネットワークは250ミリ秒で推論を実行でき、多くのシナリオで使用することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 11:26:12 GMT)
Are AI Agents interacting with Online Ads? [0.0] 本研究では、異なるAIエージェントがオンライン広告とどのように相互作用するか、広告を意思決定プロセスに組み込むか、どの広告フォーマットが最も効果的かを検討する。
我々は,OpenAI GPT-4o, Anthropic Claude, Google Gemini 2.0 Flashなどのマルチモーダル言語モデルを用いた実験を通じて,インタラクションパターン,クリック行動,意思決定戦略を分析した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 09:17:48 GMT)
An Introduction to Variational Quantum Eigensolver Applied to Chemistry [0.0] 変分量子アルゴリズム(VQA)は、短期的には古典的手法よりも有利であることを示すための実現可能なアプローチである。
本稿では、量子力学の分子研究への応用、量子コンピューティングの基礎の紹介、分子シミュレーションにおけるVQEの利用によるこれらの分野の統合について考察する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 15:31:41 GMT)
An Explainable Vision Transformer with Transfer Learning Combined with Support Vector Machine Based Efficient Drought Stress Identification [0.0] 視覚変換器(ViT)は、長距離依存を捉え、複雑な空間関係を捉えるための有望な代替手段を提供する。
航空画像を用いたジャガイモの干ばつストレス検出にViTの力を利用する,説明可能なディープラーニングパイプラインを提案する。
以上の結果から, 提案手法は干ばつストレス同定の精度を高めるだけでなく, 干ばつストレスにかかわる多彩な植物の特徴にも光を当てることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:14:01 GMT)
An Explainable Deep Learning Framework for Brain Stroke and Tumor Progression via MRI Interpretation [0.0] 本稿では,MRI画像から脳腫瘍と脳卒中を同定する深層学習システムについて述べる。
畳み込みニューラルネットワークであるMobileNet V2とResNet-50の2つの画期的な戦略を実行しました。
トレーニング精度は93%に達し、検証精度は88%まで向上した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:19:56 GMT)
Adversarial Text Generation with Dynamic Contextual Perturbation [0.0] 自然言語処理(NLP)モデルに対する敵対的な攻撃は、入力テキストに微妙な摂動を導入することで脆弱性を露呈する。
動的文脈摂動(DCP)という新たなテキスト攻撃手法を提案する。
DCPは、文、段落、文書にまたがる文脈対応の摂動を生成し、意味的忠実さと流布性を確保する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:02:37 GMT)
Advancing STT for Low-Resource Real-World Speech [0.0] 本稿では,300時間アノテート音声コーパスであるSRB-300データセットを提案する。
様々な現実的な環境で記録された全てのスイスの方言を自然に会話する。
SRB-300データセット上で複数のOpenAI Whisperモデルを微調整し、以前のゼロショットパフォーマンスメトリクスよりも顕著な拡張を実現しました。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 14:22:48 GMT)
Advanced Kernel Search approach for the MST Problem with conflicts involving affinity detection and initial solution construction [0.0] 我々は,最小スパンニング木問題と衝突を解くために,改良されたカーネルサーチ手法を用いる。
競合グラフからの独立集合の計算をアルゴリズムに統合し、親和性を検出し、競合を効果的に管理する。
提案手法はMSTC向けに設計されているが,その原理は競合を伴う他の最適化問題にまで拡張することができる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:39:37 GMT)
Adiabatic dynamics in a V-type quantum system by oppositely chirped counterrotating circularly polarized laser pulses [0.0] 実験的に、測定された3次元光電子運動量分布(3D PMD)の形状の顕著な変化を観察する。
実験では,超連続偏光パルス整形とOC-CRCPフェムト秒レーザーパルスと速度マップを用いた光電子トモグラフィーを併用して3次元PMDを再構成した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:25:40 GMT)
Adaptive quantum dynamics with the time-dependent variational Monte Carlo method [0.0] シミュレーション中の変動量子状態の表現率を適応的に制御する,時間依存型変分モンテカルロ法(tVMC)の拡張を提案する。
スピンジャストロウと制限ボルツマン機械波動関数を用いた一次元横場イジングモデルにおける量子クエンチのベンチマークを行った。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:47:01 GMT)
Adaptive path planning for efficient object search by UAVs in agricultural fields [0.0] 本稿では,UAVを用いた農業分野における対象探索のための適応経路プランナを提案する。
プランナーは、高高度の飛行経路を使用し、検出ネットワークが不確実である場合に、追加の低高度検査を計画する。
我々は、草地に置かれた人工植物を検出するために、YOLOv8検出ネットワークを訓練し、パスプランナーの可能性を実証した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:39:26 GMT)
AI as Decision-Maker: Ethics and Risk Preferences of LLMs [0.0] 大規模言語モデル(LLM)は、AI意思決定者としての行動において、驚くほど多様なリスク嗜好を示す。
行動タスクを用いて50個のLCMを分析し、安定だが多様なリスクプロファイルを求める。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:33:51 GMT)
AGITB: A Signal-Level Benchmark for Evaluating Artificial General Intelligence [0.0] 既存の評価フレームワークは、その中核にある一般性を捉えることができず、漸進的な進歩のためのガイダンスをほとんど提供しない。
本稿では,12個の完全自動化可能なベンチマークスイートであるAGITB(Artificial General Intelligence Testbed)を紹介する。
AGITBは、事前訓練、シンボル操作、セマンティックグラウンドをせずに、時間的シーケンスを予測するモデルを必要とする。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:33:41 GMT)
A fidelity-driven approach to quantum circuit partitioning via weighted hypergraphs for noise-resilient computation [0.0] 本稿では、量子回路を忠実度対応ハイパーグラフに変換する新しいフレームワークであるFidelipartを紹介する。
6-qubit/22-gate, 10-qubit/55-gate, 24-qubit/88-gateベンチマーク上で, BQSKitのQuick Partitionerに対するFidelipartの評価を行った。
結果、Fidelipartの優れた性能を示し、SWAPゲートの削減は77.3%から100%、カットキュービットの52.2%まで低下した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:17:11 GMT)
A Technique for Isolating Lexically-Independent Phonetic Dependencies in Generative CNNs [0.0] 語彙学習から派生した音韻論的一般化を表現するディープニューラルネットワーク(DNN)の能力は、未解決の問題である。
本研究では,語彙項目の生音声波形に基づいて学習した生成畳み込みニューラルネットワーク(CNN)の語彙不変な一般化能力について検討した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:22:33 GMT)
A Sagnac-based arbitrary time-bin state encoder for quantum communication applications [0.0] 量子情報の時間ビン符号化は、光ファイバー上の長距離量子通信プロトコルに有利である。
非平衡干渉計を用いた時間ビン量子状態の最も一般的な実装は、動作の安定性と柔軟性の観点からの課題を示す。
本稿では,完全制御可能な任意の時間ビン量子状態エンコーダの実装について述べる。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 16:44:47 GMT)
A Refined Algorithm For the EPR model [0.0] 2つのグループは、近似比$frac1+sqrt54approx.809$の高エネルギー状態の特定のアルゴリズムを独立に開発している。
ここでは、等質/準同質な分数マッチングを考案することにより、2つのアルゴリズムのうちの1つを洗練しようと試みる。
不規則グラフの場合、分数マッチングが適切に選択されていれば、そのような改善が良好な性能を保証できることが示される。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 08:12:14 GMT)
A Privacy-Preserving Federated Learning Framework for Generalizable CBCT to Synthetic CT Translation in Head and Neck [0.0] Cone-beam CT(CBCT)は画像誘導放射線療法(IGRT)において広く採用されている。
頭頸部領域におけるCBCT-to-sCT合成のためのクロスサイロ水平フェデレーションラーニング(FL)手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 10:10:56 GMT)
A Multi-Modal Spatial Risk Framework for EV Charging Infrastructure Using Remote Sensing [0.0] RSERI-EVは空間的に明示的でマルチモーダルなリスク評価フレームワークである。
リモートセンシングデータ、オープンインフラストラクチャデータセット、空間グラフ分析を組み合わせて、EV充電ステーションの脆弱性を評価する。
筆者らのプロトタイプでは, 耐気候性, インフラに配慮したEVの展開を支援する上で, マルチソースデータ融合と解釈可能な空間推論の価値を強調した。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 05:27:51 GMT)
A Hybrid Architecture with Efficient Fine Tuning for Abstractive Patent Document Summarization [0.0] 本研究では,特許記録の抽象要約を効率的に作成するシステムを提案する。
この手順では、LexRankグラフベースのアルゴリズムを使用して、入力された親テキストから重要な文を検索する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 07:04:49 GMT)
A Generative Framework for Predictive Modeling of Multiple Chronic Conditions Using Graph Variational Autoencoder and Bandit-Optimized Graph Neural Network [0.0] 複数の慢性疾患(MCC)の出現を予測することは、早期介入とパーソナライズされた医療にとって重要である。
グラフニューラルネットワーク(GNN)は、MCCに見られるような複雑なグラフデータをモデリングするための効果的な手法である。
本稿では,データ分布を利用してグラフ構造を代表的に構築するGNNのための新しい生成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 20:56:53 GMT)
(2+1)d Lattice Models and Tensor Networks for Gapped Phases with Categorical Symmetry [0.0] 融合2-カテゴリー対称性を持つ2+1次元量子場理論におけるギャップ位相を最近分類した。
このようなギャップを持つ全ての位相に対して、系統的な格子モデル構築を提供する。
論文参考訳(メタデータ) (Tue, 10 Jun 2025 18:44:46 GMT)