A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment [320.2] 本稿では, LLM のトレーニング, 展開, 商業化のプロセス全体を通して, 安全問題を体系的に検討する "フルスタック" の安全性の概念を紹介する。
我々の研究は800以上の論文を網羅的にレビューし、包括的カバレッジとセキュリティ問題の体系的な組織化を確保しています。
本研究は,データ生成の安全性,アライメント技術,モデル編集,LLMベースのエージェントシステムなど,有望な研究方向を特定する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:36:20 GMT)
Easy2Hard-Bench: Standardized Difficulty Labels for Profiling LLM Performance and Generalization [126.3] さまざまなドメインにまたがる6つのベンチマークデータセットのコレクションであるEasy2Hard-Benchを紹介します。
これらのデータセット内の各問題は、数値的な難易度スコアで注釈付けされる。
様々な難易度にまたがる性能と一般化能力を総合的に分析する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:15:44 GMT)
DBudgetKV: Dynamic Budget in KV Cache Compression for Ensuring Optimal Performance [125.8] 我々はDBudgetKVと呼ばれる新しいKVキャッシュ圧縮手法を提案する。
残りのKVキャッシュがフルキャッシュのパフォーマンスにマッチしない場合、注意ベースのメトリクスが特徴である。
提案手法は, 平均圧縮率25%を超え, 無損失KVプルーニングを効果的かつ堅牢に実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:31:53 GMT)
MiniCPM4: Ultra-Efficient LLMs on End Devices [124.7] MiniCPM4は、エンドサイドデバイス向けに明示的に設計された高効率な大規模言語モデル(LLM)である。
この効率性は、モデルアーキテクチャ、トレーニングデータ、トレーニングアルゴリズム、推論システムという4つの重要な側面において、体系的な革新を通じて達成します。
MiniCPM4は、それぞれ0.5Bと8Bのパラメータを持つ2つのバージョンで利用可能である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:16:50 GMT)
Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks [112.7] 命令ベースユニバーサル音声モデルの包括的評価のためのオープンベンチマークであるDynamic-SUPERB Phase-2を提案する。
第1世代をベースとして、この第2バージョンには125の新しいタスクが含まれており、ベンチマークを合計180タスクに拡張している。
評価結果から, モデルが良好に機能することのないことが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:36:12 GMT)
xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs [109.3] ビデオ用マルチモーダル言語モデルであるxGen-MM-Vid(B-3-Video)を提案する。
BLIP-3-Videoは、従来のビジュアルトークン化器に加えて「時間エンコーダ」を利用する。
BLIP-3-Videoは、より大規模な最先端モデルに匹敵するビデオ質問応答精度が得られることを実験的に確認する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:33:32 GMT)
BLUR: A Bi-Level Optimization Approach for LLM Unlearning [106.0] 未学習問題の階層構造をモデル化することが重要であると論じる。
本稿では,より優れた性能を実現する新しいアルゴリズムであるBi-Level UnleaRning(textttBLUR)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:23:05 GMT)
SpaCE-10: A Comprehensive Benchmark for Multimodal Large Language Models in Compositional Spatial Intelligence [91.3] 合成空間評価のベンチマークである SpaCE-10 について述べる。
SpaCE-10では、10個の原子空間能力を定義し、8つの合成能力を形成する。
SpaCE-10の共通MLLMの広範な評価を行い、最も先進的なMLLMでさえ、大きなマージンで人間より遅れていることを発見した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:41:36 GMT)
Accelerating Diffusion Models in Offline RL via Reward-Aware Consistency Trajectory Distillation [88.5] オフライン強化学習のための新しい一貫性蒸留手法を提案する。
本手法は,高い性能と簡易なトレーニングを維持しつつ,単一ステップ生成を可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:48:19 GMT)
Rational Decision-Making Agent with Internalized Utility Judgment [88.0] 大規模言語モデル(LLM)は目覚ましい進歩を示し、従来のNLPアプリケーションを超えて複雑な多段階決定タスクを実行できるエージェントにLLMを開発するための重要な努力を惹きつけている。
本稿では,RadAgentを提案する。このRadAgentは,経験探索とユーティリティ学習を含む反復的なフレームワークを通じて,合理性の発展を促進する。
ToolBenchデータセットの実験結果は、RadAgentがベースラインよりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:28:38 GMT)
ARGUS: Hallucination and Omission Evaluation in Video-LLMs [86.7] ARGUSは、無料のビデオキャプションのパフォーマンスを測定するビデオLLMベンチマークである。
ビデオLLM出力と人間の真実のキャプションを比較することで、ARGUSは2つのメトリクスを定量化する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:42:13 GMT)
Knowledge-to-Jailbreak: Investigating Knowledge-driven Jailbreaking Attacks for Large Language Models [86.7] knowledge-to-jailbreakは、ドメイン知識からジェイルブレイク攻撃を生成することを目的としている。
12,974組の知識ジェイルブレイクペアで大規模なデータセットを収集します。
実験によると、ジェイルブレイク発生器は、人間の専門家が作り上げたものと同等の有害なジェイルブレイクを発生させることができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:18:21 GMT)
Unsolvable Problem Detection: Robust Understanding Evaluation for Large Multimodal Models [84.8] Unsolvable Problem Detection (UPD) は,大規模マルチモーダルモデル(LMM)の頑健な理解能力を評価するための新しいタスクである。
UPDは、多票質問応答の解決不可能な問題に遭遇する際のLMMの回答を抑える能力を評価する。
本稿では,MM-UPD Benchについて紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:51:00 GMT)
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain [82.8] 対向的浄化法は 対向的摂動を 前方から等方性雑音の一部に 浸入させようとする
我々は周波数領域の視点に目を向け、画像を振幅スペクトルと位相スペクトルに分解する。
両スペクトルとも,逆方向の摂動による損傷は周波数とともに単調に増加する傾向にある。
本稿では,原画像の保存を最大化しながら,対向的摂動を解消できる浄化法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:12:49 GMT)
MEMOIR: Lifelong Model Editing with Minimal Overwrite and Informed Retention for LLMs [82.3] 寿命の長いモデル編集のための既存の方法は、妥協の一般化、過去の編集の妨害、長い編集シーケンスへのスケールの失敗である。
残メモリを介して知識を注入する新しいスケーラブルなフレームワークであるMEMOIRを提案する。
MeMOIRは各編集をメモリパラメータの別のサブセットに限定し、編集間の干渉を最小限にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:16:42 GMT)
When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration [79.7] 我々は,人間とAIの知識伝達能力に関する概念的かつ実験的フレームワークである知識統合と伝達評価(KITE)を紹介する。
最初の大規模人間実験(N=118)を行い,その測定を行った。
2段階のセットアップでは、まずAIを使って問題解決戦略を思いつき、その後独立してソリューションを実装し、モデル説明が人間の理解に与える影響を分離します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:57:09 GMT)
Enhancing Few-Shot Vision-Language Classification with Large Multimodal Model Features [79.5] 生成型大規模マルチモーダルモデル(LMM)は、様々な視覚言語(VL)タスクで優れている。
高い性能にもかかわらず、LMMの生成出力は視覚言語分類タスクに特化していない。
LMMの潜在空間からマルチモーダル特徴抽出を利用する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:01:06 GMT)
Enhancing Open-Domain Task-Solving Capability of LLMs via Autonomous Tool Integration from GitHub [79.3] オープンドメインのタスク解決能力を評価するためにOpenActベンチマークを導入します。
我々は,オープンドメインの進化するクエリに,GitHubから専門ツールを自律的に統合することで対処できる,新しいLLMベースのエージェントシステムであるOpenAgentを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:02:55 GMT)
Spatial super-resolution in nanosensing with blinking emitters [79.2] 本稿では,蛍光ナノセンサを点滅させたメソロジー(サーモメトリー,マグネティックメソメトリー,pH推定など)における空間分解能向上手法を提案する。
我々は, 生活科学分野において, 画像解析技術に補完される点滅蛍光センシング剤を日常的に活用できると考えている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:33:15 GMT)
Beyond Closure Models: Learning Chaotic-Systems via Physics-Informed Neural Operators [78.6] カオスシステムの長期的挙動を予測することは、気候モデリングなどの様々な応用に不可欠である。
このような完全解法シミュレーションに対する別のアプローチは、粗いグリッドを使用して、時間テキストモデルによってエラーを修正することである。
この制限を克服する物理インフォームド・ニューラル演算子(PINO)を用いたエンド・ツー・エンドの学習手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:37:52 GMT)
R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation [78.3] 本稿では,自律運転シミュレーションの限界を克服する軽量な1ステップ拡散モデルであるR3D2を紹介する。
シャドウや一貫した照明など、妥当なレンダリング効果を生み出すことで、既存のシーンに完全な3Dアセットを現実的に挿入することができる。
R3D2は挿入されたアセットの現実性を大幅に向上させ,テキストから3Dへのアセット挿入やクロスシーン/データセットオブジェクト転送といったユースケースを可能にした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:50:19 GMT)
E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.2] 3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。
GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。
我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。
すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:01 GMT)
MIB: A Mechanistic Interpretability Benchmark [77.4] 4つのタスクと5つのモデルにまたがる2つのトラックを持つメカニスティック解釈可能性ベンチマークMIBを提案する。
MIBを用いて、帰属とマスク最適化の手法が回路のローカライゼーションにおいて最適であることがわかった。
因果変数の局在化では、教師付きDAS法がニューロンより優れているが、SAEの特徴はニューロンより優れている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:44:50 GMT)
SyncMind: Measuring Agent Out-of-Sync Recovery in Collaborative Software Engineering [74.0] SyncMindは、ソフトウェア工学において、大きな言語モデル(LLM)エージェントが直面している非同期の問題を体系的に定義するフレームワークである。
SyncMindをベースとしたSyncBenchは,実世界のCSEで24,332のエージェントアウトオブシンクシナリオを特徴とするベンチマークです。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:19:09 GMT)
Attention with Trained Embeddings Provably Selects Important Tokens [73.8] トーケン埋め込みは言語モデリングにおいて重要な役割を担っているが、この実践的関連性にもかかわらず、理論的な理解は限られている。
本論文は,勾配降下法により得られた埋め込み構造を特徴付けることにより,そのギャップを解消する。
実世界のデータセット(IMDB、Yelp)の実験では、我々の理論が明らかにしたものに近い現象が示されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:35:47 GMT)
Cool-Fusion: Fuse Large Language Models without Training [73.2] Cool-Fusionは、トレーニングを必要としないソースLLMの知識を融合させる。
さまざまなベンチマークデータセットで実験が行われた。
GSM8Kでは、Cool-Fusionは3つの強力なLLMからの精度を17.4%向上させた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:19:19 GMT)
ComPtr: Towards Diverse Bi-source Dense Prediction Tasks via A Simple yet General Complementary Transformer [71.8] 多様な双方向の高密度予測タスクに対して,$underlineComP$lementary $underlinetr$ansformer, $textbfComPtr$を提案する。
ComPtrは異なる入力を等しく扱い、変換器上にシーケンス・ツー・シーケンスの形で効率的な密な相互作用モデルを構築する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:29:57 GMT)
Coherence-guided Preference Disentanglement for Cross-domain Recommendations [71.4] 本研究では,共有項目属性を明示的に抽出し,共有ユーザの好みを学習するためのコヒーレンス誘導型参照不整合(CoPD)手法を提案する。
実世界のデータセットで行った実験は、既存の競争ベースラインよりも提案したCoPDの優れた性能を示し、ドメイン間の推薦性能を向上させる効果を強調した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:41:13 GMT)
Cost-Optimal Active AI Model Evaluation [71.2] 生成AIシステムの開発には、継続的な評価、データ取得、アノテーションが必要である。
我々は、安価だがしばしば不正確で弱いレーダの使用を積極的にバランスさせる新しいコスト認識手法を開発した。
我々は、弱者と強者の間で所定のアノテーション予算を割り当てるためのコスト最適化政策のファミリーを導出する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:14:41 GMT)
LLMs Caught in the Crossfire: Malware Requests and Jailbreak Challenges [70.9] 悪意のあるコード生成のための3,520のジェイルブレイクプロンプトを含むベンチマークデータセットであるMalwareBenchを提案する。
M MalwareBenchは、11のJailbreakメソッドと29のコード機能カテゴリをカバーする、320の手作業による悪意のあるコード生成要件に基づいている。
実験の結果、LLMは悪意のあるコード生成要求を拒否する限られた能力を示し、複数のjailbreakメソッドを組み合わせることで、モデルのセキュリティ機能をさらに低下させることが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:02:39 GMT)
Self Forcing: Bridging the Train-Test Gap in Autoregressive Video Diffusion [70.4] 本稿では,自己回帰ビデオ拡散モデルのための新しい訓練パラダイムであるSelf Forcingを紹介する。
露光バイアスの長年の問題に対処し、地道的な文脈で訓練されたモデルは、自身の不完全な出力で条件付けられたシーケンスを生成する必要がある。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:55 GMT)
LEANN: A Low-Storage Vector Index [70.1] LEANNは、リソース制約されたパーソナルデバイスに最適化された、ストレージ効率の近い近接検索インデックスである。
評価の結果,LEANNは原データの5%以下までインデックスサイズを縮小し,標準インデックスの最大50倍のストレージを実現した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:43:30 GMT)
Assessing Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks [68.3] 本稿では、標準英語とAAVEで1.2K以上の並列クエリペアを含むベンチマークであるReDialを紹介する。
我々は、GPT、Claude、Llama、Mistral、Phiモデルファミリーなど、広く使われているモデルを評価した。
我々の研究は、方言クエリにおけるLLMバイアスを分析するための体系的で客観的な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:20:58 GMT)
Trajectory World Models for Heterogeneous Environments [67.3] 環境を横断するセンサーやアクチュエータの不均一性は、大規模な事前訓練された世界モデルを構築する上で大きな課題となる。
我々は80の環境から100万以上のトラジェクトリからなる統一データセットUniTrajを紹介した。
また,様々なセンサやアクチュエータ情報を扱える新しいアーキテクチャであるTrajWorldを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:09:01 GMT)
BioNeMo Framework: a modular, high-performance library for AI model development in drug discovery [67.0] 計算生物学と化学AIモデルのトレーニングを容易にするために,BioNeMo Frameworkを紹介した。
256のNVIDIA A100では、BioNeMo Frameworkは40億のパラメータBERTベースのPLMを4.2日で1兆個以上のトークンでトレーニングしている。
BioNeMo Frameworkはオープンソースで、誰でも自由に使える。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:23:50 GMT)
Precise High-Dimensional Asymptotics for Quantifying Heterogeneous Transfers [66.7] 2つのタスクのサンプルを組み合わせることは、1つのタスクだけを学習するよりも、いつより優れているかを示す。
この問題は、実際には観測されている負転移と呼ばれる経験的な現象によって動機付けられている。
これらの結果をランダム効果モデルで説明し、ソースタスクのサンプル数が増加するにつれて、正から負への位相遷移を数学的に証明する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:26:52 GMT)
Bipartite Ranking From Multiple Labels: On Loss Versus Label Aggregation [66.3] 両部ランク付けは基本的な教師付き学習問題であり、単一のバイナリターゲットラベルに対して最大範囲(ROC曲線)を持つインスタンスのランク付けを学習することを目的としている。
このようなラベルを1つのコヒーレントなランキングにどうやって合成できるのか?
本研究では,ベイズ最適解を特徴付けることにより,損失集約とラベル集約という2つの手法を解析する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:51:57 GMT)
General-Reasoner: Advancing LLM Reasoning Across All Domains [64.7] 強化学習(RL)は近年,大規模言語モデル(LLM)の推論能力の向上に強い可能性を示している。
本稿では,多分野にわたるLSM推論能力の向上を目的とした,新たなトレーニングパラダイムであるGeneral-Reasonerを提案する。
私たちは一連のモデルをトレーニングし、物理学、化学、金融、電子工学など幅広い分野をカバーする幅広いデータセットでそれらを評価します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:40:25 GMT)
Pushing the Limits of Low-Bit Optimizers: A Focus on EMA Dynamics [64.6] ステートフル(例えばアダム)は、最適収束を達成するために、モデルサイズを2倍も補助情報を維持する。
SOLOにより、アダムスタイルは3ビットまたは2ビットの精度で量子化された状態を維持することができる。
したがって、SOLOはAdamスタイルにシームレスに適用でき、精度の低下を最小限に抑えることができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:49:51 GMT)
From Thousands to Billions: 3D Visual Language Grounding via Render-Supervised Distillation from 2D VLMs [64.3] LIFT-GSはポイントクラウドから3Dガウス表現を予測し、予測された言語条件の3Dマスクを2Dビューにレンダリングする。
LIFT-GSは、オープン語彙のインスタンスセグメンテーションで25.7%のmAPで最先端の結果を達成する。
注目すべきは、事前トレーニングがデータセットの微調整を2倍にし、強力なスケーリング特性を示すことだ。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:28:09 GMT)
CXR-LT 2024: A MICCAI challenge on long-tailed, multi-label, and zero-shot disease classification from chest X-ray [64.2] CXR-LTシリーズは、胸部X線を用いた肺疾患の分類を強化するために設計されたコミュニティ主導のイニシアチブである。
CXR-LT 2024はデータセットを377,110の胸部X線(CXR)と45の疾患ラベルに拡張し、19の新しい稀な疾患の発見を含んでいる。
本稿では、CXR-LT 2024の概要を述べるとともに、データキュレーションプロセスの詳細と最先端ソリューションの統合について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:53:31 GMT)
Audio-Sync Video Generation with Multi-Stream Temporal Control [64.0] 我々は,正確な音声-視覚同期を備えたビデオ生成のための多目的フレームワークであるMTVを紹介する。
MTVは音声を音声、エフェクト、トラックに分離し、唇の動き、イベントタイミング、視覚的気分を制御できる。
このフレームワークをサポートするために、高品質な撮影ビデオとデミックスされたオーディオトラックのデータセットであるDremixを提示する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:42 GMT)
Graph-KV: Breaking Sequence via Injecting Structural Biases into Large Language Models [63.6] 構造的帰納バイアスを通して相互作用を管理するグラフ-KVを導入する。
このフレームワークでは、「ターゲット」セグメントは指定された「ソース」セグメントのKV-cacheのみに選択的に参加する。
我々は,(1)直接推論,マルチホップ推論,長期文書理解にまたがる7つのRAGベンチマーク,(2)引用エゴグラフとして構造化された全文科学論文を用いた新しい学術論文QAタスクArxiv-QA,(3)引用ネットワーク内の論文トピック分類の3つのシナリオでグラフ-KVを評価する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:30:08 GMT)
Exploiting the Semantic Knowledge of Pre-trained Text-Encoders for Continual Learning [63.5] 継続的な学習は、モデルが学習した知識を維持しながら、新しいデータから学習することを可能にする。
画像のラベル情報で利用できるセマンティック知識は、以前に取得したセマンティッククラスの知識と関連する重要なセマンティック情報を提供する。
テキスト埋め込みを用いて意味的類似性を把握し,タスク内およびタスク間のセマンティックガイダンスの統合を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:48:46 GMT)
SnapGen-V: Generating a Five-Second Video within Five Seconds on a Mobile Device [61.4] 本稿では,大規模ビデオ拡散モデルのパワーをエッジユーザーにもたらすための包括的加速フレームワークを提案する。
我々のモデルは0.6Bのパラメータしか持たないため、iPhone 16 PMで5秒以内に5秒のビデオを生成することができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:48:33 GMT)
GLOS: Sign Language Generation with Temporally Aligned Gloss-Level Conditioning [60.9] GLOSは手話生成フレームワークであり、時間的に並んだ光沢レベル条件付けを備えている。
本手法は,CSL-Daily と Phoenix-2014T の先行手法よりも高い精度で,正しい語彙順と高い意味精度の符号を生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:09:03 GMT)
GTR-CoT: Graph Traversal as Visual Chain of Thought for Molecular Structure Recognition [60.8] GTR-Mol-VLMは、2つの重要な革新を特徴とする新しいフレームワークである。
分子グラフを段階的に解析することで、人間の推論をエミュレートする。
画像中の短縮構造と拡張アノテーションとのミスマッチに対処する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:47:10 GMT)
Information Bargaining: Bilateral Commitment in Bayesian Persuasion [60.4] 長期的説得のための統一的なフレームワークとよく構造化されたソリューションの概念を導入する。
この視点はゲーム構造の共通知識を明確にし、レシーバに匹敵するコミットメント能力を与える。
このフレームワークは、2段階の検証と推論のパラダイムによって検証される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:43:23 GMT)
Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.7] 本稿では, この手法の軌道最適化を改良し, 復元品質と効率の両立に焦点をあてる。
反復サンプリングに伴うかなりの計算負担を軽減するため,コストを考慮したトラジェクトリー蒸留法を提案する。
提案アルゴリズムを用いて基礎拡散モデル(FLUX)を12Bパラメータで微調整し、7種類の画像復元タスクを処理する統一的なフレームワークを作成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:14:25 GMT)
Directed Exploration in Reinforcement Learning from Linear Temporal Logic [59.7] リニア時間論理(LTL)は強化学習におけるタスク仕様のための強力な言語である。
合成された報酬信号は基本的に疎結合であり,探索が困難であることを示す。
我々は、仕様をさらに活用し、それに対応するリミット決定性B"uchi Automaton(LDBA)をマルコフ報酬プロセスとしてキャストすることで、よりよい探索を実現することができることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:34:32 GMT)
Measuring Diversity in Synthetic Datasets [59.5] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクのための合成データセットを生成するために広く採用されている。
これらの合成データセットの多様性を正確に測定する - 堅牢なモデルのパフォーマンスに不可欠な側面は、大きな課題である。
分類の観点から,合成データセットの多様性を測定する新しい手法であるDCScoreを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:36:15 GMT)
NTPP: Generative Speech Language Modeling for Dual-Channel Spoken Dialogue via Next-Token-Pair Prediction [59.4] 話者に依存しない双方向音声対話学習を実現するために,新しい生成モデルパラダイムであるNext-Token-Pair Prediction(NTPP)を導入する。
提案手法であるNTPPは, ターンテイク予測, 応答コヒーレンス, 自然性の観点から, SLMの会話能力を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:47:32 GMT)
Low-Dimension-to-High-Dimension Generalization And Its Implications for Length Generalization [59.2] LDHDの一般化は、事前知識を利用して適切な帰納バイアスを与えることなく、一般的には達成不可能であることを示す。
LDHD一般化から長さ一般化への洞察を応用して,CoTの潜在空間の変化に対する効果を説明する。
また,データ形式のような内在的なLDHD一般化とニュアンスの両方を扱うために,位置埋め込み設計の原理を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:19:42 GMT)
Unblocking Fine-Grained Evaluation of Detailed Captions: An Explaining AutoRater and Critic-and-Revise Pipeline [58.8] VNLI-Critiqueは,自動文レベルの事実性分類と批判生成のためのモデルである。
1) VNLI-CritiqueはM-HalDetectベンチマークの最先端性能によって検証された堅牢な一般化を実証し、(2) VNLI-CritiqueによるDOCCI-Critique向けAutoRaterは信頼性の高いVLMランキングを提供し、人間の事実性判断と優れた整合性を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:57:26 GMT)
RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors [57.8] 本稿では,72kの多種多様かつ高い変換可能な対向例からなるRAID(Robust Evaluation of AI- generated Image Detectors)を提案する。
提案手法は,未知の検出器に高い成功率で転送する逆画像を生成する。
以上の結果から,現在最先端のAI生成画像検出器は,敵の例によって容易に認識できることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:46:28 GMT)
Speedy Deformable 3D Gaussian Splatting: Fast Rendering and Compression of Dynamic Scenes [57.7] 動的シーンへの3次元ガウススティング(3DGS)の最近の拡張は、ニューラルネットワークを用いて各ガウスの時間変化変形を予測することによって、高品質な新規ビュー合成を実現する。
しかしながら、ガウス毎のニューラルネットワークを各フレームで実行することは、レンダリング速度を制限し、メモリと計算要求を増大させる、重大なボトルネックとなる。
動的3DGSおよび4DGS表現のレンダリング速度を2つの相補的手法により低減し,高速化する汎用パイプラインであるSpeedy Deformable 3D Gaussian Splatting(SpeeDe3DGS)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:30:48 GMT)
WebUIBench: A Comprehensive Benchmark for Evaluating Multimodal Large Language Models in WebUI-to-Code [57.5] MLLM(Multimodal Large Language Models)は、複雑なWebアプリケーション開発を実行するAIソフトウェアエンジニアとして機能する可能性がある。
既存のベンチマークは、通常、サブ能力の評価を提供し、Webページ生成結果のみに焦点を当てない。
WebUIパーセプション、HTMLプログラミング、WebUI-HTML理解、WebUI-to-Codeの4つの主要な領域でMLLMを評価するために体系的に設計されたベンチマークであるWebUIBenchを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:46:02 GMT)
Accelerating Spectral Clustering under Fairness Constraints [56.9] 本研究では,Fair SC問題を凸関数(DC)フレームワークの差内にキャストすることで,フェアスペクトルクラスタリング(Fair SC)のための新しい効率的な手法を提案する。
本研究では,各サブプロブレムを効率よく解き,計算効率が先行処理よりも高いことを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:46:27 GMT)
Profiling Electric Vehicles via Early Charging Voltage Patterns [56.4] 電気自動車(EV)は、燃料駆動車に代わる持続可能な代替手段として急速に普及している。
近年の結果,攻撃者はリレー攻撃によってエネルギーを盗む可能性が示唆された。
1つの対策は、充電中に交換された電流でEVの指紋を活用することだ。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:57:37 GMT)
Learning to Reason via Mixture-of-Thought for Logical Reasoning [56.2] Mixture-of-Thought (MoT) は、LLMが自然言語、コード、真理表の3つの相補的なモダリティにまたがる推論を可能にするフレームワークである。
MoT は,(1) 自己進化型 MoT トレーニング,(2) 3 つのモーダルの相乗効果を完全に活用してより良い予測を生成する MoT 推論,という2段階の設計を採用する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:22:15 GMT)
Language Models over Canonical Byte-Pair Encodings [56.1] トークンレベルの言語モデルにおいて、正準性を強制する手法を提案する。
正則性ミスの修正は,いくつかのモデルやコーパスの保持データの可能性を向上させることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:26:14 GMT)
Reinforcing Multimodal Understanding and Generation with Dual Self-rewards [56.1] 大規模言語モデル(LLM)は、クロスモデル理解と生成を単一のフレームワークに統合する。
現在のソリューションでは、外部の監視(例えば、人間のフィードバックや報酬モデル)が必要であり、一方向のタスクにのみ対処する。
我々は,LMMの理解と生成能力を強化するために,自己監督型二重報酬機構を導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:38:45 GMT)
Improving large language models with concept-aware fine-tuning [55.6] 概念認識ファインチューニング(CAFT)は,大規模言語モデル(LLM)のための新しいマルチトークン学習手法である
CAFTは複数のトークンにまたがるシーケンスの学習を可能にし、より強力な概念認識学習を促進する。
実験は、従来の次世代ファインタニング法と比較して大幅に改善された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:55:00 GMT)
Chasing Moving Targets with Online Self-Play Reinforcement Learning for Safer Language Models [55.3] 従来の言語モデル(LM)の安全性アライメントは、リアクティブで非結合な手順に依存している。
このシーケンシャルなアプローチはミスマッチを生み出し、攻撃者は時代遅れの防御に過度に適合する一方、守備側は出現する脅威に常に遅れをとどめている。
我々は,攻撃者と防御エージェントが継続的なインタラクションを通じて共進化するオンラインセルフプレイ強化学習アルゴリズムであるSelf-RedTeamを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:35:12 GMT)
BehaviorBox: Automated Discovery of Fine-Grained Performance Differences Between Language Models [55.2] 本稿では,性能を考慮した文脈埋め込みを用いた言語モデルの自動比較手法を提案する。
提案手法は,2つのLM間の生成容易性について,その相違点を示すコヒーレントな特徴を抽出する。
本研究では,サイズ,モデルファミリ,ポストトレーニングの異なるモデルを比較し,コーパスレベルの難易度だけでは見つからないパフォーマンスの有意義な違いを示す,特定のコンテキストに対する洞察を列挙する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:17:27 GMT)
Improving Memory Efficiency for Training KANs via Meta Learning [55.2] 我々は,MetaKANと呼ばれる,より小さなメタラーナーを用いて,kansの重みを生成することを提案する。
KansとMetaKanをエンドツーエンドの差別化方法でトレーニングすることで、MetaKanは同等あるいはそれ以上のパフォーマンスを達成できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:38:26 GMT)
MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.0] 本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。
結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:53:16 GMT)
Reparameterized LLM Training via Orthogonal Equivalence Transformation [54.8] 直交同値変換を用いてニューロンを最適化する新しいトレーニングアルゴリズムPOETを提案する。
POETは、目的関数を安定して最適化し、一般化を改善する。
我々は、大規模ニューラルネットワークのトレーニングにおいて、POETを柔軟かつスケーラブルにするための効率的な近似を開発する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:34 GMT)
Learning Speaker-Invariant Visual Features for Lipreading [54.7] リリーディングは、視覚的な唇の動きを音声テキストに変換することを目的とした、難しいクロスモーダルタスクである。
既存の唇読解法は、しばしば、視覚とテキストの間に急激な相関をもたらす話者固有の唇属性を抽出する。
SIFLipは、話者固有の属性をアンタングルする、話者不変の視覚特徴学習フレームワークである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:16:14 GMT)
GradSkip: Communication-Accelerated Local Gradient Methods with Better Computational Complexity [54.6] 本研究では,クライアントが通信前に複数の局所勾配型トレーニングステップを実行できるようにすることにより,通信コストの低減を目的とした分散最適化アルゴリズムのクラスについて検討する。
特に、修正したGradSkipは、同じ仮定の下で線形に収束し、通信複雑性が同じであることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:48:07 GMT)
From Language Models over Tokens to Language Models over Characters [54.1] 現代の言語モデルは、$itcharacter$ stringsではなく$ittoken$ strings上の内部的、数学的に...分布である。
本稿では,トークンレベル言語モデルから文字レベル言語への変換アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:02:51 GMT)
Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.6] 医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:22:41 GMT)
QA-LIGN: Aligning LLMs through Constitutionally Decomposed QA [50.0] シンボル報酬の自動分解手法であるQA-LIGNを導入する。
モノリシックスコアを出力するブラックボックス報酬モデルをトレーニングする代わりに、QA-LIGNは原則固有の評価質問を定式化する。
QA-LIGNはより透明性と適応性を提供することを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:24:57 GMT)
LeVo: High-Quality Song Generation with Multi-Preference Alignment [49.9] 本稿では、LLMと音楽伴奏からなるLMベースのフレームワークであるLeVoを紹介する。
LeVoは2種類のトークンを並列にモデル化することができる: 混合トークンは声帯の合成音声を表し、声帯と伴奏を別々にエンコードする二重トラックトークンである。
実験の結果,LeVoは客観的指標と主観的指標の両方において,既存の手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:57:24 GMT)
Reinforcement Learning via Implicit Imitation Guidance [49.9] 自然なアプローチは、訓練中の正規化や参照ポリシーの取得など、模倣学習の目的を取り入れることである。
提案手法では,条件に付加されたノイズによる探索を導出するための先行データのみを用いて,明示的な行動クローニング制約の必要性を回避することを提案する。
提案手法は、7つの模擬連続制御タスクにまたがるオフライン手法による事前強化学習よりも最大2~3倍向上する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:32:52 GMT)
The AI Imperative: Scaling High-Quality Peer Review in Machine Learning [49.9] AIによるピアレビューは、緊急の研究とインフラの優先事項になるべきだ、と私たちは主張する。
我々は、事実検証の強化、レビュアーのパフォーマンスの指導、品質改善における著者の支援、意思決定におけるAC支援におけるAIの具体的な役割を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:37:14 GMT)
Fast Geometric Embedding for Node Influence Maximization [49.8] 低次元空間にグラフを埋め込む効率的な力配置アルゴリズムを導入する。
アプリケーションとして、提案した埋め込みにより、ネットワーク内の高影響ノードを見つけることができ、標準のgreedyアルゴリズムの高速でスケーラブルな代替手段を提供することがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:21:56 GMT)
ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.3] 本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:08:59 GMT)
Statistical Hypothesis Testing for Auditing Robustness in Language Models [49.2] 本稿では,摂動解析を頻繁な仮説テスト問題として再検討するフレームワークである分布に基づく摂動解析を紹介する。
モンテカルロサンプリングを用いて低次元意味的類似性空間内に経験的ヌルおよび代替出力分布を構築する。
反応変化の定量化、正/偽の正率の測定、参照モデルとの整合性の評価について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:11:07 GMT)
Real-Time Execution of Action Chunking Flow Policies [49.2] 本稿では,アクションインタラクションシステムの非同期実行を可能にする新しい推論時アルゴリズムを提案する。
これは、再トレーニングなしでボックスから実行する拡散またはVLAベースのシステムに適用できる。
その結果、RTCは高速で、性能が高く、推論操作に対して一意に堅牢であることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:01:59 GMT)
Decoupling the Image Perception and Multimodal Reasoning for Reasoning Segmentation with Digital Twin Representations [49.0] Reasoning(RS)は、暗黙のテキストクエリに基づいてオブジェクトをセグメント化する必要があるマルチモーダル視覚テキストタスクである。
現在のRSアプローチは、知覚と推論の両方に微調整の視覚言語モデル(VLM)に依存している。
本稿では、Digital Twin表現を中間層として活用し、認識を推論から切り離す新しいRS手法DTwinSegerを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:05:02 GMT)
Hidden in plain sight: VLMs overlook their visual representations [48.8] 視覚言語モデル(VLM)と視覚エンコーダを比較し、これらのモダリティをまたいで統合する能力を理解する。
VLMは視覚エンコーダよりも著しく性能が悪く、近距離性能に低下することがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:54 GMT)
BridgeVLA: Input-Output Alignment for Efficient 3D Manipulation Learning with Vision-Language Models [48.8] BridgeVLAは、3D入力を複数の2D画像に投影し、VLMバックボーンとの入力アライメントを保証する新しい3D VLAモデルである。
アクション予測に2Dヒートマップを使用し、一貫した2次元画像空間内の入力空間と出力空間を統一する。
10以上のタスクで96.8%の成功率を達成することができ、1タスクにつき3つの軌道しか持たず、異常なサンプル効率を誇示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:36:34 GMT)
Leveraging Network Methods for Hub-like Microservice Detection [48.6] ハブのようなマイクロサービスアンチパターンには明確な定義と検出方法がない。
本研究では,Hubライクなマイクロサービスアンチパターンに対して,堅牢な検出アプローチを見つけることを目的とする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:13:49 GMT)
Centrality Change Proneness: an Early Indicator of Microservice Architectural Degradation [48.6] 時間ネットワークの研究は、進化するネットワークを記述し分析する方法として現れてきた。
これまでの研究では,サイズや複雑性,品質といったソフトウェアメトリクスが,マイクロサービスの集中度とどのように関係しているかが検討されてきた。
本研究は, 時間集中度指標が建築劣化の早期検出に有効かどうかを考察する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:22:12 GMT)
CityGo: Lightweight Urban Modeling and Rendering with Proxy Buildings and Residual Gaussians [48.2] CityGoは、テクスチャ化されたプロキシ幾何と周囲の3Dガウスアンを組み合わせたハイブリッドフレームワークで、空から見た都市景観のレンダリングを行う。
我々の表現はトレーニング時間を大幅に短縮し、平均1.4倍のスピードアップを実現し、純粋な3次元ガウススプラッティングアプローチに匹敵する視覚的忠実度を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:56:18 GMT)
WWAggr: A Window Wasserstein-based Aggregation for Ensemble Change Point Detection [47.9] Change Point Detection (CPD) は、データストリームの急激な分散シフトの瞬間を特定することを目的としている。
現在の最先端検出器はまだ完璧な品質を達成できていない。
WWAggr - Wasserstein 距離に基づく新しいタスク固有のアンサンブルアグリゲーション法を紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:52:10 GMT)
Learning to Focus: Causal Attention Distillation via Gradient-Guided Token Pruning [47.8] 大規模言語モデル (LLM) は文脈理解において著しく改善されている。
しかし、長いコンテキストの推論と生成の間に真に重要な情報に出席する能力は、まだペースの遅れています。
本稿では,2段階のフレームワークであるLearning to Focus(LeaF)を導入し,コンバウンディング要因を緩和する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:16:39 GMT)
Theoretical Benefit and Limitation of Diffusion Language Model [47.6] 拡散言語モデルは、テキスト生成の有望なアプローチとして現れてきた。
本稿では,広く使われている拡散言語モデルMasked Diffusion Model(MDM)の厳密な理論的解析について述べる。
我々の分析は、MDMの利点と限界を理解するための最初の理論的基盤を確立している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:36:10 GMT)
Toward Greater Autonomy in Materials Discovery Agents: Unifying Planning, Physics, and Scientists [46.9] MAPPSはPlanner、ツールコードジェネレータ、Scientific Mediatorで構成されている。
計画、物理学、科学者を統一することで、MAPPSはより柔軟で信頼性の高い物質発見を可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:27:38 GMT)
GLoSS: Generative Language Models with Semantic Search for Sequential Recommendation [46.9] セマンティック検索(GLoSS)を用いた生成低ランク言語モデルを提案する。
GLoSSはセマンティック検索を使用して、語彙マッチングを超えて関連するアイテムを検索する。
我々は、GLoSSを3つの実世界のAmazonレビューデータセット、美容、トイ、スポーツで評価し、最先端のパフォーマンスを達成することを発見した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:45:38 GMT)
Enigmata: Scaling Logical Reasoning in Large Language Models with Synthetic Verifiable Puzzles [46.7] エニグマタ(Enigmata)は,パズル推論スキルを備えた大規模言語モデルの改良に適した,最初の包括的スイートである。
これには、7つのカテゴリにわたる36のタスクが含まれており、それぞれが、制御可能な難易度を持つ無制限なサンプルを生成するジェネレータと、自動評価のためのルールベースの検証器を備えている。
私たちのトレーニングモデルであるQwen2.5-32B-Enigmataは、パズル推論ベンチマークにおいて、o3-mini-highとo1を一貫して上回ります。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:49:32 GMT)
Solving Inequality Proofs with Large Language Models [46.7] 不等式証明は様々な科学・数学分野において不可欠である。
これにより、大きな言語モデル(LLM)の需要が高まるフロンティアとなる。
我々は、Olympiadレベルの不平等を専門家が計算したデータセットであるIneqMathをリリースした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:43:38 GMT)
CyberV: Cybernetics for Test-time Scaling in Video Understanding [46.7] 現在のMLLM(Multimodal Large Language Models)は、長いビデオや複雑なビデオを理解するのに苦労する可能性がある。
本稿では,ビデオMLLMを適応システムとして再設計する,サイバネティックな原理にインスパイアされた新しいフレームワークを提案する。
当社のアプローチであるCyberVでは,MLLM推論システム,センサ,コントローラで構成されるサイバネティックループを導入している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:45:18 GMT)
TwinBreak: Jailbreaking LLM Security Alignments based on Twin Prompts [46.3] 大きな言語モデル(LLM)は、日々の生活にますます統合されています。
LLMは有害なプロンプトを送信することによって悪意のあるユーザによって悪用される。
これを軽減するために、モデルはしばしば、そのようなプロンプトを自動的に拒否するセキュリティメカニズムを含んでいる。
本稿では,革新的な安全アライメント除去手法であるTwinBreakを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:54:25 GMT)
Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction [46.3] テスト時間スケーリングの未解決次元であるテスト時間インタラクションのスケールアップを提案する。
まず,Webベンチマークのタスク成功を非自明に向上させることが,対話スケーリングの促進にも有効であることを示す。
我々は,TTI(Test-Time Interaction)というカリキュラムベースのオンライン強化学習手法を導入し,エージェントのロールアウト長を適応的に調整することでエージェントを訓練する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:50:02 GMT)
ProtocolLLM: RTL Benchmark for SystemVerilog Generation of Communication Protocols [45.7] 大きな言語モデル(LLM)は、汎用プログラミング言語のコードを生成する上で有望な能力を示している。
SystemVerilogは論理指向であり、タイミング、セマンティクス、合成可能性の制約に厳格に固執することを要求する。
本稿では,I2C,This,IC,AXIの4つの広く使用されているプロトコルを対象とした,最初のベンチマークスイートを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:10:47 GMT)
RSafe: Incentivizing proactive reasoning to build robust and adaptive LLM safeguards [45.5] 大規模言語モデル(LLM)は、意図的な安全確保努力にもかかわらず、脆弱性を示し続けている。
ポリシー違反のリスクから保護するために、外部ガードモデルによるシステムレベルのモデレーションが一般的な緩和戦略として現れている。
我々は、特定の安全ポリシーの範囲内で堅牢な保護を提供するためのガイド付き安全推論を行う適応型推論ベースの安全ガードであるRSafeを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:20:04 GMT)
LLM-driven Indoor Scene Layout Generation via Scaled Human-aligned Data Synthesis and Multi-Stage Preference Optimization [45.3] 既存の屋内レイアウト生成手法は、プロンプト駆動と学習に基づく2つのカテゴリに分類される。
本稿では,大規模データセットである3D-SynthPlaceについて紹介する。
屋内レイアウト生成に最適化された強力なオープンソースLLMであるOptiSceneを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:13:06 GMT)
RADAR: Benchmarking Language Models on Imperfect Tabular Data [45.3] 言語モデル(LM)は、自律的なデータ分析を行うために、ますますデプロイされている。
しかし、データ認識 -- データのアーティファクトを認識し、推論し、適切に処理する能力 -- は、まだ調査されていない。
表型データに基づくデータ認識推論を体系的に評価するベンチマークであるRADARを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:32:47 GMT)
Decentralized Optimization on Compact Submanifolds by Quantized Riemannian Gradient Tracking [45.1] 本稿では,コンパクト部分多様体における分散最適化の問題について考察する。
エージェントが量子化変数を用いて変数を更新するアルゴリズムを提案する。
我々の知る限りでは、量子化の存在下で$mathcalO (1/K)$収束率を達成した最初のアルゴリズムである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:57:25 GMT)
HyColor: An Efficient Heuristic Algorithm for Graph Coloring [45.0] 本稿ではHyColorというグラフ色問題(GCP)に対する効率的なハイブリッドアルゴリズムを提案する。
HyColorは大規模なスパースグラフを扱うのに優れ、小さな高密度グラフでは印象的な結果が得られる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:45:08 GMT)
Cross-lingual Collapse: How Language-Centric Foundation Models Shape Reasoning in Large Language Models [44.9] textbfCross-lingual Collapseは、多言語言語モデルが支配的な事前学習言語に回帰する体系的なドリフトである。
実験の結果, (i)GRPOは事前学習言語の不均衡を急速に増幅し, わずか数百回の更新で低リソース言語が侵食され, (ii) 言語整合性報酬はこのドリフトを緩和するが, ほぼ5~10ppの精度の低下を犠牲にしていることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:55:27 GMT)
G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems [44.8] 大規模言語モデル (LLM) を利用したマルチエージェントシステム (MAS) は、単一のLLMエージェントよりもはるかに高い認知と実行能力を示している。
組織記憶理論に触発されたMASのための階層型エージェントメモリシステムG-Memoryを紹介する。
Gメモリは、インボディードアクションの成功率と知識QAの精度を、それぞれ20.89%$と10.12%$で改善する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:43:46 GMT)
Self-Supervised Transformers as Iterative Solution Improvers for Constraint Satisfaction [44.7] 制約満足度問題(CSP)のためのトランスフォーマーベースのフレームワークを提案する。
本稿では,Transformerをソリューションリファインダとして活用する自己教師型フレームワークであるConsFormerを提案する。
本モデルは1ステップのランダムな割り当てを改善するために訓練されているが、テスト時に反復的にデプロイされ、教師付きおよび強化学習のボトルネックを回避する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:30:29 GMT)
Language-Grounded Hierarchical Planning and Execution with Multi-Robot 3D Scene Graphs [44.5] マッピング,ローカライゼーション,タスク・アンド・モーション・プランニング(TAMP)を統合したマルチロボットシステムを提案する。
本システムでは,マルチロボット3Dシーングラフの融合に利用されるオープンセットのオブジェクトベースマップを組み込んだ共有3Dシーングラフを構築している。
本研究では,大規模な屋外環境における実環境タスクにおけるシステム性能の実験的評価を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:02:34 GMT)
LLM Alignment as Retriever Optimization: An Information Retrieval Perspective [44.3] 大規模言語モデル(LLM)は、推論、コーディング、コミュニケーションの能力を備えた人工知能に革命をもたらした。
我々の研究は、確立された情報検索(IR)の原則に基づいて、LCMアライメントのための新しい直接最適化手法を導入する。
本稿では,LLMアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント(LarPO)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:53:37 GMT)
Benchmark Granularity and Model Robustness for Image-Text Retrieval [44.0] データセットの粒度とクエリの摂動が検索性能とロバスト性にどのように影響するかを示す。
よりリッチなキャプションは、特にテキスト・ツー・イメージタスクにおいて、検索を継続的に強化することを示す。
本研究は, モデル頑健性の変化とキャプション粒度と感度摂動のデータセット依存的関係に着目した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:08:47 GMT)
Bingo: Boosting Efficient Reasoning of LLMs via Dynamic and Significance-based Reinforcement Learning [43.6] 本稿では,RLフレームワークであるBingoを提案する。
Bingoには2つの重要なメカニズムが組み込まれており、重要でないトークンだけを減らすためにモデルを徐々にガイドし、動的長の報酬は最初は難しい質問に対する精巧な推論を奨励するが、全体的な効率を改善するために時間の経過とともに減衰する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:27:26 GMT)
AlphaAgent: LLM-Driven Alpha Mining with Regularized Exploration to Counteract Alpha Decay [43.5] 我々は,大規模言語モデルとアドホック正規化を統合し,崩壊耐性アルファ因子をマイニングする自律的フレームワークであるAlphaAgentを提案する。
AlphaAgentは、中国CSI 500と米国S&P 500市場で、過去4年間で引き続き重要なアルファ版を提供している。
特にAlphaAgentは、アルファ崩壊に対する顕著な抵抗を示し、強力な要因をもたらす可能性を高めている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:44:51 GMT)
Adaptive Blind Super-Resolution Network for Spatial-Specific and Spatial-Agnostic Degradations [43.2] サンプリング、ぼかし、ノイズなどの劣化モードは、大まかに2つのクラスに分類される。
これら2種類の劣化に対処するために,グローバルおよびローカルブランチを統合した動的フィルタネットワークを導入する。
提案手法は,合成データセットと実画像データセットの両方において,最先端のブラインド超解像アルゴリズムより優れている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:48:17 GMT)
A Two-Phase Deep Learning Framework for Adaptive Time-Stepping in High-Speed Flow Modeling [43.0] そこで我々はShockCastと呼ばれる2段階の機械学習手法を提案する。
ShockCastは高速フローを学習する最初のフレームワークであるため、2つの超音速フローデータセットを生成して評価する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:44:20 GMT)
Detecting Out-of-Distribution Objects through Class-Conditioned Inpainting [42.7] 現実のデプロイメントは、しばしば、out-of-distribution (OOD)オブジェクトと呼ばれる、新しく予期せぬオブジェクトを導入します。
現代の物体検出器は一般的に過信であり、その予測をOOD検出に単独で使用することは信用できない。
我々は,識別対象検出器と異なる目的関数で訓練された安定拡散のような,既製のテキスト・ツー・イメージ生成モデルを利用する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:06:04 GMT)
MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification [42.6] 我々は、協調学習と整合性正規化のパラダイムを擬似ラベルで組み合わせた、新しい半教師付き学習(SSL)アルゴリズムであるMultiMatchを紹介する。
コアとなるMultiMatchは、3つの重要な目的のために設計された3倍の擬似ラベル重み付けモジュールを備えている。
このモジュールは、Multihead Co-trainingのヘッドアグリーメント、FreeMatchの自己適応しきい値、MarginMatchのAverage Pseudo-Marginsの3つの既存のテクニックを強化し、統合する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:27:47 GMT)
APTOS-2024 challenge report: Generation of synthetic 3D OCT images from fundus photographs [42.6] アジア太平洋眼科会(Asia Pacific Tele-Ophthalmology Society)は、人工知能に基づくOCT生成(OCT Generation from Fundus Images)という課題を組織した。
本稿では、ベンチマークデータセットを含むチャレンジフレームワーク(APTOS-2024 Challenge)について詳述する。
このチャレンジには342チームが参加し、42の予備出場と9人のファイナリストが参加した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:29:37 GMT)
Knowledge Compression via Question Generation: Enhancing Multihop Document Retrieval without Fine-tuning [42.4] 本研究では,細調整や従来のチャンキングを必要とせずに,検索強化生成(RAG)システムを改善する質問ベースの知識符号化手法を提案する。
テキストコンテンツは語彙空間と意味空間にまたがって生成された質問を用いてエンコードされ、ターゲット検索キューと独自の構文再構成手法が組み合わさって生成される。
109件の科学論文のシングルホップ検索では、Recall@3が0.84となり、従来のチャンキング手法よりも60%向上した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:15:11 GMT)
Adaptive Per-Tree Canopy Volume Estimation Using Mobile LiDAR in Structured and Unstructured Orchards [42.3] 本稿では,日常的なロボットナビゲーション中に収集した移動体LiDARデータを用いて,木ごとのキャノピー体積推定を行うリアルタイムシステムを提案する。
本研究では,2つの商業用果樹園,1つのピスタチオ果樹園,1つのアーモンド果樹園,および2つの樹冠を交互に重ねて評価した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:40:28 GMT)
On the Impact of Uncertainty and Calibration on Likelihood-Ratio Membership Inference Attacks [42.2] 我々は,情報理論の枠組みにおける可能性比攻撃(LiRA)の性能を解析する。
我々は、MIAの有効性に対する不確実性と校正の影響についての洞察を提供することを目的として、MIA敵の利点に基づいて境界を導出する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:29:17 GMT)
Quantum noise in a squeezed-light-enhanced multiparameter quantum sensor [41.9] 本研究では, 量子センサを用いた感度の量子化について検討した。
hOPMはdc磁場強度(スカラー磁力計)の両方を取得し、選択された周波数でac磁場の1つの4分の1を共鳴的に検出する。
我々は、これらの相互作用を、S$とS_3$Skesコンポーネント間の量子ノイズの分布を制御するツールとして、圧縮光を用いて観察する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:00:51 GMT)
What if LLMs Have Different World Views: Simulating Alien Civilizations with LLM-based Agents [41.7] 本研究では,人間と地球外文明の複雑な相互作用をシミュレーションするために,Large Language Models (LLM) を用いた革新的な人工知能システムであるCosmoAgentを紹介する。
本手法により,文明の成長軌跡を定量的に分析し,成長・飽和の重要な点での今後の意思決定の洞察を提供する。
この革新的な研究は、潜在的な文明間力学を解釈する新しい方法を導入するだけでなく、異なる価値体系を持つ実体が、非対称情報の下でのゲームの実行、競合の防止、およびゲームへの関与を可能にする実践的な価値も持っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:57:35 GMT)
GHOST 2.0: generative high-fidelity one shot transfer of heads [41.6] ヘッドスワップは、合成中に頭全体の構造情報を保存する必要があることや、スワップされたヘッドとバックグラウンドの間の不透明なギャップなど、追加の課題を生じさせる。
本稿では,2つの問題固有のモジュールからなるGHOST 2.0を用いて,これらの問題に対処する。
まず、頭部再現のための拡張アリグナーモデルを導入し、複数のスケールで識別情報を保存する。
次に,Blenderモジュールを用いて,再現された頭部を肌の色を伝達し,不一致領域を塗布することで,シームレスに対象の背景に組み込む。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:13:34 GMT)
SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding [40.9] SpikeSMOKEは低出力のモノクル3Dオブジェクト検出のための新しい試みである。
SpikeSMOKEはSMOKEと比較してエネルギー消費を大幅に削減できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:20:10 GMT)
Extending Epistemic Uncertainty Beyond Parameters Would Assist in Designing Reliable LLMs [40.7] 我々は、不確実性を推論し、不確実性の再現性を明確化するコヒーレントな基盤を提供する枠組みの採用を提唱する。
受動的回避よりも能動的解決をサポートすることで、より信頼性が高く透明で広く適用可能なLCMシステムへの扉を開くことができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:52:03 GMT)
One Fits All: Learning Fair Graph Neural Networks for Various Sensitive Attributes [40.6] 不変学習,すなわちFairINVに基づくグラフフェアネスフレームワークを提案する。
FairINVはセンシティブな属性分割を取り入れ、ラベルと各種のセンシティブな属性の間の急激な相関を排除し、公正なGNNを訓練する。
いくつかの実世界のデータセットの実験結果から、FairINVは最先端のフェアネスアプローチを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:47:07 GMT)
Using Satellite Images And Self-supervised Machine Learning Networks To Detect Water Hidden Under Vegetation [40.5] 我々は、レーダー衛星画像を、手動のアノテーションを使わずに、陸地から水を分離する領域に分割するモデルを訓練する。
同じアーキテクチャを用いた1つの完全教師付きモデルと比較して、我々の自己教師付きモデルのアンサンブルは、インターセクション・オーバー・ユニオン計量において0.02の改善を達成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:35:31 GMT)
REMoH: A Reflective Evolution of Multi-objective Heuristics approach via Large Language Models [39.9] 多目的最適化は、複雑な意思決定タスクにおいて基礎となる。
大規模言語モデル(LLM)の最近の進歩は、説明可能性、適応性、推論の強化を提供する。
本研究では,NSGA-II と LLM を融合した新たなフレームワークである REMoH (Reflectionive Evolution of Multi-Objective Heuristics) を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:38:28 GMT)
A Practical Guide to Tuning Spiking Neuronal Dynamics [39.6] 我々は、SNNで使用されている2つの異なる基礎ニューロンユニット、すなわち、漏洩した統合・火災(LIF)と共鳴・火災(RAF)ニューロンに焦点を当てた。
本稿では,SNNの他の重要な設計要素として,入力エンコーディングの選択と排他的阻害集団のセットアップについて論じる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:41:11 GMT)
Distributed Risk-Sensitive Safety Filters for Uncertain Discrete-Time Systems [39.5] 本研究では,不確実なダイナミクスを持つ離散時間マルチエージェントシステムに対して,新たなリスク感応性安全フィルタを提案する。
提案手法は, モデル不確実性に対するロバスト性を確保するために, 指数的リスク演算子に基づく集中型安全条件に依存する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:48:25 GMT)
SWE-Dev: Building Software Engineering Agents with Training and Inference Scaling [39.5] 大規模言語モデル(LLM)は、会話による問題解決から、ツール使用に関わる現実的なタスクへの対処まで、急速に進歩している。
この問題に対処するために、オープンソースのLLM上に構築されたSWEエージェントであるSWE-Devを提案する。
SWE-bench-Verifiedベンチマークの実験は、SWE-Devモデルが全てのオープンなSWEエージェントの中で最高のパフォーマンスを達成できることを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:03:16 GMT)
Augmenting LLMs' Reasoning by Reinforcing Abstract Thinking [38.9] 大規模言語モデル(LLM)は、しばしばその推論に頑健さを欠いている。
このアプローチは、推論の問題に重点を置いています。
この抽象化プロセスは、単に教師付き微調整よりも強化学習(RL)によりより良く得られる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:34:50 GMT)
Language Embedding Meets Dynamic Graph: A New Exploration for Neural Architecture Representation Learning [38.3] 本稿では,言語に基づくセマンティック埋め込みと動的グラフ表現学習の相乗的統合により,制約に対処する革新的なフレームワークであるLeDG-Formerを紹介する。
具体的には、ニューラルアーキテクチャとハードウェアプラットフォーム仕様の両方を統一的なセマンティック空間に投影する言語埋め込みフレームワークを提案する。
本フレームワークは,NAS-Bench-101とNAS-Bench-201データセットに対して優れた性能を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:20:02 GMT)
OccludeNet: A Causal Journey into Mixed-View Actor-Centric Video Action Recognition under Occlusions [37.8] 我々はOccludeNetを構築した。OccludeNetは大規模に隠蔽されたビデオデータセットで、実シーンと合成シーンの両方を含んでいる。
分析の結果,シーン関連度が低く,部分的な身体視認性が高いと精度が低下することが明らかとなった。
本稿では,背景調整と反事実推論を併用した因果認識(Causal Action Recognition, CAR)手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:55:43 GMT)
Return of ChebNet: Understanding and Improving an Overlooked GNN on Long Range Tasks [37.7] 我々はChebNetを再訪し、遠く離れたノードの相互作用をモデル化する能力について光を当てる。
我々はChebNetを安定かつ非散逸的力学系とみなし、Stable-ChebNetを造語した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:41:34 GMT)
Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy [37.7] 本稿では、侵害されたクライアントが世界収束を遅らせるために敵の更新を注入する、ビザンチン攻撃という特定の脅威に対処する。
信頼スコアの概念とトライアル関数の方法論を組み合わせることで、アウトレイラを動的にフィルタリングする。
提案手法は,Byzantineノードが多数を占める場合でも機能を実現するため,従来のアプローチの限界に対処する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:01:53 GMT)
Dynamical learning and quantum memory with non-Hermitian many-body systems [37.7] 非エルミート系(NH)は、量子技術のための肥大したプラットフォームを提供する。
ランダムグラフ上で定義された対話型NHスピンシステムの例を用いて,この関係について検討する。
第1の例外点の開始は,システムの学習能力の急激な変化に対応することを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:58:40 GMT)
Hummingbird: High Fidelity Image Generation via Multimodal Context Alignment [37.4] シーン属性を、マルチモーダルコンテキストと整合した生成画像に保存することが重要である。
$textbfHummingbird$は、マルチモーダルコンテキストが与えられた最初の拡散ベースのイメージジェネレータで、非常に多様な画像を生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:16:50 GMT)
Jamais Vu: Exposing the Generalization Gap in Supervised Semantic Correspondence [37.3] 単眼深度推定を用いて2次元鍵点を正準3次元空間に昇降させることにより高密度対応を学習するための新しい手法を提案する。
本手法は, オブジェクト形状を明示的な3次元監視やカメラアノテーションを必要とせず, 連続カノニカル多様体を構成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:40:47 GMT)
DISCO: Efficient Diffusion Solver for Large-Scale Combinatorial Optimization Problems [37.2] DISCOは、大規模な組合せ最適化問題に対する効率的な拡散解法である。
サンプリング空間は、解残基によって導かれるより有意義な領域に制約され、出力分布のマルチモーダルな性質は保たれる。
大規模なトラベリングセールスマン問題や最大独立セットのベンチマークに挑戦し、他の拡散手段よりも最大5.28倍の速度で推論を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:24:14 GMT)
Doxing via the Lens: Revealing Location-related Privacy Leakage on Multi-modal Large Reasoning Models [37.2] 広告主は、ユーザ生成画像からセンシティブな位置情報を推測することができる。
DoxBenchは、さまざまなプライバシーシナリオを反映した500の現実世界の画像のキュレートされたデータセットである。
本研究は,MLRMにおける推論時プライバシーリスクの再評価の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:29:36 GMT)
An Overview of the Burer-Monteiro Method for Certifiable Robot Perception [37.0] 本稿では,ロボット認識問題をリアルタイムに認識する手法であるBurer-Monteiroの概要を述べる。
我々の目標は、認証された知覚にBMを適用するための実践的なプライマーを提供することである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:32:24 GMT)
STAMImputer: Spatio-Temporal Attention MoE for Traffic Data Imputation [36.9] 既存のタイム・ツー・スペースのメソッドは、ブロック単位で欠落したデータシナリオの特徴を効果的に抽出することができないことが多い。
本稿では,トラフィックデータ計算のためのSTAMImputerという,専門家ネットワークの時空間注意混合方式を提案する。
その結果,STAMImputer は既存の SOTA 手法に比べて性能が大幅に向上した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:05:00 GMT)
Incorporating Uncertainty-Guided and Top-k Codebook Matching for Real-World Blind Image Super-Resolution [36.7] Codebookベースのリアルイメージ超解像(SR)は、実世界のアプリケーションで有望な結果を示している。
既存のメソッドでは、コードブックと不正確な機能マッチングと、テクスチャの詳細な再構築という、2つの大きな課題に直面している。
本稿では,3つのキーコンポーネントを組み込んだ新しいUncertainty-Guided and Top-k Codebook Matching SRフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:37:58 GMT)
MIRIAD: Augmenting LLMs with millions of medical query-response pairs [36.3] 医療用QAペア5,821,948の大規模キュレートコーパスであるMIRIADを紹介する。
また,MIRIADの精度はRAGベースラインに比べて6.7%向上した。
56の医学分野にまたがるMIRIADのインタラクティブマップであるMIRIAD-Atlasについても紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:21:53 GMT)
Compliance-to-Code: Enhancing Financial Compliance Checking via Code Generation [36.2] 金融規制コンプライアンスに特化した中国初の大規模データセットであるCompliance-to-Codeを提示する。
10のカテゴリにわたる361の規則から1,159の注釈付き節をカバーし、各節は規則関係とともに4つの論理的要素、条件、制約、文脈情報からなるモジュール構造になっている。
自動監査を容易にするために,決定論的Pythonコードマッピング,詳細なコード推論,コード説明を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:23:25 GMT)
Diffusion Models-Aided Uplink Channel Estimation for RIS-Assisted Systems [36.1] 本稿では,再構成可能なインテリジェントサーフェス(RIS)支援システムのためのチャネル推定手法を提案する。
拡散モデル(DM)の逆過程と一致するデノナイズプロセスとしてチャネル推定問題を再構成する。
U-Netのパラメータ数を削減すべく、我々は、同等の性能を実現する軽量ネットワークを慎重に設計する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:46:44 GMT)
When, Where and Why to Average Weights? [36.1] トレーニング軌道に沿ってチェックポイントを平均化することは、機械学習モデルの一般化性能を改善するための強力なアプローチである。
平均化はトレーニングを著しく加速し、最小限の実装とメモリコストの価格でかなりの効率向上をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:23:21 GMT)
PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation [36.0] PhantomWikiは、多様な問合せ対を持つドキュメントコーパスを生成するパイプラインである。
評価毎に新しいPhantomWikiインスタンスがオンデマンドで生成される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:55:58 GMT)
GUI-Reflection: Empowering Multimodal GUI Models with Self-Reflection Behavior [35.7] 本稿では,自己回帰と誤り訂正機能をエンド・ツー・エンドのマルチモーダルGUIモデルに統合する新しいフレームワークを提案する。
Gui-Reflectionは、完全に自動化されたデータ生成と学習プロセスによる自己回帰行動の出現を可能にする。
当社のフレームワークは,GUIエージェントに自己反映と修正機能を備え,より堅牢で適応性があり,インテリジェントなGUI自動化を実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:57 GMT)
PhysiInter: Integrating Physical Mapping for High-Fidelity Human Interaction Generation [35.6] 人間のインタラクション生成パイプライン全体に統合された物理マッピングを導入する。
具体的には、物理に基づくシミュレーション環境での運動模倣は、ターゲットの動きを物理的に有効な空間に投影するために使用される。
実験の結果,人間の運動の質は3%~89%向上した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:04:49 GMT)
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [35.5] 本研究では,視覚言語モデルと拡散プランナを統合した自律運転システムReCogDriveを提案する。
本稿では,大規模運転質問応答データセットを用いてVLMの訓練を行い,汎用コンテンツと実世界の運転シナリオとのドメイン差を緩和する。
第2段階では、拡散型プランナーを用いて模倣学習を行い、潜在言語空間から連続運転行動への表現をマッピングする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:14:04 GMT)
Navigating the Latent Space Dynamics of Neural Models [35.4] 我々は、潜在多様体に作用する力学系として、ニューラルモデルの別の解釈を示す。
オートエンコーダモデルは、符号化復号写像を反復的に適用することによって導かれる、多様体上の潜在ベクトル場を暗黙的に定義することを示す。
本稿では,ベクトル場をネットワークの表現として活用し,モデルとデータの特性を解析するための新しいツールを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:28:34 GMT)
From Output to Evaluation: Does Raw Instruction-Tuned Code LLMs Output Suffice for Fill-in-the-Middle Code Generation? [35.1] ファイリング・イン・ザ・ミドル(FIM)コード生成におけるLCMの自動評価には,後処理が不可欠である。
本研究では,LLM出力の処理後処理の必要性について検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:03:15 GMT)
Enhancing Watermarking Quality for LLMs via Contextual Generation States Awareness [35.1] プラグ・アンド・プレイ型コンテキスト生成状態認識型透かしフレームワーク(CAW)について紹介する。
まず、CAWは透かしキャパシティ評価器を内蔵し、異なるトークン位置におけるメッセージの埋め込みの影響を評価する。
提案手法によって生じる遅延を回避するために,マルチブランチプレジェネレーション機構を導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:53:41 GMT)
From Passive to Active Reasoning: Can Large Language Models Ask the Right Questions under Incomplete Information? [35.0] LLMのアクティブな推論能力を評価するために設計された新しいベンチマークであるAR-Benchを提案する。
AR-Benchは3つのタスクファミリー検出ケース、状況パズル、推測数で構成される。
AR-ベンチに関する実証的な評価は、現代のLDMは活発な推論を伴う困難を顕著に示していることを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:56:41 GMT)
Instructing Large Language Models for Low-Resource Languages: A Systematic Study for Basque [34.7] ユーザ意図で言語モデルを教えるには、限られた言語セットでしか利用できない大規模な命令データセットが必要である。
対象言語におけるコーパス、既存のオープンウェイトな多言語ベースと指示されたバックボーンLLM、および指示されたバックボーンから合成された命令のみを利用できる低リソース言語に対する現実的なシナリオを仮定する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:54:47 GMT)
Training Articulatory Inversion Models for Interspeaker Consistency [34.7] AAIは音声から調音への逆写像をモデル化しようとする。
AAIの最近の研究は、単一話者データセットに自己監視学習(SSL)モデルを適用することを提案した。
単一話者データと複数話者データに基づいて訓練されたSSL適応モデルが、英語とロシア語の話者識別に一貫性のある音声目標を生成するかどうかを検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:06:35 GMT)
SecFormer: Fast and Accurate Privacy-Preserving Inference for Transformer Models via SMPC [34.6] 本稿では,Transformer モデルに対する高速かつ正確な PPI を実現するための SecFormer という包括的 PPI フレームワークを提案する。
効率面では、SecFormerはBERT$_textBASE$とBERT$_textLARGE$のPUMAよりも3.57倍速い。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:49:24 GMT)
Correlated Noise Mechanisms for Differentially Private Learning [34.6] この本は、AIと機械学習モデルのプライベートトレーニングに差分プライバシーのための相関ノイズメカニズムの適用に焦点を当てている。
ノイズの反相関は、その後のステップで追加されたノイズの一部を慎重にキャンセルすることで、プライバシーとユーティリティのトレードオフを大幅に改善する。
このような相関ノイズ機構は、行列機構、分解機構、学習アルゴリズムに適用されたDP-FTRL(DP-FTRL)としても知られており、産業的展開が世界規模で行われている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:21:50 GMT)
Super Encoding Network: Recursive Association of Multi-Modal Encoders for Video Understanding [34.5] ビデオ理解は世界モデリングの重要なステップである。
ビデオ理解のための統合スーパーネットワーク(SEN)を提案する。
私たちのSENは、最も代表的な4つのタスクを著しく強化できます。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:20:21 GMT)
From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models [34.5] 我々は,ゼロショットの新たな目標への一般化を促進する抽象的記号的世界モデル学習に注力する。
そのようなモデルの重要な構成要素は、オブジェクトの性質とオブジェクト間の関係を定義する記号述語(英語版)の集合である。
我々はシミュレーションと実世界の両方で実験を経験的に実証し、本手法が積極的に一般化できることを実証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:52:27 GMT)
Detect Anything 3D in the Wild [34.3] DetAny3Dは任意のカメラ構成で新しい物体を検知できる3D検出基盤モデルである。
2D知識を3Dに効果的に転送するために、DetAny3Dは2DアグリゲータとZero-Embedding Mappingによる3Dインタプリタという2つのコアモジュールを組み込んでいる。
DetAny3Dは、未確認のカテゴリや新しいカメラ構成の最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:56:03 GMT)
Serendipitous Recommendation with Multimodal LLM [34.2] MLLM(Multimodal Large Language Models)は、セレンディピティーに必要な世界的知識とマルチモーダル理解を持つ。
本稿では,MLLMが従来の推薦モデルに対して高レベルなガイダンスを提供する,新しい階層型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:13:22 GMT)
SpatialLM: Training Large Language Models for Structured Indoor Modeling [34.1] SpaceLMは3Dポイントクラウドデータを処理し、構造化された3Dシーン理解出力を生成するために設計された大きな言語モデルである。
室内の12,328の点雲と地上の3Dアノテーションからなる大規模で高品質な合成データセットを収集する。
提案モデルでは,3次元物体検出において,レイアウト推定における最先端性能と競合性を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:10:58 GMT)
Cartridges: Lightweight and general-purpose long context representations via self-study [34.0] 大規模な言語モデルは、大きなテキストコーパスに埋もれたクエリに答えるためにしばしば使用される。
本研究では,コーパスに関する合成会話を生成し,文脈蒸留目的のカートリッジを訓練する学習レシピを提案する。
自己学習で訓練したCartridgesは、ICLの機能を複製するが、提供コストはかなり安い。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:21:52 GMT)
Is poisoning a real threat to LLM alignment? Maybe more so than you think [33.6] そこで我々は,異なるシナリオ下での中毒攻撃に対するDPOの脆弱性を調査し,嗜好中毒の有効性を比較検討した。
PPOベースの手法とは異なり、バックドア攻撃では、有害な行動を誘発するために、少なくとも4%のデータを汚染する必要がある。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:00:06 GMT)
GIQ: Benchmarking 3D Geometric Reasoning of Vision Foundation Models with Simulated and Real Polyhedra [33.5] 本稿では,視覚モデルと視覚言語基礎モデルの幾何学的推論能力を評価するためのベンチマークであるGIQを紹介する。
GIQは224種類の多面体からなる合成および実世界の画像からなる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:11:21 GMT)
SlideCoder: Layout-aware RAG-enhanced Hierarchical Slide Generation from Design [33.5] 参照画像から編集可能なスライドを生成するためのレイアウト対応検索拡張フレームワークであるSlideCoderを紹介した。
実験によると、SlideCoderは最先端のベースラインを最大40.5ポイント上回るパフォーマンスを示し、レイアウトの忠実さ、実行精度、視覚的整合性を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:39:48 GMT)
Weakly Supervised Temporal Action Localization via Dual-Prior Collaborative Learning Guided by Multimodal Large Language Models [33.4] MLLM4WTALと呼ばれる新しい学習パラダイムを導入する。
MLLMのポテンシャルを利用して、時間的アクションキーセマンティクスと完全なセマンティクスの事前を提供する。
キーセマンティックマッチング(KSM)と完全セマンティック再構成(CSR)の2つの異なるモジュールを統合することでこれを実現できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:58:32 GMT)
AI Scientists Fail Without Strong Implementation Capability [33.2] 人工知能(AI)科学者の出現は、科学的発見のパラダイムシフトを表している。
最近のAI Scientist研究は、独立した科学的発見のための十分な能力を示している。
この大きな進歩にもかかわらず、AI Scientistはコンピュータ科学の分野における画期的な成果をまだ生み出していない。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:01:24 GMT)
MADFormer: Mixed Autoregressive and Diffusion Transformers for Continuous Image Generation [32.9] 我々は,AR拡散トレードオフを解析するためのテストベッドとして機能するMixed Autoregressive Diffusion and Transformerを紹介する。
1)高分解能画像の性能はブロック分割により著しく向上し,(2)ARと拡散層を垂直に混合すると,FIDが最大75%向上する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:01 GMT)
Protein folding with an all-to-all trapped-ion quantum computer [32.7] バイアス場デジタル化された反断熱量子最適化(BF-DCQO)アルゴリズムは、IonQの完全に接続されたイオン量子プロセッサ上に実装されている。
現在報告されているタンパク質折り畳み問題の量子ハードウェア実装としては,最大12アミノ酸の四面体格子上でのタンパク質折り畳みが最大である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:34:02 GMT)
Dreamland: Controllable World Creation with Simulator and Generative Models [32.4] 大規模ビデオ生成モデルは、動的世界創造のために多様で現実的な視覚コンテンツを合成することができる。
しかし、多くの場合、要素の操作性に欠けており、シーンの編集やAIエージェントの訓練に使用を妨げている。
本研究では,物理シミュレーションの粒度制御と大規模事前学習型生成モデルのフォトリアリスティックコンテンツ出力を組み合わせたハイブリッドワールドジェネレーションフレームワークDreamlandを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:52 GMT)
$τ^2$-Bench: Evaluating Conversational Agents in a Dual-Control Environment [32.3] AIエージェントの既存のベンチマークは、シングルコントロール環境をシミュレートする。
我々は$tau2$-benchを導入し、エージェントとユーザの両方が、共有された動的な環境で動くツールを活用しています。
特に,エージェントが非ユーザからデュアルコントロールに移行すると,パフォーマンスが著しく低下する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:52:18 GMT)
Learning Universal User Representations Leveraging Cross-domain User Intent at Snapchat [32.3] 我々は、異なるアプリ内サーフェスにまたがってユニバーサルユーザモデリング(UUM)を行おうとしている。
ドメイン固有の表現を置き換える代わりに、UUM表現はドメイン間のトレンドをキャプチャする。
UUM埋め込みは、(i)ロングフォームビデオ埋め込みベースの検索に組み込まれており、(ii)ロングフォームビデオオープンレートの2.78%増加、(ii)ロングフォームビデオL2ランキングの19.2%増加、(iii)レンズL2ランキングの1.76%増加、(iv)通知L2ランキングの0.87%増加となっている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:49:36 GMT)
Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency [32.2] 本稿では、駆動ビデオとLiDARシーケンスの合同生成のための統一的なフレームワークを提案する。
我々は,3D-VAEモダリティにDiTベースのビデオ拡散モデルを統合する2段階アーキテクチャと,NeRFベースのレンダリングと適応サンプリングを備えたBEV対応LiDARジェネレータを用いる。
構造化セマンティクスで生成をガイドするために,シーンレベルとインスタンス言語を統括する視覚レベルモデル上に構築されたキャプションモジュールであるDataCrafterを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:20:49 GMT)
A Good CREPE needs more than just Sugar: Investigating Biases in Compositional Vision-Language Benchmarks [32.1] 視覚言語モデルの構成理解能力の測定によく用いられる17のベンチマークについて検討する。
我々は、データソースやキュレーション手順を含む設計上の選択について精査する。
ブラインドコンストラクションはCLIPモデルと同等に機能し、これらのベンチマークは構成的理解を効果的に測定していないことを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:53:43 GMT)
HeuriGym: An Agentic Benchmark for LLM-Crafted Heuristics in Combinatorial Optimization [31.9] HeuriGymは、LLM(Large Language Models)によって生成されたアルゴリズムを評価するために設計されたエージェントフレームワークである。
我々は、コンピュータシステム、ロジスティクス、生物学などの分野における9つの問題に対する9つの最先端モデルを評価し、ツールの使用、計画、適応推論における永続的な制限を明らかにした。
我々のオープンソースベンチマークは、科学・工学分野におけるLLMの開発をより効果的で現実的な問題解決に導くことを目的としています。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:46:47 GMT)
AI to Identify Strain-sensitive Regions of the Optic Nerve Head Linked to Functional Loss in Glaucoma [31.9] 片眼のONHは,(1)初視と(2)初視で35 mmHgまで上昇した。
下側頭縁と下側頭縁は鍵ひずみ感受性領域と同定され,視野障害の予測に最も寄与した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:00:01 GMT)
Membership Inference Attack Should Move On to Distributional Statistics for Distilled Generative Models [31.8] 大規模生成モデルの訓練における不正なデータ使用を検出するために,MIA(メンバシップ推論攻撃)が有効であることが証明された。
従来のMIAは蒸留生成モデル(すなわち学生モデル)に対して失敗し,その効率性はますます向上している。
蒸留生成モデルを用いて不許可なトレーニングデータを検出するための分布型MIAの3つの原理を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:14:48 GMT)
BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation [31.8] ロボット操作のための最初の1ビットVLAモデルであるBitVLAを紹介する。
本稿では,全精度エンコーダを1.58ビットの重量に圧縮する蒸留対応トレーニング戦略を提案する。
大規模ロボティクスの事前訓練がないにもかかわらず、BitVLAは最先端のOpenVLA-OFTに匹敵する性能を達成している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:15:11 GMT)
Ego-centric Learning of Communicative World Models for Autonomous Driving [31.7] 自律運転などの複雑な高次元環境におけるタスクに対するマルチエージェント強化学習(MARL)について検討する。
本研究では,その潜在表現とともに世界モデルに具現化された生成AIを利用することで,CALL,下線コミュニクアンダーライン型Worunderlineld Modeunderlinelを開発した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:56:40 GMT)
MrM: Black-Box Membership Inference Attacks against Multimodal RAG Systems [31.5] マルチモーダル検索拡張生成(RAG)システムは、クロスモーダル知識を統合することで、大きな視覚言語モデルを強化する。
これらの知識データベースには、プライバシー保護を必要とする機密情報が含まれている可能性がある。
MrMはマルチモーダルRAGシステムを対象とした最初のブラックボックスMIAフレームワークである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:48:50 GMT)
Retrieval-Augmented Generation as Noisy In-Context Learning: A Unified Theory and Risk Bounds [31.3] In-context linear regression における RAG に対する最初の有限サンプル一般化法を提案する。
我々のフレームワークは、検索したテキストを、クエリ依存のノイズのあるインコンテキストの例と見なしている。
解析の結果, ICLとは対照的にRAG上に本態性天井が存在することが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:35:22 GMT)
ProSplat: Improved Feed-Forward 3D Gaussian Splatting for Wide-Baseline Sparse Views [31.3] ProSplatは2段階のフィードフォワードフレームワークで、幅広いベースライン条件下で高忠実度レンダリングを行う。
ProSplatは最近のSOTA法と比較してPSNRで1dBの平均的な改善を実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:45:50 GMT)
GarmageNet: A Multimodal Generative Framework for Sewing Pattern Design and Generic Garment Modeling [31.1] GarmageNetは、2Dミシンパターンの作成を自動化する生成フレームワークである。
ガーマージ(Garmage)は、各パネルを構造的幾何学的イメージとしてエンコードする、新しい衣服表現である。
GarmageSetは1万以上のプロフェッショナルデザインの衣服からなる大規模なデータセットである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:06:19 GMT)
Uncertainty-o: One Model-agnostic Framework for Unveiling Uncertainty in Large Multimodal Models [30.7] 不確実性(Uncertainty-o)は、LMMにおけるモダリティ、アーキテクチャ、能力に関わらず不確実性を明らかにするように設計された、モデルに依存しないフレームワークである。
様々なモダリティにまたがる18のベンチマークと10のLMM実験により、LMMの不確かさを確実に推定する不確実性oの有効性が示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:20:20 GMT)
A Comprehensive Study of Decoder-Only LLMs for Text-to-Image Generation [30.0] 多くのテキスト・ツー・イメージモデルでは、T5とCLIPをテキストエンコーダとして採用している。
私たちは、異なるテキスト埋め込みの効果を分離し、評価できるように、標準化されたトレーニングと評価パイプラインを構築します。
実験の結果, 最終層埋め込みを条件付けとして使用するというデファクトな手法は, 性能を低下させることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:29:53 GMT)
How Expressive are Knowledge Graph Foundation Models? [29.7] 本稿では,知識グラフ基礎モデルの表現力は,関係表現の学習に使用されるモチーフに依存していることを示す。
本研究の一環として、より豊かなモチーフを用いて、より表現力のあるKGFMを設計する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:56:28 GMT)
No Stupid Questions: An Analysis of Question Query Generation for Citation Recommendation [29.4] GPT-4o-miniは、答えると、科学論文からの抜粋に関する新たな洞察を公開することができる。
本研究では,これらの質問を検索クエリとして有効性を評価し,マスク付きターゲット文書の検索とランク付けに有効性を評価する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:13:32 GMT)
Tight Lower Bounds and Improved Convergence in Performative Prediction [29.2] 過去のスナップショットから過去のデータセットを活用することで、繰り返しリスク最小化(RRM)フレームワークを拡張します。
データセットの最終イテレーションのみを使用するメソッドに対して,新たな上限を導入します。
様々な性能予測ベンチマークにおいて,安定点への高速収束を実証的に観察する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:15:15 GMT)
MoQAE: Mixed-Precision Quantization for Long-Context LLM Inference via Mixture of Quantization-Aware Experts [29.1] MoQAEは、量子化の専門家の混合による混合精度量子化法である。
この結果から,MoQAEは最先端のKVキャッシュ量子化手法よりも効率と効率の両面で優れていることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:16:24 GMT)
4DGT: Learning a 4D Gaussian Transformer Using Real-World Monocular Videos [29.1] 動的シーン再構成のための4次元ガウス型トランスフォーマーモデルである4DGTを提案する。
4D Gaussian を誘導バイアスとして用い、4DGT は静的および動的成分を統一する。
我々のモデルでは64個のフレームを回転風で連続的に処理し、現場で一貫した4Dガウスを予測している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:59 GMT)
The Computational Advantage of Depth: Learning High-Dimensional Hierarchical Functions with Gradient Descent [29.0] 本稿では,潜在部分空間次元の階層構造を組み込んだ対象関数のクラスを紹介する。
深層ネットワークの学習力学と一般化性能を,高次元限界における浅層ネットワークと比較して解析的に検討した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:34:01 GMT)
Theoretical Limitations of Ensembles in the Age of Overparameterization [29.0] 最近の実証研究により、現代のニューラルネットワークのアンサンブルは、単一だが大きなニューラルネットワークに対して固有の一般化の利点を与えない可能性がある。
パラメータ化されたRF回帰器の無限アンサンブルが(単一の)無限幅RF回帰器と同値になることを最小限の仮定で証明する。
さらに,アンサンブルメンバー間の予測的ばらつきを特徴づけ,従来の不確実性の概念を捉えるのではなく,キャパシティの増加が期待する効果を定量化することを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:30:56 GMT)
Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions [29.0] 大規模言語モデル(LLM)推論は、強化学習(RL)を通して計画や自己回帰のような洗練された行動が現れることを示した。
textbfReLIFT (textbfReinforcement textbfL textbfInterleaved with Online textbfFine-textbfTuning)
ReLIFTでは、モデルを主にRLを使ってトレーニングするが、難しい問題に遭遇すると、ファインチューニングのための高品質なソリューションが収集され、トレーニングプロセスが交互に行われる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:11:20 GMT)
Dynamic Diffusion Schrödinger Bridge in Astrophysical Observational Inversions [28.9] 動的天体物理系の文脈における拡散シュリンガーブリッジ(DSB)モデルについて検討した。
本稿では、天体物理の力学に最適化された対の領域仮定を持つDSBの変種であるAstro-DSBモデルを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:35:36 GMT)
Fairness Overfitting in Machine Learning: An Information-Theoretic Perspective [28.7] 本稿では,情報理論レンズを用いたフェアネス一般化誤差の解析のための理論的枠組みを提案する。
実験結果から,様々なフェアネス認識学習アルゴリズムにまたがる境界の厳密性と実践的妥当性を検証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:24:56 GMT)
Link Prediction with Relational Hypergraphs [28.6] 知識グラフとのリンク予測は、グラフ機械学習において徹底的に研究されている。
本稿では,グラフニューラルネットワークの完全なリレーショナル構造への応用を解き放ち,リレーショナルハイパーグラフとリンク予測を行うフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:08:14 GMT)
Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning [28.3] 教師付き微調整タスクのための汎用トークンクリーニングパイプラインを提案する。
本手法では,キータスク固有の情報を格納したまま,非形式トークンをフィルタリングする。
私たちのフレームワークは、ダウンストリームのパフォーマンスを継続的に改善します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:34:23 GMT)
CuRe: Cultural Gaps in the Long Tail of Text-to-Image Systems [28.2] CuReは、文化的代表性のためのベンチマークとスコアリングスイートである。
我々のデータセットは、32の文化サブカテゴリにまたがる300の文化的アーティファクトを6つの広い文化軸に分類している。
我々は,視覚的類似性,イメージテキストのアライメント,文化的多様性の人的判断に対する,得点者の階級の強い相関を経験的に観察した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:54:41 GMT)
Generative Models at the Frontier of Compression: A Survey on Generative Face Video Coding [28.1] Generative Face Video Coding (GFVC)はこの革命の最前線にいる。
GFVCは複雑な顔のダイナミクスを、エンコーダ側でビットストリームのコンパクト化のためにコンパクトな潜在符号に特徴付けることができる。
本稿ではGFVC技術に関する包括的調査を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:39:24 GMT)
AutoSDT: Scaling Data-Driven Discovery Tasks Toward Open Co-Scientists [28.1] AutoSDTは、現実世界のデータ駆動ディスカバリで高品質なコーディングタスクを収集する自動パイプラインである。
データ駆動ディスカバリのための5,404のコーディングタスクのデータセットであるAutoSDT-5Kを構築した。
AutoSDT-Coder-32Bは、2つの挑戦的なデータ駆動ディスカバリベンチマークで大幅に改善されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:41:50 GMT)
Tile Classification Based Viewport Prediction with Multi-modal Fusion Transformer [27.9] ビューポート予測はタイルベースの360度ビデオストリーミングシステムにおいて重要な側面である。
マルチモーダルフュージョン変換器(MFTR)を用いたタイル分類に基づくビューポート予測手法を提案する。
提案したMFTRを評価するために,広く利用されている2つのPVS-HMとXu-Gazeデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:11:49 GMT)
Representation Bending for Large Language Model Safety [27.8] 大きな言語モデル(LLM)は強力なツールとして登場したが、その固有の安全性のリスクは重大な課題を引き起こしている。
本稿では,LLMにおける有害行動の表現を根本的に破壊する新しい手法であるRepBendを紹介する。
RepBendは最先端のパフォーマンスを達成し、Circuit Breaker、RMU、NPOといった従来の手法よりも優れ、攻撃成功率を最大95%削減する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:56:47 GMT)
Tree-of-Debate: Multi-Persona Debate Trees Elicit Critical Thinking for Scientific Comparative Analysis [27.7] 本稿では,科学論文をそれぞれの新奇性を議論するペルソナに変換するフレームワークであるTree-of-Debate(ToD)を紹介する。
ToDは議論ツリーを動的に構築し、学術論文の中で独立した新規性議論のきめ細かい分析を可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:26:53 GMT)
Fine-Grained Motion Compression and Selective Temporal Fusion for Neural B-Frame Video Coding [27.3] ニューラルBフレーム符号化のための動き圧縮と時間融合の新たな拡張を提案する。
提案手法では,対話型デュアルブランチ動作自動エンコーダと,ブラッチごとの適応量子化ステップを組み込む。
第2に,二方向融合重みを予測し,二方向多スケール時間文脈の識別的利用を実現するための選択時間融合法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:51:10 GMT)
Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models [27.2] 長文言語モデル(LCLM)は知識ベース全体を処理し、直接検索と推論を行うことができる。
LOFTのような既存のベンチマークは、過度に単純化されたコンテキストを提供することでLCLMのパフォーマンスを過大評価することが多い。
ICR2はLCLMをより現実的なシナリオで評価するベンチマークである。
次に, LCLMの性能向上のための3つの手法を提案する。(1) 検索-then-generate fine-tuning, (2) 注意頭を用いてデコード中の長いコンテキストをフィルタリング・復調する検索-attention-probing, (3) 生成ヘッドと併用した共同検索ヘッドトレーニング。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:37:32 GMT)
Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation [27.0] インスタンスイメージゴールナビゲーション(IIN)では、任意の視点から捉えた参照画像に描かれた対象物や場所を特定し、ナビゲートする必要がある。
ターゲットマッチングのための最適視点を推定する階層的スコアリングパラダイムを備えた新しいIINフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:58:14 GMT)
PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement [26.9] PolyVividは、フレキシブルでアイデンティティ一貫性のある生成を可能にする、多目的ビデオカスタマイズフレームワークである。
実験では、PolyVividはアイデンティティの忠実さ、ビデオリアリズム、被写体アライメントにおいて優れたパフォーマンスを達成し、既存のオープンソースおよび商用ベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:11:09 GMT)
Diffusion of Responsibility in Collective Decision Making [26.8] 責任の拡散」とは、複数のエージェントが個々の説明責任を欠く結果に対する責任を共有する状況を指す。
本稿では, 集団意思決定機構の文脈において, しばしば望ましくない現象について考察する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:54:56 GMT)
Well Begun is Half Done: Low-resource Preference Alignment by Weak-to-Strong Decoding [26.4] 大規模言語モデル(LLM)は、攻撃的、偽り、あるいは無意味なコンテンツを生成するのを避けるために、人間の好みと整合する必要がある。
本稿では,ベースモデルのアライメント能力を高めるための新しいフレームワークであるWak-to-Strong Decoding (WSD)を提案する。
我々はまた、ドラフトモデルとして小さなPilot-3Bを微調整するための新しいデータセットGenAlignerも収集しています。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:21:22 GMT)
Fault-tolerant quantum computation with a neutral atom processor [26.3] 256量子ビットの量子プロセッサ上では,それぞれが中性Ytterbium原子である。
我々は、48個の原子に符号化された24個の論理量子ビットの絡み合いを実証し、一度にエラーをキャッチし、平均1.8個の失われた原子を補正した。
また、112個の原子に符号化された最大28個の論理量子ビットを持つベルンシュタイン・ヴァジラニのアルゴリズムも実装した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:38:48 GMT)
Scalable Sobolev IPM for Probability Measures on a Graph [26.3] グラフ距離空間上での確率測度に対するソボレフIPM問題について検討する。
グラフ構造を利用して、正規化されたソボレフIPMが高速な計算のためにエンフローズドフォーム表現を提供することを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:27:32 GMT)
Identifiable Object Representations under Spatial Ambiguities [26.3] 我々は、ビュー固有のスロットを集約して*不変コンテンツ*情報をキャプチャする、新しい多視点確率的アプローチを導入する。
従来の単一視点法とは異なり、我々の手法は空間的曖昧さを解消し、同定可能性に関する理論的保証を提供し、*視点アノテーションを必要としない*。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:35:23 GMT)
From Calibration to Collaboration: LLM Uncertainty Quantification Should Be More Human-Centered [26.2] 大規模言語モデル(LLM)は、現実世界のユーザをますます支援していますが、その信頼性は依然として懸念されています。
LLMにおける不確実性定量化の現在の実践は、現実世界のタスクにおける意思決定に有用なUQを開発するのに最適ではない、と我々は主張する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:10:04 GMT)
LoRaConnect: Unlocking HTTP Potential on LoRa Backbones for Remote Areas and Ad-Hoc Networks [26.2] LoRaネットワーク上でのWebアクセスを可能にするLoRaWebを提案する。
LoRaWebハードウェアは、クライアントデバイスが接続し、Webブラウザを使用してWebページにアクセスするWiFiホットスポットをテザリングする。
LoRaWebは、要求者と応答者の間の効果的なメッセージ交換の課題に対処するための同期手順を実装している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:58:19 GMT)
Instruction-Tuned Video-Audio Models Elucidate Functional Specialization in the Brain [26.0] マルチモーダル大言語モデル(MLLM)は、単言語モデルと比較して脳のアライメントの程度が高い。
命令調整型ビデオMLLMは,非命令調整型マルチモーダルモデルや非モーダルモデルよりも有意に優れていることを示す。
言語誘導命令を用いたビデオと音声のタスクに対するMLLMの評価は,MLLMのタスク固有表現に明確に絡み合っていることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:48:36 GMT)
Understanding Cross-Domain Adaptation in Low-Resource Topic Modeling [25.9] 我々は、低リソースのトピックモデリングにドメイン適応を導入し、高リソースのソースドメインが低リソースのターゲットドメインに無関係なコンテンツで圧倒することなく通知する。
DALTAは、ドメイン不変の機能に共有エンコーダ、ドメイン固有ニュアンスに特化されたデコーダ、関連する情報を選択的に転送するための逆アライメントを利用する新しいフレームワークである。
多様な低リソースデータセットの実験により、DALTAはトピックコヒーレンス、安定性、転送可能性の観点から、最先端の手法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:59:18 GMT)
LegalReasoner: Step-wised Verification-Correction for Legal Judgment Reasoning [25.8] 法的判断予測(LJP)は、事件の主張や事実に基づいて最終判決を下すことによって裁判官として機能することを目的としている。
本稿では,段階的検証と推論プロセスの修正によりLJPの信頼性を向上させるLegalReasonerを提案する。
香港の58,130件の判例を含むLegalHKデータセットを公開し、紛争点の詳細なアノテーション、ステップバイステップの推論チェーン、プロセス検証ラベルを含む。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:48:35 GMT)
Straight-Line Diffusion Model for Efficient 3D Molecular Generation [25.6] この問題に対処するために, SLDM(Straight-Line Diffusion Model)を提案する。
提案法は, 分子構造のノイズ感度特性とよく一致し, 再生過程全体にわたって再構成作業の均一な分散を行う。
SLDMは3次元分子生成ベンチマークの最先端性能を実現し,サンプリング効率を100倍に向上させる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:41:53 GMT)
MIRA: Medical Time Series Foundation Model for Real-World Health Data [25.5] 医用時系列の統一基盤モデルは、アノテーションの負担を軽減し、モデルのカスタマイズを最小化し、堅牢な転送を可能にする。
医療時系列の予測に特化して設計された統合基盤モデルであるMIRAを紹介する。
MIRAは、他のゼロショットベースラインや微調整ベースラインと比較して、アウト・オブ・ディストリビューションとイン・ディストリビューションのシナリオで平均10%と7%の誤差を予測できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:27:17 GMT)
ArchiLense: A Framework for Quantitative Analysis of Architectural Styles Based on Vision Large Language Models [25.4] 我々は1,765の高品質なアーキテクチャイメージとそれに対応するスタイルアノテーションからなるArchDiffBenchというプロのアーキテクチャスタイルデータセットを構築した。
アドバンストなコンピュータビジョン技術、ディープラーニング、機械学習を統合することで、ArchiLenseはアーキテクチャイメージの自動認識、比較、正確な分類を可能にする。
ArchiLenseはアーキテクチャスタイルの認識において、92.4%の一貫性と専門家アノテーション、84.5%の分類精度で高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:22:57 GMT)
Bit-level BPE: Below the byte boundary [25.3] サブワードトークン化のためのバイトレベルのフォールバックは、大規模言語モデルにおいて一般的なプラクティスとなっている。
本稿では,シーケンス長を無作為に削減する単純な圧縮手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:28:16 GMT)
Reward-Instruct: A Reward-Centric Approach to Fast Photo-Realistic Image Generation [25.3] 本稿では、複雑な人間の嗜好に合わせた高品質で高速な画像生成を実現するという課題に対処する。
Reward-Instructは、トレーニング済みのベース拡散モデルから報酬強化された数ステップジェネレータに変換するための、新しくて驚くほどシンプルな報酬中心のアプローチである。
テキスト・ツー・イメージ生成実験により,Reward-Instructは視覚的品質と定量的な測定結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:23:04 GMT)
NeurIPS 2025 E2LM Competition : Early Training Evaluation of Language Models [25.0] このコンペティションは、言語モデルの早期訓練の進捗に適した科学的知識評価タスクを設計するという課題に取り組む。
すべての実験と開発作業は、広く利用可能なクラウドベースのGPUプラットフォーム上で実行できる。
提出は、それらが生成するパフォーマンス信号の品質、トレーニングの1兆トークンにおけるモデルランキングの整合性、科学的知識領域との関連性の3つの基準に基づいて評価される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:15:50 GMT)
Implementing LoRa MIMO System for Internet of Things [24.9] 現代のIoTアプリケーションは、LoRaが提供するものよりも高いスループットを必要とする。
本研究は、LoRaの帯域制限に対処する空間多重化アルゴリズムと、LoRa多重入力多重出力(MIMO)システムを導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:09:43 GMT)
FMaMIL: Frequency-Driven Mamba Multi-Instance Learning for Weakly Supervised Lesion Segmentation in Medical Images [24.9] FMaMILは画像レベルのラベルのみに基づく弱教師付き病変分割のための2段階のフレームワークである。
最初の段階では、MILパラダイムの下で画像パッチ間の長距離依存関係をキャプチャするために、軽量なMambaベースのエンコーダが導入された。
空間感度と構造意識を高めるため,周波数領域符号化モジュールを設計し,空間領域の特徴をスペクトル情報で補う。
第2段階では、CAM誘導ソフトラベル監視と自己補正機構により、初期擬似ラベルを洗練し、ラベルノイズ下においても堅牢なトレーニングを可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:18:02 GMT)
Reinforcement Learning from Human Feedback with High-Confidence Safety Constraints [24.9] 言語モデルと人間の嗜好を整合させるために,人間のフィードバックから高信頼安全な強化学習を提案する。
HC-RLHFは高い確率で安全なモデルを生成し、従来の手法と比較して無害性や有用性を向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:03:56 GMT)
EVADE: Multimodal Benchmark for Evasive Content Detection in E-Commerce Applications [24.8] EVADEは、eコマースにおける回避コンテンツ検出の基礎モデルを評価するために設計された、最初の専門家による、中国のマルチモーダルベンチマークである。
データセットには、2,833の注釈付きテキストサンプルと、6つの要求のある製品カテゴリにまたがる13,961のイメージが含まれている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:54:55 GMT)
Circumventing Backdoor Space via Weight Symmetry [23.7] 深層ニューラルネットワークは、トレーニング中に悪意のある振る舞いを埋め込むバックドア攻撃に対して脆弱である。
本研究では,データ形式とは独立して動作し,少量のクリーンサンプルしか必要としない新しいバックドア浄化防御である2段シンメトリ・コネクティビティ(TSC)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:21:35 GMT)
Task Generalization With AutoRegressive Compositional Structure: Can Learning From $D$ Tasks Generalize to $D^{T}$ Tasks? [23.6] 大規模言語モデル(LLM)は目覚ましいタスクの一般化を示し、いくつかのデモで明示的に訓練されなかったタスクを解決する。
小さなタスクセットから学ぶことはいつ、大きなタスクファミリーに一般化できるのだろうか?
すべての$DT$タスクへの一般化は、$widetildeO(D)$タスクのみをトレーニングすることで理論的に達成可能であることを示す。
In-context Learning (ICL) と chain-of- Thought (CoT) の推論により,トランスフォーマーがスパースパリティ関数の指数的タスク一般化を実現することを実証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:02:00 GMT)
ETT-CKGE: Efficient Task-driven Tokens for Continual Knowledge Graph Embedding [23.6] 継続的な知識グラフ 埋め込みは、過去の情報を保存しながら新しい知識を統合する。
既存の方法は2つの重要な制限があるため、効率性とスケーラビリティに苦しむ。
ETT-CKGE (Efficient, Task-driven, Tokens for Continual Knowledge Graph Embedding, ETT-CKGE)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:07:59 GMT)
W4S4: WaLRUS Meets S4 for Long-Range Sequence Modeling [23.5] 状態空間モデル(SSM)は、シーケンスモデリングの強力なコンポーネントとして登場した。
冗長ウェーブレットフレームから構築された新しいSSMであるW4S4(WaLRUS for S4)を導入する。
我々は,HipPOをベースとしたSSMよりも長い地平線上での情報保持が極めて優れていることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:33:29 GMT)
Scaling Laws of Motion Forecasting and Planning -- A Technical Report [23.3] 本研究では,エンコーダ・デコーダ・オートレグレッシブ・トランスモデルの実証スケーリング法則について検討する。
モデルトレーニング損失とモデル評価指標との間には,強い相関関係がみられた。
我々は,エゴエージェントの性能向上のために,他のエージェントの一般的なログ化された運転データに対するトレーニングの有用性を短時間で検討した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:54:23 GMT)
A Comprehensive Survey on Artificial Intelligence for Complex Network: Potential, Methodology and Application [23.1] 複雑なネットワーク科学は、実際のネットワークの基盤となる統計力学、構造、力学の理解を大幅に強化した。
人工知能(AI)技術の出現は、複雑なネットワーク科学研究の新しい時代を告げている。
この調査は、複雑なネットワーク研究の難題を克服する上で、AIの潜在的な利点を体系的に解決することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:40:44 GMT)
OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation [23.1] テキスト・ツー・イメージ(T2I)モデルは、テキスト・プロンプトに整合した高品質な画像を生成する上で大きな注目を集めている。
OneIG-Benchは、T2Iモデルを複数の次元で評価するためのベンチマークフレームワークである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:50:21 GMT)
SoK: Data Reconstruction Attacks Against Machine Learning Models: Definition, Metrics, and Benchmark [22.9] 本稿では,統一的な攻撃分類とデータ再構成攻撃の形式的定義を提案する。
まず、定量化可能性、一貫性、精度、多様性といった重要な基準を考慮に入れた定量的評価指標のセットを提案する。
我々は,人間の判断の代用として大規模言語モデル(LLM)を活用し,高品質な再構築を重視した視覚的評価を可能にした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:00:48 GMT)
Robust 3D Shape Reconstruction in Zero-Shot from a Single Image in the Wild [22.8] 本研究では,3次元形状復元に特化して設計された分割と再構成を統合した統合回帰モデルを提案する。
また、オブジェクト、オクローダ、バックグラウンドの幅広いバリエーションをシミュレートするスケーラブルなデータ合成パイプラインも導入しています。
我々の合成データのトレーニングにより,提案モデルは実世界の画像に対して最先端のゼロショット結果が得られる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:18:25 GMT)
ReverB-SNN: Reversing Bit of the Weight and Activation for Spiking Neural Networks [22.7] 生物学的にインスパイアされたニューラルネットワーク基盤であるSpking Neural Network(SNN)は、最近大きな注目を集めている。
我々は textbfReverB-SNN と呼ばれる SNN の重みと活性化を逆転することを提唱する。
これにより、標準SNNのイベント駆動および乗算不要の利点を保ちながら、アクティベーションの情報容量を向上させることができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:02:03 GMT)
Boosting Vulnerability Detection of LLMs via Curriculum Preference Optimization with Synthetic Reasoning Data [22.6] 本稿では,脆弱性パターンのマイニングに優れた大規模言語モデル(LLM)の新たなフレームワークを提案する。
具体的には、脆弱性と対応する固定コードに対する前方および後方の推論プロセスを構築し、高品質な推論データの合成を保証する。
ReVD は LLM ベースのソフトウェア脆弱性検出のための新たな最先端技術,例えば 12.24%-22.77% の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:25:23 GMT)
Astraea: A GPU-Oriented Token-wise Acceleration Framework for Video Diffusion Transformers [22.3] ビデオ拡散変換器 (vDiT) は, テキスト・ビデオ生成において顕著な進歩を遂げているが, その高い計算要求は, 実用的展開において大きな課題を呈している。
本稿では,vDiTをベースとしたビデオ生成において,ほぼ最適設定を検索する自動フレームワークであるASTRAEAを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:34:47 GMT)
Sparse Interpretable Deep Learning with LIES Networks for Symbolic Regression [22.3] 記号回帰は、データを正確に記述する閉形式の数学的表現を発見することを目的としている。
既存のSR手法は、しばしば人口に基づく探索や自己回帰モデリングに依存している。
LIES(Logarithm, Identity, Exponential, Sine)は,シンボル表現のモデル化に最適化された,解釈可能なプリミティブアクティベーションを備えたニューラルネットワークアーキテクチャである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:05:53 GMT)
Hierarchical Lexical Graph for Enhanced Multi-Hop Retrieval [22.3] RAGは、大きな言語モデルを外部の証拠に基礎を置いているが、セマンティックに遠く離れた文書で答えをまとめなければならないと、いまだに混乱している。
私たちは、StatementGraphRAGとTopicGraphRAGという2つのプラグイン・アンド・プレイレトリバーを構築します。
提案手法は,検索リコールと正当性において平均23.1%の相対的改善を達成し,有意なチャンクベースRAGよりも優れていた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:58:35 GMT)
Automating Exploratory Multiomics Research via Language Models [22.3] PROTEUSは、生のデータファイルからデータ駆動仮説を生成する完全に自動化されたシステムである。
本稿では, 下流データ解析と仮説の提案が重要な分野である臨床プロテオゲノミクス(Proteogenomics)にProteusを適用した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:44:21 GMT)
FuXi-Air: Urban Air Quality Forecasting Based on Emission-Meteorology-Pollutant multimodal Machine Learning [22.3] 高精度な空気質予測を支援するために,マルチモーダルデータ融合に基づく空気質予測モデルFuXi-Airを構築した。
このモデルでは、主要な大気汚染物質6種の72時間の予測を、25~30秒以内に複数の監視地点で時間分解能で完了させることに成功した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:27:50 GMT)
What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.0] 状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。
我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。
本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:23:55 GMT)
Accurate INT8 Training Through Dynamic Block-Level Fallback [21.8] トランスフォーマーモデルは、さまざまなAIアプリケーションで顕著な成功を収めているが、かなりのトレーニングコストに直面している。
オフレイアを含むアクティベーションブロックに対して,動的に8ビットから16ビットにフォールバックする混合精度GEMMを実装したフォールバック量子化を提案する。
実験により、我々のアプローチは微調整と事前学習の両方で堅牢に機能していることが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:37:17 GMT)
ETA: Efficiency through Thinking Ahead, A Dual Approach to Self-Driving with Large Models [21.6] 一般的なソリューションはデュアルシステムアーキテクチャであり、迅速かつリアクティブな決定に小さなモデル、より遅いがより情報的な分析により大きなモデルを採用する。
既存のデュアルシステム設計は、しばしば並列アーキテクチャを実装し、現在のフレームごとに大きなモデルを使って推論を行うか、以前に格納された推論結果から検索する。
私たちの重要な洞察は、現在のフレームの集中的な計算を以前のタイムステップにシフトし、複数のタイムステップのバッチ推論を実行し、大きなモデルを各タイムステップに迅速に応答させることです。
ETAは最先端の性能を8%向上させ、運転スコアは69.53。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:11:02 GMT)
Learning Concept-Driven Logical Rules for Interpretable and Generalizable Medical Image Classification [21.5] 概念ルール学習者(CRL)は、二項化視覚概念から論理ルールを学ぶための新しいフレームワークである。
CRLは概念相関を捉え、臨床的に意味のある規則を抽出し、局所的およびグローバルな解釈可能性を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:45:56 GMT)
Stochastic Nonlinear Control via Finite-dimensional Spectral Dynamic Embedding [21.4] 本稿では,非線形系の最適制御のためのスペクトルダイナミクス埋め込み制御(SDEC)を提案する。
これはシステムの非線形力学によって誘導される無限次元の特徴表現を明らかにし、状態-作用値関数の線形表現を可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:24:01 GMT)
Retrieval-augmented systems can be dangerous medical communicators [21.4] 患者は長年、健康に関する情報をオンラインで求めてきた。
検索強化生成と引用接地は、幻覚を減らし、AI生成応答の精度を向上させる方法として広く推進されている。
本論文は,資料から引き出された文字通り正確な内容が幻覚に反する場合でも,誤解を招く可能性があることを論じる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:13:58 GMT)
On Fitting Flow Models with Large Sinkhorn Couplings [21.3] フローモデルは、1つのモーダリティ(例えばノイズ)から別のモーダリティ(例えば画像)へ徐々にデータを変換する。
近年の研究では、$n$ソースと$n$ターゲットポイントのミニバッチをサンプリングし、OTソルバを使用してそれらを再注文してより良いペアを作る方法が提案されている。
エントロピーの正則化が低い大きなシンクホーンカップリングを組み込む場合, 流れモデルに大きな利点があることが示される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:15:36 GMT)
Parallel nonlinear neuromorphic computing with temporal encoding [21.3] 多次元チャネルにおける情報状態の任意の重ね合わせを可能にする並列非線形ニューロモルフィックプロセッサを提案する。
我々の研究は、複雑なシナリオに適した、時間的に調節された様々なニューロモルフィックプロセッサのための柔軟な道を開く。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:55:05 GMT)
SIFBench: An Extensive Benchmark for Fatigue Analysis [20.9] 機械学習はストレス強度因子(SIF)の予測に大きな可能性を示している
SIFBenchはMLベースのSIF予測をサポートするために設計されたオープンソースの大規模ベンチマークデータベースである。
SIFBenchは、500万以上の異なるクラックと、高忠実度有限要素シミュレーションから派生したコンポーネントジオメトリを含んでいる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:46:46 GMT)
Physics-Informed Deep Learning Model for Line-integral Diagnostics Across Fusion Devices [20.9] 線積分測定による2次元プラズマプロファイルの迅速再構築は核融合において重要である。
本稿では、オニオンと呼ばれる物理インフォームドモデルアーキテクチャを導入し、モデルの性能を向上させる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:29:41 GMT)
Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries [20.8] 本稿では,SPTI(Synsration via Private Textual Intermediaries)と呼ばれる新しい手法を提案する。
SPTIはまず、各プライベート画像をテキストモデルに画像を用いた簡潔なテキスト記述に要約し、その後、修正されたPrivate Evolutionアルゴリズムを適用してDPテキストを生成し、最終的に画像モデルにテキストを使用したイメージを再構成する。
プライベートデータセットが与えられた場合、SPTIは以前のDPアプローチよりもかなり高品質な合成画像を生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:48:06 GMT)
Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning [20.8] Token Internal Position Awareness (TIPA) は、トークン内の文字位置をキャプチャするモデルの能力を大幅に改善する手法である。
TIPAは、大きな言語モデルにおける位置予測精度を高め、元のテキストにおけるターゲット文字のより正確な識別を可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:15:53 GMT)
SurgBench: A Unified Large-Scale Benchmark for Surgical Video Analysis [20.6] SurgBenchは、事前トレーニングデータセットである textbfSurgBench-P と、評価ベンチマークである textbfSurgBench-E で構成される統一的な手術ビデオベンチマークフレームワークである。
SurgBench-Pは、22の外科手術と11の専門分野にわたる5300万フレームをカバーし、SurgBench-Eは72のきめ細かいタスクにまたがる6つのカテゴリ(フェーズ分類、カメラモーション、ツール認識、疾患診断、行動分類、臓器検出)で堅牢な評価を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:02:58 GMT)
Scalable Meta-Learning via Mixed-Mode Differentiation [20.1] Mixed-Flow Meta-Gradientsは、より効率的でスケーラブルな計算グラフを構築するために混合モード微分を利用する実用的なアルゴリズムである。
モダンなメタ学習セットアップの標準実装よりも10倍以上のメモリと25%のウォールクロック時間の改善を実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:37:58 GMT)
DeepVideo-R1: Video Reinforcement Fine-Tuning via Difficulty-aware Regressive GRPO [19.9] グループ相対政策最適化(GRPO)は、グループベースの正規化報酬を持つPPOスタイルの強化アルゴリズムを用いることで、驚くべき成功を収めた。
提案するReg-GRPO(Regressive GRPO)と難易度対応データ拡張戦略を用いて学習したビデオ大言語モデルであるDeepVideo-R1を提案する。
包括的実験の結果,DeepVideo-R1は複数のビデオ推論ベンチマークでビデオ推論性能を大幅に改善することがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:15:54 GMT)
KScope: A Framework for Characterizing the Knowledge Status of Language Models [19.9] LLM知識モードの整合性と正当性に基づく5つの知識状態の分類法を導入する。
次に、知識モードに関する仮説を段階的に洗練する統計テストの階層的なフレームワークであるKScopeを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:06:05 GMT)
Diffusion Counterfactual Generation with Semantic Abduction [19.9] 本稿では,意味表現を拡散モデルに統合し,反実的推論プロセスを通じて画像の編集を行うフレームワークを提案する。
我々の知る限り、拡散反事実に対する高レベルな意味的アイデンティティ保存を考えるのはこれが初めてである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:54:00 GMT)
Drive Any Mesh: 4D Latent Diffusion for Mesh Deformation from Video [19.8] DriveAnyMeshは、モノクロビデオでガイドされたメッシュを駆動する方法である。
潜在集合の列を識別する4次元拡散モデルを提案する。
ラッチセットは変分オートエンコーダを利用し、3D形状とモーション情報を同時にキャプチャする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:08:58 GMT)
Shapley-Coop: Credit Assignment for Emergent Cooperation in Self-Interested LLM Agents [19.8] 大規模言語モデル(LLM)は、事前に定義された役割と役割を持つマルチエージェントシステムにおいて、強力な協調的なパフォーマンスを示す。
コーディネーションの 中心的な課題は 信用の割り当てにある
Shagley-CoopはShapley Chain-of-Thoughtを効果的な価格マッチングのための構造化プロトコルに統合する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:24:01 GMT)
Beyond the Sentence: A Survey on Context-Aware Machine Translation with Large Language Models [19.8] 本研究は,大規模言語モデル(LLM)を用いた文脈認識翻訳の文献レビューである。
既存の作業はプロンプトと微調整のアプローチを利用しており、文脈対応機械翻訳のための自動後編集と翻訳エージェントの作成にはほとんど焦点を当てていない。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:27:00 GMT)
Efficient Long-duration Talking Video Synthesis with Linear Diffusion Transformer under Multimodal Guidance [19.6] LetsTalkは、ビデオ合成のための拡散拡散TranSformerである。
提案手法は最先端の生成品質を実現し,時間的コヒーレントでリアルなビデオを生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:18:35 GMT)
ShapeMoiré: Channel-Wise Shape-Guided Network for Image Demoiréing [19.6] この研究は、既存の画像復号法で無視される2つの問題を特定する。
そこで本研究では,画像復号化のための新しい手法であるShapeMoir'eを提案する。
提案手法はShapeConvとShape-Architectureの両方を備えており,既存のアプローチにシームレスに統合することができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:33:13 GMT)
Adversarial Attack Classification and Robustness Testing for Large Language Models for Code [19.5] 本研究では,自然言語入力における逆方向の摂動がLarge Language Models for Code(LLM4Code)に与える影響について検討する。
文字、単語、文レベルにおける摂動の影響を調べ、最も影響の大きい脆弱性を特定する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:02:29 GMT)
Mimicking or Reasoning: Rethinking Multi-Modal In-Context Learning in Vision-Language Models [19.4] 視覚言語モデル(VLM)は、文脈内学習(ICL)を示すと広く想定されている
提案するMM-ICLにはReasoningパイプラインが組み込まれている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:55:32 GMT)
State-offset Tuning: State-based Parameter-Efficient Fine-Tuning for State Space Models [19.3] ステートスペースモデル(SSM)はトランスフォーマーの効率的な代替品として登場した。
Prompt TuningやPrefix-Tuningのようなプロンプトベースのメソッドは、SSMではうまく機能しない。
本稿では,プロンプトベースの手法の代替として,状態ベースの手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:11:15 GMT)
Feature Statistics with Uncertainty Help Adversarial Robustness [19.0] 敵の攻撃は 特徴統計の分布を 変える傾向がある
頑健性向上のための不確実性駆動型特徴統計調整モジュールを提案する。
提案されたFSUモジュールは、トレーニング、アタック、予測、微調整に普遍的に適用可能である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:16:36 GMT)
Mind the Gap: Removing the Discretization Gap in Differentiable Logic Gate Networks [19.0] ウォールタイムでネットワークを4.5倍速くトレーニングし、差別化のギャップを98%削減し、未使用のゲートの数を100%削減します。
この結果は、LGNの収束特性を改善する暗黙のヘッセン正則化によるものである。
ウォールタイムでネットワークを4.5倍速くトレーニングし、差別化のギャップを98%削減し、未使用のゲートの数を100%削減します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:25:51 GMT)
Conditional Local Independence Testing with Application to Dynamic Causal Discovery [18.9] 我々は、Christgau et al. (2024)で開発された条件付き局所独立試験理論を伊東プロセスに拡張する。
この結果は力学系の因果発見に応用できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:08:41 GMT)
Incorporating Domain Knowledge into Materials Tokenization [18.9] MATTERは、物質知識をトークン化に統合する新しいトークン化アプローチである。
材料知識ベースで訓練されたMatDetectorに基づいて、MATTERは識別された材料概念の構造的整合性を維持している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:59:13 GMT)
Pixel-Sensitive and Robust Steganography Based on Polar Codes [18.8] 極性符号は任意の二進対称音源に対する速度歪み境界を達成することが証明されている。
本稿では,極性符号に基づく画素感度・ロバストなステガノグラフィー手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:54:27 GMT)
Improving Fairness of Large Language Models in Multi-document Summarization [18.8] 多文書要約(MDS)の公正性は、多様な社会的属性値を持つ文書を包括的に把握するために重要である。
本手法は,MDSの要約レベルとコーパスレベルの公平性に着目した選好チューニング手法であるFairPOを提案する。
実験の結果,FairPOはサマリーの臨界品質を維持しつつ,強いベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:52:59 GMT)
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary [18.7] VLogはビデオナレーションを語彙として定義するビデオ理解フレームワークである。
軽量言語モデル GPT-2 上に構築されたVLog には,3つの重要なイノベーションがある。
コードはhttps://github.com/showlab/VLog.comで公開されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:24:26 GMT)
How Benchmark Prediction from Fewer Data Misses the Mark [18.7] ベンチマーク予測は、評価ポイントの小さなサブセットを選択し、そのサブセットからベンチマーク全体のパフォーマンスを予測することを目的としている。
本論文では,19種類のベンチマークにおいて,11種類のベンチマーク予測手法の長所と短所を体系的に評価する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:50:41 GMT)
Minerva: A Programmable Memory Test Benchmark for Language Models [18.5] 本稿では、モデルがメモリを効果的に活用できる能力を評価するために、包括的なテストを自動的に生成するフレームワークを提案する。
我々は、検索、リコール、編集、マッチング、文脈記憶における情報の比較といったアトミックなタスクのモデルを評価する。
また、より複雑で統合されたタスクを実行するモデルの能力を調べるために、複合テストも設計する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:31:04 GMT)
Grouped Discrete Representation for Object-Centric Learning [18.4] オブジェクト指向学習のためのGDR(Grouped Discrete Representation)を提案する。
GDRは、主要なOCLメソッドと最先端のOCLメソッドの両方を、さまざまなデータセットで一貫して改善する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:33:23 GMT)
BatteryLife: A Comprehensive Dataset and Benchmark for Battery Life Prediction [18.4] バッテリライフ予測(Battery Life Prediction, BLP)のための包括的なデータセットとベンチマークであるバッテリライフを提案する。
BatteryLifeは16のデータセットを統合し、前回の最大のデータセットの2.5倍のサンプルサイズを提供する。
BatteryLifeは、亜鉛イオン電池、ナトリウムイオン電池、そして業界でテストされているリチウムイオン電池のバッテリー寿命データセットを初めてリリースした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:30:01 GMT)
BalancEdit: Dynamically Balancing the Generality-Locality Trade-off in Multi-modal Model Editing [18.4] マルチモーダルモデル編集における一般化-局所性トレードオフの概念を導入する。
バランスモデル編集の新しい手法であるBalancEditを提案する。
この結果,堅牢な編集能力を維持しつつ,最小限のトレードオフを実証し,BalancEditの有効性を確認した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:51:05 GMT)
Leveraging Historical and Current Interests for Continual Sequential Recommendation [18.4] CSTRec(Continuous Sequential Transformer for Recommendation)
中心となるCSA(Continuous Sequential Attention)は、古いデータに直接アクセスすることなく過去の知識を保持する線形アテンションメカニズムである。
3つの実世界のデータセットの実験は、CSTRecが知識保持と獲得の両方において最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:20:23 GMT)
RomanLens: The Role Of Latent Romanization In Multilinguality In LLMs [18.3] 大きな言語モデル(LLM)は、英語中心のコーパスで主に訓練されているにもかかわらず、強い多言語のパフォーマンスを示す。
LLMはこのような多言語機能をどのように達成しますか?
非ローマ文字で書かれた言語に着目し、多言語処理における潜在的ブリッジとしてのロマン化の役割について検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:33:37 GMT)
Explicit Preference Optimization: No Need for an Implicit Reward Model [18.2] 直接選好最適化(DPO)とそのオフシュートは、個別の報酬トレーニングステップの必要性を回避する。
DPOをベースとした目的は,しかしながら,準最適正規化や反直観的アーティファクトの対象であることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:11:01 GMT)
Fact in Fragments: Deconstructing Complex Claims via LLM-based Atomic Fact Extraction and Verification [18.2] Atomic Fact extract and Verification (AFEV) は、複雑なクレームを原子事実に反復的に分解する新しいフレームワークである。
AFEVは、精度と解釈可能性の両方において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:49:43 GMT)
Outlier-weighed Layerwise Sampling for LLM Fine-tuning [18.1] Outlier-weighed Layerwise Smplingはメモリ効率の良い微調整アプローチである。
我々は、OWSが完全な微調整を含むベースラインアプローチを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:55:25 GMT)
Premise Selection for a Lean Hammer [18.0] ハマーは、退屈な推論ステップを自動化するために外部の自動定理プローバーとインターフェースするツールである。
LeanHammerは、リーンの最初のエンドツーエンドのドメイン・ジェネラル・ハンマーです。
我々の前提セレクタは、LeanHammerが既存の前提セレクタと比較して21%多くの目標を解決できることを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:50:59 GMT)
Generalization Analysis for Bayesian Optimal Experiment Design under Model Misspecification [18.0] 薬物発見や臨床試験のような科学や産業の多くの分野では、時間と予算の制約の下で実験を設計することが中心的な課題である。
トレーニング中、BOEDは事前に決定された取得基準に従って入力を選択する。
テスト中、トレーニング中に学んだモデルは、自然に発生するテストサンプルの分布に遭遇する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:33:50 GMT)
Beyond Jailbreaks: Revealing Stealthier and Broader LLM Security Risks Stemming from Alignment Failures [17.9] 大規模言語モデル(LLM)は、現実のアプリケーションにますますデプロイされ、セキュリティに対する懸念が高まっている。
ジェイルブレイク攻撃は、過度に有害なクエリの下での失敗を浮き彫りにするが、彼らは重大なリスクを見落としている。
我々は,高リスク領域を明らかにすることで,出力の事実性と入力の無害性に基づいて,構造化された二次的な視点でLLMリスク景観を体系的に再構築する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:52:43 GMT)
Unveiling and Addressing Pseudo Forgetting in Large Language Models [17.9] 従来のタスクのパフォーマンス劣化は、能力の喪失によるものではなく、適切なモデル能力の活性化のための命令の失敗によるものであることを示す。
Rationale-Guidance Difficulty based Replay (RGD-R) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:09:36 GMT)
Execution-Aware Program Reduction for WebAssembly via Record and Replay [17.8] 本稿では, RR-ReduceとHybrid-Reduceについて述べる。
RR-Reduceは、バグトリガ機能をターゲット関数として識別し、その機能をプログラムの他の部分から分離し、縮小されたプログラムを生成する。
RR-ReduceとHybrid-Reduceを28のWasmプログラムで評価し、3つのエンジンの様々なバグを発生させる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:57:10 GMT)
Evidential Spectrum-Aware Contrastive Learning for OOD Detection in Dynamic Graphs [17.8] 動的グラフにおけるアウト・オブ・ディストリビューション(OOD)検出は、受信したデータがイン・ディストリビューション(ID)トレーニングセットの分布から逸脱するかどうかを特定することを目的としている。
我々は、Evidential Spectrum-awarE Contrastive Learningを用いた、革新的で効果的なOOD検出器であるEviSECを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:34:46 GMT)
Segment Any Architectural Facades (SAAF):An automatic segmentation model for building facades, walls and windows based on multimodal semantics guidance [17.5] 本研究では,マルチモーダルな意味指導に基づくファサードの壁や窓の自動セグメンテーションモデルを提案する。
本研究では,テキスト記述から画像分割へのマッピング関係を自律的に学習するためのエンドツーエンドトレーニングフレームワークを開発した。
本モデルでは,壁面分割作業と窓分割作業の精度向上と一般化能力の向上を図っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:16:46 GMT)
WeThink: Toward General-purpose Vision-Language Reasoning via Reinforcement Learning [17.5] DeepSeek-R1のようなテキストベースの推論モデルの成功に基づいて、これらの機能をマルチモーダル推論に拡張することは大きな約束である。
本稿では,強化学習を通じて汎用的な視覚言語推論を実現する方法について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:20:54 GMT)
Vision Transformers Don't Need Trained Registers [17.4] 疎いニューロンの集合は、外れ値のトークンに高ノルムの活性化を集中させる役割を担っている。
これらのアーティファクトを緩和するために、トレーニング不要のアプローチを作成します。
その結果,テスト時のレジスタは,テスト時のレジスタトークンの役割を効果的に担っていることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:57 GMT)
Multi-agent Architecture Search via Agentic Supernet [17.2] 大規模言語モデル(LLM)を利用したマルチエージェントシステムは、個々のエージェントの認知的境界を拡張する。
エージェントの設計を自動化する方法が利用可能であるにもかかわらず、彼らは通常、静的で複雑で、1サイズに適したシステムを見つけ出そうとする。
スーパーネットからクエリ依存エージェントシステムをサンプリングする自動フレームワークであるMASを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:15:47 GMT)
WorldGUI: An Interactive Benchmark for Desktop GUI Automation from Any Starting Point [17.2] We introduced WorldGUI, a comprehensive GUI benchmark including tasks across 10 wide used desktop and web applications。
WorldGUI-Agentは3つのコアモジュールを統一する普遍的なフレームワークである。高レベルプラン修正のためのPlanner-Critic、中間検証のためのStep-Check、アクションレベルの最適化のためのActor-Criticである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:58:38 GMT)
Egocentric Event-Based Vision for Ping Pong Ball Trajectory Prediction [17.1] 本稿では,イベントカメラを用いたテーブルテニスにおけるリアルタイムなエゴセントリックな軌道予測システムを提案する。
そこで我々は,メタプロジェクトAriaメガネのセンサデータと同期した球の3次元地下軌道を含むピンポンゲームシーケンスのデータセットを収集した。
我々の検出パイプラインは、計算と知覚を含む4.5msの最悪ケースの総レイテンシを持つ。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:22:55 GMT)
Compound AI Systems Optimization: A Survey of Methods, Challenges, and Future Directions [17.1] 大規模言語モデルとAIシステムの進歩は、複雑なAIの設計と最適化におけるパラダイムシフトにつながった。
本稿では,複合AIシステムの最適化における最近の進歩を,数値的手法と言語的手法の両方を包含して体系的にレビューする。
我々は、複合AIシステムの最適化の概念を形式化し、いくつかの重要な側面に沿って既存のメソッドを分類し、この急速に発展する分野におけるオープンな研究課題と今後の方向性を明らかにする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:04:14 GMT)
R.R.: Unveiling LLM Training Privacy through Recollection and Ranking [17.1] 大規模言語モデル(LLM)は、暗黙の暗記によるトレーニングデータを漏洩させる可能性のある、重大なプライバシーリスクを生じさせる。
R.R.(Recollect and Rank)は、攻撃者が盗難データからPIIエンティティを再構築できる新しい2段階のプライバシ盗難攻撃である。
3つの人気のあるPIIデータセットに対する実験は、R.R.がベースラインよりも優れたPII識別性能を達成することを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:24:30 GMT)
CCI4.0: A Bilingual Pretraining Dataset for Enhancing Reasoning in Large Language Models [17.0] 我々はCCI4.0を紹介した。CCI4.0は、データ品質と多種多様なヒューマンライクな推論軌道のために設計された、大規模なバイリンガル事前学習データセットである。
CCI4.0はディスク空間を約35ドルで占有し、CCI4.0-M2-BaseとCCI4.0-M2-CoTの2つのサブデータセットから構成される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:14:19 GMT)
GUIPilot: A Consistency-based Mobile GUI Testing Approach for Detecting Application-specific Bugs [16.9] モバイル設計と実装の矛盾を検出するためのGUIPilotを提案する。
実験の結果,GUIPilotは画面不整合の検出において94.5%の精度と99.6%のリコールを実現することができた。
トレーディングモバイルアプリケーションにGUIPilotを適用するという産業ケーススタディは、GUIPilotが9つのアプリケーションバグを検出したことを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:09:48 GMT)
Video Unlearning via Low-Rank Refusal Vector [16.8] 映像生成モデルは直感的な指示によって視覚コンテンツの作成を民主化する。
しかし、Webスケールのトレーニングデータに埋め込まれたバイアスや有害な概念も継承する。
ユーザーは望ましくないコンテンツや違法コンテンツを簡単に生成できるため、この継承は重大なリスクをもたらす。
この研究は、この重要な問題に対処するためにビデオ拡散モデル用に明示的に調整された最初のアンラーニング手法を導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:06:49 GMT)
Coordinating Search-Informed Reasoning and Reasoning-Guided Search in Claim Verification [16.7] マルチホップクレーム検証のための階層型エージェント推論と情報検索(HARIS)を提案する。
HARISは、主検証チェーンの構築に集中し、より多くの情報が必要な場合に事実質問を生成する高レベル推論エージェントと、より多くの情報を反復的に検索する低レベル検索エージェントから構成される。
EX-FEVER と HOVER のベンチマーク実験の結果,HARIS は高い性能を示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:11:43 GMT)
Efficient MRI Parallel Imaging Reconstruction by K-Space Rendering via Generalized Implicit Neural Representation [16.6] 本研究では、MRI PI再構成のための一般化暗黙的神経表現(INR)に基づくフレームワークを提案する。
提案手法は, ボクセル特有の特徴の事前知識を活用することにより, 限界を克服する。
公開されているMRIデータセットを用いた実験は,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:59:27 GMT)
Generate Realistic Test Scenes for V2X Communication Systems [16.6] 我々は,V2X協調認識システムのための自動テストツールであるV2XGenを設計,実装する。
V2XGenは、現実的な協調オブジェクトインスタンスを生成し、それらを背景データに戦略的に配置するために、高忠実なアプローチを利用する。
本稿では,V2XGen 上で異なる融合方式による複数の協調認識システムを用いて実験を行い,その性能評価を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:35:53 GMT)
From Static to Adaptive Defense: Federated Multi-Agent Deep Reinforcement Learning-Driven Moving Target Defense Against DoS Attacks in UAV Swarm Networks [16.6] UAVスワムネットワークにおける能動的かつ適応的なDoS緩和のための新しいフレームワークを提案する。
具体的には、リードスイッチング、ルート突然変異、周波数ホッピングを含む3つの軽量かつ協調的なMTD機構を設計する。
我々のアプローチは最先端のベースラインを大きく上回り、最大34.6%の攻撃緩和率向上を実現した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:33:04 GMT)
QUITE: A Query Rewrite System Beyond Rules with LLM Agents [16.5] 既存のアプローチは主に事前に定義されたリライトルールに依存しているが、クエリのサブセットが限られており、パフォーマンスの低下を引き起こす可能性がある。
本稿では,Large Language Models (LLM) に基づくトレーニングフリーでフィードバック対応のQUITE(クエリリライト)を提案する。
広範な実験により、QUITEはクエリ実行時間を最先端のアプローチで最大35.8%削減し、以前の方法よりも24.1%多く書き換えることを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:51:27 GMT)
MF-LAL: Drug Compound Generation Using Multi-Fidelity Latent Space Active Learning [16.5] 現在の創薬モデルでは、主に分子ドッキングをオラクルとして使用して活性化合物の生成を誘導している。
MF-LAL(Multi-Fidelity Latent space Active Learning, MF-LAL)を提案する。
代理モデルと生成モデルを別々に学習する従来のアプローチとは異なり、MF-LALは生成的および多忠実な代理モデルを単一のフレームワークに統合する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:10:02 GMT)
Adapting Prediction Sets to Distribution Shifts Without Labels [16.5] 我々は、共形予測(CP)と呼ばれる標準設定値予測フレームワークに焦点を当てる。
本稿では, シフトテスト領域からのラベルなしデータのみを用いて, 実用性を向上させる方法について検討する。
提案手法は,既存のベースラインよりも一貫した改善を実現し,完全教師付き手法の性能にほぼ一致することを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:58:21 GMT)
Space-O-RAN: Enabling Intelligent, Open, and Interoperable Non Terrestrial Networks in 6G [16.5] 本稿では,Open RANの原理を階層的な閉ループ制御により衛星コンステレーションに拡張する分散制御アーキテクチャであるSpace-O-RANを紹介する。
軽量のglspldappは衛星をオンボードで運用し、恒久的な地上アクセスに頼ることなく、スケジューリングやビームステアリングなどのリアルタイム機能を実現できる。
鍵となるイネーブルは、O-RANインタフェースを衛星リンクに動的にマッピングし、様々な条件下で適応的なシグナリングをサポートすることである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:59:04 GMT)
STREAMINGGS: Voxel-Based Streaming 3D Gaussian Splatting with Memory Optimization and Architectural Support [16.5] 3DGSは、リソース制約のあるモバイルデバイスで毎秒90フレームのリアルタイム要求を満たすのに苦労している。
既存のアクセラレータは計算効率に重点を置いているが、メモリ効率を見落としているため、冗長なDRAMトラフィックにつながる。
完全ストリーミング3DGSアルゴリズムアーキテクチャの共同設計であるSTREAMINGGSを導入し,細粒度パイプライニングを実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:51:34 GMT)
IGraSS: Learning to Identify Infrastructure Networks from Satellite Imagery by Iterative Graph-constrained Semantic Segmentation [16.4] 多くのインフラネットワークは、ソースへの到達性(運河など)や接続性(道路など)などのグラフレベルの特性を持ち、これらの既存の真実を改善するために利用することができる。
本稿では,RGBを含むセマンティックセグメンテーションモジュールと追加モダリティ(NDWI, DEM)をグラフベースの地上構造改善モジュールと組み合わせた,新しい反復的フレームワークIGraSSを開発する。
実験の結果、IGraSSは到達不能な管の分節を約18%から3%に減らし、改良された地中真実による訓練は管の識別を著しく改善することがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:40:22 GMT)
Training Superior Sparse Autoencoders for Instruct Models [16.4] そこで本研究では,インストラクションモデルに適した新しいトレーニング手法を提案する。
$textitFAST$は、トレーニングプロセスとインストラクションモデルの特徴的なデータ分散とアクティベーションパターンを調整します。
機能解釈可能性において、$textitFAST$は、Llama3.2-3B-Instructでは、$textitBT(P)$と$textitBT(F)$に対して$7.0%$と$10.2%$に対して、最高値で21.1%$である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:23:34 GMT)
Looking Beyond Visible Cues: Implicit Video Question Answering via Dual-Clue Reasoning [16.2] Video Question Answering (VideoQA) は、与えられたビデオに基づいて自然言語の質問に答えることを目的としている。
以前の研究は主に、明示的な視覚的証拠と呼ばれる、関連するセグメントの期間を特定することに焦点を当てていた。
I-VQAを導入し、明確な視覚的証拠がアクセスできないシナリオにおける質問に答えることに焦点を当てた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:38:14 GMT)
BiggerGait: Unlocking Gait Recognition with Layer-wise Representations from Large Vision Models [16.2] 本研究は,下流認識タスクにおけるレイヤワイド表現の影響について検討する。
We propose a simple and universal baseline for LVM based gait recognition, called BiggerGait。
CCPG, CAISA-B*, SUSTech1K, CCGR_MINIの総合評価は, 内部およびクロスドメインタスクにおけるBiggerGaitの優位性を検証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:14:32 GMT)
Automatic Depression Assessment using Machine Learning: A Comprehensive Survey [16.1] うつ病は現在の社会に共通する精神疾患である。
最近のADA調査は、通常、限られた数の人間の行動モダリティだけに焦点を当てている。
本論文は, うつ病関連ヒトの行動について, 様々に要約する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:40:16 GMT)
SOP-Bench: Complex Industrial SOPs for Evaluating LLM Agents [16.1] 大規模言語モデル(LLM)は、目覚ましい汎用推論と問題解決能力を示している。
LLMは、標準動作手順の厳格な遵守を要求する複雑な長期水平実行に苦慮している。
SOP-Benchは10の産業ドメインにわたる1,800以上のタスクのベンチマークである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:20:12 GMT)
ScIRGen: Synthesize Realistic and Large-Scale RAG Dataset for Scientific Research [16.0] 我々は科学的なQAと検索のためのデータセット生成フレームワークであるScrirGenを開発した。
私たちはこれを使って、現実的なクエリ、データセット、論文を備えた大規模科学的検索強化世代(RAG)データセットを作成します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:47:13 GMT)
Parameter-free approximate equivariance for tasks with finite group symmetry [16.0] 等価ニューラルネットワークは、グループアクションを通じて対称性を取り入れ、様々なタスクのパフォーマンスを改善するために誘導バイアスとしてそれらを埋め込む。
損失関数における追加項として、潜在表現における有限群に対して近似同値を課す単純なゼロパラメータアプローチを提案する。
提案手法を3つのデータセットにベンチマークし,既存の同変手法と比較した結果,パラメータのごく一部に対して類似あるいは良好な性能が得られた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:23:26 GMT)
Efficient and Generalized end-to-end Autonomous Driving System with Latent Deep Reinforcement Learning and Demonstrations [15.9] 本稿では,複雑かつ多様なシナリオを対象とした,効率的かつ汎用的なエンドツーエンド自動運転システム(EGADS)を提案する。
EGADSのRLエージェントは、分布仮定に依存しない正規化フローと変分推論を組み合わせる。
実験により,EGADSは既存手法と比較して試料の複雑さを著しく低減し,安全性を著しく向上し,複雑な都市シナリオにおいて強力な一般化能力を示すことが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:02:33 GMT)
Towards a Mechanistic Explanation of Diffusion Model Generalization [15.7] 本研究では,拡散モデルの一般化動作を説明する学習自由機構を提案する。
事前学習した拡散モデルと理論上最適な経験的モデルを比較することにより、共用局所帰納バイアスを同定する。
本稿では,ネットワークの動作を再現するローカルな経験的デノイザを集約する新しいデノイケーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:57:55 GMT)
Deep Ridgelet Transform and Unified Universality Theorem for Deep and Shallow Joint-Group-Equivariant Machines [15.7] 共同群同変特徴写像を備えた学習機械に対する構成的普遍近似定理を提案する。
我々の主定理はまた、浅いネットワークと深いネットワークの両方に対する普遍近似定理を統一する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:38:02 GMT)
CausalPFN: Amortized Causal Effect Estimation via In-Context Learning [15.6] CausalPFNは、新しい観測データセットに因果効果を推定する。
提案手法は,不均一および平均処理効果評価ベンチマークにおいて,優れた平均性能を実現する。
CausalPFNはベイズ原理に基づく信頼性の高い意思決定を支援するために、校正された不確実性推定を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:31:06 GMT)
Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning [15.5] マルチエージェント強化学習 (MARL) は, 協調的対人作業において高い性能を示した。
本稿では,自己適応型難易度調整機構を用いた動的カリキュラム学習フレームワークを提案する。
本手法はトレーニングの安定性と最終性能を両立させ,最先端の手法と競合する結果を得る。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:38:18 GMT)
DualCast: A Model to Disentangle Aperiodic Events from Traffic Series [15.5] 本稿では,交通信号を空間内時間パターンと外部環境コンテキストに分離するデュアルブランチフレームワークであるDualCastを提案する。
我々は,周期的パターンと周期的パターンの両方から高次空間的関係を捉えるために,時間的アテンション機構を用いる。
最近のトラフィック予測モデルと統合し、複数の実際のデータセットで予測エラーを最大9.6%削減します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:29:14 GMT)
Voice Impression Control in Zero-Shot TTS [15.5] ゼロショット音声合成における音声印象制御法を開発した。
様々な音声印象対の強度を表現するために低次元ベクトルを用いる。
主観的評価と主観的評価の両方の結果から,印象制御における本手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:14:18 GMT)
FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity [15.4] 多視点ビデオから3Dシーンの幾何学、外観、基礎となる物理をモデル化することを目的としている。
本稿では,複雑な動的3次元シーンの物理を学ぶために,物体の先行を必要とせずにFreeGaveを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:31:25 GMT)
MARVEL: Multi-Agent RTL Vulnerability Extraction using Large Language Models [15.4] 大きな言語モデル(LLM)は、このタスクの間、直接または既存のツールと連携するために使われてきた。
我々は、意思決定、ツールの使用、推論に対する統一的なアプローチのためのマルチエージェントLLMフレームワークであるMARVELを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:58:48 GMT)
SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage [15.3] 本稿では,LLMの安全対策を効果的に回避できる新しいジェイルブレイクパラダイムであるSimple Assistive Task (SATA)を提案する。
SATAは、マスク付き言語モデルタスクや位置タスクによる要素検索のような単純な補助タスクを使用して、マスク付きキーワードのセマンティクスを符号化する。
実験の結果、SATAは最先端の性能を達成し、ベースラインを大きなマージンで上回ることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:35:57 GMT)
A Red Teaming Roadmap Towards System-Level Safety [15.2] 要求拒否を実装するLLM(Large Language Model)セーフガードは、誤用に対する緩和戦略として広く採用されている。
敵の機械学習とAIの安全性の交差点で、保護された赤いチーム分けは、最先端の拒絶訓練されたLLMの重大な脆弱性を効果的に特定した。
明確な製品安全仕様に対するテストは、抽象的な社会的バイアスや倫理的原則よりも優先すべきである、と我々は主張する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:48:22 GMT)
Community Forensics: Using Thousands of Generators to Train Fake Image Detectors [15.2] AI生成画像を検出する上で重要な課題の1つは、これまで目に見えない生成モデルによって作成された画像を見つけることである。
従来よりも大きく,多様である新しいデータセットを提案する。
得られたデータセットには、4803の異なるモデルからサンプリングされた2.7Mイメージが含まれている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:48:40 GMT)
A Survey of Physics-Informed AI for Complex Urban Systems [15.1] 都市における物理インフォームドAI手法の総合的なレビューを行う。
既存のアプローチは,3つのパラダイム – 物理集約型AI,物理AIハイブリッドアンサンブル,AI集約型物理 – に分類する。
本研究では,エネルギー,環境,経済,交通,情報,公共サービス,緊急管理,都市システムという8つの主要都市領域にまたがる応用について検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:19:14 GMT)
MapBERT: Bitwise Masked Modeling for Real-Time Semantic Mapping Generation [15.1] MapBERTは、目に見えない空間の分布をモデル化するために設計された新しいフレームワークである。
本研究では,MapBERTが最先端のセマンティックマップ生成を実現することを示す。
Gibsonベンチマークの実験では、MapBERTが最先端のセマンティックマップ生成を実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:55:55 GMT)
Dynamic Scheduling for Vehicle-to-Vehicle Communications Enhanced Federated Learning [14.9] 車両のエネルギー制約と移動性を考慮して,VFL訓練性能を最適化する最適化問題を定式化する。
本稿では,V2Vを拡張した動的スケジューリングアルゴリズムを提案する。
提案アルゴリズムは,CIFAR-10データセットの画像分類精度を4.20%向上し,Argoverse軌道予測データセットの平均変位誤差を9.82%削減する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:05:40 GMT)
Benchmarking Foundation Speech and Language Models for Alzheimer's Disease and Related Dementia Detection from Spontaneous Speech [14.9] アルツハイマー病と認知症は進行性神経変性疾患である。
自発音声には、非侵襲的なバイオマーカーとして機能する豊富な音響マーカーと言語マーカーが含まれている。
大規模オーディオまたはテキストデータに基づいて事前訓練された基礎モデルは、文脈的および音響的特徴を符号化した高次元埋め込みを生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:52:31 GMT)
Infinity Instruct: Scaling Instruction Selection and Synthesis to Enhance Language Models [14.9] Infinity-Instructは、大規模言語モデルの基本機能とチャット機能の両方を強化するために設計された高品質な命令データセットである。
我々は、Mistral、LLaMA、Qwen、Yiなどのオープンソースモデルを微調整して、Infinity-Instructを実証的に評価し、基礎的および命令的ベンチマークの両方でかなりの性能向上を観察する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:37:15 GMT)
StableMTL: Repurposing Latent Diffusion Models for Multi-Task Learning from Partially Annotated Synthetic Datasets [14.9] 部分学習のセットアップをゼロショット設定に拡張し、複数のデータセット上でマルチタスクモデルをトレーニングします。
我々の方法であるStableMTLは、遅延回帰のために画像生成装置を再利用する。
タスク毎の損失に対して、注意深いバランスを必要とするのではなく、統一された潜伏損失を採用し、より多くのタスクにシームレスなスケーリングを可能にします。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:59 GMT)
On Support Samples of Next Word Prediction [14.9] 本稿では,言語モデルにおけるデータ中心の解釈可能性について検討する。
代表者定理を用いて、特定の予測を促進または抑止する2種類の補足サンプルを同定する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:59:33 GMT)
Numerical Investigation of Sequence Modeling Theory using Controllable Memory Functions [14.8] 本稿では,異なる時系列モデルが時間構造を効果的に捉える方法を評価するための,合成ベンチマークフレームワークを提案する。
このアプローチのコアは、それぞれがメモリ機能と時間依存の強さを決定するパラメータによって特徴づけられる合成ターゲットを生成することである。
いくつかのシーケンスモデリングアーキテクチャの実験は、既存の理論的洞察を確認し、新しい発見を明らかにする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:50:59 GMT)
UA-Pose: Uncertainty-Aware 6D Object Pose Estimation and Online Object Completion with Partial References [14.8] 6次元オブジェクトポーズ推定とオンラインオブジェクト補完のための不確実性を考慮したアプローチであるUA-Poseを提案する。
ロボットと人間の手によって操作されたYCBオブジェクトのRGBDシーケンスを含む,YCB-Video,YCBInEOAT,HO3Dデータセットについて評価を行った。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:58:12 GMT)
Refusal-Feature-guided Teacher for Safe Finetuning via Data Filtering and Alignment Distillation [14.8] ユーザデータから有害なプロンプトをフィルタリングするRefusal-Feature-Guided Teacher (ReFT)を提案する。
微調整の間、ReFTモデルはユーザデータから有害なプロンプトをフィルタリングする教師として機能する。
我々の戦略は、有害な出力を効果的に最小化し、ユーザ固有のタスクの微調整精度を高める。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:10:51 GMT)
MCPWorld: A Unified Benchmarking Testbed for API, GUI, and Hybrid Computer Use Agents [14.7] MCPWorldは、API、GUI、API-GUIハイブリッドエージェントのための最初の自動CUAテストベッドである。
MCPWorldの鍵となる原則は、ソースコードが利用可能で必要に応じて修正・再コンパイルできる「ホワイトボックスアプリ」を使うことである。
MCPWorldには201の精巧なキュレーションと注釈付きユーザタスクが含まれており、多彩なユースケースと難易度をカバーしている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:50:33 GMT)
Adapter Naturally Serves as Decoupler for Cross-Domain Few-Shot Semantic Segmentation [14.7] 十分なサンプルを用いて、ソースドメインデータセット上でモデルを事前トレーニングするために、クロスドメイン小ショットセグメンテーション(CD-FSS)を提案する。
対象ドメイン上では、ターゲット固有の知識を学習するために、モデルを凍結し、DFNを微調整する。
提案手法は,CD-FSSの最先端手法を2.69%,MIoUが4.68%,1ショット・5ショット・シナリオでは2.68%に大きく上回っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:51:06 GMT)
Model Generalization on Text Attribute Graphs: Principles with Large Language Models [14.7] グラフ学習には大規模言語モデル(LLM)が導入されており、ラベル付きグラフデータが不足しているタスクにゼロショットの一般化の成功を拡大することを目的としている。
本研究では,タスク適応型埋め込みとグラフ情報集約機構を用いて,テキスト分散グラフ(TAG)の推論を行うフレームワークを開発する。
11の実世界のTAGベンチマークによる評価は、LLM-BPが既存のアプローチよりも大幅に優れていることを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:14:59 GMT)
Skywork R1V: Pioneering Multimodal Reasoning with Chain-of-Thought [14.6] 本稿では,R1系列のLarge Language Model (LLM) を拡張したマルチモーダル推論モデルであるSkywork R1Vを紹介する。
本稿では,反復監視ファインチューニング(SFT)とグループ相対政策最適化(GRPO)を組み合わせたハイブリッド最適化手法を提案する。
実験的な評価では、Skywork R1Vは38Bのパラメータしか持たず、MMMUベンチマークで69.0、MathVistaで67.5のスコアを得た。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:44:18 GMT)
Rethinking Crowd-Sourced Evaluation of Neuron Explanations [14.6] 低コストで高精度なクラウドソース評価戦略を開発する。
すべての入力でニューロンの活性化が説明できるかどうかを推定する。
また,クラウドソース評価におけるラベルノイズの分析を行った。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:53:55 GMT)
TreeReview: A Dynamic Tree of Questions Framework for Deep and Efficient LLM-based Scientific Peer Review [14.6] TreeReviewは、紙レビューを階層的で双方向の質問回答プロセスとしてモデル化する新しいフレームワークである。
ICLR と NeurIPS の会場から得られたベンチマークを構築し,本手法の完全なレビュー生成および実行可能なコメント生成タスクについて評価する。
実験結果から、TreeReviewは、包括的な、深い、専門家によるレビューフィードバックを提供することで、強力なベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:07:55 GMT)
GaRAGe: A Benchmark with Grounding Annotations for RAG Evaluation [14.5] GaRAGeは大規模なRAGベンチマークであり、人間によって計算された長文の回答と各接地パスのアノテーションがある。
我々のベンチマークには、複雑さ、ダイナミズム、トピックに関する2366の質問が含まれており、プライベートドキュメントセットとWebから取得した35K以上の注釈付きパスが含まれている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:47:03 GMT)
LLM Unlearning Should Be Form-Independent [14.2] 大言語モデル(LLM)は、モデル内の望ましくない知識を消去または抑制することを目的としている。
既存のアンラーニング手法の有効性は、トレーニングサンプルの形式に大きく依存する。
そこで我々は,新しいトレーニングフリー手法であるRanc-one Concept Redirection (ROCR) を有望なソリューションパスとして紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:21:25 GMT)
50 Years of Automated Face Recognition [14.2] 顔認識は、初歩的で手作りのシステムから高度なディープラーニングモデルへと進化してきた。
近年の進歩は、高品質の顔と低品質の顔のシナリオにおいて顕著な精度を実現している。
今後の顔認識研究における重要な課題と将来的な方向性について概説する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:47:23 GMT)
PIG: Physically-based Multi-Material Interaction with 3D Gaussians [14.1] PIG: 3次元ガウシアンとの物理的に基いた多元的相互作用は、3次元物体のセグメンテーションと高精度に相互作用する物体のシミュレーションを組み合わせた新しいアプローチである。
本手法は,映像品質の面では最先端技術(SOTA)よりも優れるだけでなく,物理的に現実的なシーン生成の分野での新たな方向やパイプラインも開放することを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:25:21 GMT)
Frequency-Adaptive Dilated Convolution for Semantic Segmentation [14.1] 本稿では、スペクトル分析の観点から、拡張畳み込みの個々の位相を改善するための3つの戦略を提案する。
周波数適応型拡張畳み込み(FADC)を導入し、局所周波数成分に基づいて空間的に拡散率を調整する。
2つのプラグインモジュールを設計し、有効帯域幅と受容フィールドサイズを直接的に拡張する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:30:05 GMT)
HSF: Defending against Jailbreak Attacks with Hidden State Filtering [14.0] 隠れ状態フィルタ(HSF)に基づくジェイルブレイク攻撃防御戦略を提案する。
HSFは、推論プロセスが始まる前に、モデルが相手の入力をプリエンプティブに識別し、拒否することを可能にする。
不正なユーザクエリに対する応答を最小限に抑えながら、Jailbreak攻撃の成功率を大幅に低下させる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:23:17 GMT)
When Style Breaks Safety: Defending Language Models Against Superficial Style Alignment [13.9] スタイルパターンを持つ悪意のあるクエリは、ほぼすべてのモデルに対するアタック成功率(ASR)を増大させる。
特定のスタイルで微調整することで、LDMは同じスタイルのジェイルブレイクに対してより脆弱になる。
そこで本研究では,少数の安全訓練データを組み込んだ防衛戦略であるSafeStyleを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:57:39 GMT)
ViVo: A Dataset for Volumetric Video Reconstruction and Compression [13.8] 本稿では,VolumetrIc VideO再構成と圧縮のための新しいデータセットViVoを提案する。
データセットは実世界のボリュームビデオ制作に忠実であり、多様性の定義を拡張する最初のデータセットである。
このデータベースの利用を実証するために,3つの最先端3次元再構成手法と2つのボリュームビデオ圧縮アルゴリズムをベンチマークした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:40:15 GMT)
Packet Header Recognition Utilizing an All-Optical Reservoir Based on Reinforcement-Learning-Optimized Double-Ring Resonator [13.7] 本稿では,統合二重リング共振器(DRR)をノードとする全光貯留層を提案する。
ディープ強化学習アルゴリズムはノードの遅延帯域幅積(DBP)を最大化するために用いられる。
3ビットおよび6ビットのパケットヘッダ認識タスクは、全光貯水池で実行される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:09:25 GMT)
SAM2Auto: Auto Annotation Using FLASH [13.6] VLM(Vision-Language Models)は、注釈付きデータセットの不足により、大規模言語モデルに遅れている。
SAM2Autoは、人間の介入やデータセット固有のトレーニングを必要としないビデオデータセットのための、最初の完全に自動化されたアノテーションパイプラインである。
本システムでは, 検出誤差を最小限に抑えつつ, ビデオシーケンス全体にわたって一貫した物体追跡を確実にするため, 統計的手法を用いている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:15:15 GMT)
Event-Priori-Based Vision-Language Model for Efficient Visual Understanding [13.5] Event-Priori-Based Vision-Language Model (EP-VLM)は、VLM推論効率を改善する。
EP-VLMはダイナミックイベントビジョンから派生した動作先をVLM効率を高めるために使用する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:45:35 GMT)
Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization [13.5] 戦略言語エージェントを構築するために,ゲーム理論の手法と微調整を組み合わせた反復的フレームワークであるLatent Space Policy Optimization (LSPO)を提案する。
Werewolfゲームの実験では、我々のエージェントは、性能を改善し、既存のWerewolfエージェントを上回るパフォーマンスで戦略空間を反復的に拡張している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:56:53 GMT)
Large Language Models for Multilingual Vulnerability Detection: How Far Are We? [13.3] 多言語脆弱性検出のための事前学習言語モデル(PLM)と大規模言語モデル(LLM)の有効性を評価する。
7つの言語にまたがる3万以上の現実世界の脆弱性修正パッチを使用して、機能レベルとラインレベルの両方でモデルパフォーマンスを評価します。
GPT-4oはインストラクションチューニングと数発のプロンプトによって強化され、他の評価モデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:27:49 GMT)
Structured Pruning for Diverse Best-of-N Reasoning Optimization [13.3] 本研究では,推論時に最適な頭部と層を動的に選択するコントラスト学習フレームワークであるSPRINTを提案する。
質問の埋め込みとヘッドの埋め込みを合わせることで、SPRINTはより正確な推論をもたらす、刈り取られた頭の設定を識別する。
提案手法は,MATH500およびGSM8Kデータセットにおいて,従来のベスト・オブ・N$およびランダムな頭部選択戦略を著しく上回っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:15:05 GMT)
Moment Alignment: Unifying Gradient and Hessian Matching for Domain Generalization [13.0] ドメイン一般化(DG)は、目に見えないターゲットドメインによく一般化するモデルの開発を目指している。
DGにおける研究の1行は、一般化を強化するためにドメインレベルの勾配とヘッセンの整合性に焦点を当てている。
textbfClosed-Form textbfMoment textbfAlignment (CMA)を導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:51:36 GMT)
PARF: An Adaptive Abstraction-Strategy Tuner for Static Analysis [12.8] Parfは静的プログラムアナライザの抽象化戦略を適応的にチューニングするためのツールキットである。
これはCプログラムのオープンソース静的アナライザであるFrama-C/Eva上に実装されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:30:10 GMT)
ChemAgent: Enhancing LLMs for Chemistry and Materials Science through Tree-Search Based Tool Learning [12.7] 大規模言語モデル(LLM)は、最近化学タスクにおいて有望な能力を実証した。
本稿では,基本的な情報検索から複雑な反応予測まで,137種類の外部化学ツールを統合したLCMエージェントを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:41:39 GMT)
Enhancing Adversarial Robustness with Conformal Prediction: A Framework for Guaranteed Model Reliability [12.7] 本研究は, コンフォーマル予測の原理を活かして, 対人訓練を推し進める。
我々は,共形予測の効率を抑えるために,OPSA(Optimal Size Attack)と呼ばれる敵攻撃法を開発した。
OPSA-AT(Adversarial Training)は,OPSAを新たなコンフォーマルトレーニングパラダイムに統合する防衛戦略である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:33:28 GMT)
BEYOND DIALOGUE: A Profile-Dialogue Alignment Framework Towards General Role-Playing Language Model [12.6] 大規模言語モデル(LLM)の急速な進歩はロールプレイングに革命をもたらし、一般的なロールプレイングモデルの開発を可能にした。
現在のロールプレイングトレーニングには2つの大きな問題がある: (I) 特定のシナリオに対する対話トレーニングを促すために事前に定義されたロールプロファイルを使用することで、対話とプロファイルの間に矛盾や矛盾が生じ、トレーニングバイアスが生じる。
我々はこれらのハードルを克服するために、DIALOGUEと呼ばれるシンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:26:33 GMT)
We Are AI: Taking Control of Technology [12.5] We are AI: Takeing Control of Technology”は、ピアラーニングの場において、AIとAIのトピックを一般の聴衆にもたらす公立の教育コースである。
コースの開発の背景にある目標を概説し、その作成を形作った複数年間の反復プロセスについて議論し、その内容を要約する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:18:08 GMT)
Flattery, Fluff, and Fog: Diagnosing and Mitigating Idiosyncratic Biases in Preference Models [12.4] 言語モデルは、アライメントと評価において人間の嗜好判断のためのプロキシとして機能する。
それらは体系的な誤校正を示し、実質的な品質よりも表面的なパターンを優先する。
このバイアスは長さ、構造、スタイルといった機能への過度な依存として現れ、報酬のハッキングや信頼できない評価といった問題につながります。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:10:17 GMT)
Explore the vulnerability of black-box models via diffusion models [12.4] 本研究では,アタッカーが拡散モデルAPIを利用して合成画像を生成するという,新たなセキュリティ脅威を明らかにする。
これにより、攻撃者はブラックボックス分類モデルに対するモデル抽出と転送ベースの敵攻撃を実行することができる。
本手法は,クエリ予算の0.01倍しか使用せず,最先端の手法よりも平均27.37%向上していることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:36:31 GMT)
FedX: Adaptive Model Decomposition and Quantization for IoT Federated Learning [12.3] フェデレートラーニング(FL)は、データ共有なしで複数のデバイス間で協調的なトレーニングを可能にする。
本稿では,IoTのための新しい適応モデル分解および量子化FLシステムであるFedXを提案する。
また,FedXの量子化時間は最大8.43倍,デバイス上での計算時間は1.5倍,エンド・ツー・エンドでの学習時間はベースラインFLシステムに比べて1.36倍に向上した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:06:57 GMT)
How to Mitigate Information Loss in Knowledge Graphs for GraphRAG: Leveraging Triple Context Restoration and Query-Driven Feedback [12.3] 本稿では,Triple Context RestorationとQuery-driven Feedbackフレームワークを提案する。
情報損失を軽減するために、各トリプルの基盤となるテキストコンテキストを再構築する。
Exact Matchの29.1%の改善とF1の15.5%の改善を実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:44:25 GMT)
Clock Synchronization for Drone-Based Entanglement Quantum Key Distribution [12.2] ドローンベースの絡み合い分布は、動的環境における量子鍵分布(QKD)を可能にする量子ネットワークの完全なカバレッジを提供する。
我々のプロトコルはドローンによる絡み合いの分布を可能にし、広帯域およびローカル領域の量子インターネットのシームレスな精度を実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:54:12 GMT)
NOVA3D: Normal Aligned Video Diffusion Model for Single Image to 3D Generation [12.2] 革新的な単一画像から3D生成フレームワークであるNOVA3Dを紹介する。
私たちの重要な洞察は、事前訓練されたビデオ拡散モデルから、強力な3Dプリエントを活用することです。
色と幾何学的領域間の情報交換を容易にするため,GTA(Geometry-Temporal Alignment)アテンション機構を提案する。
また,マルチビュー不正確な問題に対処することで,テクスチャの忠実度を向上させるデコンフリクト幾何融合アルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:37:46 GMT)
EmoVOCA: Speech-Driven Emotional 3D Talking Heads [12.2] EmoVOCAと呼ばれる合成データセットを作成するための革新的なデータ駆動手法を提案する。
次に,3次元顔,音声ファイル,感情ラベル,強度値を入力として受け入れる感情的3次元音声ヘッドジェネレータを設計,訓練し,顔の表情特性で音声同期唇の動きをアニメーション化することを学ぶ。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:06:34 GMT)
Nonparametric Modern Hopfield Models [12.2] 深層学習互換ホップフィールドモデルに対する非パラメトリック解釈を提案する。
我々の重要な貢献は、現代のホップフィールドモデルにおけるメモリストレージと検索プロセスの解釈に起因している。
サブクワッドラティックな複雑性を持つテクスチャパース構造を持つ現代ホップフィールドモデルを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:41:40 GMT)
Seeing Voices: Generating A-Roll Video from Audio with Mirage [12.2] ビデオ生成への現在のアプローチは、音声を無視して汎用的だがサイレントな画像シーケンス生成に焦点を当てている。
音声入力が与えられたスクラッチからリアルで表現力のある出力画像を生成するのに優れるオーディオ・ビデオ基盤モデルであるMirageを紹介する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:56:02 GMT)
Fine-grained Hierarchical Crop Type Classification from Integrated Hyperspectral EnMAP Data and Multispectral Sentinel-2 Time Series: A Large-scale Dataset and Dual-stream Transformer Method [12.0] 細粒度作物型分類は大規模作物マッピングの基礎となる。
これらの2つのモダリティを組み合わせた研究は、ハイパースペクトルデータ取得と作物型アノテーションコストの課題により、依然として少ない。
本研究では,30m分解能EnMAPハイパースペクトルデータとSentinel-2時系列を統合することで,階層型ハイパースペクトルデータ(H2Crop)を構築する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:30:14 GMT)
PairEdit: Learning Semantic Variations for Exemplar-based Image Editing [12.0] PairEditは、限られた画像対や単一の画像対から複雑な編集セマンティクスを学習するための新しいビジュアル編集手法である。
誘導方向項を用いて、ペア画像内の意味的変動を明示的にモデル化するターゲットノイズ予測を提案する。
また,コンテンツから意味変化の学習を遠ざけるために,異なるLoRAを最適化することを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:57:15 GMT)
FedGA-Tree: Federated Decision Tree using Genetic Algorithm [12.0] 遺伝的アルゴリズムを導入し、パーソナライズされた決定木の構築を容易にする。
本手法は,ローカルデータとベンチマークアルゴリズムのみで訓練された決定木を超越した手法である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:39:22 GMT)
OpenDance: Multimodal Controllable 3D Dance Generation Using Large-scale Internet Data [11.9] OpenDance5Dは、14の異なるジャンルにわたる101時間以上の人間のダンスデータセットです。
それぞれのサンプルには、RGBビデオ、オーディオ、2Dキーポイント、3Dモーション、そして人間の芸術作品の細かい記述など、堅牢なクロスモーダル学習を促進するための5つのモダリティがある。
音楽に条件付けされた制御可能なダンス生成のための統一的なモデリングフレームワークOpenDanceNetと、テキストプロンプト、キーポイント、文字位置決めの任意の組み合わせを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:05:13 GMT)
Fractional-order Jacobian Matrix Differentiation and Its Application in Artificial Neural Networks [11.8] 本稿では,自動微分(Autograd)技術と完全に互換性のある分数次行列微分計算法を提案する。
線形加群と分数次微分に基づいて、隠れ層における分数次微分の利用を可能にする分数次オートグレード技術を設計する。
深層学習の分野では優れた分数次勾配降下法であることが証明された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:04:08 GMT)
DeRAGEC: Denoising Named Entity Candidates with Synthetic Rationale for ASR Error Correction [11.8] 本稿では、自動音声認識(ASR)システムにおいて、名前付きエンティティ(NE)補正を改善する方法であるDeRAGECを提案する。
Retrieval-Augmented Generative Error Correction (RAGEC) フレームワークを拡張することで、DeRAGECは、ノイズの多いNE候補を修正前にフィルタリングするために、合成 denoising rationals を採用する。
CommonVoiceとSTOPデータセットの実験結果から,ワードエラー率(WER)とNEヒット率に大きな改善が見られた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:37:50 GMT)
DEBATE: A Dataset for Disentangling Textual Ambiguity in Mandarin Through Speech [11.8] 本稿では,中国独自の音声テキストデータセットであるDEBATEについて述べる。
10人の母語話者によって記録された1,001の丁寧に選択されたあいまいな発話を含んでいる。
我々は、機械と人間の発話意図の理解の間には、明確で大きなパフォーマンスギャップがあることを示す、最先端の3つの大規模音声および音声言語モデルをベンチマークする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:27:22 GMT)
Play to Generalize: Learning to Reason Through Game Play [11.8] そこで我々は,MLLMがアーケード的なゲームによってマルチモーダル推論のドメイン外一般化を開発する,新たな学習パラダイムであるVisual Game Learningを提案する。
ルールベースのゲームは、制御可能でスケーラブルなプレテキストタスクとして機能する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:57 GMT)
Info-Coevolution: An Efficient Framework for Data Model Coevolution [11.8] モデルとデータをバイアスのないオンライン選択アノテーションで共進化させる新しいフレームワークを提案する。
ImageNet-1Kのような現実世界のデータセットでは、Info-Coevolutionはアノテーションとトレーニングコストをパフォーマンス損失なく32%削減する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:04:11 GMT)
Adversaries With Incentives: A Strategic Alternative to Adversarial Robustness [11.7] 敵の訓練は、あらゆる意味で予測性能を損なうことが唯一の目的である敵に対して防御することを目的としている。
対戦相手を,分類者に対して直接取り組むのではなく,単に自身の目標を追求するものとしてモデル化することを提案する。
我々は、相手のインセンティブに関する穏やかな知識がいかに有用であるかを示す一連の実験を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:28:26 GMT)
GRE Suite: Geo-localization Inference via Fine-Tuned Vision-Language Models and Enhanced Reasoning Chains [11.7] Geo Reason Enhancement (GRE) Suiteは、解釈可能な位置推論のための構造化推論チェーンを備えたビジュアル言語モデルを拡張する新しいフレームワークである。
まず、GRE30Kという、きめ細かい視覚的・文脈的分析を容易にするために設計された高品質なジオローカライゼーション推論データセットを紹介する。
次に,シーン属性,局所的詳細,意味的特徴を段階的に推測する多段階推論手法を用いて,GREモデルを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:46:33 GMT)
Calibrated Value-Aware Model Learning with Probabilistic Environment Models [11.6] 我々は、人気の高いMuZero損失を含む、価値認識モデル学習損失の家系を分析した。
これらの損失は、通常用いられるように、無調整の代理損失であり、必ずしも正しいモデルと値関数を回復しないことを意味する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:24:44 GMT)
Worst-Case Symbolic Constraints Analysis and Generalisation with Large Language Models [11.6] 大規模言語モデル(LLM)は、コード生成、補完、修復など、様々なコーディングタスクにうまく適用されている。
本稿では,プログラムにおける最悪のケース実行をシンボリック制約解析により推論するLLMの能力について検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:33:30 GMT)
Zero-Shot Event Causality Identification via Multi-source Evidence Fuzzy Aggregation with Large Language Models [11.5] 事象因果同定(ECI)は、テキストコンテキストにおける事象間の因果関係を検出することを目的としている。
既存のECIモデルは、主に管理された方法論に依存しており、大規模な注釈付きデータに依存している。
本稿では,Multi-source Evidence Fuzzy Aggregationに基づく新しいゼロショットフレームワークMEFAを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:04:44 GMT)
Attacking Attention of Foundation Models Disrupts Downstream Tasks [11.5] ファンデーションモデルは大規模なモデルであり、多くの下流タスクで高い精度を提供する広範囲なデータに基づいて訓練されている。
これらのモデルは敵の攻撃に弱い。
本稿では,CLIP と ViT に着目した視覚基盤モデルの脆弱性について検討する。
タスクに依存しない方法でトランスフォーマーアーキテクチャの構造をターゲットとした,新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:05:05 GMT)
PID: Physics-Informed Diffusion Model for Infrared Image Generation [11.4] 赤外線イメージング技術は、低視認性条件下での信頼性の高いセンシング能力に大きな注目を集めている。
既存の画像翻訳法の多くは、赤外線画像は、基礎となる物理法則を無視して、スタイリスティックなバリエーションとして扱う。
物理法則に従う赤外線画像にRGB画像を変換するための物理情報拡散(PID)モデルを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:35:16 GMT)
Accelerating Constrained Sampling: A Large Deviations Approach [11.4] 本研究は, SRNLD の長期挙動に着目し, RLD にスキュー対称行列を付加する。
本研究では, SRNLD は, このスキュー対称行列を選択することで, RLD と比較して目標分布への収束を加速できることを示す。
提案したスキュー対称行列に基づくSRNLMCの数値実験により,優れた性能を示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:44:39 GMT)
DINO-CoDT: Multi-class Collaborative Detection and Tracking with Vision Foundation Models [11.3] 道路利用者を対象とした多クラス協調検出・追跡フレームワークを提案する。
まず,大域的空間注意融合(GSAF)モジュールを用いた検出器を提案する。
次に,視覚基盤モデルを用いた視覚的セマンティクスを活用し,IDSW(ID SWitch)エラーを効果的に低減するトラックレットRe-IDentification(REID)モジュールを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:49:10 GMT)
On the Complexity of Winner Determination and Strategic Control in Conditional Approval Voting [11.2] 条件最小 (Conditional Minisum, CMS) は、優先的な依存関係を持つ多問題選挙の投票規則である。
我々は,CMSを表現性と計算効率の良好なトレードオフを実現するソリューションとみなすことができることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:23:33 GMT)
Towards Large Language Models with Self-Consistent Natural Language Explanations [11.1] 大きな言語モデル(LLM)は、解釈容易なパスを提供するようだ。
しかし、研究によると、これらのポストホックな説明は真の決定過程を誤って表現していることが多い。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:06:33 GMT)
Numerical Analysis of HiPPO-LegS ODE for Deep State Space Models [11.1] ディープラーニングにおいて、最近導入された状態空間モデルは、HiPPOメモリユニットを使用して入力関数の連続時間軌道を近似する。
これらの手法は、長い入力シーケンスで長距離依存関係をキャプチャする実験的な成功を示している。
しかし、これらのODEの数学的基礎、特に特異な HiPPO-LegS (Legendre Scaled) ODE とその対応する数値離散化は未解決のままである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:37:45 GMT)
Selective Matching Losses -- Not All Scores Are Created Equal [11.0] 我々は、スコア領域上のリンク関数の増大を設計して、選択的なマッチング損失関数を構築する。
リンクは、損失感度をスコアの関数として定義し、平坦なものよりも高い傾斜高感度領域を強調する。
標準的なSoftmax関数の制限を克服するが、これは分類には適しているが、隣り合うスコアの区別には向いていない。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:06:48 GMT)
Constrained Pareto Set Identification with Bandit Feedback [11.0] 意味不明の$Kの武器が与えられた場合、平均が他の腕よりも一様でない腕のセットを特定することが目的である。
我々は固定信頼度同定に重点を置いており、レースのようなアルゴリズムを著しく上回るアルゴリズムを導入している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:29:28 GMT)
Missing Data Imputation by Reducing Mutual Information with Rectified Flows [10.9] 本稿では,データとそれに対応するマスクの相互情報を逐次低減する,新しいデータ計算手法を提案する。
提案アルゴリズムは, インプットされたデータの結合分布とマスクの欠落とのKLのばらつきを反復的に最小化する。
この枠組みの下での最適計算は、流速場が整流学習目標を最小化するODEの解法に対応していることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:46:35 GMT)
Diffuse Everything: Multimodal Diffusion Models on Arbitrary State Spaces [10.9] 任意の状態空間上に多モード拡散モデルを構築するための新しいフレームワークを提案する。
各モードに対して革新的な分離ノイズスケジュールを導入することにより、単一モデル内で非条件とモード条件の両方を同時に生成することが可能となる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:20:20 GMT)
Parameter-Efficient Fine-Tuning of State Space Models [10.8] Deep State Space Models (SSM) は、言語モデリングの強力なツールとなり、シーケンス長で高いパフォーマンスと線形スケーラビリティを提供する。
本稿では,パラメータ効率のよい微調整法(PEFT)のSSMモデルへの適用について検討する。
SSMモジュールに適したPEFT法であるスパース次元チューニング(SDT)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:07:50 GMT)
RSNet: A Light Framework for The Detection of SAR Ship Detection [10.7] RSNetは、SAR画像における船舶検出を強化する軽量フレームワークである。
Waveletpool-ContextGuided (WCG)は、グローバルなコンテキスト理解を導くバックボーンである。
ウェーブレットプール・スターフュージョン (WSF) は、残っているウェーブレット要素の乗算構造を用いてネックとして導入された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:05:24 GMT)
F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation [10.7] F2Netは、UHR画像を特殊な処理のために高周波数成分と低周波数成分に分解する周波数認識フレームワークである。
ハイブリッド周波数融合モジュールは、2つの新しい目的によって導かれるこれらの観測を統合する。
F2Netは、それぞれ80.22のmIoUと83.39の最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:09:49 GMT)
Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch [10.6] Twitchの自動モデレーションツール(texttAutoMod$)の監査を実施し、ヘイトフルコンテンツのフラグ付けの有効性を調査します。
我々は、誤用、人種差別、能力主義、ホモフォビアを含むあからさまに憎しみのあるコンテンツをフラグ付けする$textttAutoMod$の精度を測定した。
実験の結果、いくつかのデータセットで最大94%のヘイトフルなメッセージが、モデレーション信号としてslursに依存していることが判明した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:39:39 GMT)
RainFusion: Adaptive Video Generation Acceleration via Multi-Dimensional Visual Redundancy [10.5] RainFusionは、ビデオ品質を保ちながら注意計算を加速するために、視覚データに固有の空間性を利用する。
提案するbf RainFusionは,最先端の3D動画生成モデルにシームレスに統合可能なプラグアンドプレイ方式である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:33:40 GMT)
Developer Perspectives on Licensing and Copyright Issues Arising from Generative AI for Software Development [10.5] コーディングのためのGenAIのライセンスと著作権に関する574人の開発者を対象に調査を行った。
我々の結果は、開発者がGenAIから得られるメリット、AI生成コードの使用を、他の既存のコードとよく似たものとみなす方法を示している。
私たちは、技術がどのように使われているのか、ステークホルダーが解決したいことについて、貴重な洞察を提供しています。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:48:14 GMT)
SAFEFLOW: A Principled Protocol for Trustworthy and Transactional Autonomous Agent Systems [10.4] 大規模言語モデル(LLM)や視覚言語モデル(VLM)の最近の進歩は、複雑な推論とマルチモーダルツールの使用が可能な強力な自律エージェントを可能にしている。
能力の増大にもかかわらず、今日のエージェントフレームワークは脆弱であり、セキュアな情報フロー、信頼性、マルチエージェント調整のための原則的なメカニズムが欠如している。
SAFEFLOWは信頼性の高いLDM/VLMベースのエージェントを構築するための新しいプロトコルレベルフレームワークである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:04:37 GMT)
BiMa: Towards Biases Mitigation for Text-Video Retrieval via Scene Element Guidance [10.3] BiMaは、視覚的およびテキスト的表現のバイアスを軽減するために設計された新しいフレームワークである。
視覚障害者には、これらのシーン要素をビデオ埋め込みに統合し、きめ細かな細部と細部を強調できるようにします。
テキストの偏りを解消するために,テキスト特徴をコンテンツやバイアス成分に分解する機構を導入し,意味のあるコンテンツに集中できるようにする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:11:06 GMT)
Difference Inversion: Interpolate and Isolate the Difference with Token Consistency for Image Analogy Generation [10.2] 本稿では, A と A' の差のみを分離し,それを B に適用して可塑性 B' を生成する差分反転法を提案する。
実験により、差分反転は既存のベースラインを定量的にも質的にも上回ることを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:34:47 GMT)
HieraEdgeNet: A Multi-Scale Edge-Enhanced Framework for Automated Pollen Recognition [10.2] 自動花粉認識のためのマルチスケールエッジエンハンスメントフレームワークであるHieraEdgeNetを紹介する。
フレームワークの中核となる革新は3つの相乗的モジュールの導入である。
大規模なデータセットでは、HieraEdgeNetは平均平均精度(mAP@.5)が0.9501に達し、最先端のベースラインモデルを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:03:31 GMT)
Decentralizing Multi-Agent Reinforcement Learning with Temporal Causal Information [10.1] 我々はエージェントに高度な記号的知識を提供することが、この設定のユニークな課題にどのように対処できるかを研究する。
特に、ローカルポリシーとチームタスクの互換性を確認するのに使用されるフォーマルなツールを拡張します。
DMARLにおける事象の時間的進化に関する記号的知識は,DMARLの学習過程を著しく向上させることができることを実証的に実証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:53:03 GMT)
Scalable Vision Language Model Training via High Quality Data Curation [10.1] 本稿では,2Bパラメータと8BパラメータでSOTA(State-of-the-art)性能を実現するための,オープンソースのビジョン言語モデル(VLM)シリーズを紹介する。
以下の3つの重要な改善は、SAIL-VLの主要なパフォーマンスに貢献している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:56:55 GMT)
Reliably detecting model failures in deployment without labels [10.0] 本稿では,デプロイ後劣化(PDD)モニタリングの問題点を定式化し,対処する。
本稿では,予測モデルの相違に基づく,実用的で効率的なモニタリングアルゴリズムD3Mを提案する。
標準ベンチマークと実世界の大規模内科データセットによる実証的な結果から,フレームワークの有効性が示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:57:42 GMT)
CoCoA-Mix: Confusion-and-Confidence-Aware Mixture Model for Context Optimization [9.9] 本稿では,混乱したクラス間の決定境界を精査することにより,特殊化を改善する混乱認識損失(CoA-loss)を提案する。
数学的には、混合モデルが特殊化を損なうことなく一般化を促進できることを実証する。
CoA-lossとCoA-weightsの混合モデルであるCoCoA-Mixは、特殊化と一般化を強化して最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:04:47 GMT)
Skywork-VL Reward: An Effective Reward Model for Multimodal Understanding and Reasoning [9.8] 実験により、Skywork-VL RewardはマルチモーダルVL-RewardBenchの最先端結果が得られることが示された。
この結果から,Skywork-VL Rewardは多モードアライメントのための汎用かつ信頼性の高い報酬モデルへの大きな進歩と評価された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:46:47 GMT)
Subgraph-Oriented Testing for Deep Learning Libraries [9.8] 我々は,異なるハードウェアプラットフォーム上でディープラーニング(DL)ライブラリをテストするためのSORT(Subgraph-Oriented Realistic Testing)を提案する。
SORTは、テスト対象として、しばしばモデルグラフのサブグラフとして表現される、人気のあるAPIインタラクションパターンを採用している。
SORTは100%有効な入力生成率を実現し、既存のメソッドよりも精度の高いバグを検出し、シングルAPIテストで欠落したインタラクション関連のバグを明らかにする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:19:59 GMT)
HeTa: Relation-wise Heterogeneous Graph Foundation Attack Model [9.8] 不均一グラフニューラルネットワーク(HGNN)は脆弱性があり、堅牢性を評価し、セキュリティを確保するために、適切な攻撃の必要性を強調している。
近年,基礎モデルはグラフニューラルネットワークの一般化のための新たな地平を開拓している。
本稿では,新たな関係性を考慮したヘテロジニアスグラフ基盤攻撃モデルHeTaを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:59:14 GMT)
Geometrical Properties of Text Token Embeddings for Strong Semantic Binding in Text-to-Image Generation [9.7] 我々は、強力なセマンティックバインディングのためのトレーニング不要なテキスト埋め込み対応T2IフレームワークtextbfTokeBiを提案する。
TokeBiは、NP間のCAマップを識別するCausality-Aware Projection-Out(CAPO)と、NP間の分離を強化するAdaptive Token Mixing(ATM)で構成されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:09:12 GMT)
Through the Valley: Path to Effective Long CoT Training for Small Language Models [9.7] ロングチェーン・オブ・思想(CoT)の監督は、言語モデルにおける推論を強化する共通の戦略となっている。
私たちはLong CoT Degradationと呼ぶ現象を特定し、小さな言語モデル(SLM)が限られた長いCoTデータでトレーニングされた場合、性能が著しく低下する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:56:41 GMT)
Plug-in and Fine-tuning: Bridging the Gap between Small Language Models and Large Language Models [9.5] 大規模言語モデル(LLM)は、その広範な言語知識と強力な一般化能力で有名である。
小型言語モデル (SLM) は計算効率が高いが、LLMの広範な一般化能力に欠けることが多い。
我々は,LLMとSLMの長所を組み合わせ,高い性能を実現する新しいフレームワークであるPiFiを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:45:13 GMT)
IntenTest: Stress Testing for Intent Integrity in API-Calling LLM Agents [9.5] LLMエージェントの意図的整合性違反を明らかにするための,API中心のストレステストフレームワークであるIntenTestを紹介した。
IntenTestはツールキットのドキュメンテーションに基づいて現実的なタスクを生成し、ターゲットの突然変異を適用して微妙なエージェントエラーを露呈する。
IntenTestは、意図的整合性違反を効果的に発見し、エラー検出率とクエリ効率の両方において、ベースラインを著しく上回ります。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:09:08 GMT)
R-FORCE: Robust Learning for Random Recurrent Neural Networks [9.4] RRNNのロバスト性を高めるためのロバストトレーニング手法を提案する。
FORCE学習アプローチは、目標学習の課題にも適用可能であることが示された。
実験の結果,R-FORCEはより広範囲のRRNNに対して,より安定かつ正確な目標学習を促進することが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:30:54 GMT)
MedChat: A Multi-Agent Framework for Multimodal Diagnosis with Large Language Models [9.4] 緑内障検出と大言語モデル(LLM)の統合は、眼科医の不足を軽減するための自動戦略である。
一般的なLLMを医用画像に適用することは、幻覚、限定的な解釈可能性、ドメイン固有の医療知識の不足により、依然として困難である。
我々は、特殊視モデルと複数のロール固有のLLMエージェントを組み合わせたマルチエージェント診断フレームワークとプラットフォームであるMedChatを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:51:18 GMT)
HAIBU-ReMUD: Reasoning Multimodal Ultrasound Dataset and Model Bridging to General Specific Domains [9.4] 本稿では、ドメイン四重項を生成するための教師付き微調整データ生成パイプラインを提案する。
医用超音波領域データセットReMUDが確立され、45,000以上の推論と非推論による微調整質問回答(QA)と視覚質問回答(VQA)データを含む。
Qwen2.5-VL-7B-インストラクトを微調整したReMUD-7Bモデルは、医用超音波分野での一般領域MLLMよりも優れている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:01:38 GMT)
Self-Cascaded Diffusion Models for Arbitrary-Scale Image Super-Resolution [9.3] 任意スケール画像超解像のための自己カスケード拡散フレームワークCasArbiを提案する。
座標誘導残差拡散モデルにより連続画像表現の学習が可能となる。
私たちの実験では、CasArbiは知覚と歪みの両方のパフォーマンス指標において、先行技術よりも優れています。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:43:21 GMT)
Reason-to-Recommend: Using Interaction-of-Thought Reasoning to Enhance LLM Recommendation [9.3] $textbfR2Rec$は推論強化レコメンデーションフレームワークである。
ユーザアイコングラフからインタラクションチェーンをサンプリングし、それらを構造化されたインタラクション・オブ・思想に変換する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:08:12 GMT)
Exploring Microstructural Dynamics in Cryptocurrency Limit Order Books: Better Inputs Matter More Than Stacking Another Hidden Layer [9.2] ニューラルネットワークに余分な隠蔽層やパラメータを追加することで、短期的な価格予測が真に向上するかどうかを検討することを目的としている。
我々は,BTC/USDT LOBスナップショットを100ミリ秒から複数秒間隔で公開して,解釈可能なベースライン,ロジスティック回帰,XGBoostからディープアーキテクチャ(DeepLOB,Conv1D+LSTM)まで,モデルをベンチマークする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:37:07 GMT)
Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures [9.2] インテリジェントトランスポーテーションシステム(ITS)の複雑さは、エッジサーバ、車両ノード、UAVなどの外部インフラストラクチャへの計算オフロードに大きな関心を惹き付けている。
深部強化学習(DRL)による車両エッジコンピューティング(VEC)用オフロードの最近の進歩
学習パラダイム(シングルエージェント、マルチエージェントなど)、システムアーキテクチャ(集中型、分散型、階層型)、最適化目標(レイテンシ、エネルギー、公正性など)に基づいて、既存の作業の分類と比較を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:49:16 GMT)
GradEscape: A Gradient-Based Evader Against AI-Generated Text Detectors [9.2] 我々は、AIGT(AI- generated text)検出器を攻撃するために設計された最初の勾配ベースの回避器であるGradEscapeを紹介する。
GradEscapeは、検出器入力のための重み付き埋め込みを構築することで、テキストの離散性に起因する微分不可能な計算問題を克服する。
次に、被害者検知器からのフィードバックを使って、イーバーモデルパラメータを更新し、最小限のテキスト修正で高い攻撃成功を達成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:56:42 GMT)
A Framework for Creating Non-Regressive Test Cases via Branch Consistency Analysis Driven by Descriptions [9.1] DISTINCT は Description-guided, branch-consistency analysis framework である。
LLM(Large Language Model)ベースのジェネレータを障害対応テストジェネレータに変換する。
コンパイル成功率(CSR)が14.64%、通過率(PR)が6.66%の平均的な改善を実現している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:05:48 GMT)
Language-Vision Planner and Executor for Text-to-Visual Reasoning [9.1] 本稿では,容易に理解可能なスクリプトで段階的に視覚的推論計画を作成し,各ステップをリアルタイムで実行することができるAIシステムを提案する。
本稿では,視覚的推論のための大規模言語モデル (LLM) の開発に触発されて,容易に理解可能なスクリプトで段階的に視覚的推論計画を作成し,計画の各ステップをリアルタイムで実行可能なAIシステム VLAgent を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:55:55 GMT)
A Diffusion-Driven Temporal Super-Resolution and Spatial Consistency Enhancement Framework for 4D MRI imaging [9.0] 医用画像では、4D MRIはダイナミックな3D可視化を可能にするが、空間分解能と時間分解能のトレードオフはスキャン時間の延長を必要とする。
伝統的なアプローチは一般的に中間フレームを生成するために登録ベースに依存している。
空間整合性を維持しつつ中間フレームを生成する新しいフレームワークTSSC-Netを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:39:48 GMT)
Scalar Particles on embedded submanifolds [9.0] 我々は、拘束されたスピンレス粒子の運動を記述するために、曲線多様体上のクライン=ゴルドン方程式とシュル「オーディンガー方程式を導出した。
我々の結果には幾何誘導電位が現れる。
ある特定の場合において、本手法は純粋幾何学的帰納法により下次元多様体上のスカラー場の質量項を導出した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:56:26 GMT)
Tree-Sliced Wasserstein Distance with Nonlinear Projection [9.0] ツリースライス法は、伝統的なスライスド・ワッサースタイン距離(SW)の代替として登場した。
本稿では,ツリースライク・ワッサースタイン距離(TSW)に対する新しい非線形射影フレームワークを提案し,以前のバージョンにおける線形射影を一般射影に置き換える。
提案手法をユークリッドおよび球面データセットの広範な数値実験により検証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:00:36 GMT)
Memory Allocation in Resource-Constrained Reinforcement Learning [8.9] リソースの制約は、学習と意思決定の両方を根本的に変えることができます。
標準的な強化学習アルゴリズムを用いて、未知環境をナビゲートする際のメモリ制約がエージェントの性能に与える影響について検討する。
特に、メモリ制限されたエージェントはジレンマに直面している:そのモデルを使用して計画を作成するのとは対照的に、そのエージェントの内部プロセス、例えば世界モデルを見積もるなど、そのエージェントの内部プロセスに制限されたメモリのどのくらいを割り当てるべきか?
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:15:37 GMT)
Speaker-Distinguishable CTC: Learning Speaker Distinction Using CTC for Multi-Talker Speech Recognition [8.8] 本稿では,補助情報を必要としない多話者自動音声認識のための新しい枠組みを提案する。
Speaker-Distinguishable CTC (SD-CTC) は、CTCの拡張であり、トークンとその対応する話者ラベルを各フレームに共同割り当てる。
SD-CTCとSOTを用いたマルチタスク学習は,SOTモデルの誤り率を26%削減し,補助情報に依存する最先端手法に匹敵する性能を実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:43:43 GMT)
Gungnir: Exploiting Stylistic Features in Images for Backdoor Attacks on Diffusion Models [8.7] 拡散モデル(DM)はバックドア攻撃に対して脆弱である。
Gungnirは、入力画像内のスタイルトリガを通じて、攻撃者がDMのバックドアをアクティベートできる新しい方法である。
本手法は,クリーン画像と知覚的に区別できないトリガー埋め込み画像を生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:23:33 GMT)
Continuous Policy and Value Iteration for Stochastic Control Problems and Its Convergence [8.7] 本稿では,制御問題の値関数と最適制御の近似をLangevin型力学を用いて同時に更新する連続ポリシー反復アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:20:21 GMT)
SEED: Enhancing Text-to-SQL Performance and Practical Usability Through Automatic Evidence Generation [8.6] State-of-the-the-art text-to-sql studyはBIRDデータセットに依存しており、証拠が質問と共に提供されると仮定している。
実世界のシナリオにおける性能向上と実用性向上のためのエビデンスを自動生成するSEEDを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:44:31 GMT)
An end-to-end attention-based approach for learning on graphs [8.6] グラフ上で学習するためのトランスフォーマーベースのアーキテクチャは、効果的な学習メカニズムとして注目によって動機付けられている。
本稿では,エンコーダとアテンションプーリング機構を組み合わせた,純粋に注意に基づくアプローチを提案する。
その単純さにもかかわらず、このアプローチは微調整されたメッセージパッシングベースラインよりも優れており、最近70以上のノードとグラフレベルのタスクでトランスフォーマーベースのメソッドが提案されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:24:10 GMT)
PrunePEFT: Iterative Hybrid Pruning for Parameter-Efficient Fine-tuning of LLMs [8.5] PEFT(Efficient Fine-Tuning)法は、訓練済み言語モデルにおいて、効率的かつ有望なアプローチとして登場した。
本稿では,PEFT 戦略探索をプルーニング問題として定式化する新しい手法 PrunePEFT を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:32:58 GMT)
Aligning Text, Images, and 3D Structure Token-by-Token [8.5] 構造化3次元シーンにおける自己回帰モデルの可能性について検討する。
言語,画像,3Dシーンを整合させる統一LLMフレームワークを提案する。
実世界の3Dオブジェクト認識タスクにおけるモデルの有効性を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:37 GMT)
"I wasn't sure if this is indeed a security risk": Data-driven Understanding of Security Issue Reporting in GitHub Repositories of Open Source npm Packages [8.4] この研究は、GitHubリポジトリ全体で報告された10,907,467件のnpmパッケージを収集した。
これらの問題に関連するタグは、セキュリティ関連の問題に0.13%しか存在しないことを示している。
手動解析のアプローチに続いて、高精度な機械学習モデルを構築し、セキュリティ関連の問題としてタグ付けされていない1,617,738件を特定した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:11:35 GMT)
What Do Indonesians Really Need from Language Technology? A Nationwide Survey [8.3] インドネシアにおける母語話者の実際のニーズを評価するために全国調査を実施している。
以上の結果から,特に機械翻訳や情報検索による言語障壁への対処が最重要課題であることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:36:15 GMT)
Semantic Exploration with Adaptive Gating for Efficient Problem Solving with Language Models [8.3] 本稿では,セマンティック探索を適応ゲーティング(SEAG)で提案し,意味論的に同一の経路を探索する。
SEAGは計算コストの31%しか必要とせず、平均4.3%の精度を著しく向上させる。
私たちのコードはhttps://github.com/ml-postech/SEAG-semantic-exploration-with-adaptive-gatingで公開しています。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:08:04 GMT)
Towards Achieving Perfect Multimodal Alignment [8.0] ある条件下では、各モジュラリティのペア化されたデータが等価な潜在ベクトルにマップできることを示し、これを完全アライメントと呼ぶ。
合成多モードガウスデータの実験により, 完全アライメント法の有効性が検証された。
人間の行動認識におけるクロスモーダルトランスファーの実践的応用を実証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:05:39 GMT)
Surgeon Style Fingerprinting and Privacy Risk Quantification via Discrete Diffusion Models in a Vision-Language-Action Framework [8.0] 本稿では,ロボット手術における外科特異的フィンガープリントのモデル化手法を提案する。
本手法は,ジェスチャー予測を構造化シーケンス記述タスクとして定式化する。
パーソナライズされた外科医の指紋は 自然言語のプロンプトで符号化される
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:49:55 GMT)
Flowing Datasets with Wasserstein over Wasserstein Gradient Flows [8.0] 本稿では,各クラスを特徴の条件付き分布で表現し,これらのクラスでサポートされている混合分布としてデータセットをモデル化する。
我々は、この空間に最適な輸送、すなわちワッサーシュタイン上のワッサーシュタイン(WoW)距離の計量構造を持ち、この空間上の微分構造を導出し、WoW勾配流を定義する。
本フレームワークは, グラデーションフロー構築と新規な抽出可能な機能を利用して, 学習と蒸留作業のデータセット化に応用する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:17:35 GMT)
Solving Constrained Optimization Problems Using Hybrid Qubit-Qumode Quantum Devices [8.0] 変分量子アルゴリズム(VQA)は、短期量子ハードウェアにおける複雑な最適化問題を解くための有望なアプローチを提供する。
エコー条件変位変動量子固有解器(ECD-VQE)を用いた2次非拘束二元最適化問題に対して、ハイブリッド量子ビット量子デバイスがどのように対処できるかを示す。
我々は,従来の量子コンピュータでは深部回路を必要とする変動型ECDアンサーゼを,ハイブリッド量子モードプラットフォームで効率的に実現することができると結論付けた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:38:41 GMT)
Synthesis by Design: Controlled Data Generation via Structural Guidance [7.9] 数学的推論から生成した問題解決コードを用いて構造情報を抽出する。
提案手法はMATHとGSM8Kに適用し,ラベル付き中間ステップと6.1Kプロブレムベンチマークを用いて39K問題を生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:38:23 GMT)
"Would You Want an AI Tutor?" Understanding Stakeholder Perceptions of LLM-based Systems in the Classroom [7.9] 教室における大規模言語モデルによって直接的あるいは間接的に影響を受ける人々の認識を理解することは、この重要な領域におけるAIの責任ある使用を保証するために不可欠である、と我々は主張する。
学習におけるLLMの導入に関する文脈認識(Co-PALE)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:09:10 GMT)
Mind the Gap: Revealing Security Barriers through Situational Awareness of Small and Medium Business Key Decision-Makers [7.9] 中小企業(中小企業)の主要な意思決定者は、サイバーセキュリティ対策を効果的に実施するための認識と知識を欠いていることが多い。
テーマ分析を用いて,SMB意思決定者の認識するリスクを,価値あるデジタル資産の観点で明らかにした。
我々は、サイバーセキュリティ意識に基づく意思決定者の特徴付けに状況認識モデルを用い、敵との戦いにおいて比較的意識が低い者を識別した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:13:49 GMT)
A Simplifying and Learnable Graph Convolutional Attention Network for Unsupervised Knowledge Graphs Alignment [7.7] 教師なし知識グラフアライメント(SLU)のための簡易かつ学習可能なグラフ畳み込み型アライメントネットワークを提案する。
具体的には、まず2つのKGのグラフ構造をモデル化するバックボーンネットワークとして、新しいシンプルなフレームワークLCATを紹介する。
そこで我々は、アライメントされたエンティティの無効な近傍情報を効率的にフィルタリングするために、ポテンシャルマッチング関係に基づく関係構造の再構築手法を設計する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:46:25 GMT)
FRED: Flexible REduction-Distribution Interconnect and Communication Implementation for Wafer-Scale Distributed Training of DNN Models [7.6] 分散ディープニューラルネットワーク(DNN)トレーニングは、トレーニングタスクを複数のアクセラレータに分散することで、トレーニングオーバーヘッドを低減するテクニックである。
我々は,ウエハスケールネットワークの高BW要求に適したウェハスケール相互接続であるFREDを提案する。
その結果、FREDはResNet-152, Transformer-17B, GPT-3, Transformer-1Tの平均エンドツーエンドトレーニング時間を1.76X, 1.87X, 1.34X, 1.4Xで改善できることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:50:50 GMT)
Suppression of spin bath and low-frequency noise for sub-MHz AC magnetometry based on double-dressed spin qubit in diamond [7.5] 我々は,ダイヤモンドの量子バス相互作用を効果的に抑制し,弱い交流信号の検出を可能にするプロトコルを実験的に実証した。
この研究は、低磁場NMR実験における弱結合核スピンの感度検出への道を開いた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:06:28 GMT)
Noise-Robustness Through Noise: Asymmetric LoRA Adaption with Poisoning Expert [7.5] ダウンストリームタスクに事前訓練された言語モデルを適用するための現在の微調整手法は、ノイズの多いデータからの干渉に影響を受けやすい。
非対称なロラ中毒専門家(LoPE)によるノイズロバスト適応手法を提案する。
LoPEは、低コストのノイズ注入によって、パフォーマンスとロバスト性を純粋に達成し、データクリーニングの必要性を完全に排除する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:25:42 GMT)
Towards AI-assisted Neutrino Flavor Theory Design [7.3] 本研究では、強化学習エージェントが合理化された物理ソフトウェアパイプラインと相互作用し、効率的に空間を探索するフレームワークを開発する。
AMBerは対称性群、粒子内容、および群表現代入を選択して実行可能なモデルを構築する。
我々は、理論空間のよく研究された領域における我々のアプローチを検証し、探索を、以前に検討されなかった新しい対称性群に拡張する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:00:01 GMT)
GaussianVAE: Adaptive Learning Dynamics of 3D Gaussians for High-Fidelity Super-Resolution [7.3] 本稿では,3次元ガウス散乱(3DGS)の分解能と幾何学的忠実度を,ネイティブトレーニングの分解能を超えて向上させる新しい手法を提案する。
私たちの研究は、この制限を軽量な生成モデルによって破り、最も必要な3Dガウスを予測し、洗練します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:13:12 GMT)
On Hypothesis Transfer Learning of Functional Linear Models [7.2] 再生カーネル空間(RKHS)フレームワークを用いて,関数線形回帰(FLR)のための伝達学習(TL)について検討する。
我々は、RKHS距離を用いてタスク間の類似度を測定し、転送される情報のタイプがRKHSの特性に結びつくようにする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:50:41 GMT)
Why Gradients Rapidly Increase Near the End of Training [7.2] この増加は、体重減少、正規化層、学習率スケジュールの意図しない相互作用によるものであることを示す。
本稿では、この動作を修正しながら、トレーニングを通して損失値の低減を図った簡単な修正を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:08:17 GMT)
DINeMo: Learning Neural Mesh Models with no 3D Annotations [7.2] カテゴリーレベルの3D/6Dポーズ推定は、総合的な3Dシーン理解に向けた重要なステップである。
最近の研究は、分析バイシンセサイザーの観点から、2Dおよび3Dタスクにアプローチするニューラルネットワークモデルについて検討している。
疑似対応を利用して3次元アノテーションを使わずにトレーニングした新しいニューラルネットワークモデルであるDINeMoを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:25:49 GMT)
Accelerating LLM Inference with Lossless Speculative Decoding Algorithms for Heterogeneous Vocabularies [7.1] 投機的復号法(SD法)は、単一の目標フォワードパスを使用して複数のトークンを生成することにより、実質的な効率向上をもたらす。
既存のSDアプローチでは、ドラフトラとターゲットモデルは同じ語彙を共有する必要があるため、ドラフトラのプールが制限される。
この共有語彙制約を除去する3つの新しいSD手法を提案する。
我々のアルゴリズムは、標準の自己回帰復号よりも最大2.8倍の高速化を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:12:43 GMT)
C3T: Cross-modal Transfer Through Time for Sensor-based Human Activity Recognition [7.1] C3T(Cross-modal Transfer Through Time)を紹介する。
C3Tは、動的センサーデータを処理するために、アライメント中の時間情報を保存する。
様々なカメラ+IMUデータセットを用いた実験により、C3TはUMAの既存の手法を少なくとも8%上回っていることが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:03:39 GMT)
Hyperpruning: Efficient Search through Pruned Variants of Recurrent Neural Networks Leveraging Lyapunov Spectrum [7.1] LS-based Hyperpruning (LSH) と呼ばれる効率的なハイパープルニングフレームワークを導入する。
LSベースのHyperpruningは、フルトレーニングに依存する従来のアプローチに比べて、検索時間を桁違いに削減する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:49:29 GMT)
Open World Scene Graph Generation using Vision Language Models [7.0] SGG(Scene-Graph Generation)は、画像中の物体を認識し、その正当な対関係を蒸留する。
オープンワールドSGG(Open-World SGG)は、視覚言語モデル(VLM)の事前訓練された知識に直接アクセスする、トレーニング不要で、効率的で、モデルに依存しないフレームワークである。
提案手法は,マルチモーダルプロンプト,埋め込みアライメント,および軽量なペアリファインメント戦略を組み合わせることで,未知のオブジェクト語彙や関係集合に対する推論を可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:59:05 GMT)
SceneRAG: Scene-level Retrieval-Augmented Generation for Video Understanding [7.0] SceneRAGは,映像を物語に一貫性のあるシーンに分割するフレームワークである。
各シーンについて、このフレームワークは視覚とテキストの両方のモダリティから情報を融合し、エンティティ関係を抽出する。
LongerVideosベンチマークの実験では、134時間以上の多様なコンテンツがあり、SceneRAGが以前のベースラインを大幅に上回っていることを確認した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:00:54 GMT)
SK-VQA: Synthetic Knowledge Generation at Scale for Training Context-Augmented Multimodal LLMs [6.9] SK-VQA(SK-VQA)は,200万以上の視覚的質問応答対を含む大規模合成マルチモーダルデータセットである。
人間の評価を通じて,生成した質問応答対の質と文脈的関連性を確認する。
以上の結果から,SK-VQAでトレーニングしたモデルは,コンテキスト対応VQAとマルチモーダルRAG設定の両方において拡張された一般化を示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:57:56 GMT)
InverseScope: Scalable Activation Inversion for Interpreting Large Language Models [6.8] InverseScopeは、入力インバージョンを介して神経活性化を解釈するための仮定ライトでスケーラブルなフレームワークである。
高次元空間におけるサンプリングの非効率性に対処するために,新しい条件生成アーキテクチャを提案する。
また,サンプル入力上で計算された特徴整合率を用いて,解釈可能性仮説をテストする定量的評価プロトコルを導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:59:28 GMT)
What makes an Ensemble (Un) Interpretable? [6.8] エンサンブルモデルはMLコミュニティにおいて、限定的な解釈可能性によって広く認識されている。
この民間伝承の認識にもかかわらず、アンサンブルを解釈可能なものにするための厳密な数学的理解が欠けている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:38:04 GMT)
Learning from Double Positive and Unlabeled Data for Potential-Customer Identification [6.7] 意思決定者は、人々が会社に忠誠心を持っているかどうかに基づいて、効果的に製品を売り込もうとする。
本稿では、ポジティブなデータやラベルなしデータから学習を応用して、ターゲットマーケティングにおける潜在的な顧客を特定する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:56:53 GMT)
Tree-Sliced Wasserstein Distance: A Geometric Perspective [6.6] 木系と呼ばれるより複雑な構造で一次元の線を置き換えることを提案する。
この構造は木の計量によって測定可能であり、木系上のOT問題の閉形式表現をもたらす。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:52:00 GMT)
KokushiMD-10: Benchmark for Evaluating Large Language Models on Ten Japanese National Healthcare Licensing Examinations [6.5] 国師MD-10は、日本の10の医療免許試験から構築された最初のマルチモーダルベンチマークである。
このベンチマークは、医学、歯科医学、看護学、薬局、および関連医療専門職を含む複数の分野にまたがる。
実際の11588以上の質問が含まれており、臨床画像と専門家による注釈付き根拠を取り入れて、テキストと視覚的推論の両方を評価している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:26:02 GMT)
Exploiting Curvature in Online Convex Optimization with Delayed Feedback [6.4] 曲面損失と遅延フィードバックを用いたオンライン凸最適化問題について検討する。
次数$minsigma_maxln T, sqrtd_mathrmtot$を後悔する規則化リーダの変種を提案する。
次に、exp-concave損失を検討し、適応的な学習率チューニングで遅延を処理するためにOnline Newton Stepアルゴリズムを拡張した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:49:54 GMT)
Evaluating LLMs Effectiveness in Detecting and Correcting Test Smells: An Empirical Study [6.4] テストの臭いは、テストコードの悪い開発プラクティスを示し、保守性と信頼性を低下させる。
GPT-4-TurboNose, LLaMA 3 70B, Gemini-1.5 ProをPythonおよびJavaテストスイート上で評価した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:46:41 GMT)
SWAT-NN: Simultaneous Weights and Architecture Training for Neural Networks in a Latent Space [6.2] ニューラルネットワークのアーキテクチャと重みを同時に最適化するフレームワークを提案する。
我々のフレームワークはまず、アーキテクチャ情報とパラメトリック情報の両方を連続的な潜在空間に埋め込む、普遍的なマルチスケールオートエンコーダを訓練する。
データセットが与えられたら、埋め込み空間内の点をランダムに初期化し、勾配降下によって更新して最適なニューラルネットワークを得る。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:22:37 GMT)
Positional Attention: Expressivity and Learnability of Algorithmic Computation [6.2] この研究は、アルゴリズム実行におけるトランスフォーマーにおける注意の役割をよりよく理解することを目的としている。
位置対応変換器(位置対応変換器)は並列計算モデルと同じ表現性を持つことを示す。
パラメータノルムにより良い理論的依存を示す一方で、特定のタスクはより多くの層を必要とする可能性がある。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:05:35 GMT)
Do Large Language Models Judge Error Severity Like Humans? [6.2] 人間は異なるエラータイプに様々な重大度を割り当てる。
視覚的コンテキストは、色と型エラーに対する認識の重大さを著しく増幅する。
大きな言語モデルは、性別エラーに低いスコアを割り当てるが、色エラーには不当に高いスコアを割り当てる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:37:59 GMT)
Domain Randomization for Object Detection in Manufacturing Applications using Synthetic Data: A Comprehensive Study [6.2] 本稿では,オブジェクト検出用合成データ生成における領域ランダム化の重要な側面について述べる。
オブジェクトの特徴,背景,照明,カメラ設定,後処理など,さまざまな要因を反映した包括的データ生成パイプラインを提案する。
本実験では, 実物検出の課題だけでなく, 実現可能性に関するより豊富な結果と知見を提示する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:26:19 GMT)
Poisson Midpoint Method for Log Concave Sampling: Beyond the Strong Error Lower Bounds [6.1] 過度に損傷/破壊されたランゲヴィン力学の中間点離散化を用いた$mathbbRd$上の強対数分布からのサンプリング問題について検討する。
2-ワッサーシュタイン距離(W$)における収束性を証明し、オイラー・丸山離散化に対する目標精度(epsilon$)に依存して立方体スピードアップを達成する。
特に、アンダーダムングランゲヴィン力学の場合、$W$収束の複雑さは$L2$の収束の複雑さの下限よりもはるかに小さいことを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:27:15 GMT)
A Cognac Shot To Forget Bad Memories: Corrective Unlearning for Graph Neural Networks [6.1] 我々は,最近定式化された矯正的未学習の問題について検討した。
現在のグラフアンラーニング手法は、操作された集合が全て知られている場合でも、操作の効果を解き放たない。
コニャックというグラフアンラーニング手法を導入し、5%しか特定されていない場合でも操作セットの効果を解き放つことができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:05:59 GMT)
Walrus: An Efficient Decentralized Storage Network [6.1] Walrusは、複数の技術革新を通じて制限に対処する、分散化されたブロブストレージシステムである。
RedStuffは、4.5倍のレプリケーション係数で高いセキュリティを実現する2次元消去符号化プロトコルである。
Walrusはまた、ストレージノードチャーンを効率的に処理する、新しいマルチステージエポック変更プロトコルも導入している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:08:54 GMT)
Can AI Validate Science? Benchmarking LLMs for Accurate Scientific Claim $\rightarrow$ Evidence Reasoning [6.0] CLAIM-BENCHは,科学的クレームエビデンス抽出と検証において,大規模言語モデルの能力を評価するためのベンチマークである。
GPT-4やClaudeのようなクローズドソースモデルは、精度とリコールにおいて、オープンソースモデルよりも一貫して優れています。
戦略的に設計された3つのパスと1対1のプロンプトアプローチは、分散した証拠とクレームを正確にリンクするLSMの能力を大幅に向上させた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:04:39 GMT)
Lite-RVFL: A Lightweight Random Vector Functional-Link Neural Network for Learning Under Concept Drift [6.0] Lite-RVFLは、ドリフトの検出や再学習なしにコンセプトドリフトに適応できる軽量で高速で効率的なランダムなベクトル機能リンクネットワークである。
実世界の安全評価タスクの結果は,Lite-RVFLの時間的パターンを捉えることの効率性,ドリフトへの適応性,および可能性を検証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:42:57 GMT)
Consistent Video Editing as Flow-Driven Image-to-Video Generation [6.0] FlowV2Vはパイプライン全体を1フレームの編集と条件付きI2V生成に分解し、変形した形状に整合した擬似フローシーケンスをシミュレートする。
DAVIS-EDITによるDOVERの13.67%と50.66%の改善とワープエラーによる実験の結果は、既存の最先端のものと比較して、FlowV2Vの時間的一貫性とサンプル品質が優れていることを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:57:30 GMT)
TimberStrike: Dataset Reconstruction Attack Revealing Privacy Leakage in Federated Tree-Based Systems [5.9] 我々はTimberStrikeを紹介した。TimberStrikeは、水平結合木モデルをターゲットにした最適化ベースのデータセット再構成攻撃である。
我々の攻撃は、他のクライアントからのセンシティブなトレーニングデータを推測するために、分割値と決定経路を用いて決定木の離散的な性質を利用する。
本研究は,木系フェデレート学習システムに特化して設計されたプライバシ保護機構の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:06:03 GMT)
Human-in-the-Loop Annotation for Image-Based Engagement Estimation: Assessing the Impact of Model Reliability on Annotation Accuracy [5.9] 本研究では,ハイパフォーマンスなイメージベース感情モデルをHITLアノテーションフレームワークに統合する。
モデル信頼性および認知フレーミングの変化が、人間の信頼、認知負荷、アノテーション行動にどのように影響するかを検討する。
人間の監視と自動システムの強みを活用することにより、感情アノテーションのためのスケーラブルなHITLフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:17:01 GMT)
Quickest Causal Change Point Detection by Adaptive Intervention [5.9] 2つのモニタリング手法が提案され、それぞれが適応的介入ポリシーを用いて探索と搾取のバランスをとる。
提案手法の1次最適性を理論的に実証し、シミュレーションデータセットと2つの実世界のケーススタディを用いてそれらの特性を検証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:39:35 GMT)
Protecting Deep Learning Model Copyrights with Adversarial Example-Free Reuse Detection [5.7] ディープニューラルネットワーク(DNN)の再利用と複製は、モデル所有者に著作権侵害と経済的損失をもたらす可能性がある。
既存のホワイトボックステストベースのアプローチは、モデルアーキテクチャが変更される一般的な異種再利用ケースに対処できない。
神経機能解析に基づく再利用検出装置であるNFARDを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:31:53 GMT)
ZeroVO: Visual Odometry with Minimal Assumptions [5.7] 我々は,様々なカメラや環境にまたがるゼロショットの一般化を実現する新しいビジュアル・オドメトリー(VO)アルゴリズムであるZeroVOを紹介する。
我々は,推定深度およびカメラパラメータのノイズを処理できるキャリブレーションのない幾何対応ネットワーク構造を設計する。
我々は、複雑な自律運転状況を分析し、従来の方法に対して30%以上の改善を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:51 GMT)
UnCLe: Benchmarking Unsupervised Continual Learning for Depth Completion [5.7] UnCLeは、マルチモーダル3D再構成タスクの教師なし連続学習のための最初の標準ベンチマークである。
連続したデータストリーム上の教師なし学習の実践シナリオ下で、深度補完モデルをベンチマークする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:39:25 GMT)
General Loss Functions Lead to (Approximate) Interpolation in High Dimensions [5.7] 我々は、バイナリとマルチクラスの設定にまたがる凸損失の一般的なファミリーに適用可能な統一されたフレームワークを提供する。
具体的には、暗黙バイアスが高次元の最小ノルムに近似されている(正確には同値ではない)ことを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:24:45 GMT)
LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds [5.6] ローカルとグローバルの両方の機能から3Dセマンティクスを学ぶためにLogoSPを紹介します。
我々のアプローチは,周波数領域におけるグローバルなパターンに従ってスーパーポイントをグループ化することで,3次元意味情報を発見することである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:21:37 GMT)
SELT: Self-Evaluation Tree Search for LLMs with Task Decomposition [5.6] 外部報酬モデルに頼らずにLSM推論を強化する新しいフレームワークであるSELT(Self-Evaluation LLM Tree Search)を紹介する。
知識に基づくMMLUとツール学習データセットSeal-Toolsを含む,挑戦的なベンチマークに対するアプローチを検証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:52:27 GMT)
LUCIFER: Language Understanding and Context-Infused Framework for Exploration and Behavior Refinement [5.5] 動的環境において、既存の環境知識の急速な陳腐化は、エージェントの内部モデルと運用コンテキストの間にギャップを生じさせる。
本稿では、階層的な意思決定アーキテクチャと強化学習を統合したドメインに依存しないフレームワークLUCIFERを提案する。
LUCIFERは探索効率と意思決定品質を向上し、平坦で目標条件の政策よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:30:05 GMT)
Position: We Need Responsible, Application-Driven (RAD) AI Research [5.5] このポジションペーパーは、人工知能(AI)による有意義な科学的および社会的進歩を達成するには、AI研究に対する責任あるアプリケーション駆動アプローチ(RAD)が必要であると主張している。
我々は、技術的に実現可能な方法で新しい価値を解放するアプリケーション駆動型AI研究の将来へのビジョンを提示する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:43:18 GMT)
Quantum Information-Theoretical Size Bounds for Conjunctive Queries with Functional Dependencies [5.4] 我々は、古典的情報理論と量子情報理論による接続型クエリのサイズ境界を推定する以前の研究の関連性を確立する。
古典的なシャノンエントロピーを量子R'enyiエントロピーに置き換えることを提案する。
これは有望な修正であるが、古典的な分布の代わりに量子状態に対する最適化は新たな課題を生み出している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:46:56 GMT)
Phase estimation via delocalized photon subtraction operation inside the SU(1,1) interferometer [5.4] そこで本研究では,位相測定の精度を強度検出により向上させる理論的手法を提案する。
位相感度と量子フィッシャー情報をD-PSOと局所光子減算演算で比較する。
D-PSOは、SU(1,1)干渉計の測定精度を向上し、内部光子損失に対するロバスト性を高めることができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:13:51 GMT)
Automated Capability Discovery via Foundation Model Self-Exploration [5.4] ACDは、ある基礎モデルを科学者として指定し、対象モデルの能力を示すオープンエンドタスクを提案するフレームワークである。
ACDは様々な基礎モデルにまたがってデモを行い、何千もの異なるタスクを自動的に生成することを示した。
さらに, モデル生成と人的評価の高精度な一致を観察し, 広範囲な人的調査による自動採点の有効性を検証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:49:46 GMT)
DPFormer: Dynamic Prompt Transformer for Continual Learning [5.4] 連続学習では、破滅的な問題を忘れると、モデルは安定性と塑性のジレンマに陥る可能性がある。
本稿では,プロンプトスキームを用いた新しい動的プロンプトトランス (DPFormer) を提案する。
プロンプトスキームは、DPFormerが以前のクラスやタスクの知識を記憶し、単一のネットワーク構造の下で新しいクラスやタスクから新しい知識を学習し続けるのに役立つ。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:26:20 GMT)
Generative Modeling of Weights: Generalization or Memorization? [5.4] 効率的なニューラルネットワークの重み付けのために生成モデルが検討されている。
本研究では,新しいモデル重みを生成できる4つの手法について検討する。
これらの手法は主として記憶によって重みを合成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:58:36 GMT)
Resilience of Rademacher chaos of low degree [5.3] ラデマッハカオスのレジリエンスは、カオスが持続できる敵のサインフリップの最大数である。
我々はRadecherカオスの弾力性に関する確率的低バウンド保証を提供する。
次数2のラデマッハカオスと次数2のラデマッハカオスは,同じ概念的枠組みで確立されているが,大きな違いがある。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:45:25 GMT)
Snap-and-tune: combining deep learning and test-time optimization for high-fidelity cardiovascular volumetric meshing [5.3] 医用画像からの高品質なボリュームメッシュ化は、パーソナライズされた医療における物理ベースのシミュレーションの鍵となるボトルネックである。
深層学習(DL)とテスト時間最適化を順次適用するスナップ・アンド・トゥン戦略を導入する。
本手法は空間精度とメッシュ品質を両立させながら, 完全自動化した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:58:11 GMT)
RONA: Pragmatically Diverse Image Captioning with Coherence Relations [5.2] RONAはマルチモーダル大規模言語モデルのための新しいプロンプト戦略である。
ronAは, 全体的な多様性と地道整合性を向上したキャプションを生成することを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:48:21 GMT)
CORDIAL: Can Multimodal Large Language Models Effectively Understand Coherence Relationships? [5.2] 本研究は、類似度に基づくメトリクスを超えて、MLLMを評価するための談話駆動フレームワークを採用することの必要性を強調する。
我々のベンチマークである CORDIAL は、3つの異なる談話領域で様々な粒度でコヒーレンス関係を包含している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:25:06 GMT)
Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models [5.2] 自然言語タスク記述から報酬関数を生成するための教師なしパイプラインを提案する。
報酬はシミュレーション環境でRLエージェントを訓練するために使用され、報酬生成プロセスは実現可能性を高めるために形式化される。
ABB YuMiコラボレーティブロボットを用いたシングルアームおよびバイマニュアル操作タスクの広範囲なシミュレーション実験により,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:23:24 GMT)
Multi-View Adaptive Contrastive Learning for Information Retrieval Based Fault Localization [5.2] MACL-IRFL(Multi-View Adaptive Contrastive Learning for Information Retrieval Fault Localization)という新しい手法を提案する。
まず、レポート・コード・インタラクション・ビュー、レポート・レポートの類似性ビュー、コード・コードの共引用ビューを別々に生成し、グラフニューラルネットワークを用いて、埋め込みプロセスの3つのビューからバグレポートやソースコードファイルの情報を集約する。
コントラスト学習タスクの設計では,バグレポートの表現は,レポートレポートやレポートコードビューで共有される情報をエンコードし,ソースコードファイルの表現はコードコードとレポートコードビューで共有する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:51:50 GMT)
Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration [5.1] 2つの重要なモジュールを組み込んだ連続的な都市変化検出フレームワークを提案する。
時間的特徴改善(TFR)モジュールは、ConvNetベースのマルチ時間的ビルディング表現を改善するために自己アテンションを使用する。
マルチタスク統合(MTI)モジュールはマルコフネットワークを利用して最適なビルディングマップ時系列を見つける。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:32:53 GMT)
Squeeze3D: Your 3D Generation Model is Secretly an Extreme Neural Compressor [5.1] Squeeze3Dは、既存の訓練済みの3D生成モデルから学習した暗黙の事前知識を利用して、非常に高い圧縮比で3Dデータを圧縮する新しいフレームワークである。
提案手法は,事前学習したエンコーダと事前学習した生成モデルとの間に,学習可能なマッピングネットワークを介して遅延空間をブリッジする。
実験により,Squeeze3Dはテクスチャメッシュで最大2187倍,点雲で55倍,放射場で619倍の圧縮比を実現し,多くの既存手法に匹敵する視覚的品質を維持した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:52:10 GMT)
Intent Matters: Enhancing AI Tutoring with Fine-Grained Pedagogical Intent Annotation [5.0] 教師意図の微粒化アノテーションにより,LLM生成学習の質が向上することを示す。
本研究では,数学教育のためのダイアログ・データセットであるMathDialに着目し,自動アノテーション・フレームワークを用いてデータセットの一部を注釈付けする。
次に、これらのアノテーションを使用してLPMを微調整し、その性能を元の4つの分類体系に基づいて訓練されたモデルと比較する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:45:18 GMT)
Spatio-Temporal State Space Model For Efficient Event-Based Optical Flow [5.0] イベントベースの動き推定(光学フロー)は多くのリアルタイムアプリケーションにとって重要である。
SNNやGNNなどのイベントベースの手法は計算効率が良いが、これらの手法は十分な非同期時間情報の取得に失敗する。
本稿では,新しいネットワークアーキテクチャとともにSTSSMモジュールを導入し,競争性能の高い効率的なソリューションを開発した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:51:06 GMT)
Graph-Assisted Stitching for Offline Hierarchical Reinforcement Learning [5.0] Graph-Assisted Stitching (GAS)はグラフ探索問題としてサブゴール選択を定式化する新しいフレームワークである。
ガスクラスターは、異なる軌道からのセマンティックに類似した状態を統一グラフノードに分割し、効率的な遷移縫合を可能にする。
グラフ品質を改善するために,ノイズや非効率な遷移状態をフィルタする時間効率(TE)指標を導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:26:23 GMT)
Detection and manipulation of surface electric field noise of hexagonal boron nitride [4.9] 浅いホウ素空孔欠陥を用いたhBNの表面電気的エルドノイズを系統的に検討した。
これらの実験により、hBNにおける表面電気フィエルドノイズの理解が促進され、ノイズ緩和戦略の基盤となる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:18:25 GMT)
The Catechol Benchmark: Time-series Solvent Selection Data for Few-shot Machine Learning [4.9] 我々は、機械学習ベンチマークのための最初の過渡フローデータセットを提供する、収差予測のための新しいデータセットを提案する。
以前のデータセットは離散パラメータに焦点を当てていましたが、実験的なセットアップによって、多数の継続的プロセス条件をサンプリングすることができます。
我々は,特に理論的にモデル化が難しい課題である溶媒選択に焦点をあてる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:34:14 GMT)
MoE-GPS: Guidlines for Prediction Strategy for Dynamic Expert Duplication in MoE Load Balancing [4.9] 本稿では,予測戦略,アキュラシー,オーバヘッド,エンド・ツー・エンドのシステム性能のトレードオフについて議論する。
我々は,様々なシステム構成下で最適な予測器設計を選択するためのフレームワークであるMoE-GPSを提案する。
具体的には,トークン全体の分布のみを予測する予測戦略である分散オンリー予測を提唱する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:32:09 GMT)
PolitiSky24: U.S. Political Bluesky Dataset with User Stance Labels [4.7] スタンス検出は、政治的人物のような特定の対象に対してテキストで表される視点を特定する。
ブルースキーから収集された2024年アメリカ合衆国大統領選挙の姿勢検出データセットを提示する。
データセットは、エンゲージメントメタデータ、インタラクショングラフ、ユーザー投稿履歴に富んだ16,044人のユーザターゲットスタンスペアで構成されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:06:25 GMT)
LoRMA: Low-Rank Multiplicative Adaptation for LLMs [4.7] Low-Rank Multiplicative Adaptation (LoRMA)
ローランド乗算適応(LoRMA)を提案する。
計算複雑性や行列乗算のランクボトルネックといった問題に取り組む。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:36:46 GMT)
Multilingual Hate Speech Detection in Social Media Using Translation-Based Approaches with Large Language Models [4.7] キーワードフィルタリングにより収集した英語,ウルドゥー語,スペイン語で10,193ツイートのトリリンガルデータセットを導入する。
GPT-3.5 Turbo と Qwen 2.5 72B をアテンション層に統合することで,高い性能を実現する。
我々のフレームワークは、多言語ヘイトスピーチ検出のための堅牢なソリューションを提供し、世界中のより安全なデジタルコミュニティを育む。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:53:56 GMT)
Noninvasive precision modulation of high-level neural population activity via natural vision perturbations [4.6] 本研究では,高位霊長類腹側視覚路における神経活動の精密かつ非侵襲的調節の可能性について検討した。
予測モデルと生物学的に実現された効果との間に定量的な一致が認められた。
これらの結果は、現在の腹腔ストリームのマシン実行可能なモデルが、非侵襲的で視覚的に提供され、おそらく受容不能な神経介入を設計できることを強調している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:52:36 GMT)
TS-RSR: A provably efficient approach for batch Bayesian Optimization [4.6] 本稿では,Phompson Smpling-Regret to Sigma Ratio Direct sampleという,バッチベイズ最適化(BO)の新しい手法を提案する。
我々のサンプリング目的は、各バッチで選択されたアクションを、ポイント間の冗長性を最小化する方法で調整することができる。
提案手法は, 難解な合成および現実的なテスト機能において, 最先端の性能を達成できることを実証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:42:30 GMT)
Binary Classifier Optimization for Large Language Model Alignment [4.6] ChatGPTのような現実世界のサービスでは、ユーザーフィードバックに基づいたモデルの調整がパフォーマンス向上に不可欠である。
既存のアライメント研究の多くは、ペアとして正と負の両方の反応を必要とする嗜好に基づくアプローチに依存している。
本稿では,バイナリフィードバックのみを用いてLLMを効果的に整合させる手法であるバイナリ最適化(BCO)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:10:33 GMT)
Graph-of-Causal Evolution: Challenging Chain-of-Model for Reasoning [4.6] この研究は因果進化グラフ(GoCE)を提案する。
GoCEは暗黙のトークン表現を、微分可能でスパースな因果隣接行列にマッピングし、計算の各層を通じて因果制約を透過する。
CLUTRR、CLADDER、EX-FEVER、CausalQAなどの公開データセットで評価されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:26:47 GMT)
AQUATIC-Diff: Additive Quantization for Truly Tiny Compressed Diffusion Models [4.4] この研究は、拡散モデル圧縮の問題にコードブックベースの加算ベクトル量子化を適用する。
We report sFID 1.92 points lower than the full-precision model at W4A8 and the best-reported results for FID, sFID and ISC at W2A8。
また、効率的な推論カーネルを介して、任意のハードウェア上でFLOPの節約を実証することができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:44:29 GMT)
SimLTD: Simple Supervised and Semi-Supervised Long-Tailed Object Detection [4.4] 本稿では、オブジェクトクラスが自然に長い尾の分布に従うような環境でのオブジェクト検出の課題に焦点を当てる。
遠距離検出のための既存の方法は、低ショットのトレーニングインスタンスを拡張するために外部のImageNetラベルに頼っている。
我々は,人間のアノテーションの負担を伴わずに容易に収集できる,任意のラベル付き画像を活用する汎用的でスケーラブルなアプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:00:42 GMT)
Transcript-Prompted Whisper with Dictionary-Enhanced Decoding for Japanese Speech Annotation [4.3] 音声と韻律のラベルを与えられた音声と音声のペアにアノテートする方法を提案する。
音韻ラベリングにおける誤りの訂正に辞書事前知識を用いた復号方式を用いる。
提案手法を用いてアノテートしたラベルで訓練したTTSモデルにより合成された音声の自然性は,手動のアノテーションで訓練したモデルに匹敵することを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:10:24 GMT)
VIVAT: Virtuous Improving VAE Training through Artifact Mitigation [4.3] 本稿では, KL-VAEトレーニングにおいて, 急激なアーキテクチャ変更を伴わずに, 共通成果物を緩和するための体系的アプローチであるVIVATを紹介する。
カラーシフト、グリッドパターン、ぼやけ、コーナー、ドロップレットアーティファクトの5つの一般的なアーティファクトの詳細な分類を示し、その根本原因を分析します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:27:03 GMT)
The Universality Lens: Why Even Highly Over-Parametrized Models Learn Well [4.2] 拡張仮説クラスに先立って,ログロスと(ほとんど)均一なベイズ混合について検討する。
主要な結果は、学習者の後悔は仮説クラス全体のサイズによって決定されないことを示している。
結果は、オンライン、バッチ、教師付き学習設定で広く適用されます。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:32:31 GMT)
Revisiting Non-Acyclic GFlowNets in Discrete Environments [4.2] 離散環境における非巡回GFlowNetの理論的枠組みを提案する。
固定された後方方針によるトレーニング、流れ関数の性質、エントロピー規則化されたRLと非環状GFlowNetの接続に関する、様々な新しい理論的知見を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:56:18 GMT)
Optimal quantum sampling on distributed databases [4.1] 量子サンプリングタスクが与えられた場合、コーディネータはすべてのマシンにオラクルクエリを作成できる。
逐次アルゴリズムと並列アルゴリズムの両方を提示する。
両アルゴリズムがそれぞれの設定で最適であることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:08:59 GMT)
Estimation of Head Motion in Structural MRI and its Impact on Cortical Thickness Measurements in Retrospective Data [4.1] MRIでは運動関連アーティファクトは避けられない
これらのアーティファクトは、皮質厚みなどの自動神経解剖学的指標をバイアスすることができる。
ここでは、3次元畳み込みニューラルネットワークをトレーニングし、振り返りの定期的な研究スキャンで要約運動距離を推定する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:25:02 GMT)
Towards Timetronics with Photonic Systems [4.0] 移動波共振器を用いて時間次元の様々な凝縮物質相をエミュレートする多角的手法を提案する。
変調に必要な周波数と深さは実験的に達成可能であり、マイクロ波および光学系における結晶構造の実用的実現の道を開く。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:44:33 GMT)
Discrete and Continuous Difference of Submodular Minimization [4.0] 連続あるいは離散の領域で定義される部分モジュラ函数は、多くの応用に現れる。
離散領域上のすべての関数と連続領域上のすべての滑らかな関数はDSであることが示される。
本稿では、DCアルゴリズム(DCA)の新たな変種を提案し、結果のDCプログラムに適用する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:17:15 GMT)
Lightweight Sequential Transformers for Blood Glucose Level Prediction in Type-1 Diabetes [3.8] 1型糖尿病(T1D)は世界中の数百万人に影響を与え、重度の低血糖や高血糖症を予防するために継続的なモニタリングを必要とする。
本稿では,T1Dにおける血糖予測のための新しい軽量シーケンストランスモデルを提案する。
2つのベンチマークデータセットであるOttoT1DMとDiaTrendの実験では、提案されたモデルは、グルコース濃度の予測と有害事象の検出において最先端の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:27:43 GMT)
Dynamic View Synthesis as an Inverse Problem [3.8] 単眼ビデオからの動的ビュー合成をトレーニング不要環境における逆問題として扱う。
K次再帰雑音表現と呼ばれる新しい雑音表現を導入する。
カメラの動きから新たに見える領域を合成するために,ラテント変調を導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:47 GMT)
Diffusion models under low-noise regime [3.7] 拡散モデルは, 汚損レベルが小さい場合に有効であることを示す。
トレーニングセットのサイズ,データ幾何,および客観選択形状のモデル化方法の定量化を行う。
この研究は、実用的なアプリケーションにおける生成モデルの信頼性に対する理解のギャップに対処し始めます。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:07:16 GMT)
Surgeons Awareness, Expectations, and Involvement with Artificial Intelligence: a Survey Pre and Post the GPT Era [3.7] 本研究は,2021年と2024年に行われた比較調査を通じて,外科手術におけるAIの意識,期待,関与について検討した。
AIコースの認知度は2021年の14.5%から2024年の44.6%に上昇し、コース出席率は12.9%から23%に増加した。
AIの役割への期待は2024年に変化し、病院経営は関連性を高めた。
学際的なコラボレーションと構造化されたトレーニングは、AIの採用の成功に不可欠であると認識された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:46:08 GMT)
DualDynamics: Synergizing Implicit and Explicit Methods for Robust Irregular Time Series Analysis [3.7] NDE法とニューラルフロー法を組み合わせた新しいフレームワークである「DualDynamics」を紹介する。
このアプローチは計算要求のバランスを保ちながら表現力を高め、既存の手法の限界に対処する。
以上の結果から,DualDynamicsが不規則時系列解析を飛躍的に進める可能性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:31:49 GMT)
FunDiff: Diffusion Models over Function Spaces for Physics-Informed Generative Modeling [3.7] 本稿では関数空間における生成モデリングのための新しいフレームワークであるFunDiffを紹介する。
FunDiffは遅延拡散プロセスと関数オートエンコーダアーキテクチャを組み合わせて入力関数を処理する。
本研究では流体力学および固体力学におけるFunDiffの実効性を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:19:59 GMT)
Stability of Mean-Field Variational Inference [3.6] 平均場推論(英: Mean-field Inference, MFVI)は、積測度による高次元確率分布の近似法として広く用いられている手法である。
MFVI は対象電位によって微分可能であり、偏微分方程式により微分を特徴づけることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:21:37 GMT)
LiteVLM: A Low-Latency Vision-Language Model Inference Pipeline for Resource-Constrained Environments [3.5] 本稿では,組込みデバイスへのデプロイに最適化された効率的なビジョン・ランゲージ・モデル(VLM)パイプラインを提案する。
パイプラインは、パッチ選択を併用して、無関係なカメラビューをフィルタリングすることにより、計算オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:30:25 GMT)
Generation of Frequency-Tunable Shaped Single Microwave Photons Using a Fixed-Frequency Superconducting Qubit [3.5] 超伝導量子コンピュータをスケールアップするには リモートチップ間の量子通信が必要です
高忠実性通信を実現するためには、マイクロ波光子の周波数と時間形状を制御することが不可欠である。
周波数可変回路素子を使わずに周波数可変形マイクロ波光子の発生を実証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:53:43 GMT)
Learning to Stop: Deep Learning for Mean Field Optimal Stopping [3.4] リスク管理、ファイナンス、ロボティクス、機械学習の応用において、最適停止は、最適化における根本的な問題である。
標準フレームワークをマルチエージェント設定に拡張し、マルチエージェント最適停止(MAOS)と名付け、エージェントが有限空間離散時間環境で最適な停止決定を行う。
エージェントの数がとても多いため,MAOSの解法は計算的に禁止されるので,エージェントの数が無限大になる傾向にあるため,平均フィールド最適停止問題について検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:11:54 GMT)
Dealing with the Evil Twins: Improving Random Augmentation by Addressing Catastrophic Forgetting of Diverse Augmentations [3.3] ランダムな拡張の性質は、学習した特徴を歪ませるコライディング拡張のセットを生み出すことができることを示す。
そこで本研究では,ランダム拡張の一般化効果を改善するための簡単な解を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:18:13 GMT)
FAMSeg: Fetal Femur and Cranial Ultrasound Segmentation Using Feature-Aware Attention and Mamba Enhancement [3.3] 本稿では, 特徴知覚とマンバ強調に基づく胎児大腿骨・頭蓋骨超音波画像分割モデルを提案する。
FAMSegネットワークは、様々なサイズと向きのイメージに対して、最も高速な損失低減と最高のセグメンテーション性能を達成した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:06:47 GMT)
Universal phase correction for quantum state transfer in one-dimensional topological spin chains [3.3] ギャップ保護トポロジカルチャネルは、量子ネットワークにおける堅牢かつ高忠実な状態伝達を実現するための有望な方法である。
量子状態伝達(QST)の位相情報を1次元(1次元)トポロジカルスピン鎖で数値的に研究する。
我々の研究は1次元位相的に保護されたQSTにおける普遍的な位相補正を明らかにし、量子系における位相的保護機構の再評価を促す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:47:53 GMT)
TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation [3.3] 本稿では,視覚言語ナビゲーション(VLN)タスクに対して,問題を4つのサブモジュールに分解してモジュール化する手法を提案する。
自然言語によるナビゲーションの指導を受けると、まずLLMにランドマークと訪問順序を抽出するよう促す。
環境のトポロジカルマップ上の最短経路アルゴリズムを用いて,開始位置から最終ランドマークまでの経路仮説を生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:25:31 GMT)
Feature-Based Lie Group Transformer for Real-World Applications [3.2] 表現学習の主な目的は、実世界の感覚入力から意味のある表現を、監督なしで取得することである。
ガロア代数理論における群分解を用いた新しい手法を提案する。
この方法は、より一般的な表現を定義することを約束するが、特徴抽出なしでピクセル間変換を仮定する。
特徴抽出とオブジェクトセグメンテーションを組み合わせることで,より現実的なシナリオにグループ分解理論を適用する方法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:10:31 GMT)
Addressing Correlated Latent Exogenous Variables in Debiased Recommender Systems [3.1] 推薦システム(RS)は、パーソナライズされたコンテンツを提供することを目的としているが、選択バイアスによる非バイアス学習の課題に直面している。
本稿では,予測モデルを学習する確率に基づく学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:50:21 GMT)
How to Write a Simulator for Quantum Circuits from Scratch: A Tutorial [3.1] このチュートリアルは、量子回路シミュレータをゼロから製作することで有能なプログラマをガイドする。
およそ1000-2000行のコードで、アダマール、パウリX、Y、Z、SWAP、その他の量子論理ゲートをシミュレートすることができる。
特に、状態ベクトルを更新するqubit-wise乗算と、密度行列の減少を求める部分的トレースについて説明する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:43:46 GMT)
Distinguishing Cause from Effect with Causal Velocity Models [3.1] 本研究では,加法や位置スケールノイズなどの既知のモデルクラスを超えて,因果発見を行う手法を開発した。
スコアが適切に推定された場合、その目的はまた、モデルの非識別性や不特定性を検出するのにも有用である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:33:48 GMT)
Automatic Generation of Inference Making Questions for Reading Comprehension Assessments [3.0] 推論作成は読書理解(RC)において不可欠だが複雑なスキルである
本稿では、RCの推論型分類を導入し、診断RCアイテムバンク内のアイテムの分布を分析する。
本稿では, GPT-4o を用いて, 数発のプロンプトにより, 所与の読み出し経路に対してブリッジング推論RCアイテムを生成する実験を行った。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:50:12 GMT)
Comprehensive Review of Neural Differential Equations for Time Series Analysis [3.0] 本稿では,NDEに基づく時系列解析手法について概説する。
NDEは、ニューラルネットワークの柔軟性と微分方程式の数学的厳密さを組み合わせたパラダイムシフトを表している。
本稿では, それらの数学的定式化, 数値計算法, 応用に関する詳細な議論を行い, 連続時間力学をモデル化する能力を強調した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:27:24 GMT)
Can Hessian-Based Insights Support Fault Diagnosis in Attention-based Models? [2.9] 注意モデルにおける欠陥診断のためのヘッセン解析の可能性について検討する。
ヘシアン測度は,勾配のみよりも不安定性やピンポイント断層源の局所化を効果的に行うことができることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:40:32 GMT)
WeQA: A Benchmark for Retrieval Augmented Generation in Wind Energy Domain [2.9] Large Language Models (LLM) と Retrieval Augmented Generation (RAG) アプローチは、トランスフォーメーションソリューションを提供する。
本稿では,ドメイン関連RAGベンチマークを生成するための包括的なフレームワークを提案する。
風力エネルギー領域の第一級ベンチマークであるWeQAを導入することで、この枠組みを実証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:33:22 GMT)
SALT: A Lightweight Model Adaptation Method for Closed Split Computing Environments [2.8] SALTは、閉じた制約下でのSplit Computingのための軽量なモデル適応フレームワークである。
クライアント側でコンパクトでトレーニング可能なアダプタを導入し、ヘッドネットワークから潜在機能を洗練します。
微調整法に比べてトレーニング遅延が小さく,精度が向上した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:08:02 GMT)
Cognitive Weave: Synthesizing Abstracted Knowledge with a Spatio-Temporal Resonance Graph [2.8] 本稿では,多層動的共鳴グラフ(GSTR)を中心としたメモリフレームワークであるCognitive Weaveを紹介する。
GSTRはセマンティック・リッチ・インサイト・パーティクル(IP)として情報を管理し、専用のセマンティック・オーラル・インタフェース(ISO)を通じて共振鍵、シグニケータ、状況インプリントを付加する。
Cognitive Weaveの重要なコンポーネントは認知プロセスである。これは、高レベルの知識構造を凝縮した洞察集約(AsI)の合成を含む。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:00:46 GMT)
Remote Sensing Image Classification with Decoupled Knowledge Distillation [2.7] 本稿では,知識蒸留に基づく軽量な分類法を提案する。
提案手法は,パラメータ数を6.24倍に削減しつつ,ほぼ同等のTop-1精度を実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:02:29 GMT)
LLM-BT: Back-Translation as a Framework for Terminology Standardization and Dynamic Semantic Embedding [2.7] 我々は,大言語モデル(LLM)を利用した翻訳フレームワークである textbfLLM-BT を提案し,用語の検証と標準化を自動化する。
textbf(1) Term-Level Consistency Validation: Using English $rightarrow$ intermediate language $rightarrow$ English achieves back-translation。
textbf (3) セマンティック埋め込みとしてのバックトランスレーション:BTは動的セマンティック埋め込みとして概念化され、潜在意味を明らかにする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:39:09 GMT)
UniVarFL: Uniformity and Variance Regularized Federated Learning for Heterogeneous Data [2.7] UniVarFLは、IIDライクなトレーニングダイナミクスを直接クライアントレベルでエミュレートする新しいFLフレームワークである。
複数のベンチマークデータセットの実験では、UniVarFLが既存のメソッドよりも精度が高いことが示されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:25:35 GMT)
CaliciBoost: Performance-Driven Evaluation of Molecular Representations for Caco-2 Permeability Prediction [2.7] Caco-2の透過性は、初期薬物発見時の薬物候補の経口吸収を予測する重要なin vitro指標となる。
本研究では,2D/3D記述子,構造指紋,深層学習に基づく埋め込みを含む8種類の分子的特徴表現の影響について検討した。
PaDELとMordredの両方の表現に対して、3Dディスクリプタは2D機能のみを使用する場合に比べて15.73%削減された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:30:28 GMT)
OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis [2.6] 伝統的な中国医学(TCM)は、現代医療において重要な役割を担っている古代医学知識の豊富なリポジトリである。
TCMの文献の複雑さと広さのため、AIテクノロジの統合は、その近代化とより広範なアクセシビリティにおいて重要である。
本稿では、ドメイン固有のTCM知識グラフとグラフベースの検索拡張生成(GraphRAG)を組み合わせたLLMベースのOpenTCMを開発する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:34:27 GMT)
Algorithmic Aspects of Strategic Trading [2.6] 我々は、一時的な影響設定に対する最良の応答を計算するための効率的なアルゴリズムを提供する。
我々は、Follow the Perturbed Leaderの実装を通じて効率的に計算できることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:46:11 GMT)
Conservative Bias in Large Language Models: Measuring Relation Predictions [2.6] 大規模言語モデル(LLM)は、関係抽出タスクにおいて保守的なバイアスを示す。
このトレードオフを複数のプロンプト、データセット、関係型で体系的に評価する。
その結果,保守的偏見は幻覚の2倍の頻度で起こることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:20:18 GMT)
Digital Twin Synchronization: Bridging the Sim-RL Agent to a Real-Time Robotic Additive Manufacturing Control [2.6] この研究は、産業ロボット工学応用のためのソフトアクター・クライトとデジタルツインの統合を推進している。
システムアーキテクチャはUnityのシミュレーション環境とROS2を組み合わせて、シームレスなデジタル双対同期を実現する。
その結果、シミュレートされた環境と物理的環境の両方において、迅速な政策収束と堅牢なタスク実行が示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:33:56 GMT)
Domain Switching on the Pareto Front: Multi-Objective Deep Kernel Learning in Automated Piezoresponse Force Microscopy [2.5] 強誘電体偏極スイッチングは、幅広い材料や装置の機能的性能を支えている。
本稿では,画像データから直接スイッチング動作を規定するマイクロ構造規則を推論する多目的カーネル学習ワークフローを提案する。
強誘電体領域のスイッチングを実証する一方で、我々の手法は複雑で微分不可能な設計空間をナビゲートするための強力で一般化可能なツールを提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:58:27 GMT)
A Digital Twin Framework for Generation-IV Reactors with Reinforcement Learning-Enabled Health-Aware Supervisory Control [2.5] デジタルツインは、デジタルツールで現実世界のシステムを橋渡しし、コストを削減し、意思決定を強化し、運用効率を高める。
この研究では、Gen-IV Fluoride-salt-cooled High-Temperature Reactorを操作するために、デジタルツインフレームワークが設計されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:23:34 GMT)
Compiling Metric Temporal Answer Set Programming [2.4] 重要な課題は、きめ細かいタイミング制約を扱う際のスケーラビリティを維持することである。
我々は、差分制約(線形制約の単純化された形式)を備えたASPの拡張を活用して、時間関連の側面を外部で処理します。
われわれの手法は、計量ASPを時間の粒度から効果的に分離し、その結果、時間精度の影響を受けない解が得られる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:56:57 GMT)
Towards Energy-Efficient and Low-Latency Voice-Controlled Smart Homes: A Proposal for Offline Speech Recognition and IoT Integration [2.4] 既存のAI音声認識サービスは、主にインターネット上のクラウドプラットフォームにデプロイされている。
オフライン音声認識とIoT技術に基づくスマートホームの概念を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:15:48 GMT)
Open quantum battery in the background of a three-dimensional rotating black hole [2.4] ブラックホールの回転は、充電性能を有限時間で向上させる。
散逸と回転によって真空変動からエネルギーを抽出し、QBの容量を抑え、このエネルギーを抽出する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:06:47 GMT)
C3S3: Complementary Competition and Contrastive Selection for Semi-Supervised Medical Image Segmentation [2.3] 補間競合とコントラスト選択を統合した,新しい半教師付きセグメンテーションモデルであるC3S3を紹介する。
この設計は境界線を著しく鋭くし、全体的な精度を高める。
提案されたC3S3は、2つの公開データセットに対して厳格な検証を行っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:34:19 GMT)
Uncovering the Functional Roles of Nonlinearity in Memory [2.3] 我々は、繰り返しネットワークにおける非線形性の機能的役割を系統的に解明するために、性能比較を超えていく。
ニアリニアリカレントニューラルネットワーク(AL-RNN)を用いて非線形性に対するきめ細かい制御を可能にする。
最小の非線形性は十分であるだけでなく、しばしば最適であり、より単純で、より堅牢で、完全に非線形あるいは線形なモデルよりも解釈可能なモデルが得られる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:32:19 GMT)
Harnessing the Continuous Structure: Utilizing the First-order Approach in Online Contract Design [2.3] 本研究は,オンライン契約設計問題を研究する。
プリンシパルの目標は、反復的な相互作用を通じて彼女の効用を最大化する最適な契約を学ぶことである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:49:17 GMT)
Realistic Urban Traffic Generator using Decentralized Federated Learning for the SUMO simulator [2.3] DesRUTGeは、Deep Reinforcement LearningエージェントをSUMOシミュレータと統合し、現実的な24時間トラフィックパターンを生成する新しいフレームワークである。
DesRUTGeの重要な革新は、分散フェデレートラーニング(DFL)を使用することで、各トラフィック検出器とその対応する都市ゾーンが独立した学習ノードとして機能する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:51:45 GMT)
BioHopR: A Benchmark for Multi-Hop, Multi-Answer Reasoning in Biomedical Domain [2.3] 既存のベンチマークには、バイオメディカル領域におけるマルチホップ推論を評価する能力がない。
BioHopRは、構造化されたバイオメディカル知識グラフにおけるマルチホップ、マルチアンサー推論を評価するために設計された新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:31:09 GMT)
In-situ tuning of cavity dissipation and a topological transition in an atom-nanotip-cavity system [2.3] 原子空洞系における散逸率の調整法について検討する。
キャビティモードにナノチップを挿入することにより,キャビティの散逸率は約20倍に増加すると推定した。
単一原子またはイオンが共振器に結合されたときに、例外的な線が得られることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:27:22 GMT)
FlashDMoE: Fast Distributed MoE in a Single Kernel [2.2] FlashDMoEは、専門家の計算とGPU間通信を永続的なGPUカーネルに融合させる、完全にGPU対応のMoE演算子である。
我々は、FlashDMoEが、GPU使用率の高い textbf9$times$高レイテンシ、 textbf6$times$高スループット、 textbf5.7$高スループット、 textbf4$times$高重複効率であることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:15:13 GMT)
GANQ: GPU-Adaptive Non-Uniform Quantization for Large Language Models [2.1] GANQは、ハードウェア効率の良いルックアップテーブルベースのmpGEMMに最適化されたレイヤーワイズ後の非一様量子化フレームワークである。
広汎な実験は、3ビットおよび4ビット量子化の最先端手法と比較して、GANQのFP16ベースラインからのパープレキシティギャップを低減する能力を示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:15:20 GMT)
Non-degenerate Ground State of the Spin-Boson Model under Abelian Diagonalization [2.1] スピンボソンモデルの基底状態エネルギーは、縮退可能な最小の系よりも低く、一定のパリティを有することを証明した。
この式は量子モンテカルロ (QMC) 法と対数離散化数値再正規化群 (NRG) 法で得られた位相図を再現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:34:30 GMT)
Efficient Generation of Diverse Cooperative Agents with World Models [2.0] Zero-Shot Coordination (ZSC)エージェントのトレーニングプロセスにおける大きなボトルネックは、コラボレーションの慣行において多様なパートナーエージェントの生成である。
人口発生のための現在のクロスプレイ最小化(XPM)手法は、計算コストが非常に高く、サンプル非効率である。
提案手法は,SP集団訓練報酬とZSCエージェントのトレーニングパートナーの両面で,従来手法と一致した多様なコンベンションのパートナを効果的に生成できることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:52:45 GMT)
Image Reconstruction as a Tool for Feature Analysis [2.0] 本稿では,画像再構成による視覚特徴の解釈のための新しい手法を提案する。
画像ベースタスクで事前訓練されたエンコーダは、非画像タスクで訓練されたものよりも、はるかに多くの画像情報を保持することを示す。
我々のアプローチはどんな視覚エンコーダにも適用でき、特徴空間の内部構造に光を遮ることができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:32:18 GMT)
Evaluating Visual Mathematics in Multimodal LLMs: A Multilingual Benchmark Based on the Kangaroo Tests [2.0] MLLM(Multimodal Large Language Models)は先進的な視覚言語能力を約束するが、視覚的に提示された数学におけるその有効性は未解明のままである。
本稿では,図形,多言語テキスト,記号表記に着目し,数学的問題解決のためのMLLMの開発と評価を行う。
GPT 4o, Pixtral, Qwen VL, Llama 3.2 Vision, Gemini 2.0 Flashなど,英語,フランス語,スペイン語,カタルーニャ語にまたがる多言語カンガルースタイルのベンチマークを評価した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:35:02 GMT)
Denoising the Future: Top-p Distributions for Moving Through Time [2.0] 動的確率モデルにおける推論は、高価な操作を含む複雑なタスクである。
我々は,トップp状態のみを用いることで,未来を認知し,推論を高速化することを提案する。
我々は少なくとも1桁のスピードアップを期待でき、全変動距離の誤差は0.09以下であることを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:23:09 GMT)
PropEnc: A Property Encoder for Graph Neural Networks [2.0] PropEncは、グラフメトリックから表現的ノード埋め込みを生成する、新しくて汎用的なエンコーダである。
PropEncは、低次元表現と多様な入力タイプをサポートする柔軟なソリューションを提供する。
ノード機能に欠ける複数のソーシャルネットワークにおけるグラフ分類タスクの広範な実験を通じて、PropEncを検証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:26:59 GMT)
A System for Accurate Tracking and Video Recordings of Rodent Eye Movements using Convolutional Neural Networks for Biomedical Image Segmentation [2.0] 視線決定における瞳孔および角膜反射の同定のための柔軟で頑健で高精度なモデルを提案する。
これは、高度に正確で実用的なバイオメディカルイメージセグメンテーションに基づく畳み込みニューラルネットワークアーキテクチャを実証した最初の論文である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:48:32 GMT)
AI-Assisted Rapid Crystal Structure Generation Towards a Target Local Environment [1.9] 局所環境幾何配向結晶発生器(LEGO-xtal)と呼ばれる対称性インフォームドAI生成手法を提案する。
提案手法は、拡張された小さなデータセットに基づいて訓練されたAIモデルを用いて初期構造を生成する。
本研究では,25個の低エネルギーのsp2炭素同素体から1,700個以上の黒鉛の基底状態エネルギー0.5eV/原子に拡張することでLEGO-xtalの有効性を実証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:47:36 GMT)
Ensemble-Based Survival Models with the Self-Attended Beran Estimator Predictions [1.9] 本稿では,SurvBESA(Survival Beran Estimators Self-Attended)を提案する。
従来の方法とは異なり、SurvBESAは生存関数の予測に自己注意を適用し、各生存関数を調整することでノイズを滑らかにする。
数値実験により、SurvBESAは最先端モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:53:25 GMT)
Learning shallow quantum circuits with many-qubit gates [1.9] 本稿では,多くの量子ゲートを持つ浅量子回路の平均ケース学習のための,計算効率のよい最初のアルゴリズムを提案する。
学習したユニタリ回路は多対数深度で効率的に合成可能であることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:20:46 GMT)
Innate-Values-driven Reinforcement Learning based Cognitive Modeling [1.8] 本来の価値観はエージェントの本質的なモチベーションを表しており、エージェントの本来の関心や目標追求の好みを反映している。
本稿では,本モデルと期待効用理論を組み合わせた固有値駆動型(IVRL)と呼ばれる新しいRLモデルを提案する。
VILベースのモデルは、エージェントが様々なニーズを合理的に整理し、より効果的なパフォーマンスを実現するのに役立つことを実証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:52:45 GMT)
Edge Computing based Human-Robot Cognitive Fusion: A Medical Case Study in the Autism Spectrum Disorder Therapy [1.8] 近年,エッジコンピューティングは,AIやロボティクス,IoT,高速ワイヤレスセンサネットワーク(5Gなど)など,多くの未来のテクノロジを実現するパラダイムとして機能している。
本稿では,人間の専門家と協力するロボットを併用したエッジ認知コンピューティングのアーキテクチャを提案し,シームレスな遠隔診断,ラウンド・ザ・タイムの症状モニタリング,緊急警報,セラピー修正,高度な支援を実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:32:39 GMT)
Gradients: When Markets Meet Fine-tuning -- A Distributed Approach to Model Optimisation [1.8] Gradientsは、ハイパーパラメータの最適化を競争力のあるマーケットプレースに変換する、分散型のAutoMLプラットフォームです。
経済的なインセンティブは、個人の探索と集合的な最適化目標を一致させる。
多様なモデルアーキテクチャとタスクタイプにまたがる180の制御実験に対するアプローチを評価した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:00:38 GMT)
Data-driven inventory management for new products: An adjusted Dyna-$Q$ approach with transfer learning [1.8] 本稿では,過去の需要情報を持たない新商品の在庫管理のための新しい強化学習アルゴリズムを提案する。
このアルゴリズムは、モデルフリーとモデルベースアプローチのバランスをとる古典的なDyna-$Q$構造に従っている。
転送学習の考え方に基づいて、既存の類似商品の需要データからウォームスタート情報をアルゴリズムに組み込むことができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:45:53 GMT)
Schauder Bases for $C[0, 1]$ Using ReLU, Softplus and Two Sigmoidal Functions [1.8] 空間$C[0,1]$のシューダー基底を4つ構築し、一方はReLU関数を使い、もう一方はSoftplus関数を使い、もう一方はReLU関数とSoftplus関数のシグモダルバージョンを使う。
これにより、これらの関数を初めて使用する基底の存在が確立され、それらに関連する普遍近似特性が向上する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:55:43 GMT)
SILK: Smooth InterpoLation frameworK for motion in-betweening A Simplified Computational Approach [1.8] 動きの切り替えはアニメーターにとって重要なツールであり、ポーズごとにポーズレベルの詳細を制御できる。
最近の動きの機械学習ソリューションは、複雑なモデル、スケルトン対応アーキテクチャ、あるいは複数のモジュールとトレーニングステップを必要とする。
本研究では,トランスフォーマーをベースとした単一エンコーダを用いて,現実的な動きを合成するシンプルなフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:26:27 GMT)
Error-Mitigated Quantum Metrology via Probabilistic Virtual Purification [1.7] 短期量子距離論は、しばしばノイズによって制約される。
ほぼ蓄積した雑音に対処する仮想チャネル浄化法が提案されている。
誤差解析の結果,サンプリングコストにおいてバイアスが著しく減少し,量子的優位性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:31:12 GMT)
Creating a Historical Migration Dataset from Finnish Church Records, 1800-1920 [1.7] 1800年から1920年の間、フィンランドにおける内部移動の構造化されたデータセットを、デジタル化された教会移動記録を用いて作成する。
データセットには、手書きのマイグレーションレコードの約20万の画像から抽出された600万以上のエントリが含まれている。
このデータセットは、内陸部の移動、都市化、家族の移動、およびフィンランドにおける病気の拡散を研究するのに利用できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:32:55 GMT)
Cost of Locally Approximating High-Dimensional Ground States of Contextual Quantum Models [1.6] 量子相関の最も強い形式の1つである文脈性は、量子世界と古典的世界を説明する。
いくつかの量子モデルは、無限の1次元の変換不変なハミルトン多様体の形で、量子物理学で許容される最低基底状態エネルギー密度を持つ。
そこで我々は,量子ビット型ゲートをアンザッツとして用いて,量子回路のパラメータ化をシミュレートする置換対称性の普遍的集合を開発した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:32:17 GMT)
PoSyn: Secure Power Side-Channel Aware Synthesis [1.6] PoSynは、PSC攻撃に対する暗号ハードウェアの耐性を高めるために設計された新しい論理合成フレームワークである。
我々は、AES、RSA、PreSENT、SaberやCRYSTALS-Kyberといったポスト量子暗号アルゴリズムなど、さまざまな暗号ハードウェア実装のPoSynを評価する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:41:47 GMT)
ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT [1.6] 本研究は,電子商取引データの文脈において,モデルに情報を加えることによって翻訳を改善する方法について検討する。
チェコ語からポーランド語への新しいeコマース製品翻訳データセットであるConECTを作成します。
我々は視覚言語モデル(VLM)を検証し、視覚コンテキストが翻訳品質に役立つことを発見した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:39:22 GMT)
AI-based Framework for Robust Model-Based Connector Mating in Robotic Wire Harness Installation [1.5] 我々は、力制御と深層ビゾタクティル学習を統合することで、ケーブルコネクタの配座を自動化する新しいAIベースのフレームワークを設計する。
視覚的・触覚的・受容的データに基づいて学習したマルチモーダルトランスフォーマーアーキテクチャ上での1次最適化を用いた探索・挿入戦略を最適化する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:41:53 GMT)
Reliable Collaborative Conversational Agent System Based on LLMs and Answer Set Programming [1.5] 我々は、ASP駆動のボットが同じ知識ベースを共有し、割り当てられたタスクを独立して完了する、マネージャ-顧客-サービスデュアル-エージェントパラダイムを提案する。
AutoManagerでは、カスタマーサービスボットが顧客の注文を受け、マネージャボットがメニューと食品の供給を管理します。
我々はAutoManagerシステムを評価し,現実のTaco Bell Drive-Thru AI Order Takerと比較した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:41:15 GMT)
MBTModelGenerator: A software tool for reverse engineering of Model-based Testing (MBT) models from clickstream data of web applications [1.5] このツールはUIイベントをキャプチャして状態遷移モデルに変換し、その結果をGraphWalker MBTツールと互換性のあるフォーマットでエクスポートする。
本報告では, システム要件, 設計決定, 実装詳細, テストプロセス, ツールの実証評価について報告する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:44:10 GMT)
SMRS: advocating a unified reporting standard for surrogate models in the artificial intelligence era [1.5] 我々は、サロゲートモデルのための構造化レポート標準を確立する緊急の必要性を論じる。
標準化されながらフレキシブルなフレームワークを推進することによって、サロゲートモデリングの信頼性を向上させることを目指している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:01:25 GMT)
Learning-Based Multiuser Scheduling in MIMO-OFDM Systems with Hybrid Beamforming [1.4] 周波数分割多重化(OFDM)とハイブリッドビームフォーミングを用いたマルチ入力多重出力(MIMO)システムにおけるマルチユーザスケジューリング問題について検討する。
スケジューリングを行うために、グリージーやソートアルゴリズムなどのソリューションを提案し、次に機械学習(ML)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:59:05 GMT)
Repeton: Structured Bug Repair with ReAct-Guided Patch-and-Test Cycles [1.4] 大規模言語モデル(LLM)は、コード生成と理解において強力な能力を示しているが、複雑なソフトウェアエンジニアリングタスクへの応用は、しばしば低い精度と限定的な解釈可能性に悩まされている。
実世界のGitの正確かつ自動化されたコード操作にLLMを活用する、完全にオープンソースなフレームワークであるRepetonを紹介します。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:36:40 GMT)
MacroSwarm: A Field-based Compositional Framework for Swarm Programming [1.4] 本稿では,新しいフィールドベースのコーディネーション手法であるMacroSwarmを提案し,Swarmの動作を設計・プログラムする。
集約コンピューティングのマクロプログラミングパラダイムに基づいて、MacroSwarmは、各Swarm動作ブロックを純粋関数として表現するという考え方に基づいている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:14:13 GMT)
A Theory of Machine Understanding via the Minimum Description Length Principle [1.4] エンド・ツー・エンドの学習モデルでは、学習内容が"理解"できないことを示す。
言い換えれば、説明可能な表現は、単に深いネットワークを最小記述長の原理に従うようにすることで、自己監督的な方法で現れる。
この研究は完全に理論的であり、自己管理型説明可能なAIに向けた将来の研究を刺激することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:50:27 GMT)
Swiss Parliaments Corpus Re-Imagined (SPC_R): Enhanced Transcription with RAG-based Correction and Predicted BLEU [1.4] 本稿では,スイス議会コーポレーション(Swiss Parliaments Corpus)の長期的リリースについて述べる。
私たちのパイプラインは、すべてのセッションオーディオをWhisper Large-v3を使って、高速な設定で標準ドイツ語に書き起こすことから始まります。
次に、2段階のGPT-4o補正プロセスを適用し、まず、GPT-4oがWhisper出力を公式プロトコルとともに取り込み、主に名前付きエンティティの認識を洗練させる。
最終的なコーパスには801時間分のオーディオが含まれており、そのうち751時間は品質管理に合格する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:11:18 GMT)
Private Memorization Editing: Turning Memorization into a Defense to Strengthen Data Privacy in Large Language Models [1.3] プライベートデータ漏洩防止のためのPME(Private Memorization Editing)を提案する。
我々は、記憶されたPIIを検出し、トレーニングデータのモデル知識を編集することで、PIIの記憶を緩和する。
PMEは、多くの構成においてリークしたPIIの数を効果的に減らすことができ、場合によってはプライバシー攻撃の精度をゼロにすることもある。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:57:43 GMT)
Integrating Project Spatial Coordinates into Pavement Management Prioritization [1.3] 本研究では,舗装セグメントの空間座標をM&R優先順位付け解析に組み込む新しい手法を提案する。
提案手法は,舗装セグメントと収束した空間座標を同じ時間軸で修復することを目的としている。
開発したアルゴリズムは,2つの実例から1,800個の舗装維持プロジェクトを用いて検証した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:47:17 GMT)
Pel, A Programming Language for Orchestrating AI Agents [1.2] Pelは関数/ツール呼び出しと直接コード生成のギャップを埋めるために設計された新しいプログラミング言語である。
Lisp、Elixir、Gleam、Haskellの強みに触発されたPelは、構文的にシンプルで、ホモシニックで、セマンティックにリッチなプラットフォームを提供する。
主な特徴は、線形合成のための強力な配管機構、簡単な部分的アプリケーションと機能パターンを可能にするファーストクラスクロージャ、LLMが評価する自然言語条件のビルトインサポート、Common Lispスタイルの再起動を備えた高度なRead-Eval-Print-Loop(REPeL)、自動化のためのLLMベースのヘルパーエージェントである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:05:20 GMT)
The Many Challenges of Human-Like Agents in Virtual Game Environments [1.2] この記事では、ゲームで人間のようなAIを実装する上で最も重要な課題について調査する。
独自のディープリカレント畳み込みニューラルネットワークを用いた機械学習手法を提案する。
特定のゲームのために人間のようなAIを作るのが難しいほど、AI駆動のプレイヤーと人間を区別する手法を開発するのが簡単になる、という仮説を立てる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:57:51 GMT)
Benchmarking Pre-Trained Time Series Models for Electricity Price Forecasting [1.2] 我々は、電力価格予測のための確立された統計および機械学習(ML)手法に対して、最先端の事前訓練モデルをいくつかベンチマークする。
ドイツ、フランス、オランダ、オーストリア、ベルギーの2024日の日頭オークション(DAA)の電力価格を用いて、1日当たりの予想を下方修正する。
Chronos-BoltとTime-MoEはTSFMの中でも最強で、従来のモデルと同等のパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:10:00 GMT)
Eliciting Fine-Tuned Transformer Capabilities via Inference-Time Techniques [1.1] 大規模言語モデルは自然言語処理に変化をもたらしたが、教師付き微調整(SFT)は計算集約的のままである。
本稿では,SFTにより得られた能力をベーストランスモデルにより近似できることを正式に証明する。
これらの結果を、有限コンテキスト長と部分データセットアクセスを備えた実用的なシナリオに拡張する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:37:19 GMT)
A Proposal to Extend the Common Model of Cognition with Metacognition [1.1] 認知の共通モデルにメタ認知を統合する統一的なアプローチを提案する。
本提案では,CMCの既存の認知機能を活用し,動作メモリ内で利用可能な構造や情報の最小限の拡張を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:35:48 GMT)
Anomaly Detection and Early Warning Mechanism for Intelligent Monitoring Systems in Multi-Cloud Environments Based on LLM [1.1] 大規模言語モデル(LLM)に基づくマルチクラウド環境におけるインテリジェントモニタリングシステムの異常検出と早期警告機構を提案する。
既存のモニタリングフレームワークに基づいて,提案手法は,異常検出の精度を高め,リアルタイム応答効率を向上させるマルチレベル特徴抽出手法を革新的に導入する。
実験結果から,提案手法は検出精度とレイテンシの観点から従来の異常検出システムよりも有意に優れており,クラウドインフラストラクチャのレジリエンスとアクティブな管理能力を大幅に向上させることが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:00:23 GMT)
An Intelligent Fault Self-Healing Mechanism for Cloud AI Systems via Integration of Large Language Models and Deep Reinforcement Learning [1.1] 大規模言語モデル(LLM)と深層強化学習(DRL)を統合したインテリジェントフォールト自己修復機構(IFSHM)を提案する。
IFSHMは,クラウドAIシステムにおけるセマンティック理解とポリシ最適化機能を備えた障害復旧フレームワークの実現を目的としている。
クラウドフォールトインジェクションプラットフォームの実験的結果は、既存のDRLとルールメソッドと比較して、IFSHMフレームワークが未知の障害シナリオでシステムリカバリ時間を37%短縮することを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:14:05 GMT)
TissUnet: Improved Extracranial Tissue and Cranium Segmentation for Children through Adulthood [1.1] 頭蓋骨,皮下脂肪,筋肉を3次元T1強調MRIから抽出する深層学習モデルTissUnetを提案する。
このモデルは155対のMRI断層撮影(CT)スキャンでトレーニングされ、9つのデータセットで検証された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:05:21 GMT)
Scaling Human Activity Recognition: A Comparative Evaluation of Synthetic Data Generation and Augmentation Techniques [1.1] HAR(Human Activity Recognition)は、ラベル付きデータセットの不足によってしばしば制限される。
近年, 仮想慣性測定ユニット(IMU)データの生成について, クロスモーダル転送による検討が行われている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:25:53 GMT)
CrosswalkNet: An Optimized Deep Learning Framework for Pedestrian Crosswalk Detection in Aerial Images with High-Performance Computing [1.0] 本研究は,多様な歩行者横断歩道を検出するための,堅牢で効率的なディープラーニングフレームワークであるCrosswalkNetを紹介する。
23,000以上のアノテーション付き横断歩道インスタンスからなるデータセットを使用して、提案したフレームワークをトレーニングし、検証する。
最高の性能モデルは96.5%の精度で、マサチューセッツ州の航空画像では93.3%の精度でリコールされている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:56:24 GMT)
Towards the Influence of Text Quantity on Writer Retrieval [1.0] 著者検索は、手書きの類似性に基づいて、データセット内で同じ個人によって作成された文書を識別する。
本稿では,手工芸と深層学習の両方のアプローチを含む,最先端のライター検索システムについて検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:05:15 GMT)
Addition in Four Movements: Mapping Layer-wise Information Trajectories in LLMs [1.0] LLaMA-3-8B-インストラクタの内部演算過程を解析する。
人間が追加を行うステップバイステップ方式に着想を得て,コヒーレントな4段階軌道の提案と解析を行った。
出力の近くで、モデルが最終内容を整理し、生成し、正しいトークンが上位ランクを確実に占有する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:48:43 GMT)
Evaluating Zero-Shot Multilingual Aspect-Based Sentiment Analysis with Large Language Models [1.0] 我々は,大規模言語モデル(LLM)をゼロショット条件下で評価し,ABSA課題に取り組む可能性を探る。
本稿では,バニラゼロショット,チェーン・オブ・シント(CoT),自己改善,自己議論,自己整合性など,様々な促進策について検討する。
その結果、LLMは多言語ABSAを扱う上での有望性を示すが、一般的には細調整されたタスク固有モデルに欠けることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:09:25 GMT)
The Lie Algebra of XY-mixer Topologies and Warm Starting QAOA for Constrained Optimization [0.9] XYミキサーは、変分量子アルゴリズムを含む現代の量子コンピューティングで広く利用されている。
我々は、様々な$XY$-mixer位相に付随する動的リー代数の明示的な分解を与える。
我々はこれらの概念をPortfolio Optimization, Sparsest $k$-Subgraph, Graphing で示す数値シミュレーションを行った。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:49:16 GMT)
Minoritised Ethnic People's Security and Privacy Concerns and Responses towards Essential Online Services [0.9] 本研究は、少数民族の安全とプライバシの懸念、態度、行動に焦点をあてる。
英国における様々な少数民族に対する44の半構造化インタビューのテーマ分析を行った。
プライバシーに関する懸念と個人情報のコントロールの欠如が主要なテーマとして浮上し、多くのインタビュアーは、プライバシーをオンラインサービスを使用する際の最も重要な関心事として考えている。
我々は、より包括的で、疎外的で、プライバシーに配慮したオンラインサービスの設計について学んだ教訓を提供するために、その結果を描きます。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:10:55 GMT)
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery [0.8] 我々は、当初、約10,610人の高品質な人間のピアランク写真画像からなるDataSeeds.AIサンプルデータセット(DSD)を紹介した。
DSDは、商用画像データセットの新しい標準となるように設計された基礎的なコンピュータビジョンデータセットである。
我々は、DSDが既知のベンチマークに対する特定のモデルに対して生成した量的改善を文書化し、我々の評価で使用されるコードとトレーニングされたモデルを一般公開する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:48:46 GMT)
Nearness of Neighbors Attention for Regression in Supervised Finetuning [0.8] 我々はNearness of Neighbors Attention (NONA)レグレッション層を紹介する。
NONAは、ニューラルネットワークの注意の力学と、k-NN回帰アルゴリズムの微分可能なプロキシを生成するために、新しい学習されたアテンションマスキングスキームを使用する。
複数の非構造化データセットの結果は、回帰のためのSFT埋め込みにおいて、高密度層予測とk-NNの両方よりも性能が向上したことを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:41:48 GMT)
Extending Internet Access Over LoRa for Internet of Things and Critical Applications [0.8] ILoRaは、LoRaのバックボーンネットワークを介して、インターネット上のアプリケーションプログラミングインタフェース(API)とWebページへのアクセスを可能にする。
本研究はILoRaの提案と実装を行い,本質的なサービス提供のために公共インターネットを非接続領域に拡張する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:55:53 GMT)
Evaluating explainable AI for deep learning-based network intrusion detection system alert classification [0.8] ネットワーク侵入検知システム(NIDS)は、サイバー攻撃やその他の不要な活動のネットワークを監視する。
NIDSソリューションは、しばしば毎日圧倒的な数のアラートを発生させるため、アナリストが優先度の高い脅威を優先順位付けすることは困難である。
本研究は、信頼と解釈性を改善するために、NIDS警告分類における説明可能な人工知能(XAI)の重要性を強調した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:53:30 GMT)
Quantum Resource Comparison for Two Leading Surface Code Lattice Surgery Approaches [0.8] ハミルトンシミュレーションは量子優位性の実証の最も有望な候補の1つである。
最適スキームは量子信号処理を用いてハミルトニアンシミュレーションを実装するかどうかに依存することを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:46:32 GMT)
Aircraft Trajectory Dataset Augmentation in Latent Space [0.8] 本稿では,航空機軌道データセット拡張のための新しいフレームワークであるATRADAを提案する。
Transformer Encoderは、元のトラジェクトリデータセットの下位パターンを学習する。
新しいサンプルは、実装されたGMMから引き出され、サンプルの寸法は元の次元に戻され、それらをマルチ層パーセプトロンで復号する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:29:37 GMT)
Beyond Benchmarks: A Novel Framework for Domain-Specific LLM Evaluation and Knowledge Mapping [0.8] 本稿では,言語モデル(LM)評価における2つの重要な課題として,信頼性の高いドメイン固有ベンチマークの作成と,ドメイン適応時の知識表現の理解について論じる。
本稿では,LMや人為的なキュレーションに頼らずに,生のドメインコーパスを補完型ベンチマークに変換する決定論的パイプラインを提案する。
提案手法は,TFとTF-IDFを用いたドメイン固有キーワードと関連する単語リストを生成し,プロンプトとターゲットのペアを構築する。
我々は,これらのプロンプトを適切なドメイン固有ターゲットで完了させる能力を測定し,計算コストの低いドメイン知識を直接評価することによって,モデルを評価する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:30:12 GMT)
Federated Learning on Stochastic Neural Networks [0.7] 本稿では,ニューラルネットワークをフェデレート学習フレームワーク内の局所モデルとして用いることを提案する。
本稿では,本手法,特に非独立分散データと同一分散データを扱う実験について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:28:39 GMT)
Correlated Errors in Large Language Models [0.7] リーダーボードデータセットのモデルエラーには,かなりの相関関係がある。
共有アーキテクチャやプロバイダを含むモデル相関を駆動する要因を特定します。
LLM-as-judge 評価と雇用という2つの下流課題における相関の効果を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:37:18 GMT)
Towards a Small Language Model Lifecycle Framework [0.7] 本研究は,小言語モデルのための包括的ライフサイクル・フレームワークを定義することを目的とする。
本稿では,主,オプション,横断的なコンポーネントで構成されたモジュール型ライフサイクルモデルを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:33:05 GMT)
Random Exclusion Codes: Quantum Advantages of Single-Shot Communication [0.7] 双方向通信プリミティブであるRandom Exclusion Code (REC)は、シングルショットの準備と測定のためのプロトコルである。
量子資源を持つRECは古典的戦略よりも高い成功確率が得られることを示す。
また,従来の資源に比較して,ランダムアクセス符号 (RAC) は次元的優位性を持たない可能性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:40:10 GMT)
A Systematic Literature Review on Continuous Integration and Deployment (CI/CD) for Secure Cloud Computing [0.6] 継続的ソフトウェアエンジニアリングは、ソフトウェア開発とデプロイメントに不可欠です。
66の論文、ツールの要約、アプローチ、クラウドにおけるCI/CDのセキュリティに関する課題についてレビューしました。
画像操作、不正アクセス、弱い認証といった課題が強調された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:21:29 GMT)
OG-HFYOLO :Orientation gradient guidance and heterogeneous feature fusion for deformation table cell instance segmentation [0.6] OG-HFYOLOモデルを提案し、グラディエント・オリエンテーション・アウェア・エクストラクタによるエッジ応答を向上させる。
また,細粒度テーブルセル空間座標定位のためのデータセットのギャップを埋めるデータ生成器を提案する。
実験により,本モデルが主流のインスタンスセグメンテーションモデルに対して優れたセグメンテーション精度を示すことが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:44:39 GMT)
A Generative Physics-Informed Reinforcement Learning-Based Approach for Construction of Representative Drive Cycle [0.6] PIESMCは、過渡的ダイナミクス、加速度、減速、アイドリング、道路グレード遷移を捉えることで駆動サイクルを構築する。
計算コストを削減した効率的なサイクル構成を提供する。
従来の技術よりも桁違いに速い。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:44:42 GMT)
Understanding and Improving Data Repurposing [0.6] 我々は、これらのデータが収集されたときに予期されなかったタスクに既存のデータを使うという前例のない機会に生きている。
本稿では,従来のデータ利用やデータ再利用とどのように異なるのかを説明し,既存のデータを新しいタスクに適応させるための概念と活動からなるデータ再利用のためのフレームワークを開発する。
我々は、データ再資源化をよりよく理解し、より効果的なデータ再資源化の実践を可能にする研究の機会を提案することで締めくくります。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:33:47 GMT)
Recommendations and Reporting Checklist for Rigorous & Transparent Human Baselines in Model Evaluations [0.6] ヒューマンパフォーマンスのベースラインは、機械学習コミュニティ、下流のユーザ、そして政策立案者がAI評価を解釈するために不可欠である。
モデルは「超人的」な性能を達成するとしばしば主張されるが、既存のベースライン法は十分な厳密さも十分に文書化されておらず、性能の違いをしっかりと測定し評価することができない。
我々は,提案する勧告を,基礎モデル評価において115人のベースラインを体系的にレビューするために使用するチェックリストに合成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:08:16 GMT)
Neural networks for the prediction of peel force for skin adhesive interface using FEM simulation [0.6] 皮膚組織からの接着剥離に必要な最小剥離力を予測するために,ニューラルネットワークを用いたアプローチを提案する。
本モデルでは,厳密な5倍のクロスバリデーションによる精度の検証を行った。
本研究は, 粘着挙動を予測し, 精度を保ちながらシミュレーション時間を著しく短縮する信頼性, 計算効率のよい手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:22:00 GMT)
Understanding the Error Sensitivity of Privacy-Aware Computing [0.5] ホモモルフィック暗号化(HE)は、復号化せずに暗号化データのセキュアな計算を可能にする。
本研究では, HEアプリケーションのビット断層に対する感度に関する詳細な議論を動機付け, CKKS(Cheon-Kim-Kim-Song)の詳細な誤差解析を行った。
CKKSは、AIおよび機械学習アプリケーションのための固定点演算をサポートするため、最も人気のあるHEスキームの1つである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:27:40 GMT)
APE: Selective Fine-tuning with Acceptance Criteria for Language Model Adaptation [0.5] APEは、パラメータの不安定化を防止し、体系的な改善を可能にするフィルタ選択プロセスを実装している。
本手法は,ニュース要約タスクにおけるBLEU改善率33.9%,複雑度36.2%の削減を実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:21:49 GMT)
Measuring NIST Authentication Standards Compliance by Higher Education Institutions [0.5] 本稿では,米国とカナダの大学135校の認証方針について検討する。
組織にまたがって多要素認証が広く展開されているが、普遍的ではない。
また,パスワードの有効期限,パスワード構成規則,知識に基づく認証などの時代遅れな利用も見いだす。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:58:03 GMT)
Highly Compressed Tokenizer Can Generate Without Training [0.5] 1D画像トークン化器は、画像を32個の離散トークンの高度に圧縮された1次元シーケンスとして表現する。
ベクトル量子化による1次元トークン化器によって達成される高い圧縮により,画像の編集と生成が可能であることがわかった。
本手法は, 画像編集における画像の塗り絵やテキストガイドに応用でき, 生成モデルの訓練を必要とせず, 多様な実例を生成できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:45:03 GMT)
Markerless Multi-view 3D Human Pose Estimation: a survey [0.5] 3D人間のポーズ推定は、人体の関節を検出することによって人間の骨格を再構築する。
アニメーション、人間とロボットのインタラクション、監視、スポーツなど、いくつかの現実世界のアプリケーションには、正確で効率的なソリューションが必要である。
しかし、オクルージョンや2Dポーズミスマッチ、ランダムカメラの視点、限られた3Dラベル付きデータといった課題は、モデルの性能を妨げている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:57:32 GMT)
The Impact of Feature Scaling In Machine Learning: Effects on Regression and Classification Tasks [0.5] 本研究は、14の機械学習アルゴリズムと16のデータセットにまたがる12のスケーリングテクニックを体系的に評価することで、機能スケーリングに関する包括的な研究が欠如していることに対処する。
我々は、予測性能(精度、MAE、MSE、R2$など)と計算コスト(トレーニング時間、推論時間、メモリ使用量)への影響を慎重に分析した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:32:51 GMT)
SeDe: Balancing Blockchain Privacy and Regulatory Compliance by Selective De-Anonymization [0.5] 我々は、Selective De-Anonymization (SeDe) と呼ばれる規制および準拠のフレームワークを確立することにより、プライバシ保護機能のバランスをとるフレームワークを提案する。
我々の技術は、匿名化の決定や制御を単一のエンティティに残さずに、複数のエンティティに分散させながら、それぞれのアクションに責任を負うことなく、これを実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:21:01 GMT)
RiemannFormer: A Framework for Attention in Curved Spaces [0.4] この研究は、トランスフォーマーベースのアーキテクチャのさらなる可能性を解き放つための洞察を提供する努力である。
主な動機の1つは、変圧器における注意機構の幾何学的解釈を提供することである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:56:18 GMT)
Preprocessing Methods for Memristive Reservoir Computing for Image Recognition [0.4] Reservoir Computing (RC) は効率的なリカレントニューラルネットワークアーキテクチャとして注目されている。
メムリスタで実装する場合、RC系はその動的特性から恩恵を受け、貯水池建設に最適である。
本稿では, 経験的RCシステムにおける各種前処理手法を系統的に比較し, 精度とエネルギー消費に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:55:03 GMT)
Are Trees Really Green? A Detection Approach of IoT Malware Attacks [0.4] Internet of Things(IoT)デバイスは、リソースの制約とセキュリティパッチの適用の難しさにより、依然として脆弱である。
本稿では,フローのプライバシ保存による統計的特徴に基づくIoTマルウェアネットワーク攻撃を識別するグリーン手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:01:04 GMT)
Maximum Separation of Quantum Communication Complexity With and Without Shared Entanglement [0.3] 入力サイズが$n$である関係問題を、絡み合い支援量子通信モデルのための通信無しで解くことができる。
これは、共有絡み合いと非共有絡み合いによる量子通信複雑性の最大分離である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:58:02 GMT)
Broadband and high-precision two-level system loss measurement using superconducting multi-wave resonators [0.3] 2レベル系(TLS)は超伝導量子ビットにおける散逸と脱コヒーレンスの主要な原因として知られている。
量子状態における共振器のTLSによる損失を正確に測定することは、低信号-雑音比(SNR)とTLSの時間的変動のために困難である。
我々は、共振器長を標準のクォーター波$lambda/4$から$Nlambda/4$へと拡張するマルチウェーブ共振器装置を開発し、6GHzで$N = 37$となる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:33:46 GMT)
Enhanced Consistency Bi-directional GAN(CBiGAN) for Malware Anomaly Detection [0.3] 本稿では,マルウェア異常検出分野におけるCBiGANの適用について紹介する。
我々は、ポータブル実行可能ファイル(PE)とObject Linking and Embedding(OLE)ファイルの両方を含む、いくつかのデータセットを利用する。
次に,214のマルウェアファミリーから自己コンパイルされた悪意のある実行ファイルを含む,PEおよびOLEファイルの多種多様なセットに対して,我々のモデルを評価した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 02:43:25 GMT)
Generative Learning of Differentiable Object Models for Compositional Interpretation of Complex Scenes [0.2] この研究は、DVP(Disentangler of Visual Priors)のアーキテクチャに基づく。
DVPは、認識された物体を、形状、大きさ、配向、色見性の独立した視覚的側面に分解することで、シーンを解釈することを学ぶ。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:06:42 GMT)
Comparing Credit Risk Estimates in the Gen-AI Era [0.2] 生成AI技術は多様なアプリケーションにまたがって大きな可能性を示してきた。
本研究は、従来の手法と、生成的AIを活用する方法とを比較して、クレジットスコアモデリング手法の比較分析を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:37:04 GMT)
Generative Voice Bursts during Phone Call [0.2] 本稿では,現在進行中の通話中に音声を短時間で,文脈に配慮した音声メッセージを送信するための新しい手法を提案する。
生成AI技術を活用することで、システムはコンテキスト入力から音声メッセージを自動生成する。
このソリューションには音声、テキスト、優先度推論機構が含まれており、優先度の高い緊急メッセージを従来の呼び出し待ち障壁をバイパスすることができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:10:43 GMT)
Spectral Domain Neural Reconstruction for Passband FMCW Radars [0.2] 本研究では,周波数変調連続波レーダを用いた高忠実度ボリューム再構成のためのニューラルネットワークSpINRv2を提案する。
我々のコアコントリビューションは、クローズドフォーム合成を用いて複雑なレーダ応答をキャプチャする、完全微分可能な周波数領域フォワードモデルである。
細かな範囲の解像度で生じる曖昧なサブビンの曖昧さを解消するために、スパーシリティと正規化を導入する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:21:27 GMT)
Temporalizing Confidence: Evaluation of Chain-of-Thought Reasoning with Signal Temporal Logic [0.1] 本稿では,段階的信頼度を時間的信号としてモデル化し,STL(Signal Temporal Logic)を用いて評価する構造化フレームワークを提案する。
特に,定型的なSTLに基づく制約を定義し,望ましい時間特性と,構造化された解釈可能な信頼度推定として機能するスコアを求める。
本手法はキャリブレーションの指標を常に改善し,従来の信頼度集計やポストホックキャリブレーションよりも信頼性の高い不確実性推定を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:21:12 GMT)
A Computational Harmonic Detection Algorithm to Detect Data Leakage through EM Emanation [0.1] EMエマニュエーションと呼ばれる意図しない電磁放射は、機密情報を回復するために利用することができる。
データ漏洩を防ぐために防衛組織が使用する金属遮蔽は費用がかかり、広く使われるには実用的ではない。
本稿では,高調波検出アルゴリズムを用いた高調波検出手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:38:04 GMT)
Enhancing Measurement Precision of Non-Degenerate Two-Photon Absorption [0.1] 伝送測定から得られた非縮退型2光子吸収信号を2モード励起光を用いて解析する。
強度相関測定は, 正規化強度相関法や雑音低減係数法と比較して, 最高の性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:07:02 GMT)
Quantum annealing eigensolver as a NISQ era tool for probing strong correlation effects in quantum chemistry [0.1] 本稿では,強い相関効果が支配的なシステムに対する数値計算と,QAEとVQEの予備スケーリング分析から得られた結論を組み合わせた。
前者は、矩形形状のH4分子の交差を回避した計算の代表的な例を選び、D-Wave Advantage System 4.1ハードウェアの完全な構成相互作用値の約1.2%の値が得られることを示す。
我々の数値的な結果に続いて、我々は、NASQ時代の化学における前者の能力を評価するために、QAEアルゴリズムとVQEアルゴリズムのスケーリング挙動を詳細にかつ予備的に分析する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:38:12 GMT)
zkFi: Privacy-Preserving and Regulation Compliant Transactions using Zero Knowledge Proofs [0.0] zkFiプロトコルは、開発者がトランザクションアセットを処理する柔軟性を提供するプラグイン・アンド・プレイソリューションとして機能するように設計されている。
ゼロ知識証明(ZKP)の専門知識はオプションであり、zkFiのモジュラーアプローチとソフトウェア開発キット(SDK)の可用性に起因する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:18:02 GMT)
gh0stEdit: Exploiting Layer-Based Access Vulnerability Within Docker Container Images [0.0] Dockerイメージの整合性を損なう脆弱性であるgh0stEditを紹介します。
gh0stEditは、イメージ履歴に表示されない方法で、攻撃者が悪意を持ってDockerイメージを編集することを可能にする。
この脆弱性に対する2つのユースケーススタディを示し、静的スキャンツールや動的スキャニングツールによって拾われない方法で、gh0stEditが画像に毒を与える方法を示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:38:17 GMT)
Will Neural Scaling Laws Activate Jevons' Paradox in AI Labor Markets? A Time-Varying Elasticity of Substitution (VES) Analysis [0.0] 我々は、人工知能における神経スケーリング法則が労働市場におけるJevonsのパラドックスを活性化するかどうかを分析する。
我々は、AIシステムが補完から人間の労働の代替へと移行する分析条件を確立する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:11:42 GMT)
Wigner's friend scenarios: on what to condition and how to verify the predictions [0.0] ウィグナーの友人の実験とその現代的な拡張は、量子状態の割り当てに関する量子力学的記述の曖昧さを示している。
それぞれの観測者が持たない異なる種類の情報が存在することを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:43:27 GMT)
When Two LLMs Debate, Both Think They'll Win [0.0] 大規模言語モデル (LLM) を動的, 敵対的な議論環境で評価する。
我々は10のLLMのうち60の3ラウンドの政策討論を組織した。
パターンを5つ観察した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:54:25 GMT)
Wave-function microscopy: Derivation and anatomy of exact algebraic spinful wave functions and full Wigner-molecular spectra of a few highly correlated rapidly rotating ultracold fermionic atoms [0.0] 高速回転トラップにおけるフェルミオン極低温原子の強い相関状態について検討した。
このような高速回転では、原子が最低ランダウレベル(LLL)を占めるため、得られる代数的表現は全LLLスペクトルに対処することができる。
明示された解析波動関数は、対応する数値FCI結果を正確に再現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:49:16 GMT)
Vuyko Mistral: Adapting LLMs for Low-Resource Dialectal Translation [0.0] 本稿では,ウクライナのフツル方言に大規模な言語モデルを適用するための最初の取り組みを紹介する。
我々は、9852語対標準ウクライナ語の文対と7320語の単語マッピングの辞書の並列コーパスを作成しました。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:30:35 GMT)
Verification of Quantum Circuits through Barrier Certificates using a Scenario Approach [0.0] 本稿では,量子回路のバリア証明書を合成する手法を提案する。
我々の手法は初期状態やシステムの力学における不確実性を扱うことができる。
量子回路に関するいくつかのケーススタディを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:01:17 GMT)
User-space library rootkits revisited: Are user-space detection mechanisms futile? [0.0] ユーザ空間のルートキットをユーザ空間のツールで検出することは無駄か?
有効性を考慮した一般的な見解とは対照的に,ユーザ空間におけるルートキートの検出は,ユーザ空間内では不可能である,と論じる。
本書では,ユーザ空間ライブラリのルートキット構築における古典的アプローチ,従来の検出機構,回避方法の相違について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:50:48 GMT)
Unraveling Ethereum's Mempool: The Impact of Fee Fairness, Transaction Prioritization, and Consensus Efficiency [0.0] 本研究は, ガス価格の変動, メムプールのクリアランス率, および実証・オブ・テイクエコシステムにおける最終化時間を実証的に分析する。
EIP-1559の意図した改善にもかかわらず、ハイフィートランザクションは一貫して優先順位付けされているのに対して、低フィートランザクションは遅延や排除に直面している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:55:25 GMT)
Universal Differential Equations for Scientific Machine Learning of Node-Wise Battery Dynamics in Smart Grids [0.0] 科学機械学習(SciML)の強力な枠組みとして、普遍微分方程式(UDE)が登場した。
この研究は、ニューラルネットワーク残基を物理的にインスパイアされたバッテリODEに埋め込むことで、ノード固有のバッテリ進化を学習するためのUDEベースのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:24:55 GMT)
Unexplainability of Artificial Intelligence Judgments in Kant's Perspective [0.0] 本稿では, カントの判断理論のレンズによるAI判断の不説明性について検討する。
カントの4つの論理形式-量、品質、関係、モダリティ-に基づいて、この研究はAIの不確実性と呼ばれるものを特定する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:12:25 GMT)
Unable to forget: Proactive lnterference Reveals Working Memory Limits in LLMs Beyond Context Length [0.0] 人間では、そのような干渉に対する感受性は、作業記憶能力と逆の関連がある。
PI-LLMは意味論的に関連するキー-値の更新とクエリを逐次的にストリームする評価手法である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:49:11 GMT)
Trend-Aware Fashion Recommendation with Visual Segmentation and Semantic Similarity [0.0] 本稿では, ディープビジュアル表現, 衣服意識のセグメンテーション, セグメンテーション, セマンティックカテゴリーの類似性, ユーザ行動シミュレーションを統合した, 流行認識型, 視覚的なファッションレコメンデーションシステムを提案する。
セマンティックセグメンテーションにより非着衣領域をマスキングすることで,視覚的埋め込みに焦点を当てたパイプラインを抽出する。
現実的な買い物行動をシミュレートするために,ユーザ固有の傾向や商品の人気に左右される,総合的な購入履歴を生成する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:48:16 GMT)
Towards a test of the Born rule in high-energy collisions [0.0] 我々は、量子力学の基本原理であるボルン則が、最も短い時間スケールで生成された粒子に対してどのようにテストできるかを考える。
我々は、特にクリーンな実験信号を提供するスピンまたは偏極確率のボルン則のターゲットテストに焦点を当てる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:12:42 GMT)
Towards Non-Abelian Quantum Signal Processing: Efficient Control of Hybrid Continuous- and Discrete-Variable Architectures [0.0] 量子信号処理(QSP)は、$theta$で表されるユニタリパラメータを、関数$f(theta)$で表される1つに変換する。
我々はQSPを非可換制御パラメータを利用する新しいクラスである非可換QSPに拡張する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:48:59 GMT)
TokenBreak: Bypassing Text Classification Models Through Token Manipulation [0.0] テキスト分類モデルは、LLM(Large Language Models)に対する即発的なインジェクション攻撃のような脅威を防ぐために実装することができる。
TokenBreakを紹介します。トークン化戦略を活用することで、これらの保護モデルを回避できる新たな攻撃です。
重要なことは、エンドターゲット(LLMまたはEメール受信者)は、まだ操作されたテキストを理解して応答することができ、そのため、保護モデルが配置された非常に攻撃に弱いことである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:11:28 GMT)
The impact of hole $g$-factor anisotropy on spin-photon entanglement generation with InGaAs quantum dots [0.0] 1つの有望なスキームは、横磁場におけるスピンのラーモア偏差に依存する。
我々は、平面内磁場方向に対する重ホール$g$-factor異方性の起源を調査する。
その結果, スピン光子クラスター状態の生成を改善するために, ホール$g$-factorの生後制御が可能であることがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:40:09 GMT)
Text-guided multi-stage cross-perception network for medical image segmentation [0.0] テキスト誘導多段階クロスパーセプションネットワーク(TMC)を提案する。
TMCは、Diceの84.77%、78.50%、88.73%を3つの公開データセットで上回っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:50:15 GMT)
Supervised Similarity for Firm Linkages [0.0] 高速連接型ベクトル(CVL)のための新しいプロキシについて紹介する。
この概念は、まずユークリッドの類似性から、続いて量子認知機械学習(QCML)を類似性学習に適用することにより、ファームリンクを推定する。
両手法が利益の出るモチベーションの流出戦略を構築するのに有効であることを示すが、QCMLの類似性はより単純なユークリッド類似性よりも優れている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:13:35 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の分布を持つ確率変数に置き換える。
各サンプリング数は、正確な結果を得るために十分な大きさである必要がある。
本稿では、分散算術と呼ばれる統計テイラー展開の実装と分散算術に関する試験について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:52:06 GMT)
Stark-Coleman Invariants and Quantum Lower Bounds: An Integrated Framework for Real Quadratic Fields [0.0] Stark-Coleman不変量 $kappa_p(K) = log_p left( fracvarepsilon_mathrmSt,psigma(varepsilon_mathrmSt,p) mod pmathrmord_p(Delta_K)$$$p$-adic Hodge理論の合成と拡張されたコールマン積分により。
スターク単位はクラス群の幾何学的構造を制約し、計算複雑性障壁の理論的な洞察を与えることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:06:17 GMT)
Stark Tuning and Charge State Control in Individual Telecom C-Band Quantum Dots [0.0] 通信波長量子ドット(QD)は、既存の光ファイバーインフラストラクチャと互換性のある決定論的単一光子を生成するための有望なソリューションとして浮上している。
本稿では,通信Cバンド内で動作する個別InAs/InPQDのStarkチューニングとチャージ状態制御の初例を示す。
これらの進歩により、QDはキャビティモードやエミッターなどの他のシステムと共振し、スケーラブルでファイバー互換の量子フォトニクスデバイスへの重要な一歩となる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:16:51 GMT)
Spectral form factor and energy correlations in banded random matrices [0.0] 重核のスペクトル統計を記述するために、完全なランダム行列のより現実的な代替としてバンド化されたランダム行列が導入された。
短距離エネルギー相関が存在しないにもかかわらず、弱長距離エネルギー相関は帯状ランダム行列の非エルゴード相に持続することを示す。
また、エネルギー変動のパワースペクトルの高周波挙動は、帯状ランダム行列の非エルゴード位相とエルゴード位相を区別できることを示した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:02:53 GMT)
Secure Distributed Learning for CAVs: Defending Against Gradient Leakage with Leveled Homomorphic Encryption [0.0] ホモモルフィック暗号化(HE)は、差分プライバシー(DP)とセキュアマルチパーティ計算(SMPC)に代わる有望な代替手段を提供する
資源制約のある環境において,フェデレートラーニング(FL)に最も適したHE方式の評価を行った。
我々は、モデル精度を維持しながら、Gradients (DLG)攻撃からのDeep Leakageを効果的に軽減するHEベースのFLパイプラインを開発した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:12:18 GMT)
Scaling up the transcorrelated density matrix renormalization group [0.0] 我々はトランスコリックス密度行列再正規化群(DMRG)の改良技術を開発した。
二次元Fermi-Hubbardモデルの基底状態エネルギーの大規模計算を実演する。
トランスコリックスDMRGは基底状態エネルギーの誤差を3倍から17倍に減らし、半充填時の小さな系では最小の改善であり、希薄な閉殻系では最大の改善である。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:36:59 GMT)
ST-GraphNet: A Spatio-Temporal Graph Neural Network for Understanding and Predicting Automated Vehicle Crash Severity [0.0] 詳細な空間グラフを用いて,自動走行車(AV)の重大度をモデル化し,予測するためのグラフニューラルネットワークフレームワークST-GraphNetを紹介する。
提案したST-GraphNetは97.74%の精度を達成し、最もきめ細かいモデル(64.7%のテスト精度)を大幅に上回っている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 01:42:19 GMT)
SHIELD: Secure Hypernetworks for Incremental Expansion Learning Defense [0.0] 本稿では、超ネットワークベースの連続学習アプローチとインターバル算術を統合する新しいアプローチであるShielDを紹介する。
本手法は,ネットワーク適応性を犠牲にすることなくセキュリティを強化し,継続的な学習における安全性の課題に対処する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:43:56 GMT)
Relativistic Collapse Model with Quantised Time Variables [0.0] Schr"odinger 方程式は CSL 形式であり、エルミート・ハミルトニアンと反エルミート・ホワイトノイズ依存ハミルトニアンを持つ。
モデルはポアンカーの共変であり、予想されるエネルギーを保存する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:31:02 GMT)
Recovering Exact Vibrational Energies Within a Phase Space Electronic Structure Framework [0.0] 位相空間電子フレームワーク上で摂動理論を用いて、結合した原子-電子ハミルトニアンから正確な量子エネルギーを抽出する方法を示す。
この研究は、第0次位相空間電子状態を修正するための厳密な枠組みを提供することにより、位相空間電子構造アプローチを正当化する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:57:33 GMT)
Real-time Localization of a Soccer Ball from a Single Camera [0.0] 本研究では,1台の放送カメラからリアルタイムな3次元サッカー軌道再構成を行うための計算効率のよい手法を提案する。
従来の研究とは対照的に,提案手法では,最適化を大幅に高速化するために,$W$離散モードのマルチモード状態モデルを導入している。
システムは標準CPUで動作し、ライブブロードキャスト設定に適した低レイテンシを実現する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:52:07 GMT)
Quantum Kinetic Uncertainty Relations in Mesoscopic Conductors at Strong Coupling [0.0] 運動的不確実性関係は量子輸送の精度限界を確立する。
強い結合において、量子コヒーレンス(英語版)はKURの妥当性に挑戦する。
このQKURは、すべての結合強度で不確実性関係が有効であることを保証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:44:58 GMT)
Quantum Imaging and Metrology with Undetected squeezed Photons: Noise Canceling and Noise Based Imaging [0.0] 未検出の励起光子に基づく量子イメージング装置は、感度位相測定および量子イメージングに使用される。
検出されていない光子を用いた従来の量子イメージングにもかかわらず、提案されたセットアップはホモダイン検出によって実現されている。
その結果, 画像品質と位相測定精度の指標として, ノイズ比の高い信号量を明らかにした。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:42:55 GMT)
Prompt to Protection: A Comparative Study of Multimodal LLMs in Construction Hazard Recognition [0.0] 本研究は,5つの最先端大言語モデル(LLM)の比較評価を行う。
各モデルは、ゼロショット、少数ショット、チェーン・オブ・シント(CoT)という3つのプロンプト戦略の下でテストされた。
その結果、CoTは性能に大きく影響し、CoTはモデル間で高い精度を連続的に生成することがわかった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:22:35 GMT)
Probing Kirkwood-Dirac nonpositivity and its operational implications via moments [0.0] カークウッド・ディラック(KD)分布の非古典的シグネチャを検出するための実験的動機付け基準を導入する。
このアプローチは、量子コヒーレンスや非古典的抽出可能な作業など、他の量子資源の特定に自然に及んでいることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:05:01 GMT)
ProARD: progressive adversarial robustness distillation: provide wide range of robust students [0.0] 敵の攻撃に対する軽量深層ニューラルネットワークの堅牢性を高める効果的な方法として、Adrial Robustness Distillation (ARD)が登場した。
現在のアプローチでは、特定の制約を満たすために、スクラッチから新しい学生ネットワークをトレーニングする必要がある。
本稿では、動的ネットワークの効率的なワンタイムトレーニングを可能にするプロダード(Progressive Adrial Robustness Distillation)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:39:25 GMT)
Predicting Bad Goods Risk Scores with ARIMA Time Series: A Novel Risk Assessment Approach [0.0] 本研究は,時系列予測後の粗悪品の計算を目的とした独自式と時系列ARIMAモデルを統合した新しいフレームワークを提案する。
有機ビールG1リッターの2022-2024のデータセット上で実験結果が検証され、提案手法が従来の統計モデルより優れていることが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:53:18 GMT)
Power-Law Decay Loss for Large Language Model Finetuning: A Theory Perspective [0.0] 本稿では,テキスト生成のための微調整処理を最適化する新しい損失関数Power-Law Loss Decay (PDL)を提案する。
PDLは、標準のクロスエントロピー損失における各トークンの寄与を再重み付けする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:44:04 GMT)
Pilot-waves and copilot-particles: A novel approach to objective collapse [0.0] マクロ計測による波動関数崩壊現象を取り入れたシュル・オーディンガー方程式の拡張を提案する。
我々のアプローチは、ブーム・ド・ブロイのパイロット波と客観的崩壊理論のハイブリッドに依存している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:27:14 GMT)
Perfect state transfer in Grover walks on association schemes and distance-regular graphs [0.0] 離散時間量子ウォークのモデルであるグローバーウォークにおける完全状態伝達について検討する。
完全な状態移動を示すハミングおよびジョンソンスキームのクラス上の全てのグラフを特徴づける。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:32:44 GMT)
Overcoming the entanglement barrier with sampled tensor networks [0.0] 我々は,汎用ローカル演算子の期待値をサンプリングし,評価するハイブリッドネットワーク/モンテカルロ(TN-MC)アルゴリズムを開発した。
波動関数振幅の正確な収縮は、時間とともに好ましいスケーリングの結果である。
この結果から,局所作用素の期待値を計算すると,一次元ハミルトン進化における絡み合い障壁を回避できることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:44:30 GMT)
Orbit dimensions in linear and Gaussian quantum optics [0.0] 量子状態の軌道の次元(ヒルベルト空間の多様体として)を研究する。
フォック基底における有限支持状態に対する軌道次元の一般的かつ直接的な計算方法を示す。
我々は、ガウスユニタリ群の下での軌道次元が非ガウス性証人となることを強調する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:58:08 GMT)
Optimization of Bottlenecks in Quantum Graphs Guided by Fiedler Vector-Based Spectral Derivatives [0.0] 我々は、量子指向非巡回グラフ(QDAG)として表される量子リソースノードのネットワークにおけるFiedlerベクトル、Cheeger定数、しきい値挙動の関係について論じる。
本稿では,QDAGにおける量子情報フローのダイナミクス,特にグラフ信号処理におけるボトルネックを伴うルーティング問題を理解するために,これらの数学的構造をどのように適用することができるかを検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:46:46 GMT)
On whether quantum theory needs complex numbers: the foil theories perspective [0.0] 因果構造に関する仮定のみを仮定した量子理論から、旋回量子世界を区別することができないことを示す。
また、因果構造に関する特定の条件を同定し、その理論とシンメトリケートされたバージョンの間の因果整合性ギャップを支えられるようにする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:00:02 GMT)
On the exact solutions of a two-dimensional hydrogen atom in a constant magnetic field [0.0] 我々は、最近フロベニウス法の一般化によって導かれた量子力学モデルの正確な解を解析する。
特に,定磁場下での2次元水素原子の溶液の解釈を行う。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:44:31 GMT)
On computational complexity and average-case hardness of shallow-depth boson sampling [0.0] 古典的にシミュレートが難しいと考えられる計算タスクであるボソンサンプリングは、量子計算の優位性を示すことを約束する。
実験的な実装におけるノイズは、古典的にシミュレート可能で、古典的なイントラクタビリティを妥協するボソンサンプリングをレンダリングする可能性があり、大きな課題となる。
浅深さ線形光回路を用いたボソンサンプリングによる量子計算の優位性の実現可能性について検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:29:41 GMT)
Observation of slow relaxation due to Hilbert space fragmentation in strongly interacting Bose-Hubbard chains [0.0] 本研究では1次元Bose-Hubbardシステムについて実験的に検討した。
分子動力学では, シンロンとダブルロンの数が保存され, 観察された緩やかな緩和のメカニズムとしてHSFが示唆された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:57:19 GMT)
Notes on Real Quantum Mechanics in a Kahler Space [0.0] 量子力学における複素数の必要性は長い間議論されてきた。
本稿では、標準複素ヒルベルト空間フレームワークと等価性を主張する量子力学の実際のケーラー空間定式化を開発する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:58:13 GMT)
Neural Tangent Kernel Analysis to Probe Convergence in Physics-informed Neural Solvers: PIKANs vs. PINNs [0.0] 我々は,ニューラル・タンジェント・カーネル(NTK)理論を用いて,cPIKANの理論的理解を促進することを目的としている。
まず、標準cKANのNTKを教師付き設定で導出し、次に解析を物理インフォームドコンテキストに拡張する。
結果は、標準物理インフォームドニューラルネットワーク(PINN)がキャプチャできない学習力学を公開するcPIKANの文脈において、NTKのトラクタブルな振る舞いを示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:30:13 GMT)
Network nonlocality with continuous variables: probing nonbilocality through pseudospin measurements [0.0] 量子ネットワークはベルのシナリオを超えて非局所的な相関を求めるための魅力的なプラットフォームを提供する。
局所的なシナリオ,最も単純な量子ネットワークを連続変数のフレームワークで検討する。
本研究は,ネットワークベースの量子相関を実現するためのCVシステムの可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:31:17 GMT)
MoE-MLoRA for Multi-Domain CTR Prediction: Efficient Adaptation with Expert Specialization [0.0] MoE-MLoRAはエキスパートの混成フレームワークで、各専門家はドメインを専門にするために独立して訓練される。
MoE-MLoRAはMovielensとTaobaoの8つのCTRモデルで評価した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:03:05 GMT)
Misreading EPR: Variations on an Incorrect Theme [0.0] EPRの思考実験は、驚くほどの回数で誤って説明されている。
EPRは、最も古い科学実験の1つである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:27:55 GMT)
Microscopic Mechanism of Anyon Superconductivity Emerging from Fractional Chern Insulators [0.0] 我々は、どんな超伝導も反発相互作用から生じることを示す。
このような最小限のモデルで安定なセミオン結晶を見つけると、従来のCDWやFQH状態と競合する実行可能な状態であることが強調される。
本フレームワークは, 超伝導体への最近のアプローチにより, 強い反発で統一し, 平らなバンドモア材料へのガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:59:13 GMT)
Metainformation in Quantum Guessing Games [0.0] この研究はミーテン情報の概念を導入している。
たとえまだ提供されていないとしても、特定のタイプの追加のサイド情報が後で利用可能になることは知識である。
以上の結果から, 達成可能な成功確率は, 事前測定側情報と同じくらい有用となる点まで向上できることが示された。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:34:08 GMT)
MalGEN: A Generative Agent Framework for Modeling Malicious Software in Cybersecurity [0.0] MalGENは、マルウェアサンプルを生成するために敵の振る舞いをシミュレートするマルチエージェントフレームワークである。
MalGENを用いて10種類の新規ウイルスサンプルを合成し,抗ウイルスおよび行動検出エンジンに対して評価した。
このフレームワークはデータの不足に対処し、厳格なテストを可能にし、弾力性と将来的な検出戦略の開発をサポートする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 09:32:03 GMT)
LlamaRec-LKG-RAG: A Single-Pass, Learnable Knowledge Graph-RAG Framework for LLM-Based Ranking [0.0] LlamaRec-LKG-RAGは、パーソナライズされた知識グラフコンテキストをレコメンデーションランキングに統合する、新しい単一パスでエンドツーエンドのトレーニング可能なフレームワークである。
提案手法はLlamaRecアーキテクチャを拡張し,ユーザプライオリティを動的に識別する軽量なモジュールを組み込むことで実現した。
ML-100KとAmazon Beautyデータセットの実験では、主要なランキングメトリクス間でLlamaRecよりも一貫性があり、重要な改善が示されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 05:52:03 GMT)
Limits of Classical correlations and Quantum advantages under (Anti-)Distinguishability constraints in Multipartite Communication [0.0] 共有絡み合いのない量子戦略は古典的戦略よりも優れていることを示す。
これらの不等式に反する露骨な量子プロトコルが研究されている。
各送信者がバイナリ入力を持つと、量子的優位性は送信者の数とともに増大する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:38:58 GMT)
Kirkwood-Dirac Nonpositivity is a Necessary Resource for Quantum Computing [0.0] 我々は、準確率分布の観点から実量子ビットの計算モデルをキャストすることで、量子ビット系の理解を深める。
我々は、KD陽性状態の集合の幾何に関する最近の結果を利用して、これまで知られていなかった古典的にシミュレート可能な(有界な)状態を構築する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:00:07 GMT)
JavelinGuard: Low-Cost Transformer Architectures for LLM Security [0.0] 本稿では,LLM(Large Language Model)インタラクションにおける悪意を検出するための,低コストで高性能なモデルアーキテクチャであるJavelinGuardを紹介する。
私たちのモデルは、9つの異なる敵対的データセットに対して厳格にベンチマークされています。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 00:11:06 GMT)
Jarzynski Reweighting and Sampling Dynamics for Training Energy-Based Models: Theoretical Analysis of Different Transition Kernels [0.0] エネルギーベースモデル(EBM)は、生成モデリングのための柔軟なフレームワークを提供する。
対照的な発散やスコアマッチングといった従来の手法は、正確な学習を妨げるバイアスを導入している。
本稿では,非平衡統計力学の手法であるジャジンスキー再重み付けの理論的解析とそのEBM訓練への応用について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:08:01 GMT)
Introspective Growth: Automatically Advancing LLM Expertise in Technology Judgment [0.0] 大きな言語モデル(LLM)は、概念的理解の兆候をますます示している。
彼らの内部知識の多くは、潜伏し、ゆるやかに構造化され、アクセスや評価が難しいままである。
LLMの理解を改善するための軽量でスケーラブルな戦略として,自己問合せを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:40:03 GMT)
Improving Generalization in MRI-Based Deep Learning Models for Total Knee Replacement Prediction [0.0] 変形性関節症イニシアチブ(OAI)データベースからMRIデータを用いてモデルを訓練し,評価した。
その結果,両領域の分類精度は統計的に有意に向上した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:37:18 GMT)
Human Side of Smart Contract Fuzzing: An Empirical Study [0.0] 本研究では,SCファジィツールの実践者が直面する課題について検討する。
本研究は,これらの課題を,SCファジィワークフロー内におけるそれらの性質と発生に基づく分類に分類する。
以上の結果から,ブロックチェーンエミュレーションに関する技術的問題を含む,ドメイン固有の使いやすさと有用性の課題が明らかになった。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 03:25:14 GMT)
HuSc3D: Human Sculpture dataset for 3D object reconstruction [0.0] HuSc3Dは、3D再構成モデルの厳密なベンチマークのために、現実的な取得課題下で特別に設計された、新しいデータセットである。
我々のデータセットは、複雑な穿孔と最小限のテクスチャと色の変化を特徴とする、非常に詳細で完全に白い6つの彫刻を特徴としている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:47:02 GMT)
High-Dimensional Learning in Finance [0.0] 機械学習の最近の進歩は、財務予測に有望な結果を示している。
本稿では,これらの手法が予測的成功をいつ,どのように達成するかを理解するための理論的基礎と実証的検証を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:20:01 GMT)
High resolution quantum enhanced phase imaging of cells [0.0] 量子イメージングは、古典的な技術よりも光子当たりの情報を取り出すための強力なアプローチを提供する。
数値開口のみに制限された高分解能位相像を実現する。
これにより、生体細胞のサブショットノイズ定量位相イメージングが初めて可能になる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:40:15 GMT)
High Impedance Granular Aluminum Ring Resonators [0.0] grAlメアンダードスーパーインダクタで作られたリング共振器は、単光子系で105ドル(約10万5000円)のオーダーで品質因子を示す。
一部の装置では、単光子状態において、未知の原点の正のカー係数を観測する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:39:36 GMT)
Hidden Bias in the Machine: Stereotypes in Text-to-Image Models [0.0] テキスト・トゥ・イメージ(T2I)モデルは視覚的コンテンツ生成を変革し、自然言語のプロンプトから非常にリアルな画像を生成する。
我々は、職業、特徴、行動、イデオロギー、感情、家族の役割、場所の記述、精神性、ライフイベントなど、テーマのカテゴリにまたがる様々なプロンプトをキュレートした。
160のトピックそれぞれに対して、さまざまな意味や視点を反映した複数のプロンプトのバリエーションを作成しました。
本分析では, 性別, 人種, 年齢, 体型, その他の人中心的要因の表現に, 生成画像間で有意差が認められた。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:06:04 GMT)
Heavy Lasso: sparse penalized regression under heavy-tailed noise via data-augmented soft-thresholding [0.0] 本稿では,学生のt分布にインスパイアされた損失関数をラッソのペナル化フレームワークに組み込んだ,新しいロバスト回帰手法を提案する。
この損失は、小さな残留物に対して望ましい二次的挙動を維持しながら、大きな偏差を適応的に下降させ、重み付きノイズや外れ値に対するロバスト性を高める。
当社のメソッドは,Githubで公開されているRパッケージのヘビーラッソに実装されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:13:02 GMT)
HOT-FIT-BR: A Context-Aware Evaluation Framework for Digital Health Systems in Resource-Limited Settings [0.0] 低所得国におけるデジタルヘルスシステムの実施は、評価の欠如によりしばしば失敗する。
本稿では,HOT-FITモデルを拡張する文脈評価フレームワークであるHOT-FIT-BRを紹介する。
HOT-FIT-BRはHOT-FITよりも58%感度が高く,特に赤外指数が3。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 22:54:39 GMT)
HAELT: A Hybrid Attentive Ensemble Learning Transformer Framework for High-Frequency Stock Price Forecasting [0.0] 非定常性、騒音、ボラティリティのため、高周波の株価予測は困難である。
ハイブリッド注意アンサンブル学習変換器(HAELT)を提案する。
HAELTはResNetベースのノイズ緩和モジュール、関連する履歴に動的にフォーカスするための時間的自己アテンション、LSTM-Transformerのハイブリッドコアを組み合わせている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:40:18 GMT)
Geometric Floquet theory [0.0] 折りたたみエネルギーは、断熱ゲージポテンシャル$U(1)mapstomathbbZ$の破れたゲージ群の結果である。
代わりに平行移動ゲージを用いてゲージ自由を固定すると、フロケ力学は純粋に幾何学的進化へと一意に分解される。
離散時間結晶で分裂する$pi$-quasienergyや、異常なフロケ・トポロジカル絶縁体の$pi$-edgeモードなど、本質的に非平衡効果の幾何学的起源を導出する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:46:54 GMT)
Generalized measurements for Bell tests in different probability spaces [0.0] 2つの非常に異なる確率空間に有効な実用的スキームを提供できることを示す。
これにより、より標準的なアプローチでは不可能な新しいベルテストの導入が可能であることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:19:09 GMT)
Fully data-driven inverse hyperelasticity with hyper-network neural ODE fields [0.0] 閉形方程式を使わずに異種材料の力学特性を同定するための新しい枠組みを提案する。
通常のニューラル微分方程式(NODE)に基づいて構築された物理に基づくデータ駆動法を用いて方程式を探索する。
提案手法は、非常に少数の仮定で異種物質の力学的性質を同定する上で、堅牢で一般的なものである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:50:14 GMT)
Forests for Differences: Robust Causal Inference Beyond Parametric DiD [0.0] DiD-BCF(Didi-in-Differences Bayesian Causal Forest)は、DD推定における重要な課題に対処する新しい非パラメトリックモデルである。
DiD-BCFは、平均(ATE)、グループ平均(GATE)、条件平均処理効果(CATE)を推定するための統一的なフレームワークを提供する。
大規模なシミュレーションでは、DD-BCFは確立されたベンチマークよりも優れた性能を示している。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:53:37 GMT)
Exposing Hidden Backdoors in NFT Smart Contracts: A Static Security Analysis of Rug Pull Patterns [0.0] rug pullsは、開発者が信頼とスマートコントラクトの特権を利用してユーザ資金を引き出したり、資産の所有権を無効にするスキームだ。
静的解析フレームワークであるSlitherを用いて,49,940個のNFTスマートコントラクトの大規模静的解析を行う。
以上の結果から,大規模な静的解析によって,単純なレビューでしばしば見逃される悪質なパターンが表面化できることが判明した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:49:04 GMT)
Explainable AI for Enhancing IDS Against Advanced Persistent Kill Chain [0.0] 本研究では,2つの著名な機械学習アルゴリズムを統合した特徴選択と分類モデルを提案する。
本研究の目的は、様々な位相でAPTを検出するための最小限の影響力のある特徴に基づいて軽量IDSを開発することである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:54:12 GMT)
Experimental Test of the Principle of Tomographic Locality [0.0] 一対のフォトニックモードの偏極度に関する実験を準備・測定シナリオで検討する。
完全な量子環境において、トモグラフィーの局所性に違反する証拠は見つからない。
また、実場上の量子論によって記述された断片の内部にあるこれらの状態や測定に注意を限定するならば、トモグラフィーの局所性の失敗の明確なサインが観察される。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:49:28 GMT)
Exact quantum noise deconvolution with partial knowledge of noise [0.0] ノイズの完全な知識に依存しない新しい量子ノイズデコンボリューション技術を導入する。
我々は、ノイズの不完全な知識にもかかわらず、完全に修正可能な期待値を持つ観測可能な集合を構築した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:33:31 GMT)
Evaluating Robustness in Latent Diffusion Models via Embedding Level Augmentation [0.0] 遅延拡散モデル (LDM) は様々なタスクにおいて最先端の性能を達成する。
それらは一般に、現在の研究で十分に研究されていない限界である頑健さを欠いている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:48:45 GMT)
Evaluating Large Language Models on the Frame and Symbol Grounding Problems: A Zero-shot Benchmark [0.0] フレーム問題とシンボルグラウンド問題(英語版)は歴史的に、伝統的なシンボルAIシステムでは解決不可能と見なされてきた。
本研究では,現代のLSMがこれらの問題に対処するために必要な認知能力を持っているかを検討する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:12:47 GMT)
Evaluating LLMs Robustness in Less Resourced Languages with Proxy Models [0.0] 数文字だけを変更し、単語の重要度を計算するために小さなプロキシモデルを使用することで、驚くほど強力な攻撃が生まれることを示す。
これらの特徴と単語レベルの攻撃は、異なるLLMの予測を劇的に変えることが判明した。
我々は,低リソース言語ポーランド語に対する攻撃構築手法を検証し,LLMの潜在的な脆弱性を発見する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 11:09:39 GMT)
Entropic Dynamics approach to Relational Quantum Mechanics [0.0] エントロピック・ダイナミクスは、量子力学の非相対論的モデルを構築するために用いられる。
EDが時間的リレーショナルであることを明確にする。
EDアプローチは時間の問題と呼ばれる量子重力の類似を回避していることを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:33:54 GMT)
Entanglement dynamics and Page curves in random permutation circuits [0.0] 計算基底をランダムに透過する量子回路によって生成されるアンサンブルについて検討する。
本研究は,多体システムにおけるエンタングルメント生成における古典的特徴の影響を明らかにするものである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 17:34:55 GMT)
Entanglement asymmetry in conformal field theory and holography [0.0] エンタングルメント非対称性(英: entanglement asymmetric)は、量子サブシステムにおける対称性の破れの尺度である。
U(1)対称性を持つ共形場の量子論において、励起的「コヒーレント状態」のクラスの非対称性を研究する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:52:57 GMT)
Ensuring Reliability of Curated EHR-Derived Data: The Validation of Accuracy for LLM/ML-Extracted Information and Data (VALID) Framework [0.0] 大規模言語モデル(LLM)により抽出された臨床データの質を評価するための包括的枠組みを提案する。
このフレームワークは、専門家による抽象化に対する変数レベルのパフォーマンスベンチマーク、内部の一貫性と妥当性の自動検証、レプリケーション分析を統合している。
この多次元アプローチは、改善が必要な変数の同定、潜時エラーの体系的検出、および実世界の研究におけるデータセットの適合性確認を可能にする。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:59:16 GMT)
Efficient Quantum Simulation of QCD Jets on the Light Front [0.0] 光面上の3+1次元QCDハミルトニアンを用いた多体力学の効率的な量子シミュレーションのための統一的フレームワークを提案する。
物理自由度を量子ビットにマッピングするスケーラブルな手法と、メジウム内ジェットの進化をシミュレートする手法について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 12:49:40 GMT)
Effects of superradiance on relativistic Foldy-Wouthuysen densities [0.0] Klein-Gordon方程式のウェーブパレットダイナミクスについて検討する。
波動関数のFoldy-Wouthuysen変換に基づく密度は光円錐の外側で局所的に増幅できる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:28:07 GMT)
EconWebArena: Benchmarking Autonomous Agents on Economic Tasks in Realistic Web Environments [0.0] EconWebArenaは、現実的なWeb環境における複雑なマルチモーダル経済タスクにおいて、自律エージェントを評価するためのベンチマークである。
このベンチマークは、マクロ経済学、労働、金融、貿易、公共政策といった分野にまたがる82の権威あるウェブサイトから360のキュレートされたタスクで構成されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:39:48 GMT)
Divisibility of dynamical maps: Schrödinger vs. Heisenberg picture [0.0] 動的写像の可視性は、量子非マルコビアン性の研究において中心的な概念である。
対応する双対写像の可除性は一般に同値ではないことを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:01:21 GMT)
Design and Evaluation of Deep Learning-Based Dual-Spectrum Image Fusion Methods [0.0] ディープラーニングベースの融合手法が注目されているが、現在の評価は、標準化されたベンチマークやダウンストリームタスクのパフォーマンスを使わずに、汎用的なメトリクスに依存している。
これらのギャップに対処するため、キャンパス環境下で取得した高品質なデュアルスペクトルデータセットを構築した。
本稿では,融合速度,一般メトリクス,オブジェクト検出性能を統合した総合的かつ公正な評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:56:32 GMT)
Delayed Arrow-of-Time Detection in Signed Laplacian Dynamics [0.0] 状態重みが正あるいは負の場合に,メソスコピックデータから時間方向がいかに迅速に検出可能かを検討する。
長さが少なくとも$tau$の時間間隔で行うと、熱力学時間の方向を正確に識別するテストを定義する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 21:08:59 GMT)
Deep reinforcement learning for near-deterministic preparation of cubic- and quartic-phase gates in photonic quantum computing [0.0] 本稿では,3次相状態を生成する量子光学回路を制御するために,強化学習を用いてディープニューラルネットワークを訓練する数値実験の結果について述べる。
全く同じ資源で、立方体ゲート分解を必要とせず、クォート相ゲートを直接生成することができる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:22:54 GMT)
Curvature effects on stimulated parametric down-conversion process: an analog model [0.0] パラメトリックダウンコンバージョンプロセスの量子特性に対する空間曲率の影響について検討する。
上記プロセスの入力ビームとして, 2モード球コヒーレント状態を用いる。
線形エントロピーにより測定されたパラメトリックダウン変換過程の出力状態の絡み合いを計算した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:31:37 GMT)
Counter-Inferential Behavior in Natural and Artificial Cognitive Systems [0.0] 本研究では,自然・人工認知システムにおける反推論行動の出現について検討する。
ノイズや設計上の欠陥から生じるのではなく、内部情報モデル間の構造化された相互作用を通じて発生する。
本研究は, 安定条件下での適応活性化を最小限に抑えることの重要性を強調した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:19:52 GMT)
Considerations for Cloud Security Operations [0.0] クラウドコンピューティング環境における情報セキュリティについて検討する。
緩和アプローチがリストアップされています
クラウドコンピューティングが紹介され、緩和アプローチが議論されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 08:11:34 GMT)
Conjoined Predication and Scalar Implicature [0.0] マグリは協力関係から生じる2つのパズルを調査する。
我々は,接続述語の集合的あるいは同時的な読解から奇異が生じることを論じる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 04:59:46 GMT)
Chiral excitation flows of a multinode network based on synthetic gauge fields [0.0] キラル励起流はその特異な一方向性のために大きな注目を集めている。
このような流れは合成ゲージ場(SGF)を持つ3ノードネットワークで研究されている。
本稿では,補助ノードを導入してシステムの制御を行う,$n$-nodeネットワークにおけるカイラルフローを実現する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:12:46 GMT)
Can Perplexity Predict Fine-tuning Performance? An Investigation of Tokenization Effects on Sequential Language Models for Nepali [0.0] SentencePieceトークン化は、ネパールの理解に基づくタスクにおいて、一貫して優れた結果をもたらす。
本研究はシーケンシャルトランスフォーマーモデルについて検討し,低リソース言語における言語モデル開発に有用な知見を提供する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:43:57 GMT)
Can Artificial Intelligence Write Like Borges? An Evaluation Protocol for Spanish Microfiction [0.0] 大規模な言語モデルは、物語的に一貫性があり、言語的に一貫性のある短編テキストを生成することができる。
これらの進歩にもかかわらず、文学的価値のための厳密な評価が注目されている。
本稿では,AI生成マイクロフィクションを客観的に評価するためのフレームワークとして,文学理論に基づく評価プロトコルGrAImesを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:34:13 GMT)
Ambiguity-Restrained Text-Video Representation Learning for Partially Relevant Video Retrieval [0.0] 部分関連ビデオ検索(PRVR)は、特定のセグメントが所定のテキストクエリに関連するビデオを取得することを目的としている。
テキストとビデオの内容のあいまいさは、その概念的スコープに基づいて指摘する。
この曖昧さをモデル学習プロセスに組み込んだフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 06:44:45 GMT)
Altermagnet-Superconductor Heterostructure: a Scalable Platform for Braiding of Majorana Modes [0.0] トポロジカル量子計算は、マヨラナゼロモード (MZMs) として知られる任意の励起で構築された量子ビットを特徴とするが、長い間、スケーラブルな量子計算へのエキサイティングな経路を示してきた。
本研究は,MZMsを担持するだけでなく,物質のトポロジカルな境界に沿った位置を自由に操作する,反磁性超伝導体ヘテロ構造の可能性を示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 18:00:16 GMT)
Agent Semantics, Semantic Spacetime, and Graphical Reasoning [0.0] 有限$gamma (3,4)$表現は、任意の意味複雑性にスケール可能な閉じた演算の集合を形成するために定義される。
セマンティック時空モデル(およびその公約理論)の起源は、そのような吸収状態が境界情報とどのように関連しているかを明らかにするのに役立つ。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 13:37:47 GMT)
AI-Driven Early Detection of Cardiovascular Diseases: Reducing Healthcare Costs and improving patient Outcomes [0.0] 本研究の主な目的は、人工知能(AI)の主な特徴と、早期心血管疾患(CVD)検出、材料および方法の適用性について論じることである。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:56:14 GMT)
A weighted quantum ensemble of homogeneous quantum classifiers [0.0] 均一なアンサンブルは同一のモデルを使用し、異なるデータサブセットを通して多様性を達成する。
データエンコーディングのためのインデックスレジスタを持つ量子分類器を用いて、重み付き均一な量子アンサンブルを実現する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:38:13 GMT)
A non-local exchange potential for electronic structure calculations [0.0] パウリの排他原理に従うように、電子の交換相互作用のモデルを記述する。
原子と単純な分子と固体の交換ポテンシャルを計算する。
我々の結果はコーン・シャムに近づき、固体の中間空間となる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 23:27:27 GMT)
A Temporal FRBR/FRBRoo-Based Model for Component-Level Versioning of Legal Norms [0.0] 本稿では、FRBRooフレームワークを拡張して、このギャップに対処する構造化時間モデルを提案する。
Expressio - Temporal Version (TV) とLanguage Version (LV) の特別なサブクラスを導入し、法的な規範の状態を表現している。
ブラジル連邦憲法を事例研究として、この論文は、各修正が、影響を受ける条項に対して、どのようにして新しいコンポーネント・テンポラル・バージョンを作成するかを示す。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 15:18:36 GMT)
A Study on the MCP x A2A Framework for Enhancing Interoperability of LLM-based Autonomous Agents [0.0] 現代のAIシステムでは、自律エージェントと外部ツールとの統合が、実用的なAIアプリケーションを構築する上で不可欠な要素となっている。
本稿では,Googleが開発したオープンソースのエージェント・ツー・エージェント(A2A)プロトコルと,Arthropicが導入したモデルコンテキストプロトコル(MCP)の詳細な技術分析と実装手法について述べる。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 14:03:58 GMT)
A Real-time 3D Desktop Display [0.0] altiro3Dは、2Dウェブカメラ画像またはフラットビデオファイルからの3Dビデオストリームを扱うことを目的としている。
マルチビューを再現するために必要なコア機能は、MiDaS Convolutional Neural Network(CNN)の利用である。
ユーザによるデスクトップ画面領域の取得を容易にするため,マルチプラットフォームなグラフィカルユーザインタフェースも実装されている。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 10:55:15 GMT)
A Metrics-Oriented Architectural Model to Characterize Complexity on Machine Learning-Enabled Systems [0.0] 本研究の目的は、MLESの複雑さを特徴付けるメトリクスベースのアーキテクチャモデルの導入である。
目標は、これらのシステムの開始と成長のガイドラインを提供する、アーキテクチャ上の決定をサポートすることです。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 19:02:19 GMT)
A Machine Learning Approach to Generate Residual Stress Distributions using Sparse Characterization Data in Friction-Stir Processed Parts [0.0] 処理後のコンポーネント内に残留する残留応力は、性能を低下させる可能性がある。
本研究では,機械学習に基づく残留応力発生器(Residual Stress Generator,RSG)を提案する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:26:57 GMT)
A Hybrid GA LLM Framework for Structured Task Optimization [0.0] GA LLMは、遺伝的アルゴリズムと大規模言語モデルを組み合わせて、厳密な制約の下で構造化された生成タスクを処理するハイブリッドフレームワークである。
言語モデルはドメイン知識と創造的バリエーションを提供し、遺伝的アルゴリズムは構造的整合性とグローバルな最適化を保証する。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 07:00:04 GMT)
A Comparative Study of U-Net Architectures for Change Detection in Satellite Images [0.0] U-Netアーキテクチャは、空間情報をキャプチャし、ピクセル単位の分類を行う能力で人気を博している。
本研究は18種類のU-Net変動の比較と解析を行い,リモートセンシングにおける変化検出の可能性について検討した。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 16:38:34 GMT)
"I Wrote, I Paused, I Rewrote" Teaching LLMs to Read Between the Lines of Student Writing [0.0] Geminiのような大規模な言語モデルは、学生の執筆を支援する一般的なツールになりつつある。
彼らのフィードバックの大部分は、そのテキストの書き方に関する重要な文脈を欠いた最後のエッセイに基づいている。
私たちは、学生のタイプとエッセイの時間とともにどのように進化していくかをキャプチャーするデジタル・ライティング・ツールを構築しました。
論文参考訳(メタデータ) (Mon, 09 Jun 2025 20:42:02 GMT)