OpenThoughts: Data Recipes for Reasoning Models [215.2] OpenThoughtsプロジェクトは、推論モデルをトレーニングするためのオープンソースのデータセットを作成することだ。
OpenThoughts2-1Mデータセットは、公開推論データに基づいてトレーニングされた最初のモデルであるOpenThinker2-32Bに導かれた。
OpenThoughts3-7Bモデル。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:21:52 GMT)
OmniCharacter: Towards Immersive Role-Playing Agents with Seamless Speech-Language Personality Interaction [123.9] OmniCharacter は,低レイテンシで没入型 RPA を実現するための対話型対話モデルである。
具体的には、OmniCharacterは、エージェントが相互作用を通して、ロール固有の性格特性と声質特性を一貫して表示できるようにする。
提案手法は,既存のRPAモデルや主流言語モデルと比較して,応答遅延を289msに抑えながら,内容とスタイルの両面で優れた応答が得られる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:53:28 GMT)
Contrastive Visual Data Augmentation [119.5] 大規模なマルチモーダルモデル(LMM)は、訓練済みの知識に依存し、微妙な視覚的詳細を捉える能力に制限があるため、しばしば新しい概念を認識するのに苦労する。
本稿では,LMMの視覚的特徴と言語との整合性を改善するために,Contrastive visual Data Augmentation(CoDA)戦略を提案する。
CoDAは、認識されていない既知の概念に対して、ターゲット概念の重要な対照的なテキスト的特徴と視覚的特徴を抽出し、ターゲットとなる合成データを生成するために、マルチモーダル生成モデルを使用する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:50:14 GMT)
Object-X: Learning to Reconstruct Multi-Modal 3D Object Representations [112.3] Object-Xは多目的なマルチモーダル3D表現フレームワークである。
リッチなオブジェクトの埋め込みをエンコードして、幾何学的および視覚的再構成に復号することができる。
シーンアライメント、シングルイメージの3Dオブジェクト再構成、ローカライゼーションなど、さまざまなダウンストリームタスクをサポートする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:14:42 GMT)
Video World Models with Long-term Spatial Memory [110.5] 本稿では,ビデオワールドモデルの長期的整合性を高める新しい枠組みを提案する。
我々のフレームワークは、長期空間記憶から情報を保存・取得する機構を含んでいる。
評価の結果,関連するベースラインに比べて品質,一貫性,コンテキスト長が向上した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:42:34 GMT)
Recycling the Web: A Method to Enhance Pre-training Data Quality and Quantity for Language Models [107.2] 我々は,低品質な文書を学習に役立てるために, guIded Rewrite で Web をリサイクルする REWIRE を提案する。
高品質な原文と書き直しテキストが混在すると,22のタスクでそれぞれ1.0,1.3,2.5のパーセンテージが向上することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:12:12 GMT)
Urania: Differentially Private Insights into AI Use [104.7] $Urania$は、クラスタリング、パーティション選択、ヒストグラムベースの要約といったDPツールを活用することによって、エンドツーエンドのプライバシ保護を提供する。
結果は、厳密なユーザのプライバシを維持しながら、意味のある会話の洞察を抽出するフレームワークの能力を示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:00:31 GMT)
Visual Text Processing: A Comprehensive Review and Unified Evaluation [99.6] 視覚テキスト処理における最近の進歩を包括的・多視点的に分析する。
本研究の目的は,視覚テキスト処理のダイナミックな分野における今後の探索と革新を促進する基礎資源として,本研究を確立することである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:59:02 GMT)
Dissecting Long Reasoning Models: An Empirical Study [94.3] 強化学習(RL)における正・負のサンプルの役割を系統的に分析する。
グループ相対的政策最適化において、サンプルの半数以上がゼロの優位性を持つような実質的なデータ非効率性を同定する。
本研究では,様々な推論モデルとベンチマークの不安定な性能について検討し,不明瞭な結果を伴う不確実な問題に対する不安定性について考察した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:47:10 GMT)
Sample Complexity and Representation Ability of Test-time Scaling Paradigms [91.3] テスト時間スケーリングのパラダイムは、複雑なタスクにおいて、大きな言語モデル(LLM)の能力を向上した。
本稿では, 自己整合性, ベスト・オブ・n$, 自己補正など, 様々なテストタイム戦略のサンプル効率について検討する。
単一のTransformerアーキテクチャは、ユーザクエリに関連する特定のタスクを事前に知ることなく、複数のタスクを確実に解決することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:48:19 GMT)
SmartAvatar: Text- and Image-Guided Human Avatar Generation with VLM AI Agents [91.3] SmartAvatarは視覚言語によるアニメーション対応の3Dアバターを生成するためのフレームワークである。
重要なイノベーションは、エージェントがドラフトアバターを描画する自動検証ループである。
生成されたアバターは完全にリグされ、一貫したアイデンティティと外観で操作をサポートする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:49:01 GMT)
Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models [90.5] 我々は、前身のGTE-Qwenシリーズよりも大幅に進歩したQwen3 Embeddingシリーズを紹介する。
Qwen3 Embeddingシリーズは、組み込みタスクと再ランクタスクの両方のためのモデルサイズの範囲を提供する。
Qwen3 Embeddingシリーズは様々なベンチマークで最先端の結果が得られる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:49:48 GMT)
DiCoRe: Enhancing Zero-shot Event Detection via Divergent-Convergent LLM Reasoning [89.4] DiCoReは、DreamerとGolderを使ってEDのタスクを分離する分散収束推論フレームワークである。
我々は、DiCoReがゼロショット、トランスファーラーニング、推論ベースラインを一貫して上回っていることを実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:16:14 GMT)
DataGen: Unified Synthetic Dataset Generation via Large Language Models [88.2] DataGenは、多様な、正確で、高度に制御可能なデータセットを生成するように設計された包括的なフレームワークである。
データ多様性を強化するため、DataGenは属性誘導生成モジュールとグループチェック機能を備えている。
大規模な実験は、DataGenによって生成されたデータの優れた品質を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:59:14 GMT)
Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3] コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:25:49 GMT)
Quantifying Cross-Modality Memorization in Vision-Language Models [86.8] モーダリティ記憶のユニークな特徴について検討し,視覚言語モデルを中心とした体系的な研究を行う。
以上の結果から,一方のモダリティが他方のモダリティに伝達されることが判明したが,情報源の情報と対象のモダリティの間には大きなギャップがあることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:10:47 GMT)
ICPC-Eval: Probing the Frontiers of LLM Reasoning with Competitive Programming Contests [85.7] 推論のフロンティアを探索するために設計されたトップレベルの競合コーディングベンチマークである textbfICPC-Eval を提案する。
ICPC-Evalは、世界中の各地域で開催されている11のICPCコンテストから、118の慎重にキュレートされた問題を含んでいる。
結果は、複雑な推論能力を評価する上で重要な課題を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:20:37 GMT)
SNaRe: Domain-aware Data Generation for Low-Resource Event Detection [84.8] 事象検出は、生物医学、法学、疫学のような高度に専門化された領域での推論を可能にするために重要である。
SNaReは、Scout、Narrator、Refinerの3つのコンポーネントから構成される、ドメイン対応の合成データ生成フレームワークである。
Scoutはラベルのないターゲットドメインデータからトリガーを抽出し、高品質なドメイン固有のトリガーリストをキュレートする。
これらのトリガに条件付けされたナレーターは、高品質なドメイン整列文を生成し、Refinerは追加のイベント参照を識別する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:45:00 GMT)
Look Before You Leap: A GUI-Critic-R1 Model for Pre-Operative Error Diagnosis in GUI Automation [83.9] 実際の実行に先立って効果的なフィードバックを提供する事前の批判機構を導入する。
そこで我々は,GUI-Critic-TrainとGUI-Critic-Testを作成するために,推論ブートストラップに基づくデータ収集パイプラインを開発した。
我々のモデルは、現在のMLLMと比較して、批評家の精度に大きな利点をもたらす。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:12:36 GMT)
Exploring Diffusion Transformer Designs via Grafting [82.9] 計算予算の少ない新しいアーキテクチャを実現するために,事前に訓練された拡散変換器(DiT)を編集する簡単な手法であるグラフト方式を提案する。
演算子置換からアーキテクチャ再構成に至るまで,事前訓練したDiTをグラフトすることで,新しい拡散モデルの設計を探索できることが示されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:40 GMT)
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training [82.7] 実データに対する対角的VRトレーニングを行うセドVR2と呼ばれる一段階拡散型VRモデルを提案する。
単一ステップで高精細度VRを扱うために、モデルアーキテクチャとトレーニング手順の両方にいくつかの拡張を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:51:05 GMT)
Beyond Accuracy: Dissecting Mathematical Reasoning for LLMs Under Reinforcement Learning [82.4] 本稿では,強化学習が推論に与える影響を明らかにするための,きめ細かい分析フレームワークを提案する。
本フレームワークは,RLトレーニングの恩恵を受けると仮定された重要な要素を具体的に調査する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:53:59 GMT)
ReCalKV: Low-Rank KV Cache Compression via Head Reordering and Offline Calibration [81.8] 大きな言語モデル(LLM)はキーバリュー(KV)キャッシュを保存するのに必要な過剰なメモリによって制約されることが多い。
近年,KVキャッシュの隠蔽次元の低減について検討されている。
本稿では,KVキャッシュの隠れ次元を削減した後学習KVキャッシュ圧縮手法ReCalKVを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:27:34 GMT)
The Common Pile v0.1: An 8TB Dataset of Public Domain and Openly Licensed Text [81.0] オープンライセンスの8テラバイトのテキストコレクションであるCommon Pile v0.1を収集、キュレート、リリースしています。
Common Pileは、研究論文、コード、書籍、百科事典、教育資料、オーディオ書き起こしなど、さまざまな分野にまたがる30のソースからのコンテンツで構成されている。
我々は,コモンパイルからテキストで20億のパラメータLSMをトレーニングすることで,我々の努力を検証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:21:30 GMT)
When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration [79.7] 我々は,人間とAIの知識伝達能力に関する概念的かつ実験的フレームワークである知識統合と伝達評価(KITE)を紹介する。
最初の大規模人間実験(N=118)を行い,その測定を行った。
2段階のセットアップでは、まずAIを使って問題解決戦略を思いつき、その後独立してソリューションを実装し、モデル説明が人間の理解に与える影響を分離します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:48:16 GMT)
Towards provable probabilistic safety for scalable embodied AI systems [79.3] エンボディードAIシステムは、様々なアプリケーションでますます普及している。
複雑な運用環境での安全性確保は依然として大きな課題である。
提案する確率的安全性は,大規模展開の残留リスクが予め定義された閾値以下であることを保証することを目的としている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:46:25 GMT)
Interpretable Few-Shot Image Classification via Prototypical Concept-Guided Mixture of LoRA Experts [79.2] 自己説明可能なモデル(SEM)は、視覚認識プロセスをより解釈可能なものにするために、プロトタイプ概念学習(PCL)に依存している。
パラメトリック不均衡と表現の不整合という2つの重要な課題を緩和するFew-Shotプロトタイプ概念分類フレームワークを提案する。
我々のアプローチは、既存のSEMを顕著な差で常に上回っており、5-way 5-shot分類では4.2%-8.7%の相対的な利得がある。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:39:43 GMT)
FocusDiff: Advancing Fine-Grained Text-Image Alignment for Autoregressive Visual Generation through RL [78.6] 微細なテキスト画像のセマンティックアライメントを強化するためにFocusDiffを提案する。
我々は、類似した全体表現を持つペアテキストと画像の新しいデータセットを構築するが、局所的な意味論を区別する。
提案手法は,既存のテキスト・画像・ベンチマークにおける最先端性能を実現し,PairCompの先行手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:36:33 GMT)
Perceptual Decoupling for Scalable Multi-modal Reasoning via Reward-Optimized Captioning [78.2] 本稿では,抽出者のキャプション動作と推論目的を一致させる推論誘導型強化学習戦略を提案する。
マルチモーダルな数学と科学ベンチマークの実験により、提案手法は最先端の平均性能を達成することを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:28:07 GMT)
OGGSplat: Open Gaussian Growing for Generalizable Reconstruction with Expanded Field-of-View [74.6] 一般化可能な3次元再構成において視野を拡大するオープンガウス成長法であるOGGSplatを提案する。
我々の重要な洞察は、オープンガウスのセマンティックな属性が、画像外挿の強い先行性を提供するということである。
OGGSplatはまた、スマートフォンカメラから直接撮影される2つのビューイメージを備えた場合、有望なセマンティック・アウェア・シーン再構築機能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:17:18 GMT)
SparseMM: Head Sparsity Emerges from Visual Concept Responses in MLLMs [74.3] マルチモーダル言語モデル(MLLM)が視覚入力をどのように処理するかを,その注意機構を解析して検討する。
LLMにおける注目のごく一部だけが視覚的理解に有効である。
我々は,KVキャッシュ最適化手法であるSparseMMを導入し,その視覚的スコアに基づいて非対称な計算予算をLLMの先頭に割り当てる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:55 GMT)
SPARTA ALIGNMENT: Collectively Aligning Multiple Language Models through Combat [73.5] SPARTA ALIGNMENT(SPARTA ALIGNMENT)を提案する。
各イテレーションにおいて、1つの命令と2つのモデルがデュエルのために選択され、他のモデルが2つのレスポンスを評価し、それらの評価スコアは、適応されたエロランクベースの評価システムを介して集約される。
ピア評価された戦闘結果は、敗戦よりも勝利の反応が優先される選好ペアとなり、各イテレーションの最後にこれらの選好からすべてのモデルが学習される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:51:23 GMT)
VideoMolmo: Spatio-Temporal Grounding Meets Pointing [73.3] VideoMolmoは、ビデオシーケンスのきめ細かいポインティングに適したモデルだ。
新しい仮面融合はSAM2を双方向の点伝播に用いている。
The generalization of VideoMolmo, we introduced VPoMolS-temporal, a challenge out-of-distribution benchmark across two real-world scenarios。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:29 GMT)
From System 1 to System 2: A Survey of Reasoning Large Language Models [72.9] 基礎的な大規模言語モデルは、迅速な意思決定では優れているが、複雑な推論には深みがない。
OpenAIのo1/o3とDeepSeekのR1は、数学やコーディングといった分野のエキスパートレベルのパフォーマンスを実証している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:18:45 GMT)
Beyond Memorization: A Rigorous Evaluation Framework for Medical Knowledge Editing [72.8] 知識編集(KE)は,大規模言語モデル(LLM)の特定の事実を,完全なリトレーニングを必要とせずに更新する,有望なアプローチとして登場した。
本稿では,医療領域における既存のKE手法の有効性を厳格に評価するために,MedEditBenchという新しいフレームワークを提案する。
以上の結果から,現在のKE法は,新たなシナリオへの一般化に失敗し,インジェクションされた情報の表層記憶に留まることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:20:15 GMT)
OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning [72.6] OCRBench v2は、大規模なバイリンガルテキスト中心のベンチマークである。
さまざまなシナリオ31、人間検証された質問回答ペア1万、詳細な評価指標をカバーしている。
LMMのスコアは50未満(合計100点)で、5種類の制限に悩まされている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:59:05 GMT)
Aligning Latent Spaces with Flow Priors [72.2] 本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。
特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:59:53 GMT)
When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding [72.2] 大規模マルチモーダルモデル(LMM)は視覚知覚と推論において顕著な進歩を遂げた。
視覚的に曖昧で非意味的なシーンテキストに直面すると、コンテンツを正確に見つけて理解するのに苦労することが多い。
本稿では,2つの主要コンポーネントからなる学習自由な意味幻覚緩和フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:53:19 GMT)
Does Your 3D Encoder Really Work? When Pretrain-SFT from 2D VLMs Meets 3D VLMs [72.1] 本稿では,最近の3次元視覚言語モデルを3次元オブジェクト中心,2次元イメージベース,および3次元シーン中心のアプローチに分類する。
3Dシーン中心のVLMと2Dシーン中心のVLMのアーキテクチャ的類似性にもかかわらず、最新の3Dオブジェクト中心と2Dイメージベースアプローチと比較して比較的低い性能を示した。
本研究は,これらのモデルが多モードアライメント機能を有する一方で,言語的手がかりに過度に頼り,頻繁な回答に過度に適合する傾向があることを示唆している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:56:12 GMT)
The Generative Leap: Sharp Sample Complexity for Efficiently Learning Gaussian Multi-Index Models [71.5] この研究において、ラベルは(ガウス)$d$-次元入力にのみ依存し、低次元$r = O_d(1)$部分空間への射影を通して得られる。
生成的跳躍指数 $kstar$, [Damian et al.'24] から生成的指数の自然拡張をマルチインデックス設定に導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:34:56 GMT)
Truth in the Few: High-Value Data Selection for Efficient Multi-Modal Reasoning [71.4] アクティベーション推論ポテンシャル(RAP)と呼ばれる新しいデータ選択パラダイムを提案する。
RAPは、真のマルチモーダル推論を刺激する各サンプルのポテンシャルを推定することで、認知サンプルを識別する。
我々のRAP法は、トレーニングデータの9.3%しか使用せず、計算コストを43%以上削減しながら、常に優れた性能を実現している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:40:24 GMT)
Layered Motion Fusion: Lifting Motion Segmentation to 3D in Egocentric Videos [71.2] 本研究では,2次元モデルから層状放射場への運動分割予測を融合させることにより,3次元の動的セグメンテーションを改善することを提案する。
テスト時間の改善によってこの問題に対処し、モデルが特定のフレームに集中できるようにし、データの複雑さを軽減します。
このことは、3D技術が挑戦的で現実的な環境での動的現象に対しても2次元解析を向上できることを証明している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:46:48 GMT)
MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark [70.5] MMTUは、25の現実世界のテーブルタスクに30万以上の質問がある大規模なベンチマークである。
MMTUは、専門家レベルで実際のテーブルを理解し、推論し、操作できるモデルを包括的に評価するように設計されている。
MMTUはテーブル理解、推論、コーディングといった、今日のフロンティアモデルにとって困難なスキルの組み合わせを必要としています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:05:03 GMT)
Towards Storage-Efficient Visual Document Retrieval: An Empirical Study on Reducing Patch-Level Embeddings [70.3] ColPali/ColQwen2は各ページを複数のパッチレベルの埋め込みにエンコードし、過剰なメモリ使用率をもたらす。
本研究では,ページごとのパッチ埋め込みを最小性能劣化時に低減する方法について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:06:01 GMT)
A Fictional Q&A Dataset for Studying Memorization and Knowledge Acquisition [69.6] 本稿では,事実記憶と動詞列記憶という2つのプロセスを研究するための新しいデータセットを提案する。
データセットは、フィクションイベントに関する合成生成されたWebテキストのようなドキュメントと、イベントに関する質問と回答のペアで構成されている。
我々は、架空の出来事に関する合成データが、異なる形態の記憶を分解する上でどのように有効であるかを示す訓練実験を行う。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:58:20 GMT)
Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning [69.6] 本稿では,大規模言語モデル(LLM)によって強化された動作エージェントを,動的・乱雑な環境における自律的なナビゲーションに向けて前進させる。
トレーニング不要なフレームワークは、マルチエージェント調整、クローズドループ計画、動的障害物回避を、リトレーニングや微調整なしでサポートしています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:17:03 GMT)
Do It Yourself: Learning Semantic Correspondence from Pseudo-Labels [69.6] 本稿では,3D対応の擬似ラベルを用いた意味対応推定法を提案する。
具体的には, 3D-aware chaining を用いて得られた擬似ラベルを用いて, 既製の特徴を洗練するためのアダプタを訓練する。
データセット固有のアノテーションの必要性を減らしながら、SPair-71kに新たな最先端を4%以上の絶対的なゲインに設定しました。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:54:33 GMT)
NOBLE -- Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models [68.9] NOBLEは、解釈可能なニューロンの特徴を連続周波数変調した埋め込みから電流注入によって誘導されるソマティック電圧応答へのマッピングを学ぶ神経オペレーターフレームワークである。
内在的な実験変数を考慮したニューラルダイナミクスの分布を予測する。
NOBLEは、実際の実験データに基づいて検証された最初のスケールアップされたディープラーニングフレームワークである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:01:18 GMT)
Bringing SAM to new heights: Leveraging elevation data for tree crown segmentation from drone imagery [68.7] 現在のモニタリング手法には、大規模なコスト、時間、労力を必要とする地上計測が含まれる。
ドローンのリモートセンシングとコンピュータビジョンは、広範囲の航空画像から個々の木をマッピングする大きな可能性を秘めている。
高解像度ドローン画像におけるツリークラウンインスタンスの自動セグメンテーションのためのセグメンテーションモデル(SAM)を用いた手法の比較を行った。
また,デジタルサーフェスモデル(DSM)情報を用いたモデルへの標高データの統合についても検討した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:43:11 GMT)
MesaNet: Sequence Modeling by Locally Optimal Test-Time Training [67.5] 我々は,最近提案されたMesa層の数値的に安定かつチャンクワイズ可能な並列化版を導入する。
テストタイムの最適トレーニングにより、従来のRNNよりも言語モデリングの難易度が低く、ダウンストリームベンチマークのパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:50:23 GMT)
VoxDet: Rethinking 3D Semantic Occupancy Prediction as Dense Object Detection [67.1] 3Dのセマンティック占有予測は,周囲環境の3D形状とセマンティックスを再構築することを目的としている。
密接なボクセルラベルでは、以前の研究は通常、これを密接なセグメンテーションタスクとして定式化し、それぞれのボクセルを独立に分類する。
本稿では,Voxelレベルの占有率予測を高密度オブジェクト検出として再構成する,インスタンス中心のフレームワークであるVoxDetを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:31:55 GMT)
LSM-2: Learning from Incomplete Wearable Sensor Data [65.6] 本稿では,Adaptive and Inherited Masking (AIM)を用いた第2世代Large Sensor Model (LSM-2)を紹介する。
AIMは明示的な計算を必要とせず、不完全なデータから直接堅牢な表現を学習する。
AIMを用いた LSM-2 は, 分類, 回帰, 生成モデルなど, 多様なタスクにまたがる最高の性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:57:11 GMT)
Why LLM Safety Guardrails Collapse After Fine-tuning: A Similarity Analysis Between Alignment and Fine-tuning Datasets [65.0] 本稿では,上流アライメントデータセットと下流微調整タスクの表現類似性のレンズによる安全ガードレールの劣化について検討する。
これらのデータセット間の高い類似性は、安全ガードレールを著しく弱め、モデルがジェイルブレイクの影響を受けやすくする。
これら2種類のデータセット間の類似性が低いと、より堅牢なモデルが得られ、有害度スコアが最大10.33%減少する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:55 GMT)
Biased AI can Influence Political Decision-Making [64.9] 本稿では,大言語モデル(LLM)におけるパルチザンバイアスが政治的意見や意思決定に与える影響について検討する。
その結果,党派偏見モデルに曝露した参加者は,LLMの偏見と一致した意見を取り入れ,決定を下す可能性が有意に高いことがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:55:15 GMT)
FreeTimeGS: Free Gaussians at Anytime and Anywhere for Dynamic Scene Reconstruction [64.3] ガウス的プリミティブを任意の時間と位置で表示できる新しい4D表現であるFreeTimeGSを提案する。
我々の表現は強い柔軟性を持ち、ダイナミックな3Dシーンをモデル化する能力を向上させる。
いくつかのデータセットに対する実験結果から,本手法のレンダリング品質は,最近の手法よりも大きなマージンで優れていることが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:57 GMT)
Track Any Anomalous Object: A Granular Video Anomaly Detection Pipeline [64.0] Track Any Anomalous Object (TAO)と呼ばれる新しいフレームワークでは、詳細なビデオ異常検出パイプラインが導入されている。
各画素に異常スコアを割り当てる手法とは異なり、我々の手法は問題から異常オブジェクトの画素レベルの追跡に変換する。
実験の結果、TAOは新しいベンチマークを精度と堅牢性で設定した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:49:39 GMT)
Distilling the Implicit Multi-Branch Structure in LLMs' Reasoning via Reinforcement Learning [63.9] 教師による微調整(SFT)による教師から生徒への推論経路の蒸留は、大規模言語モデル(LLM)の推論能力を向上させるショートカットを提供する。
GSRM(Generative Structure Reward Model)による強化学習に基づく蒸留フレームワークRLKDを提案する。
GSRMは、推論パスを複数のメタ推論解決ステップに変換し、報酬を計算して、学生と教師の推論の構造的アライメントを測定する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:57:42 GMT)
FullDiT2: Efficient In-Context Conditioning for Video Diffusion Transformers [63.8] FullDiT2は、ビデオ生成と編集の両方における一般的な制御性のための効率的なコンテキスト内条件付けフレームワークである。
FullDiT2は、拡散ステップ当たりの平均時間コストにおいて、計算の大幅な削減と2~3倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:35:21 GMT)
EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents [63.4] EmbodiedBenchは、視覚駆動型エンボディエージェントを評価するために設計された広範囲なベンチマークである。
我々はEmbodiedBench内のプロプライエタリおよびオープンソースMLLMを24件評価した。
MLLMは高いレベルのタスクで優れるが、低レベルの操作に苦戦し、最高のモデルであるGPT-4oは平均28.9%のスコアしか獲得できなかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:22:50 GMT)
Advancing Tool-Augmented Large Language Models via Meta-Verification and Reflection Learning [63.2] 本稿では,2つの重要なイノベーションを通じてシステム2推論を包括的に行う新しいツール拡張LDMであるTool-MVRを提案する。
具体的には、まず、API、クエリ、推論トラジェクトリを厳格に検証する体系的なパイプラインであるMulti-Agent Meta-Verification(MAMV)を紹介します。
第2に,ツールフィードバックを活用することで,ツールのリフレクション機能を向上させるExploration-based Reflection Learning (EXPLORE)を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:35:49 GMT)
MLLM-CL: Continual Learning for Multimodal Large Language Models [62.9] ドメインと能力の連続学習を含む新しいベンチマークであるMLLM-CLを紹介する。
我々のアプローチは、ドメイン固有の知識と機能的能力とを最小限の忘れ込みで統合することができ、既存の手法よりもはるかに優れています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:58:13 GMT)
Can Watermarking Large Language Models Prevent Copyrighted Text Generation and Hide Training Data? [62.7] 著作権文書の生成に対する抑止剤としての透かしの有効性について検討する。
我々は、透かしがメンバーシップ推論攻撃(MIA)の成功率に悪影響を及ぼすことを発見した。
透かしにおける最近のMIAの成功率を改善するための適応的手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:46:17 GMT)
Prompting is Not All You Need! Evaluating LLM Agent Simulation Methodologies with Real-World Online Customer Behavior Data [62.6] 人間の行動のシミュレーションにおいて「主観的信頼性」よりも「LLMの客観的精度」を評価することに重点を置いている。
本稿では,Web ショッピング行動生成の課題に対して,最先端 LLM の総合評価を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:33:15 GMT)
The Lessons of Developing Process Reward Models in Mathematical Reasoning [62.2] Process Reward Models (PRM) は、推論プロセスにおける中間エラーを特定し、緩和することを目的としている。
我々は,モンテカルロ (MC) 推定とLarge Language Models (LLM) を効果的に統合するコンセンサスフィルタリング機構を開発した。
私たちは、既存のオープンソース代替品よりも優れた、最先端のPRMを新たにリリースしています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:34:24 GMT)
EvaLearn: Quantifying the Learning Capability and Efficiency of LLMs via Sequential Problem Solving [62.0] EvaLearnは、大きな言語モデル(LLM)を学習能力と課題の効率性を評価するために設計されたベンチマークである。
9つのフロンティアモデルをベンチマークし、様々な性能プロファイルを観察する。
静的能力の強い現在のLLMは、全てのタスクにおいて学習能力に明らかな優位性を示すものではない。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:44:51 GMT)
Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay [61.8] 強化学習(RL)は、大規模言語モデル(LLM)の微調整に有効なアプローチとなっている。
LLM RLファインチューニングにおけるデータ効率向上のための2つの手法を提案する。
本手法は,RLの微調整時間を25%から65%削減し,GRPOアルゴリズムと同等の性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:55:43 GMT)
Unleashing Hour-Scale Video Training for Long Video-Language Understanding [61.7] 本稿では,大規模な時間長ビデオインストラクション追従データセットであるVideoMarathonを紹介する。
このデータセットには、ビデオあたり3分から60分に及ぶ、さまざまなドメインからソースされた9,700時間の長いビデオが含まれている。
時間スケールビデオ言語モデリングのための高効率ビデオLMMであるHour-LLaVAを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:04 GMT)
Unfolding Spatial Cognition: Evaluating Multimodal Models on Visual Simulations [61.2] 既存のAIベンチマークは、主に言語推論を評価し、非言語的で多段階の視覚シミュレーションの複雑さを無視している。
STAREは,マルチモーダルな大規模言語モデルを視覚シミュレーションによりよりよく解いたタスクで厳格に評価するためのベンチマークである。
評価の結果,より単純な2次元変換よりもモデルの方が優れているが,より複雑なタスクにおいてランダムに近い確率で実行可能であることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:09:46 GMT)
CLATTER: Comprehensive Entailment Reasoning for Hallucination Detection [61.0] 我々は,系統的かつ包括的な推論プロセスを実行するためのモデルを導くことで,モデルがよりきめ細やかで正確な絞り込み決定を実行できることを提案する。
我々は,(i)クレームの分解,(ii)サブクレームの属性と包含分類,および(iii)集約分類から成る3段階の推論プロセスを定義し,そのような導出推論が実際に幻覚検出の改善をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:02:52 GMT)
TextVidBench: A Benchmark for Long Video Scene Text Understanding [60.9] TextVidBenchは、長ビデオテキスト質問応答用に設計された最初のベンチマークである(>3分)。
TextVidBenchは3つの重要な貢献をしている: 9つのカテゴリ(ニュース、スポーツ、ゲームなど)を平均2306秒で拡大し、より現実的な長ビデオ理解を可能にする。
i)IT-ロープ機構と時間的プロンプトエンジニアリングを導入し、時間的知覚を高めること、(ii)非一様位置符号化を採用して長いビデオシーケンスをよりよく扱うこと、(iii)軽量な微調整を施すことにより、大規模モデルを改善するための効率的なパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:54:56 GMT)
MonkeyOCR: Document Parsing with a Structure-Recognition-Relation Triplet Paradigm [60.1] MonkeyOCRはドキュメント解析のためのビジョン言語モデルである。
SRR(Structure-Recognition-Relation)三重項パラダイムを活用することで、最先端の技術の進歩を図っている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:34:57 GMT)
MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining [60.0] 提案するMiMo-7Bは,学習前の段階と学習後の段階にまたがって最適化された,推論タスクのための大規模言語モデルである。
MiMo-7B-Baseは25兆のトークンで事前訓練されており、性能の向上と推論速度の高速化を目標としている。
最後のRLチューニングモデルであるMiMo-7B-RLは、OpenAI o1-miniの性能を上回り、数学、コード、一般的な推論タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:49:09 GMT)
On the Emergence of Position Bias in Transformers [59.9] 本稿では,多層構造における位置バイアスを解析するためのグラフ理論フレームワークを提案する。
我々のフレームワークは、トランスにおける位置的相互作用を理解するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:00:48 GMT)
SRD: Reinforcement-Learned Semantic Perturbation for Backdoor Defense in VLMs [57.9] 攻撃者は、トレーニングデータに知覚不能な摂動を注入することができ、モデルが悪意のある攻撃的制御されたキャプションを生成する。
本稿では,引き金の事前知識を伴わずにバックドア動作を緩和する強化学習フレームワークであるセマンティック・リワード・ディフェンス(SRD)を提案する。
SRDはDeep Q-Networkを使用して、機密画像領域に個別の摂動を適用するためのポリシーを学習し、悪意ある経路の活性化を妨害することを目的としている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:22:24 GMT)
RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors [57.8] 本稿では,72kの多種多様かつ高い変換可能な対向例からなるRAID(Robust Evaluation of AI- generated Image Detectors)を提案する。
提案手法は,未知の検出器に高い成功率で転送する逆画像を生成する。
以上の結果から,現在最先端のAI生成画像検出器は,敵の例によって容易に認識できることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:39:28 GMT)
CLIPErase: Efficient Unlearning of Visual-Textual Associations in CLIP [57.5] CLIPEraseは視覚的・テキスト的関連を選択的に忘れる新しいアプローチである。
CIFAR-100とFlickr30Kデータセットの実験は、CLIPEraseがマルチモーダルサンプルのゼロショットタスクにおける指定された関連性を効果的に忘れていることを示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:48:38 GMT)
Revisiting Depth Representations for Feed-Forward 3D Gaussian Splatting [57.4] 本稿では,事前学習した変圧器によって予測される点マップに基づく新しい正規化損失PM-Lossを紹介する。
改良された深度マップにより,様々なアーキテクチャやシーンのフィードフォワード3DGSを大幅に改善する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:58:23 GMT)
Relational Conformal Prediction for Correlated Time Series [56.6] 時系列における不確実性定量化の問題を相関配列を利用して解決する。
共形予測フレームワークと量子レグレッションに基づく分布自由な新しい手法を提案する。
我々の手法は正確なカバレッジを提供し、関連するベンチマークで最先端の不確実性定量化を実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:20:34 GMT)
OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation [56.5] OPERAは、ユーザペルソナ、ブラウザの観察、きめ細かいWebアクション、そして自己報告されたジャストインタイム論理を包括的にキャプチャする最初のパブリックデータセットである。
我々は,現在のLCMがユーザの次の行動と合理的性をどの程度予測できるかを評価するための最初のベンチマークを確立する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:37:49 GMT)
Safe: Enhancing Mathematical Reasoning in Large Language Models via Retrospective Step-aware Formal Verification [56.2] Chain-of-Thoughtプロンプトは、大規模言語モデル(LLM)から推論能力を引き出すデファクトメソッドとなっている。
検出が極めて難しいCoTの幻覚を緩和するために、現在の方法は不透明なボックスとして機能し、彼らの判断に対する確認可能な証拠を提供しておらず、おそらくその効果を制限する。
任意のスコアを割り当てるのではなく、各推論ステップで形式数学言語Lean 4で数学的主張を明確にし、幻覚を識別するための公式な証明を提供しようとしている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:16:08 GMT)
TreeRPO: Tree Relative Policy Optimization [56.0] nameは、ツリーサンプリングを用いて、様々な推論ステップで報酬の数学的期待を推定する新しい方法である。
GRPOの集団相対的な報酬訓練機構に基づいて、木サンプリング時に生成されたステップレベルグループに基づいて報酬を革新的に計算する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:56:38 GMT)
Neural Network Reprogrammability: A Unified Theme on Model Reprogramming, Prompt Tuning, and Prompt Instruction [55.9] モデル適応のための統一フレームワークとして,ニューラルネットワークの再プログラム可能性を導入する。
本稿では,4つの重要な側面にまたがる情報操作アプローチを分類する分類法を提案する。
残る技術的課題や倫理的考察も分析する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:42:27 GMT)
Tuning the Right Foundation Models is What you Need for Partial Label Learning [55.6] 部分ラベル学習は、不正確な監督を伴うデータセットから一般化可能な分類器を訓練しようとする。
本研究では,13のアプローチによる11の基盤モデルの評価を,3つのシナリオ下で8つのベンチマークデータセット上で実証的に実施する。
その結果, 基礎モデルを用いた場合, 2) 互いに著しく類似した性能を示し, 3) 様々なあいまいさレベルにわたって安定な性能を維持し, 4) 基礎モデルの選択や適応戦略に敏感であることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:37:33 GMT)
Practical Manipulation Model for Robust Deepfake Detection [55.2] 画像超解像領域において,より現実的な劣化モデルを構築した。
擬似フェイクの空間を、ポアソンブレンディング、より多様なマスク、ジェネレータアーティファクト、およびイントラクタを用いて拡張する。
DFDCデータセットとDFDCPデータセットでは、それぞれ3.51%$と6.21%$AUCが明らかに増加した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:06:16 GMT)
FRAME: Pre-Training Video Feature Representations via Anticipation and Memory [55.0] FRAMEは、高密度ビデオ理解に適した自己監督型ビデオフレームエンコーダである。
同社は、過去と現在のRGBフレームから現在と将来のDINOパッチ機能を予測することを学ぶ。
画像エンコーダや既存の自己監督型ビデオモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:44:47 GMT)
UAV4D: Dynamic Neural Rendering of Human-Centric UAV Imagery using Gaussian Splatting [54.9] UAV4Dは,UAVが捉えたダイナミックな現実世界のシーンに対して,フォトリアリスティックなレンダリングを可能にするフレームワークである。
我々は3次元基礎モデルと人間のメッシュ再構築モデルを組み合わせて、シーン背景と人間の両方を再構築する。
以上の結果から,新しい視点合成法に対するアプローチの利点が示され,1.5dBPSNRの改善と視覚的シャープネスの向上が達成された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:21:09 GMT)
Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models [54.6] 本稿では,事前学習したオブジェクトカウント技術とオブジェクト検出器を用いて生成をガイドする新しいフレームワークを提案する。
まず、完全生成画像上で計算された外ループ損失を用いてカウントトークンを最適化する。
第二に、視点や比例シフトによる誤差を補正する検出駆動スケーリング項を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:25:55 GMT)
MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning [54.5] MORSE-500(MORSE-500)は、6つの補足的推論カテゴリにまたがる500の完全スクリプト化されたクリップを埋め込んだビデオベンチマークである。
各インスタンスは、決定論的Pythonスクリプト(Manim、Matplotlib、MoviePy)、生成ビデオモデル、実際の映像を使用して生成される。
一度飽和すると時代遅れになる静的ベンチマークとは異なり、MORSE-500は進化するために構築されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:12:45 GMT)
SynthesizeMe! Inducing Persona-Guided Prompts for Personalized Reward Models in LLMs [54.5] 本稿では,パーソナライズされた報酬モデリングのためのユーザインタラクションから合成ユーザペルソナを誘導するアプローチであるSynthesizeMeを紹介する。
また、SynthesizeMeによるプロンプトの使用により、パーソナライズされたプロンプトがArenaで4.4%向上することを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:23:16 GMT)
AGENTFUZZER: Generic Black-Box Fuzzing for Indirect Prompt Injection against LLM Agents [54.3] 本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentFuzzerを提案する。
我々はAgentFuzzerをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:44:46 GMT)
ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL [54.1] 連鎖推論と強化学習がNLPの突破口となった。
我々はReasonGen-R1を紹介した。ReasonGen-R1は自動回帰画像生成器に明示的なテキストベースの「思考」スキルを付与するフレームワークである。
ReasonGen-R1は、強いベースラインや先行技術モデルよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:51:58 GMT)
AnyTop: Character Animation Diffusion with Any Topology [54.1] 我々は,異なる動きダイナミクスを持つ多種多様な文字に対する動きを生成する拡散モデルであるAnyTopを紹介する。
我々の研究は、任意の骨格学習に適したトランスフォーマーベースの認知ネットワークを特徴としている。
我々の評価では、AnyTopsはトポロジー当たりのトレーニング例が3つも少なく、見えない骨格の運動も生成できる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:23:33 GMT)
UniRes: Universal Image Restoration for Complex Degradations [53.7] 実世界のイメージ復元は、様々なキャプチャ条件、キャプチャデバイス、後処理パイプラインから生じるさまざまな劣化によって妨げられている。
UniResという名前の、シンプルで柔軟な拡散ベースのフレームワークは、このような劣化をエンドツーエンドで解決するために提案されている。
提案手法は, 複合劣化画像復元データセットと単分解画像復元データセットの両方を用いて評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:25:39 GMT)
Perceive Anything: Recognize, Explain, Caption, and Segment Anything in Images and Videos [53.7] 本稿では,画像やビデオの総合的な領域レベルの視覚的理解のためのフレームワークであるPerceive Anything Model(PAM)を提案する。
提案手法は,Large Language Models (LLMs) を統合することで,強力なセグメンテーションモデルSAM 2を拡張し,オブジェクトセグメンテーションの同時実現を可能にする。
SAM 2のリッチな視覚的特徴をマルチモーダルトークンに効率的に変換するために、Semantic Perceiverという重要なコンポーネントが導入されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:51:39 GMT)
Unleashing the Reasoning Potential of Pre-trained LLMs by Critique Fine-Tuning on One Problem [53.3] 一つの問題に対する批判的微調整(CFT)は,LLMの推論能力を効果的に解き放つことができることを示す。
わずか5回のGPUトレーニングで、Qwen-Math-7B-CFTは6つのベンチマークで平均15%改善、3つのロジック推論ベンチマークで平均16%改善した。
結果は20倍の計算量で、RLの結果に匹敵するか、さらに上回っている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:25:20 GMT)
Empowering Economic Simulation for Massively Multiplayer Online Games through Generative Agent-Based Modeling [53.3] 我々は,MMO経済シミュレーションにおいて,Large Language Models (LLMs) を用いた新しいアプローチを導入するための予備的なステップを採っている。
我々は人間のような意思決定と適応性を備えたLSM駆動型エージェントを設計する。
これらのエージェントはロールプレイング、知覚、記憶、推論の能力を備え、上記の課題を効果的に解決する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:21:13 GMT)
A MISMATCHED Benchmark for Scientific Natural Language Inference [53.2] 我々はMISMATCHEDと呼ばれる科学NLIの新たな評価ベンチマークを導入する。
新しいベンチマークでは、PSYCHOLOGY、ENGINEERING、PUBLIC HEALTHの3つの非CSドメインをカバーする。
MISMATCHEDベンチマークを導入することに加え、モデルトレーニングにおいてそれらの間の暗黙的な科学的NLI関係を持つ文対を組み込むことで、科学的NLIの性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:40:57 GMT)
SIV-Bench: A Video Benchmark for Social Interaction Understanding and Reasoning [53.2] SIV-Benchは、SSU(Social Scene Understanding)、SSR(Social State Reasoning)、SDP(Social Dynamics Prediction)におけるMLLM(Multimodal Large Language Models)の機能を評価するための新しいビデオベンチマークである。
SIV-Benchは、2,792本のビデオクリップと8,792本の人間とLLMのコラボレーティブパイプラインから得られた精巧に生成された質問応答ペアを備えている。
また、異なるテキストキュー固有のオンスクリーンテキスト、追加の対話、あるいはノーテキストの影響を分析するための専用の設定も含まれている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:51:35 GMT)
EOC-Bench: Can MLLMs Identify, Recall, and Forecast Objects in an Egocentric World? [53.0] マルチモーダル・大規模言語モデル(MLLM)は、自我中心の視覚応用において画期的な進歩を遂げた。
EOC-Benchは、動的自我中心のシナリオにおいて、オブジェクト中心の具体的認識を体系的に評価するために設計された革新的なベンチマークである。
EOC-Benchに基づく各種プロプライエタリ,オープンソース,オブジェクトレベルのMLLMの総合評価を行う。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:44:12 GMT)
Information Locality as an Inductive Bias for Neural Language Models [52.9] 本稿では,Transformer と LSTM LM の言語学習において,$m$local entropy は困難であることを示す。
これらの結果は、ニューラルネットワークが言語の統計構造に非常に敏感であることを示唆している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:21:05 GMT)
VideoMathQA: Benchmarking Mathematical Reasoning via Multimodal Understanding in Videos [52.9] VideoMathQAは、ビデオ上で時間的に拡張されたクロスモーダル推論を実行できるかどうかを評価するために設計されたベンチマークである。
ベンチマークは10種類の数学的領域にまたがっており、ビデオは10秒から1時間以上に及ぶ。
構造化された視覚的コンテンツを解釈し、指導的物語を理解し、視覚的、音声的、テキスト的モダリティにまたがる共同概念を理解するためのモデルが必要である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:58 GMT)
HoliSafe: Holistic Safety Benchmarking and Modeling with Safety Meta Token for Vision-Language Model [52.7] 既存の安全チューニングデータセットとベンチマークは、画像とテキストの相互作用が有害なコンテンツを生み出す方法を部分的に考慮しているだけである。
私たちは、安全で安全でない5つの画像とテキストの組み合わせにまたがる、全体安全データセットとベンチマークであるHoliSafeを紹介します。
我々は,学習可能な安全メタトークンと専用の安全ヘッドを備えた新しいVLMであるSafeLLaVAを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:26:34 GMT)
Controlled Data Rebalancing in Multi-Task Learning for Real-World Image Super-Resolution [51.8] 実世界の画像超解像(Real-SR)は、低解像度画像の複雑な劣化パターンのために難しい問題である。
本稿では,データヘテロジニアスなマルチタスク学習問題としてReal-SRの枠組みを改良したパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:40:21 GMT)
Zeroth-Order Optimization Finds Flat Minima [51.4] 標準二点推定器によるゼロ階最適化は、ヘッセンの小さなトレースを持つ解を好むことを示す。
さらに、凸関数と十分に滑らかな関数に対する近似平坦なミニマに対して、ゼロ階最適化の収束率を提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:09 GMT)
Offline Multi-agent Reinforcement Learning via Score Decomposition [51.2] オフライン協調型マルチエージェント強化学習(MARL)は、分散シフトによる固有の課題に直面している。
この作業は、オフラインとオンラインのMARL間の分散ギャップを明示的に解決する最初の作業である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:41:09 GMT)
Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning [50.5] Follow-Your-Motionは、複雑な動きを合成するために強力なビデオ拡散トランスフォーマーを微調整する、効率的な2段階ビデオモーション転送フレームワークである。
我々は,Follow-Your-Motionの優位性を検証するため,MotionBenchについて広範囲に評価を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:18:32 GMT)
Autoformulation of Mathematical Optimization Models Using LLMs [50.0] 本稿では,自然言語問題記述から解法対応最適化モデルを自動生成する,$textitautoformulation$の問題にアプローチする。
オートフォーミュレーションの3つの主要な課題を識別する: $textit(1)$ 巨大で問題に依存した仮説空間、および$textit(2)$ 不確実性の下でこの空間を効率的かつ多様に探索する。
我々は,$textitLarge Language Models$と$textitMonte-Carlo Tree Search$を併用した新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:26:44 GMT)
AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning [50.0] 大規模強化学習は, 強大・中小モデルの推論能力を大幅に向上させることができることを示す。
まずは算数のみのプロンプト、次にコードのみのプロンプトのトレーニングを行う。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:12 GMT)
RaySt3R: Predicting Novel Depth Maps for Zero-Shot Object Completion [49.9] RaySt3Rは、新しいビュー合成問題として、3D形状の完成をリキャストする。
フィードフォワード変換器をトレーニングし、深度マップ、オブジェクトマスク、およびクエリ線に対する画素ごとの信頼スコアを予測する。
RaySt3Rは、これらの予測を複数のクエリビューに融合して、完全な3D形状を再構築する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:43:23 GMT)
UnHiPPO: Uncertainty-aware Initialization for State Space Models [49.8] 状態空間モデルは、シーケンス問題の支配的なモデルクラスとして出現している。
HiPPOはデータがノイズフリーであると仮定する。
我々は、測定ノイズを伴ってHiPPO理論を拡張し、状態空間モデル力学のための不確実性を考慮した枠組みを導出する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:11:36 GMT)
Counterfactual reasoning: an analysis of in-context emergence [49.6] 大規模ニューラルネットワークモデル(LM)は、文脈内学習において顕著な性能を示す。
この研究は、言語モデルにおける文脈内対実的推論、すなわち仮説的シナリオの下での変化の結果を予測することを研究する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:02:07 GMT)
Learning Joint Interventional Effects from Single-Variable Interventions in Additive Models [49.6] 観察データと単変量介入のみを用いて共同介入効果の学習方法を示す。
本稿では,それぞれの介入変数に対する因果効果を,包括的かつ未確立な貢献に分解する実用的推定器を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:20:50 GMT)
Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation [49.4] 大規模言語モデル(LLM)におけるバイアスと公平性の標準ベンチマークは、プロンプトによって記述されたユーザー属性とインプットの関係を測定する。
本研究では, 子どもの就寝時間, ユーザ・ペルソナ, 英語学習演習の3つの文脈から, RUTEdの類似性を評価する。
標準偏差指標は、より現実的な偏差指標と有意な相関関係がないことがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:35:00 GMT)
AI-powered Contextual 3D Environment Generation: A Systematic Review [49.2] 本研究では,既存の3次元シーン生成のための生成AI技術について,体系的なレビューを行う。
最先端のアプローチを検討することで、シーンの真正性やテキスト入力の影響など、重要な課題が提示される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:56:28 GMT)
PixCell: A generative foundation model for digital histopathology images [49.0] PixCellは,病理組織学における最初の拡散ベース生成基盤モデルである。
われわれはPanCan-30MでPixCellをトレーニングした。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:14:32 GMT)
On-the-fly Reconstruction for Large-Scale Novel View Synthesis from Unposed Images [48.9] 撮影直後にカメラのポーズと3DGSの訓練を行うためのオンザフライ方式を提案する。
本手法は,順序付き写真シーケンスと大規模シーンの高密度かつ広帯域なキャプチャを処理できる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:10:18 GMT)
Stochastic Poisson Surface Reconstruction with One Solve using Geometric Gaussian Processes [48.7] 幾何学的ガウス過程を応用して、技法と表面再構成を1つのステージに組み合わせる。
得られた再構成された表面サンプルは、問題依存のボリュームメッシュやグリッドを使わずに、局所的に宇宙でクエリすることができる。
その結果、我々のアプローチはよりクリーンで、より原理的で、より柔軟な表面再構築パイプラインを提供することを示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:54:25 GMT)
From Play to Replay: Composed Video Retrieval for Temporally Fine-Grained Videos [48.7] Composed Video Retrieval(CoVR)は、クエリビデオと、意図した変更を記述した修正テキストが与えられたターゲットビデオを取得する。
TF-CoVRは、時間的にきめ細かなCoVRに特化した最初の大規模ベンチマークである。
TF-CoVRは体操とダイビングに重点を置いており、FinGymとFineDivingから180Kのトリプルを提供している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:31:17 GMT)
Focus On This, Not That! Steering LLMs with Adaptive Feature Specification [48.3] Focus Instruction Tuning (FIT)は、大きな言語モデルをトレーニングして、特定の機能に注目しながら、他の機能を無視して応答を条件付けする。
我々は,FITが推論時に行動のステアリングに成功したこと,(ii)コアタスク信号の増幅による堅牢性の向上,(iii)人口統計特性の抑制による社会的偏見の軽減,(iv)分布シフト下での一般化,および以前には見つからなかった焦点特徴の緩和を実証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:25:12 GMT)
SViMo: Synchronized Diffusion for Video and Motion Generation in Hand-object Interaction Scenarios [48.1] ハンドオブジェクトインタラクション(HOI)生成には、大きな応用可能性がある。
現在の3D HOIモーション生成アプローチは、事前に定義された3Dオブジェクトモデルとラボでキャプチャされたモーションデータに大きく依存している。
本稿では,同期拡散プロセス内での視覚的事前制約と動的制約を組み合わせることで,HOIビデオと動きを同時に生成するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:21:54 GMT)
Avoiding Death through Fear Intrinsic Conditioning [48.1] 我々は、初期の扁桃体発達にインスパイアされた本質的な報酬関数を導入し、この本質的な報酬関数を、新しいメモリ拡張ニューラルネットワークアーキテクチャにより生成する。
この本質的なモチベーションが終末状態の探索を阻害し,動物に観察される恐怖条件と同様の回避行動をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:24:51 GMT)
Generalization Bounds via Meta-Learned Model Representations: PAC-Bayes and Sample Compression Hypernetworks [47.8] 本稿では,ニューラルネットワークに対する厳密な(空でない)一般化境界を導出するためのメタラーニング手法を提案する。
このアプローチの独創性は、パラメータを復号する前にデータセットをエンコードする調査されたハイパーネットワークアーキテクチャにあります。
後者の定理は、エンコーダ・デコーダ・ジャンクションで通過する重要な情報を利用して、我々のスキームによって得られた下流予測器毎の一般化保証を計算する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:32:11 GMT)
Is It JUST Semantics? A Case Study of Discourse Particle Understanding in LLMs [47.5] 本研究は、英語の「ジャスト」のきめ細かい感覚を識別するLLMの能力について考察する。
LLMはより広いカテゴリを区別する能力を持っているが、より微妙なニュアンスを完全に捉えるのに苦労している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:59:05 GMT)
Pre-training Everywhere: Parameter-Efficient Fine-Tuning for Medical Image Analysis via Target Parameter Pre-training [47.2] 簡易かつ効果的な微調整フレームワークTarget Pre-Training(TPP)を提案する。
TPP はターゲットパラメータ、すなわち微調整中に導入された新しいパラメータをPEFT 以前の追加の段階でトレーニングする。
TPPは既存のPEFT手法に容易に統合でき、性能が大幅に向上する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:19:43 GMT)
Follow-Your-Creation: Empowering 4D Creation through Video Inpainting [47.1] Follow-Your-Creationは、単一のモノクロビデオ入力から4Dコンテンツを生成および編集できるフレームワークである。
映像インパインティング基礎モデルを生成先行として活用することにより、4次元映像作成を映像インパインティングタスクとして再構成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:11:48 GMT)
Toward Greater Autonomy in Materials Discovery Agents: Unifying Planning, Physics, and Scientists [46.9] MAPPSはPlanner、ツールコードジェネレータ、Scientific Mediatorで構成されている。
計画、物理学、科学者を統一することで、MAPPSはより柔軟で信頼性の高い物質発見を可能にする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:07:06 GMT)
DualSpec: Text-to-spatial-audio Generation via Dual-Spectrogram Guided Diffusion Model [46.6] 本稿では,DualSpec というテキスト・音声生成フレームワークを提案する。
まず、音響イベントオーディオから潜時音響表現を抽出するための変分オートエンコーダ(VAE)を訓練する。
最後に、空間音響生成のための潜在音響表現とテキスト特徴から拡散モデルを訓練する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:44:26 GMT)
Cautious Optimism: A Meta-Algorithm for Near-Constant Regret in General Games [46.5] 本研究では,学習者の適応的ペアリングによる学習促進は孤立的な現象ではないことを示す。
汎用ゲームにおいて,より高速な正規化学習を実現するフレームワークであるemphCautious Optimismを導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:13:48 GMT)
EnIGMA: Interactive Tools Substantially Assist LM Agents in Finding Security Vulnerabilities [46.3] 本稿では,CTF(Capture The Flag)課題を自律的に解決するLMエージェントであるEnIGMAを紹介する。
セキュリティ脆弱性を発見して悪用するエージェントの能力を改善するために、新しいツールとインターフェースを導入します。
390 CTF課題に関する実証分析により,これらの新しいツールとインターフェースがエージェントの性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:58:02 GMT)
VoxelSplat: Dynamic Gaussian Splatting as an Effective Loss for Occupancy and Flow Prediction [46.3] カメラによる占領予測の最近の進歩は、3Dセマンティクスとシーンフローの同時予測に焦点を当てている。
本稿では,これらの課題とその根本原因を解決するために,VoxelSplatという新たな正規化フレームワークを提案する。
本フレームワークは,ガウス運動をモデル化するために,予測されたシーンフローを用いて,移動物体のシーンフローを自己監督的に学習することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:19:35 GMT)
DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion [45.8] Ont組み込みはクラス、リレーション、個人を$mathcalEL++$にマップする。
本手法は,知識ベース完了作業におけるベースライン埋め込みよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:51:13 GMT)
ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development [45.8] ComfyUI-CopilotはComfyUI用の大規模な言語モデル駆動プラグインである。
インテリジェントなノードとモデルレコメンデーションとワンクリックワークフローの自動構築を提供する。
オフラインの定量的評価とオンラインユーザフィードバックによるComfyUI-Copilotの有効性を検証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:20:50 GMT)
Survey on the Evaluation of Generative Models in Music [45.7] 本稿では,音楽における生成システム評価のための共通評価対象,方法論,メトリクスの学際的検討を行う。
本稿では,音楽学,工学,HCIの観点から,このようなアプローチの利点と課題について論じる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:46:04 GMT)
Viewport Prediction for Volumetric Video Streaming by Exploring Video Saliency and Trajectory Information [45.3] 本稿では,Saliency and Trajectory Viewport Prediction (STVP) という新しいアプローチを提案し,提案する。
ボリュームビデオストリーミングにおけるビューポート予測の精度の向上を目的としている。
特に,計算複雑性を低減するために,新しいサンプリング手法であるUniform Random Smpling (URS)を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:08:18 GMT)
Deriving Strategic Market Insights with Large Language Models: A Benchmark for Forward Counterfactual Generation [45.3] 大きな言語モデル(LLM)は、約束を提供するが、このアプリケーションには未検討のままである。
我々はFin-Force-FINancial Forward Counterfactual Evaluationという新しいベンチマークを導入する。
これにより、将来の市場展開を探索し、予測するためのスケーラブルで自動化されたソリューションの道を開くことができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:59:20 GMT)
Safe Planning and Policy Optimization via World Model Learning [45.0] 実世界のシナリオにおける強化学習アプリケーションは、安全性と信頼性を優先しなければならない。
固有のモデル不正確さは、安全クリティカルな環境で破滅的な失敗を引き起こす可能性がある。
本稿では,タスク性能と安全性を協調的に最適化する新しいモデルベースRLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:50:02 GMT)
Can Transformers Do Enumerative Geometry? [45.0] 計算列挙幾何に対する Transformer ベースのアプローチを提案する。
私たちは、10-45$から1045$までの値の交叉数を計算します。
ネットワークは、純粋にデータ駆動方式で、ヴィラソロ制約を暗黙的にモデル化していることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:08:50 GMT)
AudioLens: A Closer Look at Auditory Attribute Perception of Large Audio-Language Models [45.0] 本研究は、LALMが聴覚特性を内在的に知覚し、認識する方法について、初めて詳細な分析を行ったものである。
3つの最先端のLALMに語彙予測を適用することで、属性情報が層やトークンの位置間でどのように進化していくかを追跡する。
この結果から聴覚属性処理の知見が得られ,今後の改善への道が開けた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:22:47 GMT)
MVP-Shapley: Feature-based Modeling for Evaluating the Most Valuable Player in Basketball [45.0] 本研究では,アシストやポイントなど,ゲーム中の関連イベントを記録するプレイバイプレイデータに焦点を当てた。
我々は,新たなMVP評価フレームワークをussysとして導入することで,課題に対処することを目指している。
このアプローチには、機能処理、ウィンロスモデルトレーニング、Shapley値アロケーション、プレイヤーのコントリビューションに基づいたMVPランキング決定が含まれる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:40:22 GMT)
PCDVQ: Enhancing Vector Quantization for Large Language Models via Polar Coordinate Decoupling [44.9] ベクトル量子化(VQ)は、非常に低ビット(2ビットでも)で精度の高いこの問題に対する一般的な解決策である。
本稿では,効率的なVQフレームワークであるPola Coordinate Decoupled Vector Quantization (PCDVQ)を提案する。
実験の結果、PCDVQは2ビットレベルのベースライン法を少なくとも1.5%ゼロショット精度で上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:58:58 GMT)
Line of Sight: On Linear Representations in VLLMs [44.8] 残ストリームで線形デオード可能な機能によって表現される、多様なImageNetクラスが見つかる。
線形特徴量の多様性を高めるために,マルチモーダルスパースオートエンコーダ(SAE)を訓練する。
モダリティ間のモデル表現は極めて不整合であるが、より深い層で共有されることが分かる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:30:58 GMT)
Lifelong Evolution: Collaborative Learning between Large and Small Language Models for Continuous Emergent Fake News Detection [44.6] 大規模言語モデル(LLM)は、時代遅れの知識と適切な実演がないため、偽ニュースを正確に検出できない。
本稿では,これらの課題に対処するために,新たな協調的創発的フェイクニュース検出(C$2$EFND)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:17:55 GMT)
Efficient Time Series Processing for Transformers and State-Space Models through Token Merging [44.3] コンピュータビジョンアーキテクチャにおける計算効率を向上させるソリューションとして、トークンマージが登場している。
局所的マージとは、局所的な領域内でトークンを選択的に結合する、ドメイン固有のトークンマージアルゴリズムである。
総合的な実証実験により,局所的なマージは精度に最小限の影響を伴って,実質的な効率向上をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:34:18 GMT)
FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion [44.2] FPSAttentionは、ビデオ生成のためのFP8量子化とスパーシリティの新たなコデザインである。
1)量子化とスパーシリティの両方を同時にサポートする統一された3次元タイルの粒度,2)ノイズスケジュールに適応し,量子化/スパーシティエラーとデノナイズステップの強い相関に対処するデノナイズされたステップアウェア戦略,である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:30:30 GMT)
Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models [44.0] 大規模言語モデル(LLM)のための自己信頼による強化学習(RLSC)を提案する。
RLSCはモデル自身の自信を報奨信号として使用し、ラベル、選好モデル、報酬工学の必要性を排除している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:55:15 GMT)
Self-Correction is More than Refinement: A Learning Framework for Visual and Language Reasoning Tasks [44.0] モデルにアウトプットを洗練させる自己補正は、この問題に対する有望な解決策である。
本研究では,視覚言語モデルの推論および微調整段階における自己補正能力について検討した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:25:43 GMT)
Progressive Tempering Sampler with Diffusion [43.9] 本研究では, 拡散モデルを温度にわたって逐次訓練するニューラルサンプリング器を提案する。
また, 高温拡散モデルを組み合わせて低温試料を近似的に生成する手法を提案する。
本手法は,拡散型ニューラルサンプリングよりも高い精度で目標評価効率を向上する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:46:04 GMT)
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation [43.6] 発話顔生成の研究は、主に、顔の動きを同期させ、視覚的に魅力的で時間的に整合したアニメーションを作るという複雑さを探求する。
我々は,グローバルな音声知識を活用し,全体的な知覚を高めるために,Sonicと呼ばれる新しいパラダイムを提案する。
映像品質、時間的整合性、唇の同期精度、動きの多様性の点で、新しいオーディオ駆動のパラダイムが既存のSOTA手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:49:59 GMT)
MINT-CoT: Enabling Interleaved Visual Tokens in Mathematical Chain-of-Thought Reasoning [43.5] CoT(Chain-of-Thought)は、Large Language Models(LLMs)において拡張された数学的推論を持つ
階層型視覚推論のための数学的インターリーブトケンスを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:02 GMT)
Refer to Anything with Vision-Language Prompts [43.0] RAS(Refer to Any Mask Group)は、複雑なマルチモーダル相互作用と理解を伴うセグメンテーションモデルを強化する。
我々は,従来の参照表現セグメンテーション(RES)および一般化参照表現セグメンテーション(GRES)タスクと同様に,新しいORESタスクにおけるRASの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:51 GMT)
Just Enough Thinking: Efficient Reasoning with Adaptive Length Penalties Reinforcement Learning [42.8] ALPによるDeepScaleR-1.5Bのトレーニングは、パフォーマンスを著しく低下させることなく、平均トークン使用量を50%削減する。
固定予算と均一なペナルティ基準に対して、ALPは、簡単なプロンプトで計算をカットし、保存されたトークンを難しいものに再配置することで、予算の削減をよりインテリジェントに再分配する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:17:05 GMT)
MMSU: A Massive Multi-task Spoken Language Understanding and Reasoning Benchmark [42.6] MMSUは、47の異なるタスクにまたがって、5000の厳密にキュレートされたオーディオクエスト・アンサートレットで構成されている。
我々は、音声学、韻律、修辞学、構文学、意味論、パラ言語学を含む言語理論のベンチマークを定めている。
MMSUは、音声言語理解の包括的評価のための新しい標準を確立する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:09:36 GMT)
Modern approaches to building effective interpretable models of the property market using machine learning [41.9] 本稿では,初期データの収集,外れ値の同定,データ中のパターンの探索と解析,モデルの構築,効率評価など,モデリングのすべての段階について述べる。
解釈可能性の要件として強い制約があるにもかかわらず、不動産市場の効果的なモデルを構築することは依然として可能であることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:17:18 GMT)
Seed-Coder: Let the Code Model Curate Data for Itself [41.7] 8Bサイズの一連のオープンソースモデルであるSeed-Coderを紹介します。
我々のコードはモデル中心のデータパイプラインによって生成される。
Seed-Coderは、同じサイズのオープンソースモデルの中で最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:26:05 GMT)
HALoS: Hierarchical Asynchronous Local SGD over Slow Networks for Geo-Distributed Large Language Model Training [41.6] 大規模言語モデル(LLM)の訓練は、地理的に分散したアクセラレータにますます依存し、地域間での通信の禁止と不均一なハードウェアの利用を引き起こす。
HALoSは,各リージョンにローカルサーバ(LPS)を導入し,地域内リンク間の階層的トラグラーをマージするグローバル非同期最適化フレームワークである。
実験的に、HALoSはジオ分散トレーニングのベースラインよりも7.5倍早く収束し、既存の非同期メソッドを最大2.1倍改善する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:48:55 GMT)
Video Summarization with Large Language Models [41.5] 本稿では,近年のLarge Language Models (LLM) の機能を活用したビデオ要約フレームワークを提案する。
LLM-based Video Summarization (LLMVS) と呼ばれる我々の手法は、ビデオフレームをMulti-Modal Large Language Model (MLLM) を用いて一連のキャプションに変換する。
実験の結果,提案手法は標準ベンチマークにおける既存手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:18:38 GMT)
GenLit: Reformulating Single-Image Relighting as Video Generation [41.4] 我々は、映像生成モデルに光操作を行うためのグラフィックスエンジンの能力を蒸留するフレームワークであるGenLitを紹介する。
小さな合成データセットのみに微調整されたモデルが現実世界のシーンに一般化されることが分かりました。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:36:04 GMT)
APVR: Hour-Level Long Video Understanding with Adaptive Pivot Visual Information Retrieval [41.1] APVRは、階層的な視覚情報検索を通じてメモリウォール制限に対処する、トレーニング不要のフレームワークである。
Pivot Frame Retrievalはセマンティック拡張とマルチモーダル信頼スコアを採用し、セマンティックなビデオフレームを識別する。
Pivot Token Retrievalは、ピボットフレーム内でクエリ対応のアテンション駆動トークン選択を実行する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:27:10 GMT)
Differentiable Logic Cellular Automata: From Game of Life to Pattern Generation [41.1] 本稿では,微分論理セルオートマタ(DiffLogic CA)を紹介する。
ニューラルセルラーオートマタ(NCA)と微分論理ゲートネットワーク(DLGN)の新たな組み合わせである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:45:43 GMT)
Identifying and Understanding Cross-Class Features in Adversarial Training [40.9] 逆行訓練(AT)は、ディープニューラルネットワークを敵の攻撃に対して堅牢にするための最も効果的な方法の1つと考えられている。
我々は、クラスワイド特徴属性のレンズによるATの研究について、新しい視点を提示する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:40:11 GMT)
On the Comprehensibility of Multi-structured Financial Documents using LLMs and Pre-processing Tools [40.9] 本稿では,大規模言語モデル (LLMs) とマルチモーダル大規模言語モデル (MLLMs) の機能について考察する。
MLLM である GPT-4o は, 直接文書を送受信した場合, 複数構造化文書に対して 56% の精度が得られた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:52:44 GMT)
Multi-scale Image Super Resolution with a Single Auto-Regressive Model [40.8] 視覚的自己回帰(VAR)モデリングの最近の進歩を利用して、画像超解像(ISR)に取り組む。
我々の知る限りでは、量子化器が様々なスケールで意味的に一貫した残留を強制するために訓練されたのはこれが初めてである。
本モデルでは, LR画像と超解像を, 1回の前方通過で, 目標値の半値と全値でデノマイズすることができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:02:23 GMT)
Fast-DataShapley: Neural Modeling for Training Data Valuation [40.6] 実時間推論速度で再利用可能な説明器モデルをトレーニングするためのワンパス学習手法であるFast-DataShapleyを提案する。
新しいテストサンプルが与えられた場合、トレーニングデータのShapley値を計算するために再トレーニングは必要ない。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:35:46 GMT)
SupeRANSAC: One RANSAC to Rule Them All [40.6] SupeRANSACは、新しい統一RANSACパイプラインである。
本稿では、RANSACを特定の視覚タスクに有効にするための技術について詳細に分析する。
複数の問題やデータセットに対する最先端技術よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:30:27 GMT)
MuLan: Adapting Multilingual Diffusion Models for Hundreds of Languages with Negligible Cost [39.4] 多言語アノテーションによる高品質な画像に調整されたモデルとは異なり、広く利用可能なテキストエンコーダを活用することで、ノイズの多いインターネット画像とテキストのペアは、データの効率を大幅に向上させる。
我々は,20M未満のパラメータを持つ軽量言語アダプタであるMulan(Multi-Language Adapter)を導入し,凍結テキストエンコーダと画像拡散モデルを用いて訓練を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:34:56 GMT)
ATLaS: Agent Tuning via Learning Critical Steps [39.3] 大規模言語モデル(LLM)エージェントは、マルチドメインタスクにまたがる顕著な一般化機能を示す。
既存のエージェントチューニングアプローチでは、典型的には専門家の軌跡全体について教師付き微調整を用いる。
我々は,これらのステップのみにおいて,専門家の軌跡や微粒化における重要なステップを低コストで識別するATLaSを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:42:08 GMT)
Optimizing Anytime Reasoning via Budget Relative Policy Optimization [38.6] 我々は,任意の推論性能を最適化する新しいフレームワークであるAnytimeReasonerを提案する。
従来の分布からサンプルトークンの予算に適合するように、完全な思考プロセスを切り離します。
次に、累積報酬を最大化するために、分割された方法で思考と要約ポリシーを最適化する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:55:06 GMT)
Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards [38.5] 従来の作業に比べて,ミニマックスの後悔点の上下境界が改善した。
実験設計により導かれる新しい除去アルゴリズムを提案する。
例えば$l_p$-norm balls for $p le 1 + epsilon$の場合、$d$への依存をさらに減らすことができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:07:26 GMT)
From EHRs to Patient Pathways: Scalable Modeling of Longitudinal Health Trajectories with LLMs [38.5] 本稿では,多様な電子健康記録(EHR)データを構造化表現に変換することで,患者経路モデリングの新しい手法を提案する。
本稿では,長期的文脈をトピック固有の要約トークンに組み込む新しい要約機構を導入し,テキストのみの性能を向上させる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:54:01 GMT)
Can Graph Descriptive Order Affect Solving Graph Problems with LLMs? [38.2] 大規模言語モデル(LLM)は、数学的推論や論理的推論を含む推論タスクにおいて大きな成功を収めた。
従来の研究は様々な手法を用いてLSMのグラフ推論能力について研究してきた。
重要な要素は、主に見過ごされ、グラフ記述がモデルに提示される即時順序である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:02:16 GMT)
Deep Learning Reforms Image Matching: A Survey and Outlook [38.1] 画像マッチングはコンピュータビジョンの基盤として機能し、幅広いアプリケーションを支える。
最近のディープラーニングの進歩は、堅牢性と正確性の両方を大きく向上させた。
この調査では、ディープラーニングが古典的な画像マッチングパイプラインを漸進的に変革した方法について、包括的にレビューすることで、ユニークな視点を採用している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:25:22 GMT)
ChatWise: A Strategy-Guided Chatbot for Enhancing Cognitive Support in Older Adults [38.1] 戦略誘導型AIチャットボットChatWiseを提案する。
マクロレベルの戦略計画とマイクロレベルの発話生成を統合し、高齢者向けに調整された多ターン対話を可能にする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:16:33 GMT)
MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning [37.7] RLVR(Reinforcement Learning with Verifiable Rewards)は、最近、大規模言語モデル(LLM)のポストトレーニングのための強力なパラダイムとして登場した。
RLVRをMultimodal LLM(MLLMs)に適用することは大きなチャンスであるが、視覚言語タスクの広範で異質な性質により複雑である。
本稿では、厳密なデータ混合問題定式化とベンチマーク実装を備えたマルチモーダルLLM RLVRのための体系的な後学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:13:46 GMT)
RELIC: Evaluating Compositional Instruction Following via Language Recognition [37.5] 大規模言語モデル(LLM)は、コンテキストで提供されるタスクの仕様に基づいてのみタスクを実行することがますます期待されている。
本稿では,言語認識を用いたインコンテキスト認識(RELIC)フレームワークについて紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:17:24 GMT)
WebTrust: An AI-Driven Data Scoring System for Reliable Information Retrieval [37.4] 本稿では,WebTrustについて紹介する。WebTrustは,信頼性のある情報をオンラインで検索し,判断するプロセスを簡単にするシステムである。
WebTrustは信頼性スコア(0.1から1)を処理対象の各ステートメントに割り当てる。
これは、なぜそのスコアを受け取ったのかを明確に正当化するものだ。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:48:09 GMT)
Scalable Multi-Agent Offline Reinforcement Learning and the Role of Information [37.2] データセット収集とオフライン学習の両方にスケーラブルな新しいルーチンを提案する。
エージェントはまず、事前に特定された情報共有ネットワークと一貫性のある多様なデータセットを収集する。
提案手法は,FQIの教師あり学習段階における固有誤差を,共有情報と非共有情報との相互情報に限定することを可能にしている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:43:08 GMT)
DREAM: Disentangling Risks to Enhance Safety Alignment in Multimodal Large Language Models [37.1] MLLM(Multimodal Large Language Models)は、視覚データとテキストデータの統合により、ユニークな安全性上の課題を提起する。
textbfDREAM(textittextbfDisentangling textbfRisks to textbfEnhance Safety textbfAlignment in textbfMLLMs)を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:13:05 GMT)
SSA-COMET: Do LLMs Outperform Learned Metrics in Evaluating MT for Under-Resourced African Languages? [37.0] SSA-COMETとSSA-COMET-QEを開発した。
実験の結果,SSA-COMETモデルの方がAfriCOMETより有意に優れていた。
すべてのリソースは、将来の研究をサポートするために、オープンライセンスでリリースされる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:16:56 GMT)
Text-to-Decision Agent: Offline Meta-Reinforcement Learning from Natural Language Supervision [36.6] オフラインメタRLは通常、高品質なサンプルやウォームアップ探索からタスク信念を推測することで一般化に取り組む。
textbfText-to-textbfDecision textbfAgent (textbfT2DA)を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:40:34 GMT)
DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts [36.0] Dynamic Evidence-based FAct-checking with Multimodal Experts (DEFAME)は、オープンドメイン、テキストイメージクレーム検証のためのゼロショットMLLMパイプラインである。
DEFAMEは6段階のプロセスで動作し、ツールと検索深度を動的に選択し、テキストおよび視覚的証拠を抽出し、評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:10:20 GMT)
TSFM-Bench: A Comprehensive and Unified Benchmarking of Foundation Models for Time Series Forecasting [35.5] 時系列予測(TSF)は、金融投資、気象サービス、エネルギー管理など、多くの分野で重要な機能である。
多くのTSFメソッドはドメイン固有のデータ収集とモデルトレーニングを必要とし、他のドメインに適用してもうまく一般化しない。
大規模な異種時系列データに基づいて事前訓練された時系列基礎モデル(TSFM)は、これらの制限を克服することを目的としている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:28:35 GMT)
Implicit Cross-Lingual Rewarding for Efficient Multilingual Preference Alignment [35.2] 提案手法は,暗黙の報奨によって適切に整合した英語モデルからの好みを捉え,反復学習を通じて他言語に伝達する手法である。
2回に分けて微調整したLlama3はウィンレートを平均12.72%改善し、X-AlpacaEvalのリーダーボード上でのトレーニング言語全体の長さ制御ウィンレートを5.97%向上させた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:40:44 GMT)
GRU: Mitigating the Trade-off between Unlearning and Retention for LLMs [34.9] 非学習過程における更新の方向を規定する改良されたフレームワークであるグラデーション・リクティファイド・アンラーニング(GRU)を提案する。
GRUは簡単に実装でき、様々な確立された未学習ベンチマークで実践的な効果を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:34:42 GMT)
EMBER2024 -- A Benchmark Dataset for Holistic Evaluation of Malware Classifiers [34.8] 本稿では,マルウェア分類器の全体的評価を可能にする新しいデータセットEMBER2024を提案する。
本データセットは,7つのマルウェア分類タスクにおける機械学習モデルのトレーニングと評価を支援する。
EMBER2024は、最初はアンチウイルス製品によって検出されなかった悪意のあるファイルのコレクションを含む最初のものである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:20:36 GMT)
QiMeng: Fully Automated Hardware and Software Design for Processor Chip [34.8] プロセッサチップの完全自動ハードウェアおよびソフトウェア設計のための新しいシステムであるQiMengを提案する。
下位層では,アーキテクチャ,トレーニング,推論において新しい設計を取り入れた,ドメイン固有の大規模プロセッサチップモデル(LPCM)を構築している。
中間層では,LPCMの知識表現と推論機能を活用し,ハードウェア設計エージェントとソフトウェア設計エージェントを開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:17:50 GMT)
Dissecting Logical Reasoning in LLMs: A Fine-Grained Evaluation and Supervision Study [34.3] 本研究では,3次元にわたる論理的推論を評価するためのきめ細かい評価フレームワークであるFinalLogicを提案する。
微調整時の監督形式の効果について検討する。
この結果から, 自然言語指導は, アウト・オブ・ディストリビューションや長文タスクにも強い一般化をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:34:12 GMT)
MARBLE: Material Recomposition and Blending in CLIP-Space [34.2] 材料をCLIP空間に埋没させることにより, 微細な材料特性をブレンディングし, 再合成する手法を提案する。
資料帰属に責任を負うUNetのブロックを見つけることにより,既存の素材編集を改善する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:55:16 GMT)
LLMs Can Compensate for Deficiencies in Visual Representations [34.0] 私たちはCLIPベースの視覚エンコーダを構築しており、様々な制限があることが知られている。
我々は、慎重に設計された探索作業において、制御された自己注意の保証を行う。
既知の制限にもかかわらず、CLIP視覚表現は言語デコーダに読みやすいセマンティック情報を提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:04:59 GMT)
RIVAL: Reinforcement Learning with Iterative and Adversarial Optimization for Machine Translation [33.8] 大規模言語モデル(LLM)は、強い多言語機能を有し、ヒューマンフィードバックからの強化学習と翻訳タスクを組み合わせることは大きな可能性を示している。
このパラダイムは、単語の字幕翻訳タスクに適用した場合、予期せぬ性能が低下するのを観察する。
本稿では,RM と LLM の間の min-max ゲームとしてプロセスを定式化する,対角的学習フレームワーク RIVAL を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:18:21 GMT)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning [33.8] 二段階強化学習(BRL)は、生成モデルを調整するための強力なフレームワークとして登場した。
連続状態-作用複雑性において$mathcalO(epsilon)$の最初のサンプルを示す。
我々の分析は、既存の$mathcalO(epsilon)$のバウンダリで、複雑さを改善します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:48:59 GMT)
Agentomics-ML: Autonomous Machine Learning Experimentation Agent for Genomic and Transcriptomic Data [33.7] 本稿では,完全自律型エージェントベースシステムであるAgenomics-MLを紹介した。
本稿では,Agenomics-MLが既存のエージェントベースの手法よりも,一般化と成功率の両面で優れていることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:44:38 GMT)
Perfecting Depth: Uncertainty-Aware Enhancement of Metric Depth [33.6] そこで我々はPerfecting Depthと呼ばれるセンサ深度向上のための新しい2段階フレームワークを提案する。
このフレームワークは拡散モデルの性質を活用し、幾何学的手がかりを保持しながら信頼できない深さ領域を自動的に検出する。
我々のフレームワークは、センサー深度向上のための新しいベースラインを設定し、自動運転、ロボティクス、没入型技術に応用できる可能性がある。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:09:11 GMT)
CoFrNets: Interpretable Neural Architecture Inspired by Continued Fractions [33.6] 連続分数の形式に着想を得た,新しいニューラルアーキテクチャCoFrNetを提案する。
我々は、CoFrNetsを効率的に訓練し、特定の機能形式を活用することを解釈できることを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:01:06 GMT)
MIRROR: Multi-agent Intra- and Inter-Reflection for Optimized Reasoning in Tool Learning [33.0] ツール統合を含む複雑なタスクは、大規模言語モデルにとって大きな課題となる。
リフレクションはエージェントベンチマークにおける誤った軌道の修正に有効な戦略として現れている。
提案するMIRRORは,実行前に意図した動作を批判的に評価するフレームワークと,軌道のさらなる調整を行うインターリフレクションの両方からなるフレームワークである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:49:45 GMT)
Exploring bidirectional bounds for minimax-training of Energy-based models [32.5] エネルギーベースモデル(EBM)はエレガントなフレームワークで非正規化密度を推定するが、訓練は困難である。
近年の研究では、変動的下界を用いてミニマックスゲームを通じてトレーニングできることに注意して、ESMを生成的敵ネットワークに関連付けている。
そこで本稿では,ESMのトレーニングにおいて,下界を最大化し,上界を最小化するため,双方向境界で作業することを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:58:03 GMT)
EnsemW2S: Enhancing Weak-to-Strong Generalization with Large Language Model Ensembles [32.2] そこで我々は,弱い専門家を育成するための新しい手法を提案し,同じ限られた人間レベルのデータでトレーニングし,複雑な超人レベルのタスクに一般化できるようにする。
われわれのアプローチは textbfEnsemW2S と呼ばれ、トークンレベルのアンサンブル戦略を採用し、複数の弱い専門家を反復的に組み合わせている。
我々は,弱い専門家のアンサンブルと,それに続く強力な学生モデルの両方の分布内(ID)および分布外(OOD)データセットの一般化性能を広範囲に評価した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:02:02 GMT)
On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding [32.0] シーケンス・ツー・シーケンス関数の連続性のモジュラリティを定義することにより、ループ変換器の近似率を確立する。
実験によって理論結果が検証され、ループ数が増加すると性能が向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:30:23 GMT)
Rethinking Contrastive Learning in Session-based Recommendation [31.9] セッションベースのリコメンデーションは、限られた振る舞いに基づいて匿名ユーザの意図を予測することを目的としている。
セッションベースレコメンデーションのためのマルチモーダル適応型コントラスト学習フレームワークMACLを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:52:57 GMT)
OmnimatteZero: Fast Training-free Omnimatte with Pre-trained Video Diffusion Models [31.5] オムニマテゼロ(OmnimatteZero)は、オムニマテの既訓練ビデオ拡散モデルを利用したトレーニング不要の手法である。
ビデオからオブジェクトを取り除き、個々のオブジェクト層をその効果とともに抽出し、それらのオブジェクトを新しいビデオに合成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:10:09 GMT)
PoisonedParrot: Subtle Data Poisoning Attacks to Elicit Copyright-Infringing Content from Large Language Models [31.4] PoisonedParrotは、著作権のあるコンテンツを生成するためにLLMを誘導する最初のステルスデータ中毒攻撃である。
その単純さにもかかわらず、PoisonedParrotは、著作権のあるコンテンツを識別可能な副作用なしで生成するモデルを作るのに驚くほど効果的だ。
われわれは著作権侵害攻撃を防ごうとする最初の試み、ParrotTrapを擁護する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:56:24 GMT)
Curse of High Dimensionality Issue in Transformer for Long-context Modeling [31.3] 注意計算において重要でないトークンを集約することにより冗長性を低減するために,textitDynamic Group Attention (DGA)を提案する。
その結果,DGAは競争性能を維持しながら計算コストを大幅に削減できることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:31:28 GMT)
GarmageNet: A Multimodal Generative Framework for Sewing Pattern Design and Generic Garment Modeling [31.1] GarmageNetは、2Dミシンパターンの作成を自動化する生成フレームワークである。
ガーマージ(Garmage)は、各パネルを構造的幾何学的イメージとしてエンコードする、新しい衣服表現である。
GarmageSetは1万以上のプロフェッショナルデザインの衣服からなる大規模なデータセットである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:21:51 GMT)
TIMING: Temporality-Aware Integrated Gradients for Time Series Explanation [30.9] 従来の統合勾配(IG)は、予測に正と負の両方の影響のある臨界点を効果的に捉える。
これらの課題を克服するために、TIMingを導入し、その理論的特性を維持しながら時間的認識を取り入れてIGを強化する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:40:40 GMT)
SUCEA: Reasoning-Intensive Retrieval for Adversarial Fact-checking through Claim Decomposition and Editing [30.8] 敵の主張は、人間が事実確認システムに挑戦するために意図的に設計されている。
本稿では,元来の主張を言い換える訓練のない手法を提案する。
提案手法は,検索と包含ラベルの精度を大幅に向上させ,強力なクレーム分割ベースラインを4つ備えた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:58:15 GMT)
Towards Vision-Language-Garment Models For Web Knowledge Garment Understanding and Generation [30.8] テキスト記述と視覚画像から衣服を合成する視覚言語学習モデルであるVLGを紹介する。
予備的な結果は、有望な転送能力を示し、ファッションデザインのような専門分野に効果的に適応するマルチモーダル基盤モデルの可能性を強調している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:22:17 GMT)
Mosaic-IT: Cost-Free Compositional Data Synthesis for Instruction Tuning [30.8] モザイクインストラクションチューニング(Mosaic Instruction Tuning、モザイクインストラクションチューニング)は、ヒト/モデルなし合成データ合成法である。
評価の結果,モザイクITの性能と訓練効率が向上した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:47:25 GMT)
Should I Trust You? Detecting Deception in Negotiations using Counterfactual RL [30.7] 我々は、自然言語通信と戦略的推論の両方を必要とするボードゲームであるTextitDiplomacyにおいて、人間がいかに戦略的にお互いを欺くかを分析した。
提案手法は,大規模言語モデルと比較して高い精度で人間の偽造を検知する。
今後のヒューマン・アブライインタラクションツールは,不審な提案を疑う機会をユーザに与えるために,テキストフリクションをトリガーすることで,偽造検出の手法に基づいて構築することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:27:54 GMT)
GaRA-SAM: Robustifying Segment Anything Model with Gated-Rank Adaptation [30.6] GaRA-SAMは、全ての堅牢なセグメンテーションベンチマークにおいて、以前の作業よりも大幅に優れていた。
これは以前の最高のIoUスコアを21.3%上回っている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:05:13 GMT)
From Intention To Implementation: Automating Biomedical Research via LLMs [30.3] 本稿では,ドライラボ実験を含むバイオメディカル研究プロセス全体を合理化するための,初のエンドツーエンド自動システムであるBioResearcherを紹介する。
BioResearcherはモジュール型のマルチエージェントアーキテクチャを採用し、検索、文学処理、実験設計、プログラミングのための特殊エージェントを統合している。
生成されたプロトコルは、平均して5つの品質指標で典型的なエージェントシステムよりも22.0%優れています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:44:18 GMT)
There Was Never a Bottleneck in Concept Bottleneck Models [30.0] コンセプト・ボトルネック・モデル(CBM)はこの問題を緩和するための有望なアプローチとして登場した。
コンポーネントが概念を予測できるという事実は、その概念に関する情報のみをエンコードすることを保証しません。
本稿では,最小概念ボトルネックモデル(MCBM)を提案する。このモデルでは,情報ボトルネック(IB)の目的を組み込んで,各表現要素を制約し,対応する概念に関する情報のみを保持する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:50:42 GMT)
Aligning Multimodal Representations through an Information Bottleneck [30.0] コントラッシブ・ロスの使用は、整列表現空間を学ぶのに有効ではないと論じる。
最も広く使われている対照的な損失のいくつかは、両モダリティの表現間の相互情報の最大化であるが、モダリティ固有の情報を削除するように設計されていない。
本稿では,変分近似により導出される損失関数の正規化項を提案し,表現アライメントの向上を目指す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:47:14 GMT)
Mixture-of-Experts Meets In-Context Reinforcement Learning [29.9] 本稿では,テキストbfT2MIR(textbfToken- and textbfTask-wise textbfMoE for textbfIn-context textbfRL)を紹介する。
総合的な実験により、T2MIRはコンテキスト内学習能力を大幅に向上させ、様々なベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:29:14 GMT)
LLM-First Search: Self-Guided Exploration of the Solution Space [29.8] 大規模言語モデル(LLM)は、テスト時間計算の増加による推論と計画の大幅な改善を示している。
我々は,新しいTextitLLM Self-Guided Search法である textbfLLM-First Search (LFS) を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:27:49 GMT)
HUMOF: Human Motion Forecasting in Interactive Social Scenes [29.6] 複雑なシーンは、対話情報の豊富さによる人間の行動予測に重要な課題を示す。
対話型シーンにおける人間の動き予測に有効な手法を提案する。
提案手法は,4つの公開データセットにまたがる最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:26:07 GMT)
GP-MoLFormer-Sim: Test Time Molecular Optimization through Contextual Similarity Guidance [29.6] 標的分子と類似性を保ちながら分子を設計する能力は、薬物発見、化学設計、生物学における様々な応用に不可欠である。
本稿では,生成化学言語モデル(CLM)を用いた分子空間からの効率的な学習・サンプリング法を紹介する。
本手法は,CLM自体から得られた文脈表現を利用して分子類似性を推定し,CLMの自己回帰サンプリング戦略を調整する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:09:33 GMT)
PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers [29.5] 1枚のRGB画像から複数の意味論的および幾何学的に異なる3Dメッシュを共同で合成する最初の構造化3D生成モデルであるPartCrafterを紹介する。
PartCrafterは同時に複数の3Dパーツを識別し、個々のオブジェクトと複雑な複数オブジェクトのシーンの両方をエンドツーエンドで生成する。
実験によると、PartCrafterは分解可能な3Dメッシュの生成において、既存のアプローチよりも優れています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:30:28 GMT)
DART-Vetter: A Deep LeARning Tool for automatic triage of exoplanet candidates [29.3] DART-Vetterは、相対的な信号の周期に折り畳まれた光曲線のみを処理する畳み込みニューラルネットワークである。
我々は、DART-Vetterを、TESSとKeplerの光曲線で、公開され、均質にラベル付けされたいくつかのデータセットで訓練し、テストした。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:05:16 GMT)
SeedEdit 3.0: Fast and High-Quality Generative Image Editing [29.1] 私たちは、私たちのT2IモデルであるSeedream 3.0[22]とともに、SeedEdit 3.0を紹介します。
メタインフォパラダイムとメタインフォ埋め込み戦略を用いた拡張データキュレーションパイプラインを開発した。
テストベンチマークでSeedEdit 3.0を評価したところ、実際の画像編集では、複数の側面間での最良のトレードオフを実現し、56.1%という高いユーザビリティを実現しています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:30:39 GMT)
LogicPuzzleRL: Cultivating Robust Mathematical Reasoning in LLMs via Reinforcement Learning [29.0] 大規模言語モデル(LLM)は多くの教師付きタスクで優れるが、よくなじみのない設定で構造化された推論に悩まされる。
この矛盾は、標準的な微調整パイプラインが汎用的な思考戦略を育むのではなく、狭く、ドメイン固有のものを注入する可能性があることを示唆している。
本研究では,7つのカスタム論理パズルの組による強化学習を通じて,LLMを微調整する「学習のための遊び」フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:40:47 GMT)
Grounding Beyond Detection: Enhancing Contextual Understanding in Embodied 3D Grounding [29.0] Embodied 3D groundingは、エゴ中心の視点から人間の指示で記述された対象物をローカライズすることを目的としている。
本研究では,対象カテゴリによってフィルタリングされた予測ボックスを用いて,検出モデルの接地性能を評価する。
驚くべきことに、これらの検出モデルは、命令固有のトレーニングなしで、言語命令で明示的に訓練されたグラウンドモデルよりも優れている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:11:57 GMT)
Towards Reliable Identification of Diffusion-based Image Manipulations [29.0] Inpainted AReas(RADAR)のReliAble iDentificationのための新しいアプローチを提案する。
RADARは既存のファンデーションモデルに基づいて構築され、異なる画像モダリティの機能を組み合わせている。
実験の結果,RADARは画像編集の精度を向上し,画像編集の局部化に優れることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:00:01 GMT)
The Nonlinear Filter Model of Stream Cipher Redivivus [28.9] 非線形フィルタモデルは、セキュアストリーム暗号の設計において、古くよく理解されたアプローチである。
我々は、既知の攻撃に対して$kappa$-bitセキュアなストリーム暗号の具体的な提案を行った。
80$-bit、28$-bit、2656$-bitのセキュリティレベルの場合、対応するストリーム暗号の回路はそれぞれ1743.5、2771.5、5607.5 NANDゲートが必要である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:50:26 GMT)
How to Unlock Time Series Editing? Diffusion-Driven Approach with Multi-Grained Control [28.8] 時系列編集(TSE)は、時間的コヒーレンスを維持しながら正確な修正を行う。
我々は、さまざまなタイプの制約をまたいだ同時かつ柔軟な制御を可能にするために、CocktailEditフレームワークを導入しました。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:32:00 GMT)
Bandit Multiclass List Classification [28.5] 入力例を$K$のラベル集合のサブセットにマッピングする(セミバンドフィードバック)マルチクラスリスト分類の問題について検討する。
この結果は,より単純な単一ラベル設定(Erez et al. '24)における先行作業の一般化と拡張であり,より一般的には$s$スパース報酬を伴う文脈的半帯域問題に適用される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:39:15 GMT)
EnsemW2S: Can an Ensemble of LLMs be Leveraged to Obtain a Stronger LLM? [28.4] 弱強(w2s)一般化に対する革新的アプローチを提案する。
より単純なタスクで訓練された弱いモデルは、より複雑なタスクでより強力なモデルを協調的に監督することを示します。
既存のベースラインよりも最大14%向上し、バイナリ分類および生成タスクでは平均5%と4%改善した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:40:11 GMT)
KPIRoot+: An Efficient Integrated Framework for Anomaly Detection and Root Cause Analysis in Large-Scale Cloud Systems [28.4] 類似性と因果分析を組み合わせた効率的な手法を提案する。
記号集合近似をコンパクト表現に用い、解析効率を向上する。
異常検出はいくつかのパフォーマンス異常を見逃し、SAX表現は複雑な変動傾向を捉えるのに失敗する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:42:07 GMT)
SAM-aware Test-time Adaptation for Universal Medical Image Segmentation [28.0] 本研究では、SAMの一般化を保ちながら、テストタイムフレームワークによる医用画像のセグメンテーション性能を向上させるパイプラインであるSAM-Aware Test-Time Adaptation (SAM-TTA)を提案する。
本フレームワークは,(1)単一チャネルの医用画像から3チャンネルのSAM対応入力へ適応的に変換する自己適応型ベジエ曲線変換(SBCT)と,(2)SAMの内部表現を医用意味論に整合させるために整合性学習を利用するDual-scale Uncertainty-driven Mean Teacher adaptation(DUMT)からなる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:38:16 GMT)
EPSpatial: Achieving Efficient and Private Statistical Analytics of Geospatial Data [28.0] 地理空間データ統計は、地理空間内のクライアントの分布を導出する位置データの集約と分析を含む。
地理空間データ分析におけるプライバシー保護の必要性は、クライアント位置情報の不正使用や不正アクセスに関する懸念から、最重要視されている。
地理空間データの正確・効率的・プライベートな統計分析手法である$mathtEPSpatial$を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:45:07 GMT)
Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning [27.9] 3D屋内シーン合成は、AIとデジタルコンテンツ作成の具体化に不可欠である。
既存のメソッドは、オープン語彙であり、きめ細かいユーザー指示に一致したシーンを生成するのに失敗する。
テキスト記述から数値的な3Dレイアウトを直接生成するフレームワークであるDirectを導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:42 GMT)
Faster Approx. Top-K: Harnessing the Full Power of Two Stages [27.8] 我々は、配列から最大値のK$要素を特定することを目的としたTop-$K$選択問題を考える。
我々は、Cloud TPUv5e上にアルゴリズムを実装し、元のアルゴリズムよりも桁違いのスピードアップを実現した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:39:03 GMT)
MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision [27.6] 完全に自動化されたスケーラブルなフレームワーク内でトレーニングされたプロセス報酬モデルであるMM-PRMを提案する。
我々はまず,多様な数学的推論データに基づいて訓練された強力なマルチモーダルモデルMM-Policyを構築した。
人間のラベル付けなしで700万以上のステップレベルのアノテーションを生成します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:29:41 GMT)
BESA: Boosting Encoder Stealing Attack with Perturbation Recovery [27.5] 本稿では,BESA と呼ばれる摂動回復を伴う攻撃を阻止するエンコーダを提案する。
BESAのコアは摂動検出と摂動回復の2つのモジュールで構成されている。
BESAは、既存のエンコーダ盗難攻撃のサロゲートエンコーダの精度を最大24.63%向上させる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:14:30 GMT)
Towards Robust ESG Analysis Against Greenwashing Risks: Aspect-Action Analysis with Cross-Category Generalization [27.1] A3CGは、グリーン洗浄の流行の中でESG分析の堅牢性を改善するための新しいデータセットである。
A3CGは、サステナビリティの側面と関連するアクションを明示的に関連付けることにより、サステナビリティのクレームをよりきめ細かな透明な評価を促進する。
これにより、企業がレポートを変更して一定のサステナビリティ領域を選択的に好む場合であっても、アスペクトアクション分析における堅牢なモデルパフォーマンスが保証される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:05:19 GMT)
Bridging Annotation Gaps: Transferring Labels to Align Object Detection Datasets [26.6] Label-Aligned Transfer Proposal (LAT)は、さまざまなソースデータセットからのアノテーションをターゲットラベル空間に体系的にプロジェクションする。
LATは目標領域検出性能を一貫した改善し、半教師付きベースラインよりも最大4.8APのゲインを得る。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:16:15 GMT)
Handle-based Mesh Deformation Guided By Vision Language Model [26.6] トレーニング不要なハンドベースメッシュ変形法を提案する。
我々は、視覚言語モデルを利用してハンドルベースのインタフェースを解釈し、操作する。
私たちのアプローチは、高品質なメッシュ変形を一貫して提供します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:29:42 GMT)
GENIUS: A Generative Framework for Universal Multimodal Search [26.5] 本稿では,複数のモダリティやドメインにまたがる多様なタスクを支援する汎用的な生成検索フレームワークGENIUSを提案する。
GENIUSは、モダリティを分離したセマンティック量子化を導入し、マルチモーダルデータをモダリティとセマンティクスの両方をコードする離散IDに変換する。
汎用性を高めるために,クエリとターゲットを補間するクエリ拡張を提案し,genIUSが様々なクエリ形式に適応できるようにする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:19:20 GMT)
Cosmic-ray-induced correlated errors in superconducting qubit array [26.4] 相関誤差は、フォールトトレラント量子計算に必要な量子誤差補正を逸脱させることがある。
超伝導量子ビットを用いた最近の実験は、宇宙線ミューオンとガンマ線によって誘導される準粒子(QP)バーストから生じる可能性があることを示している。
ここでは、QPバーストのモニタリングに電荷パリティジャンプとビットフリップを用い、希釈冷凍機に2つのミューオン検出器を用いてミューオン現象を検出する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:07:00 GMT)
Rethinking Text-based Protein Understanding: Retrieval or LLM? [26.3] タンパク質テキストモデルは、タンパク質の生成と理解において大きな注目を集めている。
現在のアプローチでは、タンパク質関連の知識を、継続した事前学習とマルチモーダルアライメントを通じて、大きな言語モデルに統合することに重点を置いている。
そこで本研究では,タンパク質間テキスト生成のための微調整LDMを著しく上回り,学習不要シナリオにおける精度と効率性を示す検索強化手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:59:09 GMT)
On the Convergence of Gradient Descent on Learning Transformers with Residual Connections [26.0] 本研究では, 自己アテンション, フィードフォワードネットワーク, 残差接続を含む構造的に完全な単一層トランスの収束挙動を解析する。
残余接続はこの出力行列の不調和を改善するのに役立ち、これはソフトマックス演算によって課される低ランク構造から生じる問題である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:10:22 GMT)
VCD: A Dataset for Visual Commonsense Discovery in Images [26.0] 我々は,10万以上の画像と1400万対のオブジェクト・コモンセンスを含む大規模データセットであるVisual Commonsenseデータセット(VCD)を提示する。
VCDは、視覚的コモンセンスのための新しい3段階の分類を導入し、プロパティー、アクション、スペースの側面にわたって、Seen(直接観測可能)とUnseen(推論不能)のコモンセンスを統合する。
VCDの有用性を実証するために,視覚言語モデルと命令チューニングを組み合わせた生成モデルであるVCMを開発し,画像から多様な視覚コモンセンスを検出する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:04:01 GMT)
MegaHan97K: A Large-Scale Dataset for Mega-Category Chinese Character Recognition with over 97K Categories [26.0] MegaHan97Kは、前例のない97,455の漢字を網羅した大規模データセットである。
MegaHan97Kは最新のGB18030-2022標準を完全にサポートする最初のデータセットである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:33:06 GMT)
Is Cognition Consistent with Perception? Assessing and Mitigating Multimodal Knowledge Conflicts in Document Understanding [25.8] マルチモーダルな大言語モデル (MLLM) は文書理解において顕著な能力を示している。
マルチモーダルタスクとして、文書理解には知覚能力と認知能力の両方を持つモデルが必要である。
訓練における様々な種類のアノテーションノイズのため、現在のMLLMは知覚と認知の対立に直面していることが多い。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:03:18 GMT)
Rectified Point Flow: Generic Point Cloud Pose Estimation [25.7] 本稿では,一対の点雲登録と複数部分形状の組立を条件付き単一生成問題として定式化する統一パラメータ化であるRectified Point Flowを紹介する。
提案手法は,ノイズの多い点を目標位置へ移動させる連続点速度場を学習し,その部分のポーズを復元する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:36:03 GMT)
Transformers Meet In-Context Learning: A Universal Approximation Theory [25.1] 我々は、変換器が文脈内学習を実現する方法をよりよく理解するために、普遍近似理論を開発する。
私たちの研究は、トランスフォーマーが汎用表現を同時に学習し、コンテキスト内の例に動的に適応する方法に光を当てています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:12:51 GMT)
An analytic theory of creativity in convolutional diffusion models [25.0] 我々は、畳み込み拡散モデルにおける創造性の分析的、解釈可能、予測的理論を得る。
我々のモデルは、創造性の局所的な一貫したパッチモザイク機構を明らかにする。
我々の理論は、事前訓練された自己認識可能なUNetsの出力を部分的に予測する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:09:27 GMT)
What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective [25.0] 大規模言語モデル(LLM)における異なる階層の学習パターンについて,勾配のレンズを用いて検討した。
本研究では, チェーン・オブ・シンクレット(CoT)を含まない高速思考は, ゆっくり思考するよりも, 階層間の勾配が大きく, 階層間の勾配の差が大きいことを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:01:49 GMT)
Time-Lapse Video-Based Embryo Grading via Complementary Spatial-Temporal Pattern Mining [24.5] 本稿では,ビデオベースの胚移植法を提案する。フル長時間ラプスモニタリング(TLM)ビデオを直接利用して胚学者の全体的な品質評価を予測する,最初のパラダイムである。
この課題を支援するために,2500本以上のTLMビデオからなる実世界の臨床データセットを,胚の全体的な品質を示すグレーティングラベルで評価した。
この研究は、AI支援胚選択のための貴重な方法論的枠組みを提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:22:03 GMT)
Selecting Demonstrations for Many-Shot In-Context Learning via Gradient Matching [24.4] In-Context Learning (ICL) は大規模言語モデル (LLM) を活用し, 微調整を伴わない迅速なタスク適応を実現する
マルチショットICLは、スケールされた実演を通して有望な性能を示すが、マルチショット実演の選択方法は、既存の作業におけるランダムな選択に限られている。
そこで本研究では,対象課題のトレーニングセット全体と選択された事例間の微調整勾配を整列させて,実演を選択する新しい勾配マッチング手法を提案し,選択された例内のトレーニングセット全体に対する学習効果にアプローチする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:57:05 GMT)
Investigating Non-Transitivity in LLM-as-a-Judge [24.4] 本稿では,AlpacaEvalフレームワークにおける非透過性の存在について検討し,モデルランキングに対するその影響を分析する。
ラウンドロビントーナメントの計算コストに対処するため,スイス・ワイズ・イテレーティブ・マッチメイキング(Swim)トーナメントを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:48:53 GMT)
Efficiently Serving Large Multimodal Models Using EPD Disaggregation [24.1] Encode-Prefill-Decode Disaggregation(エンコード・プリフィル・デコード・デコード・デアグリゲーション)という,エンコード・プリフィル・デコード・デコード・デアグリゲーション(Encode-Prefill-Decode Disaggregation)というフレームワークを紹介した。
エンコーディングとプリフィルをバンドルする現在のシステムとは異なり、私たちのアプローチはこれらのステップを分離し、新たな機会と最適化を解放します。
一般的なLMMを用いた実験では、メモリ効率(ピークメモリ使用率の最大15倍)、バッチサイズ(最大22倍)、リクエストあたり10倍のイメージ、および2.2倍のKVキャッシュが大幅に向上した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:21:30 GMT)
Birth and Death of a Rose [23.9] 本研究では,事前学習した2次元基礎モデルから時間的対象固有値を生成する問題について検討する。
本稿では,事前学習した2次元拡散モデルから抽出した信号を用いて,そのような資産を生成する手法を提案する。
本手法は,いくつかの自然現象に対して高品質な時間的対象固有値を生成することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:22:36 GMT)
Generating by Understanding: Neural Visual Generation with Logical Symbol Groundings [23.9] このような論理積分モデルを構築するために,Abductive Visual Generation (AbdGen) アプローチを提案する。
本手法は, 論理的推論システムと様々なニューラル生成モデルを統合するために応用できることを実験的に示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:24:20 GMT)
Membership Inference Attacks on Sequence Models [23.5] LLM(Large Language Models)や自己回帰画像生成装置(Autoregressive Image Generators)のようなシーケンスモデルは、機密情報を暗記し、不注意に漏洩する傾向にある。
我々は、シーケンシャル・ジェネレーションに固有の相関を利用して、シーケンシャル・モデルにおける効果的にプライバシ・リークを測定する必要があると論じる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:13:57 GMT)
Proactive Model Adaptation Against Concept Drift for Online Time Series Forecasting [23.5] 本稿では,オンライン時系列予測のための新しいプロアクティブモデル適応フレームワークを提案する。
Proceedは最初に、最近使用したトレーニングサンプルと現在のテストサンプルの間のコンセプトドリフトを推定する。
次に、推定ドリフトをパラメータ調整に効率的に変換するために適応生成器を使用する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:25:32 GMT)
AdvBDGen: Adversarially Fortified Prompt-Specific Fuzzy Backdoor Generator Against LLM Alignment [23.5] 本稿では,プロンプト固有のバックドアを自動的に生成する,逆向きに強化された生成ファインチューニングフレームワークであるAdvBDGenを提案する。
AdvBDGenは、バックドアのインストール性とステルス性を確保するために、敵によって強化されたジェネレータと差別器のペアを使用している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:02:29 GMT)
On Entity Identification in Language Models [23.0] 言語モデル(LM)の内部表現は、名前付きエンティティの言及を識別し、区別する。
まず、エンティティの言及の曖昧さと可変性という2つの問題を定式化します。
本稿では,クラスタリング品質指標に類似したフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:17:55 GMT)
Control Tax: The Price of Keeping AI in Check [22.9] 我々は、AIパイプラインに制御手段を統合するための運用的および財政的コストである制御税の概念を導入する。
我々は,現在最先端の言語モデルに関する総合的な評価を,敵対的設定で実施する。
制御プロトコルに対する実証的な金銭的コスト見積を行い、最適化されたモニタリング戦略を開発する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:48:39 GMT)
Unleashing The Power of Pre-Trained Language Models for Irregularly Sampled Time Series [22.9] 多様な ISTS 解析タスクに対処するために,ISTS-PLM という統合された PLM ベースのフレームワークを提案する。
ISTSにおける難解なイントラ・イン・タイム・シリーズ・モデリングに取り組むために、新しいタイム・アウェアと可変・アウェアのPLMを統合している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:21:33 GMT)
ECoRAG: Evidentiality-guided Compression for Long Context RAG [22.8] Evidentiality-guided RAG, textbfECoRAG フレームワークを提案する。
ECoRAGは、明細度に基づいて検索した文書を圧縮することで、性能を向上させる。
ECoRAGはレイテンシを低減するだけでなく、トークンの使用を最小化するため、非常にコスト効率が高い。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:43:49 GMT)
AV-Reasoner: Improving and Benchmarking Clue-Grounded Audio-Visual Counting for MLLMs [22.4] CG-AV-Countingは、手動で注釈付き手掛かり付き数え上げベンチマークで、1,027のマルチモーダル質問と5,845の注釈付き手掛かりを497本の長ビデオで紹介する。
ブラックボックスとホワイトボックスの評価の両方をサポートし、エンドツーエンドと推論ベースのカウントのための包括的なテストベッドとして機能する。
AV-Reasonerは、GRPOとカリキュラム学習で訓練されたモデルであり、関連するタスクからカウント能力を一般化する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:58:33 GMT)
How can Diffusion Models Evolve into Continual Generators? [22.1] 連続一貫性拡散(Continuous Consistency Diffusion, CCD)は、一貫性の目標をトレーニングに統合する原則的なフレームワークである。
CCDは連続的な設定の下で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:36:13 GMT)
From User Surveys to Telemetry-Driven AI Agents: Exploring the Potential of Personalized Productivity Solutions [21.8] 情報労働者は、現代の職場で生産性の課題にますます苦労している。
エンタープライズツールを通じて生産性のメトリクスが利用可能であるにもかかわらず、労働者はしばしばこのデータを実行可能な洞察に変換するのに失敗する。
ユーザのニーズに合わせたAIベースの生産性エージェントを通じて、これらの課題に対処するための包括的でユーザ中心のアプローチを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:00:36 GMT)
Toward a Human-Centered Evaluation Framework for Trustworthy LLM-Powered GUI Agents [21.7] 本稿では、GUIエージェントの3つの重要なリスクを特定し、従来のGUI自動化と一般的な自律エージェントとの違いについて検討する。
これらのリスクにもかかわらず、既存の評価は主にパフォーマンスに重点を置いており、プライバシとセキュリティアセスメントはほとんど調査されていない。
このようなギャップに対処するため,リスクアセスメントを取り入れ,コンテキスト内同意を通じてユーザ意識を高め,GUIエージェントの設計と評価にプライバシとセキュリティの考慮を組み込む人間中心評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:40:53 GMT)
SpargeAttention: Accurate and Training-free Sparse Attention Accelerating Any Model Inference [21.5] SpargeAttnは任意のモデルに対する普遍的スパースで量子化された注意である。
本手法は,エンドツーエンドのメトリクスを犠牲にすることなく,言語,画像,ビデオ生成などの多様なモデルを大幅に高速化する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:03:14 GMT)
MAVL: A Multilingual Audio-Video Lyrics Dataset for Animated Song Translation [21.5] 歌声翻訳のためのマルチリンガル・マルチモーダル・ベンチマークであるMAVL(Multilingual Audio-Video Lyrics Benchmark for Animated Song Translation)を紹介する。
本稿では,Syllable-Constrained Audio-Video LLM with Chain-of-Thought SylAVL-CoTを提案する。
実験結果から,SylAVL-CoTはテキストベースモデルよりも歌声性や文脈精度が優れていた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:48:21 GMT)
On Fitting Flow Models with Large Sinkhorn Couplings [21.3] フローモデルは、1つのモーダリティ(例えばノイズ)から別のモーダリティ(例えば画像)へ徐々にデータを変換する。
近年の研究では、$n$ソースと$n$ターゲットポイントのミニバッチをサンプリングし、OTソルバを使用してそれらを再注文してより良いペアを作る方法が提案されている。
エントロピーの正則化が低い大きなシンクホーンカップリングを組み込む場合, 流れモデルに大きな利点があることが示される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:19:01 GMT)
SoK: Are Watermarks in LLMs Ready for Deployment? [21.3] 大規模言語モデル(LLM)は自然言語処理を変革し、多様なタスクにまたがる印象的な能力を誇示している。
これらのモデルの展開は、知的財産権侵害と潜在的な誤用に関連する重大なリスクをもたらす。
プロプライエタリなLCMと非常に関係があり、セキュリティ、収益、倫理的展開に深刻な脅威をもたらすため、私たちはモデルステルス攻撃に重点を置いています。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:12:51 GMT)
LeanPO: Lean Preference Optimization for Likelihood Alignment in Video-LLMs [21.3] 本稿では,暗黙的な報酬を応答の確率の平均値として再構成する参照のない手法であるemphLean Preference Optimization (LeanPO)を提案する。
LeanPOは、ビデオ-LLMの好みと人間の信頼性を調整するための、シンプルで効果的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:21:16 GMT)
Astraea: A GPU-Oriented Token-wise Acceleration Framework for Video Diffusion Transformers [21.0] ビデオ拡散変換器 (vDiT) は, テキスト・ビデオ生成において顕著な進歩を遂げているが, その高い計算要求は, 実用的展開において大きな課題を呈している。
本稿では,vDiTをベースとしたビデオ生成において,ほぼ最適設定を検索する自動フレームワークであるASTRAEAを紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:41:38 GMT)
Neural Discovery in Mathematics: Do Machines Dream of Colored Planes? [21.0] ニューラルネットワークがHudwiger-Nelson問題のケーススタディを通じて数学的発見を促進する方法を実証する。
確率的, 微分可能な損失関数を持つ最適化タスクとして, この混合離散連続幾何着色問題を厳密な制約で再構成する。
これにより、許容可能な構成の勾配に基づく探索が可能となり、2つの新しい6色の発見につながった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:01:14 GMT)
Conformal Prediction Beyond the Seen: A Missing Mass Perspective for Uncertainty Quantification in Generative Models [20.8] Conformal Prediction with Query Oracle (CPQ)は、これらの目的間の最適な相互作用を特徴付けるフレームワークである。
本アルゴリズムは2つの基本原理に基づいて構築されている。一方は最適なクエリポリシーを規定し、他方はクエリされたサンプルから予測セットへの最適マッピングを定義する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:26:14 GMT)
Reading Recognition in the Wild [20.8] ユーザがいつ読んでいるかを判断する新しい読解タスクを導入する。
まず、Wildデータセットにおける大規模マルチモーダル読み込みについて紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:53:39 GMT)
SCOP: Evaluating the Comprehension Process of Large Language Models from a Cognitive View [20.5] 本稿では,認知的視点からの理解過程において,大規模言語モデルがどのように機能するかを検討するために,SCOPを提案する。
LLMが専門家レベルの理解プロセスを実行することは依然として困難である。
さらなる分析により、LSMはある程度信頼できない可能性があることが判明し、欠陥のある理解プロセスを通じて正しい答えを得る可能性がある。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:10:24 GMT)
DECASTE: Unveiling Caste Stereotypes in Large Language Models through Multi-Dimensional Bias Analysis [20.4] 大規模言語モデル (LLM) は自然言語処理 (NLP) に革命をもたらした。
LLMは、民族、性別、宗教に基づくものなど、有害な社会的偏見を反映し、永続することが示されている。
我々は,LLMにおける暗黙的および明示的なキャストバイアスを検知し,評価するための新しいフレームワークであるDECASTEを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:42:04 GMT)
Entropy-based Training Methods for Scalable Neural Implicit Sampler [20.4] 本稿では,制限を克服する,効率的でスケーラブルな暗黙的ニューラルサンプリング手法を提案する。
暗黙のサンプルは計算コストの低い大量のサンプルを生成することができる。
この2つのトレーニング手法を用いることで、目的の分布から学習し、生成する神経暗黙のサンプルを効果的に最適化する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:46:15 GMT)
Micro-Act: Mitigate Knowledge Conflict in Question Answering via Actionable Self-Reasoning [20.3] Micro-Actは階層的なアクション空間を持つフレームワークで、コンテキストの複雑さを自動的に認識し、各知識ソースを微妙な比較のシーケンスに適応的に分解する。
5つのデータセットと3つの競合タイプにまたがって、最先端のベースラインに対するQAの精度を継続的に向上させる。
Micro-Actは競合しない質問に対して同時に堅牢なパフォーマンスを示し、現実のRAGアプリケーションにおける実用的価値を強調している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:33:02 GMT)
Argument Summarization and its Evaluation in the Era of Large Language Models [20.2] 大規模言語モデル(LLM)は、Argument Summarization(ArgSum)を含む様々な自然言語生成(NLG)タスクに革命をもたらした。
本稿では,ArgSum への最先端 LLM の統合について検討し,その評価を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:03:53 GMT)
Seeing the Invisible: Machine learning-Based QPI Kernel Extraction via Latent Alignment [20.1] 準粒子干渉(QPI)イメージングは、量子材料中の電子構造を探索するための強力なツールである。
マルチ散乱器画像から単一散乱器QPIパターンを抽出することは、基本的に不適切な逆問題である。
本稿では,QPIカーネル抽出のためのAIベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:58:09 GMT)
Toward Efficient Kernel-Based Solvers for Nonlinear PDEs [20.0] 非線形偏微分方程式(PDE)を効率的に解くための新しいカーネル学習フレームワークを提案する。
カーネルに微分演算子を埋め込む最先端のカーネルソルバとは対照的に,本手法ではこれらの演算子をカーネルから排除する。
我々は、標準カーネル形式を用いて解をモデル化し、導関数を計算するために補間剤を区別する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:24:26 GMT)
Model-based Neural Data Augmentation for sub-wavelength Radio Localization [20.0] この作業は、メモリ要求を同時に低減し、精度を向上させることで、確立されたフィンガープリントベースのローカライゼーションフレームワークを拡張します。
モデルに基づくニューラルネットワークは、位置-チャネルマッピングを学習するために使用され、生成的ニューラルネットワークモデルとして機能する。
注目すべきは、ローカライズ精度が数桁向上すると同時に、古典的なフィンガープリント法に比べてメモリ要求量が桁違いに削減されることだ。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:20:51 GMT)
General Intelligence Requires Reward-based Pretraining [19.9] 大規模言語モデル(LLM)は、実世界の素晴らしいユーティリティを実証している。
しかし、適応的かつ堅牢に推論できる能力は、脆弱なままだ。
我々は3つの重要な方向から知識と推論を解き放つことを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:41:47 GMT)
Piloting Structure-Based Drug Design via Modality-Specific Optimal Schedule [19.9] 近年の深部生成モデルは幾何構造モデリングの課題に直面している。
雑音スケジュールがねじれ確率パスの変動下界(VLB)を決定する事実を確立することにより、VLB-Optimal Scheduling(VOS)を提案する。
本モデルにより分子構造と相互作用モデリングが効果的に向上し,CrossDock上で95.9%の最先端のPoseBusters通過率が達成される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:37:46 GMT)
Solving Inverse Problems via Diffusion-Based Priors: An Approximation-Free Ensemble Sampling Approach [19.9] 現在のDMに基づく後方サンプリング法は、生成過程への近似に依存する。
近似を使わずに後続サンプリングを行うアンサンブルに基づくアルゴリズムを提案する。
本アルゴリズムは,DM法と連続モンテカルロ法を組み合わせた既存手法に動機づけられる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:27:46 GMT)
SPHINX: Structural Prediction using Hypergraph Inference Network [19.9] 本稿では,非教師付き手法で遅延ハイパーグラフ構造を推論するモデルであるハイパーグラフ推論ネットワーク(SPHINX)を用いた構造予測を提案する。
最近の$k$サブセットサンプリングの進歩は、離散ハイパーグラフ構造を生成するのに適したツールであることを示す。
結果として得られるモデルは、現代のハイパーグラフニューラルネットワークに必要な高次構造を生成することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:13:02 GMT)
Uncovering Memorization Effect in the Presence of Spurious Correlations [19.8] 本論文は,ネットワーク内の小さなニューロンの集合における突発的特徴の存在を系統的に示す。
ニューロンの小さなサブセットに集中する急激な記憶は、不均衡なグループパフォーマンスを駆動する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:06:59 GMT)
Clustering and Median Aggregation Improve Differentially Private Inference [19.8] Differentially Private(DP)言語モデル推論は、プライベートな合成テキストを生成するアプローチである。
均一サンプリングは、プライベートテキストの品質を劣化させることを示す。
我々は,平均ではなく中央値のプライベートな計算によって,次のトークン統計を集約するアルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:34:50 GMT)
macOSWorld: A Multilingual Interactive Benchmark for GUI Agents [19.7] 我々は、グラフィカルユーザインタフェース(GUI)エージェントを評価するための最初の包括的なベンチマークであるMultilingualWorldを紹介する。
タスク命令とOSインターフェースが5つの言語で提供されている。
プロプライエタリなコンピュータ利用エージェントは30%以上の成功率で、オープンソースの軽量な研究モデルは2%未満で遅れている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:03:48 GMT)
Deployability-Centric Infrastructure-as-Code Generation: An LLM-based Iterative Framework [19.7] インフラストラクチャ・アズ・コード(IaC)の生成は、クラウドインフラストラクチャのプロビジョニングを自動化する上で大きな約束を持っています。
大規模言語モデル(LLM)の最近の進歩は、IaC開発を民主化する有望な機会を提供する。
最近の評価では、IaCテンプレートユーティリティの致命的な測定であるデプロイ可能性を無視しながら、構文的正しさに焦点を当てている。
IaCテンプレートを生成するために反復フィードバック機構を使用するLCMベースのデプロイ性中心のフレームワークであるIaCGenと、デプロイ性中心のIaCテンプレートベンチマークであるDPIaC-Evalである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:53:12 GMT)
Spike-TBR: a Noise Resilient Neuromorphic Event Representation [19.6] 時間的バイナリ表現(TBR)に基づくイベントベースの新しい符号化戦略であるSpike-TBRを提案する。
Spike-TBRは、フレームベースの利点と、スパイクニューラルネットワークのノイズフィルタリング機能を組み合わせて、イベントストリームをより堅牢に表現する。
我々は、複数のデータセットにわたって異なるスパイキングニューロンを用いて、Spike-TBRの4つの変種を評価し、ノイズの影響のあるシナリオにおいて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:38:42 GMT)
Illusion3D: 3D Multiview Illusion with 2D Diffusion Priors [19.6] ユーザが提供するテキストプロンプトや画像に基づいて、3次元のマルチビューイリュージョンを作成するための,シンプルで効果的なアプローチを提案する。
本手法は,事前学習したテキスト・画像拡散モデルを用いて,ニューラル3次元表現のテクスチャと形状を最適化する。
我々は,生成した3次元マルチビューイリュージョンの品質を向上させるために,いくつかの手法を開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:11:38 GMT)
Combating Misinformation in the Arab World: Challenges & Opportunities [19.5] 我々は、誤情報検出、追跡、緩和、コミュニティエンゲージメントといった、誤った情報と戦うための重要な側面を探求する。
我々は、草の根の事実チェック組織との関係、文化規範の理解、社会的修正の促進、強力な協調的な情報ネットワークの構築が、アラブ世界のよりレジリエントな情報エコシステムの機会をいかに生み出すかに光を当てた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:57:33 GMT)
Self-Tuning Spectral Clustering for Speaker Diarization [19.5] p-隣り合う親和性行列(SC-pNA)にスペクトルクラスタリングと呼ばれるスパース親和性行列を生成する新しいプルーニングアルゴリズムを提案する。
提案手法は,外部チューニングデータの必要性を排除し,ノード固有の固定近傍選択を改善する。
挑戦的なDIHARD-IIIデータセットの実験結果は、SC-pNAの優位性を強調している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:58:03 GMT)
Revisiting Test-Time Scaling: A Survey and a Diversity-Aware Method for Efficient Reasoning [19.4] テスト時間スケーリング(TTS)は、推論中にさらなる計算を割り当てることで、Large Language Models(LLM)の推論性能を改善する。
我々は、推論最適化モデルが、TSの有効性を制限するような、より多様な出力を生成することが多いことを観察する。
多様性を重視したデータストラテジーにプレフィックスチューニングを適用する軽量な手法であるADAPTを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:02:17 GMT)
Gaussian Building Mesh (GBM): Extract a Building's 3D Mesh with Google Earth and Gaussian Splatting [19.4] 最近リリースされたオープンソースの基礎画像セグメンテーションとオブジェクト検出モデル(SAM2+GroundingDINO)
私たちは、その名前、アドレス、地理的座標に基づいて、任意の建物の3Dメッシュを抽出するパイプラインを作成しました。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:59:49 GMT)
FG 2025 TrustFAA: the First Workshop on Towards Trustworthy Facial Affect Analysis: Advancing Insights of Fairness, Explainability, and Safety (TrustFAA) [19.4] Towards Trustworthy Facial Affect Analysis”の最初のワークショップは、信頼性に関するさまざまな課題を調査している研究者を集結させることを目的としている。
このワークショップは、FG2025が倫理に重点を置いていることに合わせて、今年の申請に対する倫理的インパクトステートメントの要件が盛り込まれており、信頼できるFAAに関する研究、議論、対話を奨励することでFG2025の取り組みを支援している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:40:49 GMT)
Hierarchical-Task-Aware Multi-modal Mixture of Incremental LoRA Experts for Embodied Continual Learning [19.2] エンボディドインテリジェンスのためのこれまでの継続的な学習設定は、人間の命令に基づく低レベルのアクションの実行に焦点を当てていた。
エージェントの連続学習プロセスを高レベル命令と低レベル動作の2つの層に分割する階層型エンボディード連続学習機構(HEC)を提案する。
本稿では, インクリメンタル LoRA Experts (Task-aware MoILE) 法について紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:20:47 GMT)
Fine-Grained Interpretation of Political Opinions in Large Language Models [19.2] 近年の研究では,LSMの反応と内的意図の相違が指摘されている。
このことは、LSMの内部メカニズムを調査し、内部の政治状態を明らかにするのに役立ちます。
我々は、4次元の政治学習フレームワークを設計し、詳細な政治概念ベクトル学習のための対応するデータセットを構築した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:06:59 GMT)
Just a Scratch: Enhancing LLM Capabilities for Self-harm Detection through Intent Differentiation and Emoji Interpretation [19.2] ソーシャルメディア上でのセルフハーム検出は、早期介入とメンタルヘルス支援に不可欠である。
現在の大きな言語モデル(LLM)は、カジュアルな言語や絵文字で暗黙の手がかりを解釈するのに苦労している。
本研究は, 言語-絵文字間相互作用による意図の識別により, LLMの自己修復に対する理解を深める。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:19:48 GMT)
MAC-Gaze: Motion-Aware Continual Calibration for Mobile Gaze Tracking [19.1] モバイルの視線追跡は基本的な課題に直面している。
本稿では,スマートフォン慣性計測ユニット(IMU)センサと連続学習技術を活用した動き認識型連続学習手法MAC-Gazeを提案する。
本システムでは、事前学習した視線推定器と、IMUに基づく活動認識モデルと、クラスタリングに基づくハイブリッド意思決定機構を統合した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:49:14 GMT)
List-Level Distribution Coupling with Applications to Speculative Decoding and Lossy Compression [19.1] そこで本研究では,SpecTrやSpecInferといったベースラインと競合する性能を実現し,実装が容易な投機的サンプリングのための新しいメカニズムを開発した。
我々は、ソースサンプルを圧縮し、複数のデコーダで利用できる設定において、サイド情報による分散損失圧縮を考察する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:32:08 GMT)
SECNEURON: Reliable and Flexible Abuse Control in Local LLMs via Hybrid Neuron Encryption [18.8] 多様な機能を持つ大規模言語モデル(LLM)は、ますますローカル環境にデプロイされている。
LLMの本質的な機能に古典的なアクセス制御をシームレスに組み込む最初のフレームワークであるSECNEURONを提案する。
SECNEURONは、未承認タスクの精度を25%以下に制限し、認証された精度の損失を2%に抑えている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:01:28 GMT)
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs [18.6] MRAG(Multi-Head RAG)は、マルチアスペクト文書を取得するための新しいスキームである。
MRAGは18RAGベースラインに対して設計上の優位性を示し,検索成功率の最大20%を実証的に改善した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:57:36 GMT)
Interpretation Meets Safety: A Survey on Interpretation Methods and Tools for Improving LLM Safety [18.4] 大規模言語モデル(LLM)は、より広い現実世界での使用、安全でない振る舞いの理解と緩和が不可欠である。
我々は,このギャップを埋める最初の調査を行い,安全性を重視した解釈手法と,それらに通知する安全性向上と,それらを運用するツールを結合する統一的なフレームワークを紹介した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:56:05 GMT)
A Novel Solver for QUBO Problems: Performance Analysis and Comparative Study with State-of-the-Art Algorithms [18.4] 本稿では,分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分枝分数分法,および分枝分枝分枝分枝分根分枝分枝分枝分枝分
我々は、遺伝的アルゴリズム、コヒーレントなイジングマシン、シミュレートされた分岐を含む8つの最先端の解法に対して、QIS3をベンチマークする。
均一なランタイム予算の下で、QIS3は、ほぼすべてのインスタンスで最高のソリューションを獲得し、最大カットインスタンスの94%で最適性を達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:22:48 GMT)
When Maximum Entropy Misleads Policy Optimization [18.2] MaxEntメソッドは、実際にパフォーマンスクリティカルな制御問題に対処することが示されている。
本研究では,強靭性と最適性の間のトレードオフが,複雑な制御タスクにおけるMaxEntの性能にどのように影響するかを分析する。
我々の分析は、挑戦的な制御問題において、報酬設計とエントロピーのバランスをとる方法の理解を深める。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:03:38 GMT)
The Role of Diversity in In-Context Learning for Large Language Models [18.2] そこで本研究では,様々なタスクを対象とした実験を通して,文脈内サンプル選択における多様性の役割について検討する。
Llama-3.1、Gemma-2、Mistral-v0.3のモデルに対する実験により、多様性を考慮した選択法が性能を向上させることが示された。
本稿では、文脈内サンプル選択に多様性を取り入れることの利点を説明する理論的枠組みを紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:20:31 GMT)
Leveraging Self-Attention for Input-Dependent Soft Prompting in LLMs [17.8] 本稿では,ソフトプロンプトを用いたパラメータ効率の高い微調整について述べる。
自己注意機構(ID-SPAM)を用いた入力依存型ソフトプロンプト手法を提案する。
各種タスクにおける最先端技術と比較して提案手法の利点を示し、改良されたゼロショット領域転送能力を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:13:22 GMT)
The Impossibility of Fair LLMs [17.8] さまざまな技術的公正フレームワークを分析し、公正な言語モデルの開発を難易度の高いものにするために、それぞれに固有の課題を見つけます。
それぞれのフレームワークが汎用的なAIコンテキストに拡張されないか、実際には実現不可能であることを示す。
これらの固有の課題は、LLMを含む汎用AIにおいて、限られた参加入力や限られた測定方法といった経験的な課題が克服されたとしても、持続する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:35:42 GMT)
Agents of Change: Self-Evolving LLM Agents for Strategic Planning [17.7] 我々は、シンプルなゲームプレイングエージェントから、自身のプロンプトとプレイヤーエージェントのコードを自動で書き直すことができるシステムまで、LSMベースのエージェントの進歩をベンチマークする。
以上の結果から,特にClaude 3.7 や GPT-4o などのモデルによって駆動される自己進化型エージェントは,その戦略を自律的に採用することで,静的ベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:45:24 GMT)
UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules [17.6] 我々は、ドメイン間知識を活用して原子間相互作用の理解を深める textbfUnified bfSimulator (UniSim) を提案する。
UniSimは、小さな分子、ペプチド、タンパク質間で高い競争力を発揮する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:10:52 GMT)
Evaluating Morphological Compositional Generalization in Large Language Models [17.5] 大規模言語モデル (LLM) の形態的一般化能力について, 構成性のレンズによる検討を行った。
我々はトルコ語やフィンランド語などの凝集言語に焦点を当てている。
解析の結果,LLMは特に新規語根に適用する場合,形態的構成一般化に苦慮していることが明らかとなった。
モデルは偶然よりも個々の形態的組み合わせを識別できるが、その性能は体系性に欠けており、人間に比べてかなりの精度の差が生じる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:08:39 GMT)
Neural Inverse Rendering from Propagating Light [17.5] 光を伝播する多視点ビデオから物理ベースでニューラル・リバース・レンダリングを行う最初のシステムを提案する。
われわれのアプローチは、時間分解されたニューラルラジオアンスキャッシングの拡張に依存している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:55 GMT)
On the Mechanism of Reasoning Pattern Selection in Reinforcement Learning for Language Models [17.4] 検証リワード(RLVR)を用いた強化学習の体系的研究について述べる。
RLVR学習モデルでは,高精度推論パターンが優先的に採用されている。
我々はRLVRの収束とトレーニングのダイナミクスに関する理論的解析を開発する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:17:04 GMT)
Exploring Representations and Interventions in Time Series Foundation Models [17.2] 時系列基礎モデル(TSFM)は、幅広いアプリケーションのための強力なツールであることを約束する。
彼らの内部表現や学習された概念はまだよく理解されていない。
本研究では,様々なTSFMにおける表現の構造と冗長性について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:26:16 GMT)
Are LLMs Reliable Translators of Logical Reasoning Across Lexically Diversified Contexts? [17.1] 論理翻訳者は語彙の多様化に苦慮している。
既存の論理的推論ベンチマークには語彙的多様性がない。
この大きなギャップに対処するために設計されたベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:49:36 GMT)
A Reliable Framework for Human-in-the-Loop Anomaly Detection in Time Series [17.1] HILADは、人間とAIの動的かつ双方向なコラボレーションを促進するために設計された、新しいフレームワークである。
ビジュアルインターフェースを通じて、HILADはドメインの専門家に、大規模な予期せぬモデルの振る舞いを検出し、解釈し、修正する権限を与えます。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:10:47 GMT)
Can Large Language Models Understand Intermediate Representations in Compilers? [17.0] 中間表現(IR)は、コンパイラ設計とプログラム解析において重要な役割を果たす。
我々は6つの最先端の大規模言語モデル(LLM)のIR理解能力を評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:48:54 GMT)
Evaluating Sparse Autoencoders: From Shallow Design to Matching Pursuit [17.0] スパースオートエンコーダ(SAE)は近年,解釈可能性の中心的なツールとなっている。
本稿では,MNISTを用いた制御環境でのSAEの評価を行う。
我々は、MP-SAE(Matching Pursuit)をアンロールすることで、マルチイテレーションSAEを導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:57:58 GMT)
Ravan: Multi-Head Low-Rank Adaptation for Federated Fine-Tuning [17.0] パラメータ効率とモデル表現率のバランスをとる適応型マルチヘッドLoRA法であるtextscRavanを提案する。
ビジョンと言語ベンチマークの実験では、textscRavanは以前のパラメータ効率の基準線よりも2-8%精度が向上している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:28:02 GMT)
Personalized Interpretability -- Interactive Alignment of Prototypical Parts Networks [17.0] 概念に基づく解釈可能なニューラルネットワークは、直感的で理解しやすい説明のために大きな注目を集めている。
最大の制限は、これらの説明が、概念上の矛盾のため、必ずしもユーザーにとって理解できないことである。
この矛盾は、モデル推論と人間の理解の整合性を損なう。
プロトタイプ部品のパーソナライズを可能にする対話型戦略であるYesProtoPを紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:30:20 GMT)
Invisible Backdoor Triggers in Image Editing Model via Deep Watermarking [16.9] 有害なデータによる画像編集プロセスに、目に見えないトリガーを埋め込む新たな攻撃フレームワークを提案する。
既成の深層透かしモデルを利用して、知覚不可能な透かしをバックドアトリガーとしてエンコードする。
私たちのゴールは、ウォーターマークされた入力を受け取る際に、事前に定義されたバックドアターゲットをモデルに作成できるようにすることです。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:51:58 GMT)
Seven Security Challenges That Must be Solved in Cross-domain Multi-agent LLM Systems [16.8] 大規模言語モデル(LLM)は、組織の境界を越えて協調する自律エージェントへと急速に進化している。
本稿では、クロスドメインマルチエージェントLLMシステムのセキュリティアジェンダをマッピングする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:07:18 GMT)
FlowCut: Rethinking Redundancy via Information Flow for Efficient Vision-Language Models [16.8] 大規模視覚言語モデル(LVLM)はマルチモーダル理解において優れているが、冗長な視覚トークンによる計算コストが高い。
既存のプルーニング法は、通常は1層の注意スコアをランク付けや冗長な視覚トークンに頼っている。
本稿では,情報フロー対応プルーニングフレームワークであるFlowCutを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:50:13 GMT)
ContentV: Efficient Training of Video Generation Models with Limited Compute [16.7] ContentVはテキスト・ツー・ビデオのモデルであり、テキスト・プロンプトから複数の解像度と期間にわたる多様な高品質のビデオを生成する。
256 x 64GBのニューラルプロセッシングユニット(NPU)を4週間訓練した後、最先端のパフォーマンス(VBenchでは85.14)を達成した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:54 GMT)
F2T2-HiT: A U-Shaped FFT Transformer and Hierarchical Transformer for Reflection Removal [16.5] シングルイメージリフレクション除去(SIRR)技術は,背景からの不要な反射を除去することにより,画像処理において重要な役割を担っている。
これらの反射は、しばしばガラスの表面から撮影された写真によって引き起こされるが、画質を著しく劣化させる可能性がある。
本稿では,U字型高速フーリエ変換器と階層変換器アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:12:36 GMT)
HypeVPR: Exploring Hyperbolic Space for Perspective to Equirectangular Visual Place Recognition [16.5] 双曲空間における新しい階層的埋め込みフレームワークであるHypeVPRを紹介する。
HypeVPRは、P2E(point-to-equirectangular VPR)の独特な課題に対処するために設計された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:47:15 GMT)
Convex Relaxation for Robust Vanishing Point Estimation in Manhattan World [16.4] GlobustVPは、マンハッタンの世界における点の消滅のための、グローバルに最適なアウトリー・ロバスト反復解法である。
合成データと実世界のデータの両方の実験により、GlobustVPは効率、堅牢性、大域的最適性の間の好適なバランスを達成していることが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:05:31 GMT)
From Objects to Anywhere: A Holistic Benchmark for Multi-level Visual Grounding in 3D Scenes [16.4] Anywhere3D-Benchは2,632個の表現3D境界ボックスペアからなる総合的な3D視覚的グラウンドベンチマークである。
我々は,大規模言語モデルとともに,最先端の3次元視覚的グラウンドディング手法の評価を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:28:02 GMT)
Flex-TravelPlanner: A Benchmark for Flexible Planning with Language Agents [16.3] Flex-TravelPlannerは動的計画シナリオで柔軟に推論できる言語モデルの能力を評価するベンチマークです。
GPT-4o と Llama 3.1 70B を解析したところ,いくつかの重要な所見が得られた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:31:50 GMT)
Evaluation of LLMs in Speech is Often Flawed: Test Set Contamination in Large Language Models for Speech Recognition [16.2] 本研究は,LLMプレトレーニングコーパスにLibriSpeechとCommon Voiceの評価セットのかなりの量が現れることを明らかにする。
汚染影響を測定するために、汚染を伴わずに訓練されたLLMを比較した。
その結果,LSMの出力は少量のデータ汚染によってバイアスを受けることができることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:40:05 GMT)
PoCGen: Generating Proof-of-Concept Exploits for Vulnerabilities in Npm Packages [16.1] PoCGenは、npmパッケージの脆弱性に対するPoCエクスプロイトを自動生成し、検証する新しいアプローチである。
大規模な言語モデル(LLM)をPoCエクスプロイト生成のための静的および動的解析技術と併用する、初めての完全自律型アプローチである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:37:33 GMT)
Time to Talk: LLM Agents for Asynchronous Group Communication in Mafia Games [16.1] ソーシャルゲームでは、ターンという固有の概念は存在しないため、いつ話すかという決定は参加者の決定の重要な部分を形成する。
適応型非同期 LLM-agent を開発し,何と言ったらよいのかを判断すると同時に,いつ言ったらよいのかを判断する。
分析の結果,会話のタイミング決定におけるエージェントの行動は,メッセージ内容の相違はあるものの,人間のパターンを忠実に反映していることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:53:44 GMT)
Magic Mushroom: A Customizable Benchmark for Fine-grained Analysis of Retrieval Noise Erosion in RAG Systems [16.1] 既存のベンチマークでは、現実世界の検索環境で発生する複雑で異質なノイズ分布をエミュレートすることができない。
Magic Mushroomは"マジックキノコ"ノイズを再現するベンチマークである。
Magic Mushroomは、ノイズキャンバスRAGシステムの評価と進展のための有望なツールとして登場した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:44:23 GMT)
Generating Synthetic Stereo Datasets using 3D Gaussian Splatting and Expert Knowledge Transfer [16.0] ステレオデータセット生成のための3D Gaussian Splatting(3DGS)ベースのパイプラインを導入し、Neural Radiance Fields(NeRF)ベースの手法の効率的な代替手段を提供する。
3DGS生成データセット上でのステレオモデルを微調整すると、ゼロショット一般化ベンチマークにおいて競合性能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:41:09 GMT)
Bayesian Inference for Correlated Human Experts and Classifiers [16.0] そこで本研究では,クラスラベルの予測に専門家に問い合わせることの問題点について,できるだけ少ない人的クエリを用いて検討する。
この問題に対する一般的なベイズ的枠組みを開発し、連立潜在表現による専門家相関をモデル化する。
我々は,CIFAR-10H と ImageNet-16H の2つの実世界の医学分類問題に適用する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:39:41 GMT)
E^2GraphRAG: Streamlining Graph-based RAG for High Efficiency and Effectiveness [15.8] 本稿では,グラフベースのRAGフレームワークであるE2GraphRAGを提案する。
E2GraphRAGはGraphRAGの最大10倍のインデックス化を実現し、LightRAGの100倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:41:14 GMT)
Learning normalized image densities via dual score matching [15.8] 拡散生成モデルにインスパイアされた固有化エネルギー(log probability)モデルを学習するための新しいフレームワークを提案する。
我々は、その帰納バイアスを保ちながらエネルギーを計算するためにスコアネットワークアーキテクチャを変更した。
推定ログ確率は、トレーニングセット内の特定の画像とほぼ独立である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:53:57 GMT)
FlowDAS: A Stochastic Interpolant-based Framework for Data Assimilation [15.6] データ同化(DA)は、PDEが支配するシステムの状態を推定するために、動的モデルと観測を統合する。
FlowDASは、間補体を使用して状態遷移ダイナミクスを学習する生成DAフレームワークである。
本研究では,FlowDASがモデル駆動法,ニューラル演算子,スコアベースベースラインを超える精度と物理的妥当性を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:58:03 GMT)
Causal Effect Identification in lvLiNGAM from Higher-Order Cumulants [15.6] 本稿では,高次累積を用いた線形非ガウス非巡回モデル (lvLiNGAM) における因果効果の同定について検討する。
因果効果が一つのプロキシや機器で識別可能であることを証明し、対応する推定方法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:14:35 GMT)
FPTQuant: Function-Preserving Transforms for LLM Quantization [15.6] 本稿では,4つの新しい,軽量かつ表現力のある関数保存変換(FPT)を導入し,変換器の量子化を容易にするFPTQuantについて述べる。
FPTQuantはカスタムカーネルを必要としない。
FPTは、外れ値を減らすために局所的に訓練され、量子化モデルと完全精度モデルの出力が一致するようにエンド・ツー・エンドの両方で訓練される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:56:12 GMT)
Model-Based Exploration in Monitored Markov Decision Processes [15.4] 強化学習の要点は、エージェントが常に報酬を観察することである。
Mon-MDPアルゴリズムにはいくつかの制限がある。
我々はこれらの欠点に対処するMon-MDPのモデルベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:52:08 GMT)
The Impact of Inference Acceleration on Bias of LLMs [15.4] モデル生成における推定加速度最適化による人口統計バイアスについて検討する。
加速度戦略とバイアスタイプの組み合わせは、あるモデルではバイアスの変化が少ないが、別のモデルでは大きな影響をもたらす可能性がある。
この結果から,モデルバイアスの深度・ケースバイケース評価の必要性が示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:50:51 GMT)
In-context Language Learning for Endangered Languages in Speech Recognition [15.3] In-context Learning (ICL) を用いて,大規模言語モデル (LLM) が未知の低リソース言語を学習できるかどうかを検討する。
ICLは、これらの言語に特化して訓練された専用言語モデルに匹敵する、あるいは超越したASR性能を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:49:15 GMT)
ADAMIX: Adaptive Mixed-Precision Delta-Compression with Quantization Error Optimization for Large Language Models [15.0] 大規模言語モデル(LLM)は、様々な知識集約的かつ複雑な推論タスクにおいて印象的なパフォーマンスを達成する。
最近の研究は、カスタマイズされたLLMと対応するベースモデルの間のデルタパラメータの定量化と圧縮のためのデルタ圧縮アプローチを探求している。
効果的な適応型混合精度デルタ圧縮フレームワークであるADAmixを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:17:12 GMT)
UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation [15.0] OpenAIは強力なGPT-4oイメージモデルを導入した。
この知見にインスパイアされたUniWorld-V1は、強力な大言語モデルから抽出された意味的特徴に基づいて構築された統合生成フレームワークである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:41:40 GMT)
Artificial Intelligence Should Genuinely Support Clinical Reasoning and Decision Making To Bridge the Translational Gap [14.9] 人工知能は医学に革命をもたらすと約束しているが、その影響は広く翻訳されるギャップのために限られている。
本稿では,医師の認知・てんかん活動の補完を目的とした,データ駆動型支援ツールの新たな社会工学的概念化を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:39:37 GMT)
FEAT: Full-Dimensional Efficient Attention Transformer for Medical Video Generation [14.9] 高品質なダイナミック・メディカル・ビデオのためのフル次元能動的アテンション・トランスフォーマであるFEATを提案する。
FEAT-Sは、最先端モデルのEndoraのパラメータのわずか23%しか持たないが、同等またはそれ以上の性能を発揮することを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:31:02 GMT)
Toward Better SSIM Loss for Unsupervised Monocular Depth Estimation [14.9] 本研究は, 構造類似度指標(SSIM)の新たな形式を提案する。
元のSSIM関数と比較して、提案された新しい形式は、SSIMの輝度、コントラスト、構造的類似性に関連するコンポーネントを組み合わせるために、乗法ではなく加算を用いる。
このスキームで構築した損失関数は、よりスムーズな勾配をもたらし、教師なし深さ推定におけるより高い性能を達成するのに役立つ。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:43:24 GMT)
Learning dissection trajectories from expert surgical videos via imitation learning with equivariant diffusion [14.9] 内視鏡下粘膜下郭清ビデオにおける解離軌跡の予測は,術式訓練の強化に有意な可能性を秘めている。
学習のための等変表現を用いた入射拡散政策(iDPOE)について紹介する。
本手法は, 分割軌跡の性質を把握し, 連立状態の行動分布を通して専門家の行動をモデル化する。
我々は,等式を学習プロセスに埋め込むことで,幾何学的対称性に一般化するモデルの能力を高める。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:41:19 GMT)
LotusFilter: Fast Diverse Nearest Neighbor Search via a Learned Cutoff Table [14.8] 隣接した検索結果を多角化するための後処理モジュールであるLotusFilterを提案する。
フィルタリング中、LotusFilterはテーブルを調べて、候補から冗長なベクトルを削除する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:17:30 GMT)
Spectra of Magnetoroton and Chiral Graviton Modes of Fractional Chern Insulator [14.8] 我々は,ハルダンハニカム格子モデルを用いて,$nu=1/2$ (ボソニック) と$1/3$ (フェルミオン) チャーン絶縁体 (FCI) の電荷-中性励起スペクトルを計算した。
動的密度構造因子から可視化されたマグネトロトンは、相互作用の増加とともに軟化することのできる有限運動量における最小のギャップを取得する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:28:34 GMT)
Two Birds with One Stone: Improving Factuality and Faithfulness of LLMs via Dynamic Interactive Subspace Editing [14.7] 幻覚のカテゴリーは、神経表現において重なり合う部分空間を共有し、同時に緩和する機会を示す。
本研究では,共有アクティベーションサブスペースを編集することで,事実性と忠実性を両立させる統一フレームワークであるSPACEを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:10:57 GMT)
Cracking the Code: Enhancing Implicit Hate Speech Detection through Coding Classification [14.7] 我々は,Im-HS検出のための新しい分類法を導入し,コードタイプと呼ばれる6つの符号化戦略を定義した。
実験により、コードタイプを使用することで、中国語と英語の両方のデータセットにおける即時HS検出が向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:15:21 GMT)
Aligned but Blind: Alignment Increases Implicit Bias by Reducing Awareness of Race [14.7] 文脈が曖昧である場合, 言語モデル(LM)は, 初期内部表現における人種概念を無視することを示す。
本稿では,初期モデル層における人種概念の表現を動機付けることによって,新たなバイアス緩和戦略を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:35:16 GMT)
Text-Aware Real-World Image Super-Resolution via Diffusion Model with Joint Segmentation Decoders [14.7] 本稿では,テキスト認識と共同セグメンテーションデコーダを統合した新しい拡散型SRフレームワークTADiSRを紹介する。
本研究では,高精細なフルイメージのテキストマスクを用いた高品質な画像合成のための完全なパイプラインを提案する。
提案手法は,超解像におけるテキストの可読性を大幅に向上させ,複数の評価指標にまたがって最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:23:10 GMT)
Mathematical Reasoning for Unmanned Aerial Vehicles: A RAG-Based Approach for Complex Arithmetic Reasoning [14.7] 自律型UAVは、軌道計画や電力管理といったタスクに対して、信頼性の高い数学的推論を必要とする。
本稿では,複数の大規模言語モデル (LLM) の数学的推論を改善するために,UAV固有の文脈下での検索拡張生成フレームワークであるRAG-UAVを提案する。
実験により,検索を組み込むことで解答精度を大幅に向上し(o1で75%まで達成),不正な定式化選択の事例を25%から5%に削減し,数値誤差を低減し,平均二乗誤差(MSE)を最良性能モデルの桁数で低減した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:09:24 GMT)
CheckEmbed: Effective Verification of LLM Solutions to Open-Ended Tasks [14.6] CheckEmbed (CE)は、大規模言語モデル(LLM)の単純でスケーラブルで正確な検証方法である。
CEは、全問合せレベルで、高速でセマンティックにリッチな比較を行い、精度とスケーラビリティの両方において重要な制限を克服します。
実験の結果,CEは閉じたタスクとオープンエンドタスクの両方の幻覚を確実に検出することがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:22:36 GMT)
Is LLM the Silver Bullet to Low-Resource Languages Machine Translation? [14.6] 低リソース言語(LRL)は、言語資源の制限と標準データセットの表現不足により、自然言語処理において重大な課題を呈している。
近年のLarge Language Models (LLMs) とNeural Machine Translationの進歩により、高リソース言語への翻訳機能が大幅に改善されている。
本稿では,200言語における現在のLLMを体系的に評価し,LRL翻訳能力の限界を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:55:07 GMT)
Attack Effect Model based Malicious Behavior Detection [14.4] 従来のセキュリティ検出手法における3つの重要な課題に対処するフレームワークであるFEAD(Focus-Enhanced Detection)を提案する。
本稿では,オンラインアタックレポートからセキュリティクリティカルな監視項目を抽出し,包括的カバレッジを実現するための攻撃モデル駆動アプローチを提案する。
また、FEADは5.4%のオーバーヘッドしか持たない既存のソリューションよりも8.23%高いF1スコアを達成することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:10:58 GMT)
Causal Discovery from Conditionally Stationary Time Series [14.3] 我々は,広範囲の非定常時系列を扱う因果探索手法を開発した。
State-Dependent Causal Inference (SDCI)と名付けられた私たちのアプローチは、根底にある因果関係を回復することができる。
非線形粒子相互作用データと遺伝子制御ネットワークに関する実証実験は、SDCIの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:49:18 GMT)
DSG-World: Learning a 3D Gaussian World Model from Dual State Videos [14.2] 本稿では,Dual Stateの観測から3次元ガウス世界モデルを明示的に構築する,新しいエンドツーエンドフレームワークDSG-Worldを提案する。
提案手法は、二分割対応ガウス場を構築し、双方向の測光および意味的整合性を実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:33:32 GMT)
Self-Predictive Dynamics for Generalization of Vision-based Reinforcement Learning [14.1] 視覚に基づく強化学習は、画像に基づく観察の効率的で堅牢な表現を必要とする。
本研究では,タスク関連特徴を効率的に抽出する自己予測ダイナミクス(SPD)を設計する。
MuJoCo視覚制御タスクと自律運転タスク(CARLA)のセットでは、SPDは複雑な観察において過去の研究よりも優れていた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:36:54 GMT)
Dream to Generalize: Zero-Shot Model-Based Reinforcement Learning for Unseen Visual Distractions [14.1] ゼロショットモデルに基づく強化学習(MBRL)のための新しい自己教師型手法Dream to Generalize(Dr.G)を提案する。
G博士はそのエンコーダと世界モデルを2つのコントラスト学習で訓練し、多視点データ拡張におけるタスク関連特徴を効率的に捉える。
我々はまた、世界モデルが時間構造をよりよく理解するのに役立つリカレント状態逆ダイナミクスモデルも導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:39:03 GMT)
Stable Vision Concept Transformers for Medical Diagnosis [14.1] 概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、モデルの潜在空間を人間に理解できない高レベルな概念に制限することを目的としている。
CBMはモデルの予測を決定するために概念的機能のみに依存している。
既存の手法は、モデルの予測を決定するために概念的特徴のみに依存している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:43:27 GMT)
Privacy Amplification Through Synthetic Data: Insights from Linear Regression [14.0] ランダムな入力から合成データが生成されると、限られた数の合成データポイントが、モデル固有の保証以上のプライバシーを増幅することを示す。
線形回帰に関する我々の発見は、将来的にはより一般的な境界を導出するための基礎となると信じている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:44:15 GMT)
Adaptive Preconditioners Trigger Loss Spikes in Adam [14.0] Adamプリコンディショナーを使用すると、さまざまなアーキテクチャとスケールのニューラルネットワークを横断するトレーニング中に、損失のスパイクが一般的に発生する。
これまでの説明では、これらの現象は損失景観の低損失化特性に起因している。
第二次モーメント推定よりも二乗がかなり小さくなり、後者が$beta$-exponential崩壊する臨界状態を特定する。
この不安定さは勾配と最大固有方向とのアライメントをもたらし、勾配方向の曲率が2/eta$を超えると正確に損失スパイクが発生する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:31:41 GMT)
Diffusion with a Linguistic Compass: Steering the Generation of Clinically Plausible Future sMRI Representations for Early MCI Conversion Prediction [13.9] そこで本研究では,臨床応用可能な将来のsMRI表現を直接ベースラインデータから合成する拡散型フレームワークを提案する。
ADNIとAIBLのコホートの実験では、MCI-Diffは最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:01:05 GMT)
Evaluating Robustness of Deep Reinforcement Learning for Autonomous Surface Vehicle Control in Field Tests [13.9] 種々の摂動下での浮遊廃棄物の回収を目的としたDRLをベースとしたエージェントのレジリエンス評価を行った。
実世界のフィールドテストにおいて,ドメインランダム化を用いてエージェントを訓練し,その性能を評価する。
我々は,DRL ベースの ASV コントローラをデプロイするための効果的なトレーニング戦略,実世界の課題,実践的考察について考察する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:31:07 GMT)
DualX-VSR: Dual Axial Spatial$\times$Temporal Transformer for Real-World Video Super-Resolution without Motion Compensation [13.9] ViTやTimeSformerのようなトランスフォーマーベースのモデルは、時間的依存関係を効果的にモデル化することで、高度なビデオ理解を実現する。
これらのモデルは、実世界の超解像(VSR)に直接適用される
VSRは高いレベルの精度を必要としており、トークン化とシーケンシャルな注意機構によって妥協することができる。
実世界ビデオ解像度(DualX-VSR)のためのAxial Dual Spatial$times$ Transformerを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:53:44 GMT)
Neural MJD: Neural Non-Stationary Merton Jump Diffusion for Time Series Prediction [13.8] 本稿ではニューラルネットワークに基づく非定常メルトン拡散(MJD)モデルであるNeural MJDを紹介する。
我々のモデルは、ポアソン方程式(SDE)シミュレーション問題として予測を明示的に定式化する。
トラクタブルラーニングを実現するため,小さな時間間隔でジャンプ回数を抑える機構を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:23:28 GMT)
Training Dynamics Underlying Language Model Scaling Laws: Loss Deceleration and Zero-Sum Learning [13.8] この研究は、スケーリングが言語モデルをどのように改善するか、特にトレーニングダイナミクスの観点から理解することを目的としている。
学習の早い段階では、言語モデルが損失減少を経験し、損失改善率の急激な低下により、ログ空間における損失曲線の分別線形な挙動がもたらされることが判明した。
ゼロサム学習(ZSL)と呼ばれる訓練力学の種類による損失減少の要因について検討する。
ZSLでは、サンプルごとの勾配が体系的に対立し、サンプルごとの損失の変化に破壊的な干渉をもたらす。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:18:35 GMT)
Communication Efficient Adaptive Model-Driven Quantum Federated Learning [13.8] 巨大なデータセットと多数の参加デバイスを使用したトレーニングは、フェデレートラーニング(FL)のボトルネックにつながる
モデル駆動型量子フェデレーション学習アルゴリズム(mdQFL)を導入し,これらの課題に対処する。
以上の結果から,最終モデルの精度以上を維持しつつ,通信コストの50%近くを削減できることを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:48:00 GMT)
Bandit based Dynamic Candidate Edge Selection in Solving Traveling Salesman Problems [13.6] 旅行セールスマン問題(TSP)に対するLin-Kernighan-Helsgaun(LKH)アルゴリズムのバンディットに基づく手法を提案する。
各イテレーションにおいて最も適したエッジを動的に選択するために、マルチアームのバンディットモデルを組み込むことで、LKHはよりスマートな選択を可能にし、改善されたソリューションへと導くことができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:16:06 GMT)
Gen-n-Val: Agentic Image Data Generation and Validation [13.6] Gen-n-Valは、高品質で単一のオブジェクトマスクと多様なバックグラウンドを生成する新しいエージェントデータ生成フレームワークである。
MosaicFusionのような最先端の合成データアプローチと比較して、我々の手法は無効な合成データを50%から7%に削減する。
Gen-n-Val は YOLO11m を用いたオープン語彙オブジェクト検出ベンチマークにおいて YOLO-Worldv2-M よりも大幅に改善されている(7.1% mAP)。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:52:26 GMT)
Rollout Roulette: A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods [13.6] 大規模言語モデル(LLM)は、モデルのサイズやデータのスケールアップを通じて、大幅なパフォーマンス向上を実現している。
既存の推論時間スケーリング手法は、このタスクを検索問題として捉えており、ハックに報いるには弱い傾向にある。
本稿では,粒子ベースのモンテカルロ法を応用した新しい推論時間スケーリング手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:14:21 GMT)
ADFormer: Aggregation Differential Transformer for Passenger Demand Forecasting [13.6] 本稿では,需要予測促進のための新たな洞察を提供する差分集約変換器(AD)を提案する。
空間的相関を利用して注意を喚起する一方で、空間と時間の性質に基づく集約戦略を設計する。
タクシーと自転車で行った実験は,本モデルの有効性と有効性を確認し,その実用的価値を実証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:54:37 GMT)
Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency [13.6] 主なコントリビューションは、エンフィンプル・ヘッド・トランスフォーマーの即時チューニングであり、エンフィンプル・セルフアテンション層のみである。
そのような最も単純な変換器の迅速なチューニングは、列から列へのリプシッツ関数に対する普遍近似であることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:04:39 GMT)
TALL -- A Trainable Architecture for Enhancing LLM Performance in Low-Resource Languages [13.4] 本稿では,LLMを2つのバイリンガル翻訳モデルに統合したTALL(Trainable Architecture for Enhancing LLM Performance in Low-Resource Languages)を提案する。
ヘブライ語に関する我々の実験は、直接使用、ナイーブ翻訳、微調整アプローチなど、いくつかのベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:02:12 GMT)
Automatic Robustness Stress Testing of LLMs as Mathematical Problem Solvers [13.4] 大規模言語モデル(LLM)は、様々な推論集約的なタスクにおいて優れたパフォーマンスを達成している。
LLMはロバスト性の問題に直面する可能性があり、いくつかの単純な推論タスクで予期せず失敗する。
本稿では,従来の意味を保ちつつも LLM に失敗する可能性のある数学的問題変種を生成するための新しいフレームワークである Automatic Robustness Checker (AR-Checker) を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:42:39 GMT)
Engineering harmonic emission through spatial modulation in a Kitaev chain [13.4] 二重化キタエフ鎖における高調波発生について検討する。
HHG放出スペクトルは3つのセグメントに分類される。
lambdaleq0$ regimeでは、ミドルギャップ状態(MGS)とバルクとのハイブリダイゼーションが観察され、より早く観測されたハーモニックな拡張が抑制される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:12:52 GMT)
OpenGT: A Comprehensive Benchmark For Graph Transformers [13.2] グラフトランスフォーマー(GT)は、最近、様々な領域で顕著なパフォーマンスを示している。
本稿では,グラフトランスフォーマーの総合ベンチマークであるOpenGTを紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:48:46 GMT)
Knockout LLM Assessment: Using Large Language Models for Evaluations through Iterative Pairwise Comparisons [13.2] 大規模言語モデル(LLM)は、様々な領域にわたる効果的な評価指標であることが示されている。
Knockout Assessment, LLM-asa judge method using a knockout tournament system with iterationerative pairwise comparisons。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:01:33 GMT)
Predicting ICU In-Hospital Mortality Using Adaptive Transformer Layer Fusion [13.0] 本稿では,LoRAアダプタと適応層重み付け機構を併用して,BERTバックボーンから意味的特徴を融合するモジュール型アテンションベースアーキテクチャであるALFIAを紹介する。
ALFIAは、厳格なcw-24(CriticalWindow-24)ベンチマークに基づいて、AUPRCの最先端の分類器を上回り、バランスの取れた精度-リコールプロファイルを保存する。
本実験では,ALFIAの早期期成績が良好であることを確認するとともに,日常的な臨床テキストを直接操作することで,リスク階層化や緊急ケア設定への時間的介入に便利な,堅牢なツールを臨床医に提供した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:59:20 GMT)
FedAPM: Federated Learning via ADMM with Partial Model Personalization [12.7] FL(Federated Learning)では、異なるデバイスからのデータセットが独立であり、同じ分散(すなわち、同じ分散)であるという仮定は、ユーザ差によって保持されないことが多い。
本稿では、FedAPMと呼ばれる乗算器の交互方向法(ADMM)に基づくFLフレームワークを提案し、クライアントのドリフトを緩和する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:38:29 GMT)
Degradation-Aware Image Enhancement via Vision-Language Classification [12.7] 本稿では,VLM(Vision-Language Model)を用いて,劣化した画像を予め定義されたカテゴリに自動的に分類するフレームワークを提案する。
VLMは入力画像を、(A)超分解分解(ノイズ、ぼかし、JPEG圧縮を含む)、(B)反射加工品、(C)動きぼかし、(D)見えない劣化の4種類に分類する。
分類されると、カテゴリA、B、Cに割り当てられた画像は、特定の劣化タイプごとに調整された専用モデルを使用して、ターゲットの復元を行う。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:42:01 GMT)
Intelligibility of Text-to-Speech Systems for Mathematical Expressions [12.7] 我々は、MXの様々なカテゴリの聴取および翻訳テストを通じて、5つのTSモデルの品質と信頼性を評価する実験を設計する。
TTSモデルでは直接処理できないため、2つのLarge Language Model (LLM) を用いてMXから英語の発音を生成する。
結果は、MXに対するTSモデルの出力が必ずしも理解不能であるとは限らないことを証明し、TTSモデルとMX間でのインテリジェンスギャップが変化することを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:21:28 GMT)
Authenticated Private Set Intersection: A Merkle Tree-Based Approach for Enhancing Data Integrity [12.6] プライベート・セット・インターセクション(PSI)は、参加者のプライバシーを維持しながら、セット・交差点のセキュアな計算を可能にする。
標準PSIの既存のプロトコルは、悪意のある参加者が追加の交差点情報を抽出できるようなデータ完全性攻撃に弱いままである。
我々はPSIにおけるデータの整合性の定義を提案し、Merkle Treesと最先端の2パーティVolePSIとマルチパーティmPSIプロトコルを統合することにより、2つの認証PSIスキームを構築する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:28:59 GMT)
Reasoning Towards Fairness: Mitigating Bias in Language Models through Reasoning-Guided Fine-Tuning [12.6] モデルの推論能力と公平性との関係について検討する。
より強力な推論能力を持つ大型モデルは、かなり低いステレオタイプバイアスを示す。
本稿では,先進的推論モデルから構造的推論トレースを抽出し,そのような能力を欠いたモデルに注入する手法であるReGiFTを紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:56:19 GMT)
Tech-ASan: Two-stage check for Address Sanitizer [12.5] アドレスサニタイザー(ASan)は、メモリの安全性違反を検出するための鋭い武器である。
ASanは、大規模なソフトウェアテストの効率を制限した、大幅なランタイムオーバーヘッドを発生させる。
Tech-ASanは、安全保証でASanを加速する2段階のチェックベースの技術である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:32:48 GMT)
Collaborative Learning in Agentic Systems: A Collective AI is Greater Than the Sum of Its Parts [12.5] 集合学習(MOSAIC)におけるモジュール共有と構成の導入
MOSAICはエージェントアルゴリズムであり、複数のエージェントが独立して異なるタスクを解くことができる。
一連のRLベンチマークの結果から,MOSAICは孤立学習者よりもサンプル効率が高いことが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:38:11 GMT)
Flattery, Fluff, and Fog: Diagnosing and Mitigating Idiosyncratic Biases in Preference Models [12.4] 言語モデルは、アライメントと評価において人間の嗜好判断のためのプロキシとして機能する。
それらは体系的な誤校正を示し、実質的な品質よりも表面的なパターンを優先する。
このバイアスは長さ、構造、スタイルといった機能への過度な依存として現れ、報酬のハッキングや信頼できない評価といった問題につながります。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:32 GMT)
A Survey on Data Contamination for Large Language Models [12.4] 大規模言語モデル(LLM)は、テキスト生成やコード合成など、様々な分野で大きな進歩を見せている。
データ汚染による性能評価の信頼性は精査されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:49:05 GMT)
Generalizable, real-time neural decoding with hybrid state-space models [12.4] 本稿では、クロスアテンションモジュールによる個別スパイクトークン化と、再帰状態空間モデル(SSM)のバックボーンを組み合わせた、新しいハイブリッドアーキテクチャPOSSMを提案する。
サル運動タスクの皮質内復号におけるPOSSMの復号性能と推論速度を評価し,臨床応用に拡張することを示す。
これらすべてのタスクにおいて、POSSMは、最先端のトランスフォーマーに匹敵する復号精度を推論コストのごく一部で達成している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:57:08 GMT)
Intelligent Channel Allocation for IEEE 802.11be Multi-Link Operation: When MAB Meets LLM [12.4] WiFi 7ではマルチリンク操作(MLO)が導入されている。
MLOは、特に高密度ネットワーク環境において、チャネル割り当てにおいて重要な課題を示す。
本稿では,MLO機能を有する高密度Wi-Fi7ネットワークにおける動的チャネル割り当て問題に対処する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:19:57 GMT)
Point Cloud Segmentation of Agricultural Vehicles using 3D Gaussian Splatting [12.3] この研究は、現実的な合成データを生成するための新しいパイプラインを導入することを目的としている。
我々はジェネリックモデルではなく、複数の農業車両の3D資産を生成する。
我々は、合成データのみをトレーニングし、検証することにより、PointNet++、Point Transformer V3、OACNNなどのセグメンテーションモデルに対する合成データの影響を評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:19:27 GMT)
Semi-Implicit Variational Inference via Kernelized Path Gradient Descent [12.3] Kullback-Leibler分散を用いたトレーニングは、高次元設定における高分散とバイアスのために難しい場合がある。
非パラメトリックな平滑化によるトレーニングを安定化するカーネル化されたKL分散推定器を提案する。
関数空間における我々の手法のバイアスは良性であり、より安定で効率的な最適化をもたらす。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:34:37 GMT)
Joint Evaluation of Answer and Reasoning Consistency for Hallucination Detection in Large Reasoning Models [12.3] トレースの推論は冗長あるいは論理的に矛盾する可能性があるため、新しい幻覚の源となる。
既存の幻覚検出法は主に回答レベルの不確実性に焦点を当てている。
LRMにおける幻覚検出に適した新しいフレームワークであるRASを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:54:04 GMT)
ValueSim: Generating Backstories to Model Individual Value Systems [12.2] 本稿では,個人バックストリーの生成を通じて個々の価値をシミュレートするフレームワークであるValueSimを紹介する。
World Values Surveyから派生した自己構築型ベンチマークでValueSimをテストすると、トップ1の精度が10%以上向上していることがわかる。
さらなる分析により、ユーザーインタラクション履歴の追加が利用可能になると、パフォーマンスが向上し、モデルがペルソナシミュレーション機能を時間とともに改善できることが示される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:41:26 GMT)
Investigating Distributions of Telecom Adapted Sentence Embeddings for Document Retrieval [12.1] 公開可能なモデルとドメイン適応型から得られた埋め込みを評価した。
我々は,異なる埋め込みに対する類似度スコアのしきい値を得るための体系的手法を確立する。
ドメイン固有の文に対する埋め込みは、ドメインに依存しない文とほとんど重複しないことを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:18:14 GMT)
Better Pseudo-labeling with Multi-ASR Fusion and Error Correction by SpeechLLM [12.0] 本稿では,テキストおよび音声に基づく大規模言語モデルによる後処理を用いたマルチASRプロンプト駆動フレームワークを提案する。
従来の方法と比較して,転写精度が大幅に向上した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:35:53 GMT)
Goal-Oriented Time-Series Forecasting: Foundation Framework Design [12.0] 時系列予測は、しばしば、現実のアプリケーションの特定の要求を無視して、予測エラーを最小限にすることだけに焦点を当てる。
本稿では、エンドアプリケーションで特定される予測範囲の重要性に基づいて、予測モデルがフォーカスを動的に調整できる新しいトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:31:17 GMT)
OpenRR-5k: A Large-Scale Benchmark for Reflection Removal in the Wild [11.9] SIRR(Single Image Reflectionectomy)のための新しいベンチマークを提案する。
我々は,5,300画素の高画質な画像対を含む大規模データセットを開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:03:39 GMT)
Simulating LLM-to-LLM Tutoring for Multilingual Math Feedback [11.9] 大規模言語モデル(LLM)を用いた多言語チューター-学生間相互作用の大規模シミュレーションについて述べる。
より強いモデルは教師の役割を担い、ヒントの形でフィードバックを生成し、弱いモデルは生徒をシミュレートする。
本研究では,学生の入力言語,教師のフィードバック言語,モデル選択,言語資源レベルがパフォーマンスにどのように影響するかを検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:53:04 GMT)
Done Is Better than Perfect: Unlocking Efficient Reasoning by Structured Multi-Turn Decomposition [11.9] 大共振モデル (LRM) は、最終解を導出する長大なチェーン・オブ・ソート (CoT) に対して批判される。
本稿では,Multi-Turn Decomposition (MinD)を導入し,従来のCoTを明示的,構造化的,ターンワイドなインタラクションのシーケンスにデコードする。
MinDは、出力トークンの使用量と最初のトークンの時間(TTFT)の両方を最大70%削減することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:15:25 GMT)
From Benign import Toxic: Jailbreaking the Language Model via Adversarial Metaphors [11.8] 本稿では,AdVersArial meTAphoR(AVATAR)を利用して大規模言語モデルを誘導し,脱獄の悪質な隠喩を校正する新たな攻撃フレームワークを提案する。
AVATARは脱獄性LDMを効果的かつ効果的に導入できることを示す実験結果が得られた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:10:34 GMT)
SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping [11.7] 本研究では,単一視界から透明物体とスペキュラ物体をロボットで把握することのできる,学習自由フレームワークSR3Dを提案する。
具体的には、単一のビューRGBと深度画像が与えられた場合、SR3Dはまず外部視覚モデルを使用して3D再構成されたオブジェクトメッシュを生成する。
そして、鍵となるアイデアは、3Dオブジェクトのポーズとスケールを決定し、再構成されたオブジェクトを元の奥行き劣化した3Dシーンに正確にローカライズすることだ。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:36:46 GMT)
Self-Supervised Learning for Text Recognition: A Critical Survey [11.6] テキスト認識(英語: Text Recognition, TR)とは、画像からテキスト情報を取得することに焦点を当てた研究領域である。
ディープニューラルネットワーク(DNN)のトレーニングにラベルなしデータの大規模なデータセットを活用することで、自己監視学習(SSL)が注目されている。
本稿では,TR分野におけるSSLの利用を集約し,その技術の現状を概観する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:49:26 GMT)
Does It Make Sense to Speak of Introspection in Large Language Models? [11.6] 我々は,大規模言語モデルから明らかな内省的自己報告の2つの事例を提示し,批判する。
人間では、そのような報告はイントロスペクション(introspection)の学部によるものとされ、通常は意識と結びついている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:13:54 GMT)
Knowledge Retention for Continual Model-Based Reinforcement Learning [11.6] DRAGOは連続モデルに基づく強化学習のための新しいアプローチである。
DRAGOは、Synthetic Experience RehearsalとRe Get Memories Through Explorationの2つの重要なコンポーネントで構成されている。
実証的な評価は、DRAGOがタスク間の知識を保存でき、様々な連続学習シナリオにおいて優れたパフォーマンスを達成できることを示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:54:12 GMT)
LLM-based phoneme-to-grapheme for phoneme-based speech recognition [11.6] 音素自動音声認識(ASR)のための音素間符号化(LLM-P2G)を提案する。
実験の結果, LLM-P2G はポーランド語とドイツ語の交叉型 ASR において, WER の相対減少率 3.6% と 6.9% でWFST 系よりも優れていた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:35:55 GMT)
Ignoring Directionality Leads to Compromised Graph Neural Network Explanations [11.5] 方向性のセマンティクスを保存することは、説明の質を著しく向上させる。
これらの知見は、セキュリティクリティカルなアプリケーションにおいて、方向性を意識したGNN説明可能性の必要性を強調している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:52:18 GMT)
Better Semi-supervised Learning for Multi-domain ASR Through Incremental Retraining and Data Filtering [11.5] ラベル付きデータが不足している場合、特定のドメインに対する微調整済みのASRモデルは困難である。
本稿では,小さなドメイン内ラベル付きデータセットと,密接に関連するドメインからの補助データセットを統合した,段階的な半教師付き学習パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:53:20 GMT)
BevSplat: Resolving Height Ambiguity via Feature-Based Gaussian Primitives for Weakly-Supervised Cross-View Localization [11.5] 本稿では、弱教師付きクロスビューローカライゼーションの問題に対処する。
目的は、ノイズの多い地上の真実の注釈で衛星画像に対する地上カメラのポーズを推定することである。
特徴に基づくガウス的プリミティブを用いて高さのあいまいさを解決する新しい手法であるBevSplatを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:28:06 GMT)
Uncertainty-Based Extensible Codebook for Discrete Federated Learning in Heterogeneous Data Silos [11.4] 巨大な分散データセットを活用することを目的としたフェデレーション学習は、さまざまなサイロにまたがるデータの均一性という、重要な課題に直面している。
本稿では,emphUncertainty-Based Extensible-Codebook Federated Learning (UEFL)と呼ばれる,革新的で簡単な反復型フレームワークを提案する。
このフレームワークは遅延特徴をトレーニング可能な離散ベクトルに動的にマッピングし、不確実性を評価し、特に不確実性を示すサイロの離散化辞書やコードブックを拡張する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:46:31 GMT)
MokA: Multimodal Low-Rank Adaptation for MLLMs [11.4] マルチモーダル低ランク適応(MokA)は、マルチモーダル対応の効率的な微調整戦略である。
MokAは、モダリティ固有のパラメータによって一様情報を圧縮し、クロスモーダル相互作用を明示的に強化する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:04:08 GMT)
A Smooth Sea Never Made a Skilled $\texttt{SAILOR}$: Robust Imitation via Learning to Search [11.2] 行動クローニング(BC)は、専門家が訪れた州で行ったことをエージェントに教える。
これは、BCエージェントがデモの支持から外す誤りを犯す場合、彼らはそれを回復する方法を知らないことが多いことを意味します。
これに対し,専門家による実証からL2S(Learning to Search)を学習すること,すなわち,テスト時に専門家の成果にマッチするために必要なコンポーネントを学習することを検討する。
texttSAILOR$は、同じデータでBC経由でトレーニングされた最先端の拡散ポリシーを一貫して上回る
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:47:40 GMT)
DIMCIM: A Quantitative Evaluation Framework for Default-mode Diversity and Generalization in Text-to-Image Generative Models [11.1] 我々は、デフォルトモードの多様性を基準無しで測定するDod-it/Can-itフレームワーク、DIM-CIMを紹介する。
1.5Bから8.1Bパラメータへのスケーリングでは,既定モードの多様性を犠牲にして,広く使用されているモデルが一般化されることがわかった。
また、DIMCIMを用いて、T2Iモデルのトレーニングデータを評価し、トレーニング画像の多様性とデフォルトモードの多様性との相関関係を0.85で観測する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:53:34 GMT)
Conformal Prediction Adaptive to Unknown Subpopulation Shifts [11.0] コンフォーマル予測は、形式的カバレッジ保証を享受する不確実な定量化を備えたブラックボックス機械学習モデルに広く用いられる。
本研究では,テスト環境がキャリブレーションデータと比較して未知かつ異なるサブポピュレーションの混合を示すサブポピュレーションシフトに対処する。
本研究では,このような変化に対する適応予測を適切に適用し,人口構造に関する明示的な知識を必要とせず,有効なカバレッジを確保する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:58:39 GMT)
Prompting LLMs: Length Control for Isometric Machine Translation [11.0] 本稿では,異なるプロンプト戦略,いくつかの例のバリエーション,および実演選択が翻訳品質と長さ制御に与える影響について検討する。
提案手法では,提案する実演の特徴に則った指示文の表現が,出力長の制御において重要な役割を担っていることがわかった。
複数の出力を考慮すると、長さと品質の全体的なトレードオフが顕著に改善され、いくつかの言語ペアの最先端のパフォーマンスが得られる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:24:08 GMT)
MockConf: A Student Interpretation Dataset: Analysis, Word- and Span-level Alignment and Baselines [11.0] 学生のカリキュラムの一部として実施されているモック会議から収集したデータセットであるモックコンファレンスを紹介する。
このデータセットには、ヨーロッパ5カ国語で7時間の録音が含まれており、スパンと単語のレベルで書き起こされ調整されている。
我々はまた、同時解釈の整合に適した長文入力のパラレルワードとスパンアノテーションのためのモダンなWebベースのアノテーションツールInterAlignを実装し、リリースする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:16:15 GMT)
Calibrating Translation Decoding with Quality Estimation on LLMs [11.0] 本稿では,分布から見た翻訳品質を考慮した仮説のキャリブレーション手法を提案する。
本手法では,大規模言語モデル (LLM) の翻訳は,限られた訓練後に大幅に改善される。
結果として得られた最先端の翻訳モデルは、付随するコードと人間の評価データとともに、10の言語をカバーする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:33:42 GMT)
When can in-context learning generalize out of task distribution? [11.0] In-context Learning (ICL) は、モデルが数例しか見ていないタスクに一般化できる事前訓練されたトランスフォーマーの能力である。
我々はICLの事前学習に必要となる条件を実験的に検討し,その展開と分布の一般化について検討した。
タスクの多様性が増大するにつれて、トランスフォーマーは、事前学習タスク分布内でのみICLを示す特殊な解から、タスク空間全体への分布から一般化する解へと移行する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:30:50 GMT)
IYKYK: Using language models to decode extremist cryptolects [11.0] エクストリーム派グループは、外部者を排除したり誤解させたりするために、複雑なイングループ言語(クリプトレクトとも呼ばれる)を開発する。
本稿では,2つのオンライン過激派プラットフォームの暗号を検出・解釈する現在の言語技術の能力について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:38:53 GMT)
Uniform convergence of the smooth calibration error and its relationship with functional gradient [10.9] この研究は滑らかな校正誤差(CE)に焦点を当て、一様収束境界を提供する。
我々は3つの代表的なアルゴリズムを解析する: 勾配の押し上げ木、カーネルの押し上げ、2層ニューラルネットワーク。
この結果は,信頼性のある確率モデルを設計するための新たな理論的洞察と実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:31:45 GMT)
Multi-granularity Knowledge Transfer for Continual Reinforcement Learning [10.9] 連続強化学習(CRL)は、RLエージェントに一連のタスクを学習する能力を与える。
既存の手法は、しばしば類似のタスク間できめ細かい知識の伝達に重点を置いている。
本稿では,大きめの知識伝達を促進するためのMT-Coreという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:52:51 GMT)
Prefix Grouper: Efficient GRPO Training through Shared-Prefix Forward [10.6] 提案するPrefix Grouperは,より効率的なGRPO学習アルゴリズムであり,Shared-Prefix Forward戦略を用いて冗長なプレフィックスを除去する。
自己注意を2つの部分に再構成することで、共有プレフィックスを1回だけエンコードすることが可能となる。
我々は、Prefix Grouperが標準GRPOと同等のトレーニングであるという理論的および実証的な証拠を提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:13:37 GMT)
Psi-Sampler: Initial Particle Sampling for SMC-Based Inference-Time Reward Alignment in Score Models [10.5] $Psi$-Samplerは、pCNLベースの初期粒子サンプリングを組み込んだSMCベースのフレームワークである。
スコアベース生成モデルとの推論時間報酬アライメントは、大きな注目を集めている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:50:56 GMT)
Timing is Important: Risk-aware Fund Allocation based on Time-Series Forecasting [10.5] 我々は、資金配分の問題を解決するために、リスク対応の時系列予測(RTS-PnO)フレームワークを導入する。
このフレームワークには, 目標アライメント測定によるエンドツーエンドトレーニング, (ii) 適応予測の不確実性校正, (iii) 予測モデルに非依存な3つの特徴がある。
RTS-PnOの評価はオンラインとオフラインの両方の実験で行われている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:57:09 GMT)
Breaking the Cloak! Unveiling Chinese Cloaked Toxicity with Homophone Graph and Toxic Lexicon [10.5] ソーシャルメディアプラットフォームは、虐待的な言葉や差別的な発言など、有毒なコンテンツの著しい増加を経験している。
既存の方法はほとんどが英語のテキスト用に設計されているが、中国のクロークによる毒性の暴露はまだ解決されていない。
C$2$TUは,中国における有毒物公開のための新規なトレーニングフリーかつプロンプトフリーな方法である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:47:25 GMT)
Fool the Stoplight: Realistic Adversarial Patch Attacks on Traffic Light Detectors [10.5] この研究は、信号検出用のCNNをプリントパッチで攻撃する方法を示している。
本稿では,信号機の各インスタンスにパッチを貼って攻撃する脅威モデルを提案し,トレーニング戦略について述べる。
実験では,現実的なレッド・ツー・グリーン・ラベル・フリップ攻撃とピクトグラム分類に対する攻撃を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:41:12 GMT)
ODE-GS: Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting [10.5] ODE-GSは、動的3次元シーンを予測するために、3次元ガウス格子と潜時神経常微分方程式(ODE)を統一する新しい手法である。
以上の結果から, 連続潜時ダイナミクスは複雑な3次元シーンの予測に強力で実用的な方法であることが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:02:30 GMT)
Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting [10.5] 本稿では,外見符号と二元格子を統一する多スケール二元格子を提案する。
本手法は動的に分離された自律走行シーン再構築における幾何的精度を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:33:41 GMT)
Rethinking LLM Advancement: Compute-Dependent and Independent Paths to Progress [10.5] 本研究は,大規模言語モデルが,計算制約環境におけるアルゴリズム的革新によって進展するか否かを評価する。
本稿では,計算に依存しないイノベーションから高い計算量で不均質な利益をもたらす計算依存のイノベーションを区別する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:09:08 GMT)
TaDA: Training-free recipe for Decoding with Adaptive KV Cache Compression and Mean-centering [10.4] 量子化精度の高いKVキャッシュ圧縮のためのトレーニング不要なレシピであるTaDAを紹介する。
提案手法は,様々なコンテキスト長をサポートする複数のモデルに対して,大幅な精度向上を実現する。
本手法は,言語モデルにおけるスケーラブルで高性能な推論手法である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:23:38 GMT)
Rethinking the Stability-Plasticity Trade-off in Continual Learning from an Architectural Perspective [10.2] 本稿では,継続学習のためのプラグインコンポーネントとして機能するDual-Archという新しいフレームワークを紹介する。
本論文では,Dual-Archが既存のCL法の性能を向上させるとともに,パラメータの最大87%がコンパクトであることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:59:39 GMT)
Towards Better Generalization via Distributional Input Projection Network [10.1] 本稿では,各層で学習可能な分布に入力を投影する新しいフレームワークDIPNetを紹介する。
DIPNetは局所的滑らか度測定とネットワークのリプシッツ定数の両方を低減し,一般化性能の向上に寄与することを示す。
提案手法は既存のモデルにシームレスに組み込むことができ、現代のディープラーニングにおける一般化性能を高めるための汎用的で効果的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:13:59 GMT)
Theoretical Analysis of Positional Encodings in Transformer Models: Impact on Expressiveness and Generalization [10.0] 位置エンコーディングはトランスフォーマーベースのモデルの中核部分である。
本稿では, 様々な位置符号化手法がトランスフォーマーの表現性, 一般化能力, より長いシーケンスに対する外挿にどのように影響するかを解析する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:02:18 GMT)
NorEval: A Norwegian Language Understanding and Generation Evaluation Benchmark [10.0] NorEvalは、24の高品質な人間生成データセットで構成されている。
ノルウェー語の理解と生成を対象とするタスクカテゴリの幅広い範囲をカバーする。
ノルウェー語の公式標準であるボクマール語とニノルスク語の両方に焦点を当てている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:51:26 GMT)
Towards Reasonable Concept Bottleneck Models [9.9] CREAMはConcept Bottleneck Models(CBM)の新しいファミリーである
CBMは概念概念(texttC-C$)と概念タスク(texttC$rightarrow$Y$)の関係を明示的にエンコードし、望ましいモデル推論を強制する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:22:29 GMT)
Static Word Embeddings for Sentence Semantic Representation [9.9] 文意味表現に最適化された静的単語埋め込みを提案する。
まず、事前学習した文変換器から単語埋め込みを抽出し、文レベルの主成分分析により改善する。
推論では,単語の埋め込みを単純に平均化することで文を表現するが,計算コストは少ない。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:33:10 GMT)
PUB: An LLM-Enhanced Personality-Driven User Behaviour Simulator for Recommender System Evaluation [9.8] Personality-driven User Behaviour Simulator (PUB)は、パーソナライズされたユーザの振る舞いをモデル化するために、Big Fiveのパーソナリティ特性を統合している。
PUBは、行動ログ(例えば、評価、レビュー)とアイテムメタデータからユーザーの個性を動的に推論し、その後、実際のデータに対する統計的忠実性を保存するための合成相互作用を生成する。
Amazonレビューデータセットの実験では、PUBが生成したログは実際のユーザの行動と密接に一致し、パーソナリティ特性とレコメンデーション結果の間に有意義な関連性を明らかにする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:57:36 GMT)
Improving Neural Diarization through Speaker Attribute Attractors and Local Dependency Modeling [9.8] 話者ダイアリゼーションは、マルチトーカー録音における話者のセグメンテーションと識別を含む。
EDAは、可変話者数を扱うとともに、トレーニング中のネットワークのガイドを改善するために提案されている。
本研究では,直接話者モデルを超えて,より詳細な話者属性を表現することに集中することで,アトラクタパラダイムを拡張した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:12:14 GMT)
The Oversmoothing Fallacy: A Misguided Narrative in GNN Research [9.7] ディープグラフニューラルネットワーク(GNN)構築の主な障害として、オーバースムーシングが認識されている。
本稿では, 過密化の影響が過大評価され, 深層GNNアーキテクチャのさらなる探索を提唱している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:49:12 GMT)
Scalable First-order Method for Certifying Optimal k-Sparse GLMs [9.6] そこで本研究では,BnBフレームワークの視点緩和を解くために,一階近位勾配アルゴリズムを提案する。
提案手法は双有界計算を著しく高速化し,大規模問題に対する最適性証明の提供に極めて有効であることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:08:53 GMT)
Adapt before Continual Learning [9.5] 我々は,既存のCLアプローチで各タスクを学習する前に,プラグイン・アンド・プレイ適応フェーズを通じてPTMのバックボーンを洗練する新しいフレームワークであるコアCLプロセス(ACL)の前に,PTMを適応させることを提案する。
ACLは、埋め込みを元のクラスプロトタイプと整列させ、他のクラスと距離を置き、理論上、実験的に安定性と可塑性のバランスを保ち、可塑性を高める。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:01:57 GMT)
Do Large Language Models Judge Error Severity Like Humans? [9.4] 人間は異なるエラータイプに様々な重大度を割り当てる。
視覚的コンテキストは、色と型エラーに対する認識の重大さを著しく増幅する。
大きな言語モデルは、性別エラーに低いスコアを割り当てるが、色エラーには不当に高いスコアを割り当てる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:24:33 GMT)
Grapheme-Coherent Phonemic and Prosodic Annotation of Speech by Implicit and Explicit Grapheme Conditioning [9.4] 本稿では,グラテムに忠実な音声の音素ラベルと韻律ラベルを得るモデルを提案する。
実験の結果,提案手法はグラフエムと予測ラベルとの整合性を著しく改善した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:24:00 GMT)
A Practitioner's Guide to Building ASR Models for Low-Resource Languages: A Case Study on Scottish Gaelic [9.4] 低リソース言語のためのASRシステムの開発における効果的なアプローチは、既存の多言語のエンドツーエンドモデルを微調整することである。
本稿では,ハイブリッドHMMと自己教師付きモデルを組み合わせることで,限られたトレーニングデータによる大幅な性能向上が期待できることを示す。
We benchmark our approach on Scottish Gaelic, achieve WER reductions 32% relative of our best fine-tuned Whisper model。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:52:08 GMT)
Intentionally Unintentional: GenAI Exceptionalism and the First Amendment [9.3] 本稿では,大規模な生成AIモデルからの出力に対して,裁判所が修正第一条の保護を与えるべきだという仮定に異議を唱える。
これらのモデルには意図性がないため、確立された法律上の前例の文脈で理解されているように、そのアウトプットはスピーチを構成することができない、と我々は主張する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:26:32 GMT)
Reason-to-Recommend: Using Interaction-of-Thought Reasoning to Enhance LLM Recommendation [9.3] $textbfR2Rec$は推論強化レコメンデーションフレームワークである。
ユーザアイコングラフからインタラクションチェーンをサンプリングし、それらを構造化されたインタラクション・オブ・思想に変換する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:16:44 GMT)
Fokker-Planck to Callan-Symanzik: evolution of weight matrices under training [9.3] 本稿では,Fokker-Planckを用いて,単純な2-bottleneck層自動エンコーダのボトルネック層における個々の重み行列の確率密度進化をシミュレートする。
また、カルン=シマンツィクやカルダル=パリ=チャン方程式のような物理的に関係のある偏微分方程式は、我々が持つ力学方程式から導出する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:28:30 GMT)
An Efficient Task-Oriented Dialogue Policy: Evolutionary Reinforcement Learning Injected by Elite Individuals [9.1] 進化的アルゴリズム(EA)は、人口多様性を維持することにより、ニューラルネットワークの解空間を効果的に探索することが証明されている。
そこで我々は,EAの探索効率を高めるために,集団に最適な個人を適応的に導入することで,エリート個人注入機構を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:09:38 GMT)
Beyond the Protocol: Unveiling Attack Vectors in the Model Context Protocol Ecosystem [9.1] Model Context Protocol(MCP)は、LLM(Large Language Model)アプリケーションと外部ツールやリソースとのシームレスな相互作用を可能にするために設計された新しい標準である。
本稿では,MPPエコシステムを対象とした攻撃ベクトルに関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:22:09 GMT)
When Thinking LLMs Lie: Unveiling the Strategic Deception in Representations of Reasoning Models [9.1] 大規模言語モデル(LLM)における戦略的偽造について研究する。
我々は、CoT対応LLMにおいて、そのような偽造を誘導し、検出し、制御する。
明示的なプロンプトを伴わずに、文脈に適した詐欺を誘発する成功率を40%達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:44:19 GMT)
Regularized KL-Divergence for Well-Defined Function-Space Variational Inference in Bayesian neural networks [9.0] 後続の不確実性推定は事前の選択に依存しており、重み空間における情報的事前の発見は困難であることが証明されている。
これは、重みではなく、BNNが生成する関数に直接先行する変動推論(VI)手法を動機付けている。
提案手法は, 合成および小型実世界のデータセットに先立って, GPによって規定される特性を組み込んだものである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:05:59 GMT)
LGM-Pose: A Lightweight Global Modeling Network for Real-time Human Pose Estimation [9.0] これらの課題に対処するために,シングルブランチ軽量グローバルモデリングネットワーク (LGM-Pose) が提案されている。
このネットワークでは、軽量なMobileViMブロックが、LARM(Lightweight Attentional Representation Module)として提案されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:29:04 GMT)
Distributional Matrix Completion via Nearest Neighbors in the Wasserstein Space [9.0] わずかに観察された経験的分布の行列を考えると、観測された行列と観測されていない行列の両方に関連する真の分布をインプットしようと試みる。
最適輸送のツールを用いて、最も近い隣人法を分布設定に一般化する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:51:35 GMT)
The Jacobi Factoring Circuit: Quantum Factoring with Near-Linear Gates and Sublinear Space and Depth [8.9] 本稿では,整数のクラスを分解する小型量子回路を提案する。
P2 Q$ の形の $n$-bit 整数を $log Q = Theta(na)$ for $a in (2/3, 1) とする。
我々の回路は、Li, Peng, Du, Suter (Nature Scientific Reports 2012) によって発見された平方自由分解のための量子アルゴリズムに基づいており、これは量子重ね合わせにおけるヤコビ記号の計算に依存している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:35:58 GMT)
FOLIAGE: Towards Physical Intelligence World Models Via Unbounded Surface Evolution [8.9] 本稿では,物理インフォームド・マルチモーダル世界モデルFOLIAGEを提案する。
Action-Perceptionループでは、統合コンテキストがイメージ、メッシュ接続、ポイントクラウドを共有潜在状態にマップする。
物理制御アクションを条件とした物理認識予測器は、この潜伏状態に時間をかけて、表面の目標潜伏状態と整合する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:00:09 GMT)
Seamless Dysfluent Speech Text Alignment for Disordered Speech Analysis [8.6] 本稿では,難読テキストと音声テキストアライメントのための新しいアプローチであるNeural LCSを提案する。
提案手法を大規模シミュレーションデータセット上で評価する。
以上の結果から,音声障害の診断・解析の自動化システムを強化するニューラルLCSの可能性が示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:06:37 GMT)
From Developer Pairs to AI Copilots: A Comparative Study on Knowledge Transfer [8.6] AIコーディングアシスタントの台頭により、開発者は人間のパートナーだけでなく、AIペアプログラマーとも仕事をするようになる。
人・人・AI設定の知識伝達を解析するために,実験的検討を行った。
同様の頻度で知識伝達が成功し、両方の設定で話題カテゴリーが重複していることがわかりました。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:13:30 GMT)
Simultaneous Task Allocation and Planning for Multi-Robots under Hierarchical Temporal Logic Specifications [8.5] 有限トレース (LTL$_f$) 上で広く使用される仕様型の階層構造を導入する。
HLTL$_f$と呼ばれる結果の言語は、構文とセマンティクスの両方で定義される。
また,マルチロボットシステムの設計計画を合成するための検索ベースアプローチも開発している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:23:46 GMT)
UniMate: A Unified Model for Mechanical Metamaterial Generation, Property Prediction, and Condition Confirmation [8.5] メカニカルメタマテリアルデザインでは、典型的には3つの重要なモダリティ、すなわち3次元トポロジー、密度条件、機械的特性が関係している。
モーダルアライメントモジュールと相乗拡散生成モジュールからなる統一モデルUNIMATEを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:05:09 GMT)
David and Goliath: Small One-step Model Beats Large Diffusion with Score Post-training [8.4] Diff-Instruct* (DI*) は1ステップのテキスト・ツー・イメージ生成モデルのためのデータ効率のよいポストトレーニング手法である。
提案手法は,人的フィードバックからオンライン強化学習としてアライメントを行う。
我々の2.6B emphDI*-SDXL-1stepモデルは、50ステップのFLUX-devモデルより優れている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:11:49 GMT)
Blink of an eye: a simple theory for feature localization in generative models [8.3] 大型の言語モデルでは、目が瞬く間に予期せぬ振る舞いを見せることができる。
この現象は自己回帰モデルに特有のものではない。
我々はこの現象を説明するための単純で統一的な理論を開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:55:06 GMT)
Using In-Context Learning for Automatic Defect Labelling of Display Manufacturing Data [8.2] 本稿では,ディスプレイパネル欠陥検出のためのAIを用いた自動ラベルシステムを提案する。
我々は、いくつかのドメイン固有のトレーニング技術を用いて、SegGPTアーキテクチャを採用し、拡張する。
本稿では,ラベリングプロセスの合理化のために,スクリブルベースのアノテーション機構を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:42:31 GMT)
Text-to-CAD Generation Through Infusing Visual Feedback in Large Language Models [8.2] 本稿では,Large Language Models (LLM) をバックボーンとして使用するフレームワークであるCADFusionを紹介する。
CADFusionは質的にも定量的にも性能を著しく向上することを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:25:25 GMT)
Causal Policy Learning in Reinforcement Learning: Backdoor-Adjusted Soft Actor-Critic [8.2] DoSACは、因果介入推定によって隠れたコンバウンディングを補正するSACアルゴリズムの原則拡張である。
DoSACは、真の共同創設者や因果ラベルへのアクセスを必要とせずに介入ポリシーを見積もる。
整合した設定の下では、堅牢性、一般化、およびポリシーの信頼性を改善したベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:52:38 GMT)
Can Foundation Models Generalise the Presentation Attack Detection Capabilities on ID Cards? [8.2] 巨大なデータセットでトレーニングされたファンデーションモデル(FM)は、一般化機能の改善に役立つ。
チリのIDに基づく1つのプライベートデータセットと、フィンランド、スペイン、スロバキアの3つのID国に基づく1つのオープンセット。
以上の結果から,ボナファイド画像が一般化の鍵であることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:24:11 GMT)
Combinatorial Reinforcement Learning with Preference Feedback [8.1] そこでは,学習エージェントが順次,複数の項目をユーザへ割り当てるアクションを提示する,優先的なフィードバックによる強化学習を検討する。
本枠組みは,(1)各項目の未知の値,(2)選択性を維持しながら楽観性を確保することの難しさ,の2つの課題に直面する。
本稿では,これらの課題に対処し,統計的に効率的なアルゴリズムMNL-VQLを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:30:34 GMT)
Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis [8.1] 病理基盤モデル(PFM)は、スライド画像全体(WSI)を解析するための強力なツールとして登場した。
TAPFMは、特徴表現と注目重みの両方を最適化しながら、MILアグリゲーションに視覚変換器(ヴィット)アテンションを使用する。
膀胱癌および肺腺癌に対する突然変異予測タスクの評価。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:56:45 GMT)
Firm or Fickle? Evaluating Large Language Models Consistency in Sequential Interactions [8.1] 大きな言語モデル(LLM)は、様々なタスクにまたがって顕著な機能を示している。
ハイテイクなドメインへのデプロイメントには、複数ラウンドにわたるユーザインタラクションの一貫性と一貫性を備えた動作が必要です。
本稿では,LLM応答整合性の評価と改善のための総合的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:39:20 GMT)
TabFlex: Scaling Tabular Learning to Millions with Linear Attention [8.0] TabPFNのような最近の進歩は、小規模データセットでは優れているが、大規模で複雑なデータセットではスケールが困難である。
本研究は,線形アテンション機構を組み込むことで,大規模データセットに対するTabPFNの効率性とスケーラビリティを向上させる。
私たちのモデルであるTabFlexは、数千のフィーチャと数百のクラスを持つ表データセットを効率的に処理し、数百万のサンプルにシームレスにスケーリングします。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:59:33 GMT)
Learning pure quantum states (almost) without regret [8.0] 本研究は,試料に最小限の歪みを有する試料-最適量子状態トモグラフィーの研究である。
サンプルの逐次測定によって量子状態の正確な記述を効率よく学べると同時に、サンプルの計測後の状態が最小限の摂動しか持たないことを確かめることができるか?
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:09:29 GMT)
UniPTMs: The First Unified Multi-type PTM Site Prediction Model via Master-Slave Architecture-Based Multi-Stage Fusion Strategy and Hierarchical Contrastive Loss [7.9] 本研究は,マルチタイプPTM予測のための最初の統一フレームワークであるUniPTMを提案する。
UniPTMは最先端モデルの大幅な性能向上を示す。
モデル複雑性と性能のバランスをとるために、UniPTMs-miniという軽量版も開発しました。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:02:43 GMT)
Augmented Invertible Koopman Autoencoder for long-term time series forecasting [7.9] そこで我々は,Augmented Invertible Koopman AutoEncoder (AIKAE) を神経オートエンコーダに基づく新しい実装として提案する。
本稿では,衛星画像時系列の長期時系列予測実験によるAIKAEの関連性を示すとともに,大局的な見返り窓に基づく予測を含むベンチマークを行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:23:32 GMT)
Conservative classifiers do consistently well with improving agents: characterizing statistical and online learning [7.9] 複数の新しい軸にまたがる改良を施したいわゆる学習性の特徴付けを行う。
より困難な環境での学習方法を示し、よく研究された有界雑音モデルの下で、より低い一般化誤差を達成する。
我々は、適切な学習と不適切な学習の両方のために、Attiasらによって提起されたオープンな質問を解決する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:13:59 GMT)
SuperMapNet for Long-Range and High-Accuracy Vectorized HD Map Construction [7.8] 長距離および高精度なベクトル化HDマップ構築のためのSuperMapNetを提案する。
入力にはカメライメージとLiDARポイントクラウドの両方を使用し、最初にカメライメージからのセマンティック情報とLiDARポイントクラウドからの幾何学的情報とを密に結合する。
nuScenesとArgoverse2データセットの実験では、SOTAが14.9/8.8 mAPと18.5/3.1 mAPを超え、ハード/イージーな設定で優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:19:22 GMT)
Explainable Concept Generation through Vision-Language Preference Learning for Understanding Neural Networks' Internal Representations [7.7] 概念に基づく手法は、ディープニューラルネットワークをポストホックで説明するのに一般的な選択肢となっている。
視覚言語生成モデルを微調整する強化学習に基づく選好最適化アルゴリズムを考案する。
提案手法は,多様な概念を効率的にかつ確実に表現する能力を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:54:01 GMT)
EX-4D: EXtreme Viewpoint 4D Video Synthesis via Depth Watertight Mesh [7.7] EX-4DはDepth Watertight Mesh表現を通じてこれらの課題に対処する新しいフレームワークである。
この表現は、可視領域と隠蔽領域の両方を明示的にモデル化することで、頑健な幾何学的先行として機能する。
軽量なLoRAベースのビデオ拡散アダプタを用いて、高品質で物理的に整合性があり、時間的に整合した映像を合成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:02:05 GMT)
Scaling Trends in Language Model Robustness [7.7] 言語モデルのロバスト性は,いくつかの分類課題,モデルファミリー,敵対的攻撃にまたがって研究される。
明確な安全性トレーニングがなければ、より大きなモデルの方が一貫して堅牢ではないことが分かっています。
攻撃の規模は、研究対象の全モデルにまたがる敵の訓練をはるかに上回るが、より大きな敵の訓練を受けたモデルは、長期的には防衛上の優位性をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:11:43 GMT)
Position is Power: System Prompts as a Mechanism of Bias in Large Language Models (LLMs) [7.7] 大規模言語モデル(LLM)におけるシステムプロンプトは、モデル動作を導く事前定義された指示である。
LLMのデプロイでは、コンテキスト間の一貫性のあるレスポンスを保証するために、ますます使用されている。
システムプロンプトがより複雑になるにつれて、直接的または間接的に、副作用の未報告を導入することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:12:53 GMT)
Demonstrations of Integrity Attacks in Multi-Agent Systems [7.6] マルチエージェントシステム(Multi-Agent Systems、MAS)は、システムの中核機能を破壊しずに自己利益を提供する悪意のあるエージェントに対して脆弱である可能性がある。
この研究は、悪意のあるエージェントが微妙なプロンプト操作を使用してバイアスMAS操作を行ない、様々な利益を得る、完全性攻撃を探索する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:44:49 GMT)
Constrained Entropic Unlearning: A Primal-Dual Framework for Large Language Models [7.6] 大規模言語モデル(LLM)が現実の環境でデプロイされるようになると、機密性、時代遅れ、あるいはプロプライエタリな情報を漏らさなくてはならなくなる。
既存の未学習の手法は、忘れと保持を規則化されたトレードオフとして定式化し、両方の目的を1つのスカラー化された損失に組み合わせる。
制約付き最適化問題として,LLMアンラーニングの新たな定式化を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:55:23 GMT)
Mitigating Confounding in Speech-Based Dementia Detection through Weight Masking [7.5] 本研究は認知症検出における性差に対処する。
これは2つの方法を提案する: $textitExtended Confounding Filter$と$textitDual Filter$。
認知障害患者と健常者を対象とした1対1の物語を用いた認知症データセットの評価を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:45:59 GMT)
CHANCERY: Evaluating corporate governance reasoning capabilities in language models [7.5] 我々は、経営陣/取締役会/株主の提案した行動が企業ガバナンス憲章と一致しているかどうかをモデルが判断する能力をテストするために、企業ガバナンス推論ベンチマーク(CHANCERY)を導入します。
ベンチマークは、コーポレート・チャーター(コーポレート・コベナントのセット)とエグゼクティブ・アクションの提案から成っている。
最先端推論モデル(SOTA)の評価ではベンチマークの難しさが確認され、Claude 3.7 Sonnet や GPT-4o がそれぞれ 64.5% と 75.2% の精度で評価された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:13:32 GMT)
Identifying Reliable Evaluation Metrics for Scientific Text Revision [7.5] ROUGEやBERTScoreといった従来のメトリクスは主に、意味のある改善を捉えるのではなく、類似性に重点を置いている。
まず手動による注釈研究を行い、異なる修正の質を評価する。
そこで本研究では,NLPドメインの参照不要評価指標について検討する。
LLM-as-a-judge評価とタスク固有のメトリクスを組み合わせたハイブリッドアプローチが,最も信頼性の高いリビジョン品質評価を提供することがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:00:23 GMT)
Influence Functions for Edge Edits in Non-Convex Graph Neural Networks [7.5] グラフニューラルネットワーク(GNN)に適した近位ブレグマン応答関数を提案する。
提案手法は, メッセージ伝達効果を明示的に説明し, エッジ削除や挿入に対する影響予測を原理的に拡張する。
グラフリウィリングや逆アタックなどの応用において,影響関数は汎用的であることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:15:46 GMT)
Efficient Robust Conformal Prediction via Lipschitz-Bounded Networks [7.4] コンフォーマル予測(CP)は、ニューラルネットワークの信頼性を改善する効果的な方法であることが証明されている。
そこで我々は,Lipschitz-bounded network を用いてロバストCP集合を高精度かつ効率的に推定する手法を提案する。
我々のリップ-rcp法は、この2番目のアプローチをバニラCPと同じくらい効率的にすると同時に、堅牢性を保証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:38:14 GMT)
Online Conformal Model Selection for Nonstationary Time Series [7.4] MPS(Model Prediction Set)は、非定常時系列のオンラインモデル選択のための新しいフレームワークである。
非定常条件下でMPSが最適モデルを確実かつ効率的に同定することを示す。
汎用的なフレームワークとして、MPSはデータ生成プロセス、データ構造、モデルクラス、トレーニングメソッド、評価メトリクスに対応している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:45:52 GMT)
Evaluation is All You Need: Strategic Overclaiming of LLM Reasoning Capabilities Through Evaluation Design [7.4] Deepseek-R1-Distillシリーズで表現される推論モデルは、オープンソースコミュニティで広く採用されている。
本研究により, 評価結果は, 種々の要因による大きな変動の影響を受けることが明らかとなった。
同様の現象は、Deepseek-R1-Distillシリーズに基づいて微調整された他のオープンソース推論モデルで観察される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:09:11 GMT)
Please Translate Again: Two Simple Experiments on Whether Human-Like Reasoning Helps Translation [7.4] 大きな言語モデル(LLM)は、多くのタスクに対して強力な推論能力を示し、しばしばChain-of-Thought (CoT)推論を通じてタスクを明示的に分解する。
textit Translating Step-by-stepcitepbriakou2024 Translatingは、例えば、LLMによる翻訳の分解と洗練を伴うマルチステッププロンプトを導入している。
以上の結果から, LLM の帰納的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:04:39 GMT)
Tunable spin-phonon polarons in a chiral molecular qubit framework [7.3] 非対称スピンフォノンカップリングを生成するキラル構造は理論上スピンフォノンポラロンを生成することができる。
スピンフォノンポラロンの形成を初めて明らかに示すスピンダイナミックシグネチャを報告する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:03:51 GMT)
Hierarchical Language Models for Semantic Navigation and Manipulation in an Aerial-Ground Robotic System [7.3] 本稿では,大規模言語モデル (LLM) と微調整型視覚言語モデル (VLM) を統合した階層型フレームワークを提案する。
VLMは,航空画像からタスク特定セマンティックラベルと2次元空間情報を抽出し,地域計画を支援する。
これは、VLMに基づく認識とLLM駆動のタスク推論とモーションプランニングを統合した地上異種システムの最初の実演である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:27:41 GMT)
Safety Tax: Safety Alignment Makes Your Large Reasoning Models Less Reasonable [7.1] 安全アライメントは、大規模言語モデルが公式にデプロイされる前に重要な手順である。
シーケンシャルなLRM生産パイプラインでは、推論と安全性のトレードオフがあることが示されている。
副産物として、安全アライメントのための代替データセットとして機能する、DirectRefusalと呼ばれるデータセットをキュレートします。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:20:54 GMT)
Robust Moment Identification for Nonlinear PDEs via a Neural ODE Approach [7.1] ニューラルODEを用いたPDE-governedシステムから低次モーメントダイナミクスを学習するためのデータ駆動型フレームワークを提案する。
非線形シュリンガー方程式をアプリケーションプラットフォームとして利用し、クロージャが利用可能になったときのモーメントダイナミクスを正確に回復する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:03:42 GMT)
CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature [7.1] 組換え例の大規模知識ベース(KB)であるCHIMERAを構築した。
ChiMERAは、科学者がどのようにして概念を再結合し、異なる領域からインスピレーションを得るかを探索するために使用することができる。
我々はCHIMERAを分析し、AIの異なるサブ領域における組換えの性質を探索する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:20:59 GMT)
Initial Model Incorporation for Deep Learning FWI: Pretraining or Denormalization? [7.0] 地下特性ニューラルネットワークによるフルウェーブフォームインバージョン (FWI) が, 効果的な教師なし学習フレームワークとして登場した。
地下モデルを直接微調整する代わりに、トレーニング可能なニューラルネットワークパラメータを更新する。
トレーニングはまず、初期速度モデルに適合させることで、ニューラルネットワークのパラメータを規制する。
正規化の非正規化は、ネットワークの出力を直接事前訓練せずに初期モデルに追加する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:06:37 GMT)
MARS: Radio Map Super-resolution and Reconstruction Method under Sparse Channel Measurements [6.9] 本稿では,CNNとトランスフォーマーを組み合わせたマルチスケールAware Radiomap Super- resolution法を提案する。
異なるシーンとアンテナ位置での実験により、MARSはMSEとSSIMの両方でベースラインモデルより優れていることが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:03:50 GMT)
Spatiotemporal Contrastive Learning for Cross-View Video Localization in Unstructured Off-road Terrains [6.9] MoViXは、セルフ教師付きクロスビュービデオローカライゼーションフレームワークである。
方向認識を維持しながら、視点と季節不変表現を学習する。
MoViXは25m以内の地中真理を93%、そして50m以内の地中における地中真理を定めている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:10:29 GMT)
Knowledgeable-r1: Policy Optimization for Knowledge Exploration in Retrieval-Augmented Generation [6.9] Retrieval-augmented Generation (RAG) は知識集約型タスクの性能向上のための主流の手法である。
本稿では,共同サンプリングを用いたナレッジブル-r1を提案し,知識能力探索における多ポリシ分布を定義した。
実験により、Knowledgeable-r1はパラメータと文脈の衝突タスクの両方において、堅牢性と推論の精度を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:34:15 GMT)
STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Open-Set Source Tracing and Attribution [6.9] STOPAは、13の合成器から8つのAM、6つの設定、700kサンプルをカバーするディープフェイク音声ソーストレースのためのデータセットである。
STOPAは、ボコーダモデル、音響モデル、事前訓練された重みの選択など、幅広い生成要因をカバーする体系的に制御されたフレームワークを提供する。
この制御により帰属精度が向上し、法医学的分析、ディープフェイク検出、生成モデルの透明性が向上する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:43:39 GMT)
Active Learning with Variational Quantum Circuits for Quantum Process Tomography [6.8] 本稿では、再構成のための量子状態の最も情報性の高いサブセットを適応的に選択する汎用能動学習(AL)フレームワークを提案する。
最大7量子ビットのランダム量子回路から生じるユニタリ量子過程を再構成することにより、アルゴリズムを実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:45:52 GMT)
Active Illumination Control in Low-Light Environments using NightHawk [6.8] NightHawkは、アクティブ照明と露出制御を組み合わせることで、困難な照明条件下での画質を最適化するフレームワークである。
フィールド実験の結果、特徴の検出とマッチングが47-197%向上し、難易度の高い照明条件でのより信頼性の高い視覚的推定が可能になった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:14:19 GMT)
AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization [6.8] QD(Quality-Diversity)アルゴリズムは、多種多様な高性能なソリューションの発見に顕著な成功を収めている。
しかし、それらは、事前に定義された多様性の概念への探索を制約する手作りの行動記述子に大きく依存している。
本稿では,マルコフ決定プロセスに政策の占有度を埋め込むことにより,行動記述子を自動的に生成する理論的基礎的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:34:53 GMT)
EECD-Net: Energy-Efficient Crack Detection with Spiking Neural Networks and Gated Attention [6.7] 本稿では,道路亀裂検出のための多段階検出手法であるEECD-Netを提案する。
SRCNN(Super-Resolution Convolutional Neural Network)は、低画質画像に固有の課題に対処するために用いられる。
これらの画像をスパースパルスシーケンスに変換するために,CIF(Continuous Integrate-and-Fire)ニューロンを用いたSCU(Spike Convolution Unit)を提案する。
CrackVision12Kベンチマークの実験では、EECD-Netは98.6%の精度で検出された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:19:36 GMT)
IIITH-BUT system for IWSLT 2025 low-resource Bhojpuri to Hindi speech translation [6.7] 本稿では,低リソースBhojpuri-Hindi言語対の音声翻訳におけるIIITH-BUTのIWSLT 2025共有タスクへの提出について述べる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:38:01 GMT)
DGMO: Training-Free Audio Source Separation through Diffusion-Guided Mask Optimization [6.7] 言語クエリされたオーディオソース分離(LASS)は、自然言語クエリによるオープン語彙の分離を可能にする。
ゼロショットLASSにおける生成前処理を利用した学習自由フレームワークを提案する。
提案手法は,ソース分離のための事前学習拡散モデルを効果的に再利用し,タスク固有の監督なしに競争性能を達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:46:57 GMT)
Human and AI collaboration in Fitness Education:A Longitudinal Study with a Pilates Instructor [6.6] 本研究では,Picatesインストラクターによる1年間の質的ケーススタディを通じて,フィットネス教育における人間とAIの連携について検討した。
研究員はインストラクタークラスに参加し、半構造化インタビューを行い、生成型AIをクラス計画と授業に組み込む方法について調査した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:04:34 GMT)
Population-Proportional Preference Learning from Human Feedback: An Axiomatic Approach [6.6] 評価対象者の嗜好の真の人口分布に比例して、集合的な意見や政策を整合できる新しい嗜好学習フレームワークを開発する。
提案手法は, 対比較データから直接, 評価対象人口分布の可能な集合を推定する。
本研究では,コンドルチェット優勝者の選考により,人口分布表現を円滑にトレードオフするソフトマックス緩和法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:15:07 GMT)
Reliably detecting model failures in deployment without labels [6.5] 本稿では,デプロイ後劣化(PDD)モニタリングの問題点を定式化し,対処する。
本稿では,予測モデルの相違に基づく,実用的で効率的なモニタリングアルゴリズムD3Mを提案する。
標準ベンチマークと実世界の大規模内科データセットによる実証的な結果から,フレームワークの有効性が示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:56:18 GMT)
Which Prompting Technique Should I Use? An Empirical Investigation of Prompting Techniques for Software Engineering Tasks [6.5] 4つのLarge Language Model(LLM)を用いて,ソフトウェア工学(SE)タスクにまたがる14の確立されたプロンプト手法の体系的評価を行う。
先述の文献で確認されているように、選択されたプロンプト技術は6つの中核次元(ゼロショット、フーショット、思考生成、組み立て、自己批判、分解)にまたがる。
提案手法は, 文脈理解や実例駆動のシナリオに依存するタスクよりも, 複雑な論理と集中的推論を必要とするSEタスクに最も効果的であることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:58:44 GMT)
Zero-shot protein stability prediction by inverse folding models: a free energy interpretation [6.5] 逆折り畳みモデルは、タンパク質安定性の非常に効果的なゼロショット予測因子であることが証明されている。
逆折り畳みモデルの自由エネルギー基盤を明らかにするためのステップを踏む。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:15:13 GMT)
$μ$nit Scaling: Simple and Scalable FP8 LLM Training [6.4] 8ビット浮動小数点(FP8)フォーマットによる大規模言語モデルトレーニングでは、大幅な効率向上が期待できるが、数値的な精度の低下はトレーニングを困難にしている。
モデルのサイズが大きければ、動的スケーリングファクタを必要としない、シンプルでスケーラブルなFP8トレーニングを実演します。
1Bから13Bパラメータのモデルをトレーニングし、FP8のすべての隠れ線形層計算を実行することにより、本手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:10:47 GMT)
Non-linear Multi-objective Optimization with Probabilistic Branch and Bound [6.3] 多重目的確率分岐と単観察境界(MOPBnB(so))と呼ばれる多目的シミュレーション最適化アルゴリズムを提案する。
その結果、MOPBnB(so)と比較すると、複数の複製を持つ変種は計算資源の面で極めて集中的であることが明らかとなった。
さらに,MOPBnB(so) は遺伝子アルゴリズムNSGA-II よりも高い性能を示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:01:08 GMT)
From Standalone LLMs to Integrated Intelligence: A Survey of Compound Al Systems [6.3] 複合アルシステム(CAIS)は、大規模な言語モデル(LLM)をレトリバー、エージェント、ツール、オーケストレータといった外部コンポーネントと統合する新興パラダイムである。
学術と産業の両方で採用が増加しているにもかかわらず、CAISの景観は断片化され、分析、分類、評価のための統一された枠組みが欠如している。
本調査は,次世代のシステムレベルの人工知能を理解し,開発し,推進するための総合的な基盤を研究者や実践者に提供することを目的とする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:34:43 GMT)
Attentive Eraser: Unleashing Diffusion Model's Object Removal Potential via Self-Attention Redirection Guidance [6.2] Attentive Eraser は、安定かつ効果的な物体除去のために、事前訓練された拡散モデルを強化するチューニング不要な手法である。
本稿では、マスクに基づいて自己注意機構を再設計するASS(Attention Activation and Suppression)を紹介する。
また、ASSによる自己注意リダイレクトを利用して生成プロセスのガイドを行う自己注意リダイレクトガイダンス(SARG)についても紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:54:00 GMT)
Collective motion from quantum-inspired dynamics in visual perception [6.2] 本稿では, 自己推進型アクティブエージェントにおいて, 知覚的意思決定プロセスを含む集団行動モデルを提案する。
この枠組みでは, アクティブエージェントの運動を駆動する力は, 知覚演算子の量子平均によって支配されていることを示唆する。
我々のモデルは、知覚的決定状態の適切な選択により、フラッキング行動のよく知られたヴィエクモデルを導出できることを実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:54:43 GMT)
One Wave To Explain Them All: A Unifying Perspective On Feature Attribution [6.2] 特徴属性法は、モデルの決定に影響を及ぼす入力特徴を特定することにより、ディープニューラルネットワークの透明性を向上させることを目的としている。
ピクセルベースのヒートマップは、画像、オーディオ表現、ボリュームなどの高次元入力に特徴をもたらす標準となっている。
この研究は、ウェーブレット領域が情報的かつ有意義な属性を許容することを証明している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:15:38 GMT)
TituLLMs: A Family of Bangla LLMs with Comprehensive Benchmarking [6.1] 1b と 3b のパラメータサイズで利用可能な,最初の大規模事前訓練型 Bangla LLM である TituLLM を提案する。
TituLLMsをトレーニングするために、約37億トークンの事前トレーニングデータセットを収集しました。
我々はLlama-3.2トークンを言語や文化固有の知識に組み込むように拡張した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:53:25 GMT)
Evaluating the Impact of Privacy-Preserving Federated Learning on CAN Intrusion Detection [5.9] 本研究は,車載車載ネットワークにおける機械学習による侵入検出プロセスにフェデレートラーニング戦略を統合することの効果について検討する。
LSTMオートエンコーダに基づく制御領域ネットワーク(CAN)のためのIDS(State-of-the-the-art Intrusion Detection System)を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:49:22 GMT)
Improved Belief Propagation Decoding Algorithms for Surface Codes [5.9] BP(Belief propagation)は、ほぼ線形時間の複雑さと安定化符号の適用性で有名である。
本稿では,表面符号のGF(4)よりもBPの復号精度を向上させることに焦点を当てる。
提案するEWAInit-BPは,初期確率を適応的に更新し,従来のBPよりも1~3桁の精度向上を実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:35:59 GMT)
UTSA-NLP at ArchEHR-QA 2025: Improving EHR Question Answering via Self-Consistency Prompting [5.9] 電子カルテを用いた臨床質問に対する回答システムについて述べる。
提案手法では,2段階の大規模言語モデルを用いて,臨床医の質問に関連のある文を見つけ出すとともに,短い引用支援応答を生成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:07:55 GMT)
Scaling Laws for Robust Comparison of Open Foundation Language-Vision Models and Datasets [5.8] モデルとデータセットの比較において,スケール法則の導出がいかに有効かを示す。
初めて、CLIPとMaMMUTという2つの重要な言語ビジョン学習手順のために、完全なスケーリング法則が導出された。
一定の学習率のスケジュールでスケーリング法則を導出する場合も比較が可能であることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:35:59 GMT)
Addressing Concept Mislabeling in Concept Bottleneck Models Through Preference Optimization [5.8] 概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、AIシステムの信頼性を高めるために、人間に理解可能な一連の概念に決定を拘束することを提案する。
CBMは通常、データセットには正確な概念ラベルが含まれており、性能を著しく低下させる可能性があると仮定する。
本稿では,概念選好最適化(Concept Preference Optimization, CPO)の目的について紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:06:29 GMT)
Nonlinear Causal Discovery through a Sequential Edge Orientation Approach [5.8] 完全部分DAGにおける非方向エッジの順序付け手順を提案する。
制限されたANMを仮定して真の因果DAGを回復できることが証明された。
非線形ANMのもとで因果DAGを学習するための制約に基づく新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:08:13 GMT)
Light and 3D: a methodological exploration of digitisation techniques adapted to a selection of objects from the Mus{é}e d'Arch{é}ologie Nationale [5.8] 遺産オブジェクトのデジタル化の必要性は広く受け入れられている。
本稿では,写真による3次元デジタル化手法の多様性について述べる。
すべてのケースに1つの方法が適していないことが示される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:59:33 GMT)
Joint Optimization of Electric Vehicle Routes and Charging Locations Learning Charge Constraints Using QUBO Solver [5.6] 充電ステーションの位置と電気自動車(EV)のルーティングの協調最適化に焦点をあてる。
本稿では,ベイズ推論とQUBOソルバを用いた逐次最適化手法を提案し,バッテリ容量の制約を自動的に学習する。
この手法を20箇所のルーティング問題に適用することにより,学習プロセスが良好に動作し,効率的な探索によって優れた解が見つかることを確認した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:08:19 GMT)
Diagonal Batching Unlocks Parallelism in Recurrent Memory Transformers for Long Contexts [5.6] トランスフォーマーモデルは、2次時間と線形メモリの複雑さのために、長いコンテキスト推論に苦しむ。
リカレントメモリ(RMT)は、コストの線形時間とメモリ使用量の一定を削減してソリューションを提供する。
しかし、メモリ更新メカニズムがシーケンシャルな実行を引き起こし、パフォーマンスのボトルネックが発生します。
本稿では,RTTのセグメント間の並列性を正確に保ちつつ,並列性を解放するスケジューリング手法であるDiagonalを紹介する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:43:48 GMT)
Design of intelligent proofreading system for English translation based on CNN and BERT [5.5] 本稿では,ロバストな証明読解のための新しいハイブリッド手法を提案する。
畳み込みニューラルネットワーク(CNN)と変換器からの双方向表現(BERT)を組み合わせる。
実験は90%の精度、89.37%のF1、および16.24%のMSEを達成し、最近の証明読解技術を10%以上上回った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:34:42 GMT)
DeePoly: A High-Order Accuracy and Efficiency Deep-Polynomial Framework for Scientific Machine Learning [5.5] この研究は、Deeソリューションを2段階のアプローチに変換する新しいフレームワークを紹介します。
戦略的な組み合わせは、両方の方法の強みを利用する。
多様な問題タイプにまたがって、高次かつ効率性を提供します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:10:52 GMT)
When Claims Evolve: Evaluating and Enhancing the Robustness of Embedding Models Against Misinformation Edits [5.4] ユーザーはオンラインでクレームと対話するので、しばしば編集を導入し、現在の埋め込みモデルがそのような編集に堅牢かどうかは不明だ。
本研究では, 文埋め込みモデルの頑健性を評価するために, 有効かつ自然なクレーム変動を生成する摂動フレームワークを提案する。
評価の結果,標準埋込モデルでは編集されたクレームに顕著な性能低下がみられ,LCM蒸留埋込モデルでは高い計算コストでロバスト性の向上が期待できることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:17:20 GMT)
Inducing lexicons of in-group language with socio-temporal context [5.4] 群言語は群力学の重要な記号である。
本稿では,グループ内言語の語彙を誘導する新しい手法を提案する。
オンラインの反女性コミュニティの会話で訓練された動的単語とユーザ埋め込みを用いて、我々のアプローチは、レキシコン誘導の先行手法よりも優れている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:55:19 GMT)
Learning to Recover: Dynamic Reward Shaping with Wheel-Leg Coordination for Fallen Robots [5.3] 本稿では,エピソードベースの動的リワードシェーピングとカリキュラム学習を統合した学習フレームワークを提案する。
相乗的ホイールレッグ調整は関節トルクの消費を15.8%、26.2%減少させることを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:58:12 GMT)
Customizing Speech Recognition Model with Large Language Model Feedback [5.3] 教師なしドメイン適応のための強化学習に基づくアプローチを提案する。
我々は、未ラベルデータを利用して転写品質、特にドメインミスマッチの影響を受ける名前付きエンティティを向上させる。
提案手法は,従来の自己学習手法に比べて,エンティティ単語の誤り率を21%向上させる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:42:57 GMT)
A theoretical framework for overfitting in energy-based modeling [5.1] 相互作用ネットワークの同定を目的とした逆問題に対するペアワイズエネルギーベースモデルの学習における限られたデータの影響について検討する。
これらの時間スケールとトレーニングの初期条件との相互作用から早期停止の最適点が生じることを示す。
本稿では、スコアマッチングの下でのスコア関数のニューラルネットワークカーネルダイナミクスを導出することにより、任意のエネルギーベースモデルへの一般化を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:06:46 GMT)
Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity [5.1] 圧縮比が最大で x1500 となるベクトルが存在することを示す。
得られた限界は、入力埋め込みの理論的能力とそれらの実用的利用の間の実質的なギャップを浮き彫りにする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:20:09 GMT)
Evaluating Vision-Language and Large Language Models for Automated Student Assessment in Indonesian Classrooms [5.1] 本研究は,インドネシアの6校の4年生を対象に,646人の受験者を対象に,最先端のVLMと複数のLDMの性能評価を行った。
以上の結果から,VLMは学生の筆跡の正確な認識に苦慮し,下流のLSMグレーディングにおける誤りの伝播につながることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:41:09 GMT)
Are all models wrong? Fundamental limits in distribution-free empirical model falsification [5.1] モデルクラス上で達成可能な最良のテストエラーに対して,下位境界を構築する問題に対して,モデルに依存しない基本硬度結果を確立する。
木に基づく手法や線形回帰といった特定のモデルクラスにその意味を考察する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:34:12 GMT)
LEDRO: LLM-Enhanced Design Space Reduction and Optimization for Analog Circuits [5.1] アナログ回路サイズの設計空間を反復的に洗練する最適化手法とともに,Large Language Models (LLMs) を用いたLEDROを導入する。
LEDROは、他のRLやBOベースラインと比較して非常に一般化可能であり、異なるトポロジや技術ノードの設計アノテーションやモデルトレーニングは不要である。
結果,LEDROは平均13%のFoM改善,2.15倍のOp-Amp,48%のFoM改善,1.7倍のOp-Ampを向上した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:02:32 GMT)
Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Spatial Reasoning Questions [5.1] 本稿では,空間的タスクにRAGを拡張するフレームワークである空間検索拡張生成(Spatial-RAG)を提案する。
多目的ランキング戦略は空間的制約と意味的関連性のバランスを保ち、LLM誘導ジェネレータはコヒーレント応答を保証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:50:15 GMT)
Connecting Thompson Sampling and UCB: Towards More Efficient Trade-offs Between Privacy and Regret [5.1] DP-TS-UCBは,プライバシと後悔の交換を可能にする,新しいパラメタライズドプライベートバンディットアルゴリズムである。
DP-TS-UCBは、トンプソンサンプリングに基づくアルゴリズムにおいて、ガウス分布の反集中境界とリンク探索機構に依存している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:07:12 GMT)
Benchmarking Large Language Models on Homework Assessment in Circuit Analysis [5.0] 大規模言語モデル(LLM)は、コード開発、ロボティクス、金融、教育など、様々な分野に革命をもたらす可能性がある。
本稿では,LLMを工学教育に活用する方法を検討する。
我々は, GPT-3.5 Turbo, GPT-4o, Llama 3 70B など,様々な LLM の能力のベンチマークを行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:16:30 GMT)
Admissibility of Completely Randomized Trials: A Large-Deviation Approach [5.0] 治療用アームが少なくとも3つあるときはいつでも、適応的でない完全にランダムな試行を普遍的かつ厳密に支配するシンプルな適応型設計が存在することが分かる。
この優位性は、実験サンプルが大きい場合に設計の統計的効率を定量化する効率指数と呼ばれる概念によって特徴づけられる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:58:43 GMT)
How to Train Your Dragon: Quantum Neural Networks [5.0] ニューラルネットワーク(NN)のトレーニングは、計算資源とエネルギー資源の両方の主要な消費者として現れている。
我々は、D-Waveのような量子アニールプラットフォームが、古典的NNの高速かつ効率的なトレーニングを可能にすることを実証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:03:26 GMT)
ScaleRTL: Scaling LLMs with Reasoning Data and Test-Time Compute for Accurate RTL Code Generation [5.0] 高品質な推論データとテスト時間計算の両方をスケールアップする RTL 符号化のための最初の推論 LLM である ScaleRTL を紹介する。
具体的には、56Kトークンを平均化して、RTLの豊富な知識をキャプチャする3.5Bトークンのデータセットを生成する。
このコーパス上で汎用推論モデルを微調整すると、深いRTL推論が可能なScaleRTLが得られる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:24:58 GMT)
Implicit Neural Representation for Video Restoration [5.0] Inlicit Neural Representations (INR)に基づく新しいビデオ復元手法であるVR-INRを紹介する。
VR-INRは、テスト時に任意の、目に見えない超解像スケールに効果的に一般化する。
トレーニング中、目に見えないスケールで高品質な再構築とノイズを継続的に維持する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:09:59 GMT)
Efficient Formal Verification of Quantum Error Correcting Programs [4.9] 本稿では,量子誤り訂正(QEC)プログラムの効率的な検証フレームワークを提案する。
提案するプログラムロジックをCoq証明アシスタントで定式化し,QEC検証器として検証する。
検証された安定化器符号14のベンチマークを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:20:09 GMT)
Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning [4.9] オンライン単エージェント強化学習(RL)とフェデレーション付きRL(FRL)の問題点について検討する。
本稿では,Q-EarlySettled-LowCostとFedQ-EarlySettled-LowCostという2つの新しいモデルレスRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:36:38 GMT)
High-Dimensional Independence Testing via Maximum and Average Distance Correlations [4.9] 高次元設定における最大距離と平均距離の相関の一貫性特性を特徴付ける。
それぞれのテスト統計の利点を比較し,それぞれのヌル分布を検証し,高速なチ二乗検定手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:35:05 GMT)
StealthInk: A Multi-bit and Stealthy Watermark for Large Language Models [4.8] StealthInkは、大規模言語モデル(LLM)のためのステルスなマルチビット透かし方式である
元のテキスト配布を保存し、証明データの埋め込みを可能にする。
固定等誤り率で透かし検出に必要なトークン数に対する低い境界を導出する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:37:38 GMT)
MambaNeXt-YOLO: A Hybrid State Space Model for Real-time Object Detection [4.8] YOLOシリーズモデルは、速度と精度のバランスをとることで、強力なベンチマークを設定している。
トランスフォーマーは自己アテンション機構のため、計算の複雑さが高い。
精度と効率のバランスをとる新しいオブジェクト検出フレームワークであるMambaNeXt-YOLOを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:07:11 GMT)
Artificial Intelligence in Creative Industries: Advances Prior to 2025 [4.7] 人工知能(AI)の急速な進歩は、クリエイティブ産業に大きな影響を与えた。
本稿は,2022年の前回レビュー以降に現れたものに対して,創造的機会を拡大し,効率を向上する方法について考察する。
複数のクリエイティブなタスクに対処し、統合できる統合AIフレームワークへのトレンドを強調します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:18:13 GMT)
LFA applied to CNNs: Efficient Singular Value Decomposition of Convolutional Mappings by Local Fourier Analysis [4.7] 興味深いスペクトル特性を符号化した 畳み込み写像の特異値。
特異値の計算は典型的には資源集約である。
本稿では,局所フーリエ解析に基づく複雑性O(N)のアプローチを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:10:01 GMT)
Unsupervised Machine Learning for Scientific Discovery: Workflow and Best Practices [4.6] 教師なし機械学習は、気候科学、生物医学、天文学、化学などの重要な領域におけるデータ駆動的な発見に広く用いられている。
広く利用されているにもかかわらず、信頼できる再現可能な科学的発見を行うための教師なし学習の標準化が欠如している。
我々は、有効な科学的質問の定式化、堅牢なデータ準備と探索の実行、様々なモデリング手法の使用、教師なしの学習結論の安定性と一般化性の評価による厳密な検証、再現可能な科学的発見を保証するための効果的なコミュニケーションと結果の文書化の促進から始まるベストプラクティスを強調し、議論する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:58:45 GMT)
LLM Social Simulations Are a Promising Research Method [4.6] 我々は,5つの難題に対処することで,LLM社会シミュレーションの約束を達成できると主張している。
LLMの社会シミュレーションは、すでにパイロット実験や探索研究に利用できると信じている。
研究者は、新しいAIシステムを最大限に活用するために、概念モデルと反復評価の開発を優先すべきである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:12:55 GMT)
Noninvasive precision modulation of high-level neural population activity via natural vision perturbations [4.6] 本研究では,高位霊長類腹側視覚路における神経活動の精密かつ非侵襲的調節の可能性について検討した。
予測モデルと生物学的に実現された効果との間に定量的な一致が認められた。
これらの結果は、現在の腹腔ストリームのマシン実行可能なモデルが、非侵襲的で視覚的に提供され、おそらく受容不能な神経介入を設計できることを強調している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:33:14 GMT)
Optimizing hypergraph product codes with random walks, simulated annealing and reinforcement learning [4.6] ハイパーグラフ製品は、2つの古典的なLDPCコードから構築された量子低密度パリティチェック(LDPC)コードである。
本研究では,量子消去チャネルに対する性能の最適化に焦点をあてる。
このチャネルの重要な利点は、効率的な最大形デコーダの存在である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:30:00 GMT)
StatsMerging: Statistics-Guided Model Merging via Task-Specific Teacher Distillation [4.6] StatsMergingは、基礎となる真理ラベルやテストサンプルを必要とせずに、重量分布統計によって導かれる学習ベースのモデルマージ手法である。
タスク固有の事前学習モデルの重量分布をモデル化するために、軽量な学習者StatsLearnerを使用している。
以上の結果から,StatsMergingは全体の精度,未確認タスクへの一般化,画像品質の変動に対する堅牢性において,最先端技術よりも優れていた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:37:10 GMT)
Jailbreak Attack Initializations as Extractors of Compliance Directions [4.5] 安全に配慮したLSMは、コンプライアンスまたは拒絶のプロンプトに応答する。
近年の研究では、他のプロンプトからの自己伝達による攻撃の初期化が、その性能を著しく向上させることが示されている。
コンプライアンスの方向性に沿って、未確認のプロンプトをプロジェクションすることを目的としたフレームワークであるCRIを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:08:36 GMT)
DACN: Dual-Attention Convolutional Network for Hyperspectral Image Super-Resolution [4.5] ハイパースペクトル画像超解像のためのデュアルアテンション畳み込みネットワークであるDACNを紹介する。
我々は、チャンネルと空間次元の異なる注意マップを推論し、どこに焦点を合わせるかを決定する。
L2正則化と空間スペクトル勾配損失を組み合わせた最適化された損失関数を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:45:21 GMT)
Learning Hyperparameters via a Data-Emphasized Variational Objective [4.5] ベイズ変分法から得られたエビデンスローバウンド(ELBo)目標を通した全トレーニングセット上での正規化ハイパーパラメータの勾配に基づく直接学習を検討する。
このようなシナリオでは、ELBoは事前のばらつきにマッチする後方を優先順位付けし、データの過小評価につながる。
提案手法は,過去の作業の88時間以上のグリッド検索を3時間以内の精度で行う。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:02:11 GMT)
MMRefine: Unveiling the Obstacles to Robust Refinement in Multimodal Large Language Models [4.5] 本稿では,Multimodal Large Language Models(MLLM)の誤り修正能力を評価するためのベンチマークであるMMRefineを紹介する。
推論中の推論の強化に重点が移るにつれて、MMRefineはMLLMの6つの異なるシナリオでエラーを検出し修正する能力を評価するフレームワークを提供する。
各種オープン・クローズドMLLMを用いた実験では、改良性能を阻害するボトルネックや要因が明らかになり、効果的な推論向上のための領域が強調された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:11:36 GMT)
A Unified Framework for Provably Efficient Algorithms to Estimate Shapley Values [4.4] 本稿では,KernelSHAPと関連する推定器を代替サンプリング戦略を用いて構築した,広範かつ統一的なフレームワークについて述べる。
我々は、我々のフレームワークから全ての推定者に適用できる強い非漸近的理論的保証を証明している。
正則なシャプリー値に対する我々のアプローチを検証し、最小値の2乗誤差を最小値のサンプルサイズで連続的に達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:30:53 GMT)
Associative Memory and Generative Diffusion in the Zero-noise Limit [4.4] 生成拡散と連続状態連想記憶モデルとの関係について検討した。
モース・スモール力学系は勾配に基づく連想記憶モデルの普遍近似として強調される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:51:47 GMT)
Defurnishing with X-Ray Vision: Joint Removal of Furniture from Panoramas and Mesh [4.3] テクスチャメッシュとそれに対応するパノラマ画像として表現された室内空間の劣化したレプリカを生成するパイプラインを提案する。
まず、メッシュ表現から家具を分割、取り除き、平面を拡張し、穴を埋め、単純化された廃メッシュ(SDM)を得る。
次にこれらをガイドとして、ControlNetの塗り絵を通してパノラマ画像から家具を取り除きます。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:30 GMT)
The NTNU System at the S&I Challenge 2025 SLA Open Track [4.3] スコア融合戦略を用いて,W2VとPhi-4マルチモーダル大言語モデル(MLLM)を統合するシステムを提案する。
提案システムは,Speak & Improve Challenge 2025の公式テストセットにおいて,0.375の根平均二乗誤差(RMSE)を達成する。
比較すると、トップランク、サードランク、オフィシャルベースラインのRMSEはそれぞれ0.364、0.384、0.444である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:09:23 GMT)
Fewer Hallucinations, More Verification: A Three-Stage LLM-Based Framework for ASR Error Correction [4.3] 本稿では, 誤り前検出, 連鎖型サブタスク反復補正, 推論プロセス検証の3段階からなる信頼性補正フレームワーク(RLLM-CF)を提案する。
AISHELL-1, AISHELL-2, Librispeechの実験により, このフレームワークによって強化されたGPT-4oモデルは, CER/WERの相対減少率21%, 11%, 9%, 11.4%を達成した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:26:39 GMT)
kTULA: A Langevin sampling algorithm with improved KL bounds under super-linear log-gradients [4.2] 超線形に成長するログ勾配を持つ分布からサンプリングする問題を解くために, kTULA と呼ばれるタグ付きランゲヴィン動的アルゴリズムを提案する。
本研究の主な成果は,kTULAの性能に関する理論的保証を提供することである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:51:18 GMT)
Robust and Efficient Transfer Learning via Supernet Transfer in Warm-started Neural Architecture Search [4.2] Neural Architecture Search (NAS)フレームワークは、AIの民主化を支援する有用な、人気のあるソリューションを提供する。
NASフレームワークは、しばしば計算コストがかかるため、適用性とアクセシビリティが制限される。
最適輸送やマルチデータセット保持に基づいて,事前学習したスーパーネットを効果的に転送できる新しいトランスファー学習手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:55:00 GMT)
Dissecting Bias in LLMs: A Mechanistic Interpretability Perspective [4.2] 大規模言語モデル(LLM)は、社会的、人口統計学的、性別的偏見を示すことが知られている。
我々は、GPT-2やLlama2のようなモデルの中で、そのようなバイアスがどのように構造的に表現されるかを分析する。
これらの成分を除去することで、バイアスのある出力を削減できるだけでなく、他のNLPタスクにも影響を及ぼすことを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:43:34 GMT)
Big Bird: Privacy Budget Management for W3C's Privacy-Preserving Attribution API [4.2] プライバシー保護属性(PPA)のためのプライバシ予算マネージャであるBig Birdを紹介します。
Big Birdはクォータ予算によるユーティリティ保存の制限を強制し、新しいバッチスケジューリングアルゴリズムによってグローバルな予算利用を改善する。
われわれはFirefoxでBig Birdを実装し、実世界の広告データで評価し、そのレジリエンスと効果を実証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:45:13 GMT)
Robustness Evaluation for Video Models with Reinforcement Learning [4.0] 本研究では,映像の空間的・時間的領域を協調的に認識するマルチエージェント強化学習手法を提案する。
提案手法は,Lp測定値と平均クエリにおける最先端の解よりも優れる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:38:09 GMT)
Coordinated Robustness Evaluation Framework for Vision-Language Models [4.0] 我々は、画像とテキストの両方を入力とし、共同表現を生成する一般的な代理モデルを訓練する。
この協調攻撃戦略は、視覚的質問と回答と視覚的推論データセットに基づいて評価される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:09:05 GMT)
ViCocktail: Automated Multi-Modal Data Collection for Vietnamese Audio-Visual Speech Recognition [4.0] 本稿では,生ビデオからAVSRデータセットを生成するための実用的な手法を提案する。
ベトナムのためのベースラインAVSRモデルを開発することで、その幅広い適用性を実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:13:01 GMT)
Gaussian Process Diffeomorphic Statistical Shape Modelling Outperforms Angle-Based Methods for Assessment of Hip Dysplasia [4.0] 患者股関節のCT画像を用いた半自動異形成分類のためのパイプラインを開発した。
192個のCTスキャン,100個のモデルトレーニング,92個のテストを行った。
GPDSSMは、異形成サンプルとコントロールを効果的に区別すると同時に、異形成変化を示す表面の領域をハイライトする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:08:12 GMT)
Optimal estimates of trace distance between bosonic Gaussian states and applications to learning [4.0] 第1と第2のモーメントがエラー$varepsilon$まで認識されている場合、状態のトレース距離エラーも$varepsilon$にスケールする。
この証明は、2つのガウス状態の間のトレース距離を、その第1モーメントと第2モーメントのノルム距離の観点から厳密な境界を定めている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:10:25 GMT)
Mitigating Degree Bias Adaptively with Hard-to-Learn Nodes in Graph Contrastive Learning [3.9] グラフニューラルネットワーク(GNN)はしばしばノード分類タスクの次数バイアスに悩まされる。
グラフコントラスト学習(GCL)を採用するいくつかのアプローチが、このバイアスを軽減するために提案されている。
本稿では,HAR (Hardness Adaptive Reweighted) のコントラスト損失を緩和し,次数バイアスを緩和する手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:28:12 GMT)
Using Large Language Models to Simulate Human Behavioural Experiments: Port of Mars [3.9] 集団リスク社会ジレンマ(CRSD)は、個人の好みと貢献する必要性の間のトレードオフを浮き彫りにする。
生成AIは、この問題に対処するための潜在的補完的なアプローチを提供する。
本論文は,本手法の有効性と,十分に多様性のある大規模人型実験を表現可能であるかに焦点を当てる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:02:31 GMT)
Leveraging LLMs for Bangla Grammar Error Correction:Error Categorization, Synthetic Data, and Model Evaluation [3.9] 世界第5位の言語であるにもかかわらず、バングラの文法的誤り訂正(GEC)は未発達のままである。
まず、バングラで12のエラークラスを広範囲に分類し、実世界のエラーを収集するためにネイティブなバングラ話者を調査します。
次に,規則に基づくノイズ注入法を考案し,正しい文に対応する文法的不正確な文を生成する。
このデータセットは、バングラの GEC のタスクのための命令チューニング LLM に使用される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:17:05 GMT)
Geological Field Restoration through the Lens of Image Inpainting [3.9] スパース観測から多次元の地質学領域を再構築する新たな視点を提示する。
多次元テンソルとして部分的に観測された空間場をモデル化し,大域的な低ランク構造を強制することによって損失値の復元を行う。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:45:27 GMT)
Projection-based Lyapunov method for fully heterogeneous weakly-coupled MDPs [3.9] 弱結合マルコフ決定過程(WCMDP)の完全不均一な設定について検討する。
完全不均一なWCMDPに対して,O(1/sqrtN)$のオプティニティギャップが,N$が大きくなるにつれて,アーム当たりの平均報酬が1本当たり平均報酬で最大になることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:04:57 GMT)
User Altruism in Recommendation Systems [3.9] レコメンデーションシステム(RecSys)に基づくソーシャルメディアプラットフォームのユーザは、プラットフォームコンテンツと戦略的に対話し、将来のレコメンデーションに影響を与える。
このようなプラットフォームでは、ユーザーは大規模草の根運動を形成するために文書化されており、アルゴリズムによって抑圧されたコンテンツと対話し、その推奨を「ブースト」するよう促している。
ユーザとRecSysの間のゲームについて検討し、ユーザがRecSys(潜在的に操作された)のコンテンツに対する好みを提供する。
結果がいくつかのモデルの誤用に対して堅牢であることを示し、その結果を裏付ける。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:14:40 GMT)
Intelligent4DSE: Optimizing High-Level Synthesis Design Space Exploration with Graph Neural Networks and Large Language Models [3.8] 我々は,タスク適応型メッセージパッシングと大規模言語モデル拡張進化アルゴリズムをグラフニューラルネットワークに統合するフレームワークであるCoGNNs-LLMEAを提案する。
予測モデルとして、CoGNNはコンパイラフロントエンド処理後にソースコードから生成された中間表現を直接利用し、HLSツールを起動することなく結果の品質(QoR)の予測を可能にする。
CoGNNは、HLS後のQoR予測における最先端予測精度を実現し、平均予測誤差を2.8$times$と3.4$times$で削減する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:16:48 GMT)
QuanUML: Towards A Modeling Language for Model-Driven Quantum Software Development [3.8] QuanUMLは、量子ソフトウェアシステム用に設計されたUnified Modeling Language(UML)の拡張である。
量子ビットや量子ゲートなどの量子固有構造をアルゴリズムフレームワークに統合する。
量子アルゴリズムの設計と視覚化におけるその有用性を実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:19:22 GMT)
Early linguistic fingerprints of online users who engage with conspiracy communities [3.8] 著名な共謀コミュニティで活動するRedditユーザーの心理言語学的パターンについて検討した。
共謀者が持つ個人は、一般のユーザー集団とは別物として、独特な精神言語的指紋を呈することを発見した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:33:40 GMT)
A Survey on Vietnamese Document Analysis and Recognition: Challenges and Future Directions [3.8] ベトナムの文書分析と認識(DAR)は、デジタル化、情報検索、自動化において重要な分野である。
OCRとNLPの進歩にもかかわらず、ベトナムのテキスト認識は、複雑なダイアクリティカルス、声調の変化、大規模な注釈付きデータセットの欠如により、独特な課題に直面している。
近年,大規模言語モデル (LLM) と視覚言語モデルは,テキスト認識や文書理解において顕著に改善されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:03:18 GMT)
Knowledge-Informed Deep Learning for Irrigation Type Mapping from Remote Sensing [3.8] 衛星画像のスペクトル特徴のみに依存する既存のモデルは、農業景観の複雑さと限られた訓練データのために効果がない。
本稿では,特殊なプロジェクション行列を用いて農作物を灌水確率にエンコードする,スウィントランスフォーマーに基づく新しいアプローチであるKnowledge-Informed Irrigation Mapping(KIIM)を提案する。
合衆国の5州での実験では、ベースラインよりも22.9%(IoU)の改善があり、71.4%(IoU)の改善が図られている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:18:45 GMT)
$K$-MSHC: Unmasking Minimally Sufficient Head Circuits in Large Language Models with Experiments on Syntactic Classification Tasks [3.8] 我々は,分類作業に不可欠な最小限の注意点を識別する手法である$(bmK, epsilon)$-Minimum Sufficient Head Circuitを導入する。
検索-K-MSHCアルゴリズムをGemma-9Bに適用し、文法受容性、算術検証、算術語問題という3つの構文的タスクファミリを解析する。
本研究により, タスク固有のヘッド回路が明らかになり, 初期層を利用した文法タスク, 浅い領域と深い領域の両方で顕著な活動を示す単語問題, ネットワークにまたがるより分散したパターンを示す算術的検証が実現した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:45:59 GMT)
On the Importance of Gaussianizing Representations [3.7] 本稿では、パワー変換を用いてニューラルネットワークの特徴表現の正規性を奨励し、トレーニング中に付加的なガウス雑音を用いる新しい正規化層を提案する。
本実験は,広く使用されているモデルとデータセットの組み合わせの配列上での一般化性能について,正規性正規化の有効性を実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:52:50 GMT)
Foundation Models Knowledge Distillation For Battery Capacity Degradation Forecast [3.7] 本研究は,時系列基礎モデルの劣化を考慮した微調整戦略を提案する。
リリースしたCycleLife-SJTUIEデータセットの検証は、微調整されたバッテリタイマーが強力なゼロショットの一般化能力を持っていることを示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:20:39 GMT)
Reinforcement Learning for Individual Optimal Policy from Heterogeneous Data [3.7] オフライン強化学習(RL)は,事前収集したデータを活用することで,期待される全報酬を最大化するために,動的環境における最適ポリシーを見つけることを目的としている。
従来の手法では、単一のエピソードや均質なバッチエピソードから事前に収集されたデータを持つすべての個人に対して最適なポリシーを学ぶことに重点を置いている。
異種時間定常マルコフ決定プロセスのための個別化オフラインポリシー最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:23:46 GMT)
PandasBench: A Benchmark for the Pandas API [3.7] パンダAPIは、パンダとその代替品の成功の中心となっている。
その重要性にもかかわらず、ベンチマークはありません。
それらを満たす最初のベンチマークを示す: PandasBench。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:30:55 GMT)
Subjective Perspectives within Learned Representations Predict High-Impact Innovation [3.6] 測定された主観的視点は、個人やグループが創造的に何を参加し、将来うまく組み合わせられるかを予測する。
我々は、様々な視点と背景の多様性で設計されたAIエージェント間の自然な実験を分析し、創造的なコラボレーションをシミュレートする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:18:53 GMT)
A comparative study of focusing with scalar and vector beams in an active Raman gain system [3.6] 能動ラマンゲイン構成は、4状態原子系において重要なケラの非線形性を達成するために用いられる。
我々はスカラーおよびベクトルプローブビームの線形および3次非線形感受性を解析的に導出した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:38:10 GMT)
A Large Language Model Approach to Identify Flakiness in C++ Projects [3.5] 不安定なテストは非決定的な振る舞いを導入し、回帰テスト結果の信頼性を損なう。
コードレベルでのC++プロジェクトにおけるフレキテストの根本原因を特定するためのLLMベースのアプローチを提案する。
我々は、C++データセットと既存のJavaデータセット上でMistral-7b、Llama2-7b、CodeLlama-7bモデルを微調整し、精度、リコール、精度、F1スコアで性能を評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:45:15 GMT)
Correlating Superconducting Qubit Performance Losses to Sidewall Near-Field Scattering via Terahertz Nanophotonics [3.5] ここでは,非侵襲的テラヘルツ (THz) ナノイメージング/分光法を用いてニオブトランスモン量子ビットのカプセル化を行った。
さらに、THzハイパースペクトル線走査を用いて、Al接合界面における誘電体応答と場参加を探索する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:03:37 GMT)
LESS: Large Language Model Enhanced Semi-Supervised Learning for Speech Foundational Models [3.5] そこで我々は,Large Language Models (LLMs) を利用した多用途フレームワークを導入し,実データから生成された擬似ラベルを補正する。
LESSフレームワーク内では、教師なしデータのASR(Automatic Speech Recognition)またはAST(Automatic Speech Translation)からの擬似ラベル付きテキストをLLMにより洗練する。
マンダリンASRとスペイン語と英語のASTの両タスクの実験は、LESSが3.77%の絶対的なWER削減を達成したことを示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:00:04 GMT)
Adaptive Jailbreaking Strategies Based on the Semantic Understanding Capabilities of Large Language Models [3.5] 大規模言語モデル(LLM)に対するジェイルブレイク技術による敵攻撃は、AIセキュリティにおいて重要な課題として浮上している。
本稿では,大規模言語モデルの意味的理解能力に基づく適応的ジェイルブレーク戦略を提案する。
GPT-4oの脱獄率は98.9%である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:24:01 GMT)
OpenCCA: An Open Framework to Enable Arm CCA Research [3.5] TDXやSEV-SNPとは異なり、Arm CCAの研究における重要な課題はハードウェアサポートの欠如である。
我々は,コモディティArmv8.2ハードウェア上でCCAバウンドコードの実行を可能にするオープンリサーチプラットフォームOpenCCAを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:16:25 GMT)
On Automating Security Policies with Contemporary LLMs [3.5] 本稿では、テキスト内学習と検索強化生成(RAG)の革新的組み合わせにより、攻撃緩和ポリシーコンプライアンスを自動化するフレームワークを提案する。
STIXv2 フォーマットと Windows API ドキュメントで公開されている CTI ポリシを用いて実施した実証評価では,RAG ベースラインに比べて精度,リコール,F1 スコアの大幅な向上が示されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:58:00 GMT)
Manipulation of photonic spin Hall effect in the Rydberg atomic medium [3.4] 本稿では,強い相互作用を持つRydberg原子媒体を用いたフォトニックスピンホール効果(PSHE)のチューナビリティ向上を示す理論的研究を行う。
特に、調整可能なPSHEは、光子スピンに基づくビームステアリングを可能にし、精度測定の感度を改善し、機能をリアルタイムで再構成可能なフォトニックデバイスをサポートすることができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:12:06 GMT)
Skill-Driven Certification Pathways: Measuring Industry Training Impact on Graduate Employability [3.4] オーストラリアでは、2030年までに毎年約5万2000ドルの新規技術専門家を必要としている。
この研究は、MicrosoftのAI-900のような業界認定が、この重要なスキルギャップをいかに埋めるかを調査する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:09:05 GMT)
iN2V: Bringing Transductive Node Embeddings to Inductive Graphs [3.4] node2vec(N2V)のような浅層ノードの埋め込みは、機能のないノードや、既存の機能を構造ベースの情報で補うために使用できる。
トレーニング中に見つからないノードに対する埋め込みを計算するためのポストホック手順を組み合わせたインダクティブノード2vec(iN2V)を提案する。
いくつかのベンチマークデータセットで実験を行い、iN2Vが帰納的埋め込みを帰納的環境に導入するための効果的なアプローチであることを実証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:43:24 GMT)
Chaotic Hedging with Iterated Integrals and Neural Networks [3.3] 反復ストラトノビッチ積分に基づく$Lp$-chaos展開を導出する。
任意の$p$-可積分、[1,infty)$の$pは、反復ストラトノヴィチ積分の有限和で近似できることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:02:14 GMT)
Explicit Density Approximation for Neural Implicit Samplers Using a Bernstein-Based Convex Divergence [3.3] 暗黙的な生成モデルをトレーニングするための新しい可能性のない目的である二重ISLを導入する。
これらの理論上の優位性は実践的なものへと変換される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:21:54 GMT)
Train One Sparse Autoencoder Across Multiple Sparsity Budgets to Preserve Interpretability and Accuracy [3.2] 我々は,複数の空間レベルにわたる再建を同時に最適化するために,単一のSAEを訓練する新しいトレーニング目標であるemphHierarchicalTopKを導入する。
実験の結果,HierarchicalTopKは高頻度でも高い解釈可能性スコアを保っていることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:42:24 GMT)
Feature-Based Lie Group Transformer for Real-World Applications [3.2] 表現学習の主な目的は、実世界の感覚入力から意味のある表現を、監督なしで取得することである。
ガロア代数理論における群分解を用いた新しい手法を提案する。
この方法は、より一般的な表現を定義することを約束するが、特徴抽出なしでピクセル間変換を仮定する。
特徴抽出とオブジェクトセグメンテーションを組み合わせることで,より現実的なシナリオにグループ分解理論を適用する方法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:30:11 GMT)
Evaluating Prompt-Driven Chinese Large Language Models: The Influence of Persona Assignment on Stereotypes and Safeguards [3.1] 広義の中国語モデルであるQwenにおいて,ペルソナの割り当てが拒絶行動および応答毒性に与える影響を解析した。
本研究は, 拒絶率に有意な性別バイアスを呈し, ある否定的な人物が, 最大60倍の中国の社会集団に対する毒性を増大させることができることを示した。
この毒性を軽減するために,Qwenと外部評価器の反復的相互作用を利用した,革新的なマルチモデルフィードバック戦略を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:47:21 GMT)
Detection Method for Prompt Injection by Integrating Pre-trained Model and Heuristic Feature Engineering [3.1] 即時注射攻撃は 重大な セキュリティ上の脅威として現れました
既存の防御機構は、有効性と一般化性の間のトレードオフに直面している。
本稿では,デュアルチャネル機能融合検出フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:01:19 GMT)
Multi-Layer GRPO: Enhancing Reasoning and Self-Correction in Large Language Models [3.1] 我々は,MGRPO(Multi-layer GRPO)を提案する。
MGRPOは標準GRPOを著しく上回り、推論能力と自己補正能力の両方を育成することで優れた性能を達成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:27:34 GMT)
Beyond the Buzz: A Pragmatic Take on Inference Disaggregation [3.0] 本稿では,分散推論の大規模化に関する最初の体系的研究について述べる。
その結果,デアグリゲーションは交通パターンや大規模モデルにおいて最も有効であることが判明した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:47:49 GMT)
Scenarios in Computing Research: A Systematic Review of the Use of Scenario Methods for Exploring the Future of Computing Technologies in Society [3.0] 本稿では,計算機科学におけるシナリオ構築手法の活用について,系統的な文献レビューを行う。
我々は、シナリオがなぜ使用されるのかという根拠に焦点をあてて、計算文学においてシナリオがどのように使用されるかを明らかにすることを目的としている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:35:24 GMT)
A Selective Homomorphic Encryption Approach for Faster Privacy-Preserving Federated Learning [2.9] フェデレーテッド・ラーニング(FL)は、医療におけるプライバシー保護機械学習にとって重要なアプローチである。
これらのシステムの現在のセキュリティ実装は、基本的なトレードオフに直面している。
我々は、選択的同型暗号化、差分プライバシー、ビットワイズスクランブルを戦略的に組み合わせて堅牢なセキュリティを実現する新しいアプローチであるFast and Secure Federated Learningを提示する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:47:27 GMT)
Spectral Graph Neural Networks are Incomplete on Graphs with a Simple Spectrum [2.9] スペクトル機能は、その表現力を改善するために、グラフニューラルネットワーク(GNN)に広く組み込まれている。
簡単なスペクトルグラフ上でSGNNの表現性を向上する手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:26:29 GMT)
Mini Diffuser: Fast Multi-task Diffusion Policy Training Using Two-level Mini-batches [2.9] 本稿では,視覚ロボット拡散政策の学習に必要な時間と記憶量を,桁違いに削減する手法を提案する。
Mini-Diffuserは、多モードのアクション分布をモデル化する機能を含む拡散ベースのポリシーの重要な強みを保存する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:01:16 GMT)
Beyond Cropped Regions: New Benchmark and Corresponding Baseline for Chinese Scene Text Retrieval in Diverse Layouts [2.9] 中国語のシーンテキスト検索は,中国語のクェリテキストの視覚的な例を含む画像の検索を目的とした実践的なタスクである。
現在の努力は、英語のシーンテキスト検索のソリューションを継承する傾向にあり、十分な性能を達成できなかった。
我々は,グローバルな視覚情報と多粒性アライメントトレーニングを統合する新しいモデルである中国語シーンテキスト検索CLIP(CSTR-CLIP)を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:10:17 GMT)
Towards LLM-Centric Multimodal Fusion: A Survey on Integration Strategies and Techniques [2.9] MLLM(Multimodal Large Language Models)は、事前訓練されたLLMと様々なモダリティエンコーダを組み合わせる。
この統合では、異なるモダリティが言語バックボーンにどのように接続するかを体系的に理解する必要があります。
多様なモーダル入力を言語埋め込み空間に変換・整合する手法について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:14:41 GMT)
Agents for self-driving laboratories applied to quantum computing [2.8] 本稿では,実験者の実験知識の組織化とエージェントによる実験の自動化を支援するため,k-agentsフレームワークを提案する。
本フレームワークでは,実験結果の分析方法を含む実験室の知識をカプセル化するために,大規模言語モデルに基づくエージェントを用いている。
実験を自動化するために,複数ステップの実験手順をエージェントベースの状態マシンに分割し,他のエージェントと対話して各ステップを実行し,実験結果を解析する実行エージェントを導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:11:26 GMT)
An Optimal Cascade Feature-Level Spatiotemporal Fusion Strategy for Anomaly Detection in CAN Bus [2.8] インテリジェントトランスポートシステム(ITS)は、現代のインフラにおいて重要な役割を担っているが、車内コントローラエリアネットワーク(CAN)バスの放送特性により、セキュリティ上のリスクに直面している。
提案したフレームワークは、100%精度で全ての攻撃タイプを検出し、最先端の手法より優れている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:37:44 GMT)
Kernel $k$-Medoids as General Vector Quantization [2.8] ベクトル量子化(VQ)は機械学習とデータ圧縮において広く使われている技術である。
$k$-medoidsクラスタリングとカーネル密度推定(KDE)アプローチは、2つの顕著で一見無関係なパラダイムを表している。
擬似非拘束バイナリ最適化(QUBO)のレンズによる接続性について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:14:25 GMT)
A Multi-Dataset Evaluation of Models for Automated Vulnerability Repair [2.8] 本研究では、6つのデータセットと4つの言語にまたがる自動脆弱性パッチのための事前訓練された言語モデルであるCodeBERTとCodeT5について検討する。
それらの精度と一般化を未知の脆弱性に対して評価する。
結果は、両方のモデルが断片化やスパースなコンテキストで課題に直面しているのに対して、CodeBERTはそのようなシナリオでは比較的優れたパフォーマンスを示し、CodeT5は複雑な脆弱性パターンのキャプチャに優れていることを示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:00:19 GMT)
Partially-Supervised Neural Network Model For Quadratic Multiparametric Programming [2.8] 本研究では,大域的解関数の数学的構造を直接表現する部分教師付きNNアーキテクチャを提案する。
汎用的なNNトレーニング手法とは対照的に,PSNN法は最適化問題の数学的性質から直接モデル重みを導出する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:26:18 GMT)
ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation [2.7] 学習力学モデルによるプランニングは、現実世界の長期的操作に対して有望なアプローチを提供する。
ActivePusherは、残差物理モデリングとカーネルベースの不確実性駆動型アクティブラーニングを組み合わせたフレームワークである。
シミュレーションと実世界の両環境でのアプローチを評価し,ベースライン手法と比較してデータ効率と計画成功率を改善することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:28:14 GMT)
FlowDirector: Training-Free Flow Steering for Precise Text-to-Video Editing [2.7] FlowDirectorは、新しいインバージョンフリーのビデオ編集フレームワークである。
我々のフレームワークは、編集プロセスをデータ空間の直接進化としてモデル化する。
局所的かつ制御可能な編集を実現するために,注意誘導型マスキング機構を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:54:40 GMT)
MCMC-Correction of Score-Based Diffusion Models for Model Composition [2.7] 拡散モデルは、スコアやエネルギー関数の観点からパラメータ化することができる。
スコア関数の行積分に基づく新しいMH型受入規則を導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:27:06 GMT)
Active Learning of Piecewise Gaussian Process Surrogates [2.5] 本研究では,Jump GPサロゲートを能動的に学習する手法を開発した。
ジャンプGPは、設計空間の領域において連続であるが、不連続である。
本研究では,Jump GPモデルのバイアスとばらつきを推定する手法を開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:47:09 GMT)
BYO-Eval: Build Your Own Dataset for Fine-Grained Visual Assessment of Multimodal Language Models [2.5] 眼科診断に触発された新しい評価手法を提案する。
合成画像のプロシージャ生成を用いて視覚特性の制御を行う。
この診断は、系統的なストレステストときめ細かい故障解析を可能にする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:43:10 GMT)
Explainability in Practice: A Survey of Explainable NLP Across Various Domains [2.5] レビューでは、実用的デプロイメントと実世界のアプリケーションに焦点を当てた説明可能なNLP(XNLP)について検討している。
本稿は,XNLPの理解を深め,より広範に応用できる今後の研究方向を提案することで締めくくっている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:41:25 GMT)
TANGO: Clustering with Typicality-Aware Nonlocal Mode-Seeking and Graph-Cut Optimization [2.5] 密度に基づくモード探索法は,低密度点から高密度近傍への遠心依存性を生成する。
両言語の観点から, 局所的に定義された依存関係を探索することにより, 固有性という新しい概念を導入する。
我々は,グローバルビューの典型性を利用して,モードを効果的かつ効率的に識別するアルゴリズムを考案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:47:02 GMT)
Place Recognition Meet Multiple Modalitie: A Comprehensive Review, Current Challenges and Future Directions [2.5] 位置認識の最近の進歩を概観し,3つの方法論的パラダイムを強調した。
CNNベースのアプローチ、トランスフォーマーベースのフレームワーク、およびクロスモーダル戦略について議論する。
我々は現在の研究課題を特定し、ドメイン適応、リアルタイムパフォーマンス、生涯学習を含む今後の方向性を概説し、この領域の今後の進歩を刺激する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:31:11 GMT)
Can Masked Autoencoders Also Listen to Birds? [2.4] Masked Autoencoders (MAEs) は、リッチな意味表現を学習することで、音声分類において競合する結果を示した。
汎用モデルは、きめ細かいオーディオドメインに直接適用しても、うまく一般化できない。
この研究は、このドメインギャップを埋めるには、ドメイン固有の事前トレーニングデータ以上のものが必要であることを実証している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:20:02 GMT)
Eddeep: Fast eddy-current distortion correction for diffusion MRI with deep learning [2.4] 画像間の対応を復元する画像トランスレータを提案する。
また,翻訳画像の整列化のための登録モデルを提案する。
この研究は、私たちの知る限りでは、ディープラーニングでこの問題に最初に取り組みます。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:22:16 GMT)
Model Predictive Control is Almost Optimal for Restless Bandit [2.3] 離散時間無限水平平均報酬(RMAB)問題を考える。
本稿では, 回転型計算水平方向を$tau$とする非定常ポリシーを提案する。
局所安定性条件下では、その部分最適性ギャップは一般に$O(1/sqrtN)$、$exp(-Omega(N))$である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:08:44 GMT)
FlashDMoE: Fast Distributed MoE in a Single Kernel [2.2] FlashDMoEは、専門家の計算とGPU間通信を永続的なGPUカーネルに融合させる、完全にGPU対応のMoE演算子である。
我々は,FlashDMoE のレイテンシが textbf6x 未満, textbf5,7x のスループットが向上し, textbf4x のスケーリング効率が向上し, textbf9x のGPU利用率が最先端のベースラインよりも向上したことを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:29:14 GMT)
Unsupervised Latent Pattern Analysis for Estimating Type 2 Diabetes Risk in Undiagnosed Populations [2.2] 米国だけでも、診断された糖尿病の経済的負担は2022年に400億ドルを超えた。
本稿では,非負行列因子化(NMF)を統計的手法と統合し,T2DMを開発するリスクのある個人を特定する新しい非教師なしフレームワークを提案する。
本手法は,診断されたT2DM患者において,多型性および多剤耐性の潜伏パターンを同定し,このパターンを用いて未診断者のT2DMリスクを推定する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:09:26 GMT)
TRIDENT -- A Three-Tier Privacy-Preserving Propaganda Detection Model in Mobile Networks using Transformers, Adversarial Learning, and Differential Privacy [2.2] TRIDENTは3層プロパガンダ検出モデルトランスである。
敵の学習と差分プライバシーを統合して、プライバシー漏洩を軽減している。
TRIDENTの3層防衛を適用することで、モバイルMLデプロイメント全体で強力なプライバシ保護を示す、削減されるが効果的な累積F1が0.83になる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:38:02 GMT)
Robustness as Architecture: Designing IQA Models to Withstand Adversarial Perturbations [2.2] 画像品質評価(IQA)モデルは、実世界のシステムで画像品質を評価するためにますます頼りになっている。
しかし、彼らの採用は根本的なリスクをもたらします。
我々は、アーキテクチャの先行として堅牢性という挑発的な考えを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:24:38 GMT)
Biased by Design: Leveraging Inherent AI Biases to Enhance Critical Thinking of News Readers [2.1] 本稿では,Large Language Models (LLM) を用いたプロパガンダ検出ツールの設計について検討する。
AIモデルの本質的偏見、特に政治的文脈において、これらの偏見をどのように活用してニュース消費における批判的思考を強化するかを検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:39:10 GMT)
Multiple Invertible and Partial-Equivariant Function for Latent Vector Transformation to Enhance Disentanglement in VAEs [2.0] 帰納的バイアスを注入するために,Multiple Invertible and partial-equivariant transformation (MIPE-transformation) と呼ばれる新しい手法を提案する。
3Dカー、3D形状、dSpritesデータセットの実験では、MIPE変換は最先端のVAEのアンタングル性能を改善する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:28:20 GMT)
Dictionary-Based Reconstruction of Spatio-Temporal 3D Magnetic Field Images from Quantum Diamond Microscope [2.0] 従来の2Dフーリエ方式の電流源位置定位法は多層系や動的系に悪影響を及ぼす。
本研究では, 窒素空孔中心型広磁場磁気顕微鏡による動的3時間イメージングと電流源の局在化を実証する。
本手法は, 空間・時間にわたって能動電流源のロバスト同定を可能にし, 複雑なシステムにおける動的3次元電流イメージングとNVベース磁気メトリーの精度を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:13:14 GMT)
Composing Agents to Minimize Worst-case Risk [2.0] 我々はエージェント・ワークフローをエージェント・グラフと呼ばれる有向非巡回グラフとして定式化する。
実現可能なエージェント構成のセットよりも最悪のケースリスクを考慮する。
エージェントグラフをトラバースする効率的なアルゴリズムを導入し,エージェントのほぼ最適組成を求める。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:04:44 GMT)
Implementation and topological characterization of Weyl exceptional rings in quantum-mechanical systems [1.9] ワイル例外環(WER)の最初の量子力学的実装を報告する。
多様体のサイズを縮めることによって引き起こされる位相遷移を実演する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:21:22 GMT)
Quick design of feasible tensor networks for constrained combinatorial optimization [1.9] 近年,実用化のための制約付き最適化問題に対して,テンソルネットワークが適用されている。
1つのアプローチは、nilpotent-matrix操作でテンソルネットワークを構築することである。
提案手法は,制約付き最適化問題に対する実現可能なテンソルネットワークの発見を容易にすることが期待されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:51:42 GMT)
U-NetMN and SegNetMN: Modified U-Net and SegNet models for bimodal SAR image segmentation [1.8] モード正規化が広く使われている2つのセマンティックセグメンテーションモデル(U-NetとSegNet)に与える影響を評価する。
実験の結果、モード正規化は収束を著しく加速することが示された。
クロスバリデーションの結果, 正規化モデルでは, 異なるゾーンで安定性が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:32:38 GMT)
Learning long range dependencies through time reversal symmetry breaking [1.8] ディープステート宇宙モデル(SSM)は、RNNを力学系に組み込むことができるため、物理基底計算パラダイムを定式化する。
本稿では,非散逸的なハミルトン系の物理的軌跡の有限差として損失を確実に計算するアルゴリズムであるRecurrent Hamiltonian Echo Learning (RHEL)を提案する。
我々は,中間範囲から長距離の分類や,シーケンス長が$sim 50k$に達するレグレッションなど,さまざまな時系列タスクに対して,線形および非線形ダイナミクスのHSSMを訓練する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:20:39 GMT)
Beyond the Desktop: XR-Driven Segmentation with Meta Quest 3 and MX Ink [1.8] 本研究では,解剖学的CTスキャンのための拡張現実(XR)ベースのセグメンテーションツールの有用性と臨床応用性について検討した。
本研究では,2次元および3次元の医用画像データとリアルタイムに対話できる没入型インタフェースを,カスタマイズ可能なワークスペースで開発する。
公立頭蓋顔面CTデータセットを用いたユーザスタディでは、このツールの生存可能性を示し、医療応用の期待される範囲内で、システムユーザビリティ尺度(SUS)のスコア66を達成した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:25:46 GMT)
A Private Smart Wallet with Probabilistic Compliance [1.8] 新規な招待型プライベートオフボード機構を備えたプライバシー保護型スマートウォレットを提案する。
このソリューションは、権威者(innocence mechanism)の証明と先祖のコミットメント追跡システム(ancestral commitment tracking system)という、2つのレベルのコンプライアンスを統合する。
本評価では,プライバシ保護とコンプライアンスを意識したデジタル決済を,計算処理と財務上のオーバーヘッドを最小限に抑えながら実現可能であることを評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:23:20 GMT)
CIVET: Systematic Evaluation of Understanding in VLMs [1.8] VLM(Vision-Language Models)は、様々なタスクにおいて競争力を発揮する。
対象物の性質と関係を制御・解釈可能な方法で研究する。
我々は,システマティC評価のための新しいフレームワークであるCIVETを紹介した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:27:16 GMT)
Improving Low-Resource Morphological Inflection via Self-Supervised Objectives [1.8] 極低リソース環境における形態変化に対する自己教師付き補助作業の有効性について検討した。
ラベルのないデータが非常に限られている場合、自動エンコーディングは最高のパフォーマンスを得る。
データ可用性が向上するにつれて、文字マスキング言語モデリングがより効果的になる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:42:45 GMT)
Automated Modeling Method for Pathloss Model Discovery [1.7] 本稿では,解釈可能性を維持しながら経路損失モデルの発見を加速する新しい手法を提案する。
一つはDeep Symbolic Regressionをベースとし、もうひとつは完全な解釈可能性を提供し、もうひとつはKolmogorov-Arnold Networksをベースとし、2段階の解釈性を提供する。
以上の結果から,コルモゴロフ・アルノルドネットワークは最小の予測誤差で1に近い決定値R2の係数を達成する一方,Deep Symbolic Regressionは適度な精度でコンパクトなモデルを生成することがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:12:40 GMT)
Full characterization of measurement-induced transitions of a superconducting qubit [1.7] 超伝導量子ビットでは、読み出し音のパワーを増大させることで、分散状態の読み出し速度を向上させることができる。
近年, トランスモン超電導キュービットの読み出しは, キュービット周波数よりもはるかに大きい周波数のトーンを用いて改善されている。
本稿では,本体制における読み出し誘起遷移のメカニズムを実験的に同定する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:53:05 GMT)
ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT [1.6] 本研究は,電子商取引データの文脈において,モデルに情報を加えることによって翻訳を改善する方法について検討する。
チェコ語からポーランド語への新しいeコマース製品翻訳データセットであるConECTを作成します。
我々は視覚言語モデル(VLM)を検証し、視覚コンテキストが翻訳品質に役立つことを発見した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:02:01 GMT)
Geometric and Physical Constraints Synergistically Enhance Neural PDE Surrogates [1.5] 台座格子上の物理法則と対称性を尊重する新しい入力層と出力層を導入する。
本稿では,これらの制約がPDEサロゲートの精度に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:54:26 GMT)
NIMO: a Nonlinear Interpretable MOdel [1.5] NIMO(Nonlinear Interpretable MOdel)を導入し,線形モデル予測に対する非線形補正を学習するためにNNを設計するモデルを作成する。
我々は,予測精度を大幅に向上させながら,基礎となる線形係数を復元できることを実証的に示す。
他のハイブリッド解釈可能なアプローチと比較して、線形モデルと同じ線形係数の解釈可能性を維持するのは我々のモデルだけである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:02:55 GMT)
Weak Physics Informed Neural Networks for Geometry Compatible Hyperbolic Conservation Laws on Manifolds [1.5] 物理インフォームドニューラルネットワーク(PINN)は、複素幾何学において高次元偏微分方程式(PDE)を解くための強力なアプローチを提供する。
PINNは、非線形双曲方程式から生じるような、低い正則性を持つ解を近似するのに苦労することがある。
弱解の効率的な近似に適したPINNのためのフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:29:39 GMT)
Self-supervised One-Stage Learning for RF-based Multi-Person Pose Estimation [1.4] 本稿では,生のRF信号に基づく,効率的で軽量なMPPEモデルを提案する。
RF信号のサブグループ化と共有単層CNNによる埋め込みとマルチヘッドアテンションにより、このモデルは従来の手法よりも優れていた。
本モデルでは,従来の生RF信号を用いた手法と比較して,最大15個のPCKh@0.5のMPPE精度を向上する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:40:27 GMT)
Confidence-Guided Human-AI Collaboration: Reinforcement Learning with Distributional Proxy Value Propagation for Autonomous Driving [1.4] 本稿では,これらの制約を克服するために,信頼誘導型人間-AIコラボレーション(C-HAC)戦略を開発する。
C-HACは、人間との相互作用を最小限に抑えたヒト誘導政策の迅速かつ安定した学習を実現する。
様々な運転シナリオに対する実験により、C-HACは安全性、効率、全体的な性能において従来の方法よりも大幅に優れていたことが判明した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:35:36 GMT)
Neurosymbolic Association Rule Mining from Tabular Data [1.4] アソシエーションルールマイニング(アソシエーションルールマイニング、アソシエーションルールマイニング)は、論理ルールの形式でデータ特徴間のパターンをマイニングするタスクである。
Aerial+は、データのニューラル表現を生成し、特徴間の関連をキャプチャする、新しいニューロシンボリックARMメソッドである。
モデルの再構成機構を利用して、このニューラル表現からルールを抽出する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:58:39 GMT)
Reasoning or Overthinking: Evaluating Large Language Models on Financial Sentiment Analysis [1.4] 我々は,様々な大規模言語モデル (LLM) が経済的文脈における人間ラベルの感情とどのように一致しているかを評価する。
本研究は, モデル設計のプロンプトや本質的設計による推論が, この課題における性能を向上させるものではないことを示唆している。
驚くべきことに、モデルと手法の最も正確かつ人間に整合した組み合わせは、CoT(Chain-of-Thought)を推進しないGPT-4oであった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:47:23 GMT)
E-bike agents: Large Language Model-Driven E-Bike Accident Analysis and Severity Prediction [1.4] 本研究では,大規模言語モデル(LLM)を用いて,非構造化インシデントレポートから安全変数を分類・抽出するフレームワークであるE-bike Agentを紹介する。
本フレームワークは,データ分類,情報抽出,傷害原因判定,部品リンクなど4つのLCMエージェントから構成され,Eバイク事故の原因となる要因を抽出する。
我々の研究によると、機器の問題は人間関連のものよりやや多いが、人間関連の出来事は致命的であることが多い。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:49:41 GMT)
Hiding in Plain Sight: Query Obfuscation via Random Multilingual Searches [1.4] パーソナライゼーションは関連性を高め プライバシーのリスクをもたらし バブルをフィルタします
本稿では,ランダムに生成された多言語検索クエリを用いた軽量なクライアント側クエリ難読化戦略を提案し,評価する。
その結果,検索結果の表示は比較的安定しているものの,ユーザの関心は難易度に大きく変化していることがわかった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:38:08 GMT)
Learning Theory of Decentralized Robust Kernel-Based Learning Algorithm [1.4] 我々は、カーネルヒルベルト空間(RKHS)を再現する枠組みの中で、新しい堅牢なカーネルベース学習アルゴリズムを提案する。
分散化アルゴリズムから生成された各局所ロバスト推定器を用いて回帰関数を近似することができることを示す。
局所的なサンプルサイズに対する厳密な選択ルールを提供し、適切に選択されたステップサイズとスケーリングパラメータ$sigma$では、分散化されたロバストアルゴリズムが最適な学習率を達成することができることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:30:05 GMT)
Multivariate Temporal Regression at Scale: A Three-Pillar Framework Combining ML, XAI, and NLP [1.3] 本稿では、機械学習(ML)、説明可能なAI(XAI)、自然言語処理(NLP)を統合することで、時間データにおける実行可能な関係の発見を加速する新しいフレームワークを提案する。
提案手法では,ML駆動プルーニングを用いて,低品質サンプルの識別と緩和,重要な特徴の相互作用を検証するためのXAIベースの解釈可能性,将来的なコンテキスト検証のためのNLPを組み合わせ,動作可能な洞察を明らかにするのに必要な時間を40~60%削減する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:56:44 GMT)
COMI-LINGUA: Expert Annotated Large-Scale Dataset for Multitask NLP in Hindi-English Code-Mixing [1.3] COMI-lingUAは、ヒンディー語と英語のコード混成データセットとしては最大である。
5つのコアNLPタスクにわたる125K以上の高品質なインスタンスで構成されている。
各インスタンスには3つのバイリンガルアノテーションがアノテートされ、376K以上の専門家アノテーションが生成される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:46:46 GMT)
Nonlinear Causal Discovery for Grouped Data [1.3] 因果グラフ学習のための2段階のアプローチを導入する。
まず、ランダムベクトル間の因果順序を推測する。
次に、この順序に整合した最良のグラフを特定するためにモデル選択を行う。
本稿では,変数群間の因果順序に関する部分的知識を持つ実世界のアセンブリラインデータに適用する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:08:01 GMT)
From Concept to Measurement: A Survey of How the Blockchain Trilemma Can Be Analyzed [1.2] ブロックチェーンのトリレンマサブコンセプトを分析するためのメトリクスを通じて、コンストラクトとそれらの運用を識別するためのアプローチをレビューする。
この研究は、ブロックチェーンのトリレンマがどのようにブロックチェーンシステムに現れるかについて、より洗練された調査のための理論的基盤を提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:36:20 GMT)
FastDraft: How to Train Your Draft [1.2] 我々はFastDraftを紹介します。FastDraftは、ドラフトモデルを任意の大きな言語モデルに事前トレーニングし、調整するための、新しく効率的なアプローチです。
我々は、人気のあるPhi-3-miniとLlama-3.1-8Bモデルの2つの高パラメータ効率ドラフトをトレーニングすることで、FastDraftを実証する。
FastDraftを使って、Intel$circledR$Gaudi$circledR$2アクセラレータを1つのサーバに約100億のトークンを持つドラフトモデルを24時間以内に作成することができました。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:09:22 GMT)
Erasure cost of a quantum process: A thermodynamic meaning of the dynamical min-entropy [1.2] 論理的および補助的な入力出力系に作用する任意の二部ゲートを解析する。
我々は、削減されたダイナミクスの敵の消去コストに焦点をあてる。
この洞察は熱力学、情報理論、量子計算の基本的な限界を橋渡しする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:53:17 GMT)
GRAF: Graph Retrieval Augmented by Facts for Romanian Legal Multi-Choice Question Answering [1.1] この研究は、低リソース言語のための法的ドメインであるMultiple-Choice QA(MCQA)を探求する。
JuROは3つの異なる試験と合計10,836の質問からなるルーマニア初の公開法的MCQAデータセットである。
我々はルーマニア語のための知識グラフであるLaw-RoGを最初に提案し、このKGは前述のコーパスから派生したものである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:37:25 GMT)
A unified weighting framework for evaluating nearest neighbour classification [1.1] 従来型 (NN), ファジィ (FNN), ファジィ粗 (FRNN) の総合的および大規模評価を行った。
理論上最適なサムワース重みはカーネルに収束することを示す。
また, 距離とスケーリングの指標についても検討し, 相互に関連性を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:35:36 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。
モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。
3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:15:07 GMT)
Quantum circuits as a game: A reinforcement learning agent for quantum compilation and its application to reconfigurable neutral atom arrays [1.1] 量子回路デーモン(quantum circuit daemon、QC-Daemon)は、量子デバイス操作をコンパイルする強化学習エージェントである。
我々は、Atom Gameと呼ばれる移動合成問題にQC-Daemonを適用した。
原子の配置をインテリジェントに変化させることにより、様々なベンチマーク問題に対する対数不整合の低減を100キュービットまで観測する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:34:01 GMT)
Entanglement cost hierarchies in quantum fragmented mixed states [1.0] 強い対称性は、対称開量子力学の定常状態における非自明な量子絡み合いパターンを強制する。
混合状態に対する様々な二分的絡み合いを, この種の状態に対して計算できることが示される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:15:10 GMT)
The Complexity of Learning Sparse Superposed Features with Feedback [1.0] モデルの基本となる学習特徴がエージェントからのフィードバックによって効率的に検索できるかどうかを検討する。
スパース設定で特徴行列を学習する際のフィードバックの複雑さを解析する。
この結果は,エージェントがアクティベーションを構築し,スパースシナリオにおいて強い上限を示すことを許された場合に,厳密な境界を確立する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:58:48 GMT)
40Gbps Tri-type Quantum Random Number Generator [0.9] 我々は,60Gbits/s以上の生ビットで3種類の確率分布をオンデマンドで生成できる量子乱数生成器を開発した。
ランダム性抽出の後、一様乱数に対して42Gbps以上のセキュアビットレートが示され、ガウス乱数に対して14Gbps以上のセキュアビットレートが示される。
ランダム番号はNISTとDieharderのテストに合格し、さまざまなアプリケーションで利用可能であり、Cisco Quantum Random Number Webサービスを通じて継続的にアクセスすることができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:09:16 GMT)
hdl2v: A Code Translation Dataset for Enhanced LLM Verilog Generation [0.9] 私たちは出席します。
HDL-to-Verilog – 人間が記述したVerilogデータの量を増やすデータセット。
私たちはその価値を示します。
HDL-to-Verilogは32億重みモデルのパフォーマンスを最大23%向上させる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:29:18 GMT)
Construction of Urban Greenland Resources Collaborative Management Platform [0.8] ハッピーシティ緑化管理システムは、庭師、木、花、緑地を効果的に管理している。
庭師の管理、購入・サプライヤの管理、樹木と花の管理、メンテナンス計画のためのモジュールで構成されている。
このシステムはバックエンドとデータストレージにJavaを使って構築されており、Vueフレームワークで設計されたユーザフレンドリな設計で補完されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:59:50 GMT)
Power Law Guided Dynamic Sifting for Efficient Attention [0.8] そこで我々は,最上位のk$ステップをしきい値に基づく計算効率の良い要素ワイドフィルタリング操作に置き換える,新しい近似アテンション手法SiftAttentionを提案する。
評価の結果,SiftAttentionは,ベクタのロード時のメモリ使用量を削減するとともに,既存の近似アテンション手法よりもモデル品質を向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:50:32 GMT)
Classical and Quantum Query Complexity of Boolean Functions under Indefinite Causal Order [0.8] 計算モデルは一般に、操作が一定の順序で適用されると仮定する。
近年、固定因果構造を持たない計算を考慮し、この仮定を緩和する研究がいくつか行われている。
正確なクエリの複雑さの分離は、今のところ発見されていない。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:00:36 GMT)
Breaking Anonymity at Scale: Re-identifying the Trajectories of 100K Real Users in Japan [0.8] 匿名化されたYjmob100kデータセットを解析し,日本の10万人の利用者の軌跡を抽出した。
人口密度パターン、構造相関、時間的活動プロファイルを活用して、データセットの実際の位置とタイミングを再同定する。
この研究は、現在の軌道匿名化手法の限界を強調し、モビリティデータの公開においてより堅牢なプライバシーメカニズムを要求する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:51:50 GMT)
Continual Learning from Simulated Interactions via Multitask Prospective Rehearsal for Bionic Limb Behavior Modeling [0.8] 生体補綴制御の文脈における人間の行動モデルを提案する。
本稿では、時間とともに動きを予測・洗練するマルチタスク・継続的適応モデルを提案する。
我々は,トランスティバイアル・アンプを含む実世界の人間の歩行データセットの実験を通じて,我々のモデルを検証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:17:51 GMT)
Impact of Temporally Correlated Dephasing Noise on the Fidelity of the 2-Qubit Deutsch-Jozsa Algorithm [0.8] 量子系のノイズはしばしば時間的相関を示し、非マルコフ力学に繋がる。
本稿では,時間相関雑音が2ビットDeutsch-Jozsaアルゴリズムの忠実度に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:48:50 GMT)
Distributional encoding for Gaussian process regression with qualitative inputs [0.7] 本稿では,分布符号化(DE)に基づく一般化が,対象変数のすべてのサンプルをカテゴリとして利用することを示す。
提案手法は実験的に検証され,様々な合成および実世界のデータセットに対して最先端の予測性能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:35:02 GMT)
Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training [0.7] 本論文では,Unreal Engineにおける注釈付き合成データの自動生成手法を提案する。
合成データセットが実世界のデータセットに匹敵する性能を達成できることを実証する。
これは、ロボットサッカーにおけるオブジェクト検出アルゴリズムのトレーニングのための合成データの最初の応用である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:37:40 GMT)
Evaluating the Effectiveness of Linguistic Knowledge in Pretrained Language Models: A Case Study of Universal Dependencies [0.7] 普遍依存(UD)は、言語間シンタクティック表現において最も成功した言語フレームワークとみなされている。
本稿では, 言語間対数パラフレーズ識別タスクにおいて, UDが性能を向上できるかどうかを評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:10:14 GMT)
A Compressive-Expressive Communication Framework for Compositional Representations [0.7] 本稿では,事前学習モデルから学習した表現の合成性を誘導する自己教師型フレームワークCELEBIを紹介する。
提案手法は,Shapes3DおよびMPI3Dデータセット上での学習メッセージの効率性と構成性を向上する。
この研究は、単純性に基づく帰納的バイアスから構造化された一般化可能な通信プロトコルが出現する新たな理論的および実証的な証拠を提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:57:28 GMT)
Towards Network Data Analytics in 5G Systems and Beyond [0.7] データはデジタル経済において重要な資産となっているが、モバイルネットワークオペレーター(MNOs)によって未利用のままである。
本研究では,70以上の記事の傾向とギャップを分析し,NWDAFの採用促進と収益化の可能性を探るため,新たな2つのユースケースを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:26:53 GMT)
Non-Perturbative Topological Gadgets for Many-Body Coupling [0.7] 非摂動ガジェットのクラスは、トポロジカル欠陥部分空間の奇均一性を利用して高次多体相互作用を生成できる。
概念的単純さから,これが論文の主眼となるが,2体結合のみで構築されたシステムが存在する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:57:32 GMT)
Agentic AI for Intent-Based Industrial Automation [0.7] この研究は、エージェントAIとインテントベースのパラダイムを統合する概念的フレームワークを提案する。
このフレームワークは意図に基づく処理に基づいて、人間のオペレーターが自然言語でハイレベルなビジネスや運用目標を表現できるようにする。
CMAPSSデータセットとGoogle Agent Developer Kit (ADK)を使って概念実証を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:50:54 GMT)
Exploring Adversarial Watermarking in Transformer-Based Models: Transferability and Robustness Against Defense Mechanism for Medical Images [0.7] ViT(Vision Transformers)は、コンピュータビジョンで成功したトランスフォーマーベースのモデルである。
本稿では,医用画像に対する ViTs の受容性について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:03:38 GMT)
Quantum dialogue through non-destructive discrimination of cluster state [0.7] 5つの量子ビットクラスタ状態の非破壊的識別(NDD)を利用する量子対話プロトコルを提案する。
提案プロトコルは、アンシラ量子ビットを用いて、その絡み合いを損なうことなく、状態の測定を行う計測ベースのプロトコルである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:16:09 GMT)
Supervised Quantum Machine Learning: A Future Outlook from Qubits to Enterprise Applications [0.6] Supervised Quantum Machine Learning (QML)は、量子コンピューティングと古典的な機械学習の共通点である。
本稿では, 量子回路, 量子ニューラルネットワーク, 量子カーネル法などの手法に着目し, 教師付きQMLの最近の展開を概観する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:48:21 GMT)
Mind the Confidence Gap: Overconfidence, Calibration, and Distractor Effects in Large Language Models [0.6] 大規模言語モデル(LLM)は、自然言語処理において顕著な熟練度を示す。
予測された信頼と真の正しさの過度なミスサライメントは、重要な意思決定アプリケーションに重大なリスクをもたらす。
9つのLCMと3つの質問応答データセットにわたるLCMの校正に関する包括的分析を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:14:36 GMT)
CL-ISR: A Contrastive Learning and Implicit Stance Reasoning Framework for Misleading Text Detection on Social Media [0.6] 本稿では,ソーシャルメディア上の誤解を招くテキストの検出精度を向上させるために,CL-ISR(Contrastive Learning and Implicit Stance Reasoning)を提案する。
まず,比較学習アルゴリズムを用いて,真偽と誤解を招くテキスト間の意味的差異の学習能力を向上させる。
第2に、テキストにおける潜在的姿勢傾向とその関連トピックとの関係を探るため、暗黙的姿勢推論モジュールを導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:52:28 GMT)
Wyckoff Transformer: Generation of Symmetric Crystals [0.6] 内部対称性は、物理的、化学的、電子的性質を決定する上で基本的な役割を果たす。
空間群対称性を条件付ける生成モデルWyFormerを紹介する。
Wyckoff の位置をエレガントで圧縮され、離散的な構造表現の基盤として用いることでこれを達成している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:50:47 GMT)
Learning to Plan via Supervised Contrastive Learning and Strategic Interpolation: A Chess Case Study [0.6] 我々は、教師付きコントラスト学習を用いてトランスフォーマーエンコーダを訓練し、位置評価によって構成された潜在空間に基板状態を埋め込む。
移動選択は, 深層探索に頼らずに, 有利な領域に進むことで, この埋め込み空間内で完全に発生することを実証する。
モデルサイズと埋め込み次元の両方でパフォーマンスが向上し、潜在計画が従来の検索の代替となる可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:19:26 GMT)
Deep histological synthesis from mass spectrometry imaging for multimodal registration [0.5] 本研究は, ピクサ2ピクセルモデルを用いてMSIから組織像を合成し, 一様登録を効果的に実現する手法を提案する。
予備的な結果から,有望な人工組織像と限られた人工組織像が得られ,相互情報(MI)と構造類似度指標(SSIM)は,それぞれ+0.924,+0.419と増加した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:45:52 GMT)
The non-Hermitian magnetic moment [0.5] 非エルミート周期系における電子の半古典理論を構築する。
この理論を均一な外部磁場の特定の場合に適用し、軌道磁化エネルギーの式を得る。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:18:10 GMT)
The TESS Ten Thousand Catalog: 10,001 uniformly-vetted and -validated Eclipsing Binary Stars detected in Full-Frame Image data by machine learning and analyzed by citizen scientists [0.5] 我々は、全ての短命と光中心テストに合格した10001個の楕円型連星のカタログを提示する。
対象物の検出と分析について概説し、サンプルの特性について論じ、潜在的に興味深いシステムに焦点を当てる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 23:29:13 GMT)
MineInsight: A Multi-sensor Dataset for Humanitarian Demining Robotics in Off-Road Environments [0.5] 我々は,地雷検出のためのマルチセンサ,マルチスペクトルデータセットであるMineInsightを紹介した。
データセットには3つの異なるトラックに沿って分散された35の異なるターゲットがあり、多様で現実的なテスト環境を提供する。
MineInsightは地雷検出アルゴリズムの開発と評価のベンチマークとして機能する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:08:24 GMT)
Deconstructing Obfuscation: A four-dimensional framework for evaluating Large Language Models assembly code deobfuscation capabilities [0.5] 大規模言語モデル (LLM) はソフトウェア工学において有望であるが、バイナリ解析の有効性は未定である。
組立コードの難読化のための商用LCMの総合評価を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:02:39 GMT)
Contrastive Representation Distillation via Multi-Scale Feature Decoupling [0.5] 知識蒸留は,小学生ネットワークの性能向上を目的とした技術である。
特徴空間内でのマルチスケールデカップリングを明示的に行う,対照的な表現蒸留手法であるMSDCRDを提案する。
本手法は,同種モデルにおける優れた性能を実現するとともに,多種多様な教師/学生ペア間での効率的な特徴知識の伝達を可能にする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:15:28 GMT)
PATS: Proficiency-Aware Temporal Sampling for Multi-View Sports Skill Assessment [0.5] 時間サンプリング(PATS)は、多視点スキルアセスメントのための連続時間セグメント内の完全な基本動作を保存する。
PATSは動画を適応的に分割し、分析された各部分が重要なパフォーマンスコンポーネントの完全な実行を含むことを保証する。
PATSはすべての表示構成で最先端の精度を上回っている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:05:23 GMT)
Inclusive, Differentially Private Federated Learning for Clinical Data [0.5] Federated Learning(FL)は、センシティブな患者データを集中化せずに、臨床AIモデルをトレーニングするための有望なアプローチを提供する。
実際の採用は、プライバシやリソース制約、コンプライアンスに関する課題によって妨げられています。
本稿では,定量的クライアントコンプライアンススコアに基づいて適応的にノイズを調整することでDPを向上する新しいFLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:01:10 GMT)
NEAT and HyperNEAT based Design for Soft Actuator Controllers [0.4] 本稿では神経進化に基づくソフトアクチュエータの制御系の自動設計法を提案する。
具体的には、提案手法は、Neuroevolution of Augmenting Topologies(NEAT)とHypercubeベースのNEATを用いる。
提案手法のロバスト性をテストするため,ソフトアクチュエータの高・低性能形態をテストベッドとして利用した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:20:16 GMT)
Preprocessing Methods for Memristive Reservoir Computing for Image Recognition [0.4] Reservoir Computing (RC) は効率的なリカレントニューラルネットワークアーキテクチャとして注目されている。
メムリスタで実装する場合、RC系はその動的特性から恩恵を受け、貯水池建設に最適である。
本稿では, 経験的RCシステムにおける各種前処理手法を系統的に比較し, 精度とエネルギー消費に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:06:10 GMT)
Precision Minimally-destructive detection of ultra-cold atomic ensembles [0.4] 所望の原子番号の原子アンサンブルを調製するために使用できる,高精度で最小限の破壊測定技術について報告する。
この測定は分散光原子相互作用に依存するため、アンサンブル温度に無視できる効果が期待できる。
量子エンハンスな測定を行い、干渉計シーケンスの開始時に原子番号状態を作成するのに使うことができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:12:55 GMT)
Challenging Spontaneous Quantum Collapse with XENONnT [0.3] 我々は1-140keVのエネルギー範囲で低エネルギーの電子リコイルデータを用いて動的量子崩壊から予測されるX線放射を探索する。
マルコフ連続自発局所化とディオシ-ペンローズモデルの自由パラメータに関する新しい世界リード極限が設定される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:47:46 GMT)
Federated Isolation Forest for Efficient Anomaly Detection on Edge IoT Systems [0.2] 本稿では,前述のフェデレート学習フレームワークを用いて,孤立林を用いた温度異常検出手法を提案する。
このシステムは実験的に評価され、正常な読解と異常な読解を区別する精度を96%以上達成している。
結果は、データプライバシと協調学習の連合学習原則を支持しながら、リソース制約のある環境とエッジシステムに対する適合性を強調している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:22:04 GMT)
A Reasoning-Based Approach to Cryptic Crossword Clue Solving [0.2] この研究は、オープンライセンスコンポーネントから構築されたLLMベースの推論システムについて述べる。
i) 解答の仮説, (ii) 語句説明の提案, (iii) 体系化された推論ステップで動作する検証システムを用いて, 秘密の手がかりを解く。
全体として、このシステムは、イギリスのThe TimesやThe Telegraphの新聞から得た手がかりの、挑戦的なCryptoniteデータセット上で、最先端のパフォーマンスを確立している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:43:28 GMT)
Gate-tunable spectrum and charge dispersion mitigation in a graphene superconducting qubit [0.2] ゲート可変ジョセフソン接合は超伝導回路に統合されている。
このような弱いリンクにおけるクーパー対の高伝送は電荷分散を強く抑制することを示す。
我々の研究は、グラフェンベースの量子ビットが高度な量子回路における汎用的なビルディングブロックとしての可能性を示している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:36:34 GMT)
Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation [0.2] 非視線(NLoS)条件におけるミリ波通信(mmWave)は、軍事および民間の運用において大きな課題である。
本稿では,mmWaveリンク性能の向上を目的とした視覚支援型自律反射器システムを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:07:22 GMT)
Not All Options Are Created Equal: Textual Option Weighting for Token-Efficient LLM-Based Knowledge Tracing [0.1] 大規模言語モデル(LLM)が知識追跡のための有望なツールとして登場した。
実例学習者のインタラクション履歴を文脈でエンコードするフレームワークであるtextitLLM を用いた Option-weighted Knowledge Tracing (LOKT) を提案する。
LOKTはスケーラブルでコスト効率のよい推論を可能にし、厳密なトークン制約の下でも強力なパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:41:21 GMT)
An Unsupervised Framework for Dynamic Health Indicator Construction and Its Application in Rolling Bearing Prognostics [0.1] 健康指標(HI)は転がり軸受の劣化評価と予後に重要な役割を果たしている。
HIレベルの時間依存性を考慮した新しい動的HIは、教師なしフレームワークによって構築される。
実験の結果,提案手法が比較法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:13:46 GMT)
A Comparative Study of Conventional and Tripolar EEG for High-Performance Reach-to-Grasp BCI Systems [0.1] 本研究の目的は、三極性脳波(tEEG)と従来の脳波(tEEG)の有効性を比較することで、運動障害のある個人に対するBCI応用を強化することである。
目標は、どの脳波技術が関連する神経信号を処理し、翻訳するのにより効果的かを決定することである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:50:10 GMT)
SocialDF: Benchmark Dataset and Detection Model for Mitigating Harmful Deepfake Content on Social Media Platforms [0.1] ソーシャルメディアプラットフォーム上での現実的なディープフェイク課題を反映した、キュレートされたデータセットであるSocialDFを紹介した。
このデータセットは、さまざまなオンラインエコシステムから得られた高忠実度ディープフェイクを含んでいる。
本稿では,音声認識,自動音声書き起こし,マルチエージェントLPMパイプラインを組み合わせた新しい多要素検出手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:39:28 GMT)
Two-dimensional Taxonomy for N-ary Knowledge Representation Learning Methods [0.1] 本調査では,n-aryリレーショナルデータを扱う手法を概観し,知識ハイパーグラフとハイパーリレーショナル・ナレッジグラフの両文献について概観する。
本稿では,2次元分類法を提案する。第1次元分類法は,それらの方法論,すなわち翻訳ベースモデル,ディープニューラルネットワークベースモデル,論理ルールベースモデル,ハイパーエッジ拡張ベースモデルに基づいて分類する。
第2の次元は、n-ary関係における実体的役割と位置の認識に基づいてモデルを分類し、それらを無意識、位置認識、役割認識のアプローチに分割する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:59:39 GMT)
The Vector Grounding Problem [0.0] 表現内容の哲学的理論に基づいて, LLMは参照基底を達成できると主張している。
議論の驚くべき影響の1つは、マルチモーダリティと実施はグラウンディング問題を克服するのに必要でも十分でもないことである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:55:56 GMT)
Winner-takes-all for Multivariate Probabilistic Time Series Forecasting [0.0] 本稿では,MCL(Multiple Choice Learning)パラダイムを利用した時系列予測手法であるTimeMCLを紹介する。
提案手法では,複数の頭部を持つニューラルネットワークを用いて,予測の多様性を促進するためにWinner-Takes-All(WTA)損失を利用する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:56:14 GMT)
Was Residual Penalty and Neural Operators All We Needed for Solving Optimal Control Problems? [0.0] 我々は、DeepONetのような単純なニューラルネットワークアーキテクチャが、複数の最適制御問題を解くことができることを示した。
各モデルに対して、コスト関数の異なる3つの問題を解き、全てのケースにおいて正確で一貫した性能を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:22:16 GMT)
Variational toolbox-based separability detection of multiqubit states [0.0] そこで本稿では,純状態の$k$-セパビリティを,合成ノイズの有無に関わらず識別するための変分ツールボックスを提案する。
また、混合状態の$k$-セパビリティを検出するための適応最適化手法も導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:40:57 GMT)
Upper bound for the Holevo quantity arising from the fundamental entropic inequality [0.0] 我々は、最近の[arXiv::2408.15306] における基本的なエントロピーの不等式が、量子状態の離散アンサンブルのホレヴォ量に非常に正確な上限を得るためにどのように用いられるかを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:59:26 GMT)
Unveiling quantum phase transitions from traps in variational quantum algorithms [0.0] 量子最適化と古典的機械学習を組み合わせたハイブリッドアルゴリズムを提案する。
従来の位相遷移の同定にはLASSO、トポロジカル遷移にはTransformerモデルを用いる。
リゲッティのAnkaa 9Q-1量子コンピュータで数値シミュレーションと実ハードウェア実験を行った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:31:45 GMT)
Unconventional excitonic insulators in two-dimensional topological materials [0.0] 励起子として知られる半導体の電子-ホール対は、低温でコヒーレントな状態を形成することができる。
結果として生じる位相はエキシトン絶縁体として知られ、超流動性を持つ。
最近提案された非自明なバンドトポロジーを持つ2次元候補材料について,エキサイトニック絶縁体について検討した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:25:27 GMT)
UNO: Unlearning via Orthogonalization in Generative models [0.0] 我々のアルゴリズムは、元のモデルの忠実さを維持しながらデータを忘れることができることを示す。
MNISTとCelebAデータを用いて、我々のアルゴリズムが前者よりもはるかに高速な未学習時間を達成することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:37:02 GMT)
Trustworthiness Preservation by Copies of Machine Learning Systems [0.0] データ上で複雑なクエリをモデル化し、検証するための計算を導入します。
我々は4つの異なる概念を定義している: 正当性、平等性、弱大性、ほぼ信頼に値する。
目的は、振る舞いが分かっているオリジナルのシステムからコピーされた、おそらく複雑なシステムの信頼性をチェックするための計算ツールを提供することである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:14:57 GMT)
Transient and steady-state chaos in dissipative quantum systems [0.0] 散逸的な量子カオスは、情報スクランブル、非単位進化、熱化の特徴づけと制御において中心的な役割を果たす。
確率行列玩具モデルを導入し,Ginibreスペクトルが定常カオスではなく短時間カオスを信号することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:00:13 GMT)
Towards objectivity of classical reference frames in quantum mechanics [0.0] カルテシアン参照フレームによって与えられるより複雑な情報もまた、量子力学において客観的であることを示す。
変換群によって与えられる参照フレームの非自明な内部ゲージ構造は、より一般的な客観性の形式をもたらす。
これにより、単純なシナリオを超えて量子の客観性を拡張し、現代の幾何学の基礎と結び付けることができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:46:35 GMT)
Towards a Unified System of Representation for Continuity and Discontinuity in Natural Language [0.0] 自然言語の構造における連続性と不連続性の両方を統一的に表現するシステムを提案する。
特に, 句構造文法 (PSG) は選挙区概念, 依存文法 (DG) は首依存関係, カテゴリー文法 (CG) は関手論関係に焦点をあてる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:54:41 GMT)
Towards a Multi-Agent Simulation of Cyber-attackers and Cyber-defenders Battles [0.0] 本稿では,ホストネットワークノード上に展開するサイバー攻撃エージェントとサイバー防御エージェントのシミュレーションによるマルコフモデルと実装について述べる。
現実的にコーディネートされたサイバー攻撃シナリオを実装するための実験的なフレームワークを提供することを目標としている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:17:17 GMT)
Towards Data Systems That Are Business Semantic-Centric and AI Agents-Assisted [0.0] ビジネスSemantics Centric, AI Agents Assisted Data System (BSDS)
BSDSは、データシステムをビジネス成功の動的な実現手段として再定義する。
システムには、ビジネスエンティティにリンクされたキュレートされたデータ、コンテキスト認識AIエージェントの知識ベース、効率的なデータパイプラインが含まれる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:06:06 GMT)
TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research [0.0] 本研究では,おもちゃのタスクの形式的構造と実世界の複雑さを組み合わせることで,テキスト・ツー・ジェネレーションを学習の理想的なタスクとして提案する。
最小回路の識別にはエッジパッチやスパースオートエンコーダなどの解釈可能性技術を適用する。
私たちの研究は、構造化され、段階的に複雑な設定における解釈可能性メソッドの探索と比較のための堅牢なフレームワークを提供します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:07:16 GMT)
Time Glasses: Symmetry Broken Chaotic Phase with a Finite Gap [0.0] 周期駆動型散逸型量子多体系の時間ガラス相について検討する。
リウヴィリアのギャップは、系のサイズと指数関数的に閉じる時間結晶とは対照的に、熱力学的極限において有限である。
局所的なコヒーレントな初期状態と高度に非局在な定常状態との間の量子R'enyiの発散は、システムサイズとともに無拘束に増加することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:18:17 GMT)
Through-the-Wall Radar Human Activity Recognition WITHOUT Using Neural Networks [0.0] TWR HARタスクを達成するために、ニューラルネットワークをエスキューして、元のパスに戻りたいと思っています。
マイクロドップラーセグメンテーション機能は2次元の点雲に離散化される。
提案手法の有効性を数値シミュレーションおよび測定実験により実証した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:45:08 GMT)
Three-mode tunable coupler for superconducting two-qubit gates [0.0] 2つのトランスモンと、ZZインタラクション制御が可能な可変3モードカプラで構成されるスケーラブルな量子プロセッサのビルディングブロックを提案する。
パルス長60 nsのネイティブCZゲートを実験的に示し,98%以上の2ビットゲート忠実度を達成し,そのほとんどがクビットコヒーレンス時間によって制限された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:53:36 GMT)
Thermal avalanches in isolated many-body localized systems [0.0] 乱れ磁場を受ける大きさ$L$のハイゼンベルクスピン鎖の多体局在安定性を数値的に検討した。
強い障害に対して、雪崩は熱領域がシステムサイズでスケールする場合のみ起こる。
我々は多体局在とエルゴード挙動の中間位相を$P$の増加として同定する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:55:26 GMT)
The cost of ensembling: is it always worth combining? [0.0] 予測精度と計算コストのトレードオフが極めて関連するトピックとして浮上している。
2つの大規模小売データセットにまたがる10のベースモデルと8つのアンサンブル構成を評価した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:54:19 GMT)
The Data Dilemma: Authors' Intentions and Recognition of Research Data in Educational Technology Research [0.0] 著者の視点をEasyChairで分析し,共有すべき研究データがあるかどうかを著者が指定した。
その結果,すべての研究データが著者,特にソフトウェアや定性的データによって認識されたわけではないことがわかった。
この研究は、将来のEdTec研究者の訓練に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:29:47 GMT)
The Arm Qubit: A Superconducting Qubit Co-Designed for Coherence and Coupling [0.0] 単一ビットゲートの不完全性はデコヒーレンスを含む1時間10~5ドル以下である。
Arm qubitはフォールトトレラントな量子コンピュータのための有望なスケーラブルなビルディングブロックである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:55:24 GMT)
Testing Hypotheses of Covariate Effects on Topics of Discourse [0.0] 本稿では,大きなテキストコーパスの面から抽出可能なトピックモデリング手法を提案する。
これは、基礎となる確率モデルにおけるパラメータ推定の役割を強調することで達成される。
ここで提唱される単純で非パラメトリックなアプローチは、より速く、より解釈可能であり、上記の生成モデルよりも推論の正当性を享受する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:28:49 GMT)
Tensor-based multivariate function approximation: methods benchmarking and comparison [0.0] 本稿では,テンソル(あるいはデータ-)に基づく多変量関数の構成と近似のために設計された手法の性能,特徴,ユーザエクスペリエンスを評価する。
このコントリビューションは、サロゲートモデルによるテンソル近似のための利用可能なツールの完全なベンチマークコレクションを提案するものである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:17:55 GMT)
Teaming in the AI Era: AI-Augmented Frameworks for Forming, Simulating, and Optimizing Human Teams [0.0] 論文は、チームの満足度、エンゲージメント、パフォーマンスを高めるAI強化されたチーム最適化フレームワークと実用的なシステムを開発することを目的としている。
まず,多腕バンディットアルゴリズムを利用して,ユーザの好みに基づいてチーム構成を反復的に洗練するチーム形成フレームワークを提案する。
第2に、大きな言語モデル(LLM)を使用して、チームと個々のメンバの両方に即時かつパーソナライズされたフィードバックを提供するAI駆動システムであるtAIfaを紹介します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:24:37 GMT)
TQml Simulator: Optimized Simulation of Quantum Machine Learning [0.0] 量子状態ベクトル上でのゲート層の作用をシミュレーションするための普遍的およびゲート固有の手法をベンチマークする。
我々は、与えられた回路の各層に対して最も効率的なシミュレーション手法を用いて、TQml Simulatorという数値シミュレータを開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:19:05 GMT)
Superbunching from coherently driven atoms in a waveguide [0.0] 一次元導波路の弱いコヒーレント場によって共鳴的に駆動される同一の2レベル原子$N$の散乱場について検討する。
この伝達は、全てのN$原子が励起される過程を通してのみ可能であり、多重光子状態の生成を可能にする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:27:35 GMT)
State Space Decomposition of Quantum Dynamical Semigroups [0.0] 開量子系の連続時間における平均進化は、量子チャネルの時間連続半群によって記述される。
この分解をオープンな量子ランダムウォークと量子軌道のクラスに適用し、その特異性を研究する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:28:22 GMT)
Spin textures in curved paths on a curved surface [0.0] 曲がった経路に閉じ込められたスピン-1/2粒子の量子力学の研究。
我々は、曲線の測地線曲率、正規曲率、測地線ねじりが創発的非アベリアゲージポテンシャルを支配していることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:13:07 GMT)
Spacetime Markov length: a diagnostic for fault tolerance via mixed-state phases [0.0] 測定および物理誤差を経験する局所安定化器符号の耐故障性と物質相の混合状態との対応性を確立する。
物質の混合状態における最近の発展から、これは、時空マルコフ長と呼ばれる耐故障性の診断を動機付けている。
副産物として, 脱コヒーレンスは非コヒーレントな摂動とコヒーレントな摂動によって引き起こされる高次対称性保護トポロジカル相からの遷移を明らかにするのに有用であると考えられた。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:50:47 GMT)
Space-time-symmetric non-relativistic quantum mechanics: Time and position of arrival and an extension of a Wheeler-DeWitt-type equation [0.0] 我々は、$phi(t, y, z | x)$ のような空間条件波動関数を導入し、$x$ は進化パラメータの役割を担う。
自由粒子に対しては、$phi(t, y, z | x) = langle t, y, z | phi(x) ラングル$ が公理的キョフスキ分布と同じ運動量波関数に自然に依存することを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:43:03 GMT)
Software Bill of Materials in Software Supply Chain Security A Systematic Literature Review [0.0] SBOM(Software Bill of Materials)は、ソフトウェアサプライチェーン(Software supply chains, SSC)の確保に欠かせないツールであると考えられている。
この体系的な文献レビューは、現在SBOMがSSCセキュリティの強化にどのように使われているかを評価するために、40の査読された研究から証拠を合成する。
生成ツール、データプライバシ、フォーマット/標準化、共有/配布、コスト/オーバーヘッド、脆弱性のエクスプロイラビリティ、メンテナンス、分析ツール、偽陽性、隠されたパッケージ、改ざんなどである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:49:12 GMT)
Sentinel: SOTA model to protect against prompt injections [0.0] 大規模言語モデル(LLM)はますます強力になるが、インジェクション攻撃の迅速化には弱い。
本稿では,応答型/ModernBERT大規模アーキテクチャに基づく新しい検出モデルであるSentinelを紹介する。
包括的で目に見えない内部テストセットでは、センチネルは平均精度0.987、F1スコア0.980を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:07:15 GMT)
Sentiment Analysis in Learning Management Systems Understanding Student Feedback at Scale [0.0] 非言語コミュニケーションの欠如は、教育経験の有効性を低下させる言葉によるフィードバックへの依存につながった。
本稿では,学生と教師のギャップを埋めるために,感情分析を学習管理システム(LMS)に統合することを検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:13:07 GMT)
SESaMo: Symmetry-Enforcing Stochastic Modulation for Normalizing Flows [0.0] 本稿では,Symmetry-Enforcecing Modulation (SESaMo)を紹介する。
SESaMoは、誘導変調と呼ばれる新しい技術により、バイアス(例えば対称性)を正規化フローに組み込むことを可能にする。
数値実験では、8-ガウス混合モデルと物理的に関連する場理論を含む様々なシナリオでSESaMoをベンチマークした。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:24:20 GMT)
Revisiting 3D LLM Benchmarks: Are We Really Testing 3D Capabilities? [0.0] 2D-Cheating」問題は点雲の描画画像で簡単に解ける。
我々は、真の3D理解をよりよく評価するための原則を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:35:34 GMT)
Realization of maximally-entangling two-qutrit gates using the Cross-Resonance scheme [0.0] 固定周波数トランスモン上での2量子ゲートの最大絡み合いを実現するための包括的理論的枠組みを提案する。
一般化されたクロス共振方式を用いて、トランスモンの0-1$と1-2$のエネルギー遷移に作用するパラメトリック2量子ゲートを設計する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:43:01 GMT)
Random Circuits in the Black Hole Interior [0.0] ブラックホール内部の虫穴の幾何学的長さとランダム性の顕微鏡的測定値との間には,定量的なホログラフィー的関係が認められた。
半古典的双対がアインシュタイン・ローゼン核子を含むブラックホールの状態のアンサンブルをランダム回路で作成する。
指数的に長い回路時間では、ERカタピラーのアンサンブルはブラックホールのランダムな状態の集まりと区別できない。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:14:42 GMT)
Quasinormal modes and complexity in saddle-dominated SU(N) spin systems [0.0] 粒子の振舞いを再現するスピン系を、N=2,3$で$N$次元のド・ジッター空間で研究する。
これらの量の初期特性がサドル点によって支配されているにもかかわらず、深夜の挙動をよく観察すると、システムの可積分性が明らかになる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:00:00 GMT)
Quantum simulation of the Hubbard model on a graphene hexagon: Strengths of IQPE and noise constraints [0.0] In thissimulated the Hubbard model on a six-site graphene hexagon using Qiskit。
我々は、その基底状態特性を決定するためにIQPEとアダバティック進化アルゴリズムを用いる。
これらの制約を検討するために、IBMの真のバックエンドの特徴に合わせたカスタムノイズモデルを用いて、Qiskit Aerシミュレータを利用する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:40:08 GMT)
Quantum error-correcting codes via inner products and error bases [0.0] 有限レベル量子系における状態通信のノイズ影響チャネルによる問題に対処する。
提案手法は, 破損部分空間上で定義された符号と誤り(あるいはノイズ)に基づく内積の復号化に関する自己整合理論に基づいている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:46:35 GMT)
Quantum correlations versus spin magnitude: Transition to the classical limit [0.0] 熱平衡における量子スピン($j$,1/2)系の遷移を研究する。
不協和型量子相関は、任意に大きなスピンに対しても存在することができる。
安定な量子相関はスピン$j$が成長するにつれて徐々に減少し、古典的極限に達すると最終的に消滅する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:11:22 GMT)
Quantum correlations in general qubit-qudit axially symmetric states [0.0] 任意のスピン$S$を持つ混合スピン$(1/2,S)$系について検討し、相互作用はU(1)軸対称を満たす。
局所量子不確実性(LQU)および局所量子フィッシャー情報(LQFI)の解析公式は、密度行列の要素と固有値から直接導出される。
両方の量子相関の高温は明確に見いだされる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:51:55 GMT)
Quantum Alternating Operator Ansatz for the Preparation and Detection of Long-Lived Singlet States in NMR [0.0] NMRの熱状態から長寿命一重項状態(LLS)を作成するためのQAOA配列の設計について述べる。
数値解析を用いて、制御パラメータの幅広い誤差に対して、QAOAシーケンスの効率性とロバスト性について検討する。
2ビットレジスタを超えるQAOAシーケンスの適用性を数値的に示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:24:52 GMT)
Propaganda and Information Dissemination in the Russo-Ukrainian War: Natural Language Processing of Russian and Western Twitter Narratives [0.0] この記事は、戦争の開始時から収集されたプロパガンダアカウントと信頼できるアカウントからのつぶやきの分析を行う。
我々は、自然言語処理と機械学習アルゴリズムを利用して感情を評価し、主要なテーマを特定する。
以上の結果から,情報生成・拡散・ターゲットの仕方において,両面から異なる視点を対象とする異なる戦略が示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:11:55 GMT)
Predicting memorization within Large Language Models fine-tuned for classification [0.0] 大規模言語モデルはトレーニングデータのかなりの割合を記憶しており、推論時に開示されると深刻な脅威となる。
そこで本研究では, LLMにおける暗記標本を, 分類タスクのための微調整で検出する手法を提案する。
提案手法は,新たな理論的結果によって支持され,計算予算の低さが要求される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:05:59 GMT)
Physical Annotation for Automated Optical Inspection: A Concept for In-Situ, Pointer-Based Trainingdata Generation [0.0] 本稿では,自動視線検査のためのトレーニングデータを生成するための新しい物理アノテーションシステムを提案する。
このシステムは、ポインタベースのin-situインタラクションを使用して、訓練された検査担当者の貴重な専門知識を直接機械学習(ML)トレーニングパイプラインに転送する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:37:24 GMT)
Photon Antibunching from Superposed Squeezed Vacua via Quantum Interference [0.0] 光のアンチバンチングは、量子技術にとって重要な非古典的な光の目印である。
非直交圧縮成分間の量子干渉が光子統計の正確なチューニングを可能にすることを示す。
結果は、光の工学的状態における新しい量子制御の次元を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:34:47 GMT)
Perturbative Gradient Training: A novel training paradigm for bridging the gap between deep neural networks and physical reservoir computing [0.0] 摂動勾配訓練(英: Perturbative Gradient Training、PGT)は、物理貯水池のブラックボックスの性質によりバックプロパゲーションを行うことができないことを克服する訓練パラダイムである。
PGTは,バックプロパゲーションが非現実的あるいは不可能な場合に,標準的なバックプロパゲーション手法に匹敵する性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:06:30 GMT)
Parking, Perception, and Retail: Street-Level Determinants of Community Vitality in Harbin [0.0] 本研究では,中国ハルビン市における街路レベルの特徴が小売業のパフォーマンスとユーザ満足度にどのように影響するかを検討するための,解釈可能な画像ベースフレームワークを提案する。
我々は,MeituanとDianpingのデータからCommunity Commercial Vitality Index (CCVI)を構築し,GPT-4に基づく知覚モデルを用いて抽出した空間的属性との関係を分析する。
その結果、中程度の車両の存在が商業的アクセスを高める一方で、路上駐車の過度な侵食は歩行性を損なう可能性があり、満足度と店舗レベルの価格の両方を低下させることが明らかとなった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:28:48 GMT)
Oversight Structures for Agentic AI in Public-Sector Organizations [0.0] 責任あるエージェントのデプロイメントに不可欠な5つのガバナンスの側面を特定します。
エージェントの監視は、既存の3つのガバナンス課題の強化バージョンを提供する。
本稿では,公共セクターの制約に適合する制度構造と設計エージェントを両立させるアプローチを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:57:15 GMT)
Orbit classification and analysis of qutrit graph states under local complementation and local scaling [0.0] この研究は、絡み合いのクラスを7つの四重項まで完全に特徴づけ、各クラスを軌道にマッピングする。
軌道のグラフ理論的性質を研究し、それらが持つリッチな構造を照らす。
グラフ理論特性とシュミット測度との相関は、キューディット状態の準備とフォールトトレランスに関する有用な洞察を与える。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:00:26 GMT)
Optomechanical systems with nonlinear interactions: photon blockade, collapse-revival effect and Fano-like resonance [0.0] このような系における光子遮断、崩壊、光振動の再生の効果が実現できることが示されている。
これらのクロスカーの非線形性の影響は、光学モードの減衰率の増加とともに消失し、またゼロ温度で完全に抑制される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:51:58 GMT)
OpenMaskDINO3D : Reasoning 3D Segmentation via Large Language Model [0.0] 本稿では,包括的3次元理解とセグメンテーションのためのフレームワークであるOpenMaskDINO3Dを紹介する。
OpenMaskDINO3Dは、ポイントクラウドデータとテキストプロンプトを処理し、多くの3Dタスクで優れたインスタンスセグメンテーションマスクを生成する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:57:43 GMT)
Ontology-based knowledge representation for bone disease diagnosis: a foundation for safe and sustainable medical artificial intelligence systems [0.0] 本研究では,Ho Chi Minh City Hospital for Traumatology and Orthopedicsと共同で開発された骨疾患診断のためのオントロジーベースのフレームワークを提案する。
この方法論は、体系的な知識のデジタル化、標準化された医療用語マッピング、モジュールアーキテクチャ設計を通じて臨床解釈可能性を維持する。
今後は、臨床データセットの拡充と総合的なシステム検証の実施に注力する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:41:23 GMT)
On the analytical approach to infinite-mode Boson-Gaussian states [0.0] 我々はYosida近似を用いて、状態$rho$$rho$-integrabilityに関して、潜在的に有界な可観測物の可積分性を定義する。
可換な$*$-algebraのすべての要素は、おそらく有界な$rho$-integrable observable $A$によって生成され、$langle Arangle$と表記されるのは正規で$rho, $-integrableである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:07:01 GMT)
Normative Conflicts and Shallow AI Alignment [0.0] 大規模言語モデル(LLM)のようなAIシステムの進歩は、安全なデプロイメントに対する懸念をますます高めている。
この脆弱性は、既存のアライメントメソッドの根本的な制限を反映している、と私は主張する。
人間の熟考的推論能力が、同じような敵の戦術に対する弾力性を高めることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:57:28 GMT)
New exact solutions of the 3D Schrödinger equation [0.0] 正ゲージ不変のワイル・ストラトノビッチ準確率密度関数を持つ一意量子系を求める。
エネルギースペクトルと固有関数の集合の明示的な表現が発見されている。
電磁シュル「オーディンガー方程式の解が得られ、単一の渦確率束場によって定義されるギユモトレフディラック弦ギュイユモトライトの形で磁場が与えられる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:01:44 GMT)
Network Hexagons Under Attack: Secure Crowdsourcing of Geo-Referenced Data [0.0] 本稿では,公開鍵基盤(PKI)と短命証明書を組み合わせたセキュリティアーキテクチャを提案する。
提案手法は,ランダム化鍵回転と適応的地理空間分解能により,ユーザとデバイスの匿名性を保証する。
以上の結果から,レイテンシが25%以上向上したり,スループットが7%以上低下したりすることなく,必要なセキュリティレベルを達成することが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:27:10 GMT)
Natural Language Interaction with Databases on Edge Devices in the Internet of Battlefield Things [0.0] インターネット・オブ・バトルフィールド・モノズ(IoBT)は、状況意識を高める新たな機会をもたらす。
批判的意思決定における状況認識のためのIoBTの可能性を高めるために、これらのデバイスからのデータは、コンシューマ対応の情報オブジェクトに処理されなければならない。
本稿では、自然言語処理(NLP)を利用してデータベース技術に問い合わせ、自然言語で応答を返すワークフローを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:52:13 GMT)
Multiple-Choice Question Generation Using Large Language Models: Methodology and Educator Insights [0.0] 大規模言語モデル(LLM)は、教育資料の作成と質問応答のための強力なツールとして登場した。
本稿では,Llama 2 と Mistral, GPT-3.5 の3つの LLM の比較分析を行った。
提案手法では,LLMの知識に頼らず,その知識を幻覚と対比させるプロンプトに注入し,学習者がテストのソーステキストを制御できるようにする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:21:49 GMT)
Multidimensional Analysis of Specific Language Impairment Using Unsupervised Learning Through PCA and Clustering [0.0] 特定言語障害(SLI)は、子供の約7%に影響を及ぼす。
従来の診断アプローチは、しばしば標準化された評価に依存しており、微妙な発達パターンを見落としている。
本研究の目的は、教師なし機械学習技術を用いて、SLIと非障害児の自然言語発達軌跡を同定することである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:29:12 GMT)
Multi-Point Proximity Encoding For Vector-Mode Geospatial Machine Learning [0.0] 本稿では,形状から参照点の集合への拡大距離に基づく符号化手法を提案する。
この手法であるMultiPoint (MPP)エンコーディングは任意の形状に応用でき、ベクトルモード特徴の符号化表現を用いた機械学習モデルのパラメータ化を可能にする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:22:47 GMT)
Multi-Language Detection of Design Pattern Instances [0.0] 本稿では,多言語パターン検出ツールDP-LARAを提案する。
これは、LARAフレームワークの多言語機能を使用して、コードベースのパターンインスタンスを見つけるのをサポートする。
いくつかのソフトウェアプロジェクトでDP-LARAの検出性能と一貫性を評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:05:59 GMT)
MULTISS: un protocole de stockage confidentiel {à} long terme sur plusieurs r{é}seaux QKD [0.0] 本稿では,複数の量子鍵分布(QKD)ネットワークに分散した長期記憶のための新しいプロトコルであるMultiSSを提案する。
本プロトコルでは,完全セキュリティを確保しつつ,複数のQKDネットワークにシークレットを分散するために,階層的なシークレット共有を用いる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:28:01 GMT)
Leveraging Diffusion Models for Parameterized Quantum Circuit Generation [0.0] 我々は、量子回路(PQC)を合成するために、拡散モデル(DM)に基づく生成的アプローチを導入する。
我々は,高忠実度グリーンベルガー・ホーネ・ザイリンガー(GHZ)状態の生成に最適化されたPQCを合成し,量子機械学習(QML)分類タスクにおいて高い精度を達成するためのアプローチを実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:27:22 GMT)
Learning-Augmented Algorithms for MTS with Bandit Access to Multiple Predictors [0.0] 我々は、$O(text2/3)$の後悔をいかに達成するかを示し、Dekel et al の構成に基づいて、厳密な下限を証明する。
これは、メモリ境界の敵に対する学習に関連している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:00:37 GMT)
Learning collective variables that preserve transition rates [0.0] 集団変数(CV)は、高次元系の希少事象を捉える上で重要な役割を担っている。
本稿では,多様体学習のツールをグループ不変の成果化と統合したニューラルネットワークベースのCVの設計法を提案する。
遷移速度再現のための拡散テンソルにおける一様正定性の必要性に挑戦する実証的証拠を提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:31:31 GMT)
Learning Using a Single Forward Pass [0.0] Solo Pass Embedded Learning Algorithm (SPELA) は、資源制約環境における従来のバックプロパゲーションの限界を克服するために提案されている。
SPELAは局所損失関数を用いて重みを更新し、勾配の伝播に割り当てられたリソースを著しく節約し、計算グラフを保存する。
以上の結果から,SPELAは局所学習や早期退避といった特徴を持つため,資源制約のあるエッジAIアプリケーションにおいて学習の候補となる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:31:07 GMT)
Learning Rock Pushability on Rough Planetary Terrain [0.0] 本研究では,移動ロボットに搭載されたロボットマニピュレータの操作機能を活用することにより,非構造環境における移動ナビゲーションの代替手法を提案する。
提案フレームワークは,外的および内的フィードバックを統合し,障害物の押し出し能力を評価し,回避ではなく再配置を容易にする。
ナビゲーション手法の目的は,月面や火星面などの自律的なインフラ開発が不可欠である環境において,複数のエージェントが長期にわたって使用するルートの効率を向上させることである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:00:47 GMT)
Learning Beyond Experience: Generalizing to Unseen State Space with Reservoir Computing [0.0] 貯留層計算は、明示的な構造的前提なしに、探索されていない状態空間の領域に一般化することができる。
一つのアトラクションの流域から軌道で訓練されたRCは、領域外一般化を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:46:07 GMT)
Labelling Data with Unknown References [0.0] ラベラーとしての性能を測定するための合意された方法が存在する場合、評価者は信頼に値する。
既存の参照を使わずに評価者への信頼を確立するアルゴリズムを導入する。
これは、評価者が実際にコーパスをラベル付けする方法を知っている場合、No-Data Algorithmがその出力を受け入れるように、信頼性を確立するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:39:07 GMT)
LLMs for sensory-motor control: Combining in-context and iterative learning [0.0] 本研究では,連続的な観察ベクトルを直接連続的な行動ベクトルにマッピングすることにより,大規模言語モデルによるエンボディエージェントの制御を可能にする手法を提案する。
この方法は、Gymnasiumライブラリの古典的な制御タスクと MuJoCoライブラリの逆振り子タスクで検証される。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:38:28 GMT)
Interpretable Multimodal Framework for Human-Centered Street Assessment: Integrating Visual-Language Models for Perceptual Urban Diagnostics [0.0] 本稿では,新しいマルチモーダルストリート評価フレームワーク(MSEF)を紹介する。
パラメータ効率適応のためにLoRAとP-Tuning v2を用いてフレームワークを微調整する。
このモデルは、客観的特徴に関するF1スコアの0.84と、集約された居住者の知覚との89.3%の一致を達成している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:34:04 GMT)
Integrated photonics for continuous-variable quantum optics [0.0] 量子光学の連続可変状態は、重力波の検出を含む多くの技術で利用されてきた。
このレビューは、連続可変光状態のソースと検出器をチップスケールのフォトニック集積回路に統合する取り組みに焦点を当てている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:58:49 GMT)
Infinitesimal Higher-Order Spectral Variations in Rectangular Real Random Matrices [0.0] 実矩形行列における特異値の一般$n$-次フレット微分を導出するための理論的枠組みを提案する。
自己随伴作用素に対する加藤の摂動解析理論から還元分解子作用素を利用する。
我々のフレームワークは、ランダム行列応用における高次スペクトル感度研究のための実用的なツールキットを研究者に提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:40:31 GMT)
Inference economics of language models [0.0] 我々は,トークン単位のコストとシリアルトークン生成速度の間の経済的トレードオフに対処する理論モデルを開発する。
我々のモデルは、演算、メモリ帯域幅、ネットワーク帯域幅および遅延制約を考慮している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:28:09 GMT)
Improving LLMs with a knowledge from databases [0.0] 大規模言語モデル(LLM)は、ほぼ毎回大きな進歩を遂げています。
検索強化生成(RAG)、エージェント、ツールなど、多くの高度な技術が導入され、広く受け入れられている。
本稿では,定義した知識パターンに基づいてルールセットを生成し,ルールをルールからテキストへ変換する手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:14:25 GMT)
Improving Generalization in MRI-Based Deep Learning Models for Total Knee Replacement Prediction [0.0] 変形性関節症イニシアチブ(OAI)データベースからMRIデータを用いてモデルを訓練し,評価した。
その結果,両領域の分類精度は統計的に有意に向上した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:43:42 GMT)
Improving AI-generated music with user-guided training [0.0] 画像生成アルゴリズムは、新しい音楽を生成するために応用することができる。
これらのアルゴリズムは通常、固定データセットに基づいて訓練される。
本稿では,ユーザインタラクションに基づくアルゴリズムの性能向上のためのヒューマン・コンピューティング手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:22:54 GMT)
Hybrid deep convolution model for lung cancer detection with transfer learning [0.0] 肺がんは、世界中でがん関連死亡の原因の1つとなっている。
我々は,MSNN(Maximum Sensitivity Neural Network)と呼ばれる伝達学習を利用したハイブリッド深層畳み込みモデルを提案する。
MSNNは、感度と特異性を改善することにより、肺がん検出の精度を向上させるように設計されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 10:06:50 GMT)
Hybrid between biologically inspired and quantum inspired many-body states [0.0] パーセプリンの単純なネットワークから可変多体アンサッツを構築する。
このネットワークは、テンソルネットワークから受け継いだいくつかの異なる特徴を持つニューラルネットワークと考えることができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:57:48 GMT)
Heterogeneous Sequel-Aware Graph Neural Networks for Sequential Learning [0.0] 続編を意識したグラフニューラルネットワークは,後続情報を考慮しないグラフベースのレコメンデーションシステムよりも優れたレコメンデーション性能を示す。
以上の結果から,商品からのシーケンス情報の導入により,推薦が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 22:58:24 GMT)
GOLFer: Smaller LM-Generated Documents Hallucination Filter & Combiner for Query Expansion in Information Retrieval [0.0] GOLFerは、より小さなオープンソースLMをクエリ拡張に活用する新しい手法である。
より小さなLMで共通する問題である、生成された文書の非実例および矛盾文を検出し、削除する。
より小さなLMを用いて他の手法を一貫して上回り、大型のLDMを用いた手法と競合する性能を維持している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:45:48 GMT)
GKLS Vector Field Dynamics for Gaussian States [0.0] ガウス状態によって記述された系に対するGKLS生成器に付随するベクトル場を構築する。
GKLS力学は分解原理、すなわち、このベクトル場を3つの部分で分解できることが示されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:09:14 GMT)
Full-Parameter Continual Pretraining of Gemma2: Insights into Fluency and Domain Knowledge [0.0] 大規模言語モデル(LLM)を用いた連続学習における言語流布とドメイン知識の関係を実証的に検討する。
具体的には、CulturaXデータセットのリトアニア語コンポーネントの最初の10%に設定された全パラメータを自動回帰的に事前学習することで、リトアニア語におけるGemma2 LLMの言語流用性を高める。
モデルの既存のドメイン知識の破滅的な忘れを防止するために、弾性重み強化(EWC)を適用する。
学習後評価では、難易度による言語流布度を評価し、言語理解ベンチマークの精度を用いてドメイン知識を評価する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:13:42 GMT)
From Struggle (06-2024) to Mastery (02-2025) LLMs Conquer Advanced Algorithm Exams and Pave the Way for Editorial Generation [0.0] 本稿では,大学レベルのアルゴリズム試験において,最先端の大規模言語モデル(LLM)の性能を総合的に評価する。
ルーマニア語の試験と、その高品質な英語翻訳の両方で複数のモデルをテストすることで、LLMの問題解決能力、一貫性、多言語のパフォーマンスを分析する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:41:20 GMT)
From Rogue to Safe AI: The Role of Explicit Refusals in Aligning LLMs with International Humanitarian Law [0.0] 大規模言語モデル (LLM) は様々な分野で広く使われているが、国際人道法 (IHL) との整合性はよく理解されていない。
本研究は、これらの法的枠組みに明示的に違反するプロンプトを拒否する能力について、8つの主要なLCMを評価した。
発見は、より安全で透明性の高いAIシステムの開発に寄与する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:53:29 GMT)
Field-controlled Electronic Breathing Modes and Transport in Nanoporous Graphene [0.0] 1nm幅のグラフェンナノリボンは2次元結晶格子の分子ブリッジを介して結合した。
NPGは分子構造にもかかわらず、例えばタルボット波の干渉を示す電子導波路として機能する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:42:14 GMT)
FaCTR: Factorized Channel-Temporal Representation Transformers for Efficient Time Series Forecasting [0.0] 時系列データは、時間ステップごとの情報密度が低く、チャネル間の複雑な依存関係が特徴である。
構造設計を明示した軽量な変換器FaCTRを提案する。
コンパクトな設計にもかかわらず、FaCTRは11の公開予測ベンチマークで最先端のパフォーマンスを誇った。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:17:53 GMT)
Exp4Fuse: A Rank Fusion Framework for Enhanced Sparse Retrieval using Large Language Model-based Query Expansion [0.0] 大規模言語モデル(LLM)は、クエリ拡張のための仮説文書を生成する可能性を示している。
スパースレトリバーの性能を向上させる新しい融合ランキングフレームワークExp4Fuseを導入する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:44:34 GMT)
Event Classification of Accelerometer Data for Industrial Package Monitoring with Embedded Deep Learning [0.0] 本稿では,組込みシステムを用いて再利用可能なパッケージ上に配置し,その状態を検出する手法を提案する。
我々は,再利用可能なパッケージの寿命に対応した,数年の寿命を持つシステムを設計することを目指している。
本研究では,不均衡な時系列データを対象としたディープラーニングモデルの,データ処理,トレーニング,評価を含むパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:55:58 GMT)
Enhancing Frequency for Single Image Super-Resolution with Learnable Separable Kernels [0.0] Learnable Separable Kernels (LSK) は、画像周波数成分を直接強化するために設計されたランク1の行列である。
LSKを組み込んだベースライン法は、パラメータ数と計算要求の両方で60%以上の大幅な削減を示している。
実験により、LSKを組み込むことでパラメータや計算負荷を削減できるだけでなく、全体のモデル性能も向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 02:01:59 GMT)
Enhanced spreading in continuous-time quantum walks using aperiodic temporal modulation of defects [0.0] パロンドのパラドックスは、2つの敗戦戦略の交互化が勝利をもたらす可能性があるが、最近は連続時間量子ウォークで実証されている。
決定論的非繰り返し欠陥切換えは, 欠陥のない場合と比較してCTQWの量子拡散を促進できることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:10:23 GMT)
Enhanced Drought Analysis in Bangladesh: A Machine Learning Approach for Severity Classification Using Satellite Data [0.0] 干ばつはバングラデシュで広範囲にわたる環境問題を引き起こし、農業、社会経済的安定、食料安全保障に影響を及ぼした。
SPI(Standardized Precipitation Index)やPDSI(Palmer Drought Severity Index)といった伝統的な干ばつ指標は、土壌の水分や温度といった重要な要因を見落としていることが多い。
バングラデシュ38地域の干ばつを分類する衛星データ駆動機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 07:17:43 GMT)
Engineering Quantum-Enhanced Transport by Supertransfer [0.0] スーパートランスファー(Supertransfer)は、非局在励起によるドナーからアクセプターへのエネルギー移動率の増大である。
超伝導回路をベースとした量子デバイスを用いて,スーパートランスファーを直接観測できることを示す。
弊社のスーパートランスファー技術ガイドラインは、将来の量子化光収穫機の設計を知らせるものである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:54:15 GMT)
Energentic Intelligence: From Self-Sustaining Systems to Enduring Artificial Life [0.0] 本稿では,タスクパフォーマンスではなく,内部エネルギー規制による自己維持能力によって定義される自律システムであるエネルジェンティック・インテリジェンスを紹介する。
本稿では,エネルギーベースの実用機能と生存地平線を用いてこの原理を定式化し,エネルギー回収,熱制御,適応計算を閉ループ制御システムに統合するモジュールアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:52:21 GMT)
Einstein's Cat -- A Thought Experiment Against Anti-Relativist Claims [0.0] 反相対論者の中には、時間拡張は光時計に適用されると考える者もいる。
時間拡張は、光時計と全く同じ方法で機械時計に適用されなければならないと我々は主張する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:11:05 GMT)
EfficientQuant: An Efficient Post-Training Quantization for CNN-Transformer Hybrid Models on Edge Devices [0.0] 畳み込みブロックとトランスフォーマーブロックを組み合わせたハイブリッドモデルは、コンピュータビジョン(CV)タスクにおいて強力なパフォーマンスを提供するが、エッジデプロイメントにはリソース集約である。
EfficientQuantは、畳み込みブロックに均一な量子化を適用し、変形器ブロックに$log$量子化を適用する新しい構造対応PTQアプローチである。
EfficientQuantは、ImageNet-1Kデータセット上で、最小の精度損失で2.5倍のレイテンシ削減を実現している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 21:46:41 GMT)
Efficient Implementation of a Quantum Search Algorithm for Arbitrary N [0.0] 本稿では,$N$が2のパワーではないインスタンスに対するGroverの探索アルゴリズムの拡張について述べる。
計算基底状態のサブセット上での均一な量子重ね合わせ状態の生成に効率的なアルゴリズムを用いることで、多くのケースにおいてオラクル呼び出し(およびグローバーの反復)の数を大幅に削減できることを実証する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:15:51 GMT)
Efficient Characterization of N-Beam Gaussian Fields Through Photon-Number Measurements: Quantum Universal Invariants [0.0] 一般のN-ビームガウス場の量子普遍不変量は、場の強度モーメントの観点から研究される。
グローバル場や境界場の純度を含むこれらの不変量と強度モーメントを一意に結びつける方法が提案されている。
これらの不変量の決定は、それらの量子相関を含むガウス状態を特定する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:30:44 GMT)
Dynamic Context Tuning for Retrieval-Augmented Generation: Enhancing Multi-Turn Planning and Tool Adaptation [0.0] マルチターン対話とツール環境の進化をサポートするためにRAGを拡張する軽量フレームワークであるDynamic Context Tuning (DCT)を提案する。
DCTは計画の精度を14%改善し、幻覚を37%削減し、GPT-4の性能と大幅に低いコストで一致させる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:47:22 GMT)
Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences [0.0] ワンステップのテキスト・ツー・イメージジェネレータモデルでは、迅速な推論効率、柔軟なアーキテクチャ、最先端の生成性能などの利点がある。
本稿では,1段階生成モデルと人間の嗜好との整合性の問題について考察する。
本稿では,Diff-Instruct++ (DI++) を紹介した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:44:07 GMT)
Deep learning image burst stacking to reconstruct high-resolution ground-based solar observations [0.0] 短時間露光による現在の復元手法は、強い乱流と高い計算コストを伴う課題に直面している。
本稿では,100個の短い露光画像を1つの高品質な画像にリアルタイムに再構成する深層学習手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:10:31 GMT)
Deciding When Not to Decide: Indeterminacy-Aware Intrusion Detection with NeutroSENSE [0.0] NeutroSENSEは、IoT環境における侵入検出を解釈するためのニュートロゾフィックのアンサンブルフレームワークである。
システムは予測信頼を真理(T)、虚偽(F)、不確定性(I)に分解し、不確実な定量化と棄却を可能にする。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 11:43:31 GMT)
DM-SegNet: Dual-Mamba Architecture for 3D Medical Image Segmentation with Global Context Modeling [0.0] 本稿では,Dual-MambaアーキテクチャであるDM-SegNetについて述べる。
中心となるイノベーションは、解剖学的空間コヒーレンスを維持するために4方向の3Dスキャンを利用する4方向空間マンバモジュールである。
2つの臨床的に有意なベンチマークの大規模な評価は、DM-SegNetの有効性を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 17:49:46 GMT)
CzechLynx: A Dataset for Individual Identification and Pose Estimation of the Eurasian Lynx [0.0] 個人識別,2次元ポーズ推定,ユーラシア・リンクス(Lynx lynx)のインスタンスセグメンテーションのための最初の大規模オープンアクセスデータセットである CzechLynx を紹介する。
CzechLynxには、セグメンテーションマスク、アイデンティティラベル、20点の骨格が注釈付けされた30万枚以上のカメラトラップ画像が含まれており、15年間にわたって地理的に異なる2つの地域(南西ボヘミアと西部カルパチア)で系統的な監視を行った219人の個人をカバーしている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:05:43 GMT)
Controlling Summarization Length Through EOS Token Weighting [0.0] 生成されたテキストの長さを制御することは、要約を含む様々なテキスト生成タスクにおいて重要である。
クロスエントロピー損失計算において,EOSトークンを正確に予測することの重要性を高めることで,自動テキスト要約の長さを制御するための簡単なアプローチを開発する。
我々は,エンコーダデコーダと現代のGPTスタイルのLCMを用いて実験を行い,この手法が要約の品質に影響を与えることなく生成長を制御可能であることを示した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:25:28 GMT)
Constructive Symbolic Reinforcement Learning via Intuitionistic Logic and Goal-Chaining Inference [0.0] 従来の報酬に基づく最適化を構築的論理推論に置き換える,新たな学習・計画フレームワークを導入する。
私たちのモデルでは、アクション、トランジション、ゴールは論理命題として表現されます。
提案手法は, 完全な安全性, 解釈可能な動作, 効率的な収束を実現し, 無効な動作を伴わないことを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:49:31 GMT)
Compression, simulation, and synthesis of turbulent flows with tensor trains [0.0] テンソルトレイン(TT)を用いた離散メッシュ上での乱流の表現法を示す。
また, 圧縮不能なナビエ・ストークス方程式に従って3次元流体場の時間発展をシミュレートするTTソルバを提案する。
以上の結果より, 真に乱流状態にある流体は効率的なTT記述が認められていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:00:20 GMT)
Classical and quantum trace-free Einstein cosmology [0.0] トレースフリーアインシュタイン重力は古典的にも量子的にも機械的にも解ける。
いずれの場合も、宇宙定数として特定される観測可能量はハミルトニアンの6倍である。
宇宙定数に対応する可観測物のスペクトルを計算する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:54:50 GMT)
Chronoamperometry with Room-Temperature Ionic Liquids: Sub-Second Inference Techniques [0.0] 本稿では,クロノアンペロメトリウィンドウを1秒未満に削減する新しい数学的回帰手法を提案する。
初期過渡電流応答に推論アルゴリズムを適用することにより、定常電気化学パラメータを正確に予測する。
この技術がもたらす意味は、分析化学、センサー技術、バッテリー科学である。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 01:21:24 GMT)
Catching Stray Balls: Football, fandom, and the impact on digital discourse [0.0] 本稿では,サッカーに対する感情的反応がReddit上のデジタル空間におけるオンライン談話にどのように影響するかを検討する。
現実世界の出来事がコミュニティをまたがる感情の変化を引き起こすことが示されています。
否定的な感情は問題のある言語と相関し、結果が直接感情やポストの習慣に影響を与える。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:46:57 GMT)
Can LLMs Talk 'Sex'? Exploring How AI Models Handle Intimate Conversations [0.0] 本研究では,4つの大きな言語モデルが質的内容分析によって性的指向の要求をどのように処理するかを検討する。
Claude 3.7 Sonnetは厳密で一貫した禁制を採用し、GPT-4oはニュアンス付きコンテキストリダイレクトを通じてユーザーインタラクションをナビゲートする。
Gemini 2.5 Flashはしきい値ベースの制限で許容性を示し、Deepseek-V3は不整合な境界強制と実行拒否を示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:55:37 GMT)
Can Artificial Intelligence Trade the Stock Market? [0.0] 本稿では,Double Deep Q-Network (DDQN) と Proximal Policy Optimization (PPO) の2つのアルゴリズムに着目し,市場取引におけるDeep Reinforcement Learning (DRL) の利用について検討する。
S&P500指数とBitcoinの3つの通貨ペアにまたがるアルゴリズムを、2019-2023年の日々のデータに基づいて評価している。
その結果,貿易におけるDRLの有効性と,不利な条件下での貿易を戦略的に回避することでリスク管理能力が示された。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:59:10 GMT)
BacPrep: An Experimental Platform for Evaluating LLM-Based Bacalaureat Assessment [0.0] BacPrepは、自動評価のためのLarge Language Model(LLM)の可能性を探る実験的なオンラインプラットフォームである。
Googleの最新のモデルであるGemini 2.0 Flashを採用し、公式のグレーディングスキームによってガイドされ、実験的なフィードバックを提供する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:02:06 GMT)
BSBench: will your LLM find the largest prime number? [0.0] 合理的な答えのない質問に対するLSMのベンチマークは、聞こえるほど愚かなものではない。
このようなテストを可能にするベンチマークと,既存のデータセットを修正可能なメソッドを提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:59:16 GMT)
Applying Informer for Option Pricing: A Transformer-Based Approach [0.0] 本稿では,Informerニューラルネットワークのオプション価格への適用について検討する。
本研究は,予測精度を高めるために,Informerの効率的なアーキテクチャを導入することで,財務予測の分野に寄与する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 20:23:28 GMT)
Analysis of the Fokker-Planck Equation in Schwarzschild Spacetime: A Supersymmetric Connection [0.0] シュワルツシルト時空における熱ポテンシャルの力学をフォッカー・プランク方程式を用いて再解析する。
我々は、超対称量子力学(SUSY QM)とシュワルツシルト計量に関連するフォッカー・プランク力学の間の興味深い対応を強調した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:24:28 GMT)
An Exploration of Self-Supervised Mutual Information Alignment for Multi-Task Settings [0.0] SAMI(Self-Supervised Alignment with Mutual Information)は、行動選好とモデル応答の接続を促進するために条件付き相互情報を使用する。
マルチタスク環境でSAMIを探索する2つの実験を行った。
SAMIの1つのイテレーションは、DPOに対して57%の勝利率を持ち、タスクカテゴリ間のパフォーマンスに大きな変化がある。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 00:32:25 GMT)
Against (unitary) interpretation (of quantum mechanics): removing the metaphysical load [0.0] 我々は、原子領域の理論の本質であるべきものについて、ハイゼンベルクの元々の洞察に戻ろうとする。
理論の数学的定式化の要素には存在論的地位は与えられない。
その理論は、我々の研究室での出来事の記述に関するものである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 16:28:10 GMT)
Adversarial Combinatorial Semi-bandits with Graph Feedback [0.0] セミバンドにおいて、学習者は、決定されたアームセットから繰り返し選択し、実現された報酬の合計を受信し、選択された個々のアームの報酬をフィードバックとして観察する。
時間的地平線上での最適後悔は$T$が$widetildeTheta(SsqrtT+sqrtalpha ST)$としてスケールすることを示します。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 05:09:33 GMT)
Adiabatic dynamics in a V-type quantum system by oppositely chirped counterrotating circularly polarized laser pulses [0.0] 実験的に、測定された3次元光電子運動量分布(3D PMD)の形状の顕著な変化を観察する。
実験では,超連続偏光パルス整形とOC-CRCPフェムト秒レーザーパルスと速度マップを用いた光電子トモグラフィーを併用して3次元PMDを再構成した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:50:32 GMT)
Acceleration-induced transport of quantum vortices in joined atomtronic circuits [0.0] 密度結合した2つの環型原子ボース-アインシュタイン凝縮体間の持続電流の移動に加速がどう影響するかを考察する。
加速度はリング間の密度と位相のダイナミクスを調節し、周期渦振動のバイアスをもたらす。
我々は、この伝達が、弱いリンク振幅、初期持続電流構成、加速度強度と方向に依存するかを分析する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:24:36 GMT)
Accelerated spin-adapted ground state preparation with non-variational quantum algorithms [0.0] スピン適応基底状態(スピン適応基底状態、英: spin-adapted ground state)は、全スピンの大きさとスピン-$z$成分の外部指定値によって制約されるヒルベルト空間内の最低エネルギー状態である。
本稿では,スピン適応基底状態を得るための非偏差量子アルゴリズムに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:16:17 GMT)
Absence of topological order in the $U(1)$ checkerboard toric code [0.0] 2つの異なる星部分格子を持つ$U(1)$-対称性富化トーリック符号に対応する$U(1)$チェッカーボードトーリック符号について検討する。
これらの非自明な性質は、孤立した恒星の摂動限界において自然に説明できることを示す。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 12:54:11 GMT)
A study on Heisenberg-Weyl linear maps [0.0] ハイゼンベルク・ワイル作用素は、より高次元のパウリ作用素のエルミート一般化を提供する。
これにより、作用素の高次元代数におけるパウリ型写像の研究を一般化することができる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 14:42:10 GMT)
A new pathway to generative artificial intelligence by minimizing the maximum entropy [0.0] 現在のモデルは、生成されたデータとトレーニングセットの間の距離を最小にすることで訓練される。
トレーニングセットに適合しないが、最も情報に富むもっともノイズの多いデータ表現を見つけるフレームワークを通じてパラダイムシフトを導入する。
結果は、データ効率が良く柔軟性があり、生成プロセスの制御と影響を許容する一般的な物理駆動モデルである。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 19:38:23 GMT)
A new architecture of high-order deep neural networks that learn martingales [0.0] 微分方程式(SDE)の高次弱近似アルゴリズムに基づく新しいディープラーニングニューラルネットワークアーキテクチャを提案する。
このアーキテクチャは、深層学習モデルによるマーチンガレットの効率的な学習を可能にする。
また、このアーキテクチャに基づくディープニューラルネットワークの挙動を、金融デリバティブの価格設定問題に適用する場合にも検討する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:22:50 GMT)
A map of indefinite causal order [0.0] この"マップ"では、不明確な因果順序の概念を示し、異なる風味をすばやく旅します。
我々は、ルシアン・ハーディの量子重力へのアプローチに基づいて、不確定因果順序を研究するための幅広い概念的動機から始める。
この文書は著者の博士論文の抜粋として始まり、不確定な因果順序の地図として意図され、フィールド内の探検家を導くのに使用できる。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 03:51:58 GMT)
A framework for fluctuating times and counting observables in stochastic excursions [0.0] 探索関連量を効率的に計算する方法に関する技術的結果を提供する。
抽出統計は全計数統計結果を復元し, 観測可能な観測値の変動と定常状態拡散係数(ノイズ)の関係を明らかにする。
さらに, 3ビット吸収冷凍機, 細胞センシング, 生死過程の3つの問題に対して, 探索解析と実験結果の活用について考察した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:38:18 GMT)
A Warm-start QAOA based approach using a swap-based mixer for the TSP: theoretical considerations,implementation and experiments [0.0] 旅行セールスマン問題(TSP)に対応したスワップベースのミキサーを導入する。
本稿では,QAOAを任意の古典解によって生成される解で初期化するウォームスタート手法を提案する。
5人の顧客が参加するカスタムTSPインスタンスの実験結果が、このアプローチの有効性を実証している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 08:38:30 GMT)
A Tractable Protocol for Detection-Loophole-Free Bell Tests over Long Distances [0.0] 本稿では,遠隔ユーザ間の絡み合いを緩和するためのプロトコルを提案する。
我々は、この拡張の源として、準備状態の真空成分振幅の損失独立性を同定する。
提案手法は, 絡み合い分布の損失耐性を向上し, 長距離DIアプリケーションを実用的な実装に近づける。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 13:56:24 GMT)
A Resource Allocating Compiler for Lattice Surgery [0.0] 我々は,量子回路を格子手術操作のシーケンスに変換するコンパイラを提供する。
私たちのコードは、寛容なソフトウェアライセンスの下でGitHubで利用可能です。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 04:27:21 GMT)
A Neural Network Model of Spatial and Feature-Based Attention [0.0] 我々は人間の視覚的注意の側面にインスパイアされたニューラルネットワークモデルを設計した。
モデルの創発的注意パターンは、空間的および特徴に基づく注意に対応する。
この人間の視覚的注意とコンピュータビジョンにおける注意の類似性は、ニューラルネットワークモデルを用いて人間の認知を研究する上で有望な方向を示唆している。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 18:08:11 GMT)
A MARL-based Approach for Easing MAS Organization Engineering [0.0] マルチエージェントシステム(MAS)は、複雑で分散した問題に対処する能力のために、業界で成功している。
デプロイ環境での高複雑性と低可読性により、これらの手法の適用はコストがかかるか、安全性の懸念が高まる。
AOMEAは、MARL(Multi-Agent Reinforcement Learning)プロセスと組織モデルを組み合わせて、関連する組織仕様を提案する。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 09:59:36 GMT)
A Framework for Ethical Judgment of Smart City Applications [0.0] 本稿では,倫理的問題が生じる可能性のある様々なシナリオを考察する判断枠組みを提案する。
権利に基づく分析を通じて、スマートシティにおける倫理的実践を導くための13の倫理的原則とルールを開発した。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 15:47:43 GMT)
A Fast Unsupervised Scheme for Polygonal Approximation [0.0] 本稿では,閉ディジタル曲線の多角形近似のための高速かつ教師なしのスキームを提案する。
近似スキームは最先端の近似よりも高速で、ロシン測度と美的側面において同じと競合することが示されている。
論文参考訳(メタデータ) (Thu, 05 Jun 2025 06:18:48 GMT)