MOOSE-Chem3: Toward Experiment-Guided Hypothesis Ranking via Simulated Experimental Feedback [128.3] 本研究では,事前試験の結果に基づいて仮説を優先順位付けすることを目的とした,実験誘導ランキングの課題について紹介する。
本稿では,3つのドメインインフォームド仮定に基づいて,仮説性能を既知の基底的真理仮説に類似した関数としてモデル化するシミュレータを提案する。
実験結果を用いて,124の化学仮説のデータセットをキュレートし,シミュレーションの有効性を検証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:59:51 GMT)
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis [120.7] Video-MMEは、ビデオ解析におけるMLLMの完全なマルチモード評価ベンチマークである。
我々は,GPT-4シリーズやGemini 1.5 Pro,オープンソース画像モデルなど,最先端のMLLMを幅広く評価した。
我々の実験によると、Gemini 1.5 Proは最も優れた商用モデルであり、オープンソースモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:08:27 GMT)
On the Scaling of Robustness and Effectiveness in Dense Retrieval [111.6] ロバストさと有効性は、現実世界のアプリケーションのための密集した検索モデルを開発する上で重要な側面である。
最近の研究は、高密度検索における有効性のスケーリング法則に対処し、モデルとデータのサイズと有効性の間には、ゆるい関係があることを明らかにしている。
堅牢性と有効性は異なるスケーリングパターンを示しており、両方を共同で改善する場合、かなりのリソースコストがかかります。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:57:27 GMT)
VideoRoPE: What Makes for Good Video Rotary Position Embedding? [109.9] VideoRoPEは、長いビデオ検索、ビデオ理解、ビデオ幻覚といった様々な下流タスクにまたがって、従来型のRoPEを一貫して上回っている。
VideoRoPEは、周期的振動を緩和するためのテキスト低周波時間割当、空間対称性を維持するためのテキスト対角配置、時間的および空間的インデックスを分離するためのテキスト調整可能な時間間隔を備えている。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:54:16 GMT)
Mixpert: Mitigating Multimodal Learning Conflicts with Efficient Mixture-of-Vision-Experts [104.7] マルチモーダル大言語モデル(MLLM)は複雑な画像情報のニュアンス解釈を必要とする。
多様なタスクドメインを扱うために、単一のビジョンエンコーダにのみ依存することは、困難であり、必然的に衝突につながることを証明します。
単一ビジョンエンコーダからジョイントラーニングの利点を継承する,効率的なミキシング・オブ・ビジョン・エキスパートアーキテクチャであるMixpertを導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:48:07 GMT)
How much do language models memorize? [104.2] 我々は記憶を2つの構成要素に分けている:「文体記憶」と「文体一般化」である。
一般化を完全に排除すると、モデルキャパシティを見積もるトータル・メモリ化を計算することができる。
サイズが大きくなるデータセット上で言語モデルをトレーニングし、キャパシティが満たされるまでモデルを記憶し、その時点での「グルーキング」が始まり、モデルが一般化し始めるにつれて意図しない記憶が減少するのを観察する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:34:03 GMT)
DiffusionTrend: A Minimalist Approach to Virtual Fashion Try-On [103.9] DiffusionTrendは、事前情報に富んだ潜伏情報を利用して、衣服の詳細のニュアンスをキャプチャする。
視覚的に魅力的な試行体験を提供し、トレーニング不要の拡散モデルの可能性を強調します。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:48:20 GMT)
SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement [100.9] 我々はThinkLite-VLを紹介した。これは最先端(SoTA)パフォーマンスを実現する視覚推論モデルのファミリーで、トレーニングサンプルの桁数を桁違いに減らしている。
我々はMonte Carlo Tree Search (MCTS) を用いて、各インスタンスの解決に必要な視覚言語モデル(VLM)の推論反復数を用いてサンプルの難易度を測定する。
ThinkLite-VL-7BとThinkLite-VL-72Bは、8つの視覚的推論ベンチマークにおいて、それぞれのベースモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:53:16 GMT)
VITA: Towards Open-Source Interactive Omni Multimodal LLM [100.0] MLLM(Multimodal Large Language Model)の最初のオープンソースであるVITAを紹介する。
2段階のマルチタスク学習により,言語モデルに視覚的・音声的能力を持たせる。
VITAは、多言語、視覚、および音声理解の堅牢な基礎機能を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:57:16 GMT)
Agent-X: Evaluating Deep Multimodal Reasoning in Vision-Centric Agentic Tasks [94.2] 本稿では,実世界のマルチモーダル環境での視覚中心エージェント評価のためのベンチマークであるAgent-Xを紹介する。
Agent-Xは、828のエージェントタスクと、イメージ、マルチイメージ比較、ビデオ、命令テキストを含む、真の視覚的コンテキストを備えている。
その結果、GPT、Gemini、Qwenファミリーを含む最高のパフォーマンスモデルでさえ、多段階視覚タスクの解決に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:53 GMT)
TensorGRaD: Tensor Gradient Robust Decomposition for Memory-Efficient Neural Operator Training [91.9] textbfTensorGRaDは,重み付けに伴うメモリ問題に直接対処する新しい手法である。
SparseGRaD は総メモリ使用量を 50% 以上削減し,同時に精度も向上することを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:08:32 GMT)
Supervised Optimism Correction: Be Confident When LLMs Are Sure [91.7] 教師付き微調整とオフライン強化学習の間には,新たな理論的関係が確立されている。
広く使われているビームサーチ法は、許容できない過度な最適化に悩まされていることを示す。
本稿では,トークンレベル$Q$-value推定のための簡易かつ効果的な補助的損失を導入したSupervised Optimism Correctionを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:05:02 GMT)
Visual Embodied Brain: Let Multimodal Large Language Models See, Think, and Control in Spaces [91.0] VeBrainは、現実世界における認識、推論、制御のための統一されたフレームワークである。
VeBrainは、ロボット制御を2次元視覚空間における一般的なテキストベースのMLLMタスクに再構成する。
VeBrainは、既存の方法と比較して、強い適応性、柔軟性、および構成能力を示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:00:34 GMT)
SeePhys: Does Seeing Help Thinking? -- Benchmarking Vision-Based Physics Reasoning [89.5] 物理問題に基づく推論のための大規模マルチモーダルベンチマークである SeePhys を提示する。
このベンチマークは、物理学の分野にまたがる7つの基本的な領域をカバーし、21のカテゴリの非常に異質なダイアグラムを取り入れている。
最も先進的な視覚推論モデル(例えばGemini-2.5-proやo4-mini)でさえ、ベンチマークで60%未満の精度を実現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:22:56 GMT)
Towards Effective Code-Integrated Reasoning [89.5] モデルが必要に応じてコードを生成するコード統合推論について検討し、コードインタプリタを通じてそれを実行することによってフィードバックを統合する。
ツール強化強化学習は、学習力学における潜在的な不安定さに悩まされる可能性がある。
我々は、探索と安定性のバランスをとるための強化されたトレーニング戦略を開発し、推論性能を改善しながら、ツールの利用能力を徐々に構築する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:30:18 GMT)
ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models [89.4] 本稿では,KL分散制御,参照ポリシ,多様なタスクスイートを取り入れた新しいトレーニング手法であるProRLを紹介する。
我々の経験的分析により、RL学習モデルは、広範囲のpass@k評価において、ベースリセットモデルよりも一貫して優れていたことが明らかとなった。
これらの知見は、RLが言語モデルにおける推論境界を有意に拡張する条件について、新たな洞察を与える。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:01 GMT)
An Interpretable N-gram Perplexity Threat Model for Large Language Model Jailbreaks [87.6] 本研究では,ジェイルブレイク攻撃の原理的比較のための統一的脅威モデルを提案する。
私たちの脅威モデルは、あるジェイルブレイクがテキストの配布で起こりそうなかどうかをチェックします。
私たちはこの脅威モデルに人気のある攻撃を適応させ、これらの攻撃を同等の足場でベンチマークしました。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:02:54 GMT)
Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback [87.4] 我々はHyPERを紹介した。HyPERは、人間または言語モデル(LM)にアノテーションを付与するハイブリッド推論ルータである。
その結果,HyPERを用いた人工選好と直接選好の混合は,RewardBenchでは7-13%しか使用せず,RM性能が向上していることがわかった。
また、HyPERの機能を分析した結果、安全上の懸念や複雑さが人間のフィードバックから最も恩恵を受けていることがわかりました。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:40:44 GMT)
Continual Learning in Vision-Language Models via Aligned Model Merging [84.5] 塑性を保ちながら安定性を維持するために,モデルマージに基づく新しい視点を提案する。
マージプロセスの有効性を最大化するために,従来のものと一致した重みの学習を促進するシンプルなメカニズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:52:21 GMT)
SongComposer: A Large Language Model for Lyric and Melody Generation in Song Composition [82.4] SongComposerは、音楽専門の大規模言語モデル(LLM)である。
3つの重要なイノベーションを活用することで、メロディーをLLMに同時に構成する能力を統合する。
歌詞からメロディへの生成、メロディから歌詞への生成、歌の継続、テキストから歌への生成といったタスクにおいて、高度なLLMよりも優れています。
SongComposeは大規模なトレーニング用データセットで、中国語と英語の歌詞とメロディのペアを含む。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:33:14 GMT)
ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation [82.3] 我々は、検索拡張世代(RAG)を向上するための新しいフレームワークであるClueAnchorを提案する。
ClueAnchorは、検索したコンテンツからキーキーを抽出し、異なる知識構成に基づいて複数の推論パスを生成する。
実験の結果、ClueAnchorはRAG以前のベースラインよりも完全性や堅牢性に優れていた。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:18:08 GMT)
ReCalKV: Low-Rank KV Cache Compression via Head Reordering and Offline Calibration [81.8] 大きな言語モデル(LLM)は優れたパフォーマンスを実現しているが、キーバリュー(KV)キャッシュを保存するのに必要な過剰なメモリによって、長期コンテキスト推論の能力は制限されることが多い。
最近の方法では,KVキャッシュの隠れ次元の低減が検討されているが,プロジェクション層を通じての追加計算を導入する場合や,高い圧縮比下での大幅な性能劣化に悩まされる場合が多い。
本稿では,KVキャッシュの隠れ次元を削減した後学習KVキャッシュ圧縮手法ReCalKVを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:49:27 GMT)
ToolCoder: A Systematic Code-Empowered Tool Learning Framework for Large Language Models [81.1] ツール学習は、大規模な言語モデル(LLM)にとって、外部ツールとのインタラクションを通じて、複雑な現実世界のタスクを解決する重要な機能として登場した。
本稿では,ツール学習をコード生成タスクとして再編成する新しいフレームワークであるToolCoderを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:59:23 GMT)
Tackling View-Dependent Semantics in 3D Language Gaussian Splatting [80.9] LaGaは、3Dシーンをオブジェクトに分解することで、ビュー間のセマンティック接続を確立する。
セマンティック記述子をクラスタリングし、多視点セマンティックスに基づいてそれらを重み付けすることで、ビュー集約セマンティック表現を構築する。
同じ設定で、LaGaはLERF-OVSデータセットの以前のSOTAよりも+18.7% mIoUを大幅に改善した。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:06:32 GMT)
Quick-Draw Bandits: Quickly Optimizing in Nonstationary Environments with Extremely Many Arms [80.1] 本稿では,ガウス的手法を用いて連続空間上の報酬環境を学習するための新しいポリシーを提案する。
提案手法は,$mathcalO*(sqrtT)$ cumulative regret を用いて連続リプシッツ報酬関数を効率よく学習することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:15:18 GMT)
ScienceMeter: Tracking Scientific Knowledge Updates in Language Models [79.3] 大規模言語モデル(LLM)は、科学研究を支援するためにますます使われているが、科学的進歩に関する彼らの知識は急速に時代遅れになる。
我々は,過去,現在,未来にまたがる科学的知識の更新手法を評価するための新しいフレームワークであるScienceMeterを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:28:20 GMT)
TETRIS: Optimal Draft Token Selection for Batch Speculative Decoding [76.2] TETRISは、(バッチ内のすべてのリクエストに対して)最も有望なドラフトトークンを積極的に選択する。
我々は,TETRISがベースライン投機的復号法およびドラフトトークンを動的に選択する既存手法より優れていることを理論的かつ実証的に示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:40:23 GMT)
SongGen: A Single Stage Auto-regressive Transformer for Text-to-Song Generation [75.9] SongGenは、コントロール可能な曲を生成するための、完全なオープンソースでシングルステージの自動回帰トランスフォーマーである。
音声と伴奏の混合を生成する混合モードと、それらを別々に合成するデュアルトラックモードの2つの出力モードをサポートする。
コミュニティの関与と今後の研究を促進するため、私たちは、モデルの重み付け、トレーニングコード、注釈付きデータ、前処理パイプラインをリリースします。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:59:18 GMT)
GUICourse: From General Vision Language Models to Versatile GUI Agents [75.5] GUICourseは、ビジュアルベースのGUIエージェントをトレーニングするためのデータセットスイートです。
まず、OCRとVLMのグラウンド機能を強化するためにGUIEnvデータセットを導入する。
次にGUIActとGUIChatデータセットを導入し、GUIコンポーネントやインタラクションに関する知識を充実させます。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:30:07 GMT)
un$^2$CLIP: Improving CLIP's Visual Detail Capturing Ability via Inverting unCLIP [75.2] コントラスト言語-画像事前学習(CLIP)が基礎モデルとなり、様々なビジョンやマルチモーダルタスクに適用されている。
この作業は既存のCLIPモデルの改善に重点を置いており、可能な限り多くの画像の視覚的詳細をキャプチャすることを目的としている。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:29:38 GMT)
All-in-one: Understanding and Generation in Multimodal Reasoning with the MAIA Benchmark [74.5] MAIAはビデオにおける視覚言語モデルの推論能力の詳細な調査のためのベンチマークである。
視覚入力の役割を強調することにより、言語と視覚関係を混乱させようとする12のカテゴリを考察する。
MAIAは、そのデザイン、推論カテゴリ、使用するメトリクス、およびビデオの言語と文化に関して、他の利用可能なビデオベンチマークとは異なる。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:57:45 GMT)
GPT4Point: A Unified Framework for Point-Language Understanding and Generation [73.5] GPT4PointはMLLMフレームワーク内での3Dオブジェクトの理解と生成のための画期的なポイント言語マルチモーダルモデルである。
GPT4Pointは強力な3D MLLMであり、ポイントクラウドキャプションやQ&Aのような様々なポイントテキスト参照タスクをシームレスに実行できる。
幾何学的な形状や色を維持する低品質のポイントテキスト機能によって、高品質な結果が得られる。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:51:09 GMT)
DEMO: Reframing Dialogue Interaction with Fine-grained Element Modeling [73.1] 大規模言語モデル (LLM) によって実現された対話システムは、人間と機械の相互作用において中心的なモードの1つとなっている。
本稿では,新しい研究課題--$textbfD$ialogue $textbfE$lement $textbfMO$delingを紹介する。
本稿では,包括的対話モデリングと評価のために設計された新しいベンチマークである$textbfDEMO$を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:29:20 GMT)
ComposeAnything: Composite Object Priors for Text-to-Image Generation [73.0] ComposeAnythingは、既存のT2Iモデルを再トレーニングすることなく、合成画像生成を改善するための新しいフレームワークである。
提案手法はまずLLMの連鎖推論能力を活用し,テキストから2.5Dのセマンティックレイアウトを生成する。
本モデルでは,テキストを忠実に反映した合成による高品質な画像を生成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:13:36 GMT)
ReelWave: Multi-Agentic Movie Sound Generation through Multimodal LLM Conversation [72.2] 本稿では,自律型サウンドディレクタによって教師される音声生成のためのマルチエージェントフレームワークを提案する。
Foley ArtistはComposerとVoice Actorのエージェントと共同で働き、共同でオフスクリーンサウンドを自動生成して全体の生産を補完する。
本フレームワークは,映画から抽出した映像クリップに調和した,リッチで関連性の高い音声コンテンツを生成できる。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:48:57 GMT)
A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications [71.8] 本稿では、幾何学的メッセージパッシングの観点から、既存のモデルの統一的なビューを提供するデータ構造として幾何学的グラフを定式化する。
また、方法論開発と実験評価の後の研究を促進するために、アプリケーションと関連するデータセットを要約する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:56:59 GMT)
SiLVR: A Simple Language-based Video Reasoning Framework [71.8] 簡単な言語ベースのビデオ推論フレームワークであるSiLVRについて紹介する。
第一段階では、SiLVRは生動画を多感覚入力を用いて言語ベースの表現に変換する。
第2段階では、複雑なビデオ言語理解タスクを解決するために、言語記述を強力な理由付けLLMに入力する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:19 GMT)
Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.6] AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:42:02 GMT)
A Gold Standard Dataset for the Reviewer Assignment Problem [70.5] 類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
既存のアルゴリズムを比較し、より良いアルゴリズムを開発する上で重要な課題は、公開された金標準データの欠如である。
研究コミュニティにリリースした類似度スコアの新しいデータセットを収集します。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:34:07 GMT)
Rationales Are Not Silver Bullets: Measuring the Impact of Rationales on Model Performance and Reliability [70.4] 有理数拡張による学習言語モデルは、多くの既存の作品において有益であることが示されている。
モデル性能に対する合理的性の影響を徹底的に調査するため、包括的調査を行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:39:37 GMT)
Scaling Large Motion Models with Million-Level Human Motions [67.4] 我々は、モーション生成のための最初の100万レベルのデータセットであるMotionLibを紹介する。
我々は Projname という名の大きな運動モデルを訓練し、幅広い人間の活動に頑健なパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:53:31 GMT)
"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization [67.3] 量子化は大規模言語モデル(LLM)推論を高速化するための強力なツールであるが、異なるフォーマット間での精度と性能のトレードオフは依然として不明である。
FP8,INT8,INT4の量子化を学術ベンチマークや実世界のタスクで評価し,これまでで最も包括的な実証的研究を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:39:06 GMT)
Combining Domain and Alignment Vectors to Achieve Better Knowledge-Safety Trade-offs in LLMs [67.3] 我々は、ドメインとアライメントベクトルを補間し、より安全なドメイン固有モデルを作成する、textscMergeAlignと呼ばれる効率的なマージベースのアライメント手法を導入する。
医学やファイナンスの専門家であるLlama3の変種にtextscMergeAlignを適用することで、ドメイン固有のベンチマークを最小限または全く劣化させることなく、大幅なアライメントの改善が得られる。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:17:04 GMT)
Reinforcing Video Reasoning with Focused Thinking [65.9] 新たなフレームワークは、集中した思考と深い報酬の粒度による視覚的推論を強化する。
我々は,高情報密度のトークンを優先するトークン重み付け機構を採用している。
シングルチョイスからマルチチョイスQAタスクにシフトすることで、RLトレーニングを再構築する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:42:19 GMT)
Stereotype or Personalization? User Identity Biases Chatbot Recommendations [65.1] モデルでは,ユーザが意識を意図的に明らかにしたかどうかに関わらず,人種的にステレオタイプなレコメンデーションを生成する。
チャットボットは、ユーザーが明らかにしたアイデンティティの特徴によって、いつレコメンデーションが影響されるかを透過的に示すべきであるが、現在そうしていないことを観察すべきである、と我々は主張する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:25:09 GMT)
Sundial: A Family of Highly Capable Time Series Foundation Models [64.6] Sundialはネイティブでフレキシブルでスケーラブルな時系列基盤モデルのファミリーです。
我々のモデルは、事前の分布を指定せずに事前訓練されており、複数の確率予測を生成することができる。
Sundialは、ジャスト・イン・タイムの推論速度で、ポイントと確率予測ベンチマークの両方で最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:52:53 GMT)
DreamDance: Animating Character Art via Inpainting Stable Gaussian Worlds [64.5] ドリームダンス(DreamDance)は、安定的で一貫したキャラクタと、正確なカメラ軌跡を条件としたシーンの動きを生成できるアニメーションフレームワークである。
我々は、背景品質を高めつつ、動的キャラクタをシーンビデオに注入する、ポーズ対応ビデオ塗装モデルを訓練する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:54:34 GMT)
Breaking Resource Barriers in Speech Emotion Recognition via Data Distillation [64.4] 音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす。
モノのインターネットにおけるエッジデバイスの出現は、複雑なディープラーニングモデルを構築する上での課題を示している。
本研究では,IoTアプリケーションにおけるSERモデルの効率的な開発を容易にするためのデータ蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:29:15 GMT)
A*-Thought: Efficient Reasoning via Bidirectional Compression for Low-Resource Settings [64.4] A*-Thoughtは、最も本質的な思考を識別し、分離するために設計された効率的なツリー検索ベースの統合フレームワークである。
LRMの推論過程を探索木として定式化し、各ノードは巨大な推論空間における推論スパンを表す。
低予算でQwQ-32Bを2.39$times$で改善し、高予算で出力トークンの長さを50%近く削減できる。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:58:34 GMT)
The Hallucination Dilemma: Factuality-Aware Reinforcement Learning for Large Reasoning Models [64.0] 大規模言語モデル(LLM)は、強化学習(RL)最適化を通じて、推論タスクにおいて著しく進歩している。
しかし、推論指向RL微調整は幻覚の頻度を著しく高めている。
本稿では,明示的事実性検証を取り入れた革新的なRL微調整アルゴリズムであるFSPOを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:23:32 GMT)
UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation [63.9] 本研究では、適切な設計と微調整により、ビデオ生成モデルの本質的な一貫性を一貫した幾何推定に有効に活用できることを実証する。
その結果,ビデオのグローバルな幾何学的属性の予測性能が向上し,再構成作業に直接適用できることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:31:59 GMT)
DLM-One: Diffusion Language Models for One-Step Sequence Generation [63.4] DLM-Oneは連続拡散言語モデルを用いた1ステップシーケンス生成のためのスコア蒸留ベースのフレームワークである。
DLM-Oneが言語モデリングにおけるサンプリング効率を大幅に向上できるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:42:23 GMT)
StyleSinger: Style Transfer for Out-of-Domain Singing Voice Synthesis [63.2] ドメイン外歌唱音声合成(SVS)のためのスタイル転送は、目に見えないスタイルで高品質な歌唱音声を生成することに焦点を当てている。
StyleSingerは、ドメイン外参照音声サンプルのゼロショットスタイル転送のための最初の歌声合成モデルである。
ゼロショット・スタイル・トランスファーにおける評価は、StyleSingerが基準歌唱音声サンプルの音質と類似性の両方でベースライン・モデルより優れていることを不確実に証明している。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:09:30 GMT)
Safety Reasoning with Guidelines [63.2] RT(Refusal Training)は、様々なアウト・オブ・ディストリビューション(OOD)のジェイルブレイク攻撃に対する一般化に苦慮している。
本稿では,クエリ毎に安全推論を行うためのトレーニングモデルを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:43:42 GMT)
Threading Keyframe with Narratives: MLLMs as Strong Long Video Comprehenders [62.6] 長いビデオ理解のためのマルチモーダル大言語モデル(MLLM)は依然として難しい問題である。
伝統的な一様サンプリングは、無関係な内容の選択につながる。
数千フレームの訓練後のMLLMは、かなりの計算負担を課す。
本研究では,物語付きスレッディング(Nar-KFC)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:04:28 GMT)
Data Fusion for Partial Identification of Causal Effects [62.6] 本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:13:01 GMT)
TimeHC-RL: Temporal-aware Hierarchical Cognitive Reinforcement Learning for Enhancing LLMs' Social Intelligence [62.2] 時空間認識型階層型認知強化学習(TimeHC-RL)を導入し,大規模言語モデルの社会的知性を高める。
実験の結果, 広く採用されているSystem 2 RL法と比較して, 提案したTimeHC-RL法の方が優れていることがわかった。
7Bのバックボーンモデルウィングが提供され、DeepSeek-R1やOpenAI-O3といった高度なモデルのパフォーマンスに匹敵する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:01:06 GMT)
AutoReproduce: Automatic AI Experiment Reproduction with Paper Lineage [62.0] AutoReproduceは、研究論文に記載された実験をエンドツーエンドで自動再生できるフレームワークである。
結果は、AutoReproduceが平均的なパフォーマンスギャップを22.1%$で達成していることを示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:56:32 GMT)
Nested Hash Layer: A Plug-and-play Module for Multiple-length Hash Code Learning [61.1] Nested Hash Layer (NHL) は、深い教師付きハッシュモデルのためのプラグイン・アンド・プレイモジュールである。
NHLは、複数の長さのハッシュコードをネスト構造で同時に生成する。
NHLは、様々な深層型ハッシュモデルに対して、トレーニング速度を約5~8倍に向上させる。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:09:29 GMT)
MSDA: Combining Pseudo-labeling and Self-Supervision for Unsupervised Domain Adaptation in ASR [59.8] 本稿では,自己教師付き学習と半教師付き技術を統合する,サンプル効率のよい2段階適応手法を提案する。
MSDAは、ASRモデルの堅牢性と一般化を強化するように設計されている。
本稿では,メタPLがASRタスクに効果的に適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:46:05 GMT)
TCSinger: Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control [59.0] スタイル転送とスタイル制御を備えたゼロショット歌唱音声合成(SVS)は、目に見えない音色とスタイルで高品質な歌唱音声を生成することを目的としている。
言語間音声および歌唱スタイル間のスタイル伝達のための,最初のゼロショットSVSモデルであるTCSingerを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:11:27 GMT)
RuleArena: A Benchmark for Rule-Guided Reasoning with LLMs in Real-World Scenarios [58.9] RuleArenaは、大規模言語モデル(LLM)が推論において複雑な現実世界のルールに従う能力を評価するために設計された、新しくて挑戦的なベンチマークである。
航空会社の荷物手数料、NBA取引、税制の3つの実践的領域をカバーするルールアリーナは、複雑な自然言語命令を扱うのにLLMの習熟度を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:43:10 GMT)
QPO: Query-dependent Prompt Optimization via Multi-Loop Offline Reinforcement Learning [58.8] クエリ依存型プロンプト最適化(QPO)を導入し、入力クエリに合わせて最適なプロンプトを生成するために、小さな事前訓練された言語モデルを反復的に微調整する。
我々は、オープンソースのタスクに様々なプロンプトをベンチマークする副産物として、すでに大量に存在するオフラインのプロンプトデータから洞察を得る。
様々なLLMスケールと多様なNLPおよび数学タスクの実験は、ゼロショットと少数ショットの両方のシナリオにおいて、我々の手法の有効性とコスト効率を実証している。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:21:31 GMT)
DistiLLM-2: A Contrastive Approach Boosts the Distillation of LLMs [58.5] DistiLLM-2は、教師の反応の可能性を同時に増加させ、生徒の反応を減少させる対照的なアプローチである。
実験の結果,DistiLLM-2は様々なタスクにまたがって高性能な学生モデルを構築するだけでなく,多様なアプリケーションをサポートすることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:41:12 GMT)
White Men Lead, Black Women Help? Benchmarking and Mitigating Language Agency Social Biases in LLMs [58.3] 社会的バイアスは、Large Language Model(LLM)生成コンテンツにおいて言語エージェンシーに現れる。
LLMのバイアスを包括的に評価するLanguage Agency Bias Evaluationベンチマークを導入する。
LABEを用いて,近年の3つのLLM(ChatGPT,Llama3,Mistral)における言語エージェントの社会的バイアスを明らかにした。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:39:05 GMT)
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction [58.2] 近年,無限アニメライフシミュレーションの先駆的なアプローチとして,多ターンテキスト対話を画像生成のための言語命令に変換するために,大規模言語モデル(LLM)が採用されている。
本稿では,MLLM(Multimodal Large Language Models)をベースとしたAnimeGamerを提案する。
本稿では,アニメーション映像を高品質なビデオクリップにデコード可能な,アクション対応のマルチモーダル表現を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:00:25 GMT)
MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM [58.2] マルチモーダル幻覚は多源性であり、様々な原因から生じる。
既存のベンチマークでは、知覚誘発幻覚と推論誘発幻覚を適切に区別することができない。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:54:36 GMT)
V2SFlow: Video-to-Speech Generation with Speech Decomposition and Rectified Flow [57.5] 本稿では,V2SFlowについて紹介する。V2SFlowは,サイレント・トーキング・フェイス・ビデオから直接自然で分かりやすい音声を生成するために設計された,新しいビデオ音声合成(V2S)フレームワークである。
これらの課題に対処するため、音声信号を管理可能な部分空間に分解し、それぞれ異なる音声属性を表現し、視覚入力から直接予測する。
これらの予測属性からコヒーレントでリアルな音声を生成するために,Transformerアーキテクチャ上に構築された正流整合デコーダを用いる。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:57:46 GMT)
Born a Transformer -- Always a Transformer? [57.4] We study a family of $textitretrieval$ and $textitcopying$ tasks inspired by Liu et al。
我々は、事前訓練されたモデルがクエリトークンの左(アンチインダクション)よりも右(インダクション)へのトークンの検索が優れているような、$textitinduction-versus-anti-induction$ asymmetricを観察する。
力学解析により、この非対称性は、事前学習された変圧器内の誘導の強度と反誘導回路の強度の違いに関係していることが明らかになった。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:27:46 GMT)
Boost-and-Skip: A Simple Guidance-Free Diffusion for Minority Generation [57.2] マイノリティサンプル(Minority sample)は、データ多様体の低密度領域に位置する下記のインスタンスである。
マイノリティサンプルを生成するために,Boost-and-Skipというシンプルなガイダンスのない手法を提案する。
これらの一見自明な修正は、確固たる理論と実証的な証拠によって支えられていることを強調する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:26:44 GMT)
Active Advantage-Aligned Online Reinforcement Learning with Offline Data [57.0] A3RLは,アクティブアドバンテージアライメント・アライメント・サンプリング・ストラテジーを取り入れた新しい信頼度を取り入れた手法である。
本手法はオフラインデータを利用する競合するオンラインRL技術より優れていることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:03:29 GMT)
Mastering Massive Multi-Task Reinforcement Learning via Mixture-of-Expert Decision Transformer [56.9] M3DTは、モデルのパラメータのスケーラビリティをさらに開放することで、タスクのスケーラビリティに対処する新しいM3DTフレームワークである。
実験結果から,M3DTは,専門家の数を増やすことにより,一定のタスク数に対するモデル拡張としての性能を継続的に向上するだけでなく,タスクのスケーラビリティも向上し,性能が向上した160タスクにまで拡張できることが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:08:52 GMT)
Light as Deception: GPT-driven Natural Relighting Against Vision-Language Pre-training Models [56.8] textbfLightDは、視覚・言語事前学習モデルのための自然な逆転サンプルを生成する新しいフレームワークである。
LightDは、シーンセマンティクスとの摂動を確実にしながら、最適化空間を拡張します。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:30:02 GMT)
AdaHuman: Animatable Detailed 3D Human Generation with Compositional Multiview Diffusion [56.1] AdaHumanは、単一のアプリ内画像から高忠実でアニマタブルな3Dアバターを生成する新しいフレームワークである。
AdaHumanはポーズ条件付き3D共同拡散モデルと合成3DGS精製モジュールという2つの重要なイノベーションを取り入れている。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:54 GMT)
Masked Autoencoders Are Effective Tokenizers for Diffusion Models [56.1] MAETokは自己エンコーダであり、再構築の忠実さを維持しながら意味的にリッチな潜在空間を学習する。
MaETokは1.69のgFIDで76倍高速トレーニングが可能で、512x512世代で31倍高い推論スループットを実現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:49:31 GMT)
On Symmetric Losses for Robust Policy Optimization with Noisy Preferences [55.9] この研究は、人間からのフィードバックから強化学習のコアコンポーネントである報酬モデリングに焦点を当てている。
本稿では, 騒音条件下でのロバストな政策最適化のための基本的枠組みを提案する。
対称的損失は,ノイズラベルの下でも政策最適化を成功させることができることを証明した。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:30:43 GMT)
Unpaired Deblurring via Decoupled Diffusion Model [55.2] UID-Diffは,未知領域における劣化性能の向上を目的とした生成拡散モデルである。
構造的特徴とぼかしパターン抽出器を別々に用いて, 抽出した特徴は, 合成データに対する教師付きデブロアリングタスクと教師なしのぼかし転送タスクに使用される。
実世界のデータセットの実験では、UID-Diffが既存の最先端の手法よりも、ぼやけた除去と構造保存に優れていることが示されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:19:39 GMT)
ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL [54.1] 連鎖推論と強化学習がNLPの突破口となった。
我々はReasonGen-R1を紹介した。ReasonGen-R1は自動回帰画像生成器に明示的なテキストベースの「思考」スキルを付与するフレームワークである。
ReasonGen-R1は、強いベースラインや先行技術モデルよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:48 GMT)
Graph-guided Cross-composition Feature Disentanglement for Compositional Zero-shot Learning [54.1] 合成ゼロショット学習(CZSL)において、プリミティブ(属性とオブジェクト)の視覚的特徴の歪みは例外的な結果を示した。
異なる構成にまたがる一般的な非絡み合った原始的特徴を学ぶことは困難である。
本稿では,複数のプリミティブ共有合成を入力として利用するクロスコンポジション特徴分散の解を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:00:27 GMT)
Mitigating Subgroup Disparities in Multi-Label Speech Emotion Recognition: A Pseudo-Labeling and Unsupervised Learning Approach [53.8] Implicit Demography Inference (IDI)モジュールは、k平均クラスタリングを用いて、音声感情認識(SER)におけるバイアスを軽減する
実験により、擬似ラベルIDIはサブグループの格差を減らし、フェアネスの指標を28%以上改善することが示された。
教師なしのIDIは、SERのパフォーマンスが3.6%未満のフェアネス指標を4.6%以上改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:10:08 GMT)
Controllable Context Sensitivity and the Knob Behind It [53.7] 予測を行う場合、言語モデルは、そのコンテキストとそれ以前の知識にどれだけ依存しているかをトレードオフする必要があります。
我々は,この感性を制御するノブを探索し,言語モデルが文脈から応答するか,それ以前の知識から応答するかを判断する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:21:51 GMT)
Do Language Models Use Their Depth Efficiently? [53.6] Llama 3.1 および Qwen 3 モデルの残留ストリームを分析する。
後半のレイヤが前半のレイヤよりもはるかに少ないことが分かりました。
マルチホップタスクでは、モデルが深度を増してサブレサルを構成するという証拠が見つからない。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:23:59 GMT)
Designing AI Tools for Clinical Care Teams to Support Serious Illness Conversations with Older Adults in the Emergency Department [53.5] この研究は、EDベースの重篤な病的会話の実証的な理解に貢献し、ハイテイクな臨床環境におけるAIの設計上の考察を提供する。
専門医2名と専門医9名を対象にインタビューを行った。
我々は4段階の重篤な会話ワークフロー(識別、準備、伝導、文書化)を特徴とし、各段階における重要なニーズと課題を特定した。
既存の臨床実践に適合するSICをサポートするAIツールの設計ガイドラインを提示する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:15:57 GMT)
Theorem-Validated Reverse Chain-of-Thought Problem Generation for Geometric Reasoning [53.1] TRCoT(Theorem-d Reverse Chain-of-Thought Reasoning Synthesis)フレームワークについて述べる。
最初の段階であるTR-Engineは、構造的な記述と性質を持つ定理基底幾何学図を合成する。
第2段階であるTR-Reasonerは、幾何特性と記述フラグメントを交互に検証することで、反復的に質問と回答のペアを洗練するためのリバース推論を採用している。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:15:49 GMT)
Zero-Shot Chinese Character Recognition with Hierarchical Multi-Granularity Image-Text Aligning [52.9] 漢字は独特な構造と構成規則を示しており、表現にきめ細かい意味情報を使用することが可能である。
コントラストパラダイムに基づく階層型多言語画像テキストアライニング(Hi-GITA)フレームワークを提案する。
提案したHi-GITAは既存のゼロショットCCR法より優れている。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:39:14 GMT)
AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time [52.6] 最初、$alpha$1が$alpha$ momentを導入し、これは、ユニバーサルパラメータ$alpha$でスケールされた思考フェーズを表す。
alpha$1のモーメントの後、$alpha$1は決定論的に、終端トークンによるゆっくりとした思考を終了させる。
このアプローチは、フレキシブルで高密度なスロー・トゥ・ファスト推論変調を可能にすることによって、既存のモノトニックスケーリング手法を統一し、一般化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:58:36 GMT)
FieldWorkArena: Agentic AI Benchmark for Real Field Work Tasks [52.5] FieldWorkArenaは、現実世界のフィールドワークをターゲットにしたエージェントAIのベンチマークである。
本稿では、エージェントAIが現実世界の作業環境ベンチマークのために持つべき新しいアクション空間を定義する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:11:14 GMT)
IL-SOAR : Imitation Learning with Soft Optimistic Actor cRitic [52.4] 本稿では、模倣学習のためのSOARフレームワークを紹介する。
これは、コストとポリシーの更新を交互に行うプリミティブデュアルスタイルのアルゴリズムで、専門家によるデモンストレーションからポリシーを学ぶアルゴリズムテンプレートである。
いくつかの MuJoCo 環境では,f-IRL,ML-IRL,CSIL などのソフトアクタ批判に基づく模倣学習アルゴリズムの性能を一貫して向上することが示されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:16:51 GMT)
GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks [52.3] GTSingerは、グローバルで、多技術で、無料で使える、高品質な歌唱コーパスで、リアルな音楽スコアがある。
高品質な歌声を80.59時間収集し、最大の歌唱データセットを形成する。
我々は,技術制御可能な歌唱音声合成,技術認識,スタイル伝達,音声歌唱変換の4つのベンチマーク実験を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:24:13 GMT)
ExPLoRA: Parameter-Efficient Extended Pre-Training to Adapt Vision Transformers under Domain Shifts [52.2] 本稿では,事前学習された視覚変換器(ViT)のドメインシフト下での伝達学習を改善するために,ExPLoRAを提案する。
我々の実験は、衛星画像の最先端の成果を実証し、完全な事前学習や微調整のViTよりも優れています。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:52:22 GMT)
GLTW: Joint Improved Graph Transformer and LLM via Three-Word Language for Knowledge Graph Completion [52.0] 我々は、KGの構造情報をエンコードし、それを大規模言語モデルにマージするGLTWと呼ばれる新しい手法を提案する。
具体的には、局所構造情報とグローバル構造情報の両方を効果的に符号化する改良されたグラフ変換器(iGT)を導入する。
また,KG内のすべてのエンティティを分類対象として用いたサブグラフに基づく多分類学習目標を開発し,学習効率を向上する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:59:38 GMT)
Expanding the Boundaries of Vision Prior Knowledge in Multi-modal Large Language Models [51.8] 本稿では,ビジョンエンコーダの事前知識がMLLM性能に与える影響を定量化するために,新しい計量である$Rank_e$を導入する。
視覚エンコーダレベルでの事前知識を明確に組み込んだ2段階トレーニングフレームワークであるVisPRE(Vision Prior Remediation)を提案する。
実験の結果,視覚エンコーダの事前知識の増大はMLLMの視覚理解能力を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:06:52 GMT)
Testing the Limits of Fine-Tuning for Improving Visual Cognition in Vision Language Models [51.6] 視覚認知タスクにおける視覚刺激と人間の判断を導入し,認知領域間でのパフォーマンスを評価する。
我々は、直感的な物理と因果推論のために、地上の真理データに基づいてモデルを微調整する。
タスク固有の微調整は、他の視覚的特徴を持つデータに対する堅牢な人間ライクな一般化に寄与しない。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:45:42 GMT)
LifelongAgentBench: Evaluating LLM Agents as Lifelong Learners [51.5] しかし、現在の大規模言語モデル(LLM)ベースのエージェントは、状態のままであり、時間とともに知識を蓄積または転送することができない。
LLMエージェントの生涯学習能力を体系的に評価するために設計された最初の統合ベンチマークであるLifelongAgentBenchを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:28:21 GMT)
VLM-R$^3$: Region Recognition, Reasoning, and Refinement for Enhanced Multimodal Chain-of-Thought [51.4] textbfVLM-R$3$ (textbfVisual textbfLanguage textbfModel with textbfRegion textbfRecognition and textbfReasoning) はMLLMに付加的な視覚的証拠が必要な場合にエフェクトを決定する機能を提供するフレームワークである。
MathVista、ScienceQA、その他のベンチマークの実験は、VLM-R$3$が新しいものを設定することを示している
論文参考訳(メタデータ) (Fri, 30 May 2025 06:35:34 GMT)
Logarithmic Regret for Online KL-Regularized Reinforcement Learning [51.1] KL正規化は、大規模言語モデルにおけるRL微調整の効率向上に重要な役割を果たしている。
経験的優位性にもかかわらず、KL-正則化RLと標準RLの理論的相違はほとんど未探索のままである。
楽観的なKL正規化オンライン文脈帯域幅アルゴリズムを提案し,その後悔の新たな分析法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:37:34 GMT)
Advantageous Parameter Expansion Training Makes Better Large Language Models [50.8] パラメータのサブセットは、有利なパラメータと呼ばれ、モデルの性能を決定する上で重要な役割を果たす。
本稿では,有利なパラメータを不利なパラメータの空間に段階的に拡張する手法であるAdvantageous Expansion Training (APEX)を提案する。
APEXは、トレーニングデータのわずか33%で、従来のトレーニングと同じ難易度レベルに達し、下流タスクに大幅な改善をもたらす。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:06:23 GMT)
Modular Sentence Encoders: Separating Language Specialization from Cross-Lingual Alignment [50.8] 多言語文エンコーダ(MSE)は、多言語言語モデルを訓練し、異なる言語からの文を共有意味空間にマッピングすることで一般的に得られる。
MSEは、パラメータ共有による単言語表現精度の喪失である多言語性の呪いを受ける。
我々は、異なる言語間タスクの矛盾する要求を解決するために、2つの異なるタイプのデータで言語間アダプタを訓練する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:19:22 GMT)
Behind the Magic, MERLIM: Multi-modal Evaluation Benchmark for Large Image-Language Models [50.7] 本稿では,IT-LVLMの基本的なコンピュータビジョンタスクにおける能力を評価するために,スケーラブルなテストベッドを提案する。
MERLIMには300K以上の画像検索ペアが含まれており、IT-LVLMにおけるクロスモーダルな"ハロシン化"イベントの検出に重点を置いている。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:40:41 GMT)
FlashDepth: Real-time Streaming Video Depth Estimation at 2K Resolution [50.6] ビデオ深度推定モデルは,(1)フレーム間の精度,(2)高解像度深度マップの作成,(3)リアルタイムストリーミングをサポートする。
提案するFlashDepthは,2044x1148ストリーミングビデオの深さ推定を24FPSで行うことで,3つの要件をすべて満たす手法である。
我々は、最先端の深度モデルに対する複数の未知のデータセットに対するアプローチを評価し、競争精度を維持しながら、境界のシャープネスと速度の点でそれらを上回ります。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:03:14 GMT)
Versatile Framework for Song Generation with Prompt-based Control [50.4] VersBandは、高品質でアライメントのある曲をプロンプトベースのコントロールで合成するためのフレームワークである。
分離されたモデルであるVocalBandは、歌唱スタイル、ピッチ、メル-スペクトログラムを生成するためのフローマッチング手法を利用している。
フローベースのトランスフォーマーモデルであるAccompBandは、Band-MOEを取り入れ、品質、アライメント、制御の強化に適した専門家を選択する。
歌詞用LyricBandとメロディー用MelodyBandの2世代モデルは、総合的なマルチタスク・ソング生成システムに貢献している。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:15:41 GMT)
ChinaTravel: An Open-Ended Benchmark for Language Agents in Chinese Travel Planning [49.4] emph ChinaTravelは、中国旅行の真の要件に基づいた初のオープンエンドベンチマークです。
本研究では,拡張性評価,実現可能性,制約満足度,嗜好比較を網羅する,構成的に一般化可能なドメイン固有言語を設計する。
経験的研究により、旅行計画における神経象徴的エージェントの可能性を明らかにし、人間のクエリに対する37.0%の制約満足度を達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:35:50 GMT)
Disentangled Source-Free Personalization for Facial Expression Recognition with Neutral Target Data [49.3] 本稿では,対象表現データがないモデルに適応することで生じる課題に対処するため,Distangled SFDA法を提案する。
本手法は,対象対象者に対する非ニュートラルな表現データを生成しながら,表現と同一性に関連する特徴を解き放つことを学習する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:31:22 GMT)
Harnessing Large Language Models for Scientific Novelty Detection [49.1] 科学的ノベルティ検出(ND)のための大規模言語モデル(LLM)を提案する。
そこで本研究では,LLMからアイデアレベルの知識を抽出し,ライトウェイトなレトリバーを訓練することを提案する。
実験の結果,提案手法は,アイデア検索やNDタスクのためのベンチマークデータセットにおいて,常に他よりも優れていた。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:08:13 GMT)
Exploring Multimodal Challenges in Toxic Chinese Detection: Taxonomy, Benchmark, and Findings [48.8] 我々は、有害な中国語検出に言語モデルをデプロイする上で重要な課題として、中国語のマルチモーダル性を強調した。
まず,3つの摂動戦略の分類法と,有毒な中国コンテンツに対する8つの具体的なアプローチを提案する。
そして、この分類に基づいてデータセットをキュレートし、9つのSOTA LLM(米国と中国)をベンチマークして、乱れた有毒な漢文を検出できるかどうかを評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:32:45 GMT)
Good Keypoints for the Two-View Geometry Estimation Problem [48.8] 本稿では,2次元幾何推定問題の文脈における特徴点(キーポイント)のスコアリングに関する新しい理論モデルを提案する。
このモデルは、ホモグラフィー推定問題を解くための良いキーポイントが持つべき2つの特性を決定づける。
開発したモデルを用いて、ホモグラフィー推定の恩恵を受けるキーポイントを検出する手法を設計し、バウンドNeSS-STキーポイント検出器を導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:07:10 GMT)
DexMachina: Functional Retargeting for Bimanual Dexterous Manipulation [48.7] 本研究では,人間の手動物体から対象状態を追跡するための機能的難解な操作ポリシーの問題点について検討する。
そこで我々は,仮想オブジェクトコントローラを強度で使用するという,新しいカリキュラムベースのアルゴリズムを提案する。
DexMachinaがベースライン法を著しく上回っていることを示すため,多様なタスクセットと器用な手を用いたシミュレーションベンチマークを作成した。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:50:23 GMT)
Time Blindness: Why Video-Language Models Can't See What Humans Can? [48.7] 我々は、ノイズのようなフレームの時間的シーケンスにのみ情報を格納するベンチマークである$bfSpookyBenchを紹介した。
人間は98%以上の精度でこれらのシーケンスの形状、テキスト、パターンを認識できるが、最先端の視覚言語モデルは0%の精度を達成する。
この性能ギャップは、フレームレベルの空間的特徴に対する過度な信頼と、時間的手がかりから意味を抽出できないという、限界を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:12 GMT)
RAISE: Reinforced Adaptive Instruction Selection For Large Language Models [48.6] タスクオブジェクト駆動型命令選択フレームワークRAISE(Reinforced Adaptive Instruction Selection)を提案する。
RAISEは命令の微調整プロセス全体を最適化に取り入れ、各命令がモデルの性能改善に期待する影響に基づいて各ステップで命令を選択する。
実験と結果解析は,他の命令選択法と比較して,本手法の優位性を証明している。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:23:57 GMT)
Minifinetuning: Low-Data Generation Domain Adaptation through Corrective Self-Distillation [48.5] Minifinetuningは、低データ設定におけるオーバーフィッティングによるデジェネレーションの効果を低減する。
MFTは標準的な微調整よりも2~10倍の専門化・一般化比を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:54:12 GMT)
Are the Hidden States Hiding Something? Testing the Limits of Factuality-Encoding Capabilities in LLMs [48.2] 大型言語モデル(LLM)における実名幻覚
不正確なコンテンツや偽造コンテンツを生成することによって、信頼性とユーザ信頼を損なう。
近年の研究では、偽文を生成する際、LLMの内部状態が真偽に関する情報を符号化していることが示唆されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:53:48 GMT)
Disentangling Language and Culture for Evaluating Multilingual Large Language Models [48.1] 本稿では,LLMの多言語機能を包括的に評価するデュアル評価フレームワークを提案する。
言語媒体と文化的文脈の次元に沿って評価を分解することにより、LLMが言語間を横断的に処理する能力の微妙な分析を可能にする。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:25:45 GMT)
GenHancer: Imperfect Generative Models are Secretly Strong Vision-Centric Enhancers [47.9] 本研究では,視覚的に完璧な世代が表現の強化に必ずしも最適であるとは限らないことを実証的に見出した。
その本質は、無関係な情報を緩和しながら、生成モデルからきめ細かい知識を効果的に抽出することにある。
本稿では,学習に有用な視覚知識を優先するための2段階の学習戦略を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:23:14 GMT)
Chameleon: A Flexible Data-mixing Framework for Language Model Pretraining and Finetuning [47.9] 既存のドメイン再重み付け手法は、しばしばコストのかかる重み計算に依存し、新しいデータが導入されたときに再トレーニングを必要とする。
我々は、ドメインの重要性を定量化するためにレバレッジスコアを利用するフレキシブルで効率的なデータミキシングフレームワークChameleonを紹介します。
本手法は, 微粒化におけるドメイン再重み付けを効率よく実現し, 均一混合による全微粒化領域におけるテストパープレキシティを一貫して改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:43:10 GMT)
Towards a Generalizable Bimanual Foundation Policy via Flow-based Video Prediction [47.9] 既存のアプローチでは、バイマニュアルポリシーを取得するためにVision-Language-Action(VLA)モデルに依存している。
本稿では,ロボットの軌跡を予測するために,主要なテキスト・ビデオ・モデルを微調整することで,新たなバイマニュアル・ファンデーション・ポリシーを提案する。
本手法は,単一段階のテキスト・ビデオ予測における言語のあいまいさを軽減し,ロボット・データ要求を大幅に低減する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:01:21 GMT)
DiffDecompose: Layer-Wise Decomposition of Alpha-Composited Images via Diffusion Transformers [47.5] 本稿では,DiffDecomposeについて述べる。DiffDecomposeは拡散トランスフォーマーをベースとしたフレームワークで,入力画像に条件付き可能な層分解を後部から学習する。
コードとデータセットは、論文の受理時に提供される。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:38:16 GMT)
LLaMAs Have Feelings Too: Unveiling Sentiment and Emotion Representations in LLaMA Models Through Probing [47.2] この研究では、Llamaモデルの隠れた層を探索し、感情的特徴が最も表される場所を特定する。
我々は、層とスケールをまたいだ感情のエンコーディングを分析し、感情信号を最も捉えている層とプール方法を特定します。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:15:03 GMT)
Query-driven Document-level Scientific Evidence Extraction from Biomedical Studies [46.3] 本研究は,臨床問題に対する文書レベルの科学的根拠抽出の課題に焦点をあてる。
このタスクをサポートするために、CochraneForestというデータセットを作成します。
202の注釈付き森林プロット、関連する臨床研究の質問、研究の全文、研究固有の結論からなる。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:10:09 GMT)
Revisiting Epistemic Markers in Confidence Estimation: Can Markers Accurately Reflect Large Language Models' Uncertainty? [46.3] 大規模言語モデル(LLM)は、ハイテイクなドメインでますます使われている。
LLMが本質的な信頼を反映するためにこれらのマーカーを一貫して使用しているかどうかは不明だ。
まず,モデルがてんかんマーカーを用いた場合のマーカー信頼度を観測精度として定義する。
以上の結果から,マーカーは同じ分布内ではよく一般化するが,分布外シナリオでは信頼性に矛盾が認められた。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:41:24 GMT)
Mamba-R: Vision Mamba ALSO Needs Registers [45.4] ビジョントランスフォーマーと同様に、視覚マンバの特徴マップにも存在しているアーティファクトを識別する。
これらのアーティファクトは、画像の低情報背景領域に出現するハイノームトークンに対応しており、Vision Mambaではより深刻に見えます。
この問題を緩和するために、私たちはVision Mambaにレジスタトークンを導入するという以前のソリューションに従います。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:13:05 GMT)
MELT: Towards Automated Multimodal Emotion Data Annotation by Leveraging LLM Embedded Knowledge [45.0] 我々は,Sitecom Friends から収集したマルチモーダルデータセットに GPT-4o を適用した。
構造化テキストプロンプトを作成すれば,GPT-4oが学習中に蓄積した知識を活かすことができる。
4つの自己教師付き学習(SSL)バックボーンを微調整し,音声認識性能を評価することで,MELTの有効性を実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:45:36 GMT)
When Are Concepts Erased From Diffusion Models? [44.9] 概念消去とは、モデルが特定の概念を生成するのを選択的に阻止する能力である。
拡散モデルにおける消去機構の2つの概念モデルを提案する。
概念がモデルから真に消去されたかどうかを徹底的に評価するために,独立した評価スイートを導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:00:33 GMT)
TheaterGen: Character Management with LLM for Consistent Multi-turn Image Generation [44.7] TheaterGenは、大規模な言語モデル(LLM)とテキスト・ツー・イメージ(T2I)モデルを統合した、トレーニング不要のフレームワークである。
このフレームワーク内では、LLMは"Screenwriter"として機能し、マルチターンインタラクションを行い、標準化されたプロンプトブックを生成し管理する。
プロンプトブックとキャラクタイメージの効果的な管理により、StaceGenは合成画像のセマンティックとコンテキスト整合性を大幅に改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:52:39 GMT)
Do We Know What LLMs Don't Know? A Study of Consistency in Knowledge Probing [44.7] 大型言語モデル(LLM)の信頼性は幻覚の傾向によって損なわれている。
このようなギャップを探索する方法は、キャリブレーションベースからプロンプトベースまで様々である。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:39:34 GMT)
OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation [44.3] マルチモーダルな理解と生成を統一するための軽量でオープンソースなベースラインであるOpenUniを紹介します。
統一モデル学習における一般的なプラクティスに触発されて、トレーニングの複雑さとオーバーヘッドを最小限にする効率的なトレーニング戦略を採用しました。
我々は,1) 高品質で命令整合性のある画像を生成すること,2) GenEval, DPG-Bench, WISE などの標準ベンチマークにおいて,1.1B と 3.1B のみ活性化パラメータで例外的な性能を達成できることを実証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:25:06 GMT)
Mixed-R1: Unified Reward Perspective For Reasoning Capability in Multimodal Large Language Models [44.3] マルチソースMLLMタスクを安定した強化学習に活用できる作業は存在しない。
混合報酬関数設計(Mixed-Reward)と混合後学習データセット(Mixed-45K)を含む統一的かつ簡単なフレームワークであるMixed-R1を提案する。
特に、バイナリ回答や複数選択問題に対する報酬のマッチング、チャート対応データセットに対するチャート報酬、基底問題に対するIoU報酬、キャプションデータセットのような長文応答に対するオープンエンド報酬の4つの異なる報酬機能がある。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:11:46 GMT)
Control-R: Towards controllable test-time scaling [44.0] 推論制御場(RCF)は、木探索の観点から推論を導くために構造化制御信号を注入する。
RCFは、複雑なタスクを解く際に、与えられた制御条件に応じて推論の労力を調整することができる。
条件蒸留ファインタニング(CDF)は、特に制御-R-32Bをモデルとし、試験時間中の推論を効果的に調整する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:59:44 GMT)
Unlocking the Power of Rehearsal in Continual Learning: A Theoretical Perspective [43.9] 本研究では,逐次リハーサルが,通常の同時リハーサルよりも継続学習に有益であるかどうかを検討する。
その結果,タスクの類似度が低い場合には,逐次リハーサルの精度が向上することがわかった。
さらに、類似タスクを同時に訓練し、異なるタスクを逐次再検討する、新しいハイブリッドリハーサル手法の動機付けを行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:23:15 GMT)
Addressing Misspecification in Simulation-based Inference through Data-driven Calibration [43.8] 本研究は, モデル不特定性を克服するフレームワークであるロPEを導入し, 実世界の小キャリブレーションによる地下構造パラメータの測定を行った。
4つの合成課題と2つの実世界の問題により、RoPEはベースラインを上回り、情報的およびキャリブレーションされた信頼区間を一貫して返却することを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:44:23 GMT)
EgoExOR: An Ego-Exo-Centric Operating Room Dataset for Surgical Activity Understanding [43.7] EgoExORは、ファーストパーソンとサードパーソンの視点を融合する最初のオペレーティングルーム(OR)データセットである。
それは、ウェアラブルグラスからの自我中心データ(RGB、視線、ハンドトラッキング、オーディオ)、RGB-Dカメラからの遠心的RGBと奥行き、そして超音波画像を統合する。
2つの応用された最先端モデルの手術シーングラフ生成性能を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:02:00 GMT)
M+: Extending MemoryLLM with Scalable Long-Term Memory [43.6] メモリLLMに基づくメモリ拡張モデルであるM+を導入し、長期情報保持を大幅に強化する。
M+は長期記憶機構と協調学習した検索装置を統合し、テキスト生成中に関連情報を動的に検索する。
長いコンテキスト理解や知識保持タスクを含む様々なベンチマークでM+を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:40:56 GMT)
Quantum algorithms for calculating determinant and inverse of matrix and solving linear algebraic systems [43.5] 我々は,N-1(N-1)時間行列の行列式と逆行列を計算するために,純粋に量子的な量子アルゴリズムを提案する。
基本的な考え方は、行列の各行を量子系の純粋な状態にエンコードすることである。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:54:51 GMT)
Stepsize anything: A unified learning rate schedule for budgeted-iteration training [43.5] 予算設定訓練は、所定の予算内で最適な学習を実現することを目的としている。
学習率のスケジュールは異なるネットワークやタスクのパフォーマンスを左右するが、その設計は理論的な基礎が欠如している。
本稿では,Unified Budget-Aware (UBA) スケジュールを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:38:03 GMT)
VIRAL: Vision-grounded Integration for Reward design And Learning [43.5] 強化学習は報酬関数の最大化を目的としている。
近年の進歩は、報酬生成のための大規模言語モデルが人間のパフォーマンスを上回っていることを示している。
報酬関数の生成と精算のためのパイプラインであるVIRALを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:01:19 GMT)
INSIGHT: A Survey of In-Network Systems for Intelligent, High-Efficiency AI and Topology Optimization [43.4] インネットワークAI(In-network AI)は、ネットワークインフラストラクチャにおける人工知能(AI)のエスカレート要求に対処するための、変革的なアプローチである。
本稿では,AIのためのネットワーク内計算の最適化に関する包括的な分析を行う。
リソース制約のあるネットワークデバイスにAIモデルをマッピングするための方法論を調べ、メモリや計算能力の制限といった課題に対処する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:47:55 GMT)
Bootstrapping LLM Robustness for VLM Safety via Reducing the Pretraining Modality Gap [43.3] 本研究では,モダリティギャップの量とビジョン・ランゲージ・モデルの安全性との相関性が高いことを示す。
この観察から着想を得た本研究では,事前学習時のモダリティギャップを低減するための正規化を提案する。
本手法は,LVLMの安全性を著しく向上させ,性能を損なうことなく安全性を最大16.3%向上させ,既存の防御を最大18.2%向上させることができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:40:08 GMT)
COSMIC: Generalized Refusal Direction Identification in LLM Activations [43.3] 本稿では,方向選択のための自動フレームワークであるbfCOSMIC(Cosine similarity Metrics for Inversion of Concepts)を紹介する。
モデル出力から完全に独立しているコサイン類似性を使用して、実行可能なステアリング方向とターゲット層を特定する。
敵対的な設定や弱い整列モデルにおける拒絶方向を確実に識別し、偽の拒絶を最小限に抑えつつ、より安全な行動に向けてそのようなモデルを操ることが可能である。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:54:18 GMT)
Improving Multilingual Speech Models on ML-SUPERB 2.0: Fine-tuning with Data Augmentation and LID-Aware CTC [43.3] 本稿では,ML-SUPERB 2.0 上での多言語 LID と ASR を強化し,SFM 適応のための複数の戦略を探求する。
我々は、数ショット設定におけるパフォーマンスギャップを軽減するためにデータ拡張を採用し、正規化のためのLID接続性時間分類損失を導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:25:15 GMT)
S4-Driver: Scalable Self-Supervised Driving Multimodal Large Language Modelwith Spatio-Temporal Visual Representation [43.2] 本研究では,Pa時間視覚表現を用いたスケーラブルな自己教師型動作計画アルゴリズムであるS4-Driverを提案する。
S4-Driverは、MLLMの強力な視覚表現を視点から3D空間へシームレスに変換するために、新しいスパースボリューム戦略を使用する。
その結果、S4-Driverは、既存のマルチタスクアプローチに対して、人間のアノテーションを必要とせず、好意的に機能することがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:20:14 GMT)
Compact and Selective Disclosure for Verifiable Credentials [42.8] 自己主権アイデンティティ(Self-Sovereign Identity、SSI)は、個人にデータを完全にコントロールする権限を与える新しいアイデンティティモデルである。
EUDIレギュレーションは、すべての欧州市民が検証クレデンシャル(VC)を使用してシームレスにサービスにアクセスできるようにする
本稿では,VC(CSD-JWT)のコンパクトかつ選択的開示を実現するための新しいメカニズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:53:07 GMT)
Semi-structured LLM Reasoners Can Be Rigorously Audited [42.7] 半構造的推論モデル(Semi-Structured Reasoning Models, SSRMs)を導入する。
SSRMはPythonの構文で推論トレースを生成する。
10のベンチマークで評価することで、SSRMは高い性能と汎用性を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:06:10 GMT)
RealDrive: Retrieval-Augmented Driving with Diffusion Models [42.6] 学習ベースのプランナーは、データからのニュアンスなインタラクションを推論することを学ぶことによって、人間のような運転行動を生成する。
データ駆動型アプローチは、しばしば稀で安全クリティカルなシナリオと格闘し、生成された軌道に対して限定的な制御性を提供する。
本稿では,RealDriveを提案する。RealDriveは,トレーニングデータセットから最も関連性の高い専門家のデモンストレーションを検索することで,拡散ベースの計画ポリシーを初期化するフレームワークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:15:03 GMT)
Werewolf: A Straightforward Game Framework with TTS for Improved User Engagement [42.6] テキスト・トゥ・スペーチ(TTS)モデルをチューニングした,単純かつ簡単な LLM ベースの Werewolf ゲームシステムを提案する。
Werewolf のケースでは LLM 推論の強化により,余分なコンポーネントは不要になる,と我々は主張する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:58:57 GMT)
Why Academics Are Leaving Twitter for Bluesky [42.4] 調査対象の18%の学者が、規律、政治的表現、Twitterのエンゲージメントによって変化し、従来の学術指標では変化しなかった。
我々は、情報ソースが観客よりもはるかに強力な移動を誘導する印象的な非対称性を発見し、この影響は1週間以内に指数関数的に減少する。
本研究は, ネットワーク外部性, 指向性の影響, プラットフォーム移行に関する新たな知見を提供し, スイッチングコストの克服における情報ソースの役割を強調した。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:03:21 GMT)
ComposeRAG: A Modular and Composable RAG for Corpus-Grounded Multi-Hop Question Answering [42.2] ComposeRAGは、RAGパイプラインをアトミックで構成可能なモジュールに分解する、新しいモジュラー抽象化である。
精度と接地忠実性の両方において、一貫して強いベースラインを上回ります。
検証ファーストの設計は、低品質の検索設定において、未解決の回答を10%以上削減する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:10:30 GMT)
Strongly driven transmon as an incoherent noise source [42.1] コヒーレント駆動トランスモンは、それに接続された他の回路素子に対して非コヒーレントノイズの源として作用することができる。
駆動トランスモンとの相互作用はTLSを駆動する拡散過程としてモデル化できることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:57:57 GMT)
AutoStudio: Crafting Consistent Subjects in Multi-turn Interactive Image Generation [42.0] インタラクティブな画像を生成するためのAutoStudioという,トレーニング不要なマルチエージェントフレームワークを提案する。
AutoStudioは、対話を処理するために大きな言語モデル(LLM)に基づく3つのエージェントと、高品質な画像を生成するための安定した拡散(SD)ベースのエージェントを使用している。
パブリックなCMIGBenchベンチマークと人的評価の実験は、AutoStudioが複数のターンにわたる複数オブジェクトの一貫性を良好に維持していることを示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:55:44 GMT)
Learning Safety Constraints for Large Language Models [42.0] 大規模言語モデル(LLM)は有害なアウトプットと敵の攻撃に対する脆弱性を通じて重大な安全リスクを生じさせる。
モデル表現空間において,複数の安全制約を直接学習し,適用する,安全のための幾何学的アプローチであるSaPを提案する。
我々は,ポリトープのファセットを介して安全かつ安全でない領域を識別し,安全でない出力の検出と修正を可能にするフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:30:24 GMT)
Minimal Areas from Entangled Matrices [41.9] 本稿では, 絡み合いエントロピーの最小化を図り, 龍高柳式に類似点が多いことを示す。
我々の構成は、絡み合いエッジモード、非可換幾何学、量子内部参照フレームの物理をまとめる。
微視的導出には粗粒化が不可欠であることが判明し,高度に湾曲した非幾何学的部分領域の増殖を制御した。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:44:48 GMT)
Recurrent Knowledge Identification and Fusion for Language Model Continual Learning [41.9] Recurrent-KIF は Recurrent Knowledge Identification and Fusion のためのCLフレームワークである。
人間の連続学習にインスパイアされたRecurrent-KIFは、内部ループを使用し、新しいタスクに迅速に適応する。
新しい知識と歴史的知識の融合を世界規模で管理する外ループ。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:15:45 GMT)
Adventurer: Optimizing Vision Mamba Architecture Designs for Efficiency [41.9] 本稿では,イメージをパッチトークンのシーケンスとして扱うアドベンチャーシリーズモデルを紹介し,一方向言語モデルを用いて視覚表現を学習する。
このモデリングパラダイムにより、列長に対して線形な複雑度を持つ繰り返し定式化による画像の処理が可能となる。
本稿では,画像入力を因果推論フレームワークにシームレスに統合する2つの簡単な設計を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:51:59 GMT)
Hi-Dyna Graph: Hierarchical Dynamic Scene Graph for Robotic Autonomy in Human-Centric Environments [41.8] Hi-Dyna Graphは階層的な動的シーングラフアーキテクチャで、永続的なグローバルレイアウトと局所的な動的セマンティクスを統合し、ロボットの自律性を具現化する。
大型言語モデル(LLM)を利用したエージェントを用いて、統一されたグラフを解釈し、遅延タスクトリガーを推論し、ロボットの余裕に基づいて実行可能な命令を生成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:35:29 GMT)
AXIOM: Learning to Play Games in Minutes with Expanding Object-Centric Models [41.4] AXIOMは、オブジェクト中心のダイナミクスとインタラクションに関する、最小限だが表現力に富んだコアプライドのセットを統合する、新しいアーキテクチャである。
これはベイズ的アプローチの通常のデータ効率と解釈可能性と、通常DRLに付随する全タスクの一般化を組み合わせている。
AXIOMは、DRLに比べて少数のパラメータを持ち、グラデーションベースの最適化の計算コストなしで、わずか10,000のインタラクションステップで様々なゲームをマスターする。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:46:20 GMT)
ProReason: Multi-Modal Proactive Reasoning with Decoupled Eyesight and Wisdom [41.4] 本稿ではProReasonという新しいビジュアル推論フレームワークを紹介する。
ProReasonは、分離されたビジョン推論機能とマルチランプロアクティブな知覚を備えている。
実験の結果, ProReasonは様々なベンチマークにおいて, 既存のマルチステップ推論フレームワークよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:54:08 GMT)
The Butterfly Effect in Pathology: Exploring Security in Pathology Foundation Models [41.1] 本研究は,対人攻撃に対する全スライド画像(WSI)解析のための病理基盤モデルの安全性に関する最初の体系的な研究である。
具体的には,グローバルな影響を伴うテキスト局所摂動の原理を導入し,ラベルフリー攻撃フレームワークを提案する。
本手法では,4つの古典的ホワイトボックス攻撃法を改訂し,WSIの特性に基づいて摂動予算を再定義する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:23:46 GMT)
A Rose by Any Other Name: LLM-Generated Explanations Are Good Proxies for Human Explanations to Collect Label Distributions on NLI [41.0] 人間のラベルの識別はユビキタスであり、人間の判断分布で捉えることができる。
近年の研究では、人間のラベルの変化を理解する上で、説明が貴重な情報となることが示されている。
本稿では,HJDを近似するための説明を生成する際に,大規模言語モデル (LLM) を用いて人間を置き換えることができるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:57:08 GMT)
Improved Best-of-Both-Worlds Regret for Bandits with Delayed Feedback [40.9] 本稿では,Best-Both-Worlds (BoBW) フレームワークにおいて,逆選択遅延を用いたマルチアームバンディット問題について検討する。
我々の主な貢献は、各設定の既知の下界を個別にマッチングする新しいアルゴリズムである。
これは$sum_i>0left(log T/Delta_iright) + frac1Ksum Delta_i sigma_max$で、$Delta_i$はarm $i$と$のサブ最適ギャップである。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:05:52 GMT)
MCIP: Protecting MCP Safety via Model Contextual Integrity Protocol [40.4] 本稿では,モデルコンテキストプロトコルの安全性を高めるための新しいフレームワークを提案する。
MAESTRO フレームワークをベースとして,まず MCP に欠落する安全機構を解析する。
次に、MPPシナリオで観察されるさまざまな安全でない振る舞いをキャプチャする、きめ細かい分類法を開発する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:55:41 GMT)
Empirical Validation of the Independent Chip Model [40.4] 独立チップモデル(ICM)は、現代のポーカートーナメント戦略の基盤となる。
1万以上のイベントの結果からなるポーカートーナメントのデータセットを紹介します。
ICMの大規模実証実験の一環として2つの実験を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:34:02 GMT)
Breakpoint: Scalable evaluation of system-level reasoning in LLM code agents [40.4] 本稿では,コード修復タスクを自動的に生成するベンチマーク手法であるBreakpointを紹介する。
我々の手法は、最も簡単なタスクの55%から最も難しいタスクの0%まで、最先端のモデルの成功率で任意の難易度にスケール可能であることを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:23:51 GMT)
LTM3D: Bridging Token Spaces for Conditional 3D Generation with Auto-Regressive Diffusion Framework [40.2] LTM3Dは条件付き3次元形状生成のための潜在トークン空間モデリングフレームワークである。
拡散と自己回帰(Auto-Regressive、AR)モデルの強みを統合する。
LTM3Dはマルチモーダル・マルチ表現3D生成のための一般化可能なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:08:45 GMT)
Multiple LLM Agents Debate for Equitable Cultural Alignment [40.0] LLMをベースとした2人のエージェントが文化的なシナリオについて議論し、共同で最終決定を下すマルチエージェント議論フレームワークを導入する。
オープンウェイトLLM(および21LLMの組み合わせ)に対するこれらのアプローチを,75カ国の社会的エチケット規範に対するNormAd-ETIベンチマークを用いて評価した。
実験により、単一LLMベースラインよりも総合的精度と文化的グループパリティの両方を改善することが示されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:01:52 GMT)
When GPT Spills the Tea: Comprehensive Assessment of Knowledge File Leakage in GPTs [39.9] データセキュリティ姿勢管理(DSPM)にインスパイアされた新しいワークフローを活用することで、知識ファイル漏洩の包括的リスク評価を行う。
651,022 GPTメタデータ,11,820フロー,1,466応答の解析により,5つのリークベクトルを同定した。
これらのベクトルにより、敵はタイトル、コンテンツ、タイプ、サイズといった機密性の高い知識ファイルデータを抽出できる。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:08:08 GMT)
Symbolic Hamiltonian Compiler for Hybrid Qubit-Boson Processors [39.9] 第二量子化ハミルトニアンの行列自由な記号操作に基づく新しい記号コンパイラを提案する。
これにより、フェルミオンボソン第2量子化問題を量子化してクォービットボソン命令セットアーキテクチャに分解する。
この統合は、新しい量子ビットボソンおよびフェルミオンボソンハードウェア上で量子システムをシミュレートするための包括的なパイプラインを確立する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:41:50 GMT)
Understanding Underrepresented Groups in Open Source Software [39.6] 本研究の目的は,オープンソースソフトウェア(OSS)プロジェクトにおけるマイノリティグループに関する知識の分析である。
この目的を達成するために、OSSプロジェクトにおいて、未表現グループを直接研究する42の論文を分析した系統的な文献レビュー研究を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:28:09 GMT)
On zero-shot learning in neural state estimation of power distribution systems [39.6] 本稿では,配電系統におけるニューラル状態推定の課題に対処する。
このユースケースにおいて、最も有望なモデルのクラスとしてグラフニューラルネットワークを特定します。
本稿では,データ拡張による性能向上と,一般的なゼロショット学習シナリオを対象としたモデル構成の網羅的グリッド探索を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:41:19 GMT)
Who is in the Spotlight: The Hidden Bias Undermining Multimodal Retrieval-Augmented Generation [39.5] 本稿では,マルチモーダルRAGシステムにおける位置バイアスの総合的研究について述べる。
以上の結果から,マルチモーダル相互作用によって位置バイアスが増大することが示唆された。
これらの知見は、より信頼性が高く公平な世代システムを構築するための証拠の整理やデバイアスの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:48:02 GMT)
Towards Robust Assessment of Pathological Voices via Combined Low-Level Descriptors and Foundation Model Representations [39.3] 本研究では,声質評価ネットワーク (VOQANet) を提案する。
また,低レベル音声記述子であるjitter,shimmer,haronics-to-noise ratio(HNR)とSFMをハイブリッド表現に組み込んだVOQANet+を導入する。
以上の結果から,特に患者レベルでの母音による入力は,音声属性を抽出する発話の長大さに優れることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:58:33 GMT)
MUSE: Model-Agnostic Tabular Watermarking via Multi-Sample Selection [39.0] MUSEは表生成モデルの透かしアルゴリズムである。
複数の候補サンプルを生成し、特殊なスコアリング関数に基づいて1つを選択することで、透かしを埋め込む。
様々な攻撃に対して最先端の透かし検出性と堅牢性を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:45:31 GMT)
"See the World, Discover Knowledge": A Chinese Factuality Evaluation for Large Vision Language Models [38.9] 我々は,中国語で「 ChineseSimpleVQA」というファクトリティに基づく視覚質問応答ベンチマークを初めて導入した。
このベンチマークの主な特徴は、中国語、多様な知識タイプ、マルチホップ質問の構築、高品質なデータ、静的な一貫性、短い回答による評価、などである。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:27:22 GMT)
Towards Dynamic 3D Reconstruction of Hand-Instrument Interaction in Ophthalmic Surgery [38.9] 本研究は,眼科手術用RGB-D動的3D再構成データセットであるOphNet-3Dを紹介する。
40人の外科医の41のシーケンスと7100万のフレームで構成され、12の手術フェーズ、10の楽器カテゴリ、密集したMANOハンドメッシュ、フル6-DoFの楽器ポーズの詳細なアノテーションを備えている。
OphNet-3Dをベースとして,手動ポーズ推定と手動間相互作用再構成という2つの挑戦的なベンチマークを構築した。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:41:21 GMT)
Explainable Depression Detection using Masked Hard Instance Mining [38.7] うつ病検出タスクにおける説明可能性を高めるため,マスケッドハード・インスタンス・マイニング(MHIM)を提案する。
MHIMは、モデル内の注意重みを戦略的に隠蔽し、より広範囲の有能な特徴に注意を分散させる。
以上の結果から,MHIMは予測精度と説明可能性の両方の観点から性能を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:01:20 GMT)
Cascading Adversarial Bias from Injection to Distillation in Language Models [38.4] 本稿では, 蒸留モデルによる学習中のバイアス成分の逆注入に対する脆弱性について検討する。
我々は,教師モデルに対して,データ中毒を最小限に抑えて微妙な偏見を注入できることを実証した。
本稿では,効果的な対向バイアス緩和戦略を構築するための実用的な設計原則を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:41:58 GMT)
RedundancyLens: Revealing and Exploiting Visual Token Processing Redundancy for Efficient Decoder-Only MLLMs [38.3] MLLM(Multimodal Large Language Model)の学習用フレームワークを提案する。
Probe-Activated Dynamic FFNとHollow Attentionで構成されており、ビジュアルトークンの計算の調整可能な削減を可能にする。
実験では、デコーダのみのMLLMに特有の、実質的で、構造化され、クラスタ化された冗長性を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:26:44 GMT)
MedOrch: Medical Diagnosis with Tool-Augmented Reasoning Agents for Flexible Extensibility [38.3] MedOrchは、専門的なツールや推論エージェントを編成し、総合的な医療的意思決定支援を提供する新しいフレームワークである。
我々は,アルツハイマー病の診断,胸部X線解釈,医用視覚質問応答の3つの医学的応用からMedOrchを評価した。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:13:12 GMT)
EXP-Bench: Can AI Conduct AI Research Experiments? [38.3] 我々は、AIエージェントを完全な研究実験で評価するための新しいベンチマークであるEXP-Benchを紹介する。
EXP-Benchは、研究の疑問と不完全なスターターコードから、AIエージェントに対して仮説を定式化し、実験手順を設計し、実装し、それらを実行し、結果を分析するよう挑戦する。
このパイプラインでEXP-Benchは、51の上位AI研究論文から461のAI研究タスクをキュレートした。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:46:29 GMT)
A Simple Linear Patch Revives Layer-Pruned Large Language Models [38.3] LLMを再生するプラグイン・アンド・プレイ技術であるLinearPatchを提案する。
LinearPatchは、質問応答ベンチマークで5層のLLaMA-3-8Bをプルーニングする際に、元のモデルの94.15%の性能を維持している。
5Kのサンプルだけで、リニアパッチの性能は1枚のコンピュータカードで30分以内に95.16%向上する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:06:08 GMT)
Proactive Guidance of Multi-Turn Conversation in Industrial Search [38.2] プロアクティブガイダンスを提供するための新しい2段階フレームワークを提案する。
Goal-Adaptive Supervised Fine-Tuning (G-SFT)はゴール関連コンテキスト情報を提供する。
クリック指向強化学習(C-RL)は、ユーザのクリック信号から好みのペアを構築し、クリックスルー率を積極的に改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:16:30 GMT)
Invariant Link Selector for Spatial-Temporal Out-of-Distribution Problem [38.1] 本稿では,時間グラフのどの成分が最も不変であり,ラベルに関して代表的であるかを検討する。
Information Bottleneck (IB) 法により,誤差バウンドな不変リンクセレクタを提案する。
また、時間的リンク予測などのタスク固有の損失関数を用いてトレーニングを行い、事前学習したモデルが現実世界のアプリケーションタスクを解決する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:40:00 GMT)
Why is plausibility surprisingly problematic as an XAI criterion? [38.0] 可視性は通常、特徴ローカライゼーションまたは特徴相関のメトリクスによって定量化される。
本研究は, 説明可能性の測定には妥当性が認められず, 人的説明がXAIの基礎的真理ではないことを示す。
測定の無効性と非倫理的な問題から,XAIアルゴリズムの評価と最適化の基準として,コミュニティは可視性の使用をやめるべきである,と論じる。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:29:09 GMT)
AMIA: Automatic Masking and Joint Intention Analysis Makes LVLMs Robust Jailbreak Defenders [37.8] AMIAは、LVLM(Large Vision-Language Models)のための推論専用防御である
AMIAは様々なLVLMとジェイルブレイクベンチマークの防衛成功率を平均52.4%から81.7%に改善している。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:30:50 GMT)
MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning [37.7] RLVR(Reinforcement Learning with Verifiable Rewards)は、最近、大規模言語モデル(LLM)のポストトレーニングのための強力なパラダイムとして登場した。
RLVRをMultimodal LLM(MLLMs)に適用することは大きなチャンスであるが、視覚言語タスクの広範で異質な性質により複雑である。
本稿では、厳密なデータ混合問題定式化とベンチマーク実装を備えたマルチモーダルLLM RLVRのための体系的な後学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:38 GMT)
Precision bounds for multiple currents in open quantum systems [37.7] 我々はマルコフ力学を施した開量子系における複数の観測可能な量子 TUR と KUR を導出する。
我々の境界は、1つの観測可能量に対して以前に導かれた量子 TUR や KUR よりも厳密である。
また、フィッシャー情報行列の対角線外要素が捉えた相関関係の興味深い量子的シグネチャも見出す。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:30:14 GMT)
SCOUT: Teaching Pre-trained Language Models to Enhance Reasoning via Flow Chain-of-Thought [37.5] 思考の連鎖(CoT)は、ステップ思考を奨励することで、大きな言語モデル(LLM)の推論性能を向上させる。
有望ではあるが、CoTベースのアプローチは、しばしばコストのかかる事前トレーニングを必要とし、推論の進化に関する原則的なフレームワークを欠いている。
プリトレーニングを必要とせずにFlow CoTスタイルの推論を可能にする軽量な微調整フレームワークSCOUTを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:43:24 GMT)
PatchDEMUX: A Certifiably Robust Framework for Multi-label Classifiers Against Adversarial Patches [37.3] 敵パッチに対するマルチラベル分類のための,堅牢なフレームワークであるPatchDEMUXを提案する。
本手法は,単一ラベル分類のための既存の認証防御を拡張可能な一般化可能な手法である。
PatchDEMUXはMS-COCOとPASCALのVOCデータセット上で非自明なロバスト性を実現することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:25:51 GMT)
Image Captioning Evaluation in the Age of Multimodal LLMs: Challenges and Future Perspectives [37.0] 機械生成画像キャプションの評価は複雑で進化する課題である。
MLLM(Multimodal Large Language Models)の出現に伴い、画像キャプションがコアタスクとなっている。
本調査では,画像キャプション評価の進歩について概観する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:11:25 GMT)
Stochastic Chameleons: Irrelevant Context Hallucinations Reveal Class-Based (Mis)Generalization in LLMs [36.9] クラスベース(ミス)一般化と呼ぶ構造的だが欠陥のあるメカニズムからエラーが生じることを示す。
Llama-3、Mistral、Pythiaの実験では、この挙動がモデルの内部計算に反映されていることが明らかになった。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:10:54 GMT)
GARLIC: GAussian Representation LearnIng for spaCe partitioning [36.9] GARLICは、高次元ベクトル空間を効率的に学習するための(N)次元ガウスに基づく新しいインデックス構造である。
我々は,包摂性,割当信頼度,構造的・意味的整合性のバランスをとる情報理論的目的を用いてガウスパラメータを最適化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:55:54 GMT)
EarthSE: A Benchmark for Evaluating Earth Scientific Exploration Capability of LLMs [36.7] 本研究では,大言語モデル(LLM)の科学的探索能力を評価するために,地球科学の専門的なベンチマークを示す。
10万件の研究論文のコーパスを活用して、まず2つのQAデータセット(アース・アイロンとアース・シルバー)を構築します。
これらのデータセットは、5つの地球圏、114の分野、11のタスクカテゴリを含み、科学的探索に不可欠な知識を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:31:07 GMT)
MuSC: Improving Complex Instruction Following with Multi-granularity Self-Contrastive Training [36.5] より強力なモデルに頼ることなく、複雑な命令アライメントを改善するために、MuSC(Multi-granularity Self-Contrastive Training)フレームワークを提案する。
提案手法は,オープンソースモデルを用いて評価し,提案手法が複雑かつ一般的な命令追従ベンチマークにおいて有意な改善をもたらすことを示す実験結果を得た。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:13:42 GMT)
Who Gets the Kidney? Human-AI Alignment, Indecision, and Moral Values [36.5] 本研究では,Large Language Models (LLMs) が,様々な属性の優先順位付けにおいて,人的価値との相違を示すことを示す。
少ないサンプルを用いた低ランク教師あり微調整は、決定整合性の向上と不確定性モデリングの校正に有効であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:23:11 GMT)
Unleashing the Power of Intermediate Domains for Mixed Domain Semi-Supervised Medical Image Segmentation [36.5] 限られたアノテーションとドメインシフトは、医用画像のセグメンテーションにおいて一般的な課題である。
本稿では,中間ドメイン情報を完全に活用して知識伝達を促進するUST-RUNフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:21:05 GMT)
D2AF: A Dual-Driven Annotation and Filtering Framework for Visual Grounding [36.3] D2AFは、入力画像のみを使用して視覚的な接地を行うための堅牢なアノテーションフレームワークである。
二重駆動型アノテーション戦略を実装することにより、詳細な領域テキストペアを効果的に生成する。
以上の結果から,データ量の増加がモデル性能を向上させることが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:04:47 GMT)
EVOREFUSE: Evolutionary Prompt Optimization for Evaluation and Mitigation of LLM Over-Refusal to Pseudo-Malicious Instructions [36.3] 大型言語モデル(LLM)は、しばしば擬似重複命令への応答を拒否する。
本稿では,多種多様な擬似重複命令を生成する迅速な最適化手法EVOREFUSEを紹介する。
我々は、582の擬似重複命令のベンチマークであるEVOREFUSE-TESTと3000の擬似重複命令を提供するEVOREFUSE-ALIGNという2つの新しいデータセットを作成している。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:54:29 GMT)
InteractAnything: Zero-shot Human Object Interaction Synthesis via LLM Feedback and Object Affordance Parsing [36.3] 特定のデータセットをトレーニングすることなく,新たなゼロショット3DHOI生成フレームワークを提案する。
トレーニング済みの2次元画像拡散モデルを用いて、見えない物体を解析し、接触点を抽出する。
次に、細粒度、精密、そして自然な相互作用を生成するための詳細な最適化を導入し、3Dオブジェクトと関連する身体部分との間の現実的な3D接触を強制する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:53:55 GMT)
Binarized Neural Networks Converge Toward Algorithmic Simplicity: Empirical Support for the Learning-as-Compression Hypothesis [36.2] 本稿では,二元化ニューラルネットワーク(BNN)を第1のプロキシとして用いて,アルゴリズム情報理論へのシフトを提案する。
ブロック分解法 (BDM) を適用し, エントロピーよりもトレーニング中の構造変化をより綿密に追跡した。
これらの結果は、学習が構造化正規性の進行的内部化に対応するアルゴリズム圧縮の過程としてのトレーニングの観点を支持する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:56:27 GMT)
A chip-scale atomic beam source for non-classical light [36.1] 室温熱原子は、磁気測定、電気測定、原子の絡み合いの発生、堅牢な原子時計のための強力な資源であることが証明されている。
近年、小型で製造可能な原子蒸気と原子線をチップスケール磁力計や原子時計向けに実現しようと試みている。
ここでは、チップスケールのルビジウムビーム源を高精細キャビティ-QEDシステムに統合して、古典的でない光を生成する方法を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:09:19 GMT)
Advancing Molecular Graph-Text Pre-training via Fine-grained Alignment [36.1] FineMolTexは、新しい分子グラフ-テキスト事前トレーニングフレームワークである。
粒度の粗い分子レベルの知識と粒度の細かいモチーフレベルの知識を学習する。
FineMolTexは、きめ細かな知識をうまく捉え、薬物発見と触媒設計のための貴重な洞察を提供する可能性がある。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:53:06 GMT)
KEVER^2: Knowledge-Enhanced Visual Emotion Reasoning and Retrieval [35.8] 感情推論と検索のための知識強化フレームワークである textbfK-EVERtextsuperscript2 を提案する。
本手法では,視覚的感情の意味的構造を定式化し,マルチモーダルアライメントを通じて外部の情緒的知識を統合する。
Emotion6、EmoSet、M-Disasterの3つの代表的なベンチマークで、ソーシャルメディアの画像、人間中心のシーン、災害状況について検証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:33:32 GMT)
Reinforcement Learning for Causal Discovery without Acyclicity Constraints [35.8] 我々は、強化学習機械を利用した因果発見の新しいアプローチであるALIASを紹介する。
本手法は,DAGを最適2次複雑度で1ステップで生成する効率的なポリシを特徴とする。
因果発見における最先端技術と比較して, ALIAS の強い性能を示す説得力のある実証的証拠を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:54:27 GMT)
Enhancing LLM-based Hatred and Toxicity Detection with Meta-Toxic Knowledge Graph [35.7] メタ有害知識グラフ上でのグラフ検索を利用して,憎悪や毒性を検出するメタトックスと呼ばれる新しい手法を提案する。
まず,LSMを用いて3段階のパイプラインから有害情報を抽出し,総合的なメタ有害知識グラフを構築する。
第2に、正確な有毒な知識を補うために、検索およびランキングプロセスを介してグラフを問い合わせる。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:30:30 GMT)
MetaFaith: Faithful Natural Language Uncertainty Expression in LLMs [35.6] メタファイト(MetaFaith)は、ヒトのメタ認知に触発された新規なプロンプトベースのキャリブレーション手法である。
MetaFaithは多種多様なモデルやタスク領域における忠実なキャリブレーションを強力に改善し、忠実度を最大61%向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:54:08 GMT)
TRIDENT: Enhancing Large Language Model Safety with Tri-Dimensional Diversified Red-Teaming Data Synthesis [35.3] 大規模言語モデル(LLM)は、様々な自然言語処理タスクを抜粋するが、有害なコンテンツを生成することや悪意のある目的のために悪用されることに弱いままである。
本稿では,3つの重要な領域(語彙多様性,悪意障害,ジェイルブレイク戦術)にまたがるアライメントデータセットのリスクカバレッジを測定するための新しい分析フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:02:21 GMT)
A Mathematical Framework for AI-Human Integration in Work [35.0] 我々は,人間とGenAIの相補的な強みを反映する,意思決定レベルと行動レベルのサブスキルに,新たなスキルの分解を導入する。
われわれの結果は、GenAIがいつ、どのように人間のスキルを補完するかを強調している。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:51:54 GMT)
Lossless Token Sequence Compression via Meta-Tokens [34.8] LZ77と同様のタスク非依存のロスレス圧縮手法を導入し,入力トークン列の長さを平均27%,18%削減する。
提案手法はセマンティクス/構文の厳密な保存を必要とする2つのタスクに対して評価し、既存の損失圧縮手法がこの設定において不十分であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:32:57 GMT)
Knowing Before Saying: LLM Representations Encode Information About Chain-of-Thought Success Before Completion [34.6] ゼロショット・チェーン・オブ・ソート(CoT)プロセスの成功を完了前に予測できるかどうかを検討する。
LLM表現に基づく探索型分類器は,単一トークンが生成される前に良好に実行可能であることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:54:28 GMT)
Model Unlearning via Sparse Autoencoder Subspace Guided Projections [34.5] 大きな言語モデル(LLM)は大量の情報を格納するので、強力なプライバシと安全性の懸念が高まる。
グラデーションベースの微調整やモデル編集からスパースオートエンコーダのステアリングまで、既存の未学習戦略は解釈性に欠けるか、敵のプロンプトに対して堅牢な防御を提供しない。
我々は,SAE機能を活用した新たなフレームワークであるSAE-Guided Subspace Projection Unlearning (SSPU)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:07:52 GMT)
Impact of Frame Rates on Speech Tokenizer: A Case Study on Mandarin and English [34.4] マンダリンと英語を調べた結果,フレームレートの変動が音声のトークン化に与える影響について検討した。
我々は、異なるフレームレートで音声を符号化し、音声認識タスクにおける結果のセマンティックトークンを評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:00:46 GMT)
SwitchLingua: The First Large-Scale Multilingual and Multi-Ethnic Code-Switching Dataset [34.4] コードスイッチング(Code-Switching, CS)とは、会話や発話の中で2つ以上の言語を交互に使用する方法である。
この言語現象は、自動音声認識(ASR)システムに課題をもたらす。
textbfSwitchLinguaは、最初の大規模多言語および多民族のコードスイッチングデータセットである。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:54:46 GMT)
RenderBender: A Survey on Adversarial Attacks Using Differentiable Rendering [34.3] 異なるレンダリング技術は、物理的に可塑性と異なるシーンのモデルの両方を生成することができる。
敵の機械学習コミュニティはまだ、これらの能力を十分に探求していない。
この調査は、多様な目標とタスクを統一する最初のフレームワークに貢献する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:53:03 GMT)
On Traceability in $\ell_p$ Stochastic Convex Optimization [34.2] 学習アルゴリズムが$m$-traceableであるとは、そのアウトプットを分析することで、トレーニングサンプルの少なくとも$m$を識別できるということである。
我々の主な成果は、SCOにおけるトレーサビリティと過剰リスクの根本的なトレードオフを明らかにすることである。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:36:12 GMT)
Towards Unified Neural Decoding with Brain Functional Network Modeling [34.1] 本稿では,ニューラルデコードフレームワークMIBRAINについて述べる。
MIBRAINは、複数の個人にまたがる頭蓋内神経生理学的記録を統合することで、機能的脳ネットワークモデルを構築する。
我々のフレームワークは、個人間で堅牢なニューラルデコーディングの道を開き、実践的な臨床応用のための洞察を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:10:37 GMT)
CraftsMan3D: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner [34.1] CraftsManは、非常に多様な形状、通常のメッシュトポロジ、詳細な表面を持つ高忠実な3Dジオメトリを生成することができる。
本手法は,従来の方法に比べて高品質な3Dアセットの製作に有効である。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:22:03 GMT)
MMAFFBen: A Multilingual and Multimodal Affective Analysis Benchmark for Evaluating LLMs and VLMs [33.7] MMAFFBenは多言語マルチモーダル感情分析のためのオープンソースのベンチマークである。
MMAFFBenは、感情極性、感情強度、感情分類、感情強度の4つの主要な感情分析タスクをカバーしている。
MMAFFLM-3b と MMAFFLM-7b は,感情分析タスクを微調整するための MMAFFIn データセットの構築と,それに基づく MMAFFLM-3b と MMAFFLM-7b の開発を行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:02:15 GMT)
LEMMA: Learning from Errors for MatheMatical Advancement in LLMs [33.6] 我々は,大規模言語モデルの推論能力を高めるために,数学的発展のための誤りからの学習(LEMMA)を導入する。
LEMMAは、誤ったステップの間違った解と、微調整のための正しい解への反射接続からなるデータを構成する。
実験結果から, LEMMAは他の強力なベースラインよりも高い性能向上が得られた。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:19:51 GMT)
RAST: Reasoning Activation in LLMs via Small-model Transfer [33.3] 強化学習(RL)は,大規模言語モデル(LLM)の推論能力向上のための強力なアプローチとなっている。
大規模にRLを適用することは、潜在的にリソース集約であり、複数のモデルコピーと広範なGPUワークロードを必要とします。
本稿では、RL学習モデルからRL学習モデルからより大規模なモデルにRL誘導確率調整を注入することにより、推論挙動を伝達する簡易かつ効果的なRASTを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:57:08 GMT)
Nemotron-CC: Transforming Common Crawl into a Refined Long-Horizon Pretraining Dataset [33.2] 精度とデータ量とのトレードオフを改善する方法を示します。
15Tトークンのためにトレーニングされた8Bパラメータモデルで、うち7.2Tは、Llama 3.1 8Bモデルよりも優れている。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:49:42 GMT)
When Large Multimodal Models Confront Evolving Knowledge:Challenges and Pathways [33.1] 大規模言語/マルチモーダルモデル(LLMs/LMMs)は、事前訓練された知識を蓄積するが、実際の更新との整合性を維持するのに苦労する。
実世界のシナリオにおいてマルチモーダル進化的知識を注入するLMMの能力を評価するためのEVOKEベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:36:19 GMT)
TROVE: A Challenge for Fine-Grained Text Provenance via Source Sentence Tracing and Relationship Classification [33.0] テキストpROVEnance(TROVE)チャレンジを導入し、ターゲットテキストの各文を特定のソース文にトレースする。
TROVEをベンチマークするために、11の多様なシナリオをカバーする3つの公開データセットを活用してデータセットを構築します。
我々は、直接的プロンプトおよび検索拡張パラダイムの下で11個のLLMを評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:47:17 GMT)
Advancing Compositional Awareness in CLIP with Efficient Fine-Tuning [32.9] CLIC(Compositionally-Aware Learning in CLIP)は,複数の画像と関連するキャプションを組み合わせた新しいトレーニング手法である。
Clicは、構文理解と意味理解の両面で、アーキテクチャ間の構成性だけでなく、トレーニング済みのCLIPモデルも改善する。
それでも、CLICによる短い微調整は、検索の改善とSugarCrepe++の最高のコンポジションCLIPモデルにつながる。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:04:00 GMT)
Unifying Language Agent Algorithms with Graph-based Orchestration Engine for Reproducible Agent Research [32.9] 大規模言語モデル(LLM)を利用した言語エージェントは、複雑なタスクの理解、推論、実行において顕著な能力を示した。
しかし、堅牢なエージェントの開発には、相当なエンジニアリングオーバーヘッド、標準化されたコンポーネントの欠如、公正な比較のための十分な評価フレームワークなど、大きな課題がある。
我々はこれらの課題に対処するフレキシブルで抽象的なフレームワークであるAGORA(Agent Graph-based Orchestration for Reasoning and Assessment)を紹介した。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:46:23 GMT)
On the Vulnerability of Applying Retrieval-Augmented Generation within Knowledge-Intensive Application Domains [32.7] Retrieval-Augmented Generation (RAG)は、知識集約ドメインにおける大規模言語モデル(LLM)の性能向上を実証的に示している。
医学的Q&Aにおいて,RAGは普遍的な毒殺攻撃に弱いことが示唆された。
我々は、RAGの安全な使用を保証するために、新しい検出ベースの防御を開発する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:01:35 GMT)
Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents [32.6] 我々は,LSMベースのエージェントの攻撃と防御を形式化し,ベンチマークし,評価するフレームワークであるAgen Security Bench (ASB)を紹介した。
ASBをベースとして、インジェクション攻撃10件、メモリ中毒攻撃、新しいPlan-of-Thoughtバックドア攻撃4件、混合攻撃11件をベンチマークした。
ベンチマークの結果,システムプロンプト,ユーザプロンプト処理,ツール使用量,メモリ検索など,エージェント操作のさまざまな段階における重大な脆弱性が明らかになった。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:50:33 GMT)
Towards Inclusive ASR: Investigating Voice Conversion for Dysarthric Speech Recognition in Low-Resource Languages [32.6] 音声変換モデルを英語の変形音声(UASpeech)に微調整し、話者特性と韻律歪みの両方を符号化する。
次に、健康な非英語音声(FLEURS)を非英語の変形性音声に変換する。
生成されたデータは、MMS(Massively Multilingually Speech)と呼ばれる多言語ASRモデルの微調整に使用される。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:39:27 GMT)
Rewrite to Jailbreak: Discover Learnable and Transferable Implicit Harmfulness Instruction [32.5] 大規模言語モデル(LLM)を攻撃するための移動可能なブラックボックスジェイルブレイク法を提案する。
この書き換えアプローチは学習可能で、転送可能であることが分かりました。
大規模な実験と分析により、R2Jの有効性が示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:36:46 GMT)
Universal Biological Sequence Reranking for Improved De Novo Peptide Sequencing [32.3] RankNovoは、de novoペプチドシークエンシングを強化する最初の深層構造である。
我々の研究は、既存のシングルモデルパラダイムに挑戦し、正確なde novoシークエンシングのフロンティアを前進させる新しい戦略を提示する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:21:07 GMT)
Geo-Sign: Hyperbolic Contrastive Regularisation for Geometrically Aware Sign Language Translation [32.1] ジオサイン(Geo-Sign)は、双曲幾何学の特性を利用して手話キネマティクスに固有の階層構造をモデル化する手法である。
本稿では,双曲射影層,重み付きFr'echet平均アグリゲーションスキーム,および双曲空間で直接動作する幾何学的コントラスト損失を導入する。
これらのコンポーネントは正規化関数としてエンドツーエンドの翻訳フレームワークに統合され、言語モデル内の表現を強化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:05:33 GMT)
Hyper-SET: Designing Transformers via Hyperspherical Energy Minimization [32.0] 我々は超球面上での最大推定値としてトークン力学を定式化する。
我々は,バニラ変圧器の逐次的な代替手段であるtextitHyper-Spherical Energy Transformer (Hyper-SET) を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:02:07 GMT)
SummExecEdit: A Factual Consistency Benchmark in Summarization with Executable Edits [32.0] SummExecEditという新しいパイプラインとベンチマークを導入し、実際のエラーを検知し、正確な説明を提供する能力についてモデルを評価する。
トップパフォーマンスモデルであるClaude3-Opusは、ベンチマークでわずか0.49のジョイント検出と説明スコアを達成している。
説明ミスの4つの主要なタイプを特定し、その45.4%は、要約の完全に無関係な部分に焦点を当てている。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:47:02 GMT)
A Survey on Text-Driven 360-Degree Panorama Generation [31.9] テキスト駆動型360度パノラマ生成は没入型視覚コンテンツ生成の革新的進歩である。
テキスト・画像拡散モデルの最近の進歩は、この新興分野の急速な発展を加速させている。
このサーベイは、最先端のアルゴリズムの詳細な分析と、360度3Dシーン生成におけるその拡張的応用を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:58:58 GMT)
CrossICL: Cross-Task In-Context Learning via Unsupervised Demonstration Transfer [31.8] In-Context Learning (ICL)は、大規模な言語モデル(LLM)のパフォーマンスをデモで向上させる。
ほとんどの現実世界のシナリオでは、ユーザーはそのようなデモを行うのを望まないか、望んでいないことが多い。
人間の類推に触発されて、新たなICLパラダイムであるCrossICLを探索し、ICLの既存のソースタスクのデモをターゲットタスクに活用する方法を考察する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:26:05 GMT)
Evaluating Visual and Cultural Interpretation: The K-Viscuit Benchmark with Human-VLM Collaboration [31.7] 本稿では、文化的なVLMベンチマークを構築するための半ハンギングフレームワークを提案し、特にマルチチョイスQAを対象としている。
このフレームワークは人間とVLMのコラボレーションを組み合わせ、VLMはガイドライン、注釈付きサンプルの小さなセット、関連する知識に基づいて質問を生成し、続いてネイティブスピーカーによる検証プロセスを実行する。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:58:03 GMT)
Compiler-R1: Towards Agentic Compiler Auto-tuning with Reinforcement Learning [31.6] コンパイラ自動チューニングのための最初の強化学習(RL)フレームワークであるCompiler-R1を紹介する。
私たちのコードとデータセットはhttps://github.com/Panhaolin2001/Compiler-R1.comで公開されています。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:26:10 GMT)
Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation [31.6] 機能マップのParseグラフ(RMPG)に基づくリファインメントモジュールを設計し、トップダウン分解とボトムアップ結合の2段階からなる。
我々のネットワークは,HPE(Major Human pose Estimation)ベンチマークにおいて優れた結果が得られ,RMPGの有効性は異なる手法で証明される。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:10:01 GMT)
WikiGap: Promoting Epistemic Equity by Surfacing Knowledge Gaps Between English Wikipedia and other Language Editions [31.6] ウィキガップ(WikiGap)は、ウィキペディアの他のウィキペディアのインタフェースから得られる補完的な事実を抽出するシステムである。
具体的には、最近の多言語情報ギャップ発見法とユーザ中心の設計を組み合わせることで、WikiGapはフランス語、ロシア語、中国語のウィキペディアから補完的な情報にアクセスすることができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:14:03 GMT)
ART-DECO: Arbitrary Text Guidance for 3D Detailizer Construction [31.5] 粗い3D形状プロキシを高品質なアセットに即時に変換できるニューラルネットワークである3Dディファレンサを導入する。
我々のモデルはテキストプロンプトを用いて訓練され、形状クラスを定義し、生成した詳細の外観ときめ細かいスタイルを特徴付ける。
我々の精細化器は単一形状に最適化されておらず、生成モデルを蒸留した結果であり、再学習せずに再利用でき、任意の形状を生成することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:05:04 GMT)
Verifying Device Drivers with Pancake [31.4] Pancakeはシステムプログラミングのための命令型言語で、よく定義され、検証しやすいセマンティクスを備えている。
我々は、バイナリがソースコードのセマンティクスを保持することを保証するPancake用のコンパイラを開発する。
そこで我々は,PancakeのVier SMTフロントエンドへの自動翻訳を行い,Ethernet NICの性能検証を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:48:15 GMT)
Segmenting France Across Four Centuries [31.3] 大規模・長期の土地利用と土地被覆の進化を解析するための歴史地図のデータセットを新たに導入する。
我々は18世紀と19世紀の地図に、包括的近代ラベルと22,878 km2の注釈付き歴史ラベルを提供している。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:26:52 GMT)
KBQA-o1: Agentic Knowledge Base Question Answering with Monte Carlo Tree Search [30.9] 知識ベース質問回答 (KBQA) は,大規模構造化知識ベース (KB) を用いた自然言語質問への回答を目的としている。
大きな言語モデル(LLM)の進歩にもかかわらず、KBQAはKB認識の弱さ、効率性と効率の不均衡、注釈付きデータへの高い依存といった課題に直面している。
モンテカルロ木探索(MCTS)を用いた新しいエージェントKBQA法KBQA-o1を提案する。
実験結果から,KBQA-o1は,従来の低リソースKBQA法よりもアノテートデータに制限があることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:04:19 GMT)
Drop Dropout on Single-Epoch Language Model Pretraining [30.6] 現代のLLMに共通する単一エポックな事前訓練タスクは、最小限のオーバーフィッティングをもたらす。
LMプレトレーニングにおけるドロップアウトの役割について、徹底的な実証研究は行われていない。
言語モデリング,モーコシンタクス(BLiMP),質問応答(SQuAD),自然言語推論(MNLI)のダウンストリーム性能は,事前トレーニング中にドロップアウトを適用しない場合に向上する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:48:38 GMT)
Defining Foundation Models for Computational Science: A Call for Clarity and Rigor [30.4] 計算科学における基礎モデルの形式的定義を提案する。
このようなモデルが示すべき本質的で望ましい特徴の集合を具体化します。
データ駆動有限要素法(DD-FEM)は,従来のFEMのモジュラ構造をデータ駆動学習の表現力と融合させるフレームワークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:21:57 GMT)
Starbucks-v2: Improved Training for 2D Matryoshka Embeddings [30.2] 2D Matryoshkaトレーニングにより、単一の埋め込みモデルにより、異なるレイヤにわたるサブネットワーク表現と埋め込み次元を生成することができる。
本稿では,構造化ファインチューニングとマスク付きオートエンコーダ事前学習を組み合わせた,Matryoshkaスタイルの埋め込みモデルの新たなトレーニング戦略であるStarbucksを提案する。
我々のMAEベースの事前学習により、サブネットワークの表現品質が向上し、下流タスクのバックボーンが強化される。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:54:10 GMT)
An Empirical Study of LLM-as-a-Judge for LLM Evaluation: Fine-tuned Judge Model is not a General Substitute for GPT-4 [29.9] 微調整の審査モデルは、GPT-4と同等の評価能力を発揮すると主張されている。
提案手法は, GPT-4 を超越しても, GPT-4 は汎用性, 公正性, 適応性など, 複数次元にわたって性能的に優れていた。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:01:03 GMT)
HumT DumT: Measuring and controlling human-like language in LLMs [29.8] ヒューマンライクな言語は、ユーザーエクスペリエンスを改善するかもしれないが、騙し、過度な信頼、ステレオタイピングにつながる可能性がある。
LLMの相対確率に基づくテキストデータにHumT, 人風のトーン, その他の社会的知覚の指標を導入する。
モデル性能を保ちながら,HumTを用いて人間の声調を体系的に制御し,抑える手法であるDumTを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:38:03 GMT)
Aligning Protein Conformation Ensemble Generation with Physical Feedback [29.7] エネルギーベースアライメント(EBA、Energy-based Alignment)は、生成モデルと物理モデルからのフィードバックを整合させる手法である。
EBAは、高品質なタンパク質アンサンブルを生成する際に最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:33:39 GMT)
Reason-SVG: Hybrid Reward RL for Aha-Moments in Vector Graphics Generation [29.4] SVG生成のための大規模言語モデル(LLM)推論を強化するためのフレームワークであるReason-SVGを紹介する。
Reason-SVGは"Drawing-with-Thought"(DwT)パラダイムを開拓し、モデルがSVGコードと明示的な設計論理の両方を生成する。
1万組のSVG-DwTペアからなる高品質コーパスであるSVGX-DwT-10kデータセットを導入し,各SVGコードを明示的なDwT推論に基づいて生成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:57:58 GMT)
VUDG: A Dataset for Video Understanding Domain Generalization [29.3] Video Understanding Domain Generalization (VUDG) は、ビデオ理解におけるDGのパフォーマンスを評価するために特別に設計された注釈付きデータセットである。
VUDGには、3つのタイプのドメインシフトをカバーする11の異なるドメインのビデオが含まれており、公正で意味のある評価を保証するために、異なるドメイン間のセマンティックな類似性を維持している。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:39:36 GMT)
HiCaM: A Hierarchical-Causal Modification Framework for Long-Form Text Modification [29.0] HiCaMは階層的・因果的な修正フレームワークであり、階層的な要約ツリーと因果グラフを通して動作する。
複数のモデルとドメインで一貫したパフォーマンス改善を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:02:48 GMT)
What's the Difference? Supporting Users in Identifying the Effects of Prompt and Model Changes Through Token Patterns [28.9] Spotlightは、自動化と人間の分析を組み合わせた新しいアプローチだ。
データマイニング技術に基づいて、ランダムな(復号化)バリエーションと言語モデル出力の体系的な違いを自動的に区別する。
トークンパターンのアプローチは,言語モデル出力の体系的差異を理解する上で有効であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:23:44 GMT)
Creativity or Brute Force? Using Brainteasers as a Window into the Problem-Solving Abilities of Large Language Models [28.8] 我々は、モデルが使用する推論戦略のタイプをより深く調査するために、長い物語形式で書かれたブレインティーザに基づくベンチマークを導入する。
ブレインティーザは、創造的な洞察を使った数ステップのソリューションや、より残酷な力を使ったより長いソリューションなど、複数のアプローチで解決することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:59:03 GMT)
Structured 3D Latents for Scalable and Versatile 3D Generation [28.7] 汎用的で高品質な3Dアセット作成のための新しい3D生成手法を提案する。
基本となるのは、異なる出力フォーマットへのデコードを可能にする、構造化されたLATent表現である。
これは、疎人口の少ない3Dグリッドと、強力な視覚基盤モデルから抽出された濃密な多視点視覚特徴を統合することで実現される。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:13:13 GMT)
Enhancing Large Vision Model in Street Scene Semantic Understanding through Leveraging Posterior Optimization Trajectory [28.4] バックボーンおよび下流認識ヘッドとしてのLVM(Large Vision Models)は、ADセマンティック情報を理解するために使用される。
後最適化軌道(POT)誘導最適化スキーム(POTGui)は収束を加速する。
実験の結果,提案手法は66.48%以上の性能向上を実現し,6倍の速度で収束することがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:06:21 GMT)
Training LLMs for EHR-Based Reasoning Tasks via Reinforcement Learning [28.0] 検証可能な報酬付き強化学習(RLVR)を用いて,大規模言語モデル(LLM)を複雑な臨床推論タスクに適用するための実践的レシピを提案する。
医療計算(MEDCALC)、患者と臨床の整合性(TREC CLINICAL TRIALS)、疾患診断(EHRSHOT)など,様々な臨床応用における本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:13:22 GMT)
Building Better: Avoiding Pitfalls in Developing Language Resources when Data is Scarce [27.9] 厳密なデータ収集とラベル付けは、より人間中心で社会的に意識された技術を開発するために不可欠である。
我々は,中・低リソース言語に対するNLPアーティファクトに直接かかわる個人からのフィードバックを収集する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:10:13 GMT)
LoBAM: LoRA-Based Backdoor Attack on Model Merging [27.6] モデルマージ(Model merging)は、異なるタスクに微調整された複数のモデルを統合して、複数のドメインにまたがる汎用モデルを作成する、新たなテクニックである。
既存の研究は、かなりの計算資源を仮定することで、そのような攻撃のリスクを実証しようとするものである。
最小限のトレーニングリソースで高い攻撃成功率を得る方法であるLoBAMを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:45:30 GMT)
FAMA: The First Large-Scale Open-Science Speech Foundation Model for English and Italian [27.3] FAMAは、英語とイタリア語のオープンサイエンス・スピーチ・ファンデーション・モデルの最初のファミリーである。
既存のSFMと比較して最大8倍高速な競合性能を実現している。
コード、データセット、モデルを含むすべてのアーティファクトは、OS準拠のライセンスの下でリリースされている。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:40:00 GMT)
Diversify and Conquer: Open-set Disagreement for Robust Semi-supervised Learning with Outliers [27.1] ラベル付けされていないデータは、しばしば未知のクラスデータ、すなわち外れ値を含む。
SSLの堅牢性を高めるための新しいフレームワークであるDiversify and Conquer(DAC)を提案する。
私たちの重要な貢献は、単一のトレーニングプロセスを通じて、異なるバイアスのかかったモデルのコレクションを構築することです。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:24:30 GMT)
A Comprehensive Survey on Physical Risk Control in the Era of Foundation Model-enabled Robotics [27.0] 最近のファウンデーションモデル対応ロボティクス(FMR)は、汎用技術を大幅に改善した。
一般的な基礎モデルとは異なり、FMRは物理的な世界と相互作用し、人間の安全に直接影響する。
この調査は、身体的リスクを軽減するロボット制御アプローチを包括的にまとめたものである。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:28:49 GMT)
JailBound: Jailbreaking Internal Safety Boundaries of Vision-Language Models [26.8] VLM(Vision-Language Models)は優れた性能を示すが、強力な視覚エンコーダの統合により攻撃面が大幅に拡張されている。
安全境界探索と安全境界交差という2つの段階からなる新しい遅延宇宙脱獄フレームワークであるJailBoundを提案する。
以上の結果から,JailBoundは平均94.32%のホワイトボックス,67.28%のブラックボックス攻撃を達成し,SOTA法より6.17%,21.13%高い結果を得た。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:38:43 GMT)
MAKIEval: A Multilingual Automatic WiKidata-based Framework for Cultural Awareness Evaluation for LLMs [26.8] MAKIEvalは、大規模言語モデルにおける文化的認識を評価するための自動多言語フレームワークである。
モデル出力における文化的実体を自動的に識別し、構造化された知識にリンクする。
オープンソースのシステムとプロプライエタリシステムの両方を対象とする,世界のさまざまな場所で開発された7つのLLMを評価した。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:37:57 GMT)
Ctrl-Crash: Controllable Diffusion for Realistic Car Crashes [26.7] Ctrl-Crashはコントロール可能なカークラッシュビデオ生成モデルで、バウンディングボックス、クラッシュタイプ、初期画像フレームなどの信号を条件付けする。
提案手法は,入力の微妙な変化がクラッシュ結果の劇的な変化を引き起こすような,現実的なシナリオ生成を可能にする。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:04:38 GMT)
Period-LLM: Extending the Periodic Capability of Multimodal Large Language Model [26.7] 現在のMultimodal Large Language Models (MLLM) は,1) 時間的モデリングの欠如,2) 短周期と長周期の競合による周期的タスクに苦慮している。
本稿では,多モーダルな言語モデルである Period-LLM について紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:23:21 GMT)
Breaking the Gold Standard: Extracting Forgotten Data under Exact Unlearning in Large Language Models [26.5] 我々は、さらに正確な未学習を損なう新しいデータ抽出攻撃を導入する。
模擬診断データセット上での攻撃の有効性を実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:09:33 GMT)
Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck [26.4] 本稿では,現在最先端の大規模言語モデル (LLM) の多くは視覚世界に関する階層的な知識を欠いていることを明らかにした。
6つの画像データセットと4つの画像データセットから構築された約100万の視覚的質問応答(VQA)タスクを使用して、これらの結果に到達する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:40:46 GMT)
One-Step is Enough: Sparse Autoencoders for Text-to-Image Diffusion Models [26.2] 我々は、数ステップのテキスト・画像拡散モデルであるSDXL Turboの解釈可能な機能を学ぶためにSAEを訓練する。
学習した特徴は解釈可能であり、生成プロセスに因果的に影響を与え、ブロック間の特殊化を明らかにする。
本研究は,テキスト・画像拡散モデルにおけるSAEの解釈可能性に関する最初の研究である。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:51:51 GMT)
PCIE_Pose Solution for EgoExo4D Pose and Proficiency Estimation Challenge [26.2] 本報告は,RGBエゴセントリックビデオから21個の手関節を推定する作業に焦点を当てる。
We developed the Hand Pose Vision Transformer (HPCIE-T+) to refine hand pose predictions。
EgoD Body Pose Challengeでは,マルチモーダル・シンテンポラル機能統合戦略を採用した。
提案手法は,Hand Pose Challengeで8.31 PA-MPJPE,Body Pose Challengeで11.25 MPJPEを達成した。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:51:04 GMT)
Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control [26.1] スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェアによる低レイテンシかつエネルギー効率の意思決定を提供する。
近年の研究では、強化学習(RL)アルゴリズムがSNNに適しているかどうかを概観している。
離散SNNと連続制御のギャップを埋める新しいプロキシターゲットフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:08:03 GMT)
AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning [26.1] 強化学習(RL)は、大規模言語モデル(LLM)を訓練するためのトレンドパラダイムとなっている。
LLMのための既存の大規模RLシステムは、バッチ設定で生成とトレーニングを交互に行うことで同期化されている。
本稿では,非同期RLシステムであるAReaLについて述べる。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:18:25 GMT)
ManiSkill3: GPU Parallelized Robotics Simulation and Rendering for Generalizable Embodied AI [26.1] ManiSkill3は、汎用的な操作をターゲットとしたコンタクトリッチな物理を備えた、最先端のGPU並列化ロボットシミュレータである。
ManiSkill3は、シミュレーション+レンダリング、異種シミュレーション、ポイントクラウド/ボクセルビジュアル入力など、多くの面でGPU並列化をサポートしている。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:49:14 GMT)
Context is Gold to find the Gold Passage: Evaluating and Training Contextual Document Embeddings [26.0] 本研究では,文書ワイドコンテキストを利用した検索モデルの評価を行うためのベンチマークであるConTEBを紹介する。
以上の結果から,最先端の埋め込みモデルは,コンテキストが必要な検索シナリオで苦労していることがわかった。
InSeNTは、遅延チャンキングプーリングと組み合わせることで文脈表現学習が促進される、新しい対照的なポストトレーニング手法である。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:43:28 GMT)
U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding [25.8] U2-BENCHは,分類,検出,回帰,テキスト生成タスクにおける超音波理解における大規模視覚言語モデル(LVLM)の評価を行うための,最初の総合ベンチマークである。
U2-BENCHは15の解剖学的領域にまたがる7,241の症例を集計し、診断、ビュー認識、病変の局在、臨床値の推定、報告生成など、50の超音波応用シナリオで8つの臨床的にインスパイアされたタスクを定義している。
画像レベルの分類では高い性能を示したが,空間推論や臨床言語生成の難しさが指摘された。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:02:23 GMT)
TumorGen: Boundary-Aware Tumor-Mask Synthesis with Rectified Flow Matching [25.7] tumorGenは、3D腫瘍を効率よく合成するためのリクティファイドフローマッチングを用いた新しい境界認識型腫瘍マスク合成である。
粗くきめ細かな空間制約を通した病理的精度を維持しながら、サンプリングステップを少なくすることで、計算効率を著しく向上する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:11:25 GMT)
CASPER: A Large Scale Spontaneous Speech Dataset [25.4] 本稿では,自発音声データの不足に対処するための基礎研究として,我々のデータセットと方法論を紹介する。
今後このデータセットを拡大し、研究コミュニティのためのリソースを拡大する予定です。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:03:59 GMT)
DeepResearchGym: A Free, Transparent, and Reproducible Evaluation Sandbox for Deep Research [25.4] DeepResearchGymはオープンソースのサンドボックスで、検索APIと、ディープリサーチシステムのベンチマークのための厳格な評価プロトコルを組み合わせる。
このAPIは大規模な公開Webコーパス、すなわちClueWeb22とFineWebをインデックスし、最先端の高密度検索器と、DikANNによる近接検索を使用する。
一般的な商用APIよりも低レイテンシを実現し、実行中の安定したドキュメントランキングを確保し、研究用に自由に利用できる。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:20:27 GMT)
Causal-aware Large Language Models: Enhancing Decision-Making Through Learning, Adapting and Acting [25.4] 大規模言語モデル(LLM)は、モデル内に蓄積される膨大な知識のため、意思決定において大きな可能性を示している。
構造因果モデル(SCM)を意思決定プロセスに統合し,環境の構造的知識をモデル化し,更新し,活用する因果認識型LCMを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:30:44 GMT)
Biological Pathway Guided Gene Selection Through Collaborative Reinforcement Learning [25.3] 多エージェント強化学習(MARL)を用いた統計的選択と生物学的経路知識を統合する新しい枠組みを提案する。
本フレームワークは,グラフニューラルネットワークによる状態表現による経路知識,遺伝子中心性と経路被覆性を組み合わせた報酬機構,共有メモリと集中的批判コンポーネントを用いた協調学習戦略を取り入れた。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:01:07 GMT)
PCIE_Interaction Solution for Ego4D Social Interaction Challenge [25.3] 本報告では,CVPR 2025におけるEgo4D Social Interaction Challengeに対するPCIE_Interactionソリューションについて述べる。
課題は、被写体とカメラ装着者の社会的相互作用を正確に検出することである。
LAMおよびTTMチャレンジリーダーボード上で平均精度(mAP)を0.81と0.71と達成した。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:35:25 GMT)
LLM-powered Query Expansion for Enhancing Boundary Prediction in Language-driven Action Localization [25.1] ビデオにおける言語駆動のアクションローカライゼーションは、言語クエリとビデオセグメント間のセマンティックアライメントを必要とする。
本稿では,アクション開始と終了境界のテキスト記述を生成することで,元のクエリを拡張することを提案する。
また、フレームと拡張クエリ間の意味的類似性を計算することにより、アクション境界の確率スコアをモデル化する。
提案手法はモデルに依存しないため,既存の言語駆動型アクションローカライゼーションモデルにシームレスに統合することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:59:35 GMT)
Beyond the LUMIR challenge: The pathway to foundational registration models [25.1] LUMIR(Large-scale Unsupervised Brain MRI Image Registration)は、非教師なし脳MRI登録の評価と進歩を目的とした次世代ベンチマークである。
LUMIRは、ラベルマップなしでトレーニングするための4000以上の前処理されたT1強調脳MRIを提供し、生物学的に妥当な変形モデリングを促進する。
被験者は1,158名、画像ペアは4,000名以上であった。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:07:58 GMT)
SMELLNET: A Large-scale Dataset for Real-world Smell Recognition [25.0] ポータブルガスと化学センサーを使ってSmellNetを作ります。
SmellNetは、自然界で多様な匂いをデジタル化する最初の大規模データベースである。
我々は、匂いだけで物質をリアルタイムで分類するためのAIモデルを訓練する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:15:25 GMT)
Using Knowledge Graphs to harvest datasets for efficient CLIP model training [25.0] 高品質のCLIPモデルのトレーニングは通常、膨大なデータセットを必要とする。
知識グラフで強化されたスマートWeb検索戦略を利用することで、堅牢なCLIPモデルをスクラッチからトレーニングできることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:39:41 GMT)
Surrogate Signals from Format and Length: Reinforcement Learning for Solving Mathematical Problems without Ground Truth Answers [24.9] 本研究は,代用信号として形式と長さを応用し,数学的問題解決のためにLLMを訓練するものである。
本研究は,形式的正当性のみに着目した報奨関数が,初期の標準GRPOアルゴリズムに匹敵する性能向上をもたらすことを示す。
その結果、フォーマット長のサロゲート信号を利用するGRPOアプローチは、マッチするだけでなく、標準のGRPOアルゴリズムの性能を上回る。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:41:03 GMT)
Emotion-Qwen: Training Hybrid Experts for Unified Emotion and General Vision-Language Understanding [24.9] Emotion-Qwenは、感情理解と一般的な視覚言語推論の両方を強化するために設計されたフレームワークである。
Emotion-Qwenは、Mixture of Experts (MoE)パラダイムに基づいた洗練されたハイブリッドを組み込んでいる。
ビデオ感情推論(VER)データセットを構築し,40万本以上のバイリンガルビデオクリップと詳細な記述的アノテーションを用いて,感情・クウェンの感情推論能力をさらに強化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:27:30 GMT)
Normalizing Flows are Capable Models for RL [24.9] 本稿では,強化学習アルゴリズムにシームレスに統合した単一正規化フローアーキテクチャを提案する。
提案手法はより単純なアルゴリズムに導かれ,模倣学習,オフライン,目標条件付きRL,教師なしRLにおいて高い性能を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:47:02 GMT)
Boosting Multimodal Reasoning with Automated Structured Thinking [24.8] AStarは、Monte Carlo Tree Searchを使用して500以前のサンプルから抽象化された、ハイレベルな推論パターンの軽量ライブラリである。
各テスト問題に対して、AStarは最適な思考カードを適応的に取り出し、これらの外部的明示的ガイドラインをモデルの内部の暗黙的推論能力とシームレスに統合する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:53:06 GMT)
Federated Learning with Dynamic Client Arrival and Departure: Convergence and Rapid Adaptation via Initial Model Construction [24.7] ほとんどのフェデレートされた学習アプローチは、固定されたクライアントセットを前提とします。
現実のシナリオでは、クライアントが特定のタスクに対するニーズや関心に基づいてシステムに参加したり、去ったりすることが多い。
本稿では,クライアントがシステムに参加・離脱するたびに,新しいクライアントセットへの迅速な適応を可能にするアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:51:29 GMT)
Let Them Down Easy! Contextual Effects of LLM Guardrails on User Perceptions and Preferences [24.6] 異なる拒絶戦略が、様々なモチベーションにまたがるユーザの知覚にどのように影響するかを検討する。
以上の結果から,反応戦略がユーザエクスペリエンスを大きく形成する一方で,実際のユーザのモチベーションが無視できないことが判明した。
この研究は、効果的なガードレールは意図を検知するよりも、思慮深い拒絶を作らなければならないことを示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:07:07 GMT)
SALE : Low-bit Estimation for Efficient Sparse Attention in Long-context LLM Prefilling [24.2] 既存のスパースアテンション手法は、アテンションマップの少ない領域をスキップすることで、アテンション計算を加速する。
モデル精度を損なうことなくLLMの長文プリフィルステージを高速化する細粒度アテンション手法であるSALEを提案する。
SALEはLlama-3.1-8Bで64Kより長いシーケンスで3.36倍のスピードアップを実現し、モデル品質を維持している。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:40:24 GMT)
Show-1: Marrying Pixel and Latent Diffusion Models for Text-to-Video Generation [24.2] Show-1は、テキスト・ツー・ビデオ生成のためのピクセルベースのVDMと潜在型のVDMを組み合わせたハイブリッドモデルである。
遅延VDMと比較して、Show-1は正確なテキスト・ビデオアライメントの高品質なビデオを生成することができる。
本モデルは,標準映像生成ベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:55:20 GMT)
Proxy-FDA: Proxy-based Feature Distribution Alignment for Fine-tuning Vision Foundation Models without Forgetting [24.1] ビジョンファウンデーションモデルは、現実世界の概念の豊かな表現をエンコードする大量のデータに基づいて事前訓練される。
近年の頑健な微調整手法は、微調整性能に影響を与えることなく、事前知識の忘れを緩和することを目的としている。
本稿では,特徴空間の構造的知識を明示的に保存する新しい正則化手法であるProxy-FDAを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:16:53 GMT)
Should I Share this Translation? Evaluating Quality Feedback for User Reliance on Machine Translation [24.1] 本研究では,モノリンガルなユーザがまずMT出力を共有するか,次に品質フィードバックで共有するかを決定する,現実的な機械翻訳(MT)シナリオについて検討する。
エラーハイライトを除くすべてのフィードバックタイプは、決定精度と適切な信頼の両方を著しく改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:08:10 GMT)
Seeing is Not Reasoning: MVPBench for Graph-based Evaluation of Multi-path Visual Physical CoT [24.1] 複雑な場面において,OpenAI o3 と GPT-4o が基本的な物理法則,空間的相互作用,因果的影響を把握できないことを示す。
我々は、視覚連鎖(CoT)レンズによる視覚的身体的推論を厳格に評価するベンチマークであるMVPBenchを紹介した。
最先端のMLLMでさえ、物理領域における視覚的推論精度の低下と画像テキストアライメントの弱さを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:48:59 GMT)
Click Without Compromise: Online Advertising Measurement via Per User Differential Privacy [24.0] 本稿では,オンライン広告測定結果を対象とした新しいユーザレベル差分プライバシー保護スキームであるAdsBPCを紹介する。
AdsBPCは、広告測定に適用された既存のストリーミングDPメカニズムよりも33%から95%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:32:33 GMT)
MIR: Methodology Inspiration Retrieval for Scientific Research Problems [23.9] 我々は、ある研究課題に対する解決策を刺激できる概念を持つ先行研究の回収という課題に対処する。
MIR上での学習と評価に適した新しいデータセットを構築した。
我々はMAGを利用して「直感的な先行」を密集したレトリバーに埋め込んで、方法論的インスピレーションのパターンを特定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:33:03 GMT)
Latent-space adversarial training with post-aware calibration for defending large language models against jailbreak attacks [23.8] 大規模言語モデル(LLM)は、システム脆弱性を利用して安全対策を回避し、有害または不適切な出力を誘発するジェイルブレイク攻撃の影響を受ける。
LATPC(Latent-space Adrial Training with Post-aware framework)を紹介する。
LATPCは有害な入力と良性入力を対比することにより安全性に重要な潜伏次元を同定し、ターゲットの拒絶特徴除去攻撃を適応的に構築する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:31:24 GMT)
Open CaptchaWorld: A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents [23.7] Open CaptchaWorldは、MLLMを使用したエージェントの視覚的推論とインタラクション能力を評価するために特別に設計された、Webベースのベンチマークとプラットフォームである。
その結果,Browser-Use Openai-o3 による成功率は 40.0% である。
これはOpen CaptchaWorldを、現在のマルチモーダルエージェントの限界を診断し、より堅牢なマルチモーダル推論システムの開発を導くための重要なベンチマークとして強調している。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:55 GMT)
Learning from Videos for 3D World: Enhancing MLLMs with 3D Vision Geometry Priors [23.7] これまで,ビデオとして解釈することで3次元シーンの理解にMLLM(Multimodal Large Language Models)を適用する研究が続けられてきた。
ビデオ3次元幾何大言語モデル(VG LLM)を提案する。
提案手法では,映像系列から3次元事前情報を抽出する3次元ビジュアルジオメトリエンコーダを用いる。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:16:41 GMT)
Towards Unified Modeling in Federated Multi-Task Learning via Subspace Decoupling [23.6] Federated Multi-Task Learning (FMTL) は、複数のクライアントがローカルデータを交換することなく異種タスクを実行できる。
既存のFMTLメソッドのほとんどは、各クライアント用にパーソナライズされたモデルを構築することに集中しており、複数の異種タスクの集約を統一モデルにサポートできない。
マルチタスクモデル統合に特化して設計された更新構造対応アグリゲーション手法であるFedDEAを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:53:21 GMT)
MSVCOD:A Large-Scale Multi-Scene Dataset for Video Camouflage Object Detection [23.6] Video Camouflaged Object Detection (VCOD)は、ビデオの背景にシームレスに隠されたオブジェクトを特定することを目的とした、難しいタスクである。
我々は,新しい大規模マルチドメインVCODデータセットMSVCODを構築した。
私たちのMSVCODは、これまでで最大のVCODデータセットであり、人間、動物、医療、自動車などの複数のカテゴリーを導入しました。
本フレームワークは,既存のVCOD動物データセットと提案したMSVCODの最先端結果を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:46:33 GMT)
Identifying biological perturbation targets through causal differential networks [23.6] 本稿では,生物学的システムの変更に責任を持つ変数を同定する因果性に着想を得たアプローチを提案する。
まず、観測データと干渉データからノイズの多い因果グラフを推定する。
次に、これらのグラフ間の差分を、追加の統計的特徴とともに、介入された変数の集合にマッピングすることを学ぶ。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:00:27 GMT)
AI for Just Work: Constructing Diverse Imaginations of AI beyond "Replacing Humans" [23.6] AIの一般的なビジョンと目的に対する批判的な考察の欠如は、コミュニティを操作に脆弱にする可能性がある。
AIコミュニティにおける一般的なビジョンは、主に、人間の置き換えや生産性向上といった目的を強調するモノカルチャーである、と私たちは認識しています。
そして私たちは、AIの集合的想像力を多様化し、AIの想像の始まりから倫理的仮定を埋め込むように呼びかけます。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:02:57 GMT)
Neural Force Field: Few-shot Learning of Generalized Physical Reasoning [23.5] 大規模なトレーニングにもかかわらず、現在のAIモデルは、同様の一般化を達成するのに依然として苦労している。
NFFは、連続的な明示的な力場における重力、支持、衝突のような基本的な物理的概念を捉えている。
我々の研究は、物理にインスパイアされた表現を学習システムに組み込むことで、人体推論能力と人体推論能力のギャップを埋めることができることを示唆している。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:10:50 GMT)
ViStoryBench: Comprehensive Benchmark Suite for Story Visualization [23.3] ViStoryBenchはストーリービジュアライゼーションモデルの評価ベンチマークである。
モデルがキャラクタ一貫性を維持する能力をテストするために、シングルとマルチの主人公によるストーリーが特徴である。
複雑なプロットと、正確な視覚を生成するモデルに挑戦する複雑な世界構築を含んでいる。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:58:21 GMT)
PDE-Transformer: Efficient and Versatile Transformers for Physics Simulations [23.2] PDE-Transformerは、正規格子上の物理シミュレーションの代理モデリングのための改良されたトランスフォーマーベースのアーキテクチャである。
提案アーキテクチャは16種類のPDEの大規模データセット上で,コンピュータビジョンのための最先端のトランスフォーマーアーキテクチャより優れていることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:39:54 GMT)
DisTime: Distribution-based Time Representation for Video Large Language Models [23.2] DisTimeは、ビデオLLMにおける時間的理解を強化するために設計された軽量フレームワークである。
DisTimeは、連続的な時間的埋め込みスペースを作成するために学習可能なトークンを使用する。
DisTimeは3つの時間に敏感なタスクでベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:10:18 GMT)
Hush! Protecting Secrets During Model Training: An Indistinguishability Approach [23.2] そこで本研究では,DP を標的にするのではなく,秘密再構築後の確率を対象とする秘密保護の代替的定義を提案する。
提案アルゴリズムは,DP-SGDを全データセット上で実行した場合のベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:14:02 GMT)
On the Design Fundamentals of Diffusion Models: A Survey [23.1] 拡散モデルは、データ分散のモデル化とサンプルを行うパターン学習システムである。
本研究は,拡散モデルの各機能成分における素粒子設計因子の包括的かつ一貫したレビューを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:09:49 GMT)
Privacy Amplification in Differentially Private Zeroth-Order Optimization with Hidden States [23.0] 我々は、ゼロ階最適化のために収束プライバシー境界を確立することができることを示す。
本分析は,スムーズな損失関数の設定に注目するプライバシアンプリフィケーション・バイ・イテレーション・フレームワークを一般化する。
この手法は、それまで文献に知られていなかったDPゼロオーダーのアルゴリズム設計を改良する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:55:32 GMT)
Re-ttention: Ultra Sparse Visual Generation via Attention Statistical Reshape [23.0] 大きなボトルネックは、複雑性が解像度とビデオ長で2倍にスケールする注意機構である。
既存の技術は、非常に高い空間レベルにおける視覚的品質の維持に失敗し、無視できない計算オーバーヘッドを発生させる可能性がある。
本稿では,視覚生成モデルに非常に注意を払わせるRe-ttentionを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:09:51 GMT)
HELM: Hyperbolic Large Language Models via Mixture-of-Curvature Experts [23.0] 我々はHypErbolic Large Language ModelsのファミリーであるHELMを紹介する。
HELM-MICEでは,双曲型マルチヘッド潜在注意法を開発した。
両方のモデルに対して、回転位置符号化と RMS 正規化の本質的な双曲的等価性を開発する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:42:42 GMT)
Weakly-Supervised Affordance Grounding Guided by Part-Level Semantic Priors [23.0] 擬似ラベルに基づく教師あり学習パイプラインを開発した。
擬似ラベルは、空き地から部品名へのマッピングによってガイドされる、既製の部品分割モデルから生成される。
これらのテクニックは,既成の基盤モデルに埋め込まれた静的オブジェクトの意味的知識を活用して,手頃な学習を改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:12:39 GMT)
Children's Voice Privacy: First Steps And Emerging Challenges [22.9] 本研究は, 子どもの3つのデータセット, 6つの匿名化方法, 客観的および主観的ユーティリティメトリクスから構成する。
以上の結果から,成人向けシステムでは,子どもの音声のプライバシーを保護できるが,実用性低下に悩まされていることが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:21:18 GMT)
Do Language Models Understand Honorific Systems in Javanese? [22.8] ジャワ語は、話者、聞き手、参照者の社会的地位に応じて異なる、複雑な名誉体系を持つ。
本稿では,Unggah-Ungguh Basaのニュアンスをカプセル化したデータセットであるUnggah-Ungguhを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:50:03 GMT)
Category-Level 6D Object Pose Estimation in Agricultural Settings Using a Lattice-Deformation Framework and Diffusion-Augmented Synthetic Data [22.7] 我々は、RGB入力にのみ依存するカテゴリ6D推定のための新しいフレームワークを開発する。
各種形状,大きさ,熟度の評価に挑戦するベンチマーク評価において,本フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:25:52 GMT)
Using Information Theory to Characterize Prosodic Typology: The Case of Tone, Pitch-Accent and Stress-Accent [22.6] 我々は,韻律を用いて語彙を区別する言語は,韻律と単語の同一性の間に高い相互情報を示すべきであると予測した。
テキストとピッチ曲線の相互情報を推定するために、5つの言語ファミリーで10の言語で発音された文を読み取る話者のデータセットを使用する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:49:17 GMT)
Mamba Knockout for Unraveling Factual Information Flow [22.5] 我々は、Transformerベースのアーキテクチャとその注意機構に対する理論的および実証的な接続に依存している。
我々は,最初にトランスフォーマー用に開発された注意的解釈可能性技術を,Mamba-1とMamba-2に適応させる。
マンバの構造的因子化をさらに活用することにより、異なる「特徴」がトークンからトークンへの情報交換を可能か、あるいは個々のトークンを豊かにするかを混乱させます。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:08:36 GMT)
Adversarially Robust AI-Generated Image Detection for Free: An Information Theoretic Perspective [22.5] 我々は,AIGI検出において,対戦訓練(AT)がパフォーマンスの低下に悩まされていることを示す。
この差に触発されて,情報理論による無トレーニングロバスト検出(TRIM)を提案する。
TRIMは標準検出器上に構築され、予測エントロピーとKL分散を用いて特徴シフトを定量化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:57:06 GMT)
REIC: RAG-Enhanced Intent Classification at Scale [22.4] 本稿では,Retrieval-augmented Generation Enhanced Intent ClassificationアプローチであるREICを紹介する。
大規模な顧客サービス設定において、REICが従来の微調整、ゼロショット、少数ショットメソッドよりも優れていることを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:32:10 GMT)
Improving Protein Sequence Design through Designability Preference Optimization [22.0] 我々は、高い設計性に向けてシーケンス生成を操ることで、トレーニング目標を再定義する。
ResiDPO(Residue-level Designability Preference Optimization)を導入する。
これにより、すでにうまく機能している領域を保存しながら、設計性を直接改善することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:02:51 GMT)
EgoVIS@CVPR: What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.0] 状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。
我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。
本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:39:29 GMT)
Cluster-Aware Causal Mixer for Online Anomaly Detection in Multivariate Time Series [21.8] 誤検出や誤検出に関連する重大なリスクを考えると、時系列データの異常の検出は極めて重要である。
時系列中の異常を効果的に検出するクラスタ対応因果混合器を提案する。
本稿では,偽陽性を防止すべく,異常証拠を蓄積する異常検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:56:54 GMT)
Soft Reasoning: Navigating Solution Spaces in Large Language Models through Controlled Embedding Exploration [21.8] 大きな言語モデル(LLM)は、多様性と非効率的な探索のために複雑な推論に苦しむ。
我々は,第1トークンの埋め込みを最適化して生成をガイドする埋め込み型検索フレームワークであるSoft Reasoningを提案する。
実験では、最小限の計算で優れた正確性を示し、スケーラブルでモデルに依存しないソリューションである。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:11:52 GMT)
Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning [21.7] 本稿では,2段階のフレームワークであるReinforcement Distillation (REDI)を提案する。
Supervised Fine-Tuning (SFT) による正のトレースから学ぶステージ1
ステージ2は、提案したREDI目標を通じて、正と負の両方のトレースを用いてモデルをさらに洗練する。
DPO/SimPOを併用したベースラインリジェクションサンプリングSFTやSFTよりもREDIが優れていることを示す実験的検討を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:47:17 GMT)
Hidden in Plain Sight: Probing Implicit Reasoning in Multimodal Language Models [21.7] マルチモーダルな大規模言語モデル(MLLM)は、オープンエンドの現実世界の環境にますます多くデプロイされている。
本稿では,現在のMLLMが暗黙の推論シナリオをどのように扱うのかを体系的に分析する。
モデルは、必要な知覚と推論スキルを持っている場合でも、隠れた問題にしばしば遭遇しない。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:47:28 GMT)
SSF-Net: Spatial-Spectral Fusion Network with Spectral Angle Awareness for Hyperspectral Object Tracking [21.7] ハイパースペクトルビデオ(HSV)は、空間的、スペクトル的、時間的情報を同時に提供する。
既存の手法は主にバンド再編成に重点を置いており、特徴抽出のためにRGBトラッカーに依存している。
本稿では、超スペクトル(HS)物体追跡において、スペクトル角認識(SST-Net)を用いた空間-スペクトル融合ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:37:43 GMT)
The State of Multilingual LLM Safety Research: From Measuring the Language Gap to Mitigating It [21.6] 私たちは、2020年から2024年にかけての300近い出版物を、主要なNLPカンファレンスや*ACLのワークショップでレビューします。
英語以外の言語が独立した言語として研究されることはめったになく、英語の安全研究が言語ドキュメントの実践に乏しいことを観察する。
我々の調査と提案された方向性に基づいて、この分野は、多様な世界人口に対するより堅牢で包括的なAI安全プラクティスを開発することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:32:44 GMT)
Learning to Reason Over Time: Timeline Self-Reflection for Improved Temporal Reasoning in Language Models [21.6] 大規模言語モデル(LLM)は、一貫性のあるテキストを生成し、コンテキストを理解し、推論タスクを実行するための強力なツールとして登場した。
彼らは時間的推論に苦しむが、それはイベントシーケンシングや時間的関係、時間的関係などの時間的関連情報を処理する必要がある。
我々は,タイムライン構築と反復的自己回帰を組み合わせた多段階プロセスを通じて,LLMの時間的推論能力を高める新しいフレームワークであるTISERを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:37:19 GMT)
Accelerating the Evolution of Personalized Automated Lane Change through Lesson Learning [21.5] 高度運転支援システムの普及にはパーソナライゼーションが不可欠である。
ユーザの好みに合わせて、オンラインの進化能力は必須です。
本稿では,ドライバーの乗っ取り介入から学ぶ授業学習アプローチを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:05:17 GMT)
Contrastive Perplexity for Controlled Generation: An Application in Detoxifying Large Language Models [21.3] 大規模言語モデル(LLM)による有害なコンテンツの生成は、言語技術の安全なデプロイにおいて重要な課題である。
プロトタイプに基づくコントラッシブ・パープレキシティを目標とした微調整 LLM による暗黙的知識編集とテキスト生成のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:37:59 GMT)
LaMP-QA: A Benchmark for Personalized Long-form Question Answering [21.1] パーソナライズされた長文回答生成を評価するために設計されたベンチマークであるLaMP-QAを紹介する。
本ベンチマークでは,(1)芸術・エンターテイメント,(2)ライフスタイル・アンド・パーソナル・デベロップメント,(3)社会・文化の3つのカテゴリーを対象とし,45以上のサブカテゴリを対象とする。
その結果、パーソナライズされたコンテキストを組み込むことで、パフォーマンスが最大39%向上することがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:16:03 GMT)
RoboMoRe: LLM-based Robot Co-design via Joint Optimization of Morphology and Reward [21.1] RoboMoReは、ロボットの共同設計ループ内での共同最適化のための形態と報酬形成を統合するフレームワークである。
粗い最適化段階において、LLMに基づく多様性反射機構は、多様かつ高品質な形態-逆対を生成する。
最適化段階では、LLM誘導報酬とモルフォロジー勾配の更新を交互に行い、上位候補を反復的に洗練する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:16:07 GMT)
Complexity-Aware Deep Symbolic Regression with Robust Risk-Seeking Policy Gradients [20.9] 本稿では,データ駆動型数式発見の堅牢性と解釈可能性を高めるために,新しい記号回帰手法を提案する。
我々の研究は、データ固有の式生成器の学習に焦点を当てた、一般的なDSRフレームワークと一致しています。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:19:04 GMT)
HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images [20.8] このような不正な手を取り戻すためのHandCraftを提案する。
これは、手のためのマスクと奥行き画像を自動的にコンディショニング信号として構築することで実現される。
我々のプラグアンドプレイハンド修復ソリューションは、既存の事前訓練拡散モデルと互換性がある。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:22:47 GMT)
CLaSp: In-Context Layer Skip for Self-Speculative Decoding [20.8] 我々は、自己投機的復号化のためのコンテキスト内レイヤスキッピング戦略であるCLaSpを提案する。
以前の方法とは異なり、CLaSpは追加のドラフトモジュールや追加のトレーニングを必要としない。
CLaSpはLLaMA3シリーズモデルの1.3x 1.7xの高速化を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:15:06 GMT)
Reading Recognition in the Wild [20.8] ユーザがいつ読んでいるかを判断する新しい読解タスクを導入する。
まず、Wildデータセットにおける大規模マルチモーダル読み込みについて紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:46:13 GMT)
On the Interaction of Noise, Compression Role, and Adaptivity under $(L_0, L_1)$-Smoothness: An SDE-based Approach [20.8] 本研究では分散SGD,分散圧縮SGD,分散署名SGDのダイナミクスについて検討する。
我々の分析は、バッチノイズ、勾配圧縮、適応性の間の複雑な相互作用に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:35:15 GMT)
Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs [20.8] 中層は言語間アライメントの可能性が強い。
スロットフィリング、機械翻訳、構造化テキスト生成の実験は、言語間転送における一貫した改善を示している。
我々は、個別に訓練されたアライメントモジュールを既存のタスク固有のモジュールとマージすることができ、完全に再トレーニングすることなく言語間の機能を改善することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:20:43 GMT)
Mixture-of-Experts for Personalized and Semantic-Aware Next Location Prediction [20.7] NextLocMoEは、大きな言語モデル(LLM)上に構築され、デュアルレベルのMixture-of-Experts(MoE)設計を中心に構築された、新しいフレームワークである。
我々のアーキテクチャは2つの特別なモジュールで構成されている: ロケーションセマンティックス MoE は、位置の豊富な機能的意味をエンコードする埋め込みレベルで動作し、パーソナライズされた MoE は、トランスフォーマーのバックボーンに埋め込まれ、個々のユーザーモビリティパターンに動的に適応する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:45:19 GMT)
Decoding Knowledge Attribution in Mixture-of-Experts: A Framework of Basic-Refinement Collaboration and Efficiency Analysis [20.5] MoEモデルは、"ミッドアクティベーション、遅延増幅"パターンにより、層ごとの効率を37%向上させる。
これらの洞察はMoEの解釈可能性を高め、効率性、特殊化、堅牢性のバランスをとるための原則を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:40:51 GMT)
SA-Person: Text-Based Person Retrieval with Scene-aware Re-ranking [20.5] 既存の手法は主に外観に基づくクロスモーダル検索に重点を置いており、しばしばシーン内に埋め込まれたコンテキスト情報を無視する。
SCENEPERSON-13Wは,歩行者の外観と環境条件の両方を多用した10万シーンを超える大規模データセットである。
第1段階では、テキストの手がかりを歩行者固有の地域と整列させることにより、差別的な接地を行う。
第2段階では、SceneRankerを紹介した。SceneRankerは、マルチモーダルな大規模言語モデルを利用して、歩行者の外観とグローバルなシーンコンテキストを共同で推論する、トレーニング不要でシーン対応のリグレード手法である。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:10:28 GMT)
DemoShapley: Valuation of Demonstrations for In-Context Learning [20.3] インコンテキスト学習(ICL)を用いた大規模言語モデル(LLM)は、タスク固有の微調整なしで多くのタスクを抽出する。
本研究では,Data ShapleyとBeta ShapleyにインスパイアされたDemoShapleyとBeta-DemoShapleyを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:48:42 GMT)
Accountability Attribution: Tracing Model Behavior to Training Processes [20.3] AI開発パイプラインは、複数のステージ事前トレーニング、微調整ラウンド、その後の適応やアライメント、各ステージ内の多数のモデル更新ステップを含むことが多い。
これは、デプロイされたモデルが成功したり失敗したり、どのステージが責任を負い、どの程度まで責任を負うかという、説明責任に関する重要な疑問を提起する。
トレーニングプロセスの特定の段階に遡るモデル行動の追跡を目的とした,アカウンタビリティ帰属(countability attribution)の問題を提起する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:27:39 GMT)
3D Gaussian Splat Vulnerabilities [20.1] ビュー依存型ガウスの外観を導入し、特定の視点からしか見えない敵のコンテンツを埋め込む。
DAGGERは3Dガウスを直接摂動する敵攻撃であり、基礎となる訓練データにアクセスできない。
これらの攻撃は、3DGSの未発見の脆弱性を浮き彫りにしており、自律ナビゲーションやその他の安全クリティカルな3DGSアプリケーションに対して、ロボット学習に新たな脅威をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:21:22 GMT)
Conservation-preserved Fourier Neural Operator through Adaptive Correction [20.0] 本稿では,基本量の保存を確実にするための適応補正手法を提案する。
本手法では,学習時に学習可能な行列を導入し,学習中の保存則を満たすための解を適応的に調整する。
理論的には、制約のないFNOに適応補正を適用すると、最高の保存条件を満たすFNOよりもデータ損失の少ない解が得られることが示される。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:28:12 GMT)
Revisiting Group Relative Policy Optimization: Insights into On-Policy and Off-Policy Training [19.8] 我々は、政治と政治の双方の最適化体制において、グループ相対政策最適化(GRPO)を再考する。
我々は、政治と政治以外のGRPO目標の両方が報酬の改善をもたらすことを示す。
次に,2つのGRPO変種を用いた後学習における強化学習の実証的性能と検証可能な報酬とを比較した。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:55:41 GMT)
Mind the Quote: Enabling Quotation-Aware Dialogue in LLMs via Plug-and-Play Modules [19.7] 課題をスパン条件付き世代として定式化し、各ターンを対話履歴に分解する。
本稿では,タスク固有の対話を自動的に合成する引用中心のデータパイプラインを提案する。
本稿では,2つのボトルネックプロジェクションをアタッチメントヘッドにアタッチする軽量なトレーニングベース手法QuAdaを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:06:11 GMT)
Every Rollout Counts: Optimal Resource Allocation for Efficient Test-Time Scaling [19.7] テスト時間スケーリング(TTS)による大規模言語モデル(LLM)の性能向上
探索中に最も効果的にロールアウト予算を割り当てる方法はまだ探索されていないが、多くの場合、テスト時に計算の効率が悪くなる。
本稿では,このバイアスを緩和する最適手法として,指向性資源割当(DORA)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:05:25 GMT)
Hierarchical Attention Fusion of Visual and Textual Representations for Cross-Domain Sequential Recommendation [19.7] クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインにわたる歴史的なインタラクションを活用することで、ユーザの振る舞いを予測する。
本稿では,視覚的・テキスト的表現の階層的意図融合(HAF-VT)を提案する。
階層的な注意機構は、人間の情報統合を模倣して、単一ドメインとクロスドメインの好みを共同で学習する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:31:51 GMT)
MolQAE: Quantum Autoencoder for Molecular Representation Learning [19.6] MolQAEは完全な分子構造を利用する最初の量子オートエンコーダである。
MolQAEはパラメータ化された回転ゲートを用いてSMILES文字列を直接量子状態にマッピングする。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:53:00 GMT)
Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning [19.5] Deep Augmentationは、ニューラルネットワークのターゲット層にドロップアウトまたはPCA変換を適用する方法である。
レイヤ間で均一にドロップアウトを適用することで、パフォーマンスが一貫して向上しないことを示す。
また, 停止段階の操作は, 拡張として効果的にドロップアウト機能を確保するために重要であることも示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:01:15 GMT)
SORCE: Small Object Retrieval in Complex Environments [19.4] 本稿では,T2IRの新たなサブフィールドであるSORCE(Small Object Retrieval in Complex Environments)を紹介する。
SORCE-1Kの予備解析では、既存のT2IRメソッドは小さなオブジェクトをキャプチャし、すべてのセマンティクスを単一の埋め込みにエンコードするのに苦労している。
我々はMLLM(Multimodal Large Language Models)を活用して、一組のReP(Regional Prompts)で指示された各画像に対する複数の埋め込みを抽出する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:23:05 GMT)
RCCDA: Adaptive Model Updates in the Presence of Concept Drift under a Constrained Resource Budget [19.4] リアルタイム機械学習アルゴリズムは、コンセプトドリフトにモデルを適用するという課題に直面していることが多い。
既存のソリューションは、しばしば資源制約された環境に対して高い計算オーバーヘッドをもたらすドリフト検出法に依存している。
本稿では,MLトレーニングのダイナミクスを最適化し,事前定義されたリソース制約に対する厳格なコンプライアンスを確保する動的モデル更新ポリシーであるRCCDAを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:49:42 GMT)
STAR-Net: An Interpretable Model-Aided Network for Remote Sensing Image Denoising [19.3] スパーステンソル支援表現ネットワーク(STAR-Net)という新しいRSI復調手法を提案する。
我々はSTAR-NetをSTAR-Net-Sと呼ばれるスパース変種に拡張し、ロバスト性の向上を目的としたオリジナルのRSIにおける非ガウス雑音による干渉に対処する。
合成および実世界のデータセットに関する包括的な実験は、STAR-NetとSTAR-Net-Sが最先端のRSI復調法より優れていることを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:09:31 GMT)
Unleashing High-Quality Image Generation in Diffusion Sampling Using Second-Order Levenberg-Marquardt-Langevin [19.3] 拡散ヘッセン幾何学を学習自由な方法で近似する新しいレバンス・マルカルト・ランジュヴィン法(LML)を導入する。
このLML近似ヘッセン幾何により、拡散サンプリングによりより正確なステップを実行し、画像生成品質を向上させることができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:21:44 GMT)
Scalable Oversight for Superhuman AI via Recursive Self-Critiquing [19.1] 直接評価が不可能な場合、高次の批判(例えば、批判的批判の批判)を行うことにより、よりトラクタブルな監視経路が提供されることを示す。
我々はさらに人間-AIとAI-AIの実験を行い、AIの監督のために再帰的な自己評価を活用する可能性について調査する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:46:59 GMT)
Model Informed Flows for Bayesian Inference of Probabilistic Programs [18.9] VIPとフルランクのガウス流は、翻訳項とモデル先行からの入力を付加した前方自己回帰流として正確に表現できることを示す。
モデルインフォームド・フローアーキテクチャを導入し、必要な翻訳機構、事前情報、階層的順序付けを追加する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:08:00 GMT)
Swarm Intelligence Enhanced Reasoning: A Density-Driven Framework for LLM-Based Multi-Agent Optimization [18.9] 本稿では,新しいエージェントベースのSwarm Intelligence(ASI)パラダイムを導入することにより,Swarmインテリジェンスを推論プロセスに統合することを提案する。
そこで我々は,Swarm Intelligence Enhancing Reasoningフレームワークを開発した。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:59:59 GMT)
S3CE-Net: Spike-guided Spatiotemporal Semantic Coupling and Expansion Network for Long Sequence Event Re-Identification [18.8] イベントカメラは、厳しい照明条件に抵抗し、背景干渉を低減し、高解像度を実現し、顔情報を保護することができる。
本稿では,S3CE-Net(Spike-guided Spatiotemporal Semantic Coupling and Expansion Network)という,簡便な時系列イベントRe-IDモデルを提案する。
S3CE-Netは多くのメインストリームのイベントベースの人物Re-IDデータセットで優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:32:37 GMT)
The Road to Generalizable Neuro-Symbolic Learning Should be Paved with Foundation Models [18.7] 複雑な推論タスクのためにニューラルネットワークを訓練する際の課題に対処するために、ニューロシンボリックラーニングが提案された。
一般化問題につながる計算,データ,プログラムに関して,従来のニューロシンボリック学習の落とし穴を3つ挙げる。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:46 GMT)
When Harry Meets Superman: The Role of The Interlocutor in Persona-Based Dialogue Generation [18.7] 対話エージェントにペルソナ情報を与えると、世代間の一貫性と多様性が著しく向上することが証明されている。
提供されるペルソナとの対話の整合性に多くの焦点が当てられているが、インターロケータのプロファイルへの適応性はいまだに未熟である。
本研究では,(1)モデルが提供したペルソナとインターロケータの両方と応答を一致させる能力,(2)慣れ親しんだインターロケータやトピックを扱う際の堅牢性,(3)特定のペルソナに基づく対話に対する追加の微調整の影響について検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:04:30 GMT)
Running Conventional Automatic Speech Recognition on Memristor Hardware: A Simulated Approach [18.5] 数百万のパラメータを持つMLシステムがmemristorハードウェア上でどのように振る舞うかを示す。
我々は,3ビット重み精度を用いて線形演算を行う場合,単語誤り率の相対劣化を25%に制限する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:42:41 GMT)
BatteryLife: A Comprehensive Dataset and Benchmark for Battery Life Prediction [18.4] バッテリライフ予測(Battery Life Prediction, BLP)のための包括的なデータセットとベンチマークであるバッテリライフを提案する。
BatteryLifeは16のデータセットを統合し、前回の最大のデータセットの2.5倍のサンプルサイズを提供する。
BatteryLifeは、亜鉛イオン電池、ナトリウムイオン電池、そして業界でテストされているリチウムイオン電池のバッテリー寿命データセットを初めてリリースした。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:39:56 GMT)
Pushing the Limits of Beam Search Decoding for Transducer-based ASR models [18.4] ビームサーチはキーネットワークコンポーネントの繰り返し評価によりトランスデューサを著しく遅くする。
本稿では,トランスデューサのビームサーチを高速化する汎用手法を提案し,ALSD++とAES++の2つの最適化アルゴリズムを実装した。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:42:48 GMT)
FinMME: Benchmark Dataset for Financial Multi-Modal Reasoning Evaluation [18.1] FinMMEは金融分野におけるMLLMのマルチモーダル評価データセットである。
18の金融ドメインと6つの資産クラスで11,000以上の高品質な金融調査サンプルをカバーしている。
FinScoreは幻覚の罰則と多次元能力評価を取り入れた評価システムである。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:36:19 GMT)
Performative Risk Control: Calibrating Models for Reliable Deployment under Performativity [18.1] リスク管理を達成するために機械学習モデルを校正することは、信頼性の高い意思決定を保証するために不可欠である。
本稿では, リスク管理を行うためのモデルキャリブレーションフレームワークであるPerformative Risk Controlを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:59:25 GMT)
Geospatial Foundation Models to Enable Progress on Sustainable Development Goals [18.1] Foundation Models(FM)は、自然言語処理とコンピュータビジョンに革命をもたらした大規模で事前訓練されたAIシステムである。
本研究は地理空間的FMの厳密な学際的評価を提供し,持続可能性目標達成におけるその役割について重要な知見を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:36:38 GMT)
DeepSeek-R1 vs. o3-mini: How Well can Reasoning LLMs Evaluate MT and Summarization? [18.0] 推論可能な大規模言語モデル (LLM) は論理的タスクに優れるが、自然言語生成を評価するための実用性はまだ明らかにされていない。
本研究は,機械翻訳およびテキスト要約評価タスクにおいて,推論LLMと非推論LLMを体系的に比較する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:59:36 GMT)
Out of Sight, Not Out of Context? Egocentric Spatial Reasoning in VLMs Across Disjoint Frames [18.0] エゴセントリックなビデオを操作するAIアシスタントは、時間をかけて空間的な手がかりを統合する必要がある。
Disjoint-3DQAは、VLMのこの能力を評価するためのQAベンチマークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:32:26 GMT)
VecTrans: Enhancing Compiler Auto-Vectorization through LLM-Assisted Code Transformations [18.0] VecTransは、コンパイラベースのコードベクトル化を強化するために、大きな言語モデルを活用するフレームワークである。
VecTransは1.77倍のGeomeanスピードアップを実現し、51のテストケースのうち24をベクトル化することに成功した。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:10:51 GMT)
Intercept Cancer: Cancer Pre-Screening with Large Scale Healthcare Foundation Models [17.7] CATCH-FM, CATch carcinoma early with Healthcare Foundation Models。
Caught-FMは、歴史的医療記録に基づいて、さらなるスクリーニングを行うためのリスクの高い患者を特定する。
各種患者分布におけるCATCH-FMのロバスト性について検討した。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:31:09 GMT)
Can Slow-thinking LLMs Reason Over Time? Empirical Studies in Time Series Forecasting [17.7] 時系列予測(TSF)は、古典的な統計的アプローチから現代のディープラーニングやマルチモーダル言語モデリングまで、基礎的で広く研究されている課題である。
一方、ゆっくり考え始めるLSMは、様々な領域にまたがる印象的な多段階推論能力を示している。
スロー思考のLLMは、時系列予測をサポートするために時間的パターンよりも効果的に推論できるのか?
論文参考訳(メタデータ) (Fri, 30 May 2025 12:19:02 GMT)
No Task Left Behind: Isotropic Model Merging with Common and Task-Specific Subspaces [17.7] モデルマージは、複数のタスク固有のモデルの重みを単一のマルチタスクモデルに統合する。
この問題に対する最近の関心にもかかわらず、シングルタスクモデルと組み合わせたモデルの間には大きなパフォーマンスギャップが残っている。
タスク固有成分とマージ行列の特異成分のアライメントは,性能改善と強く相関していることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:26:33 GMT)
Are MLMs Trapped in the Visual Room? [17.7] サールの中国語室からインスピレーションを得て,bfVisual Roomの議論を提案する。
システムは、根底にある意図を真に理解することなく、アルゴリズムの規則に従って視覚入力のあらゆる詳細を処理し、記述することができる。
この研究は、提案されたVisual Room引数の実証的な基盤を提供し、新しい評価パラダイムのフォーマットを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:14:00 GMT)
Effects of Theory of Mind and Prosocial Beliefs on Steering Human-Aligned Behaviors of LLMs in Ultimatum Games [17.6] 交渉課題におけるエージェント的行動と人間の規範を整合させる上での思考理論(ToM)推論の役割について検討する。
ToM推論は、行動整合性、意思決定整合性、交渉結果を高める。
本研究は,人間とAIの相互作用と協調的意思決定の促進におけるToMの役割の理解に寄与する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:23:52 GMT)
CREFT: Sequential Multi-Agent LLM for Character Relation Extraction [17.6] CREFTは知識蒸留を通じて基本文字グラフを構築し、その後、文字合成、関係抽出、役割識別、グループ割り当てを反復的に洗練する。
韓国のドラマデータセットをキュレートした実験では、CREFTは精度と完全性の両方でシングルエージェントLLMベースラインを著しく上回っている。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:01:36 GMT)
Accelerated Sampling from Masked Diffusion Models via Entropy Bounded Unmasking [17.5] 仮面拡散モデル (MDM) は, 言語モデリングにおける自己回帰モデル (ARM) と比較して, 競合性能を示した。
本稿では,Entropy bounded unmasking 手法を用いて,既存のサンプルのドロップイン置換であるEB-Samplerを紹介する。
EB-Samplerは、パフォーマンスを損なうことなく、標準的なコーディングと数学推論ベンチマークで、最先端のMDMのサンプリングを約2~3倍高速化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:52:55 GMT)
Why (not) use AI? Analyzing People's Reasoning and Conditions for AI Acceptability [17.4] 我々は,AIの発達に関する人々の判断に影響を与える人口統計学的要因と推論的要因について検討する。
我々は、個人の健康よりも労働代替利用の受け入れが低いことを見出した。
統一推論タイプ(例えば、コスト対利益推論)を観察して、より高い合意を導きます。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:58:39 GMT)
Star Attention: Efficient LLM Inference over Long Sequences [17.4] 本稿では,複数のホストに注意を向けることで,計算効率を向上させる2相ブロックスパース近似であるStar Attentionを紹介する。
Star Attentionは、グローバルに注意を払ってトレーニングされたほとんどのTransformerベースのLarge Language Modelとシームレスに統合され、メモリ要件と推論時間を最大11倍に短縮する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:36:37 GMT)
Tradeoffs between Mistakes and ERM Oracle Calls in Online and Transductive Online Learning [17.4] 学習者が経験的リスク最小化(Empirical Risk Minimization, ERM)や弱一貫性オラクルによってのみ概念クラスと対話する場合, オンライン学習とトランスダクティブオンライン学習を学習する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:11:58 GMT)
Right Side Up? Disentangling Orientation Understanding in MLLMs with Fine-grained Multi-axis Perception Tasks [17.4] 本稿では,オブジェクト指向認識を主評価対象とするベンチマークであるDORI(Discriminative Orientation Reasoning Intelligence)を紹介する。
DORIは、正面アライメント、回転変換、相対方向関係、標準方向理解の4つの次元を評価する。
最先端の視覚言語モデル15について評価した結果,限界が明らかとなった。
DORIは、ロボット制御の改善、3Dシーン再構築、物理的環境における人間とAIの相互作用に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:36:31 GMT)
On Meta-Prompting [17.3] 現代の大規模言語モデル(LLM)は、入力文字列を命令やプロンプトとして解釈し、それらに基づいてタスクを実行することができる。
プロンプトとプレトレーニングのための多くのアプローチは、メタプロンプトとして知られるこれらのプロンプトの自動生成を含んでいる。
ユーザと対話する際のICLとLCMの挙動を一般化し記述するためのカテゴリ理論に基づく理論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:08:20 GMT)
MythTriage: Scalable Detection of Opioid Use Disorder Myths on a Video-Sharing Platform [17.3] 本稿では,オピオイド関連神話の大規模な研究をYouTubeで紹介する。
臨床専門家は,8つの普及神話を検証し,専門家ラベル付きビデオデータセットをリリースする。
MythTriageは、日常的なケースに軽量モデルを使用し、より難しいものを高いパフォーマンスで高コストで大規模な言語モデル(LLM)にデフェクトする、効率的なトリアージパイプラインである。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:37:10 GMT)
HD-NDEs: Neural Differential Equations for Hallucination Detection in LLMs [17.3] 文の真偽を評価する新しい手法であるHalucination Detection-Neural Differential Equations (HD-NDEs)を提案する。
本研究では,大規模言語モデルの潜在空間における力学系をモデル化するために,ニューラル微分方程式(Neural differential equations,Neural DEs)を適用した。
実験では、特にHD-NDEの有効性を示し、True-Falseデータセット上でAUC-ROCを14%以上改善した。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:19:49 GMT)
Causal-PIK: Causality-based Physical Reasoning with a Physics-Informed Kernel [17.2] Causal-PIKは、ベイズ最適化を利用して物理インフォームドカーネルを介して因果相互作用を推論する手法である。
Causal-PIKは最先端の成果よりも優れており、目標を達成するためには少ないアクションを必要とする。
Causal-PIKは、人間の問題解決者であっても、非常に困難なタスクに対して競争力を維持しています。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:43:35 GMT)
Super-additivity of quantum capacity in simple channels [17.1] 量子容量の超付加性は、量子情報理論の重要な特徴である。
一般化されたプラティプスチャネルは、それぞれQudit消去チャネルとマルチレベル振幅減衰チャネルを組み合わせた場合、量子容量の超付加性を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:48:32 GMT)
PRISM: A Framework for Producing Interpretable Political Bias Embeddings with Political-Aware Cross-Encoder [17.0] PRISMはinteRpretable polItical biaS eMbeddingsを製造するためのフレームワークである。
弱いラベル付けされたニュースデータから政治トピックとそれに対応するバイアス指標を抽出する。
次に、構造化されたバイアススコアを、これらの指標との整合性に基づいてニュース記事に割り当てる。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:31:53 GMT)
Reasoning Can Hurt the Inductive Abilities of Large Language Models [17.0] しばしば、Large Reasoning Models (LRM) で用いられるように、チェーン・オブ・シント(CoT)はそのような推論を促進すると仮定される。
隠れた人間定義ルールでゲームベースの4つの制御されたタスクを作成することで、この仮定を考察する。
CoT推論は帰納的性能を低下させる可能性があり, LRMは非推論的性能を低下させることが多い。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:24:21 GMT)
Adversarial Pruning: A Survey and Benchmark of Pruning Methods for Adversarial Robustness [16.6] 近年の研究では、敵の例に対する堅牢性を保ちながら、ネットワークのサイズを小さくするニューラルネットワークプルーニング技術が提案されている。
これらの手法には複雑で明瞭な設計が含まれており、違いを分析して公正かつ正確な比較を確立することは困難である。
そこで我々は,パイプライン,いつ産卵するべきか,具体例,どのように産卵するべきかという2つの主要な次元に基づいて分類する新しい分類法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:21:25 GMT)
Beyond Prompting: An Efficient Embedding Framework for Open-Domain Question Answering [16.6] 大規模言語モデルは、最近、新しいフロンティアにオープンドメインの質問に答えた。
一般的なレトリバーリーダーパイプラインは、しばしば複数のプロンプトレベル命令に依存する。
EmbQAは,レシーバとリーダの両方を強化した埋め込みレベルのフレームワークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:44:30 GMT)
From Citations to Criticality: Predicting Legal Decision Influence in the Multilingual Swiss Jurisprudence [16.5] 本稿では,ケース優先性を評価するための新たなリソースであるCriticality Predictionデータセットを紹介する。
本データセットは,(1)二段式LD-Label,(2)より粒度の細かいCitation-Label,(2)二段式LD-Label,(2)二段式LD-Labelを特徴とする。
より小型の微調整モデルと大型の言語モデルを含む複数の多言語モデルをゼロショット設定で評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:57:28 GMT)
LLM Inference Enhanced by External Knowledge: A Survey [16.3] 本研究では,外部知識を用いた大規模言語モデル(LLM)の強化戦略について検討する。
比較分析では、解釈可能性、スケーラビリティ、パフォーマンスのトレードオフを強調しています。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:08:51 GMT)
CogniBench: A Legal-inspired Framework and Dataset for Assessing Cognitive Faithfulness of Large Language Models [16.3] 忠実な幻覚は、LLMに提供されるコンテキストによってサポートされていないLarge Language Model (LLM)によって生成される主張である。
認知的ステートメントの様々なレベルの忠実度を評価するための厳密なフレームワークを開発し、CogniBenchデータセットを導入する。
これにより、大規模なCogniBench-Lデータセットが作成され、事実と認知の両方の幻覚に対する正確な検出器の訓練が容易になる。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:16:51 GMT)
Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models [16.3] ビデオ言語モデル(VLM)は、複雑なビデオ中心の質問に答えるように設計されている。
現在のベンチマークでは、選択バイアスのため、VLMの完全な推論能力の取得に失敗している。
本研究は,ビデオ-テキスト LLM モデルにおける選択バイアスについて,初めて焦点を絞った研究である。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:01:57 GMT)
BOSE: A Systematic Evaluation Method Optimized for Base Models [16.2] 事前トレーニングの初期段階では、ベースモデルには質問に答える能力がない。
ベースモデルとインストラクトモデルとの整合性:ベースモデルでは、対応するインストラクトモデルと比較して評価性能が劣っている。
本稿では,ベースモデルの評価を最適化する手法として,ベースモデル指向システム評価(BOSE)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:59:02 GMT)
Discl-VC: Disentangled Discrete Tokens and In-Context Learning for Controllable Zero-Shot Voice Conversion [16.2] Discl-VCはゼロショット音声変換フレームワークである。
内容と韻律情報を自己教師型音声表現から切り離す。
ターゲット話者の声をテキスト内学習により合成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:04:23 GMT)
Softmax is not Enough (for Sharp Size Generalisation) [16.2] 鋭い振る舞いのキーキャリアはソフトマックス関数である。
推定時間におけるソフトマックスのシャープネスを改善するためのアドホックな手法として適応温度を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:46:05 GMT)
Explorer: Scaling Exploration-driven Web Trajectory Synthesis for Multimodal Web Agents [16.2] 我々は,これまでで最大かつ最も多様な軌跡レベルのデータセットを合成するスケーラブルなレシピを開発した。
このデータセットには、49KのユニークなURL、720Kのスクリーンショット、3300万のWeb要素を含む、94K以上の成功したマルチモーダルWebトラジェクトリが含まれている。
我々は、Mind2Web-Live、Multimodal-Mind2Web、MiniWob++のようなオフラインおよびオンライン両方のWebエージェントベンチマークで強力なパフォーマンスを示します。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:30:57 GMT)
Generative AI for Urban Design: A Stepwise Approach Integrating Human Expertise with Multimodal Diffusion Models [16.2] 本研究では,マルチモーダル拡散モデルと人間の専門知識を統合した段階的都市デザインフレームワークを提案する。
単一のエンドツーエンドのプロセスで結果を生成するのではなく、このフレームワークは、確立された都市デザインに合わせた3つの重要なステージにプロセスを分割する。
各段階で、レンダリング拡散モデルは、テキストプロンプトと画像ベースの制約に基づいて予備設計を生成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:33:48 GMT)
Go With the Flow: Fast Diffusion for Gaussian Mixture Models [16.1] シュロディンガーブリッジ (Schrodinger Bridges, SBs) は、有限時間で操る拡散過程であり、与えられた初期分布を、適切なコスト関数を最小化する。
そこで本研究では,低次元問題を解くための一組の実行可能なポリシーの解析的パラメトリゼーションを提案する。
本稿では,オートエンコーダの潜伏空間における画像から画像への変換,マルチマージ運動量SB問題を用いたセルダイナミクスの学習など,低画像化におけるこのアプローチの可能性を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:11:37 GMT)
From Hallucinations to Jailbreaks: Rethinking the Vulnerability of Large Foundation Models [16.1] 大きな基礎モデル(LFM)は幻覚やジェイルブレイク攻撃の影響を受けやすい。
本稿では,ジェイルブレイクをトークンレベルの最適化および注意レベルの最適化として幻覚としてモデル化する統一理論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:48:50 GMT)
DiffuseTrace: A Transparent and Flexible Watermarking Scheme for Latent Diffusion Model [16.0] 生成モデル出力に透かしを追加することは、著作権の追跡と潜在的なリスクの軽減に欠かせないテクニックである。
本稿では拡散モデル成分の微調整に依存しないDiffuseTraceと呼ばれる新しい手法を提案する。
8種類の画像処理用透かし攻撃と3種類の生成用透かし攻撃の下では、DiffuseTraceは透かし検出率99%、帰属精度94%以上を維持している。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:06:29 GMT)
ProxyThinker: Test-Time Guidance through Small Visual Reasoners [15.9] ProxyThinkerは、大規模なモデルで、訓練なしに、小さく、ゆっくりと考えられた視覚的推論能力を継承できる推論時手法である。
RFTの推論者からベースモデルの出力を減じることで、プロクシーティンカーは自己検証や自己補正のような出現した振る舞いによって証明される緩やかな思考的推論を導き出す。
本実装では,複数の言語モデルを並列化手法で効率的にコーディネートし,従来の復号時間法と比較して最大38$timesの高速推論を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:43 GMT)
E^2GraphRAG: Streamlining Graph-based RAG for High Efficiency and Effectiveness [15.8] 本稿では,グラフベースのRAGフレームワークであるE2GraphRAGを提案する。
E2GraphRAGはGraphRAGの最大10倍のインデックス化を実現し、LightRAGの100倍の高速化を実現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:27:40 GMT)
Evaluating Gemini in an arena for learning [15.7] 教育者や教育の専門家がAIモデルを比較する"学習の場"を運営しています。
このアリーナは、Gemini 2.5 Pro、Claude 3.7 Sonnet、GPT-4o、OpenAI o3といった最先端モデルのスレートを評価した。
専門家はこれらの試合の73.2%でジェミニ2.5 Proを好んだ。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:26:32 GMT)
GradPower: Powering Gradients for Faster Language Model Pre-Training [15.7] GradPowerは、言語モデルの事前トレーニングを加速するための軽量な変換技術である。
たった1行のコードの変更だけで、ベースの内部ロジックを変更する必要はない。
多様なアーキテクチャで終端損失を継続的に減少させる。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:49:57 GMT)
Why Are Positional Encodings Nonessential for Deep Autoregressive Transformers? Revisiting a Petroglyph [15.6] 自動回帰変換言語モデルは、明示的なPEを必要とせずに、置換トークンでシーケンスを区別することができる。
この特性は、言語モデリングにTransformerを採用した初期の取り組み(GPT-2と同時期)から知られていた。
ここでは,多層自己回帰変換器において明示的なPEが重要でない理由について,長年にわたる説明をレビューする。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:12:49 GMT)
Randomized Dimensionality Reduction for Euclidean Maximization and Diversity Measures [15.6] 次元縮小の効果は、基礎となるデータセットである$X$のemphdoubling dimension $lambda_X$と密接に結びついていることが示される。
具体的には、ターゲット次元が$O(lambda_X)$ sufficesであり、ほぼ最適解の値を保存するのに十分であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:11:03 GMT)
LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models [15.6] この調査は、2022年から2025年までの大規模言語モデル(LLLM)の限界について、データ駆動半自動レビューを行うことによって、このギャップに対処する。
ACL と arXiv のコーパスから,キーワードフィルタリングと LLM に基づく分類を用いて,14,648 の関連制限紙を抽出した。
LLM関連の研究は、2022年から2025年の間にACLの約6倍、arXivの約15倍に増加することが判明した。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:19:31 GMT)
BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks [15.5] タスクを完了するには、LLM(Big Language Model)ベースのエージェントを計画によって簡単に実行可能なステップに分解する必要がある。
既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。
実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:04:33 GMT)
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation [15.5] モデルマージは、複数のタスク固有のモデルを統合モデルに統合し、タスク固有のモデルの能力を継承することを目的としている。
既存のモデルマージ手法は、最終的なマージモデルに対する異なるタスク固有モデルの寄与率の違いを考慮していないことが多い。
そこで我々はMixup Model Merge(M3)を提案する。これはMixupデータ拡張手法のランダム化線形戦略に着想を得た単純で効果的な手法である。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:49:16 GMT)
Model-Based Exploration in Monitored Markov Decision Processes [15.4] 強化学習の要点は、エージェントが常に報酬を観察することである。
Mon-MDPアルゴリズムにはいくつかの制限がある。
我々はこれらの欠点に対処するMon-MDPのモデルベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:57:33 GMT)
Friends in Unexpected Places: Enhancing Local Fairness in Federated Learning through Clustering [15.4] フェデレートラーニング(FL)は、分散データセット間の機械学習モデルの協調トレーニングにおいて重要なパラダイムである。
本稿では、パーソナライズされたFLと局所的に公平なFLの空間にまたがる異種設定のための新しいFLアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:50:03 GMT)
ZPressor: Bottleneck-Aware Compression for Scalable Feed-Forward 3DGS [15.4] ZPressorは軽量なアーキテクチャに依存しないモジュールで、マルチビュー入力の効率的な圧縮を可能にする。
本研究では、ZPressorを複数の最先端フィードフォワード3DGSモデルに統合することにより、適度なインプットビューでの性能が向上し、高密度ビュー設定でロバスト性が向上することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:57:49 GMT)
Provably Improving Generalization of Few-Shot Models with Synthetic Data [15.3] 本研究では,分散の相違が教師あり学習に与える影響を定量化する理論的枠組みを開発する。
本稿では,データ分割とモデルトレーニングの両方を最適化するために,プロトタイプ学習を統合した理論に基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:59:45 GMT)
Multi-Continental Healthcare Modelling Using Blockchain-Enabled Federated Learning [15.2] 我々は,地域データセットを共有することなく,多大陸(ヨーロッパ,北米,アジア)のデータセットを用いたグローバルヘルスケアモデリングの枠組みを提案する。
技術的には、ブロックチェーン対応のフェデレーション学習は、医療データのプライバシと安全性の要件を満たすように適応して実装されている。
実験結果から,提案するフレームワークは有効で,効率的で,プライバシーが保たれていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:44:28 GMT)
SAMBLE: Shape-Specific Point Cloud Sampling for an Optimal Trade-Off Between Local Detail and Global Uniformity [15.2] Sparse Attention Map and Bin-based Learning method(SAMBLE)を提案する。
SAMBLEは、局所的な詳細のためのサンプリングエッジポイントと、グローバルな形状の均一性を維持するためのバランスを効果的に改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:11:08 GMT)
Learning geometry and topology via multi-chart flows [15.2] 本稿では,低次元の潜在空間と周囲の空間をマッピングする正規化フローの退化学習手法を提案する。
次に、そのような多様体上の測地線を計算するための最初の数値アルゴリズムを開発する。
経験的に、このことがトポロジ推定の大幅な改善につながっていることを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:54:25 GMT)
A Red Teaming Roadmap Towards System-Level Safety [15.2] 要求拒否を実装するLLM(Large Language Model)セーフガードは、誤用に対する緩和戦略として広く採用されている。
敵の機械学習とAIの安全性の交差点で、保護された赤いチーム分けは、最先端の拒絶訓練されたLLMの重大な脆弱性を効果的に特定した。
明確な製品安全仕様に対するテストは、抽象的な社会的バイアスや倫理的原則よりも優先すべきである、と我々は主張する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:58:54 GMT)
Understanding while Exploring: Semantics-driven Active Mapping [15.2] ActiveSGMは、実行前に潜在的観測の有意性を予測するために設計された、アクティブなセマンティックマッピングフレームワークである。
ロボットが最も有益な視点を戦略的に選択できるようにすることで、ActiveSGMは、ノイズの多いセマンティックデータに対するマッピング完全性、正確性、堅牢性を効率的に強化する。
ReplicaとMatterport3Dデータセットの実験は、アクティブセマンティックマッピングタスクにおけるActiveSGMの有効性を強調した。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:03:17 GMT)
Adapting to Linear Separable Subsets with Large-Margin in Differentially Private Learning [15.0] 本稿では,二元線形分類におけるDP-ERMの問題について検討する。
実験的なゼロワンリスク境界を持つ効率的な$(varepsilon,delta)$-DPアルゴリズムを得る。
我々のアルゴリズムは、マージンパラメータ$gamma$やoutlierサブセット$S_mathrmout$を知る必要がないため、高度に適応している。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:56:58 GMT)
Don't Reinvent the Wheel: Efficient Instruction-Following Text Embedding based on Guided Space Transformation [15.0] 誘導空間変換に基づく新しい命令追従型テキスト埋め込みフレームワークであるGSTransformを提案する。
我々のキーとなる観察は、命令関連情報は本質的には汎用的な埋め込みに符号化されているが、まだ利用されていないことである。
GSTransformは、少量のテキストデータと命令中心のラベルアノテーションでガイドされるユーザ命令に合わせるために、事前に計算された埋め込みをリアルタイムで適応する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:16:22 GMT)
Transformers Are Universally Consistent [14.9] ソフトマックスに基づく非線形アテンションを備えたトランスフォーマーは,最小二乗の回帰処理を行う場合,一様に整合性を示す。
我々は経験的誤差の上限を導出し、この条件下では$mathcalO(t-1/2d)$の証明可能な速度で減衰し、$t$は入力トークンの数を表し、$d$は埋め込み次元を表す。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:39:26 GMT)
Constrained Bayesian Optimization under Bivariate Gaussian Process with Application to Cure Process Optimization [14.9] 我々は、目的関数と制約関数の間の独立ガウス過程の仮定に基づく制約付きベイズ最適化を開発する。
本稿では,製造工程の最適化に応用した提案手法の性能を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:24:54 GMT)
On Designing Diffusion Autoencoders for Efficient Generation and Representation Learning [14.7] 拡散オートエンコーダ(DA)は、入力依存の潜在変数を使用して、拡散過程と共に表現をキャプチャする。
より良い生成モデリングは、別のクラスの拡散モデル -- 前方(ノイズ)プロセスを学ぶもの -- の第一の目標です。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:14:09 GMT)
Aligned but Blind: Alignment Increases Implicit Bias by Reducing Awareness of Race [14.7] 文脈が曖昧である場合, 言語モデル(LM)は, 初期内部表現における人種概念を無視することを示す。
本稿では,初期モデル層における人種概念の表現を動機付けることによって,新たなバイアス緩和戦略を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:41:44 GMT)
SPPSFormer: High-quality Superpoint-based Transformer for Roof Plane Instance Segmentation from Point Clouds [14.7] 変圧器は、ポイントクラウドの屋根面のインスタンスセグメンテーションにはほとんど使われていない。
既存のスーパーポイント変換器は、低品質のスーパーポイントを使用するため、限られた性能に悩まされる。
高品質なスーパーポイントが満足すべき2つの基準を確立し、それに対応する2段階のスーパーポイント生成プロセスを導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:23:16 GMT)
Beyond KAN: Introducing KarSein for Adaptive High-Order Feature Interaction Modeling in CTR Prediction [14.7] This study introduces Kolmogorov-Arnold Represented Sparse Interaction Network (KarSein)。
KarSeinは、低次の基本的な特徴を高次の特徴相互作用に適応的に変換する。
非常にコンパクトなパラメータサイズと最小の計算オーバーヘッドを維持しながら、例外的な予測精度を達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:31:15 GMT)
ALPS: Attention Localization and Pruning Strategy for Efficient Alignment of Large Language Models [14.7] 下流タスクに対する汎用大規模言語モデル(LLM)の調整は、しばしばかなりの訓練調整コストを発生させる。
我々は、最もタスクに敏感なアテンションヘッドをローカライズし、それらをプーンする効率的なアルゴリズムであるtextittextbfAttention textbfLocalization と textbfPruning textbfStrategy (textbfALPS)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:30:20 GMT)
On the Emergence of Weak-to-Strong Generalization: A Bias-Variance Perspective [14.7] W2SG(Weak-to-strong generalization)とは、弱い教師によってラベル付けされたデータセットに基づいて訓練された強力な学生モデルが、ターゲットタスクにおいて教師より優れる現象である。
近年の研究では、学生モデルと教師モデルの間の予測ミスフィットによるパフォーマンス向上が評価されている。
W2SGは、生徒モデルが個々の教師を模倣するのではなく、その後部の平均教師に近似した場合に出現する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:52:43 GMT)
GridRoute: A Benchmark for LLM-Based Route Planning with Cardinal Movement in Grid Environments [14.6] 大規模言語モデル(LLM)は、計画と推論タスクにおけるその可能性を実証している。
LLMが従来のアルゴリズムをどのように活用できるかを評価するための総合評価ベンチマークGridRouteを提案する。
また,従来のアルゴリズムのプロンプト指導を取り入れた,アルゴリズム・オブ・シント(AoT)と呼ばれる新しいハイブリッドプロンプト手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:40:59 GMT)
HardTests: Synthesizing High-Quality Test Cases for LLM Coding [14.6] 検証は、強化学習のような後学習技術が必要とする大言語モデル(LLM)推論において重要な役割を果たす。
LLMを用いた高品質なテスト合成のためのパイプラインであるHARDTESTGENを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:00:34 GMT)
Contrastive Learning for Task-Independent SpeechLLM-Pretraining [14.5] 大規模言語モデル(LLM)は自然言語処理に優れている。
タスク固有の微調整は、リスク、データ要求、計算コストの過度な適合によって制限される。
スケーラブルな2段階トレーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:35:44 GMT)
Multi-task Learning for Heterogeneous Multi-source Block-Wise Missing Data [14.4] マルチタスク学習(MTL)は、複数の学習タスクを同時に解決するための命令型機械学習ツールとして登場した。
様々なタスクにまたがる情報を効果的に借用するためには、均質情報と異質情報の両方を活用することが不可欠である。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:52:03 GMT)
Multi-task Learning for Heterogeneous Data via Integrating Shared and Task-Specific Encodings [14.4] マルチタスク学習(MTL)は、複数の学習タスクを同時に処理する上で欠かせない機械学習ツールとなっている。
タスク毎に不均一な潜在因子空間を構築するためのデュアルエンコーダフレームワークを提案する。
本稿では,タスク固有およびタスク共有エンコーダと係数を交互に学習する統一アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:58:42 GMT)
Smooth Model Compression without Fine-Tuning [14.4] ニューラルネットワークのトレーニングとモデル圧縮に対するスムーズな正規化の影響について検討する。
その結果,スムーズなモデルに適用した場合,標準的な刈り取り方式の方がよくなることがわかった。
我々の手法は、微調整なしで最先端の圧縮を可能にする。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:13:48 GMT)
6D Pose Estimation on Point Cloud Data through Prior Knowledge Integration: A Case Study in Autonomous Disassembly [14.3] 本研究は, 製品ライフサイクルの工学的強化を目的としたスタータモータの解体に焦点を当てた。
この文脈における重要な目的は、モーターに付着したボルトの識別と6次元ポーズ推定である。
完全なボルト情報を取得することができる包括パイプラインの開発は、ボルト検出の監視を回避するために不可欠である。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:58:04 GMT)
50 Years of Automated Face Recognition [14.2] 顔認識は、初歩的で手作りのシステムから高度なディープラーニングモデルへと進化してきた。
近年の進歩は、高品質の顔と低品質の顔のシナリオにおいて顕著な精度を実現している。
今後の顔認識研究における重要な課題と将来的な方向性について概説する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:10:48 GMT)
Improving Language and Modality Transfer in Translation by Character-level Modeling [14.1] 現在の翻訳システムは多言語であるにもかかわらず、世界の言語のうち5%しかカバーしていない。
新しい言語やモダリティへの適応性を改善するための文字ベースアプローチを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:16:08 GMT)
Are Any-to-Any Models More Consistent Across Modality Transfers Than Specialists? [14.0] ACONは、字幕、編集命令、Q&Aペアと組み合わせた1000枚の画像からなるデータセットで、モーダル間転送を評価する。
実験の結果,任意のモデルが,ポイントワイド評価において,特定のモデルよりも一貫した相互整合性を示さないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:51:54 GMT)
Towards Scalable Schema Mapping using Large Language Models [14.0] スキーママッピングに大規模言語モデル(LLM)を使用する際の3つの問題を特定する。
本稿では,サンプリングとアグリゲーションによる手法を提案する。
データ型プリフィルタのような戦略を緩和することを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:36:56 GMT)
The Gaussian Mixing Mechanism: Renyi Differential Privacy via Gaussian Sketches [14.0] 本稿では,Renyi Differential Privacy (RDP) のレンズを用いて,この操作を再考する。
この改良された解析が、異なる線形回帰設定における性能改善にどのように寄与するかを実証する。
経験的に、我々の手法は複数のデータセットのパフォーマンスを改善し、いくつかのケースではランタイムを削減します。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:52:48 GMT)
Qwen Look Again: Guiding Vision-Language Reasoning Models to Re-attention Visual Information [13.9] 長い推論は視覚的トークンを希釈し、視覚的情報の注意を減らし、幻覚を引き起こす可能性がある。
Qwen-LookAgain (Qwen-LA) は新たな視覚テキスト反映プロセスで、推論中にモデルが再認識されるように誘導する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:37:34 GMT)
MAGIC-VQA: Multimodal And Grounded Inference with Commonsense Knowledge for Visual Question Answering [13.7] 本稿では,広視野言語モデル(LVLM)と共通知識を体系的に統合することにより,視覚質問応答(VQA)を向上させる新しいフレームワークであるMAGIC-VQAを紹介する。
MAGIC-VQAは、外部ソースからの明示的な知識統合、コンテキストの洗練のためのBY-Type Post-Processing、構造化推論のためのグラフニューラルネットワーク(GNN)を用いたインプシット知識拡張という3段階のプロセスを採用している。
我々のフレームワークは,ベンチマークデータセット上での最先端性能を実現し,VQAにおける常識推論を大幅に改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:34:32 GMT)
STORK: Improving the Fidelity of Mid-NFE Sampling for Diffusion and Flow Matching Models [13.6] 本稿では,安定化テイラー直交ルンゲ-クッタ法 (STORK) と呼ばれる,新しい,トレーニング不要で構造に依存しないDMODEソルバを提案する。
STORKは、FIDスコアによって測定された、無条件画素レベル生成と条件付き潜在空間生成タスクで生成品質を改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:46:34 GMT)
Bi-Manual Joint Camera Calibration and Scene Representation [13.6] Bi-Manual Joint and Representation Framework (Bi-JCR)について紹介する。
Bi-JCRは、カメラを装着した複数のロボットマニピュレータがキャリブレーションマーカーの画像を撮影することを回避できる。
Bi-JCRは、密集したマーカーのないマルチビュー対応に3D基礎モデルを活用することにより、(i)各カメラからエンドエフェクタへの外部変換、(ii)マニピュレータ間のアーム間相対的なポーズ、(iii)共有ワークスペースの統一的でスケール一貫性のある3D表現を共同で推定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:22:00 GMT)
A Training-Free Length Extrapolation Approach for LLMs: Greedy Attention Logit Interpolation (GALI) [13.6] Greedy Attention Logit Interpolation (GALI) は、入力長固有のチューニングを必要とせずに長さ外挿を改善する訓練不要の手法である。
Galiは入力長固有のチューニングを必要とせずに、幅広い長文タスクに対して安定かつ優れたパフォーマンスを実現する。
Galiは、大規模言語モデルにおけるより堅牢で一般化可能な長文処理への一歩である。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:42:35 GMT)
MonoCoP: Chain-of-Prediction for Monocular 3D Object Detection [13.6] 提案するMonoCoPは,3つのキー設計により3次元特性を逐次的かつ条件的に予測する。
追加のデータを必要とせずに、KITTIのリーダーボード上での最先端(SoTA)パフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:52:48 GMT)
EVA-MILP: Towards Standardized Evaluation of MILP Instance Generation [13.5] 混合整数線形プログラミング(MILP)は、複雑な意思決定問題を解決するための基礎となる。
多様なデータセットに対する機械学習の需要により,MILPインスタンス生成手法の普及が加速し,標準化された評価手法が大幅に向上した。
本稿では,MILPインスタンス生成手法の体系的および客観的評価を目的とした総合ベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:42:15 GMT)
Faithful and Robust LLM-Driven Theorem Proving for NLI Explanations [13.5] 自然言語推論(NLI)における自然言語説明の役割
近年の研究では、大言語モデル(LLM)と定理証明器(TP)の相互作用が、NLI説明の有効性の検証と改善に役立つことが示されている。
本稿では,自己形式化時の意味喪失を軽減するための戦略について検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:38:39 GMT)
Reefknot: A Comprehensive Benchmark for Relation Hallucination Evaluation, Analysis and Mitigation in Multimodal Large Language Models [13.5] 我々は2万以上の実世界のサンプルからなる関係幻覚を対象とする総合的なベンチマークであるReefknotを紹介した。
関係幻覚を体系的に定義し、知覚的視点と認知的視点を統合するとともに、Visual Genomeのシーングラフデータセットを用いて関係ベースのコーパスを構築する。
本稿では,Reefknotを含む3つのデータセットに対して,幻覚率を平均9.75%削減する信頼性に基づく新たな緩和戦略を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:27:55 GMT)
SUMO: Subspace-Aware Moment-Orthogonalization for Accelerating Memory-Efficient LLM Training [13.2] 低ランク勾配に基づく最適化手法は、大規模言語モデル(LLM)の訓練において、メモリ効率を大幅に改善した。
これらの手法は主にメモリの節約を強調し、しばしば収束の潜在的な加速を見落としている。
本稿では,SUMO(Subspace-Aware Moment-Orthogonalization)を提案する。
我々は,SUMOがコンバージェンスを加速し,安定性を向上し,性能を向上し,最先端手法と比較してメモリ要求を最大20%削減することを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:08:40 GMT)
Co-designed Quantum Discrete Adiabatic Linear System Solver Via Dynamic Circuits [13.1] 既存の量子離散的断熱的アプローチは、進化段階の数とともに線形に増加する回路深さによって妨げられる。
本稿では,動的回路機能とリアルタイムな古典処理を統合した協調設計フレームワークを提案する。
我々の解法は、現実的な雑音モデルの下でも、80パーセント以上の解の忠実さを維持しながら、過去の奥行き制限を克服することに成功している。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:18:42 GMT)
Vision-Language Models Struggle to Align Entities across Modalities [13.1] クロスモーダルなエンティティリンクは、マルチモーダルコード生成のような現実世界のアプリケーションに必要な基本的なスキルである。
我々のベンチマークであるMATEは5.5kの評価インスタンスで構成されており、視覚シーンはテキスト表現と一致している。
現状のビジョン・ランゲージ・モデル(VLM)と人間をこの課題で評価し,VLMが人間と比べ有意に苦労していることを見いだした。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:04:40 GMT)
StructFlowBench: A Structured Flow Benchmark for Multi-turn Instruction Following [13.1] マルチターン命令追従能力は、現実世界のアプリケーションにおいて、大規模言語モデル(LLM)のコア能力を構成する。
既存の評価ベンチマークは、マルチターンとシングルターンの相互作用を区別するダイアログ間の重要な構造的依存関係を見落としている。
構造フローモデリングを用いたマルチターンインストラクションであるStructFlowBenchを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:20:31 GMT)
Near-Optimal Nonconvex-Strongly-Convex Bilevel Optimization with Fully First-Order Oracles [13.1] 両レベル最適化は、低レベル問題が強い凸である場合に考慮する。
我々は,2段階の更新を組み込んで,最適に近い$tilde MathcalO(epsilon-2)$ 1次オラクル複雑性を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:23:29 GMT)
VietMix: A Naturally Occurring Vietnamese-English Code-Mixed Corpus with Iterative Augmentation for Machine Translation [13.0] 機械翻訳システムは、低リソース言語向けのコード混合入力を処理する際に失敗する。
この課題に対処するために、自然発生のベトナム語のテキストを専門の英訳と組み合わせたコード混合コーパスであるVietMixを、並列コーパスでキュレートする。
このリソースを増大させ、補完的な合成データ生成パイプラインを開発した。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:18:10 GMT)
All That Glitters is Not Novel: Plagiarism in AI Generated Research [12.9] 近年、自律的な研究エージェントが新たな研究アイデアを創出できると主張する論文がいくつかある。
このような研究資料のかなりの部分は、巧妙に盗用されている。
本研究では, 自動プラギアリズム検出装置は, それらのシステムからプラギア化のアイデアを捉えるのに不十分であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:17:39 GMT)
Beyond Pretty Pictures: Combined Single- and Multi-Image Super-resolution for Sentinel-2 Images [12.9] SEN4Xは、シングルイメージとマルチイメージの利点を組み合わせたハイブリッド超解像度アーキテクチャである。
センチネル2の画像を2.5mの地中サンプリング距離にアップグレードする。
最先端の超高解像度ベースラインよりも性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:02:56 GMT)
Leadership Assessment in Pediatric Intensive Care Unit Team Training [12.8] 本稿では、自我中心のビジョンに基づく自動分析フレームワークを開発することにより、PICUチームのリーダーシップスキルを評価するタスクについて述べる。
指導力評価の重要指標として, 固定対象, アイコンタクト, 会話パターンなどの重要な行動指標を同定した。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:19:33 GMT)
Consensus-aware Contrastive Learning for Group Recommendation [12.7] グループレコメンデーションは、個人の好みを反映して、ユーザーグループにパーソナライズされたアイテム提案を提供することを目的としている。
コンセンサスを意識したContrastive Learning for Group Recommendation(CoCoRec)を導入し,コントラスト学習を通じてグループコンセンサスをモデル化する。
4つのベンチマークデータセットで実施された実験によると、CoCoRecは個々の推奨シナリオとグループ推奨シナリオの両方において、最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:44:32 GMT)
Learning reusable concepts across different egocentric video understanding tasks [12.7] Hier-EgoPackは、下流タスク間で実行できるタスクパースペクティブのコレクションを作成することができるフレームワークである。
本稿では、下流タスクにまたがるタスクの視点の集合を作成できる統合フレームワークであるHier-EgoPackについて紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:14:46 GMT)
Structure-Aware Fill-in-the-Middle Pretraining for Code [12.6] AST-FIMは抽象構文木(AST)を利用して,大規模な構文構造を隠蔽する事前学習戦略である。
実世界のフィリング・イン・ザ・ミドル(FIM)プログラミングタスクを評価するために、12言語にわたる3万以上のGitHubコミットから得られたベンチマークであるReal-FIM-Evalを紹介した。
実験により、AST-FIMは、標準のFIMベンチマークで最大5 ptの精度で標準のランダム文字FIMを上回り、現実世界のコード編集に特に有益であることが示されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:19:39 GMT)
Stop Guessing: Optimizing Goalkeeper Policies for Soccer Penalty Kicks [12.6] 我々は,異なるゴールキーパー戦略の有効性を評価できるプレイヤー非依存のシミュレーションフレームワークを開発した。
私たちの研究は、ペナルティの専門家が注釈を付けた大量の罰則に基づいています。
現実の状況におけるゴールキーパーポリシーの最適化に,私たちのフレームワークをどのように利用できるかを示します。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:23:12 GMT)
ResSVD: Residual Compensated SVD for Large Language Model Compression [12.5] 大規模言語モデル(LLM)は、幅広い下流自然言語処理タスクにおいて印象的な機能を示している。
本稿では,ポストトレーニング後のSVDに基づくLLM圧縮手法であるResSVDを提案する。
トラニケート過程中に発生する残留行列を利用してトラニケート損失を低減する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:11:24 GMT)
NativQA: Multilingual Culturally-Aligned Natural Query for LLMs [12.4] 大規模言語モデル(LLM)の能力を評価する上で、QAデータセットは重要な役割を果たす。
文化的かつ地域的に整合したQAデータセットをシームレスに構築する,スケーラブルで言語に依存しないフレームワークであるNativQAを提案する。
7言語で64kの注釈付きQAペアからなる多言語自然QAデータセットであるMultiNativQAを設計することで,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:06:34 GMT)
Otter: Generating Tests from Issues to Validate SWE Patches [12.4] 本稿では、問題からテストを生成するベンチマークであるTDD-Bench-Verifiedと、このタスクのためのLLMベースのソリューションであるOtterを紹介する。
Otterはルールベースの分析でLCMを拡張してアウトプットのチェックと修復を行い、新しい自己反射型アクションプランナを導入している。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:25:04 GMT)
Inference Acceleration of Autoregressive Normalizing Flows by Selective Jacobi Decoding [12.3] 正規化フローは、理論的厳密性、分析的対数類似性、エンドツーエンドトレーニングなどの利点を持つ有望な生成モデルである。
近年の進歩は自己回帰モデリングを活用し、表現力と生成品質を大幅に向上させた。
並列反復最適化により自己回帰推論を高速化する選択的ヤコビ復号法(SeJD)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:53:15 GMT)
Local Test for Unitarily Invariant Properties of Bipartite Quantum States [12.3] 両部量子状態に対する局所テストのパワーについて検討する。
バイパルタイト純状態の性質について、ある部分におけるユニタリ不変性は、他の部分だけに作用する最適な局所テスターを意味する。
アプリケーションとして、精製されたサンプルは混合状態のプロパティテストに何の利点も与えないことを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:20:02 GMT)
BIMA: Bijective Maximum Likelihood Learning Approach to Hallucination Prediction and Mitigation in Large Vision-Language Models [12.3] 本稿では, 正規化フロー理論を用いた幻覚緩和のための, 主観的最大主観的学習手法を提案する。
特に、BIMAは平均F1スコア85.06%をPOPEベンチマークで達成し、CHAIRSとCHAIRIはそれぞれ7.6%、CAIRIは2.6%減少する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:38:07 GMT)
GUM-SAGE: A Novel Dataset and Approach for Graded Entity Salience Prediction [12.2] 格付けされたエンティティサリエンス(英語版)は、テキストにおける相対的な重要性を反映したエンティティスコアを割り当てる。
両アプローチの強みを組み合わせた,格付けされたエンティティ・サリエンスのための新しいアプローチを提案する。
提案手法は,人間の要約やアライメントに基づくスコアとの相関が強く,既存の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:05:57 GMT)
A Cross Branch Fusion-Based Contrastive Learning Framework for Point Cloud Self-supervised Learning [12.1] 我々は、ポイントクラウドデータ(PoCCA)のためのコントラスト的クロスブランチ注意ベースのフレームワークを提案する。
PoCCAは、ロスエンドの前に異なるブランチ間で情報交換を可能にする。
実験により、余分なトレーニングデータを使用しない場合、自己教師付きモデルで学習した表現が最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:28:06 GMT)
M-learner:A Flexible And Powerful Framework To Study Heterogeneous Treatment Effect In Mediation Model [12.0] 異種間接および全治療効果を推定するための新しい手法 M-learner を提案する。
私たちの知る限りでは、メディエーションの存在下での治療効果の不均一性を捉えるために特別に設計された最初のアプローチである。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:14:36 GMT)
Multi-perspective Alignment for Increasing Naturalness in Neural Machine Translation [11.9] ニューラルマシン翻訳(NMT)システムは、トレーニングデータに存在する語彙バイアスを増幅し、出力翻訳において人工的に不十分な言語を生み出す。
自然とコンテンツ保存の両方に報いる新しい方法を提案する。
本手法は英蘭文翻訳において評価され,翻訳精度を損なうことなく,語彙的に豊かで,人文言語の性質が向上する翻訳モデルが得られた。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:47:35 GMT)
Efficient RAW Image Deblurring with Adaptive Frequency Modulation [11.9] RAW画像の劣化は、特に周波数依存のぼかしを扱う際、ユニークな課題を示す。
本稿では、RAW-to-RAWデブロアリング用に設計されたフレームワークである周波数拡張ネットワーク(FrENet)を提案する。
実験により,FrENetはRAW画像の劣化における最先端の劣化手法を超越していることが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:46:39 GMT)
$K^2$VAE: A Koopman-Kalman Enhanced Variational AutoEncoder for Probabilistic Time Series Forecasting [11.8] 確率的時系列予測(PTSF)は、経済、エネルギー、輸送など様々な分野における意思決定において重要な役割を果たしている。
我々は、非線形時系列を線形力学系に変換する効率的なVAEベースの生成モデルであるK2$VAEを紹介する。
K2$VAEは、短期および長期のPTSFにおいて最先端のメソッドより優れており、より効率的で正確なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:12:38 GMT)
Learning Aerodynamics for the Control of Flying Humanoid Robots [11.8] 空飛ぶヒューマノイドロボットは、特に空気力学的力によって、モデリングと制御の課題に直面している。
技術的貢献には、ジェットエンジンのヒューマノイドロボットであるiRonCub-Mk1の機械設計が含まれる。
この科学的貢献は、古典的および学習技術を用いて空気力学的力をモデル化し、制御するための包括的なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:27:44 GMT)
Applying Large Language Models to Issue Classification: Revisiting with Extended Data and New Models [11.7] 手動のイシュー分類は面倒でスケーラビリティに欠けています。
伝統的に、問題分類には機械学習技術が用いられてきた。
大規模言語モデル(LLM)は、ソフトウェア工学の課題に対処するための強力なツールとして登場した。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:02:55 GMT)
SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping [11.7] 本研究では,単一視界から透明物体とスペキュラ物体をロボットで把握することのできる,学習自由フレームワークSR3Dを提案する。
具体的には、単一のビューRGBと深度画像が与えられた場合、SR3Dはまず外部視覚モデルを使用して3D再構成されたオブジェクトメッシュを生成する。
そして、鍵となるアイデアは、3Dオブジェクトのポーズとスケールを決定し、再構成されたオブジェクトを元の奥行き劣化した3Dシーンに正確にローカライズすることだ。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:38:46 GMT)
LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs [11.7] LLMOpsパイプライン"LlamaDuo"を導入して,サービス指向のLLMから,より小さく,ローカルに管理可能なモデルへの,知識と能力のシームレスな移行を実現した。
LlamaDuoは、後者によって生成された合成データセットを使用して、サービスLLMに対して小さな言語モデルを微調整する。
このマルチターンプロセスは、小さなモデルが特定の下流タスクにおいて最終的にLLMの能力と一致するか、さらに超えることを保証します。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:53:07 GMT)
WTEFNet: Real-Time Low-Light Object Detection for Advanced Driver Assistance Systems [11.6] WTEFNetは、低照度シナリオ用に特別に設計されたリアルタイムオブジェクト検出フレームワークである。
WTEFNetは、LLEモジュール、ウェーブレットベースの特徴抽出(WFE)モジュール、アダプティブフュージョン検出(AFFD)モジュールの3つのコアモジュールから構成されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:08:44 GMT)
Fast Convergence of Softmax Policy Mirror Ascent [11.5] 自然ポリシー勾配 (NPG) は共通ポリシー最適化アルゴリズムであり、確率空間におけるミラー上昇と見なすことができる。
我々はこのアルゴリズムを改良し、アクション間の正規化の必要性を排除し、結果の方法を分析する(SPMA参照)。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:46:35 GMT)
SentinelAgent: Graph-based Anomaly Detection in Multi-Agent Systems [11.5] 大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)に適したシステムレベルの異常検出フレームワークを提案する。
本稿では,エージェント間相互作用を動的実行グラフとしてモデル化し,ノード,エッジ,パスレベルでの意味的異常検出を可能にするグラフベースのフレームワークを提案する。
第2に,セキュリティポリシとコンテキスト推論に基づくMAS実行の監視,解析,介入を行うLLMによる監視エージェントである,プラグイン可能なSentinelAgentを導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:25:19 GMT)
Identifying Metric Structures of Deep Latent Variable Models [11.4] 深い潜伏変数モデルは、研究された現象の内部の働きを反映したデータの凝縮表現を学習する。
現在のソリューションは、潜在変数モデルに対する追加の制約を通じて、識別可能性の欠如を制限する。
私たちは目的を変える:潜伏変数を識別する代わりに、それらの間の関係を識別する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:13:28 GMT)
AMSbench: A Comprehensive Benchmark for Evaluating MLLM Capabilities in AMS Circuits [11.4] Analog/Mixed-Signal (AMS) 回路設計は、その困難さと複雑さのため、長年にわたる課題である。
MLLM(Multi-modal Large Language Models)の最近の進歩は、AMS回路解析と設計をサポートする有望な可能性を提供する。
AMSbenchは、回路スキーマ認識、回路解析、回路設計を含む重要なタスクにわたってMLLMの性能を評価するために設計されたベンチマークスイートである。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:17:45 GMT)
ChuLo: Chunk-Level Key Information Representation for Long Document Processing [11.3] ChuLoは長い文書理解のための新しいチャンク表現手法である。
提案手法は,情報損失を最小限に抑え,トランスフォーマーモデルの有効性を向上させる。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:34:49 GMT)
ByzFL: Research Framework for Robust Federated Learning [11.2] 提案するByzFLは,ベンチマーク学習(FL)アルゴリズムを開発するためのオープンソースのライブラリである。
ByzFLは、最先端の堅牢なアグリゲータの実装を含む統一されたフレームワークを提供する。
このライブラリは、単一ベースの構成ファイルを通じて体系的な実験を可能にし、結果を視覚化するための組み込みユーティリティを含んでいる。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:08:15 GMT)
CoRet: Improved Retriever for Code Editing [11.2] CoRetは、コード編集タスクの厳密な検索モデルである。
コードセマンティクス、リポジトリ構造、コールグラフの依存関係を統合する。
自然言語クエリに基づいて、コードリポジトリの関連部分を検索する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:36:37 GMT)
From Invariant Representations to Invariant Data: Provable Robustness to Spurious Correlations via Noisy Counterfactual Matching [11.2] 最近の代替手段はテストタイムデータを活用することで堅牢性を向上させるが、実際にはそのようなデータは利用できないかもしれない。
不変なデータペアとノイズの多い逆ファクトマッチングを活用することで、データ中心のアプローチを取る。
我々は、合成データセット上で検証し、事前訓練されたバックボーン上の線形探索が堅牢性を向上させる実世界のベンチマークを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:42:32 GMT)
REJEPA: A Novel Joint-Embedding Predictive Architecture for Efficient Remote Sensing Image Retrieval [11.1] REJEPA(Retrieval with Joint-Embedding Predictive Architecture)は、RS-CBIR用に設計された革新的な自己管理型フレームワークである。
空間的に分散したコンテキストトークンエンコーディングを使用して、ターゲットトークンの抽象表現を予測する。
ピクセル再構成ベースラインと比較して計算複雑性を40-60%削減する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:50:55 GMT)
LaWa: Using Latent Space for In-Generation Image Watermarking [11.1] 知覚不能な画像透かしはそのような問題に対する有効な解決策の1つである。
LaWaは、LCD向けに設計された次世代画像透かし方式である。
また,LaWaは一般的な画像透かしにも利用できることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:59:43 GMT)
Efficient Text Encoders for Labor Market Analysis [11.1] スキル分類の極端多ラベル分類タスクにトークンレベルの注意を向けた,新しいコントラスト学習手法である textbfConT-match を提案する。
textbfSkill-XLは、全文レベルのスキルアノテーションを備えた新しいベンチマークである。
私たちのモデルは効率的で正確でスケーラブルで、大規模でリアルタイムな労働市場分析に最適です。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:27:25 GMT)
From Macro to Micro: Probing Dataset Diversity in Language Model Fine-Tuning [11.0] この研究は、既存の多様性制御戦略の体系的な分類を提示する。
実験により,117,000個のオープンソースSFTサンプルのコーパスから固定サイズデータセットを構築した。
その結果, マクロ・メソスコピック・ストラテジーは, 多様性の増大とともに高い性能をもたらすが, 応答の微視的ストラテジーは, モデル性能と多様性の程度と, 全戦略にまたがる最大多様性を伴う優れた性能の相関性を示すことがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:31:05 GMT)
Speech-to-Text Translation with Phoneme-Augmented CoT: Enhancing Cross-Lingual Transfer in Low-Resource Scenarios [10.9] 本稿では,音素表現をChain-of-Thoughtフレームワークに統合した音声テキスト翻訳(S2TT)手法を提案する。
中間段階として音素認識を導入することで、言語間変換を強化し、ラベル付き音声データを持たない言語でも翻訳が可能となる。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:15:00 GMT)
dc-GAN: Dual-Conditioned GAN for Face Demorphing From a Single Morph [10.9] 顔変形は、顔形態を構成する原画像の復元を試みる。
dc-GAN(Dual-conditioned GAN)は、画像から抽出された埋め込みと同様に、形態像上に条件付けられた新規な変形法である。
本手法は, 形状再現問題を克服し, 構成像の高忠実度再構成を行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:12:38 GMT)
Limited-Resource Adapters Are Regularizers, Not Linguists [10.8] 関連する高リソース言語からの言語間移動は、低リソース言語技術を強化するための確立された戦略である。
予め訓練された機械翻訳モデルのクロスアテンション微調整と組み合わせたアダプタスープ法について検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:34:28 GMT)
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation [10.8] MTVCrafterは、人間の画像アニメーションのための生の3Dモーションシーケンスをモデル化する最初のフレームワークである。
2Dレンダリングされたポーズ画像と比較して、4Dモーショントークンはより堅牢な時間的手がかりを提供する。
MTVCrafterは様々なスタイルやシナリオで様々なオープンワールドキャラクター(シングル/複数、フル/半ボディ)を一般化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:11:00 GMT)
Reflection-Bench: Evaluating Epistemic Agency in Large Language Models [10.8] 疫学エージェンシーは動的環境に関する信念を柔軟に構築し、適応し、監視する能力である。
リフレクション・ベンチ(Reflection-Bench)は,データ漏洩の長期的関連性と最小化を伴う7つのタスクからなるベンチマークである。
本研究は, コア認知機能の向上, クロスファンクショナルコーディネートの改善, 適応処理機構の開発など, 有望な研究の方向性を示唆する。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:15:52 GMT)
$\textit{Revelio}$: Interpreting and leveraging semantic information in diffusion models [10.7] 様々なレイヤで表現されるリッチな視覚的意味情報と,異なる拡散アーキテクチャの時間ステップについて検討する。
k-スパースオートエンコーダ(k-SAE)を利用した単意味的解釈可能な特徴を明らかにする。
既成拡散モデルの特徴量に対する軽量分類器を用いた移動学習による機械的解釈について検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:11:31 GMT)
Differential privacy enables fair and accurate AI-based analysis of speech disorders while protecting patient data [10.6] 本研究は,病的音声データにおける差分プライバシーを初めて研究したものである。
プライバシ、診断精度、公正性のトレードオフに焦点を当てている。
以上の結果から,DPは音声障害検出におけるプライバシーと利便性のバランスがとれることが明らかとなった。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:45:56 GMT)
Donate or Create? Comparing Data Collection Strategies for Emotion-labeled Multimodal Social Media Posts [10.6] 感情をラベル付けしたマルチモーダルなソーシャルメディア投稿を,研究によって作成され,本物のソーシャルメディア投稿と比較した。
本物の投稿に比べて、研究によって作成された投稿は長く、テキストに頼り、感情表現に画像に頼らないことがわかりました。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:07:34 GMT)
Estimating Privacy Leakage of Augmented Contextual Knowledge in Language Models [10.6] 言語モデル(LM)は、質問応答のような特定のタスクに対して関連する文脈知識を付加したパラメトリック知識に依存している。
LMの出力をコンテキストと比較する簡単なアプローチは、プライバシーリスクを過大評価する可能性がある。
差分プライバシーに基づくメトリクスである$emphcontext influence$を導入し、デコード中のコンテキスト知識のプライバシー漏洩を推定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:01:01 GMT)
MoTime: A Dataset Suite for Multimodal Time Series Forecasting [10.6] MoTimeは、データセットのマルチモーダル時系列予測スイートである。
時間信号とテキスト、メタデータ、画像などの外部モダリティをペアリングする。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:59:05 GMT)
Timing is important: Risk-aware Fund Allocation based on Time-Series Forecasting [10.5] 我々は、資金配分の問題を解決するために、リスク対応の時系列予測(RTS-PnO)フレームワークを導入する。
このフレームワークには, 目標アライメント測定によるエンドツーエンドトレーニング, (ii) 適応予測の不確実性校正, (iii) 予測モデルに非依存な3つの特徴がある。
RTS-PnOの評価はオンラインとオフラインの両方の実験で行われている。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:36:45 GMT)
Developer Perspectives on Licensing and Copyright Issues Arising from Generative AI for Software Development [10.5] コーディングのためのGenAIのライセンスと著作権に関する574人の開発者を対象に調査を行った。
我々の結果は、開発者がGenAIから得られるメリット、AI生成コードの使用を、他の既存のコードとよく似たものとみなす方法を示している。
私たちは、技術がどのように使われているのか、ステークホルダーが解決したいことについて、貴重な洞察を提供しています。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:54:38 GMT)
Federated Incomplete Multi-view Clustering with Globally Fused Graph Guidance [10.4] We propose a novel Federated Incomplete Multi-view Clustering method with global Fused Graph guidance (FIMCFG)。
融合グラフの指導のもと、2つの基礎となる特徴は、擬似ラベルの監督の下でクラスタリングが行われるかに基づいて、ハイレベルな特徴に融合される。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:17:51 GMT)
Feedback-Aware Monte Carlo Tree Search for Efficient Information Seeking in Goal-Oriented Conversations [10.4] 本稿では,Large Language Models (LLMs) を利用して情報探索質問を生成する新しいフレームワークを提案する。
推測時間計画の一環として,情報獲得を最大化する質問を戦略的に選択する。
本研究は,目標指向対話における情報探索の促進にMCTSが有効であることを示すものである。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:44:37 GMT)
MedDiff-FM: A Diffusion-based Foundation Model for Versatile Medical Image Applications [10.3] 本稿では,MedDiff-FMという,様々な医療画像課題に対処するための拡散基盤モデルを提案する。
MedDiff-FMは頭部から腹部まで解剖学的領域をカバーする3次元CT画像を利用して拡散基盤モデルの事前訓練を行う。
MedDiff-FMが下流の様々な医療画像タスクに有効であることを示す実験結果が得られた。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:59:38 GMT)
MultiHoax: A Dataset of Multi-hop False-Premise Questions [10.3] 我々はMultiHoaxを紹介した。これは、複雑で多段階の推論タスクにおいて、偽の前提を扱う大規模言語モデルの性能を評価するためのベンチマークである。
我々のデータセットは7つの国と10の多様な知識カテゴリにまたがっており、ウィキペディアを主要な知識源としています。
実験によると、最先端のLLMは、異なる国、知識カテゴリ、マルチホップ推論タイプで偽の前提を検出するのに苦労している。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:55:18 GMT)
SwiLTra-Bench: The Swiss Legal Translation Benchmark [10.3] SwiLTra-Benchは180Kを超えるスイスの法翻訳ペアの総合ベンチマークである。
体系的な評価により、フロンティアモデルは全ての文書タイプで優れた翻訳性能が得られることが示された。
SwiLTra-Judgeは、人間の専門家による評価に最適な特殊なLCM評価システムである。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:48:42 GMT)
Softpick: No Attention Sink, No Massive Activations with Rectified Softmax [10.3] 我々は,変圧器の注意機構におけるソフトマックスの置き換えであるソフトピック(Softpick)を導入する。
340Mおよび1.8Bパラメータモデルによる実験では、ソフトピックが一貫して0%のシンクレートを達成することが示された。
標準的なベンチマークでは、ソフトピックを用いた量子モデルはソフトマックスよりも優れており、特に低ビット精度では顕著な利点がある。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:37:29 GMT)
On the Expressive Power of Mixture-of-Experts for Structured Complex Tasks [10.2] 低次元性と疎性という2つの構造的前提を持つ複雑なタスクのモデル化におけるMoEの表現力について検討する。
浅部MoEに対して、低次元でサポートされた関数を効率的に近似できることを証明し、次元性の呪いを克服する。
深層MoEsの場合、$cO(L)$-layer MoEs with $E$ experts per layer は、構成空間の幅を持つ$EL$ピースからなるピースワイズ関数を近似することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:35:03 GMT)
A Consolidated Volatility Prediction with Back Propagation Neural Network and Genetic Algorithm [10.2] 本稿では,バックプロパゲーションニューラルネットワークと遺伝的アルゴリズムを併用した統合モデルを構築し,新興市場の将来的ボラティリティを予測する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:02:16 GMT)
The NaijaVoices Dataset: Cultivating Large-Scale, High-Quality, Culturally-Rich Speech Data for African Languages [10.2] 5000人以上の話者を持つ1,800時間音声テキストデータセットであるNaijaVoicesデータセットを紹介する。
我々は,我々のユニークなデータ収集手法を概説し,その音響的多様性を分析し,微調整実験を通じてその影響を実証する。
これらの結果から,ナイジャヴォイセスがアフリカ語における多言語音声処理を進展させる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:40:58 GMT)
EasyREG: Easy Depth-Based Markerless Registration and Tracking using Augmented Reality Device for Surgical Guidance [10.2] 我々はARデバイスの奥行きセンサーのみに依存するマーカーレスフレームワークを提案する。
登録モジュールは、深度センサの誤差補正、Human-in-the-loop領域フィルタリング技術、ロバストなグローバルアライメントを統合する。
トラッキングモジュールは高速で堅牢な登録アルゴリズムを使用し、登録モジュールの初期ポーズを使用して、ターゲットのポーズをリアルタイムで推定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:59:48 GMT)
Tag-Evol: Achieving Efficient Instruction Evolving via Tag Injection [10.1] より多様で効率的な命令進化法であるTag-Evolフレームワークを提案する。
特にTag-Evolは、制御された進化を達成するための戦略として、多種多様な特定の知識タグを使用している。
多様な領域ベンチマークにおいて,複数のバックボーンを用いた実験により,提案手法が他の手法よりも大幅に進化したデータを生成することを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:14:17 GMT)
Pretraining Deformable Image Registration Networks with Random Images [10.1] 近年の深層学習に基づく医用画像登録の進歩は、深層ニューラルネットワークの訓練が必ずしも医用画像を必要とするとは限らないことを示している。
本稿では,画像登録のための基礎モデルを事前学習するためのプロキシタスクとして,ランダム画像間の登録を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:22:10 GMT)
Equilibrium Distribution for t-Distributed Stochastic Neighbor Embedding with Generalized Kernels [10.0] 一般化されたカーネルによるt-SNEの収束について検討し、2023年に Auffinger と Fletcher の結果を拡張した。
特定の条件下では、データポイントの数が分散するにつれて、t-SNEアルゴリズムは幅広い入出力カーネルの平衡分布に収束することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:50:09 GMT)
CHIP: Chameleon Hash-based Irreversible Passport for Robust Deep Model Ownership Verification and Active Usage Control [10.0] 大規模ディープニューラルネットワーク(DNN)の普及と、その膨大なトレーニングコストにより、知的財産権(IP)は最重要視されている。
最近導入されたパスポートベースの手法は、あいまいな攻撃に対するオーナシップ検証を強化するために透かしをステアリングしようとする試みである。
残念なことに、透かしやパスポートベースの手法は、堅牢なオーナシップ証明、高い忠実性、アクティブな使用許可、ユーザトレーサビリティを備えた全体的保護を提供していない。
本稿では,暗号カメレオンハッシュ関数を利用したCHP(Irreversible Passport)保護フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:41:51 GMT)
Taming Hyperparameter Sensitivity in Data Attribution: Practical Selection Without Costly Retraining [10.0] データ属性法は、個別のトレーニングデータポイントが機械学習モデルに与える影響を定量化する。
この領域で開発された新しい手法の急増にもかかわらず、これらの手法におけるハイパーパラメータチューニングの影響は未解明のままである。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:33:56 GMT)
Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation [10.0] LongBench-T2Iは、複雑な命令の下でテキスト・トゥ・イメージ(T2I)モデルを評価するためのベンチマークである。
LongBench-T2Iは9つの視覚的評価次元にまたがる500の複雑なプロンプトで構成されている。
Plan2Genは複雑な命令駆動の画像生成を容易にするフレームワークで、追加のモデルトレーニングを必要としない。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:48:14 GMT)
Improving Parallel Program Performance with LLM Optimizers via Agent-System Interfaces [9.9] 並列プログラムのパフォーマンスを改善する上で重要な課題は、タスクをプロセッサやデータに効率的にメモリにマッピングすることだ。
生成最適化によるマッパー開発を自動化するフレームワークを提案する。
提案手法では,9つのベンチマークで1.34倍の高速化を実現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:34:55 GMT)
ErpGS: Equirectangular Image Rendering enhanced with 3D Gaussian Regularization [9.8] 360度カメラで取得したマルチビュー画像は、広い面積の3D空間を再構築することができる。
NeRFと3DGSに基づく等角形状画像からの3次元再構成法と、ノベルビュー合成(NVS)法がある。
本稿では3DGSに基づくOmnidirectional GSであるErpGSを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:15:01 GMT)
Assessing Social Alignment: Do Personality-Prompted Large Language Models Behave Like Humans? [9.8] 最先端のアプローチは、さまざまなトレーニングデータを利用して、モデルを特定のパーソナリティを採用するように促します。
我々は、古典的な心理学実験、ミルグラム実験、ウルティマトゥムゲーム(Ultimatum Game)を社会的相互作用テストベッドとして使用しています。
実験では, モデル動作の即時変調の失敗モードを明らかにし, 即時摂動下でテストおよび持続する全てのモデル間で共有される。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:31:47 GMT)
TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores [9.7] 本稿では3DGSのコア(TCU)適用性を拡張するアルゴリズム非依存のユニバーサルモジュールであるTC-GSを提案する。
鍵となる革新は、αを行列乗法にマッピングすることであり、既存の3DGS実装では、そうでなければアイドルTCUを完全に活用している。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:58:18 GMT)
How hard is learning to cut? Trade-offs and sample complexity [9.7] 両スコアに有効である新しいサンプル複雑性の低い境界を示す。
我々は、インスタンスをカットにマッピングする幅広いクラスの$mathcalF$に対して、それらのスコアを最小化するためにインスタンスの未知の分布を学習するには、同じクラス関数から学ぶのと同じくらい多くのサンプル(乗法定数まで)が必要であることを示す。
我々の結果は、制限されたカットセット、すなわちSimplex tableauから学習するケースにも及んでいる。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:41:01 GMT)
Learning Distances from Data with Normalizing Flows and Score Matching [9.6] 密度ベース距離(DBD)は、基礎となるデータ分布の観点で距離を定義することによって、メートル法学習への原則的なアプローチを提供する。
我々は,高次元に直感的にスケールし,数値安定性を向上させる次元適応型フェルマー距離を導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:36:42 GMT)
Rethinking Neural Combinatorial Optimization for Vehicle Routing Problems with Different Constraint Tightness Degrees [9.6] 最近のニューラル最適化(NCO)手法は、ドメイン固有の専門知識を必要としない、有望な問題解決能力を示している。
本稿では,キャパシティ制約の厳密度が異なるNCO性能を実験的に解析するために,キャパシティ制約付き車両ルーティング問題(CVRP)を例に挙げる。
本研究では,制約のきつい度合いを明示的に考慮した効率的なトレーニング手法を開発し,汎用的な解法を学習するためのマルチエキスパートモジュールを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:21:33 GMT)
LKD-KGC: Domain-Specific KG Construction via LLM-driven Knowledge Dependency Parsing [9.5] 知識グラフ(KG)は現実世界の実体とそれらの関係を3重に構成し、様々なタスクに対する機械推論を強化する。
大規模言語モデル(LLM)に基づく知識グラフ構築への最近のアプローチは、効率的であることが証明されている。
教師なしドメイン固有KG構築のための新しいフレームワークであるLKD-KGCを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:10:23 GMT)
Gated Multimodal Graph Learning for Personalized Recommendation [9.5] マルチモーダルレコメンデーションは、協調フィルタリングにおけるコールドスタートとスパーシリティの問題を軽減するための有望なソリューションとして登場した。
グラフベースユーザモデリングと適応型マルチモーダルアイテムエンコーディングを組み合わせた軽量かつモジュール化されたレコメンデーションフレームワーク RLMultimodalRec を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:57:17 GMT)
TrojanEdit: Multimodal Backdoor Attack Against Image Editing Model [9.4] 本研究は,マルチモーダル拡散に基づく画像編集モデルに対するバックドア攻撃に関する最初の研究である。
TrojanEditは、トレーニング中の各モードの勾配コントリビューションを動的に調整するバックドアインジェクションフレームワークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:58:20 GMT)
Position: Beyond Assistance - Reimagining LLMs as Ethical and Adaptive Co-Creators in Mental Health Care [9.3] このポジションペーパーは、大規模言語モデル(LLM)がメンタルヘルスドメインにどのように統合されるか、という変化を論じている。
我々は、単なる補助ツールではなく、共同創造者としての役割を主張する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:24:24 GMT)
Multi-Domain Graph Foundation Models: Robust Knowledge Transfer via Topology Alignment [9.2] 実世界のグラフはスパースが多く、ノイズの多い接続や敵の攻撃を受けやすい。
本稿では,ドメイン間のトポロジ情報を整合化し活用する統合フレームワークであるMDGFMを提案する。
トポロジを整列させることで、MDGFMはマルチドメイン事前学習を改善するだけでなく、目に見えないドメインへの堅牢な知識伝達を可能にする。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:45:49 GMT)
Patho-R1: A Multimodal Reinforcement Learning-Based Pathology Expert Reasoner [9.2] 我々は、病理教科書と現実世界の病理の専門家を活用して、高品質で推論指向のデータセットを構築する。
Patho-R1はマルチモーダルなRLベースの病理組織Reasonerで、3段階のパイプラインを通じてトレーニングされた。
パス-CLIP(Patho-CLIP)は、継続事前訓練に使用される同じフィギュア・キャプション・コーパスで訓練された。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:59:51 GMT)
Adaptive LoRA Merge with Parameter Pruning for Low-Resource Generation [9.2] LoRAマージ技術は、異なるタスクでトレーニングされた複数のLoRAモジュールを統合する。
以前の方法はLoRAパラメータを凍結し続けるため、適応性に制限がある。
最小限のタスクデータを用いた微調整によりLoRAパラメータを更新およびプーンするLoRAマージ手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:34:25 GMT)
Phase estimation in lossy optical interferometry without a reference beam [9.1] 共役状態を用いた損失干渉計の位相推定について検討し,特に参照ビームを使用しないシナリオに着目した。
量子フィッシャー情報を計算することで、2つの重要な結果が明らかになる。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:33:18 GMT)
PhySense: Principle-Based Physics Reasoning Benchmarking for Large Language Models [9.1] 大規模言語モデル(LLM)は急速に進歩し、複雑な科学的問題に取り組む能力が高まっている。
この相違は、効率的かつ解釈可能な問題解決に中核となる物理原則を適用する能力において、重要なギャップを浮き彫りにする。
我々は、ガイド原理を用いて専門家が容易に解けるように設計された、新しい原理に基づく物理推論ベンチマークであるPhySenseを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:25:20 GMT)
A survey of using EHR as real-world evidence for discovering and validating new drug indications [9.1] エレクトロニック・ヘルス・レコーズ(Electronic Health Records)は、新薬の発見と検証を支援するために、現実世界の証拠としてますます利用されている。
本稿では, EHRをベースとした医薬品のリサイクル, データソース, 処理方法, 表現技術の現状について調査する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:30:54 GMT)
EasyText: Controllable Diffusion Transformer for Multilingual Text Rendering [9.1] 本稿では,DiT(Diffusion Transformer)に基づくテキストレンダリングフレームワークであるEasyTextを紹介する。
本稿では,文字位置の符号化と位置の符号化手法を提案する。
我々は,100万の多言語画像テキストアノテーションを用いた大規模合成テキスト画像データセットを構築し,20Kの注釈付き画像の高品質なデータセットを構築した。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:55:39 GMT)
MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU [9.0] MIDASはマルチレベルインテント,ドメイン,スロット知識の蒸留を多ターンNLUに適用する新しい手法である。
我々は、SI検出、WSフィリング、会話レベルドメイン(CD)分類のための個別の教師を構築し、それぞれが特定の知識のために微調整されている。
その結果,マルチターン会話理解におけるモデルの有効性が示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:51:10 GMT)
IMTS is Worth Time $\times$ Channel Patches: Visual Masked Autoencoders for Irregular Multivariate Time Series Prediction [9.0] IMTS 予測のための Visual MAE 適応フレームワーク VIMTS を提案する。
欠落した値の影響を軽減するため、VIMTSはまずタイムラインに沿ってIMTSを同じ間隔で特徴パッチに処理する。
そして、パッチ再構成のためのスパースマルチチャネルデータを扱う視覚的MAEの機能を利用し、その後、粗大なテクニックで正確な予測を生成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:28:59 GMT)
ACM-UNet: Adaptive Integration of CNNs and Mamba for Efficient Medical Image Segmentation [9.0] ACM-UNetは医療画像のための汎用セグメンテーションフレームワークである。
軽量アダプタ機構を通じて、事前訓練されたCNNとMambaモデルが組み込まれている。
計算効率を保ちながら最先端の性能を達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:30:53 GMT)
CSVQA: A Chinese Multimodal Benchmark for Evaluating STEM Reasoning Capabilities of VLMs [9.0] VLM(Vision-Language Models)は、マルチモーダル理解において顕著な進歩を示しているが、科学的推論の能力は依然として不十分である。
CSVQAは、領域的視覚的質問応答による科学的推論の評価に特化して設計された診断マルチモーダルベンチマークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:34:25 GMT)
On the Lipschitz Continuity of Set Aggregation Functions and Neural Networks for Sets [9.0] ニューラルネットワークのリプシッツ定数は、ネットワークのいくつかの重要な性質に接続されている。
これまでの研究は主に多層パーセプトロンと畳み込みニューラルネットワークのリプシッツ定数の推定に重点を置いてきた。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:34:58 GMT)
BaxBench: Can LLMs Generate Correct and Secure Backends? [8.9] 大規模言語モデル(LLM)は、関数レベルで効率的にコードを生成し、コード編集を行い、アルゴリズムによるコーディングタスクを解決する。
完全な自動化を実現するためには、LLMは製品品質の自己完結型アプリケーションモジュールを生成する必要がある。
バックエンドアプリケーション生成のための392タスクからなる新しい評価ベンチマークであるBaxBenchを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:01:16 GMT)
Nonparametric Additive Value Functions: Interpretable Reinforcement Learning with an Application to Surgical Recovery [8.9] 強化学習における解釈可能な値関数を推定するための非パラメトリック加算モデルを提案する。
この方法は、フレキシブルな機械学習技術と医療応用に必要な解釈可能性とのギャップを埋める。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:29:27 GMT)
FactSelfCheck: Fact-Level Black-Box Hallucination Detection for LLMs [8.8] 大規模言語モデル(LLM)は、しばしば幻覚的コンテンツを生成し、事実性が重要であるアプリケーションの課題を提起する。
FactSelfCheckは,ファクトレベルのきめ細かな検出が可能なブラックボックスサンプリング方式である。
我々のアプローチは、三重項の形で事実からなる知識グラフとしてテキストを表現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:59:56 GMT)
Repo2Run: Automated Building Executable Environment for Code Repository at Scale [8.8] 大規模なリポジトリに対して実行可能なテスト環境の構築を自動化するためのエージェントであるRepo2Runを紹介します。
Repo2RunはDockerイメージを反復的にビルドし、建物のフィードバックに基づいてユニットテストを実行し、Dockerfileを合成する。
結果のDockerfileを使用して、コードとテストを実行するDockerコンテナ環境を作成することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:25:20 GMT)
An Adversary-Resistant Multi-Agent LLM System via Credibility Scoring [8.8] 信頼性スコアリングに基づく汎用・対向抵抗型マルチエージェントLCMフレームワークを提案する。
私たちのシステムは、チームのアウトプットを集約するときに使用される信頼性スコアを関連付けています。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:57:37 GMT)
AlphaPO: Reward Shape Matters for LLM Alignment [8.8] textbfAlphaPOは、標準的なログ報酬以外の報酬関数の形状を変えるのに役立つ新しいDAAである。
最高のパフォーマンスを持つDAAの1つであるSimPOと比較して、AlphaPOはアライメント性能が7%から10%向上した。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:56:02 GMT)
IDEA: An Inverse Domain Expert Adaptation Based Active DNN IP Protection Method [8.7] ディープニューラルネットワーク(DNN)モデルの非合法的な複製、配布、導出は、経済的損失、評判のダメージ、さらにはプライバシー侵害にも影響を及ぼす可能性がある。
提案するIDEAは、アクティブな認証とソーストレーサビリティを備えた、逆ドメインエキスパート適応に基づくプロアクティブDNNIP保護手法である。
5つのデータセットと4つのDNNモデル上でIDEAを広範囲に評価し、認証制御、原因追跡成功率、各種攻撃に対する効果を実証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:32:27 GMT)
Efficient Large-Scale Quantum Optimization via Counterdiabatic Ansatz [8.7] 我々は、MaxCut問題におけるDC-QAOAとQAOAを比較し、CNOTゲートの総個数を等しくする。
この結果,DC-QAOA(NC)はQAOAに比べて回路の複雑さを小さくすることがわかった。
同一数のCNOTゲートを使用する1層DC-QAOA(NC)と3層QAOA(NC)の直接比較において、直流-QAOA(NC)の指数的性能優位性を同定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:16:49 GMT)
VideoGameBench: Can Vision-Language Models complete popular video games? [8.5] ビデオゲームは、人間が自然に帰納的バイアスを生かして学習し、習得するために直感的に作られている。
1990年代にVLMが直接リアルタイムに対話する人気ゲーム10種からなるベンチマークであるVideoGameBenchを紹介する。
その結果,フロンティア・ビジョン言語モデルは,ゲーム開始以降の進行に苦慮していることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:50:48 GMT)
HSTU-BLaIR: Lightweight Contrastive Text Embedding for Generative Recommender [8.5] 本稿では,軽量なコントラストテキスト埋め込みモデルで生成レコメンデータを増強するハイブリッドフレームワークHSTU-BLaIRを提案する。
HSTU-BLaIRをAmazon Reviews 2023データセットの3つのサブセットとSteamデータセットの2つのEコマースデータセットで評価した。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:22:12 GMT)
Distributed gradient methods under heavy-tailed communication noise [8.4] ネットワークノードが局所的に知られている凸コストの総和を協調的に最小化する分散最適化の標準的な問題を考える。
ヘビーテールノイズは非常に関連性が高く、密集した無線センサやIoT(Internet of Things)ネットワークで頻繁に発生する。
提案手法は,平均二乗誤差感覚において,ネットワーク全体の問題解の近傍に収束することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:07:21 GMT)
Data Flows in You: Benchmarking and Improving Static Data-flow Analysis on Binary Executables [8.4] 215,072マイクロベンチマークテストケースを含むベンチマークデータセットを導入し、277,072バイナリ実行ファイルにマッピングする。
我々は,Angr,Ghidra,Miasmの3種類の技術データフロー解析実装の評価を行った。
静的データフロー解析のための3つのモデル拡張を提案し、精度を大幅に向上し、ほぼ完全なリコール(0.99)を達成し、精度を0.13から0.32に向上させた。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:49:57 GMT)
The RAG Paradox: A Black-Box Attack Exploiting Unintentional Vulnerabilities in Retrieval-Augmented Generation Systems [8.3] RAGパラドックスに基づく現実的なブラックボックス攻撃を導入する。
文書検索性の改善に重点を置く以前の作業とは異なり,攻撃手法は検索可能性とユーザ信頼の両方を明示的に考慮している。
本手法は, 内部アクセスのないシステム性能を著しく低下させるとともに, 自然に見える有毒な文書を生成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:19:35 GMT)
Bounds on the Excess Minimum Risk via Generalized Information Divergence Measures [8.3] 有限次元のランダムベクトルが$Y$、$X$、および$Z$を与えられたとき、過剰な最小リスクの上限を導出する。
過大な最小リスクは、$Y$を$X$から$Z$から推定する最小損失の差として定義される。
我々は、Gy"orfi et al.の相互情報に基づく境界を一般化する境界の族を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:28:18 GMT)
Safety Alignment Can Be Not Superficial With Explicit Safety Signals [8.3] 大規模言語モデル(LLM)の安全性アライメントに関する最近の研究は、既存のアプローチがしばしば表面的に機能することを明らかにしている。
既存のアライメントアプローチでは、アライメントプロセス中にモデルが暗黙的に安全関連推論タスクを学習できると考えられる。
安全関連バイナリ分類タスクを明示的に導入し,その信号を注意と復号化戦略に統合することにより,この曖昧さを解消する。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:54:56 GMT)
SEAR: A Multimodal Dataset for Analyzing AR-LLM-Driven Social Engineering Behaviors [8.3] SEARデータセットは、拡張現実(AR)とマルチモーダル大言語モデル(LLM)によって編成された社会工学(SE)攻撃の出現する脅威を研究するために設計された、新しいマルチモーダルリソースである。
このデータセットは、シミュレーションされた敵シナリオにおける60人の参加者間の180の注釈付き会話をキャプチャする。
それは、ARでキャプチャされた視覚/オーディオの手がかり(例えば、表情、声のトーン)、環境条件、ソーシャルメディアのプロフィール、そして信頼評価や感受性評価などの主観的な指標を含む。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:46:13 GMT)
The Minimax Risk in Testing Uniformity of Poisson Data under Missing Ball Alternatives [8.3] 本研究では,多くのカテゴリーからポアソン分布に至るまでの項目の出現の適合性を検証することの課題について検討する。
この問題のミニマックスリスクを、期待されるサンプル数$n$とカテゴリ数$N$が無限大になるものとして特徴づける。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:52:31 GMT)
Benchmarking Foundation Models for Zero-Shot Biometric Tasks [8.3] 基礎モデル、特にVLM(Vision-Language Models)とMLLM(Multi-modal Large Language Models)は、人工知能のフロンティアを再定義した。
本研究では,6つのバイオメトリック・タスクにわたる最先端のVLMとMLLMのゼロショット性能と少数ショット性能を評価するベンチマークを提案する。
実験により、これらの基礎モデルからの埋め込みは、様々な成功度を持つ多様な生体計測タスクに利用できることが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:53:55 GMT)
Let's Be Self-generated via Step by Step: A Curriculum Learning Approach to Automated Reasoning with Large Language Models [8.3] カリキュラム学習にインスパイアされたtextbfLBS3 自動推論のための新しいプロンプト手法を提案する。
LBS3はLLMを操り、ターゲットクエリに関連付けられた簡単にハードなプロキシクエリをリコールする。
これは、簡単なプロキシクエリから派生した例的なプロンプトを利用して、ハードプロキシクエリの解決にLSMを向けるプログレッシブ戦略を起動する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:02:49 GMT)
Mapping Human-Agent Co-Learning and Co-Adaptation: A Scoping Review [8.2] 既存の研究におけるこの協調関係を記述する用語は、より一貫性がある必要があることが指摘されている。
現在のスコープレビューの主要な研究課題(RQ1)は、このコラボレーションパターンについて議論する既存の論文を集めることを目的としている。
我々の第3の目的は、既存の研究で使われている認知理論とフレームワークを、人間-エージェントの協調学習と協調適応を計測するために研究することである。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:10:44 GMT)
TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection [8.2] TalkingHeadBenchはディープフェイクのトーキングヘッド検出のためのベンチマークだ。
私たちのデータセットには、主要な学術モデルと商業モデルによって合成されたディープフェイクが含まれています。
一般的な障害モードや検出可能なバイアスを明らかにするために,Grad-CAM視覚化を用いてエラー解析を行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:08 GMT)
Absolute Coordinates Make Motion Generation Easy [8.2] 最先端のテキスト・トゥ・モーション生成モデルは、HumanML3Dによって普及したキネマティック・アウェア、局所相対運動表現に依存している。
本稿では,大域空間における絶対的共同座標という,テキスト・トゥ・モーション生成の大幅な単純化と長期化の代替案を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:54:43 GMT)
Generalization Dynamics of Linear Diffusion Models [8.1] 線形デノイザを用いた簡単なモデルを用いて,記憶から一般化への遷移を解析的に検討する。
我々の研究は、拡散ベース生成モデルの単純なモデルにおいて、サンプルの複雑さが一般化をどのように支配するかを明らかにする。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:31:58 GMT)
Firm or Fickle? Evaluating Large Language Models Consistency in Sequential Interactions [8.1] 大きな言語モデル(LLM)は、様々なタスクにまたがって顕著な機能を示している。
ハイテイクなドメインへのデプロイメントには、複数ラウンドにわたるユーザインタラクションの一貫性と一貫性を備えた動作が必要です。
本稿では,LLM応答整合性の評価と改善のための総合的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:25:15 GMT)
Binary Hypothesis Testing for Softmax Models and Leverage Score Models [8.1] ソフトマックスモデルの設定における二元仮説テストの問題点を考察する。
我々はソフトマックスモデルとレバレッジスコアモデルとの類似性を描く。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:54:49 GMT)
An evaluation of LLMs for generating movie reviews: GPT-4o, Gemini-2.0 and DeepSeek-V3 [8.1] 大規模言語モデル(LLM)の製品レビュー生成への適用性は、勢いを増している。
3つのLCM(GPT-4o, DeepSeek-V3, Gemini-2.0)を用いて映画レビューを生成するフレームワークを提案する。
生成した出力をIMDbユーザレビューと比較することにより,その性能を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:45:53 GMT)
Balancing Profit and Fairness in Risk-Based Pricing Markets [8.0] 我々は、規制当局が、学習された解釈可能な税制スケジュールを通じて、社会的目的による私的インセンティブを認識できることを示します。
経験的に調整された2つの市場、すなわち米国の健康保険と消費者クレディットでは、当社のプランナーは同時に需要公正度を最大16%値上げしている。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:24:08 GMT)
Federated Foundation Model for GI Endoscopy Images [8.0] ファンデーションモデルは汎用表現を学習することで有望なソリューションを提供する。
ファンデーションモデルトレーニングは通常、広範なデータセットを必要とし、病院は大量のデータを生成するが、プライバシー制限は直接的なデータ共有を妨げている。
本稿では,腹腔鏡画像の基礎モデルをトレーニングするためのFLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:18:17 GMT)
Cloud Optical Thickness Retrievals Using Angle Invariant Attention Based Deep Learning Models [7.9] クラウド・オプティカル・厚さ(COT)は、地球の気候、気象、放射線の予算に影響を及ぼす重要な雲の性質である。
我々は,角符号化を用いたクラウド・アテンション・ネット(CAAC)と呼ばれる,角度不変で注意に基づく新しい深層モデルを提案する。
CAACは、既存の最先端のディープラーニングモデルよりも大幅に優れており、クラウドプロパティの検索エラーを少なくとも9倍削減している。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:26:30 GMT)
Locating Risk: Task Designers and the Challenge of Risk Disclosure in RAI Content Work [7.7] 群衆労働者は、しばしば責任あるAI(RAI)コンテンツワークを任される。
以前の取り組みでは、RAIコンテンツ作業に関連する労働者の幸福に対するリスクが強調されていたが、これらのリスクが労働者にどのように伝達されるかという点では、はるかに注意が払われていない。
本研究では,クラウドソーシングされたRAIタスクにおいて,タスクデザイナがリスク開示にどのようにアプローチするかを検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:08:50 GMT)
HelpSteer3: Human-Annotated Feedback and Edit Data to Empower Inference-Time Scaling in Open-Ended General-Domain Tasks [7.7] 推論時間スケーリングは、OpenAI o1やDeepSeek R1といった最近のモデルの成功に不可欠である。
私たちは、人間が最初に試みる方法からインスピレーションを得て、他の人から詳細なフィードバックを求め、そのようなフィードバックに基づいて改善します。
Arena Eloを強く予測するベンチマークであるArena Hardのパフォーマンスは、初期レスポンスドラフトの数、効果的なフィードバック、編集されたレスポンスをスケールすることで向上できることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:42:57 GMT)
Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models [7.7] SCoPE (Scheduled of Coarse-to-fine Prompt Embeddings) を提案する。
詳細な入力プロンプトが与えられたら、まずそれを複数のサブプロンプトに分解し、広いシーンレイアウトの記述から高度に複雑な詳細へと進化させる。
推論中、これらのサブプロンプト間を補間し、生成した画像によりきめ細かな詳細を徐々に導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:44:55 GMT)
Learning-Augmented Algorithms for Boolean Satisfiability [7.6] 古典的ブール満足度(SAT)決定と最適化問題を2種類のアドバイスを用いて検討する。
Subsetアドバイスは最適な代入から変数のランダムな$epsilon$区切りを提供するが、ラベルアドバイス”は最適な代入ですべての変数に対してノイズの多い予測を提供する。
最適化問題に対して、$alpha$-approximationアルゴリズムを用いて、サブセットアドバイスをブラックボックス方式で組み込む方法を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:17:43 GMT)
Minimax Rates for the Estimation of Eigenpairs of Weighted Laplace-Beltrami Operators on Manifolds [7.6] 楕円微分作用素の固有ペアを、多様体$M$で支えられる分布$rho$のサンプルから推定する問題について検討する。
グラフラプラシアンの固有ペアは、近似の誤差で正規性多様体推定器を誘導し、対数補正まで、我々の下界と一致する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:19:25 GMT)
A Quantum "Lifting Theorem" for Constructions of Pseudorandom Generators from Random Oracles [7.5] ランダムなオラクルから構築した擬似乱数発生器(PRG)の(量子)セキュリティについて検討する。
我々は、大まかに言えば、そのようなPRGが、ランダムなオラクルに対して無条件に多くのクエリを結び付ける古典的敵に対して無条件に安全であるならば、同じ意味で(無条件で)量子的敵に対して安全であることを示す「持ち上げ定理」を証明している。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:33:16 GMT)
Online Fair Division with Additional Information [7.4] オンライン環境では,特定不可能な商品をエージェントにかなり割り当てる問題について検討する。
我々は、将来の商品に関する情報の入手が、公平なアロケーションの存在と近似性にどのように影響するかを問う。
既知結果よりも高い公平性を保証するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:06:16 GMT)
Rehearsal with Auxiliary-Informed Sampling for Audio Deepfake Detection [7.4] Rehearsal with Auxiliary-Informed Smpling (RAIS)は、オーディオディープフェイク検出のためのリハーサルベースのCLアプローチである。
RAISはラベル生成ネットワークを使用して補助ラベルを生成し、メモリバッファの多様なサンプル選択を導く。
大規模な実験では、RAISは最先端の手法よりも優れており、5つの経験で平均1.953%のEER(Equal Error Rate)を達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:40:50 GMT)
Interactive Video Generation via Domain Adaptation [7.4] テキスト条件付き拡散モデルは高品質のビデオ生成のための強力なツールとして登場してきた。
近年の無訓練アプローチでは、軌道案内のための注意マスクが導入されているが、品質は低下することが多い。
これらの手法の2つの重要な障害モードを特定し、どちらもドメイン問題と解釈する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:19:47 GMT)
Physics-Informed Generative Modeling of Wireless Channels [7.4] 機械学習(ML)の潜在能力を最大限活用するためには、特定の環境における無線チャネルのサイト固有の分布を学習することが不可欠である。
我々は,無線チャネルの物理圧縮性と生成モデルを組み合わせることで,基礎となる物理チャネルパラメータの分布を学習する。
本手法は,リトレーニングを必要とせずに,システム構成を物理的に解釈し,一般化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:24:44 GMT)
Predicting the Past: Estimating Historical Appraisals with OCR and Machine Learning [7.4] 本稿では,歴史的住宅評価データをデジタル化し,それを応用して1つの郡にデータセットを構築し,リリースするアプローチを提案する。
我々は、古典的なコンピュータビジョン技術とディープラーニングベースのOCRを組み合わせた2段階のアプローチに基づいて、OCRを使用して5万のプロパティにデータをラベル付けする。
これらの費用対効果の高いツールによって、学者、コミュニティ活動家、政策立案者は、リライニングの歴史的影響をよりよく分析し理解することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:04:21 GMT)
DCTdiff: Intriguing Properties of Image Generative Modeling in the DCT Space [7.3] 本稿では、離散コサイン変換(DCT)空間の画像を効率的にモデル化する、エンドツーエンドの拡散生成パラダイムであるDCTdiffを紹介する。
実験により、DCTdiffは、生成品質とトレーニング効率に関する画素ベースの拡散モデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:03:44 GMT)
Two failure modes of deep transformers and how to avoid them: a unified theory of signal propagation at initialisation [7.2] ニューラルネットワークの適切な初期化を見つけることは、スムーズなトレーニングと優れたパフォーマンスを保証するために不可欠である。
トランスでは、間違った初期化は、ランク崩壊とエントロピー崩壊という、2つの自己注意層の障害モードの1つにつながる可能性がある。
本稿では, 自己アテンション層を有するバニラ変圧器ブロックによる信号伝搬の解析理論を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:18:23 GMT)
Don't Just Follow MLLM Plans: Robust and Efficient Planning for Open-world Agents [7.2] 本稿では,これらの問題に対処するための新しいフレームワークであるオープンワールドエージェントのためのロバスト・効率的な計画手法(REPOA)を紹介する。
REPOAは、適応的な依存性学習と、知識不正確性に対する堅牢性を高めるためのきめ細かな障害対応操作メモリの3つの重要なコンポーネントを備えている。
2つの確立されたオープンワールドテストベッドにおける評価は、REPOAの堅牢で効率的なプランニングを実証し、遅発品の獲得に成功していることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:01:44 GMT)
Can Classic GNNs Be Strong Baselines for Graph-level Tasks? Simple Architectures Meet Excellence [7.1] グラフニューラルネットワーク(GNN)の未解決の可能性について,拡張フレームワークであるGNN+を用いて検討する。
GNN+フレームワークによって強化された3つの古典的GNNを14のグラフレベルデータセットで体系的に再評価する。
以上の結果から,これらの古典的GNNは,広く普及している信念とは対照的に,GTのパフォーマンスと一貫して一致しているか,上回っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:44:36 GMT)
Learn from the Past: Fast Sparse Indexing for Large Language Model Decoding [7.1] 大規模言語モデル(LLM)は、より長いコンテキストをサポートし続ける。
復号化時のキーバリューキャッシュのメモリ需要は急速に増大する。
スパースアテンション機構は、選択されたキー値対に対してのみ注意重みを計算することでこの問題を軽減する。
既存の方法は、各デコードステップを独立したプロセスとして扱うことが多い。
本研究では,過去の注目パターンに基づいて,スパースインデックス化候補を動的に構築する高速化手法LFPSを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:35:59 GMT)
Sleep Brain and Cardiac Activity Predict Cognitive Flexibility and Conceptual Reasoning Using Deep Learning [7.1] 本研究では、深層学習モデルが夜間睡眠中の生理的過程から実行機能、特に認知的適応性と概念的推論を予測することができるかどうかを検討する。
マルチモーダルポリソノグラフィーデータを処理するために設計されたマルチスケール畳み込み変換器モデルであるCogPSGFormerを紹介する。
拡張睡眠信号の処理を最適化するために,CogPSGFormerアーキテクチャの徹底的な評価を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:21:07 GMT)
TOPLOC: A Locality Sensitive Hashing Scheme for Trustless Verifiable Inference [7.1] 大規模言語モデル(LLM)は非常に有能であることが証明されているが、現在フロンティアモデルへのアクセスは推論プロバイダに依存している。
本研究では,この問題に対処する検証可能な新しい手法であるTOPLOCを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:07:40 GMT)
Feeling Guilty Being a c(ai)borg: Navigating the Tensions Between Guilt and Empowerment in AI Use [7.1] 本稿では,AIによる人間の拡張現実である「c(ai)borg」として,罪悪感の概念を探求する。
c(ai)borgのビジョンは、AIがオープンに共同パートナーとして受け入れられる未来を提唱している。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:33:04 GMT)
Entanglement Detection with Variational Quantum Interference: Theory and Experiment [7.1] 絡み合い検出は量子情報科学の基本的な課題である。
我々は、中程度の古典的および量子的資源を必要とする絡み合い検出プロトコルを開発する。
我々のプロトコルは、効率的な絡み合い検出のための新しい経路を舗装する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:26:25 GMT)
How Much Backtracking is Enough? Exploring the Interplay of SFT and RL in Enhancing LLM Reasoning [6.9] 8つの推論課題におけるSFTとRLのダイナミクスについて検討する。
ウォームアップとしてSFTで使用される短いCoT配列は、コールドスタートRLと比較してRLトレーニングに適度に寄与する。
バックトラックの長いCoTは、一般的にRLトレーニングをより良く安定したものにします。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:49:00 GMT)
Krikri: Advancing Open Large Language Models for Greek [6.9] ギリシャ語に適した最先端の大規模言語モデルであるLlama-Krikri-8Bを紹介する。
Llama-Krikri-8Bは、言語的ニュアンスへの優れた適応を保証するために、高品質なギリシャ語のデータを広範囲に訓練してきた。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:44:32 GMT)
ER-REASON: A Benchmark Dataset for LLM-Based Clinical Reasoning in the Emergency Room [6.9] 大規模言語モデル (LLMs) は, ライセンス試験に基づく質問応答タスクにおいて, 広範囲に評価されている。
ER-Reason(ER-Reason)は、救急室におけるLSMに基づく臨床推論と意思決定を評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:23:56 GMT)
CLIP-IT: CLIP-based Pairing for Histology Images Classification [6.9] 視覚バックボーンモデルのトレーニングにCLIP-ITを導入し、外部ソースからの特権的なテキスト情報と組み合わせることで、組織像を分類する。
当初、モダリティペアリングのステップは、CLIPベースのモデルを使用して、組織像と外部ソースからの意味的に関連するテキストレポートデータとをマッチングし、拡張されたマルチモーダルデータセットを作成する。
パラメータ効率のよい微調整法を用いて、主(画像)と対(テキスト)のモダリティのミスアライメントを効率的に解決する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:29:42 GMT)
Behavioral Safety Assessment towards Large-scale Deployment of Autonomous Vehicles [6.8] 自動運転車(AV)の行動安全へのパラダイムシフトを提案する。
本稿では,運転免許試験と運転情報検査の2つの相補的な評価要素を含む,サードパーティのAV安全性評価フレームワークを紹介する。
シミュレーション環境とミシガン大学のMcity Testing Facilityの物理的テストトラックの両方で,オープンソースのLevel 4 AVであるtexttAutoware.Universeを検証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:11:11 GMT)
Feature Attribution from First Principles [6.8] あらゆる特徴帰属メソッドが満たすべき公理的フレームワークは、しばしば制限的すぎると我々は主張する。
公理を課すのではなく、最も単純なモデルに対する属性を定義することから始める。
深部ReLUネットワークの帰属を表すクローズドフォーム式を導出し,評価指標の最適化に向けて一歩踏み出した。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:53:11 GMT)
You need to MIMIC to get FAME: Solving Meeting Transcript Scarcity with a Multi-Agent Conversations [6.7] FAMEは、英語で500のミーティングと、MIMICが制作したドイツ語で300のミーティングのデータセットである。
心理学的根拠を持つ参加者プロファイルを定義することにより、所定の知識ソース上で会議の書き起こしを生成する。
モジュラー後処理ステップはこれらの出力を洗練させ、潜在的反復性を緩和し、過度にフォーマルなトーンを緩和する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:21:32 GMT)
ROAD: Responsibility-Oriented Reward Design for Reinforcement Learning in Autonomous Driving [6.7] 本研究では,交通規制を具体化する責任指向報酬関数をReinforcement Learningフレームワークに導入する。
本稿では,交通規制知識グラフを導入し,視覚・言語モデルと検索・拡張生成手法を併用して報酬の割り当てを自動化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:00:51 GMT)
Shadow defense against gradient inversion attack in federated learning [6.7] フェデレートラーニング(FL)は、プライバシ保護分散トレーニングのための変革的フレームワークとして登場した。
グラディエント・アタック(GIA)は、訓練画像のトレーニングと再構築に使用される勾配を近似し、患者のプライバシーを盗む。
これらの課題に対処するフレームワークを導入し、機密性の高い領域を特定するために、解釈可能性を備えたシャドウモデルを活用する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:58:57 GMT)
AMXFP4: Taming Activation Outliers with Asymmetric Microscaling Floating-Point for 4-bit LLM Inference [6.7] AMXFP4は4ビットの非対称なFPフォーマットで、どちらも非対称な共有スケールで処理する。
AMXFP4はVQAでMXFP4を3%上回り、CSQAで1.6%上回る。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:11:39 GMT)
Optimal Weighted Convolution for Classification and Denosing [6.7] 従来の畳み込みニューラルネットワーク(CNN)を強化する新しい重み付き畳み込み演算子を導入する。
この拡張により、ネットワークは基準画素に対する相対位置に基づいて隣接画素を微分重み付けすることができる。
2次元画像データのために開発されたが、任意の次元の正規格子上の信号に一般化可能である。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:10:46 GMT)
Optimal Density Functions for Weighted Convolution in Learning Models [6.7] 本稿では、正規格子上で定義された信号の畳み込みに対する新しいアプローチである重み付き畳み込みについて紹介する。
重み付き畳み込みは畳み込みニューラルネットワーク問題に適用でき、近似精度を向上させることができる。
今後の研究は、重み付き畳み込みを実例2Dおよび3D画像畳み込み学習問題に適用する予定である。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:36:36 GMT)
The Structural Safety Generalization Problem [6.6] LLMジェイルブレイクは幅広い安全上の課題である。この問題がまだ解決されていないことを踏まえ、重要な障害メカニズムをターゲットにすることを提案する。
我々は、マルチターン、マルチイメージ、翻訳ベースの攻撃に対する新たな脆弱性を明らかにすることで、このフレームワーク内でレッドチームを行う。
次に、このフレームワークがStructure Rewriting Guardrailを提案することによって、新たな防御を可能にする可能性を実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:39:05 GMT)
Towards Robust and Efficient Federated Low-Rank Adaptation with Heterogeneous Clients [6.6] 低ランク適応(LoRA)は解法として提案されているが、連合学習におけるその応用は集約の不一致によって複雑である。
この不一致に対処する既存の手法は、不均一なデータ設定で低いランクでの性能劣化に悩まされることが多い。
LoRA-A$2$を導入し、低いランクと高いデータ不均一性を持つ挑戦的な設定において堅牢性を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:33:11 GMT)
Learning Distributions over Permutations and Rankings with Factorized Representations [6.5] 置換よりも分散を学習することは、機械学習の基本的な問題である。
置換に代替表現を利用する新しい手法を提案する。
提案手法は,最短表現モードでも非自明な分布を学習することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:53:40 GMT)
Heterodyne detection of low-frequency fields via Rydberg EIT with phase demodulation [6.5] 我々は、Rydberg原子を介して低周波場を検出する特別で低コストでスケーラブルな手法を設計、実装、分析する。
本稿では,Rydberg EIT機構を介して低周波場によって誘導されるプローブレーザの位相変調効果に着目した。
本手法の一般的な原理は、電場と磁場の両方に適用でき、同一装置における両方の機能の組み合わせを実現できる。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:46:44 GMT)
WaferLLM: Large Language Model Inference at Wafer Scale [6.5] 本稿では,最初のウェハスケールLLM推論システムであるWaferLLMを紹介する。
WaferLLMは、ウェハスケールアーキテクチャのユニークなハードウェア特性をキャプチャする新しいPLMRモデルによってガイドされる。
WaferLLMは最先端の手法よりも200$times$高いアクセラレータ利用を実現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:10:19 GMT)
Simulating Training Data Leakage in Multiple-Choice Benchmarks for LLM Evaluation [6.4] 既存のリーク検出技術である置換法とn-gram法を比較した。
解析の結果,n-gram法は高いF1スコアが得られることがわかった。
MMLUとHellaSwagのクリーンバージョンを作成し、複数のLLMを再評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:37:39 GMT)
Vedavani: A Benchmark Corpus for ASR on Vedic Sanskrit Poetry [6.4] 我々は,Rig VedaとAtharva Vedaの3,779個のラベル付きオーディオサンプルからなる,54時間のサンスクリットASRデータセットを提示する。
このデータセットは、言語を定義する正確な韻律的特徴とリズム的特徴をキャプチャする。
また、様々な最先端の多言語音声モデルにデータセットをベンチマークする。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:36:54 GMT)
RMoA: Optimizing Mixture-of-Agents through Diversity Maximization and Residual Compensation [6.4] 本稿では,Residual Mixture-of-Agents(RMoA)を提案する。
RMoAは、アライメント、数学的推論、コード生成、マルチタスク理解のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:23:11 GMT)
Adapting Offline Reinforcement Learning with Online Delays [6.3] 強化学習(RL)エージェントのオフラインからオンラインへのデプロイは、2つのギャップを埋めなければならない。
デプロイ時に遅延ダイナミクスに対処するために構築されたオフラインRLフレームワークであるDT-CORLを紹介する。
実験により、DT-CORLは歴史拡張法とバニラ信念に基づく手法の両方を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:09:29 GMT)
Autonomous Behavior and Whole-Brain Dynamics Emerge in Embodied Zebrafish Agents with Model-based Intrinsic Motivation [6.3] 自律性は動物の知能の目印であり、外部の報酬やタスク構造に頼ることなく、複雑な環境で適応的でインテリジェントな行動を可能にする。
本稿では,動物に観察される堅牢な自律探査を捉えるために,モデルに基づく本質的なドライブを提案する。
本研究は,モデルに基づく本質的な動機づけを自然主義的行動に結びつけるための計算枠組みを確立し,動物のような自律性を持つ人工エージェント構築の基盤となる。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:21:40 GMT)
Enhancing Table Recognition with Vision LLMs: A Benchmark and Neighbor-Guided Toolchain Reasoner [6.2] 本研究では,視覚大言語モデル(VLLM)の学習自由シナリオにおける認識能力を評価するためのベンチマークを提案する。
低品質画像入力は認識過程において重要なボトルネックであることがわかった。
視覚操作のための多様な軽量ツールを統合することで特徴付けられるNGTR(Neighbor-Guided Toolchain Reasoner)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:29:17 GMT)
Impact of Bottleneck Layers and Skip Connections on the Generalization of Linear Denoising Autoencoders [6.2] 勾配流下で訓練された2層線形デノナイジングオートエンコーダに着目した。
学習した解に対するランク制約を効果的に実施する低次元ボトルネック層。
スキップ接続は オートエンコーダの 分散を緩和できる
論文参考訳(メタデータ) (Fri, 30 May 2025 14:58:02 GMT)
Pre-trained Prompt-driven Semi-supervised Local Community Detection [6.1] プロンプト駆動型半教師型地域コミュニティ検出法(PPSL)
PPSLはノードエンコーディング、サンプル生成、プロンプト駆動の微調整の3つの主要コンポーネントで構成されている。
5つの実世界のデータセットによる実験結果から、PPSLはコミュニティの品質と効率の両方においてベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:17:36 GMT)
Edge Computing for Physics-Driven AI in Computational MRI: A Feasibility Study [6.1] FPGAベースのエッジコンピューティングデバイスに最適化された新しいPD-AI計算MRI手法を提案する。
提案手法は,従来のPD-AI手法に匹敵する再現性を維持しつつ,計算効率の向上を図っている。
提案手法は,資源制約されたデバイス上での高分解能MRI再構成の機会を示し,実世界の展開の可能性を明らかにする。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:35:43 GMT)
Planning in a recurrent neural network that plays Sokoban [6.1] 我々は、逐次的かつ不可逆な決定を必要とするパズルであるソコバンで訓練されたリカレントニューラルネットワーク(RNN)を分析する。
RNNには因果的計画表現があり、今後50段階の行動を予測する。
トレーニングされたRNNを、トレーニング体制を超えた堅牢な表現を実証し、より大きく、配布外なソコバンパズルに拡張する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:08:56 GMT)
Real-time Fall Prevention system for the Next-generation of Workers [6.0] この研究は倒立振子の動的モデルを用いて、深い学習フレームワークに供給される落下のシミュレーションを生成する。
出力は、被写体が害のリスクがある場合に、転倒軽減機構を活性化する信号である。
このアプローチは、被験者が初期設定を著しく変更することなく落下する特定の種類の転倒に適している。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:41:16 GMT)
SoundSculpt: Direction and Semantics Driven Ambisonic Target Sound Extraction [6.0] SoundSculptは、アンビソニック録音からターゲット音場を抽出するように設計されたニューラルネットワークである。
SoundSculptはアンビソニック・イン・アンビソニック・アウトアーキテクチャを採用しており、空間情報とセマンティック・埋め込みの両方を条件にしている。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:15:10 GMT)
The Hype Index: an NLP-driven Measure of Market News Attention [5.9] 本稿では,大規模株式に対するメディアの注目度を定量化するための指標として,Hype Indexを紹介した。
まず,各報道記事のシェアを計算し,相対的なメディア露出を測定するニューズカウントベースのハイプ指数を構築した。
次に、資本化調整ハイプ指数(Capitalization Adjusted Hype Index)に拡張し、株式またはセクターのメディア重量と、その産業またはセクター内の市場資本化重量との比率を考慮し、経済規模を調整します。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:55:54 GMT)
T2VUnlearning: A Concept Erasing Method for Text-to-Video Diffusion Models [5.9] 本稿では,テキスト・ツー・ビデオ(T2V)モデルに対する頑健で高精度な未学習手法を提案する。
正確なアンラーニングを実現するために,モデルの非ターゲット概念生成能力を維持するために,ローカライゼーションと保存正規化を組み込んだ。
本手法は,既存の手法よりも優れたモデル生成能力を保ちながら,特定の概念を効果的に消去する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:11:29 GMT)
FABLE: A Novel Data-Flow Analysis Benchmark on Procedural Text for Large Language Model Evaluation [5.9] FABLEは、構造化された手続き型テキストを用いて、大規模言語モデルのデータフロー理解を評価するために設計されたベンチマークである。
推論中心モデル(DeepSeek-R1 8B)、汎用モデル(LLaMA 3.1 8B)、コード固有モデル(Granite Code 8B)の3種類を評価した。
その結果,推理モデルでは精度が向上するが,他のモデルに比べて20倍以上の推論が遅くなることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:32:34 GMT)
Localizing Persona Representations in LLMs [5.8] 大規模言語モデル(LLM)の表現空間におけるペルソナのエンコード方法と場所について検討する。
我々は、道徳的ニヒリズムや実用主義など、特定の倫理的観点で重なるアクティベーションを観察する。
対照的に、保守主義や自由主義のような政治的イデオロギーは、より異なる地域で表現されているようである。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:46:44 GMT)
REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards [5.7] Reasoning Gym (RG) は強化学習のための推論環境のライブラリである。
代数、算術、計算、認識、幾何学、グラフ理論、論理学、各種ゲームを含む複数の領域にまたがる100以上のデータ生成器と検証器を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:20:18 GMT)
A High-Performance Multilevel Framework for Quantum Layout Synthesis [5.7] QLSのための高性能マルチレベルフレームワークML-SABREを提案する。
我々は、あらゆるレベルで最先端のLightSABREを採用し、効率と性能の両立を図っている。
ML-SABREは、SWAP数では最大82%、回路深さでは49%の最適ギャップを著しく減少させることができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:24:22 GMT)
A Mathematical Perspective On Contrastive Learning [5.7] マルチモーダルコントラスト学習(Multimodal contrastive learning)は、異なるデータモダリティをリンクするための方法論である。
本稿では,条件付き確率分布を定義するエンコーダの最適化として,バイモーダル設定とコントラスト学習に着目した。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:09:37 GMT)
Large Language Model-Driven Distributed Integrated Multimodal Sensing and Semantic Communications [5.6] 本稿では,新しい大規模言語モデル (LLM) による分散分散マルチモーダルセンシングとセマンティックコミュニケーションフレームワークを提案する。
具体的には、RFモジュールとカメラモジュールを備えた複数の協調センシング装置で構成されている。
Genesis シミュレーションエンジンにより生成された合成多視点RF-視覚データセットの評価結果から,LLM-DiSAC が良好な性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:40:41 GMT)
How Do Transformers Learn Variable Binding in Symbolic Programs? [5.6] シンボリックプログラムにおいて、クエリされた変数を非参照するようにTransformerを訓練する。
このモデルでは、残余ストリームをアドレス可能なメモリ空間として活用することを学びました。
この結果から,Transformer モデルが体系的変数バインディングの実装を学べることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:08:50 GMT)
A Human Study of Cognitive Biases in Web Application Security [5.5] 本稿では,認知バイアスが旗の教育とセキュリティの獲得にどのように役立つかを検討する。
本稿では,認知バイアス,特に検索と損失回避の満足度を制御するためのアプローチを提案する。
本研究は,多くの参加者が検索バイアスの満足度を示し,このバイアスがその成功に有意な影響を与えていることを明らかにする。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:55:45 GMT)
MHTS: Multi-Hop Tree Structure Framework for Generating Difficulty-Controllable QA Datasets for RAG Evaluation [5.5] 既存のRAGベンチマークはクエリの難しさを見落とし、単純な質問や信頼性の低い評価でパフォーマンスが膨らむ。
MHTS(Multi-Hop Tree Structure)は、マルチホップツリー構造を利用して、論理的に連結されたマルチチャンククエリを生成することで、マルチホップ推論の複雑さを制御する新しいデータセット合成フレームワークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:59:47 GMT)
Principled Understanding of Generalization for Generative Transformer Models in Arithmetic Reasoning Tasks [5.5] トランスフォーマーベースのモデルは様々なタスクにおいて優れているが、その一般化能力、特に算術的推論では、まだ完全には理解されていない。
本稿では,算術課題における変圧器の一般化動作を理解するための統一的理論枠組みを開発する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:41:39 GMT)
Concerning the Responsible Use of AI in the US Criminal Justice System [5.5] Piece氏は、AIのデータ、ロジック、制限の明確な説明を提唱している。
AIシステムのバイアスに対処し、説明責任を維持するために定期的な監査を求める。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:33:42 GMT)
MorphoSeg: An Uncertainty-Aware Deep Learning Method for Biomedical Segmentation of Complex Cellular Morphologies [5.5] 深層学習は医学や生物学的イメージング、特にセグメンテーションのタスクに革命をもたらした。
細胞の形態の多様性と複雑さのため、生物学的な細胞を分断することは依然として困難である。
我々は多能性癌細胞株であるNtera-2細胞の新しいベンチマークデータセットを導入する。
トレーニング中の低線量領域からの仮想アウトリーチのサンプリングを取り入れた,複雑な細胞形態区分(MorphoSeg)のための不確実性を考慮したディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:42:51 GMT)
An Explicit Syllogistic Legal Reasoning Framework for Large Language Models [5.5] 大規模言語モデル(LLM)は法的問題に答えることができるが、しばしば明示的なシロジック推論に苦慮する。
我々は,LLMが明示的なシロジックな法的推論を行えるように設計された新しいフレームワークであるSyLeRを紹介した。
SyLeRは、関係する法規や前例を合成するために、木構造的階層的検索機構を使用している。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:49:16 GMT)
Towards Automatic Sampling of User Behaviors for Sequential Recommender Systems [5.5] 本稿では,一様でない過去の行動を扱うために,AutoSAMというシーケンシャルレコメンデーションのための新しい自動サンプリングフレームワークを提案する。
ベンチマークレコメンデーションモデルと4つの実世界のデータセットについて広範な実験を行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:40:25 GMT)
Substrate Effect on Electronic Band Structure and Topological Property in Monolayer V2O3 Magnetic Topological Insulator [5.4] V2O3ベースのファンデルワールス(vdW)基板は量子異常ホール(QAH)状態を実現するための有望なプラットフォームを提供する。
我々は、h-BNなどの非磁性基板がチャーン数C = 1でQAH相を保ち、隙間のないキラルエッジ状態を維持することを示す。
強磁性基板は余分な電子を誘導し、フェルミ準位をシフトすることでトポロジカル秩序を破壊する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:24:30 GMT)
MOFGPT: Generative Design of Metal-Organic Frameworks using Language Models [5.4] 応用固有の性質を持つ金属有機フレームワーク(MOF)は、材料化学における中心的な課題である。
我々はMOFのデノボ設計のための強化学習型トランスフォーマーベースのフレームワークを提案する。
特性フィードバックをシーケンス生成に統合することにより、このモデルを合成可能でトポロジカルに有効なMOFに向けて駆動する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:09:11 GMT)
Generator Based Inference (GBI) [5.3] 我々は、ジェネレータベース推論(GBI)と呼ばれるジェネレータと機械学習の統合を記述するための一般的なフレームワークを提案する。
特に,共振器の異常検出に着目し,背景を記述した生成器をサイドバンドから学習する。
これにより、異常検出の統計的出力を直接解釈できるように変換され、LHCOコミュニティベンチマークデータセットのパフォーマンスは、異常検出感度のための新しい最先端技術を確立する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:00:08 GMT)
A Theoretical Framework for OOD Robustness in Transformers using Gevrey Classes [5.2] セマンティック・アウト・オブ・ディストリビューション・シフト下でのトランスフォーマー言語モデルのロバスト性について検討する。
We derived sub-exponential upper bounds on prediction error using Wasserstein-1 distance and Gevrey-class smoothness。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:14:36 GMT)
From Misleading Queries to Accurate Answers: A Three-Stage Fine-Tuning Method for LLMs [5.2] 大規模言語モデル(LLM)は自然言語処理(NLP)において優れた性能を示す
既存の方法は出力の修正に重点を置いているが、LLMが入力自体の誤解を招くコンテンツを検出し修正する能力を改善する可能性を見落としていることが多い。
入力中のミスリード情報を検出・修正するLLMの能力を向上する新しい3段階微調整法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:16:10 GMT)
Recurrent Self-Attention Dynamics: An Energy-Agnostic Perspective from Jacobians [5.2] この研究は、エネルギーの制約を緩和し、推論力学のエネルギーに依存しない特徴づけを提供することを目的としている。
まず、エネルギーベースの定式化において伝統的に必要とされる対称性と単頭制約を緩和することを検討する。
正規化層はヤコビアン複素固有値を効果的に正規化し、力学を臨界状態に近づける。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:01:23 GMT)
Hierarchical Level-Wise News Article Clustering via Multilingual Matryoshka Embeddings [5.2] 本稿では,ニュース記事やソーシャルメディアデータをクラスタリングするための,新しい,スケーラブルで解釈可能な,階層的,多言語的なアプローチを提案する。
まず、さまざまなレベルの粒度でストーリーの類似性を決定するマルチリンガルなMatryoshka埋め込みを訓練する。
本研究では,Matryoshka埋め込みの階層性を活用し,ユニークなニュース,物語,テーマを識別する効率的な階層的クラスタリングアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:17:18 GMT)
Refined Causal Graph Structure Learning via Curvature for Brain Disease Classification [5.1] 脳疾患の分類・検出のための新しいフレームワークCGB(Causal Graphs for Brains)を提案する。
CGBは、脳疾患の分類性能を高めるために重要な情報をもたらすROI間の因果関係を明らかにする。
実験の結果,脳疾患データセットの分類作業において,CGBは最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:50:45 GMT)
WILTing Trees: Interpreting the Distance Between MPNN Embeddings [5.1] 特定のタスクにおけるメッセージパッシングニューラルネットワーク(MPNN)によって学習される距離関数について検討する。
我々はMPNN埋め込み間の距離を解釈可能なグラフ距離に蒸留する。
我々は,MPNNが埋め込みの相対的な位置を,少数の部分グラフに焦点をあてて定義することを実証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:28:41 GMT)
Structuring Radiology Reports: Challenging LLMs with Lightweight Models [5.0] 大規模言語モデル(LLM)は、臨床テキストの再構築、高い計算要求、透明性の欠如、データプライバシに関する懸念が現実的な展開を妨げていることを示す。
我々は,MIMIC-CXRおよびCheXpert Plusデータセットからの放射線学レポートを構造化するために,軽量エンコーダデコーダモデル(300Mパラメータ)を特にT5およびBERT2BERTで検討する。
我々の最良性能軽量モデルは、人間による注釈付きテストセット上で、プロンプトベースの手法で適応された全てのLCMより優れています。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:12:51 GMT)
Overfitting has a limitation: a model-independent generalization error bound based on Rényi entropy [5.0] 本稿では,データヒストグラムのみにより出力が決定されるアルゴリズムに適用可能な一般化誤差に対するモデル独立上界を提案する。
このフレームワークは、データにランダムノイズを注入することで、一般化性能が著しく低下する現象について、直接的な説明を提供する。
我々は、ノー・フリー・ランチの定理をデータ分布依存に適応させ、R'enyiエントロピーに対応するデータの量が実際に学習の成功に不可欠であることを証明した。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:41:37 GMT)
Disentangling Granularity: An Implicit Inductive Bias in Factorized VAEs [5.0] 本研究では, 因数分解前の変分自己エンコーダ (VAE) の非絡み合いを誘導する暗黙的帰納バイアスについて検討した。
因子化VAEにおける暗黙的帰納バイアスとしての異方性粒度は、異方性性能とエビデンス・ロウアー・バウンド(ELBO)の推論の両方に影響を及ぼすことを示した。
その結果, 因子化VAEにおける暗黙的誘導バイアスとしての粒状化が, ELBOの解離性能と推定に影響を及ぼし, VAEの解釈可能性や固有バイアスに関する新たな知見が得られた。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:08:50 GMT)
Statistical mechanics of extensive-width Bayesian neural networks near interpolation [5.0] 総重量分布と活性化関数を持つ2層完全連結ネットワークの教師あり学習について検討した。
我々は、同じアーキテクチャを持つ別のネットワークによって生成されたデータセットを用いて、教師学生のシナリオにおけるベイズ最適学習に焦点を当てる。
分析の結果,データ数の増加に伴い,多様な学習遷移を伴う豊富な現象が明らかになった。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:46:59 GMT)
Contrast-Invariant Self-supervised Segmentation for Quantitative Placental MRI [4.9] マルチエコーT2*重み付きMRIにおける相補的情報を活用するコントラスト拡張セグメンテーションフレームワークを提案する。
本手法は, (i) ラベルなしマルチエコスライスを用いた自己教師付き事前学習のためのマスク付き自動符号化 (MAE) , (ii) 教師なしドメイン適応のためのマスク付き擬似ラベル化 (MPL) , (iii) 微細な特徴をグローバルな解剖学的文脈と整合させるグローバルな局所的コラボレーションとを統合した。
臨床用マルチエコープラテンタルMRIデータセットを用いた実験により, エコー時間および単一エコーおよびナイーブ核融合の効率良く一般化できることが判明した。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:58:14 GMT)
CLIX: Cross-Lingual Explanations of Idiomatic Expressions [4.9] 本稿では,eXaticpressionsの言語横断的説明課題であるCLIXを提案する。
この課題に対する現在のNLPモデルの能力について検討し、課題はあるものの、大きな言語モデルは有望であることを示す。
私たちは、これらのシステムを教育ツールに確実に組み込む前に、対処すべき重要な課題を強調するために、詳細なエラー分析を行います。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:16:02 GMT)
Autoregression-free video prediction using diffusion model for mitigating error propagation [4.8] 本稿では拡散モデルを用いた最初のオートレグレスフリー(ARFree)ビデオ予測フレームワークを提案する。
自動回帰ビデオ予測メカニズムとは異なり、ARFreeはコンテキストフレームから直接将来のフレームを予測する。
提案するARFreeビデオ予測フレームワークは,2つのベンチマークデータセットを用いた実験により,最先端のビデオ予測手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:09:29 GMT)
Energy-Embedded Neural Solvers for One-Dimensional Quantum Systems [4.8] エネルギー埋め込み型物理インフォームドニューラルネットワークによるシュリンガー方程式の解法を提案する。
提案手法はシュル・オーディンガー方程式以外の偏微分方程式を解くために拡張することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:13:26 GMT)
Revisiting Cross-Modal Knowledge Distillation: A Disentanglement Approach for RGBD Semantic Segmentation [4.8] RGBDセマンティックセグメンテーションのためのクロスモーダルな知識蒸留フレームワークであるCroDiNo-KD(Cross-Modal Disentanglement: a New Outlook on Knowledge Distillation)を紹介する。
提案手法は, アンタングル表現, コントラスト学習, およびデカップリングデータ拡張を利用して, 単一モードのRGBとDepthモデルを同時に学習する。
本研究は,CroDiNo-KDの品質を実証し,従来の教師/学生のパラダイムを再考し,マルチモーダルデータから単一モーダルニューラルネットワークへ情報を抽出することを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:53:35 GMT)
Stress-testing Machine Generated Text Detection: Shifting Language Models Writing Style to Fool Detectors [4.8] 本稿では,最新のMGT検出器の言語情報による敵攻撃に対するレジリエンスをテストするパイプラインを提案する。
我々は、MGTスタイルを人文テキスト(HWT)にシフトするために、言語モデルを微調整する。
これは検出器が構造的な手がかりに頼っていることを悪用し、新しい世代を検知することがより困難になる。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:33:30 GMT)
TRAPDOC: Deceiving LLM Users by Injecting Imperceptible Phantom Tokens into Documents [4.8] 大規模言語モデル(LLM)への過度な依存は、重要な社会的問題として浮上している。
そこで本研究では,LLMがユーザにとって妥当と思われるが,実際には誤りである出力を生成するために,不知覚なファントムトークンを文書に注入する手法を提案する。
本手法を応用して,高信頼性LLMユーザを欺くためのフレームワークであるTRAPDOCを導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:16:53 GMT)
NdLinear: Don't Flatten! Building Superior Neural Architectures by Preserving N-D Structure [4.7] NdLinearは、テンソルを直接操作することによって破壊的平坦化を回避する新しい線形変換である。
表現力を大幅に向上させ、劇的なパラメータ削減を実現し、良好な計算プロファイルを維持する。
NdLinearは、標準的な線形層に対する汎用的でドロップインの代替として、元のN次元形式でデータを処理している。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:35:07 GMT)
Agent-UniRAG: A Trainable Open-Source LLM Agent Framework for Unified Retrieval-Augmented Generation Systems [4.7] 本稿では,最近の大規模言語モデル (LLM) エージェントの概念を用いたRAGシステムに対する新しいアプローチを提案する。
本稿では,統合検索拡張LLMシステムのためのエージェントUniRAGと呼ばれるトレーニング可能なエージェントフレームワークを提案する。
主なアイデアは、入力の複雑さに基づいてRAGタスクを段階的に解決するLLMエージェントフレームワークを設計することである。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:44:41 GMT)
Position: Federated Foundation Language Model Post-Training Should Focus on Open-Source Models [4.7] 基礎言語モデルのポストトレーニングは、フェデレートラーニング(FL)における有望な研究領域として浮上している。
この領域の最近の進歩は、ブラックボックス基礎言語モデルの上に構築された集中的なポストトレーニングアプローチを採用する。
我々の立場では、FLにおけるブラックボックスモデルの使用は、データプライバシや自律性といったフェデレーションの原則とは矛盾している。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:38:36 GMT)
Towards Secure MLOps: Surveying Attacks, Mitigation Strategies, and Research Challenges [4.7] 我々は,MLOpsエコシステムのさまざまなフェーズにわたる攻撃を評価するために,MITRE ATLAS(Adrial Threat Landscape for Artificial-Intelligence Systems)フレームワークの体系的応用を提案する。
次に、MLOpsエコシステムの対応するフェーズに明示的にマッピングされた攻撃手法の構造的分類を示す。
これに続いて、これらの攻撃カテゴリに沿った緩和戦略の分類が行われ、MLOpsエコシステムのセキュリティを強化するための実行可能なアーリーステージディフェンスが提供される。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:45:31 GMT)
Preparing magnonic non-Gaussian states by adding a single magnon onto Gaussian states [4.6] 2つのガウス状態に1つのマグノンを加えることで、2種類の非ガウス的マグノン状態を作成する。
どちらの状態も、コヒーレントまたは熱マグノン励起を変化させることで、量子状態から古典状態への滑らかな遷移を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:29:46 GMT)
CMIE: Combining MLLM Insights with External Evidence for Explainable Out-of-Context Misinformation Detection [4.5] 本稿では,OOC誤報を検出するための新しいフレームワークであるCMIEを提案する。
CMIEは、画像とテキスト間の基盤的共存を特定し、関連する証拠を選択的に利用して誤情報検出を強化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:34:43 GMT)
Calibration of Large Language Models on Code Summarization [4.4] 我々は、AIが生成した要約が、人間が生成したであろう要約にいかに近いかを研究する。
BERTScore(英語版)やBLEU(英語版)などの対策が提案され、人体実験で評価されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:55:33 GMT)
Three Kinds of Negation in Knowledge and Their Mathematical Foundations [4.3] 哲学,論理学,言語学など,さまざまな分野における否定の理解と特性について検討し,分析する。
矛盾の概念と反対概念の区別に基づき,概念的視点から知識の否定には3つの異なる種類が存在することを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:01:37 GMT)
Equivalence checking of quantum circuits via intermediary matrix product operator [4.3] 等価チェックは、量子回路のコンパイルと最適化中に発生するエラーを特定する上で重要な役割を果たす。
本稿では,量子回路の等価性を決定するために,行列積演算子(MPO)に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:07:35 GMT)
Fewer Hallucinations, More Verification: A Three-Stage LLM-Based Framework for ASR Error Correction [4.3] 本稿では, 誤り前検出, 連鎖型サブタスク反復補正, 推論プロセス検証の3段階からなる信頼性補正フレームワーク(RLLM-CF)を提案する。
AISHELL-1, AISHELL-2, Librispeechの実験により, このフレームワークによって強化されたGPT-4oモデルは, CER/WERの相対減少率21%, 11%, 9%, 11.4%を達成した。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:40:49 GMT)
A Flat Minima Perspective on Understanding Augmentations and Model Robustness [4.3] モデル強化がモデル堅牢性をいかに高めるかを明らかにするため、統一的な理論フレームワークを提供する。
我々の研究は従来の研究から、我々の分析が既存の増補手法の多くを幅広く包含しているという点で分岐している。
我々は、既存の共通汚職と敵対的堅牢性ベンチマークのシミュレーションを通じて、我々の理論を裏付ける。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:40:44 GMT)
A Gibbs Sampler for Efficient Bayesian Inference in Sign-Identified SVARs [4.2] 我々は,符号制限で同定された構造ベクトル自己回帰に基づく新しい推論アルゴリズムを開発した。
楕円スライスサンプリングをギブスサンプリング手法に組み込むことで,速度が劇的に向上することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:22:00 GMT)
Category-aware EEG image generation based on wavelet transform and contrast semantic loss [4.2] 本稿では、離散ウェーブレット変換(DWT)とゲーティング機構を統合したトランスフォーマーベースのEEG信号エンコーダを提案する。
このエンコーダは,脳波信号から視覚刺激に関連する特徴を抽出するために用いられる。
事前学習した拡散モデルにより、これらの特徴は視覚刺激に再構成される。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:24:58 GMT)
A Generalization Result for Convergence in Learning-to-Optimize [4.1] 機械学習を利用して最適化アルゴリズムを高速化する。
我々は,学習と最適化の収束を研究するための新しい証明ストラテジーを開発した。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:30:12 GMT)
Cross Entropy versus Label Smoothing: A Neural Collapse Perspective [4.1] 本稿では,強力な経験的・理論的枠組みであるNeural Collapse(NC)の観点から,スムースなラベル付けについて検討する。
まず、ラベルの平滑化で訓練されたモデルは、神経崩壊解に早く収束し、より強力な神経崩壊レベルに達することを実証的に示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:28:28 GMT)
The Relativity of Causal Knowledge [4.1] 人工知能の最近の進歩は、純粋に予測可能なシステムの限界を明らかにし、因果的および協調的推論へのシフトを要求する。
本稿では、構造因果モデル(SCM)が本質的に不完全であり、関係ネットワークに埋め込まれた主観的表現であることを示す因果知識の相対性について紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:40:23 GMT)
FACE: A Fine-grained Reference Free Evaluator for Conversational Recommender Systems [4.0] 本研究は,微細なアスペクトベースの会話評価手法であるFACEを提案する。
これは、レコメンデーション会話の多様なターンレベルおよび対話レベルの品質に対する評価スコアを提供する。
FACEは参照なしであり、人間の判断と強い相関を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:54:13 GMT)
Benchmarking Large Language Models for Cryptanalysis and Mismatched-Generalization [4.0] 大規模言語モデル(LLM)は、自然言語の理解と生成を変革した。
データセキュリティと暗号化にとって重要な領域である暗号解析は、まだLLM評価において徹底的に研究されていない。
我々は,様々な暗号アルゴリズムを用いて生成した暗号化テキストに対して,美術用LLMの暗号解析可能性を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:12:07 GMT)
Improving Reliability and Explainability of Medical Question Answering through Atomic Fact Checking in Retrieval-Augmented LLMs [4.0] 大型言語モデル (LLM) は医学的知識が豊富であるが、幻覚や不正確な引用の傾向にある。
Retrieval Augmented Generationのような現在の手法は、ソース文書の回答を根拠にすることで、これらの問題に部分的に対処する。
我々は,LLMの信頼性と説明可能性を高めるために,新しい原子ファクトチェックフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:33:07 GMT)
DEEPQUESTION: Systematic Generation of Real-World Challenges for Evaluating LLMs Performance [4.0] 私たちは、Bloomの分類に基づいて既存のデータセットを拡張するスケーラブルな自動化フレームワークであるDeepQuestionを紹介します。
我々は,高次タスクにおいて高い性能低下(最大70%の精度低下)を示し,深い推論において持続的なギャップを減らした。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:39:42 GMT)
Perturbation-based Effect Measures for Compositional Data [4.0] 本稿では,合成上の解釈可能な統計関数を定義する仮説データ摂動に基づくフレームワークを提案する。
摂動依存再パラメータ化を導出することにより, 摂動効果の平均を効率的に推定できることを示す。
シミュレーションおよび半合成データに基づいて提案した推定器を実証的に分析し,ニューヨークの学校やマイクロバイオームのデータに対する既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:54:58 GMT)
Interpretable Graph Learning Over Sets of Temporally-Sparse Data [3.9] 本稿では,不規則な時間信号の集合を学習するための新規かつ解釈可能なモデルであるグラフ混合付加ネットワーク(GMAN)を提案する。
本手法は, 病院内死亡予測のAUROCスコアが4ポイント上昇するなど, 現実的な医療課題における最先端性を実現する。
ノードレベル、グラフレベル、サブセットレベルの重要度を含むその解釈能力が、移行フェーズの検出と医学的洞察の獲得を可能にしていることを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:32:29 GMT)
"Dyadosyncrasy", Idiosyncrasy and Demographic Factors in Turn-Taking [3.9] 本研究は、アメリカ英語会話の大規模なデータセットを用いて、性別、年齢、教育、個人的要因がターンテイクをどのように形成するかを検討する(Fisher)。
性別と年齢は小さいが、女性話者と高齢者はわずかにオフセットが短い。
個人差は、強いイディオシントラティックとさらに強い「ダイアドシントラティック」コンポーネントによって引き起こされる、より大きな影響を与える。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:55:47 GMT)
Memory OS of AI Agent [3.9] 大きな言語モデル(LLM)は、固定されたコンテキストウィンドウと不十分なメモリ管理から重要な課題に直面します。
本稿では,AIエージェントの総合的かつ効率的なメモリ管理を実現するために,メモリオペレーティングシステム(MemoryOS)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:36:51 GMT)
Talking Transactions: Decentralized Communication through Ethereum Input Data Messages (IDMs) [3.8] 我々は、外部呼び出し者がスマートコントラクトと対話できるように設計されたトランザクションの入力データフィールドに焦点を当てる。
ユーザはこれらの入力データメッセージ(IDM)をピアツーピア通信に利用することができる。
発生ブロックから2024年2月(3134日)までのICMの大規模分析を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:47:13 GMT)
Multilingual Gloss-free Sign Language Translation: Towards Building a Sign Language Foundation Model [3.8] 手話翻訳は、手話(SL)ビデオを音声言語テキストに変換することを目的としている。
トークンレベルのSL識別と音声テキスト生成のための2つのCTC目的を持つ多言語グロスフリーモデルを提案する。
我々のモデルは10のSLをサポートし、1対1、多対1、多対多のSLTタスクを処理する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:47:44 GMT)
ECG-FM: An Open Electrocardiogram Foundation Model [3.8] 本稿では,ECG分析のためのオープン基盤モデルであるECG-FMについて述べる。
ECG-FMは、コントラストと生成的自己教師付き学習のハイブリッドアプローチを用いて事前訓練されたトランスフォーマーベースのモデルである。
我々は,ECG-FMがロバストで,ラベル効率が高く,機能的に識別可能であることを確認した。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:29:06 GMT)
CRScore++: Reinforcement Learning with Verifiable Tool and AI Feedback for Code Review [3.8] コードレビューコメント生成を改善するための強化学習(RL)には、構造化されていない出力を扱う必要がある。
我々は、主観的フィードバックと検証可能な信号の両方を活用するRLフレームワークであるCRScore++を提案する。
CRScore++は教師モデルから教師付き微調整とRL批判を組み合わせることで、より弱い学生モデルを改善することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:58:35 GMT)
AFLoRA: Adaptive Federated Fine-Tuning of Large Language Models with Resource-Aware Low-Rank Adaption [3.8] フェデレートされた微調整は、分散データを使用して下流タスクにファンデーションモデルを適用するための有望なアプローチとして現れている。
大規模言語モデルのための適応的で軽量なファインチューニングフレームワークであるAFLoRAを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:35:32 GMT)
LLMs Are Globally Multilingual Yet Locally Monolingual: Exploring Knowledge Transfer via Language and Thought Theory [3.8] 我々は、言語と思考理論による非英語から英語への移動を探求する。
本稿では,入力言語,内的認知プロセス,知識の関係を解析するL2T(Language-to-Thought)プロンプト戦略を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:47:25 GMT)
Diff-SPORT: Diffusion-based Sensor Placement Optimization and Reconstruction of Turbulent flows in urban environments [3.7] Diff-Sportは、都市環境における高忠実度流れの再構築と最適センサ配置のための拡散に基づくフレームワークである。
従来の数値法と比較して、Diff-SPORTは統計的および瞬時流の忠実さを維持しながら、大幅な高速化を実現している。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:41:50 GMT)
PathGene: Benchmarking Driver Gene Mutations and Exon Prediction Using Multicenter Lung Cancer Histopathology Image Dataset [3.7] 肺癌における遺伝子変異、変異サブタイプおよびそれらのエクソンの正確な予測は、パーソナライズされた治療計画と予後評価に重要である。
病理組織像と次世代シークエンシングレポートを組み合わせたPathGeneを収集した。
このマルチセンターデータセットは、全スライディングイメージをドライバ遺伝子変異状態、突然変異サブタイプ、エキソン、腫瘍突然変異負担(TMB)ステータスにリンクする。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:51:11 GMT)
VideoCAD: A Large-Scale Video Dataset for Learning UI Interactions and 3D Reasoning from CAD Software [3.7] VideoCADは、CAD操作の41K以上の注釈付きビデオ記録からなる大規模な合成データセットである。
VideoCADは、現実世界のエンジニアリングタスクのためのUIインタラクション学習において、桁違いに複雑なものを提供する。
プロの3D CADツールからのUIインタラクションの学習と,視覚的質問応答ベンチマークの2つの重要なダウンストリームアプリケーションについて述べる。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:39:52 GMT)
Low-Cost FlashAttention with Fused Exponential and Multiplication Hardware Operators [3.7] 我々は,指数関数とベクトル乗算の計算を融合した新しいハードウェア演算子を用いて,浮動小数点型FlashAttentionのカーネルの最適化に着目する。
提案されたExpMulハードウェアオペレータは、FlashAttentionベースのハードウェアアクセラレータの面積と電力コストを大幅に削減する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:32:39 GMT)
A Novel Discrete Memristor-Coupled Heterogeneous Dual-Neuron Model and Its Application in Multi-Scenario Image Encryption [3.7] 本研究は、MHDNN(Mmristive heterogeneous dual-neuron network)を離散的に導入する。
MHDNNの安定性は、初期条件と様々な神経パラメータに関して分析される。
数値シミュレーションは複雑な力学挙動を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:12:02 GMT)
Impact of Tuning Parameters in Deep Convolutional Neural Network Using a Crack Image Dataset [3.6] 深部畳み込みニューラルネットワーク(DCNN)の性能に及ぼす各種チューニングパラメータの影響について検討した。
最大値設定により、DCNNはアダムとタンのアクティベーションファンクオンの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:58:31 GMT)
Leveraging Knowledge Graphs and LLMs for Structured Generation of Misinformation [3.6] 本稿では,知識グラフ(KG)を構造的意味資源として活用し,偽三重項を生成する手法を提案する。
これらの三重項は、様々な信頼度を持つ誤情報文を生成する際に、大きな言語モデル(LLM)を導くのに使用される。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:29:10 GMT)
From the Pursuit of Universal AGI Architecture to Systematic Approach to Heterogenous AGI: Addressing Alignment, Energy, & AGI Grand Challenges [3.6] SAGIは、システム設計原則を利用して、エネルギーの壁とアライメントの課題を克服する、AIの体系的アプローチである。
システム設計は、AGIの目標と保証を達成し、古典的シンボリック、創発的、ハイブリッドなアプローチに取って代わる上で、より基本的なものである、と我々は主張する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:49:47 GMT)
GeoVision Labeler: Zero-Shot Geospatial Classification with Vision and Language Models [3.6] 厳密なゼロショット分類フレームワークであるGeoVision Labeler(GVL)を紹介する。
GVLはリッチで可読な画像記述を生成し、それをユーザ定義のクラスにマッピングする。
これは、SpaceNet v7のバイナリビルディング対ノービルディングタスクで最大93.2%のゼロショット精度を達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:32:37 GMT)
DLiPath: A Benchmark for the Comprehensive Assessment of Donor Liver Based on Histopathological Image Dataset [3.5] ドナー肝生検の総合的評価は、移植の可能性を受け入れるか破棄するために重要な情報を提供する。
門脈線維症, 総脂肪症, 巨胞性脂肪症, バルーン形成などのドナー肝生検の特徴は移植成績と相関する。
そこで本研究では,包括的ドナー肝アセスメントのための最初のベンチマークであるDLiPathを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:13:00 GMT)
Robust Distributed Estimation: Extending Gossip Algorithms to Ranking and Trimmed Means [3.5] 本研究では,大域的にロバストな数値を推定することにより,外乱平均を計算することができることを示す。
我々は,textscGoRankと呼ばれるランク推定のための新しいゴシップアルゴリズムを提案し,それを応用して,トリミング平均推定専用のゴシップ手順を設計する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:07:48 GMT)
Exploring the Impact of Occupational Personas on Domain-Specific QA [3.4] 本研究では, PBP (Professional Personality-Based Personas) とOPBP (Occupational Personality-Based Personas) の2つのタイプのペルソナを導入して, 専門的なQAパフォーマンスを高めるか分析する。
PBPは精度をわずかに向上できるが、OPBPはタスクに意味論的に関係していても性能を劣化させることがある。
本研究は,ペルソナ関連性だけでは効果的な知識利用を保証せず,最適な知識応用を妨げる認知的制約を課すことを示唆している。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:35:39 GMT)
Spurious Correlations and Beyond: Understanding and Mitigating Shortcut Learning in SDOH Extraction with Large Language Models [3.3] 大型言語モデル (LLM) は将来性を示しているが、表面的な手がかりに依存して、急激な予測を導いている。
アルコールや喫煙の言及は、誰もいない現在および過去における薬物使用を予測するために、モデルに誤った誘導を与える可能性があることを実証する。
我々は、これらの偽陽性を減らすために、迅速なエンジニアリングや連鎖推論などの緩和戦略を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:11:33 GMT)
Modelling bounded rational decision-making through Wasserstein constraints [3.3] 情報制約処理による有界な合理的意思決定をモデル化することは、原則化されたアプローチを提供する。
既存のアプローチは一般にエントロピー(Entropy)、Kulback-Leibler分散(Kullback-Leibler divergence)、相互情報(Mutual Information)に基づいている。
ワッサーシュタイン距離を利用した有界有理RLエージェントをモデル化するための代替手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:05:18 GMT)
A SHAP-based explainable multi-level stacking ensemble learning method for predicting the length of stay in acute stroke [3.3] 既存の機械学習モデルは、最適以下の予測性能、限定的な一般化可能性を示し、システムレベルの要因を見落としている。
我々は,虚血性脳梗塞と出血性脳梗塞に対する解釈可能な多段階重ねアンサンブルモデルを開発した。
説明可能なアンサンブルモデルは,虚血性脳卒中におけるLOSの延長を効果的に予測する。
出血性脳卒中にはさらなる検証が必要である。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:08:26 GMT)
Principles and Policy Recommendations for Comprehensive Genetic Data Governance [3.3] 遺伝データ収集はユビキタスになり、健康、祖先、社会的特性に関する遺伝情報を生み出している。
科学的理解の進展の中で 無規制の使用は 深刻なプライバシーと差別のリスクを引き起こす
ガバナンスシステムが保持しなければならない重要な価値を識別するリスクアセスメントフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:15:58 GMT)
Multi-Analyte, Swab-based Automated Wound Monitor with AI [3.2] 糖尿病性足潰瘍(DFU)は、米国だけでも毎年75万人に影響を及ぼす。
早期に慢性傷に進展する非治癒性DFUは、治療コストを大幅に削減し、切断のリスクを最小化する。
低コストでマルチアナライトな3Dプリントアッセイをスワブにシームレスに統合し,非癒しDFUを同定する。
創傷センサデータの制御と自動解析のための革新的なモバイルアプリケーションを開発した。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:42:37 GMT)
Train One Sparse Autoencoder Across Multiple Sparsity Budgets to Preserve Interpretability and Accuracy [3.2] 我々は,複数の空間レベルにわたる再建を同時に最適化するために,単一のSAEを訓練する新しいトレーニング目標であるemphHierarchicalTopKを導入する。
実験の結果,HierarchicalTopKは高頻度でも高い解釈可能性スコアを保っていることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:20:44 GMT)
Inference-Time Alignment of Diffusion Models with Evolutionary Algorithms [3.2] 進化的アルゴリズムに基づく推論時間アライメントフレームワークを提案する。
拡散モデルをブラックボックスとして扱い、それらの潜在空間を探索してアライメント目的を最大化する。
本手法は, 微分不可能なアライメント目的と微分不可能なアライメント目的の両方に対して, 効率的な推論時間アライメントを実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:14:31 GMT)
Reality Check: A New Evaluation Ecosystem Is Necessary to Understand AI's Real World Effects [3.1] 論文は、AIの間接的および二次的効果を測定するには、シリコで実施される静的な単一ターンアプローチを超えて拡張する必要がある、と論じている。
我々は、文脈認識を容易にし、下流の解釈とAIの二次効果に関する意思決定を可能にするデータと方法の必要性について説明する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:09:51 GMT)
Analysis of Pseudo-Labeling for Online Source-Free Universal Domain Adaptation [3.1] トレーニングデータとテストデータのシフトは、ディープニューラルネットワークの実際のパフォーマンスを妨げることが多い。
オンラインソースフリーユニバーサルドメイン適応(SF-UniDA)はこの課題に対処する。
既存の手法は主に擬似ラベルによる自己学習に依存しているが、擬似ラベルと適応結果の関係は研究されていない。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:22:51 GMT)
Robust Federated Learning against Model Perturbation in Edge Networks [3.1] シャープネスを考慮したロバストフェデレーション学習(SMRFL)を提案する。
SMRFLは、モデルランドスケープの幾何学的性質を探索することにより、摂動に対するモデルロバスト性を改善することを目的としている。
SMRFLは3つのベースライン法と比較して摂動に対する頑健さを著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:52:05 GMT)
Entropic Risk Optimization in Discounted MDPs: Sample Complexity Bounds with a Generative Model [3.1] 我々は、割引マルコフ決定プロセス(MDP)において、最適状態-作用値関数$Q*$と最適ポリシー$pi*$を学習する際のサンプル複雑度を解析する。
我々は、モデルに基づくリスクに敏感な$Q$-value-iteration (MB-RS-QVI) と呼ばれる単純なモデルベースアプローチを提案し、分析する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:27:57 GMT)
ZOGRASCOPE: A New Benchmark for Semantic Parsing over Property Graphs [3.1] プロパティグラフ(PG)は、複雑な構造化情報を表現する手段として採用されている。
業界での人気が高まっているにもかかわらず、PGはセマンティックパーシング研究において相対的に過小評価されている。
PGとCypherで書かれたクエリに特化して設計されたベンチマークであるZOGRASCOPEを紹介する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:02:52 GMT)
Beyond FACS: Data-driven Facial Expression Dictionaries, with Application to Predicting Autism [3.0] 顔面行動符号化システム(FACS)は、顔の行動と精神健康との関係を調べるために多くの研究で用いられている。
30年間にわたる激しい努力にもかかわらず、多くのアクションユニットの検出精度は行動研究に必要なしきい値を下回っていると考えられている。
本稿ではFACSの重要な特性を模倣する新しい符号化方式を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:06:01 GMT)
A Novel Coronary Artery Registration Method Based on Super-pixel Particle Swarm Optimization [3.0] 本研究では,Swarm最適化アルゴリズムに基づく新しい多モード冠状動脈画像登録法を提案する。
PCIを施行した10例のXRAおよびCTA画像28対のパイロットデータセットを用いて,本アルゴリズムの評価を行った。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:44:46 GMT)
From Pixels to Camera: Scaling Superconducting Nanowire Single-Photon Detectors for Imaging at the Quantum-Limit [3.0] 超伝導ナノワイヤ単光子検出器(SNSPD)は、光子検出の境界を前例のない感度、超高タイミング精度、幅広いスペクトル応答で押し上げる重要なデバイスとして登場した。
材料工学、超伝導エレクトロニクスの統合、低温システム設計の最近の進歩は、SNSPDをスケーラブルなアレイや大型の単一光子時間タギングカメラへと進化させることを可能にしている。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:48:11 GMT)
Curate, Connect, Inquire: A System for Findable Accessible Interoperable and Reusable (FAIR) Human-Robot Centered Datasets [3.0] ロボット工学におけるAIの急速な成長は、高品質で再利用可能なデータセットの必要性を増幅した。
この分野におけるオープンデータの状況は、キュレーション標準の欠如と一貫した出版慣行のために不均一である。
本稿では,2つの主要なコントリビューションを持つキュレーションとアクセスシステムを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:48:32 GMT)
Weisfeiler and Leman Follow the Arrow of Time: Expressive Power of Message Passing in Temporal Event Graphs [3.0] 時間的グラフにおける時間的参照パスの時間的展開表現を利用する一貫したイベントグラフ同型の概念を導入する。
本稿では,時間グラフのイベントグラフ表現に基づく時間グラフニューラルネットワークのための新しいメッセージパッシング方式を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:20:30 GMT)
Interactive OT Gym: A Reinforcement Learning-Based Interactive Optical tweezer (OT)-Driven Microrobotics Simulation Platform [2.9] Interactive OT Gymは、OT駆動のマイクロロボティクス用に設計された強化学習(RL)ベースのシミュレーションプラットフォームである。
我々のプラットフォームは、複雑な物理場シミュレーションをサポートし、触覚フィードバックインタフェース、RLモジュール、コンテキスト対応の共有制御戦略を統合する。
高い忠実度、対話性、低コスト、高速なシミュレーション機能により、Interactive OT Gymはユーザフレンドリーなトレーニングおよびテスト環境として機能する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:45:21 GMT)
Looking for Attention: Randomized Attention Test Design for Validator Monitoring in Optimistic Rollups [2.9] 本稿では、最適ロールアップ(ORU)におけるバリデータに対する確率論的挑戦を目的とした新しいプロトコルであるランダム化注意テスト(RAT)を紹介する。
我々のゲーム理論分析は、すべてのバリデータに注意を払い、提案者が正直な理想的なセキュリティ均衡をRATで達成できることを実証している。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:24:09 GMT)
QGAN-based data augmentation for hybrid quantum-classical neural networks [2.9] 我々は、量子生成逆数ネットワーク(QGAN)とハイブリッド量子古典ニューラルネットワーク(HQCNN)を統合し、拡張フレームワークを開発する。
MNISTデータセットのシミュレーション実験により、QGANは従来のデータ拡張手法や古典的なGANよりも優れていることが示された。
これはQGANがモデルを単純化し、高品質なデータを生成し、HQCNNの精度と性能を向上させることを示唆している。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:42:31 GMT)
Model-Guided Network with Cluster-Based Operators for Spatio-Spectral Super-Resolution [2.9] 論文は、低分解能マルチスペクトル観測から高分解能ハイパースペクトル像を再構成する問題に対処する。
本稿では,共同分光超分解能問題を空間超分解能,スペクトル超分解能,融合タスクに明示的に分解するエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:54:47 GMT)
Sample-optimal learning of quantum states using gentle measurements [2.9] ここでは、有限次元量子系上の$alpha-$locally-gentle測定(alpha-$LGM)のクラスを紹介する。
我々は、関係性と量子微分プライバシーの優しさを改善した量子データ処理不等式(qDPI)をこのクラスで証明する。
量子ラベルスイッチ(quantum Label Switch)と呼ばれる,これらのバウンダリを実現するために,$alpha-$LGMを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:34:11 GMT)
Sparsity-Driven Parallel Imaging Consistency for Improved Self-Supervised MRI Reconstruction [2.8] 本稿では,PD-DLネットワークを慎重に設計した摂動を用いてトレーニングする方法を提案する。
提案手法は,アーティファクトのエイリアスを効果的に低減し,高加速速度での雑音増幅を緩和することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:11:25 GMT)
A Global Dataset Mapping the AI Innovation from Academic Research to Industrial Patents [2.8] DeepInnovationAIは3つの構造化ファイルを含む包括的なグローバルデータセットである。
DeepInnovationAIは、研究者、政策立案者、業界リーダーがトレンドを予測し、コラボレーションの機会を特定することを可能にする。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:55:05 GMT)
Harnessing Foundation Models for Robust and Generalizable 6-DOF Bronchoscopy Localization [2.8] 視覚に基づく6-DOF気管支鏡の局所化は、正確で費用対効果の高い介入誘導のための有望なソリューションを提供する。
既存の方法では,1)ラベル付きデータ不足による患者全体の一般化の制限,2)視覚的劣化による堅牢性の低下に苦慮している。
気管支鏡の局所化フレームワークであるPANSv2を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:14:12 GMT)
HiLDe: Intentional Code Generation via Human-in-the-Loop Decoding [2.8] 本稿では,コード生成中のLCM決定を観察・直接的に影響を与える新しいインタラクション技術であるHuman-in-the-loop Decodingを提案する。
我々はこの手法を,LLMが決定する重要な決定を強調し,ユーザが探索するローカルな代替手段を提供するコード補完アシスタントであるHiLDeに実装する。
セキュリティ関連のタスクに関する調査(N=18)では、HiLDeが参加者に重大な脆弱性を発生させ、コード生成と目標の整合性を向上させたことが分かりました。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:45:49 GMT)
GNNBleed: Inference Attacks to Unveil Private Edges in Graphs with Realistic Access to GNN Models [2.7] 本稿では,敵がターゲットGNNモデルへのブラックボックスアクセスしか持たない状況下でのエッジプライバシについて検討する。
本稿では,GNNのメッセージパッシング機構を利用した攻撃について述べる。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:00:25 GMT)
SWIFT: Mapping Sub-series with Wavelet Decomposition Improves Time Series Forecasting [2.7] $textitSWIFT$は軽量モデルで、強力だが、長期の時系列予測のデプロイメントと推論にも効率的である。
我々は包括的実験を行い、この結果から、textitSWIFT$が複数のデータセット上での最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:30:41 GMT)
DiG-Net: Enhancing Quality of Life through Hyper-Range Dynamic Gesture Recognition in Assistive Robotics [2.6] ロボット工学に特化して設計された新しいアプローチを導入し,最大30mの距離で動的ジェスチャー認識を実現する。
提案手法では,DADAブロックと時空間グラフモジュールを効果的に組み合わせ,距離対応ゲスチャネットワーク(DiG-Net)を提案する。
かなりの距離からジェスチャーを効果的に解釈することにより、DiG-Netは在宅医療、産業安全、遠隔支援シナリオにおける補助ロボットのユーザビリティを著しく向上させる。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:47:44 GMT)
KairosAD: A SAM-Based Model for Industrial Anomaly Detection on Embedded Devices [2.6] 画像に基づく異常検出にMobile Segment Anything Model(MobileSAM)のパワーを利用する新しい教師付きアプローチであるKairosADを提案する。
その結果,KairosADではパラメータが78%少なくなり,最先端のモデルに比べて推論時間が4倍速くなった。
カイロスADはヴェローナ大学のインダストリアル・コンピュータ・エンジニアリング・ラボ(ICE Lab)の実際の生産ラインに設置および試験に成功している。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:18:49 GMT)
AutoChemSchematic AI: A Closed-Loop, Physics-Aware Agentic Framework for Auto-Generating Chemical Process and Instrumentation Diagrams [2.6] 現在のAI手法では、化学プロセスのスケーリングにおいて重要な役割を担っているにもかかわらず、PFDやPIDを自動生成することはできない。
産業用PFDとPIDの自動生成のための閉ループ対応物理フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:32:00 GMT)
Domain Pre-training Impact on Representations [2.5] 事前学習を通じてのみ誘導される表現品質に焦点をあてる。
実験により,小型の特殊コーパスによる事前学習が効果的に表現できることが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:42:43 GMT)
In Dialogue with Intelligence: Rethinking Large Language Models as Collective Knowledge [2.5] 大規模言語モデル(LLM)は通常、アーキテクチャ、振る舞い、トレーニングデータレンズを通して分析される。
この記事では、理論的かつ経験的再フレーミングについて述べる。 LLMs as dynamic instantiations of Collective Human Knowledge (CK)。
そこで我々は,創発的対話パターン,微調整の意味,協調の概念,人間と機械の認知の相互強化について検討した。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:31:58 GMT)
Dynamic Classification: Leveraging Self-Supervised Classification to Enhance Prediction Performance [2.3] 本稿では,ゼロミス検出と最小偽陽性を実現することを目的とした,革新的な動的分類アルゴリズムを提案する。
このアルゴリズムはデータを自己教師付き学習生成方式で分割し、モデルがトレーニングセットから学習できるようにする。
実験結果から,データ分割誤差が最小限であれば,アルゴリズムは例外的な性能を達成できることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:55:34 GMT)
Attribute-Based Authentication in Secure Group Messaging for Distributed Environments [2.3] メッセージ層セキュリティ(MLS)とその基盤となるContinuous Group Key Agreementプロトコルは、暗号化シークレットを動的に共有することを可能にする。
グループ内の認証のためのデジタル証明書の使用は、グループメンバーのプライバシーに反する。
本報告では,ソリケータが自身のアイデンティティを明らかにする代わりに,特定の属性の所有を証明するだけでよい,別の認証方法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:25:00 GMT)
Interpreting Large Text-to-Image Diffusion Models with Dictionary Learning [2.2] Sparse Autoencoders (SAEs) と Inference-Time Decomposition of Activation (ITDA) をテキスト・画像拡散モデル Flux 1 に適用する。
SAEは、残りのストリーム埋め込みを正確に再構築し、解釈可能性でニューロンを打ち負かす。
私たちはITDAがSAEに匹敵する解釈性を持っていることに気付きました。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:53:27 GMT)
Beyond Atomic Geometry Representations in Materials Science: A Human-in-the-Loop Multimodal Framework [2.2] MultiCrystalSpectrumSet(MCS-Set)は、原子構造と2Dプロジェクションと構造化テキストアノテーションを統合することで、材料データセットを拡張するキュレートされたフレームワークである。
MCS-Setは,(1)マルチモーダル特性と要約予測,(2)部分クラスタ管理による制約結晶生成の2つの重要なタスクを実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:18:42 GMT)
TESTQUEST: A Web Gamification Tool to Improve Locators and Page Objects Quality [2.2] TestQUESTは、ロケータとページオブジェクトに適用することで、テストの堅牢性を改善するために設計されたツールである。
ロケータは、迅速なソフトウェア進化によるWebページ構造の頻繁な変化に非常に敏感です。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:18:10 GMT)
Analyzing limits for in-context learning [2.1] インコンテキスト学習(ICL)は、基本的な振る舞いを明らかにするための制御された設定として関数正規化タスクに焦点を当て、スクラッチから訓練されたトランスフォーマーモデルである。
我々は、変圧器モデルが正規化(非線型)関数の未確認クラスを一般化し近似することができることを実証的に示すが、それらは特定の値を超える一般化はできない。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:55:14 GMT)
When Humans Growl and Birds Speak: High-Fidelity Voice Conversion from Human to Animal and Designed Sounds [2.1] 人間から非人間への音声変換(H2NH-VC)は、人間の音声を動物や設計された発声に変換する。
我々は,前処理パイプラインと改良されたCVAEベースのH2NH-VCモデルを導入する。
実験の結果,提案手法は品質,自然性,類似性MOSのベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:24:41 GMT)
Localized LoRA: A Structured Low-Rank Approximation for Efficient Fine-Tuning [2.1] 局所化LoRAは、重み行列の構造ブロックに適用された低ランク近似の合成として重み更新をモデル化するフレームワークである。
提案手法は,一致したパラメータの予算下での低い近似誤差を連続的に達成することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:13:23 GMT)
Black-box Adversarial Attacks on CNN-based SLAM Algorithms [2.1] GCN-SLAMアルゴリズムに入力されたRGB画像にブラックボックスの逆数を適用する。
適度なスケールの攻撃でさえ、フレームの76%で障害を追跡する可能性がある。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:41:38 GMT)
Alternate Groundwater Modelling Strategies: A Multi-Faceted Data-Driven Approach [2.1] 本稿は, 研究者の早期処分における, 実際に行われている統計的方法論の検証に焦点をあてる。
従来の時系列モデルと現代のニューラルネットワークは、このドメインで一般的に利用可能なデータから実行可能な予測を分析および作成するための実行可能な選択肢となり得る。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:51:13 GMT)
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework [2.0] 本稿では,ラベル値をエネルギー強度レベルにマッピングする全ラベルおよびトレーニングセットラベル回帰法を提案する。
これにより、マイクロ感情検出とアノテーションのための感情量子化ネットワーク(EQN)フレームワークが確立された。
EQNフレームワークは、エネルギーレベルスコアで自動マイクロ感情アノテーションを実現する最初のフレームワークである。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:44:12 GMT)
Don't Erase, Inform! Detecting and Contextualizing Harmful Language in Cultural Heritage Collections [2.0] 我々は,文化遺産(CH)メタデータにおける攻撃的用語を検出するAIツールを開発した。
我々は、コミュニティ、研究者、およびCH専門家と共同で作られた多言語語彙を活用している。
このツールは790万以上のレコードを処理し、メタデータで検出された競合する用語をコンテキスト化している。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:44:54 GMT)
Bias Beware: The Impact of Cognitive Biases on LLM-Driven Product Recommendations [1.9] 我々は,ブラックボックスの敵対的戦略としての認知バイアスについて検討し,それらが大規模言語モデルに与える影響と人間の購買行動とを対比した。
社会的証明のような偏見はプロダクトの推薦率やランキングを継続的に向上させ、希少性や排他性など他のバイアスは驚くほど視界を低下させます。
以上の結果から,認知バイアスは最先端のLCMに深く埋め込まれており,製品レコメンデーションにおいて極めて予測不能な行動をもたらすことが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:51:36 GMT)
HESEIA: A community-based dataset for evaluating social biases in large language models, co-designed in real school settings in Latin America [1.9] HESEIAは専門的な開発コースで作成された46,499の文のデータセットである。
それは、生きた経験と教育者の教育的専門知識を通して、地域の文脈を反映している。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:32:48 GMT)
Searching Clinical Data Using Generative AI [1.8] 本稿では,臨床データの検索精度と効率を高めるために,検索AIと呼ばれる生成AIアプローチを提案する。
医療専門家は典型的には、関連疾患、薬物、または多くのコードにマッピングされる状態の集団を探索する。
SearchAIはこれらの階層を予測的にナビゲートし、関連するノードを失うことなく、すべてのパスが到達可能であることを保証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:33:51 GMT)
Interpretable phenotyping of Heart Failure patients with Dutch discharge letters [1.8] 本研究は左室エジェクション分画(LVEF)に基づく表現型心不全(HF)患者のモデルについて検討した。
この研究は、2015年から2023年までアムステルダムUMC病院(AMCとVUmc)におけるすべてのHF入院を分析した。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:11:32 GMT)
DeepBoost-AF: A Novel Unsupervised Feature Learning and Gradient Boosting Fusion for Robust Atrial Fibrillation Detection in Raw ECG Signals [1.8] 心房細動(英: atrial fibrillation, AF)は、健康リスクの上昇に伴う心臓不整脈である。
本研究では、教師なし深層学習と勾配促進モデルを統合してAF検出を改善する革新的なハイブリッド手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:08:56 GMT)
Towards a unified user modeling language for engineering human centered AI systems [1.7] AIベースの会話エージェントのような、インテリジェントなユーザーインターフェースの新しい波は、そのようなパーソナライズを可能にする可能性がある。
本稿では,従来のアプローチを一つの提案で組み合わせることを目的とした統合ユーザモデリング言語の概念を提案する。
言語を用いてモデル化されたユーザプロファイルを利用して会話エージェントを自動的に適応する概念実証が開発された。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:20:15 GMT)
Investigating the effectiveness of multimodal data in forecasting SARS-COV-2 case surges [1.7] 新型コロナウイルス(COVID-19)のパンデミック対応は、ケースの頻度や死亡率などの重要な結果を予測するために、統計モデルと機械学習モデルに大きく依存した。
既存のほとんどのモデルは、伝統的な疫学データに基礎を置いているが、ゲノム情報や人間の行動から派生したデータセットの可能性を未発見のまま残している。
本研究は, 生物(突然変異など), 公衆衛生(事例数, 政策介入など), 人間の行動特性(移動性, ソーシャルメディアの会話など)の相対的効果を, 国レベルでのケースサージの予測において強調した。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:18:00 GMT)
Beyond Linear Steering: Unified Multi-Attribute Control for Language Models [1.7] K-ステアリング(K-Steering)は、隠れたアクティベーションに対して単一の非線形マルチラベル分類器を訓練する統一的で柔軟なアプローチである。
これにより、線形性の仮定を回避し、別個のベクトル属性の保存とチューニングの必要性を排除し、再トレーニングなしに振る舞いの動的構成を可能にする。
アクティベーションに基づく分類器とLCMに基づく判定器の両方で検証された3つのモデルファミリーにおける実験結果から、K-ステアリングは複数の動作を正確に操る上で、強いベースラインより優れていることが証明された。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:41:19 GMT)
Evaluation of LLMs for mathematical problem solving [1.7] 大規模言語モデル(LLM)は、様々な教育課題において優れた性能を示してきたが、数学的な問題を解く可能性についてはまだ検討されていない。
我々は,GPT-4o,DeepSeek-V3,Gemini-2.0の3つの数学データセットを比較した。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:37:37 GMT)
Bayesian Data Sketching for Varying Coefficient Regression Models [1.7] 本研究では, 様々な係数モデルに対するベイジアンデータスケッチを導入し, 大きなサンプルサイズで表される計算課題を回避した。
提案手法は,大規模関数型データを解析するための既存手法と相違する。
圧縮されたデータに様々な係数回帰モデルの確立された方法とアルゴリズムを適用することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:09:06 GMT)
Fine-Tune an SLM or Prompt an LLM? The Case of Generating Low-Code Workflows [1.6] 現実世界のアプリケーションのための微調整の小さな言語モデル(SLM)は、もはや明確ではないかもしれない。
我々は、低符号を生成するタスクにおいて、SLMの微調整とLCMのプロンプトを比較した。
適切なプロンプトが妥当な結果をもたらす一方で、微調整は品質を平均で10%向上させる。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:59:35 GMT)
LesionDiffusion: Towards Text-controlled General Lesion Synthesis [1.6] 3次元CT画像のためのテキスト制御可能な病変合成フレームワークLesionDiffusionを提案する。
本モデルでは, 病変の属性を制御し, より広範囲な病変タイプをサポートする。
今回,8臓器に14種類の病変を網羅した1,505個のCTスキャンと2対の病変マスクと構造報告のデータセットを紹介した。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:42:11 GMT)
Digital twins enable full-reference quality assessment of photoacoustic image reconstructions [1.6] 非参照画像の品質測定は不十分な場合が多いが、フル参照は理想的な参照画像へのアクセスを必要とする。
組織模倣ファントムの数値デジタル双対とイメージングシステムを用いて定量的キャリブレーションを行うことにより,この問題に対処する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:25:36 GMT)
What do professional software developers need to know to succeed in an age of Artificial Intelligence? [1.6] ジェネレーティブAIは、ソフトウェア開発者にとって生産性向上の初期の証拠を見せている。
我々は、AIの使用の最先端にいる21人の開発者による研究について述べ、彼らが発見した12の作業目標と75の関連するタスク、それぞれに関するスキルと知識をまとめています。
私たちは、成功するAI開発者になるためのスキルと知識が、4つのドメインにまとめられていることに気づきました。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:14:03 GMT)
Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks [1.6] 言語間の移動により、モデルはトレーニング中に目に見えない言語でタスクを実行することができる。
本研究は,多言語学習が効果的な伝達に必要でもなく,本質的に有益ではないことを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:36:20 GMT)
An Independent Discriminant Network Towards Identification of Counterfeit Images and Videos [1.5] オンラインプラットフォーム上での偽画像やビデオの急速な拡散は、新たな問題だ。
この作業では、GAN生成した画像や動画を識別できる独立した識別ネットワークを使用する。
InceptionResNetV2に基づく畳み込みニューラルネットワークを用いて、識別ネットワークが作成されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:44:16 GMT)
Quantum DeepONet: Neural operators accelerated by quantum computing [1.5] 本稿では,DeepONet評価の高速化に量子コンピューティングを活用することを提案する。
我々は,反微分演算子,対流方程式,バーガース方程式など,様々なPDEを用いて量子DeepONetをベンチマークする。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:44:01 GMT)
Bridging 3D Anomaly Localization and Repair via High-Quality Continuous Geometric Representation [1.5] 新しいフレームワークは、連続的なポーズ不変の形状表現を学習することで、3D異常の検出と修復を統合する。
Real3D-ADとAnomaly-ShapeNetの実験は最先端の性能を示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:11:49 GMT)
Disturbance-based Discretization, Differentiable IDS Channel, and an IDS-Correcting Code for DNA Storage [1.4] 本稿では,複雑なIDSチャネルに対して,IDS訂正符号を効率よく生成することを目的とした,自動エンコーダベースのアプローチ THEA-codeを提案する。
オートエンコーダの特徴を識別するために, 外乱に基づく離散化を提案する。
擬似微分可能なIDSチャネルは、IDS操作の微分可能な代替手段として開発されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:58:27 GMT)
Shuffle PatchMix Augmentation with Confidence-Margin Weighted Pseudo-Labels for Enhanced Source-Free Domain Adaptation [1.4] 本研究では、モデルがソースデータにアクセスせずにターゲットドメインに適応する、ソースフリードメイン適応(SFDA)について検討する。
新たな拡張手法であるShuffle PatchMix (SPM) を導入し,性能向上を図る。
最先端の結果は、PACS、VisDA-C、DomainNet-126の3つの主要なベンチマークで達成されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:02:42 GMT)
GATE: General Arabic Text Embedding for Enhanced Semantic Textual Similarity with Matryoshka Representation Learning and Hybrid Loss Training [1.4] General Arabic Text Embedding (GATE) モデルはMTEBベンチマークのセマンティックテキスト類似性タスクで最先端のパフォーマンスを達成する。
Gateは、STSベンチマークで20-25%のパフォーマンス改善により、OpenAIを含むより大きなモデルを上回っている。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:29:03 GMT)
Applying Vision Transformers on Spectral Analysis of Astronomical Objects [1.4] 我々は、SDSSとLAMOSTによる数百万のスペクトルを用いて、ImageNetで事前訓練されたViTを微調整し、スペクトルプロットとして表現する。
我々は、Support Vector MachinesやRandom Forestsよりも高い分類精度を実現し、AstroCLIPのスペクトルエンコーダに匹敵するR2$の値を得る。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:53:45 GMT)
Learning API Functionality from Demonstrations for Tool-based Agents [1.3] ドキュメンテーションのないシナリオに適用可能な新しいパラダイムとして,デモから直接API機能を学ぶことを提案する。
実演回数とLCM生成サマリーの使用と評価が,APIベースのエージェントのタスク成功率にどのように影響するかを検討する。
明示的な関数呼び出しと自然言語の批判を提供することで、より正確なパラメータの充足によりエージェントのタスク成功率が大幅に向上することがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:17:09 GMT)
Eye of Judgement: Dissecting the Evaluation of Russian-speaking LLMs with POLLUX [1.3] POLLUXは、ロシア語で大規模言語モデル(LLM)の生成能力を評価するために設計されたベンチマークである。
各タスクタイプについて、一連の詳細な基準を定義し、スコアリングプロトコルを開発する。
これにより、従来のリソース消費による人的比較を超えて、透過的で基準駆動的な評価が可能になる。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:08:17 GMT)
So, I climbed to the top of the pyramid of pain -- now what? [1.3] Humal Layer Kill Chainは、人間の心理学と行動を統合して、サイバー脅威の分析を行う。
人層とサイバーキラーチェインを組み合わせることにより,社会技術キルプレーンを提案する。
この枠組みは、サイバーセキュリティの専門家が敵の方法を理解するのを助けるだけでなく、非技術要員が脅威の識別と対応を行うよう権限を与える。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:09:03 GMT)
Overcoming Sparsity Artifacts in Crosscoders to Interpret Chat-Tuning [1.3] クロスコーダは、ベースモデルと微調整モデルの両方において遅延方向として表される解釈可能な概念の共用辞書を学習する、最近のモデル微分法である。
両モデルに実際に存在するとき,概念を微調整モデルに固有のものと誤帰できるクロスコーダL1のトレーニング損失に起因する2つの問題を同定する。
BatchTopKの損失でクロスコーダをトレーニングし、これらの問題を大幅に軽減し、より真にチャット特化され、高度に解釈可能な概念を見つけます。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:15:11 GMT)
On Fairness of Task Arithmetic: The Role of Task Vectors [1.2] 本研究では,タスクベクトルの操作が,復号化パリティや等化オッドなどの公平度指標に与える影響について検討する。
本研究は, モデル編集の公正性に関する新たな知見を提供し, 公平性を意識し, 責任あるモデル編集実践の基盤を確立するものである。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:34:01 GMT)
Smartphone-Based Food Traceability System Using NoSQL Database [1.2] 本研究では、RFID技術とスマートフォンセンサを利用した安価なスマートフォンベースの食品トレーサビリティシステム(FTS)を提案する。
スマートフォンベースのRFIDリーダーは製品を追跡し、センサーは温度、湿度、そして保存および輸送中の位置をモニターする。
システムは韓国のキムチサプライチェーンで評価され、管理者と消費者の両方にリアルタイムのデータを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:31:24 GMT)
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options [1.2] フロー・オブ・オプティオン(FoO)は大規模言語モデル(LLM)の固有バイアスに対処する
FoOは圧縮および解釈可能なタスク表現を通じてLLMソリューションの多様性を強制する。
全体的な運用コストはタスクあたり1ドル以下なので、当社のフレームワークはコストに敏感なアプリケーションに適しています。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:56:47 GMT)
Entanglement for Pattern Learning in Temporal Data with Logarithmic Complexity: Benchmarking on IBM Quantum Hardware [1.2] 時系列予測は、気候モデリングから分子動力学まで、科学的および技術的領域の基礎となっている。
時間的依存関係を学習するために、絡み合いに基づくパラメータ化量子回路を利用する量子ネイティブ時系列予測フレームワークを提案する。
数値天気予報に使用される測地的高さ場を含む,合成および実世界のデータセットの古典的モデルに対して,QTSをベンチマークする。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:16:08 GMT)
Writing-Zero: Bridge the Gap Between Non-verifiable Problems and Verifiable Rewards [1.2] 我々は、検証不可能なタスクと検証可能な報酬のギャップを埋める統一的なRLVRベースのトレーニングパラダイムを提案する。
本稿では,GenRMとBootstrapped Relative Policy Optimization (BRPO)アルゴリズムを提案する。
提案手法は,LLMが微調整を監督せずに堅牢な書込み機能を開発する上で有効である。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:34:57 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。
モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。
3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:42:46 GMT)
Efficient Neural and Numerical Methods for High-Quality Online Speech Spectrogram Inversion via Gradient Theorem [1.1] 高品質を維持しながら、計算コストを大幅に削減する3つのイノベーションを紹介します。
まず,従来の技術よりも30倍小さい,たった8kパラメータのニューラルネットワークアーキテクチャを導入する。
第二に、レイテンシを1ホップサイズで増加させることで、神経推論ステップのコストをさらに半減できます。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:51:05 GMT)
Generalisation Bounds of Zero-Shot Economic Forecasting using Time Series Foundation Models [1.1] 本研究では,時系列基礎モデルのマクロ経済指標に対するゼロショット予測能力について検討した。
データスカース条件と構造破壊の下で、最先端の3つのTSFMをバックテストしました。
この結果から, TSFMは微調整がなければ, 安定した経済環境下での古典的モデルに適合し, 超過することができることが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:10:46 GMT)
Efficient Endangered Deer Species Monitoring with UAV Aerial Imagery and Deep Learning [1.1] 本稿では,無人航空機(UAV)と深層学習を用いた絶滅危惧種の自然生息地における検出について検討する。
最初のプロジェクト、パンターノ・プロジェクト(Pantano Project)はパラナデルタの沼地シカと、第2のプロジェクト、WiMoBoはカンポス・デル・トゥイウ国立公園のパンパスシカに焦点を当てている。
UAVキャプチャー画像から収集した広範囲なデータセットに基づいてトレーニングされたYOLOフレームワークを用いて、調整アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:09:48 GMT)
Detection of Endangered Deer Species Using UAV Imagery: A Comparative Study Between Efficient Deep Learning Approaches [1.1] 本研究では,UAV画像における湿地シカ検出のための最先端ニューラルネットワークの性能を比較した。
我々は、データセットに正確なセグメンテーションマスクを追加し、セグメンテーションヘッドを含むYOLOモデルのきめ細かいトレーニングを可能にした。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:45:42 GMT)
DrVD-Bench: Do Vision-Language Models Reason Like Human Doctors in Medical Image Diagnosis? [1.1] 臨床ビジュアル推論のための最初のベンチマークであるDrVD-Benchを提案する。
DrVD-Benchは、ビジュアルエビデンス、推論軌道評価、レポート生成評価の3つのモジュールで構成されている。
本ベンチマークでは,20のタスクタイプ,17の診断カテゴリ,CT,MRI,超音波,X線撮影,病理の5つの画像モダリティについて検討した。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:33:25 GMT)
Tensor Network for Anomaly Detection in the Latent Space of Proton Collision Events at the LHC [1.1] LHCにおける異常検出のためのテンソルネットワークに基づく手法を提案する。
本研究は, テンソルネットワークによる新物理発見の促進の可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:18:53 GMT)
Taxonomic Networks: A Representation for Neuro-Symbolic Pairing [1.1] 我々は、共通の知識表現を通してリンクされたニューラルおよびシンボリックなアプローチであるtextbfneuro-symbolic pairの概念を導入する。
本手法は,より少ないデータと少ない計算量でより効率的に分類網を学習し,高い資源を供給した場合に高い精度の分類網を発見できることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:48:34 GMT)
Evaluating the Contextual Integrity of False Positives in Algorithmic Travel Surveillance [1.0] 数百万人の乗客の基本的な権利に対する偽陽性の影響の可能性にもかかわらず、アルゴリズムによる旅行監視はEUにおいて合法である。
我々は,フィンランドの成人を対象に,航空旅行におけるアルゴリズムによる大量監視に対する態度を評価するために調査を行った。
驚いたことに、プライバシとセキュリティのトレードオフに直面した時、偽の正の数字でさえも正当だと見なされた。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:45:30 GMT)
Sorrel: A simple and flexible framework for multi-agent reinforcement learning [1.0] Sorrelは、新しいマルチエージェント強化学習環境の生成とテストのためのPythonインターフェースである。
本稿では,Sorrelの基本設計思想と特徴について概説する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:04:47 GMT)
SARD: A Large-Scale Synthetic Arabic OCR Dataset for Book-Style Text Recognition [1.0] SARDは、書籍スタイルのドキュメントをシミュレートするための、大規模で合成的に生成されたデータセットである。
6億9千万の単語を含む843,622の文書画像からなり、10の異なるアラビア語のフォントに散らばって、タイポグラフィーのカバー範囲を広く確保している。
スキャンされた文書から得られたデータセットとは異なり、SARDは現実世界のノイズや歪みをなくし、モデルトレーニングのためのクリーンで制御された環境を提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:47:54 GMT)
Parameterized Synthetic Text Generation with SimpleStories [1.0] 本稿では,英語と日本語のそれぞれ200万のサンプルからなる,シンプルな言語による大規模な合成物語データセットを提案する。
複数の抽象化レベルにおけるパラメータ化プロンプトにより,大規模にストーリー特性を制御できる。
私たちは、エンド・ツー・エンドのトレーニングプロセスを研究する新しい方法を実現するために、モデル作成のすべての構成要素をオープンソースにしています。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:50:03 GMT)
Tournament of Prompts: Evolving LLM Instructions Through Structured Debates and Elo Ratings [0.9] 我々は,エロの選考による議論駆動評価を通じて,進化を促す新しいフレームワークであるDEEVOを紹介する。
Eloの格付けをフィットネスプロキシとして利用することで、DEEVOは同時に改善を推進し、迅速な人口の貴重な多様性を保ちます。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:33:41 GMT)
LGAR: Zero-Shot LLM-Guided Neural Ranking for Abstract Screening in Systematic Literature Reviews [0.9] 体系的な文献レビューは、トピックに関するすべての関連論文を特定し評価することを目的としている。
現在までに、大型言語モデル(LLM)を用いた抽象的なスクリーニング手法はバイナリ分類設定に重点を置いている。
ゼロショットLLMガイド付き抽象ランクラであるLGARを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:18:50 GMT)
Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning [0.9] 本研究では,自己回帰学習と強化学習による大規模言語モデルの性能向上手法について検討する。
モデルに誤った回答をしたとき、より優れた自己回帰を生成するためのインセンティブを与えることで、複雑な検証可能なタスクを解くモデルの能力が向上できることを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:49:42 GMT)
SparQLe: Speech Queries to Text Translation Through LLMs [0.9] そこで本研究では,自己教師型音声表現と命令調整型LLMを併用して音声からテキストへの翻訳を行う手法を提案する。
実験により,本手法は入力音声の意味的内容を効果的に保存し,自己教師型音声モデルと命令調整型LLMの効果的なブリッジとして機能することが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:30:40 GMT)
What makes a good feedforward computational graph? [0.8] フィードフォワード計算グラフの望ましい性質について検討し、忠実度と混合時間という2つの重要な相補的尺度を探索する。
我々の研究は、様々なグラフに対するメトリクスの振る舞いに関する理論的分析と、これらのメトリクスをトレーニングされたニューラルネットワークモデルの性能に関連付けることの両方から裏付けられている。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:27:14 GMT)
Interactive Imitation Learning for Dexterous Robotic Manipulation: Challenges and Perspectives -- A Survey [0.8] 有害な操作は、ヒューマノイドロボティクスにおいて不可欠だが非常に複雑な課題である。
調査は、既存の学習に基づく巧妙な操作法、模倣学習、強化学習、ハイブリッドアプローチについてレビューする。
有望だが未発見の方向性はインタラクティブな模倣学習であり、人間のフィードバックはトレーニング中にロボットの行動を積極的に改善する。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:19:32 GMT)
Neuro-Symbolic Operator for Interpretable and Generalizable Characterization of Complex Piezoelectric Systems [0.8] 本稿では,ヒステリックな関係を規定する分析演算子を導出するニューロシンボリック・オペレーター・フレームワークを提案する。
複雑な圧電系の特徴付けに寄与し、ニューラル作用素の解釈性と一般化性を改善している。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:28:11 GMT)
MADCluster: Model-agnostic Anomaly Detection with Self-supervised Clustering Network [0.7] 自己教師付きクラスタリングを利用したモデルに依存しない異常検出フレームワークMADClusterを提案する。
中心となる考え方は、通常のパターンデータを'単一クラスタ'にクラスタ化すると同時に、クラスタセンタを学習し、このセンタに近いデータをマッピングすることです。
4つの時系列ベンチマークデータセットの実験では、MADClusterを適用することで、比較モデルの全体的なパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:40:45 GMT)
Can Large Language Models Address Open-Target Stance Detection? [0.7] Open-Target Stance Detection (OTSD) は、トレーニング中にターゲットが見つからず、入力として提供されない、最も現実的なタスクである。
GPT,Gemini,Llama,MistralファミリーからLarge Language Models(LLMs)を評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:14:47 GMT)
Consistent line clustering using geometric hypergraphs [0.7] ユークリッド空間において3ユニフォームハイパーグラフを用いて線をグループ化する方法を示す。
古典的ブロックモデルとは対照的に、この構成における潜在幾何学的制約はハイパーエッジ間の重要な依存関係をもたらす。
付加雑音のある平面上の交差線から発生するデータの正確かつほぼ正確に回復するための情報理論しきい値を導出する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:17 GMT)
CAE-Net: Generalized Deepfake Image Detection using Convolution and Attention Mechanisms with Spatial and Frequency Domain Features [0.7] クラス不均衡に対処し,アンサンブルベースのアーキテクチャであるemphCAE-Netを考案した。
私たちのアーキテクチャは、畳み込みと注目に基づくアンサンブルネットワークで構成されており、3つの異なるニューラルネットワークアーキテクチャを採用している。
EfficientNet B0アーキテクチャは90.79%、ConvNeXtアーキテクチャは89.49%、DeiTアーキテクチャは89.32%である。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:56:29 GMT)
Realistic quantum network simulation for experimental BBM92 key distribution [0.7] 我々は、多種多様な離散事象量子ネットワークシミュレータを用いて、絡み合いに基づくQKDプロトコルBBM92をシミュレートする。
実験的な実装が存在しないリピータ鍵分散シナリオにおいて、セキュアな鍵レートをシミュレートする。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:49:00 GMT)
Training-free zero-shot 3D symmetry detection with visual features back-projected to geometry [0.6] DINOv2のような基礎視覚モデルから視覚的特徴を利用するゼロショット3次元対称性検出のための訓練不要アプローチを提案する。
我々の研究は、基礎視覚モデルが対称性検出のような複雑な3次元幾何学的問題を解くのにどのように役立つかを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:09:18 GMT)
Supervised Quantum Machine Learning: A Future Outlook from Qubits to Enterprise Applications [0.6] Supervised Quantum Machine Learning (QML)は、量子コンピューティングと古典的な機械学習の共通点である。
本稿では, 量子回路, 量子ニューラルネットワーク, 量子カーネル法などの手法に着目し, 教師付きQMLの最近の展開を概観する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:29:12 GMT)
Supporting architecture evaluation for ATAM scenarios with LLMs [0.6] この研究は、ソフトウェアアーキテクチャコースの学生が提案する品質シナリオを分析するためのLLMツールとしてMS Copilotを研究している。
最初の研究は、LLMが品質シナリオのリスク、感度ポイント、トレードオフ分析に関して、ほとんどのケースにおいて、より正確で正確な結果を生み出すことを明らかにした。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:42:12 GMT)
TuRTLe: A Unified Evaluation of LLMs for RTL Generation [0.6] 本研究では,主要なRTL生成タスク間でLLMを評価するための統合評価フレームワークTuRTLeを提案する。
オープンLLMの多様なセットをベンチマークし、EDA固有のタスクの長所と短所を分析します。
以上の結果から,DeepSeek R1のような推論モデルの方が,複数の評価基準で常に優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:28:59 GMT)
Productionizing Quantum Mass Production [0.6] そこで本研究では,新しいQROMリソース状態のコピーを複数プリ計算することで,同一データロードオラクルへのシリアルコールのコストを低減できることを示す。
量子化学ハミルトニアンの固有値を推定するために、並列位相推定または最先端アルゴリズムの現実的固有値を利用するスキームを含む、量子質量生成のいくつかの応用について述べる。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:10:50 GMT)
Unsupervised Evolutionary Cell Type Matching via Entropy-Minimized Optimal Transport [0.5] 本稿では,エントロピー規則化最適輸送を利用した教師なし計算フレームワークOT-MESHを提案する。
OT-MESHは既知の進化的関係を正確に回復し、新しい対応を明らかにする。
我々のフレームワークは、進化的細胞型マッピングのための原則付き、スケーラブルで、対称で、解釈可能なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:20:00 GMT)
SwiftEval: Developing a Language-Specific Benchmark for LLM-generated Code Evaluation [0.5] SwiftEvalは、手作業による問題28件からなる最初のSwift指向のベンチマークで、44の人気のあるコードLLMを評価します。
その結果,LLMは言語固有の機能を必要とする問題に対して顕著なスコア低下を示し,より小型のモデルでは最も顕著であった。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:06:30 GMT)
Motivando el uso y aprendizaje de Bash a través de concursos de programación [0.5] コマンドライン学習とBashの利用は、システム管理、ソフトウェア開発、データサイエンス環境における基本的なスキルである。
我々は,実践的かつ競争的な課題を通じて,学生にBashスキルの向上を促す,インタラクティブなコンペティションを開発した。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:31:32 GMT)
Whispers of Many Shores: Cultural Alignment through Collaborative Cultural Expertise [0.5] 現在の大きな言語モデル(LLM)は、様々な文化的文脈に必要とされる曖昧な理解を欠いていることが多い。
我々は,効率的かつモジュール化された文化的アライメントを実現するための,新しいソフトプロンプト微調整フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:16:25 GMT)
Can LLMs Predict Citation Intent? An Experimental Analysis of In-context Learning and Fine-tuning on Open LLMs [0.5] 本研究では,Large Language Models (LLMs) を用いて,文脈内学習と微調整による引用意図の予測を行う。
0, 1-, few-, many-shot プロンプトを用いて, 5つの著名なオープン LLM ファミリーの12種類のモデル変動を評価した。
次に、このモデルを微調整し、SciCiteデータセットで8%、ACL-ARCデータセットで4.3%の相対的なF1スコア改善を実現し、タスク固有適応の意義を実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:17:22 GMT)
Efficient Adaptation For Remote Sensing Visual Grounding [0.5] 事前訓練されたモデルへの適応は人工知能の効果的な戦略となり、スクラッチからモデルのトレーニングにスケーラブルで効率的な代替手段を提供する。
本研究は, リモートセンシングにおけるPEFT技術の高効率かつ高精度なマルチモーダル解析への応用について述べる。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:02:07 GMT)
Dynamic Malware Classification of Windows PE Files using CNNs and Greyscale Images Derived from Runtime API Call Argument Conversion [0.4] 本稿では,Windows Portable Executable (PE)ファイルの実行時にAPI引数を抽出する動的マルウェア分類フレームワークを提案する。
実験の結果, 平均精度98.36%の手法は, マルウェアや良性の分類に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:48:10 GMT)
Grid-LOGAT: Grid Based Local and Global Area Transcription for Video Question Answering [0.4] 映像質問応答のためのグリッドベース地域・グローバル地域転写システム(Grid-LoGAT)を提案する。
視覚言語モデル(VLM)を用いたビデオフレームからのテキストテキストの抽出
次に、これらの書き起こしを用いて質問を処理し、Large Language Model (LLM) を通して回答を生成する。
そこで我々は,各グリッドセルから複雑な局所的詳細を抽出し,それらをグローバル情報と統合する,グリッドベースのビジュアルプロンプトを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:04:30 GMT)
Mid-circuit measurement as an algorithmic primitive [0.4] 我々は、量子位相推定(QPE)と中間回路の測定によって、変動量子アルゴリズムの性能が向上するかを評価する。
所望の結果が得られた場合、中間回路測定が低エネルギーフィルタとして機能することが実証された。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:00:03 GMT)
Cartan Networks: Group theoretical Hyperbolic Deep Learning [0.4] 本稿では,群準同型を計量保存微分同型にインターリーブした双曲型ディープラーニングアルゴリズムを提案する。
得られたアルゴリズムはCartan Networkと呼ばれ、様々なベンチマークデータセットで有望な結果を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:45:53 GMT)
A double selection entanglement distillation-based state estimator [0.4] 本研究では, 未蒸留状態のベル対角線パラメータを効率よく推定するために, 二重選択蒸留法のみを用いることを示した。
また, この新しい推定器は, 従来提案されていた蒸留法に基づく推定器よりも資源の複雑度が高いことを実証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:58:03 GMT)
Fidelity decay and error accumulation in random quantum circuits [0.4] 忠実度は、回路深さとアーキテクチャ依存のパワーに上昇する量子ビットの数の両方で指数関数的に減衰する。
量子ボリュームテストにおいて量子プロセッサをベンチマークするために用いられる重出力周波数と忠実度との間には、堅牢な線形関係が確立される。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:54:31 GMT)
A Survey on Self-supervised Contrastive Learning for Multimodal Text-Image Analysis [0.3] 近年のテキストイメージモデルにおけるコントラスト学習のアプローチの概要について述べる。
第3に、プロセスで使用されるテクニックの最新の進歩を紹介し、議論する。
テキスト画像に基づく自己教師付きコントラスト学習モデルの最近の技術応用について論じる。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:47:21 GMT)
Ethical AI: Towards Defining a Collective Evaluation Framework [0.3] 人工知能(AI)は医療、金融、自律システムといった分野を変えつつある。
しかし、その迅速な統合は、データ所有権、プライバシー、およびシステムバイアスに関する緊急の倫理的懸念を提起する。
本稿では,意味不明で解釈可能な単位のオントロジブロック上に構築されたモジュール型倫理的評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:10:47 GMT)
Are Optimal Algorithms Still Optimal? Rethinking Sorting in LLM-Based Pairwise Ranking with Batching and Caching [0.3] ペアワイズランキング(PRP)におけるアルゴリズム解析のための新しいフレームワークを提案する。
比較数に基づく古典的指標は、伝統的に効率を測るために用いられてきたが、我々の分析は、高価な推測がこれらの予測を覆すことを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:29:55 GMT)
A Decade of Wheat Mapping for Lebanon [0.3] 冬季のコムギ分割のための改良パイプラインを導入することにより,衛星画像から小麦畑を正確にマッピングする問題に対処する。
本手法は,コムギのセグメンテーションを精密なフィールド境界抽出と組み合わせることで,幾何的コヒーレントでセマンティックにリッチな地図を生成する。
この研究は、作物のモニタリングや収量推定など、様々な重要な研究と今後の進歩の基礎を築いた。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:57:42 GMT)
DeGLIF for Label Noise Robust Node Classification using GNNs [0.3] ノイズのあるラベル付きデータセットは、クリーンなラベル付きデータセットに比べて一般的に安価である。
DeGLIF:Left-One-Out Influence Functionを用いたグラフデータの復調手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:20:40 GMT)
RxRx3-core: Benchmarking drug-target interactions in High-Content Microscopy [0.3] RxRx3コアはRxRx3データセットのキュレートされ圧縮されたサブセットである。
わずか18GBのRxRx3コアは、大規模なHCSデータセットに関連するサイズバリアを大幅に削減する。
RxRx3コアは、736個のCRISPRノックアウトと1,674個の化合物を8濃度に分散した22,601枚の顕微鏡画像を含む。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:28:03 GMT)
Demonstration of a reconfigurable ground to space quantum networking scheme [0.3] 本稿では、大都市圏の量子ネットワークにおける衛星リンクの統合に適した再構成可能な量子ネットワークアーキテクチャを実験的に実証する。
ネットワークアーキテクチャは、衛星が範囲内になると、マルチポイント・ツー・ポイントトポロジで構成されるように設計されている。
5ノードネットワークにおいて,追加のリソースオーバーヘッドを伴わない偶然/偶然の比が増加することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:07:04 GMT)
Symmetry-deformed toric codes and the quantum dimer model [0.2] トリック符号(TC)ハミルトニアン(英語版)のガウス・ロー強制星項を体系的に分解することにより、トポロジカル秩序の対称性に基づく変形について検討する。
この "term-dropping" プロトコルは、対称性変形モデルにおける "ungauging" トポロジ的順序の代替の枠組みを超えて、グローバルな対称性を導入する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:00:01 GMT)
Studying and Improving Graph Neural Network-based Motif Estimation [0.2] グラフニューラルネットワーク(GNN)は,グラフ表現学習において主要な手法である。
ネットワークモチーフ重要度予測(SP)へのそれらの適用は未定であり、文献に定評のあるベンチマークは存在しない。
本稿では,SP推定をサブグラフ周波数推定に依存しないタスクとしてフレーミングすることで,この問題に対処することを提案する。
提案手法は,周波数カウントから直接SP推定へ移行し,マルチターゲット回帰として問題を変調する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:17:23 GMT)
Multi-criteria Rank-based Aggregation for Explainable AI [0.2] 本稿では,複数の品質指標を同時にバランスさせて説明モデルのアンサンブルを生成する,複数基準のランクに基づく重み付け集約手法を提案する。
公開されているデータセットの実験は、これらのメトリクスにわたって提案されたモデルの堅牢性を示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:02:59 GMT)
Automatic classification of stop realisation with wav2vec2.0 [0.2] wav2vec2.0モデルは英語と日本語の両方で高い精度でバースト存在を自動的に分類する訓練が可能であることを示す。
その結果,音声コーパスデータの自動アノテーションおよび処理ツールとして,事前学習音声モデルの可能性を実証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:54:35 GMT)
NbTiN Nanowire Resonators for Spin-Photon Coupling on Solid Neon [0.2] 固体ネオン上に浮かぶ電子は、長い電荷コヒーレンス時間を示す。
NbTiN超伝導ナノワイヤ共振器は電子オンネオン系と互換性がある。
単一量子ビットでは99.99%、2量子ビットでは99.9%を超えるスピン量子ビットゲートの忠実度は、電荷のスイートスポットで天然ネオンを用いて達成できる。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:31:20 GMT)
Lightweight Convolutional Neural Networks for Retinal Disease Classification [0.2] 本稿では,2つの軽量かつ効率的な畳み込みニューラルネットワークアーキテクチャであるMobileNetとNASNetMobileを用いて,正常,DR,MH網膜画像の分類を行った。
実験の結果、MobileNetV2の精度は90.8%、NASNetMobileの精度は89.5%だった。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:36:45 GMT)
Dynamic Context-Aware Streaming Pretrained Language Model For Inverse Text Normalization [0.2] 逆テキスト正規化(ITN)は、音声自動音声認識(ASR)出力を十分に整形されたテキストに変換するために重要である。
我々はITNのためのストリーミング事前学習言語モデルを導入し、頑健性を向上させるために事前学習言語表現を活用する。
提案手法は,非ストリーミングITNに匹敵する精度を達成し,ベトナムのデータセット上で既存のストリーミングITNモデルを上回る精度を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:41:03 GMT)
LLM Benchmarking with LLaMA2: Evaluating Code Development Performance Across Multiple Programming Languages [0.2] 本稿では,Llama 2-70Bモデルがプログラミング言語で書かれた科学アプリケーションを自動化する能力について述べる。
コード、ドキュメンテーション、ユニットテストを生成するためのモデルの能力と、既存のコードをプログラミング言語間で翻訳する能力を評価します。
以上の結果から,Llama 2-70Bは,より単純な数値処理のために,構文的に正しい関数コードを生成することが多いが,より複雑で並列化された,あるいは分散計算ではかなりの困難に直面することが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:20:31 GMT)
The Cost of Restaking vs. Proof-of-Stake [0.2] リスク要件の観点から,再試行プロトコルとProof-of-Stakeプロトコルの効率を比較検討する。
このような再帰グラフをセキュアなPoSプロトコルに変換することは,常に可能であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:22:55 GMT)
Quantum Search for Gravitational Wave of Massive Black Hole Binaries [0.2] 量子マッチングフィルタリングアルゴリズムは理論的に$O(N)$から$O(sqrtN)$に計算複雑性を減少させることができることを示す。
また,アルゴリズムの不安定性により性能が低下する場合もある。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:47:37 GMT)
Chameleon: A MatMul-Free Temporal Convolutional Network Accelerator for End-to-End Few-Shot and Continual Learning from Sequential Data [0.2] エッジでのデバイス上での学習により、低レイテンシ、長期的な堅牢性の向上とメンテナンスコストの削減による個人化が可能になる。
スケーラブルで低消費電力のエンド・ツー・エンドのオン・チップ・ラーニングを実現するには、特に実世界のシーケンシャルなデータに限られた数のサンプルを組み込むことは、オープンな課題である。
Chameleonを紹介します。これらの課題を解決するために3つの重要なコントリビューションを活用します。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:49:30 GMT)
Binary Cumulative Encoding meets Time Series Forecasting [0.1] 単調なバイナリベクトルにスカラーターゲットを表すバイナリ累積符号化(BCE)を導入する。
BCEはオーダとマグニチュード情報を暗黙的に保存し、モデルが分類フレームワーク内で動作しながら、距離対応の表現を学習できるようにする。
提案手法は,より少ないパラメータを必要とせず,より高速な学習が可能でありながら,点予測と確率予測の両方で広く用いられている手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:41:39 GMT)
Leveraging Intermediate Features of Vision Transformer for Face Anti-Spoofing [0.1] 本研究では,視覚変換器(ViT)を用いたスプーフィング攻撃検出手法を提案する。
OULU-NPUとSiWデータセットを用いた実験により提案手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:33:01 GMT)
Spatiotemporal Analysis of Forest Machine Operations Using 3D Video Classification [0.1] 本稿では,ダッシュカム映像からの森林活動の深層学習フレームワークを提案する。
PyTorchVideoで実装された3D ResNet-50アーキテクチャを採用している。
手動でアノテートされたフィールド記録データセットでトレーニングされたこのモデルは、強いパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:07:57 GMT)
Guiding Generative Storytelling with Knowledge Graphs [0.1] 大規模言語モデル(LLM)は、自動ストーリ生成において大きな可能性を示しています。
生成的ストーリーテリングを支援するための構造化データの使用は、まだ未定である。
本稿では,ナレッジグラフが物語の質を向上し,ユーザ主導の修正を可能にすることによって,LLMベースのストーリーテリングを向上する方法について検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:08:21 GMT)
End-to-end guarantees for indirect data-driven control of bilinear systems with finite stochastic data [0.0] 本稿では,安定性が保証された双線形システムの間接的データ駆動制御のためのエンドツーエンドアルゴリズムを提案する。
広範にわたる数値的な研究により、制御器設計と導出された識別誤差境界との相互作用を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:48:26 GMT)
Large amplitude mechanical coherent states and detection of weak nonlinearities in cavity optomechanics [0.0] キャビティ・オプティメカル・セットアップと、弱い機械的非線形性を検出する場合を考える。
これらの手法はダッフィングのような材料非線形性の測定や、量子重力理論に関連する効果的な非線形補正にうまく応用することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:57:09 GMT)
randextract: a Reference Library to Test and Validate Privacy Amplification Implementations [0.0] 量子鍵分布プロトコルの機密性は、プライバシ増幅ステップの正しい実行に依存します。
プライバシアンプリフィケーションの実装をテストし、検証するためのリファレンスライブラリであるrundextractを提示する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:01:50 GMT)
pyMEAL: A Multi-Encoder Augmentation-Aware Learning for Robust and Generalizable Medical Image Translation [0.0] 3D医療画像は、取得プロトコル、スキャナの違い、患者の動きによって、データの不足と不整合に悩まされている。
従来の拡張では、すべての変換に単一のパイプラインを使用しており、各拡張のユニークな特性を無視している。
専用エンコーダによって処理される4つの異なる拡張変異を利用したマルチエンコーダ拡張学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:01:23 GMT)
ZeShot-VQA: Zero-Shot Visual Question Answering Framework with Answer Mapping for Natural Disaster Damage Assessment [0.0] 最近発表されたモデルは、オープンエンドの質問に答える能力を持っていない。
ZeShot-VQAは、トレーニング手順中に見られなかった回答を処理し、生成することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:15:11 GMT)
Wine Quality Prediction with Ensemble Trees: A Unified, Leak-Free Comparative Study [0.0] 我々は,5つのアンサンブル学習者(ランドムフォレスト,グラディエントブースティング,XGBoost,LightGBM,CatBoost)を標準のVinho Verde赤と白のデータセットに統一した最初のベンチマークを提示する。
グラディエントブースティングは最高精度(赤はF1 0.693 +/- 0.028、白は0.664 +/- 0.016)を達成し、続いてランダムフォレストとXGBoostの3ポイント以内である。
我々は、最もコスト効率の良い生産モデルとしてRandom Forest、GPU効率の良い代替品としてXGBoostとLightGBM、オフラインベンチマークの精度天井としてGradient Boostingを推奨する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:02:36 GMT)
Variational-Adiabatic Quantum Solver for Systems of Linear Equations with Warm Starts [0.0] 線形系に対する再検討型変分量子解法を提案する。
量子回路上で容易に実装できる既知の基底状態を持つ初期ハミルトニアンを定義する。
我々は、最終基底状態が与えられた線形系の解と一致するように制御変数をチューニングすることで、ハミルトニアンを進化させる。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:00:14 GMT)
Utilizing AI for Aviation Post-Accident Analysis Classification [0.0] 航空安全報告で利用可能なテキストデータの量は、タイムリーかつ正確な分析の課題を示している。
本稿では、人工知能(AI)、具体的には自然言語処理(NLP)が、このデータから貴重な洞察を抽出するプロセスを自動化する方法について検討する。
この結果から,NLPと深層学習,およびTMは,航空安全解析の効率と精度を著しく向上させる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:15:04 GMT)
Unifying non-Markovian characterisation with an efficient and self-consistent framework [0.0] ほぼ全ての量子デバイスは、回路のレベルでノイズの多い量子と古典的な相関に悩まされている。
我々は、すべての非マルコフ現象を均一に包含し分類する理論的な枠組みを開発する。
任意の$SU(4)$演算のダイヤモンド標準と平均ゲート忠実度において、大幅な改善が可能であることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:21:52 GMT)
Unified theoretical guarantees for stability, consistency, and convergence in neural PDE solvers from non-IID data to physics-informed networks [0.0] 現実的なトレーニング条件下では,ニューラルネットワークの安定性,一貫性,収束性に対処する統一的な理論的枠組みを確立する。
従属データを用いた標準教師付き学習では、勾配法に対して一様安定性境界を導出する。
ヘテロジニアスデータを用いたフェデレーション学習では、曲率認識の集約と情報理論の分岐によるモデル不整合性の定量化を行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:53:06 GMT)
Turing Test 2.0: The General Intelligence Threshold [0.0] 我々は、一般知性(G.I.)を明確に定義し、G.I.しきい値(G.I.T.)を設定する。
次に、システムがG.I.を達成したかどうかを、シンプルで包括的で明確なフェール/パス方式で検出できるテストの構築方法に関する新しいフレームワークを提案する。
現代のA.I.モデル上でのチューリングテスト2.0フレームワークに従ってテストを適用する実例を実例で示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:53:17 GMT)
Transaction Proximity: A Graph-Based Approach to Blockchain Fraud Prevention [0.0] 本稿では,パブリックブロックチェーンに対する不正検出アクセス検証システムを提案する。
トランザクションプロキシ(Transaction Proximity)"は、トランザクショングラフ内のウォレット間の距離を測定します。
「容易に到達できる識別子」は、中央集権取引所への直接取引接続を持つ財布を識別する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:00:07 GMT)
Thermodynamic Signatures of Gaussian Entanglement Beyond Entropy [0.0] 両極端ガウス状態における絡み検出のためのエントロピーフリー基準を導入する。
我々は解析をある種の非ガウス状態にまで拡張し、量子相関の類似エネルギーに基づくシグネチャを観察する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:43:36 GMT)
Thermal conductance at the superradiant phase transition in the quantum Rabi model [0.0] 量子ラビモデルは結合が強くなると超ラジカル相転移を示す。
このレターでは、2つの熱浴の間の量子ラビモデルによりモデル化されたボソニックモードに埋め込まれた原子間の熱輸送について検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:11:58 GMT)
The World As Large Language Models See It: Exploring the reliability of LLMs in representing geographical features [0.0] 本研究では, GPT-4o と Gemini 2.0 Flash の3つの地理空間的タスク(ジオコーディング, 標高推定, 逆ジオコーディング)における性能評価を行った。
どちらのモデルもオーストリアの連邦国家の正確な再構築を達成せず、永続的な誤分類を強調した。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:14:17 GMT)
The Impact of Disability Disclosure on Fairness and Bias in LLM-Driven Candidate Selection [0.0] 本研究では,大規模言語モデル(LLM)による候補選択に対する自発的に開示された情報の影響について検討する。
LLMは障害がないことを公表した候補者を好んだ。
候補者が障害の状態を公表しない場合であっても、LSMは障害を持っていないと明言した者に比べて、それらを選択する可能性が低い。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:44:17 GMT)
The Einstein Equation from an Informational-Geometrical Equivalence [0.0] 距離場はミンコフスキー空間から逸脱し、異なる時空点における局所観測者によって割り当てられた無限小距離を関連付けることを示す。
十分に小さな空間的領域に対するインセンフィニカル・幾何学的等価性(IGE)を提案する。
系とLRFの間の量子相関の存在を考えると、この IGE は半古典的アインシュタイン方程式を復元する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:56:45 GMT)
TIP-Search: Time-Predictable Inference Scheduling for Market Prediction under Uncertain Load [0.0] TIP-Searchは、不確実なワークロード下でのリアルタイム市場予測のための時間予測可能な推論スケジューリングフレームワークである。
TIP-Searchを3つの実世界のリミットオーダーブックデータセットで評価する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:52:01 GMT)
Supporting Long-term Transactions in Smart Contracts Generated from Business Process Model and Notation (BPMN) Models [0.0] 論文は、協調取引をサポートするために自動生成された代替取引メカニズムを調べ評価する。
BPMNモデルのスマートコントラクトへの自動変換に対する私たちのアプローチは、プライバシとチェーン間の相互運用性をサポートして実現可能であることを示しています。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:47:06 GMT)
Supervised Quadratic Feature Analysis: Information Geometry Approach for Dimensionality Reduction [0.0] 教師付き次元減少は、クラス識別性を最大化しつつ、ラベル付きデータを低次元の特徴空間にマッピングすることを目的としている。
本稿では,SQFA(Supervised Quadratic Feature Analysis)を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:27:22 GMT)
Statistics of Strongly Coupled Defects in Superconducting Qubits [0.0] 本研究では,フラックス可変トランスモンの動作周波数におけるエネルギー緩和度を測定した。
我々の結果は、個々の界面欠陥に支配される損失と一致している。
我々は、支配的な欠陥をクビット接合の500nm以内に局所化することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:05:19 GMT)
State Estimation and Control of Dynamic Systems from High-Dimensional Image Data [0.0] 本稿では、畳み込みニューラルネットワーク(CNN)を用いた空間的特徴抽出と、ゲートリカレントユニット(GRU)による時間的モデリングを統合した新しいニューラルアーキテクチャを提案する。
実験により,提案手法により,地中構造に直接アクセスすることなく,リアルタイム,高精度な推定と制御が可能であることを実証した。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:40:06 GMT)
Spreading of information on a network: a quantum view [0.0] 本稿では,複雑な多層ネットワークによる情報拡散のモデル化について述べる。
1つは(H,$)誘起力学に基づくもので、もう1つはゴリーニ-コッサ-スダルシャン-リンドブラッド方程式に基づくものである。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:43:02 GMT)
Spin vs. position conjugation in quantum simulations with atoms: application to quantum chemistry [0.0] 置換対称性は、区別不可能な粒子の集合波動関数の基本的な特性である。
特に、光学的ツイーザーによって媒介されるメソスコピックにスケールされた原子量子ビットの集まりは、分子中の核中心と結合した価電子シェルの挙動をモデル化することができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:58:34 GMT)
Spatiotemporal Emotional Synchrony in Dyadic Interactions: The Role of Speech Conditions in Facial and Vocal Affective Alignment [0.0] 非重複音声は、より明確な感情的調整を促進する。
重なり合う言葉は同期を乱す。
指向性パターンでは, 顔の表情が発話に先行する傾向がみられた。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:35:39 GMT)
Simulating Neutral Atom Quantum Systems with Tensor Network States [0.0] 多数の量子ビットを持つ回路は、より頻繁にノイズの下で故障し、量子ビット人口を減少させることを示す。
また、最適化されたパラメータは特にノイズに対して堅牢であり、ノイズの多い量子系が最適パラメータを見つけるのに利用できることを示唆している。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:05:25 GMT)
Shill Bidding Prevention in Decentralized Auctions Using Smart Contracts [0.0] 本稿では,ブロックチェーンスマートコントラクトを用いたオークション詐欺の防止に動的行動に基づく罰則を適用した概念的枠組みを提案する。
このフレームワークは、提案されたBid Shill Score (BSS) を用いて、9つの異なる入札行動を評価する。
性能評価の結果,システムには中程度のガスと遅延のオーバーヘッドのみを導入し,実際の使用限界内にトランザクションコストと応答時間を維持できることが示唆された。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:23:29 GMT)
Romanesco codes: Bias-tailored qLDPC codes from fractal codes [0.0] バイアスノイズに適応したクリフォード変形自転車コード群を導入・解析する。
我々のqLDPC符号は、制限域ゲートと低重安定化器を備えた二部形六角形格子上で定義される。
高い符号化率を持つ小さな例は、幅広いバイアスに対して良好に機能する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:06:24 GMT)
Robust random graph matching in Gaussian models via vector approximate message passing [0.0] 我々は,n1-o(1)$の任意の逆摂動の下で頑健な効率的なランダムグラフマッチング型アルゴリズムを提案する。
我々のアルゴリズムは,n1-o(1)$の任意の逆摂動の下で頑健な,最初の効率的なランダムグラフマッチング型アルゴリズムである。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:59:59 GMT)
Riemannian Principal Component Analysis [0.0] 本稿では,従来のユークリッド空間におけるデータの仮定を超越した,主成分分析(PCA)の革新的拡張を提案する。
局所測度を含むようにPCAを適用し、多様体幾何を組み込むことができる。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:04:01 GMT)
Reservoir-assisted quantum battery charging at finite temperatures [0.0] 量子電池の性能に及ぼすフェルミオンおよびボソニック熱貯留層の影響について検討した。
その結果, 貯水池の種類によらず, 最適帯電パラメータが示されることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:36:52 GMT)
Reducing Circuit Depth in Quantum State Preparation for Quantum Simulation Using Measurements and Feedforward [0.0] 中間回路の測定とフィードフォワードは、量子回路の深さを著しく減少させることが示されている。
本稿では,幅の増大を犠牲にして,量子回路の深さを低減する並列化手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:38:30 GMT)
Recipes for Pre-training LLMs with MXFP8 [0.0] 精度のスケーリングは、精度を犠牲にすることなくGPU効率を改善するための魅力的なテクニックとして現れている。
MX形式は、他の縮小精度表現に比べて数値安定性が向上する。
15Tトークン上の8Bモデルに対して,MXFP8の事前学習を成功させるラウンド・ツー・インフィニティを用いたラウンド・ツー・インフィニティ(ラウンド・トゥ・インフィニティ)の改良手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:08:15 GMT)
Random Rule Forest (RRF): Interpretable Ensembles of LLM-Generated Questions for Predicting Startup Success [0.0] 大規模言語モデル(LLM)によって生成されるYES/NO質問を組み合わせた軽量アンサンブルフレームワークを提案する。
スタートアップの10%を成功と分類するテストセットでは、ランダム選択よりも5倍の精度で50%の精度を達成しています。
これらの結果は、推論と人間の洞察を組み合わせることの価値を強調し、単純で解釈可能なアンサンブルが、ベンチャーキャピタル(VC)のような領域における高い意思決定を支援することを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:13:21 GMT)
Quantum theory of fractional topological pumping of lattice solitons [0.0] 格子ソリトンのトポロジカルポンプの完全な量子記述を示す。
我々は、質量の中心のバンド構造によって決定される位相不変量、多体チャーン数を同定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:21:08 GMT)
Quantum computing from a mathematical perspective: a description of the quantum circuit model [0.0] 本論文は, 量子コンピューティングの基本原理を数学的観点から, 本質的に自己完結型かつ厳密な記述である。
これは、この急速に成長する分野を把握したい数学者を助け、数学とこの分野の先駆的な分野の間の言語的ギャップに驚嘆することを目的としている。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:37:59 GMT)
Quantum Meets SAR: A Novel Range-Doppler Algorithm for Next-Gen Earth Observation [0.0] 本稿では、従来のFFTと比較して処理を高速化する量子レンジドップラーアルゴリズム(QRDA)を提案する。
RDAパイプラインにおける重要なステップであるフーリエ領域におけるレンジセルマイグレーション補正(RCMC)の量子実装を導入している。
量子RCMCの性能を従来のRCMCと比較して評価し、高度なSARイメージングにおける量子コンピューティングの可能性を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:04:28 GMT)
Quantum Acoustics with Tunable Nonlinearity in the Superstrong Coupling Regime [0.0] 超伝導カー共振器に結合した多モード機械キャビティを実現する。
カーモードはフラックス可変SQUIDアレイ共振器によって実現される。
7組のメカニカルモード間の相互Kerr相互作用を測定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:59:03 GMT)
Purcell Enhancement and Suppression in Laser Cooling of Yb$^{3+}$:YLF Nanocrystals in a Fabry-Pérot Microcavity [0.0] 本稿では,Purcell効果を利用したFabry-P'erotマイクロキャビティにおけるYb$3+$:YLFナノ結晶の反ストークスレーザー冷却の改善について検討した。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:05:24 GMT)
ProofNet++: A Neuro-Symbolic System for Formal Proof Verification with Self-Correction [0.0] 本稿では,自動定理証明を強化するニューロシンボリックフレームワークProofNet++を提案する。
ProofNet++は,従来のモデルよりも検証精度,正確性,形式的妥当性を著しく向上することを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:44:34 GMT)
Predictability of quantum observables: Applications in QKD and top quarks [0.0] 本研究では,ベイズリスクと推定分散を用いて,二部量子系における局所観測可能量の予測可能性の定量化と最適化を行う。
また、任意の2量子状態に対する解析式を提供し、アインシュタイン-ポドルスキー-ローゼンステアリング基準との関係を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:03:59 GMT)
Practical primary thermometry via alkali-metal-vapour Doppler broadening [0.0] ドップラーブロードニングサーモメトリー(DBT)は, 実用化に適したキャリブレーションフリー一次基準として用いられる。
アルカリ金属気相細胞に関する概念実証研究について報告する。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:50:35 GMT)
PerFormer: A Permutation Based Vision Transformer for Remaining Useful Life Prediction [0.0] 本稿では,多変量時系列データをパーミュレートするパーフォーメーション・ベース・ビジョン・トランスフォーマー手法PerFormerを紹介する。
NASAのC-MAPSSデータセットに関する実験は、PerFormerのRUL予測における優れた性能を実証している。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:49:10 GMT)
Passive leakage removal unit based on a disordered transmon array [0.0] 量子ビット部分空間からの漏れは、標準的な量子エラー訂正プロトコルを損なう。
本稿では,無秩序なトランスモンの配列に基づくパッシブリーク除去ユニットを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:18:58 GMT)
P: A Universal Measure of Predictive Intelligence [0.0] AIシステムが持つとされる知性について、一般的に合意されている定義はない。
人間、動物、AIの知能を1つの比率で比較できるような実践的な尺度は、誰も開発していません。
本稿では,予測が知能の最も重要な構成要素であるという仮説に基づく,新たな普遍的な知能尺度を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:05:54 GMT)
Optimizing the Interface Between Knowledge Graphs and LLMs for Complex Reasoning [0.0] 知識グラフを用いた大規模言語モデル(LLM)
Cognaneは、エンドツーエンドのKG構築と検索のためのモジュラーフレームワークである。
チャンキング、グラフ構築、検索、プロンプトに関連するパラメータを最適化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:27:59 GMT)
Optimizing Connectivity through Network Gradients for Restricted Boltzmann Machines [0.0] ネットワーク接続は、浅いネットワークの学習性能において重要な役割を果たす。
本研究では, RBMの最適接続パターンを求める最適化手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 00:41:16 GMT)
Optimal number of stabilizer measurement rounds in an idling surface code patch [0.0] コードパッチに符号化された論理量子ビットに対する安定化器測定ラウンドの速度を数値的に最適化する。
我々は、ゲート誤差、読み出し誤差、振幅、位相減衰を含む回路レベルの環境騒音をモデル化する。
定性的には、安定した測定ラウンドの最適な数は、より良いキュービットのために小さくなり、より良いゲートやより大きなコードサイズのために大きくなっています。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:10:14 GMT)
Optimal Haar random fermionic linear optics circuits [0.0] 非粒子保存(能動)および粒子保存(パッシブ)FLOハール測度上でのサンプリングに最適なアルゴリズムを導入する。
また、Clifford FLOを最適な$Theta(n2)$ゲートカウントでサンプリングする量子回路も提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:52:40 GMT)
On The Causal Network Of Face-selective Regions In Human Brain During Movie Watching [0.0] 我々は,M-matrices for Acyclicity (DAGMA)を用いて脳の顔選択ネットワークの因果構造を調べる。
以上の結果から,刺激中の顔の存在がネットワーク内の特定接続数に因果関係があることが判明した。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:45:54 GMT)
On Pareto Optimality for the Multinomial Logistic Bandit [0.0] マルチノードロジット帯域問題に対処するための新しいオンライン学習アルゴリズムを提供する。
MNLモデルがもたらす課題にもかかわらず、我々は新しいアッパー信頼境界法(UCB)を開発した。
我々は,MNL-Bandit問題に対する後悔と推定誤差のトレードオフを特徴付ける理論的保証を開発する。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:26:21 GMT)
Non-Gaussian enhancement of precision in quantum batteries [0.0] 我々は、量子コヒーレンス、非ガウス性、および絡み合いが、ボゾン量子電池のエネルギー出力の変動にどのように影響するかを分析する。
この研究は、実用的なエネルギー変換タスクの性能を向上させるために量子効果をどのように活用できるかを示す、具体的な熱力学的量子優位性を強調している。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:54:10 GMT)
NexusSum: Hierarchical LLM Agents for Long-Form Narrative Summarization [0.0] 物語要約のための多エージェントLLMフレームワークであるNexusSumを紹介する。
物語固有の事前処理方法は、文字対話と記述テキストを統一されたフォーマットに標準化する。
本手法は物語要約における新たな最先端技術を確立し,書籍,映画,テレビ脚本間でBERTScore(F1)を最大30.0%向上させる。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:26:23 GMT)
Next Generation Authentication for Data Spaces: An Authentication Flow Based On Grant Negotiation And Authorization Protocol For Verifiable Presentations (GNAP4VP) [0.0] 本稿では,データ空間内の共有データ環境に適した認証プロトコルを提案する。
提案したソリューションは、分散化されたユーザ中心のアイデンティティ管理を容易にするために、SSI(Self-Sovereign Identity)の原則に準拠している。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:20:39 GMT)
Neural Networks as Universal Finite-State Machines: A Constructive ReLU Simulation Framework for NFAs [0.0] ReLUアクティベーションは非決定論的分岐、サブセット構成、および$epsilon$-クロージャを数学的に正確にシミュレートする。
この研究は、標準ディープラーニングアーキテクチャにおけるNFAの証明可能な完全なシンボルシミュレーションを初めて提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:18:35 GMT)
Neural Drift Estimation for Ergodic Diffusions: Non-parametric Analysis and Numerical Exploration [0.0] 雑音や粗い関数データに対する推測を可能にする理論的推定手順を実践的に実施する方法を示す。
サンプルパスのIto-Taylor近似をシミュレーションした結果が得られた。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:12:49 GMT)
Multireference Embedding and Fragmentation Methods for Classical and Quantum Computers: from Model Systems to Realistic Applications [0.0] 量子埋め込みは、複雑なシステムを管理可能なサブシステムに分割することで、有望なソリューションを提供する。
量子コンピュータにおける古典的実装とこれらの手法の新たな可能性について論じる。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:18:10 GMT)
Multi-Domain ABSA Conversation Dataset Generation via LLMs for Real-World Evaluation and Model Comparison [0.0] 本稿では,Large Language Models (LLMs) を用いた合成ABSAデータ生成手法を提案する。
GPT-4oを用いて複数の領域に一貫したトピックと感情分布を持つデータを生成するための生成プロセスについて詳述する。
その結果, 合成データの有効性が示され, モデル間での相違点が明らかとなった。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:24:17 GMT)
Mixed state concurrence for symmetric systems [0.0] 高度に対称な系の混合状態における絡み合いを定量化する手法を提案する。
対称性を用いて非絡み合った密度を明示的に構成し、熱混合状態に最適に含まれる。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:34:27 GMT)
Minimizing the number of edges in LC-equivalent graph states [0.0] あるグラフ状態を別のグラフにマッピングする局所クリフォード演算は、エッジの数の変更を含む対応するグラフの構造を変更することができる。
ここでは、与えられたグラフのLC等価クラスにおいて、最小限のエッジ数を持つグラフを見つけるという、関連するエッジ最小化問題に取り組む。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:49:45 GMT)
Measurement-invisible quantum correlations in scrambling dynamics [0.0] 2つのサブシステム間の量子相関の質的に異なる形式によって特徴づけられる3つの異なる動的位相が存在することを示す。
量子相関はサブシステムの1つの測定で目に見えない、あるいは目に見えないような位相を分離する、絡み合った位相内の新しい位相遷移を明らかにする。
本研究の結果は,量子インタラクティブ力学の枠組み内で測定フィードバックを用いて行うことができるタスクの種類に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 30 May 2025 05:43:35 GMT)
MDPO: Multi-Granularity Direct Preference Optimization for Mathematical Reasoning [0.0] 大規模言語モデル(LLM)の数学的推論を最適化するMDPO(Multi-Granularity Direct Preference Optimization)法を提案する。
我々はオープンソースのQwen2とLlama3で実験を行い、GSM8Kデータセットで1.7%と1.2%、MATHデータセットで2.3%と1.2%の改善を実現した。
また、MDPOトレーニングデータを構築するためのパイプラインも提供しています。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:42:14 GMT)
Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification [0.0] 大腸癌の検出は、患者の生存率を高めるために重要である。
大腸内視鏡は、適切な高品質の内視鏡画像を取得することに依存する。
Few-Shot Learning アーキテクチャにより、我々のモデルは、目に見えないきめ細かな内視鏡画像パターンに迅速に適応できる。
精度は90.1%,精度は0.845,リコールは0.942,F1スコアは0.891であった。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:54:51 GMT)
LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text [0.0] 我々は,明快さ,コヒーレンス,用語に基づく法文の質を評価する回帰モデルを構築した。
まず、モデルの品質レベルが14億のパラメータから外れ、限界的な改善は72億のパラメータで2.7%だけである。
論文参考訳(メタデータ) (Fri, 30 May 2025 17:30:18 GMT)
Learning to Optimally Dispatch Power: Performance on a Nation-Wide Real-World Dataset [0.0] ウルグアイの電力網の構造特性と2年近い実世界の運用データの両方を含む,一般公開された電力システムデータセットを紹介する。
実世界のデータが学習ベースORPDソリューションに与える影響を評価し, 人工的な需要から実際の需要へ移行する際の予測誤差が顕著に増加したことを明らかにする。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:07:38 GMT)
Learning Dynamics under Environmental Constraints via Measurement-Induced Bundle Structures [0.0] 本稿では,状態空間上の繊維束構造を通しての計測,制約,動的学習を統一する幾何学的枠組みを提案する。
ニューラルネットワークを統合することにより,センサの品質に依存した学習収束と制約満足度を理論的に保証し,幾何学的制約を保ちながら連続時間ダイナミクスを学習する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:41:54 GMT)
Large Language Models are Locally Linear Mappings [0.0] オープンウェイトな大言語モデルの推論操作を、入力シーケンスに対して正確に等価な線形システムにマッピングする。
そのパワーと大域的非線形性にもかかわらず、現代のLSMは、ほぼ完全に局所的な線形分解によって解釈できる。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:08:33 GMT)
LPASS: Linear Probes as Stepping Stones for vulnerability detection using compressed LLMs [0.0] 本稿では,Linear Probesを用いて圧縮された大言語モデルの性能を推定する方法を示す。
また, レイヤプルーニング圧縮を適用する際に, カットオフ点の設定に適合することを示す。
我々のアプローチは、$LPASS$と呼ばれ、480kのC/C++サンプル上で、MITREのTop 25の最も危険な脆弱性を検出するためにBERTとGemmaに適用される。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:37:14 GMT)
Keyed Chaotic Masking: A Functional Privacy Framework for Neural Inference [0.0] この研究は、キー付きカオスマスキングに基づくプライバシ保護ニューラルネットワーク推論のための軽量フレームワークを導入している。
本稿では,グラフサンプリング,動的ルール選択,カオス診断などのマスキングシステムの構築について述べる。
このフレームワークは、現代のAIシステムにおけるユーザ制御プライバシのための実用的でモジュール化されたビルディングブロックを提供する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:56:04 GMT)
Is BERTopic Better than PLSA for Extracting Key Topics in Aviation Safety Reports? [0.0] 本研究は,航空安全レポートから有意義なトピックを抽出する上で,BERTopic と Probabilistic Latent Semantic Analysis (PLSA) の有効性を比較した。
2000年から2020年にかけてのNTSB(National Transportation Safety Board)のデータセットを使用して、BERTopicはトランスフォーマーベースの埋め込みと階層的なクラスタリングを採用した。
その結果, BERTopicはPLSAのトピックコヒーレンスに優れ, PLSA 0.37に比べてCvスコア0.41の成績を示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:27:11 GMT)
Intuitionistic Fuzzy Sets for Large Language Model Data Annotation: A Novel Approach to Side-by-Side Preference Labeling [0.0] 本稿では,多言語モデル(LLM)における人間の嗜好をモデル化・集約するための直観的ファジィ集合(IFS)に基づく新しい枠組みを提案する。
我々のアプローチは、選好の度合いだけでなく、メンバーシップ、非メンバーシップ、およびヒューイテーションの度合いを通じて、人間の判断に固有の不確実性や偏見も捉えている。
複数のデータセットに対する実験的検証は、我々のIFSベースのアプローチがアノテーションの一貫性を大幅に改善し、アノテータの疲労を低減し、高品質な嗜好データを生成することを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:20:00 GMT)
Integrated Information in Relational Quantum Dynamics (RQD) [0.0] 本稿では,量子ダイナミクス(RQD)フレームワーク内の多部状態に対する情報統合尺度である$Phi$を紹介する。
$Phi$ は、n-部分作用素 $rho と、その部分系の分割上の任意の状態の間の最小量子距離として定義される。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:54:11 GMT)
Information-theoretic machine learning for time-varying mode decomposition of separated airfoil wakes [0.0] NACA0012翼まわりの分離流れの3つの例,すなわち,攻撃後の安定角度におけるラミナ周期波動,強い渦-翼相互作用,および時空間周期領域における乱流波動について考察する。
本手法は,時変リフト応答に付随する情報的渦構造を明らかにする。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:59:59 GMT)
Impacto del desorden en los estados cuánticos de dos fotones generados en arreglos de guías de onda no lineales [0.0] この研究は、光の伝播とその量子相関に対する障害の影響をシミュレートし分析する。
光を1つの導波管に注入すると、結合の混乱が局所化を増大させ、分散を減少させると決定される。
最後に、相関行列から得られる量子相関が障害の存在下で頑健であることが観察された。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:38:08 GMT)
Impact of surface roughness on the stability of nanoelectromechanical pressure sensors in the Casimir regime [0.0] カシミール系におけるナノエレクトロメカニカル圧力センサの安定性は, センサ膜および接地板の表面粗さを考慮して検討した。
センサ膜の平衡位置は, 外部の測定値, 弾性, 電気的圧力, およびリフシッツ理論を用いて計算したカシミール圧力のバランスから得られる。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:33:44 GMT)
If Eleanor Rigby Had Met ChatGPT: A Study on Loneliness in a Post-LLM World [0.0] 孤独感は、人の精神的および身体的健康に大きな影響を及ぼす。
これまでの研究では、大きな言語モデル(LLM)が孤独を和らげる可能性があることが示唆されている。
私たちは、ChatGPTのようなサービスで広範にLLMを使用することは、この目的のために設計されていないため、より一般的でリスクが高いと論じています。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:15:32 GMT)
Identifying Primary Stress Across Related Languages and Dialects with Transformer-based Speech Encoder Models [0.0] 音声フレーム分類ヘッドを用いた事前学習型変圧器モデルの微調整手法について検討する。
私たちの実験では、クロアチア、セルビア、チャカヴィア、スロベニアでのテストセットを備えた、新しいクロアチアのトレーニングデータセットを使用しました。
複数音節の訓練語は数百語に過ぎなかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:23:46 GMT)
Homophily Within and Across Groups [0.0] ホモフィリー(Homophily)-類似の他と結びつく傾向は、ネットワーク構造と機能を形成する上で中心的な役割を担っている。
グループ内およびグループ間でホモフィリーを分解する最大エントロピーフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:58:28 GMT)
Graph Neural Network-Based Reinforcement Learning for Controlling Biological Networks: The GATTACA Framework [0.0] 複雑な生物学的システムのネットワークモデルを制御するために, 深層強化学習(DRL)の利用について検討する。
セルリプログラミングにおける非同期更新モード下でのブールネットワークモデルに対する新しい制御問題を定式化する。
生体システムの構造を活用するため,DRLエージェントが学習した行動値関数のための人工ニューラルネットワーク近似器に,グラフ畳み込みを伴うグラフニューラルネットワークを組み込んだ。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:59:25 GMT)
Generative Knowledge Production Pipeline Driven by Academic Influencers [0.0] 本研究では,53のアカデミックインフルエンサー・ビデオを用いて,新しい,構造化された,実装可能なパイプラインを同定する。
発見は、出版を自動化し、知識生産への参加を民主化する、生成的AIの可能性を強調している。
本研究は,共同インテリジェンス適応のための生成出版生産パイプラインと政策フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:07:01 GMT)
Generating Samples to Question Trained Models [0.0] 学習したモデルを探索し、好みのサンプルを識別する数学的枠組みを提案する。
フレームワークを紹介するために、これらのクエリを、分類タスクや回帰タスクで訓練されたさまざまなモデルに適用し、生成されたデータの形式で回答を受け取る。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:13:39 GMT)
Generating Hypotheses of Dynamic Causal Graphs in Neuroscience: Leveraging Generative Factor Models of Observed Time Series [0.0] 複雑なデータセットから科学的仮説を生成する新しい手法を提案する。
提案手法は,予測された動的因果パターンのf1スコアを平均ベースラインで約22~28%改善する。
実際の脳データに関するケーススタディは、我々の方法が特定の行動状態に関連する関係を明らかにする能力を示している。
論文参考訳(メタデータ) (Fri, 30 May 2025 14:13:47 GMT)
Fermionic Magic Resources of Quantum Many-Body Systems [0.0] フェミオン性非ガウス性(fermionic non-Gaussianity)とも呼ばれるフェルミオン性魔法資源の定量化フレームワークを開発する。
FAFは効率よく計算可能で実験的に利用できる非ガウス性の尺度である。
FAFは相転移を検知し、臨界点の普遍的な特徴を明らかにし、多体系における特別な解点を明らかにする。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:00:01 GMT)
FastCAR: Fast Classification And Regression for Task Consolidation in Multi-Task Learning to Model a Continuous Property Variable of Detected Object Class [0.0] FastCARは、分類と回帰タスクのためのマルチタスク学習(MTL)における新しいタスク統合アプローチである。
タスク統合のためのFastCARアプローチは、トレーニング時間効率(2.52倍高速)と、ベンチマークMTLネットワークよりも推論遅延(55%高速)を実現する。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:31:06 GMT)
Extensions of Schrödinger operators that generate $C_0$ contraction semigroups [0.0] ツマルカは$psi$の力学は$C_0$の縮約半群によって支配されなければならないと主張した。
これらすべての進化は、$psi$ 上の(潜在的に非局所的な)吸収境界条件を $partial Omega$ に沿って配置することによって生成される。
論文参考訳(メタデータ) (Fri, 30 May 2025 21:08:15 GMT)
Exact volume-law entangled zero-energy eigenstates in a large class of spin models [0.0] 我々は、スピンハミルトニアンの大規模なクラスにおいて、体積法で絡み合ったゼロエネルギーの正確な励起固有状態の特定の集合を解析的に構築する。
単純な条件を満たすすべてのスピン鎖が、スペクトルの中央に正確な体積法則ゼロエネルギー固有状態を持つことを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:49:59 GMT)
Exact Algorithms for Multiagent Path Finding with Communication Constraints on Tree-Like Structures [0.0] パラメータ化複雑性フレームワークを用いて,通信制約問題を用いたマルチエージェントパス探索について検討する。
我々の主な貢献は、入力ネットワークの特定の構造を考える際に効率的である3つの正確なアルゴリズムである。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:14:52 GMT)
Evolutionary model for energy trading in community microgrids using Hawk-Dove strategies [0.0] 本稿では,マイクログリッド間のエネルギー協力の分散モデルを提案する。
決定はマイクログリッドコミュニティのレベルで局所的に行われる。
マイクログリッドの販売と購入の相互作用は、進化的アルゴリズムによってモデル化される。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:04:01 GMT)
EvalYaks: Instruction Tuning Datasets and LoRA Fine-tuned Models for Automated Scoring of CEFR B2 Speaking Assessment Transcripts [0.0] EvalYaks と呼ばれるモデル群を開発し,CEFR B2 を英語で評価・評価する。
EvalYaksは平均許容精度96%、変量0.35の精度を達成し、次のベストモデルの3倍の精度で実行された。
論文参考訳(メタデータ) (Fri, 30 May 2025 07:41:36 GMT)
Enhancing Drug Discovery: Autoencoder-Based Latent Space Augmentation for Improved Molecular Solubility Prediction using LatMixSol [0.0] 本稿では,新しいラテント空間拡張フレームワークLatMixSolを提案する。
LatMixSolは、オートエンコーダベースの特徴圧縮と、トレーニングデータを強化するためのガイドを組み合わせたものだ。
分析により,クラスタ誘導潜在空間拡張は,データセットの多様性を拡大しながら,化学的妥当性を保っていることを確認した。
論文参考訳(メタデータ) (Fri, 30 May 2025 20:54:57 GMT)
Emergence of Hermitian topology from non-Hermitian knots [0.0] エルミートモデルのトポロジーの変化は、基礎となるNHノットトポロジーの遷移を意味することを示す。
NHモデルとエルミートモデルの間のこの関係は、格子運動量の周期性が同じである限り、頑健である。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:03:26 GMT)
Efficient detection of genuine multipartite entanglement using moments of positive maps [0.0] Genuine multipartite entanglement (GME)は、マルチパートシステムにおいて最も強力なエンタングルメントである。
本稿では, 正の写像の途切れたモーメントに基づいて, GME を検出するための効率的かつ実験的に実現可能な手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:07:53 GMT)
Domain-Specific Translation with Open-Source Large Language Models: Resource-Oriented Analysis [0.0] オープンソースの自己回帰型デコーダ専用大言語モデル(LLM)のドメイン固有翻訳性能とタスク指向機械翻訳(MT)モデルとの比較を行った。
実験では,医療領域に焦点をあて,資源利用率の異なる4つの言語方向をカバーした。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:50:03 GMT)
Disordering a permutation symmetric system: revivals, thermalization and chaos [0.0] 本研究では,対称性破壊障害の導入が粒子置換下での系の不変系の力学に及ぼす影響について検討する。
この障害により、量子状態は$N+1$ 次元完全対称空間に制限され、指数的に大きい2N$ 次元ヒルベルト空間に$N$粒子を浸透させる。
システムには障害に対する堅牢性があり、これはキックされたトップがいかにカオスであるかの関数である。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:38:07 GMT)
Directional Non-Commutative Monoidal Structures with Interchange Law via Commutative Generators [0.0] 一次元モノイド系を高次元に一般化する代数構造群を導入する。
本稿では,信号処理とデータ解析において,よく知られた線形変換を統一するフレームワークについて述べる。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:40:01 GMT)
Deformable Attention Mechanisms Applied to Object Detection, case of Remote Sensing [0.0] 本稿では,デフォルマブルアテンション機構を用いた特定のアーキテクチャであるデフォルマブル・DETRモデルをリモートセンシング画像に適用することを提案する。
この目的を達成するために、Pleiades AircraftデータセットとSAR、特にSAR Ship Detectionデータセットの2つのデータセットが使用される。
提案されたモデルは特によく機能し、光学データセットのF1スコアは95.12%、SSDDの94.54%を得た。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:43:09 GMT)
Deep Learning Weather Models for Subregional Ocean Forecasting: A Case Study on the Canary Current Upwelling System [0.0] 本研究は,当初グローバル気象予報のために開発されたグラフニューラルネットワークを応用し,地域の海洋予測を改善することを目的としている。
このモデルは衛星データを用いて訓練され、海洋力学を捉える際の性能を評価するために最先端の物理海洋モデルと比較される。
以上の結果から, 深層学習モデルは, 高度化に課題があるにもかかわらず, 従来の手法を超越していることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:10:40 GMT)
Cyclic measurements and simplified quantum state tomography [0.0] 我々は、全量子状態トモグラフィーを行うことができるサイクリック・タイトな測定の概念を導入する。
このタイプの測定は、物理系の量子状態を取得するのに必要な実験的なセットアップの複雑さを著しく単純化する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:08:00 GMT)
Copenhagenish interpretations of quantum mechanics [0.0] 我々はコペンハーゲンの精神に従う近代的な解釈を含むコペンハーゲンの解釈の類を定義する。
これらの解釈は、オブザーバ・オブザーバ・オブザーバ(Observer Observe)、普遍性(Universality)、反$psi$オントロジー(Anti-$psi$-ontology)、完全性(Completeness)の4つの仮定によって特徴づけられる。
我々は、コペンハーゲン語における測定問題、ウィグナーの友人思考実験、およびウィグナーの友人思考実験の単純な変種による解釈について論じる。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:00:00 GMT)
Complex wave functions, CPT and quantum field theory for classical generalized Ising models [0.0] 複素波動関数の場の量子論の概念は、古典的な統計一般化したイジングモデルにおける情報伝達を理解するのに有用である。
一般化Isingモデルのサブクラスは、決定論的更新と確率的初期条件を持つセルオートマトン(PCA)である。
情報理論では、PCAの量子フォーマリズムは決定論的計算や確率的入力による信号処理に新たな光を当てている。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:23:50 GMT)
Comparing Retrieval Strategies to Capture Interdisciplinary Scientific Research: A Bibliometric Evaluation of the Integration of Neuroscience and Computer Science [0.0] 学際的な科学研究は、知識生産、資金政策、学術的な議論においてますます重要になっている。
本研究では,2つの知識体系間の学際的コーパスを定義するための異なる戦略を開発し,比較する。
その結果,キーワードベースの戦略は精度とリコールの両面で優れていることがわかった。
論文参考訳(メタデータ) (Fri, 30 May 2025 19:29:18 GMT)
Circuit Stability Characterizes Language Model Generalization [0.0] モデル性能を評価する新しい手法として回路安定性を導入する。
回路安定性と回路等価性を数学的に定式化する。
回路安定性とその欠如が一般化の異なる側面を特徴づけ、予測できることを実証的に示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:53:56 GMT)
Chances and Challenges of the Model Context Protocol in Digital Forensics and Incident Response [0.0] 大規模な言語モデルは、法医学的な調査をサポートするためのかなりの約束を持っているが、その広く採用されていることは透明性の欠如によって妨げられている。
本稿では,新たなモデルコンテキストプロトコルがこれらの課題に対処し,デジタル法医学におけるLLMの意義ある活用を支援する方法について考察する。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:15:48 GMT)
CCNETS: A Modular Causal Learning Framework for Pattern Recognition in Imbalanced Datasets [0.0] Causal Cooperative Networks (CCNETS) は、統一因果パラダイム内で生成、推論、再構築を統合するモジュール型学習フレームワークである。
現実のクレジットカード不正検出データセット上でのCCNETSの評価を極端不均衡(詐欺の場合0.2%)で行う。
論文参考訳(メタデータ) (Fri, 30 May 2025 04:50:47 GMT)
Bottom-Up Perspectives on AI Governance: Insights from User Reviews of AI Products [0.0] 本研究は,ガバナンス関連テーマをユーザ談話でどのように表現するかをボトムアップで検討する。
G2.comの10万以上のAI製品のユーザレビューに基づいて、BERTopicを適用して、潜伏したテーマを抽出し、AIガバナンスに関連する最も意味のあるものを特定する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:33:21 GMT)
Bosonic quantum error correction using squeezed Fock states [0.0] 我々は,Knill-Laflammeコスト関数とPetzマップの忠実度を用いて,シュレッディンガーの猫状態に基づくコードと比較した。
圧縮されたフォック状態は、粒子損失やデファス化を伴うチャネル内の情報保護に競争力があることを実証する。
論文参考訳(メタデータ) (Fri, 30 May 2025 23:18:18 GMT)
Boosting Automatic Exercise Evaluation Through Musculoskeletal Simulation-Based IMU Data Augmentation [0.0] 本稿では,運動軌跡の体系的な修正と統合された筋骨格シミュレーションを用いて,現実的なIMUデータを生成する新しいデータ拡張手法を提案する。
本手法はバイオメカニカル・ポーラビリティを保証し,逆パラメータと知識に基づく評価戦略を組み合わせることで,自動的,信頼性の高いラベル付けを可能にする。
本研究は,理学療法演習評価における深層学習の課題を克服するために,本手法の有効性と有効性について考察した。
論文参考訳(メタデータ) (Fri, 30 May 2025 09:53:37 GMT)
Bias-field-free operation of nitrogen-vacancy ensembles in diamond for accurate vector magnetometry [0.0] 窒素空孔(NV)中心スピンアンサンブルは、高感度ベクトル磁気学に有望な解決策を提供する。
通常、各NV方向からの信号の分離に使用されるバイアス磁場は永久磁石やコイルのドリフトから不正確性をもたらす。
本研究では,マイクロ波(MW)磁場の方向からNV配向を可変パルス変調ラムゼー列にラベル付けする新しいバイアス場のない手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 13:26:10 GMT)
Beyond Exponential Decay: Rethinking Error Accumulation in Large Language Models [0.0] エラーは均一に分散されていないが、重要な決定ジャンクションを表すスパースな"キートークン"に集中していることを示す。
本稿では,意味的に重要なトークンを選択的に保存することを目的とした次世代システムのためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 03:57:31 GMT)
BPE Stays on SCRIPT: Structured Encoding for Robust Multilingual Pretokenization [0.0] SCRIPT (Script Category Representation in PreTokenization) は、Unicodeスクリプトとカテゴリプロパティに基づいた初期トークンを使用することで、バイト8変換をバイパスする新しい符号化方式である。
実験により,SCRIPT-BPEは,非ラテン文字言語に対する符号化に基づくペナルティを排除しながら,競合圧縮を実現することを示した。
論文参考訳(メタデータ) (Fri, 30 May 2025 15:12:41 GMT)
Axioms of Quantum Mechanics in light of Continuous Model Theory [0.0] このノートの目的は、物理学者 (Dirac calculus) によって使われる量子力学の非公式な公理系を連続論理の言語で再放送することである。
我々は、一階述語論理の代数化の道具としてのタルスキのシリンド代数の概念と、物理学の連続論理の同じ目的を果たすことができるヒルベルト空間との類似性に注目した。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:33:56 GMT)
Awes, Laws, and Flaws From Today's LLM Research [0.0] 我々は,2020年から2024年の間に2000件を超える研究成果を,良質な研究とされる基準に基づいて評価した。
倫理的否定者の減少、評価者としてのLLMの台頭、人的評価を生かさないLLM推論能力の主張の増加など、さまざまな傾向を見出した。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:55:40 GMT)
Authentication and authorization in Data Spaces: A relationship-based access control approach for policy specification based on ODRL [0.0] 本稿では,Open Digital Rights Language (ODRL) の標準である ODRL Data Spaces (ODS) プロファイルの拡張を提案する。
このアプローチはOpenFGAを含むユースケースを通じて検証され、関係ベースのアクセス制御シナリオの適用性を示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:00:24 GMT)
Attractor learning for spatiotemporally chaotic dynamical systems using echo state networks with transfer learning [0.0] 本稿では,一般的な倉本・シンスキー(gKS)方程式に対するエコー状態ネットワーク(ESN)の予測能力について検討する。
本稿では,gKSモデルのパラメータの多様性にまたがる予測性能を向上させるために,ESNとトランスファー学習を統合する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 01:01:09 GMT)
Artificial Empathy: AI based Mental Health [0.0] 多くの人は精神疾患に悩まされるが、誰もが専門的な援助を求めたり、メンタルヘルスにアクセスできるわけではない。
AIチャットボットは、精神疾患を持つ人や、誰かと話したい人にとって、ますます行き詰まりになっている。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:36:56 GMT)
Anomaly Detection and Improvement of Clusters using Enhanced K-Means Algorithm [0.0] 本研究では,Nクラスタのクラスタ内分散を,大域的最小値に到達するまで反復的に低減するアルゴリズムを提案する。
本研究では, シルエット係数, Calinski-Harabasz 指数, Davies-Bouldin 指数など, 教師なし学習の本質的尺度を用いて評価を行った。
合成データとUCI乳癌およびUCIワイン品質データセットの外部検証には、Jaccard類似度スコア、V尺度、F1スコアが使用されている。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:56:53 GMT)
Aligning Language Models with Observational Data: Opportunities and Risks from a Causal Perspective [0.0] 本研究では,観測データを用いた大規模言語モデルの微調整の課題と機会について検討する。
観察結果が貴重な監視を提供する一方で、そのようなデータを直接微調整することで、素早い相関関係を学習できることが示される。
報奨信号から既知の共同創設者の効果を明示的に除去する手法であるDeconfoundLMを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:44:09 GMT)
Adversarial Threat Vectors and Risk Mitigation for Retrieval-Augmented Generation Systems [0.0] Retrieval-Augmented Generation (RAG) システムは、Large Language Models (LLM) を外部の知識ソースと統合する。
本稿では,最近の産業採用動向を通したRAGシステムの重要性を考察し,RAGの攻撃ベクトルとして,即時注入,データ中毒,対逆クエリ操作などを挙げる。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:22:05 GMT)
Accurate heat currents via reorganised master equation [0.0] 我々は「再構成されたマスター方程式」が熱電流の非常に正確な推定をいかに生み出すかを示す。
特に、そのようなマスター方程式は熱電流の計算において「非再編成」の方程式よりも優れている。
論文参考訳(メタデータ) (Fri, 30 May 2025 22:03:45 GMT)
Absence of topological order in the $U(1)$ checkerboard toric code [0.0] 2つの異なる星部分格子を持つ$U(1)$-対称性富化トーリック符号に対応する$U(1)$チェッカーボードトーリック符号について検討する。
これらの非自明な性質は、孤立した恒星の摂動限界において自然に説明できることを示す。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:02:02 GMT)
AC-Stark Spectroscopy of Interactions between Moiré Excitons and Polarons [0.0] 我々は非線形ポンププローブ分光法を用いて電荷調整可能なMoSe$$WS$$moir'eヘテロ構造における光励起を研究する。
弱共振レーザーパルスによる結果として生じるアクスターク効果を測定することにより、基本光励起の性質と相互相互作用にアクセスできる。
論文参考訳(メタデータ) (Fri, 30 May 2025 12:19:53 GMT)
A universal constraint for relaxation rates for quantum Markov generators: complete positivity and beyond [0.0] 普遍的制約の妥当性に影響を与えることなく,2-正に緩和できることを示す。
また、これらの境界と量子過程における定常状態の数との関係についても検討する。
論文参考訳(メタデータ) (Fri, 30 May 2025 11:11:40 GMT)
A Reward-driven Automated Webshell Malicious-code Generator for Red-teaming [0.0] 難読化メソッドによって整理された、公開され、適切に分類された悪意のあるコードデータセットが大幅に不足している。
既存の悪意のあるコード生成手法は、主に迅速なエンジニアリングに依存しており、しばしばそれらが生成するペイロードの多様性と高い冗長性に悩まされる。
我々は、red-teamingアプリケーション用に設計されたtextbfRAWG, textbfReward-driven textbfAutomated textbfWebshell Malicious-code textbfGeneratorを提案する。
論文参考訳(メタデータ) (Fri, 30 May 2025 06:16:42 GMT)
A Review of Design Concerns in Superconducting Quantum Circuits [0.0] 本稿では,量子情報応用のための超伝導回路デバイスの設計プロセスについて述べる。
デバイス上で望ましい実効ハミルトニアンを実装するために考慮すべき要因について論じる。
論文参考訳(メタデータ) (Fri, 30 May 2025 02:07:39 GMT)
A Reinforcement Learning-Based Telematic Routing Protocol for the Internet of Underwater Things [0.0] 本稿では,RL-RPL-UA(RL-RPL-UA)について紹介する。
RL-RPL-UAは、標準のRPLメッセージとの完全な互換性を維持し、リアルタイムな意思決定をサポートするための動的目的関数を追加する。
Aqua-Simを用いたシミュレーションでは、RL-RPL-UAはパケット配信を最大9.2%増加させ、パケット当たりのエネルギー使用量を14.8%削減し、従来の方法と比較してネットワーク寿命を80秒延長している。
論文参考訳(メタデータ) (Fri, 30 May 2025 18:11:31 GMT)
A New Representation of Binary Sequences by means of Boolean Functions [0.0] ブール関数のいくつかの性質を二進列を通して研究し、その逆も検討する。
また、そのような表現とブール関数の他の表現との関係についても検討する。
最後に、ブール関数とそれらの性質のいくつかの観点から一般化自己収縮列を解析する。
論文参考訳(メタデータ) (Fri, 30 May 2025 10:28:45 GMT)
A Dirichlet stochastic block model for composition-weighted networks [0.0] 合成重みベクトルの直接モデリングに基づく合成重み付きネットワークのブロックモデルを提案する。
推論は分類期待-最大化アルゴリズムの拡張によって実装される。
このモデルはシミュレーション研究を用いて検証され,Erasmus交換プログラムのネットワークデータと,ロンドン市における自転車共有ネットワークで実証された。
論文参考訳(メタデータ) (Fri, 30 May 2025 16:15:56 GMT)
A 3D Mobile Crowdsensing Framework for Sustainable Urban Digital Twins [0.0] 持続可能な都市デジタル双生児(UDT)を対象とした3次元移動群集センシング(3D-MCS)フレームワークを提案する。
本フレームワークは,(1)アクティブモデルと受動モデルからなる3D-MCS機構,(2)Geohashに基づく空間情報管理機構,(3)UDTのためのダイナミックポイントクラウド統合機構の4つの主要なメカニズムから構成される。
論文参考訳(メタデータ) (Fri, 30 May 2025 08:42:24 GMT)