From Selection to Generation: A Survey of LLM-based Active Learning [153.8] 大きな言語モデル(LLM)は、全く新しいデータインスタンスを生成し、よりコスト効率の良いアノテーションを提供するために使われています。
本調査は,LSMに基づくAL手法の直感的な理解を目指して,研究者や実践者の最新のリソースとして機能することを目的としている。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:20:09 GMT)
Autoregressive Models in Vision: A Survey [119.2] 本調査は、視覚に適用される自己回帰モデルに関する文献を包括的に調査する。
視覚的自己回帰モデルを,画素ベース,トークンベース,スケールベースを含む3つの一般的なサブカテゴリに分割する。
本稿では,画像生成,映像生成,3D生成,マルチモーダル生成など,コンピュータビジョンにおける自己回帰モデルの多面的分類を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:35:55 GMT)
Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.0] G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:33:17 GMT)
G2S: A General-to-Specific Learning Framework for Temporal Knowledge Graph Forecasting with Large Language Models [109.0] 上記の2種類の知識の学習過程を解き放つ汎用学習フレームワーク(G2S)を提案する。
一般学習の段階では、異なるTKGのシナリオ情報を隠蔽し、匿名の時間構造に変換する。
特定の学習段階では、コンテキスト内学習または微調整モードによって、シナリオ情報を構造に注入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:57:19 GMT)
Scaling Diffusion Language Models via Adaptation from Autoregressive Models [105.7] 拡散言語モデル(DLM)は、テキスト生成モデルのための将来性のある新しいパラダイムとして登場した。
170Mから7BまでのARモデルをDiffuGPTとDiffuLLaMAの拡散モデルに変換し、200B未満のトークンでトレーニングできることを示す。
実験の結果,これらのモデルは初期のDLMよりも優れており,ARと競合していることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:01:57 GMT)
Existing Large Language Model Unlearning Evaluations Are Inconclusive [105.6] いくつかの評価では、モデルにかなりの新しい情報を導入し、真の未学習のパフォーマンスを隠蔽する可能性があることを示す。
評価結果はタスクによって大きく異なることを示し、現在の評価ルーチンの一般化性を損なうことを示した。
今後の未学習評価には,情報注入の最小化とタスク認識のダウンストリームという2つの原則を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:43:00 GMT)
Immune: Improving Safety Against Jailbreaks in Multi-modal LLMs via Inference-Time Alignment [97.4] 訓練時安全アライメントにもかかわらず、Multimodal Large Language Models (MLLM) はジェイルブレイク攻撃に対して脆弱である。
我々は,ジェイルブレイク攻撃に対する防御のために,制御復号化による安全な報酬モデルを活用する推論時防御フレームワークImmuneを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:36:22 GMT)
CRAVES: Controlling Robotic Arm with a Vision-based Economic System [96.6] 現実のタスクを達成するためにロボットアームを訓練することは、アカデミックと産業の両方で注目を集めている。
本研究は,この分野におけるコンピュータビジョンアルゴリズムの役割について論じる。
本稿では,3次元モデルを用いて大量の合成データを生成する方法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:10:58 GMT)
Protecting multimodal large language models against misleading visualizations [94.7] この結果から,誤解を招く可視化に対する質問応答(QA)の精度が,ランダムなベースラインのレベルに平均で低下していることが示唆された。
本研究では,非ミスリーディングの精度を損なうことなく,誤解を招くビジュアライゼーションにおけるQA性能を改善するための最初の推論時間手法を提案する。
テーブルベースのQAと視覚化を再描画する2つの方法が有効であり、最大19.6ポイントの改善が期待できる。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:48:25 GMT)
One RL to See Them All: Visual Triple Unified Reinforcement Learning [92.9] V-Triuneは、視覚的推論と知覚タスクを1つのトレーニングパイプライン内で実現するビジュアルトリプル統一強化学習システムである。
V-Triuneは3つの補完的なコンポーネントで構成されている: Sample-Level Datashelf (多様なタスク入力を統一する)、Verifier-Level Reward (特殊検証を通じてカスタム報酬を提供する)。
本稿では,V-Triuneが処理する知覚タスクに対して適応的,進行的,明確なフィードバックを提供する,新しい動的IoU報酬を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:52:01 GMT)
Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence [90.9] 我々は,Swarmインテリジェンスを介してLLMを適応させる協調探索アルゴリズムであるModel Swarmsを提案する。
モデルSwarmsは、LLMの専門家を1つのタスク、マルチタスクドメイン、報酬モデル、そして多様な人間の興味に柔軟に適用できることを示します。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:27:47 GMT)
Personalized Generation In Large Model Era: A Survey [90.8] 大規模モデルの時代には、コンテンツ生成は徐々にパーソナライズドジェネレーション(PGen)へとシフトしている。
本報告では,PGen に関する総合的な調査を行い,この急速に成長する分野における既存研究について考察する。
複数のモダリティにまたがるPGen研究をブリッジすることで、この調査は知識共有と学際的コラボレーションを促進する貴重な情報源となる。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:25:45 GMT)
Acting Less is Reasoning More! Teaching Model to Act Efficiently [87.3] ツール統合推論は、タスクを解決するために外部ツールを呼び出す機能によって、大きな言語モデルを拡張します。
現在のアプローチは、外部ツールの使用効率や必要性を考慮せずに、最終的な正確性のためにのみ最適化されている。
最小限のツールコールで正確な回答をモデルに提示するフレームワークを提案する。
このアプローチでは,ツールコールを最大68.3%削減し,ツールの生産性を最大215.4%向上すると同時に,同等の回答精度を維持している。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:08:42 GMT)
RelDiff: Relational Data Generative Modeling with Graph-Based Diffusion Models [83.6] RelDiffは、外部キーグラフ構造を明示的にモデル化することによって完全な関係データベースを合成する新しい拡散生成モデルである。
RelDiffは、現実的で一貫性のある合成リレーショナルデータベースの作成において、従来手法よりも一貫して優れている。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:01:02 GMT)
Con Instruction: Universal Jailbreaking of Multimodal Large Language Models via Non-Textual Modalities [76.9] 既存のマルチモーダル言語モデル(MLLM)に対する攻撃は、主に敵対的な画像を伴うテキストを通して指示を伝える。
我々はMLLMの能力を利用して、非テキスト命令、具体的には、我々の新しい手法であるCon Instructionによって生成された逆画像やオーディオを解釈する。
LLaVA-v1.5 (13B)で81.3%,86.6%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:11:14 GMT)
Dyna-Think: Synergizing Reasoning, Acting, and World Model Simulation in AI Agents [76.9] 本稿では,AIエージェントの性能向上のための推論と行動を伴う内的世界モデルとプランニングを統合した思考フレームワークDyna-Thinkを提案する。
DITは、R1の思考プロセスを再構築し、提案された(計画された)行動に関連する世界モデルシミュレーションの実行に集中し、この再構成データを用いてポリシーを訓練する。
DDTは2段階のトレーニングプロセスを使用して、まず状態予測や批判生成といった目的を通じてエージェントの世界モデリング能力を改善し、次にポリシートレーニングを通じてエージェントのアクションを改善する。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:10:18 GMT)
Risk and cross validation in ridge regression with correlated samples [72.6] 我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:33:09 GMT)
SkillVerse : Assessing and Enhancing LLMs with Tree Evaluation [70.3] SkillVerseは、特定の能力におけるモデル習熟度を理解するための教師なしツリー構造化診断フレームワークである。
任意のレベルの粒度の習熟度を考慮すれば、SkillVerseはモダンな大規模モデルの振る舞いの洞察を生み出す柔軟性がある。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:08:59 GMT)
The Mirage of Model Editing: Revisiting Evaluation in the Wild [70.2] 我々は、広く使われている質問応答(QA)データセットに対応する新しいベンチマークであるQAEditと、タスクに依存しない評価フレームワークであるWILDを紹介する。
単一の編集実験により、現在行われている編集手法は、以前報告したよりもかなり悪い結果が得られた。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:12:14 GMT)
Towards Modality Generalization: A Benchmark and Prospective Analysis [68.2] 本稿では,モダリティ・ジェネリゼーション(MG)について述べる。
マルチモーダルアルゴリズムを特徴とする包括的ベンチマークを提案し,一般化に着目した既存手法を適用した。
私たちの研究は、堅牢で適応可能なマルチモーダルモデルを進化させる基盤を提供し、現実的なシナリオで目に見えないモダリティを扱えるようにします。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:26:54 GMT)
MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.6] 医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。
具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。
5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:22:55 GMT)
KnowCoder-X: Boosting Multilingual Information Extraction via Code [62.7] 汎用IEのための高度な言語間および多言語機能を備えた強力なコードLLMであるKnowCoder-Xを提案する。
Pythonクラスを使用して多言語スキーマの表現を標準化し、異なる言語間で一貫性を確保する。
KnowCoder-XはIEアライメントを強化することで、言語間IE転送を大幅に強化する。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:13:09 GMT)
Rethinking Backdoor Attacks on Dataset Distillation: A Kernel Method Perspective [62.0] 本稿では, データセット蒸留に特化した2つの新しい理論駆動トリガパターン生成手法を提案する。
最適化に基づくトリガ設計フレームワークは,データセットの蒸留に対する効果的なバックドア攻撃を通知する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:47:36 GMT)
The iNaturalist Sounds Dataset [60.2] iNatSoundsは、5500種以上の音をキャプチャする23万のオーディオファイルのコレクションで、世界中で27,000人以上のレコーダーが貢献している。
このデータセットは、鳥類、哺乳類、昆虫、虫類、両生類からの音を包含し、iNaturalistに提出された観察から得られたオーディオおよび種名を含む。
我々は、次世代の公的なエンゲージメントアプリケーションを支えるこのデータに基づいて訓練されたモデルを構想し、大規模なオーディオコレクションの処理において生物学者、生態学者、土地利用管理者を支援する。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:07:37 GMT)
Scaling Textual Gradients via Sampling-Based Momentum [59.9] Textual Gradient Descent (TGD)フレームワークは、有望なデータ駆動アプローチとして登場した。
トレーニングサンプルの数をスケールすることで結果が改善されるが、後にTGDのパフォーマンスが低下する。
本稿では,テキスト・グラディエント・ Descent with Momentum (TSGD-M) を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:35:45 GMT)
ARIA: Training Language Agents with Intention-Driven Reward Aggregation [58.1] 本稿では,効率よく効果的な言語エージェント訓練を実現するために,意図空間内のリワードを集約する手法であるARIAを提案する。
ARIAは、高次元のジョイントトークン分布空間から低次元の意図空間に自然言語アクションを投影することを目的としており、そこでは意味的に類似したアクションがクラスタ化され、共有報酬が割り当てられる。
大規模な実験では、ARIAは政策勾配のばらつきを著しく低減するだけでなく、4つの下流タスクで平均9.95%のパフォーマンス向上をもたらし、オフラインとオンラインのRLベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:54:49 GMT)
PromptRefine: Enhancing Few-Shot Performance on Low-Resource Indic Languages with Example Selection from Related Example Banks [57.9] 大規模言語モデル(LLM)は、近ごろ、コンテキスト内学習(ICL)を通じて、印象的な数ショットの学習能力を実証した。
ICLのパフォーマンスは、数発のデモの選択に大きく依存しており、最も最適な例の選択は永続的な研究課題である。
本稿では,低リソースのIndic言語におけるICLの性能向上を目的とした,新しい代替最小化手法であるPromptRefineを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:34:02 GMT)
Chain-of-Thought Training for Open E2E Spoken Dialogue Systems [57.8] エンド・ツー・エンド(E2E)音声対話システムは完全な識別性を保ち、非音声情報をキャプチャする。
我々は,多モーダル言語モデルと密接に一致した会話データによる学習を確実にするためのチェーン・オブ・シント(CoT)の定式化を提案する。
提案手法はベースラインよりも1.5ROUGE-1の改善を実現し,一般公開された人間と人間の会話データセット上で音声対話システムの訓練に成功している。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:43:37 GMT)
AVadCLIP: Audio-Visual Collaboration for Robust Video Anomaly Detection [57.6] 本稿では,ロバストなビデオ異常検出に音声と視覚の協調を利用する,弱教師付きフレームワークを提案する。
本フレームワークは,複数のベンチマークにおいて優れた性能を示し,オーディオ統合により異常検出精度が大幅に向上する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:52:07 GMT)
How to Select Datapoints for Efficient Human Evaluation of NLG Models? [57.6] 我々は,人間の評価に最も有用なデータポイントを得るために,セレクタスイートを開発し,分析する。
本研究では,自動測定値の分散に基づくセレクタ,モデル出力の多様性,項目応答理論がランダム選択より優れていることを示す。
特に,情報源に基づく推定手法を導入し,情報源のテキストに基づいて人体評価に有用な項目を推定する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:55:39 GMT)
Normalized Attention Guidance: Universal Negative Guidance for Diffusion Model [57.2] 注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文参考訳(メタデータ) (Sat, 31 May 2025 18:16:47 GMT)
SCAR: Data Selection via Style Consistency-Aware Response Ranking for Efficient Instruction-Tuning of Large Language Models [56.9] 本研究は, 応答における2つの重要なスタイル的要素, 言語形式と指導的前提を同定する。
これに触発されて、スタイル一貫性対応対応ランキング(SCAR)を導入する。
SCARは、そのレスポンススタイリスティックな一貫性に基づいて、トレーニングセット内の命令-レスポンスペアを優先順位付けする。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:53:22 GMT)
Beyond Factual Accuracy: Evaluating Coverage of Diverse Factual Information in Long-form Text Generation [56.8] ICATは、長文テキスト生成における多様な事実情報のカバレッジを測定するための評価フレームワークである。
原子の事実的クレームと出力で提示されるであろう様々な側面のアライメントを計算する。
私たちのフレームワークは、多様性とカバレッジの解釈可能かつきめ細かな分析を提供します。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:23:14 GMT)
Harnessing PDF Data for Improving Japanese Large Multimodal Models [56.8] 大規模マルチモーダルモデル (LMM) は英語では高い性能を示したが、日本語では有効性は限られている。
現在の日本のLMMは、しばしば翻訳された英語のデータセットに依存しており、日本固有の文化知識を捉える能力を制限する。
我々は、事前訓練されたモデルを利用してPDFから画像とテキストのペアを抽出する完全自動パイプラインを導入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:33:53 GMT)
Curiosity-Driven Reinforcement Learning from Human Feedback [56.5] 人間のフィードバックからの強化学習(RLHF)は、大きな言語モデルと人間の好みを一致させるのに有効であるが、出力の多様性を減らすためにしばしば効果的である。
好奇心駆動型RLHF(CD-RLHF)を導入する。
テキスト要約や命令追従を含むタスクの広範な実験を通じて,CD-RLHFの有効性を実証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:08:55 GMT)
World Models for Cognitive Agents: Transforming Edge Intelligence in Future Networks [55.9] 本稿では,世界モデルを概観し,そのアーキテクチャ,トレーニングパラダイム,予測,生成,計画,因果推論といった応用を概観する。
ワイヤレスエッジインテリジェンス最適化に適した,新しい世界モデルに基づく強化学習フレームワークであるWireless Dreamerを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:43:00 GMT)
Insight Over Sight: Exploring the Vision-Knowledge Conflicts in Multimodal LLMs [55.7] 本稿では,マルチモーダル大言語モデル(MLLM)におけるコモンセンスレベル・ビジョン・知識衝突の問題について考察する。
MLLMにおけるこれらの競合をシミュレートし、評価するために設計された入力を生成するために、人間のループ品質制御を付加した自動フレームワークを導入する。
このフレームワークを用いて、374のオリジナル画像と1,122の高品質な質問応答対からなる診断ベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:59:15 GMT)
LDMol: A Text-to-Molecule Diffusion Model with Structurally Informative Latent Space Surpasses AR Models [55.5] テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
実験の結果, LDMolはテキストから分子生成ベンチマークにおいて, 既存の自己回帰ベースラインよりも優れていた。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:53:20 GMT)
Evaluating Robot Policies in a World Model [54.9] WPE(World-model-based Policy Evaluation)について検討する。
WPEは実際のビデオのようにロボットアームの動きを模倣することで高い忠実性を達成する。
WPEは実世界の展開前にロボットポリシーを評価する出発点として機能することを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:51:56 GMT)
Active Multi-task Policy Fine-tuning [54.7] AMF(Active Multi-task Fine-tuning)を提案する。
我々は,AMFの性能保証を規則性仮定で導き,複雑・高次元環境における実験的有効性を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:53:51 GMT)
QuickVideo: Real-Time Long Video Understanding with System Algorithm Co-Design [54.4] ビデオ監視、会議要約、教育講義分析、スポーツ放送といった現実の応用において、ロングビデオ理解が重要な機能として現れてきた。
我々は,リアルタイムダウンストリームアプリケーションをサポートするために,長時間ビデオ理解を大幅に高速化するシステムアルゴリズムの共同設計であるQuickVideoを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:43:36 GMT)
Don't Let Your Robot be Harmful: Responsible Robotic Manipulation via Safety-as-Policy [53.0] ロボット操作における人間の指示の実行は、深刻な安全性のリスクにつながる可能性がある。
i) 安全リスクを含むシナリオを自動生成し、仮想的なインタラクションを行う世界モデルと、(ii) 反射による結果を予測するメンタルモデルを含む。
本研究は, 安全行政がリスクを回避し, 合成データセットと実世界の両方の実験において, 効率的にタスクを完了できることを実証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:19:45 GMT)
Co-Reinforcement Learning for Unified Multimodal Understanding and Generation [53.0] 本稿では,統一多モーダル大言語モデル(ULM)に対するグループ相対的政策最適化による強化学習(RL)の先駆的な探索について述べる。
共同最適化のための統一RLステージとタスク固有強化のための改良RLステージからなる協調強化学習フレームワークであるCoRLを紹介する。
提案したCoRLでは,3つのテキスト・画像生成データセットで平均7%,9つのマルチモーダル理解ベンチマークで平均23%の改善を実現している。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:51:12 GMT)
PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.7] ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。
PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:26:02 GMT)
Bounded Rationality for LLMs: Satisficing Alignment at Inference-Time [52.2] 本稿では,2次基準のしきい値に基づく制約を満たしつつ,主目的を最大化し,アライメントの多面性に対処する推論フレームワークSITAlignを提案する。
我々は、満足度に基づく推論アライメントアプローチの準最適境界を導出することで理論的洞察を提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:47:06 GMT)
Judging Quality Across Languages: A Multilingual Approach to Pretraining Data Filtering with Language Models [52.2] 大規模言語モデル(LLM)を効果的に事前学習するためには,高品質な多言語学習データが不可欠である
本稿では,多言語多言語データを大規模に効率的にキュレートする体系的アプローチであるJQLを紹介する。
JQLは、LLMのアノテーション機能を、事前トレーニングされた多言語埋め込みに基づいて軽量アノテータに蒸留する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:28:40 GMT)
M$^3$-VOS: Multi-Phase, Multi-Transition, and Multi-Scenery Video Object Segmentation [51.8] 本稿では,その視覚的特徴と潜在的な形態的・外見的変化に基づいて,現実世界の物体を分類するセグメンテーションにおける位相の概念を紹介する。
本稿では,オブジェクトの位相を理解するためのモデルの有効性を検証するために,新しいベンチマーク,Multi-Phase,Multi-Transition,Multi-Scenery Video Object (M$3$-VOS)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:24:10 GMT)
Tokenizing Electron Cloud in Protein-Ligand Interaction Learning [51.7] ECBindは電子雲信号を量子化埋め込みにトークン化する方法である。
これは、原子レベルのモデルで完全に表現できないバインディングモードを明らかにするのに役立つ。
適用範囲を幅広いシナリオに広げるために,我々は知識蒸留を用いて電子クラウドに依存しない予測モデルを構築した。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:00:35 GMT)
Vid2Coach: Transforming How-To Videos into Task Assistants [51.7] 我々は、ハウツービデオをウェアラブルカメラベースのアシスタントに変換するシステムVid2Coachを提案する。
Vid2Coachは、各ステップのデモの詳細と完了基準を付加して、アクセス可能な命令を生成する。
次に、BLV固有のリソースから関連する非視覚的回避策を抽出するために、検索増強世代を使用する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:28:50 GMT)
Personalized Graph-Based Retrieval for Large Language Models [51.7] ユーザ中心の知識グラフを利用してパーソナライゼーションを強化するフレームワークを提案する。
構造化されたユーザ知識を直接検索プロセスに統合し、ユーザ関連コンテキストにプロンプトを拡大することにより、PGraphはコンテキスト理解と出力品質を向上させる。
また,ユーザ履歴が不足あるいは利用できない実環境において,パーソナライズされたテキスト生成タスクを評価するために設計された,パーソナライズドグラフベースのテキスト生成ベンチマークを導入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:33:39 GMT)
Accelerating Diffusion LLMs via Adaptive Parallel Decoding [51.0] 並列にサンプリングされたトークンの数を動的に調整する新しい手法であるアダプティブ並列復号法(APD)を導入する。
APDは、ダウンストリームベンチマークで最小限の品質劣化を伴って、非常に高いスループットを提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:10:10 GMT)
CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [50.9] 本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:52:56 GMT)
Point Cloud Mixture-of-Domain-Experts Model for 3D Self-supervised Learning [50.6] ポイントクラウドは、3Dデータの主表現として、シーンドメインポイントクラウドとオブジェクトドメインポイントクラウドに分類することができる。
本稿では,ブロック・ツー・シーン事前学習戦略を用いて,総合的なPoint Cloud Mixture-of-Domain-Expertsモデル(Point-MoDE)を学習することを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:09:54 GMT)
Towards a Sharp Analysis of Offline Policy Learning for $f$-Divergence-Regularized Contextual Bandits [50.0] 我々は$f$-divergence-regularized offline policy learningを分析する。
逆Kullback-Leibler (KL) の発散に対して、単極集中性の下での最初の$tildeO(epsilon-1)$サンプル複雑性を与える。
これらの結果は,$f$-divergence-regularized policy learningの包括的理解に向けて大きな一歩を踏み出したものと考えられる。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:12:14 GMT)
Dyn-HaMR: Recovering 4D Interacting Hand Motion from a Dynamic Camera [49.8] Dyn-HaMRは、野生のダイナミックカメラで撮影されたモノクロビデオから4Dグローバルハンドモーションを再構築する最初のアプローチである。
提案手法は,4次元メッシュ・リカバリにおいて最先端の手法を著しく上回ることを示す。
これにより、動くカメラでモノクロビデオから手の動きを復元するための新しいベンチマークが確立される。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:35:49 GMT)
Model Reprogramming Demystified: A Neural Tangent Kernel Perspective [49.4] 本稿では,ニューラルタンジェントカーネル(NTK)フレームワークのレンズを用いて,モデル再プログラミング(MR)の包括的理論的解析を行う。
目的とするデータセット上でのNTK行列の固有値スペクトルによってMRの成功が制御されることを示す。
我々の貢献には、MRの新たな理論フレームワーク、ソースモデルとターゲットモデルの関係に関する洞察、そして我々の発見を検証した広範な実験が含まれる。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:15:04 GMT)
An All-Atom Generative Model for Designing Protein Complexes [49.1] APM(All-Atom Protein Generative Model)は、マルチチェーンタンパク質をモデル化するためのモデルである。
鎖間相互作用を正確にモデル化し、結合能力を持つタンパク質複合体をゼロから設計することができる。
また、多鎖タンパク質の折りたたみおよび逆折りのタスクも行う。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:26:21 GMT)
ChatReID: Open-ended Interactive Person Retrieval via Hierarchical Progressive Tuning for Vision Language Models [49.1] 人物の再識別はコンピュータビジョンにおいて重要な課題であり、重複しないカメラビューを通して個人を認識することを目的としている。
本稿では,テキストを優先した検索パラダイムに焦点を移し,フレキシブルかつインタラクティブな再識別を可能にする新しいフレームワークChatReIDを提案する。
本稿では,人物属性の理解からきめ細かい画像検索,マルチモーダルタスク推論に至るまで,3段階のチューニングを通じてRe-ID能力を実現する階層的プログレッシブチューニング戦略を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:10:57 GMT)
FLoE: Fisher-Based Layer Selection for Efficient Sparse Adaptation of Low-Rank Experts [47.4] FLoEは、(i)MoEベースの低ランク適応のためのタスククリティカルトランスフォーマー層を動的に識別するFisher情報誘導重要度スコアリング機構、(ii)網羅的検索なしで特定のデータセット上で最適なLoRAランクを自動的に決定するベイズ最適化駆動ランクアロケータである。
多様なLCMとベンチマークの実験により、FLoEは顕著な効率と精度のトレードオフを達成し、FLoEは特に迅速な適応を必要とする資源制約環境において有利であることが明らかとなった。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:27:08 GMT)
Improving Optical Flow and Stereo Depth Estimation by Leveraging Uncertainty-Based Learning Difficulties [46.4] 本稿では,空間的に異なる学習困難を捉える不確実性に基づく信頼マップについて検討する。
我々はまず,誤りに基づく信頼度尺度を用いて,問題となるピクセルや領域により集中するようネットワークに促すDifficulty Balancing(DB)損失を提示する。
そこで本研究では,Occlusion Avoiding (OA)損失を回路整合性に基づく信頼性領域に誘導する手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:37:12 GMT)
Preference-based learning for news headline recommendation [46.3] 本研究では、優先学習によるニュース見出し推薦の最適化戦略について検討する。
リアルタイムのユーザインタラクションデータとフランス語のオンラインニュース投稿を併用して,コンテキスト的バンディット設定の下で見出し推薦エージェントを学習する。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:57:56 GMT)
Exploring Multi-Modal Data with Tool-Augmented LLM Agents for Precise Causal Discovery [45.8] ツール拡張 LLM を利用したマルチエージェントシステムである MATMCD を紹介する。
以上の結果から,マルチモーダル化による因果発見の可能性が示唆された。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:01:54 GMT)
Understanding Behavioral Metric Learning: A Large-Scale Study on Distracting Reinforcement Learning Environments [45.5] 状態抽象化の鍵となるアプローチは、観察空間における行動メトリクスを近似し、これらの学習を表現空間に埋め込むことである。
設計選択の異なる等尺的埋め込みとして概念的に統一された最近の5つのアプローチを評価する。
20のステートベースタスクと14のピクセルベースのタスクにまたがってベースラインでベンチマークを行い、370のタスク設定と多様なノイズ設定にまたがる。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:43:41 GMT)
Pitfalls in Evaluating Language Model Forecasters [45.4] 我々はコミュニティとして、大きな言語モデルを評価するような結論に注意する必要があると論じている。
1) 時間的リークによる評価結果の信頼の難しさ,(2) 評価性能から実世界の予測への外挿の難しさ,の2つのカテゴリを識別する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:49:17 GMT)
TabFSBench: Tabular Benchmark for Feature Shifts in Open Environments [45.4] タブラルデータは様々な機械学習タスクで広く利用されている。
これまでの研究は主に分布シフトを緩和することに集中してきたが、特徴シフトは限定的な注目を集めた。
本稿では,表型データにおける特徴シフトに関する最初の包括的研究を行い,最初の表型特徴シフトベンチマーク(TabFSBench)を紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:08:18 GMT)
Data Swarms: Optimizable Generation of Synthetic Evaluation Data [45.0] 合成評価データの生成を最適化するアルゴリズムであるData Swarmsを提案する。
まず、既存のデータを用いて初期データ生成者の群れを訓練し、様々な評価目標を定義する。
次に、データジェネレータのスワムを最適化するために、パーティクルスワムを最適化する。
我々はそれをAdversarial Swarmsに拡張し、データジェネレータSwarmはより難しいデータを生成し、テストテイカーモデルSwarmはそのようなデータから学習する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:03:46 GMT)
Fortune: Formula-Driven Reinforcement Learning for Symbolic Table Reasoning in Language Models [44.3] 本稿では,LMを訓練して実行可能なスプレッドシート式を生成する強化学習フレームワークであるフォーミュラチューニングを提案する。
フォーミュラ・タニングは、二項応答の正しさを報奨信号として利用することにより、教師付き公式アノテーションへの依存を減らす。
これは、特に多段階の数値およびシンボリック推論タスクにおいて、LM性能を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:32:09 GMT)
Can Language Models Reason about Individualistic Human Values and Preferences? [44.2] 個人主義的価値推論の課題について言語モデル(LM)について検討する。
最前線のLMでは, 個性値の予測において, 55~65%の精度しか達成できない限界がみられた。
提案した値不等式指数(sigma Inequity)によって測定された大域的個人主義的価値の推論におけるLMの部分性も同定する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:22:11 GMT)
RAG-Gym: Systematic Optimization of Language Agents for Retrieval-Augmented Generation [43.5] 本稿では,(1)プロンプトエンジニアリング,(2)アクターチューニング,(3)批判的トレーニングという,3つの最適化次元を探求する総合的なプラットフォームであるRAG-Gymを紹介する。
本稿では,リフレクション推論を取り入れた新しいエージェントであるRe$2$Searchを提案する。
アクターチューニングにおいて,プロセスの監督をきめ細かい3つの人気のあるポストトレーニングアルゴリズムを評価し,直接選好最適化を最も効果的に評価する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:32:16 GMT)
More Thinking, Less Seeing? Assessing Amplified Hallucination in Multimodal Reasoning Models [43.5] テストタイム計算は、拡張推論チェーンを生成するために、大きな言語モデルに権限を与えた。
世代が長くなるにつれて、モデルは画像付きコンテンツから遠ざかっていき、言語優先に大きく依存する傾向にある。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:02:34 GMT)
K-order Ranking Preference Optimization for Large Language Models [43.2] トップKランキングの一貫性を最適化することは、現実世界のアプリケーションにもっと適している、と私たちは主張する。
そこで我々は,DPOのPlanet-Luceモデルを拡張して,上位Kランクに適合させることにより,K順序ランキング最適化(KPO)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:46:42 GMT)
High-order interactions in quantum optomechanics: fluctuations, dynamics and thermodynamics [43.2] 2-および3-フォノン散乱過程を特徴とする高次共振壁場相互作用について検討した。
ハミルトニアンの高次項の存在は、全ての粒子の人口とエントロピー生産率に大きな影響を及ぼす。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:37:05 GMT)
LayerCraft: Enhancing Text-to-Image Generation with CoT Reasoning and Layered Object Integration [43.1] 構造化され、階層化された画像生成と編集をオーケストレーションするモジュラーフレームワークであるtextbfLayerCraftを紹介します。
LayerCraftは2つの主要な機能をサポートしている: $textitstructured generation$ from simple prompts via chain-of-thinkt reasoning, $textitlayered object integration$ ユーザーはオブジェクトを挿入してカスタマイズできる。
このシステムはコーディネータエージェントと、CoT駆動レイアウト計画のための$textbfChainArchitect$と、オフザシェルフを使用したシームレスな画像編集のための$textbfObject Integration Network (OIN)$で構成されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:45:55 GMT)
BMIKE-53: Investigating Cross-Lingual Knowledge Editing with In-Context Learning [43.1] 本稿では,言語間言語間知識編集(IKE)のためのベンチマークBMIKE-53を紹介する。
言語横断的なKEは、無関係な知識を保持しながら、他言語にまたがって一般化するために、ある言語で編集された知識を必要とする。
以上より, モデルスケールと実演アライメントが言語間IKEの有効性を著しく左右することが明らかとなった。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:21:04 GMT)
How Significant Are the Real Performance Gains? An Unbiased Evaluation Framework for GraphRAG [43.0] GraphRAG(Graph-based search-augmented generation)は,大規模言語モデル(LLM)を拡張し,ユーザの質問に対する質の高い回答を生成する。
GraphRAGの現在の回答評価フレームワークには、2つの重大な欠陥、すなわち無関係な質問と評価バイアスがある。
本稿では,グラフテキストによる質問生成を用いて,基礎となるデータセットに関する質問を生成する非バイアス評価フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:36:16 GMT)
TestNUC: Enhancing Test-Time Computing Approaches and Scaling through Neighboring Unlabeled Data Consistency [42.8] TestNUCは、隣接する未ラベルデータの局所的な一貫性を活用することで、テスト時の予測を改善する。
TestNUCは既存のテストタイムコンピューティングアプローチとシームレスに統合できる。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:53:48 GMT)
SST: Self-training with Self-adaptive Thresholding for Semi-supervised Learning [42.8] SST(Self-Adaptive Thresholding)は、新しい、効果的で効率的なSSLフレームワークである。
SSTはモデルの学習進捗に基づいてクラス固有のしきい値を調整する。
Semi-SST-ViT-Hugeは競合するImageNet-1K SSLベンチマークで最高の結果を得る。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:34:04 GMT)
Test-time Vocabulary Adaptation for Language-driven Object Detection [42.3] 本稿では,ユーザ定義語彙を改良するためのVocAda(VocAda)を提案する。
VocAdaはトレーニングを一切必要とせず、推論時に3つのステップで動作します。
COCOとObjects365の3つの最先端検出器による実験は、VocAdaが一貫して性能を改善していることを示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:15:29 GMT)
Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control [42.2] テキスト・トゥ・イメージ(T2I)モデルは、正確な空間レイアウト制御に苦慮している。
Seg2Anyは、高度なマルチモーダル拡散変換器上に構築された新しいS2Iフレームワークである。
Seg2Anyは、オープンセットとクローズセットの両方のS2Iベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:12:04 GMT)
SSAM: Self-Supervised Association Modeling for Test-Time Adaption [42.0] SSAM(Self-Supervised Association Modeling)は、2相アソシエーション学習による動的エンコーダの洗練を可能にする新しいTTAフレームワークである。
提案手法は,1)特徴空間の再構成を導くための確率的カテゴリアソシエーションを推定するソフトプロトタイプ推定(SPE)と,2)クラスタ条件による画像特徴再構成によるエンコーダの安定性を向上するPIR(Prototype-anchored Image Reconstruction)の2つの相乗的コンポーネントを介して動作する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:13:07 GMT)
OWSM v4: Improving Open Whisper-Style Speech Models via Data Scaling and Cleaning [41.5] Open Whisperスタイルの音声モデル(OWSM)プロジェクトは、一連の完全にオープンな音声基礎モデルを開発した。
この作業は、大規模なWebcrawledデータセットであるYODASとCreative Commonsライセンスを統合することでOWSMを強化する。
これを解決するために、公開ツールキットを用いたスケーラブルなデータクリーニングパイプラインを開発し、75言語にわたる166,000時間の音声データセットを生成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:44:44 GMT)
Concept-Centric Token Interpretation for Vector-Quantized Generative Models [41.4] 概念指向Token Explanation(CORTEX)はベクトル量子生成モデル(VQGM)を解釈するための新しいアプローチである
本フレームワークでは,(1)個々の画像中のトークンの重要度を解析するサンプルレベル説明法,(2)コードブック全体を探索してグローバルなトークンを見つけるコードブックレベル説明法という2つの手法を用いている。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:11:32 GMT)
AgentAuditor: Human-Level Safety and Security Evaluation for LLM Agents [41.0] sysは、トレーニングなし、メモリ拡張推論フレームワークである。
sysは、LLMが適応的に構造化された意味的特徴を抽出することで経験記憶を構築する。
Dataは、LLMベースの評価器が安全リスクとセキュリティ上の脅威の両方を見つけることができるかを確認するために設計された最初のベンチマークである。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:10:23 GMT)
KVTuner: Sensitivity-Aware Layer-Wise Mixed-Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference [41.0] KVキャッシュの量子化は、長いコンテキストにおける大規模言語モデル推論のスループットとレイテンシを改善することができる。
現在の方法では、KVキャッシュの量子化に対する階層的感度を見極めること、オンラインのきめ細かい決定のオーバーヘッドが高いこと、異なるLLMや制約に対する柔軟性の低いこと、の3つの未解決問題がある。
粗粒度のKVキャッシュに対して最適なハードウェアフレンドリなKV量子化ペアを適応的に探索する,シンプルで効果的なフレームワークKVTunerを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:45:23 GMT)
DYNAC: Dynamic Vocabulary based Non-Autoregressive Contextualization for Speech Recognition [40.3] CB (Contextual biasing) は、まれなフレーズと見えないフレーズの自動音声認識を改善する。
近年、動的語彙を導入し、文脈句を自己回帰(AR)モデルで拡張可能なトークンとして表現している。
本稿では動的語彙を中間層に統合する自己条件付きCTC法であるDYNACを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:53:25 GMT)
WaterSplatting: Fast Underwater 3D Scene Reconstruction Using Gaussian Splatting [39.6] 本研究では,水中データ処理を効果的に行うために,ボリュームレンダリングを3DGSで融合する手法を提案する。
提案手法は,海底シースルー-ネRFデータセットのレンダリング品質において,最先端のNeRF法よりも優れていた。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:42:44 GMT)
Marco-o1 v2: Towards Widening The Distillation Bottleneck for Reasoning Models [39.2] LRMの生成したデータに基づく蒸留は、より小さなモデルの推論能力を高めるための、単純かつ効果的な方法である。
このボトルネックを軽減するために,モンテカルロ木探索を用いて木に基づくCoTデータを構築することを提案する。
次に、構築したデータに基づいてSFTとRLを強化するために、Thoughts Length Balance, Fine-fine DPO, Joint Post-Training ObjectiveなどのCoT対応アプローチを利用する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:16:36 GMT)
Step-by-Step Mastery: Enhancing Soft Constraint Following Ability of Large Language Models [39.1] 大規模言語モデル(LLM)には、複数の制約を含む命令に従うことが不可欠である。
高品質な出力を持つデータセットを自動構築するパイプラインを設計する。
データ構築プロセス中に発生する正と負のサンプルを十分に活用するために、トレーニング手法として直接選好最適化(DPO)を選択する。
我々は,LLMのソフト制約追従能力を向上させるための手法の有効性を実験的に評価した。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:42:28 GMT)
MADUV: The 1st INTERSPEECH Mice Autism Detection via Ultrasound Vocalization Challenge [39.0] 超音波による自閉症検出(MADUV)チャレンジでは、マウスの発声による自閉症スペクトラム障害(ASD)の検出に焦点を当てた最初のInterSPEECHチャレンジが導入されている。
参加者は、サンプリング率の高い記録に基づいて、マウスをワイルドタイプまたはASDモデルとして自動的に分類するモデルを開発することを義務付けられている。
その結果, 可聴域の特徴を最大限に発揮し, 自動ASD検出の実現可能性を示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:20:30 GMT)
Chain-of-Frames: Advancing Video Understanding in Multimodal LLMs via Frame-Aware Reasoning [37.9] そこで本稿では,関連ビデオフレームに推論ステップを接頭し,明示的に参照するビデオLLMを提案する。
我々のアプローチはシンプルで自己完結型であり、ビデオCoTの既存のアプローチとは異なり、関連するフレームを選択またはキャプションするために補助的なネットワークを必要としない。
これにより、複数のビデオ理解ベンチマークのパフォーマンスが向上する。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:08:21 GMT)
Long-Tailed Visual Recognition via Permutation-Invariant Head-to-Tail Feature Fusion [37.6] 長い尾を持つデータの不均衡分布は、ディープラーニングモデルにとって重要な課題である。
低認識精度に寄与する2つの重要な要因は、変形表現空間とバイアス分類器である。
本稿では,これらの問題に対処するため,置換不変な特徴融合(PI-H2T)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:31:43 GMT)
LLM-Powered Test Case Generation for Detecting Bugs in Plausible Programs [37.5] TrickCatcherは、可算プログラムでバグを発見するためのテストケースを生成する。
TrickCatcherは1.80x、2.65x、1.66xのリコール、精度、F1スコアを達成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:23:39 GMT)
CogSteer: Cognition-Inspired Selective Layer Intervention for Efficiently Steering Large Language Models [37.5] 大規模言語モデル(LLM)は、広範囲なデータに対する事前学習を通じて、優れたパフォーマンスを達成する。
基本的なメカニズムにおける解釈可能性の欠如は、特定のアプリケーションに対してLLMを効果的に操る能力を制限する。
本稿では,パラメータ効率の優れた微調整法に基づく効率的な選択的層干渉法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:23:27 GMT)
ArtiScene: Language-Driven Artistic 3D Scene Generation Through Image Intermediary [37.4] ArtiSceneは、シーンデザインのためのトレーニング不要の自動パイプラインである。
シーン記述から2D画像を生成し、オブジェクトの形状と外観を抽出し、3Dモデルを作成する。
測定基準によってレイアウトと美的品質の大きなマージンで最先端のベンチマークを上回ります。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:03:54 GMT)
Organizing Unstructured Image Collections using Natural Language [37.2] 大規模で非構造化画像コレクションからクラスタリング基準を自動的に検出することを目的としたOpen-ended Semantic Multiple Clustering (OpenSMC) の課題を紹介する。
当社のフレームワークであるX-Cluster: eXploratory Clusteringは、テキストを推論プロキシとして扱い、画像を基準毎に意味のあるクラスタにグループ化する。
X-Clusterは意味のあるパーティションを効果的に公開し、バイアス発見やソーシャルメディア画像人気分析などの下流アプリケーションを可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:52:09 GMT)
Flashbacks to Harmonize Stability and Plasticity in Continual Learning [36.7] Flashback Learning (FL) は連続学習(CL)におけるモデルの安定性と可塑性を調和させるように設計されている
FLは2段階のトレーニングプロセスを通じて動作し、様々なCLメソッドにシームレスに統合することができる。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:04:58 GMT)
Keeping an Eye on LLM Unlearning: The Hidden Risk and Remedy [36.2] 本稿では、微調整に基づく未学習における重大な脆弱性を明らかにする。
悪意のあるユーザは操作済みの忘れた要求を作成でき、それをひそかにモデルの有用性を損なうことができる。
本研究では、スコープ項を学習対象に導入する軽量化として、スコープ認識型アンラーニング(SU)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:57:24 GMT)
RAEmoLLM: Retrieval Augmented LLMs for Cross-Domain Misinformation Detection Using In-Context Learning Based on Emotional Information [36.1] クロスドメイン誤情報検出の方法は、努力とリソース集約的な微調整と複雑なモデル構造に依存している。
RAEmoLLMは、感情情報に基づくテキスト内学習を用いたクロスドメイン誤情報検出のための、最初の検索拡張(RAG)LLMフレームワークである。
RAEmoLLMは、3つのデータセットの他の数ショットメソッドと比較して大幅に改善されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:54:19 GMT)
Encoding of Demographic and Anatomical Information in Chest X-Ray-based Severe Left Ventricular Hypertrophy Classifiers [36.1] 胸部X線による重症左室肥大を予測するための直接分類フレームワークを提案する。
提案手法は AUROC と AUPRC を高い精度で実現し,特徴表現率の定量化に相互情報ニューラル推定を用いる。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:30:04 GMT)
A Comprehensive Survey of Machine Unlearning Techniques for Large Language Models [35.9] 本研究では,大規模言語モデル(LLM)の文脈における機械学習手法について検討する。
LLMのアンラーニングは、LLMから望ましくないデータの影響を取り除くための原則的なアプローチを提供する。
研究の関心が高まりつつあるにもかかわらず、既存の研究を体系的に整理し、重要な洞察を蒸留する総合的な調査は行われていない。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:19:34 GMT)
Dual Debiasing for Noisy In-Context Learning for Text Generation [35.6] 文脈学習では、大きな注釈付きコーパスから引き出された高品質なデモンストレーションに大きく依存する。
既存のアプローチでは、ノイズのあるサンプルがクリーンなアノテーションよりも高いパープレキシティをもたらすと仮定して、局所的なパープレキシティをランク付けすることでノイズの多いアノテーションを検出する。
我々は、ノイズの多いアノテーションの下でテキスト生成のためのパープレキシティに基づくパラダイムを再検討し、パープレキシティの2つのバイアス源を強調した。
合成された隣接体を用いて、パープレキシティ推定を明示的に補正し、ロバストなサンプルクリーンネススコアを生成する双対脱バイアスフレームワークを導入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:44:48 GMT)
Training Articulatory Inversion Models for Inter-Speaker Consistency [34.7] AAIは音声から調音への逆写像をモデル化しようとする。
AAIの最近の研究は、単一話者データセットに自己監視学習(SSL)モデルを適用することを提案した。
単一話者データと複数話者データに基づいて訓練されたSSL適応モデルが、英語とロシア語の話者識別に一貫性のある音声目標を生成するかどうかを検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:57:45 GMT)
Pre-Training and Personalized Fine-Tuning via Over-the-Air Federated Meta-Learning: Convergence-Generalization Trade-Offs [33.3] 本稿では、事前学習フェーズに参加するエージェントが共有無線チャンネルを介してサーバに接続される無線環境におけるメタpFLの一般化性能について検討する。
本稿では,新しいエージェントとタスクへの一般化と,一方で収束のトレードオフについて検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:15:14 GMT)
Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation [33.1] 大言語モデル(LLM)は機械翻訳(MT)のランドスケープを再構築した
我々は,数発のプロンプト,言語間移動,パラメータ効率の微調整などの手法を解析する。
幻覚、評価の不整合、遺伝バイアスなど、永続的な課題について議論する。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:46:21 GMT)
A European Multi-Center Breast Cancer MRI Dataset [32.8] ODELIAコンソーシアムは、MRIで乳癌を検出するAIツールの開発を支援するために、このマルチセントデータセットを一般公開した。
欧州乳房画像学会の最近のガイドラインでは、乳房の高密度組織に対する補助的スクリーニングツールとして乳房MRIを推奨している。
ODELIAコンソーシアムは、MRIで乳癌を検出するAIツールの開発を支援するために、このマルチセントデータセットを一般公開した。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:45:02 GMT)
Revisiting LLMs as Zero-Shot Time-Series Forecasters: Small Noise Can Break Large Models [32.3] 大規模言語モデル(LLM)は、ドメイン固有のトレーニングなしで、様々なタスクにまたがる顕著なパフォーマンスを示している。
近年の研究では、LLMは予測に固有の効果を欠いていることが示唆されている。
実験の結果,LLMベースのゼロショット予測器はノイズに敏感なため,高い精度を達成するのに苦慮していることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:24:01 GMT)
HarmoniCa: Harmonizing Training and Inference for Better Feature Caching in Diffusion Transformer Acceleration [32.0] 我々はHarmoniCaと呼ばれる新しい学習ベースのキャッシュフレームワークを開発した。
SDT(Step-Wise Denoising Training)を取り入れて、Denoisingプロセスの継続性を保証する。
私たちのフレームワークは40%以上のレイテンシ削減(理論的スピードアップ)とPixArt-$alpha$のパフォーマンス向上を実現しています。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:58:24 GMT)
AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation [31.9] アナジェント(AnnaAgent)は、第三次記憶を備えた感情的・認知的動的エージェントシステムである。
本稿では,AnnaAgentが,既存のベースラインよりも心理学的カウンセリングにおいて,より現実的な探索シミュレーションを実現していることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:15:51 GMT)
CoQuIR: A Comprehensive Benchmark for Code Quality-Aware Information Retrieval [31.8] CoQuIRは、品質を意識したコード検索を評価するために設計された、最初の大規模多言語ベンチマークである。
CoQuIRは、11のプログラミング言語で42,725のクエリと134,907のコードスニペットに対して、きめ細かい品質のアノテーションを提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:00:17 GMT)
PreGIP: Watermarking the Pretraining of Graph Neural Networks for Deep Intellectual Property Protection [31.8] グラフニューラルネットワーク(GNN)の事前トレーニングは、さまざまな下流タスクの促進に大きく貢献している。
敵は、下流のタスクのために訓練済みのGNNモデルを違法にコピーして展開することができる。
本稿では,組込み空間の高品質を維持しつつ,IP保護のためのGNNエンコーダの事前訓練を透かし,PreGIPという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:35:11 GMT)
OmniRouter: Budget and Performance Controllable Multi-LLM Routing [31.6] 大規模言語モデル(LLM)は優れた性能を提供するが、かなりの計算資源を必要とし、比較的低効率で運用する。
マルチLLMサービスのための制御可能なルーティングフレームワークであるOmniを紹介する。
実験の結果、Omniは応答精度を最大6.30%改善し、同時に計算コストを少なくとも10.15%削減した。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:35:45 GMT)
Exploring In-context Example Generation for Machine Translation [31.5] 大規模言語モデル(LLM)は様々なタスクにまたがって強力なパフォーマンスを示しており、いくつかの例で例外的な文脈内学習能力を活用している。
機械翻訳の分野では、最適な文脈内サンプルの選択が活発に研究されている。
本稿では,機械翻訳における文脈内サンプル生成の研究の方向性について検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:00:49 GMT)
LoHoVLA: A Unified Vision-Language-Action Model for Long-Horizon Embodied Tasks [31.3] 実世界のエンボディエージェントは、マルチステップソリューションを必要とするハイレベルな目標に直面します。
ロングホライゾンタスクは、ハイレベルなタスクプランニングと低レベルなモーションコントロールを必要とする。
我々は,LoHoVLAと呼ばれる長期タスクのための統合視覚言語フレームワークを導入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:01:03 GMT)
The Security Threat of Compressed Projectors in Large Vision-Language Models [31.3] 適切な視覚言語プロジェクタの選択は、大きな視覚言語モデルのトレーニングの成功に不可欠である。
評価の結果,セキュリティプロファイルに有意な差異が認められた。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:43:56 GMT)
Do Large Language Models Latently Perform Multi-Hop Reasoning? [31.1] 我々は,Large Language Models (LLMs) が "The mother of the singer of 'Superstition' is" のような複雑なプロンプトを用いて,最近マルチホップ推論を行っているかを検討する。
特定の関係型のプロンプトに対する潜在マルチホップ推論の強い証拠が得られ,プロンプトの80%以上で推論経路が用いられている。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:20:49 GMT)
Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts? [31.1] 大規模言語モデル(LLM)は、事実をリコールして、マルチホップクエリに応答するように構成する。
LLM は "Scarlett Johansson" の頭文字と "United States" の頭文字に遭遇してショートカットを発達させた可能性がある。
我々は,LLMがショートカットを活用せずに,有望なマルチホップ推論能力を示すことを観察した。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:16:44 GMT)
BDPFL: Backdoor Defense for Personalized Federated Learning via Explainable Distillation [30.4] フェデレートラーニング(Federated Learning)は、複数のクライアントにわたるグローバルモデルの協調トレーニングを促進する分散学習パラダイムである。
我々は,これらの課題に対処するために,BDPFLという,バックドア・ロバストなpFLフレームワークを提案する。
まず、BDPFLは、クライアントが潜在的なバックドアを緩和しながら、パーソナライズされたローカルモデルを学習できるようにする階層的相互蒸留を導入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:10:47 GMT)
SoloSpeech: Enhancing Intelligibility and Quality in Target Speech Extraction through a Cascaded Generative Pipeline [29.9] SoloSpeechは、圧縮、抽出、再構築、修正プロセスを統合するカスケード生成パイプラインである。
ターゲット音声抽出および音声分離タスクにおける最先端の知性および品質を実現する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:50:43 GMT)
AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence [29.6] 本稿では,モデルが次の単語を予測する自信に基づいて推論ステップを分割する手法であるAdaptiveStepを提案する。
数理推論およびコード生成タスクにおいて,AdaptiveStep-trained PRMを用いた実験により実効性を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:35:35 GMT)
RF4D:Neural Radar Fields for Novel View Synthesis in Outdoor Dynamic Scenes [29.3] 本研究では,屋外のダイナミックシーンにおける新しいビュー合成を目的としたレーダーベースニューラルネットワークフレームワークRF4Dを紹介する。
RF4Dはその表現に時間情報を明示的に組み込んでおり、動く物体をモデル化する能力を大幅に強化している。
本稿では,レーダセンシング物理と密接に一致したレーダ固有のパワーレンダリングを提案し,合成精度と相互運用性を改善した。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:16:00 GMT)
WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks [29.0] 攻撃者がモデルをクローンすると,既存のE透かしをパラフレーズで除去できることを示す。
埋め込みを線形に変換する新しい透かし手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:16:14 GMT)
BAGNet: A Boundary-Aware Graph Attention Network for 3D Point Cloud Semantic Segmentation [28.9] バウンダリー・アウェア・グラフ・アテンション・ネットワーク(BAGNet)と呼ばれる新しいグラフアテンション・ネットワークを開発した。
BAGNetには、境界対応のグラフアテンション層と、ポイントクラウドのグローバルな特徴を抽出する軽量アテンションプーリング層が含まれている。
ポイントクラウドセマンティックセグメンテーションにおける最先端の手法よりも精度が高く、推論時間も少ない。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:51:14 GMT)
When Should a Leader Act Suboptimally? The Role of Inferability in Repeated Stackelberg Games [28.9] 我々は、リーダーとフォロワーが繰り返し対話する観察結果を用いて、Stackelbergゲームを用いて、推論可能性の問題をモデル化する。
様々なゲーム設定において、不確実性ギャップは、リーダーの戦略の相互作用数とセマンティレベルの関数によって上限づけられていることが示される。
リーダーの準最適戦略が大きな推論可能性ギャップに悩まされる可能性のある、一連のゲームを特定します。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:34:37 GMT)
Evaluating the Evaluation of Diversity in Commonsense Generation [28.7] 我々は,コモンセンス生成のための多様性指標の体系的メタ評価を行う。
形式に基づく多様性指標は文集合の多様性を常に過大評価する傾向がある。
コンテンツに基づく多様性評価の指標が、フォームベースの指標よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:18:26 GMT)
Supercharging Graph Transformers with Advective Diffusion [28.4] 本稿では,この課題に対処するために,物理に着想を得たグラフトランスモデルAdvDIFFormerを提案する。
本稿では,AdvDIFFormerが位相シフトによる一般化誤差を制御できることを示す。
経験的に、このモデルは情報ネットワーク、分子スクリーニング、タンパク質相互作用の様々な予測タスクにおいて優位性を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:50:56 GMT)
CTRL-GS: Cascaded Temporal Residue Learning for 4D Gaussian Splatting [28.3] 動的シーンのための4次元ガウススプラッティングの新規拡張を提案する。
動的シーンを「ビデオ・セグメンテーション・フレーム」構造に分解し、セグメントを光学的フローで動的に調整する。
いくつかの確立したデータセット上で、最先端の視覚的品質とリアルタイムレンダリングを実証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:11:43 GMT)
TIDFormer: Exploiting Temporal and Interactive Dynamics Makes A Great Dynamic Graph Transformer [27.8] 本稿では,時間的・インタラクティブなダイナミクスをフル活用した動的グラフトランスフォーマーTIDFormerを提案する。
時間的およびインタラクティブなダイナミクスをモデル化するために、カレンダーベースの時間分割情報を利用する。
さらに、歴史的相互作用パターンの潜在的な変化を捉え、時間的・インタラクティブな特徴を共同でモデル化する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:23:05 GMT)
Anticipating Future with Large Language Model for Simultaneous Machine Translation [27.6] 同時機械翻訳(SMT)は、ストリーミング入力の発話を受け取り、ターゲットテキストを漸進的に生成する。
我々は、$textbfA$nticipating $textbfF$uture (TAF)による$textbfT$ranslationを提案する。
その中核となる考え方は、大きな言語モデル(LLM)を使用して将来のソース語を予測し、過剰なリスクを伴わずに機会的に翻訳することである。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:32:52 GMT)
QoQ-Med: Building Multimodal Clinical Foundation Models with Domain-Aware GRPO Training [27.5] QoQ-Medは、医療画像、時系列信号、およびテキストレポートを共同で原因付ける、最初のオープン・ジェネラリスト臨床基礎モデルである。
DRPOトレーニングは,すべての視覚領域において,マクロF1の診断性能を平均43%向上させることを示した。
QoQ-Medは集中的なセグメンテーションデータに基づいてトレーニングされており、オープンモデルよりもIoU 10倍高い、診断に関連する健全な領域をハイライトすることができる。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:02:52 GMT)
Automating Legal Interpretation with LLMs: Retrieval, Generation, and Evaluation [27.3] ATRIEは法的概念解釈器と法的な概念解釈評価器から構成される。
私たちの解釈の質は、法の専門家によって書かれたものと同等であり、包括性と可読性に優れています。
精度に差はあるものの、法律実務者が法解釈の効率を改善するのに既に助けることができる。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:48:07 GMT)
Towards Building Large Scale Datasets and State-of-the-Art Automatic Speech Translation Systems for 14 Indian Languages [27.3] BhasaAnuvaadは、インドの言語で最大の音声翻訳データセットで、4400万時間以上のオーディオと1700万行のテキストセグメントにまたがる。
本実験は, 翻訳品質の向上を実証し, インド語音声翻訳の新しい標準を設定した。
アクセシビリティとコラボレーションを促進するために、許容ライセンス付きのすべてのコード、データ、モデルの重みをオープンソースでリリースします。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:18:52 GMT)
PMF-CEC: Phoneme-augmented Multimodal Fusion for Context-aware ASR Error Correction with Error-specific Selective Decoding [27.2] 文脈認識誤り訂正のための音素拡張多重モーダル融合法を提案する。
提案するPMF-CECは、適切な推論速度を維持しつつ、バイアス付き単語誤り率をさらに低減する。
我々の手法は他の文脈バイアス法よりも優れている。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:18:34 GMT)
Samudra: An AI Global Ocean Emulator for Climate [27.2] 我々は、最先端の気候モデルにおける海洋成分のグローバルエミュレータを構築した。
多層海洋データに基づいてトレーニングしたConvNeXt UNetアーキテクチャを改良した。
海洋エミュレータ - Samudra は, 海洋変数の深さ構造と年次変動を再現できることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:21:18 GMT)
Odyssey: Empowering Minecraft Agents with Open-World Skills [26.5] Odysseyは、LLM(Large Language Model)ベースのエージェントにオープンワールドスキルを付与し、Minecraftの世界を探索する新しいフレームワークである。
Odysseyは,(1)40のプリミティブスキルと183の作曲スキルからなるオープンワールドスキルライブラリを備えた対話型エージェント,(2)Minecraft Wikiから派生した390k以上のインストラクションインストラクションを持つ大規模質問応答データセット上で訓練された微調整LLaMA-3モデル,(3)新しいエージェント能力ベンチマークの3つの重要な部分から構成される。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:58:58 GMT)
On scalable and efficient training of diffusion samplers [26.5] データがない場合、非正規化エネルギー分布からサンプルを採取するために拡散モデルを訓練することの課題に対処する。
そこで我々は,従来の強力なサンプリング手法と拡散サンプリングを適切に調和させる,スケーラブルでサンプル効率のよいフレームワークを提案する。
本手法は,拡散サンプリングの標準ベンチマークにおける試料効率を大幅に向上し,高次元問題や実世界の分子コンホメータ生成に優れる。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:12:47 GMT)
View-Invariant Policy Learning via Zero-Shot Novel View Synthesis [26.2] 本研究では,世界の大規模視覚データから得られる知識が,一般化可能な操作のための一軸の変動にどのように対処できるかを考察する。
本研究では,異なるカメラ視点から同一シーンの画像をレンダリングすることで,シーンレベルの3D認識を学習する単一画像の新規ビュー合成モデルについて検討する。
多様なロボットデータに実用的に応用するには、これらのモデルはゼロショットを動作させ、目に見えないタスクや環境でビュー合成を行う必要がある。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:58:31 GMT)
TSD-SR: One-Step Diffusion with Target Score Distillation for Real-World Image Super-Resolution [26.0] 事前訓練されたテキスト-画像拡散モデルが、現実の画像超解像(Real-ISR)タスクにますます応用されている。
拡散モデルの反復的洗練された性質を考えると、既存のアプローチのほとんどは計算的に高価である。
実世界の超高解像度画像に特化して設計された新しい蒸留フレームワークであるTLD-SRを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:55:19 GMT)
Thinking Out of the Box: Hybrid SAT Solving by Unconstrained Continuous Optimization [25.3] ペナルティ項によるハイブリッドSAT問題の非制約連続最適化を提案する。
本結果は,効率的なハイブリッドSAT解決のための連続最適化と機械学習に基づく手法を組み合わせる可能性を強調した。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:58:33 GMT)
Reasoning Like an Economist: Post-Training on Economic Problems Induces Strategic Generalization in LLMs [25.1] 本稿では,特にSFT(Supervised Fine-Tuning)やRLVR(Reinforcement Learning with Verifiable Rewards)といったポストトレーニング手法が,マルチエージェントシナリオに$textit Generalize$を効果的に適用できるかどうかを考察する。
我々は、経済的推論をテストベッドとして使用し、数学とゲーム理論の強力な基盤を活用している。
経済推論ベンチマークとマルチエージェントゲームに関する総合的な評価は、構造化推論と経済合理性において明らかに改善されていることを示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:22:40 GMT)
Pandora's Box or Aladdin's Lamp: A Comprehensive Analysis Revealing the Role of RAG Noise in Large Language Models [25.0] 大規模言語モデル(LLM)における幻覚に対処するための重要な手法として、検索型拡張生成(RAG)が登場している。
本稿では,言語的観点から7つの異なるノイズタイプを定義し,ノイズRAGベンチマーク(NoiserBench)を確立する。
我々の分析は、より堅牢で適応可能なRAGソリューションを開発し、多様な検索シナリオにまたがる幻覚を緩和するための洞察を提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:45:31 GMT)
System-1.5 Reasoning: Traversal in Language and Latent Spaces with Dynamic Shortcuts [24.8] CoT推論(Chain-of-Thought reasoning)は、大規模言語モデルでシステム2推論を行うことを可能にする。
最近の潜在空間推論手法は、言語に復号することなく隠れ状態を操作することで効率を向上させる。
本稿では,適応推論フレームワークであるSystem-1.5 Reasoningを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:08:41 GMT)
FinBERT2: A Specialized Bidirectional Encoder for Bridging the Gap in Finance-Specific Deployment of Large Language Models [24.4] FinBERT2は、32bトークンの高品質な財務特化コーパスで事前訓練された、特殊な双方向エンコーダである。
差別的微調整モデル(Fin-Labelers)は、他の(Fin)BERTモデルよりも0.4%-3.3%、LLMを9.7%-12.3%、財務分類5つのタスクで上回っている。
Fin-TopicModelは、金融タイトルの優れたクラスタリングとトピック表現を可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:59:44 GMT)
Towards Early Prediction of Self-Supervised Speech Model Performance [23.9] SSL音声モデルの事前学習の質について,教師なしの効率的な手法を提案する。
その結果, クラスタ品質とランクの指標は, 未ラベル音声の1時間における事前学習損失よりも, ダウンストリーム性能と相関することがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:29:13 GMT)
$\texttt{AVROBUSTBENCH}$: Benchmarking the Robustness of Audio-Visual Recognition Models at Test-Time [23.8] 我々は、音声視覚認識モデルの試験時間ロバスト性を評価するために設計された総合的なベンチマークである$textttAVROBUSTBENCH$を紹介した。
$textttAVROBUSTBENCH$は、4つのオーディオ視覚ベンチマークデータセット、$textttAUDIOSET-2C$、$texttVGGSOUND-2C$、$texttKINETICS-2C$、$textttEPICKITCHENS-2C$からなる。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:56:07 GMT)
SEED: A Benchmark Dataset for Sequential Facial Attribute Editing with Diffusion Models [23.5] 増え続けるアプリケーションのクラスは、プログレッシブ編集のシーケンスを分析し、追跡する機能を要求するようになった。
本稿では,最先端拡散モデルを用いて構築した大規模逐次編集facEデータセットSEEDを紹介する。
SEEDには90,000以上の顔画像と1~4つのシーケンシャルな属性修正が含まれており、多様な拡散ベースの編集パイプラインを使用して生成される。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:39:45 GMT)
DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments [23.4] DefenderBenchは、犯罪、防衛、サイバーセキュリティ知識に基づくタスクに対して言語エージェントを評価するための実用的でオープンソースのツールキットである。
研究者にとって手頃で手頃な価格で手軽に利用でき、公正で厳格な評価を提供するように設計されている。
以上の結果から,Claude-3.7-sonnetが81.65点,Claude-3.7-sonnetが78.40点,Llama 3.3 70Bが71.81点,Claude-3.7-sonnetが71.81点,Claude-3.7-sonnetが最高性能を示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:00:29 GMT)
CMT-LLM: Contextual Multi-Talker ASR Utilizing Large Language Models [23.3] 本稿では,複数話者の重なり合う音声認識とコンテキストバイアスをひとつのタスクに組み合わせた統合フレームワークを提案する。
提案手法は従来の文脈バイアス法よりも優れており,WERはLibriMixで7.9%,AMI SDMで32.9%を達成している。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:26:44 GMT)
Spectral Analysis of Diffusion Models with Application to Schedule Design [23.1] 拡散モデル(DM)は、複雑なデータ分散をモデル化するための強力なツールとして登場した。
我々は、DMの推論プロセスの新たな解析を行い、包括的周波数応答の観点を導入する。
提案手法を応用して,データの特徴と効果的に整合するノイズスケジュールを設計する方法を実証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:33:54 GMT)
Neural Conditional Probability for Uncertainty Quantification [23.0] 条件分布の学習に対する演算子理論的アプローチであるニューラル条件確率(NCP)を導入する。
ニューラルネットワークの近似能力を活用することで、NCPは様々な複合プレックス確率分布を効率的に扱うことができる。
実験では,2層ネットワークを持つNCPが先行手法に適合するか,あるいは性能が優れていることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:54:41 GMT)
Image Restoration Learning via Noisy Supervision in the Fourier Domain [22.8] ノイズ管理とは、ノイズのあるターゲットで画像復元学習を監督することを指す。
これにより、データ収集の負担を軽減し、ディープラーニング技術の実用性を高めることができる。
既存の方法には2つの欠点がある。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:43:56 GMT)
AdvAgent: Controllable Blackbox Red-teaming on Web Agents [22.7] AdvAgentは、Webエージェントを攻撃するためのブラックボックスのレッドチームフレームワークである。
強化学習に基づくパイプラインを使用して、敵のプロンプトモデルをトレーニングする。
慎重な攻撃設計では、エージェントの弱点を効果的に活用し、ステルス性と制御性を維持する。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:34:01 GMT)
An Adversarial Perspective on Machine Unlearning for AI Safety [22.6] この作業は、アンラーニングと従来のトレーニング後の安全性の根本的な違いに挑戦する。
既存のjailbreakメソッドは、これまで未学習に対して効果がないと報告されていたが、慎重に適用した場合に成功できることを実証する。
例えば、アクティベーション空間における10の無関係な例を微調整したり、特定の方向を除去することで、RMUで編集されたモデルに対して最も危険な能力を回復できることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:22:41 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [22.6] 本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。
このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:19:09 GMT)
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization [22.6] そこで我々は,より高速な4ビット行列乗算(Matmul)と精度向上手法を併用したSageAttention2を提案する。
提案手法は,言語,画像,ビデオ生成など,さまざまなモデルにまたがる,無視可能なエンドツーエンドメトリクスの損失を生じさせる。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:21:10 GMT)
Mitigating Plasticity Loss in Continual Reinforcement Learning by Reducing Churn [22.4] 深部連続RLにおけるチャーンレンズの可塑性損失について検討した。
1) 可塑性の喪失は, ニューラルタンジェントカーネル (NTK) マトリックスの段階的ランク低下によるチャーンの悪化を伴うことを示した。
本稿では,C-CHAIN(Continuous Churn Approximated Reduction)を導入し,学習性能の向上を実証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:58:22 GMT)
Inter-Passage Verification for Multi-evidence Multi-answer QA [22.2] 本稿では,新たな複数問合せ型QAフレームワークを提案する。
本フレームワークは,各パスを個別に処理し,初期ハイリコールでノイズの多い応答セットを生成する。
我々のフレームワークは、様々なモデルサイズで既存のベースラインを著しく上回り、平均的なF1スコアは11.17%向上した。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:03:52 GMT)
RLAE: Reinforcement Learning-Assisted Ensemble for LLMs [21.8] 大規模言語モデル(LLM)は、様々なモデルの多様な強みを効果的に組み合わせ、様々なタスクのパフォーマンスを高めるための有望なアプローチを提供する。
マルコフ決定プロセス(MDP)のレンズを通してアンサンブルを再構成する新しいフレームワークであるLLMのための強化学習支援アンサンブルを提案する。
提案手法では,入力コンテキストと中間生成状態の両方を考慮してアンサンブル重みを動的に調整するRLエージェントを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:38:41 GMT)
Towards Omni-RAG: Comprehensive Retrieval-Augmented Generation for Large Language Models in Medical Applications [21.5] 大規模言語モデルは、医学診断推論、研究知識獲得、臨床意思決定、消費者健康調査支援など、医療上の課題に取り組むことを約束している。
様々なソースの属性に合わせてコンテキストに適したクエリを定式化することを目的として,この課題に対処する。
既存のアプローチは、ソース計画を見落としているか、モデルがソースと実際のコンテンツに対する期待を誤っているため、効果的にそれを達成することができないかのいずれかである。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:13:46 GMT)
SpargeAttention: Accurate and Training-free Sparse Attention Accelerating Any Model Inference [21.5] SpargeAttnは任意のモデルに対する普遍的スパースで量子化された注意である。
本手法は,エンドツーエンドのメトリクスを犠牲にすることなく,言語,画像,ビデオ生成などの多様なモデルを大幅に高速化する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:22:36 GMT)
CoAM: Corpus of All-Type Multiword Expressions [21.5] CoAMは、データ品質を向上させるために多段階プロセスを通じて構築された1.3K文のデータセットである。
MWE識別のデータセットで初めて、CoAMのMWEはNounやVerbといった型でタグ付けされ、きめ細かいエラー解析を可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:09:06 GMT)
Common Inpainted Objects In-N-Out of Context [21.4] Common Inpainted Objects In-N-Out of Context (COinCO)は、既存のビジョンデータセットにおけるコンテキスト外例の不足に対処する新しいデータセットである。
本研究では,COCO画像のオブジェクトを拡散型塗布により体系的に置き換えることにより,コンテキスト的に一貫性のあるシーンと一貫性のないシーンの両方を特徴付ける97,722個のユニークな画像を生成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:42:12 GMT)
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance [21.1] トレーニング後の量子化は、大規模言語モデルのメモリと推論遅延を低減するための重要なテクニックである。
本稿では,エンドロスからの勾配情報を量子化対象に組み込む新しい量子化手法である GuidedQuant を提案する。
GuidedQuantは、ウェイトオンリーのスカラー、ウェイトオンリーのベクトル、ウェイト・アンド・アクティベーションの量子化にまたがる最先端の量子化手法の性能を一貫して向上させる。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:37:07 GMT)
TrimR: Verifier-based Training-Free Thinking Compression for Efficient Test-Time Scaling [21.0] 大規模推論モデル(LRM)は、複雑な数学的、論理的、コーディングタスクに対処する際、例外的な能力を示す。
本稿では,動的チェイン・オブ・ソート(CoT)圧縮のための検証器ベース,トレーニング不要,効率的なフレームワークTrimRを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:54:42 GMT)
Learning from Negative Samples in Generative Biomedical Entity Linking [20.7] 陰性サンプルを用いて生成BioELモデルをトレーニングする最初のフレームワークであるANGELを紹介する。
我々のモデルは5つのベンチマークで平均1.4%の精度で以前の最高のベースラインモデルより優れています。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:25:08 GMT)
Entriever: Energy-based Retriever for Knowledge-Grounded Dialog Systems [20.6] 検索者は、コンテキストが与えられた知識ベースから関連する知識片を検索する。
エネルギーベースのレトリバーであるEntrieverを提案する。
本稿では,Entrieverが知識検索タスクにおいて,強力なクロスエンコーダベースラインを大幅に上回っていることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:42:34 GMT)
Astute RAG: Overcoming Imperfect Retrieval Augmentation and Knowledge Conflicts for Large Language Models [20.6] 不完全な検索強化は避けられ、一般的であり、有害であることがわかった。
本稿では,不完全検索拡張に耐性を持つ新しいRAG手法であるAstute RAGを提案する。
GeminiとClaudeによる実験は、従来の堅牢性強化RAGアプローチと比較して、Astute RAGの優れた性能を示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:07:21 GMT)
Probabilistic Forecasting for Building Energy Systems using Time-Series Foundation Models [20.6] エネルギーシステムの構築は、関連する時系列モデルの予測精度に依存する。
本稿では,建築エネルギー予測における時系列基礎モデル(TSFM)の適用性と微調整戦略について検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:38:29 GMT)
RiOSWorld: Benchmarking the Risk of Multimodal Compter-Use Agents [20.5] 実世界のコンピュータ操作におけるMLLMエージェントの潜在的なリスクを評価するためのベンチマークである textbfRiOSWorld を紹介する。
私たちのベンチマークには、Web、ソーシャルメディア、マルチメディア、os、Eメール、オフィスソフトウェアを含む、さまざまなコンピュータアプリケーションにまたがる492の危険タスクが含まれています。
評価には,リスク目標意図とリスク目標達成の2つの視点から安全リスクを評価する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:04:59 GMT)
NeuSym-RAG: Hybrid Neural Symbolic Retrieval with Multiview Structuring for PDF Question Answering [20.4] NeuSym-RAGは、両方のパラダイムをインタラクティブなプロセスで組み合わせたハイブリッドニューラルネットワークのシンボル検索フレームワークである。
NeuSym-RAGは半構造化PDFコンテンツをリレーショナルデータベースとベクトルストアの両方に整理する。
自己注釈付きAIRQA-REALを含む3つのPDFベースのQAデータセットの実験では、NeuSym-RAGがベクターベースRAGと様々な構造ベースラインの両方を安定して打ち負かすことが示されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:51:54 GMT)
Improving the Calibration of Confidence Scores in Text Generation Using the Output Distribution's Characteristics [20.3] よく校正されたモデル信頼スコアは、テキスト生成モデルの有用性を向上させることができる。
生成に適したタスク非依存の信頼性指標を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:01:45 GMT)
Counterspeech the ultimate shield! Multi-Conditioned Counterspeech Generation through Attributed Prefix Learning [20.2] HiPPrO, HiPPrO, Hierarchical Prefix Learning with Preference Optimizationは, 音声合成のための新しいフレームワークである。
目的整合度が38%向上し, 3%, 2%, 3%, 3%, 3%, ルージュ-1, ルージュ-2, ルージュ-Lがそれぞれ改善した。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:50:41 GMT)
CodeSense: a Real-World Benchmark and Dataset for Code Semantic Reasoning [20.1] 私たちはCodeSenseという,一連のきめ細かいコード推論タスクを利用できる最初のベンチマークを提案しています。
この結果から,モデルが微粒な推論処理を行う場合の性能差が明らかとなった。
当社の作業では,詳細なSE推論タスクに対して,真理を簡単に収集することのできる実行トレースフレームワークとツールセットを作成しました。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:32:01 GMT)
MagiCodec: Simple Masked Gaussian-Injected Codec for High-Fidelity Reconstruction and Generation [20.0] MagiCodecは、トランスフォーマーベースの新しいシングルレイヤー・ストリーミングオーディオである。
周波数領域におけるノイズ注入の効果を解析的に導出し,その有効性を示す。
MagiCodecは、再構築品質と下流タスクの両方において最先端のコーデックを上回っていることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:31:02 GMT)
Towards Global AI Inclusivity: A Large-Scale Multilingual Terminology Dataset (GIST) [19.9] GISTは2000年から2023年にかけての上位AIカンファレンス論文から抽出された5K語を含む、大規模な多言語AI用語データセットである。
この用語はアラビア語、中国語、フランス語、日本語、ロシア語に翻訳され、LLMを抽出するためのハイブリッドフレームワークと翻訳のための人間の専門知識を組み合わせたものである。
データセットの品質は既存のリソースに対してベンチマークされ、クラウドソースによる評価によって、より優れた翻訳精度を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:39:16 GMT)
Teaching an Old LLM Secure Coding: Localized Preference Optimization on Distilled Preferences [19.8] セキュアなコード生成を改善する上で,2つの重要な課題に対処する。
まず、幅広いセキュリティ問題をカバーする高品質なトレーニングデータを取得することが重要です。
第二に、モデルをセキュアなコードに整合させるには、ローカライズされたコードの領域にフォーカスする必要がある。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:48:12 GMT)
Beyond One-Size-Fits-All: Tailored Benchmarks for Efficient Evaluation [19.7] 本論文では,各対象モデルに合わせてカスタマイズした評価を行うTaloredBenchを提案する。
Global-coresetはまず、ターゲットモデル毎に最も一貫性のあるソースモデルを特定するプローブとして構築される。
拡張性のあるK-Medoidsクラスタリングアルゴリズムが提案され、Global-coresetを各ターゲットモデルに適したNative-coresetに拡張する。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:10:23 GMT)
Video Signature: In-generation Watermarking for Latent Video Diffusion Models [19.6] ビデオシグナチャ (VID SIG) は、遅延ビデオ拡散モデルのための次世代透かし方式である。
視覚的品質を維持するために、パータベーション・アウェア・抑制(PAS)が知覚に敏感な層を事前に識別し凍結する潜時デコーダを部分的に微調整することでこれを実現できる。
実験結果から, VID SIGは透かし抽出, 視覚的品質, 生成効率において, 最高の総合的な性能を発揮することがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:43:54 GMT)
DUSK: Do Not Unlearn Shared Knowledge [19.6] Machine Unlearningは、ユーティリティと情報を“保持”セットから保持しながら、そのような“忘れる”データを削除することを目的としている。
DUSKは実データ重なりの非学習手法を評価するためのベンチマークである。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:26:58 GMT)
Adapting General-Purpose Embedding Models to Private Datasets Using Keyword-based Retrieval [19.6] BMEmbedは、汎用テキスト埋め込みモデルをプライベートデータセットに適用するための新しい手法である。
モデル適応を容易にするために,キーワードベースの検索結果のランキングからスーパーバイザリー信号を構築する。
我々は、BMEmbedをさまざまな領域、データセット、モデルにまたがって評価し、検索性能が一貫した改善を示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:06:09 GMT)
GSO: Challenging Software Optimization Tasks for Evaluating SWE-Agents [19.5] GSOは、高性能ソフトウェアを開発する際の言語モデルの能力を評価するためのベンチマークである。
SWE-Agentsは5%未満の成功率を達成でき、推論時間スケーリングにおいても改善が限られている。
将来の研究を可能にするために、ベンチマークのコードとアーティファクトとエージェントトラジェクトリをリリースします。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:53:06 GMT)
Alignment is All You Need: A Training-free Augmentation Strategy for Pose-guided Video Generation [19.4] 生成された映像シーケンスが参照画像の微妙さを確実に保持する訓練不要のフレームワークを導入する。
我々は、骨格と動きの先行情報をポーズ情報から切り離し、アニメーション生成の正確な制御を可能にする。
提案手法は,大規模なデータセットや高価な計算資源を必要とせず,映像生成の質を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:38:13 GMT)
EffiVLM-BENCH: A Comprehensive Benchmark for Evaluating Training-Free Acceleration in Large Vision-Language Models [19.3] LVLM(Large Vision-Language Models)は大きな成功をおさめたが、その大きな計算要求は実際の展開を妨げている。
EffiVLM-Benchは絶対的な性能だけでなく、一般化や忠誠心も評価するための統一的なフレームワークである。
我々の実験と深部分析は、LVLMの加速のための最適戦略に関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:10:43 GMT)
ExPerT: Effective and Explainable Evaluation of Personalized Long-Form Text Generation [19.3] ExPerTは、パーソナライズされたテキスト生成のための説明可能な参照ベースの評価フレームワークである。
実験の結果, ExPerTは人間の判断に合わせた相対的な7.2%の改善を達成できた。
人間の評価者は、ExPerTの説明を5つ中4.7に評価し、評価決定をより解釈可能なものにする効果を強調した。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:44:04 GMT)
FRAME: Boosting LLMs with A Four-Quadrant Multi-Stage Pretraining Strategy [19.2] マルチステージ事前トレーニングは有望なアプローチだが、既存の手法ではデータ分割の量的基準が欠如しており、直観に頼っていることが多い。
本稿では,4段階の事前学習プロセスを4段階に編成し,大幅な損失削減を実現するという確立された原則に導かれる,4段階の多段階訓練戦略(FRAME)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:08:15 GMT)
Graph Evidential Learning for Anomaly Detection [19.0] 本稿では,グラフ・エビデンシャル・ラーニング(GEL)を提案する。
GELはグラフの不確かさと再構成の不確かさの2つのタイプを定量化し、それらを異常スコアリング機構に組み込む。
GELは、ノイズや構造的摂動に対して高い堅牢性を保ちながら、最先端の性能を達成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:06:42 GMT)
DeepRAG: Integrating Hierarchical Reasoning and Process Supervision for Biomedical Multi-Hop QA [18.9] DeepRAGは、DeepSeekの階層的質問分解機能をRAG Gymに統合する新しいフレームワークである。
MedHopQAデータセットの予備評価によると、DeepRAGはスタンドアロンのDeepSeekやRAG Gymといったベースラインモデルよりも優れており、Exact Matchと概念レベルの正確性の両方において顕著に改善されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:52:05 GMT)
OOD-Chameleon: Is Algorithm Selection for OOD Generalization Learnable? [18.8] 本研究は,OOD一般化のための学習アルゴリズムの選択を学習する可能性を探るものである。
本稿では,候補アルゴリズムに対する多ラベル分類として選択を定式化する概念の証明を提案する。
我々は,OOD-Chameleonが未知のシフトやデータセットにアルゴリズムをランク付けする能力を評価する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:31:51 GMT)
CityLens: Benchmarking Large Language-Vision Models for Urban Socioeconomic Sensing [18.7] CityLensは、衛星やストリートビューの画像から社会経済指標を予測するために、大きな言語ビジョンモデル(LLVM)の能力を評価するために設計されたベンチマークである。
経済、教育、犯罪、輸送、健康、環境の6つの主要な領域にまたがる、合計17のグローバルな分散都市をカバーするマルチモーダルデータセットを構築した。
その結果,LLVMは有望な知覚・推論能力を示すが,都市社会経済指標の予測には限界があることが明らかとなった。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:25:33 GMT)
Optimized Local Updates in Federated Learning via Reinforcement Learning [18.7] Federated Learning(FL)は、大規模分散データ上で協調的なモデルトレーニングを行う分散フレームワークである。
本稿では,クライアントモデルのトレーニングに必要なデータ量を最適化するために,DRL(Deep Reinforcement Learning)エージェントを利用する新しいフレームワークを提案する。
FLクライアントのトレーニングをアルゴリズムで行うと、複数のベンチマークデータセットやFLフレームワークの性能が向上することを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:32:42 GMT)
Both Direct and Indirect Evidence Contribute to Dative Alternation Preferences in Language Models [18.6] 我々は、長さとアニマシー(animacy)という、交互に選択する性質に焦点を当てている。
長さとアニマシーの直接的な証拠は重要であるが、そのような証拠がなくても、簡単優先の選好は継続する。
LMの創発的な構文的嗜好は、直接的および間接的ソースの混合に由来すると結論付けている。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:35:06 GMT)
SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL [18.5] テキスト・トゥ・コレクションのためのSLMに基づく階層的行動補正アシスタントSHAREを提案する。
SHAREはシーケンシャルパイプラインで3つの特殊小言語モデル(SLM)を編成する。
実験により,SHAREは様々なLSMに対して堅牢性を示しながら,自己補正能力を効果的に向上することが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:51:12 GMT)
TMetaNet: Topological Meta-Learning Framework for Dynamic Link Prediction [18.2] 動的トポロジ的特徴に基づくメタラーニングパラメータ更新モデルTMetaNetを提案する。
私たちのコードはhttps://github.com/Lihaogx/TMetaNet.comから入手可能です。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:15:23 GMT)
Robust Adaptation of Foundation Models with Black-Box Visual Prompting [18.2] BlackVIPは計算やパラメータを知らずにPTMを効率的に適応する。
19のデータセットの実験では、BlackVIPは、最小限のメモリ要件で、さまざまなドメインやタスクへの堅牢な適応を可能にすることが示されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:01:00 GMT)
Deflated Dynamics Value Iteration [17.7] 値関数の計算を高速化するために, DDVI (Deflated Dynamics Value Iteration) を提案する。
DDVI は行列分割法と行列デフレレーション法を用いて、遷移行列 $mathcalPpi$ の上位$s$支配固有構造を効果的に除去する。
このことが$tildeO(gammak |lambda_s+1$is $(s+1)$-the largest eigen value of the dynamics matrix につながることを証明している。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:46:15 GMT)
Rank, Chunk and Expand: Lineage-Oriented Reasoning for Taxonomy Expansion [17.7] 本稿では,識別的ランキングと生成的推論を組み合わせ,効率的な分類学拡張のためのプラグイン・アンド・プレイ・フレームワークを提案する。
LoRexは、最先端の手法よりも精度を12%向上し、Wu & Palmerの類似度を5%向上させる。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:07:12 GMT)
FinS-Pilot: A Benchmark for Online Financial System [17.7] FinS-Pilotは、オンライン金融アプリケーションで大規模言語モデル(RAG)を評価するための新しいベンチマークである。
当社のベンチマークでは,インテント分類フレームワークによって編成されたリアルタイムAPIデータと構造化テキストソースの両方を取り入れている。
本研究は,金融NLPシステムの研究を進めるための,実践的評価フレームワークとキュレートデータセットの両方に貢献する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:50:19 GMT)
Towards Better Chain-of-Thought: A Reflection on Effectiveness and Faithfulness [17.6] CoT(Chain-of-Thought)プロンプトは、異なる推論タスクの下で様々なパフォーマンスを示す。
これまでの作業は、それを評価しようとするが、CoTに影響を与えるパターンの詳細な分析を提供するには不足している。
我々は,CoTの有効性が問題困難,情報ゲイン,情報フローなどのパフォーマンス改善に影響を及ぼす重要な要因を同定する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:18:02 GMT)
Learning with Calibration: Exploring Test-Time Computing of Spatio-Temporal Forecasting [17.5] 本稿では,S時間予測のための新しいテスト時間計算パラダイム,すなわちキャリブレーションによる学習,ST-TTCを提案する。
本研究の目的は,テストフェーズ中に非定常性に起因する周期的構造バイアスを捕捉し,予測に対するリアルタイムなバイアス補正を行い,精度を向上させることである。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:48:27 GMT)
The Hitchhiker's Guide to Program Analysis, Part II: Deep Thoughts by LLMs [17.5] BugLensは、バグ検出のための静的解析精度を大幅に向上させる、ポストリファインメントフレームワークである。
LLMは有望なコード理解能力を示すが、プログラム分析への直接の応用は信頼できない。
LLMは、セキュリティへの影響を評価し、ソースコードから制約を検証するため、構造化された推論ステップを通じてLLMをガイドする。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:47:58 GMT)
Efficient Over-parameterized Matrix Sensing from Noisy Measurements via Alternating Preconditioned Gradient Descent [17.4] 雑音行列検出問題に対する交互事前条件勾配降下法(APGD)を提案する。
APGDは、既存の代替法と比較して、最も早く収束し、最も低い計算時間を達成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:49:27 GMT)
GuideX: Guided Synthetic Data Generation for Zero-Shot Information Extraction [17.2] GUIDEXは、ドメイン固有のスキーマを自動的に定義し、ガイドラインを推論し、合成ラベル付きインスタンスを生成する方法である。
GUIDEXを搭載したLlama 3.1は、7つのゼロショット名前付きエンティティ認識ベンチマークにまたがって新しい最先端技術を設定する。
GUIDEXで訓練されたモデルは、人間がラベル付けしたデータを使わずに以前の手法で最大7F1ポイントまで増加し、組み合わせると2F1ポイント近く上昇する。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:36:18 GMT)
It's High Time: A Survey of Temporal Information Retrieval and Question Answering [17.1] 本稿では,時間的情報検索と時間的質問回答の総合的概要について述べる。
我々は、トランスフォーマーモデルや大規模言語モデルなど、従来のアプローチと現代的なニューラルメソッドの両方をレビューする。
また、時間的言語モデリング、マルチホップ推論、検索強化生成の最近の進歩についてもレビューする。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:34:42 GMT)
Towards Multi-dimensional Evaluation of LLM Summarization across Domains and Languages [17.0] MSumBenchは、英語と中国語の要約の多次元多領域評価である。
8つの現代的な要約モデルを評価することにより、ドメインや言語間で異なるパフォーマンスパターンが見つかる。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:12:35 GMT)
Smotrom tvoja pa ander drogoj verden! Resurrecting Dead Pidgin with Generative Models: Russenorsk Case Study [16.6] ルセノルスク語(Russenorsk)は、ロシア語とノルウェー語との貿易で使われるピジン語である。
我々は同義語と語源によってグループ化された言語の構造化辞書を構築した。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:26:00 GMT)
Do Language Models Mirror Human Confidence? Exploring Psychological Insights to Address Overconfidence in LLMs [16.6] モデルでは、異なるペルソナに基づいて回答するよう促されたとき、人間の過信パターンと微妙な違いが示される。
信頼性キャリブレーションとLCMの解釈性を改善するために,アンサーフリー信頼度推定法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:37:18 GMT)
UNSURF: Uncertainty Quantification for Cortical Surface Reconstruction of Clinical Brain MRIs [16.5] 臨床脳MRI画像の皮質表面再構成のための新しい不確実性尺度であるUNSURFを提案する。
実際の臨床検査では, ボクセルのモンテカルロ分散などの従来の不確実性測定は, 表面配置の不確かさのモデル化には適していないことが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:31:51 GMT)
InfoChartQA: A Benchmark for Multimodal Question Answering on Infographic Charts [16.5] InfoChartQAは、インフォグラフィックチャートの理解に基づいてマルチモーダル大言語モデル(MLLM)を評価するためのベンチマークである。
5,642組のインフォグラフィックと平易なチャートが含まれており、それぞれが同じ基礎データを共有するが、視覚的な表示では異なる。
視覚的要素に基づく質問を設計し、そのユニークな視覚的デザインとコミュニケーション意図を捉える。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:25:24 GMT)
ChartGalaxy: A Dataset for Infographic Chart Understanding and Generation [16.5] インフォグラフィックチャートの理解を促進するために設計された100万規模のデータセットであるChartGalaxyを紹介する。
データセットは、実際のインフォグラフィックチャートから75のチャートタイプ、330のチャートバリエーション、68のテンプレートを識別するインダクティブプロセスによって構築される。
1)微調整によるインフォグラフィックチャート理解の改善,2)インフォグラフィックチャートのベンチマークコード生成,3)インフォグラフィックチャート生成の実現。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:53:58 GMT)
PADetBench: Towards Benchmarking Physical Attacks against Object Detection [16.3] 物体検出に対する物理的攻撃は、その重要な実践的意味から注目を集めている。
これらの課題に対処するため、現実的なシミュレーションを活用し、物理的攻撃を徹底的かつ厳密にベンチマークする。
私たちのベンチマークには、20の物理的攻撃方法、48のオブジェクト検出器、包括的な物理力学、評価指標が含まれています。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:03:18 GMT)
Understanding differences in applying DETR to natural and medical images [16.2] トランスフォーマーベースの検出器は、自然画像を用いたコンピュータビジョンタスクで成功している。
医用画像データには、非常に大きな画像サイズ、興味の少ない領域の小さい領域、微妙な違いによってのみ区別できるオブジェクトクラスなど、固有の課題がある。
本研究は, 検診用マンモグラフィーデータセットに適用した場合に, これらのトランスフォーマーに基づく設計選択の適用性を評価するものである。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:51:33 GMT)
Don't Miss the Forest for the Trees: Attentional Vision Calibration for Large Vision Language Models [16.2] 大きな視覚言語モデル(LVLM)は、視覚的理解と記述において強力な能力を示すが、幻覚に悩まされることが多い。
我々は,目隠しのメカニズムを変更せずに,目隠しトークンの影響を再検討するテストタイムアプローチである注意覚(AvisC)を提案する。
POPE、MME、AMBERなどの標準ベンチマークの実験は、AvisCがLVLMの幻覚を効果的に減少させることを示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:41:34 GMT)
Exploring the Effect of Segmentation and Vocabulary Size on Speech Tokenization for Speech Language Models [16.1] 音声トークン化は、音声信号を離散表現のシーケンスに変換する。
本稿では,音声トークン化の2つの重要な側面として,分割幅と離散単位のクラスタサイズについて検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:32:13 GMT)
Advancing Image Super-resolution Techniques in Remote Sensing: A Comprehensive Survey [15.9] リモートセンシング画像超解像(RSISR)は,リモートセンシング画像処理において重要な課題である。
近年、RSISR法が提案されているが、これらの手法の体系的かつ包括的なレビューはいまだに欠落している。
本稿では、RSISRアルゴリズムの徹底的なレビューを行い、方法論、データセット、評価指標について述べる。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:24:34 GMT)
INTERACT: Enabling Interactive, Question-Driven Learning in Large Language Models [15.8] 大規模言語モデル(LLM)は、質問に答える能力は優れているが、知識を疑問視したり洗練したりすることなく、静的データを受動的に吸収する。
本稿では,LLMが学生と教師の対話を通して,対話型,質問駆動型学習にどのように移行できるかを考察する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:21:54 GMT)
Towards Effective and Efficient Adversarial Defense with Diffusion Models for Robust Visual Tracking [15.8] 本稿では,DiffDfと呼ばれる拡散確率モデルに基づく新しい敵防衛法を提案する。
実験により、DiffDfは30FPS以上のリアルタイム推論速度を実現し、優れた防御性能と効率を示すことが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:37:28 GMT)
Efficient 3D Brain Tumor Segmentation with Axial-Coronal-Sagittal Embedding [15.8] 医用画像における脳腫瘍セグメンテーションの重要課題に対処し,その性能向上のための革新的なアプローチを提案する。
これらの制限を克服するために、Axial-Coronal-Sagittal畳み込みとImageNetからの事前訓練した重み付けをnnU-Netフレームワークに統合する。
2次元事前学習した重量を3次元領域に移動させる2つの戦略が提示され、学習関係の保存が保証された。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:30:37 GMT)
Efficient Open Set Single Image Test Time Adaptation of Vision Language Models [15.6] 動的で現実世界の環境にモデルを適応させることは、ディープラーニングにおける重要な課題である。
動的に更新された機能バンクを利用して信頼性の高いテストサンプルを識別する新しいフレームワークであるROSITAを提案する。
このアプローチは、未知のサンプルを拒絶しながら、既知のクラスに対するドメインシフトにモデルを効果的に適用する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:23:41 GMT)
LETS-C: Leveraging Text Embedding for Time Series Classification [15.5] 本稿では,時系列領域における言語モデリングの成功を活用するための代替手法を提案する。
テキスト埋め込みモデルを用いて時系列を埋め込み、その埋め込みを畳み込みニューラルネットワーク(CNN)と多層パーセプトロン(MLP)からなる単純な分類ヘッドと組み合わせる。
本研究は,テキスト埋め込みモデルを用いて時系列データをエンコードし,かつ,単純かつ効果的に分類し,高性能な時系列分類を実現する上で有望な方向性を示すことを示唆する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:41:19 GMT)
iDPA: Instance Decoupled Prompt Attention for Incremental Medical Object Detection [15.5] 1) 画像から詳細なインスタンスレベルの知識を分離するインスタンスレベルのPrompt Generation (ipg) と、2) 分離されたPrompt Attention (dpa) は、元のプロンプトの注意を分離し、より直接的で効率的な情報転送を可能にする。
我々は,13の臨床,クロスモーダル,マルチ組織,マルチカテゴリのデータセットをデータセットとして収集し,既存のSOTA法でメソッドアウトパフォーマンスが向上し,FAPが5.44%,4.83%向上したことを示す実験を行った。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:53:13 GMT)
StarVector: Generating Scalable Vector Graphics Code from Images and Text [15.3] 本稿では,SVG生成のための多モーダル大言語モデルであるStarを紹介する。
画像のセマンティクスを理解し、SVGプリミティブをコンパクトで正確な出力に使用することにより、画像ベクトル化を行う。
ベクトル化タスク間の一般化を可能にする2Mサンプルの多種多様なデータセットであるStarStackをトレーニングする。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:41:26 GMT)
IrrMap: A Large-Scale Comprehensive Dataset for Irrigation Method Mapping [15.1] IrrMapは、地域間での灌水方法マッピングのための最初の大規模データセット(11万パッチ)である。
データセットは2013年から2023年までの複数の西部州で1,687,899の農場と14,117,330エーカーに及ぶ。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:44:09 GMT)
Dynamic Domain Adaptation-Driven Physics-Informed Graph Representation Learning for AC-OPF [15.1] 交流最適潮流(AC-OPF)は、電力系統における電圧の大きさと位相角の非形式的関係を利用して発電機出力を最適化することを目的としている。
現在のAC-OPFソルバは、制約空間における変数分布と対応する最適解の間の複雑な関係を効果的に表すのに苦労している。
本稿では,制約に関連した問題に対処し,グラフベースの学習フレームワークを構築するための新しい手法であるDDA-PIGCNを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:07:19 GMT)
A3 : an Analytical Low-Rank Approximation Framework for Attention [14.6] トレーニング後の低ランク近似フレームワークである$tt Attt 3$を提案する。
tt Attt 3$ は SoTA よりも優れたパフォーマンスを維持していることを示す。
また、KVキャッシュ圧縮、量子化、性能向上のための混合ランク代入など、$tt Att 3$の汎用性も示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:12:10 GMT)
Exploring Compositional Generalization of Multimodal LLMs for Medical Imaging [14.4] マルチモーダルな大言語モデル(MLLM)は、その強力な一般化能力のため、分析にますます活用されている。
合成一般化(CG)をモデルに導入し,新しい組み合わせを理解する能力について検討した。
実験の結果、MLLMはCGを使って見えない医療画像を理解することができ、マルチタスクトレーニングで観察される一般化の主要因の1つとしてCGを特定した。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:45:12 GMT)
Neural Estimation for Scaling Entropic Multimarginal Optimal Transport [14.4] ニューラルエントロピーMOT(Neural Entropic MOT)と呼ばれる,エントロピーMOTのための新しい計算フレームワークを提案する。
NEMOTでは、データセットサイズからミニバッチサイズに計算複雑性を転送するミニバッチを使用してトレーニングされたニューラルネットワークを使用している。
特に、マグニチュード・オブ・マグニチュード・スピードアップは最先端技術と比較して観察され、可能なサンプル数や限界数が顕著に増加する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:10:27 GMT)
Efficient Latent Semantic Clustering for Scaling Test-Time Computation of LLMs [14.3] テスト時間計算のスケールは、大規模言語モデルの信頼性と品質を改善するための有望な戦略となっている。
主要な共有コンポーネントはセマンティッククラスタリング(セマンティッククラスタリング)である。
本稿では,ジェネレータLSMの内部隠蔽状態をクラスタリングに利用する軽量でコンテキストに敏感なLatent Semantic Clustering (LSC)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:08:32 GMT)
Label-shift robust federated feature screening for high-dimensional classification [14.3] 本稿では,既存のスクリーニング手法を統一する汎用フレームワークを提案し,ラベルシフト型ロバストな機能スクリーニング(LR-FFS)を提案する。
この枠組みに基づいて、LR-FFSは条件分布関数と期待値を活用し、計算負荷を加えることなくラベルシフトに対処する。
LR-FFSの各種クライアント環境における優れた性能を示す実験結果と理論的解析を行った。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:14:49 GMT)
Blending Complementary Memory Systems in Hybrid Quadratic-Linear Transformers [14.1] 汎用シーケンス処理ニューラルネットワークのためのハイブリッドメモリアーキテクチャを開発した。
高速プログラミング(FWメモリ)により,キー値メモリをソフトマックスアテンション(KVメモリ)と動的シナプスメモリと組み合わせる。
我々は、よく設計されたハイブリッドが、個々のコンポーネントの制限を克服できることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:16:53 GMT)
Fovea Stacking: Imaging with Dynamic Localized Aberration Correction [14.0] Fovea Stackingは、デフォルマブル位相プレート(DPP)と呼ばれる動的光学部品を使用して、イメージセンサーのどこにでも局所的な収差補正を行う新しいタイプのイメージングシステムである。
微分可能な光学モデルによりDPP変形を最適化することにより、オフ軸収差を局所的に補正し、眼窩に類似した、固定点での鋭さを増強したファーベレーション画像を生成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:15:27 GMT)
BenchHub: A Unified Benchmark Suite for Holistic and Customizable LLM Evaluation [13.9] BenchHubは動的ベンチマークリポジトリで、研究者や開発者がより大きな言語モデル(LLM)をより効果的に評価できるようにする。
継続的更新とスケーラブルなデータ管理をサポートし、さまざまなドメインやユースケースに合わせてフレキシブルでカスタマイズ可能な評価を可能にするように設計されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:24:32 GMT)
Multi-Prompting Decoder Helps Better Language Understanding [13.9] 本稿では,MaaS適応のためのMPD(Multi-Prompting Decoder)フレームワークを提案する。
提案手法は,複数の自然言語理解データセットに対して,数ショット設定で新たな最先端結果を実現する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:39:12 GMT)
ViVo: A Dataset for Volumetric VideoReconstruction and Compression [13.8] 本稿では,VolumetrIc VideO再構成と圧縮のための新しいデータセットViVoを提案する。
データセットは実世界のボリュームビデオ制作に忠実であり、多様性の定義を拡張する最初のデータセットである。
このデータベースの利用を実証するために,3つの最先端3次元再構成手法と2つのボリュームビデオ圧縮アルゴリズムをベンチマークした。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:30:21 GMT)
Learning to Upsample and Upmix Audio in the Latent Domain [13.8] ニューラルオーディオオートエンコーダは、知覚的に重要な情報を保持するコンパクトな潜在表現を生成する。
本稿では,オートエンコーダの潜在空間内で音声処理を行うフレームワークを提案する。
生音声における後処理に匹敵する品質を維持しつつ,最大100倍の計算効率向上を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:27:22 GMT)
Enhancing LLMs via High-Knowledge Data Selection [13.8] 大規模言語モデル(LLM)の性能は、そのトレーニングデータの品質と本質的に関連している。
我々は,知識の次元から高品質なデータを選択するための,新しい,勾配のないハイノウレッジ・スコラー(HKS)を提案する。
我々は、高知識バイリンガルデータセット上でモデルを訓練し、実験結果から、知識集約的および一般理解的なタスクにおいて、スコアラーがモデルの性能を向上させることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:47:36 GMT)
Large Language Models in Bioinformatics: A Survey [13.7] 大規模言語モデル(LLM)は生物情報学に革命をもたらし、DNA、RNA、タンパク質、単細胞データの高度な解析を可能にしている。
この調査は、ゲノム配列モデリング、RNA構造予測、タンパク質機能推論、単細胞転写学など、最近の進歩の体系的なレビューを提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:40:57 GMT)
Tokens for Learning, Tokens for Unlearning: Mitigating Membership Inference Attacks in Large Language Models via Dual-Purpose Training [13.7] 大規模言語モデル(LLM)は、現代の自然言語処理のバックボーンとなっているが、センシティブなトレーニングデータの漏洩に関するプライバシー上の懸念を生じさせている。
本稿では,トークン固有の特徴を活用して,言語モデルのトレーニングデータを保護するための,軽量かつ効果的な経験的プライバシ保護手法である methodname を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:53:12 GMT)
DrKGC: Dynamic Subgraph Retrieval-Augmented LLMs for Knowledge Graph Completion across General and Biomedical Domains [13.6] 知識グラフ補完(KGC)は、既存の三重情報とテキスト情報を活用することにより、知識グラフ(KG)に欠落した三重情報を予測することを目的としている。
DrKGCは、KG内の構造埋め込みと論理ルールを学ぶために、フレキシブルで軽量なモデルトレーニング戦略を採用している。
そして、新しいボトムアップグラフ検索手法を利用して、学習ルールでガイドされた各クエリのサブグラフを抽出する。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:56:54 GMT)
SatDreamer360: Geometry Consistent Street-View Video Generation from Satellite Imagery [13.6] 衛星画像から幾何学的かつ時間的に一貫した地上映像を生成する新しいフレームワークであるSatDreamer360を提案する。
実験により、SatDreamer360は様々な都市のシーンにおける忠実さ、コヒーレンス、幾何学的アライメントにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:15:54 GMT)
The Hidden Language of Harm: Examining the Role of Emojis in Harmful Online Communication and Content Moderation [13.4] エモジは孤立して攻撃的になることはめったにないが、象徴的連想、皮肉、文脈的誤用を通じて有害な意味を得ることができる。
ツイートの意味的意図を保ちながら有害な絵文字を置き換えるLLM方式のマルチステップモデレーションパイプラインを提案する。
分析の結果、オンラインコミュニケーションや絵文字のモデレーションに不均一な洞察を与え、悪質なタイプにまたがる異質な効果も明らかにした。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:39:08 GMT)
Speculative Reward Model Boosts Decision Making Ability of LLMs Cost-Effectively [13.4] 本稿では,検索戦略の費用対効果を評価するために3E基準を導入する。
本稿では,既存の検索戦略とシームレスに統合するプラグイン・アンド・プレイ・フレームワークであるSpeculative Reward Model (SRM)を提案する。
実験の結果,RMは,有効性を保ちながら,従来の検索フレームワークの1/10までコストを削減できることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:32:12 GMT)
Enabling Chatbots with Eyes and Ears: An Immersive Multimodal Conversation System for Dynamic Interactions [13.3] 本研究の目的は、人間とのより没入的な相互作用が可能な「目と耳」をチャットボットに装備することである。
本稿では,マルチモーダルな会話データセットであるマルチモーダルなマルチセッション・マルチパーティ・会話について紹介する。
我々のモデルはM3C$で訓練され、複数の話者との長期会話をシームレスに行う能力を示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:50:51 GMT)
A Survey of Large Language Models in Psychotherapy: Current Landscape and Future Directions [13.2] 大きな言語モデル(LLM)は、広いコンテキストとマルチターン推論を扱う能力のために、このギャップに対処する可能性がある。
本総説では, 精神療法を相互に連携した段階(評価, 診断, 治療)に分割し, LLMの進歩と課題を体系的に検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:40:23 GMT)
Predictability-Aware Compression and Decompression Framework for Multichannel Time Series Data [13.1] 本稿では,予測可能性を考慮した圧縮圧縮フレームワークを提案し,ランタイムの削減,通信コストの低減,予測精度の維持を図る。
提案するフレームワークは時間効率が高く,多数のチャネルでスケーラブルである。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:53:41 GMT)
GAME: Learning Multimodal Interactions via Graph Structures for Personality Trait Estimation [13.1] ショートビデオからの明瞭なパーソナリティ分析は、視覚的、聴覚的、およびテキスト的手がかりの複雑な相互作用のため、重要なチャルレンジを呈する。
本稿では,グラフ拡張型マルチモーダル進化法であるGAMEを提案する。
ビジュアルストリームのために、顔グラフを構築し、グラフ畳み込みネットワーク(GCN)と畳み込みニューラルネットワーク(CNN)を組み合わせたデュアルブランチGeo Two-Stream Networkを導入する。
時間的ダイナミクスを捉えるために、フレームレベルの特徴はBiGによって処理される
論文参考訳(メタデータ) (Sat, 31 May 2025 09:08:51 GMT)
Advanced simulation paradigm of human behaviour unveils complex financial systemic projection [13.0] 本稿では,各エージェントが階層的知識アーキテクチャによってサポートされ,駆動される行動シミュレーションの新しいパラダイムを提案する。
我々のシミュレーターは、価格上昇率が285.34%に達する危機シナリオをシミュレートする上で、13.29%の偏差を達成している。
また,通常の条件下では,商品先物価格の予測における平均2乗誤差も低く抑えられる。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:30:25 GMT)
Semantic-guided Representation Learning for Multi-Label Recognition [13.0] マルチラベル認識(MLR)では、画像内の各データインスタンスに複数のラベルを割り当てる。
近年のビジョンと言語事前学習法は、ゼロショットMLRタスクの処理において大きな進歩を遂げている。
本研究では,セマンティック誘導型表現学習手法(SigRL)を導入し,モデルが効果的な視覚的およびテキスト的表現を学習できるようにする。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:49:50 GMT)
Causal Structure Discovery for Error Diagnostics of Children's ASR [13.0] 子どもの自動音声認識(ASR)は、相互依存因子が混在しているため、大人に比べて性能が劣ることが多い。
生理学,認知学,外因性要因,およびASRエラーの相互依存関係を明らかにするために,因果構造発見を導入する。
分析を微調整モデルに拡張し、微調整によって緩和される要因を識別し、ほとんど影響を受けない。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:44:43 GMT)
Sequence-Based Identification of First-Person Camera Wearers in Third-Person Views [12.9] TF2025は、ファーストパーソンとサードパーソンのビューを同期した拡張データセットである。
本研究では,3人称映像における一対一の着用者を特定するシークエンスに基づく手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:25:18 GMT)
SenseFlow: Scaling Distribution Matching for Flow-based Text-to-Image Distillation [12.8] 分散マッチング蒸留 (DMD) は, 安定拡散 (SD) 1.5 などのテキスト・画像拡散モデルに適用されている。
しかし、バニラMDDはSD 3.5やFLUXのような大規模フローベースのテキスト・ツー・イメージモデルにおいて収束困難に悩まされている。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:59:02 GMT)
Statistical Signal Processing for Quantum Error Mitigation [12.8] 量子誤差緩和(QEM)に対する統計的信号処理手法を提案する。
我々のモデルは、回路深度がノイズの偏極化に十分であると仮定し、劣化した観測結果を生成する。
提案手法は,ノイズモデルに整合した合成データを用いて,より大規模な量子ビット数にスケールすることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:34:19 GMT)
Decoupling Reasoning and Knowledge Injection for In-Context Knowledge Editing [12.5] インコンテキスト編集(ICE)は、入力コンテキストに直接新しい知識を注入することで、軽量なソリューションを提供する。
既存のICEアプローチは、新しく注入された知識をモデル本来の推論プロセスから明確に分離するものではない。
マスク付き推論経路を生成することで知識編集から推論を分離する新しいICEフレームワークであるDecKERを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:51:12 GMT)
Adaptive-VP: A Framework for LLM-Based Virtual Patients that Adapts to Trainees' Dialogue to Facilitate Nurse Communication Training [12.3] Adaptive-VPは、訓練生の入力に基づいてVPの振る舞いを動的に適応する対話生成フレームワークである。
臨床ベースでフレキシブルなVPシナリオを構築するパイプラインと、トレーニング担当者のコミュニケーションを評価し、VPレスポンスをリアルタイムで調整するモジュールシステムを備えている。
実践看護師のコーパスから,我々のコミュニケーションスキル評価メカニズムが実世界の熟練度を反映していることが判明した。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:34:55 GMT)
Recover Experimental Data with Selection Bias using Counterfactual Logic [12.0] 我々は、観測界における選択機構が反現実領域にどのように伝播するかを分析する。
偏りのない観測データを利用して、偏りのある実験データセットから$P(Y*_x*)$を回収する原理的手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:23:39 GMT)
"Cold, Calculated, and Condescending": How AI Identifies and Explains Ableism Compared to Disabled People [11.9] 障害のある人(PwD)は、定期的にネット上の憎悪やマイクロアグレッションに遭遇する。
AIモデルが有能な発話をいかに効果的に識別するか、その判断がPwDとどのように一致しているかについては、ほとんど分かっていない。
われわれはPwDをターゲットとした200のソーシャルメディアコメントの第一種データセットをキュレートした。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:18:42 GMT)
Regionalized Metric Framework: A Novel Approach for Evaluating Multimodal Multi-Objective Optimization Algorithms [11.8] 本研究では,地域化メトリック・フレームワークに基づく評価指標を提案する。
アルゴリズムは評価対象の解の集合を3つの領域に分割し、各領域のユニークなスコアリング関数に従って各解を評価する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:36:55 GMT)
Communication Efficient Multiparty Private Set Intersection from Multi-Point Sequential OPRF [11.8] マルチパーティ・プライベート・セット・交差点(MPSI)は、複数の参加者がローカルに所有するデータセットの交点を公開せずに計算することができる。
既存のMPSIプロトコルのほとんどは、星、メッシュ、リングトポロジーに基づいている。
リングトポロジを持つMPSIプロトコルを開発し,通信の課題と計算オーバーヘッドに対処する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:50:40 GMT)
Massively Multilingual Adaptation of Large Language Models Using Bilingual Translation Data [11.6] Llama3モデルのLlama3系列を500言語に大々的に多言語化するためのバイリンガル翻訳データの影響について検討した。
我々は2500以上の言語対のデータを含むMALAバイリンガル翻訳コーパスを構築した。
我々は4つの大規模多言語モデルからなるEMMA-500 Llama 3スイートを開発した。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:37:17 GMT)
Application based Evaluation of an Efficient Spike-Encoder, "Spiketrum" [11.6] スパイクベースのエンコーダは、情報をスパイクまたはパルスのシーケンスとして表現し、ニューロン間で伝達される。
Spiketrumエンコーダはスパイクトレインまたはコードセットを使用して入力データを効率よく圧縮する。
この論文は、Spketrumハードウェアとそのソフトウェアの両方を、最先端で生物学的に証明可能なエンコーダに対して広範囲にベンチマークしている。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:08:07 GMT)
Neuro2Semantic: A Transfer Learning Framework for Semantic Reconstruction of Continuous Language from Human Intracranial EEG [11.5] 頭蓋内脳波(iEEG)記録から知覚音声の意味内容を再構築する新しい枠組みであるNeuro2Semanticを紹介する。
まず、LSTMベースのアダプタが、トレーニング済みのテキスト埋め込みとニューラルネットワークをアライメントし、次に、修正モジュールがこれらのアライメントされた埋め込みから直接、連続した自然なテキストを生成する。
Neuro2Semanticは、30分以内のニューラルデータで強力なパフォーマンスを達成し、ローデータ設定における最新の最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:17:19 GMT)
Channel-Imposed Fusion: A Simple yet Effective Method for Medical Time Series Classification [11.5] 本研究は、構造的透明性を重視したモデリングパラダイムに焦点を移し、医療データの本質的な特徴とより密接に一致させる。
本稿では,チャネル間情報融合による信号と雑音の比を高める新しい手法であるChannel Imposed Fusion (CIF)を提案する。
複数のパブリックなEEGおよびECGデータセットの実験結果は、提案手法が既存の最先端(SOTA)アプローチを様々な分類基準で上回るだけでなく、分類プロセスの透明性を著しく向上させ、医療時系列分類の新しい視点を提供することを示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:44:30 GMT)
Disentangling Codemixing in Chats: The NUS ABC Codemixed Corpus [11.5] コードミキシングは、単一の言説の中で複数の言語からの言語要素をシームレスに統合する。
著者ラベル付きで、人間の会話や関係をモデル化するのに適した公開コーパスが不足している。
本研究では,厳格なプライバシと倫理基準を維持しつつ,文脈におけるコードミキシングを理解するためのラベル付き汎用コーパスについて紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:09:04 GMT)
Assortment of Attention Heads: Accelerating Federated PEFT with Head Pruning and Strategic Client Selection [11.4] 本稿では,フェデレートラーニングフレームワーク内でPEFTを実行するための効率的な手法を提案する。
我々は,頭部刈り込み,頭部特異的重み付け機構,クライアント選択戦略を通じて課題に対処する。
我々は、20のニュースグループ、XL-Sum、E2E NLGデータセットと共に、MultiNLIベンチマークの結果を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:09:26 GMT)
Narrative Media Framing in Political Discourse [11.4] ナラティブフレームは、複雑で物議を醸すアイデアを概念化し、伝達する強力な方法である。
本稿では,ナラティビティの要素をフレーミングの基本的な側面と結びつけ,そのような側面を形式化し,運用する枠組みを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:55:08 GMT)
LENSLLM: Unveiling Fine-Tuning Dynamics for LLM Selection [11.4] オープンソースのLarge Language Models (LLM) と様々な下流タスクは効率的なモデル選択を必要とする。
LLMの一般化能力を評価するための適切なレンズを提供する新しい理論フレームワークを提案する。
特に, LLMの微調整ダイナミクスを明らかにするPAC-Bayesian Generalization Boundを導出する。
次に,ニューラルタンジェントカーネル(NTK)をベースとしたRectified Scaling ModelであるLENSLLMを紹介し,正確な性能予測を実現する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:36:42 GMT)
Temporal Chunking Enhances Recognition of Implicit Sequential Patterns [11.3] 本稿では、時間的シーケンスを文脈タグ付きチャンクに圧縮する神経インスパイアされたアプローチを提案する。
これらのタグはオフラインのスリープフェーズで生成され、過去の経験のコンパクトな参照として機能する。
我々は、従来のニューラルネットワークに基づくシーケンス学習者の限界を明らかにするために、制御された合成環境において、このアイデアを評価する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:51:08 GMT)
RsGCN: Rescaling Enhances Generalization of GCNs for Solving Scalable Traveling Salesman Problems [11.3] 本稿では、スケーラブルなニューラル走行セールスマン問題(TSP)解決のための新しいRescaling Graph Convolutional Network(RsGCN)を提案する。
RsGCNは、(1)隣接ノードを再スケーリングして、各ノードに対する隣接ノード数の均一なサブグラフを構築することにより、機能一般化を強化する。
さらに、RsGCNでは、混合スケールデータセットと双方向ロスによる効率的なトレーニング戦略が使用される。
RsGCN と Re2Opt を併用したアーキテクチャを基礎として,我々の解法は目覚ましい一般化と訓練コストの低減を実現している。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:40:02 GMT)
MT-RAIG: Novel Benchmark and Evaluation Framework for Retrieval-Augmented Insight Generation over Multiple Tables [11.3] MT-RAIG Benchは、マルチテーブル上での検索型インサイト生成システムを評価するように設計されている。
そこで本研究では,人体品質判定の精度向上を目的とした,詳細な評価フレームワークMT-RAIG Evalを紹介した。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:47:26 GMT)
Beyond Context to Cognitive Appraisal: Emotion Reasoning as a Theory of Mind Benchmark for Large Language Models [11.3] 本研究では,大規模言語モデル(LLM)が文脈情報を用いて,他者の情緒状態をどう判断するかを検討するために,表面レベルの知覚的特徴を超えて前進する。
認知評価理論を基礎としたToM評価データセット1をキュレートし,前向きの推論(文脈から感情へ)と後向きの推論(文脈から感情へ)の両方を評価する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:18:04 GMT)
Nearest neighbor synthesis of CNOT circuits on general quantum architectures [11.2] NISQデバイスは、接続性やハードウェアノイズに固有の制限がある。
CNOT回路の合成は物理的制約を考慮し、量子アルゴリズムを低レベル量子回路に変換する。
本論文は、ハミルトニアンパスを持つアーキテクチャにおけるCNOT回路の近接合成について述べる。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:14:43 GMT)
Constrained Stein Variational Gradient Descent for Robot Perception, Planning, and Identification [11.1] 本稿では、制約付き最適化の原理を新しい変分推論に応用する2つの新しいフレームワークを提案する。
衝突を正確に回避するロボット動作計画,SE(3)多様体上のロボットアーム関節角度の正確なテーブル配置制約,およびテーブル配置制約付きポイントクラウドからのオブジェクトポーズの分布を構築することができることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:52:34 GMT)
Is Your Explanation Reliable: Confidence-Aware Explanation on Graph Neural Networks [11.0] 本稿では,信頼度評価モジュール(ConfExplainer)を用いた説明フレームワークを提案する。
実験の結果,GNN説明の堅牢性と信頼性を高める上での信頼性スコアの有効性が示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:34:54 GMT)
Elucidating Flow Matching ODE Dynamics with Respect to Data Geometries [10.9] フローマッチング(FM)モデルは、ODEサンプルモデルに基づく拡散モデルを一般的なフレームワークに拡張する。
FMモデルの厳密な理論的解析は、サンプルの品質、安定性、より広範な適用性に不可欠である。
本稿では,サンプル軌道の包括的解析により,FMモデルの理論を推し進める。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:09:11 GMT)
SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Constrained Learning [10.8] 視覚言語アクションモデル(VLA)は、汎用的なロボットポリシーとしての可能性を示している。
これらのモデルは、環境、ロボット自身、人間への危害のリスクを含む、現実世界の展開中に極端な安全上の課題を生じさせる。
我々は、ISA(Integrated safety approach)を探求し、安全要件を体系的にモデル化し、多様な安全でない振る舞いを積極的に引き出すことによって、この問題に対処する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:22:50 GMT)
ProjectEval: A Benchmark for Programming Agents Automated Evaluation on Project-Level Code Generation [10.7] ユーザインタラクションをシミュレートしてプロジェクトレベルのコード生成を自動評価する,LLMエージェントのための新しいベンチマークであるProjectEvalを紹介する。
ProjectEvalは、実行のためのユーザインタラクションシミュレーションと、既存の客観的インジケータによるコード類似性によって、生成されたプロジェクトを評価することができる。
システム工学的なプロジェクトコード、プロジェクト全体の理解、総合的な分析能力が、LLMエージェントが実践的なプロジェクトを達成する鍵であることに気付きました。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:53:50 GMT)
Temac: Multi-Agent Collaboration for Automated Web GUI Testing [10.7] 我々は,大規模言語モデル(LLM)を用いた自動Web GUIテスト(AWGT)を強化し,コードカバレッジを向上させるアプローチであるTemacを提案する。
評価の結果,Temacは6つの複雑なオープンソースWebアプリケーションのコードカバレッジの平均12.5%から60.3%に,最先端のアプローチを超越していることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:43:37 GMT)
Context-Robust Knowledge Editing for Language Models [10.6] 知識編集手法のコンテキストロバスト性を評価するためのベンチマークであるCHEDを開発した。
CHEDの評価は、先行するコンテキストが存在するときにしばしば失敗することを示している。
我々はコンテキストの堅牢性を高めるために設計されたKE手法であるCoREを紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:20:21 GMT)
Hidden Conflicts in Neural Networks and Their Implications for Explainability [10.6] 我々は、ANNにおける対立の理論を開発し、2つのケーススタディを通して、ANNの説明可能性への影響を実証する。
最初のケーススタディでは、コンフリクトの理論を用いて、新しい特徴帰属法の設計を刺激する。
第2のケーススタディでは、アウト・オブ・ディストリビューションシナリオにおけるコンフリクトの役割を理解するための予備的なステップを採っている。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:46:26 GMT)
TreeRare: Syntax Tree-Guided Retrieval and Reasoning for Knowledge-Intensive Question Answering [10.6] 反復的かつ適応的な検索は、複雑で知識集約的な質問を解決するための有望なアプローチであることが示されている。
本研究では,構文木を利用した質問応答のための情報検索と推論のためのフレームワークであるTreeRareを提案する。
TreeRareは、既存の最先端メソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:07:50 GMT)
Experimental demonstration of generalized quantum fluctuation theorems in the presence of coherence [10.5] フォトニックシステムにおける量子ゆらぎ定理(QFT)の実験的検証を報告する。
実験により,時間-フォワードの準確率と複数の時間-反転過程との比が一般化されたクルックスQFTに従うことを確認した。
これらの知見は、一般的な量子プロセスと時間反転の基本的な対称性を強調し、ノイズの多い量子情報処理を探索するための基本的なツールキットを提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:00:59 GMT)
Math Neurosurgery: Isolating Language Models' Math Reasoning Abilities Using Only Forward Passes [10.3] 数学推論は人工知能の目印であり、数学教育を含むいくつかの領域に影響を及ぼす。
大規模言語モデルパラメータ内での数学推論のエンコード方法や、それがモデル内で孤立可能なスキルであるかどうかについて、いくつかの研究がおこなわれている。
フォワードパスのみを用いて LLM における算数固有パラメータを分離する計算効率のよい方法である MathNeuro を導入する。
MathNeuroは、パラメータの重要度を計算するために重みとアクティベーションを使用することで、既存の作業の上に構築されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:37:42 GMT)
CityBench: Evaluating the Capabilities of Large Language Models for Urban Tasks [10.2] 大規模言語モデル (LLMs) と視覚言語モデル (VLMs) は、実際の有効性と信頼性を確保するために欠かせないものとなっている。
都市研究のための体系的評価ベンチマークを構築する上での課題は、都市データの多様性にある。
本稿では,対話型シミュレータによる評価プラットフォームである textitCityBench を設計する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:40:15 GMT)
CodeReviewQA: The Code Review Comprehension Assessment for Large Language Models [10.1] 最先端の大規模言語モデル(LLM)は、印象的なコード生成機能を示しているが、実際のソフトウェアエンジニアリングタスクに苦労している。
コードレビューのコメントは暗黙的であり、曖昧で、口語であり、モデルがコードと人間の意図の両方を理解する必要がある。
この課題は、大きな言語モデルが技術的コンテキストと会話的コンテキストの両方を橋渡しする能力を評価することである。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:26:00 GMT)
Beyond Face Swapping: A Diffusion-Based Digital Human Benchmark for Multimodal Deepfake Detection [10.1] 拡散モデルに基づく大規模マルチモーダルデジタルヒューマンフォージェリデータセットであるDigiFakeAVを紹介する。
私たちのデータセットは6万のビデオ(840万フレーム)で構成され、複数の国籍、肌の色、性別、現実世界のシナリオをカバーしています。
ユーザ調査によると、DigiFakeAVの参加者による誤認識率は最大68%に達する。
DigiShieldは、ビデオの3Dセマンティック特徴と音声のセマンティック音響特徴を共同でモデル化することにより、DigiFakeAV上での最先端のSOTA(State-of-thetemporal-art)パフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:32:55 GMT)
On Temperature Scaling and Conformal Prediction of Deep Classifiers [10.0] コンフォーマル予測(CP)は、ユーザが特定した確率で真のラベルを含む候補ラベルの予測セットを生成する。
温度スケーリング(TS)キャリブレーションは適応CP法のクラス条件カバレッジを改善するが、驚くべきことに予測セットサイズに悪影響を及ぼす。
本稿では,適応型CPとキャリブレーションを効果的に組み合わせ,ユーザ定義の目標に合わせるためのガイドラインを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:57:06 GMT)
Attention-Aided MMSE for OFDM Channel Estimation: Learning Linear Filters with Attention [9.9] 本稿では,アテンション変換器を用いて最適MMSEフィルタを学習するアテンション支援型MMSEを提案する。
A-MMSEは、チャネル推定のための単一の線形演算を通じてチャネルを推定し、推論中の非線形活性化を除去する。
提案したA-MMSEのランク適応拡張により、複雑性とチャネル推定精度の間の柔軟なトレードオフが可能になる。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:12:04 GMT)
A Brain Graph Foundation Model: Pre-Training and Prompt-Tuning for Any Atlas and Disorder [9.8] 本稿では,脳グラフ基盤モデルを構築するための,グラフに基づく事前学習パラダイムを提案する。
BrainGFMは、様々なパーセレーションと様々な脳のアトラスの混合物で事前訓練されている。
BrainGFMは、25の一般的な神経疾患と精神疾患にまたがる27のデータセットで事前訓練されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:35:53 GMT)
SafeTy Reasoning Elicitation Alignment for Multi-Turn Dialogues [9.8] 悪意のある攻撃者は、大きな言語モデル(LLM)をマルチターン対話で利用することができる。
マルチTurnダイアログ(STREAM)のためのSafeTy Reasoning Elicitation Alignmentという新しい防御機構を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:38:23 GMT)
Event-based multi-view photogrammetry for high-dynamic, high-velocity target measurement [9.7] 既存の測定方法は、限られたダイナミックレンジ、不連続な観測、高コストといった課題に直面している。
本稿では,イベントベース多視点測光システムを活用した新しいアプローチを提案する。
軽ガスガンのフラグメント試験では, 電磁式速度計と比較して測定偏差が4.47%であった。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:23:39 GMT)
A New Spatiotemporal Correlation Anomaly Detection Method that Integrates Contrastive Learning and Few-Shot Learning in Wireless Sensor Networks [9.6] 既存の異常検出手法は、サンプルラベルの欠如、少数の異常サンプル、不均衡なサンプル分布などの課題に直面していることが多い。
これらの問題に対処するために,相関検出モデル(MTAD-RD)を提案する。
MTAD-RDは、時系列データからグローバル情報を抽出しながら、モーダル間相関特徴と空間ノード間近傍を統合することができる。
そのシリアライズされた推論特性ノードは、推論オーバーヘッドを著しく削減することができる。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:50:05 GMT)
Do Language Models Understand the Cognitive Tasks Given to Them? Investigations with the N-Back Paradigm [9.6] GPT 3.5の2-backタスクと3-backタスクのパフォーマンス低下は、人間のように動作するメモリ容量の限界を反映していることを示す。
これらのタスクにおける様々なパフォーマンスレベルのオープンソース言語モデルを解析することにより、少なくともタスク理解とタスクセットのメンテナンスの制限によるパフォーマンスの低下が少なくとも一部原因であることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:13:06 GMT)
Beyond the Protocol: Unveiling Attack Vectors in the Model Context Protocol Ecosystem [9.1] Model Context Protocol(MCP)は、LLM(Large Language Model)アプリケーションと外部ツールやリソースとのシームレスな相互作用を可能にするために設計された新しい標準である。
本稿では,MPPエコシステムを対象とした攻撃ベクトルに関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:01:11 GMT)
HateDay: Insights from a Global Hate Speech Dataset Representative of a Day on Twitter [9.1] ソーシャルメディア設定を代表した初のグローバルヘイトスピーチデータセットであるHateDayを紹介する。
本研究では,学術データセットに対する評価が実世界の検出性能を大幅に過大評価していることを示す。
モデル性能の低さは、公的なモデルを自動ヘイトスピーチのモデレーションに不適当にしている、と我々は主張する。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:52:11 GMT)
VITAL: A New Dataset for Benchmarking Pluralistic Alignment in Healthcare [9.1] 既存のアライメントパラダイムは、文化、人口統計学、地域社会における視点の多様性を説明できない。
これは、文化、宗教、個人的価値観、矛盾する意見の影響により複数のことが不可欠である健康関連シナリオにおいて特に重要である。
この研究は、現在のアプローチの限界を強調し、健康固有のアライメントソリューションを開発するための基盤となる。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:13:38 GMT)
Log-PDE Methods for Rough Signature Kernels [9.1] 署名カーネルは時系列解析のための機械学習アルゴリズムを支える。
既存のPDEソルバはインクリメントのみを入力データとして使用するため、一階近似誤差が発生する。
入力された粗経路の高次反復積分を含む係数を含むPDEの新しいシステムにより、粗符号カーネルを近似することができることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:27:42 GMT)
Local Frames: Exploiting Inherited Origins to Bypass Content Blockers [9.0] ローカルフレームは、"about:blank"のようなURL以外のソースを持つiframeである
本稿では,ローカルフレームがさまざまなWebセキュリティおよびプライバシツールによってどのように扱われているかについて検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:07:24 GMT)
EcoLens: Leveraging Multi-Objective Bayesian Optimization for Energy-Efficient Video Processing on Edge Devices [9.0] 資源制約のある環境でのリアルタイム分析のためのビデオ処理は、エネルギー消費とビデオセマンティクスのバランスをとる上での課題である。
本稿では,ディープラーニング推論に不可欠なビデオ機能を保持しつつ,エッジ上でのエネルギー消費を最小限に抑えるために,処理を動的に最適化するシステムを提案する。
実験結果から,高解析性能を維持しつつ,ビデオ処理エネルギー使用量を削減するシステムの有効性が示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:47:47 GMT)
Causal Abstraction Learning based on the Semantic Embedding Principle [8.9] 構造因果モデル(SCM)により,複数の解像度で複雑なシステムを調べることができる。
本稿では,低次測度と高次測度の間の準同型を見出すことにより,CAの学習を可能にするSCMに対するカテゴリー論的アプローチを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:31:59 GMT)
Multimodal Generative AI with Autoregressive LLMs for Human Motion Understanding and Generation: A Way Forward [8.5] 本稿では,多モード生成人工知能(GenAI)と自己回帰型大規模言語モデル(LLM)を人間の動作理解と生成に利用することに焦点を当てる。
新たな手法、アーキテクチャ、および現実的で汎用的なモーション合成を前進させる可能性についての洞察を提供する。
本研究は,医療,ヒューマノイド,ゲーム,アニメーション,アシスト技術などの応用において,テキスト・トゥ・モーションのGenAIとLLMアーキテクチャの変革の可能性を示すものである。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:02:24 GMT)
Developmentally-plausible Working Memory Shapes a Critical Period for Language Acquisition [8.4] 大きな言語モデルは一般的な言語能力を持っているが、人間よりも効率が低い。
本研究では,臨界期における作業記憶の発達特性を統合する手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:07:46 GMT)
Protein Language Model Zero-Shot Fitness Predictions are Improved by Inference-only Dropout [8.1] そこで本研究では,ProteinGymデータセットのサブセットにおいて,プロデューサ/エンベディング層とそのトランスフォーマー間の推論時間にドロップアウト層を注入することにより,ゼロショット性能が向上することを示す。
0.1のドロップアウトは、すべてのモデルでパフォーマンスが向上しているようだ。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:16:59 GMT)
Fact-Controlled Diagnosis of Hallucinations in Medical Text Summarization [8.1] 大きな言語モデル(LLM)の幻覚は、患者のケアと臨床的意思決定に重大なリスクをもたらす。
一般ドメイン検出器は、臨床幻覚の検出に苦慮し、ファクトコントロールされた幻覚の性能は、自然幻覚に対する効果を確実に予測できない。
幻覚を数えるファクトベースアプローチを開発し、既存の手法では利用できない説明可能性を提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:04:37 GMT)
A Computational Approach to Improving Fairness in K-means Clustering [8.0] 一般的なK平均クラスタリングアルゴリズムは、さらなる分析や解釈の大きな弱点に悩まされる可能性がある。
この研究は、K平均クラスタリングの公平性を改善するために、2段階最適化の定式化を試みる。
ベンチマークデータセットの実験は、クラスタリングの品質に最小限の影響を伴って、フェアネスを大幅に改善したことを示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:44:03 GMT)
OrgAccess: A Benchmark for Role Based Access Control in Organization Scale LLMs [8.0] 大規模言語モデル(LLM)は、エンタープライズ環境での統合知識リポジトリとインテリジェントアシスタントとして機能する。
この重要な能力を評価することは、現実の企業データとアクセス制御ポリシーの独自性と機密性のため、本質的に難しい。
組織の役割やレベルに共通する40種類のパーミッションからなる,総合的かつ代表的な textbfOrgAccess ベンチマークを導入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:24:08 GMT)
Score Matching With Missing Data [8.0] スコアマッチングは、フレキシブルな設定で欠落したデータを扱うように適応します。
一般的な用途には2つの異なるスコアマッチングのバリエーション、重要重み付け(IW)アプローチ、変分アプローチを提供する。
より複雑な高次元設定において、我々の変分アプローチが最強であることを示します。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:26:51 GMT)
Quantifying Lexical Semantic Shift via Unbalanced Optimal Transport [7.9] SUS(Sense Usage Shift)は,各用例における単語感覚の使用頻度の変化を定量化する尺度である。
意味変化検出におけるいくつかの課題を統一的に解決できることを実証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:22:24 GMT)
Monitoring Robustness and Individual Fairness [7.9] デプロイされたブラックボックスAIモデルのインプット・アウトプット・ロバスト性のランタイムモニタリングを提案する。
そこで本研究では, 固定半径近傍の探索問題 (FRNN) として, 監視問題をキャストできることを示す。
いくつかの軽量モニタを提供するツールであるClemontを紹介します。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:27:54 GMT)
An LLM Agent for Functional Bug Detection in Network Protocols [7.8] RFCScanは、大きな言語モデル(LLM)を利用して機能的なバグを検出する自律エージェントである。
ヒトの監査手順にインスパイアされたRFCScanは、インデクシングエージェントと検出エージェントの2つの重要なコンポーネントから構成される。
RFCScanは、81.9%の精度で47の機能的バグを特定し、そのうち20のバグが開発者によって確認または修正されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:13:19 GMT)
Research on E-Commerce Long-Tail Product Recommendation Mechanism Based on Large-Scale Language Models [7.8] 大規模言語モデル(LLM)を用いた製品記述とユーザ行動シーケンスを統合した,新しいロングテール製品レコメンデーション機構を提案する。
我々の研究は、今後のeコマースレコメンデーションシステムにおいて、製品コンテンツとユーザ意図を解釈するLLMの可能性を強調します。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:17:48 GMT)
Subpixel Edge Localization Based on Converted Intensity Summation under Stable Edge Region [7.8] 我々は、ピクセルレベルの強度が、サブピクセルローカライゼーションの強度モデルにおける局所積分写像として解釈できると仮定して、革新的な視点を取る。
個々のエッジ点の局所化にのみ焦点をあてた限られたロバスト性に対処するため、安定エッジ領域(SER)に基づくアルゴリズムがエッジ近傍での局所的干渉を軽減するために提案される。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:48:04 GMT)
From Local Cues to Global Percepts: Emergent Gestalt Organization in Self-Supervised Vision Models [7.8] 我々は、現代の視覚モデルが類似した行動を示すかどうか、そしてこれらがどのような訓練条件で現れるかを検討する。
Masked Autoencoding (MAE) で訓練された視覚変換器 (ViT) はゲシュタルト法則と整合したアクティベーションパターンを示す。
本研究では,局所的なテクスチャを保ちながら,地球規模の空間摂動に対する感受性を評価するためのディストーテッド空間関係テストベンチ(DiSRT)を紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:35:54 GMT)
Bregman Conditional Random Fields: Sequence Labeling with Parallelizable Inference Algorithms [7.7] 本稿では,Bregman Conditional random Field (BCRF) と呼ばれるシーケンスラベリングの新しい識別モデルを提案する。
BCRFは、反復的なブレグマン射影に基づく高速並列化可能な推論アルゴリズムを実現する。
このようなモデルがFenchel-Youngの損失を使ってどのように学習できるかを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:36:21 GMT)
SAFEPATH: Preventing Harmful Reasoning in Chain-of-Thought via Early Alignment [7.7] SAFEPATHは, LRMを微調整して, その推論の開始時に, 短時間で8個の安全プライマーを出力する軽量アライメント手法である。
実験の結果,SAFEPATHは推論性能を維持しながら有害な出力を効果的に減少させることが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:18:54 GMT)
CLEAR: Character Unlearning in Textual and Visual Modalities [7.6] マルチモーダル・アンラーニング(MMU)は、クロスモーダルデータの除去を評価するためのオープンなベンチマークが欠如しているため、まだ探索されていない。
CLEARには200人の架空の人物と3700枚の画像が関連付けられている。
4つの評価セットにまたがる11種類のMU手法を包括的に分析し、両モードを共同学習することで単一モダリティのアプローチよりも優れることを示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:24:54 GMT)
Active Learning via Regression Beyond Realizability [7.5] そこで本研究では,実際のリスクを前提として,サロゲート学習サロゲートに基づく分類のための新たなアクティブラーニングフレームワークを提案する。
我々の新しいアクティブラーニングフレームワークは、既存のアクティブラーニングアルゴリズムよりも複雑であることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:04:07 GMT)
Quantum Geometric Tensor for Mixed States Based on the Covariant Derivative [7.5] 量子幾何テンソル(QGT)は、量子状態の幾何学的性質を特徴づける量である。
精製バンドルと共変誘導体を用いてQGTを混合状態に一般化する。
この研究は純粋状態と混合状態の両方の幾何学的解析のための統一的な枠組みを確立する。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:15:07 GMT)
A Geometric Quantum Speed Limit: Theoretical Insights and Photonic Implementation [7.5] 本稿では,Bloch角に基づく新しい量子速度制限(QSL)を導入し,飽和条件を導出する。
我々の研究は、より厳密で実験的に利用可能なQSLを提供することにおけるブロッホ角の有効性を強調し、量子力学の理解を深める。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:34:47 GMT)
Improving the Context Length and Efficiency of Code Retrieval for Tracing Security Vulnerability Fixes [7.5] CVEを修正するためのパッチコミットをトレース/検索する既存のアプローチは、2つの大きな課題に悩まされている。
SITPatchTracerは、既知の脆弱性パッチをトレースするスケーラブルで効果的な検索システムである。
SITPatchTracerを使って、GitHub Advisoryデータベース内の35の新しいCVEのパッチリンクをトレースしてマージしました。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:45:52 GMT)
MR2US-Pro: Prostate MR to Ultrasound Image Translation and Registration Based on Diffusion Models [7.5] 本稿では,TRUS 3次元再構成とクロスモーダル登録という,2段階のプロセスによる課題に対処する新しい枠組みを提案する。
本稿では,矢状面と横方向のTRUSビューの自然な相関を生かした完全プローブ位置独立アプローチを提案する。
登録段階では、モダリティ変換によって導かれる教師なし拡散に基づくフレームワークを導入する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:55:03 GMT)
Spectral Insights into Data-Oblivious Critical Layers in Large Language Models [7.5] 我々は,事前調整言語モデルにおいて,本質的な臨界層を特定するためのデータ公開アプローチを提案する。
表現空間が著しく変化する層も微調整時に最も影響を受ける層であることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:21:39 GMT)
CityGPT: Empowering Urban Spatial Cognition of Large Language Models [7.4] 大規模言語モデルは、都市環境内の実際の地理空間的タスクに取り組むと、しばしば不足する。
都市空間に対するLLMの理解を高め、関連する都市課題を解決する能力を向上させるためのフレームワークである textitCityGPT を提案する。
提案手法の有効性を検証するため,LLMの性能評価のためのテキストベースの空間ベンチマークtextitCityEvalを開発した。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:26:01 GMT)
Bias as a Virtue: Rethinking Generalization under Distribution Shifts [7.4] 機械学習モデルは、トレーニングデータとは異なるデータ分散にデプロイされると、しばしば劣化する。
また,IDバイアスの増大は,より優れたアウト・オブ・ディストリビューション(OOD)一般化につながる可能性が示唆された。
我々の研究は、一般化を改善するための実践的な方法と、堅牢な機械学習におけるバイアスの役割を再考するための理論的枠組みの両方を提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:54:49 GMT)
VFScale: Intrinsic Reasoning through Verifier-Free Test-time Scalable Diffusion Model [7.3] 本稿では,VFScale(Verifier-free Test-time scalable Diffusion Model)を導入し,スケーラブルな本質的な推論を実現する。
モーゼとスドクの挑戦的推論タスクについて,VFScaleの学習目標とスケーラブルな推論手法の有効性を実証する。
特に、最大6ドルまでのMazeサイズでトレーニングされたVFScaleは、15ドル以上のMaze問題の88%を解決していますが、標準拡散モデルは完全に失敗します。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:36:55 GMT)
FMNet: Frequency-Assisted Mamba-Like Linear Attention Network for Camouflaged Object Detection [7.2] カモフラージュ対象物検出(COD)は、カモフラージュ対象物とその周囲の強い類似性のために困難である。
既存の手法は主に空間的局所的特徴に依存しており、グローバルな情報を捉えていない。
周波数支援型マンバ様線形注意ネットワーク(FMNet)は,グローバルな特徴を効率的に捉えるために提案されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:23:18 GMT)
Learning from Double Positive and Unlabeled Data for Potential-Customer Identification [7.2] 意思決定者は、人々が会社に忠誠心を持っているかどうかに基づいて、効果的に製品を売り込もうとする。
本稿では、ポジティブなデータやラベルなしデータから学習を応用して、ターゲットマーケティングにおける潜在的な顧客を特定する手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:33:48 GMT)
Action-Gradient Monte Carlo Tree Search for Non-Parametric Continuous (PO)MDPs [7.2] Action-Gradient Monte Carlo Tree Search (AGMCTS)は、非パラメトリック粒子探索とPOMDPのオンライン勾配改善をブレンドする最初のプランナーである。
AGMCTSは、広く使われているサンプルのみの解法よりも、ソリューションの品質が優れている。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:36:20 GMT)
TrajAgent: An LLM-based Agent Framework for Automated Trajectory Modeling via Collaboration of Large and Small Models [7.0] 軌道モデリングは、生活サービス、都市交通、行政などの分野で広く応用されている。
自動化モデリングによるロバストかつ効率的な軌道モデリングを支援するフレームワークである textitTrajAgent を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:00:06 GMT)
A Foundation Model for Non-Destructive Defect Identification from Vibrational Spectra [7.0] DefectNetは、置換点欠陥の化学的アイデンティティと濃度を予測する基礎的な機械学習モデルである。
最大6つの異なる欠陥要素を0.2%から25%の濃度で同定することができる。
本研究は, バルク材料中の点欠陥定量化のための非破壊プローブとして振動分光法を確立した。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:51:51 GMT)
Sensitivity-Constrained Fourier Neural Operators for Forward and Inverse Problems in Parametric Differential Equations [6.9] du/dt = f(u, x, t, p) という形のパラメトリック微分方程式は、科学や工学において基本的なものである。
フーリエニューラル演算子(FNO)のようなディープラーニングフレームワークは、解を効率的に近似することができるが、逆問題、感度推定(du/dp)、概念ドリフトに苦労する。
我々は、感度制約のあるフーリエニューラル演算子(SC-FNO)と呼ばれる感度に基づく正則化戦略を導入することで、これらの制限に対処する。
SC-FNOは解経路の予測において高い精度を達成し、物理インフォームド正規化により標準FNOとFNOを一貫して上回る。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:11:52 GMT)
Synergizing LLMs with Global Label Propagation for Multimodal Fake News Detection [6.8] 大規模言語モデル(LLM)は、擬似ラベルを予測することによって、マルチモーダルな偽ニュースの検出を支援する。
GLPN-LLMはラベル伝搬技術を介してLLM機能を統合する。
Maskベースのメカニズムは、トレーニング中にラベルの漏洩を防止するように設計されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:50:40 GMT)
COGNATE: Acceleration of Sparse Tensor Programs on Emerging Hardware using Transfer Learning [6.8] COGNATEは、汎用ハードウェアの安価なデータサンプルを利用してコストモデルをトレーニングする新しいフレームワークである。
我々はCOGNATEが既存の技術より優れており、SDDMMでは1.47倍(最大5.46倍)、SDDMMでは1.39倍(最大4.22倍)のスピードアップを実現していることを示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:59:55 GMT)
Single nuclear spin detection and control in a van der Waals material [6.8] 近年,六方晶窒化ホウ素 (hBN) の層状ファンデルワールス (vdW) 材料に単一スピン欠陥が発見された。
我々は13ドルCイオン注入を用いてhBNに単一スピン欠陥を発生させ,超微粒子相互作用に基づく3種類の欠陥を同定した。
核スピンの原子スケールNMRとコヒーレント制御をvdW材料で実証し, 室温で99.75%の$pi$ゲート忠実度を示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:52:49 GMT)
Exploring the Performance of Perforated Backpropagation through Further Experiments [6.8] ピッツバーグの学生と地元のML実践者が集まって、Perforated Backproagationアルゴリズムを試した。
結果、システムはプロジェクトを強化でき、90%のモデル圧縮が精度に悪影響を及ぼすことなく、または16%まで元のモデルの精度を向上できることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:52:17 GMT)
YOLO advances to its genesis: a decadal and comprehensive review of the You Only Look Once (YOLO) series [6.8] 本稿では,YOLOv1からYOLOv12へのオブジェクト検出アルゴリズムの進歩を体系的に検討する。
この研究は、自動運転車と交通安全、ヘルスケアと医療画像、工業生産、監視とセキュリティ、農業の5つの重要な分野にわたるYOLOモデルの変革的な影響を強調している。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:02:39 GMT)
A Unified Framework for Entropy Search and Expected Improvement in Bayesian Optimization [6.7] 本稿では,EIと情報理論獲得関数が従来認識されていたよりも密接な関係があることを明らかにする統一理論フレームワークである変分エントロピー探索を導入する。
本稿では,EI と MES の強度のバランスをとる新しい獲得関数 VES-Gamma を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:48:23 GMT)
SafeTuneBed: A Toolkit for Benchmarking LLM Safety Alignment in Fine-Tuning [6.7] ベンチマークとツールキットであるSafeTuneBedを導入し、微調整と防御の評価を統一する。
SafeTuneBedは、感情分析、質問回答、マルチステップ推論、オープンな命令タスクにまたがる、複数の微調整データセットの多様なリポジトリをキュレートする。
これは、アライメントステージの免疫、訓練中の安全ガード、訓練後の修復など、最先端の防衛の統合を可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:00:58 GMT)
Bridging the Gap between Hardware Fuzzing and Industrial Verification [6.7] 本稿では,最近のハードウェアファジリング手法を概観し,その適合性を産業的検証で分析する。
現在の検証ツールがハードウェアファジィ化を効率的にサポートするかどうかを検討する。
ハードウェアファズリングに必要なサポートを提供するプロトタイプHwFuzzEnvを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:26:19 GMT)
Statistical Inference for Generative Model Comparison [6.7] 本稿では,2つの生成モデルと統計的信頼度を比較する手法を提案する。
理論的には、我々の推定器はパラメトリック収束率を達成し、正規性を認め、有効な推論を可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:48:10 GMT)
Comparing Traditional and Reinforcement-Learning Methods for Energy Storage Control [6.5] エネルギー貯蔵管理における従来の学習手法と強化学習手法のトレードオフをよりよく理解することを目的としている。
従来のRL手法とRL手法のパフォーマンスを比較し,各手法が有効な設定について考察し,今後の研究への道筋を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:25:21 GMT)
Conflict-Aware Pseudo Labeling via Optimal Transport for Entity Alignment [6.4] 本稿では,エンティティアライメントのための最適輸送モデル (CPL-OT) による競合認識型擬似ラベリングを提案する。
CPL-OTは、グローバルローカルアグリゲーションを備えたエンティティ埋め込み学習と、反復的なコンフリクト対応の擬似ラベリングという、2つの重要なコンポーネントで構成されている。
ベンチマークデータセットの実験は、最先端のベースラインよりもCPL-OTの方が優れていることを検証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:55:51 GMT)
Algebra Unveils Deep Learning -- An Invitation to Neuroalgebraic Geometry [6.4] 我々は代数幾何学のレンズを通して機械学習モデルによってパラメータ化された関数空間の研究を促進する。
我々は、次元、次数、特異点などの多様体の代数幾何学的不変量の間の辞書を概説する。
研究は、代数幾何学とディープラーニングを橋渡しする研究の方向性の基礎を築いた。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:36:26 GMT)
WhiSPA: Semantically and Psychologically Aligned Whisper with Self-Supervised Contrastive and Student-Teacher Learning [6.3] 本研究は,後続のテキスト-LMが不要となるような音声モデルにおけるLMの改善手法を提案する。
本稿では,教師としての言語モデル埋め込みによる対照的な損失という,新たな学習目標を生かしたWhiSPAを紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:37:32 GMT)
Consensus-based adaptive sampling and approximation for high-dimensional energy landscapes [6.2] 高次元エネルギー景観におけるサロゲート構築のための残差適応サンプリングを用いて位相空間探索を統一するコンセンサスベースのフレームワークを提案する。
我々は、サロゲート近似と残留エンハンスサンプリングの両方を併用するミニマックスとして問題を定式化する。
開発されたフレームワークは、高次元エネルギーランドスケープを持つ複雑なシステムのための効率的なサロゲート構築のための一般的なものである。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:57:57 GMT)
Translate With Care: Addressing Gender Bias, Neutrality, and Reasoning in Large Language Model Translations [6.1] トランスレート・ウィズ・ケア(Translate-with-Care)データセットを導入する。
分析の結果,性別のないコンテンツの翻訳に苦慮していることが明らかとなり,性別のステレオタイピングや推論の誤りが生じた。
Google TranslateとGPT-4は特に強いバイアスを示し,男性代名詞は女性代名詞の4~6倍であった。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:27:07 GMT)
Modeling and Optimizing User Preferences in AI Copilots: A Comprehensive Survey and Taxonomy [6.0] AIコパイロは、複雑でコンテキストに富んだタスクでユーザを支援するように設計された、AI駆動システムの新世代を表す。
このパーソナライゼーションの中心は、好みの最適化である。システムの個々のユーザの好みを検出し、解釈し、調整する能力である。
この調査は、AIコパイロにおけるユーザの嗜好がどのように運用されているかを調べる。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:48:02 GMT)
Explicit vs. Implicit: Investigating Social Bias in Large Language Models through Self-Reflection [5.8] 大規模言語モデル(LLM)は、生成されたコンテンツに様々なバイアスとステレオタイプを示すことが示されている。
本稿では,LLMにおける明示的偏見と暗黙的偏見を調査・比較するための体系的枠組みを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:07:26 GMT)
Channel Normalization for Time Series Channel Identification [5.8] CID(Channel identifiability)とは、時系列モデリングにおける個々のチャンネルを区別する能力である。
CIDの欠如は、しばしば同一の入力に対して同一の出力を生成し、チャネル固有の特性を無視する。
本稿では,各チャネルに異なるアフィン変換パラメータを割り当てることで,CIDを向上する簡易かつ効果的な正規化戦略であるChannel Normalization(CN)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:24:24 GMT)
Prompt-Tuned LLM-Augmented DRL for Dynamic O-RAN Network Slicing [5.6] 大規模言語モデル(LLM)は、無秩序なネットワークフィードバックを意味のある潜在表現に構造化する。
O-RANスライシングでは、SNR、パワーレベル、スループットといった概念が意味的に関連している。
学習可能なプロンプトをLLM拡張DRLフレームワークに統合した文脈化に基づく適応手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:12:56 GMT)
ORAN-GUIDE: RAG-Driven Prompt Learning for LLM-Augmented Reinforcement Learning in O-RAN Network Slicing [5.6] マルチエージェント(MARL)をタスク関連で意味的にリッチな状態表現で拡張するデュアルLLMフレームワークである textitORAN-GUIDE を提案する。
その結果、ORAN-GUIDEは標準MARLおよび単一LLMベースライン上でのサンプル効率、ポリシー収束、性能一般化を改善することが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:21:19 GMT)
Rethinking Neural-based Matrix Inversion: Why can't, and Where can [5.6] 現在、行列反転を近似する普遍的なニューラルネットワーク法は存在しない。
本稿では,一般行列逆変換モデルの開発におけるニューラルネットワークの基本的限界を示す理論的解析について述べる。
本稿では,行列逆転問題に対処するニューラルネットワークの有効性について検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:11:15 GMT)
"Who experiences large model decay and why?" A Hierarchical Framework for Diagnosing Heterogeneous Performance Drift [5.6] サブグループ走査型階層推論フレームワーク(SHIFT)を提案する。
ShiFTはパフォーマンス崩壊によって影響を受ける解釈可能な部分群を特定し、効果的に崩壊を緩和する標的作用を提案する。
実世界の実験では、ShiFTは性能劣化による解釈可能な部分群を同定し、効果的に崩壊を緩和する標的作用を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:50:54 GMT)
CineMA: A Foundation Model for Cine Cardiac MRI [5.6] 臨床上重要な測定を限定ラベルで自動化する基礎的AIモデルであるCineMAを開発した。
CineMAは、74,916 cine CMR研究で訓練された自己消費オートエンコーダモデルである。
心室および心筋セグメンテーション, 左右心室排ガス分画計算, 疾患検出と分類, ランドマークの4つのカテゴリから23のタスクの8つのデータセットで評価した。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:12:34 GMT)
Alignment Revisited: Are Large Language Models Consistent in Stated and Revealed Preferences? [5.5] 批判的だが、未調査の問題は、LLMが明記した嗜好と明らかにした嗜好との潜在的な相違である。
この研究は正式に定義され、この選好偏差を測定する方法を提案する。
我々の研究は、LDMをサービス、特に人間と直接対話するサービスに統合するために不可欠です。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:38:48 GMT)
Active Learning For Repairable Hardware Systems With Partial Coverage [5.5] 本稿では,診断カバレッジ(DC),魚情報行列(FIM),診断試験予算を組み込んだMISDP(Mised Semidefinite Program)を提案する。
文献(エントロピー)において最も広く使われているAL AFに対する提案手法の評価を行った。
提案するAFは, 6,000の実験構成において, 代替AFの中では, 平均で最多であった。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:36:23 GMT)
Anything Goes? A Crosslinguistic Study of (Im)possible Language Learning in LMs [5.4] 言語モデルをトレーニングして、不可能で、タイプミス的に証明されていない言語をモデル化します。
以上の結果から, GPT-2 の小型化により, 検証対象言語と不可能言語との完全分離が達成できないことが明らかとなった。
これらの結果は、LMは人間のような誘導バイアスを示すが、これらのバイアスは人間の学習者よりも弱いことを示唆している。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:14:47 GMT)
A Generalisation of Voter Model: Influential Nodes and Convergence Properties [5.4] 我々は有権者モデルの一般化を紹介し,研究する。
そこで本研究では,いくつかのラウンド後に期待されるブルーノード数を最大化するために,種子のブルーノードを選択する問題について検討する。
実世界のグラフデータおよび合成グラフデータに関する実験により,提案アルゴリズムが他のアルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:01:47 GMT)
MoPINNEnKF: Iterative Model Inference using generic-PINN-based ensemble Kalman filter [5.4] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)を含む前方および逆問題を解く強力なツールとして登場した。
本稿では,複数目的のPINNアンサンブルカルマンフィルタ(MoPINNEnKF)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:20:18 GMT)
Practical Adversarial Attacks on Stochastic Bandits via Fake Data Injection [5.3] 盗賊に対する敵対的な攻撃は伝統的にいくつかの非現実的な仮定に依存してきた。
現実的な敵の制約を反映したより実用的な脅威モデルを提案する。
我々は、このモデルの下で効率的な攻撃戦略を設計し、大小制約と時間的制約の両方に明示的に対処する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:08:47 GMT)
ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework [5.1] 共感応答生成のための軽量で包括的なフレームワークである ReflectDiffu を紹介する。
この枠組みは感情の伝染を組み込んで感情表現を増強し、感情表現マスクを用いて批判的な感情的要素を識別する。
探索・サンプリング・修正のメカニズムを2回反映することで、リフレクションディフューは感情的な意思決定を正確に意図の行動に変換する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:12:51 GMT)
The Disparate Effects of Partial Information in Bayesian Strategic Learning [5.0] スコアリングルールに関する部分的な情報が,戦略的学習環境における公平性にどのように影響するかを検討する。
我々は,ノイズ信号を顔の値で捉えるナイーブエージェントと,その信号に基づいて事前の信念を更新するベイズエージェントの2つの異なるエージェントモデルを考える。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:34:30 GMT)
PackHero: A Scalable Graph-based Approach for Efficient Packer Identification [4.9] PackHeroは、パッカーを特定するためのスケーラブルで効率的な方法論である。
我々は,各種パッカーを詰めたマルウェアと良性サンプルの公開データセットに対するアプローチを評価した。
PackHeroのマクロ平均F1スコアは93.7%、パッカー1個あたり10サンプルで、100サンプルで98.3%に改善されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:01:50 GMT)
Review of Blockchain-Based Approaches to Spent Fuel Management in Nuclear Power Plants [4.8] 本研究は、不適切なデータ透明性、厳密な機密性要件、協力者間の信頼の欠如など、使用済み核燃料の輸送管理における課題に対処する。
ブロックチェーン技術とIoT(Internet of Things)を統合するプロトタイプシステムとして,多層コンソーシアムチェーンアーキテクチャが提案されている。
その結果、このアプローチはデータの不変性を著しく向上し、リアルタイムなマルチセンサデータ統合を可能にし、分散された透明性を改善し、従来のシステムと比較してレジリエンスを向上することを示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:09:15 GMT)
Social Construction of Urban Space: Understanding Neighborhood Boundaries Using Rental Listings [4.7] シカゴのCraigslistのレンタル広告を2018年から2024年にかけて分析し、リスティングエージェントが近所を特徴付ける方法を検討した。
本稿は,従来の手法では見過ごせない方法で,都市空間の定義がどう競合するかを自然言語処理技術が明らかにすることを示すものである。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:42:46 GMT)
Sarc7: Evaluating Sarcasm Detection and Generation with Seven Types and Emotion-Informed Techniques [4.7] サルカズム (Sarcasm) はユーモアの一種で、表現は文字通りの解釈とは反対の意味を伝達する。
Sarc7は、7種類のサルカズムを分類するベンチマークである。
本研究では,サルカズム不整合,ショック値,コンテキスト依存性の重要成分を同定し,感情に基づく生成手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:01:23 GMT)
LID Models are Actually Accent Classifiers: Implications and Solutions for LID on Accented Speech [4.7] 先行研究により,LIDモデルの性能はアクセント付き音声で著しく低下することが示唆された。
LIDシステムはL2アクセント音声を話者の母語あるいは関連言語と誤分類することが多い。
単言語ASRシステムに頼ることなく,シーケンスレベルの情報をモデルに統合する手法を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:35:40 GMT)
Adaptive and Efficient Dynamic Memory Management for Hardware Enclaves [4.6] Intel Software Guard Extensions (Intel SGX)の第2バージョンでは、エンクレーブメモリとスレッドの動的管理が追加されている。
SGX2のEnclave Dynamic Memory Management機能は、起動時間と全体の実行時間を短縮する可能性がある。
本稿では,GramineライブラリOSをランタイム環境の代表として使用したEDMM性能の回復方法を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:04:38 GMT)
A Large Language Model Based Pipeline for Review of Systems Entity Recognition from Clinical Notes [4.6] 臨床ノートからシステムレビュー(ROS)エンティティを自動的に抽出する,費用対効果の高い大規模言語モデル(LLM)ベースのパイプラインを開発した。
我々は,オープンソースのLLM (Mistral, Llama, Gemma) と ChatGPT を用いてパイプラインを実装した。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:11:28 GMT)
Understanding Remote Communication between Grandparents and Grandchildren in Distributed Immigrant Families [4.5] 祖父母と孫の国債は双方にとって不可欠である。
多くの移民は地理的に分散している。
祖父母と孫の国債は双方にとって不可欠である。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:05:24 GMT)
Theoretical Guarantees for Minimum Bayes Risk Decoding [4.4] 最小ベイズリスク(MBR)復号法は,高い確率で最適解に近づき,その確率は$Oleft(n-frac12right)$である。
この結果は、MBR復号化に関するいくつかの先行的な実証研究で観察された強い性能を理論的に説明するのに役立ちます。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:33:16 GMT)
Enhancing Accuracy in Generative Models via Knowledge Transfer [4.3] 本研究では,Kullback-Leiblerの分散化など,分散指標下での伝達学習のための新しいフレームワークを提案する。
提案理論は,共有構造が目標タスクの生成精度を向上させることを示唆している。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:28:16 GMT)
How Much is Enough? The Diminishing Returns of Tokenization Training Data [4.3] 1GBから900GBまでの英語学習データを用いて,BPE,UnigramLM,WordPieceのトークンをさまざまな語彙サイズで訓練する。
その結果,トレーニングデータサイズが約150GBを超えるとリターンが低下することが明らかとなり,追加データによるトークン化品質向上の実践的限界が示唆された。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:06:12 GMT)
Amatriciana: Exploiting Temporal GNNs for Robust and Efficient Money Laundering Detection [4.2] マネーロンダリングは、金融の整合性と社会保障に深刻な脅威をもたらす。
我々は、トランザクショングラフ内のマネーロンダラーを検出する新しいアプローチであるAmatricianaを紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:47:29 GMT)
On the Limit of Language Models as Planning Formalizers [4.1] 大規模言語モデルは、地上環境では実行不可能で検証不可能な計画を作成することが発見されている。
新たな作業のラインは、LLMをフォーマライザとして使用して、ある言語で計画領域を形式的に表現することに成功したことを示している。
この形式的表現は、計画を見つけるために決定論的に解決できる。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:14:36 GMT)
Deep-Learning-Driven Prefetching for Far Memory [4.1] 本稿では,深層学習(DL)を利用したLinuxベースの遠メモリシステムであるFarSightについて述べる。
データ集約的な4つのワークロードに対するFarSightの評価は、最先端の遠メモリシステムよりも最大3.6倍性能が高いことを示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:27:22 GMT)
From Perceptions to Decisions: Wildfire Evacuation Decision Prediction with Behavioral Theory-informed LLMs [4.1] FLAREは、山火事避難決定予測の高度な推論のためのフレームワークである。
行動理論とモデルを統合して、CoT(Chain-of-Thought)推論を合理化している。
実験では、従来の理論にインフォームドされた行動モデルよりも平均20.47%の性能改善が示されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:18:46 GMT)
TRATES: Trait-Specific Rubric-Assisted Cross-Prompt Essay Scoring [4.0] TRATESは、新しい特性特有かつルーリックベースのクロスプロンプトAESフレームワークであり、基盤となる特性に固有のものである。
このフレームワークはLarge Language Model (LLM)を活用しており、特性グレーディングルーリックを使用して特性特化機能を生成する。
実験によると、TRATESは広く使用されているデータセット上で、すべての特性に対して新しい最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:33:14 GMT)
Probing Subphonemes in Morphology Models [3.9] 音素を直接訓練したトランスフォーマーにおける音韻的特徴符号化の言語に依存しない探索手法を提案する。
音素の埋め込みにおいて,トルコ語における最終音素発声のような局所的な音韻的特徴がよく捉えられるのに対し,母音調和のような長距離依存は変圧器のエンコーダで表現されるのがよいことを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:53:40 GMT)
Differential Privacy for Deep Learning in Medicine [3.9] ディファレンシャルプライバシ(DP)は、医学的深層学習(DL)における機密データ保護の鍵となる技術である
臨床モデルがデータに依存しやすくなるにつれ、プライバシーと実用性と公正性とのバランスが重要な課題となっている。
医療用DLへのDP適用の最近の進展を概観する。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:03:15 GMT)
Decoding the Stressed Brain with Geometric Machine Learning [3.9] ストレスは精神障害と身体障害の両方に寄与する。
本研究では,幾何学的機械学習を用いて生記録からのストレスを検出する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:47:48 GMT)
Goal-Aware Identification and Rectification of Misinformation in Multi-Agent Systems [3.6] 大規模言語モデルに基づくマルチエージェントシステム(MAS)は、複雑な実世界のタスクに対処する上で、強力なアドバンテージを示している。
MASは特に、追加の攻撃面の導入により誤情報注入に弱い。
このような脅威に対してMASを評価するために設計された、複雑で現実的なタスクを特徴とする新しいデータセットであるMisinfoTaskを紹介する。
本稿では、目標認識推論を利用した2段階無訓練防衛フレームワークARGUSを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:02:26 GMT)
iDSE: Navigating Design Space Exploration in High-Level Synthesis Using LLMs [3.6] 高レベル合成はアジャイルなハードウェア開発ツールとして機能します。
伝統的な設計空間探索法(DSE)は、いまだに違法な探査コストと準最適結果に悩まされている。
我々は,設計空間を効果的にナビゲートするために,設計品質の認識を活用する最初のLLM支援型DSEフレームワークであるiDSEを紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:52:20 GMT)
Open High-Resolution Satellite Imagery: The WorldStrat Dataset -- With Application to Super-Resolution [3.6] 以下にWorldStratデータセットを紹介する。
最大の、そして最も多様な公開データセットは、エアバス SPOT 6/7の高解像度の1.5 m/ピクセルである。
自由アクセス可能な低解像度のSentinel-2衛星から10m/ピクセルの高解像度画像を複数の低解像度画像で時間的にマッチングする。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:14:21 GMT)
Pattern Recognition or Medical Knowledge? The Problem with Multiple-Choice Questions in Medicine [3.5] 大規模言語モデル(LLM)は、医療領域において大きな可能性を示す。
これらの質問は、USMLEのような試験をモデルとしたMCQ(Multiple-choice Question)を用いて評価されることが多い。
私たちは、想像上のオルガンであるGlianorexを中心とした架空の医療ベンチマークを作成し、記憶された知識と推論能力の分離を可能にしました。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:21:22 GMT)
Manipulation of Photonic Spin Hall Effect via Interacting Rydberg Atom [3.4] 本稿では,強い相互作用を持つRydberg原子媒体を用いたフォトニックスピンホール効果(PSHE)のチューナビリティ向上を示す理論的研究を行う。
特に、調整可能なPSHEは、光子スピンに基づくビームステアリングを可能にし、精度測定の感度を改善し、機能をリアルタイムで再構成可能なフォトニックデバイスをサポートすることができる。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:55:55 GMT)
Data-light Uncertainty Set Merging with Admissibility: Synthetics, Aggregation, and Test Inversion [3.4] 本稿では、多種多様かつ潜在的に依存する不確実性集合を単一の統一集合にマージする、Synthetics, Aggregation, and Test Inversion (SAT) アプローチを紹介する。
SATは初期セットと制御レベルのみが利用可能である場合、不確実セットを統合するという課題によって動機付けられている。
主要な理論的貢献はSATの特性の厳密な解析であり、決定論的集合の融合の文脈における許容性の証明を含む。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:38:16 GMT)
A Case Study of Cross-Lingual Zero-Shot Generalization for Classical Languages in LLMs [3.4] 我々は、サンスクリット語、古代ギリシア語、ラテン語の3つの古典的な言語における自然言語理解に焦点を当てている。
まず、名前付きエンティティ認識と機械翻訳を英語に翻訳する。
検索拡張生成手法を用いてコンテキストを組み込むことにより,性能が著しく向上することを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:29:42 GMT)
Full- and low-rank exponential midpoint schemes for forward and adjoint Lindblad equations [3.4] 我々は、前方および隣接したリンドブラッド方程式を解くためのフルおよびローランク指数的中間点を開発する。
提案手法は, 肯定性を保ち, 無条件で追跡することを示す。
これらの数値スキームの収束性は理論的に証明され、数値的に検証される。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:15:00 GMT)
FSNet: Feasibility-Seeking Neural Network for Constrained Optimization with Guarantees [3.3] 伝統的な解法は、しばしばリアルタイムの使用に対して計算的に禁止される。
機械学習ベースのアプローチが代替手段として登場したが、厳格に制約を強制することに苦労している。
制約満足度を確保するためにFSNet(Feasibility-Seeking-Integrated Network)を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:05:29 GMT)
Enabling Secure and Ephemeral AI Workloads in Data Mesh Environments [3.3] 多くの大企業は、データとAIチームをサポートする効率的で効果的な方法を持っていません。
本稿では、オンデマンドのセルフサービスデータプラットフォームインフラストラクチャという形で、全体的な問題に対するソリューションの鍵となる部分を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:30:22 GMT)
Parallel Rescaling: Rebalancing Consistency Guidance for Personalized Diffusion Models [3.2] パーソナライズされた拡散モデルのための並列再スケーリング手法を提案する。
従来のパーソナライズ手法とは異なり、我々の手法では追加のトレーニングデータや高価なアノテーションを必要としない。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:36:36 GMT)
Security Concerns for Large Language Models: A Survey [3.2] 大きな言語モデル(LLM)は自然言語処理に革命をもたらしたが、その能力は新たなセキュリティ脆弱性も導入している。
我々は,LSMに関する新たなセキュリティ上の懸念の包括的概要,迅速な注射と脱獄への脅威の分類,入力の摂動やデータ中毒などの敵攻撃,および自律型LSMエージェントに固有の厄介なリスクについて述べる。
LLMが安全で有益であることを保証するために、堅牢で多層的なセキュリティ戦略を推進していくことの重要性を強調した。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:25:09 GMT)
Leveraging Complementary Attention maps in vision transformers for OCT image analysis [3.1] OCTスキャンからバイオマーカーを識別するための最新のパイプラインについて概説する。
バイオマーカー検出のための異なるコンボリューションとアテンション機構を評価した。
IEEE Video and Image Processing Cup 2023のコンペでは、両モデルの予測をまとめて第一位に立った。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:46:46 GMT)
Heisenberg-limited Hamiltonian learning continuous variable systems via engineered dissipation [3.0] 量子システムの進化を支配下に置くハミルトニアンを同定することは、量子学習理論の基本的な課題である。
本研究では,連続変数量子系の共通型であるボソニック量子系のハミルトニアンの学習に焦点をあてる。
このようなシステムにおける強い消散の効果を研究するための分析フレームワークを導入し、猫のクビット安定化の厳密な分析を可能にした。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:33:26 GMT)
Are LLMs effective psychological assessors? Leveraging adaptive RAG for interpretable mental health screening through psychometric practice [3.0] 心理学的実践において、標準化されたアンケートは、構造化され、臨床的に検証された質問を通じて精神的な健康を評価するための必須のツールとして機能する。
本稿では,心理学的実践と計算手法を橋渡しする,アンケート誘導型スクリーニングフレームワークを提案する。
提案手法は,未構造化のソーシャルメディアコンテンツと,各アンケート項目の関連記事の検索による標準化された臨床評価とを関連づけるものである。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:41:57 GMT)
dpmm: Differentially Private Marginal Models, a Library for Synthetic Tabular Data Generation [3.0] そこで我々は,差分プライベート(DP)保証付き合成データ生成のためのオープンソースライブラリdpmmを提案する。
PrivBayes、MST、AIMの3つの一般的な限界モデルが含まれており、優れたユーティリティを実現し、よりリッチな機能を提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:23:05 GMT)
DV365: Extremely Long User History Modeling at Instagram [2.9] 本稿では,ユーザの長期的関心を高度に一般化可能なユーザ表現を生成する,新たなユーザ埋め込み学習戦略であるマルチスライシングと要約を提案する。
DV365と名付けられたこの埋め込みは、Instagramにデプロイされた高度な注意深いユーザーシーケンスモデルの上に、非常にインクリメンタルに実装されていることが証明されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:09:54 GMT)
Human Attention During Localization of Memory Bugs in C Programs [2.9] 本稿では,C言語における記憶障害の局所化における人間の視覚的注意に関する研究について述べる。
私たちは11人のプログラマを募集し、3つのCプログラムの1~6つのメモリバグをそれぞれ1.5~2時間見つけました。
私たちの研究のバグは、メモリリーク、オーバーフロー、ダブルフリーをカバーしています。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:56:16 GMT)
Optimizing Sensory Neurons: Nonlinear Attention Mechanisms for Accelerated Convergence in Permutation-Invariant Neural Networks for Reinforcement Learning [2.8] 訓練強化学習(RL)エージェントは、しばしば重要な計算資源を必要とし、訓練時間を延長する。
私たちは、強化学習タスクのための新しいニューラルネットワークを導入した、Google BrainのSensory Neuronによって構築された基盤の上に構築しました。
本稿では,キーベクトル(K)の非線形変換をマッピング関数を用いて組み込んだ改良されたアテンション機構を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:50:37 GMT)
AWML: An Open-Source ML-based Robotics Perception Framework to Deploy for ROS-based Autonomous Driving Software [2.8] AWMLは、ロボット工学のためのMLOpsをサポートするように設計されたフレームワークである。
自動運転のための機械学習インフラストラクチャを提供する。
自動ラベリング、半自動ラベリング、データマイニング技術が組み込まれている。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:29:32 GMT)
Utilizing Precise and Complete Code Context to Guide LLM in Automatic False Positive Mitigation [2.8] 静的アプリケーションセキュリティテスト(SAST)ツールは、ソフトウェア品質にとって重要なツールであり、開発中の潜在的なコード問題を特定する。
しばしば、手動でレビューし、開発を遅くする誤った肯定的な警告を発生させる。
本稿では,軽量かつ効率的な偽陽性緩和フレームワーク LLM4FPM を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:52:17 GMT)
AtmosSci-Bench: Evaluating the Recent Advance of Large Language Model for Atmospheric Science [2.8] AtmosSci-Benchは大気科学における大規模言語モデル(LLM)の評価ベンチマークである。
AtmosSci-Benchは、マルチチョイス質問(MCQ)とオープンエンド質問(OEQ)の両方からなるデュアルフォーマット設計を備えている。
代表的なLCMを総合的に評価し、命令調整モデル、高度な推論モデル、数学強化モデル、ドメイン固有の気候モデルという4つのグループに分類する。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:43:31 GMT)
PVP: An Image Dataset for Personalized Visual Persuasion with Persuasion Strategies, Viewer Characteristics, and Persuasiveness Ratings [2.8] 596個のメッセージに28,454個の説得画像と9つの説得戦略からなるパーソナライズされたビジュアル説得データセットをリリースする。
このデータセットは、2,521人のアノテーションによって評価された画像の説得力スコアと、その人口統計学的および心理的特徴を提供する。
実験の結果,心理的特徴を取り入れることで説得的画像の生成と評価が促進されることが判明した。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:21:57 GMT)
Human Fall Detection using Transfer Learning-based 3D CNN [2.7] 意図しない転倒や偶発的な転倒は高齢者にとって重要な健康問題の一つである。
本稿では,事前学習した3D CNNを用いた視覚による転倒検出システムを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:58:12 GMT)
Multi-Objective Neural Network Assisted Design Optimization of Soft Fin-Ray Grippers for Enhanced Grasping Performance [2.7] フィン線指の内部構造は適応性と把握性能において重要な役割を担っている。
フィン線指がより硬くなり、高い力を発揮できると、物体の扱いにおいて繊細になる。
本研究では有限要素法 (FEM) を用いて, 有限要素法を用いて円筒状物体のたわみと接触力を推定する。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:16:58 GMT)
Dialogue Systems for Emotional Support via Value Reinforcement [2.6] 感情支援システムは、探索者が課題を克服するのを助けることを目的としている。
人間の価値観は個人の苦痛を軽減するが、現代の心理療法ではますます強調される。
本稿では,感情支援システムに価値強化を統合するモデルを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:43:02 GMT)
Mapping 1,000+ Language Models via the Log-Likelihood Vector [2.6] 我々は,事前定義されたテキスト集合上で計算された対数様ベクトルをモデル特徴として用いて,自動回帰言語モデルを大規模に比較する。
提案手法はスケーラビリティが高く,計算コストはモデル数とテキストサンプル数の両方で線形に増大する。
この手法を1000以上の言語モデルに適用し、大規模モデル解析の新しい視点を提供する「モデルマップ」を構築した。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:03:13 GMT)
Federated learning framework for collaborative remaining useful life prognostics: an aircraft engine case study [2.6] 6つの航空会社がFLフレームワークに協力して、航空機のエンジンの総合的なRUL予測モデルを訓練していると考えられている。
本稿では,グローバルな予測モデルのパラメータを集約する4つの新しい手法を提案する。
その結果、FLは6つの航空会社のうち5社でより正確なRULの診断に繋がることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:32:51 GMT)
Physics-informed Temporal Alignment for Auto-regressive PDE Foundation Models [2.6] 本稿では,逆問題解に着想を得た自己教師型学習フレームワークPITAを提案する。
PITAは、物理インフォームド制約を自己超越信号に統合することにより、それぞれのPDE軌道上の異なる時間ステップで発見された物理力学を整列させる。
実験により、PITAは、様々な時間依存PDEデータに基づいて、既存の基礎モデルの精度と堅牢性を著しく向上させることが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:05:23 GMT)
Retrieval-Augmented Generation Systems for Intellectual Property via Synthetic Multi-Angle Fine-tuning [2.4] 知的財産権(IP)分野の検索システムは、しばしば多様なユーザクエリに苦しむ。
マルチアングル質問生成と検索ファインチューニング法(MQG-RFM)を提案する。
MQG-RFMは、高速なクエリ生成と強い負のマイニングを組み合わせることで、コストのかかるインフラ変更を伴わずに、検索の堅牢性を高める。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:19:35 GMT)
Hidden State Differential Private Mini-Batch Block Coordinate Descent for Multi-convexity Optimization [2.3] マルチバウンド問題に対する隠れ状態仮定(HSA)の下での差分プライバシー保証について検討する。
隠蔽状態の仮定下でのプライバシー損失の最近の分析は、凸性のような強い仮定に依存している。
プライバシ損失の勾配に加え、理論的解析はニューラル降下や適応ノイズのシナリオとも互換性がある。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:08:15 GMT)
Neural Network-based Information-Theoretic Transceivers for High-Order Modulation Schemes [2.3] ニューラルネットワーク(NN)ベースのエンドツーエンド通信システム(E2E)は、人工知能(Al)ネイティブなE2Eシステムを開発するための潜在的なツールとして研究されている。
本稿では,ベースラインデマッパーに匹敵する性能を維持しつつ,計算効率を向上させるNNベースのビットワイズ受信機を提案する。
物理層における送信機と受信機を協調的に最適化する新しいシンボルワイドオートエンコーダ(AE)ベースのE2Eシステムを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:22:26 GMT)
Feature Fusion and Knowledge-Distilled Multi-Modal Multi-Target Detection [2.3] マルチモーダルMTDのための機能融合および知識蒸留フレームワークを提案する。
後続確率最適化タスクとしてこの問題を定式化し,多段階学習パイプラインを用いて解決する。
実験の結果,教師モデルの平均平均精度の約95%を学生モデルが達成していることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:11:44 GMT)
Task-Optimized Convolutional Recurrent Networks Align with Tactile Processing in the Rodent Brain [2.3] 触覚は神経科学では理解されておらず、視覚や言語に比べて人工システムでは効果が低い。
本稿では,現実的な触覚入力シーケンスに基づいてトレーニングされたタスク最適化時間ニューラルネットワークの空間を探索する新しいAttender-Decoder(EAD)フレームワークを提案する。
我々は,畳み込みリカレントニューラルネットワーク(ConvRNN)を,触覚分類のための純粋に前向きおよび状態空間アーキテクチャに優れたエンコーダとして同定する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:47:37 GMT)
STEM-POM: Evaluating Language Models Math-Symbol Reasoning in Document Parsing [2.2] STEM-PoM(STEM-PoM)は,大規模言語モデルの数学記号に対する推論能力を評価するためのベンチマークデータセットである。
データセットには変数、定数、演算子、および単位記述子の主属性に分類される2K以上の数学記号が含まれている。
実験の結果,テキスト内学習では20~60%,微調整では50~60%の精度が得られた。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:56:47 GMT)
TabID: Automatic Identification and Tabulation of Subproblems in Constraint Models [2.1] 本稿では,有望なサブプロブレムを自動で同定するTabIDを提案する。
我々は、標準CP(Minion and Gecode)、節学習CP(Chuffed and OR-Tools)、SATソルバ(Kissat)など、様々な問題解決者に対するアプローチを評価した。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:09:39 GMT)
MINT: Memory-Infused Prompt Tuning at Test-time for CLIP [2.1] 既存のテスト時間適応メソッドは、モデルの内部知識を完全に活用するには不十分です。
人間の連想記憶理論に触発され、MINTはメモリ・プロンプト・バンクを導入した。
MINTは、MPBが取得したメモリを利用することで、テスト時に迅速かつ正確なVLM適応を可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:31:20 GMT)
An Interpretable Representation Learning Approach for Diffusion Tensor Imaging [2.1] そこで我々は, DTIトラクトグラフィーの新たな2次元表現法を提案し, トラクションレベルの分画異方性(FA)値を9x9グレースケール画像にエンコードする。
この表現は、空間放送復号器を備えたベータ・トゥル相関変分自動符号化器によって処理される。
我々は,補助的分類,三重項損失,SimCLRに基づくコントラスト学習を含む,教師付きおよび教師なし表現学習戦略を用いて,この埋め込みの質を評価する。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:31:42 GMT)
Generating Plausible Distractors for Multiple-Choice Questions via Student Choice Prediction [2.0] 教育における多重選択質問(MCQ)の設計において、学生の誤解と知識のギャップを識別するためには、妥当な気晴らし器の作成が不可欠である。
本研究は,学生が選択する可能性がより高い気晴らし器を生成するモデルを訓練するためのパイプラインを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:37:00 GMT)
PAKTON: A Multi-Agent Framework for Question Answering in Long Legal Agreements [2.0] 我々は,プラグイン・アンド・プレイ機能を備えた,完全オープンソースでエンドツーエンドのマルチエージェント・フレームワークであるPAKTONを紹介した。
PAKTONは、協調エージェントと新しい検索拡張生成(RAG)コンポーネントによって、契約分析の複雑さを扱うように設計されている。
実験により、PAKTONは、予測精度、検索性能、説明可能性、完全性、根拠的正当性において、汎用モデルと事前訓練モデルの両方より優れていることが示された。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:38:21 GMT)
Optimizing Multi-Hop Document Retrieval Through Intermediate Representations [2.0] Retrieval-augmented Generation (RAG)は、複雑なクエリ、特にマルチホップ質問に対処する際の課題に遭遇する。
次ホップ情報を取得する中間層からの中間表現を利用して外部知識を抽出するレイヤワイドRAG(L-RAG)を提案する。
実験の結果、L-RAGはオープンドメインのマルチホップ質問応答データセット上で既存のRAG法よりも優れていた。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:02:25 GMT)
Adaptive Plane Reformatting for 4D Flow MRI using Deep Reinforcement Learning [2.0] 4次元フローMRIによる実験結果から,平面修正角と距離誤差の精度が向上した。
この手法の柔軟性と適応性は、他の4次元フローMRI以外の医療画像アプリケーションにも有望な候補となる。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:02:05 GMT)
SATA-BENCH: Select All That Apply Benchmark for Multiple Choice Questions [2.0] 大規模言語モデル(LLM)は、単一回答の複数選択タスクでますます評価される。
多くの実世界の問題は、選択肢の集合から正しい答えを識別する必要がある。
SATA-BENCHは、Select All That Apply 質問における LLM の評価のための最初の専用ベンチマークである。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:14:21 GMT)
The TIP of the Iceberg: Revealing a Hidden Class of Task-in-Prompt Adversarial Attacks on LLMs [1.9] LLMに対する新たなジェイルブレイク攻撃のクラスを提示する。
提案手法では,シーケンス・ツー・シーケンス・タスクをモデルが間接的に禁止された入力を生成するプロンプトに組み込む。
我々は,6つの最先端言語モデルにおいて,安全対策を回避できることを実証した。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:52:11 GMT)
Redefining Toxicity: An Objective and Context-Aware Approach for Stress-Level-Based Detection [1.9] ほとんどの毒性検出モデルは、毒性を本質的なテキストの性質として扱い、その影響を形作る上での文脈の役割を見越す。
我々は毒性を社会的に創発的なストレス信号として再認識する。
本稿では, 毒性検出のための新しいフレームワークについて紹介し, 公式な定義と基準, 新たなデータセットに対するアプローチの検証を行った。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:02:49 GMT)
PSI-PFL: Population Stability Index for Client Selection in non-IID Personalized Federated Learning [1.9] Federated Learning (FL)は、クライアント間でデータをローカライズすることで、データのプライバシを保持しながら、分散機械学習(ML)モデルのトレーニングを可能にする。
パーソナライズド・フェデレーション・ラーニング(PFL)のための新しいクライアント選択フレームワークであるPSI-PFLを提案する。
提案手法はPSIに基づいてより均質なクライアントを選択し,FL性能の最も有害な要因であるラベルスキューの影響を低減させる。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:41:42 GMT)
Poster: Adapting Pretrained Vision Transformers with LoRA Against Attack Vectors [1.9] 入力画像の変更による悪質な誤分類の原因となる摂動を含む敵の攻撃について広範囲にわたる議論がある。
本研究は、低ランク適応で事前訓練された視覚トランスフォーマーの重みとクラスを調整し、敵攻撃に対してより堅牢になり、再訓練なしにスケーラブルな微調整を可能にすることによる攻撃対策を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:16:21 GMT)
Blockchain-Enabled Privacy-Preserving Second-Order Federated Edge Learning in Personalized Healthcare [1.9] フェデレートラーニング(FL)は、従来のクラウド中心の機械学習モデルにおいて、セキュリティとプライバシの課題に注目が集まっている。
1次FLアプローチは、異種非独立で同一に分散された(非id)データにより、パーソナライズされたモデルトレーニングにおいていくつかの課題に直面している。
近年,2次FLアプローチは,パーソナライズされたモデルトレーニングを改善しつつ,非IDデータセットの安定性と一貫性を維持している。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:41:04 GMT)
Federated Learning for Smart Grid: A Survey on Applications and Potential Vulnerabilities [1.8] スマートグリッド(スマートグリッド、SG)は、将来のエネルギー需要を予測するために、リアルタイムの電力利用データを収集する重要なエネルギーインフラである。
SGにおけるデータセキュリティとプライバシに関する懸念が高まっているため、フェデレートラーニング(FL)が有望なトレーニングフレームワークとして登場した。
FLは、IoTデバイスからプライベートデータを共有することなく、協調的なモデルトレーニングを可能にすることによって、SGのプライバシ、効率、精度のバランスを提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:24:57 GMT)
BatteryBERT for Realistic Battery Fault Detection Using Point-Masked Signal Modeling [1.7] 本稿では,バッテリー故障検出のためのBERTスタイルの事前学習を適応する新しいフレームワークを提案する。
標準のBERTアーキテクチャを、カスタマイズされた時系列からトーケン表現モジュールと、ポイントレベルのマスケッド信号モデリング(point-MSM)プリトレーニングタスクで拡張する。
このアプローチは、シーケンシャル電流、電圧、その他の電荷放電サイクルデータに対する自己教師付き学習を可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:06:08 GMT)
Central Path Proximal Policy Optimization [1.6] 本稿では、制約された最適化問題の中央経路に近いポリシーを反復するPPOの簡易な修正であるCentral Path Proximal Policy Optimization (C3PO)を紹介する。
C3POは、より厳格な制約執行によるパフォーマンス向上を実現し、中央のパス誘導更新が制約されたポリシー最適化に有望な方向を提供することを示唆している。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:14:29 GMT)
Beyond Winning: Margin of Victory Relative to Expectation Unlocks Accurate Skill Ratings [1.5] Margin of Victory Differential Analysis (MOVDA)は、従来の評価システムを強化するフレームワークである。
MOVDAは、評価微分に基づいて予測されたMOVを予測するために、ドメイン固有の非線形関数を学習する。
NBAのプロバスケットボールデータによる実験によると、MOVDAは標準のELOやベイズベースラインを大きく上回っている。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:16:51 GMT)
Browser Fingerprinting Using WebAssembly [1.5] 本稿ではWebAssembly(Wasm)を用いた高度な指紋認証手法を提案する。
WebAssemblyの計算機能を活用して、異なるブラウジングセッション間で返却デバイスを識別する、新たなアプローチを提案する。
このアプローチを、Intel、AMD、ARM CPU、Windows、Android、iOSなどのオペレーティングシステム、VMWare、KVM、iOSなどの環境など、さまざまなプラットフォーム上で検証しています。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:39:17 GMT)
Robust and Verifiable MPC with Applications to Linear Machine Learning Inference [1.4] 本稿では,参加者の不正な多数を占める設定において,強力なセキュリティ保証を提供する,効率的なマルチパーティ計算プロトコルを提案する。
完全な正当性によって、誠実な当事者は、悪意のある当事者の同一性を検出し、全会一致で合意することができる。
我々は、クライアントが所望の計算をサーバにオフロードし、計算結果を検証するML-as-a-serviceシナリオで、我々のプロトコルをベンチマークする。
論文参考訳(メタデータ) (Sat, 31 May 2025 11:26:57 GMT)
Foresight: Adaptive Layer Reuse for Accelerated and High-Quality Text-to-Video Generation [1.3] Diffusion Transformer (DiTs) は、テキスト・トゥ・イメージ、テキスト・トゥ・ビデオ生成、編集といった最先端の成果を達成する。
静的キャッシュは、固定ステップにまたがって機能を再利用することでこれを緩和するが、ジェネレーションダイナミクスに適応できない。
ベースライン性能を保ちながらデノナイジングステップ間の計算冗長性を低減させる適応層再利用手法であるForesightを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:52:17 GMT)
Extending AALpy with Passive Learning: A Generalized State-Merging Approach [1.2] AALpyはPythonで書かれたオープンソースの自動学習ライブラリである。
AALpyを用いてステートマージアルゴリズムの定義と実行方法について述べる。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:29:32 GMT)
The Many Challenges of Human-Like Agents in Virtual Game Environments [1.2] この記事では、ゲームで人間のようなAIを実装する上で最も重要な課題について調査する。
独自のディープリカレント畳み込みニューラルネットワークを用いた機械学習手法を提案する。
特定のゲームのために人間のようなAIを作るのが難しいほど、AI駆動のプレイヤーと人間を区別する手法を開発するのが簡単になる、という仮説を立てる。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:01:45 GMT)
Encouraging Students' Responsible Use of GenAI in Software Engineering Education: A Causal Model and Two Institutional Applications [1.2] ChatGPTやGitHub CopilotといったジェネレーティブAI(GenAI)ツールは、教育において広く普及している。
コースワークから学ぶよりも、学生がそれを完成させるために使うことを懸念する声が上がっている。
本稿では、ソフトウェア工学教育におけるGenAI利用に責任を持つ教育者を支援するために、因果モデルを提案し、実証的に適用する。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:27:40 GMT)
Assembly of Experts: Linear-time construction of the Chimera LLM variants with emergent and adaptable behaviors [1.1] 既存のMixture-of-Experts親モデルの有能な子版を線形時間で作成するための「AoE」構築法。
我々は、DeepSeekのV3-0324モデルとR1モデルを組み合わせて、671BのオープンウェイトハイブリッドモデルであるDeepSeek R1T "Chimera"を構築した。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:23:19 GMT)
Observation of effects of inter-atomic interaction on Autler-Townes splitting in cold Rydberg atoms [1.0] 寒冷原子中でのオートラー・タウンズ分裂による高励起リドバーグ原子の原子間相互作用の効果を実証する。
コールド・ライドベルク原子における相互作用誘起脱落効果の結果,ATスプリッティング信号の広帯域化の劇的な増加が観察された。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:34:14 GMT)
ABCDEFGH: An Adaptation-Based Convolutional Neural Network-CycleGAN Disease-Courses Evolution Framework Using Generative Models in Health Education [1.0] 本稿では,畳み込みニューラルネットワーク(CNN)とCycleGANを用いた合成医療画像の生成について検討する。
本研究では、畳み込みニューラルネットワーク(CNN)とCycleGANを用いた合成医療画像の生成について検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:32:58 GMT)
A "Wenlu" Brain System for Multimodal Cognition and Embodied Decision-Making: A Secure New Architecture for Deep Integration of Foundation Models and Domain Knowledge [1.0] 本稿では,個人知識と公開モデルとの安全な融合を実現するために,多モード認知と具体的意思決定脳システムWenluを提案する。
このシステムは、脳にインスパイアされたメモリタグ付けと再生機構を導入し、ユーザーのプライベートなデータ、業界固有の知識、汎用言語モデルとシームレスに統合する。
既存のソリューションと比較すると、"Wenlu"はマルチモーダル処理、プライバシセキュリティ、エンドツーエンドのハードウェア制御コード生成、自己学習、持続可能なアップデートにおいて、大きなメリットを示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:01:34 GMT)
Performance Analysis of Few-Shot Learning Approaches for Bangla Handwritten Character and Digit Recognition [1.0] 本研究は,Bangla手書き文字と数字の認識における数ショット学習手法の性能について検討する。
本稿では,手書き文字と数字の認識精度を向上させるために設計されたハイブリッドネットワークであるSynergiProtoNetを紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:03:10 GMT)
FRIREN: Beyond Trajectories -- A Spectral Lens on Time [1.0] 長期時系列予測モデルは、ドメインにまたがって適用可能な汎用的なソリューションとしてしばしば提示される。
幾何学的構造は動的に依存しない基礎モデルの正しい抽象化であると主張する。
現代の生成フローと古典的なスペクトル分析を結びつけることで、FRIRENは正確かつ解釈可能な長期的な予測を行う。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:38:14 GMT)
From Argumentative Text to Argument Knowledge Graph: A New Framework for Structured Argumentation [1.0] 本稿では,議論文を議論知識グラフ(AKG)に変換する枠組みを提案する。
知識ベース(KB)グラフをノードのメタデータ属性で構築することで、情報を豊かにする。
次に、KB の前提と推論ルールを用いて、modus ponens を適用して引数を生成する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:11:30 GMT)
Text-to-CT Generation via 3D Latent Diffusion Model with Contrastive Vision-Language Pretraining [0.9] 本稿では,3次元コントラッシブな視覚-言語事前学習方式と潜在拡散モデルを組み合わせたテキスト-CT生成のための新しいアーキテクチャを提案する。
本手法は,テキストから臨床的に有意なCTボリュームを合成するための,スケーラブルで制御可能なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:41:55 GMT)
Multihead self-attention in cortico-thalamic circuits [0.8] 本稿では,マルチヘッド自己アテンションに類似した計算を実現するために,皮質視床回路の構造が適していることを示す。
マルチヘッド自己アテンションを実現するために,皮質視床回路を配線する方法を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:33:59 GMT)
PointODE: Lightweight Point Cloud Learning with Neural Ordinary Differential Equations on Edge [0.8] 本稿では,残差接続を持つブロックの連続的スタックに基づいて,ポイントクラウド特徴抽出のためのパラメータ効率のよいアーキテクチャを提案する。
PointODEは、合成データセットと実世界のデータセットの両方の最先端モデルと競合する精度を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:34:54 GMT)
FragNet: A Graph Neural Network for Molecular Property Prediction with Four Levels of Interpretability [0.7] 本稿では,主要なモデルにマッチするグラフニューラルネットワークを提案し,分子サブストラクチャの4つのレベルについて考察する。
このモデルは、特定の分子特性を予測する上で、どの原子、結合、分子フラグメント、およびフラグメント間の接続が重要であるかを特定するのに役立つ。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:45:26 GMT)
Accurate Simulation of the Hubbard Model with Finite Fermionic Projected Entangled Pair States [0.6] 2次元ハバードモデルの基底状態の正確なシミュレーションを行うため,有限サイズのフェルミオン射影対状態と変分モンテカルロを併用して実演する。
我々の研究は、2次元ハバードモデルの物理と関連する問題を解くために有限サイズのフェルミオンテンソルネットワークの力を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:42:01 GMT)
Clinical Annotations for Automatic Stuttering Severity Assessment [0.6] スタタリングは、効果的な評価と治療のために専門的な専門知識を必要とする複雑な疾患である。
本稿では,FluencyBankのデータセットを,確立された臨床基準に基づく新たなスタブリングアノテーションスキームで強化する取り組みについて述べる。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:18:20 GMT)
Blockchain Powered Edge Intelligence for U-Healthcare in Privacy Critical and Time Sensitive Environment [0.6] プライバシクリティカルで時間に敏感な健康アプリケーションのための自律型コンピューティングモデルを提案する。
このシステムは、継続的監視、リアルタイムアラート通知、疾患検出、堅牢なデータ処理と集約をサポートする。
セキュアなアクセススキームは、オフチェーンとオンチェーンのデータ共有とストレージの両方を管理するために定義される。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:58:52 GMT)
Using Diffusion Ensembles to Estimate Uncertainty for End-to-End Autonomous Driving [0.5] EnDfuserは、拡散モデルを軌道プランナーとして使用するエンドツーエンドの駆動システムである。
本研究は,従来の軌道計画モジュールのドロップイン代替として用いられるアンサンブル拡散が,運転決定の安全性向上に役立つことを示唆している。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:33:27 GMT)
Ultra-Quantisation: Efficient Embedding Search via 1.58-bit Encodings [0.5] 任意の精度浮動小数点値のベクトルを集合-1,0,1から要素を引き出すベクトルに置き換える方法を示す。
これは、類似度測定のための強い相関を維持しながら、空間と計量評価コストの非常に大きな節約をもたらす。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:22:24 GMT)
Electric field tunable spin-orbit gap in a bilayer graphene/WSe$_{2}$ quantum dot [0.4] 二層グラフェン(BLG)とジエレン化タングステン(WSe$$$)の構造における近接誘起スピン軌道結合(SOC)の研究について報告する。
少数粒子状態のBLG量子ドット(QD)は、誘導SOCの感度プローブとして機能する。
本測定は,QDの弱い側方閉じ込めと一致し,大きな変位場における谷の$g$-factorの低減効果を示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:45:23 GMT)
M2WLLM: Multi-Modal Multi-Task Ultra-Short-term Wind Power Prediction Algorithm Based on Large Language Model [0.4] 本研究は,風力出力を粒度間隔で予測するLarge Language Models (LLMs) の機能を活用する革新的なモデルであるM2WLLMを紹介する。
M2WLLMは,テキスト情報と時間的数値データをシームレスに統合することにより,従来の学習手法の限界を克服する。
中国三省の風力発電データに対する実証的な評価は、M2WLLMが既存の手法を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:27:17 GMT)
JojoSCL: Shrinkage Contrastive Learning for single-cell RNA sequence Clustering [0.4] 単細胞RNAシークエンシング(scRNA-seq)は、個々の細胞レベルで遺伝子発現解析を行うことで、細胞プロセスの理解に革命をもたらした。
しかし、scRNA-seqデータの高次元性と空間性は、既存のクラスタリングモデルに挑戦し続けている。
本稿では,cRNA-seqクラスタリングのための自己教師型コントラスト学習フレームワークであるJojoSCLを紹介する。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:59:56 GMT)
Structured Gradient Guidance for Few-Shot Adaptation in Large Language Models [0.4] 目標は、データが制限された場合のタスク適応性とトレーニングの安定性を高めることだ。
この手法は基底損失関数に基づいて構築され、2つの勾配関連正規化項を導入する。
クロスタスクの一般化をさらに改善するため、勾配アライメント機構が組み込まれている。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:59:01 GMT)
Graph-Driven Multimodal Feature Learning Framework for Apparent Personality Assessment [0.4] 人格特性の自動予測は、コンピュータビジョンにおいて難しい問題となっている。
本稿では,ショートビデオクリップにおけるパーソナリティ分析のための革新的なマルチモーダル特徴学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:09:03 GMT)
CSTRL: Context-Driven Sequential Transfer Learning for Abstractive Radiology Report Summarization [0.4] 放射線学報告は、診断の発見と印象を含むいくつかのセクションから構成される。
キーコンテンツ抽出とコヒーレント要約を保証するシーケンシャルトランスファー学習を導入する。
MIMIC-CXRとOpen-Iデータセットを用いて、我々のモデルであるCSTRLは最先端の性能を達成した。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:39:55 GMT)
Towards Graph-Based Privacy-Preserving Federated Learning: ModelNet -- A ResNet-based Model Classification Dataset [0.4] 本稿では,事前学習したResNet50モデルから抽出した埋め込みから構築した新しい画像分類データセットであるModelNetを紹介する。
モデルパラメータを保存するために、トレーニング済みのResNet50モデルで3つのバリエーションのクライアント固有のサブセットをトレーニングします。
マルチドメイン画像データに加えて、匿名化モデルパラメータにアクセスできるFLアルゴリズムを定義する新しい仮説を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:53:16 GMT)
High-Efficiency, High-Fidelity Charge Initialization of Shallow Nitrogen Vacancy Centers in Diamond [0.1] ダイヤモンド中の窒素空孔(NV)中心は長いスピンコヒーレンス時間を示す。
ダイヤモンド表面から5nmから15nmの浅いNV中心を効率よく初期化するためのプロトコルを示す。
このプロトコルは、現在状態準備エラーがスケーリングを禁止しているナノスケールセンシングアプリケーションを可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:53:05 GMT)
A condensing approach to multiple shooting neural ordinary differential equation [0.0] 多重撮影は常微分方程式のパラメータ推定手法である。
次に、前回の軌跡の終端と次の軌跡の始点とのシューティングギャップを取り除くために、等式制約を適用する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:51:33 GMT)
Wide Reflective Equilibrium in LLM Alignment: Bridging Moral Epistemology and AI Safety [0.0] 本稿では,広反射平衡法(MWRE)は,現在のAIアライメントの取り組みを理解するための,一意に適応したフレームワークである,と論じる。
MWREは、道徳的判断、道徳的原則の導出、関連する背景理論の間の一貫性の達成を強調している。
この論文は、MWREが現在のアライメントの取り組みを批判的に分析し、より倫理的に健全で公正に整合したAIシステムの今後の発展を導く上で、貴重な基礎となることを実証している。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:40:59 GMT)
Unitary and non-unitary operators leverage perfect and imperfect single qutrit teleportation [0.0] 本稿では,Alice から Bob への単一キュートリットの送信方式について,二つのキュートリットの絡み合ったチャネルを資源として検討する。
テレポーテーションの成功のために、これらの絡み合った状態はアリスとボブの間で共有される量子チャネルとして選ばれた。
2つのクエット状態のもう1つの絡み合った基底は補助状態として使われており、アリスが彼女のチャネルで操作し、彼女が保持する1つのクットがボブにテレポートされるのに役立っている。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:53:22 GMT)
Unexplainability of Artificial Intelligence Judgments in Kant's Perspective [0.0] 本稿では, カントの判断理論のレンズによるAI判断の不説明性について検討する。
カントの4つの論理形式-量、品質、関係、モダリティ-に基づいて、この研究はAIの不確実性と呼ばれるものを特定する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:31:03 GMT)
Uncertainty-Aware Genomic Classification of Alzheimer's Disease: A Transformer-Based Ensemble Approach with Monte Carlo Dropout [0.0] アルツハイマー病(英語版) (AD) は遺伝学的に複雑であり、ゲノムデータも複雑である。
我々はモンテカルロ・ドロップアウトを用いた変圧器を用いたアンサンブルモデル(TrUENet)を開発した。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:20:49 GMT)
Thermodynamic Properties and Superstatistics of Graphene under a Constant Magnetic Field [0.0] 定磁場下でのグラフェンに対するディラック・ワイル方程式の解を示す。
この研究は、磁場下でのグラフェン中の電子輸送の相対論的性質を確認する。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:00:24 GMT)
The GAIN Model: A Nature-Inspired Neural Network Framework Based on an Adaptation of the Izhikevich Model [0.0] GAINモデルは、グリッドベースの構造を使用して、生物学的な可視性とモデルのダイナミクスを改善する。
このIzhikevichモデルの適応により、モデルの力学と精度が向上し、その用途は特殊化できるが効率的である。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:30:34 GMT)
Teleportation of unknown qubit via Star type tripartite states [0.0] プロトタイプの$W$ stateは標準的なテレポーテーションには役に立たないことが知られている。
我々は、非プロトタイプの$W$状態の線型重ね合わせとスピンフルプ版を取り、$Star$クラスに属することを示した。
チャネルとして使用するためには、真の三部体の絡み合いが必須ではないことが観察された。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:12:15 GMT)
Scene Detection Policies and Keyframe Extraction Strategies for Large-Scale Video Analysis [0.0] 本稿では,シーンの自動検出と選択のための統一的適応フレームワークを提案する。
短編メディアから長編映画、アーカイブコンテンツ、監視映像まで、様々なフォーマットを扱う。
このシステムは商用のビデオ分析プラットフォームにデプロイされ、メディア、教育、研究、セキュリティドメインからのコンテンツを処理している。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:37:21 GMT)
Scaling DeFi with ZK Rollups: Design, Deployment, and Evaluation of a Real-Time Proof-of-Concept [0.0] Zero-Knowledge Rollups (ZK Rollups)は、トランザクションをオフチェーンにバンドルし、スループットと効率を高めるためにチェーンに妥当性を提出する、有望なソリューションを提供する。
ZKロールアップと分散交換からなる概念実証(PoC)を設定し,トークンスワップを生成するロードバランサを実装した。
以上の結果から,1秒間に最大71トランザクションを処理可能であることがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:39:24 GMT)
Reinforcement Learning for Hanabi [0.0] 我々は,異なる強化学習アルゴリズムを探索し,同一タイプのエージェントに対して,また他の種類のエージェントに対して,どのエージェントが最高の性能を示したかを検討した。
その結果、時間差(TD)アルゴリズムは、表型エージェントと比較して、プレイタイプの全体的なパフォーマンスとバランスが良好であることが判明した。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:24:16 GMT)
Quantum-Enhanced Channel Mixing in RWKV Models for Time Series Forecasting [0.0] ニューラルシークエンスモデリングの最近の進歩は、RWKVのようなアーキテクチャにつながり、リカレントスタイルの時間混合とフィードフォワードチャネルミキシングを組み合わせることで、効率的なロングコンテキスト処理を可能にする。
本稿では、標準フィードフォワードネットワーク(FFN)を部分的に変分量子回路(VQC)に置き換えるRWKVモデルのハイブリッド量子ピース拡張であるQuantumRWKVを提案する。
量子コンポーネントは、PennyLaneフレームワークを介してエンドツーエンドの微分性を保ちながら、非線形表現能力を高めるように設計されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 21:21:06 GMT)
Quantum computation with longlived Rydberg-Landau atoms featuring suppressed ionization by the Magnetic Cage [0.0] 強磁場下で生成したRydberg-Landau状態(2.5 Tesla)を紹介する。
これらの状態は、非常に長い寿命と強いレーザー場の下でもイオン化を阻止する磁気閉じ込め機構を示す。
このアプローチは、クーロン系と同様、長寿命で強く相互作用する rLandau 循環状態のコヒーレント励起を単純化する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:14:01 GMT)
QTP-Net: A Quantum Text Pre-training Network for Natural Language Processing [0.0] 自然言語処理タスクの性能向上のために,量子テキスト事前学習ネットワーク(QTP-Net)を提案する。
QTP-Netは、単語の複数の意味を量子重畳状態にエンコードし、適応GAを利用してリッチテキスト特徴を高速にキャプチャする。
SCでは、QTP-Netは平均精度を0.024、F1スコアを0.029、ベンチマークデータセットを6つ改善している。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:17:35 GMT)
Power-of-Two (PoT) Weights in Large Language Models (LLMs) [0.0] モデルパラメータの数はここ数年で指数関数的に増加しており、例えば、GPT2の15億からGPT3の1750億までである。
これにより、特にメモリと処理能力が非常に制限されたエッジデバイスにおいて、実装上の大きな課題が提起される。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:01:25 GMT)
Power-Law Decay Loss for Large Language Model Finetuning: A Theory Perspective [0.0] 本稿では,テキスト生成のための微調整処理を最適化する新しい損失関数Power-Law Loss Decay (PDL)を提案する。
PDLは、標準のクロスエントロピー損失における各トークンの寄与を再重み付けする。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:32:33 GMT)
Position: Olfaction Standardization is Essential for the Advancement of Embodied Artificial Intelligence [0.0] AIアーキテクチャからの嗅覚の排除は、構造的課題とは無関係である、と我々は主張する。
私たちは、嗅覚ベンチマークを形式化し、マルチモーダルデータセットを開発し、マシンが人間の環境で理解し、ナビゲートし、行動するのに必要な感覚機能を定義するために、学際的なコラボレーションを求めている。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:35:13 GMT)
Permutation-Invariant Transformer Neural Architectures for Set-Based Indoor Localization Using Learned RSSI Embeddings [0.0] Wi-Fi アクセスポイントからの RSSI スキャンを用いた屋内位置推定のための置換型ニューラルアーキテクチャを提案する。
6つの建物からなるキャンパス環境にまたがって収集したデータセットのモデルを評価する。
その結果, モデルが細粒度構造を正確に復元し, 物理的に異なる領域にまたがって性能を維持できることが示唆された。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:56:39 GMT)
PVAC: Package Version Activity Categorizer, Leveraging Semantic Versioning in a Heterogeneous System [0.0] 本研究の目的は、異種パッケージマネージャエコシステム内のバージョンアクティビティを評価するための体系的手法とプロトタイプツールの導入である。
3つのコンポーネントからなるパッケージバージョンアクティビティカテゴリ(PVAC)を開発した。
PVACは、さまざまなパッケージバージョン文字列からセマンティックバージョニングの詳細を解析し、一貫した分類とバージョン変更の定量的評価を可能にする。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:38:53 GMT)
Organizational Adaptation to Generative AI in Cybersecurity: A Systematic Review [0.0] 本研究は、サイバーセキュリティ組織が脅威モデリングフレームワークと運用プロセスをどのように適応させ、生成的人工知能統合に対処するかを検討するために、体系的な文書分析と比較ケーススタディ手法を用いている。
この研究は、セキュリティアプリケーションのための大規模言語モデル統合、リスク検出と応答自動化のためのGenAIフレームワーク、脅威ハンティングのためのAI/ML統合の3つの主要な適応パターンを特定している。
成熟したセキュリティインフラストラクチャを持つ組織、特に金融と重要なインフラストラクチャ部門は、構造化ガバナンスアプローチ、専用のAIチーム、堅牢なインシデント対応プロセスを通じて、より高い準備性を示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:16:11 GMT)
OntoRAG: Enhancing Question-Answering through Automated Ontology Derivation from Unstructured Knowledge Bases [0.0] 本稿では,非構造化知識ベースから導出する自動パイプラインであるOntoRAGを紹介する。
OntoRAGは、Webスクレイピング、PDF解析、ハイブリッドチャンキング、情報抽出、知識グラフ構築、オントロジー生成など、高度な技術を統合している。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:33:39 GMT)
On a class of bounded Hermitian operators for the Bell-CHSH inequality in Quantum Field Theory [0.0] 相対論的スカラー量子場理論におけるベル-CHSH不等式の不等式は解析される。
有界エルミート作用素の集合はユニタリワイル作用素から構成される。
ミンコフスキー時空における因果タンジェントダイヤモンドのケースは精査されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:53:27 GMT)
On Quantum Entanglement and Nonlocality [0.0] 相関した光子対の実験は、ベルの不等式と量子力学との一致を明確に破ることを示した。
この論文は、距離で2つの相関した光子の同時測定が局所的な原因であることを非常に満足して結論付けた。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:18:56 GMT)
Old Quantum Mechanics by Bohr and Sommerfeld from a Modern Perspective [0.0] ボーアの原子モデルとソマーフェルトによる拡張について、波動力学の数学的観点から検討する。
量子化規則とエネルギー準位の導出は、半古典的手法を用いて再検討される。
論文参考訳(メタデータ) (Sat, 31 May 2025 05:55:28 GMT)
Off-Policy Evaluation of Ranking Policies via Embedding-Space User Behavior Modeling [0.0] 大規模なランク付け行動空間を有するランキング設定における非政治的評価は、新しいレコメンデーションポリシーを評価する上で不可欠である。
我々は2つの新しい仮定を導入する: ランキングに直接的な影響はなく、ユーザー行動モデルがランキングの埋め込み空間に直接的な影響を与えることはない。
次に,統計的に望ましい特性を持つ一般化された辺化逆確率スコア推定器を提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:58:53 GMT)
Observation of a Fault Tolerance Threshold with Concatenated Codes [0.0] ノイズ閾値が高く,アンシラオーバーヘッドの低いバタフライネットワークアーキテクチャを用いて,コード結合のためのフォールトトレラントプロトコルを提案する。
テンソルネットワークを用いた確率パスデコーダを開発し,チェックの各層にベイジアン更新を適用した。
我々は、実量子デバイスにおけるしきい値の挙動を示すために、ノイズを付加したイオントラップハードウェアに状態準備プロトコルを実装した。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:24:43 GMT)
NoCodeGPT: A No-Code Interface for Building Web Apps with Language Models [0.0] ChatGPTはアプリケーションを構築するためのユーザフレンドリーなインターフェースを提供していません。
NoCodeGPTは、言語モデルに送信されたプロンプトを有用なコンテキスト情報で計測する。
シンプルなバージョン管理機能があり、ユーザーはすぐに以前のバージョンに戻すことができる。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:22:16 GMT)
No Audiogram: Leveraging Existing Scores for Personalized Speech Intelligibility Prediction [0.0] 従来のアプローチは主にオーディオグラムに頼っていたが、これは本質的には聴取者の聴力閾値を純音で捉えているため正確性に制限されている。
本稿では,個人が持つ既存の知性データを活用して,その性能を推定する手法を提案する。
本研究は,パーソナライズされた音声のインテリジェンス予測のための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:55:03 GMT)
Multi-Operator Quantum Uncertainty Relations from New Cauchy-Schwarz Inequalities [0.0] 我々は、コーシー=シュワルツの不等式の新しい一般化を複数のベクトルに提案し、それを多演算量子不確実性関係の導出に利用し、多演算スキューズを提案する。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:09:50 GMT)
Multi-Controlled Quantum Gates in Linear Nearest Neighbor [0.0] マルチコントロールシングルターゲット(MC)ゲートは、様々な量子アルゴリズムにとって重要なビルディングブロックである。
本稿では,$sim 4k+8n$ CNOT ゲートを使用せずに MC ゲートを実装する手法について述べる。
提案手法は, MCゲートの任意の場合において, 上界よりもCNOTゲートを少なくする回路を提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:01:21 GMT)
Machine vs Machine: Using AI to Tackle Generative AI Threats in Assessment [0.0] 本稿では、高等教育評価において、生成人工知能(AI)がもたらす課題に対処するための理論的枠組みを提案する。
GPT-4、Claude、Llamaのような大規模な言語モデルは、洗練された学術コンテンツを作成する能力をますます示している。
調査によると、学生の74-92%が学術目的でこれらのツールを実験している。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:29:43 GMT)
MIRROR: Cognitive Inner Monologue Between Conversational Turns for Persistent Reflection and Reasoning in Conversational LLMs [0.0] 人間の知性は複雑な情報を処理するために内部のモノローグに依存している。
大規模言語モデルに並列推論機能を実装する認知アーキテクチャMIRRORを導入する。
MIRRORアーキテクチャを利用するLLMは、臨界安全シナリオの相対的な改善を156%まで達成している。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:17:48 GMT)
Involution-Infused DenseNet with Two-Step Compression for Resource-Efficient Plant Disease Classification [0.0] 本研究では,重み付けと知識蒸留を統合した2段階モデル圧縮手法を提案する。
その結果、ResNet50sは、PandVillageとPaddyLeafのデータセットで99.55%と98.99%の精度を達成した。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:43:23 GMT)
Introduction to Predictive Coding Networks for Machine Learning [0.0] 予測符号化ネットワーク(PCN)は、脳内の階層的計算を理解するための生物学的にインスパイアされたフレームワークである。
基礎的なネットワークアーキテクチャ、推論と学習の更新ルール、アルゴリズムの実装について述べる。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:48:53 GMT)
Innovative Tangible Interactive Games for Enhancing Artificial Intelligence Knowledge and Literacy in Elementary Education: A Pedagogical Framework [0.0] 本稿では,人工知能(AI)の知識とリテラシーを高めるために,有形対話型ゲームを用いた革新的なフレームワークを提案する。
21世紀におけるAI能力の重要性の高まりを認識し、この研究は、年齢に適した経験的学習ツールに対する重要なニーズに対処する。
論文参考訳(メタデータ) (Sat, 31 May 2025 17:40:30 GMT)
Imputation of Missing Data in Smooth Pursuit Eye Movements Using a Self-Attention-based Deep Learning Approach [0.0] 本稿では,時系列に自己注意型Imputation Networkを用いた新しいImputationフレームワークを提案する。
我々は、スムーズな追従眼球運動シーケンスを表現するために、カスタムメイドのオートエンコーダを用いて、インプテッドデータを洗練する。
その結果,再建眼球運動系列の精度は有意に向上した。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:10:30 GMT)
Improved constraints on exotic interactions between electron and proton in hydrogen [0.0] 原子分光法は、初等フェルミオン間のエキゾチックな力を運ぶ新しいボソンを探すために用いられる。
水素の2S$_1/2$電子レベルと最新の境界状態量子力学理論の超微細分裂の最近の精密測定と比較すると、制約は改善される。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:24:01 GMT)
Hybrid Cloud Security: Balancing Performance, Cost, and Compliance in Multi-Cloud Deployments [0.0] この研究は、オンプレミスとクラウドリソース間のリソース分散のバランスを達成する上での課題を捉えている。
提案されたセキュリティおよびパフォーマンス管理ソリューションは、AWSとAzureベースのハイブリッドクラウドの採用に関する詳細なケーススタディで検証された。
論文参考訳(メタデータ) (Sat, 31 May 2025 07:04:08 GMT)
HueManity: Probing Fine-Grained Visual Perception in MLLMs [0.0] HueManityはMLLMの視覚知覚を評価するために設計されたベンチマークである。
このデータセットは、石原テストスタイルのドットパターンに埋め込まれた2文字のアルファ数字の文字列を特徴とする83,850枚の画像からなる。
HueManityにおける9つの最先端MLLMの評価は、人間や伝統的なコンピュータビジョンのベースラインと比較して大きな性能低下を示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:59:48 GMT)
High-level quantum algorithm programming using Silq [0.0] Silqは最近のハイレベルな量子プログラミング言語で、その強みとユニークな特徴を強調している。
我々は、Silqを用いた高レベル量子アルゴリズムの設計と実装に関する洞察を共有し、その実用的な応用と量子プログラミングの利点を実証することを目指している。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:14:50 GMT)
Hiden Topics in Robotic Process Automation -- an Approach based on AI [0.0] 本研究の目的は,重要なテーマ領域を特定し,時間とともに発達を追跡し,学術的影響を評価することにより,RPAの科学的景観をマッピングすることである。
RPAの今後の研究フロンティアの探索と理解を支援するために設計された科学マップで取り上げられた最も顕著なテーマのうち15は、100の異なる研究トピックである。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:09:37 GMT)
Heralded deterministic Knill-Laflamme-Milburn entanglement generation for solid-state emitters via waveguide-assisted photon scattering [0.0] 本稿では,光子散乱特性による2量子,3量子および$N$-qubit Knill-Laflamme-Milburn(KLM)状態を生成するための決定論的プロトコルについて述べる。
各プロトコルでは、補助的な単光子は全ての定常量子ビットをブリッジする普遍的なインタフェースとして機能する。
論文参考訳(メタデータ) (Sat, 31 May 2025 04:35:12 GMT)
Green Economic Load Dispatch: A Review and Implementation [0.0] 発電機の経済派遣は火力発電所にとって大きな関心事である。
生物の進化と社会行動に基づく現代の人工知能(AI)技術は、そのような問題を解決するために用いられている。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:59:59 GMT)
Gradient-Free Score-Based Sampling Methods with Ensembles [0.0] スコアに基づくサンプリング手法にアンサンブルを導入し、勾配のない近似サンプリング手法を開発した。
様々な例を通して,アンサンブル戦略の有効性を実証する。
本研究は,複雑な確率分布をモデル化するためのアンサンブル戦略の可能性を明らかにする。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:52:12 GMT)
Geometry of chiral temporal structures I: Physical effects [0.0] 本稿では,時間的形状の幾何学的および位相的特性を包含する時間的幾何学の概念を紹介する。
時間幾何学の中心概念であるベリー曲率とベリー接続は、光励起非平衡キラル電子力学のユビキタスな特徴として現れる。
我々の発見は、超高速で、トポロジカルに非自明で、エナンチオ感受性の化学動力学への道を開くかもしれない。
論文参考訳(メタデータ) (Sat, 31 May 2025 12:47:27 GMT)
From Rules to Rewards: Reinforcement Learning for Interest Rate Adjustment in DeFi Lending [0.0] 本研究は、オフライン強化学習を用いて、DeFi貸出プロトコルの金利調整を最適化する。
Aaveプロトコルの履歴データを用いて、保守的Q-Learning(CQL)、振舞いクローン(BC)、TD3-BCの3つのRLアプローチを評価する。
TD3-BCは、バランシング利用、資本安定、リスクにおいて優れた性能を示し、既存のモデルより優れている。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:56:07 GMT)
FastCAR: Fast Classification And Regression Multi-Task Learning via Task Consolidation for Modelling a Continuous Property Variable of Object Classes [0.0] FastCARは、分類と回帰タスクのためのマルチタスク学習(MTL)における新しいタスク統合アプローチである。
オブジェクト分類と連続特性変数回帰(continuous property variable regression)に対処する。
FastCARは従来のMTLモデルファミリよりも優れており、アーキテクチャや損失重み付けの分野でパラメタ化されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:26:01 GMT)
Exponential speedup in quantum simulation of Kogut-Susskind Hamiltonian via orbifold lattice [0.0] オービフォールド格子ハミルトニアンがコグト・ススキンド・ハミルトニアンを制御極限で再現できることが示される。
この改定は長年の技術的障害を解消し、デジタル量子シミュレーションのための簡単な実装プロトコルを提供する。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:50:27 GMT)
ExplainBench: A Benchmark Framework for Local Model Explanations in Fairness-Critical Applications [0.0] ローカルモデル説明の体系的な評価を行うためのオープンソースのベンチマークスイートであるExplainBenchを紹介する。
フレームワークにはインタラクティブな探索のためのStreamlitベースのグラフィカルインターフェースが含まれており、Pythonモジュールとしてパッケージ化されている。
ExplainBenchはCompAS, UCI Adult Income, LendingClubなどのフェアネス研究でよく使われるデータセット上で実証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:12:23 GMT)
Examining marginal properness in the external validation of survival models with squared and logarithmic losses [0.0] 生存分析のための共通二乗および対数スコアリングルールを調査した。
我々は,ISBS(Integrated Survival Brier Score)とRCLL(Right-Censored Log-Likelihood)が理論的に不適切であることを示す。
我々は、RCLLとISBSの両方を、自動手順を含むモデルの外部検証で推奨する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:29:26 GMT)
Efficiency Bottlenecks of Convolutional Kolmogorov-Arnold Networks: A Comprehensive Scrutiny with ImageNet, AlexNet, LeNet and Tabular Classification [0.0] Convolutional Kolmogorov Arnold Networks (CKANs) を ImageNet-1k データセットで130万イメージでトレーニングする。
CKANは、MoAやMNISTのような小さなデータセットではCNNよりもかなり遅いが、データセットがImageNetのように大きく複雑になるにつれて、ほぼ同等ではない。
論文参考訳(メタデータ) (Sat, 31 May 2025 18:13:49 GMT)
Docker under Siege: Securing Containers in the Modern Era [0.0] 本稿では,ランタイム保護,ネットワーク保護,設定ベストプラクティス,サプライチェーンセキュリティ,包括的な監視とロギングソリューションなど,コンテナセキュリティの重要な領域について検討する。
これらのドメイン内の一般的な脆弱性を特定し、これらのリスクに対処し緩和するための実行可能なレコメンデーションを提供します。
論文参考訳(メタデータ) (Sat, 31 May 2025 13:00:52 GMT)
Diffusion Models for Increasing Accuracy in Olfaction Sensors and Datasets [0.0] 拡散型分子生成を用いた新しい機械学習手法を導入し,オーダローカライゼーションの精度を向上する。
本フレームワークは,ロボット上での嗅覚モデルにより,臭気を正しいソースと正確に関連付ける能力を高める。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:22:09 GMT)
Demonstration of Scully-Drühl-type quantum erasers on quantum computers [0.0] 本稿では,Scully-Dr"uhl型遅延チョイス量子消去器を真に実装した新しい量子回路を提案する。
IBM QuantumとIonQプロセッサで行った実験では、干渉パターンの回復が様々な程度に理論的な予測と密接に一致していることが示されている。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:32:23 GMT)
Deceptive Humor: A Synthetic Multilingual Benchmark Dataset for Bridging Fabricated Claims with Humorous Content [0.0] 提案するDeceptive Humor データセット (DHD) は, 偽造クレームから得られたユーモアを注入したコメントの集合である。
それぞれのエントリーには、Satire Level(微妙な風刺は1からオーバート風刺は3まで)とラベルが付けられ、5つのユーモアタイプに分類される。
データセットは英語、テルグ語、ヒンディー語、カンナダ語、タミル語、およびそれらのコードミキシング形式にまたがっており、多言語分析に有用なリソースとなっている。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:26:21 GMT)
Data-Constrained Synthesis of Training Data for De-Identification [0.0] 臨床領域に適応する大言語モデル(LLM)について検討した。
我々は,個人識別可能な情報にタグを付加した人工的な臨床テキストを生成する。
合成コーパスは合成NERモデルの訓練に使用される。
論文参考訳(メタデータ) (Sat, 31 May 2025 10:43:20 GMT)
Context-aware Biases for Length Extrapolation [0.0] 長さ補間のための付加的RPE, コンテキスト認識バイアス(CABLE)を提案する。
入力シーケンスに基づいて位置バイアスを動的に調整することにより、CABLEは固定されたRPEの剛性を克服する。
提案手法はFineWeb-Edu10BおよびWikiText-103データセット上でテストされた既存のRPE手法の性能を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 31 May 2025 06:24:36 GMT)
Comparative Analysis of QNN Architectures for Wind Power Prediction: Feature Maps and Ansatz Configurations [0.0] 量子機械学習(QML)は、絡み合いや重畳といった量子力学の原理を活用することで、古典的な機械学習手法を強化することを目的としている。
この研究は、量子ニューラルネットワーク(QNN)にヒントを得た人工知能ニューラルネットワーク(ANN)を広範囲に評価する。
本稿では,QNNが予測タスクにおける古典的手法よりも優れており,実世界のアプリケーションにおけるQMLの可能性を示している。
論文参考訳(メタデータ) (Sat, 31 May 2025 19:17:53 GMT)
Collectively-modified inter-molecular electron correlations: The connection of polaritonic chemistry and spin glass physics [0.0] ポーラリトン化学とスピングラスの無関係な分野の基本的な理論的関連性を強調した。
スピンガラスの球状シェリントン・カークパトリックモデルに対する集合振動強い結合の下での多分子電子構造問題の写像について述べる。
我々の接続は、分極性化学において多くのスピングラスの概念を取り入れ、調整し、探究する方法を舗装する。
論文参考訳(メタデータ) (Sat, 31 May 2025 14:02:16 GMT)
ChemReservoir -- An Open-Source Framework for Chemically-Inspired Reservoir Computing [0.0] 貯留層計算(Reservoir computing)は、リカレントニューラルネットワークの一種で、固定力学系と非線形力学系を用いて入力を高次元空間にマッピングする。
ChemReservoirは化学的にインスパイアされた貯水池コンピューティングのためのオープンソースのフレームワークである。
論文参考訳(メタデータ) (Sat, 31 May 2025 22:12:05 GMT)
Chaotic dynamics of Bose-Einstein condensates in a tilted optical lattice [0.0] 本研究では,Bose-Einstein condensates (BECs) における交互 (AC) 成分および定数 (DC) 成分のカオスダイナミクスの出現について検討した。
様々な種類のカオスが異なるパラメトリックな状態で識別され、数値シミュレーションにより正規領域とカオス領域の明確な区別が明らかになった。
我々は,BECの動的制御に関する知見を提供し,量子シミュレーションやコヒーレント物質波工学への応用の可能性を示した。
論文参考訳(メタデータ) (Sat, 31 May 2025 02:02:06 GMT)
Bayesian Inference of Training Dataset Membership [0.0] 本稿では,メンバーシップ推論のための効率よく解釈可能なベイズ推論手法を提案する。
予測誤差、信頼度(エントロピー)、大きさ、データセット統計などのポストホックな指標を訓練されたMLモデルから分析することにより、広範囲なモデルトレーニングを必要とせずに、メンバーシップの後方確率を計算する。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:14:38 GMT)
BanTH: A Multi-label Hate Speech Detection Dataset for Transliterated Bangla [0.0] 我々は,37.3kサンプルからなるバングラヘイト音声データセットであるBanTHを紹介する。
サンプルはYouTubeコメントからソースされ、各インスタンスに1つ以上のターゲットグループをラベル付けする。
実験により、さらに事前訓練されたエンコーダが、BanTHデータセット上で最先端のパフォーマンスを実現していることが明らかになった。
論文参考訳(メタデータ) (Sat, 31 May 2025 16:01:10 GMT)
Auto-Patching: Enhancing Multi-Hop Reasoning in Language Models [0.0] 大規模言語モデル(LLM)におけるマルチホップ推論を強化するために,推論中に隠れた状態を動的にパッチする新しい手法であるAuto-Patchを導入する。
オートパッチは18.45%(ベースライン)から23.63$pm$0.7%(ラン)に改善し、チェーン・オブ・ソート(27.44%)へのギャップを狭める。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:30:59 GMT)
Asymmetry by Design: Boosting Cyber Defenders with Differential Access to AI [0.0] 識別アクセス(differential access)とは、AI能力へのアクセスを形作ることにより、サイバーセキュリティのバランスを防御に傾ける戦略である。
このレポートは、フロンティアAI開発者が3つの差分アクセスアプローチのうちの1つを選択し、実装するのを助けるプロセスを提供する。
本稿では,ディフェンダーが参照する4つの例を示し,ディペンダーアクセスが様々な能力とディフェンダーレベルに対してどのように価値を提供するかを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 00:20:22 GMT)
An application of machine learning to the motion response prediction of floating assets [0.0] 本研究では,400m深部における砲塔係留容器の非線形運動応答を予測するための教師付き機械学習手法を提案する。
そこで我々は,勾配型アンサンブル法と独自の受動的天気予報解法を組み合わせた機械学習ワークフローを開発した。
このモデルでは, 臨界係留パラメータと船舶の進路精度を, メトカンの様々な条件で2.5度以内で平均で5%未満の予測誤差を達成した。
論文参考訳(メタデータ) (Sat, 31 May 2025 08:10:12 GMT)
Adversarial Machine Learning for Robust Password Strength Estimation [0.0] 本研究では,逆機械学習を用いたパスワード強度推定モデルの開発に焦点をあてる。
5つの分類アルゴリズムを適用し、670,000以上の逆パスワードのサンプルを用いたデータセットを用いてモデルをトレーニングする。
その結果,従来の機械学習モデルと比較して,パスワード強度の分類精度を最大20%向上することがわかった。
論文参考訳(メタデータ) (Sat, 31 May 2025 03:54:04 GMT)
Accurate Estimation of Mutual Information in High Dimensional Data [0.0] 相互情報(英: Mutual Information、MI)は、2つの変数間の統計的依存関係の尺度である。
近年,有望な機械学習に基づくMI推定手法が出現している。
信頼性と統計的整合性を保証する明示的なチェックを含むMI推定のためのプロトコルを提案し,検証する。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:06:18 GMT)
A Topological Semantics of Dialogue: Nerve Structures and Logical Extraction [0.0] 固定された意味空間内の開集合に各発話をマッピングすることにより、有限対話のための簡潔で位相的動機付けされた意味論を導入する。
関節適合性の対応する神経複合体を構築し,基本的不変量を抽出する。
ウルフラム言語における実践的なデモンストレーションは、神経の構築、不整合の検出、グローバルな解釈の計算のためのアルゴリズムである。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:58:05 GMT)
A Scalable k-Medoids Clustering via Whale Optimization Algorithm [0.0] We introduced WOA-kMedoids, a novel unsupervised clustering method which with the Whale Optimization Algorithm (WOA)。
セントロイド選択を最適化することにより、WOA-kMedoidsは観測数に関して計算複雑性を2次からほぼ直線に減らす。
We showed that WOA-kMedoids achieved a clustering performance with PAM, a average Rand Index (RI) of 0.731 than PAM's 0.739, out Performance PAM on 12 of 25 datasets。
論文参考訳(メタデータ) (Sat, 31 May 2025 01:38:20 GMT)
A New $q$-Heisenberg Algebra [0.0] ハイゼンベルク代数の新規な$q$-$hbar$変形を導入する。
結果として得られる構造は、量子平面 citeYuri-Manin2010 と、リー代数準同型 citeReyes2014a に関連する代数を包含することを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 20:16:42 GMT)
A Meta-Learning Method for Estimation of Causal Excursion Effects to Assess Time-Varying Moderation [0.0] DR-W」は、メタラーナーの観点から因果抽出効果を推定するための、柔軟で二重に頑健な推論法である。
提案する推定器の双方向特性を理論的およびシミュレーションにより比較する。
結果は、観察不足や不確実な治療ランダム化確率であっても、一貫した、より効率的な見積もりを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 15:41:20 GMT)
A Low Rank Neural Representation of Entropy Solutions [0.0] 本研究では, 平滑な凸束関数を持つ非線形スカラー保存法則に対するエントロピー解の新しい表現を構築した。
衝撃トポロジーの複雑さにかかわらず, 一定の層数と少数の係数を持つ低階神経表現が任意のエントロピー解を近似できることを示す。
論文参考訳(メタデータ) (Sat, 31 May 2025 23:23:29 GMT)
A Compendium of Autonomous Navigation using Object Detection and Tracking in Unmanned Aerial Vehicles [0.0] 無人航空機(英語: Unmanned Aerial Vehicles、UAV)は21世紀の最も革新的な発明の1つである。
本稿では,UAVの自律航法を目的として,複数の著者が提案した様々なアプローチについて検討する。
論文参考訳(メタデータ) (Sat, 31 May 2025 09:13:43 GMT)