Artificial Intelligence for Science in Quantum, Atomistic, and Continuum Systems [268.6] 科学のためのAI(AI4Science)として知られる新しい研究領域
領域は、物理世界(波動関数と電子密度)、原子(分子、タンパク質、物質、相互作用)、マクロ(流体、気候、地下)まで理解することを目的としている。
主要な課題は、物理第一原理、特に対称性を深層学習法によって自然システムで捉える方法である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:45:58 GMT)
Towards Semantic Equivalence of Tokenization in Multimodal LLM [149.1] 視覚トークン化は、視覚と言語間のセマンティックアライメントに不可欠である。
本稿では,新しい動的セマンティック等価ビジョントケナイザ(SeTok)を提案する。
SeTokは動的クラスタリングアルゴリズムを通じて、視覚的特徴をセマンティックユニットにグループ化する。
結果として得られる視覚トークンは意味的整合性を効果的に保持し、低周波と高周波の両方の視覚特徴をキャプチャする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:55:53 GMT)
Movie Gen: A Cast of Media Foundation Models [133.4] 高品質の1080pHDビデオを生成する基礎モデルのキャストであるMovie Genについて紹介する。
ユーザの画像に基づいて,高精度な命令ベースのビデオ編集やパーソナライズされたビデオの生成などの追加機能を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:05:55 GMT)
Shh, don't say that! Domain Certification in LLMs [124.6] 大きな言語モデル(LLM)は狭いドメインで制約されたタスクを実行するためにしばしばデプロイされる。
ドメイン認証は、言語モデルのドメイン外動作を正確に特徴付ける保証である。
次に, 逆境界を証明として提供するVALIDを, 単純かつ効果的なアプローチとして提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:13:19 GMT)
FSPO: Few-Shot Preference Optimization of Synthetic Preference Data in LLMs Elicits Effective Personalization to Real Users [111.6] メタ学習問題として報酬モデルを再設計するFew-Shot Preference Optimizationを提案する。
このフレームワークでは、LDMはそのユーザからいくつかのラベル付けされた好みを通じてユーザへの迅速な適応を学び、パーソナライズされた報酬関数を構築する。
公開されているLLMを用いて100万以上の合成パーソナライズされた好みを生成する。
本研究は,映画レビュー,教育背景に基づく教育適応,一般質問応答の3分野を対象に,最大1,500人の総合ユーザを対象に,パーソナライズされたオープンエンド世代に対するFSPOの評価を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:08:46 GMT)
Towards Optimal Multi-draft Speculative Decoding [102.7] MDSD(Multi-Draft Speculative Decoding)は、各トークンを生成する際に、小さなドラフトモデルで複数のドラフトを生成する手法である。
本稿では、最適輸送問題の双対性について論じ、最適受容率を効率的に計算する方法を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:22:44 GMT)
BIG-Bench Extra Hard [98.4] 大規模言語モデル(LLM)は、ますます日常的なアプリケーションにデプロイされ、堅牢な一般的な推論機能を必要としている。
BIG-Benchデータセットは、LLMの一般的な推論能力を評価するための重要なベンチマークとして機能している。
最先端のモデルは、BIG-Benchの多くのタスクにおいてほぼ完璧なスコアを得るため、その実用性は低下する。
BIG-Bench Extra Hard (BBEH) は, LLM推論評価のバウンダリを推し進めるための新しいベンチマークである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:50:50 GMT)
On How Iterative Magnitude Pruning Discovers Local Receptive Fields in Fully Connected Neural Networks [92.7] イテレーティブ・マグニチュード・プルーニング(IMP)は、高性能にトレーニング可能なスパースワークを抽出する一般的な方法となっている。
近年の研究では、IMPを完全連結ニューラルネットワーク(FCN)に適用することは、局所受容野(RF)の出現につながることが示されている。
本稿では,非ガウス統計をFCNの表現に反復的に増加させ,局所性を高めるフィードバックループを作成することを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:09:31 GMT)
SuperCorrect: Advancing Small LLM Reasoning with Thought Template Distillation and Self-Correction [89.6] SuperCorrectは、大きな教師モデルを使用して、より小さな学生モデルの推論と反映の両方を監督し、修正する新しい2段階のフレームワークである。
第1段階では、教師モデルから階層的な高レベルかつ詳細な思考テンプレートを抽出し、よりきめ細かい推論思考を導き出す学生モデルを指導する。
第2段階では、学生モデルの自己補正能力を高めるために、クロスモデル協調直接選好最適化(DPO)を導入する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:32:31 GMT)
Learning to Generate Structured Output with Schema Reinforcement Learning [83.1] 本研究では,大規模言語モデル(LLM)の構造的生成能力について検討する。
最新のLLMはまだ有効な文字列を生成するのに苦労している。
我々のモデルでは、出力と下流の両方のタスクが大幅に改善されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:45:29 GMT)
COSMOS: A Hybrid Adaptive Optimizer for Memory-Efficient Training of LLMs [81.0] 大規模言語モデル(LLM)は、様々な領域で顕著な成功を収めている。
それらの最適化は、彼らが居住している複雑で高次元のロスランドスケープのために重要な課題である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:23:19 GMT)
Efficient Inference for Large Language Model-based Generative Recommendation [78.4] LLM(Large Language Model)ベースの生成レコメンデーションは目覚ましい成功を収めた。
ジェネレーティブレコメンデーションにSD(Speculative Decoding)を適用すると、トップKアイテムを生成する必要があるため、ユニークな課題が提示される。
我々は,厳密なトップK検証の下でトップKアライメントを最適化する AtSpeed-S というアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:30:36 GMT)
CodeRAG-Bench: Can Retrieval Augment Code Generation? [78.4] 検索拡張生成を用いたコード生成の系統的,大規模な解析を行う。
まず、コード生成タスクの3つのカテゴリを含む総合的な評価ベンチマークであるCodeRAG-Benchをキュレートする。
CodeRAG-Bench上のトップパフォーマンスモデルについて、1つまたは複数のソースから検索したコンテキストを提供することにより検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:10:36 GMT)
Faster Diffusion via Temporal Attention Decomposition [77.9] テキスト条件拡散モデルにおける推論における注意機構の役割について検討する。
我々は、時間的注意づけ(TGATE)として知られるトレーニング不要の手法を開発した。
TGATEは、スケジュールされた時間ステップで注意出力をキャッシュして再利用することで、効率的に画像を生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:49:33 GMT)
The NeRF Signature: Codebook-Aided Watermarking for Neural Radiance Fields [77.8] 我々は,NeRFの新しい透かし方式であるNeRFシグナチャを提案する。
我々は、モデル構造を変更しないコードブック支援署名埋め込み(CSE)を採用している。
また、署名をパッチに隠すための共同ポーズパッチ暗号透かし戦略も導入する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:27:49 GMT)
Hi Robot: Open-Ended Instruction Following with Hierarchical Vision-Language-Action Models [76.2] 汎用ロボットは、タスク実行中に複雑な命令、プロンプト、さらにはフィードバックを処理できなければならない。
階層構造における視覚言語モデルを用いたシステムについて述べる。
我々は、単腕、二腕、二腕移動ロボットを含む3つのロボットプラットフォームにまたがるシステムを評価した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:58:41 GMT)
MathTutorBench: A Benchmark for Measuring Open-ended Pedagogical Capabilities of LLM Tutors [76.2] 我々は、総合的なチューリングモデル評価のためのオープンソースのベンチマークであるMathTutorBenchを紹介する。
MathTutorBenchには、ダイアログベースの教育における科学の研究によって定義された、家庭教師の能力をカバーするデータセットとメトリクスが含まれている。
閉鎖的およびオープンウェイトなモデルの幅広いセットを評価し、問題解決能力によって示される課題の専門知識が、すぐには良い教育に変換されないことを発見した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:43:47 GMT)
LabSafety Bench: Benchmarking LLMs on Safety Issues in Scientific Labs [75.9] 人工知能(AI)は科学研究に革命をもたらしていますが、実験室環境への統合が進むと、重要な安全上の課題が浮かび上がっています。
大規模言語モデル(LLM)は、手続き的なガイダンスから自律的な実験オーケストレーションまで、タスクをますます支援している。
このような過度な信頼性は、リスク識別やリスクアセスメントの失敗が重大事故を引き起こすような高リスクな実験室環境では特に危険である。
本研究では,LLM とビジョン言語モデル (VLM) を評価する総合的なフレームワークであるLab Safety Benchmark (LabSafety Bench) を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:17:27 GMT)
ExpliCa: Evaluating Explicit Causal Reasoning in Large Language Models [75.1] 明示的な因果推論において,LLM(Large Language Models)を評価するための新しいデータセットであるExpliCaを紹介する。
ExpliCa上で7つの商用およびオープンソース LLM をテストしました。
驚くべきことに、モデルは因果関係と時間的関係を関連付ける傾向にあり、そのパフォーマンスはイベントの言語的順序にも強く影響される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:15:45 GMT)
PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [73.8] 本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:11:45 GMT)
CritiQ: Mining Data Quality Criteria from Human Preferences [70.4] 人間の嗜好からデータ品質の基準を自動的にマイニングする新しいデータ選択手法であるCritiQを紹介する。
CritiQ Flowはマネージャエージェントを使用して品質基準を進化させ、ワーカーエージェントはペアで判断する。
コード,数学,論理領域において,本手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:33:41 GMT)
Judge as A Judge: Improving the Evaluation of Retrieval-Augmented Generation through the Judge-Consistency of Large Language Models [68.9] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) に対する幻覚を緩和する効果を証明している。
既存の自動評価メトリクスは、トレーニングと評価の間にRAGモデルによって生成されたアウトプットを正確に評価することはできない。
本稿では,RAGモデルのより正確な評価を実現するため,LCMの強化を目的とした判断一貫性(ConsJudge)手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:50:43 GMT)
ACEBench: Who Wins the Match Point in Tool Usage? [68.5] ACEBenchは、Large Language Models (LLMs)におけるツールの使用状況を評価するための包括的なベンチマークである。
データを評価方法論に基づく3つの主要なタイプに分類する。
これは、異なるデータタイプにわたるエラー原因をよりきめ細かい検査を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:54:28 GMT)
Joint Optimal Transport and Embedding for Network Alignment [66.5] 本稿では,JOENA というネットワークアライメントのための統合最適トランスポートおよび埋め込みフレームワークを提案する。
統一された目的により、両手法の相互利益は、コンバージェンスを保証する最適化スキーマの交互化によって達成できる。
実世界のネットワークの実験はJOENAの有効性とスケーラビリティを検証し、最大16%の改善と20倍の高速化を実現した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:28:08 GMT)
Building Interactable Replicas of Complex Articulated Objects via Gaussian Splatting [66.3] コンピュータビジョンにおいて、音声で表現されたオブジェクトを構築することが重要な課題である。
既存のメソッドは、しばしば異なるオブジェクト状態間で効果的に情報を統合できない。
3次元ガウスを柔軟かつ効率的な表現として活用する新しいアプローチであるArtGSを紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:25:32 GMT)
GraphBridge: Towards Arbitrary Transfer Learning in GNNs [65.0] 本稿では,GNNにおける異なるタスクやドメイン間での知識伝達を可能にする新しいフレームワークであるGraphBridgeを紹介する。
具体的には、GraphBridgeは、予測ヘッドと入力を出力層に接続するブリッジングネットワークを備えた、事前訓練されたGNNの拡張を可能にする。
提案手法は,Graph2Graph,Node2Node,Graph2Node,Graph2point-cloudなど,さまざまなトランスファー学習シナリオに対して徹底的に評価されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:57:51 GMT)
Exploring Rewriting Approaches for Different Conversational Tasks [63.6] 正確な書き換えアプローチは、しばしば、会話アシスタントによってサポートされているユースケースとアプリケーション固有のタスクに依存します。
基本的に異なる2つの生成タスクに対して,書き換えと融合という2つの異なるアプローチを体系的に検討した。
以上の結果から, 特定の書き換え手法や融合手法は, 基礎となるユースケースや生成課題に大きく依存していることが示唆された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:05:29 GMT)
External Large Foundation Model: How to Efficiently Serve Trillions of Parameters for Online Ads Recommendation [63.2] 広告推薦はオンライン広告システムの顕著なサービスであり、積極的に研究されている。
近年の研究では、レコメンデーションモデルのスケールアップと高度な設計が、大幅な性能向上をもたらすことが示されている。
しかし、モデルスケールが大きくなるにつれて、従来の研究は産業規模での2つの基本的な課題を無視することが多いため、産業とのギャップが著しく増大する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:29:28 GMT)
Sparsing Law: Towards Large Language Models with Greater Activation Sparsity [62.1] 活性化空間性は、除去できる活性化出力の中に、かなり弱い分散要素が存在することを表す。
PPL-$p%$ sparsity, a accurate and performance-aware activation sparsity metric。
我々は、SiLUよりも活性化関数としてReLUが効率的であることを示し、より多くのトレーニングデータを利用してアクティベーション空間を改善することができることを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:39:03 GMT)
Multimodality Helps Few-shot 3D Point Cloud Semantic Segmentation [61.9] FS-PCS (Few-shot 3D point cloud segmentation) は、最小のサポートサンプルで新しいカテゴリを分割するモデルを一般化することを目的としている。
テキストラベルと潜在的に利用可能な2次元画像モダリティを利用したマルチモーダルFS-PCS構成を提案する。
トレーニングバイアスを軽減するため,テスト時間適応型クロスモーダル(TACC)技術を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:33:30 GMT)
Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework [61.4] 大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、より広く使われている。
従来の研究では、強力なプロプライエタリモデルの評価と判断を再現するために、オープンソースのLLMを微調整しようと試みてきた。
本稿では,評価基準を適応的に定式化し,テキストベースとコード駆動分析の両方を合成する新しい評価フレームワークARJudgeを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:31:45 GMT)
Chemical knowledge-informed framework for privacy-aware retrosynthesis learning [60.9] 現在の機械学習に基づくレトロシンセシスは、複数のソースからの反応データを1つのエッジに集め、予測モデルを訓練する。
このパラダイムは、組織の境界を越えた広範なデータ可用性を必要とするため、かなりのプライバシーリスクをもたらす。
本研究では, 化学知識インフォームド・フレームワーク (CKIF) について紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:13:24 GMT)
From Exploration to Mastery: Enabling LLMs to Master Tools via Self-Driven Interactions [60.7] 本稿では,大規模言語モデルと外部ツールとの包括的ギャップを埋めることに焦点を当てる。
動的精錬ツールの文書化を目的とした新しいフレームワーク DRAFT を提案する。
この方法論は、3つの異なる学習フェーズからなる革新的な試行錯誤アプローチに基づいている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:24:58 GMT)
END: Early Noise Dropping for Efficient and Effective Context Denoising [60.2] 大規模言語モデル(LLM)は、幅広い自然言語処理タスクにおいて顕著な性能を示している。
彼らはしばしば、出力品質を低下させる入力シーケンスにおける無関係またはノイズの文脈に気を散らされる。
我々は,LLMの微調整を必要とせず,この問題を緩和するための新しい手法であるEarly Noise Dropping (textscEND)を紹介した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:07:17 GMT)
TotalSegmentator MRI: Robust Sequence-independent Segmentation of Multiple Anatomic Structures in MRI [59.9] nnU-Netモデル(TotalSegmentator)をMRIおよび80原子構造で訓練した。
予測されたセグメンテーションと専門家基準セグメンテーションとの間には,ディススコアが算出され,モデル性能が評価された。
オープンソースで使いやすいモデルは、80構造の自動的で堅牢なセグメンテーションを可能にする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:27:21 GMT)
Intelligence Test [59.8] インテリジェンステスト(インテリジェンステスト)は、あらゆる課題における対象のインテリジェンスを定量化する手法である。
我々の結果は、AIシステムは単純なタスクである程度の自律性を達成するが、より複雑なタスクでは、まだ自律性には程遠いことを示している。
私たちは、インテリジェンステストはAIの将来の発展を導くだけでなく、人間自身のインテリジェンスに対する深い洞察を与えることができると信じています。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:59:45 GMT)
RouterRetriever: Routing over a Mixture of Expert Embedding Models [59.0] 本稿では、ルーティング機構を用いて、ドメイン固有の専門家の混在を利用した検索モデルであるReuterRetrieverを紹介する。
RouterRetrieverは、ドメイン固有の専門的な埋め込みモデルを混在させたルーティングの利点を示す最初の研究である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:19:05 GMT)
Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning? [58.9] o1-likeモデルは、既存のLarge Language Models(LLM)の推論能力を改善するための長いチェーン・オブ・ソート(CoT)推論ステップを生成する。
DeltaBenchを導入し、異なる推論タスクのために異なるo1-likeモデルから生成された長いCoTを含む。
DeltaBenchに基づいて、生成した長いCoTのきめ細かい分析を行い、異なるo1モデルの有効性と効率を明らかにする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:59:27 GMT)
Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones? [58.8] 大型言語モデル(LLM)の蒸留は、教師による微調整(SFT)を通して教師モデルの応答を伝達するのが一般的である。
本稿では, 応答と報酬の両方を伝達する新しい蒸留パイプラインを提案する。
本手法は,教師と生徒の両方の反応の固有構造を利用した自己教師機構によって擬似回帰を生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:50:11 GMT)
FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.7] ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。
FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:19:16 GMT)
Position: A taxonomy for reporting and describing AI security incidents [58.0] AIシステムのセキュリティインシデントを記述し報告するためには、具体的が必要である、と我々は主張する。
非AIセキュリティまたは汎用AI安全インシデントレポートの既存のフレームワークは、AIセキュリティの特定の特性をキャプチャするには不十分である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:59:51 GMT)
Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation [57.7] Hydra-SGGは、VG150 (16.0 mR@50)、Open Images V6 (50.1 weighted score)、GQA (12.7 mR@50)を含む複数のデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:28:31 GMT)
Distributed Stochastic Gradient Descent with Staleness: A Stochastic Delay Differential Equation Based Framework [56.8] 分散勾配降下(SGD)は、計算リソースのスケーリング、トレーニング時間の短縮、マシンラーニングにおけるユーザのプライバシ保護の支援などにより、近年注目されている。
本稿では,遅延微分方程式(SDDE)と勾配到着の近似に基づく分散SGDの実行時間と安定化について述べる。
活性化作業員の増加は, 安定度による分散SGDを必ずしも加速させるものではないことが興味深い。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:36:31 GMT)
PCE-GAN: A Generative Adversarial Network for Point Cloud Attribute Quality Enhancement based on Optimal Transport [56.6] 点雲品質向上のための生成逆ネットワーク(PCE-GAN)を提案する。
ジェネレータは、局所特徴抽出(LFE)ユニット、大域空間相関(GSC)ユニット、特徴圧縮ユニットからなる。
判別器は、強化点雲と原点雲の確率分布のずれを計算し、ジェネレータを誘導して高品質な再構成を実現する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:34:33 GMT)
Teaching LLMs According to Their Aptitude: Adaptive Reasoning for Mathematical Problem Solving [55.9] 大規模な言語モデルによる数学的推論への既存のアプローチは、一般化可能性(英語版)にはChain-of-Thought(英語版)(CoT)、正確な計算にはTool-Integrated Reasoning(英語版)(TIR)に依存している。
本稿では, LLM が自然に推論戦略をパーソナライズできる適応型フレームワークである TATA (Teaching LLMs according their Aptitude) を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:38:54 GMT)
Sliding Window Attention Training for Efficient Large Language Models [55.6] SWATを導入し,スライディングウインドウ・アテンション・トレーニング(Sliding Window Attention Training)により,より効率的な長文処理を実現する。
本稿では,まず,変圧器の非効率性について,ソフトマックス動作のばらつきから生じる注意シンク現象を考察する。
実験により、SWATは8つのベンチマーク上での最先端の線形リカレントアーキテクチャと比較してSOTA性能を達成することが示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:31:44 GMT)
AfroBench: How Good are Large Language Models on African Languages? [55.4] AfroBenchは、64のアフリカ言語にわたるLLMのパフォーマンスを評価するためのベンチマークである。
AfroBenchは9つの自然言語理解データセット、6つのテキスト生成データセット、6つの知識と質問応答タスク、1つの数学的推論タスクで構成される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:16:47 GMT)
Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement [55.2] Time Series Multi-Task Question Answering (Time-MQA)は、複数の時系列タスクにわたる自然言語クエリを可能にする統合フレームワークである。
Time-MQAの中心はTSQAデータセットである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:47:13 GMT)
A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.1] 高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。
モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。
一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:18:13 GMT)
Large Language Models as Realistic Microservice Trace Generators [54.9] ワークロードトレースは、複雑なコンピュータシステムの振る舞いを理解し、処理とメモリリソースを管理するために不可欠である。
本稿では,大規模言語モデルを用いて合成ワークロードトレースを生成する手法を提案する。
我々のモデルは、キートレースの特徴を予測したり、欠落したデータを埋め込んだりといった、下流のトレース関連タスクに適応する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:02:29 GMT)
Unveiling the Magic of Code Reasoning through Hypothesis Decomposition and Amendment [54.6] 我々は,大規模言語モデルの推論能力に対する新たな視点を提供するために,新しいタスクであるコード推論を導入する。
論理的推論の確立した形式に基づいて3つのメタベンチマークを要約し、8つの特定のベンチマークタスクにインスタンス化する。
本稿では,人間の複雑な問題解決手法に触発された新たな経路探索パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:50:35 GMT)
Agentic Reward Modeling: Integrating Human Preferences with Verifiable Correctness Signals for Reliable Reward Systems [54.4] リワードモデル(RM)は、大規模言語モデル(LLM)のトレーニングと推論時間のスケールアップに不可欠である
本稿では,報酬モデルと検証可能な正当性信号を組み合わせた報酬システムであるエージェント報酬モデルを提案する。
我々は,既存の報奨モデルベンチマークと実世界の下流タスクのベスト・オブ・n検索に関する総合的な実験を行う。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:19:12 GMT)
Multi-LLM Collaborative Search for Complex Problem Solving [54.2] そこで我々は,Mixture-of-Search-Agents(MoSA)パラダイムを提案する。
MoSAは、独立した探索とLCM間の反復的精錬を組み合わせることで、様々な推論経路を統合する。
モンテカルロ木探索(MCTS)をバックボーンとして使用することにより、複数のエージェントが推論ステップを提案して集約することが可能となり、精度が向上する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:31:04 GMT)
Medical Hallucinations in Foundation Models and Their Impact on Healthcare [54.0] マルチモーダルデータの処理と生成が可能なファンデーションモデルは、医療におけるAIの役割を変革した。
医療幻覚を、モデルが誤解を招く医療内容を生成する場合の例と定義する。
以上の結果から,Chain-of-Thought (CoT) や Search Augmented Generation などの推論手法は,幻覚率を効果的に低減できることがわかった。
これらの知見は、ロバストな検出と緩和戦略のための倫理的かつ実践的な衝動を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:30:44 GMT)
InductionBench: LLMs Fail in the Simplest Complexity Class [53.7] 大規模言語モデル(LLM)は推論において顕著に改善されている。
帰納的推論(inductive reasoning)は、観測されたデータから基礎となるルールを推測するものであり、まだ探索されていない。
本稿では, LLMの帰納的推論能力を評価するための新しいベンチマークであるインジェクションベンチを紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:13:06 GMT)
Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports [53.6] 任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを紹介する。
バスケットボールU,サッカーU,サッカーUの3つの実践的スポーツデータセットをベンチマークして評価を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:35:18 GMT)
Training Large Recommendation Models via Graph-Language Token Alignment [53.3] 本稿では,グラフ言語トークンアライメントによる大規模推薦モデルのトレーニングを行う新しいフレームワークを提案する。
インタラクショングラフからアイテムとユーザノードを事前訓練されたLLMトークンにアライメントすることで、GLTAはLLMの推論能力を効果的に活用する。
さらに、エンドツーエンドのアイテム予測のためのトークンアライメントを最適化するために、GLLM(Graph-Language Logits Matching)を導入する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:19:10 GMT)
Graph-Based Captioning: Enhancing Visual Descriptions by Interconnecting Region Captions [53.1] グラフベースのキャプション(GBC)は、様々なタイプのノードを持つラベル付きグラフ構造を用いて画像を記述する。
GBC は,既製のマルチモーダル LLM とオブジェクト検出モデルを用いて自動生成可能であることを示す。
GBCノードのアノテーションを活用することで、さまざまなベンチマークでモデルのパフォーマンスが大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:54:53 GMT)
Code to Think, Think to Code: A Survey on Code-Enhanced Reasoning and Reasoning-Driven Code Intelligence in LLMs [53.0] 大規模言語モデル(LLM)では、コードと推論が互いに強化される。
コードは検証可能な実行パスを提供し、論理的な分解を強制し、実行時の検証を可能にする。
我々は,このシナジーを強化するために,重要な課題を特定し,今後の研究方向性を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:55:42 GMT)
Learning to Generate Unit Tests for Automated Debugging [52.6] ユニットテスト(UT)は、コードの正確性を評価するだけでなく、大きな言語モデル(LLM)にフィードバックを提供する上でも重要な役割を果たします。
提案するUTGenは,LLMに対して,予測出力とともにエラーを示す単体テスト入力を生成することを教える。
UTGen は他の LLM ベースラインを7.59% 上回っていることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:03:54 GMT)
(Mis)Fitting: A Survey of Scaling Laws [52.6] 本稿では,パラメータ比に対する最適トークンのような質問に対して,いくつかの先行研究が到達した結論の相違について論じる。
スケーリングのトレンドを研究する50以上の論文を調査します。
本稿では,法律研究のスケールアップに寄与しながら,著者が考慮すべきチェックリストを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:27:54 GMT)
The Sharpness Disparity Principle in Transformers for Accelerating Language Model Pre-Training [51.8] 本稿では、各ブロックのシャープネスに合わせてLRを調整する戦略であるブロックワイズ学習率(LR)を提案する。
モデルサイズは0.12Bから1.1Bの範囲である。
最近提案されたメモリ効率のAdam-miniにBlockwise LRを組み込むことで、2倍のスピードアップと2倍のメモリ節約を実現しています。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:06:37 GMT)
R.I.P.: Better Models by Survival of the Fittest Prompts [51.2] 本稿では,低品質入力が高ばらつきと低品質応答をもたらすという仮定に基づいて,データの完全性を評価する手法を提案する。
これは、拒否された応答品質と、選択された選好対と拒否された選好対の間の報酬ギャップを測定することで達成される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:58:53 GMT)
AttentionPredictor: Temporal Pattern Matters for Efficient LLM Inference [51.2] 本稿では,最初の学習に基づくクリティカルトークン識別手法であるAttentionPredictorを提案する。
注意予測器は、無視可能なメモリを消費しながら、注意スコアを正確に予測する。
また、トークン時間オーバーヘッドを隠蔽してデコードステージを高速化する、クロストークンクリティカルキャッシュプリフェッチフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:48:22 GMT)
Nexus-O: An Omni-Perceptive And -Interactive Model for Language, Audio, And Vision [50.2] 業界レベルのtextbfomni-perceptive および-interactive モデルである textbfNexus-O を導入し,音声,画像,ビデオ,テキストデータを効率的に処理する。
まず、モデルを効率的に設計し、トレーニングして、複数のモダリティにわたるトリモーダルアライメント、理解、推論機能を実現するにはどうすればよいか?
第二に、現実のシナリオにおける信頼性の高いパフォーマンスと適用性を保証するために、トリモーダルモデルの堅牢性を評価するために、どのようなアプローチが実装できるのか?
第3に,高品質で現実的なシナリオをキュレートし,得るための戦略
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:26:36 GMT)
Long-term Causal Inference via Modeling Sequential Latent Confounding [49.6] Ghassamiらは、条件付き付加的等価バイアス(CAECB)の仮定に基づくアプローチを提案する。
我々は,時間的短期的な結果に対応するため,CAECBの仮定を拡張した新たな仮定を導入する。
提案した仮定は、時間的短期的な結果にまたがる逐次的共起バイアス間の機能的関係を述べる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:56:56 GMT)
Pareto Low-Rank Adapters: Efficient Multi-Task Learning with Preferences [49.1] 本稿では,機械学習におけるマルチタスクトレードオフに対処するパラメータ効率の高い新しい手法PaLoRAを紹介する。
実験の結果、PaLoRAは様々なデータセットで最先端のMTLとPFLのベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:56:57 GMT)
DualSpec: Text-to-spatial-audio Generation via Dual-Spectrogram Guided Diffusion Model [48.6] 本稿では,DualSpec というテキスト・音声生成フレームワークを提案する。
まず、音響イベントオーディオから潜時音響表現を抽出するための変分オートエンコーダ(VAE)を訓練する。
最後に、空間音響生成のための潜在音響表現とテキスト特徴から拡散モデルを訓練する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:01:59 GMT)
On Speeding Up Language Model Evaluation [48.5] 我々はこの空間を探索するために$textitadaptive$アプローチを提案する。
我々は、マルチアームの包帯に頼り、次の(メソッド、バリデーションサンプル)ペアを順次識別して評価する。
典型的資源の5~15%のみを用いて,トップパフォーマンスの手法を同定できることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:53:59 GMT)
Towards an AI co-scientist [48.1] Gemini 2.0上に構築されたマルチエージェントシステムであるAIコサイシストを紹介する。
このAIの共同科学者は、新しい独創的な知識を解明し、明らかに新しい研究仮説を定式化することを目的としている。
システムの設計には、科学的手法にインスパイアされた仮説生成への生成、議論、進化のアプローチが組み込まれている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:17:13 GMT)
Complex LLM Planning via Automated Heuristics Discovery [48.1] 複雑な計画タスクのための大規模言語モデル(LLM)の強化を検討する。
我々は,LLMがガイドタイム検索の関数を明示的に生成できる新しい手法である自動推論発見(AutoHD)を提案する。
提案手法はモデルトレーニングや微調整を必要とせず,LLMが生成する関数の明示的な定義は推論過程の解釈可能性と洞察を与える。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:52:31 GMT)
ProxyTransformation: Preshaping Point Cloud Manifold With Proxy Attention For 3D Visual Grounding [47.9] エージェントは言語命令に基づいてリアルタイムで3D環境と対話する必要がある。
既存の点雲拡大法は、しばしば多様体を改善するために退屈なプロセスを必要とする。
本稿では,マルチモーダルタスクに適したプロキシ変換を提案し,ポイントクラウド多様体を効率的に改善する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:53:41 GMT)
Between Circuits and Chomsky: Pre-pretraining on Formal Languages Imparts Linguistic Biases [47.9] 形式言語上での言語モデルの事前学習は、自然言語の獲得を改善することができるが、どの特徴が帰納的バイアスを与えるかは明らかではない。
これら2つの特性を持つ形式言語は、自然言語の損失を減らし、他の言語と比較して言語一般化を良くする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:55:55 GMT)
What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations [47.8] 本稿では,科学領域におけるビデオとテキストの要約に特化したデータセットであるVISTAを紹介する。
我々は、最先端の大規模モデルの性能をベンチマークし、抽象概念の構造的性質をよりよく捉えるためにプランベースのフレームワークを適用した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:57:59 GMT)
Reward Shaping to Mitigate Reward Hacking in RLHF [47.7] 人間のフィードバックからの強化学習(RLHF)は、大きな言語モデルと人間の価値の整合に不可欠である。
報酬形成はRLHFを安定させ、報酬ハッキングを部分的に軽減する。
本稿では,報酬形成手法の総合的研究について述べる。
提案手法は,報酬モデル自体に埋め込まれた潜在的嗜好を,強化学習の信号として活用する手法である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:57:59 GMT)
Energy-based Epistemic Uncertainty for Graph Neural Networks [47.5] 高品質な不確実性推定を提供するエネルギーベースモデル(EBM)を提案する。
我々は、エネルギー関数を正則化することにより、データ空間の可積分密度を確実に誘導する。
我々のフレームワークは、様々な分散シフトに敏感な事前学習GNNに適用可能な、シンプルで効果的なポストホック手法である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:07:55 GMT)
Can LLMs Solve longer Math Word Problems Better? [47.2] 数学語問題(MWP)は、大規模言語モデル(LLM)の能力を評価する上で重要な役割を果たす。
より長い文脈が数学的推論に与える影響は未解明のままである。
本研究は文脈長一般化可能性(CoLeG)の研究の先駆者である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:21:40 GMT)
Spatial-Mamba: Effective Visual State Space Models via Structure-aware State Fusion [46.8] SSM(Selective State Space Model)は、1Dシーケンシャルデータにおける長距離依存関係のキャプチャに優れる。
本研究では,地域間直接接続を実現する新しいアプローチであるSpatial-Mambaを提案する。
画像分類,検出,セグメンテーションにおいて,空間マンバは,単一のスキャンであっても,最先端のSSMベースのモデルを達成したり,超えたりしていることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:20:02 GMT)
World Models for Math Story Problems [46.2] 我々は,数学のストーリー問題領域に特有なグラフベースのセマンティックフォーマリズムであるMathWorldを開発した。
既存のいくつかのデータセットから得られた数学のストーリー問題と1019個の問題と3,204個の論理形式からなるコーパスを、MathWorldと組み合わせる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:11:39 GMT)
Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation [45.8] Hunyuan3D 2.0は、高分解能なテクスチャ3Dアセットを生成するための大規模3D合成システムである。
スケーラブルなフローベース拡散変圧器上に構築された形状生成モデルは、所定の条件画像と適切に整合する幾何を作成することを目的としている。
テクスチャ合成モデルは、強い幾何学的および拡散前の利点を生かし、高解像度で活気のあるテクスチャマップを生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:17:59 GMT)
The Mighty ToRR: A Benchmark for Table Reasoning and Robustness [45.4] ToRR は Table Reasoning と Robustness のベンチマークである。
テーブル関連のタスクのパフォーマンスと堅牢性をモデル化する。
本稿では,ToRR上での先行モデルの結果を総合的に分析するとともに,リーダーボードを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:56:38 GMT)
Ev-3DOD: Pushing the Temporal Boundaries of 3D Object Detection with Event Cameras [45.0] 非同期イベントカメラを初めて3次元オブジェクト検出に導入する。
我々はその高時間分解能と低帯域幅を活用して高速な3Dオブジェクト検出を実現する。
イベントベース3Dオブジェクト検出データセットであるDSEC-3DODを導入する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:51:25 GMT)
Knowledge representation and scalable abstract reasoning for simulated democracy in Unity [45.0] 模擬民主主義におけるエージェントに関するスケーラブルな知識表現の新たな形態であるe-polisを提案する。
実際のユーザは、民主的な制度に関連する社会的課題に反応する。
ゲームが終わると、プレイヤーは集団選択によるスマートシティに投票する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:03:02 GMT)
Highly nondegenerate polarization-entangled photon pairs produced through noncritical phasematching in single-domain KTiOPO$_4$ [45.0] 非臨界位相整合(NCPM)SPDCに基づく低温感度の光子対の偏光源を実証した。
信号光子を局所的に検出すると、アイドラー光子は62kmと93kmの電信ファイバーを通して伝達された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:09:13 GMT)
Grad-ECLIP: Gradient-based Visual and Textual Explanations for CLIP [44.9] 私たちはCLIP(Grad-ECLIP)のためのグラディエントに基づく視覚的・テキスト的説明法を提案する。
トークンの特徴にチャネル重みと空間重みを適用し,高品質な視覚的説明を行う。
また,CLIPファインチューニングにおける微粒化アライメントを高めるため,Grad-ECLIPを用いたアプリケーションを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:50:20 GMT)
AutoML for Multi-Class Anomaly Compensation of Sensor Drift [44.6] センサドリフトは、時間とともに機械学習モデルのパフォーマンスを低下させる。
標準クロスバリデーション法はドリフトの不適切な会計によって性能を過大評価する。
本稿では,(1)モデル検証のための新しいセンサドリフト補償学習パラダイム,(2)分類性能の向上とセンサドリフト補償のための自動機械学習(AutoML)技術を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:34:53 GMT)
Simple Guidance Mechanisms for Discrete Diffusion Models [44.4] 我々は、均一ノイズを利用した新しい拡散モデルを開発し、その出力を連続的に編集できるため、より誘導可能である。
我々はこれらのモデルの品質を、最先端の性能をもたらす新しい連続時間変動下界で改善する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:08:59 GMT)
Dealing with Inconsistency for Reasoning over Knowledge Graphs: A Survey [44.0] 我々は、一貫性のない知識グラフ(KG)の推論を行う方法に焦点を当てている。
A) 矛盾の原因となるKGの部分の検出、b) 矛盾しないKGの固定による一貫性の維持、c) 矛盾に耐性のある推論。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:30:22 GMT)
Active Few-Shot Learning for Text Classification [43.6] LLM(Large Language Models)の台頭により、自然言語処理におけるFew-Shot Learning(FSL)メソッドの利用が促進された。
ラベルのないプールから有効なサポートインスタンスを識別する,アクティブな学習ベースのインスタンス選択機構を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:30:13 GMT)
Lightning IR: Straightforward Fine-tuning and Inference of Transformer-based Language Models for Information Retrieval [43.4] 検索シナリオにトランスフォーマーベースの言語モデルを適用するための,使い易いフレームワークであるLightning IRを紹介する。
Lightning IRは、細調整やインデックス付けから検索と再ランク付けまで、検索パイプラインのすべてのステージをサポートするモジュラーとアーキテクチャを提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:29:20 GMT)
Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models [42.8] CBPT(Class-wise Backdoor Prompt Tuning)は、テキストプロンプトによって間接的に汚染された視覚言語モデル(VLM)を浄化する効率的な方法である。
CBPTは、7つの主要なバックドア攻撃に対して平均的クリーン精度(CA)58.86%、アタック成功率(ASR)0.39%のモデルユーティリティを維持しながら、バックドアの脅威を著しく軽減する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:25:15 GMT)
TestNUC: Enhancing Test-Time Computing Approaches through Neighboring Unlabeled Data Consistency [42.8] TestNUCは、隣接する未ラベルデータの局所的な一貫性を活用することで、テスト時の予測を改善する。
TestNUCは既存のテストタイムコンピューティングアプローチとシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:17:56 GMT)
The Prompt Report: A Systematic Survey of Prompt Engineering Techniques [42.6] 生成的人工知能システムは、様々な産業や研究領域に展開されつつある。
工学は矛盾する用語と 存在論的理解に苦しむ
本研究は,プロンプト技術と応用分析の分類を組み込むことにより,プロンプトエンジニアリングの構造化された理解を確立する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:59:01 GMT)
I Know What I Don't Know: Improving Model Cascades Through Confidence Tuning [42.1] カスケード構成の小型モデルを校正するための新しい損失関数「ゲートキーパー」を導入する。
我々のアプローチは、より小さなモデルを微調整して、より大規模なモデルに複雑なタスクを遅延させながら、正しく実行できるタスクを確実に処理する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:29:08 GMT)
Evolution of expected values in open quantum systems [41.9] いくつかのケースでは、システムによって実行されるパワーは量子可観測性(quantum observable)とみなすことができる。
アプリケーションとして、純粋なdephasingプロセスは、この観点から再解釈されます。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:35:55 GMT)
GHOST 2.0: generative high-fidelity one shot transfer of heads [41.6] ヘッドスワップは、合成中に頭全体の構造情報を保存する必要があることや、スワップされたヘッドとバックグラウンドの間の不透明なギャップなど、追加の課題を生じさせる。
本稿では,2つの問題固有のモジュールからなるGHOST 2.0を用いて,これらの問題に対処する。
まず、頭部再現のための拡張アリグナーモデルを導入し、複数のスケールで識別情報を保存する。
次に,Blenderモジュールを用いて,再現された頭部を肌の色を伝達し,不一致領域を塗布することで,シームレスに対象の背景に組み込む。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:47:40 GMT)
Conformal Linguistic Calibration: Trading-off between Factuality and Specificity [41.5] 本稿では,言語プラグマティクスのレンズを通して,抑止と言語キャリブレーションを結合する統一的な枠組みを提案する。
本稿では,モデル応答における不正確度を制御できる実装について述べる。
提案手法は,不確実性を考慮した適応的クレーム書き換えを微調整モデルで実現し,事実性と特異性の間に制御可能なバランスを与える。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:01:49 GMT)
Systematic Outliers in Large Language Models [41.2] 外乱はLarge Language Models (LLM) で広く観測されている。
LLMの生成過程,根本原因,機能について詳細な解析を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:59:40 GMT)
CLIP-Optimized Multimodal Image Enhancement via ISP-CNN Fusion for Coal Mine IoVT under Uneven Illumination [40.7] 地下環境における低照度および不均一輝度は、画像品質を著しく低下させる。
本稿では,不均一照明に最適化されたISP-CNN融合アーキテクチャを用いて,炭鉱IoVTに適したマルチモーダル画像強調手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:09:40 GMT)
Learning Policy Committees for Effective Personalization in MDPs with Diverse Tasks [40.3] 本稿では,実行中に発生するタスクの確率の高い,少なくとも1つの準最適政策を含む政策委員会を学習するための新しいアプローチを提案する。
MuJoCo と Meta-World に関する実験により,提案手法は,訓練,一般化,少数ショット学習において,最先端のマルチタスク,メタ,タスククラスタリングベースラインより優れていることが示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:45:25 GMT)
Switching multiplicative watermark design against covert attacks [40.2] スイッチングフィルタパラメータを定義するための最適設計手法を提案する。
一致した秘密攻撃の最悪のシナリオが想定される。
我々のアルゴリズムは、ある時点でウォーターマークフィルタパラメータが与えられた場合、最適な次ステップパラメータを提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:56:56 GMT)
Pose Magic: Efficient and Temporally Consistent Human Pose Estimation with a Hybrid Mamba-GCN Network [40.1] 我々は,Hybrid Mamba-GCN(Pose Magic)という,注目のない新しいハイブリッドアーキテクチャを提案する。
MambaとGCNの表現を適応的に融合させることで、Pose Magicは基礎となる3D構造を学ぶ上で優れた能力を示している。
実験によると、Pose Magicは74.1%のFLOPを節約しながら新しいSOTA結果を達成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:17:49 GMT)
UQABench: Evaluating User Embedding for Prompting LLMs in Personalized Question Answering [39.8] nameは、パーソナライズのための大きな言語モデルを促進するために、ユーザ埋め込みの有効性を評価するために設計されたベンチマークである。
ユーザ埋め込みをモデル化するための様々な最先端手法について広範な実験を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:34:00 GMT)
DataMan: Data Manager for Pre-training Large Language Models [39.7] 既存の方法は限定的な直観に依存しており、包括的で明確なガイドラインを欠いている。
テキストパープレキシティ異常の原因から14の品質基準を導出し、ドメイン混合をサポートするために15の共通アプリケーションドメインを導入する。
実験では、DataManを使って30Bトークンを選択し、1.3B-パラメータ言語モデルをトレーニングし、我々のアプローチを検証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:01:19 GMT)
Enantiosensitive positions of exceptional points in open chiral systems [39.6] 非エルミート開キラル系のトポロジカルおよびキラル特性に対する新しいタイプの制御を可能にする。
本研究は,高エナンチオセンシティとトポロジカルロバストネスを併用し,非エルミート現象とキラル現象の制御における新たなアプローチの道を開いた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:20:08 GMT)
Hierarchical corpus encoder: Fusing generative retrieval and dense indices [39.6] 生成検索は、クエリに基づいた文書IDの条件付き生成にシーケンスモデルを用いる。
これにより、ゼロショット検索のパフォーマンスが向上したが、トレーニング中に見えないドキュメントをサポートすることは困難である。
本稿では,階層型コーパスエンコーダ(HCE)を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:43:09 GMT)
Distilling Reinforcement Learning Algorithms for In-Context Model-Based Planning [39.5] In-context Model-based RL frameworkであるDistillation for In-Context Planning (DICP)を提案する。
以上の結果から,DICPはベースラインよりも環境相互作用を著しく少なく抑えながら,最先端の性能を実現することが示唆された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:16:57 GMT)
Rethinking LLM Unlearning Objectives: A Gradient Perspective and Go Beyond [39.4] 大きな言語モデル(LLM)は、著作権やプライバシー侵害などの潜在的なリスクを特定するために厳格な監査を受けなければならない。
本稿では,学習対象がモデル性能に与える影響を定量化する勾配効果(G効果)のツールキットを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:59:21 GMT)
SAN: Hypothesizing Long-Term Synaptic Development and Neural Engram Mechanism in Scalable Model's Parameter-Efficient Fine-Tuning [39.0] 我々は、事前学習パラメータ空間の洗練された解析により、FFT(Full Fine-Tuning)による性能ギャップを橋渡しした。
本稿では,前方から後方へのスケーリング成分を分解するSynapse and Neuron(SAN)を提案する。
提案手法は,神経伝達物質放出によるシナプス発生を制御できる長期増強/抑うつ(Neural/D)現象に理論的に基礎を置いている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:07:05 GMT)
NotaGen: Advancing Musicality in Symbolic Music Generation with Large Language Model Training Paradigms [39.0] NotaGenは、高品質なクラシック楽譜を制作する可能性を探究する象徴的な音楽生成モデルである。
1.6万曲の楽譜を事前訓練し、その後「時代劇構成」のプロンプトを条件に、約9Kの高音質のクラシック曲を微調整する。
強化学習のためのCLaMP-DPO法は,人間のアノテーションや事前定義された報酬を必要とせずに,生成品質と制御性をさらに向上する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:18:41 GMT)
ChineseSimpleVQA -- "See the World, Discover Knowledge": A Chinese Factuality Evaluation for Large Vision Language Models [38.9] 我々は,中国語で「 ChineseSimpleVQA」というファクトリティに基づく視覚質問応答ベンチマークを初めて導入した。
このベンチマークの主な特徴は、中国語、多様な知識タイプ、マルチホップ質問の構築、高品質なデータ、静的な一貫性、短い回答による評価、などである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:56:22 GMT)
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models [38.8] ディープ圧縮オートエンコーダ (DC-AE) は高分解能拡散モデルの高速化を目的とした新しいオートエンコーダモデルである。
遅延拡散モデルへの直流-AEの適用により,精度低下のない大幅な高速化を実現した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:56:06 GMT)
TGB-Seq Benchmark: Challenging Temporal GNNs with Complex Sequential Dynamics [38.5] この問題に触発されて、逐次ダイナミクス付き時間グラフベンチマーク(TGB-Seq)を導入する。
TGB-Seqは、eコマースインタラクション、映画評価、ビジネスレビュー、ソーシャルネットワーク、引用ネットワーク、Webリンクネットワークなど、さまざまな領域にまたがる大規模な実世界のデータセットで構成されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:24:09 GMT)
Unlearning Personal Data from a Single Image [38.4] 機械学習は、トレーニング中にデータを見たことがなかったかのように、モデルからデータを消去することを目的としている。
現在、そのようなシナリオにおけるアンラーニング手法の有効性を調査するための設定やベンチマークは存在しない。
トレーニングデータが入手できない場合の未学習モデルを評価する1-SHUI(One-Shot Unlearning of Personal Identities)を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:16:34 GMT)
Permute-and-Flip: An optimally stable and watermarkable decoder for LLMs [38.0] 本稿では,Permute-and-Flip(PF)デコーダと呼ばれる新しいデコーダを提案する。
PFデコーダは標準サンプリングデコーダと同様の安定性を有する。
サンプリングよりも品質と安定性のトレードオフが最大で2倍向上している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:09:49 GMT)
Thermal spectrometer for superconducting circuits [38.0] 超伝導回路は、量子現象の研究のための多用途で制御可能なプラットフォームを提供する。
量子回路の状態を読み出し、その特性を特徴づける従来の手法は、RF測定方式に基づいている。
ここでは、超伝導回路の特性を調べるために、熱分光計の簡単な直流測定を実演する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:28:09 GMT)
Self-calibration for Language Model Quantization and Pruning [38.0] 量子化法とプルーニング法は、ラベルなしサンプルの小さなセットであるキャリブレーションデータを必要とする。
本稿では,自己校正を解法として提案する。
われわれの手法は外部データを必要としないが、代わりにモデル自体を利用して合成キャリブレーションデータを生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:40:00 GMT)
OS-Kairos: Adaptive Interaction for MLLM-Powered GUI Agents [37.9] 本稿では,各インタラクションステップにおける信頼度を予測可能な適応GUIエージェントOS-Kairosを紹介する。
我々はOS-Kairosが複雑なシナリオを特徴とするキュレートデータセットの既存モデルを大幅に上回っていることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:31:16 GMT)
GenTool: Enhancing Tool Generalization in Language Models through Zero-to-One and Weak-to-Strong Simulation [37.9] 大規模言語モデル(LLM)は、外部ツールを統合することで、AIアシスタントとしての能力を向上することができる。
我々は,ツール利用における多種多様な一般化課題に備えた,新しい学習フレームワークGenToolを提案する。
提案手法は,ゼロ・ツー・ワン・ジェネリゼーションと弱・ストロング・ジェネリゼーションという,実世界の応用に不可欠な2つの基本次元に対処する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:54:33 GMT)
Self-Memory Alignment: Mitigating Factual Hallucinations with Generalized Improvement [37.6] 大きな言語モデル(LLM)は、しばしば客観的な事実と反応を一致させるのに苦労し、結果として幻覚をもたらす。
自己記憶アライメント(SMA)を導入し、正確かつ単純な事実質問に対する自己生成応答のモデルを微調整する。
大規模な実験により、SMAはLLMの全体的な性能を著しく改善し、現実性に関する様々なベンチマークを一貫して強化し、有用性や包括的スキルも向上した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:34:52 GMT)
Holistic Audit Dataset Generation for LLM Unlearning via Knowledge Graph Traversal and Redundancy Removal [37.5] 総合的な監査データセットを生成する上で,2つの重要な課題を特定した。
本稿では,総合的な監査データセット生成のためのフレームワークであるHANKERを提案する。
MUSEベンチマークにHANKERを適用して、69,000件の監査ケースと111,000件の監査ケースを生成しました。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:39:22 GMT)
Nonparametric Heterogeneous Long-term Causal Effect Estimation via Data Combination [37.5] 長期的な因果推論は多くの科学領域で注目を集めている。
また、不均一な長期因果効果を頑健かつ効果的に推定する方法も検討されている。
異種長期因果効果推定のための2段階型非パラメトリック推定器を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:17:04 GMT)
Know You First and Be You Better: Modeling Human-Like User Simulators via Implicit Profiles [37.4] ユーザシミュレータは、対話システムとの人間のインタラクションを複製するのに不可欠である。
本研究では,人間と機械の会話から暗黙のユーザプロファイルを推論するフレームワークである暗黙のプロファイル(USP)を用いたユーザシミュレータを提案する。
USPは、一貫性において同等のパフォーマンスを達成しつつ、信頼性と多様性の観点から、強力なベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:26:54 GMT)
Bayesian Optimization for Controlled Image Editing via LLMs [37.4] BayesGenieは、大規模言語モデルとベイズ最適化を統合する、既定のアプローチである。
本手法により,手動の領域マークを使わずに,自然言語による画像の修正が可能となる。
筆者らのフレームワークは,編集精度と意味保存の両面で,既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:53:39 GMT)
Quantum Advantage in Distributed Sensing with Noisy Quantum Networks [37.2] 分散センシングにおける量子優位性は、ノイズの多い絡み合った状態のみを分散できるノイズの多い量子ネットワークによって達成できることを示す。
分散センシングにおける量子優位性を持つプローブ状態は3ノードの量子ネットワークで作成できることを実証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:22:29 GMT)
Revisiting Prefix-tuning: Statistical Benefits of Reparameterization among Prompts [36.9] 本研究では,大規模事前学習モデルの微調整のためのプロンプトベース手法の理論的基礎について検討する。
本研究は, 再パラメータ化は単なる工学的トリックではなく, 深い理論的基礎に根ざしていることを示す。
本研究は,プロンプトに基づく手法とその基盤となるメカニズムの理解を深め,理論的および経験的貢献を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:23:23 GMT)
How Far are LLMs from Real Search? A Comprehensive Study on Efficiency, Completeness, and Inherent Capabilities [36.8] 本稿では,Large Language Models (LLMs) を有効かつ効率的な検索に活用するフレームワークとして,SeaL(Search via Learning)を提案する。
SeaLは、従来のアプローチと比較して、検索スペースを最大99.1%削減しながらほぼ完璧な精度を実現している。
解析の結果,現在のLLMは複雑な問題において効率的な探索に苦しむ一方で,体系的な探索戦略を取り入れることで,問題解決能力が著しく向上していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:40:18 GMT)
AFlow: Automating Agentic Workflow Generation [36.6] 大規模言語モデル(LLM)は、様々な領域にわたる複雑なタスクを解く上で、顕著な可能性を示している。
我々は、Monte Carlo Tree Searchを使って、この空間を効率的に探索する自動化フレームワークであるAFlowを紹介します。
6つのベンチマークデータセットに対する実証的な評価は、AFlowの有効性を示し、最先端のベースラインよりも平均5.7%向上している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:38:03 GMT)
Can Language Models Falsify? Evaluating Algorithmic Reasoning with Counterexample Creation [36.5] 偽装仮説は、主張が時間とともに反復的に洗練されることを許すため、科学的進歩の鍵となる。
言語モデルに関する現在のベンチマークは、主に、それらに挑戦するのではなく、ソリューションを生成する能力を評価している。
我々は、この逆の能力を評価するベンチマークの開発を提唱する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:58:13 GMT)
Multi-level Attention-guided Graph Neural Network for Image Restoration [36.2] 画像復元タスクでは、画像の局所的な特徴は不十分であり、それらを補完するためにグローバルな特徴の統合が必要である。
本稿では,多レベル注意誘導グラフニューラルネットワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:35:42 GMT)
AI Mentors for Student Projects: Spotting Early Issues in Computer Science Proposals [35.9] 我々は,学生が適任に就けるかどうかを判断するために,プロジェクト提案や情報を収集し,教育者を支援するソフトウェアシステムの開発を行う。
ユーザがプロジェクト提案を書いて,さらに学ぶためのツールや技術を特定するのに,このシステムを有用だと認識していることが分かりました。
学生のプロジェクト提案の質を評価するためにLLMを使うことは有望であるが、その長期的な効果は、学生の成功と学習意欲を確実に予測する指標を特徴付けることによる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:24:14 GMT)
Weighted-Reward Preference Optimization for Implicit Model Fusion [35.6] 提案手法は,ソースLLMとターゲットLLM間の優先最適化を有効に活用する暗黙融合方式を提案する。
WRPOは語彙アライメントやマトリックス融合の必要性を排除し、様々なLSMに対応するために効率的にスケールすることができる。
MT-Bench、AlpacaEval-2、Arena-Hardベンチマークの実験は、WRPOが既存の知識融合法より一貫して優れていることを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:10:48 GMT)
Data-Driven DRO and Economic Decision Theory: An Analytical Synthesis With Bayesian Nonparametric Advancements [35.5] 我々は、データ駆動型分散ロバスト最適化(DRO)と経済決定理論を両立させる分析合成を開発する。
標準正規化とDROをあいまいさと逆決定モデルのデータ駆動型として再解釈することにより、本質的な関係を明らかにする統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:42:53 GMT)
Spectral-Enhanced Transformers: Leveraging Large-Scale Pretrained Models for Hyperspectral Object Tracking [35.3] 本稿では,超スペクトル物体追跡のためのトランスフォーマーベース基礎モデルに適応する効果的な手法を提案する。
本稿では,任意の変圧器ベースのバックボーンに拡張可能な適応型,学習可能な空間分光トークン融合モジュールを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:46:21 GMT)
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering [35.2] MLE-benchは、AIエージェントが機械学習エンジニアリングでどのように機能するかを測定するためのベンチマークである。
われわれはKaggleから75のMLエンジニアリング関連のコンペを開催する。
私たちはKaggleが公開しているリーダーボードを使って、各競技の人間ベースラインを確立します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:57:30 GMT)
Language Imbalance Driven Rewarding for Multilingual Self-improving [35.2] 大規模言語モデル(LLM)は多くのタスクで最先端のパフォーマンスを達成した。
この不均衡は、より広範なアプリケーションを制限する一方で、言語間の自然な選好ランキングを生成する。
本稿では,優越型言語と非優越型言語との固有不均衡を報酬信号として活用する,$textitLanguage Im Balance Driven Rewardingを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:39:40 GMT)
VEM: Environment-Free Exploration for Training GUI Agent with Value Environment Model [35.0] 政策最適化から価値推定を分離する環境のないRLフレームワークを提案する。
本フレームワークは,(1)長期活動ユーティリティを推定するためにVEMを事前訓練すること,(2)凍結したVEM信号による政策探索を導くこと,の2段階からなる。
Android-in-the-Wildベンチマークで評価すると、VEMはオフラインとオンラインの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:52:02 GMT)
NeuroVoz: a Castillian Spanish corpus of parkinsonian speech [34.9] この写本は、58人の健康的なコントロールと54人のPDを含む112人のカスティーリャ・スペイン語話者からなるNeuroVoz corpusを提示している。
また、このデータセットは、GRBAS尺度に従って専門家が行う音声品質の主観評価と補完される。
このデータセットはすでにいくつかの研究を支持しており、PDのスクリーニングのベンチマーク精度は89%に達した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:42:41 GMT)
Hotspot-Driven Peptide Design via Multi-Fragment Autoregressive Extension [34.6] PepHARは、特定のタンパク質を標的としたペプチドを設計するためのホットスポット駆動の自己回帰生成モデルである。
特定のホットスポット残基が高い相互作用ポテンシャルを持つという観測に基づいて、我々はまずエネルギーベースの密度モデルを用いてこれらのキー残基を適合させ、サンプリングする。
ホットスポットサンプリングとフラグメントベースの拡張を組み合わせることで,ターゲットタンパク質に適合したデノボペプチドの設計が可能となった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:18:01 GMT)
Towards Label-Only Membership Inference Attack against Pre-trained Large Language Models [34.4] メンバーシップ推論攻撃(MIA)は、データサンプルがモデルのトレーニングセットに属しているかどうかを予測することを目的としている。
textbfPETAL: textbfPEr-textbfToken semtextbfAntic simitextbfLLに基づくラベルのみのメンバシップ推論攻撃を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:47:19 GMT)
WakeMint: Detecting Sleepminting Vulnerabilities in NFT Smart Contracts [33.8] スリープマイニングは、攻撃者が他人のトークンを違法に転送することを可能にする。
このような問題の特定には,コントラクトコードの観点からの理解の欠如が不可欠です。
We propose WakeMint, built on a symbolic execution framework, is designed to be compatible with high and low version of Solidity。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:39:46 GMT)
Generalist World Model Pre-Training for Efficient Reinforcement Learning [33.8] 一般化的世界モデル事前学習 (WPT) により, 効率的な強化学習 (RL) と高速タスク適応が可能となることを示す。
6つの異なる実施形態にまたがる72のビジュモータタスクの実験では、WPTは広く使われている学習ベースラインに比べて35.65%と35%高い集計スコアを達成している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:34:29 GMT)
State-Agnostic Approach to Certifying Electron-Photon Entanglement in Electron Microscopy [33.7] 本稿では,コヒーレントカソードルミネッセンス過程から自然に生じる電子と光子の絡み合いを証明するためのプロトコルを提案する。
我々の研究は、フォトニック量子情報技術と電子顕微鏡を統合している。
原子スケールでの絡み合いに基づくイメージングの基礎を確立し、放射線被曝を減らすための潜在的経路を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:18:04 GMT)
Sequential Entanglement-Swapping assisted by Quantum Protocol over Ethernet Networks [33.4] 従来の量子技術と量子技術を組み合わせて、効率的でスケーラブルな量子ネットワークを実現する可能性を示す。
いくつかの新しいプロトコルは、イーサネット上の信頼できるエンドツーエンドの量子絡み合いを可能にする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:01:28 GMT)
MathClean: A Benchmark for Synthetic Mathematical Data Cleaning [33.3] 数学の質問と答えは不正確さを導入し、トレーニングデータとWebデータの両方を劣化させる可能性がある。
本稿では,数学データクリーニングモデルの有効性を評価するために,MathCleanベンチマークを提案する。
我々の結果は、GPT-o1やDeepSeek-R1のような強力なモデルでさえ、このベンチマークでは性能が良くないことを示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:17:50 GMT)
On Aggregation Queries over Predicted Nearest Neighbors [33.1] 指定されたオブジェクトの予測近傍における新しいタイプの集約クエリであるAQNNを紹介する。
AQNNは、例えば、医療専門家が「特定の不眠症患者に類似した予測された患者の平均的な収縮血圧」を計算したいという現代の応用で一般的である。
予測は通常、高価なディープラーニングモデルや人間の専門家が関与するため、近似集約を返す問題としてクエリ処理を定式化する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:17:32 GMT)
Automatic Detection of Research Values from Scientific Abstracts Across Computer Science Subfields [32.8] 研究の態度や行動を導いたり動機づけたりする基礎的および基本的な信念として知られる、特定の研究の価値観を探求することが不可欠である。
これまでの研究は、機械学習論文の小さなサンプルから、手動で研究値を分析してきた。
本稿では,CS関連研究をガイドする10の研究値を含む詳細なアノテーションスキームを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:43:11 GMT)
Linear Combination of Saved Checkpoints Makes Consistency and Diffusion Models Better [32.5] Diffusion Models (DM) と Consistency Models (CM) は、様々なタスクにおいて優れた生成品質を持つ人気のある生成モデルである。
本研究では,SGDでは到達できないが,適切なチェックポイント平均化によって得られるような,高品質なモデルウェイトがしばしば存在することを明らかにする。
進化探索から導出される係数とトレーニング軌道に沿ったチェックポイントを組み合わせることで,DMとCMの性能を向上させる,シンプルで効率的かつ効率的なLCSCを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:28:39 GMT)
Seeing the Forest for the Trees: A Large Scale, Continuously Updating Meta-Analysis of Frontier LLMs [32.5] 本研究では,LSMを用いたデータ抽出を高速化する半自動メタ分析手法を提案する。
関連するarXiv論文を自動的に識別し、実験結果と関連する属性を抽出し、構造化データセットに整理する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:56:34 GMT)
Wasserstein Distances, Neuronal Entanglement, and Sparsity [32.4] 本研究では,特に重み空間下での非絡み合いが,パフォーマンスの理解にどのように役立つかを検討する。
LLMの各リニア層に、少数の高度に絡み合った「ワッサースタインニューロン」が存在することを示す。
我々のフレームワークは各層の入力を分離し、各ニューロンの出力がワーセルシュタイン距離の低いニューロンの混合によって計算される専門家の混合を生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:32:10 GMT)
UniGenCoder: Merging Seq2Seq and Seq2Tree Paradigms for Unified Code Generation [32.3] 既存のコード生成アプローチでは、トークンのシーケンスとしてターゲットコードを生成するSequence-to-Sequenceパラダイムや、アクションのシーケンスとしてコードを出力するSequence-to-Treeパラダイムが重視されている。
コード関連生成タスクに対してUniGenCoderを提案する。これは共有エンコーダと、最小限の追加パラメータを持つ共有デコーダと、各インスタンスに対して最適なパラダイムを動的に選択するセレクタから構成される。
テキスト・ツー・コード生成タスクとコード・ツー・コード生成タスクの実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:30:00 GMT)
Can RLHF be More Efficient with Imperfect Reward Models? A Policy Coverage Perspective [32.0] 本稿では,オンラインRLHFにおける不完全な報酬モデルから知識を伝達する方法を検討する。
本稿では,従来のオンライン学習に比べて有益である理論伝達学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:03:06 GMT)
Combining TF-GridNet and Mixture Encoder for Continuous Speech Separation for Meeting Transcription [31.8] TF-GridNetは実残響条件下での音声分離において顕著な性能を示した。
混合エンコーダを静的な2話者シナリオから自然なミーティングコンテキストに拡張する。
実験の結果、単一のマイクを使用して、LibriCSS上での最先端のパフォーマンスが新たに向上した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:28:38 GMT)
A Sampling-based Framework for Hypothesis Testing on Large Attributed Graphs [31.1] 本研究では,属性グラフにおけるノード,エッジ,パス仮説を定式化する。
既存の仮説に依存しないグラフサンプリング手法に対応可能な,サンプリングベースの仮説テストフレームワークを開発した。
実データを用いた実験では,提案フレームワークが一般的なグラフサンプリング手法を仮説テストに活用できることが示されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:34:22 GMT)
A Multi-Agent DRL-Based Framework for Optimal Resource Allocation and Twin Migration in the Multi-Tier Vehicular Metaverse [30.7] 多層車両メタバースは、車両を相互接続されたデジタルエコシステム内の必須ノードに変えることを約束する。
階層的なStackelbergゲームベースのインセンティブ機構であるGraph Convolutional Networks(GCNs)とマルチエージェント深層強化学習(MADRL)を統合した,新たなマルチ層リソースアロケーションとVTマイグレーションフレームワークを導入する。
この動的で多層的な車種メタバースをマルコフ決定過程(MDP)としてモデル化することにより、多目的多元決定性ポリシー勾配(MO-MADDPG)と呼ばれるMADRLベースのアルゴリズムを開発する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:09:05 GMT)
Max360IQ: Blind Omnidirectional Image Quality Assessment with Multi-axis Attention [30.7] マルチ軸アテンションを用いた視覚的全方位画像品質評価モデル(Max360IQ)を提案する。
Max360IQは、一様歪んだ全方位画像の品質だけでなく、一様歪んだ全方位画像の品質も正確に測定できる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:01:03 GMT)
M2-omni: Advancing Omni-MLLM for Comprehensive Modality Support with Competitive Performance [30.4] M2-omniは、GPT-4oと競合する性能を実現する、最先端のオープンソースオムニ-MLLMである。
M2-omniは統合マルチモーダルシーケンスモデリングフレームワークを使用している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:21:12 GMT)
TheoremExplainAgent: Towards Multimodal Explanations for LLM Theorem Understanding [30.3] TheoremExplainAgentは,長文の定理説明ビデオを生成するエージェント的手法である。
以上の結果から, エージェントプランニングは, 詳細な長編ビデオ作成に不可欠であることが判明した。
マルチモーダルな説明は、テキストベースの説明が明らかにならない深い推論の欠陥を露呈する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:50:09 GMT)
MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning [29.8] 我々は、透明性と信頼性を高めるために、自然言語推論を明示的に生成する医療用VLMであるMedVLM-R1を紹介する。
MedVLM-R1の精度は、MRI、CT、X線ベンチマークで55.11%から78.22%に向上し、100万以上のサンプルでトレーニングされたより大きなモデルを上回っている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:57:34 GMT)
Learning Surrogates for Offline Black-Box Optimization via Gradient Matching [29.8] 本稿では,オフラインデータに基づく潜伏勾配場とサロゲートがいかによく一致しているかに基づいて,最適化品質を明示的に境界付けることによって,オフラインブラックボックス最適化を理解するための理論的枠組みを提案する。
そこで本研究では,オフライン最適化のための効果的なサロゲートモデル作成のためのブラックボックス勾配マッチングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:35:54 GMT)
Local-Prompt: Extensible Local Prompts for Few-Shot Out-of-Distribution Detection [29.8] Local-Promptは、ローカルプロンプトによる地域強化を強調する新しいチューニングパラダイムである。
提案手法は,ImageNet-1kデータセットを用いた4ショットチューニングにおいて,最先端手法に対して平均FPR95を5.17%削減する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:52:23 GMT)
Fewer May Be Better: Enhancing Offline Reinforcement Learning with Reduced Dataset [29.6] オフライン強化学習(RL)により、エージェントは環境とのさらなるインタラクションなしに、事前にコンパイルされたデータセットから学習することができる。
オフラインRLにおける重要な課題は、オフラインデータセットの最適なサブセットを選択することだ。
本稿では、勾配近似最適化問題としてデータセット選択をフレーム化するReDORを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:08:47 GMT)
Don't flatten, tokenize! Unlocking the key to SoftMoE's efficacy in deep RL [29.0] SoftMoEsは最近、オンライン強化学習の問題を緩和する約束を見せている。
我々は、複数の専門家ではなく、エンコーダ出力のトークン化が、SoftMoEsの有効性の裏にあることを発見した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:36:25 GMT)
Amulet: ReAlignment During Test Time for Personalized Preference Adaptation of LLMs [28.8] Amuletは、各トークンの復号処理を独立したオンライン学習問題として定式化する、トレーニング不要のフレームワークである。
Amuletは、異なるLLM、データセット、ユーザー好みの組み合わせで、リッチな設定で大幅なパフォーマンス改善を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:07:37 GMT)
Detecting Essence Code Clones via Information Theoretic Analysis [28.7] コードのクローンには、時間の節約のためにコードの断片を複製するが、ソフトウェア保守性と品質を犠牲にすることが多い。
essence clones" はType-3クローンの複雑なサブタイプであり、周辺コードが異なるにもかかわらず重要なロジックを共有するのが特徴である。
伝統的なテクニックは、しばしばその構文的焦点のため、自然クローンを検出するのに失敗する。
本稿では,コード行の意味的重要性を評価するために情報理論を利用した新しい検出ツールECScanを紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:23:40 GMT)
Exploring Translation Mechanism of Large Language Models [27.8] 大規模言語モデル(LLM)は多言語翻訳タスクにおいて著しく成功している。
本研究では,計算成分の観点から,LLMの翻訳機構について検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:52:03 GMT)
Bayesian Computation in Deep Learning [27.7] 本稿では,ディープラーニングモデルに適用したベイズ計算手法として近似推論手法を紹介する。
本稿では,ベイズニューラルネットワークと深部生成モデルに対する一般的な計算手法について述べる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:41:47 GMT)
Large Language Model Agent for Hyper-Parameter Optimization [27.2] 多様な機械学習タスクにまたがるハイパーパラメータ最適化を自動化するために,LLM(Large Language Models)を活用した新しいパラダイムを導入する。
AgentHPOはタスク情報を自律的に処理し、特定のハイパーパラメータで実験を行い、反復的にそれらを最適化する。
このヒューマンライクな最適化プロセスは、必要な試行回数を大幅に削減し、セットアッププロセスを単純化し、解釈可能性とユーザ信頼を高める。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:57:13 GMT)
LightStereo: Channel Boost Is All You Need for Efficient 2D Cost Aggregation [27.0] LightStereoは、マッチングプロセスを加速するために作られた最先端のステレオマッチングネットワークである。
私たちのブレークスルーは、3Dコストボリュームのチャネル次元に特化してパフォーマンスを向上させることです。
LightStereoは、SceneFlowデータセットで競合するEPEメトリックを達成し、最低でも22GFLOPと17msのランタイムを必要とする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:26:43 GMT)
Project Alexandria: Towards Freeing Scientific Knowledge from Copyright Burdens via LLMs [27.0] ペイウォール、ライセンスおよび著作権規則は、科学知識の広く普及と再利用を制限することが多い。
学術文献から科学的知識を抽出することは法的にも技術的にも可能であるという立場を取る。
テキスト埋め込みのような現在の方法は、事実を確実に保存することができず、単純な言い回しは法的に正しくないかもしれない。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:56:52 GMT)
Leveraging Large Models for Evaluating Novel Content: A Case Study on Advertisement Creativity [26.9] ビジュアル広告の創造性を非定型性と独創性に分解しようと試みる。
微粒な人間のアノテーションを用いて、このような主観的な問題に特化してタスクのスーツを提案する。
また,提案したベンチマークを用いて,最先端(SoTA)ビジョン言語モデル(VLM)と人間との整合性を評価する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:28:03 GMT)
Evaluating Defences against Unsafe Feedback in RLHF [26.9] 本稿では、強化学習による安全でないフィードバックからの学習について考察する。
安全に配慮したLLMは有害なテキストを生成することで、安全でない行動空間を容易に探索できることがわかった。
この脆弱性から保護するために、我々は、有害な微調整の防御を「単純」と「明示」の両方に適応させる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:01:00 GMT)
Unlock Reliable Skill Inference for Quadruped Adaptive Behavior by Skill Graph [26.9] 本稿では,ロボットの基本スキルの集合を組織化するための新しいフレームワークとして,ロボットスキルグラフ(RSG)を提案する。
RSGはKGの静的知識ではなく、巨大な動的行動スキルで構成されている。
我々は,RSGが新たなタスクや環境に対して,信頼性の高いスキル推論を提供できることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:10:09 GMT)
From Hours to Minutes: Lossless Acceleration of Ultra Long Sequence Generation up to 100K Tokens [26.8] TOKENSWIFTは超長周期の生成過程を大幅に高速化するように設計されている。
様々なスケールのモデルで3倍以上のスピードアップを達成する。
これは超長いシーケンス生成のための数時間の節約を意味する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:10:08 GMT)
Robust Federated Learning in Unreliable Wireless Networks: A Client Selection Approach [26.7] 深層ニューラルネットワーク(DNN)を無線エッジでトレーニングするための、有望な分散学習パラダイムとして、フェデレートラーニング(FL)が登場した。
既存のソリューションは主に、無線リソース最適化戦略を取り入れることでこれらの課題に対処する。
本稿では、信頼できないネットワークにおける送信障害が、ローカルサンプルの効果的なラベル分布を歪める方法に関する、新しい理論的解析を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:56:41 GMT)
A Sample-Level Evaluation and Generative Framework for Model Inversion Attacks [26.6] モデル反転(MI)攻撃は機械学習において重大なプライバシー上の懸念を引き起こす。
最近のMI攻撃は、現実的なラベルレベルのプライベートデータを再構築することに成功した。
単一対象サンプルのプライベート情報であるサンプルレベルのプライバシも重要であるが,MI文献では未検討である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:50:43 GMT)
MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems [26.5] MoE-CAPはスパースMoEシステムを評価するためのベンチマーク手法である。
主なイノベーションは、コスト、パフォーマンス、精度のメトリクスを単一のダイアグラムに統合した、疎結合対応のCAP分析モデルである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:28:08 GMT)
An Empirical Study on Commit Message Generation using LLMs via In-Context Learning [26.4] コミットメッセージは、自然言語のコード変更を簡潔に記述する。
我々は,大規模言語モデル (LLM) とテキスト内学習 (ICL) の武器を借りてコミットメッセージを生成することを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:47:52 GMT)
Exploring Graph Tasks with Pure LLMs: A Comprehensive Benchmark and Investigation [26.2] グラフ構造化データは、さまざまな領域でますます普及し、グラフタスクを処理する効果的なモデルに対する需要が高まっている。
グラフニューラルネットワーク(GNN)のような従来のグラフ学習モデルは、大きな進歩を遂げているが、グラフデータを扱う能力は、特定のコンテキストにおいて制限されている。
近年,グラフタスクの候補として大規模言語モデル (LLM) が登場しているが,ほとんどの研究はパフォーマンスベンチマークに重点を置いている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:03:46 GMT)
Privacy-Preserving Retrieval-Augmented Generation with Differential Privacy [25.9] 検索強化世代(RAG)は大規模言語モデル(LLM)を支援するのに特に有効である
RAGは、外部データソースから機密情報を漏洩するリスクを出力する。
機密情報を必要とするトークンに対してのみ、プライバシー予算を賢く費やすアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:55:54 GMT)
PolypFlow: Reinforcing Polyp Segmentation with Flow-Driven Dynamics [25.7] PolypFLowは、セグメンテーションの洗練に物理にインスパイアされた最適化力学を注入するフローマッチング拡張アーキテクチャである。
我々はPolypFLowが様々な照明シナリオで一貫した性能を維持しながら最先端を実現していることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:48:33 GMT)
Bandit and Delayed Feedback in Online Structured Prediction [25.6] 要求の少ないフィードバック、帯域幅、遅延フィードバックを扱うアルゴリズムを提案する。
バンディットフィードバックを用いたオンライン分類において,提案アルゴリズムの性能を数値的に評価する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:00:15 GMT)
Disentangled VAD Representations via a Variational Framework for Political Stance Detection [25.4] 本研究では,変分オートエンコーダ(VAE)を用いた新たな姿勢検出手法を提案する。
PoliStance-VAEは、BERT、BERTweet、GPT-4oといったモデルを上回る最先端のパフォーマンスを実現している。
このフレームワークは、自然言語処理タスク、特に詳細な感情的理解を必要とするタスクの進歩の道を開く。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:31:48 GMT)
HYBRIDMIND: Meta Selection of Natural Language and Symbolic Language for Enhanced LLM Reasoning [25.2] 本稿では,各推論問題に対して最適な推論手法を選択する適応戦略であるHYBRIDMINDを紹介する。
メタセレクタとしての微調整 LLaMA-3.1-8B-Instruct は GPT-4o の自然言語推論より優れている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:24:57 GMT)
AURO: Reinforcement Learning for Adaptive User Retention Optimization in Recommender Systems [25.2] 強化学習(Reinforcement Learning, RL)は、レコメンデーションシステムにおけるユーザ保持の最適化能力に注目が集まっている。
本稿では,この課題に対処するため,textbfAdaptive textbfUser textbfRetention textbfOptimization (AURO) という新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:25:53 GMT)
Online Prototypes and Class-Wise Hypergradients for Online Continual Learning with Pre-Trained Models [25.0] 連続学習(CL)は、分散が時間とともに変化するデータシーケンスから学習する問題に対処する。
本稿では,オンラインプロトタイプ(OP)とクラスワイズハイパーグラディエント(CWH)の両問題に対処する。
OPは、タスク境界を必要とせずに、その値をオンザフライで更新して、リプレイサンプルとして機能させることで、PTMの安定した出力表現を活用する。
CWHは、クラス依存の勾配係数を訓練中に学習し、準最適学習率を改善する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:43:54 GMT)
FaithUn: Toward Faithful Forgetting in Language Models by Investigating the Interconnectedness of Knowledge [24.9] 本研究では,非学習手法が相互接続した知識の消去に失敗する現象を指す「表面的非学習」という概念を新たに定義する。
この定義に基づいて、実世界の知識QA設定における未学習の忠実度を分析し評価する新しいベンチマーク、FaithUnを導入する。
我々は,知識関連ニューロンのみを更新し,忠実な未学習を実現する新しい未学習手法KLUEを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:11:03 GMT)
Plutus: Benchmarking Large Language Models in Low-Resource Greek Finance [24.8] Plutus-benはギリシャ初の金融評価ベンチマークであり、Plutus-8Bはギリシャの金融LLMの先駆者である。
専門ギリシャ語話者によって完全に注釈付けされた3つの新しい高品質なギリシャ語の財務データセットを提示する。
Plutus-ben上での22 LLMの包括的評価から,ギリシャの金融NLPは,言語的複雑性,ドメイン固有の用語,財政的推論のギャップのため,依然として困難なままであることが明らかとなった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:04:01 GMT)
BeamVQ: Beam Search with Vector Quantization to Mitigate Data Scarcity in Physical Spatiotemporal Forecasting [24.6] 本稿では,新たな自己集合戦略で反復的自己学習を実現するための新しい確率的枠組みを提案する。
BeamVQは、予測MSE(最大39%)を継続的に削減し、極端なイベントの検出を強化し、データの不足を処理する効果を証明している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:27:25 GMT)
AI Risk Atlas: Taxonomy and Tooling for Navigating AI Risks and Resources [24.5] AIリスクアトラス(AI Risk Atlas)は、さまざまなソースからAIリスクを統合し、それらをガバナンスフレームワークと整合させる、構造化された分類法である。
私たちはまた、リスク定義、ベンチマーク、データセット、緩和戦略の分割を橋渡しするために設計されたオープンソースのツールのコレクションであるR Risk Atlas Nexusを紹介します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:23:14 GMT)
Large Language Models for Mobile GUI Text Input Generation: An Empirical Study [24.3] 大規模言語モデル(LLM)は優れたテキスト生成機能を示している。
本稿では,UIページに対するAndroidテキスト入力生成における9つの最先端LCMの有効性を広範囲に検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:23:35 GMT)
CodeIF: Benchmarking the Instruction-Following Capabilities of Large Language Models for Code Generation [24.1] 我々は、コード生成シナリオ内でタスク指向の命令に従うために、LLM(Large Language Models)の能力を評価するために設計された最初のベンチマークであるCodeIFを紹介する。
我々はLLMによる広範囲な実験を行い、これらの課題の要求を満たす上での強みと限界を分析した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:19:49 GMT)
Omni-SILA: Towards Omni-scene Driven Visual Sentiment Identifying, Locating and Attributing in Videos [23.8] 本稿では,ビデオ(Omni-SILA)タスクにおける新しいOmni-scene駆動型視覚知覚識別,位置同定,属性化を提案する。
明示的なシーン情報と暗黙的なシーン情報の両方を通して、視覚的感情を対話的かつ正確に識別し、発見し、属性付けすることを目的としている。
本稿では,Omni-SILAタスクに対処するためのICM(Inmplicit-enhanced Causal MoE)アプローチを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:05:07 GMT)
Towards Scalable General Utility Reinforcement Learning: Occupancy Approximation, Sample Complexity and Global Optimality [23.6] 最大誤差推定(MLE)を用いた関数近似クラス内の占有度を近似する手法を提案する。
我々は,我々の占有度測定誤差が,状態行動空間のサイズではなく,関数近似クラスの次元にのみスケールすることを示す統計解析を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:19:07 GMT)
When Personalization Meets Reality: A Multi-Faceted Analysis of Personalized Preference Learning [23.6] ヒューマンフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、一般的に、多様な人間の価値観や少数派視点を見越して、ユーザ間で均質な好みを仮定する。
本稿では,多面的評価フレームワークを提案する。このフレームワークは,性能だけでなく,不公平性,意図しない効果,適応性など,様々なレベルの嗜好のばらつきを計測する。
これらの知見は、より効果的で包括的な選好学習システムの開発を進めるための全体論的評価アプローチの批判的必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:14:58 GMT)
On the Generalization and Adaptation Ability of Machine-Generated Text Detectors in Academic Writing [23.4] 本研究では,MGT検出器の一般化と適応性について,学術書誌に特有の3つの重要な側面で検討する。
ドメイン内設定とドメイン間設定の両方において、バイナリ分類および帰属タスクのための様々な検出器の性能をベンチマークする。
本研究は,MGT検出器の多種多様なシナリオにおける一般化と適応性に関する知見を提供し,ロバストで適応的な検出システム構築の基礎を築いた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:13:52 GMT)
Easy-Poly: A Easy Polyhedral Framework For 3D Multi-Object Tracking [23.4] 複数のオブジェクトカテゴリを対象としたリアルタイムフィルタベースの3DMOTフレームワークであるEasy-Polyを提案する。
結果は,Poly-MOTやFast-Polyといった最先端の手法よりも優れていることを示す。
これらの知見は、多様なシナリオにおけるEasy-Polyの適応性と堅牢性を強調している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:38:28 GMT)
EMERGE: Enhancing Multimodal Electronic Health Records Predictive Modeling with Retrieval-Augmented Generation [22.9] EMERGEはRetrieval-Augmented Generation(RAG)駆動のフレームワークであり、マルチモーダルEHR予測モデリングを強化する。
時系列データと臨床ノートからエンティティを抽出し,LLM(Large Language Models)を誘導し,プロのPrimeKGと整合させる。
抽出した知識は、患者の健康状態のタスク関連サマリーを生成するために使用される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:18:09 GMT)
PointSea: Point Cloud Completion via Self-structure Augmentation [22.8] ポイントクラウドの完成は、3Dビジョンにおける根本的な問題だが、十分に解決されていない。
グローバル・ローカル・ポイント・クラウド・コンプリートのためのPointSeaを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:12:43 GMT)
A Survey on Computational Pathology Foundation Models: Datasets, Adaptation Strategies, and Evaluation Tasks [22.8] 計算病理基盤モデル (CPathFMs) は, 組織学的データを解析するための強力なアプローチとして出現している。
これらのモデルは、セグメンテーション、分類、バイオマーカー発見のような複雑な病理タスクを自動化することを約束している。
しかし、CPathFMsの開発は、データアクセシビリティの制限、データセット間の高いばらつき、標準化された評価ベンチマークの欠如など、大きな課題を呈している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:14:21 GMT)
SynGhost: Invisible and Universal Task-agnostic Backdoor Attack via Syntactic Transfer [22.8] 事前トレーニングは、データやトレーニングメカニズムの脆弱性によるタスク非依存のバックドア攻撃に悩まされる。
我々は,シンタクティックトランスファーによる,目に見えない,普遍的なタスク非依存のバックドアアタックである$mathttSynGhost$を提案する。
$mathttSynGhost$は、コントラスト学習に基づいて最適なターゲットを適応的に選択し、トレーニング前の空間に均一な分布を生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:40:42 GMT)
CCDM: Continuous Conditional Diffusion Models for Image Generation [22.7] 条件拡散モデル(CDM)は連続条件生成モデリング(CCGM)に代わる有望な選択肢を提供する
CDMは、特別に設計された条件拡散プロセス、新しいハード・ヴィジナル・イメージ・デノージング・ロス、効率的な条件サンプリング・プロシージャによる既存の制限に対処する。
CCDMは最先端のCCGMモデルより優れており,新たなベンチマークが確立されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:45:40 GMT)
GraCoRe: Benchmarking Graph Comprehension and Complex Reasoning in Large Language Models [22.7] 本稿では,大規模言語モデルのグラフ理解と推論を体系的に評価するベンチマークであるGraCoReを提案する。
GraCoReは3階層の階層分類を使用して、純粋なグラフと不均一グラフのモデルを分類し、テストし、19のタスクでテストされた10の領域に分割する。
キーとなる発見は、OpenAI o1モデルは驚くほどの理解と推論能力を持ち、セマンティックエンリッチメントは推論性能を高め、ノードの順序付けはタスクの成功に影響を及ぼし、長いテキストを処理する能力は必ずしもグラフの理解や推論を改善するとは限らないことである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:17:32 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [22.6] 本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。
このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:28:20 GMT)
Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support [22.4] 我々は、臨床専門知識とAI推論のギャップを埋める医療言語モデルであるCitrusを紹介する。
このモデルは、シミュレーションされた専門的疾患推論データの大規模なコーパスに基づいて訓練される。
我々は、独自の医療診断対話データセットを含む、最終段階のトレーニングデータをリリースする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:50:52 GMT)
PhenoProfiler: Advancing Phenotypic Learning for Image-based Drug Discovery [22.2] PhenoProfilerは、全スライディングのマルチチャネル画像を低次元の定量的表現に直接処理するエンドツーエンドのツールである。
大規模な公開データセットに対して厳格に評価されている。
PhenoProfilerは、最先端のメソッドを最大20%上回っている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:20:43 GMT)
AI-Instruments: Embodying Prompts as Instruments to Abstract & Reflect Graphical Interface Commands as General-Purpose Tools [22.0] チャットベースのプロンプトは線形逐次テキストに応答するので、曖昧な意図を探索し、洗練することは困難である。
AIインスツルメンツは,3つの重要な原則を通じて,インターフェースオブジェクトとして"prompts"を具現化している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:11:24 GMT)
Gradient Purification: Defense Against Poisoning Attack in Decentralized Federated Learning [22.0] GPDと呼ばれる勾配浄化防御は、既存のDFLアグリゲーションとシームレスに統合され、中毒攻撃から防御される。
モデルグラデーションの害を軽減することを目的としており、モデルの重み付けの利点を保ち、精度を高めることを目的としている。
様々な毒殺攻撃に対する正確性という点で、最先端の防御を著しく上回っている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:12:42 GMT)
Agent-centric Information Access [21.9] 大規模言語モデル(LLM)はより特殊化され、それぞれが独自のデータに基づいて訓練され、特定のドメインで優れたものとなる。
本稿ではエージェント中心の情報アクセスのためのフレームワークを紹介し,LLMは知識エージェントとして機能し,その知識に基づいて動的にランク付けされ,クエリされる。
本稿では,検索拡張生成とクラスタリング技術を活用して,数千の専門モデルの構築と評価を行うスケーラブルな評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:56:19 GMT)
PEToolLLM: Towards Personalized Tool Learning in Large Language Models [21.8] 我々は、パーソナライズされたツール利用に向けて、ユーザのインタラクション履歴を統合する、パーソナライズされたツール学習のタスクを定式化する。
PEToolBenchを構築し,3つの個別設定の下でインタラクション履歴に反映される多様なユーザの好みを特徴付ける。
LLMをパーソナライズしたツール学習タスクに適用するためのフレームワークPEToolLLaMAを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:43:08 GMT)
Project-and-Fuse: Improving RGB-D Semantic Segmentation via Graph Convolution Networks [21.7] テクスチャの特徴によって幾何的特徴注入を導出する後期融合スタイルの2つのモードから特徴を融合する。
3D特徴抽出の段階では,従来のCNNは深度マップでは十分ではない。
プロジェクション行列生成段階では、元のパイプラインにバイアス・アサインメントとアンビグラス・ローカリティの問題が存在することが分かる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:34:21 GMT)
AgentSociety Challenge: Designing LLM Agents for User Modeling and Recommendation on Web Platforms [21.5] AgentSociety Challengeは、Large Language Model (LLM)エージェントの可能性を探究することを目的とした、Web Conferenceにおける最初のコンペティションである。
チャレンジは世界中に295のチームが参加し、37日間にわたって合計1,400以上の応募を受けた。
本稿では,挑戦の詳細な設計について論じ,その結果を分析し,最も成功したLLMエージェントの設計を強調した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:10:25 GMT)
Investigating Generalization of One-shot LLM Steering Vectors [21.2] 本稿では,1つのトレーニング例に基づいて,勾配降下によるステアリングベクトルの最適化を提案する。
得られたベクトルは、複数のモデルにおける安全関連挙動を効果的に媒介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:13:01 GMT)
Small Language Models: Survey, Measurements, and Insights [21.2] SLM研究は、マシンインテリジェンスをより使いやすく、手頃な価格で、日々の作業に効率的にすることを目的としている。
我々は70の最先端のオープンソースSLMを調査し、アーキテクチャ、トレーニングデータセット、トレーニングアルゴリズムという3つの軸にわたる技術革新を分析します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:34:55 GMT)
SCA3D: Enhancing Cross-modal 3D Retrieval via 3D Shape and Caption Paired Data Augmentation [21.1] クロスモーダルな3D検索は,テキスト記述と3次元形状の相互マッチングを実現することを目的としている。
3Dデータの不足と高価さは、既存のクロスモーダルな3D検索手法の性能を制約する。
クロスモーダル3D検索のための新しい3D形状とキャプションオンラインデータ拡張手法であるSCA3Dを紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:36:40 GMT)
CoopDETR: A Unified Cooperative Perception Framework for 3D Detection via Object Query [21.0] CoopDETRは、オブジェクトクエリを介してオブジェクトレベルの特徴協調を導入する新しい協調認識フレームワークである。
本フレームワークは,オブジェクトクエリに生センサデータを効率的にエンコードする単一エージェントクエリ生成と,クロスエージェントクエリ融合という2つの重要なモジュールで構成されている。
OPV2VとV2XSetデータセットの実験により、CoopDETRは最先端の性能を達成し、送信コストを従来手法の1/782に大幅に削減した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:09:51 GMT)
Curie: Toward Rigorous and Automated Scientific Experimentation with AI Agents [21.0] 実験プロセスに厳密さを組み込むように設計されたAIフレームワークであるCurieを提案する。
Curieには信頼性を高めるためのエージェント内リガーモジュール、方法論的な制御を維持するためのエージェント間リガーモジュール、解釈性を高めるための実験知識モジュールが含まれている。
テストされた最強のベースラインと比較すると、実験的な質問に正しく答えることにおいて、3.4$times$改善が達成される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:33:28 GMT)
Sparse Brains are Also Adaptive Brains: Cognitive-Load-Aware Dynamic Activation for LLMs [20.7] CLADAは、統計的疎結合とセマンティック適応性を相乗化するフレームワークである。
textbf20%の平均スピードアップを2%の精度低下で達成し、Griffin(5%以上の劣化)とTT(無視可能なスピードアップ)を上回ります。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:11:16 GMT)
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment [20.4] Low-Rank Adaptation (LoRA)は、Large Language Models (LLM) のためのパラメータ効率の良い微調整を可能にする
現在の手法は静的特異値分解サブセットを初期化することでLoRAを最適化し、事前学習された知識を最適に活用する。
我々はLunderlineoRunderlineA Mixture-of-Experunderlinet (GOAT)を提案する。
GOATはSVD構造化MoEを用いて関連する事前情報を統合し、理論スケーリング係数を導出して最適化を完全微調整MoEと整合させる
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:02:48 GMT)
SolEval: Benchmarking Large Language Models for Repository-level Solidity Code Generation [20.4] SolEvalはSolidityスマートコントラクト生成のための最初のリポジトリレベルのベンチマークです。
既存のSolidityベンチマークとは異なり、SolEvalは複雑な関数呼び出しだけでなく、現実世界の複雑さも反映している。
その結果、最高の性能のLSMは26.29%のPass@10しか達成せず、改善の余地があることが示されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:58:31 GMT)
Breaking Down Power Barriers in On-Device Streaming ASR: Insights and Solutions [20.2] 重みパラメータが消費電力に与える影響は,起動頻度やメモリ割り当てなどの要因によって異なることがわかった。
本稿では,デバイス上での音声認識モデルを改善する設計原則を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:33:32 GMT)
EMPRA: Embedding Perturbation Rank Attack against Neural Ranking Models [20.1] 敵対的攻撃は、ユーザーをターゲットコンテンツに公開することを目的として、文書のランク付けを操作しようとする。
EMPRAは文レベルの埋め込みを操作し、クエリに関連する関連するコンテキストへと誘導する。
EMPRAは、オリジナルコンテンツとシームレスに統合し、人間には受け入れられない敵対的なテキストを生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:46:31 GMT)
A 106K Multi-Topic Multilingual Conversational User Dataset with Emoticons [20.1] エモティコンは感情や情報を伝える媒体として大きな注目を集めている。
我々は、匿名ユーザ識別子とともに、時間ベースのデータを含む包括的なリソースであるエモティコンデータセットを紹介した。
これまでで最大の公開エモティコンデータセットとして、22Kのユニークなユーザ、370Kのエモティコン、8.3Mメッセージがある。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:50:58 GMT)
General Reasoning Requires Learning to Reason from the Get-go [19.9] 大規模言語モデル(LLM)は、実世界の素晴らしいユーティリティを実証している。
しかし、適応的かつ堅牢に推論できる能力は、脆弱なままだ。
我々は3つの重要な方向から知識と推論を解き放つことを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:51:12 GMT)
Evaluation of Missing Data Imputation for Time Series Without Ground Truth [19.7] 本稿では, ワッセルシュタイン距離 (WD) とジェンセンシャノン偏差 (JSD) の2つの統計指標を紹介する。
WDとJSDは、特に地上の真理データが利用できないシナリオにおいて、欠落したデータ計算の品質を評価する効果的な指標である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:02:16 GMT)
Models That Are Interpretable But Not Transparent [19.6] FaithfulDefenseは、完全に忠実だが決定境界についてできる限り明らかにしていない論理モデルの説明を作成する。
この研究はFaithfulDefenseというアプローチを提供し、完全に忠実だが決定境界についてできる限り明らかにしていない論理モデルのモデル説明を作成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:05:49 GMT)
Self-rewarding correction for mathematical reasoning [19.5] 我々は,大規模言語モデル(LLM)の自己回帰的推論について研究する。
LLMは、ステップバイステップの推論を同時に生成し、外部からのフィードバックを伴わない推論時間における出力の正しさを評価する。
本稿では,自己生成データのみを用いて自己回帰推論モデルを構築するための2段階のアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:01:16 GMT)
Do Large Language Models Align with Core Mental Health Counseling Competencies? [19.4] 大規模言語モデル(LLM)は、メンタルヘルス専門家の世界的な不足に対する有望な解決策である。
NCMHCEベースの新しいベンチマークであるCounselingBenchを紹介する。
以上の結果から,コアメンタルヘルスカウンセリング能力と整合した,高度に調整されたモデルの必要性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:37:16 GMT)
Knowledge in Superposition: Unveiling the Failures of Lifelong Knowledge Editing for Large Language Models [19.4] 知識編集は、大規模な言語モデルにおいて、時代遅れまたは誤った知識を更新することを目的としている。
現在の知識編集手法は生涯編集のスケーラビリティに限界がある。
本研究は,生涯編集において知識編集が失敗する根本的な理由を考察する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:13:06 GMT)
FinMTEB: Finance Massive Text Embedding Benchmark [19.0] 金融分野向けに設計されたMTEBに特化して開発されたFinMTEB(FinMTEB)について紹介する。
FinMTEBは、7つのタスクにまたがる64の金融ドメイン固有の埋め込みデータセットで構成されている。
1)汎用ベンチマークのパフォーマンスは,金融ドメインタスクとの相関が限定されていること,(2)ドメイン適応モデルの方が汎用タスクより一貫して優れていること,(3)意外なことに,単純なBag-of-Wordsアプローチは,金融セマンティックテクスチャ類似タスクにおける高度に密着した埋め込みよりも優れていること,の3つの重要な結果を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:26:14 GMT)
Autoregressive Image Generation Guided by Chains of Thought [18.6] CoT(Chain-of-Thought)は、人間の推論と同様、コンテキストコヒーレンスと論理的一貫性をモデルが維持するのに役立つ。
本稿では,自己回帰画像生成を改善するために,思慮的推論を用いた自己回帰画像生成(IGTR)を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:15:13 GMT)
TAPO: Task-Referenced Adaptation for Prompt Optimization [18.5] 本稿では,3つの鍵モジュールからなるマルチタスク対応プロンプト最適化フレームワークTAPOを紹介する。
まず、タスク固有のプロンプト生成機能を強化するために、タスク対応メトリック選択モジュールを提案する。
次に,複数視点からのプロンプトを共同評価するマルチメトリック評価モジュールを提案する。
第3に、自動プロンプト改善のための進化ベースの最適化フレームワークが導入され、様々なタスクへの適応性が改善されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:36:55 GMT)
BatteryLife: A Comprehensive Dataset and Benchmark for Battery Life Prediction [18.4] バッテリライフ予測 (Battery Life Prediction, BLP) は、バッテリ劣化試験によって生成された時系列データに依存する。
目覚ましい進歩にもかかわらず、この研究領域は3つの重要な課題に直面している。
本稿では,BLPの包括的なデータセットとベンチマークであるBatteryLifeを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:21:20 GMT)
Model Adaptation: Unsupervised Domain Adaptation without Source Data [18.4] 本研究では、教師なしモデル適応の挑戦的な非教師なしドメイン適応設定について検討する。
本稿では,協調型クラス条件生成対向ネットと呼ばれる新しいフレームワークを提案する。
本モデルは,ラベルのないターゲットデータのみを用いて,複数の適応タスクにおいて優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:10:52 GMT)
Mixtraining: A Better Trade-Off Between Compute and Performance [18.4] MixTrainingは、複数のSSLおよびSLエポックを統合混合トレーニングフェーズ内でインターリーブする、新しいフレームワークである。
SSLとSLのシナジーを強化し、精度を改善し、共有ステップを統合して計算オーバーヘッドを削減する。
実験により、MixTrainingは従来のパイプラインに比べて優れた計算性能のトレードオフを提供することが示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:25:27 GMT)
BIGbench: A Unified Benchmark for Evaluating Multi-dimensional Social Biases in Text-to-Image Models [18.3] 画像生成のバイアスの統一ベンチマークであるBIGbenchを紹介する。
既存のベンチマークとは異なり、BIGbenchは4次元にわたるバイアスを分類し評価する。
BIGbenchを用いて8つの代表的T2Iモデルと3つのデバイアス法を評価する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:39:38 GMT)
Drop-Upcycling: Training Sparse Mixture of Experts with Partial Re-initialization [18.3] エキスパートの混合(MoE)アーキテクチャは、同等のキャパシティの密度の高いモデルと比較して、トレーニングと推論のコストを著しく削減します。
アップサイクリング(Upcycling)は、トレーニング済みの高密度モデルを使用してMoEモデルを初期化し、トレーニングするアプローチである。
ドロップアップサイクルは、事前訓練された高密度モデルの知識を活用しながら、重量の一部を統計的に再出発させるという、一見矛盾する2つのアプローチを組み合わせたものである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:06:36 GMT)
Less or More: Towards Glanceable Explanations for LLM Recommendations Using Ultra-Small Devices [18.2] 大規模言語モデル(LLM)は、パーソナルAIアシスタントとして日々の行動を推奨する大きな可能性を示している。
現在、パーソナルAIアシスタントは、画面スペースが限られているスマートウォッチのような超小型デバイスの上に置かれていることが多い。
LLMが生成した説明の冗長性は、このような超小型デバイスに一見可能な説明を提供することを困難にしている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:55:26 GMT)
MEDDxAgent: A Unified Modular Agent Framework for Explainable Automatic Differential Diagnosis [17.9] 鑑別診断(DDx)は、臨床的意思決定の基本的な側面であるが複雑な側面である。
大規模言語モデルの最近の進歩は、DDxをサポートすることを約束している。
対話型DDx用に設計されたModular Explainable DDx Agentフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:31:43 GMT)
High-fidelity Multiphysics Modelling for Rapid Predictions Using Physics-informed Parallel Neural Operator [17.9] 非線形および強く結合した偏微分方程式(PDE)によって支配される複雑な多物理系をモデル化することは、計算科学と工学の基盤となる。
本稿では、スケーラブルで教師なしの学習フレームワークであるPIPNO(Physical-informed parallel neural operator)を提案する。
PIPNOは、地球工学、物質科学、電磁気学、量子力学、流体力学など、様々な物理学における非線形作用素のマッピングを効率的に取得する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:29:41 GMT)
CS-Dialogue: A 104-Hour Dataset of Spontaneous Mandarin-English Code-Switching Dialogues for Speech Recognition [17.8] コードスイッチング(英: Code-switching)とは、1つの会話の中で2つ以上の言語を交換することである。
既存のマンダリン・イングリッシュのコードスイッチングデータセットは、サイズ、自発性、および書き起こしを伴うフル長の対話記録の欠如に悩まされることが多い。
CS-Dialogueは,200人の話者から104時間の自発的な会話を含む,大規模マンダリン・イングリッシュ・コードスイッチング音声データセットである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:59:55 GMT)
Mapping representations in Reinforcement Learning via Semantic Alignment for Zero-Shot Stitching [17.8] 深層強化学習モデルは、環境の観察やタスク要求に小さな変化があったとしても、一般化に失敗することが多い。
そこで本稿では,視覚的およびタスクのバリエーションを学習したエージェント間での潜伏空間間のマッピングをゼロショットで行う手法を提案する。
背景と作業が変化するCarRacing環境において,ゼロショット縫合性能を実証的に実証した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:06:00 GMT)
Meta-Task: A Method-Agnostic Framework for Learning to Regularize in Few-Shot Learning [17.7] Few-Shot Learningでは、小さな可変データセットでトレーニングされたモデルは、目に見えないタスクに一般化するのではなく、記憶する傾向がある。
ラベル付きデータとラベルなしデータの両方を活用するメソッドに依存しないフレームワークであるMeta-Taskを導入し、正規化のための補助タスクを通じて一般化を強化する。
我々は,Mini-ImageNet,Tiered-ImageNet,FC100など,標準ベンチマークにおけるMeta-Taskの有効性を検証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:07:40 GMT)
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data [17.5] 安全でないLMを生成するために無害なデータを使用する既存の攻撃は、応答の最初の数個のトークンでモデル拒絶を除去することに依存していることを示す。
我々は、LMの定式的拒絶機構を利用して有害な応答を誘発する新たなデータ汚染攻撃、No, course, I Can Execute' (NOICE)について述べる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:20:01 GMT)
Exact quantum critical states with a superconducting quantum processor [17.4] アンダーソン局在化物理学は、拡張、局所化、臨界という3つの基本的な固有状態のタイプを特徴としている。
ここでは、正確な量子臨界状態に対する厳密なメカニズムによって支配される臨界状態の曖昧な実験的実現について報告する。
また、ホッピング結合における準周期零点が臨界状態を保護するという一般化されたメカニズムも観察する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:47:38 GMT)
Two Heads Are Better Than One: Dual-Model Verbal Reflection at Inference-Time [17.3] 大規模言語モデル(LLM)は複雑な推論シナリオに悩まされることが多い。
LLM生成反射の精度と深さを向上するコントラスト反射合成パイプラインを導入する。
本稿では,言語強化学習パラダイムにおける2モデル推論フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:41:41 GMT)
WOFOSTGym: A Crop Simulator for Learning Annual and Perennial Crop Management Strategies [17.3] WOFOSTGymは、強化学習(RL)エージェントを訓練して農業決定を最適化するために設計された作物シミュレーション環境である。
我々のシミュレーターは、23の年中作物と2つの年中作物をサポートし、RLエージェントが複数年・複数年・マルチファーム設定で多様な農業経営戦略を学べるようにしている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:07:11 GMT)
The Last JITAI? Exploring Large Language Models for Issuing Just-in-Time Adaptive Interventions: Fostering Physical Activity in a Conceptual Cardiac Rehabilitation Setting [17.1] デジタルヘルスにおけるジャスト・イン・タイム・アダプティブ・インターベンション(JITAI)の内容のトリガーおよびパーソナライズにLarge Language Models (LLMs) を用いることの有効性を検討した。
GPT-4生成JITAIは人為的な介入提案を上回っ、すべての指標でLayPsとHCPsを上回った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:57:38 GMT)
Beyond Linear Approximations: A Novel Pruning Approach for Attention Matrix [17.1] 大きな言語モデル(LLM)は、私たちの日常生活の様々な側面を強化する大きな可能性を示しています。
彼らの成長する能力は、非常に大きなモデルサイズを犠牲にし、エッジデバイスへのデプロイメントを困難にしている。
本稿では,注目行列の近似を直接最適化する LLM 重み付け手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:44:29 GMT)
Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator [16.9] 単眼深度推定(MDE)は、1枚のRGB画像からシーン深度を予測することを目的としており、3Dシーン理解において重要な役割を果たす。
ゼロショットMDEの最近の進歩は、様々な場面における一般化を改善するために、正規化深度表現と蒸留に基づく学習を活用している。
擬似ラベル品質を高めるために,グローバルおよびローカルな深度手がかりを統合したクロスコンテキスト蒸留を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:10:05 GMT)
Adaptive Activation Steering: A Tuning-Free LLM Truthfulness Improvement Method for Diverse Hallucinations Categories [16.7] 本稿では、推論中に「真理」の方向にアクティベーションをシフトさせる調整不要な手法であるアダプティブアクティベーションステアリング(ACT)を紹介する。
ACTは、多種多様な真性に関連する操舵ベクトルを利用し、操舵強度を適応的に調整することで、幻覚の様々なカテゴリに対処する。
大規模モデル(13B, 33B, 65B)におけるACTのスケーラビリティを検証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:07:05 GMT)
Detection Augmented Bandit Procedures for Piecewise Stationary MABs: A Modular Approach [16.6] Multi-Armed Bandit (MAB) アルゴリズムは、アームに関連する報酬分布が時間とともに変化しない静止環境向けに設計されている。
しかし、多くのアプリケーションでは、環境は非定常であるとより正確にモデル化されている。
本研究では,腕のサブセットに付随する報酬分布が変化する部分的定常MAB(PS-MAB)環境について検討した。
私たちのゴールは、CDベースのBandit(CDB)プロシージャの設計と分析をモジュール化することです。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:35:40 GMT)
Towards an AI Accountability Policy [16.6] リスクの高い技術が国家レベルでどのように規制されているかを検討する。
本稿では,商用AIシステムにおける説明可能性とベンチマーク要件の連携システムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:17:19 GMT)
LongEval: A Comprehensive Analysis of Long-Text Generation Through a Plan-based Paradigm [16.6] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な成功を収めた。
解析の結果,LLMは長文生成における長文要求や情報密度に悩まされていることが明らかとなった。
提案するLongEvalは,直接および計画に基づく生成パラダイムを用いて,長文生成を評価するベンチマークである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:46:36 GMT)
Combining Planning and Reinforcement Learning for Solving Relational Multiagent Domains [16.6] MARL(Multiagent Reinforcement Learning)は、状態空間と行動空間の指数的成長によって大きな課題を提起する。
本稿では,効率的な状態抽象化と強化学習を備えた集中型コントローラとしてリレーショナルプランナを統合することを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:55:23 GMT)
Enhancing Android Malware Detection: The Influence of ChatGPT on Decision-centric Task [16.4] 非決定モデルChatGPTのAndroidマルウェア検出における従来の意思決定中心タスクへの影響について検討する。
Drebin、XMAL、MaMaDroidの3つの最先端ソリューションを選択し、公開データセットに関する一連の実験を行い、包括的な比較と分析を行う。
非決定モデルとしてのChatGPTは、包括的な分析レポートの提供に優れ、解釈可能性を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:48:42 GMT)
A Survey on Foundation-Model-Based Industrial Defect Detection [16.3] 我々は,基礎モデル手法の比較と議論を行い,体系的な調査を行う。
我々は最近発表された非境界モデル (NFM) の手法を概観した。
FM法は,実際の産業アプリケーションシナリオに則った,少数ショット学習やゼロショット学習に適している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:49:27 GMT)
ELICIT: LLM Augmentation via External In-Context Capability [16.2] algは2つのモジュールからなるフレームワークで、タスクベクトルを効果的に保存し再利用する。
algは、モデル機能の適応的な適用を可能にするプラグイン・アンド・プレイパフォーマンス・ブースターとして機能する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:41:43 GMT)
Where Are We? Evaluating LLM Performance on African Languages [16.2] アフリカにおける豊かな言語遺産は、NLPでは残っていない。
本稿では,アフリカにおける言語景観に関する理論的知見と,サハラ語を用いた経験的評価を統合する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:49:54 GMT)
Expert-Token Resonance MoE: Bidirectional Routing with Efficiency Affinity-Driven Active Selection [16.1] Mixture-of-Experts (MoE)アーキテクチャは、大規模言語モデル(LLM)のパラダイムシフトアプローチとして登場した。
本稿では,(1)軽量計算を用いた効率的なルーティング機構,(2)エキスパートとトークンの共振を利用した適応的双方向選択機構,(3)動的トークン分布解析に基づくエキスパートキャパシティの下位境界を決定するモジュールを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:28:51 GMT)
Partition Tree Weighting for Non-Stationary Stochastic Bandits [16.0] 本稿では、インタラクションデータ、すなわち観測とインターリーブされたアクションを持つデータストリームに対するユニバーサルソースコーディングの一般化について考察する。
我々のゴールは、普遍的かつ汎用的に制御ポリシとして使用できる符号化分布を構築することです。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:16:33 GMT)
Properties of fairness measures in the context of varying class imbalance and protected group ratios [15.9] クラス変更のための公正度尺度の一般的な性質と保護群比率について検討する。
また,クラス不均衡比の変化に対して,完全公平性を達成する確率がどう変化するかを測定した。
以上の結果から, 正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の偏差は, 等級不均衡の変化に敏感であることが示唆された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:51:23 GMT)
The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation [15.9] 本稿では,非常に小さなデータセット上で事前学習した大規模言語モデルに過度に適合する反直感的な一般化結果を紹介する。
これらのモデルをさらに微調整して、少数のサンプルに対してほぼゼロに近いトレーニング損失を達成することによって、長いシーケンス生成能力が大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:51:31 GMT)
Program Synthesis Dialog Agents for Interactive Decision-Making [15.8] 本研究では,インタラクティブな意思決定を通じて,社会的利益の機会に対するユーザの適性を決定するための新しいベンチマークであるBeNYfitsを提案する。
実験の結果, GPT-4o は ReAct-style chain-of- Thought を用いて35.7 F1 しか得点できなかった。
我々のエージェントであるProADAは、ほぼ同じ数のダイアログターンを維持しながら、F1スコアを55.6に改善します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:53:01 GMT)
Online Pseudo-average Shifting Attention(PASA) for Robust Low-precision LLM Inference: Algorithms and Numerical Analysis [15.7] 我々は、Flash Attentionに基づくPASAと呼ばれる低精度で数学的に等価なアルゴリズムを開発した。
PASAは、オンライン擬似平均シフトとグローバルリカバリの2つの新しいテクニックを紹介している。
注意入力データの大きなバイアスと振幅が,数値オーバーフローに寄与する重要な要因であることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:00:46 GMT)
RadarDistill: Boosting Radar-based Object Detection Performance via Knowledge Distillation from LiDAR Features [15.7] RadarDistillは、LiDARデータを利用してレーダデータの表現を改善する知識蒸留(KD)手法である。
RadarDistillは、3つのキーコンポーネントを使用してLiDAR特徴の望ましい特徴をレーダー特徴に伝達することに成功した。
nuScenesデータセットの比較分析により、RadarDistillは、レーダのみのオブジェクト検出タスクに対して、最先端(SOTA)性能を達成することを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:41:29 GMT)
AI Governance InternationaL Evaluation Index (AGILE Index) [15.6] 人工知能(AI)技術の急速な進歩は、人間の社会を大きく変えつつある。
2022年以降、生成的AIの広範な展開、特に大きな言語モデルが、AIガバナンスの新たなフェーズとなった。
国際ガバナンスに関するコンセンサスが確立され、活動を続ける中、AIガバナンスのグローバルな評価を行う上での実践的重要性が徐々に明らかになってきている。
AGILE Indexの最初の評価は、AIの開発レベル、AIガバナンス環境、AIガバナンス機器、AIガバナンスの有効性の4つの基本柱の探索から始まった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:07:48 GMT)
Do Large Language Models Know How Much They Know? [15.6] 大規模言語モデル (LLM) は高機能なシステムとして登場した。
インテリジェントシステムの望ましい属性は、自身の知識の範囲を認識する能力である。
このベンチマークは、モデルが過度の、不十分な、あるいは正確な量の情報をリコールするかどうかを評価する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:33:06 GMT)
Round and Round We Go! What makes Rotary Positional Encodings useful? [15.5] メカニカルレベルでの RoPE の使用方法を理解するため, トレーニングされた Gemma 7B モデルの内部構造について検討した。
Gemma は,RoPE を用いて高周波数を利用してロバストな「位置的」アテンションパターンを構築することを学ぶ。
強調された問題を修正し、性能を向上するRoPEの修正を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:03:04 GMT)
Quantum computation via Floquet-tailored Rydberg interactions [15.5] Floquet frequency modulation (FFM) は、Rydberg-atomシステムにおいて、正確な量子制御を実現するためのユニークなプラットフォームを提供する。
本研究では,FFMを用いたシステムダイナミクスの操作により,Rydberg原子の任意の位相ゲートの制御を実現する手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:15:49 GMT)
Sherlock: Towards Multi-scene Video Abnormal Event Extraction and Localization via a Global-local Spatial-sensitive LLM [15.5] チャットパラダイムのtextbfMulti-scene Video Abnormal Event extract and Localization (M-VAE) タスクを提案する。
M-VAEタスクは、異常な事象(主題、イベントタイプ、オブジェクト、シーン)を抽出し、そのような事象をローカライズすることを目的としている。
本稿では,Sherlock Holmes(シャーロック・ホームズ)に代表されるグローバルローカルな空間感応型大規模言語モデル(LLM)を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:16:37 GMT)
TimeKAN: KAN-based Frequency Decomposition Learning Architecture for Long-term Time Series Forecasting [15.3] 複数の周波数混在に起因する複雑な予測問題に対処するために,kan-based Frequency Decomposition Learning Architecture (TimeKAN)を提案する。
TimeKANは主に、カスケード周波数分解(CFD)ブロック、M-KAN(Multi-order Kan Representation Learning)ブロック、周波数混合ブロックの3つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:04:40 GMT)
InternVQA: Advancing Compressed Video QualityAssessment with Distilling Large Foundation Model [15.3] InternVideo2は、その大きなパラメータサイズと大規模なマルチモーダルデータにより、ビデオ理解タスクに強い可能性を示している。
本課題に適した軽量なモデルの設計を目的として, 圧縮品質の豊富なモデルに適合する蒸留法を提案した。
その結果,InternVideo2から抽出した軽量モデルは,他の方法と比較して圧縮ビデオ品質評価において優れた性能を示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:34:14 GMT)
LGL-BCI: A Motor-Imagery-Based Brain-Computer Interface with Geometric Learning [14.9] 我々はLGL-BCI(Lightweight Geometric Learning Brain-Computer Interface)と呼ばれるプロトタイプを開発する。
LGL-BCIは、我々のカスタマイズした幾何学的深層学習アーキテクチャを用いて、精度を犠牲にすることなく高速なモデル推論を行う。
実世界の2つの脳波デバイスと2つのパブリック脳波データセットを用いて,本ソリューションの性能を評価した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:16:11 GMT)
PCL: Prompt-based Continual Learning for User Modeling in Recommender Systems [14.9] 本稿では,各タスクの外部メモリとして位置対応プロンプトを利用する,ユーザモデリングのためのPromptベースの連続学習フレームワークを提案する。
我々は,PCLの有効性を示すために,実世界のデータセットに関する広範な実験を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:47:33 GMT)
Interpreting Language Reward Models via Contrastive Explanations [14.6] リワードモデル(RM)は、大きな言語モデル(LLM)出力と人間の値のアライメントにおいて重要な要素である。
本稿では,RM によるバイナリ応答比較について,対照的な説明を用いて説明することを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:46:25 GMT)
MCLRL: A Multi-Domain Contrastive Learning with Reinforcement Learning Framework for Few-Shot Modulation Recognition [14.5] 少ないショット学習は、限られた数のラベル付きサンプルで、モデルが満足できるパフォーマンスを達成できるようにすることで、効果的なソリューションを提供する。
本研究は,新たなFSL固有信号モデルを提案するのではなく,MCLRLというフレームワークを提案する。
このフレームワークは、マルチドメインのコントラスト学習と強化学習を組み合わせたものである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:53:31 GMT)
A Sliding Layer Merging Method for Efficient Depth-Wise Pruning in LLMs [14.5] 本稿では,再現カーネルHilbert空間内の異なるレイヤの出力の相関関係を解析することにより,大規模言語モデルにおけるレイヤ間の"パッチライクな"特徴関係を明らかにする。
本研究では, 連続層を上から下へ動的に選択・融合するスライディング層マージ法について, 予め定義された類似度閾値に従って提案する。
提案手法は,ゼロショット推論性能と再学習後の回復品質の両方において,既存のプルーニング技術より優れる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:15:24 GMT)
SLAM in the Dark: Self-Supervised Learning of Pose, Depth and Loop-Closure from Thermal Images [14.3] 複雑な照明条件下での非正規な深層学習に基づく単分子熱SLAMシステムであるDarkSLAMを提案する。
提案手法は,視覚計測におけるECA(Efficient Channel Attention)機構と深度推定におけるSKA(Selective Kernel Attention)機構を取り入れたものである。
夜間の挑戦的な環境においても、正確な位置決めと3D高密度マッピングを提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:34:23 GMT)
Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management [14.3] 非漸近収束解析により,LMvinvinをベースとした勾配局所最小値が得られた。
LMvinvinアルゴリズムは,非漸近収束解析による大域最小解法であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:13:08 GMT)
ColaCare: Enhancing Electronic Health Record Modeling through Large Language Model-Driven Multi-Agent Collaboration [14.2] ColaCareは、大規模言語モデル(LLM)によって駆動されるマルチエージェントコラボレーションを通じて電子健康記録(EHR)モデリングを強化するフレームワークである。
我々のアプローチは、構造化されたEHRデータとテキストベースの推論の間のギャップを埋めるために、ドメイン固有のエキスパートモデルとLLMをシームレスに統合する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:51:56 GMT)
Task Graph Maximum Likelihood Estimation for Procedural Activity Understanding in Egocentric Videos [14.0] 手続き的活動からタスクグラフを学習するための勾配に基づくアプローチ
我々は,CaptainCook4D,EgoPER,EgoProceLに対するアプローチを検証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:45:01 GMT)
When Large Language Models Meet Speech: A Survey on Integration Approaches [13.8] 大規模言語モデル(LLM)の最近の進歩は、テキストベースのタスクを超えてアプリケーションを拡張することへの関心を喚起している。
本稿では,LLMと音声の統合について検討し,方法論を3つの主要なアプローチに分類する。
これらの手法が様々な音声関連アプリケーションにどのように適用されているかを示し、インスピレーションを与えるためにこの分野の課題を強調した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:40:49 GMT)
A Causal Lens for Evaluating Faithfulness Metrics [13.8] 本稿では,自然言語説明のための忠実度指標を評価するためのフレームワークである因果診断について述べる。
我々のフレームワークは因果診断の概念を採用し、モデル編集手法を用いて忠実で不誠実な説明ペアを生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:35:53 GMT)
African Data Ethics: A Discursive Framework for Black Decolonial Data Science [13.6] 本稿では,アフリカ奨学金の学際的コーパスによって通知されるアフリカにおけるデータ倫理の枠組みについて述べる。
我々の枠組みは、アフリカを反黒人主義とアルゴリズム的植民地主義に挑戦するための重要な場所として強調している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:30:56 GMT)
Winning Big with Small Models: Knowledge Distillation vs. Self-Training for Reducing Hallucination in QA Agents [13.6] 本稿では,QAパイプラインを提案し,人間の入力と自動化のバランスをとる方法について検討する。
本研究では,Large Language Models (LLMs) が生成する合成データが,クラウドソーシングデータより優れていることを示す。
また、"I don't know"応答をコンテキスト化して、解決不可能な質問や検索失敗に対する堅牢性も向上する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:34:58 GMT)
Modality Interactive Mixture-of-Experts for Fake News Detection [13.5] フェイクニュース検出のためのModality Interactive Mixture-of-Experts(MIMoE-FND)を提案する。
MIMoE-FNDは、マルチモーダルフェイクニュース検出を強化するために設計された、新しい階層型Mixture-of-Expertsフレームワークである。
2つの言語にまたがる3つの実世界のベンチマークに対する我々のアプローチを評価し、最先端の手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:20:53 GMT)
Automatic Prompt Optimization via Heuristic Search: A Survey [13.3] 大規模言語モデルは、様々な自然言語処理タスクにおいて顕著な成果をもたらしています。
手動の手法は効果的であるが、通常は直感に頼り、時間とともに自動的にプロンプトを洗練しない。
検索アルゴリズムを用いた自動プロンプト最適化は、人間の監視を最小限に抑えて、システマティックにプロンプトを探索し改善することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:42:08 GMT)
LORENZA: Enhancing Generalization in Low-Rank Gradient LLM Training via Efficient Zeroth-Order Adaptive SAM [13.2] 大規模言語モデル(LLM)のためのロバストパラメータ効率細調整法(PEFT)について検討する。
我々はAdam と Sharpness-Aware Minimization (SAM) を組み合わせた AdaZo-SAM という,計算効率のよい新しいフレームワークを提案する。
また,AdaZo-SAMのメモリ効率向上版であるLORENZAという低ランク勾配最適化手法を設計した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:30:34 GMT)
Policy Testing with MDPFuzz (Replicability Study) [13.1] 本論文の重要な発見のいくつかを検証し,再現と複製によるMDPFuzzの限界について検討する。
以上の結果から,MDPFuzz より優れていることが判明し,提案したカバレッジモデルが欠点の発見に繋がらないという結論が得られた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:11:52 GMT)
OASIS Uncovers: High-Quality T2I Models, Same Old Stereotypes [12.9] テキスト・トゥ・イメージ(T2I)モデルによって生成された画像は、しばしば文化や職業といった概念の視覚的バイアスやステレオタイプを示す。
本稿では,その社会学的定義に沿ったステレオタイプを定量的に測定する。
OASISには、生成された画像データセットからステレオタイプを測定するための2つのスコアが含まれている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:04:37 GMT)
Stronger Models are NOT Stronger Teachers for Instruction Tuning [12.9] より大きくより強いモデルが必ずしもより小さなモデルの教師であるとは限らないことを示す。
そこで我々は、応答生成器の有効性を測定するための新しいメトリクス、Compatibility-Adjusted Reward (CAR) を開発した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:10:05 GMT)
MultiConAD: A Unified Multilingual Conversational Dataset for Early Alzheimer's Detection [12.8] 我々は16の認知症関連会話データセットを統合することでAD検出のための新しい多言語データセットを提案する。
第2に、MCIを含む細粒度分類を行い、スパーステキストと高密度テキスト表現を用いて様々な分類器を評価する。
第三に、単言語と多言語の設定で実験を行い、ある言語は多言語訓練の恩恵を受ける一方、他の言語は独立してより優れた性能を発揮することを発見した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:12:37 GMT)
Dictionary-based Framework for Interpretable and Consistent Object Parsing [12.7] CoCalは、辞書ベースのマスク変換器に基づく解釈可能で一貫したオブジェクト解析フレームワークである。
CoCalは、セグメンテーションで使用される既存のクラスタベースのマスクトランスフォーマーアーキテクチャを再考する。
CoCalはPartImageNetとPascal-Part-108の両方で、最先端のパフォーマンスを確立している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:28:47 GMT)
Meta Prompting for AI Systems [12.3] 本稿では,大規模言語モデルとAIシステムの活用を促進すべく,メタ・プロンプティング(MP)を紹介した。
MPは、従来のコンテンツ中心の手法よりも構造的および構文的考察を優先する。
経験的評価では、メタプロンプトを伴わないQwen-72Bベース言語モデルでは、PASS@1の精度は46.3%である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:39:39 GMT)
ImageChain: Advancing Sequential Image-to-Text Reasoning in Multimodal Large Language Models [12.3] ImageChainは、画像データに対するシーケンシャルな推論機能を備えたMLLMを強化するフレームワークである。
提案手法は,次の場面における記述課題の性能向上に寄与する。
ImageChainは、コミックからロボティクスまで幅広いアプリケーションにおいて、堅牢なゼロショット・アウト・オブ・ドメインのパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:55:06 GMT)
Towards More Trustworthy Deep Code Models by Enabling Out-of-Distribution Detection [12.1] コードに対する非教師付きOOD検出と弱教師付きOOD検出の2種類のSE固有OOD検出モデルを開発した。
提案手法は, 4つのシナリオからOODサンプルを同時に検出する上で, ベースラインを著しく上回り, コード理解タスクに肯定的な影響を与えている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:59:53 GMT)
Low-Rank and Sparse Model Merging for Multi-Lingual Speech Recognition and Translation [12.1] 異なる言語やタスクでトレーニングされたモデルを効率的に統合するテクニックであるLoRS-Mergingを紹介する。
LoRS-Mergingは、従来のマルチタスクトレーニングベースラインと比較して、単語エラー率を10%削減し、BLEUスコアを4%改善する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:45:56 GMT)
Global Graph Propagation with Hierarchical Information Transfer for Incomplete Contrastive Multi-view Clustering [12.1] 階層的な情報伝達を伴う新しい不完全なマルチビュークラスタリング手法を提案する。
提案手法は,ビュー固有表現学習,グローバルグラフ伝播,階層的情報伝達,共同最適化のためのコントラストクラスタリングを組み合わせた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:50:08 GMT)
Bayesian Optimization by Kernel Regression and Density-based Exploration [12.1] 本稿では,カーネル回帰と密度に基づく探索(BOKE)アルゴリズムによるベイズ最適化を提案する。
BOKEは、効率的な関数近似、探索のためのカーネル密度にカーネル回帰を使用し、それらを信頼境界基準に統合して最適化プロセスの導出を行う。
我々は,BOKEがガウスのプロセスベース手法と競合するだけでなく,計算効率も優れていることを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:49:57 GMT)
Non-Homophilic Graph Pre-Training and Prompt Learning [12.0] 本稿では,好ましくないグラフに対する事前学習と迅速な学習の枠組みであるProNoGを提案する。
まず、既存のグラフ事前学習手法を分析し、事前学習タスクの選択に関する理論的知見を提供する。
第2に,各ノードが特異な非ホモフィル性を示すことを認識し,下流タスクにおけるノード固有のパターンを特徴付ける条件付きネットワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:58:51 GMT)
GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling [11.9] ガウススプラッティングは、ビュー合成とシーン再構成に優れた性能を示した。
各ガウス原始体は外観と幾何学の両方を符号化しているので、外見モデリングには多数のガウス原始体が必要である。
我々は,1つのガウス語でさえ外観の詳細を捉えられるように,パープリミティブな表現を採用することを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:30:40 GMT)
ByteQC: GPU-Accelerated Quantum Chemistry Package for Large-Scale Systems [11.9] ByteQCは、大規模量子化学シミュレーションのための完全機能的で効率的なパッケージである。
スタンドアロンのアルゴリズムでは、ベンチマーク結果は100コアのCPUと比較して60$times$のスピードアップとなる。
先進的な量子埋め込みの特徴として、2つの代表的な例が示されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:00:39 GMT)
Is Hyper-Parameter Optimization Different for Software Analytics? [11.9] SEデータはクラス間の"smoother"境界を持つことができる。
SMOOTHIEはより高速に動作し、SEデータでより良い予測を行う。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:59:33 GMT)
MaskPlanner: Learning-Based Object-Centric Motion Generation from 3D Point Clouds [11.7] オブジェクト中心運動生成(OCMG)は、様々な産業応用において重要な役割を果たしている。
本研究では,局所経路を予測する学習手法であるMaskPlannerを提案する。
本研究は,工学的オーバーヘッドを低減し,いくつかの産業的ユースケースにシームレスに対応するためのOCMGの学習手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:39:25 GMT)
Research on Edge Computing and Cloud Collaborative Resource Scheduling Optimization Based on Deep Reinforcement Learning [11.7] 本研究では,深部強化学習(DRL)を用いたエッジクラウド協調コンピューティングにおける資源スケジューリング最適化の課題に対処する。
DRLに基づく提案手法は,タスク処理効率の向上,全体の処理時間削減,資源利用の向上,タスクマイグレーションの効果的制御を実現する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:05:11 GMT)
ClassInvGen: Class Invariant Synthesis using Large Language Models [11.4] ClassInvGenは実行可能なクラス不変量とテスト入力を共同生成するメソッドである。
ClassInvGenは、(コードから)仕様を生成するために純粋なLCMベースの技術より優れていることを示す。
また、広く使われている高積分C++内のいくつかのクラスについてケーススタディを行い、実世界のコードに適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:10:57 GMT)
Strategic Classification With Externalities [11.4] 戦略分類問題の新しい変種を提案する。
実世界のアプリケーションによって動機づけられた我々のモデルは、あるエージェントの操作が他のエージェントに影響を与えることを決定的に許している。
特定の仮定の下では、このエージェント操作ゲームの純粋なナッシュ平衡はユニークであり、効率的に計算できることが示される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:58:22 GMT)
Entanglement-induced exponential advantage in amplitude estimation via state matrixization [11.3] 量子振幅の推定(または2つの量子状態間の重なり合い)は、量子コンピューティングの基本的な課題である。
本稿では,純粋状態から行列形式への変換による量子振幅推定のための新しいアルゴリズムフレームワークを提案する。
我々は,チャネルブロック符号化と呼ばれる手法を用いて,新しい行列化フレームワーク内で振幅推定アルゴリズムを再構成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:10:53 GMT)
CABS: Conflict-Aware and Balanced Sparsification for Enhancing Model Merging [11.2] タスクベクトルに基づくモデルマージは、複数のタスク固有のモデルを再トレーニングせずにマルチタスクモデルに統合する効率的な方法を提供する。
最近の研究は、モデルのマージによって直面する重要な課題の1つであるタスクベクトル間の衝突に、スパーシフィケーションを通じて対処するために努力されている。
CABS(Conflict-Aware and Balanced Sparsification)を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:38:55 GMT)
CHAI for LLMs: Improving Code-Mixed Translation in Large Language Models through Reinforcement Learning with AI Feedback [11.2] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる顕著な機能を示しているが、コード混在(またはコード切替)言語理解に苦慮している。
本稿では,多言語LLMのコード混合言語処理能力を向上させるための新しいフレームワークであるCHAIを提案する。
解析の結果,CHAI を用いた LLM は,コード混在翻訳タスクにおいて,最先端のオープンソース LLM よりも25.66% 向上していることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:11:35 GMT)
Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks [11.2] 分散型コントローラは、群れの凝集を維持するのに苦労する。
グラフニューラルネットワーク(GNN)アーキテクチャは、分散コントローラを開発するのに欠かせない機械学習ツールとして登場した。
我々の対称性認識コントローラは既存のGNNコントローラよりも一般化されていることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:51:46 GMT)
Enhancing the Scalability and Applicability of Kohn-Sham Hamiltonians for Molecular Systems [11.1] 我々は、物理精度で密度汎関数理論計算のためのスケーラブルなモデルを作成する。
その結果, 総エネルギー予測誤差を1347倍, SCF計算速度を18%削減できることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:36:25 GMT)
Deciphering the complaint aspects: Towards an aspect-based complaint identification model with video complaint dataset in finance [11.0] 我々は,433件の公開インスタンスからなる,プロプライエタリなマルチモーダルビデオ苦情データセットをキュレートした。
それぞれのインスタンスは、発話レベルに細心の注意を払ってアノテートされ、財務面の5つの異なるカテゴリと関連する苦情ラベルを含んでいる。
Solution 3.0は、マルチモーダル特徴(オーディオとビデオ)の扱い、2)マルチラベルのアスペクト分類、3)アスペクト分類と苦情識別を並行して行う3つの重要なタスクを実行するように調整されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:56:07 GMT)
Ground-level Viewpoint Vision-and-Language Navigation in Continuous Environments [11.0] VLN(Vision-and-Language Navigation)エージェントは、時系列の視覚観察とそれに対応する指示を関連付け、意思決定を行う。
本稿では,人間中心の指示と低地視野の四足歩行ロボットとのミスマッチに対処する。
この問題を軽減するために,地上レベルの視点ナビゲーション(GVNav)手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:30:40 GMT)
Scaffold-SLAM: Structured 3D Gaussians for Simultaneous Localization and Photorealistic Mapping [10.9] モノクロ,ステレオ,RGB-Dカメラ間の同時ローカライズと高品質な光リアルマッピングを実現するScaffold-SLAMを提案する。
まず,3次元ガウスアンによる様々なカメラポーズにおける画像の外観変化のモデル化を可能にする。
第二に、ガウス分布を導くために周波数正規化ピラミッドを導入し、モデルがシーンの細部を効果的に捉えることを可能にする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:34:39 GMT)
Threshold Filtering Packing for Supervised Fine-Tuning: Training Related Samples within Packs [10.9] 私たちはThreshold Packingを紹介します。Threshold Packingは、同じパック内で十分な多様性を維持しながら、関連するコンテキストでサンプルを選択する方法です。
実験の結果,Threshold PackingはGSM8Kで最大7%,HumanEvalデータセットで最大4%向上した。
バイアスベンチマークの結果は、公正性向上におけるSupervised Fine-Tuningの有望なパフォーマンスを強調し、予測精度を15%向上させた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:16:14 GMT)
TRIX: A More Expressive Model for Zero-shot Domain Transfer in Knowledge Graphs [10.6] 完全な帰納的知識グラフモデルを複数のドメインでトレーニングし、新しい未知のドメインでゼロショット知識グラフ補完(KGC)を実行することができる。
TRIXと呼ばれる表現的かつ有能な完全帰納モデルを導入する。
TRIXは、ゼロショットエンティティにおける最先端の完全帰納モデルと、新しいドメインにおける関係予測より優れていることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:23:49 GMT)
Norm Growth and Stability Challenges in Localized Sequential Knowledge Editing [10.6] 本研究では,大規模言語モデル(LLM)における局所化更新の影響について検討する。
まず、異なるトレーニング後の介入に対して、更新された行列のフロベニウスノルムが常に増加することを示す。
我々は、微調整、ハイパーネットワークベースのアプローチ、ロケーション・アンド・エジット手法など、様々な編集技術にまたがる一貫した現象を明らかにする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:58:30 GMT)
Unveiling Wireless Users' Locations via Modulation Classification-based Passive Attack [10.4] この研究は、そのような無線標準のゆるい一端を特定する。
盗聴者が視線無線ユーザをローカライズできる新しい受動的攻撃方法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:32:38 GMT)
Time Traveling to Defend Against Adversarial Example Attacks in Image Classification [10.4] 敵の例による攻撃は、機械学習にとって重要な脅威として浮上している。
画像分類における敵対的攻撃は、画像分類ニューラルネットワークを混乱させる画像への様々な小さな修正を悪用する。
この研究は「タイムトラベル」の概念を導入し、誰にでもアクセス可能な歴史的ストリートビュー画像を用いて、同じ標識の異なる過去のバージョンで推論を行う。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:16:53 GMT)
Fall Leaf Adversarial Attack on Traffic Sign Classification [10.4] 適応入力画像摂動攻撃は、機械学習アルゴリズムに対する重大な脅威として浮上している。
この研究は、自然の人工物を利用する新たな種類の敵攻撃を提示する。
道路標識に貼られた落ち葉は、悪意のある人間の攻撃者によって置かれるのではなく、近くの木から来る可能性がある。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:12:19 GMT)
Adversarial Universal Stickers: Universal Perturbation Attacks on Traffic Sign using Stickers [10.4] この研究は、単純な黒と白のステッカーのように見える普遍的な摂動を生成する新しい方法を紹介している。
従来の敵の摂動とは異なり、敵の普遍ステッカーはあらゆる道路標識に適用できるように設計されている。
仮想環境での実験は、これらのステッカーが道路標識認識で一般的に使用されるディープラーニングモデルを一貫して誤解させることを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:39:53 GMT)
Consensus Under Adversary Majority Done Right [10.3] 投機は、反対多数派の投機であるコンセンサスプロトコルを悩ませている。
4次元にわたるコンセンサスのためのモデルを体系化する。
文献に残るギャップを、新しいプロトコルと不可能な定理で埋める。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:22:11 GMT)
Correspondence-Free Pose Estimation with Patterns: A Unified Approach for Multi-Dimensional Vision [10.3] 新たな対応のないポーズ推定法とその実用的なアルゴリズムを提案する。
考慮された点集合をパターンとすることで、これらのパターンを記述するために使われる特徴関数を導入し、最適化に十分な数の方程式を確立する。
提案手法は視点投影などの非線形変換に適用可能であり,3次元から3次元,3次元から2次元,2次元から2次元までの様々なポーズ推定を行うことができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:38:44 GMT)
DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time [10.1] 実時間DLOモデリングのための微分離散分岐弾性棒
本稿では、実時間(DEFT)におけるFurcated DLOのモデル化のための微分離散分岐弾性ロッドを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:28:35 GMT)
OneRec: Unifying Retrieve and Rank with Generative Recommender and Iterative Preference Alignment [10.0] ケースドラーニングフレームワークを統一的な生成モデルで置き換えるOneRecを提案する。
1) ユーザの履歴行動シーケンスをエンコードし、ユーザが興味を持っているかもしれない動画を徐々にデコードするエンコーダ・デコーダ構造。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:25:10 GMT)
CLLoRA: An Approach to Measure the Effects of the Context Length for LLM Fine-Tuning [9.9] 大規模な言語モデルは、しばしば異なるデータ所有者にわたる連合学習環境において微調整される。
トレーニングデータのコンテキストの長さは、モデルの性能に影響を与える主要な要因として特定されている。
CLLoRAは、文脈の品質と長さが、非IIDコンテキストを測定するための標準となるかどうかを調査する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:56:43 GMT)
Diagrammatization and Abduction to Improve AI Interpretability With Domain-Aligned Explanations for Medical Diagnosis [9.9] 本稿では,解釈可能性のギャップを低減するため,図式および帰納的推論によるドメインアライメントの改善を提案する。
DiagramNetは,心臓の聴診から心臓の診断を予測し,基準評価に基づいて最適な仮説を選定し,臨床的に関連のある大腿骨の図を用いて説明する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:09:23 GMT)
Random Forest-of-Thoughts: Uncertainty-aware Reasoning for Computational Social Science [9.9] 思考のランダムフォレスト (RFoT) と呼ばれる新しい言語モデルプロセッシング手法を提案する。
RFoTは、多様な思考空間を生成し、思考の森を構築するためのサブ思想をランダムに選択することで、LLMが意図的な意思決定を行うことを可能にする。
実験の結果,RFoTは,非自明な推論を必要とする2つの新しい社会調査分析問題において,言語モデルの能力を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:52:44 GMT)
Fourier Multi-Component and Multi-Layer Neural Networks: Unlocking High-Frequency Potential [9.7] FMMNN(Fourier Multi-Component and Multi-Layer Neural Network)を紹介する。
FMMNNは、様々なタスクにおいて、常に優れた精度と効率を達成することを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:12:52 GMT)
NeoBERT: A Next-Generation BERT [9.7] NeoBERTは、双方向モデルの能力を再定義する次世代エンコーダである。
すべてのコード、データ、チェックポイント、トレーニングスクリプトをリリースし、研究と実際の採用を加速します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:00:22 GMT)
On Pruning State-Space LLMs [9.7] 我々は,SSM構造にいくつかのプルーニング手法を適用し,複数のタスクにまたがる4つのSSMベースのLCMに適用する。
このようなモデルは、いくつかのプルーニングメソッドに対して非常に堅牢であるのに対して、他のメソッドを使用すると、高速な性能低下につながることが分かりました。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:04:20 GMT)
MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs [9.6] 本稿では,中国EMRのICD符号化におけるエビデンス検証によるMKE-Coder: Multi-axial Knowledgeを提案する。
診断のための候補コードを特定し,そのそれぞれを4つの符号化軸の下で知識に分類する。
評価モデルを用いて,EMRの包括的内容と信頼性証拠のフィルタリングから,対応する臨床証拠を検索する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:35:15 GMT)
Kanana: Compute-efficient Bilingual Language Models [9.6] カナナ(Kanana)は、韓国語のパフォーマンスと英語の競争性能を超越した二言語モデルである。
このレポートでは、計算効率が良いが競争力のあるモデルを実現するために、事前学習で使用されるテクニックについて詳述している。
本報告では, 埋め込み, 検索拡張生成, 関数呼び出しなど, 特定のシナリオへの言語モデル適応に有効なアプローチについて詳述する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:36:20 GMT)
A Public Dataset For the ZKsync Rollup [9.6] 我々は,ZKsyncのアーカイブノードから抽出した1年間のアクティビティから得られたデータセットをキュレートし,外部関係者に自由に利用できるようにした。
我々は、このデータセットの詳細と、どのように作成されたかを説明し、それを用いて実行できるいくつかの分析例を示し、今後の研究方向性について議論する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:13:43 GMT)
Optimal Approximate Matrix Multiplication over Sliding Windows [9.4] スライドウィンドウ上でのAMMのためのDS-CODアルゴリズムを提案する。
提案アルゴリズムの理論的誤差境界と複雑性解析について述べる。
本稿では,DS-CODの適応版であるaDS-CODについて述べる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:05:00 GMT)
CLIPDrag: Combining Text-based and Drag-based Instructions for Image Editing [9.4] テキストとドラッグ信号を組み合わせた新しい画像編集手法である textbfCLIPDrag を提案する。
CLIPDragは、既存の単一のドラッグベースのメソッドやテキストベースのメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:51:12 GMT)
EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region [9.4] Emirates Multi-Taskデータセットは、アラビア湾地域で収集された自動運転のための最初の公開データセットである。
ダッシュカメラの見地から3万枚以上のフレームと、約150kmの走行ルートをカバーする570,000個の注釈付きバウンディングボックスを含んでいる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:06:35 GMT)
SECURA: Sigmoid-Enhanced CUR Decomposition with Uninterrupted Retention and Low-Rank Adaptation in Large Language Models [9.1] SECURAは、パラメータ効率の良い微調整(PEFT)変異体であり、微調整性能を改善しながら破滅的な忘れを軽減している。
その結果,SECURAは4つの質問質問(MCQ)タスクで3.59%,5つの質問回答(QA)タスクで2.51%の改善を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:27:33 GMT)
Mixed-Precision Federated Learning via Multi-Precision Over-The-Air Aggregation [9.1] 複数のビット精度を持つクライアントの混合精度OTA-FLフレームワークを提案する。
32ビットと16ビットの同種標準精度と比較して、4ビット超低精度クライアントの性能は10%以上である。
これは、異種エッジコンピューティング環境における混合精度OTA-FLアプローチの大きな可能性を示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:21:21 GMT)
Device independent security of quantum key distribution from monogamy-of-entanglement games [9.0] 非ローカルゲームのための汎用デバイス独立量子鍵分配プロトコルを提案する。
我々は,プロトコルの秘密鍵レートを有限かつ三分割的に最適化する。
我々のプロトコルは、雑音を最大2.2%まで非偏極化するために堅牢であることを示し、魔法の正方形の量子鍵分布に対する一般的な攻撃に対する最初の境界を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:03:04 GMT)
On the Interpolation Effect of Score Smoothing [8.9] 本研究では, 数学的に解けるモデルを用いて, スコアスムーシングとデノナイジングダイナミクスの相互作用について検討する。
本研究では,スムーズなスコア関数が,サブ空間内のトレーニングデータ間で補間するサンプルの生成にどのように寄与するかを示す。
また、正規化ニューラルネットワークを用いた学習スコア関数が、スコアスムーシングのような認知力学に類似した効果を持つことを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:04:01 GMT)
Data-Efficient Multi-Agent Spatial Planning with LLMs [8.9] マルチエージェント意思決定において,事前学習された大規模言語モデルの知識を効果的かつ堅牢な学習に活用する方法を示す。
本報告では,タクシーの乗り継ぎ時間を削減するため,乗客の乗り継ぎを最善に決めなければならないタクシーの経路と割り当て問題について検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:53:07 GMT)
Quantum Annealing Feature Selection on Light-weight Medical Image Datasets [8.8] 軽度医用画像データセットの特徴選択という,計算集約的な課題に取り組むために,実際の量子ハードウェアにおける量子コンピューティングアルゴリズムの利用について検討する。
本稿では,市販の量子アニールよりも大きな特徴選択を解く方法を提案する。
本手法は,小型の医用画像の再構成に用いる画素マスクを特徴選択によって識別する玩具問題において試験される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:09:23 GMT)
NeuroTree: Hierarchical Functional Brain Pathway Decoding for Mental Health Disorders [8.7] 我々は既存のfMRIベースのグラフ畳み込みネットワークの限界を克服するためにNeuroTreeを提案する。
NeuroTreeはk-hop AGE-GCNとニューラル常微分方程式(ODE)を統合して機能接続を最適化する。
我々の経験的評価は、NeuroTreeが2つの異なる精神障害データセットで最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:42:58 GMT)
Cylindrical and Möbius Quantum Codes for Asymmetric Pauli Errors [8.6] 量子情報システムでは、位相フリップエラーのような1種類のパウリエラーがビットフリップエラーのような他のものよりも頻繁に発生することがある。
このため、非対称な誤りを処理する量子誤り訂正符号は、そのような障害の影響を軽減するために重要である。
これらはXZZXやZZZYのような表面符号の変種を含み、誤り対称性の存在下で量子情報を保存するように調整されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:34:33 GMT)
A Comparison of DeepSeek and Other LLMs [8.6] 比較のために短いテキストを用いて結果を予測するタスクを使用する。
分類精度に関しては、DeepSeekはGemini、GPT、Llamaより優れている。
DeepSeekは比較的遅いが、使用コストは低く、Claudeは他のすべてよりもはるかに高価だ。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:49:17 GMT)
SPU-IMR: Self-supervised Arbitrary-scale Point Cloud Upsampling via Iterative Mask-recovery Network [8.6] 点雲アップサンプリングは、疎点雲から密度が高く均一に分散した点集合を生成することを目的としている。
既存のポイントクラウドアップサンプリングメソッドは、通常、問題としてタスクにアプローチする。
対照的に,提案手法は点雲のアップサンプリングを大域的な形状完備化問題として扱う。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:35:25 GMT)
SPLITZ: Certifiable Robustness via Split Lipschitz Randomized Smoothing [8.5] SPLITZは、敵の例に証明可能な堅牢性を提供するための実用的で斬新なアプローチである。
SPLITZのモチベーションは、多くの標準ディープネットワークがリプシッツ定数の不均一性を示すという観察から来ている。
SPLITZは、MNIST、CIFAR-10、ImageNetデータセットにおける既存の最先端のアプローチを一貫して改善することを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:01:02 GMT)
Does 3D Gaussian Splatting Need Accurate Volumetric Rendering? [8.4] 3D Gaussian Splatting (3DGS) は撮影シーンの3D表現を学習するための重要な参照手法である。
3DGSに先立つNeRFは、レンダリングのための原則的なレイマーチングアプローチに基づいている。
元の3DGSソリューションで用いられる様々な近似と仮定を詳細に分析する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:11:26 GMT)
Confounding-Robust Policy Improvement with Human-AI Teams [8.3] 我々は,人間とAIのコラボレーションにおいて,観測不能なコンバウンディングに対処する新しいソリューションを提案する。
このアプローチでは、ドメインの専門知識とAI駆動の統計モデリングを組み合わせることで、潜在的に隠れた共同設立者を説明する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:39:04 GMT)
Capacities of quantum Markovian noise for large times [8.3] 量子マルコフノイズモデルが与えられた場合、任意に長時間保存できる古典的あるいは量子的システムの最大次元について検討する。
固定時間設定とは異なり、無限時間の極限において、古典的および量子的容量は、量子チャネルの周辺スペクトルの効率的な計算可能特性によって特徴づけられることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:35:01 GMT)
Enhancing Gradient-based Discrete Sampling via Parallel Tempering [8.2] 勾配に基づく離散サンプリング器は、高次元のマルチモーダル離散分布において局所的なミニマに閉じ込められやすい。
我々は、並列テンパリング(レプリカ交換としても知られる)と離散ランゲヴィン提案を組み合わせた離散ランゲヴィン提案を開発する。
我々は,本アルゴリズムが非漸近的に目標エネルギーに収束し,単一鎖よりも高速な混合を示すことを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:51:15 GMT)
Provable Acceleration for Diffusion Models under Minimal Assumptions [8.2] そこで本研究では,スコアベースサンプルの学習自由化手法を提案する。
最小限の仮定の下で、我々のスキームは$widetildeO(d5/4/sqrtvarepsilon)$で全変量を達成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:35:05 GMT)
Who is Responsible? The Data, Models, Users or Regulations? Responsible Generative AI for a Sustainable Future [8.0] 責任人工知能(Responsible Artificial Intelligence, RAI)は、AIシステムの開発と展開における倫理的懸念に対処するための重要なフレームワークとして登場した。
本稿では、ChatGPT後における倫理的、透明性があり、説明可能なAIシステムを実装する上での課題と機会について考察する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:11:31 GMT)
ARCON: Advancing Auto-Regressive Continuation for Driving Videos [8.0] 本稿では,ビデオ継続におけるLVM(Large Vision Models)の利用について検討する。
セマンティックトークンとRGBトークンを交互に生成するスキームであるARCONを導入し,LVMが高レベルな構造化映像情報を明示的に学習できるようにする。
自律走行シナリオの実験は、我々のモデルが一貫して長いビデオを生成できることを示しています。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:16:15 GMT)
Reimagining Personal Data: Unlocking the Potential of AI-Generated Images in Personal Data Meaning-Making [7.9] 画像生成AIは、個人データを代替の視覚形式に変換する新しい機会を提供する。
本稿では、個人データへの有意義なエンゲージメントを促進するためのAI生成画像の可能性について説明する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:50:57 GMT)
Trustworthy Answers, Messier Data: Bridging the Gap in Low-Resource Retrieval-Augmented Generation for Domain Expert Systems [7.8] 生のマルチモーダルデータを構造化コーパスとQ&Aペアに変換するデータ生成パイプラインを導入する。
本システムは,非RAGベースライン上での事実正当性(+1.94),報知性(+1.16),助力性(+1.67)を改善する。
結果は、強い答えの根拠と透明性によって、異なる側面にわたるアプローチの有効性を強調します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:20:08 GMT)
A Method for Evaluating the Interpretability of Machine Learning Models in Predicting Bond Default Risk Based on LIME and SHAP [7.7] 本稿では,AIモデルによく使用される機械学習アルゴリズムを適用し,債券市場のデフォルト予測をケーススタディとして用いた。
この分析結果は、これらのモデルの解釈可能性に関する直感的な理解と論理的期待と一致している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:05:34 GMT)
From Traditional to Deep Learning Approaches in Whole Slide Image Registration: A Methodological Review [7.4] 病理組織学的には,全スライド画像(WSI)の登録は腫瘍ミクロ環境(TME)の解析に必須の課題である。
これは、同じ部分のWSIと組織サンプルのシリアルセクションの空間情報のアライメントを含む。
目標は、3D画像を作成したり、TME内の細胞のサブクラスを特定するために、Z軸に沿って隣接する核を特定することである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:24:16 GMT)
INFO-SEDD: Continuous Time Markov Chains as Scalable Information Metrics Estimators [7.4] INFO-SEDDは、相互情報やエントロピーを含む離散データの情報理論量の推定方法である。
提案手法では,1つのパラメトリックモデルのトレーニングが必要である。
実験の結果、INFO-SEDDは堅牢であり、埋め込み技術に依存しているニューラルコンペティターよりも優れていた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:40:00 GMT)
Diffusion-based Planning with Learned Viability Filters [7.4] 我々は,任意の計画の今後の成功を効率的に予測する学習可能フィルタを提案する。
本研究では, 適応型拡散予測よりも, 可視性フィルタの使用がはるかに高速であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:08:38 GMT)
Learning Autonomy: Off-Road Navigation Enhanced by Human Input [7.4] 本稿では,モノクロカメラのみを用いて実世界の実演から人間の運転ニュアンスをキャプチャする,学習に基づく新しいローカルプランナを提案する。
プランナーは、人間の運転好みを学習するために必要な現実世界のデータを大幅に削減する。
これにより、手作業による微調整を必要とせずに、学習した振る舞いを現実世界のシナリオに適用することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:36:14 GMT)
STGFormer: Spatio-Temporal GraphFormer for 3D Human Pose Estimation in Video [7.3] 本稿では,ビデオ中の3次元ポーズ推定のためのS-Temporal GraphFormerフレームワーク(STGFormer)を提案する。
まず,人体固有のグラフ分布をより効果的に活用するためのSTGアテンション機構を導入する。
次に、時間次元と空間次元を独立に並列に処理するための変調ホップワイド正規GCNを提案する。
最後に,Human3.6MおよびMPIINF-3DHPデータセット上での最先端性能を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:56:48 GMT)
Isolating Language-Coding from Problem-Solving: Benchmarking LLMs with PseudoEval [7.3] 既存のコード生成ベンチマークは、大規模言語モデルのエンドツーエンドのパフォーマンスを研究するために設計されている。
我々は擬似コードで書かれたソリューションを入力として提供する多言語コード生成ベンチマークであるPseudoEvalを構築した。
本研究は,プログラミング言語間で問題解決能力が伝達される可能性を示し,言語符号化には言語固有の取り組みが必要であることを示唆する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:08:17 GMT)
Improving Representation Learning of Complex Critical Care Data with ICU-BERT [7.3] ICU-BERTは、MIMIC-IVデータベース上で事前トレーニングされたトランスフォーマーベースのモデルである。
最小限の事前処理で複雑なICUデータの堅牢な表現を学習する。
微調整を活用することで、現在のパフォーマンスベンチマークと比較するか、超えるかのどちらかだ。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:16:58 GMT)
Poster: Long PHP webshell files detection based on sliding window attention [7.2] 私たちはまずPHPソースコードをOpcodeに変換し、次にOpcode Double-Tuples(ODT)を抽出します。
深層学習手法が長いウェブシェルファイルの検出を困難にしている問題に対処するため,スライディングウィンドウアテンション機構を導入する。
実験の結果,本手法はウェブシェル検出において精度が高いことがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:04:17 GMT)
Stay Focused: Problem Drift in Multi-Agent Debate [7.2] 議論は複数回にわたる最初の問題から遠ざかっている。
本研究は,マルチエージェントの議論における重要な限界を理解するための第一歩として,将来的な有効性向上の道筋を明らかにすることができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:54:51 GMT)
PRISM: Mitigating EHR Data Sparsity via Learning from Missing Feature Calibrated Prototype Patient Representations [7.1] PRISMは、類似した患者のプロトタイプ表現を活用することで、データを間接的にインプットするフレームワークである。
PRISMには、ステータスの欠如を考慮した各機能の信頼性を評価する機能信頼モジュールも含まれている。
MIMIC-III, MIMIC-IV, PhysioNet Challenge 2012, eICU データセットを用いた実験により, PRISM の院内死亡予測と30日間の読解作業における優れた性能が示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:37:34 GMT)
LIMEtree: Consistent and Faithful Surrogate Explanations of Multiple Classes [7.0] マルチクラス説明の新しいパラダイムを紹介する。
LIMEtree と呼ばれる多出力回帰木に基づく局所代理モデルを提案する。
強い忠実性の保証に加えて、我々の実装は多様な説明型を提供します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:32:41 GMT)
JailBench: A Comprehensive Chinese Security Assessment Benchmark for Large Language Models [7.0] JailBenchは,大規模言語モデル(LLM)の深層脆弱性を評価するための,最初の包括的な中国のベンチマークである。
我々は JailBench 構築に新しい Jailbreak Prompt Engineer (AJPE) フレームワークを採用している。
提案した JailBench は 13 個の LLM に対して広範囲に評価され,ChatGPT に対する攻撃成功率が最も高い。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:36:42 GMT)
XSS Adversarial Attacks Based on Deep Reinforcement Learning: A Replication and Extension Study [7.0] クロスサイトスクリプティング(XSS)は、Webアプリケーションのセキュリティに重大な脅威をもたらす。
Deep LearningはXSS攻撃の検出に顕著な成功を収めた。
敵攻撃はXSS攻撃ベクターの異なる構成要素に対する突然変異ベースの戦略を用いる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:39:55 GMT)
Spectral-Refiner: Accurate Fine-Tuning of Spatiotemporal Fourier Neural Operator for Turbulent Flows [7.0] 最近の演算子型ニューラルネットワークは、部分微分方程式(PDE)の近似に有望な結果を示している。
これらのニューラルネットワークは、かなりのトレーニング費用を要し、科学や工学の分野において要求される精度を常に達成するとは限らない。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:19:58 GMT)
Repurposing the scientific literature with vision-language models [6.9] 我々はNeurosurgery PublicationsからNuroPubsというマルチモーダルデータベースに23,000の記事を変換した。
教育では,ABNS書記試験のスタイルで89,587の質問を発生させた。
盲目無作為化対照試験では, CNS-Obsidian から GPT-4o への非誤認を診断的補助として示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:35:37 GMT)
Consistent Amortized Clustering via Generative Flow Networks [6.9] 本稿では,アモータイズクラスタリングのための新しいフレームワークであるGFNCPを紹介する。
GFNCPは、政策と報酬の共有エネルギーベースのパラメトリゼーションを備えた生成フローネットワークとして定式化されている。
流れの一致条件は, 境界条件下でのクラスタリング後部の整合性に等しいことを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:30:52 GMT)
Achieving Upper Bound Accuracy of Joint Training in Continual Learning [6.9] 主な課題は破滅的な忘れ(CF)であり、ほとんどの研究はこの問題の緩和に向けられている。
最先端の連続学習アルゴリズムによって達成される精度と、全てのタスクを一緒に訓練することで達成される理想的あるいは上限的精度との間には、大きなギャップが残っている。
本稿は、この成果につながる主要な研究を調査し、直感的にも神経科学的にもアプローチを正当化し、得られた知見について考察する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:26:42 GMT)
Binary Neural Networks for Large Language Model: A Survey [6.9] 低ビット量子化は、鍵となる手法として、モデルパラメータのビット幅を小さくすることで、メモリ使用量と計算要求を減らす。
BitNetチームは、低精度バイナリウェイトを使用して、モデルトレーニングの開始から量子化を行うという、根本的に異なるアプローチを提案した。
本稿では,これらのバイナリ量子化手法について概観する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:14:19 GMT)
Talking to the brain: Using Large Language Models as Proxies to Model Brain Semantic Representation [6.9] 本稿では,マルチモーダル大言語モデル(LLM)をプロキシとして活用して,自然画像から意味情報を抽出する手法を提案する。
LLMから派生した表現は、fMRIによって測定された確立された神経活動パターンをうまく予測する。
LLM由来の表現から構築された脳意味ネットワークは、機能的および文脈的関連を反映する意味あるクラスタを識別する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:40:28 GMT)
TALKPLAY: Multimodal Music Recommendation with Large Language Models [6.8] TalkPlayは、複数のモダリティをエンコードする拡張トークン語彙を通じて音楽を表現する。
モデルは、音楽レコメンデーションの会話において、次のトーケン予測を通じてレコメンデーションを生成することを学習する。
提案手法は従来のレコメンデーション-対話パイプラインの複雑さを排除し,クエリ対応の音楽レコメンデーションのエンドツーエンド学習を可能にする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:00:37 GMT)
Implicit factorized transformer approach to fast prediction of turbulent channel flows [6.7] 本稿では,従来の連鎖因数分解処理を並列因数分解処理に置き換える改良型暗黙因数分解変換器 (IFactFormer-m) モデルを提案する。
IFactFormer-mモデルは乱流流の長期予測に成功している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:24:07 GMT)
Nonlinear Sparse Generalized Canonical Correlation Analysis for Multi-view High-dimensional Data [6.7] バイオメディカル研究は、積分相関分析(CCA)を必要とする多視点高次元TCGデータセット(例えば、マルチオミクス)をますます生産する。
多視点高次元データにおける変数選択のための非線形一般化CCA法HSIC-SGCCA, SA-KGCCA, TS-KGCCAを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:16:48 GMT)
A Multifacet Hierarchical Sentiment-Topic Model with Application to Multi-Brand Online Review Analysis [6.7] 提案手法は,階層的ブランド関連トピックモデルを用いてレビュー語を説明する統一的な生成フレームワーク上に構築されている。
トピック階層間の話題語関連性を高めるために,新しい階層型ポリアワール(HPU)方式を提案する。
実験により,提案手法は適切なトピック階層を検出し,正確なブランド関連ランキングを導出するのに有効であることが示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:30:06 GMT)
Voting or Consensus? Decision-Making in Multi-Agent Debate [6.7] 意思決定がさまざまなタスクの課題にどのように対処するかは、ほとんど分かっていない。
投票プロトコルは、推論タスクとコンセンサスプロトコルのパフォーマンスが13.2%向上し、知識タスクの2.8%向上した。
回答の多様性を高めて意思決定を改善するために,2つの新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:39:18 GMT)
A Fusion Model for Art Author Identification Based on Convolutional Neural Networks and Transformers [6.6] 本稿では,CNNとトランスフォーマーを組み合わせた融合モデルを提案する。
中国と石油の絵画データセットの実験では、融合モデルは個々のCNNとトランスフォーマーモデルより優れていた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:03:24 GMT)
Simulation of Language Evolution under Regulated Social Media Platforms: A Synergistic Approach of Large Language Models and Genetic Algorithms [6.6] ソーシャルメディアプラットフォームは、しばしばユーザーコンテンツを穏健化するために制限的なポリシーを課し、創造的回避言語戦略の出現を促している。
本稿では,規制制約下での言語戦略の反復的進化をシミュレートする,Large Language Models (LLM)に基づくマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:59:27 GMT)
Bi'an: A Bilingual Benchmark and Model for Hallucination Detection in Retrieval-Augmented Generation [6.5] bftextBi'anはバイリンガルベンチマークデータセットと軽量判定モデルを備えた新しいフレームワークである。
データセットは、複数のRAGシナリオにわたる厳密な評価をサポートし、審査モデルは、コンパクトなオープンソースLLMから微調整される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:12:59 GMT)
RURA-Net: A general disease diagnosis method based on Zero-Shot Learning [6.5] 本研究はゼロショット学習に基づく一般的な疾患診断手法を提案する。
シームズニューラルネットワークは、標的疾患に類似した疾患を見つけるために使用される。
U-Netセグメンテーションモデルは、疾患の重要な病変を正確にセグメンテーションするために使用される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:41:32 GMT)
Language Models Grow Less Humanlike beyond Phase Transition [6.5] ヒトの読解行動(サイコメトリック予測力; PPP)との整合性(LM)は、先端まで前訓練中に改善することが知られている。
単語頻度、注意の傾向バイアス、文脈サイズなど、様々な要因がPPPに影響を与えるように理論化されている。
本研究は,特定の注意点の急激な出現を特徴とし,基礎となる因子が事前学習相転移であると仮定する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:17:19 GMT)
Iterative Flow Matching -- Path Correction and Gradual Refinement for Enhanced Generative Modeling [6.3] 本稿では,フローマッチングが幻覚を発生させる理由を説明し,生成プロセスを改善するための反復的プロセスを提案する。
我々の反復的プロセスは、事実上$textitany$生成モデリング技術に統合することができ、それによって合成画像システムの性能と堅牢性を向上させることができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:46:56 GMT)
Is Your Paper Being Reviewed by an LLM? A New Benchmark Dataset and Approach for Detecting AI Text in Peer Review [6.2] 我々は、AIで書かれたピアレビューを、対応する人間のレビューと組み合わせた合計788,984件の包括的データセットを導入する。
我々は、この新たなリソースを使用して、既存の18のAIテキスト検出アルゴリズムが、人間が書いたピアレビューと、最先端のLLMを区別する能力を評価する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:04:05 GMT)
HyperGCL: Multi-Modal Graph Contrastive Learning via Learnable Hypergraph Views [6.2] グラフコントラスト学習(GCL)は,グラフ表現の改善に顕著な効果を示した。
本稿では,ハイパーグラフの観点から,新しいマルチモーダルGCLフレームワークであるHyperGCLを紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:24:15 GMT)
Measuring risks inherent to our digital economies using Amazon purchase histories from US consumers [6.1] ピクルスやトランポリンの購入は、顧客の個人的属性(この場合、彼らのレース)の手がかりを明らかにするリスクがあることを示します。
この研究は、(N=4248)米国のAmazon.comの顧客からクラウドソースされた購入履歴を用いて、これらのリスクを測定する最初のオープン分析を提供する。
健康やライフスタイル、性別、年齢、人種といった消費者の個人的属性が、購入からいかに容易に推測できるかを実証する。
Amazonやデータブローカー、広告主が消費者に提供する高リソース企業のリスクをより深く理解するために、我々のモデルの予測能力がより多くのデータでどのようにスケールするかを測定します。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:06:04 GMT)
Machine Learning for Detecting Steering in Qutrit-Pair States [6.1] 準定値プログラミングを用いて、キュートリット量子系におけるステアビリティ検出のためのデータセットを構築する。
応用として、等方性状態と部分的に絡み合った状態のステアビリティ境界を調べ、新しいステアビリティ状態を求める。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:25:54 GMT)
CryptoPulse: Short-Term Cryptocurrency Forecasting with Dual-Prediction and Cross-Correlated Market Indicators [5.9] 本稿では、マクロ経済変動、技術的指標、個別の暗号通貨価格変化を取り入れて、翌日の閉値を予測する二重予測機構を提案する。
実験により,提案モデルが最先端の性能を達成し,連続して10つの比較法より優れた結果が得られた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:45:01 GMT)
Great, Now Write an Article About That: The Crescendo Multi-Turn LLM Jailbreak Attack [5.9] 我々は、Crescendoと呼ばれる新しいジェイルブレイク攻撃を導入する。
Crescendoは単純なマルチターンジェイルブレイクで、一見見栄えのよい方法でモデルと対話する。
我々はChatGPT, Gemini Pro, Gemini-Ultra, LlaMA-2 70b, LlaMA-3 70b Chat, Anthropic Chatなど,様々な公共システム上でのCrescendoの評価を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:41:41 GMT)
A Law of One's Own: The Inefficacy of the DMCA for Non-Consensual Intimate Media [5.9] NCIM(Non-consensual Intimate Media)は、表現されている個人に対して、インターネット規模の害を与えるメディアである。
デジタルミレニアム著作権法(DMCA)は、NCIMの問題に対処するよりも著作権保持者を保護するために設計された。
非商業的なリクエストでは、URLの半分以上が48時間以内にGoogle検索から削除されるが、Webサイトのホストからコンテンツを削除するのは非常に遅い。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:24:11 GMT)
Introduction to Sequence Modeling with Transformers [5.8] トランスフォーマーアーキテクチャとその動作を理解することは、機械学習(ML)エンジニアにとって不可欠である。
主な作業馬は注意であり、変圧器エンコーダ・デコーダ構造になる。
これらの構成要素は「トークン化」「エンベディング」「マスキング」「ポジションエンコーディング」「パディング」である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:21:54 GMT)
A Temporal Planning Framework for Multi-Agent Systems via LLM-Aided Knowledge Base Management [5.5] 本稿では,大規模言語モデル(LLM)とPrologベースの知識管理とマルチロボットタスクの計画を統合したPLANTORという新しいフレームワークを提案する。
その結果,LLMは人間からのフィードバックの少ない正確な知識ベースを生成でき,Prologは形式的正当性と説明可能性を保証することがわかった。
このアプローチは、柔軟でスケーラブルで人間に理解可能な計画を必要とする高度なロボティクスタスクのためのLLM統合の可能性を強調している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:51:28 GMT)
Signatures of collective photon emission and ferroelectric ordering of excitons near their Mott insulating state in a WSe$_2$/WS$_2$ heterobilayer [5.5] 強い励起子-励起子相互作用によって誘導される双極子モーア励起子の面内強誘電相の証拠を示す。
我々は、近年の光子放出の驚くべきスピードアップと、励起崩壊の低密度化を発見した。
我々の研究は、モワール格子における強い双極子間相互作用の最初の証拠を提供し、モワール量子物質のプローブとしての集合光子放射を実証した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:00:09 GMT)
MQADet: A Plug-and-Play Paradigm for Enhancing Open-Vocabulary Object Detection via Multimodal Question Answering [5.5] 既存のオープンボキャブラリ検出器は、複雑な視覚・テクスチャのミスアライメントと長い尾のカテゴリーの不均衡によって制限される。
マルチモーダルな大言語モデルのクロスモーダル推論機能を活用することで、既存のオープン語彙検出器を強化するための共通パラダイムであるMQADetを紹介する。
複雑なテキストと視覚的ターゲットを正確にローカライズするためにMLLMをガイドする3段階のMultimodal Question Answering (MQA) パイプラインを設計する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:54:27 GMT)
Integrating Biological and Machine Intelligence: Attention Mechanisms in Brain-Computer Interfaces [5.5] 時間、周波数、空間チャネルにわたる脳波の変化を捉えることで、注意機構は特徴抽出、表現学習、モデルロバスト性を改善する。
従来のアテンションメカニズムは、畳み込みネットワークやリカレントネットワーク、Transformerベースのマルチヘッド自己アテンションと統合されている。
我々は、注目に基づく脳波モデリングにおける既存の課題と新たなトレンドについて論じ、BCI技術の進歩に向けた今後の方向性を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:38:28 GMT)
Efficient Federated Search for Retrieval-Augmented Generation [5.5] 大規模言語モデル(LLM)は、様々な領域で顕著な能力を示してきたが、幻覚や矛盾の影響を受けやすいままである。
Retrieval-augmented Generation (RAG) は、これらの問題を、外部の知識ソースに応答を基盤として緩和する。
フェデレートされたRAG検索のための新しいメカニズムであるRAGRouteを紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:36:24 GMT)
Anything Goes? A Crosslinguistic Study of (Im)possible Language Learning in LMs [5.4] LMをトレーニングして、不可能で、タイプミス的に証明されていない言語をモデル化します。
GPT-2小ささは、主に証明された言語と不可能な言語を区別できる。
モデルの難易度スコアは、未証明の変種が選挙区構造を維持している限り、未証明の語順と未証明の語順とを区別しない。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:01:36 GMT)
Mapping and Influencing the Political Ideology of Large Language Models using Synthetic Personas [5.2] 政治コンパステスト(PCT)を用いたペルソナに基づく大規模言語モデルの政治的分布をマッピングする。
実験の結果, 合成ペルソナは左リバタリアン・クアドラントに主に集合しており, 明示的なイデオロギー記述子による刺激による応答性の変化を示すモデルが得られた。
すべてのモデルは、右権威主義的位置への顕著なシフトを示すが、左リバタリアン位置へのより限定的なシフトを示し、モデルトレーニングの固有のバイアスを反映するイデオロギー的操作に対する非対称な反応を示唆している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:24:32 GMT)
Inferring stochastic low-rank recurrent neural networks from neural data [5.2] 計算神経科学における中心的な目的は、大きなニューロンの活動と基礎となる力学系を関連付けることである。
低ランクリカレントニューラルネットワーク(RNN)は、トラクタブルダイナミクスを持つことによって、そのような解釈可能性を示す。
そこで本研究では,低ランクRNNをモンテカルロ変分法に適合させる手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:02:29 GMT)
SmartDelta Methodology: Automated Quality Assurance and Optimization for Incremental System Engineering [5.1] SmartDelta Projectは産業と学界に加わり、インクリメンタルな開発と品質保証のためのソリューションを開発し、テストした。
SmartDeltaの方法論は、インクリメンタルソフトウェアエンジニアリングにおけるデルタ管理のためのドメインに依存しない概念である。
本稿では,方法論の異なる段階において,選択した7つのツールについて述べる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:16:32 GMT)
CalibRefine: Deep Learning-Based Online Automatic Targetless LiDAR-Camera Calibration with Iterative and Attention-Driven Post-Refinement [5.1] CalibRefineは完全に自動化され、ターゲットレス、オンラインキャリブレーションフレームワークである。
我々は,CalibRefineが人間の関与を最小限に抑えた高精度キャリブレーション結果を提供することを示した。
本研究は、オブジェクトレベルの特徴マッチングが、反復的かつ自己監督的な注意に基づく調整と相まって、複雑で現実的な条件下でのセンサの融合を可能にすることを明らかにする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:35:56 GMT)
Provocations from the Humanities for Generative AI Research [5.0] 本稿では, 人文科学研究者の視点から, 生成AIの利用, 影響, 害を考慮した一連の挑発について述べる。
我々は人文科学研究の作業的定義を提供し、その最も健全な理論と手法の一部を要約し、これらの理論と手法を現在のAIの風景に適用する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:55:55 GMT)
Enabling Multi-Robot Collaboration from Single-Human Guidance [5.0] 本研究では,人間一人の専門知識を活用することで,マルチエージェントシステムにおける協調行動の効率的な学習方法を提案する。
本研究では,人間の操作者が短時間に制御エージェントを動的に切り替えることによって,効果的に協調学習ができることを示す。
実験の結果,本手法は,人的指導を40分で最大58%向上させることができた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:44:01 GMT)
Reinforcement learning to learn quantum states for Heisenberg scaling accuracy [5.0] 量子状態の学習過程を最適化するために強化学習(RL)を利用するメタラーニングモデルを提案する。
RLエージェントはランダム量子状態の学習のサンプル効率を大幅に改善する。
また,3量子状態を用いて訓練したRLエージェントが最大5量子状態の学習に一般化可能であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:24:09 GMT)
Probabilistic Multi-Layer Perceptrons for Wind Farm Condition Monitoring [5.0] 本研究では,通常行動モデルに基づく風力発電施設のコンディションモニタリングシステムについて述べる。
このモデルは、監督制御とデータ取得システムから得られた特徴に基づいて、風力タービンの出力パワーを予測する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:14:25 GMT)
LancBiO: dynamic Lanczos-aided bilevel optimization via Krylov subspace [4.9] 本稿では、ランツォス過程の助けを借りて、低次元近似クリロフ部分空間の列を構築する。
構成された部分空間は、動的かつ漸進的にヘッセン逆ベクトル積を近似することができる。
また,小さな三角形線形系を解くための中心ステップとして,二段階問題に対する証明可能な部分空間ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:25:09 GMT)
Resonant Energy Transfer and Collectively Driven Emitters in Waveguide QED [4.9] 導波管量子電磁力学(QED)は量子光学の新しいフロンティアを開いた。
2つの遠方の量子エミッタ間の共振エネルギー移動は、その1つだけを駆動しながら、強度相関で$g(2)(tau)$の反ジップを記録することで観測する。
本研究は,マルチエミッタ導波路QEDシステムのための新しい発光機構と励起方式を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:52:51 GMT)
Potential Field as Scene Affordance for Behavior Change-Based Visual Risk Object Identification [4.9] 行動変化に基づく視覚的リスクオブジェクト識別(Visual-ROI)について検討する。
既存の手法はしばしば空間的精度と時間的一貫性に重大な制限を呈する。
本稿では,これらの課題を克服するために,バードアイビュー表現を用いた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:06:11 GMT)
Akan Cinematic Emotions (ACE): A Multimodal Multi-party Dataset for Emotion Recognition in Movie Dialogues [4.9] アカン会話感情データセット(Akan Conversation Emotion dataset)は、アフリカ語における最初のマルチモーダル感情対話データセットである。
385の感情ラベル付き対話と6,162の発話が音声、視覚、テキストのモダリティにわたって含まれている。
このデータセットに韻律ラベルがあることは、最初の韻律的に注釈付けされたアフリカの言語データセットにもなった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:48:07 GMT)
Emergence of the Gibbs ensemble as a steady state in Lindbladian dynamics [4.9] 我々は、ギブスアンサンブルを特徴とするリンドブラッドマスター方程式のユニークな非平衡定常状態(NESS)を明示的に構成する。
XXモデルとフレドキンモデルを研究することにより、ギブス状態が平衡定常状態としてどのように現れるかを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:24:21 GMT)
3D ReX: Causal Explanations in 3D Neuroimaging Classification [4.8] 我々は3Dモデルのための最初の因果関係に基づくポストホック説明可能性ツールである3D ReXを紹介する。
脳卒中検出モデルを用いて3次元ReXを検証し,脳卒中に関連する特徴の空間分布について考察した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:25:57 GMT)
Practical Evaluation of Copula-based Survival Metrics: Beyond the Independent Censoring Assumption [4.8] 我々は,依存検閲の有無で生存モデルを評価するために,コプラに基づく3つの指標を提案する。
合成および半合成データセットにおける経験的分析により、我々の測定値が真の誤差に近い誤差推定を与えることを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:28:44 GMT)
Extendible quantum measurements and limitations on classical communication [4.8] 量子状態とチャネルの非拡張性は、量子力学の非閉定理と密接に関連している。
整数 $kge 2$ 毎に $k$-extendible 測定を定義する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:55:48 GMT)
Prompting Techniques for Secure Code Generation: A Systematic Investigation [4.8] 大規模言語モデル(LLM)は、プロンプト駆動プログラミングによるソフトウェア開発で勢いを増している。
LLMによるNL命令から生成されたコードのセキュリティに異なるプロンプト技術が与える影響について検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:28:11 GMT)
RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images [4.7] RetinaRegenは、可読性クラスフィカチオンモデル、拡散モデル、変分オートエンコーダを統合した網膜画像復元のためのハイブリッドモデルである。
SynFundus-1Mデータセットの既存の特徴は、提案手法がPSNR 27.4521、SSIM 0.9556、LPIPS 0.1911を光学ディスクの可読性ラベルとして達成していることを示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:10:30 GMT)
Adaptive debiased SGD in high-dimensional GLMs with streaming data [4.7] 本稿では,高次元一般化線形モデルにおけるオンライン推論に対する新しいアプローチを提案する。
提案手法は単一パスモードで動作し,全データセットアクセスや大次元要約統計ストレージを必要とする既存手法とは異なる。
我々の方法論的革新の核心は、動的目的関数に適した適応的降下アルゴリズムと、新しいオンラインデバイアス処理である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:46:00 GMT)
Distributed Stochastic Optimization of a Neural Representation Network for Time-Space Tomography Reconstruction [4.7] X線CT(CT)を用いた動的事象や変形物体の4次元時間空間再構成は,非破壊評価において重要な逆問題である。
分散暗黙的ニューラル表現(DINR)ネットワークを用いて,新しい分散トレーニングアルゴリズムを用いてトレーニングした4次元時間空間再構成を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:31:31 GMT)
Marking Code Without Breaking It: Code Watermarking for Detecting LLM-Generated Code [4.6] コードウォーターマーキングは、生成中にパターンをコードに埋め込むことで、AI生成コードを特定する。
既存のメソッドは、条件式中のキーワードなど、プログラムロジックにとって重要なトークンを修正することが多い。
本稿では,非構文トークンにのみ透かしを選択的に挿入することで,機能的整合性を維持するSTONEを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:46:13 GMT)
Text-driven 3D Human Generation via Contrastive Preference Optimization [4.6] 本稿では, 肯定的, 否定的両方のプロンプトによって導かれる, コントラスト的嗜好を導入する新しい枠組みを提案する。
本手法はテクスチャリアリズムを著しく向上させ,テクスチャ記述と視覚的アライメントを両立させる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:51:16 GMT)
Physics-Based Hybrid Machine Learning for Critical Heat Flux Prediction with Uncertainty Quantification [4.5] 本研究では,不確実性を考慮したハイブリッドモデリング手法の開発と検証を行う。
機械学習と物理モデルを組み合わせて、ドライアウトの場合の原子炉の臨界熱流束を予測する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:55:01 GMT)
Verde: Verification via Refereed Delegation for Machine Learning Programs [4.5] 本稿では,参照デリゲートの暗号概念を機械学習環境に適用することを提案する。
このアプローチにより、計算に制限のあるクライアントは、プログラムを複数の信頼できない計算プロバイダに委譲することができる。
我々は,参照デリゲートがクライアントの強い保証と計算プロバイダの実践的オーバーヘッドの両方を達成することを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:53:31 GMT)
Conversational Planning for Personal Plans [4.5] 大きな言語モデル(LLM)は、現実の目標や完成までに長い時間を要するタスクを支援するために、ますます使われています。
本研究では,LLMがエージェントの次のマクロアクションを決定するメタコントローラとして機能する新しいアーキテクチャを探索する。
このパラダイムが、学術的・非学術的なタスクの指導から、個人の健康計画のための会話型コーチングまで、どのようなシナリオに応用できるかを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:04:26 GMT)
Non-Hermitian delocalization in 1D via emergent compactness [4.4] 我々は、虚偽の潜在的な障害を含む、別の非局在化経路を見つける。
完全にランダムな電位は一般に局所化につながるが、障害に最小限の空間構造を与えると非局在化を防げる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:00:17 GMT)
Associative memory and dead neurons [4.3] 死んだ神経細胞の問題に弱いエネルギー関数について検討する。
これらの平坦な領域では、エネルギー関数だけですべての自由度を完全に決定することはできない。
我々は、死んだ神経細胞に対応する平坦な方向による問題を解決する方法を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:04:33 GMT)
Adaptive and Accessible User Interfaces for Seniors Through Model-Driven Engineering [4.2] AdaptForgeは新しいモデル駆動エンジニアリング(MDE)ベースのアプローチで、Flutterアプリのユーザインターフェースと振る舞いの高度な適応をサポートする。
AdaptForgeはどのようにドメイン特化言語を使って高齢者のコンテキスト・オブ・ユース・シナリオをキャプチャするかを説明します。
本稿では,現実のFlutter開発者によるAdaptForgeの可能性を実証するための評価について報告する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:03:22 GMT)
Atom identification in bilayer moire materials with Gomb-Net [4.2] ファンデルワールス二層膜のモアレパターンは原子分解能画像の解析を複雑にする。
深層学習モデルであるGomb-Netを開発し,各層における座標と原子種を同定する。
これにより、ひずみやドーパント分布のような層特異的な量のマッピングが可能になる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:11:56 GMT)
Do LLMs exhibit demographic parity in responses to queries about Human Rights? [4.2] ヘッジ(hedging)と非確認(non-affirmation)とは、曖昧さや特定の言明に対する明確な支持の欠如を表す行動である。
我々は、異なる国家または社会的アイデンティティの文脈において、人権に関する新しいプロンプトを設計する。
ヘッジや非確認行動をキャプチャするためのメトリクスを開発します。
すべてのモデルが、異なるアイデンティティグループ間での人権をどう評価するかという点において、人口統計学上の相違があることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:19:35 GMT)
MENSA: A Multi-Event Network for Survival Analysis with Trajectory-based Likelihood Estimation [4.1] マルチイベントサバイバル分析のための新しい深層学習手法であるMENSAを紹介する。
MeNSAは、イベント間の複雑な依存構造をキャプチャしながら、入力特徴の表現を共同で学習する。
シングルイベント、競合リスク、マルチイベント問題において、優れた識別性能と正確な時間対イベント予測を一貫して提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:34:56 GMT)
The Impact of Persona-based Political Perspectives on Hateful Content Detection [4.0] 政治的に多様な言語モデルは、多くの研究者や組織にアクセスできない計算資源を必要とする。
近年の研究では、ペルソナをベースとしたプロンプトが、追加の訓練なしに、モデルアウトプットに政治的多様性をもたらすことが確認されている。
本稿では、下流業務における政治的事前訓練に匹敵する結果が得られるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:23:41 GMT)
One Set to Rule Them All: How to Obtain General Chemical Conditions via Bayesian Optimization over Curried Functions [4.0] 一般性指向型BOが一般最適化の識別をいかに加速するかを考察する。
一般性指向の最適化では、パラメータとタスク選択を分離する単純なミオピック最適化戦略がより複雑なものに相容れないことが分かる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:25:48 GMT)
HDM: Hybrid Diffusion Model for Unified Image Anomaly Detection [3.9] 異常検出は、産業品質検査や医療画像撮影などの応用において重要な役割を担っている。
既存の手法は、しばしば複雑で多様な異常パターンに悩まされる。
生成と識別を統一されたフレームワークに統合する新しいハイブリッド拡散モデル(HDM)を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:05:58 GMT)
A stochastic first-order method with multi-extrapolated momentum for highly smooth unconstrained optimization [3.9] 提案したSFOMは,目的関数の高次滑らか度を$f$とすることで,最適化を高速化できることを示す。
我々の知る限りでは、これは対象関数の任意の次スムーズネスを加速度に利用した最初のSFOMである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:28:40 GMT)
MHAF-YOLO: Multi-Branch Heterogeneous Auxiliary Fusion YOLO for accurate object detection [3.9] MHAF-YOLOは,Multi-Branch Auxiliary FPN(MAFPN)と呼ばれる多機能ネックデザインを特徴とする新しい検出フレームワークである。
SAFは背骨と首を浅い特徴を融合させて橋渡しし、重要な低レベル空間情報を高い忠実度で効果的に転送する。
AAFは、より深いネック層におけるマルチスケールの特徴情報を統合し、出力層によりリッチな勾配情報を提供し、さらにモデル学習能力を高める。
RepHMSはグローバルにネットワークに統合されており、GHFKSを利用して様々な特徴層に対して大きな畳み込みカーネルを選択し、垂直受容領域を拡張し、空間階層にわたってコンテキスト情報をキャプチャする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:02:16 GMT)
Dynamic Degradation Decomposition Network for All-in-One Image Restoration [3.9] 本稿では,オールインワン画像復元のための動的劣化分解ネットワークD$3$Netを提案する。
D$3$Netは、クロスドメイン相互作用と動的分解分解を通じて誘導プロンプトによる劣化適応画像復元を実現する。
複数の画像復元タスクの実験では、D$3$Netは最先端のアプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:49:58 GMT)
3D Nephrographic Image Synthesis in CT Urography with the Diffusion Model and Swin Transformer [3.9] 提案手法は,高品質な3次元腎画像の合成を効果的に行う。
画像の品質を損なうことなく、CTUの放射線線量を33.3%削減することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:22:31 GMT)
TrajLLM: A Modular LLM-Enhanced Agent-Based Framework for Realistic Human Trajectory Simulation [3.8] この作業は、Large Language Models(LLM)を活用して人間のモビリティをシミュレートし、従来のモデルにおける高コストやプライバシの問題に対処する。
我々の階層的枠組みは、実世界の人口統計と心理データを用いて、ペルソナ生成、活動選択、目的地予測を統合している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:13:26 GMT)
SigDiffusions: Score-Based Diffusion Models for Time Series via Log-Signature Embeddings [3.8] SigDiffusionは、データのログ署名埋め込みで動作する新しい拡散モデルである。
信号を取り戻すために、我々は新しい閉形式反転式を提供する。
これらの式とSigDiffusionを組み合わせることで、高品質な時系列生成が得られることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:38:40 GMT)
New Protocols for Conference Key and Multipartite Entanglement Distillation [3.8] ネットワークにおける量子情報処理の2つの相互接続問題にアプローチする。
第1の問題は、複数の法的プレーヤと盗聴者の間でソース状態が共有される際の会議鍵の蒸留である。
第二に、グリーンベルガー=ホルン=ザイリンガー状態(GHZ)の蒸留は、局所的な操作と古典的なコミュニケーションによって行われる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:46:59 GMT)
Gaussian Process Upper Confidence Bound Achieves Nearly-Optimal Regret in Noise-Free Gaussian Process Bandits [3.7] ノイズフリーGP-UCBのほぼ最適残響上限を示す。
具体的には、二乗指数核とマタン核のノイズフリー設定において、最初の一定の累積的後悔を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:10:51 GMT)
Real-time Sign-Problem-Suppressed Quantum Monte Carlo Algorithm For Noisy Quantum Circuit Simulations [3.7] オープン量子系の力学をシミュレートする実時間量子モンテカルロアルゴリズムを提案する。
我々のアルゴリズムは、個体群動態を用いて標識問題を継続的に抑制し、進化を通してその蓄積を阻止する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:31:23 GMT)
A City of Millions: Mapping Literary Social Networks At Scale [3.5] このデータセットは、前例のない規模で歴史的な社会世界に関する情報を提供する。
これには1,192,855人のデータが含まれており、2,805,482人のペアワイド関係が親和性と関係タイプにアノテートされている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:11:47 GMT)
UNB StepUP: A footStep database for gait analysis and recognition using Underfoot Pressure [3.5] StepUPデータベースは、高解像度の圧力感知タイルで収集された歩行圧力データを備えている。
最初のリリースには、150人の個人から20万以上の足跡が含まれている。
データセットは、圧力ベースの歩行分析と認識のための新しいベンチマークを設定する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:51:31 GMT)
Quantum natural gradient with thermal-state initialization [3.5] 熱状態を持つPQCに対してフィッシャー情報行列、ウィグナー・ヤネーゼ、クボ・モリ情報行列の3つの量子一般化を計算するための正確な方法を提案する。
これらの行列要素は、アダマール検定、古典的ランダムサンプリング、ハミルトニアンシミュレーションを組み合わせた量子アルゴリズムを用いて推定できることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:00:05 GMT)
Treatment Non-Adherence Bias in Clinical Machine Learning: A Real-World Study on Hypertension Medication [3.5] 本研究では,非遺伝治療が因果推論と予測モデルの両方を歪ませる暗黙バイアスをいかに導入するかを検討する。
本研究は, 患者に報告された副作用や補充困難などの要因とともに, 非アドヒアランスに関連する重要な人口統計学的, 臨床的要因を同定する。
このことは、責任と公平な臨床機械学習システムの開発において、治療の非整合性に対する説明の重要性を強調している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:30:55 GMT)
Starjob: Dataset for LLM-Driven Job Shop Scheduling [3.4] ジョブショップスケジューリング問題(JSSP)の最初の教師付きデータセットであるStarjobを紹介します。
LLaMA 8B 4ビット量子化モデルをLoRA法で微調整し、エンドツーエンドのスケジューリング手法を開発した。
提案手法は従来のプライオリティ・ディスパッチ・ルール(PDR)を超えるだけでなく,L2Dのような最先端のニューラルアプローチよりも顕著に改善されていることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:20:01 GMT)
Atlas: A Framework for ML Lifecycle Provenance & Transparency [3.4] 我々は、完全に検証可能な機械学習パイプラインを可能にするフレームワークであるAtlasを提案する。
Atlasは、モデルのアーティファクト認証とエンドツーエンドの血統メタデータの検証可能なレコードを収集している。
プロトタイプ実装は、MLライフサイクルの透明性システムを構築するために、いくつかのオープンソースツールを統合している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:18:03 GMT)
SteeredMarigold: Steering Diffusion Towards Depth Completion of Largely Incomplete Depth Maps [3.4] SteeredMarigold は訓練なし、ゼロショット深度補完法である。
主に不完全な深度写像であっても、計量密度の深い深度を生成する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:22:50 GMT)
Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles [3.4] ドメイン不変点クラウド認識のためのマルチビュー構造畳み込みネットワーク(MSCN)。
MSCNは、ポイントクラウドから局所的なコンテキスト幾何学的特徴を抽出する構造畳み込み層(Structure Convolution Layers, SCL)から構成される。
MSCNは、ソースドメインポイントクラウドから派生した見えないドメインポイントクラウドでトレーニングすることで、機能表現を強化する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:53:53 GMT)
ECG-Expert-QA: A Benchmark for Evaluating Medical Large Language Models in Heart Disease Diagnosis [3.3] ECG-Expert-QAは、ECG解釈における診断能力を評価するために設計された総合的なマルチモーダルデータセットである。
データセットは47,211個の精巧にキュレートされた質問応答ペアで構成され、臨床シナリオの範囲にまたがる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:57:16 GMT)
Arbitrary Volumetric Refocusing of Dense and Sparse Light Fields [3.1] 本稿では,高密度あるいはスパース光場における複数の任意の領域を同時に再焦点するエンドツーエンドパイプラインを提案する。
我々は、LFを再フォーカスするために、典型的なシフト・アンド・サム方式の画素依存シフトを用いる。
ゴーストアーティファクトをほぼ完全に除去するために,U-Netアーキテクチャに基づくディープラーニングモデルを採用している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:47:23 GMT)
Uncertainty Comes for Free: Human-in-the-Loop Policies with Diffusion Models [3.1] 本研究では,拡散政策が人的援助を必要時にのみ積極的に求め,一定の人的監視への依存を減らす方法を提案する。
我々は、拡散政策の生成過程を利用して、自律エージェントが展開時にオペレーター支援を要求できる不確実性に基づくメトリクスを計算する。
この手法は, 自律的な性能向上のために, 微調整拡散ポリシーの効率的なデータ収集に有効であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:12:29 GMT)
Text2Robot: Evolutionary Robot Design from Text Descriptions [3.1] ユーザテキスト仕様とパフォーマンス選好を物理的四足歩行ロボットに変換するフレームワークであるText2Robotを紹介した。
Text2Robotは、高速なプロトタイピングを可能にし、生成モデルによるロボットデザインの新しい機会を開く。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:47:08 GMT)
Overcoming Annotation Bottlenecks in Underwater Fish Segmentation: A Robust Self-Supervised Learning Approach [3.1] 本稿では,Deep Learning を用いた魚のセグメンテーションのための自己教師型学習手法を提案する。
手動のアノテーションを使わずにトレーニングされた我々のモデルは、拡張ビューにまたがる特徴を整列することで、堅牢で一般化可能な表現を学習する。
DeepFish、Seagrass、YouTube-VOSの3つの挑戦的な水中ビデオデータセットでその効果を実証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:28:37 GMT)
How to Track and Segment Fish without Human Annotations: A Self-Supervised Deep Learning Approach [3.1] 魚の追跡とセグメンテーションのためのディープニューラルネットワーク(DNN)のトレーニングには、高品質なラベルが必要である。
本研究では,映像データの空間的・時間的変動に依存する教師なしの手法を提案する。
本フレームワークは,(1) フレーム間の空間的・時間的整合性を利用して擬似ラベルを生成する光学フローモデル,(2) 擬似ラベルを漸進的に洗練する自己教師型モデル,(3) 分割ネットワークの3段階からなる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:20:12 GMT)
Weaker LLMs' Opinions Also Matter: Mixture of Opinions Enhances LLM's Mathematical Reasoning [3.0] 大規模言語モデル(LLM)は、特に数学において、公式な推論能力への関心を高めている。
そこで本研究では,より弱いLLMからの意見の混合(MoO)を利用して,(相対的に)強いLLM推論を強化するポストトレーニング手法を提案する。
その結果,LLMの考え方を取り入れることで,数学的推論が平均5%向上し,推論作業における多様な視点の価値が浮き彫りになることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:22:02 GMT)
Retrieval Augmented Anomaly Detection (RAAD): Nimble Model Adjustment Without Retraining [3.0] Retrieval Augmented Anomaly Detectionは、Retrieval Augmented Generationからインスピレーションを得た新しい手法である。
人間の注釈付きサンプルはベクトルストアに送られ、モデル推論のために、非常に次の処理バッチでモデル出力を変更することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:17:16 GMT)
Foundation Inference Models for Stochastic Differential Equations: A Transformer-based Approach for Zero-shot Function Estimation [3.0] 本稿では,SDEのドリフトと拡散関数を正確にゼロショットで推定できる変換器を用いた認識モデルであるFIM-SDE(Foundation Inference Model for SDEs)を紹介する。
我々は,FIM-SDEと同一(事前訓練)のFIM-SDEが,多種多様な合成および実世界のプロセスにわたって頑健なゼロショット関数推定を実現することを実証した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:04:02 GMT)
Enhancing Reusability of Learned Skills for Robot Manipulation via Gaze and Bottleneck [3.0] 我々は、GazeベースのBottleneck対応ロボットマニピュレーション(GazeBot)という新しいアルゴリズムを提案する。
GazeBotは、最先端の模倣学習手法と比較して高い一般化性能を実現する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:53:59 GMT)
Like Father, Like Son: Kinship-Aware Preference Mapping (KARMA) for Automatic Alignment in Large Language Models [3.0] Kinship-Aware pReference MApping (KARMA)は、同等の能力を持つモデルから応答をペアリングする新しいフレームワークである。
類似の複雑さと品質の出力に対する選好比較を制約することにより、KARMAは選好データの情報性を高める。
経験的評価は、我々の親族認識アプローチがより一貫性があり、解釈可能なアライメントの結果をもたらすことを示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:36:40 GMT)
To Switch or Not to Switch? Balanced Policy Switching in Offline Reinforcement Learning [3.0] 強化学習は、収集した長期累積報酬を最大化する最適な行動を見つける。
いくつかの決定問題では、政策変更の可能性に直面し、それは無視できないコストを引き起こす。
オフラインRLにおける利得と切り替えコストのバランスをとるための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:10:04 GMT)
Deep-Bench: Deep Learning Benchmark Dataset for Code Generation [2.9] DeepBenchは関数レベルのディープラーニングコード生成のための新しいベンチマークデータセットである。
最先端のLDMであるGPT-4oはDeepBenchでは31%の精度を達成し、DS-1000では60%よりも大幅に低かった。
DeepBench は LLM のパフォーマンスと DL ドメインの潜在的な改善領域に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:43:50 GMT)
The Design Space for Online Restorative Justice Tools: A Case Study with ApoloBot [2.8] ApoloBotは、オンラインコミュニティで害が生じた場合の謝罪を促進するために設計されたDiscordボットである。
この研究は、オンライン修復正義ツールを採用する可能性について、より詳細な知見を得るための先行研究に基づいている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:10:22 GMT)
ChemScraper: Leveraging PDF Graphics Instructions for Molecular Diagram Parsing [2.8] 本稿では,デジタルPDFプリミティブを入力として利用する新しいモデルを提案する。
モデルは高速で正確であり、光学文字認識(OCR)やベクトル化を必要としない。
画像のアノテートにパーシングを使用し、画像中の分子を認識するために新しいマルチタスクニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:16:28 GMT)
EndoMamba: An Efficient Foundation Model for Endoscopic Videos [2.7] 視覚ナビゲーションや外科的位相認識などの内視鏡的ビデオベースのタスクは、リアルタイムの補助を提供することで、最小侵襲の手術において重要な役割を果たす。
近年のビデオ基礎モデルは有望なものとなっているが、その応用は、内視鏡の訓練のための限られたデータによる計算不効率と準最適性能によって妨げられている。
これらの問題に対処するため,一般化表現を取り入れたリアルタイム推論のための基礎モデルであるEndoMambaを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:36:16 GMT)
Partially Observed Trajectory Inference using Optimal Transport and a Dynamics Prior [2.7] 軌道推論は、時間的限界のスナップショットから集団の時間的ダイナミクスを回復しようとする。
先行研究は、観測空間に勾配駆動ドリフトを持つ微分方程式(SDE)モデルの下で行われる。
本稿では,この潜在軌道推定問題の解法としてPO-MFLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:58:39 GMT)
BEYONDWORDS is All You Need: Agentic Generative AI based Social Media Themes Extractor [2.7] ソーシャルメディア投稿のテーマ分析は、公開談話に対する大きな理解を提供する。
従来の手法は、構造化されていない大規模なテキストデータの複雑さとニュアンスを捉えるのに苦労することが多い。
本研究では,事前学習した言語モデルからツイートの埋め込みを統合したテーマ分析のための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:18:37 GMT)
Evaluating LLMs and Pre-trained Models for Text Summarization Across Diverse Datasets [2.7] 本研究では,BART,FLAN-T5,LLaMA-3-8B,Gemma-7Bの4大言語モデルについて,徹底的に評価する。
評価はROUGE-1, ROUGE-2, ROUGE-L, BERTScore, METEORなどの広く知られている自動測定値を用いて、一貫性のある情報的な要約を生成する際のモデルの能力を評価する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:32:07 GMT)
Predicting Quality of Video Gaming Experience Using Global-Scale Telemetry Data and Federated Learning [2.3] フレーム・パー・秒(FPS)はゲーム体験に大きな影響を与える。
グローバルスケールのデータセット上でゲームFPSに影響を与える可能性のある要因について検討する。
ユーザプライバシを確保するためのフェデレーション学習モデルを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:23:45 GMT)
QueryAdapter: Rapid Adaptation of Vision-Language Models in Response to Natural Language Queries [2.3] 本稿では,学習済みのVLMを自然言語クエリに迅速に適応する新しいフレームワークを提案する。
VLMの機能をクエリに関連するセマンティッククラスと整合させるために、前回のデプロイメントで収集された不正なデータを使用します。
また、実際のデータを適応するために使用する場合、クエリと無関係なオブジェクトをどのように扱うべきかについても検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:07:28 GMT)
Dynamic Classification: Leveraging Self-Supervised Classification to Enhance Prediction Performance [2.3] 本稿では,ゼロミス検出と最小偽陽性の目的を達成するために,革新的な動的分類アルゴリズムを提案する。
このアルゴリズムは、データを教師付きモデルを用いてN相当のトレーニングサブセットとN予測サブセットに分割し、その後にN別個の予測モデルから独立した予測を行う。
実験結果から,データ分割誤差が最小である場合,動的分類アルゴリズムは誤り検出をゼロとし,誤検出を最小にすることで,例外的な性能を達成することが示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:11:12 GMT)
Towards Explainable TOPSIS: Visual Insights into the Effects of Weights and Aggregations on Rankings [2.2] We generalize the concept of MSD-space to weighted criteria by introduced the concept of WMSD-space。
我々は,TOPSISと類似の距離ベースアグリゲーション手法が平面上でうまく説明できることを実証した。
提案するWMSD空間は,現実世界の意思決定問題においてTOPSISランキングを説明するための実用的な方法を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:04:01 GMT)
Local Optimization of Quantum Circuits (Extended Version) [2.2] 本稿では,効率性と品質保証を両立できる量子プログラムの最適化手法を提案する。
局所最適性の概念はカット・アンド・メルド回路最適化アルゴリズムによって実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:53:54 GMT)
Improved Physics-informed neural networks loss function regularization with a variance-based term [2.2] 機械学習や統計モデリングにおいて、平均二乗または絶対誤差は誤差計量として一般的に用いられる(「損失関数」とも呼ばれる)。
本稿では,選択した誤差量の平均偏差と標準偏差を組み合わせた新しい損失関数を提案する。
その結果, 平均損失よりも解の質が向上し, 最大誤差も低かった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:31:35 GMT)
Asymptotic Analysis of Sample-averaged Q-learning [2.2] 本稿では、サンプル平均Qラーニング(SA-QL)と呼ばれる、時間変化のバッチ平均Qラーニングのためのフレームワークを提案する。
サンプル平均化アルゴリズムの機能的中心極限を軽度条件下で利用し,間隔推定のためのランダムなスケーリング手法を開発した。
この研究は、サンプル平均Q-ラーニングのための統一理論基盤を確立し、効率的なバッチスケジューリングとRLアルゴリズムの統計的推論に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:39:06 GMT)
On the Byzantine Fault Tolerance of signSGD with Majority Vote [2.2] 多数決のSignSGDのような符号ベースの圧縮アルゴリズムは、SGDの軽量な代替手段を提供する。
我々は,シグナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズ
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:26:33 GMT)
Learning Code-Edit Embedding to Model Student Debugging Behavior [2.1] 本稿では,学生の連続的なコード入力間で有意義なコード編集を学習するエンコーダ-デコーダモデルを提案する。
テストケースの正確性を改善しながら、生徒のコーディングスタイルを維持するための、パーソナライズされた次のステップのコード提案を可能にする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:54:39 GMT)
REALM-Bench: A Real-World Planning Benchmark for LLMs and Multi-Agent Systems [2.1] このスイートは、基本的なものから非常に複雑なものへと進化する11の設計された問題を含んでいる。
それぞれの問題は、並列計画スレッドの数、依存性間の複雑さ、予期せぬディスラプションの頻度の3つの次元に沿ってスケールすることができる。
このベンチマークは、現実世界のアプリケーションのためのより堅牢で適応可能なAI計画システムの開発を進めることを目的としている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:24:22 GMT)
Optimizing Multi-Stuttered Speech Classification: Leveraging Whisper's Encoder for Efficient Parameter Reduction in Automated Assessment [2.1] 本研究は, 発声音声における不一致の同定における最後のエンコーダ層の役割を明らかにするものである。
計算効率が良く、訓練のためのパラメータが83.7%少なくなり、提案されたアプローチは様々な方言や言語に適応できるようになった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:31:34 GMT)
TabGLM: Tabular Graph Language Model for Learning Transferable Representations Through Multi-Modal Consistency Minimization [2.1] TabGLM (Tabular Graph Language Model) はテーブルの構造情報と意味情報の両方をモデル化する新しいマルチモーダルアーキテクチャである。
テーブルの各行を完全に連結されたグラフとシリアライズされたテキストに変換し、それぞれグラフニューラルネットワーク(GNN)とテキストエンコーダを使って符号化する。
25のベンチマークデータセットに対する評価は、大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:32:45 GMT)
Pairwise independent correlation gap [2.1] 我々は、n$元上で定義される任意の非負の単調部分モジュラー集合関数に対して、この比は4/3$で上界となることを示す。
これは、相互独立を保ち、相互独立と相互独立の根本的な違いを示す「相関ギャップの境界」とは異なる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:48:19 GMT)
GONet: A Generalizable Deep Learning Model for Glaucoma Detection [2.1] 緑内障性視神経症(英: Glaucomatous optic neuropathy, GON)は、早期に発見され治療を受けなければ、視力喪失を招きかねない眼疾患である。
近年,デジタル眼底画像からGON検出を自動検出する深層学習モデルは,将来性を示しているが,一般化性に限界がある場合が多い。
GONetは、7つの独立したデータセットを用いて開発された堅牢なディープラーニングモデルである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:28:09 GMT)
Residual Speech Embeddings for Tone Classification: Removing Linguistic Content to Enhance Paralinguistic Analysis [2.0] 本稿では,言語コンテンツからパラ言語的特徴を引き離す手法を提案する。
本手法を複数の自己教師型音声埋め込みに適用して評価し,残差埋め込みがトーン分類性能を著しく向上させることを示した。
これらの知見は、感情分析、話者特性解析、パラ言語音声処理における残留埋め込みの可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:32:15 GMT)
Fatigue-PINN: Physics-Informed Fatigue-Driven Motion Modulation and Synthesis [2.0] 疲労条件下での人間の動作をモデル化するための運動合成タスクには疲労モデリングが不可欠である。
本稿では,物理インフォームドニューラルネットワークに基づくディープラーニングフレームワークであるFreep-PINNを提案する。
本研究では,三成分制御モデルのPINN適応を利用して最大関節トルクの疲労誘起変動をシミュレートする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:14:48 GMT)
The Advancement of Personalized Learning Potentially Accelerated by Generative AI [2.0] ジェネレーティブAI(GAI)の急速な発展は、教育の様々な側面に革命的な変化をもたらした。
本研究は, GAIによるパーソナライズされた学習の様々な側面の強化の可能性について, 既存研究の徹底的な分析を通じて検討した。
GAIは、個人の好みやニーズに合わせて適応的な学習体験を提供する際、例外的な能力を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:54:04 GMT)
On the Usefulness of the Fit-on-the-Test View on Evaluating Calibration of Classifiers [2.0] テストセット上のキャリブレーション誤差 (ECE) によるキャリブレーションの評価は, 明確に適合しないことを示す。
これは、評価に適合するビューを動機付けます。
(3)真のキャリブレーションマップを正確に推定できる擬似実データに対するベンチマーク,(4)新しいキャリブレーションマップファミリーPLとPL3を用いた新しいキャリブレーションと評価手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:58:47 GMT)
Bridging Critical Gaps in Convergent Learning: How Representational Alignment Evolves Across Layers, Training, and Distribution Shifts [1.9] 既存の作業の多くは、適切なアライメントに必要な変換不変性を見越して、限られたメトリクスセットに依存しています。
2つ目の重要なギャップは、トレーニング中にアライメントが現れるときの理解にある。
コンバージェンスがタスク固有の学習と共に徐々に構築されるという期待とは対照的に、我々の研究結果は、コンバージェンスはほぼすべてのコンバージェンスが最初のエポック内で発生していることを明らかにする。
これらの知見は、表現の収束の理解において重要なギャップを埋め、神経科学とAIに影響を及ぼす。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:04:24 GMT)
Application of Multimodal Large Language Models in Autonomous Driving [1.8] マルチモーダル大言語モデルの実装について詳細な研究を行う。
自律運転におけるMLLMの性能の低下に対処する。
次に、シーン理解、予測、意思決定によってAD意思決定プロセスを分解する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:01:49 GMT)
An Improved 3D Skeletons UP-Fall Dataset: Enhancing Data Quality for Efficient Impact Fall Detection [1.8] 秋検出研究の重要なリソースであるUP-Fallデータセットは、価値が証明されているが、データの正確性と包括性の制限に悩まされている。
本研究は,3Dスケルトンデータを組み込んだ衝撃落下検出のためのUP-Fallデータセットの改良について述べる。
我々の前処理技術は高いデータ精度と包括性を保証し、より信頼性の高い衝突落下検出を可能にする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:02:44 GMT)
ANPMI: Assessing the True Comprehension Capabilities of LLMs for Multiple Choice Questions [1.6] 様々なプロンプトと選択からなる多重選択ベンチマークは、言語モデルの自然言語理解能力を評価する最も広く使われている手法の一つである。
提案手法を用いて測定された性能は,プロンプトに対するモデルによる理解だけでなく,プロンプトによらず特定の選択に対する固有のバイアスも反映している。
本稿では,ポイントワイド・ミューチュアル・インフォメーション(PMI)を$-log P(Choice)$で正規化するANPMIという新しい計量法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:10:18 GMT)
Drawing Pandas: A Benchmark for LLMs in Generating Plotting Code [1.6] PandasPlotBenchは、ビジュアルデータ探索のアシスタントとして言語モデルの有効性を評価するように設計されている。
データセットには175のユニークなタスクが含まれている。
我々の実験は、Matplotlib、Seaborn、Plotlyの3つの可視化ライブラリにわたる主要なLarge Language Model(LLM)を評価した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:52:21 GMT)
SparseTransX: Efficient Training of Translation-Based Knowledge Graph Embeddings Using Sparse Matrix Operations [1.6] 知識グラフ(KG)学習は、新しい知識を生成し、推論を行うための強力なフレームワークを提供する。
KG埋め込みのトレーニングには、特に大規模なデータセットでは、非常に長い時間がかかる可能性がある。
コア埋め込みをSpMMカーネルに置き換えることでこの問題に対処する。
これにより、複数のスキャッタ操作を単一の操作として統一し、トレーニング時間とメモリ使用量を削減できます。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:00:02 GMT)
Guarding the Privacy of Label-Only Access to Neural Network Classifiers via iDP Verification [1.6] ニューラルネットワークは、トレーニングセットのプライベート情報を抽出できるプライバシー攻撃の影響を受けやすい。
いくつかのトレーニングアルゴリズムは、計算にノイズを加えることで、差分プライバシー(DP)を保証する。
我々は,ラベルのみのアクセスを最小限の精度で保護できる,最強のiDP-DBを計算するためのLUCIDを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:31:42 GMT)
Late Breaking Results: The Art of Beating the Odds with Predictor-Guided Random Design Space Exploration [1.6] 高性能回路は、性能、電力、コストにとって不可欠である。
本研究はMIG合成におけるランダム探索による組合せディジタル回路の改良手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:01:59 GMT)
Beyond Surface-Level Patterns: An Essence-Driven Defense Framework Against Jailbreak Attacks in LLMs [1.6] EDDFはプラグイン・アンド・プレイ方式である。
1)オフライン本質データベースの構築,2)オンライン逆クエリ検出の2段階で動作する。
実験の結果,EDDFはアタック成功率を20%以上下げることにより既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:53:58 GMT)
CAMEx: Curvature-aware Merging of Experts [1.5] モデルトレーニングと微調整の間に専門家をマージするための既存の手法はユークリッド幾何学に依存している。
我々は,パラメータ多様体の非ユークリッド曲率を考慮に入れた,自然勾配を組み込んだ新しい専門家統合プロトコルであるCAMExを紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:52:31 GMT)
Automated Code Generation and Validation for Software Components of Microcontrollers [1.5] 本稿では,開発者の介入なしに既存の実装にシームレスに統合し,組込みシステムのためのソフトウェアコンポーネントを生成する手法を提案する。
STM32F407マイクロコントローラ上での動作のためのハードウェア抽象化層(HAL)コードの自動生成によってこれを実証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:50:33 GMT)
Walking through Hilbert Space with Quantum Computers [1.5] このレビューは、計算化学の重要な領域における複雑なサンプリングタスクに取り組む量子アルゴリズムの最近の進歩を強調している。
我々は、ハイブリッド量子古典から完全量子まで、幅広い量子アルゴリズムをレビューする。
量子計算の優位性を達成するための可能性と課題について論じる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:18:53 GMT)
Reproducibility in Machine Learning-based Research: Overview, Barriers and Drivers [1.5] 透明性の欠如、データまたはコードの欠如、標準への順守の欠如、MLトレーニングの敏感さは、原則として多くの論文が再現不可能であることを意味する。
実験では、オリジナルの結果と非常に類似性が低いことが判明した。
粗悪な完全性は研究結果の信頼と完全性を脅かす。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:34:49 GMT)
Clifford operations and homological codes for rotors and oscillators [1.5] 我々は円上の粒子の状態空間である平面ローターのプリミティブを開発する。
我々は、クリフォード演算の下での等価性に基づいて、ホモロジカルローターの誤り訂正符号と様々なローター状態の分類を行う。
これにより、新しい多モードホモロジーボゾン符号がデファス化や職業数の変化から保護される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:14:01 GMT)
Advancing calibration for stochastic agent-based models in epidemiology with Stein variational inference and Gaussian process surrogates [1.4] 疫学におけるエージェントベースモデル(ABM)の正確な校正は、公衆衛生政策の決定や介入に役立てるために重要である。
伝統的な校正法、例えばマルコフ・チェイン・モンテカルロ(MCMC)は、校正されるパラメータの確率密度関数を生成するが、しばしば計算コストがかかる。
本稿では,ガウス過程サロゲートを近似した疫学的ABMのキャリブレーション手法として,SVI(Stein Variational Inference)の有用性について検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:43:32 GMT)
Multi-modal Contrastive Learning for Tumor-specific Missing Modality Synthesis [1.4] 臨床環境での高品質なマルチモーダルMRIは、時間的制約、高コスト、患者の運動アーチファクトが原因で困難である。
悪性腫瘍領域に焦点をあてたマルチモーダルコントラスト学習を統合したMRIの再生モデルを構築した。
脳MR画像合成の課題で得られた結果は、提案モデルが欠落したモダリティを生成するのに優れていることを示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:34:58 GMT)
Controlled Diversity: Length-optimized Natural Language Generation [1.4] LLMは一般に、厳密な長さ要求に基づいて出力の長さを調整することができない。
本稿では,既存のデータを拡張し,既存の微調整技術を適用して,LCMを訓練する手法を提案する。
提案手法は,ベースラインモデルでは生成されなかったトレーニングデータを用いて,応答品質を変化させる可能性があることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:38:58 GMT)
Multispectral to Hyperspectral using Pretrained Foundational model [1.4] ハイパースペクトルイメージングは詳細なスペクトル情報を提供し、CH4やNO2のような温室効果ガスをモニターする大きな可能性を提供する。
その適用は、限られたカバレッジと頻繁な再訪時間によって制限されている。
対照的に、マルチスペクトルイメージングは空間的および時間的カバレッジを提供するが、正確な検出に必要なスペクトルの粒度は欠如している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:18:40 GMT)
Generalizable deep learning for photoplethysmography-based blood pressure estimation -- A Benchmarking Study [1.3] 光胸腺撮影による血圧推定は、カフベースのBP測定に代わる有望な方法である。
PPG波形からBPを推定する深層学習モデルが提案されている。
これらのモデルは、主に分散テストセットで評価されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:22:59 GMT)
OntologyRAG: Better and Faster Biomedical Code Mapping with Retrieval-Augmented Generation (RAG) Leveraging Ontology Knowledge Graphs and Large Language Models [1.3] In-context-learning representations のための検索拡張生成(RAG)法である OntologyRAG を開発した。
我々のソリューションはLLMを知識グラフとマッピングして質問を処理します。
私たちのソリューションでは、標準プロセスで知識グラフを更新することで、オントロジーの更新を反映できるため、LMを再トレーニングする必要はありません。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:56:10 GMT)
Random Similarity Isolation Forests [1.3] 本稿では,ランダム類似性分離林(Random similarityIsolate Forest)と呼ばれるマルチモーダル・アウトレイラ検出アルゴリズムを提案する。
本手法は,データセットと任意のデータ型の特徴の混合を扱うために,分離と類似性に基づくプロジェクションの概念を組み合わせる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:22:19 GMT)
Multi-Agent Security Tax: Trading Off Security and Collaboration Capabilities in Multi-Agent Systems [1.3] 我々は、セキュリティリスクとトレードオフを研究するために、共有目的に基づいて協力するAIエージェントのシミュレーションを開発する。
我々は、悪意のある指示の多重ホップ拡散という、感染した悪意のあるプロンプトを観察する。
この結果から,マルチエージェントシステムにおけるセキュリティと協調効率のトレードオフの可能性が示唆された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:00:35 GMT)
Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia [1.3] 急性骨髄性白血病(AML)におけるMRD(Representing and Minimal Residual Disease)は予後と予後に必須である。
本稿では, 最適輸送(OT)に基づく統計的学習手法について検討し, フロー計測の低次元表現を実現する。
特に、我々のOTベースのアプローチは、FlowSomアルゴリズムの結果の関連性および情報的2次元表現を可能にする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:11:39 GMT)
Improving the quality of Web-mined Parallel Corpora of Low-Resource Languages using Debiasing Heuristics [1.2] 異なるマルチPLMは特定の種類の文に偏りがあることを示し、ノイズの多い文が上位のサンプルに忍び込むことを可能にする。
これにより、ウェブマイニングコーパスでトレーニングしたNMTシステムの結果を改善し、マルチPLM間の格差を低減することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:56:43 GMT)
Trustworthy and Practical AI for Healthcare: A Guided Deferral System with Large Language Models [1.2] 大規模言語モデル(LLM)は、医療における様々なアプリケーションに有用な技術を提供する。
彼らの幻覚化傾向と既存のプロプライエタリなシステムへの依存は、批判的な意思決定に関する環境に課題をもたらす。
本稿では,障害分類のための医療報告を同時に解析し,ヒトへの知的な指導による不確実な予測を推論する新しいHAICガイド型deferralシステムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 00:49:57 GMT)
A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis [1.2] Fr'echet Inception Distance (FID)はImageNet Pretrained Inception-v3ネットワークで計算され、生成モデルの最先端評価指標として広く利用されている。
本稿では,FIDとその関連指標がタスク固有の評価目標と不一致であるカラーベース撮影や光コヒーレンストモグラフィなどの網膜画像モダリティの症例について検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:03:19 GMT)
Constructing balanced datasets for predicting failure modes in structural systems under seismic hazards [1.2] 本研究では、異なる障害モードを含むバランスのとれたデータセットを構築するためのフレームワークを提案する。
ディープニューラルネットワークモデルは、データセットのバランシングの重要性を強調するために、バランスの取れたデータセットと不均衡なデータセットに基づいてトレーニングされる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:11:51 GMT)
Vanishing Feature: Diagnosing Model Merging and Beyond [1.2] 結合モデルによる伝搬中に入力誘起特徴が減少する「消滅特徴」現象を同定する。
既存の正規化戦略は、消滅する特徴問題を的確に標的にすることで強化できることを示す。
初期層機能の保存に重点を置いたPFM(Preserve-First Merging')戦略を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:48:00 GMT)
Thermal Entanglement in Disordered Spin Chains: Localization, Thresholds, and the Quantum-to-Classical Crossover [1.1] 混合状態の絡み合いは、障害と温度の両方によって大きく形づくられている。
この研究は、小さなサブシステムの絡み合い特性とより広い熱環境を結びつけることによって、量子-古典遷移の理解を深める。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:57:38 GMT)
AiSAQ: All-in-Storage ANNS with Product Quantization for DRAM-free Information Retrieval [1.1] 本稿では、圧縮ベクトルをSSDインデックスにオフロードするAiSAQ(All-in-Storage ANNS with Product Quantization)を提案する。
本手法は,10 MB のメモリ使用率を数十億のデータセットによるクエリ検索で実現し,遅延の致命的な劣化を伴わない。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:47:30 GMT)
Provable Optimality of the Square-Tooth Atomic Frequency Comb Quantum Memory [1.1] 原子周波数コム(AFC)量子メモリは、量子リピータネットワークにとって有望な技術である。
最適化された正方形歯は全歯形の中で最も高い検索効率を示した。
我々の証明は、現実的な実験条件下で最適なAFCを作成するための厳密な基礎を築いた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:40:12 GMT)
AI-powered test automation tools: A systematic review and empirical evaluation [1.1] AI駆動のテスト自動化ツールは、ソフトウェア品質を改善し、手動テストの労力を減らす強力な可能性を示している。
将来の研究は、ソフトウェアテストの適応性、信頼性、堅牢性を改善するために、AIモデルを進化させることに焦点を当てるべきである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:27:58 GMT)
Theme-Explanation Structure for Table Summarization using Large Language Models: A Case Study on Korean Tabular Data [1.1] 本稿では,テーマ記述構造に基づくテーブル要約パイプライン(Tabular-TX)を提案する。
テーマ部が副詞句として現れ、説明部が予測節として続く構造化形式に従って要約文を生成する。
実験の結果,Tabular-TXは従来の微調整法よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:10:17 GMT)
Building Knowledge Graphs Towards a Global Food Systems Datahub [1.0] 様々な製品や生産方法にまたがって持続可能な農業の実践を包括的に調査する研究が欠如している。
持続可能な小麦生産に関連する知識をエンコードする一連のKNと知識グラフ(KG)を構築している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:13:11 GMT)
ART: Actually Robust Training [1.0] Artは、ディープラーニングパイプラインを開発しながら、ルールと標準を自動的に強制するように設計されたPythonライブラリである。
アートは、モデル開発を複雑さを増大させる一連の小さなステップに分割し、それぞれがプロセスの解釈可能性と堅牢性を改善する検証チェックで結論付けます。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:57:32 GMT)
LiGT: Layout-infused Generative Transformer for Visual Question Answering on Vietnamese Receipts [1.0] 本稿ではベトナムで最初の大規模文書VQAデータセットであるReceiptVQA(textbfReceipt textbfVisual textbfQuestion textbfAnswering)を紹介する。
データセットには textbf9,000+ のレシートイメージと textbf60,000+ の注釈付き質問応答ペアが含まれている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:09:28 GMT)
Blending Optimal Control and Biologically Plausible Learning for Noise-Robust Physical Neural Networks [0.9] 物理ニューラルネットワーク(PNN)は、効率的なニューロモルフィック情報処理を提供する。
本稿では,このトレーニングコストを大幅に削減するトレーニング手法を提案する。
トレーニング時間の短縮に加えて, 測定誤差やノイズの下でも, 頑健な処理を実現する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:10:40 GMT)
Detecting Linguistic Indicators for Stereotype Assessment with Large Language Models [0.9] 社会カテゴリーとステレオタイプは言語に埋め込まれており、大規模言語モデルにデータバイアスを導入することができる。
本稿では,文中のステレオタイプの言語指標を検出し,定量化する手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:15:28 GMT)
A local, many-worlds, model of quantum correlations with finite information flow [0.9] 空間的に分離された2つの最大絡み合った量子ビット上での射影測定の簡単なpsi-epistemic局所モデルを導入する。
そのランダム性のため、モデルは2つの「等重」分岐と有限情報フローを必要とする。
ランダム性と分岐性の両方を利用するこのハイブリッドアプローチは、シングルワールドとDeutsch-Hayden理論の重要な課題にどのように対処するかを考察する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:59:10 GMT)
Multiview graph dual-attention deep learning and contrastive learning for multi-criteria recommender systems [0.9] 本稿では,各エッジがユーザによる項目の基準値の1つを表すマルチエッジ二部グラフをベースとした,マルチキュートリリア・レコメンダシステムのための新しい表現を提案する。
我々は、各ビューとグラフ全体の正と負のサンプルを区別するために、局所的および大域的コントラスト学習を採用する。
提案手法を実世界の2つのデータセット上で評価し,項目評価予測に基づいて評価を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:25:58 GMT)
Forecasting intermittent time series with Gaussian Processes and Tweedie likelihood [0.8] 本稿では,間欠的時系列の確率的予測にガウス過程(GP)を導入する。
我々は、潜在GP変数と、負二項分布(NegBinGP)とツイーディ分布(TweedieGP)の2種類の予測分布を結合する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:31:56 GMT)
Graph Neural Networks embedded into Margules model for vapor-liquid equilibria prediction [0.8] 比較的単純なギブスエネルギーモデルに埋め込まれたグラフニューラルネットワーク(GNN)の性能を解析した。
この結果は、単純なギブスエネルギーモデルと無限希釈データにのみ訓練されたGNNを組み合わせた予測精度の基準となる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:03:47 GMT)
Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions [0.8] 皮膚黒色腫性病変の病理領域に特有な視覚言語モデルを構築した。
以上の結果から, モデル作成報告の品質スコアは, 病理学報告と同等であった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:52:10 GMT)
On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation [0.8] 病理学における視覚言語モデルにより、マルチモーダルケース検索と自動レポート生成が可能となる。
これまで開発されたモデルの多くは、スライド画像全体から推測できない情報を含む病理報告に基づいて訓練されてきた。
視覚言語モデリングのための病理報告からの情報選択がマルチモーダル表現の質や生成レポートにどのように影響するかを検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:45:09 GMT)
Enhancing operational wind downscaling capabilities over Canada: Application of a Conditional Wasserstein GAN methodology [0.7] 風下スケーリングは天気予報の空間分解能を改善するために不可欠である。
本研究は,DownGANフレームワークの拡張による風下スケーリングを推し進める。
風下スケール精度の大幅な向上を実現し,本手法の運用スケーラビリティを実証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:34:45 GMT)
dCMF: Learning interpretable evolving patterns from temporal multiway data [0.7] 我々は, LDS, Coupled Matrix Factorizations (CMF) とPARAFAC2モデルの関係を探索することにより, テンソル分解と動的モデリングのギャップを埋める。
そこで本稿では, 遅延因子の時間的変化を制約し, 特定のLSD構造に固執する, d(ynamical)CMFと呼ばれる時間的結合因子分解モデルを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:04:01 GMT)
IndicEval-XL: Bridging Linguistic Diversity in Code Generation Across Indic Languages [0.7] IndicEval-XLは6つの主要なIndic言語を組み込んだコード生成のための総合ベンチマークである。
私たちのベンチマークでは、これらの言語を12のプログラミング言語でブリッジし、堅牢な評価フレームワークを作成しています。
IndicEval-XLは、コード生成システムにおける言語多様性の拡大に向けた重要なステップである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:48:42 GMT)
EGR-Net: A Novel Embedding Gramian Representation CNN for Intelligent Fault Diagnosis [0.7] 回転機械の知的故障診断には特徴抽出が不可欠である。
複雑な1次元(1D)の振動信号を単純なテクスチャで2次元(2D)のイメージに変換することにより、畳み込みニューラルネットワーク(CNN)による視覚的特徴の認識と学習が容易になる。
本稿では,EGR ( Embedding Gramian Representation, Embedding Gramian Representation) と呼ばれる新しい1D-to-2D変換法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:05:56 GMT)
Clip-TTS: Contrastive Text-content and Mel-spectrogram, A High-Huality Text-to-Speech Method based on Contextual Semantic Understanding [0.7] Clip アーキテクチャに基づく TTS 方式 Clip-TTS を提案する。
この方法はClipフレームワークを用いてテキストエンコーディングの段階でテキストコンテンツと実際のメル-スペクトログラムの接続を確立する。
モデルアーキテクチャに関しては、Clip-TTSが高速な推論速度を実現するためのTransformerの基本構造を採用しています。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:09:33 GMT)
Attention-Guided Integration of CLIP and SAM for Precise Object Masking in Robotic Manipulation [0.7] 本稿では,コンビニエンスストアにおけるロボット操作のためのオブジェクトマスキングの精度を高めるための新しいパイプラインを提案する。
このアプローチはCLIPとSAMという2つの高度なAIモデルを統合し、シナジスティックな組み合わせとマルチモーダルデータの有効利用に焦点を当てている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:30:46 GMT)
Nexus: A Lightweight and Scalable Multi-Agent Framework for Complex Tasks Automation [0.7] マルチエージェントシステム(MAS)を簡単に構築および管理できるように設計されたPythonフレームワークであるNexusを紹介します。
ここでは,Nexus駆動のMASがHumanEvalで99%,VerilogEval-Humanで100%であることを示す。
これらのアーキテクチャは、複雑な推論と数学的問題解決において堅牢な習熟度を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:37:47 GMT)
Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation [0.6] p$3$VAEは、データ取得条件に関連する変動の潜在要因に関する事前の物理的知識を統合する変分自動エンコーダである。
本稿では,機械学習部と物理部のバランスをとる半教師付き学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:08:09 GMT)
Mixture models for data with unknown distributions [0.6] 実数値多変量データに対する混合モデルの幅広いクラスを記述・解析する。
データの分割と分布の推定の両方を返却し、クラスタリングと密度推定を各クラスタ内で同時に効果的に行う。
提案手法を図解的アプリケーション選択で実証し,両アルゴリズムをコードで実装する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:42:40 GMT)
Phase Transitions in Nonreciprocal Driven-Dissipative Condensates [0.6] 非平衡駆動散逸相転移における境界と空間的非相互性の影響について検討する。
我々のモデルはポストセレクションや非エルミート・ハミルトニアンを回避し、超伝導回路のようなプラットフォームで実験的に実現可能である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:44:28 GMT)
Tell me why: Visual foundation models as self-explainable classifiers [0.6] ビジュアルファウンデーションモデル(VFM)は、最先端のパフォーマンスのために人気が高まっている。
重要な応用には 解釈可能性が不可欠です
本研究は, VFMと新しいアーキテクチャ, 専門的な学習目標を組み合わせることを目的とする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:40:30 GMT)
Hamiltonian Learning via Shadow Tomography of Pseudo-Choi States [0.6] 我々は、疑似チョイ状態と呼ばれるリソースを通じてハミルトン語を学ぶための新しいアプローチを導入する。
M$ の項を持つハミルトニアンに対して、ハミルトニアン係数は誤差の中で古典的なシャドウトモグラフィーによって推定できることを示す。
また、我々の学習プロセスは、リソース状態のエラーやハミルトンクラスのエラーに対して堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:20:47 GMT)
Vision Foundation Models for Computed Tomography [0.5] 基礎モデル(FM)は、画像のモダリティを越えて多種多様な複雑なタスクを実行することにより、放射線学における変換可能性を示している。
そこで我々はCT-FM(CT-FM)を開発した。
CT-FMは画像データコモンズから148,000個のCTスキャンを用いてラベルに依存しないコントラスト学習によって事前訓練を行った。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:04:31 GMT)
A Prospect-Theoretic Policy Gradient Algorithm for Behavioral Alignment in Reinforcement Learning [0.5] 累積プロスペクト理論(CPT)は、人間に基づく意思決定のためのよりニュアンスなモデルを提供する。
CPTは、リスク、利益、損失に対する様々な態度と認識を捉えます。
我々はCPT-RLフレームワークを再考し、最適政策の性質に関する新たな理論的洞察を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:50:04 GMT)
Improved YOLOv12 with LLM-Generated Synthetic Data for Enhanced Apple Detection and Benchmarking Against YOLOv11 and YOLOv10 [0.4] YOLOv12nの構成は、0.916で最高精度、0.969で最高リコール、0.978で最高平均平均精度(mAP@50)を達成した。
YOLOv12はYOLOv11やYOLOv10より新しいが、YOLOv11nはYOLOv10、YOLOv11、YOLOv12の中では最速のYOLOアルゴリズムである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:24:01 GMT)
Self-supervised conformal prediction for uncertainty quantification in Poisson imaging problems [0.3] 本稿では,ポアソン画像問題に対する自己教師付き共形予測法を提案する。
Poisson Unbiased Risk Estorを使って、根拠となる真実データを必要としない。
提案手法は画像のデノゲーションとデブロワーリングに関する数値実験により実証された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:59:46 GMT)
Global symmetries of quantum lattice models under non-invertible dualities [0.3] 離散群 $G$ を (1+1)-次元量子格子モデル(英語版)の文脈でゲージする非可逆双対性の下での大域的対称性の変化について検討する。
二重コセットの代数環を形成する双対モデルの大域対称性の一般予想を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:25:04 GMT)
Revisiting Word Embeddings in the LLM Era [0.3] 大規模言語モデル(LLM)は、最近、様々なNLPタスクにおいて顕著な進歩を見せている。
従来の非コンテクスト化単語と文脈化単語の埋め込みをLLMによる埋め込みで比較した。
以上の結果から,LLMは意味的関連語をより緊密にクラスタ化し,非文脈化設定における類似処理をより良く行うことが示唆された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:45:08 GMT)
Recurrent Auto-Encoders for Enhanced Deep Reinforcement Learning in Wilderness Search and Rescue Planning [0.3] 荒野の捜索と救助活動は、しばしば広大な景観で行われている。
問題は完全なカバレッジではなく、利用可能な限られた時間に収集された情報の最大化の1つだ。
本稿では,再帰型オートエンコーダと深部強化学習を組み合わせることで,探索問題のより効率的な解法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:54:47 GMT)
Improving Pain Classification using Spatio-Temporal Deep Learning Approaches with Facial Expressions [0.3] 痛み管理と重症度検出は効果的な治療に不可欠である。
伝統的な自己申告法は主観的であり、非言語的個人には適さない。
表情を用いた痛みの自動検出について検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:33:44 GMT)
Universal quantum homomorphic encryption based on $(k, n)$-threshold quantum state sharing [0.3] ホモモルフィック暗号化は 量子コンピューティングと ホモモルフィック暗号化を統合します
量子状態共有に基づく普遍量子同型暗号スキームを,$(k, n)$-threshold で提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:56:25 GMT)
SoK: The Design Paradigm of Safe and Secure Defaults [0.3] セキュリティエンジニアリングでは、安全でセキュアなデフォルトを好むように指示する、よく知られた設計パラダイムがあります。
本稿では,このパラダイムの知識の体系化を,体系的なマッピング研究と関連する文献のスコーピングレビューを用いて提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:15:20 GMT)
Transfer Learning for T-Cell Response Prediction [0.2] 特定のペプチドに対するT細胞応答の予測について検討した。
膨らませた予測性能の危険性は,単に理論的なものではなく,実際に発生することを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:40:40 GMT)
BOLIMES: Boruta and LIME optiMized fEature Selection for Gene Expression Classification [0.1] BOLIMESは、遺伝子発現の分類を強化するために設計された、新しい特徴選択アルゴリズムである。
包括的特徴選択と解釈可能性による洗練を組み合わせ、高次元遺伝子発現解析のための強力なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:36:40 GMT)
Single-shot and two-shot decoding with generalized bicycle codes [0.0] 一般化自転車(GB)量子誤り訂正符号は、自然に最小限の安定化器発生器を持つ。
比較的大きな寸法, 距離, シンドロームを持つ短いGB符号を複数構築し, 耐故障性近時シンドローム測定のスケジュールを認めた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:54:19 GMT)
Work Statistics via Real-Time Effective Field Theory: Application to Work Extraction from Thermal Bath with Qubit Coupling [0.0] 本研究では, 熱浴をスピン, フェルミオン, トポロジカルタイプのいずれかのキュービットに結合させることにより, 作業抽出の可能性を検討する。
作業抽出の量は、循環的非平衡過程における作業統計から導かれる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:41:41 GMT)
tūQ: a design and modelling tool for cluster-state algorithms [0.0] t=uQツールチェーンは、クラスタステートコンピューティングの研究を進めるために設計された。
t=uQ の2つのモードは Modeller と Simulator である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:54:36 GMT)
Zipping many-body quantum states: a scalable approach to diagonal entropy [0.0] ブルート・フォース・トモグラフィー手法に代わる,効率的かつスケーラブルな画像圧縮アルゴリズムとして,Lempel-Zivロスレス画像圧縮アルゴリズムについて検討する。
このアプローチは、一次元量子イジングモデルと、従来の対称性の破れを示す2次元状態の2つの例で検証する。
また, 対角エントロピー密度の特異部分を, 複製された作用に対する再正規化群を用いて解析した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:24:47 GMT)
Work and heat exchanged during sudden quenches of strongly coupled quantum systems [0.0] 量子系の内部エネルギーの3つの定義を強結合条件下で検討する。
本研究は, ハミルトニアンが突然変化する共通過程であるクエンチに焦点をあてる。
この結果は強い結合量子系における熱力学量の研究を導く。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:59:59 GMT)
Where is my Glass Slipper? AI, Poetry and Art [0.0] この文献は、人工知能、詩、芸術の交点を問うものである。
初期のテンプレートベースのシステムから生成モデルまで、コンピュータ生成詩の発達を辿る。
レビューは、技術革新と人間の主観性の相互依存を認識する創造的プロセスの再評価を要求する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:57:03 GMT)
What is my quantum computer good for? Quantum capability learning with physics-aware neural networks [0.0] 本稿では,学習能力モデルのための量子物理学的ニューラルネットワークアーキテクチャを提案する。
我々のアーキテクチャは、量子プログラムにおけるエラーの物理に対する効率的な近似とグラフニューラルネットワークの側面を組み合わせる。
このアプローチは、実験データとシミュレーションデータの両方における平均絶対誤差を最大$sim50%$還元する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:31:49 GMT)
Wavefunction branching: when you can't tell pure states from mixed states [0.0] 波動関数"分岐"の定義を提案する。
分岐間の相対位相情報を得る試みは、頻繁な能動誤り訂正を伴わずに失敗すると主張している。
これらの分岐分解を多体量子状態で同定することで、古典性の出現に光を当てることができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:50:31 GMT)
Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies [0.0] ビジョントランス (ViT) はコンピュータビジョンタスクのための強力で有望な技術として登場した。
高い計算複雑性とメモリ要求は、リソース制約のあるエッジデバイスへのデプロイに困難をもたらす。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:34:44 GMT)
Variational Quantum Simulation of the Fokker-Planck Equation applied to Quantum Radiation Reaction [0.0] ペタワット級レーザーによる近未来の実験は、ガンマ線と電子-陽電子対の高フラックスを生み出すことが期待されている。
この研究は、プラズマ物理シナリオの量子シミュレーションに向けた第一歩として役立つだろう。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:57:04 GMT)
Using Gaussian Boson Samplers to Approximate Gaussian Expectation Problems [0.0] GBSサンプルを用いた2つの推定器がモンテカルロ(MC)推定器に指数的な高速化をもたらすことを示す。
正確には、指数的スピードアップは、これらの推定器が同じ精度に達することを保証されたサンプルサイズで定義される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:30:49 GMT)
Ultrafast quantum light uncertainty dynamics in real time [0.0] 量子光学を超高速状態に拡張し、量子不確実性は静的な制約ではないという直接的な実験的な証拠を提供する。
振幅不確かさの時間的ダイナミクスを観察し、量子不確かさが制御可能で調整可能な物理量であることを実証する。
この研究は、量子不確実性力学を探索する方法を開拓し、超高速量子科学の新たな分野の基礎を確立する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:49:45 GMT)
Tridirectional quantum teleportation protocol in continuous variables [0.0] プロトコルの特別な特徴は、3つのシナリオのうちの1つを選択することである。
3人の参加者間の同時交換、任意の2人の参加者間の交換、または2つの状態の第三の参加者への移動。
連続変数のクラスタ状態を主資源として、三方向量子テレポーテーションを実現する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:42:59 GMT)
Towards a Knowledge Graph for Models and Algorithms in Applied Mathematics [0.0] この研究データをFAIRにするために、モデルとアルゴリズム、およびそれらの関係を意味的に表現することを目指している。
2つのアルゴリズム的タスク間のリンクは、対応するタスクに対応するモデリングで発生するため確立される。
ここでは、行列の対称性や数学的モデルの線型性など、対象固有のメタデータが関係している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:03:53 GMT)
Towards Privacy-Preserving Anomaly-Based Intrusion Detection in Energy Communities [0.0] エネルギーコミュニティは、サイバー脅威に対するグリッドの脆弱性を増加させる可能性がある。
本稿では,エネルギーコミュニティの安全性を高めるために,異常な侵入検知システムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:13:02 GMT)
Three-Body Non-Locality in Particle Decays [0.0] 本研究では, 大粒子の3体崩壊から発生する3つの無質量スピン-1/2粒子の非局所相関について検討した。
いくつかの不等式を解析することにより、量子力学からの偏差の検出と、2つの主要な隠れ変数理論の違反に対処する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:00:00 GMT)
Thermodynamics of Hamiltonian anyons with applications to quantum heat engines [0.0] トポロジカルエノンはボソンとフェルミオンの間を補間し、交換時に複雑な相を拾う。
最近の研究では、同様の統計的挙動がボゾンとフェルミオンの混合によって生じることが示されている。
我々は、対称状態の人口をハミルトニアンを生成する対称性によって促進または抑制することに基づく、そのような統計的エノンの代替的な実装を導入する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:24:57 GMT)
Theory of Quantum-Enhanced Stimulated Raman Scattering [0.0] 刺激ラマン散乱は、材料のラベルフリーイメージングと分光のための強力な方法である。
近年の研究では、量子化ラマン散乱がショットノイズ限界を超え、感度が大幅に向上することが示されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:34:32 GMT)
Theoretical Limits of Protocols for Distinguishing Different Unravelings [0.0] 提案手法を適用すれば, 解答依存量の計算は, 解答処理を施す前にのみ行うことができることを示す。
解答に依存しない量は数学レベルでは確かに異なるが、解答を実行する測定手順がすでに与えられた時点でのみ計算可能であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:24:32 GMT)
The simulation of distributed quantum algorithms [0.0] 分散量子コンピューティング(DQC)は、量子通信リンクを介して接続された複数の量子処理ユニット(QPU)を使用して量子コンピュータをスケールする方法を提供する。
我々は分散量子コンピューティングシミュレータを構築し、量子アルゴリズムの調査に利用した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:03:53 GMT)
The Shady Light of Art Automation [0.0] この論文は、AIの概念的およびイデオロギー的サブストラタが芸術概念に影響を与える役割について、より広範な研究をまとめたものである。
焦点は異質だが合理化され、しばしば疑わしいアイデア、価値観、そしてジェネレーティブAIや他の芸術関連AI技術が広める政治的見解に焦点を当てている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:50:05 GMT)
The Role of Explainable AI in Revolutionizing Human Health Monitoring: A Review [0.0] Reviewは、医療における機械学習(ML)モデルの解釈可能性問題に対処する上で、説明可能なAI(XAI)の役割を強調することを目的としている。
複数のデータベースにまたがって総合的な文献検索を行い、医療にXAI技術を適用した研究を同定した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:13:35 GMT)
The Quantum Measurement Problem: A Review of Recent Trends [0.0] 量子状態はシュル「オーディンガー方程式」の下で決定的に進化し、重ね合わせを形成するが、ボルン則によって支配される過程は単一の結果へと崩壊する。
本稿では,計測問題の現状を概観し,よく理解されているものと未解決のものとを区別する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:32:44 GMT)
The Octo-Rail Lattice: a four-dimensional cluster state design [0.0] この研究は、時間領域多重化を用いて生成されたOcto-Rail Latticeと呼ばれる4次元のクラスター状態を示す。
この新しいマクロノード設計は、クアドレール格子のノイズ特性と柔軟性と、様々なトポロジ的誤り訂正符号を実行する可能性を組み合わせたものである。
解析により、Octo-Rail LatticeはGKPqunaught状態と表面コードと組み合わせることで、9.75dBの耐故障しきい値と互換性のあるノイズ性能を示すことが示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:36:47 GMT)
The Ising model as a window on quantum gravity with matter [0.0] 我々は、Isingモデル CFT が物質による3次元(量子)重力の明確な洞察を得るのに利用できると論じる。
我々は、プラトー、バースト、その後の信号の再帰を観察し、後者は明らかにブラックホールの解釈に反する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:22:25 GMT)
The FFT Strikes Back: An Efficient Alternative to Self-Attention [0.0] 我々は、$mathcalO(nlog n)$時間でグローバルトークンの混合を実現するための適応スペクトルフィルタリングフレームワークであるFFTNetを紹介する。
学習可能なスペクトルフィルタとmodReLUアクティベーションは、従来の自己アテンションに対する厳密で適応的な代替手段を提供するために、サルエント周波数成分を動的に強調する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:31:58 GMT)
Talking like Piping and Instrumentation Diagrams (P&IDs) [0.0] 本稿では,自然言語を用いたP&ID(Piping and Instrumentation Diagram)との通信を可能にする手法を提案する。
我々はDEXPIデータモデルを通じてP&IDをラベル付きプロパティグラフとして表現し、それをLLM(Large Language Models)と統合する。
将来的には、この研究は、P&IDに関する他の生成人工知能(genAI)ソリューションやAI支援HAZOP研究の文脈における機会も開放する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:30:35 GMT)
Superdiffusion, normal diffusion and chaos in semiclassical Bose-Hubbard chains [0.0] 半古典的状態における1次元Bose-Hubbardモデルの2点相関関数の進化について検討する。
強い非可積分性については、系はホモジニアス状態に終わり、弱い非可積分性に対しては振動と不均一性が持続する。
我々は、超拡散状態は前熱化や熱化の前駆体ではなく、ボース・ハバード・ハミルトンの特別なスケーリング対称性に関連する新しい早期現象であると結論付けた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 21:56:04 GMT)
Subclass Classification of Gliomas Using MRI Fusion Technique [0.0] 原発性脳腫瘍であるグリオーマは、様々な攻撃性レベルと予後を示す。
本研究の目的は,T1,T2,T1ce,および流体減衰インバージョン回復シーケンスからMRI画像を融合するアルゴリズムを開発することである。
提案手法は精度99.25%、精度99.30%、リコール99.10、F1スコア99.19%、インターセクションオーバーユニオン84.49%、特異度99.76を達成している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:10:33 GMT)
Style Ambiguity Loss Without Labeled Datasets [0.0] 分類器やラベル付きデータセットを訓練する必要のない,新しいスタイルのあいまいさ損失を導入する。
我々の新しい手法は,新規性と評価を解析するために,自動測定とユーザスタディの両方により高いスコアを付ける。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:07:15 GMT)
Stationary distribution of node2vec random walks on household models [0.0] node2vecランダムウォークを地域構成の世帯モデルグラフ上で検討する。
歩行パラメータを調整することにより、静止分布は、均一、サイズ偏り、あるいは単純なランダムな歩行定常分布の間で補間可能であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:48:59 GMT)
Spin correlation in two-proton emission from $^6$Be [0.0] 本稿では,2陽子(2p$)放射性発光におけるスピン相関の理論評価を行う。
時間依存計算を行い、放出された2つの陽子の結合スピン状態を算出する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:59:25 GMT)
Sparkle: A Statistical Learning Toolkit for High-Dimensional Hawkes Processes in Python [0.0] 本稿では,PythonにおけるHawkesプロセスの統計的学習ツールキットであるSparkleを紹介する。
これには、正規化技術を組み込むためのビルトインサポートを備えた最先端の見積もりツールと、新しい分類方法が含まれている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:38:58 GMT)
Software demodulation of weak radio signals using convolutional neural network [0.0] JT65A通信プロトコルで伝送される弱信号に対する多重周波数シフト鍵のソフトウェア復調について検討した。
干渉免疫は, MFSK信号の非コヒーレント復調の理論的限界よりも1.5dB小さいことが証明された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:41:25 GMT)
Simulating Work Extraction in a Dinuclear Quantum Battery Using a Variational Quantum Algorithm [0.0] 本研究は、二核量子電池モデルにおける量子特性と作業抽出過程を研究するための量子計算法の応用について検討する。
本研究では, 騒音環境の存在が, システム内のエネルギー量評価の精度を損なうことを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:23:19 GMT)
Set and functional prediction: randomness, exchangeability, and conformal [0.0] 本稿では、より一般的なランダム性予測や交換可能性予測と比較して、共形予測の効率性について研究を継続する。
料金は、ラベル空間上の幅広い確率測度に関して、効率性は平均でのみ達成される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:00:42 GMT)
Sentiment Analysis of Movie Reviews Using BERT [0.0] 感性分析(英: Sentiment Analysis、SA)または意見マイニング(英: opinion mining)は、あらゆる種類のテキストからの感情や意見の分析である。
本研究の目的は、映画レビューの感情分析のために、双方向長短期記憶(BiLSTM)を用いた変換器(BERT)からの双方向表現を微調整することである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:30:19 GMT)
Search for oscillating fundamental constants using a paired detector and vibrational spectroscopy [0.0] ウルトラライトダークマター(UDM)は、通常の物質の基本定数を振動させることによって自分自身を現わすことができる。
我々は、信号が同期的に記録される2つの名目上同一の検出器について、ペア検出器を提案し、実証する。
次に、2つのビート時系列のクロススペクトルをUDMシグネチャに対して解析する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:53:55 GMT)
Schwinger-Keldysh nonperturbative field theory of open quantum systems beyond the Markovian regime: Application to spin-boson and spin-chain-boson models [0.0] 我々は、任意の値 S の相互作用する多くの量子スピンを扱う場理論フレームワークを構築する。
我々のフレームワークは、非マルコフ系におけるスピンボソンの数値的正確なベンチマークを追跡する。
これは、量子コンピューティングや量子マグノニクスにおける駆動散逸系のシミュレーションのための有望なルートである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:53:06 GMT)
Robust Over-the-Air Computation with Type-Based Multiple Access [0.0] 本稿では,Byzantine攻撃の存在下での空力計算(AirComp)の頑健な手法としてTBMAについて検討する。
広範囲なシミュレーションにより,頑健なTBMAはDAを著しく上回り,対向条件下においても高い精度を維持していることが示された。
これらの結果は、TBMAをAirCompのスケーラブルで堅牢なソリューションとして確立し、次世代ネットワークにおけるセキュアで効率的なアグリゲーションの道を開いた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:22:00 GMT)
Revisiting the missing He-McKellar-Wilkens geometric quantum phase [0.0] 我々は、無限の壁の存在下で永久電気双極子モーメントを持つ中性粒子に対するランダウ準位におけるHe-McKellar-Wilkens幾何学量子位相の欠如について論じる。
また、He-McKellar-Wilkens幾何量子相が1次元量子環に制限された中性粒子のエネルギーレベルに与える影響についても論じる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:27:02 GMT)
Remote Stimulation of QED Scenarios in the Jaynes-Cummings-Hubbard Model [0.0] この記事では、量子力学シナリオのリモート誘導における重要かつ関連する課題について論じる。
これは、このようなシナリオをドナー原子からターゲット原子に転送することを含む。
ドナーキャビティ数,原子数,導波路の帯域幅に対するシナリオの効率と転送の依存性について検討した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:39:33 GMT)
Quantum-Corrected Gravitational Interaction Incorporated with a Non-inertial Cosmic String Spacetime [0.0] スカラーボソンは宇宙のストリング時空や非慣性フレームワークにおいて考慮されている。
任意の状態に対する量子補正重力相互作用の解が報告される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:23:49 GMT)
Quantum cloning transformation unlocks the potential of W class of states in a quantum secure direct communication protocol [0.0] 3つのパーティ間で共有される状態の3ビットWクラスを利用した制御QSDCプロトコルを提案する。
このプロトコルは確率的であり,プロトコルの成功確率を計算した。
より絡み合った状態のWクラスでさえも、提案された制御QSDCスキームにおいて重要な役割を果たす。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:37:25 GMT)
Quantum Models of Consciousness from a Quantum Information Science Perspective [0.0] この視点は、量子情報科学の観点から様々な意識の量子モデルを探究する。
検討中のモデルは、脳内で量子力学が機能するレベルに基づいて、3つの異なるグループに分類することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:56:08 GMT)
Practical and efficient quantum circuit synthesis and transpiling with Reinforcement Learning [0.0] 我々はReinforcement Learningを量子トランスパイリングに統合し、量子回路の合成とルーティングを大幅に強化する。
我々はLinear, Clifford, Permutationの各回路をそれぞれ9, 11, 65量子ビットに近似的に合成する。
また、2量子ゲート深さの大幅な削減と、最大133量子ビットまでの回路ルーティングのカウントを実現した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:38:25 GMT)
PixleepFlow: A Pixel-Based Lifelog Framework for Predicting Sleep Quality and Stress Level [0.0] 本研究では、画像に基づく睡眠の質とストレスレベル推定フロー(PixleepFlow)を提案する。
PixleepFlowは、睡眠パターンとその全体的な健康への影響を調べるために、複合画像データへの変換手法を採用している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:32:26 GMT)
Perturbative Framework for Engineering Arbitrary Floquet Hamiltonian [0.0] フロケット位相空間における任意の対象ハミルトニアンを設計するための体系的摂動フレームワークを開発する。
工学的なフロケ・ハミルトンの高次誤差は、高次駆動電位を摂動的に付加することによって緩和される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:59:59 GMT)
Path integral spin dynamics with exchange and external field [0.0] 本研究では、スピンの量子熱期待値を計算するために、積分に着想を得た定式化法を提案する。
このことは、我々の以前の研究で提示された形式主義を一般化し、大規模原子論シミュレーションの実現への道を開く。
この結果と精度/数値対角化法を比較して,モデルの精度範囲を確認する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:09:10 GMT)
Optimizing confidence in negative-partial-transpose-based entanglement criteria [0.0] 分離可能な量子状態の鍵となる要件は、その密度行列が正の部分変換を持つことである。
連続二部量子状態の場合、この条件の違反は、NPTに基づく絡み合い基準の階層によって検証することができる。
そこで我々は,NTTに基づく最適基準を選択するためのフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:26:41 GMT)
Optimal continuity bound for the von Neumann entropy under energy constraints [0.0] 一般エネルギー制約の下で、フォン・ノイマンエントロピーに対して有界な大域的最適連続性を構築する。
これにより、この設定におけるフォン・ノイマンエントロピーの最適連続性を求める問題が完全に解決される。
また、無限個のアルファベットと一般制約を持つ確率変数に対して最適なファノ型不等式を導出する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:46:09 GMT)
On Sequential Maximum a Posteriori Inference for Continual Learning [0.0] 損失関数の再帰として逐次最大化を定式化し、損失関数を近似するために連続学習の問題を減らした。
本稿では,2次近似を用いたオートディフ2次積分法と,ニューラルネットワーク近似を用いたニューラルコンソリデーションという2つのコアセットフリー手法を提案する。
ニューラルコンソリデーションは、入力次元が小さい古典的なタスクシーケンスでは良好に機能し、オートディフ二次コンソリデーションは、固定された事前訓練された特徴抽出器を持つイメージタスクシーケンスでは一貫して良好に機能する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:14:47 GMT)
Oddities in the Entanglement Scaling of the Quantum Six-Vertex Model [0.0] 円筒上の量子六頂点モデルの絡み合い特性について検討する。
システムサイズが奇異な場合に、期待される絡み合いのスケーリングに新たな対数補正を示す。
本研究は, このモデルの絡み合い特性を決定する上で, システムサイズパリティが重要な役割を担っていることを明らかにする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:09:40 GMT)
Non-paraxial effects on laser-qubit interactions [0.0] 四重極2S1/2-> 2D5/2遷移を駆動するガウスとラゲール・ガウスの光ポテンシャルを40Ca+で計算する。
解析モデルと数値シミュレーションにより,この効果により単一量子ゲートの不確かさを特徴づける。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:34:58 GMT)
New methods to compute the generalized chi-square distribution [0.0] 一般化されたカイ二乗分布のcdf,pdf,逆cdfを計算するための4つの新しい数学的方法を提案する。
いくつかの方法は速度を測るが、他の方法は尾部から遠くまで正確に設計されている。
これらの手法と過去の手法の精度と速度を比較し、それらの利点と限界を特徴づけ、異なる場合に最適な方法を特定する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:36:16 GMT)
Network-assisted collective operations for efficient distributed quantum computing [0.0] 遠隔量子処理ユニット間での集合量子演算の分散に関するプロトコルを提案する。
これらのプロトコルは、高性能コンピューティングで使用されるようなネットワークアーキテクチャで、集合的なマルチコントロールとマルチターゲットゲートを実行することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:13:13 GMT)
Negation-Induced Forgetting in LLMs [0.0] 本研究は,大言語モデル(LLM)が否定誘発記憶(NIF)を示すか否かを考察する。
NIF(英: NIF)とは、物体や事象の誤った属性を否定することで、この物体や事象のリコールが減少する認知現象である。
この効果をChatGPT-3.5, GPT-4o mini, Llama3-70b-instructで検証した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:13:20 GMT)
Multipartite Entanglement Structure of Fibered Link States [0.0] チャーン・サイモンズ理論における多粒子絡みのパターンについて検討する。
任意のリンクが、GHZのような絡み合いにつながる背景に埋め込まれていることが示される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:00:00 GMT)
Multifractal statistics of non-Hermitian skin effect on the Cayley tree [0.0] 非エルミート皮膚効果に関連する多フラクタル統計はほとんど未発見のままである。
木形状はケイリー木上の単粒子の皮膚状態の多フラクタル統計を誘導することを示す。
我々の研究は、ケイリーツリーにおける皮膚効果のユニークな特徴を明らかにし、障害のないオープン量子系において多重フラクタル性を誘導する新しいメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:23:22 GMT)
Multiclass Post-Earthquake Building Assessment Integrating Optical and SAR Satellite Imagery, Ground Motion, and Soil Data with Transformers [0.0] 本研究では,地震後の高分解能衛星画像と構造物の耐震性能に関連する建築固有のメタデータを組み合わせたフレームワークを提案する。
2023年2月6日トルコ・シリア地震の建物群を対象とした多層地震後の被害同定において, 現状の成果が得られた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:49:41 GMT)
Measurement-induced symmetry restoration and quantum Mpemba effect [0.0] 動的測定が多体量子系の対称性の進化に強く影響を与えることを示す。
我々は新しい測定による対称性回復機構を明らかにする。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:12:04 GMT)
Measurement of Neutron Whispering Gallery States Using a Pulsed Neutron Beam [0.0] 中性子ウィスパーリングギャラリー状態は遠心力と物質電位で束縛された材料表面に局在した量子状態である。
パルス式コールド中性子ビームを用いて, マントルムSiO$コンケーブミラー上に中性子ささやきギャラリー状態を観察した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:39:51 GMT)
Mapping out AI Functions in Intelligent Disaster (Mis)Management and AI-Caused Disasters [0.0] 我々は、災害管理におけるAIの役割の概要と、インテリジェント災害管理におけるAIの利用に関する倫理的影響の可能性について概説する。
我々は、プライバシー侵害、偏見、差別など、災害管理におけるAI使用の倫理的影響を予防または緩和する特定の方法を精査する。
次に、IDMにおけるAI使用の倫理的影響の防止における政府の役割について議論し、その欠陥と課題を特定し評価する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:59:21 GMT)
MEBench: Benchmarking Large Language Models for Cross-Document Multi-Entity Question Answering [0.0] マルチエンタリティ質問応答(MEQA)は,大規模言語モデル(LLM)において重要な課題である。
MEBenchは、断片化された情報の検索、統合、推論を行うLLMの能力を評価するために設計された、新しいマルチドキュメント、マルチエンタリティベンチマークである。
本ベンチマークでは,MEQAタスクにおける情報抽出の完全性と事実的精度の重要性を強調した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:56:51 GMT)
MC2SleepNet: Multi-modal Cross-masking with Contrastive Learning for Sleep Stage Classification [0.0] 睡眠は私たちの健康に大きな影響を与え、睡眠不足や障害は身体的・精神的な問題を引き起こす可能性がある。
MC2SleepNet (Multi-modal Cross-masking with Contrastive Learning for Sleep Stage Classification Network) について紹介する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:30:12 GMT)
Long-range nonstabilizerness and phases of matter [0.0] 長距離非安定化器性は、浅い局所量子回路では除去できない非安定化器性の量として定義することができる。
我々は、多体量子物理学の文脈における長距離非安定化器の研究を行う。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:11:47 GMT)
Local Quenches from a Krylov Perspective [0.0] 我々は、共形場理論における局所結合および分割クエンチに対するランツォ係数、拡散複雑性、クリロフエントロピーを導出する。
さらに,拡散複雑性とクリロフエントロピーは相互作用量子系の非平衡力学を探索するための強力なツールであることを示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:00:03 GMT)
Learning atomic forces from uncertainty-calibrated adversarial attacks [0.0] そこで本稿では, ユーザの指定した誤りを含む逆構造を検出するために, キャリブレーション・アディショナル・ジオメトリ・最適化(CAGO)アルゴリズムを提案する。
不確実性に対する幾何学的最適化を行うことで、ユーザ指定のターゲットMLIP予測誤差を持つ逆構造に到達する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:28:13 GMT)
Learning Ensembles of Interpretable Simple Structure [0.0] 運用研究のアプリケーションでは、意思決定の仕方を理解することは、多くの場合、決定そのものと同じくらい重要である。
決定木やロジスティック回帰といった従来の解釈可能なモデルは透明性を提供するが、複雑な特徴相互作用を含むデータセットと競合する可能性がある。
単純な構造として知られる解釈可能なサブグループにデータを分割するボトムアップな単純な構造同定アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:37:51 GMT)
Kramers-Kronig detection in the quantum regime [0.0] 本稿では,クラマース・クロニッヒ検出手法の量子化について検討する。
クラーマース・クロニッヒ検出は、両方の四角形を測定できるコヒーレント検出として機能することを示す。
また, ボゾンコヒーレント状態, モノモード純状態, 混合状態のKramers-Kronig検出による位相情報についても詳細に検討した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:56:35 GMT)
Knowledge Distillation for Semantic Segmentation: A Label Space Unification Approach [0.0] 本稿では,セマンティックセグメンテーションのためのラベル空間統一手法として機能する知識蒸留手法を提案する。
教師モデルは、与えられた分類のソースデータセットに基づいて訓練され、関連するラベル空間の基底真理ラベルが存在する追加データを擬似ラベル付けするために使用される。
我々の真実を訂正した擬似ラベルは、都市ドメインとオフロードドメインでそれぞれ388.230と18.558の画像を持つ12と7の公開データセットにまたがっている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:33:33 GMT)
Invariance Pair-Guided Learning: Enhancing Robustness in Neural Networks [0.0] トレーニングフェーズを通じてニューラルネットワークを誘導する手法を提案する。
従来の勾配降下法を補完する補正勾配を形成する。
ColoredMNIST、Waterbird-100、CelebANISTデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:36:00 GMT)
Inscanner: Dual-Phase Detection and Classification of Auxiliary Insulation Using YOLOv8 Models [0.0] 本研究では, 構造成分中の補助絶縁を検出・分類するための2相法を提案する。
検出フェーズでは、YOLOv8xモデルが完全な構造図のデータセット上でトレーニングされ、それぞれに絶縁を含むべき領域を示す境界ボックスがアノテートされる。
分類段階では、検出された絶縁パッチを収穫し、現在または欠落の2つのクラスに分類する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:29:30 GMT)
Indefinite Time Directed Quantum Metrology [0.0] 我々のプロトコルは,標準量子限界(1/sqrtN)を超越して,製品プローブ状態のハイゼンベルクスケーリング(1/N)を実現することができることを示す。
ITDMにおける対称積プローブ状態の最適性は解析的に証明するが、絡み合ったプローブ状態は、スケーリングを向上することなく、最適な積プローブよりも高いQFIを生成する。
本研究は, 製品プローブ状態の最適配向を明らかにするとともに, パラメータからの独立性を強調し, 限界条件で推定されるパラメータの独立性を強調した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:51:24 GMT)
Improving customer service with automatic topic detection in user emails [0.0] 本研究では、Telekom Srbijaにおけるカスタマーサービスの効率を高める新しい自然言語処理パイプラインを紹介する。
パイプラインの中心にあるBERTopicは、教師なしトピックモデリングを可能にするモジュールアーキテクチャである。
パイプラインは、特に低リソースで形態的にリッチな言語に対して、幅広い適用性を示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:10:38 GMT)
Implementing Quantum Generative Adversarial Network (qGAN) and QCBM in Finance [0.0] 量子コンピュータは今日、薬物発見、物質と分子モデリング、ファイナンスで使われている。
ファイナンスにおける量子機械学習(QML)の適用について、今後の活発な研究分野について論じる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 08:40:26 GMT)
Implementation and Learning of Quantum Hidden Markov Models [0.0] 量子チャネルの理論とオープン量子システムを用いて、量子隠れマルコフモデル(QHMM)として知られるジェネレータのクラスの効率的なユニタリ特性を提供する。
我々は、QHMMが、等価な古典的隠れマルコフモデル(HMM)と比較して、プロセス言語のよりコンパクトで表現力豊かな定義であることを証明した。
本稿では,QHMMのための2つの実践的学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:42:47 GMT)
Human-Centered AI in Multidisciplinary Medical Discussions: Evaluating the Feasibility of a Chat-Based Approach to Case Assessment [0.0] 複数の慢性疾患に苦しむ多病性心血管疾患の患者に焦点をあてる。
チャットアプリケーションを用いて、医師と共同で、AI活用による実現可能性、効率向上、議論内容の定量化などにより、複数の疾患のシミュレートされた症例を評価した。
5つのシミュレートされたケースでの議論の分析は、AIを用いた要約に必要な時間を大幅に削減し、平均79.98%の削減を示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:02:47 GMT)
Homomorphic Encryption of Intuitionistic Logic Proofs and Functional Programs: A Categorical Approach Inspired by Composite-Order Bilinear Groups [0.0] 本稿では、算術やブール演算以外の同型暗号を直観論理の領域に拡張するための概念的枠組みを提案する。
ソフトウェア最適化やハードウェアアクセラレーションなど,このアプローチを潜在的に効率的にするための戦略を概説する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:10:10 GMT)
Higher order coherence as witness of exceptional point in Hermitian bosonic Kitaev dimer [0.0] 例外点(EP)によって誘導される非分析性は、非エルミート系だけでなく、エルミート系にも現れる。
EPはパラメータ空間を4つの領域に分け、そこでは系は異なる等価ハミルトニアンによって特徴づけられる。
以上の結果から, EPの概念は小さなエルミート系ボソニック系で検出できることが示唆された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:34:36 GMT)
Harvesting energy from turbulent winds with Reinforcement Learning [0.0] エアボーン・ウィンド・エナジー(Airborne Wind Energy, AWE)は、高高度風力を利用した新技術である。
AWEは地上ステーションに繋ぎ、風によって駆動される飛行装置に基づいており、機械エネルギーを発電機で電気エネルギーに変換する。
我々の目標は、これらのテクニックを強化学習(RL)に基づくアプローチに置き換える可能性を探ることである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:08:17 GMT)
Graceful forgetting: Memory as a process [0.0] メモリの論理的理論が提案され、バウンドストレージ空間内での入力にどのように対応できるかを説明する。
この理論は、記憶に関する広範な知識を理解し、機能的および機械的用語における記憶の理解に近づけるための助けとなることを意図している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:03:03 GMT)
Generalized Uncertainty Principle For Quantum Dynamics [0.0] 我々は、伝統的な限界を広げるハイゼンベルクの不確実性原理の拡張を導入する。
我々は観測対象の同時精度と変化率に限界を定めている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:45:38 GMT)
FungalZSL: Zero-Shot Fungal Classification with Image Captioning Using a Synthetic Data Approach [0.0] 本稿では,大言語モデル (LLM) によって生成された2つの相補的なデータソースを紹介し,その1つは菌類成長の段階を記述し,もう1つは多様な合成菌類画像からなる。
これらのデータセットは、真菌関連のタスクのためのCLIPのゼロショット分類機能を強化するように設計されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:48:36 GMT)
Formal Verification of PLCs as a Service: A CERN-GSI Safety-Critical Case Study (extended version) [0.0] 本稿では,PLC(Programmable logic controller)プログラムに対して,機能安全基準に準拠した形式的検証サービスを提案する。
形式的検証プロセスに対する要求の高まりに対応するために、コスト効率のよいソリューションを提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:08:58 GMT)
Fast, Scale-Adaptive, and Uncertainty-Aware Downscaling of Earth System Model Fields with Generative Machine Learning [0.0] 高分解能地球モデル(ESM)シミュレーションは、人為的気候変動の生態学的および社会経済的影響を評価するために不可欠である。
最近の機械学習アプローチは、ESMシミュレーションのダウンスケールにおいて有望な結果を示し、最先端の統計手法よりも優れている。
ゼロショット方式で再トレーニングすることなく、任意のESMシミュレーションを効率的に正確にダウンスケールする一貫性モデル(CM)を学習することで、これらの欠点に対処する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:43:09 GMT)
Faithful Logic Embeddings in HOL -- A recipe to have it all: deep and shallow, automated and interactive, heavy and light, proofs and counterexamples, meta and object level [0.0] 本稿では,古典的高階論理における深層・浅層埋め込みの同時配置法を提案する。
このアプローチは論理学の教育、研究、応用に役立ちます。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:08:07 GMT)
Extreme Events of Quantum Walks on Graphs [0.0] リング格子上の量子ウォークとスケールフリーグラフを考える。
古典的なウォークと量子的なウォークでは、グラフ上のハブに比べて極端事象確率が小さいノードでは大きい。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:54:03 GMT)
Explainable Artificial Intelligence Model for Evaluating Shear Strength Parameters of Municipal Solid Waste Across Diverse Compositional Profiles [0.0] 本稿では,多様なプロファイル間の凝集度と摩擦角を評価するための新しい説明可能な知能(XAI)フレームワークを提案する。
提案モデルでは,多層パーセプトロンアーキテクチャとSHAP(SHapley Additive exPlanations)解析を統合した。
従来の勾配法に比べて予測精度は優れていた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:37:33 GMT)
Evidence-Driven Marker Extraction for Social Media Suicide Risk Detection [0.0] 本稿では,臨床マーカー抽出と自殺リスク分類の新しいアプローチであるEvidence-Driven LLM (ED-LLM)を紹介する。
ED-LLMはマルチタスク学習フレームワークを採用し、Mistral-7Bベースのモデルを共同でトレーニングし、臨床マーカーの範囲を特定し、自殺リスクレベルを分類する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:58:03 GMT)
Evidence for simple "arrow of time functions" in closed chaotic quantum systems [0.0] $C(t)$から$alphan(t)$を構成するには、$C(t)$の最初の2n$時間微分を 0$ と $t$ でなければならない。
私たちの焦点は$alphan(t)$であり、(ほとんど)単調に減少し、これらの時間関数の矢印(AOTF)と呼ばれます。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:48:36 GMT)
Evaluation of quantum entanglement state between photoelectron spin and emitted photon polarization in spin and polarization resolved XEPECS of $\rm Ti_{2}O_{3}$ [0.0] 量子絡み合いは、光電子のスピンと放射されたX線光子の線形偏光の間に起こる。
その結果, 実物質系におけるエンタングルメント特性の決定における電荷移動と結晶場効果の重要な役割が明らかにされた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 04:51:40 GMT)
Evaluation of Hate Speech Detection Using Large Language Models and Geographical Contextualization [0.0] 本研究では,多言語および多様な地理的文脈におけるヘイトスピーチ検出におけるLLMの性能について,系統的に検討した。
Llama2 (13b)、Codellama (7b)、DeepSeekCoder (6.7b)の3つの最先端LCMを評価した。
コーデラマは70.6%、F1スコアは52.18%、DeepSeekCoderは265カ所中63カ所を正確に検出した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:59:36 GMT)
Evaluating the Suitability of Different Intraoral Scan Resolutions for Deep Learning-Based Tooth Segmentation [0.0] 口腔内スキャンは歯科補綴、治療計画、矯正処置などの業務に広く用いられている。
歯のセグメンテーションなどのタスクを自動化するディープラーニングベースの手法が開発されている。
典型的な口腔内スキャンには20万以上のメッシュセルが含まれており、計算処理に費用がかかる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:30:29 GMT)
Evaluating Gender Bias in German Machine Translation [0.0] 我々は、ドイツ機械翻訳(MT)システムのための新しい性別バイアス評価テストセットWinoMTDEを提案する。
このデータセットは、性別やステレオタイプに関してバランスが取れた288のドイツ語文で構成されている。
5つの広く使われているMTシステムと大規模言語モデルの大規模評価を行う。
LLMは従来のシステムよりも優れており、ほとんどのモデルでは永続的なバイアスが示されています。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:46:59 GMT)
Estimating the Percentage of GBS Advantage in Gaussian Expectation Problems [0.0] 本稿では,GBSサンプルを用いてガウス予想問題を近似するアルゴリズムを提案する。
これらのアルゴリズムが標準モンテカルロ法(MC)よりも指数的な高速化を実現する問題空間の空でない部分集合を見つける。
特定の場合において、我々の手法は問題空間の約100%にわたってMCを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:00:44 GMT)
Entropy and type-token ratio in gigaword corpora [0.0] 語彙の多様性はタイプトケン比とエントロピーで特徴づけられる。
英語,スペイン語,トルコ語の6つの大規模言語データセットにおける多様性指標について検討した。
与えられたコーパスと言語のテキストのエントロピーとタイプトケン比の実証的機能関係を明らかにした。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:21:27 GMT)
Entangling distant systems via universal nonadiabatic passage [0.0] 一般の$M+N$次元離散系における普遍的非断熱通路を導出する。
遷移のない力学は、実際の量子ネットワークにとって重要な前提条件として、遠方の量子ビットを絡めるように定式化することができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:07:15 GMT)
Entanglement Measures for Many-Body Quantum Systems: Limitations and New Approaches [0.0] 2つの絡み合ったn-量子系内の絡み合いを、1つの三角形、2つの三角形、pi-三角形を用いて解析する。
一般化されたW状態のような特定の量子状態において、粒子の数が増加すると、これらの測度はゼロに近づく。
粒子の数が増加するにつれて等しく収束しない強い絡み合いのモノガミーを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:21:11 GMT)
Enriched Functional Tree-Based Classifiers: A Novel Approach Leveraging Derivatives and Geometric Features [0.0] 本研究では,高次元時系列の分類手法として,関数型データ分析(FDA)と木に基づくアンサンブル技術を統合した教師付き分類手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:13:03 GMT)
Enhanced Transformer-Based Tracking for Skiing Events: Overcoming Multi-Camera Challenges, Scale Variations and Rapid Motion -- SkiTB Visual Tracking Challenge 2025 [0.0] 我々は,変圧器ベースモデルSTARK (Spatio-Temporal Transformer Network for Visual Tracking) を用いてスキーヤーを追跡する。
我々はSTARKを適用して、カメラの動き、カメラの変化、閉塞など、ドメイン固有の課題に対処した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 06:26:33 GMT)
Enhanced Neuromorphic Semantic Segmentation Latency through Stream Event [0.0] フレームベースの視覚センサーで最適なセマンティックセグメンテーションを実現することは、UAVや自動運転車のようなリアルタイムシステムにとって大きな課題となる。
イベントベースのカメラにインスパイアされたセンサーからのイベントストリームを活用し、シーンの変化に応じてイベントをトリガーします。
我々は、この事象情報を利用して、低エネルギー消費で知られているバイオインスパイアされたコンピューティングパラダイムであるスパイキングニューラルネットワーク(SNN)を用いて、セマンティックセグメンテーションタスクを解決する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:43:18 GMT)
Engineering dipole-dipole couplings for enhanced cooperative light-matter interactions [0.0] 平行双極子の環内に配置された金属球が、環系内で「ガイドスライディング」状態を生成する効果的なハミルトニアンを生成することを示す。
これにより、ノイズの多い室温環境での定常的な超吸収が可能となり、従来の設計よりもはるかに簡単に実装できる。
本手法は分子構造における協調光物質効果を調整するための強力な設計パラダイムである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:59:01 GMT)
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification [0.0] 本稿では,トランスアーキテクチャの構造化プルーニングと量子化手法に着目し,最適化手法の体系的検討を行う。
実験の結果,静的量子化は分類性能を維持しながらエネルギー消費量を29.14%削減し,L1プルーニングは最小精度で推論速度を63%向上させることがわかった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:39:46 GMT)
Electrodynamics of Vortices in Quasi-2D Scalar Bose-Einstein Condensates [0.0] 準2次元(準2次元)スカラーボース・アインシュタイン凝縮体(BEC)における渦の双対性を導入する。
準2次元スカラーBECの渦を点渦近似を超えた2次元電磁力学にマッピングする方法を示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:05:53 GMT)
Efficient optimization of neural network backflow for ab-initio quantum chemistry [0.0] 第2量子化量子化学ハミルトニアンの基底状態は、分子特性を決定する鍵となる。
本研究では,コンパクトな部分空間構築,ゆがんだ局所エネルギー評価,サンプリングの改善,物理インフォームド修正を含む,これらの波動関数を最適化するための改良を開発した。
アブレーション研究は、各エンハンスメントの寄与を強調し、エネルギーの精度と計算効率が著しく向上したことを示している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:31:08 GMT)
Efficient and Accurate Spatial Mixing of Machine Learned Interatomic Potentials for Materials Science [0.0] 機械学習型原子間ポテンシャルは、ほぼ第一原理の精度を提供するが、計算コストが高い。
我々は,原子間ポテンシャルを空間的に混合することによりシミュレーションを高速化するための,効率的で柔軟なLAMMPSパッケージであるML-mixを提案する。
構成空間の関連領域における「拡張的」参照と密に一致する「チープ」近似モデルを生成することができることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:19:39 GMT)
Dynamical cluster-based optimization of tensor network algorithms for quantum circuit simulations [0.0] 本稿では, 量子ビットを動的に絡み合うクラスタに配置し, 複数の回路層の正確な収縮を1ステップで実現する,標準的なTEBDアルゴリズムである"cluster-TEBD"のバリエーションを紹介する。
我々は、安定化器と非安定化器の両方のランダム回路をシミュレートし、最大1000ドルのキュービットと100ドルのクリフォードゲートと非クリフォードゲートの層を持ち、ショアの量子アルゴリズムを数万の層でシミュレートする際のこれらの拡張アルゴリズムの性能を分析する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:49:11 GMT)
DreamNet: A Multimodal Framework for Semantic and Emotional Analysis of Sleep Narratives [0.0] 本研究では,ドリームレポートからセマンティックテーマや感情状態をデコードする,新しいディープラーニングフレームワークDreamNetを紹介する。
1500の匿名化されたドリームストーリーのキュレートされたデータセットでは、DreamNetは92.1%の精度と88.4%のF1スコアをテキストのみのモードで達成している。
強い夢と感情の相関は、メンタルヘルス診断、認知科学、パーソナライズされた治療の可能性を強調している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:10:07 GMT)
Does Quantum Information Require Additional Structure? [0.0] 我々は、直接観測されていない関係の量子空間の仮説を導入し、これは量子相関に先行し、ライヒェンバッハの共通因数原理と矛盾する。
我々は、有界状態に対する潜在的に測定可能な効果を予測する量子関係空間連続体の例として、Chyli'nskiモデルを提示する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:13:02 GMT)
District Vitality Index Using Machine Learning Methods for Urban Planners [0.0] カレントビタリティ指数と長期ビタリティ指数が提案されている。
ミスデータはK-Nearest Neighborsの計算によって処理される。
ランダムフォレストは最も信頼性が高く重要な特徴を特定するために使用されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:17:38 GMT)
Digital-Analog quantum Rabi simulation in the Deep Strong Coupling Regime [0.0] 深部強結合(DSC)系における量子ラビモデル(QRM)について検討する。
我々は、単一量子ビット回転と統合デジタルステップと量子ボゾンブロックを組み合わせて実装する。
DAQSの符号化を用いて、最先端の回路量子力学プラットフォーム上で効率的なシミュレーションを行うことができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:14:05 GMT)
Design of Resistive Frequency Selective Surface based Radar Absorbing Structure-A Deep Learning Approach [0.0] 提案手法は, 単ユニットセルを用いた各種レーダ吸収構造の低コスト設計と周波数帯の厚さ化に有効である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:09:13 GMT)
Design of Cavity Backed Slotted Antenna using Machine Learning Regression Model [0.0] このモデルは1GHzから8GHzの広帯域の入力反射係数に基づいてキャビティバックスロットアンテナの寸法を予測するために訓練された。
提案手法は、先進アンテナ設計における機械学習の活用の可能性を示し、レーダや軍用識別システム、セキュア通信ネットワークなどの実用化における効率性と精度を向上させる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:18:10 GMT)
Design and efficiency in graph-state computation [0.0] アルゴリズム固有のグラフと回路エッチングは、量子計算を実装するためにグラフ状態をコンパイルする戦略である。
Etchは、量子回路をグラフ状態に変換するためのオープンソースの回路エッチングツールである。
Etch を用いて IQP 回路を等価なグラフ状態に変換する実験により、効率の良いマジック状態蒸留よりも、パウリ量子ビットと非パウリ量子ビットの比が高かった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:44:29 GMT)
Deep learning and classical computer vision techniques in medical image analysis: Case studies on brain MRI tissue segmentation, lung CT COPD registration, and skin lesion classification [0.0] 本研究は,複数の画像モダリティにまたがるセグメンテーション,登録,分類タスクを体系的に評価した最初のものである。
脳組織のセグメンテーションでは、3D DLモデルは2Dモデルとパッチベースモデルより優れており、特に nnU-Net の Dice は 0.9397 である。
肺CTでは、古典エラスティス法がDLモデルより優れ、最小目標登録誤差(TRE)は6.68mmであった。
皮膚病変分類では、InceptionResNetV2やResNet50のようなDLモデルのアンサンブルが優れ、最大90.44%、バイナリとマルチの93.62%の精度が達成された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:05:08 GMT)
Deep Learning-Based Transfer Learning for Classification of Cassava Disease [0.0] 本稿では,カッサバ病画像の分類のための4つの畳み込みニューラルネットワークアーキテクチャの性能比較を行った。
その結果、このタスクの精度は87.7%、精度は87.8%、リコールは87.8%、F1スコアは87.7%であった。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:50:01 GMT)
Deep Learning For Time Series Analysis With Application On Human Motion [0.0] この論文はディープラーニングを活用し、特徴工学による分類を強化し、基礎モデルを導入し、コンパクトで最先端のアーキテクチャを開発する。
我々の貢献は、行動認識とリハビリテーションのための人間の動作分析を含む現実世界のタスクに当てはまる。
プロトタイピングのために,データ不足時の回帰モデルを支援する形状に基づく合成サンプル生成手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 18:01:51 GMT)
Data-Driven and Theory-Guided Pseudo-Spectral Seismic Imaging Using Deep Neural Network Architectures [0.0] フルウェーブフォーム・インバージョン(FWI)は高分解能地下モデルを再構成する。
FWIは、ソルバの選択とデータ可用性に関する課題に直面している。
Deep Learning(DL)は、データ駆動および物理ベースのメソッドをブリッジする、有望な代替手段を提供する。
この論文は擬似スペクトルFWIをDLに統合し、データ駆動と理論誘導の両方のアプローチを定式化する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:46:53 GMT)
DCSI -- An improved measure of cluster separability based on separation and connectedness [0.0] あるデータセットのクラスラベルが意味のあるクラスタに対応するかどうかは、実世界のデータセットを用いたクラスタリングアルゴリズムの評価に不可欠である。
密度に基づくクラスタリングにおける分離性の中心的な側面は、クラス間の分離とクラス内の連結性である。
新たに開発された尺度 (density cluster separability index, DCSI) は、これらの2つの特性を定量化することを目的としており、CVIとしても使用できる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:45:41 GMT)
Cross-Modality Investigation on WESAD Stress Classification [0.0] 本研究では、WESADデータセットを用いたストレス検出のためのトランスフォーマーモデル、心電図(ECG)、心電図(EDA)、筋電図(EMG)、呼吸速度(RESP)、温度(TEMP)、3軸加速度計(ACC)信号のトレーニングを開発した。
その結果, 単モード変圧器による生理的信号の解析, 精度, 精度およびリコール値が99.73%$から99.95%$の範囲で達成された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:04:58 GMT)
Contextual Quantum Neural Networks for Stock Price Prediction [0.0] 我々は、コンテキスト量子ニューラルネットワークを用いて、複数の資産の株価を予測するために量子機械学習(QML)を適用した。
このアーキテクチャは量子ファイナンスにおいて最初のものであり、優れた予測力と計算効率を提供する。
我々の発見は、金融アプリケーションにおけるQMLの変革の可能性を強調し、より先進的でリソース効率のよい量子アルゴリズムの道を開いた。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:39:23 GMT)
Comprehensive Digital Forensics and Risk Mitigation Strategy for Modern Enterprises [0.0] 本研究は、サイバーセキュリティに対するアプローチの概要として、予防的脅威予測、法医学的調査、CCPAなどの規制の遵守などを挙げる。
ソーシャルエンジニアリング、インサイダーリスク、フィッシング、ランサムウェアといった主要な脅威と、AIと機械学習を活用する緩和戦略について検討する。
この発見は、機密データを保護するための継続的監視、政策執行、適応型セキュリティ対策の重要性を強調している。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:18:49 GMT)
Complement or substitute? How AI increases the demand for human skills [0.0] 本稿では、人工知能(AI)が人間の労働を補うか、あるいは補うかを検討する。
2018年から2023年にかけて、米国から1200万件のオンライン求人情報を集めている。
結果として、AIに焦点を当てた役割は、レジリエンス、アジリティ、分析的思考といったスキルを必要とする可能性がほぼ2倍であることが示された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:30:39 GMT)
Comparison of encoding schemes for quantum computing of $S > 1/2$ spin chains [0.0] スピン鎖の量子計算のための4つの異なる符号化スキームをスピン量子数$S>1/2$と比較する。
3つの異なる量子ビット符号化方式は、閉じ込められたイオン量子コンピュータを用いて1/2 le S le 5/2$のハミルトンシミュレーションによって評価される。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:26:49 GMT)
Comment on "InAs-Al hybrid devices passing the topological gap protocol", Microsoft Quantum, Phys. Rev. B 107, 245423 (2023) [0.0] トポロジカルギャッププロトコル(TGP)は、トポロジカル超伝導の存在下での「一連の厳密な実験」として提示される。
ここでは、Microsoft Quantum (PRB 107, 245423 (2023)) によって「パス」された TGP が、「ギャップ」あるいは「トポロジ」という一貫した定義を欠いていることを示す。
TGPの結果は、磁場範囲、バイアス電圧範囲、データ解像度、カッター電圧対数の選択に敏感であることを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:57:08 GMT)
Cognitive networks highlight differences and similarities in the STEM mindsets of human and LLM-simulated trainees, experts and academics [0.0] 本研究は,STEMに焦点をあてたメンティスネットワークを用いた行動分析である。
ヒト forma mentis ネットワークは GPT-3.5 に比べてクラスタリング係数が有意に高かった。
特に人間の専門家は、認知ネットワークへのSTEM概念のより良い統合を反映して、堅牢なクラスタリング係数を実証した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:02:51 GMT)
Can Large Language Models Outperform Non-Experts in Poetry Evaluation? A Comparative Study Using the Consensual Assessment Technique [0.0] CAT(Consensual Assessment Technique)は、総合的な専門家による判断を通じて創造性を評価する手法である。
我々は2つの高度なLarge Language Model(LLM)、Claude-3-Opus と GPT-4o を用いて詩を評価する。
LLMは、出版会場に基づいて、基礎的な真実を一致させる非専門家の人間の裁判官によって達成された結果を上回ることができる。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:43:25 GMT)
Bound systems of interacting electrons. A step beyond density functional theory [0.0] 正電荷を持つ巨大核の外界における非相対論的相互作用電子ガスは、第2量子化のスキームで扱う。
密度汎関数論の基礎とそれを超える方法が明確に示されている。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:50:52 GMT)
Bidirectionalization For The Common People [0.0] Bifronsは、ドメイン固有のプログラミング言語を置き換えるBXレンズのライブラリである。
提案手法は、双方向変換の実装作業を単純化する。
単純なレンズテストフレームワークを提供することで、合理的に正確性を保証する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 09:05:13 GMT)
Benchmarking of Fluorescence Lifetime Measurements using Time-Frequency Correlated Photons [0.0] 本稿では,連続波源から発生する絡み合った光子の強い時間-周波数相関を用いて,蛍光寿命の革新的な手法の限界について検討する。
また、この手法を最先端のFLIMと比較し、改良されたメリットを観察した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:32:24 GMT)
BarkXAI: A Lightweight Post-Hoc Explainable Method for Tree Species Classification with Quantifiable Concepts [0.0] 本稿では,木種分類のための視覚モデルに対する演算子と定量化概念を用いた軽量な解釈法を提案する。
我々の研究は、世界的視覚的特徴と概念の観点からバーク視覚モデルを説明する最初の研究である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:31:15 GMT)
Balanced Neural ODEs: nonlinear model order reduction and Koopman operator approximations [0.0] 変分オートエンコーダ (VAEs) は次元の減少の潜在表現を学習するための強力なフレームワークである。
ニューラルネットワークは過渡系力学の学習において優れている。
標準ラテントODEは時変入力を持つシステムにおいて次元還元に苦しむことを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 16:45:12 GMT)
Anomaly Detection in Complex Dynamical Systems: A Systematic Framework Using Embedding Theory and Physics-Inspired Consistency [0.0] 複雑な力学系における異常検出は、産業やサイバー物理のインフラにおける信頼性、安全性、効率を確保するために不可欠である。
本稿では,古典的な埋め込み理論と物理に着想を得た一貫性原理を基礎としたシステム理論による異常検出手法を提案する。
本研究は, 異常が安定系の力学を阻害する仮説を支持し, 異常検出のための頑健かつ解釈可能な信号を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:06:13 GMT)
An anatomically-informed correspondence initialisation method to improve learning-based registration for radiotherapy [0.0] 患者間CT非剛性登録のための解剖学的インフォームド初期化法を提案する。
第2のNRRステップの前に、薄板スプライン(TPS)変形を用いてスキャンを初期化する。
2番目のステップとして、B-スプライン反復最適化に基づくアルゴリズムとディープラーニングに基づくアプローチの2つの確立されたNRR手法を比較した。
提案手法は,従来の反復アルゴリズムとより緊密に一致するように,学習に基づく手法の登録性能を改善した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 12:45:44 GMT)
Agentic Mixture-of-Workflows for Multi-Modal Chemical Search [0.0] 大規模言語モデル(LLM)は、様々な領域にわたる有望な推論と自動化機能を示している。
CRAG-MoWは、異なるCRAG戦略を用いて複数のエージェントを編成する新しいパラダイムである。
我々は、小型分子、高分子、化学反応、およびマルチモーダル核磁気共鳴(NMR)スペクトル検索のCRAG-MoWをベンチマークした。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 23:48:02 GMT)
African Gender Classification Using Clothing Identification Via Deep Learning [0.0] AFRIFASHION1600データセットは、アフリカ伝統服の1,600枚の画像を、男性と女性という2つのジェンダークラスに分類したものだ。
VGG16アーキテクチャを改良し,トランスファーラーニングを用いて訓練した深層学習モデルを開発した。
このモデルはテストセットで87%の精度を達成し、女性のサンプルに有利なデータセットの不均衡にもかかわらず、強い予測能力を示した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 20:59:59 GMT)
Adversarial Combinatorial Semi-bandits with Graph Feedback [0.0] 時間的地平線上での最適後悔は、$widetildeTheta(SsqrtT+sqrtalpha ST)$としてスケールする。
重要な技術的要素は、負の相関を持つランダム決定ベクトルを用いて凸化作用を実現することである。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 05:01:11 GMT)
Advanced YOLO-based Real-time Power Line Detection for Vegetation Management [0.0] 本稿では,電力線と隣接する植生を検知するインテリジェントリアルタイムモニタリングフレームワークを提案する。
ディープラーニング畳み込みニューラルネットワーク(CNN)、You Only Look Once(YOLO)をベースに開発された。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:21:06 GMT)
Activation degree thresholds and expressiveness of polynomial neural networks [0.0] 本研究では, 深部ニューラルネットワークの表現力について, ニューロバリアリティの幾何学的手法を用いて検討する。
我々は、幅1のボトルネックを伴わない全てのニューラルネットワークに対して、アクティベーション度閾値の存在を証明した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 03:37:41 GMT)
AI and Semantic Communication for Infrastructure Monitoring in 6G-Driven Drone Swarms [0.0] 従来のインフラ監視システムは、大規模なドローン調整のレイテンシと信頼性に欠ける5Gネットワークに重大なボトルネックに直面している。
我々は,超信頼性,低レイテンシ通信,エッジAI,セマンティック通信を統合し,検査を自動化する6G対応ドローン群システムを提案する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 17:05:35 GMT)
A quantum speedup algorithm for TSP based on quantum dynamic programming with very few qubits [0.0] ゲート複雑性における初期状態として,N長ハミルトニアンサイクルの均一な重ね合わせ状態を生成する量子アルゴリズムを提案する。
理論的にはクエリの複雑さが低いが、実用的な実装ソリューションが欠如しているアルゴリズムと比較すると、本アルゴリズムは回路実装が可能である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 01:31:13 GMT)
A perturbation theory for multi-time correlation functions in open quantum systems [0.0] 我々は、マルチ時間相関関数を計算するための体系的理論を開発することにより、オープン量子システム理論の範囲を広げる。
閉系の場合、そのような相関関係は十分に定義されているが、システムの状態に関する知識だけではそれらを完全に決定するには不十分である。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:52:13 GMT)
A diagrammatic formulation of local realism [0.0] 局所性とリアリズムの原理はどちらも1つの可換図で表されることを示す。
量子論は局所現実主義を満たさないことが知られているので、可換図式による局所現実主義の定式化は、非可換性の概念が量子論において基本的な役割を果たす別の方法を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 22:43:14 GMT)
A cohomology-based Gromov-Hausdorff metric approach for quantifying molecular similarity [0.0] 本研究では,コホモロジーに基づくGromov-Hausdorff法を導入して,1次元および高次元(コホモロジー群)の解析を行う。
幾何学的情報を取り入れることで,従来の持続的ホモロジー手法と比較して深い洞察を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 02:54:16 GMT)
A Proof of Generalized Kramers-Pasternack Relation using Hyper-Radial Equation [0.0] 超半径方程式を用いた一般化クラマース・パステルナック関係の証明を提案する。
このアプローチは、量子力学における対角半径行列要素の繰り返し関係の構造に関する深い洞察を与える。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 13:06:28 GMT)
A Pipeline of Augmentation and Sequence Embedding for Classification of Imbalanced Network Traffic [0.0] 本稿では,頑健で正確な埋め込み手法を用いて,データセットのバランスと分類を行うパイプラインを提案する。
提案した拡張パイプラインとFS-Embeddingを組み合わせることで収束速度が向上し,モデルパラメータの数が大幅に減少することを示す。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 07:55:24 GMT)
A Model-Centric Review of Deep Learning for Protein Design [0.0] ディープラーニングはタンパク質設計を変換し、正確な構造予測、シーケンス最適化、de novoタンパク質生成を可能にした。
ProtGPT2、ProteinMPNN、RFdiffusionなどの生成モデルは、自然進化に基づく制限を超えてシーケンスとバックボーンの設計を可能にした。
最近では、ESM3を含む共同シーケンス構造共設計モデルが両方のモダリティを統一されたフレームワークに統合し、設計性が向上した。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 14:31:21 GMT)
A Lightweight and Extensible Cell Segmentation and Classification Model for Whole Slide Images [0.0] 本稿では,軽量なセルセグメンテーションと分類モデルを作成することにより,データ品質,モデル性能,ユーザビリティを向上させるソリューションを提案する。
そこで,PanNukeとMoNuSACのアノテーションを改良し,異なる7つのセルタイプで統一されたデータセットを生成する。
第3に、基礎モデルの計算要求に対処するため、比較性能を維持しながら、モデルのサイズと複雑さを減らすために知識を蒸留する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:19:52 GMT)
A Hybrid Transformer Architecture with a Quantized Self-Attention Mechanism Applied to Molecular Generation [0.0] 本稿では,トランスデコーダの一部として,量子古典的自己アテンション機構を提案する。
クェリキードット積の時間的複雑さは古典的モデルでは$mathcalO(n2 d)$から量子モデルでは$mathcalO(n2 d)$に減少する。
この研究は、量子化自然言語処理(NLP)のための有望な道を提供する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 15:15:01 GMT)
A Hybrid Measurement Scheme for Generating nonGaussian Spin States [0.0] 本稿では,原子スピンアンサンブルの非古典状態を生成するプロトコルを提案する。
我々は、光の偏光回転を測定することによってスピン圧縮状態を生成する。
信号モードに散乱する単一光子を検出する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 19:59:39 GMT)
A HEART for the environment: Transformer-Based Spatiotemporal Modeling for Air Quality Prediction [0.0] ルル環境は高度でスケーラブルな大気汚染予測システムである。
エンコーダとデコーダの畳み込みニューラルネットワークを含み、4つの主要な汚染物質の平均汚染レベルを予測する。
本稿では,予測精度を向上させるための注意機構を備えたニューラルネットワークの強化について検討する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:54:27 GMT)
A Dual-Purpose Framework for Backdoor Defense and Backdoor Amplification in Diffusion Models [0.0] PureDiffusionは、バックドアディフェンスとバックドアアタック増幅という2つの対照的な役割を同時に果たす、デュアル目的のフレームワークである。
防御のために,拡散モデルに埋め込まれたバックドアトリガを反転させる2つの新しい損失関数を導入する。
攻撃増幅のために、バックドア拡散モデルに埋め込まれた元のトリガを補強するために、我々のトリガー反転アルゴリズムをどのように利用できるかを説明する。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 11:01:43 GMT)
A BV-Category of Spacetime Interventions [0.0] 我々は、Chu 構造を用いて、二重圏からBV-カテゴリをファンクショナルに構築する。
我々は任意のモノイド圏から時空におけるエージェント間の関係の標準モデルを構築する方法を見つける。
論文参考訳(メタデータ) (Wed, 26 Feb 2025 10:26:49 GMT)