On the Trustworthiness of Generative Foundation Models: Guideline, Assessment, and Perspective [314.8] Generative Foundation Models (GenFMs) がトランスフォーメーションツールとして登場した。
彼らの広く採用されていることは、次元の信頼に関する重要な懸念を提起する。
本稿では,3つの主要なコントリビューションを通じて,これらの課題に対処するための包括的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:20:36 GMT)
Energy-Based Diffusion Language Models for Text Generation [126.2] エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。
我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:23:30 GMT)
SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines [122.0] 大規模言語モデル(LLM)は、数学、物理学、計算機科学などの学問分野において顕著な熟練性を示している。
しかしながら、人間の知識は200以上の専門分野を含み、既存のベンチマークの範囲をはるかに超えている。
285分野にわたる大学院レベルの知識と推論能力を評価するベンチマークであるSuperGPQAを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:05:58 GMT)
Fact or Guesswork? Evaluating Large Language Model's Medical Knowledge with Structured One-Hop Judgment [108.6] 大規模言語モデル(LLM)は、様々な下流タスクドメインで広く採用されているが、実際の医学的知識を直接呼び起こし適用する能力はいまだ探索されていない。
既存の医療QAベンチマークの多くは、複雑な推論やマルチホップ推論を評価しており、LSM固有の医療知識を推論能力から切り離すことが困難である。
LLMの1ホップの医療知識を測定するために特別に設計されたデータセットであるMedical Knowledge Judgmentを紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:27:51 GMT)
LUME: LLM Unlearning with Multitask Evaluations [106.8] Unlearningは、大規模な言語モデル(LLM)から著作権のある、機密性の高い、あるいはプライベートなコンテンツを、完全に再トレーニングすることなく削除することを目的としている。
本研究では,(1)未学習の創造的短編小説,(2)機密情報付き未学習の合成バイオグラフィー,(3)公開バイオグラフィーのコレクションの3つのタスクを特徴とするマルチタスク・アンラーニング・ベンチマーク(LUME)を開発した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:30:45 GMT)
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.8] 本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:41:55 GMT)
Optimizing Singular Spectrum for Large Language Model Compression [95.8] SVDの分解したコンポーネントをデータ駆動で再スケールする新しい圧縮フレームワークであるSoCoを紹介する。
学習可能な特異スペクトルのおかげで、SoCoは重要度スコアに応じて成分を適応的にプーンする。
複数のLLMおよびベンチマークでの実験的な評価は、SoCoがモデル圧縮における最先端の手法を超越していることを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:18:39 GMT)
The Call for Socially Aware Language Technologies [94.7] NLPが機能する社会環境の要因、文脈、意味の認識の欠如である。
我々は、NLPが社会意識を発達させる上で大きな課題が残っており、この分野の新しい時代の始まりであると主張している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:39:08 GMT)
Dynamic Concepts Personalization from Single Videos [92.6] 動的概念で生成ビデオモデルをパーソナライズするための新しいフレームワークであるSet-and-Sequenceを紹介する。
提案手法は,空間的特徴と時間的特徴を明確に区別しないアーキテクチャにおいて,時間的重み空間を課す。
我々のフレームワークは動的概念をビデオモデルの出力領域に埋め込んでおり、前例のない編集性と構成性を実現している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:53:39 GMT)
Grammar Induction from Visual, Speech and Text [92.0] 本研究は、新しい視覚音声テキスト文法誘導タスク(textbfVAT-GI)を導入する。
言語文法がテキストを超えて存在するという事実に触発されて、テキストは文法帰納において支配的なモダリティであってはならないと論じる。
そこで本稿では,豊富なモーダル特化機能と補完機能を有効文法解析に活用した,ビジュアル・オーディオ・テキスト・インサイド・アウトサイド・オートエンコーダ(textbfVaTiora)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:46:29 GMT)
AuroraCap: Efficient, Performant Video Detailed Captioning and a New Benchmark [89.7] 大規模なマルチモーダルモデルに基づくビデオキャプタであるAuroraCapを提案する。
トークンマージ戦略を実装し、入力されたビジュアルトークンの数を減らす。
AuroraCapは、様々なビデオおよび画像キャプションベンチマークで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:36:12 GMT)
Triangulating LLM Progress through Benchmarks, Games, and Cognitive Tests [89.1] 本稿では,大規模質問応答ベンチマーク,インタラクティブゲーム,認知テストの3つの評価パラダイムについて検討する。
効果的な言語使用に不可欠な認知能力を測定するための,対象とするテストスイートをコンパイルする。
分析の結果,対話型ゲームは判別モデルにおける標準ベンチマークよりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:36:58 GMT)
Accurate Forgetting for Heterogeneous Federated Continual Learning [89.1] 提案手法は,フェデレーションネットワークにおける従来の知識を選択的に活用する新しい生成再生手法である。
我々は,従来の知識の信頼性を定量化するために,正規化フローモデルに基づく確率的フレームワークを用いる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:35:17 GMT)
Reward-Guided Iterative Refinement in Diffusion Models at Test-Time with Applications to Protein and DNA Design [87.6] 進化的アルゴリズムにインスパイアされた拡散モデルを用いた推論時間報酬最適化のための新しいフレームワークを提案する。
当社のアプローチでは,各イテレーションにおける2つのステップ – ノイズ発生と報酬誘導という,反復的な改善プロセスを採用しています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:48:45 GMT)
Multi-Record Web Page Information Extraction From News Websites [83.9] 本稿では,多数のレコードを含むWebページから情報を抽出する問題に焦点をあてる。
このギャップに対処するため、リストページ用に設計された大規模なオープンアクセスデータセットを作成しました。
我々のデータセットには13,120のWebページとニュースリストがあり、スケールと複雑さの両方で既存のデータセットをはるかに上回っている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:05:00 GMT)
Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models [82.9] マルチモーダル報酬モデルを評価するためのエキスパートアノテートベンチマークであるMultimodal RewardBenchを紹介する。
我々のデータセットは、様々な視覚言語モデルから収集された5,211個の注釈付き(プロンプト、選択された応答、拒否された応答)三つ子からなる。
Gemini 1.5 ProやClaude 3.5 Sonnetといったトップパフォーマンスモデルでさえ、全体的な精度は72%に過ぎません。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:48:13 GMT)
MedHallu: A Comprehensive Benchmark for Detecting Medical Hallucinations in Large Language Models [82.3] MedHalluは、医学的幻覚検出に特化して設計された最初のベンチマークである。
GPT-4o, Llama-3.1, および医学的に微調整されたUltraMedicalを含む最先端のLSMは、このバイナリ幻覚検出タスクに苦慮している。
双方向の包絡クラスタリングを用いて, 難解な幻覚は, 意味論的に真実に近いことを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:33:23 GMT)
Fast and Accurate Blind Flexible Docking [79.9] 小分子(配位子)のタンパク質標的への結合構造を予測する分子ドッキングは、薬物発見において重要な役割を果たす。
本研究では,現実的な視覚的フレキシブルドッキングシナリオを対象とした,高速かつ高精度な回帰ベースマルチタスク学習モデルであるFABFlexを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:31:13 GMT)
Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation [79.7] CoSynは、合成テキストリッチマルチモーダルデータを作成するフレームワークである。
高品質な命令チューニングデータを生成することができる。
また、合成ポインティングデータを生成し、視覚言語モデルで入力画像内の情報をグラウンドできる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:55:30 GMT)
CrossOver: 3D Scene Cross-Modal Alignment [78.3] CrossOverは、クロスモーダルな3Dシーン理解のための新しいフレームワークである。
モダリティを整列させることにより、シーンの統一的でモダリティに依存しない埋め込み空間を学ぶ。
堅牢なシーン検索とオブジェクトのローカライゼーションをサポートする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:05:30 GMT)
Optimizing Model Selection for Compound AI Systems [76.7] 本稿では,複合システムにおけるモデル選択のための効率的なフレームワークを提案する。
1つのモジュールを反復的に選択し、最も高いモジュールレベルのパフォーマンスを持つモデルを割り当てます。
すべてのモジュールで同じLLMを使用する場合と比較して、5%-70%の精度向上が期待できる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:36:25 GMT)
Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models [76.2] 不確実性定量化(英: Uncertainty Quantification、UQ)は、大規模言語モデル(LLM)から真正性を求めるための顕著なアプローチである。
本研究では,テキスト生成のために,分類タスクのUQ技術であるMahalanobis Distance (MD)を適用した。
提案手法は,複数レイヤのLCMからトークン埋め込みを抽出し,各トークンのMDスコアを計算し,これらの特徴を訓練した線形回帰を用いてロバストな不確実性スコアを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:25:13 GMT)
Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs [74.7] MLA(Multi-head Latent Attention)は、効率的かつ経済的推論を保証するために設計された革新的なアーキテクチャである。
本稿では,マルチヘッドアテンションからMLAへの移行のための,データ効率の良いファインチューニング手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:50:42 GMT)
Self-Improvement Towards Pareto Optimality: Mitigating Preference Conflicts in Multi-Objective Alignment [74.3] マルチオブジェクトアライメント(MOA)は、応答を複数の人間の嗜好目標に合わせることを目的としている。
DPOをベースとしたMOAアプローチは、データに広範囲にわたる優先的対立に悩まされている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:27:00 GMT)
MUSE: Mamba is Efficient Multi-scale Learner for Text-video Retrieval [73.8] 効率的なクロスレゾリューションモデリングのための線形計算複雑性を持つマルチスケールマンバであるMUSEを提案する。
具体的には、最後の単一スケールのフィーチャーマップに特徴ピラミッドを適用することで、マルチスケールの表現を生成する。
我々は,Mamba構造を効率的なマルチスケール学習者として用いて,スケールワイド表現を共同学習する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:28:55 GMT)
Noisy Test-Time Adaptation in Vision-Language Models [73.1] テスト時間適応(TTA)は、テスト中のターゲットデータのみに依存することにより、ソースデータとターゲットデータの分散シフトに対処することを目的としている。
本稿では、ゼロショット方式で、テスト時にノイズのあるサンプルをターゲットとするデータにモデルを適応させることに焦点を当てたゼロショットノイズTTA(ZS-NTTA)を提案する。
本稿では, 冷凍機の出力を擬似ラベルとして利用し, ノイズ検出器の訓練を行う適応ノイズ検出器(AdaND)を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:37:53 GMT)
More Tokens, Lower Precision: Towards the Optimal Token-Precision Trade-off in KV Cache Compression [71.4] 大規模言語モデル(LLM)では、KVキャッシュのメモリ使用量は推論において重大なボトルネックとなっている。
KVプルーニングやKV量子化を含む主流のKV圧縮法は、主にトークンまたは精度寸法を別々に扱う。
本稿では,KVキャッシュ圧縮におけるトークン精度トレードオフを包括的に検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:14:49 GMT)
Data Attribution for Text-to-Image Models by Unlearning Synthesized Images [71.2] テキスト・ツー・イメージ・モデルにおけるデータ帰属の目標は、新しい画像の生成に最も影響を与えるトレーニング画像を特定することである。
合成画像の非学習をシミュレートして効率的なデータ帰属法を提案する。
次に,学習過程の終了後に有意な損失偏差を伴う訓練画像を特定し,これらを影響力のあるものとしてラベル付けする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:16:03 GMT)
Identification of soft modes in amorphous Al$_{2}$O$_{3}$ via first-principles [69.7] アモルファスAl$_2$O$_3$は現代の超伝導量子ビットの基本成分である。
我々は、アモルファスAl$_2$O$_3$の第一原理的研究を行い、電子およびフォノンスペクトルの低エネルギーモードをTLSの起源として同定する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:43:24 GMT)
Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.6] 大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。
しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。
本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:32:19 GMT)
Stereo Image Coding for Machines with Joint Visual Feature Compression [69.3] 本稿では,機械用ステレオ画像符号化(SICM)について述べる。
SICMには,機械ビジョン指向ステレオ特徴圧縮ネットワーク (MVSFC-Net) が提案されている。
提案したMVSFC-Netは,3次元視覚タスクの性能だけでなく,圧縮効率も優れている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:46:17 GMT)
Time Travel: A Comprehensive Benchmark to Evaluate LMMs on Historical and Cultural Artifacts [65.9] TimeTravelは、10つの主要な歴史的地域にわたる266の異なる文化にまたがる10,250のエキスパート認定サンプルのベンチマークである。
TimeTravelは、原稿、アートワーク、碑文、考古学的発見のAIによる分析のために設計されている。
我々は、TimeTravelで現代のAIモデルを評価し、その強みを強調し、改善すべき領域を特定する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:59:51 GMT)
A Survey of Model Architectures in Information Retrieval [64.8] 機能抽出のためのバックボーンモデルと、関連性推定のためのエンドツーエンドシステムアーキテクチャの2つの重要な側面に焦点を当てる。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
我々は、パフォーマンスとスケーラビリティのアーキテクチャ最適化、マルチモーダル、マルチランガルデータの処理、従来の検索パラダイムを超えた新しいアプリケーションドメインへの適応など、新たな課題と今後の方向性について議論することで結論付けた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:42:58 GMT)
CrossVTON: Mimicking the Logic Reasoning on Cross-category Virtual Try-on guided by Tri-zone Priors [64.0] CrossVTONは、クロスカテゴリ仮想試行のための堅牢なフィッティングイメージを生成するためのフレームワークである。
クロスカテゴリ試行に必要な複雑な推論を構造化フレームワークに切り離す。
定性評価と定量的評価の両方において、既存のベースラインを超え、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:05:35 GMT)
Few-shot Species Range Estimation [61.6] 特定の種が地球上でどこで発見できるかを知ることは、生態学の研究と保全に不可欠である。
我々は、限られたデータから種の範囲を正確に推定することの難しさに対処するために、数発の種範囲推定の新しいアプローチを概説する。
推測において,本モデルでは,テキストや画像などの任意のメタデータとともに,空間的位置のセットを入力として取り,フィードフォワード方式で未確認種の範囲を予測できる種を出力する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:13:29 GMT)
TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.3] TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:09:01 GMT)
Fundamental Limitations in Defending LLM Finetuning APIs [61.3] 細調整APIの防御は、細調整攻撃を防ぐ能力に基本的に制限されていることを示す。
我々は、危険知識を隠蔽的に伝達するために、良性モデル出力のエントロピーを再利用する'ポイントワイド検出不能'アタックを構築した。
OpenAIの微調整APIに対する攻撃をテストし、有害な複数の質問に対する回答を導き出すことに成功しました。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:45:01 GMT)
External Large Foundation Model: How to Efficiently Serve Trillions of Parameters for Online Ads Recommendation [60.9] 広告推薦はオンライン広告システムの顕著なサービスであり、積極的に研究されている。
近年の研究では、レコメンデーションモデルのスケールアップと高度な設計が、大幅な性能向上をもたらすことが示されている。
しかし、モデルスケールが大きくなるにつれて、従来の研究は産業規模での2つの基本的な課題を無視することが多いため、産業とのギャップが著しく増大する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:35:52 GMT)
LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models [60.8] LongWriter-V-22kは22,158のサンプルのデータセットで、複数の入力イメージ、命令、0から10,000ワードまでの出力がある。
提案するIterDPOは,長い出力をセグメントに分割し,反復補正を用いて元の出力と好みのペアを形成する。
LongWriter-V-22kとIterDPOでトレーニングした7Bパラメータモデルは、ベンチマークで素晴らしいパフォーマンスを実現しています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:47:36 GMT)
Advancing Out-of-Distribution Detection via Local Neuroplasticity [60.5] 本稿では,コルモゴロフ・アルノルドネットワーク(KAN)の局所神経可塑性特性を利用した新しいOOD検出法を提案する。
本手法は,トレーニング対象のカンの活性化パターンとトレーニング対象のOOD検出パターンを比較した。
画像および医用領域のベンチマークに対するアプローチを検証し、最先端技術と比較して優れた性能と堅牢性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:13:41 GMT)
EAGER-LLM: Enhancing Large Language Models as Recommenders through Exogenous Behavior-Semantic Integration [60.5] 大規模言語モデル(LLM)は、高度なレコメンデータシステムの基本バックボーンとしてますます活用されている。
LLMは事前訓練された言語意味論であるが、llm-Backboneを通してゼロから協調意味論を学ぶ。
内因性行動情報と内因性行動情報とを非侵襲的に統合するデコーダのみの生成推薦フレームワークであるEAGER-LLMを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:01:57 GMT)
Edit Once, Update Everywhere: A Simple Framework for Cross-Lingual Knowledge Synchronization in LLMs [60.1] 我々は、シンプルで実用的なSOTAレシピであるクロス言語知識民主主義編集(X-KDE)を提案する。
X-KDEは、支配的な言語から他の言語への知識の伝達を効果的に行うように設計されている。
Bi-ZsRE と MzsRE のベンチマーク実験により、X-KDE は言語間性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:32:31 GMT)
Classical and quantum Coxeter codes: Extending the Reed-Muller family [59.9] 我々は、群 $mathbbZm$ を任意の有限コクセター群に置き換えることで、リード・ミュラー族を一般化する二進線型符号のクラスを導入する。
また、Coxeter符号から生じる量子CSS符号を構築し、Clifford群以外の論理演算子を許容する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:16:28 GMT)
FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling [59.8] 投機的サンプリングは,大規模言語モデルの自己回帰生成プロセスを促進する重要な手法として登場した。
本稿では、語彙空間圧縮によるドラフト候補選択を最適化する周波数ランクの投機的サンプリングフレームワークFR-Specを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:58:10 GMT)
LLM-Lasso: A Robust Framework for Domain-Informed Feature Selection and Regularization [59.8] LLM-Lassoは大規模言語モデル(LLM)を利用してラッソ回帰における特徴選択を導くフレームワークである。
LLMは各特徴に対してペナルティ因子を生成し、単純でチューニング可能なモデルを用いてラスソペナルティの重みに変換される。
LLMによりより関連づけられた特徴は、より低い罰を受け、最終モデルに保持される可能性を高める。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:41:35 GMT)
More for Keys, Less for Values: Adaptive KV Cache Quantization [59.7] 本稿では,大規模言語モデルにおけるキー値キャッシュを適応的に圧縮する情報認識量子化フレームワークを提案する。
鍵行列が常に高いノルム値を示し、値行列よりも量子化に敏感であることを示す。
我々は、鍵のビット幅を多く割り当て、値のビット幅を小さくする混合精度量子化戦略KV-AdaQuantを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:24:27 GMT)
TritonBench: Benchmarking Large Language Model Capabilities for Generating Triton Operators [59.6] Tritonは、効率的なGPUカーネルを構築するために設計されたハイレベルなPythonライクな言語である。
従来のコード生成のための大規模言語モデル(LLM)の進歩にもかかわらず、これらのモデルは正確でパフォーマンスに最適化されたトリトンコードを生成するのに苦労している。
本稿では,Triton演算子生成のための総合ベンチマークであるTritonBenchを紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:21:27 GMT)
MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.4] 本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:57:34 GMT)
Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation [58.8] 本稿では,多様な入力プロンプトから高品質な3次元形状とテクスチャを生成するための包括的枠組みを提案する。
フレームワークは3次元形状生成とテクスチャ生成で構成されている。
本報告では,フレームワークの改良と拡張に向けたシステムアーキテクチャ,実験結果,今後の方向性について述べる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:22:30 GMT)
RIDE: Enhancing Large Language Model Alignment through Restyled In-Context Learning Demonstration Exemplars [57.7] 調整調整は、大きな言語モデル(LLM)が倫理的かつ有用な振る舞いを確実にするために不可欠である。
本稿では,LLMアライメントを向上させるために,ICL(In-context Learning)を用いた低コストでチューニング不要な手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:41:10 GMT)
UPCORE: Utility-Preserving Coreset Selection for Balanced Unlearning [57.1] ユーザ仕様や法的フレームワークは、しばしば、大きな言語モデル(LLM)を含む、事前訓練されたモデルから削除される情報を必要とする。
これは、既に訓練済みのモデルからデータポイントのセットを削除または"偽造"する必要がある。
本研究では,非学習時の副次的損傷を軽減するための手法に依存しないデータ選択フレームワークUPCOREを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:51:10 GMT)
OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking [57.1] 提案するOmniThinkは,人間のような反復的展開とリフレクションの過程をエミュレートする,ゆっくり考えるマシンライティングフレームワークである。
実験結果から,OmniThinkはコヒーレンスや深度といった指標を伴わずに,生成した記事の知識密度を向上することが示された。
人間の評価と専門家のフィードバックは、OmniThinkが長文記事の生成における現実的な課題に対処する可能性を強調している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:05:18 GMT)
Interaction2Code: Benchmarking MLLM-based Interactive Webpage Code Generation from Interactive Prototyping [57.0] MLLM(Multimodal Large Language Models)は、設計からコードへのタスクにおいて顕著な性能を示す。
本稿では,インタラクティブなWebページを生成する上で,MLLMを初めて体系的に研究する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:59:43 GMT)
SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution [56.9] 大規模言語モデル(LLM)は、様々な複雑なタスクにまたがる顕著な習熟度を示している。
SWE-Fixerは、GitHubの問題を効果的かつ効率的に解決するために設計された、新しいオープンソースフレームワークである。
我々は,SWE-Bench LiteとVerifiedベンチマークに対するアプローチを評価し,オープンソースモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:19:39 GMT)
Harnessing PDF Data for Improving Japanese Large Multimodal Models [56.8] 大規模マルチモーダルモデル (LMM) は英語では高い性能を示したが、日本語では有効性は限られている。
現在の日本のLMMは、しばしば翻訳された英語のデータセットに依存しており、日本固有の文化知識を捉える能力を制限する。
我々は、事前訓練されたモデルを利用してPDFから画像とテキストのペアを抽出する完全自動パイプラインを導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:59:59 GMT)
Towards Efficient Automatic Self-Pruning of Large Language Models [55.9] トレーニング後の構造化プルーニングは、トレーニングを必要とせずに大規模言語モデルを熟成する有望なソリューションである。
この問題を緩和する鍵は、各レイヤのプルーニング率を正確に決定することにある、と我々は主張する。
我々は、レイヤワイドプルーニングレートを効率的に検索するLLMのためのエンドツーエンドの自動自動プルーニングフレームワークである$textbfSelf-Prunerを紹介した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:59:50 GMT)
Determining Layer-wise Sparsity for Large Language Models Through a Theoretical Perspective [55.9] 本稿では,大規模言語モデル (LLM) の階層的疎度率を理論的観点から決定する上での課題に対処する。
これは、スペーサー化プロセス全体での再構成エラーの累積効果を指す。
この問題を緩和するレイヤワイド・スパシティ・アロケーションに対する、シンプルで効果的なアプローチを導出します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:51:10 GMT)
Certified Robustness Under Bounded Levenshtein Distance [55.5] 畳み込み型分類器のリプシッツ定数をレヴェンシュテイン距離に対して計算する最初の方法を提案する。
我々の方法であるLipsLevは、それぞれ18.80ドル%と13.93ドル%の精度を1ドルと2ドルで得ることができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:44:15 GMT)
OccGaussian: 3D Gaussian Splatting for Occluded Human Rendering [55.5] 表面レンダリングにNeRFを用いた従来手法では,閉鎖領域の復元には1日以上,閉塞領域のレンダリングには数秒を要していた。
OccGaussianは3D Gaussian Splattingをベースとして6分以内でトレーニングが可能で,最大160FPSまでの高品質な人体レンダリングを実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:16:20 GMT)
DC-ControlNet: Decoupling Inter- and Intra-Element Conditions in Image Generation with Diffusion Models [55.4] マルチ条件画像生成のためのフレームワークであるDC(Decouple)-ControlNetを紹介する。
DC-ControlNetの背景にある基本的な考え方は、制御条件を分離し、グローバルな制御を階層的なシステムに変換することである。
要素間の相互作用について、多要素間相互作用を正確に処理するInter-Element Controllerを導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:01:02 GMT)
Robin3D: Improving 3D Large Language Model via Robust Instruction Tuning [55.3] 大規模命令追従データに基づいて訓練された強力な3DLLMであるRobin3Dを紹介する。
我々は,344K の逆数サンプル,508K の逆数サンプル,および165K のベンチマーク・トレーニング・セットからなる100万の命令追従データを構築した。
Robin3Dは、広く使用されている5つのマルチモーダル学習ベンチマークにおいて、従来方法よりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:06:19 GMT)
How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM? [55.3] ローランク適応(ローランク適応、LoRA)は、大規模言語モデルの更新やドメイン固有適応のための一般的かつ効率的な訓練手法である。
これまでに学習した知識を損なうことなく, LoRA を用いて LLM に新たな事実を組み込む方法について検討した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:31:03 GMT)
Antiparticles in non-relativistic quantum mechanics [55.2] 非相対論的量子力学は、もともと粒子を記述するために定式化された。
量子場理論に訴えることなく、非相対論的ケースで反粒子の概念をいかに導入できるかを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:26:47 GMT)
S*: Test Time Scaling for Code Generation [55.1] コード生成のための最初のハイブリッドテストタイムスケーリングフレームワークであるS*を提案する。
S*は生成されたコードのカバレッジと選択精度を大幅に改善する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:18:53 GMT)
HPS: Hard Preference Sampling for Human Preference Alignment [55.1] HPS(Hard Preference Sampling)は、堅牢で効率的な人間の選好アライメントのための新しいフレームワークである。
HPSはアライメント品質を維持しながら計算オーバーヘッドを低減する。
HH-RLHFとPKU-Safetyデータセットの実験はHPSの有効性を検証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:37:41 GMT)
Reward Models Identify Consistency, Not Causality [55.0] 最先端の報酬モデルでは、因果正しさよりも構造的な一貫性が優先される。
問題文の削除は報酬のスコアに最小限の影響を与える。
数値を変更するか、推論フローを乱すかは、RM出力に大きく影響する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:57:14 GMT)
Improving the Diffusability of Autoencoders [54.9] 高品質な画像やビデオを生成するための主要なアプローチとして、潜伏拡散モデルが登場している。
我々は、現代のオートエンコーダのスペクトル分析を行い、その潜在空間における不規則な高周波成分を同定する。
我々は、この高周波成分が拡散合成プロセスの粗大な微細な性質に干渉し、生成品質を阻害する仮説を立てた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:45:44 GMT)
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces [54.4] 我々は完全なフィードバックの下でオンライン学習のためのトンプソンサンプリングの分析法を開発した。
我々は、後悔の分解を、学習者が先入観を期待したことを後悔させ、また、過度な後悔と呼ぶ先延ばし的な用語を示します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:10:12 GMT)
Dynamic Low-Rank Sparse Adaptation for Large Language Models [54.1] Low-rank Sparse Adaptation (LoSA)は、低ランク適応をsparse LLM sparsityにシームレスに統合する新しい手法である。
LoSAは、微調整中に対応するスパース重みに基づいてLoRA結果を動的に分散する。
LoSAは、追加の推論負荷を伴わずに、スパースLSMの有効性を数時間で効果的に向上させることができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:37:32 GMT)
Plan-over-Graph: Towards Parallelable LLM Agent Schedule [53.8] 大規模言語モデル(LLM)はタスク計画の推論において例外的な能力を示した。
本稿では,まず実生活のテキストタスクを実行可能なサブタスクに分解し,抽象的なタスクグラフを構築する,新しいパラダイムであるプランオーバーグラフを提案する。
モデルはこのタスクグラフを入力として理解し、並列実行計画を生成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:47:51 GMT)
ReVISE: Learning to Refine at Test-Time via Intrinsic Self-Verification [53.8] Refine via Intrinsic Self-Verification (ReVISE)は、LLMが自己検証を通じてアウトプットを自己修正できる効率的なフレームワークである。
様々な推論タスクに関する実験により、ReVISEは効率的な自己補正を実現し、推論性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:50:02 GMT)
InductionBench: LLMs Fail in the Simplest Complexity Class [53.7] 大規模言語モデル(LLM)は推論において顕著に改善されている。
帰納的推論(inductive reasoning)は、観測されたデータから基礎となるルールを推測するものであり、まだ探索されていない。
本稿では, LLMの帰納的推論能力を評価するための新しいベンチマークであるインジェクションベンチを紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:48:00 GMT)
Text-to-Image Rectified Flow as Plug-and-Play Priors [52.6] 整流流は、ソースからターゲット分布への線形進行を強制する新しい生成モデルのクラスである。
補正フローアプローチが生成品質と効率を上回り,推論ステップを少なくすることを示した。
また,画像のインバージョンや編集における競合性能も示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:17:01 GMT)
MLGym: A New Framework and Benchmark for Advancing AI Research Agents [51.9] 我々はMeta MLGymとMLGym-Benchを紹介した。これはAI研究タスクにおける大規模言語モデルの評価と開発のための新しいフレームワークとベンチマークである。
これは機械学習(ML)タスクのための最初のGym環境であり、そのようなエージェントをトレーニングするための強化学習(RL)アルゴリズムの研究を可能にする。
我々は、Claude-3.5-Sonnet、Llama-3.1 405B、GPT-4o、o1-preview、Gemini-1.5 Proなどのベンチマークで、多くのフロンティア大言語モデル(LLM)を評価した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:28:23 GMT)
Triply Laplacian Scale Mixture Modeling for Seismic Data Noise Suppression [51.9] ポーラシティに基づくテンソルリカバリ法は, 地震データノイズを抑制する大きな可能性を示している。
本研究では, 3次元ラプラシアンスケール混合(TLSM)による地震波の抑制手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:28:01 GMT)
ParallelComp: Parallel Long-Context Compressor for Length Extrapolation [51.7] ParallelCompは、長文外挿のためのトレーニング不要のメソッドである。
コンテクスト長を4Kから128Kに拡張し、高いスループットを維持し、パープレキシティを保存する。
我々の分析は、並列注意機構における注意バイアスに関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:10:43 GMT)
$\text{M}^{\text{3}}$: A Modular World Model over Streams of Tokens [51.7] トークン化を個別に最適化しながら、トークンストリームを動的にモデリングする、有望なモジュラーフレームワークとして、トークンベースのワールドモデルが登場した。
本稿では、このフレームワークを拡張した、$textbfm$odular $textbfw$orld $textbfm$odelを紹介します。
$textMtext3$は、エージェントのパフォーマンスを向上させるために、既存の文献からいくつかの改善を実現している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:35:54 GMT)
Synthesizing Post-Training Data for LLMs through Multi-Agent Simulation [51.2] MATRIXは、様々なテキストベースのシナリオを自動的に生成するマルチエージェントシミュレータである。
制御可能でリアルなデータ合成のためのMATRIX-Genを紹介する。
AlpacaEval 2 と Arena-Hard のベンチマークでは、Llama-3-8B-Base が、MATRIX-Gen によって合成されたデータセット上で、たった 20K の命令応答ペアで、Meta の Llama-3-8B-Instruct モデルより優れています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:26:26 GMT)
The Belief State Transformer [50.2] ビリーフ状態変換器(Belief State Transformer)は、接頭辞と接尾辞の両方を入力として取る次世代の予測器である。
従来のフォワードオンリーのトランスフォーマーが抱える課題を効果的に解決する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:44:32 GMT)
SPRIG: Stackelberg Perception-Reinforcement Learning with Internal Game Dynamics [50.1] この研究は、単一のエージェント内の内部知覚と政治の相互作用を協調的なStackelbergゲームとしてモデル化するフレームワークであるSPRIGを紹介する。
Atari BeamRider環境における実験結果は,SPRIGの有効性を示し,通常のPPOよりも約30%高いリターンを達成した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:02:29 GMT)
Federated Fine-Tuning of Large Language Models: Kahneman-Tversky vs. Direct Preference Optimization [49.9] 我々は,大言語モデル (LLM) をフェデレート学習 (FL) 設定で微調整する方法として,KTO (Kahneman-Tversky Optimization) を評価した。
オリジナルの(KTOO)と再配布された(KTOR)構成の両方において、KTOはすべてのベンチマークで一貫してDPOを上回っている。
これらの知見は、KTOをFLの堅牢でスケーラブルな微調整方法として確立し、プライバシー保護、分散化、異種環境への採用を動機付けている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:44:21 GMT)
LongPO: Long Context Self-Evolution of Large Language Models through Short-to-Long Preference Optimization [49.4] LongPOはショート・ツー・ロングの嗜好データを利用して、ショート・コンテクストの機能をロング・コンテクストのタスクに転送する。
LongPOは短文性能を完全に保持し、長文タスクと短文タスクの両方において単純 SFT と DPO をほぼ上回っている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:16:36 GMT)
Data-Efficient Pretraining with Group-Level Data Influence Modeling [49.2] グループレベルデータ影響モデリング(Group-MATES)は、新しいデータ効率事前学習手法である。
Group-MATESは、事前学習モデルをデータセットで局所的に探索することで、オラクルグループレベルの影響を収集する。
その後、関係データの影響モデルを微調整し、個々の影響の相関重み付けとしてオラクルを近似する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:34:46 GMT)
Reinforcement Learning with Graph Attention for Routing and Wavelength Assignment with Lightpath Reuse [49.2] フレキシブルレートトランスポンダを用いた固定グリッドネットワーク上でのルーティングとスペクトル割り当ての強化学習について検討する。
RWA-LRは総長ではなくホップ数によって候補経路が順序づけられたときのスループットが6%向上することを示す。
我々はRWA-LRのためのRLエージェントをポリシーと値関数のためのグラフアテンションネットワークで訓練し、グラフ構造化データを利用する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:10:11 GMT)
SpinQuant: LLM quantization with learned rotations [49.1] 重み、アクティベーション、KVキャッシュに適用された後トレーニング量子化(PTQ)技術は、大規模言語モデル(LLM)のメモリ使用量、レイテンシ、消費電力を大幅に削減する。
我々は、量子化精度を高めつつ、完全精度のトランスフォーマーアーキテクチャにおいて同一の出力をもたらす、適用可能な回転パラメータ化の集合を同定する。
本研究では,学習した回転行列を最適な量子化ネットワーク精度に組み込む新しい手法であるSpinQuantを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:07:00 GMT)
Multi-Agent Coordination across Diverse Applications: A Survey [48.8] 多様なマルチエージェントシステム(MAS)のトレンド拡散を可能にする基盤機構に関する研究
本調査は,4つの基本的な調整質問に答える統一的な理解を通じて,アプリケーション全体での協調研究の現状を概説する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:12:45 GMT)
PLPHP: Per-Layer Per-Head Vision Token Pruning for Efficient Large Vision-Language Models [48.3] 本稿では,2レベルきめ細粒度プルーニング法PLPHPを提案する。
PLPHPはアテンションヘッドレベルでプルーニングを適用し、同じレイヤ内の異なるヘッドが独立して重要なコンテキストを保持することができる。
複数のベンチマークの実験では、PLPHPは18%高速なデコード速度を提供し、キーバリューキャッシュ(KVキャッシュ)のサイズを50%以上削減している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:31:31 GMT)
SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features [48.1] 我々は、新しい多言語視覚言語エンコーダのファミリーであるSigLIP 2を紹介する。
従来の画像テキスト学習の目的を、独立に開発されたいくつかの技術で統一されたレシピに拡張する。
新しいトレーニングレシピは、ローカライゼーションと密集した予測タスクに大きな改善をもたらす。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:08:29 GMT)
Sharpness-Aware Minimization Efficiently Selects Flatter Minima Late in Training [47.3] Sharpness-Aware Minimization (SAM) はトレーニングの遅滞時に効率よくフラットなミニマを選択する。
SAMの訓練の終わりに応用されたいくつかのエポックでさえ、完全なSAMトレーニングとほぼ同じシャープネスと解のシャープネスをもたらす。
我々は、最終解の物性を形作る上で、最終相で選択した最適化法がより重要であると推測する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:08:28 GMT)
Ask, and it shall be given: On the Turing completeness of prompting [47.1] 大規模言語モデル(LLM)は機械学習に革命をもたらし、いわゆるLLMプロンプトパラダイムを開始した。
本稿では, LLMプロンプトパラダイムに関する最初の理論的研究を, 我々の知識を最大限活用するために提示する。
有限サイズの変換器が存在し、計算可能な任意の関数に対して、変換器が関数を演算する対応するプロンプトが存在することを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:43:15 GMT)
Less is More: Improving LLM Alignment via Preference Data Selection [46.9] DPO(Direct Preference Optimization)は,大規模言語モデルと人間の嗜好を整合させる,有望なアプローチである。
DPOトレーニングにおけるデータセットキュレーションのための新たなマージン最大化原理を提案する。
Ultrafeedbackデータセットの10%しか使用せず、様々なLlamaおよびMistralシリーズモデルに対して3%から8%の改善を実現しています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:45:17 GMT)
Confidence-aware Fine-tuning of Sequential Recommendation Systems via Conformal Prediction [46.8] Sequential Recommendation Systems (SRecsys)では、クロスエントロピー(CE)損失に依存する従来のトレーニングアプローチは、精度を優先することが多いが、ユーザの満足度指標とうまく一致しない。
コンフォーマル予測(CP)に基づく損失をCE損失と統合した新しい微調整フレームワークである textbfCPFT を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:50:17 GMT)
Unstructured Evidence Attribution for Long Context Query Focused Summarization [46.7] 大規模言語モデル(LLM)は、ユーザクエリが与えられた場合、非常に長いコンテキストからコヒーレントな要約を生成することができる。
既存のシステムがどのようにして、そのコンテキストから構造化されていない証拠を生成し、適切に引用するのに苦労しているかを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:57:42 GMT)
Confidence Estimation via Sequential Likelihood Mixing [46.7] 逐次近似混合に基づく信頼セット構築のための普遍的枠組みを提案する。
オンライン推定による逐次混合,ベイズ推定,後悔の不平等の基本的な関係を確立する。
古典的な設定に対して、より厳密な信頼シーケンスを導出することで、フレームワークのパワーを説明する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:16:34 GMT)
CrossFuse: Learning Infrared and Visible Image Fusion by Cross-Sensor Top-K Vision Alignment and Beyond [46.0] 赤外線および可視画像融合(IVIF)は、ビデオ監視や自律運転システムといった重要な分野にますます応用されている。
マルチビュー拡張に基づく赤外線可視融合フレームワークを提案する。
本手法は, 実用化におけるIVIFタスクの信頼性と安定性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:19:30 GMT)
Multi-Faceted Studies on Data Poisoning can Advance LLM Development [45.5] 本稿では,大規模言語モデルにおけるデータ中毒の役割を再考する。
脅威の観点からは、データ中毒攻撃の実践的戦略は、実際の安全リスクを評価し、対処するのに役立ちます。
信頼性の観点からは、データ中毒を利用してより堅牢なLSMを構築することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:19:51 GMT)
QUILL: Quotation Generation Enhancement of Large Language Models [45.4] 大規模言語モデル(LLM)は優れた筆記アシスタントとなったが、引用生成に苦戦している。
これは、事実的な引用を提供するときに幻覚を与えるか、人間の期待を超える引用を与えるのに失敗するためである。
まず,引用生成タスクの総合的かつ自動評価システムを構築し,それぞれが対応する自動測定値を持つ5つの基準から構成される。
次に、スコープが広く次元が豊富なバイリンガル知識ベースを構築し、最大32,022個の引用を含む。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:29:42 GMT)
TabFSBench: Tabular Benchmark for Feature Shifts in Open Environment [45.4] タブラルデータは様々な機械学習タスクで広く利用されている。
これまでの研究は主に分布シフトを緩和することに集中してきたが、特徴シフトは限定的な注目を集めた。
本稿では,表型データにおける特徴シフトに関する最初の包括的研究を行い,最初の表型特徴シフトベンチマーク(TabFSBench)を紹介する。
TabFSBenchは、https://github.com/LAMDASZ-ML/TabFSBenchで数行のPythonコードを使用することで、パブリックアクセス用にリリースされた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:54:43 GMT)
LIFT: Improving Long Context Understanding of Large Language Models through Long Input Fine-Tuning [45.3] Long Input Fine-Tuning (LIFT)は、ロングコンテキストモデリングのための新しいフレームワークである。
LIFTは長い入力に基づいてモデルパラメータを動的に適応する。
Gated Memoryは、長期入力記憶とICLを自動的にバランスをとる特別なアテンションアダプタである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:32:24 GMT)
3D-Adapter: Geometry-Consistent Multi-View Diffusion for High-Quality 3D Generation [45.2] 3D-Adapterは、3D幾何学的認識を事前訓練された画像拡散モデルに注入するために設計されたプラグインモジュールである。
Instant3DやZero123++のようなテキスト・ツー・マルチビューモデルの幾何学的品質を大幅に向上させることを示す。
また,テキスト・ツー・3D,画像・ツー・3D,テキスト・トゥ・テクスチャ,テキスト・トゥ・アバタータスクにおいて,高品質な結果を示すことで,3D-Adapterの幅広い応用可能性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:42:30 GMT)
An Efficient Ground-aerial Transportation System for Pest Control Enabled by AI-based Autonomous Nano-UAVs [45.1] 我々は、害虫検出のための小さな画像ベースの畳み込みニューラルネットワーク(CNN)を設計し、微調整し、最適化する。
我々のCNNは6.8フレーム/秒でリアルタイムに動作し、クレイジーフリーナノUAVに搭載されたGWT GAP9 System-on-Chip上で33mWが必要になります。
このシナリオでは、検査と治療の両方を行う従来の単座車両と比較して、効率的な輸送システムは最大20時間作業時間を節約できる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:14:55 GMT)
Optimal control in large open quantum systems: the case of transmon readout and reset [45.0] 本稿では, 随伴状態法と逆時間バックプロパゲーションを組み合わせることで, 極めて大規模なオープンシステム量子制御問題を解く枠組みを提案する。
超伝導量子ビットにおける2つの本質的に散逸する演算を最適化するために、この枠組みを適用した。
提案手法は, 標準パルスがほぼ最適であるのに対して, プロトコル中にトランスモンドライブを付加することで, 忠実度と持続時間の2倍向上が期待できることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:00:36 GMT)
XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning [45.0] 我々は,XLand-MiniGrid環境に基づくテキスト内強化学習のための大規模データセットであるXLand-100Bを提案する。
これには3万ドル近いさまざまなタスクのための完全な学習履歴が含まれており、100ドルの移行と2.5億ドルのエピソードをカバーしている。
データセットの収集には5万時間のGPUが必要だった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:51:24 GMT)
Soft Condorcet Optimization for Ranking of General Agents [44.9] ソフトコンドルチェット最適化(SCO)という,社会選択フレームワークに触発された新たなランキング方式について述べる。
SCOランキングは、PrefLibオープンランキングアーカイブの865の選好プロファイルにまたがる正規化Kendall-Tau距離の最適ランキングから、平均0から0.043まで離れている。
SCOランキングは、古典的な7人プレーヤーゲームである外交の31,049ゲームにまたがる52,958人の人間プレイヤーを含む問題において、ホールトアウトテストセットで測定された最適なランキングに最適な近似を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:41:03 GMT)
Variance Reduction Methods Do Not Need to Compute Full Gradients: Improved Efficiency through Shuffling [44.3] 大規模機械学習問題に対するメモリ効率のアルゴリズムを開発した。
メモリ効率を向上し、完全な計算を避けるために、2つの重要な手法を用いる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:37:45 GMT)
Making Them a Malicious Database: Exploiting Query Code to Jailbreak Aligned Large Language Models [44.3] 安全アライメントの一般化可能性を検討するための新しい枠組みを提案する。
LLMを知識データベースとして扱うことにより、自然言語の悪意あるクエリを構造化された非自然なクエリ言語に変換する。
メインストリームのLSMについて広範な実験を行い、QueryAttackが高い攻撃成功率を達成できることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:19:05 GMT)
OBELiX: A Curated Dataset of Crystal Structures and Experimentally Measured Ionic Conductivities for Lithium Solid-State Electrolytes [44.2] 固体電解質電池は近い将来、液体電解質リチウムイオン電池を置き換えることが期待されている。
イオン伝導性の高い物質を見つけるには時間と資源がかかる。
OBELiXは、合成固体電解質材料と室温イオン伝導度を実験的に測定したデータベースである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:59:35 GMT)
On Memorization in Diffusion Models [44.0] より小さなデータセットでは記憶の挙動が生じる傾向があることを示す。
我々は、有効モデル記憶(EMM)の観点から、影響因子がこれらの記憶行動に与える影響を定量化する。
本研究は,拡散モデル利用者にとって実用的意義を持ち,深部生成モデルの理論研究の手がかりを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:17:25 GMT)
CKnowEdit: A New Chinese Knowledge Editing Dataset for Linguistics, Facts, and Logic Error Correction in LLMs [43.1] 大規模言語モデル(LLM)における言語的・事実的・論理的誤りの訂正を目的とした,中国初の知識編集データセットであるCKnowEditを紹介する。
我々は、古典的なテキスト、イディオム、Baidu Tieba Ruozhibaのコンテンツを含む、幅広い情報源から7種類の知識を収集します。
このデータセットを解析することにより、中国語を習得する上で、現在のLLMが直面する課題を強調します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:58:39 GMT)
ATRI: Mitigating Multilingual Audio Text Retrieval Inconsistencies by Reducing Data Distribution Errors [42.5] 既存の多言語音声テキスト検索方式は、例えば言語間での類似性マッチングのような不整合に悩まされている。
1対kのコントラスト学習とオーディオ-英語のコントラスト学習を用いた一貫したML-ATR方式を提案する。
提案手法は,英語を含む8つの主流言語に対して,リコールと整合性評価の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:06:15 GMT)
Do Audio-Language Models Understand Linguistic Variations? [42.2] Open-vocabulary Audio Language Model (ALM)は、自然言語クエリを用いた音声テキスト検索の新しいパラダイムである。
本稿では,言語変化に対する音声表現を学習するための新しい,計算効率の高い手法であるRobostCLAPを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:51:26 GMT)
Visible-Thermal Tiny Object Detection: A Benchmark Dataset and Baselines [41.8] 我々は、可視光熱小物体検出(RGBT SOD)のための高多様性を持つ最初の大規模ベンチマークを構築した。
RGBT-Tinyは、多彩なターゲット(7種類)と高多様性シーン(8種類)を含む。
本研究では,小型・大型の目標に対して高いロバスト性を示すSAFit尺度を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:53:16 GMT)
Large Language Models Struggle to Describe the Haystack without Human Help: Human-in-the-loop Evaluation of LLMs [41.1] 本研究では,教師なし,教師なしの大規模言語モデルを用いて,ユーザが獲得する知識を計測する。
LLMは人間の助けなしに大規模なコーパスの干ばつ、特にドメイン固有のデータを記述するのに苦労している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:19:41 GMT)
Measuring and Benchmarking Large Language Models' Capabilities to Generate Persuasive Language [41.1] 本研究では,Large Language Models (LLM) の説得的テキスト生成能力について検討する。
特定のドメインやタイプの説得に焦点を当てた先行研究とは対照的に、諸藩をまたいだ総合的研究を行う。
我々は、短いテキストのペア対からなる新しいデータセットPersuasive-Pairを構築し、LLMによって書き直され、説得言語を増幅または縮小する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:54:03 GMT)
A Meta-Evaluation of Style and Attribute Transfer Metrics [41.1] LLMは、どんなスタイルでもテキストを書き直しやすく、より丁寧で説得力があり、よりポジティブです。
本稿では,コンテンツ保存に着目したスタイルと属性伝達の評価指標を大規模に検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:16:34 GMT)
SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters [40.6] SimPERは言語モデルアライメントのための効果的な選好最適化アルゴリズムである。
SimPERは実装が容易で、高価なハイパーパラメータチューニングと参照モデルを必要としない。
SimPERは、既存のアプローチよりも一貫して、大幅に優れています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:26:44 GMT)
Unshackling Context Length: An Efficient Selective Attention Approach through Query-Key Compression [40.4] 効率的な選択注意(Efficient Selective Attention, ESA)は、トークンレベルで最も重要なトークンを効率的に選択することで、注意力を計算する新しいアプローチである。
コンテクスト長8k,32kのオープンソースLLMを用いて,最大256kまでの長周期ベンチマークでESAを評価した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:52:36 GMT)
Aligning LLMs to Ask Good Questions A Case Study in Clinical Reasoning [39.8] 大規模言語モデル(LLM)は、不確実性の下で有効な質問をすることがしばしば失敗する。
提案するALFAは,「良い」質問の概念を理論的な属性の集合に分解することで,LCMの質問応答を改善するフレームワークである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:59:31 GMT)
Multipartite entanglement in the diagonal symmetric subspace [39.6] 対角対称状態に対しては、$d = 3,4 $ および $N = 3$ の有界絡みがないことを示す。
四角形の多部対角対称状態をより大きい局所次元の二部対角対称状態に写像する構成的アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:59:59 GMT)
Forecasting Local Ionospheric Parameters Using Transformers [39.6] 本稿では,トランスを用いたニューラルネットワークを用いたキー電離球パラメータの予測手法を提案する。
このモデルは、F2層ピークプラズマ周波数(foF2)、F2層ピーク密度高さ(hmF2)、および所定の地理的位置に対する全電子量(TEC)の正確な予測と不確実性定量化を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:23:09 GMT)
T2ISafety: Benchmark for Assessing Fairness, Toxicity, and Privacy in Image Generation [39.5] T2ISafetyは、毒性、公正性、バイアスという3つの主要な領域にわたるT2Iモデルを評価する安全ベンチマークである。
我々は68Kの注釈付き画像を用いた大規模T2Iデータセットを構築し、臨界リスクを検出するための評価器を訓練する。
我々は、T2ISafety上での12の顕著な拡散モデルを評価し、人種的公正性に関する永続的な問題、有害なコンテンツを生成する傾向、モデル間でのプライバシー保護の顕著なばらつきなど、いくつかの懸念を明らかにした。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:18:20 GMT)
How Jailbreak Defenses Work and Ensemble? A Mechanistic Investigation [39.4] ジェイルブレイク攻撃は、生成モデルのビルトインセーフをバイパスする有害なプロンプトであり、モデルの脆弱性に対する深刻な懸念を引き起こす。
本稿では,標準生成タスクをバイナリ分類問題として再検討することにより,ジェイルブレイク防御を体系的に検討する。
我々は,全てのクエリに対する拒絶率を増加させる安全性シフトと,有害な入力と良質な入力を区別するモデルの能力を向上させる有害性判別という2つの主要な防御メカニズムを同定する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:07:40 GMT)
Symmetric observations without symmetric causal explanations [39.1] 観測された相関から因果モデルを推定することは、科学の多くの分野において重要な課題である。
この取り組みを緩和するためには、観測における対称性が基礎となる実現における対称性と一致するかどうかを知ることが重要である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:00:00 GMT)
Do Contemporary Causal Inference Models Capture Real-World Heterogeneity? Findings from a Large-Scale Benchmark [39.1] 本研究では,条件平均処理効果(CATE)推定アルゴリズムを大規模ベンチマークで評価し,予期せぬ結果を示す。
CATE推定の62%は、自明なゼロエフェクト予測器よりも平均正方形誤差(MSE)が高く、非効率であることがわかった。
これらの結果は、現在のCATEモデルにおける重要な課題を浮き彫りにして、より広範な評価と方法論的改善の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:09:35 GMT)
Do Audio-Visual Segmentation Models Truly Segment Sounding Objects? [39.0] AVSBench-Robustは、サイレント、環境騒音、オフスクリーン音を含む様々なネガティブなオーディオシナリオを取り入れたベンチマークである。
提案手法は, ほぼ完全な偽陽性率を維持しながら, 標準測定値とロバストネス測定値の両方において顕著な改善を実現している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:37:12 GMT)
On the Effective Horizon of Inverse Reinforcement Learning [38.8] 逆強化学習(IRL)アルゴリズムは、与えられた時間軸上で、しばしば(前)強化学習または計画に依存する。
時間地平線は、報酬推定の精度とIRLアルゴリズムの計算効率の両方を決定する上で重要な役割を果たす。
この研究はこの現象を公式に分析し、説明を与える。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:56:10 GMT)
Examining Multilingual Embedding Models Cross-Lingually Through LLM-Generated Adversarial Examples [38.2] 本稿では,大規模セマンティックコーパスを必要としない新たな言語間探索タスクを提案する。
これは、大きな言語モデルによって生成される障害に挑戦するよりも、真の並列文を言語横断的にランク付けするモデルの能力に焦点を当てている。
ニュースドメインにおける言語対であるドイツ語とフランス語のCLSDタスクのケーススタディを作成します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:51:46 GMT)
A Mobile Robotic Approach to Autonomous Surface Scanning in Legal Medicine [37.9] 法医学の文書には内科と外科の両方が含まれている。
フルボディのRGB-D表面スキャンを可能にする移動ロボットシステムを開発した。
以上の結果から,提案システムはより効率的かつ自律的な法医学文書作成に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:39:08 GMT)
Transfer Learning with Pre-trained Conditional Generative Models [37.7] 現在の転送学習手法では、(i)ソースとターゲットタスクラベル空間の少なくとも1つが重複し、(ii)ソースデータセットが利用可能であり、(iii)ターゲットネットワークアーキテクチャがソースと整合していると仮定している。
本稿では, 擬似事前学習と擬似半教師学習の2段階からなる, 深層生成モデルを用いた伝達学習手法を提案する。
実験結果から,スクラッチトレーニングと知識蒸留の基本的な性能を向上できることが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:22:17 GMT)
Time-periodic driving of a bath-coupled open quantum gas of light [37.7] 本研究では,光子ボース-アインシュタイン凝縮体の周波数分解密度応答を時間周期駆動による染料分子の浴に結合させることを検討した。
光子数が増加するにつれて、結合した凝縮浴系の応答は過度に損傷された状態から共鳴状態に遷移する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:22:11 GMT)
Learning Temporal 3D Semantic Scene Completion via Optical Flow Guidance [37.6] 3Dセマンティックシーンコンプリート(SSC)は、自律運転知覚のための総合的なシーン幾何学と意味論を提供する。
既存のSSC手法は、現在のフレームからスパース情報をキャプチャすることや、複数フレームの時間的特徴を経時的に積み重ねることに限られる。
本稿では, 時間的SSC手法FlowScene: Learning Temporal 3D Semantic Scene Completion through Optical Flow Guidanceを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:52:36 GMT)
Contextual Linear Bandits with Delay as Payoff [37.6] コンテキスト線形帯域に対する遅延・アズ・ペイオフモデルについて検討する。
本稿では,標準の非遅延の場合と比較して,最大で$DDelta_maxlog T$の遅延オーバヘッドを持つ効率的なアルゴリズムを提案する。
ペイオフが損失である場合には、さらにバウンドの改善を示し、シュリッセルベルクらと同様の報酬と損失の分離を示す(2024年)。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:16:02 GMT)
Transferable and Forecastable User Targeting Foundation Model [37.5] 本稿では,ファウンデーションモデルであるFOUNDを提案する。
本フレームワークはヘテロジニアスなマルチシナリオユーザデータを統合し,要求入力をターゲットとしたワンセンスデータと整合する。
このアプローチは、クロスドメインな現実世界のユーザターゲットシナリオにおいて、既存のベースラインを大幅に上回る。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:57:03 GMT)
On Diffusion Models for Multi-Agent Partial Observability: Shared Attractors, Error Bounds, and Composite Flow [37.4] 拡散モデルを用いたDEC-POMDPにおける局所的な行動観測履歴からのグローバルな状態の再構築について検討する。
深層学習近似誤差では、固定点が真の状態から逸脱し、偏差はヤコビアンランクと負の相関を持つ。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:02:22 GMT)
Enhancing Language Multi-Agent Learning with Multi-Agent Credit Re-Assignment for Interactive Environment Generalization [37.4] 我々は,新しいマルチエージェントクレジット再割り当て戦略を備えたマルチエージェント強化学習フレームワークであるCollabUIAgentsを提案する。
我々は,マルチエージェントシステムの性能と環境横断の一般化性を両立させることを実証した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:26:15 GMT)
Position: Graph Learning Will Lose Relevance Due To Poor Benchmarks [37.0] グラフ上の機械学習は、薬物設計と分子特性予測の可能性を証明している。
このポジションペーパーは、より有意義なベンチマーク、厳格な評価プロトコル、そしてドメインエキスパートとのより強力なコラボレーションへのパラダイムシフトを要求する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:21:47 GMT)
Behavioral Analysis of Information Salience in Large Language Models [36.8] 本稿では,大規模言語モデルにおける情報サリエンスを導出し,調査するための説明可能なフレームワークを提案する。
4つのデータセットにまたがる13のモデルに対する実験により、LLMは、概してモデルファミリとサイズで整合した、曖昧で階層的なサリエンスの概念を持つことが明らかになった。
モデルは高度に一貫した振る舞いを示し、従ってサリエンスパターンを示すが、このサリエンスの概念はイントロスペクションを通じてアクセスすることはできず、情報サリエンスに対する人間の認識と弱い相関関係がある。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:52:23 GMT)
An Information-Theoretic Analysis of Thompson Sampling for Logistic Bandits [36.4] 本稿では,ロジスティックバンディット問題に対するトンプソンサンプリングアルゴリズムの性能について検討する。
我々は、$O(d/alphaqrtT log(beta T/d))$ of regret incurred after $T$ expected of Smpling steps.
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:24:53 GMT)
Operations & Supply Chain Management: Principles and Practice [36.3] オペレーション・アンド・サプライ・チェーン・マネジメント(OSCM)は、幅広い戦略、フレームワーク、テクノロジーを取り入れて、継続的に進化してきた。
この百科事典の記事は、現代の戦略、ツール、方法、原則、ベストプラクティスの包括的概要を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:41:36 GMT)
Deterministic Reversible Data Augmentation for Neural Machine Translation [36.1] 本稿では,ニューラルネットワーク翻訳のための簡易かつ効果的なデータ拡張法であるDRDA(Deterministic Reversible Data Augmentation)を提案する。
余分なコーパスやモデルの変更は必要ないため、DRDAはいくつかの翻訳タスクにおいて、明確なマージンで強いベースラインを上回ります。
DRDAはノイズ、低リソース、クロスドメインデータセットにおいて優れた堅牢性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:01:46 GMT)
Mem2Ego: Empowering Vision-Language Models with Global-to-Ego Memory for Long-Horizon Embodied Navigation [35.7] 本稿では,視覚言語モデル(VLM)に基づくナビゲーションフレームワークを提案する。
提案手法は,長期タスクにおける空間的推論と意思決定を促進する。
実験の結果,提案手法は従来のオブジェクトナビゲーションタスクの手法を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:41:40 GMT)
Efficient Multivariate Robust Mean Estimation Under Mean-Shift Contamination [35.7] 平均シフト汚染を用いた高次元ロバスト平均推定のための計算効率のよい最初のアルゴリズムを提案する。
提案アルゴリズムは, ほぼ最適サンプルの複雑性を持ち, サンプル・ポリノミカル時間で動作し, ターゲット平均を任意の精度で近似する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:53:13 GMT)
Emergence of Fermi's Golden Rule in the Probing of a Quantum Many-Body System [35.4] 量子多体系におけるフェルミの黄金規則(FGR)の出現と崩壊を観察する。
本結果は,線形応答理論を量子多体系の分光に応用するための青写真を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:59:57 GMT)
Sample, Scrutinize and Scale: Effective Inference-Time Search by Scaling Verification [35.3] 本研究では,サンプリングに基づく探索を規定するスケーリング傾向について検討する。
サンプリングベース検索の最小限の実装を単純にスケールアップするだけで、実用的な推論法が得られます。
テスト時間計算で自己検証能力を改善するための2つの有用な原則を同定する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:52:18 GMT)
CityEQA: A Hierarchical LLM Agent on Embodied Question Answering Benchmark in City Space [35.2] EQA(Embodied Question Answering)は主に屋内環境に焦点を当てている。
本研究では,ダイナミックな都市空間における活発な探索を通じてオープンな語彙に答える新しい課題であるCityEQAを紹介する。
我々は,1,412の人的注釈付きタスクを含む最初のベンチマークデータセットであるCityEQA-ECを提示する。
また,CityEQA に適した新規エージェントである Planner-Manager-Actor (PMA) を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:56:20 GMT)
Entity Framing and Role Portrayal in the News [34.7] データセットには、ウクライナ・ロシア戦争と気候変動という2つの重要な領域に焦点を当てた5つの言語(ブルガリア語、英語、ヒンディー語、ポルトガル語、ロシア語)の最近の1,378のニュース記事が含まれている。
このデータセットはストーリーテリングの要素にインスパイアされた独自の分類を用いており、22のきめ細かい役割、またはアーキタイプが3つの主要なカテゴリ(主人公、敵、無実)に宿営されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:44:46 GMT)
Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set [34.1] 本稿では,線形$Q$-ラーニングイテレート(有界集合への)の最初の$L2$収束率をさらに確立する。
必要なのは、適応温度の$epsilon$-softmaxの行動ポリシーだけです。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:26:06 GMT)
Machine learning assisted tracking of magnetic objects using quantum diamond magnetometry [33.7] リモート磁気センシングは、オブジェクトの位置をリアルタイムで監視するために使用することができる。
本研究では,実験データのみに基づいて学習可能な機械学習(ML)手法を実証する。
以上の結果から,このML法を磁気物体のリアルタイムモニタリングに応用する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:11:38 GMT)
How to Get Your LLM to Generate Challenging Problems for Evaluation [33.6] CHASEは、大規模言語モデルを用いて、難しい問題を合成的に生成する統合フレームワークである。
評価ベンチマークを作成するためにCHASEを実装している。
これらのベンチマークにおける最先端のLCMの性能は、40-60%の精度の範囲にある。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:09:55 GMT)
FacaDiffy: Inpainting Unseen Facade Parts Using Diffusion Models [33.3] 本稿では,パーソナライズされた安定拡散モデルを用いてコンフリクトマップを完成させることにより,未知のファサード部品を塗布する新しい手法であるFacaDiffyを紹介する。
具体的には,既存の3次元ビルディングモデルとそれに対応するレーザー走査点雲から2次元コンフリクトマップを導出する決定論的光線解析手法を提案する。
実世界のトレーニングデータの不足を補うため,ランダムな都市モデルジェネレータとアノテートされたファサード画像を用いた合成コンフリクトマップを作成するためのスケーラブルなパイプラインも開発した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:32:41 GMT)
InstructAgent: Building User Controllable Recommender via LLM Agent [33.3] 本稿では,エージェントがユーザとレコメンダシステムの間の保護シールドとして機能する,新しいユーザエージェントプラットフォームパラダイムを提案する。
この目的のために、まず4つのレコメンデーションデータセットを構築します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:58:25 GMT)
VidStyleODE: Disentangled Video Editing via StyleGAN and NeuralODEs [33.2] 我々は、時相的に連続した$bftextStyle$表現であるVidStyleODEを提案し、$bftextStyle$とNeural-$bfODE$sをベースとした。
提案手法は,テキスト誘導による外観操作,モーション操作,画像アニメーション,映像外挿など,実映像における様々なアプリケーションを実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:56:25 GMT)
CLIPPER: Compression enables long-context synthetic data generation [33.1] ナラティブなクレーム検証に適した合成データを生成するための圧縮ベースのアプローチであるCLIPPERを紹介する。
そこで本研究では,19万冊の合成本を,その原文とチェーン・オブ・シークレットの推論に組み合わせたデータセットを構築した。
我々の最良のモデルは、物語的クレーム検証(テストセットで28%から76%の精度)におけるブレークスルー結果を達成し、サブ10Bモデルの新たな最先端モデルを設定します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:58:03 GMT)
Retrieval-Augmented Process Reward Model for Generalizable Mathematical Reasoning [32.9] 本稿では,OOD問題に対処するための新しいフレームワークであるRetrieval-Augmented Process Reward Model(RetrievalPRM)を紹介する。
RetrievalPRMは2段階の検索強化機構を利用して、セマンティックに類似した質問やステップをウォームアップとして検索する。
我々の実験では、RetrievalPRMは複数の実世界のデータセットで既存のベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:40:09 GMT)
Noise Mitigation in Single Microwave Photon Counting by Cascaded Quantum Measurements [32.7] 単一マイクロ波光子検出器(SMPD)が最近初めて実証された。
これらの検出器は量子制限増幅方式に対して大きな利点がある。
動作感度は5.9(6)時間10-23textW/sqrttextHz$は入力線内の熱光子によって制限される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:26:48 GMT)
Measuring Faithfulness of Chains of Thought by Unlearning Reasoning Steps [32.6] 生成した推論のパラメトリック忠実度を測定するためのフレームワークであるFUR(Unlearning Reasoning Step)を提案する。
FURはモデルパラメータから推論ステップに含まれる情報を消去する。
FURは,CoTがパラメトリックに忠実であることを示す重要なステップを未学習にすることで,基礎となるモデルの予測を頻繁に変更可能であることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:45:05 GMT)
A Semantic-Aware Layer-Freezing Approach to Computation-Efficient Fine-Tuning of Language Models [32.2] 下流のデータやタスクにモデルを適応させるには、微調整言語モデル(LM)が不可欠である。
本稿では,バックプロパゲーション(層レベルでの)のコスト削減に向けた先駆的な取り組みを提案する。
我々は、よく知られたLMとデータセットにまたがる広範な実験を行う。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:14:12 GMT)
GiGL: Large-Scale Graph Neural Networks at Snapchat [32.1] 大規模分散グラフMLを実現するオープンソースライブラリであるGiGL(Gigantic Graph Learning)を提案する。
私たちはSnapchat社内でGGLを使用して、リレーショナルDBからのグラフデータ前処理を含むGNNの重い処理を管理しています。
GiGLは複数のプロダクション環境で使用されており、過去2年間に複数のビジネスドメインで35回以上のローンチを実行している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:29:17 GMT)
BPO: Towards Balanced Preference Optimization between Knowledge Breadth and Depth in Alignment [32.1] 本稿では,知識源の包括性と深さを測定する知識幅と知識深度の概念を紹介する。
本稿では,各サンプルの知識深度を動的に増大させるため,バランス優先最適化(BPO)を提案する。
BPOは、知識の有用性がサンプルによって異なるという観察によって動機付けられ、知識深度をカスタマイズした学習を必要とする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:07:41 GMT)
Robust Tumor Segmentation with Hyperspectral Imaging and Graph Neural Networks [31.9] より堅牢でスムーズなセグメンテーションのために,タイルの空間的文脈を利用した改良手法を提案する。
タイルの不規則な形状に対処するため,グラフニューラルネットワーク(GNN)を用いて周辺地域のコンテキスト情報を伝播する。
以上の結果から, 文脈認識型GNNアルゴリズムは, HSI画像上の腫瘍の区切りを頑健に検出できることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:12:27 GMT)
A Survey on Text-Driven 360-Degree Panorama Generation [31.9] テキスト駆動型360度パノラマ生成は没入型視覚コンテンツ生成の革新的進歩である。
テキスト・画像拡散モデルの最近の進歩は、この新興分野の急速な発展を加速させている。
このサーベイは、最先端のアルゴリズムの詳細な分析と、360度3Dシーン生成におけるその拡張的応用を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:19:57 GMT)
Efficient 3D Perception on Multi-Sweep Point Cloud with Gumbel Spatial Pruning [31.7] 既存の方法は、屋外の点雲の希少な性質のため、距離や隠蔽された物体を認識する際の限界に直面している。
本研究では,時間的に連続する複数の雲を蓄積することにより,この問題の顕著な緩和を観察する。
本稿では,学習したエンドツーエンドのサンプリングに基づいて動的に点をプーンする,シンプルで効果的なグンベル空間プレーニング層を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:08:30 GMT)
Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models [31.5] 強化学習(Reinforcement Learning, RL)は、試行錯誤と最適制御を通じてポリシーを学習し、学習または既知の力学モデルを用いてアクションを計画する。
異なる品質のデータセットを用いて、異なるRLおよび制御に基づく手法の性能を系統的に解析する。
モデルベースプランニングは,新しい環境レイアウト,トラジェクトリー縫合,データ効率などへの一般化に優れる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:39:41 GMT)
Generating $π$-Functional Molecules Using STGG+ with Active Learning [31.4] この研究は、最先端の教師付き学習手法STGG+をアクティブな学習ループに統合する。
有機材料設計にSTGG+ALを適用する。
生成した分子は、時間依存密度汎関数理論で検証され、理化される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:52:42 GMT)
BP-SGCN: Behavioral Pseudo-Label Informed Sparse Graph Convolution Network for Pedestrian and Heterogeneous Trajectory Prediction [31.4] 軌道予測は、自動運転車や監視の応用におけるより良い意思決定を可能にする。
本研究では、擬似ラベルを学習し、軌道予測器に通知する行動擬似ラベルインフォームドスパースグラフ畳み込みネットワーク(BP-SGCN)を提案する。
実験の結果, 擬似ラベルは, 異なる行動クラスタを効果的にモデル化し, 軌道予測を改善することがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:09:21 GMT)
Provable Partially Observable Reinforcement Learning with Privileged Information [31.3] 基礎状態の部分観測性は、一般に強化学習(RL)において重要な課題を呈する。
実際には、シミュレーターからの状態へのアクセスのような特定のエンフ情報は、訓練に利用されてきた。
この設定において、単純で実用的なパラダイムを再検討し、検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:41:07 GMT)
EpMAN: Episodic Memory AttentioN for Generalizing to Longer Contexts [31.1] textbfEpMANは、textitepisodicメモリモジュールで長いコンテキストを処理する方法である。
LLMデコーダが textbfEpMAN を使用してトレーニングされると、その性能は16kから256kトークンの範囲でより強く、より堅牢であることが分かる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:41:15 GMT)
FlowAgent: Achieving Compliance and Flexibility for Workflow Agents [31.1] FlowAgentは、コンプライアンスと柔軟性の両方を維持するように設計された新しいエージェントフレームワークである。
PDL を基盤として,OOW クエリを効果的に管理する LLM を支援する包括的フレームワークを開発した。
本稿では,LLMエージェントのOOWシナリオ処理能力を評価するための新しい評価手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:59:31 GMT)
How Far are LLMs from Being Our Digital Twins? A Benchmark for Persona-Based Behavior Chain Simulation [30.7] 本稿では,デジタル双生児が連続した人間の行動をシミュレートする能力を評価する最初のベンチマークであるBehavimentChainを紹介する。
BehaviorChainは、多種多様で高品質なペルソナベースの行動連鎖で構成され、1,001のユニークなペルソナに対して15,846の異なる振る舞いがある。
総合的な評価結果は、最先端モデルでさえ、連続した人間の行動の正確なシミュレートに苦慮していることを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:29:32 GMT)
Large Language Model Confidence Estimation via Black-Box Access [30.5] 大規模言語モデル(LLM)の応答に対する信頼度をブラックボックスやクエリアクセスで推定する問題について検討する。
そこで我々は,新しい特徴を設計し,その信頼性を推定するために,これらの特徴に対する(解釈可能な)モデル(つまりロジスティック回帰)を訓練する,シンプルで汎用的なフレームワークを提案する。
我々は,Flan-ul2,-13b,Mistral-7b,GPT-4の4つのベンチマークQ&Aタスクおよび2つのベンチマーク要約タスクにおけるPegasus-large,BART-largeの信頼性を推定する上で,我々の単純なフレームワークが有効であることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:42:41 GMT)
Full-Step-DPO: Self-Supervised Preference Optimization with Step-wise Rewards for Mathematical Reasoning [30.1] 数学的推論に適した新しいDPOフレームワークであるFull-Step-DPOを提案する。
最初の誤ったステップだけを最適化する代わりに、推論チェーン全体のステップワイドな報酬を活用する。
本稿では, 最先端のベースラインと比較して, フルステップDPOが優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:28:11 GMT)
Textured 3D Regenerative Morphing with 3D Diffusion Prior [29.8] テクスチャ化された3Dモーフィングは、2つの3Dオブジェクト間の滑らかで可塑性なシーケンスを生成する。
従来は点対点対応の確立と滑らかな変形軌跡の決定に頼っていた。
本稿では,3次元拡散を用いた3次元再生型モーフィング法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:02:22 GMT)
PEARL: Towards Permutation-Resilient LLMs [29.6] 大規模言語モデル(LLM)のインコンテキスト学習(ICL)機能により、提供されたデモを使って困難なタスクを実行できる。
ICLはデモの順序に非常に敏感であり、予測の不安定性につながる。
本稿では,この脆弱性を利用してLLaMA-3の80%近い成功率を達成する自然攻撃を設計できることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:07:02 GMT)
Deep learning based infrared small object segmentation: Challenges and future directions [29.5] 赤外線センシングは、自動運転車やドローンのような無人システムをサポートするための中核的な方法である。
深層学習は赤外線画像の物体認識に応用されている。
本稿では,この領域における既存の手法を批判的に分析し,未解決課題を特定し,今後の研究指針を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:35:14 GMT)
Harnessing Diverse Perspectives: A Multi-Agent Framework for Enhanced Error Detection in Knowledge Graphs [29.4] 知識グラフ誤り検出(MAKGED)のための新しいマルチエージェントフレームワークを提案する。
訓練中, 細粒度で双方向なサブグラフ埋め込みとLLMベースのクエリ埋め込みを結合することにより, これらの表現を統合して4つの特殊エージェントを生成する。
FB15KとWN18RRの実験では、MAKGEDは最先端の手法よりも優れており、KG評価の精度と堅牢性を高めている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:07:14 GMT)
Rapid Word Learning Through Meta In-Context Learning [29.3] In-context learNing Of Words(Minnow)のためのメタトレーニング手法を提案する。
この方法は、いくつかの文脈内例から単語の使用例を生成するために言語モデルを訓練する。
Minnowでスクラッチからトレーニングするモデルは、人間のスケールの子供指向言語で、強力な数発の単語学習を可能にしている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:11:38 GMT)
DP-MemArc: Differential Privacy Transfer Learning for Memory Efficient Language Models [29.1] DP-MemArcは,大規模言語モデルのメモリコスト削減を目的とした,新たなトレーニングフレームワークである。
DP-MemArcは、異なるタスクシナリオに対して、効果的なプライバシー効率の微調整を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:47:17 GMT)
Revealing and Mitigating Over-Attention in Knowledge Editing [29.0] 大規模な言語モデルは、幅広いタスクで優れたパフォーマンスを示しています。
しかし、トレーニングデータから学んだ誤った知識のために、いまだに望ましくない誤りを呈している。
知識編集手法は、ごく少数のパラメータを効率的に修正することで、特定のモデルの知識を正確に編集する。
これらの編集手法は、既存の知識や能力が編集によって著しく劣化する特異性障害に繋がる可能性がある。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:51:12 GMT)
Accelerating Neural Network Training: An Analysis of the AlgoPerf Competition [28.9] AlgoPerf: Training Algorithmsコンペティションの目標は、基礎となるトレーニングアルゴリズムの改善のみで達成されたニューラルネットワークトレーニングの実践的なスピードアップを評価することだ。
本稿では,AlgoPerfコンペティションの初回結果について述べる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:11:54 GMT)
The Computational Limits of State-Space Models and Mamba via the Lens of Circuit Complexity [28.9] 回路複雑性フレームワークを用いて,Mamba と Statespace Models (SSM) の計算限界を解析する。
Mambaのステートフルな設計と、トランスフォーマーを上回る強力な候補として最近注目されているにもかかわらず、$mathsfDLOGTIME$-uniform $mathsfTC0$ complexity classの中に、$mathrmpoly(n)$-precisionと定数深度層を持つMambaとSSMの両方が存在することを実証した。
この結果は、マンバがTransformerと理論的に同じ計算能力を持つことを示し、算術公式問題のような問題を解くことはできない。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:38:08 GMT)
Humanoid-VLA: Towards Universal Humanoid Control with Visual Integration [28.8] 本稿では,言語理解,エゴセントリックなシーン認識,モーションコントロールを統合し,普遍的なヒューマノイド制御を実現する新しいフレームワークを提案する。
Humanoid-VLAは、テキスト記述と組み合わせた非エゴセントリックな人間の動きデータセットを使用して、言語運動の事前アライメントから始まる。
そして、パラメータを効率よくビデオコンディショニングすることで、エゴセントリックな視覚コンテキストを取り入れ、コンテキスト認識モーション生成を可能にする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:17:11 GMT)
Hier-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting [28.8] 本稿では,新しい階層型分類表現を特徴とする意味論的3次元ガウス分割SLAM法を提案する。
我々のHier-SLAMは、マッピングと追跡の精度の両方で既存の高密度SLAM法より優れており、2倍の動作速度を実現しています。
複雑な現実世界のシーンを500以上のセマンティッククラスで扱う能力を示し、その価値あるスケールアップ機能を強調している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:02:40 GMT)
Infrared Small Target Detection in Satellite Videos: A New Dataset and A Novel Recurrent Feature Refinement Framework [28.8] IRSatVideo-LEOは、合成された衛星の動き、ターゲットの外観、軌道、強度を備えたセミシミュレートされたデータセットである。
RFRは、長期の時間的依存性を悪用するための、既存の強力なCNNベースの手法を備えることが提案されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:14:34 GMT)
From Target Tracking to Targeting Track -- Part I: A Metric for Spatio-Temporal Trajectory Evaluation [28.6] 伝統的な軌道推定は時間曲線関数(FoT)によって与えられる
FoTは、時間とともにターゲットの動きの完全な情報を提供し、任意の時間に対応する状態を推測するために使用することができる。
このラクトナに対処するために、時間的整列軌道積分距離(-ID)としてデノミネーションされた計量を提案する。
提案した距離測定値と時間平均化バージョンは、理論解析と1つの目標または複数の目標の数値例により検証される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:47:50 GMT)
GATE: Graph-based Adaptive Tool Evolution Across Diverse Tasks [28.6] GATE(Graph-based Adaptive Tool Evolution)は、再利用可能なツールの階層的なグラフを動的に構築し、進化させる適応型フレームワークである。
オープンエンドタスク(Minecraft)、エージェントベースタスク(TextCraft, DABench)、コード生成タスク(MATH, Date, TabMWP)についてGATEを評価する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:56:03 GMT)
Oreo: A Plug-in Context Reconstructor to Enhance Retrieval-Augmented Generation [28.6] 大規模言語モデル(LLM)は、パラメトリックな知識が限られ、ドメイン固有の専門知識が欠如しているため、幻覚に弱いままである。
Retrieval-Augmented Generation (RAG)は、LLMの知識基盤を強化するために外部文書検索を組み込むことによって、この問題に対処する。
発電機に供給する前に外部の知識ソースを洗練するためのコンパクトで効率的でプラガブルなモジュールを導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:47:42 GMT)
Time-Uniform Confidence Spheres for Means of Random Vectors [28.4] 我々は$mathbbRd$の平均逐次推定について研究する。
全てのサンプルサイズで高い確率のランダムベクトルの平均を含む時間一様信頼球—信頼球列 -- を導出する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:10:26 GMT)
SANDWICH: Towards an Offline, Differentiable, Fully-Trainable Wireless Neural Ray-Tracing Surrogate [28.4] ワイヤレス・レイトレーシングは3Dワイヤレス・チャネル・モデリングの鍵となるツールとして登場しつつある。
現在のアプローチでは、5G(B5G)ネットワークシグナリングを超えて正確にモデルを作成するのに苦労している。
逐次決定問題として線軌跡生成を再定義する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:46:32 GMT)
Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models [28.2] AQUA-KVは、コンパクトアダプタに依存するキーバリューキャッシュの適応量子化である。
パープレキシティとLongBenchスコアの相対誤差を1%以下の値で2-2.5ビットで近似する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:01:34 GMT)
Learned Image Transmission with Hierarchical Variational Autoencoder [28.1] 画像伝送のための革新的階層型ジョイントソースチャネル符号化(HJSCC)フレームワークを提案する。
提案手法では,送信側のボトムアップパスとトップダウンパスの組み合わせを利用して,元の画像の複数の階層表現を自動回帰的に生成する。
提案手法は, 周波数歪み特性において既存のベースラインより優れ, チャネルノイズに対するロバスト性を維持している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:12:01 GMT)
Tree-of-Debate: Multi-Persona Debate Trees Elicit Critical Thinking for Scientific Comparative Analysis [27.7] 本稿では,科学論文をそれぞれの新奇性を議論するペルソナに変換するフレームワークであるTree-of-Debate(ToD)を紹介する。
ToDは議論ツリーを動的に構築し、学術論文の中で独立した新規性議論のきめ細かい分析を可能にする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:43:40 GMT)
On-the-fly Preference Alignment via Principle-Guided Decoding [27.5] モデル出力を推論中に人間の好みに合わせるために、OPAD(Principle-Guided Decoding)によるオンザフライの優先度アライメントを導入する。
OPADは、一般的なタスクとパーソナライズされたアライメントタスクの両方において、競争力または優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:23:09 GMT)
Scaling Laws for Downstream Task Performance in Machine Translation [27.3] BLEU や COMET などの指標を用いて,事前学習データの選択が下流のパフォーマンス(翻訳品質)に与える影響について検討した。
十分なアライメントで、下流のクロスエントロピーと翻訳品質スコアは、より事前訓練されたデータで単調に改善される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:26:44 GMT)
Towards Robust ESG Analysis Against Greenwashing Risks: Aspect-Action Analysis with Cross-Category Generalization [27.1] A3CGは、グリーン洗浄の流行の中でESG分析の堅牢性を改善するための新しいデータセットである。
A3CGは、サステナビリティの側面と関連するアクションを明示的に関連付けることにより、サステナビリティのクレームをよりきめ細かな透明な評価を促進する。
これにより、企業がレポートを変更して一定のサステナビリティ領域を選択的に好む場合であっても、アスペクトアクション分析における堅牢なモデルパフォーマンスが保証される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:01:08 GMT)
Role of the Pretraining and the Adaptation data sizes for low-resource real-time MRI video segmentation [26.7] 実時間MRI(Real-time Magnetic Resonance Imaging)は、発声時の声道の完全な視認を提供するため、音声合成研究において頻繁に用いられる。
本研究では,ATB分割作業におけるSegNetとUNetモデルを用いた声道運動解析におけるrtMRIの有効性について検討した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:15:43 GMT)
Is Safety Standard Same for Everyone? User-Specific Safety Evaluation of Large Language Models [26.7] LLM安全性のユーザ固有の側面を評価する最初のベンチマークであるU-SAFEBENCHを紹介する。
LLMを広く使用した18種類のLCMを評価した結果,ユーザ固有の安全基準を考慮すると,現在のLCMは安全に動作しないことがわかった。
本稿では,チェーン・オブ・思想に基づく簡単な治療法を提案し,ユーザ固有の安全性向上に有効であることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:58:44 GMT)
LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention [26.5] LServeは長周期言語モデルを高速化する効率的なシステムである。
ハードウェアフレンドリーで構造化されたスペーシングパターンを統一し、プリフィルとデコードの両方の注意を喚起する。
LServeはLLMプリフィルを最大2.9倍加速し、vLLMで1.3-2.1倍デコードする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:59:52 GMT)
A Macro- and Micro-Hierarchical Transfer Learning Framework for Cross-Domain Fake News Detection [26.1] クロスドメイン偽ニュース検出は、ドメインシフトを緩和し、ドメイン間で知識を伝達することで検出性能を向上させることを目的としている。
既存のアプローチは、ニュースコンテンツとユーザエンゲージメントに基づいた知識をソースドメインからターゲットドメインに転送する。
クロスドメイン偽ニュース検出のための新しいマクロおよびマイクロ階層変換学習フレームワーク(MMHT)を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:39:44 GMT)
Second Order Bounds for Contextual Bandits with Function Approximation [26.1] まず、時間軸の平方根ではなく、測定分散の総和の平方根でスケーリングの残差を満足するアルゴリズムを開発する。
これらの境界は文脈線形問題において2階境界を導出する既存の手法を一般化する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:50:04 GMT)
DSCA: A Digital Subtraction Angiography Sequence Dataset and Spatio-Temporal Model for Cerebral Artery Segmentation [26.1] CVDの診断におけるゴールド標準としてデジタルサブトラクションアンギオグラフィーシーケンスが認識されている。
脳動脈(CA)と幹と枝の分類は、医師が病気の正確な定量化に不可欠である。
本稿では,CA の画素レベルのセマンティックセマンティックセマンティックセマンティックセマンティクスのための DSA Sequence ベースの脳動脈セマンティクスデータセット (DSCA) を提案する。
また、DS-temporal network for CA segmentation in DSA sequencesを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:02:23 GMT)
Rumor Detection by Multi-task Suffix Learning based on Time-series Dual Sentiments [26.1] 噂の検知と追跡のための最初のマルチタスク・サフィックス学習フレームワークであるMSufを提案する。
MSuf には,(1) 感情強度の特徴を抽出して時系列的にソートする LLM ,(2) ソーステキスト単語の埋め込みを融合してアライメント埋め込みを得るモジュール,(3) 噂の検出と感情分析を行うために,アライメントベクターと2つのハードプロンプトを組み合わせる,という3つのモジュールが含まれている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:20:32 GMT)
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks [26.0] 線形時間推論の複雑さと自然列長外挿能力を備えたxLSTMを用いたLRAM(Large Recurrent Action Model)を提案する。
6つのドメインから432のタスクを実験したところ、LRAMはパフォーマンスとスピードの点でTransformerと良好に比較できることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:29:58 GMT)
SR-LLM: Rethinking the Structured Representation in Large Language Model [25.9] 本稿では,構造化表現を大規模言語モデルと統合する優れた方法を探るため,SR-LLMを提案する。
幅広い下流データセットでは、特にPAWSでは3.17%、12.38%のパフォーマンス向上が見られた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:17:56 GMT)
CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents [25.9] 既存のコード検索データセットには制限がある。
彼らは、主にセマンティックな理解を通じてコードを評価する人間のアノテータに依存している。
本稿では、CoSQAの高品質なクエリと複数の適切なコードとをペアリングするCoSQA+を紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:41:23 GMT)
SEA: Shareable and Explainable Attribution for Query-based Black-box Attacks [25.6] 本稿では,MLシステムに対するブラックボックス攻撃を法医学的に特徴付ける新しいセキュリティシステムSEAを紹介する。
本報告では,SEAは第2の事例においても攻撃帰属に有効であり,法医学的分析を回避するために設計された適応戦略に頑健であることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:04:22 GMT)
Evolving Symbolic 3D Visual Grounder with Weakly Supervised Reflection [25.5] Evolvable Symbolic Visual Grounder (EaSe)は、3Dビジュアルグラウンドのためのトレーニング不要なシンボルフレームワークである。
EaSeはNr3Dデータセットで52.9%、ScanReferで49.2%のAcc@0.25を達成している。
推論時間とコストを大幅に削減し、パフォーマンスと効率のバランスのとれたトレードオフを提供します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:59:27 GMT)
Repetition Neurons: How Do Language Models Produce Repetitions? [25.4] 本稿では,テキスト生成タスクにおける繰り返し問題の原因となるスキルニューロンとして,反復ニューロンを紹介する。
近年の訓練済み言語モデルにより生成されたテキストの繰り返し開始前後のアクティベーション値を比較することで、これらの繰り返しニューロンを同定する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:50:43 GMT)
Ultra-High-Frequency Harmony: mmWave Radar and Event Camera Orchestrate Accurate Drone Landing [25.3] 我々は、従来のフレームカメラをイベントカメラに置き換える。これは、サンプリング周波数と地上プラットフォーム設定内のmmWaveレーダとを調和させる新しいセンサーである。
mmE-Locは、ドローン着陸用に設計された高精度で低遅延の地上局地化システムである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:29:08 GMT)
Verify when Uncertain: Beyond Self-Consistency in Black Box Hallucination Detection [25.2] 大型言語モデル(LLM)は幻覚に悩まされ、センシティブなアプリケーションにおける信頼性を損なう。
本稿では,検証モデルを一部のケースに対してのみ呼び出す,予算に優しい2段階検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:06:08 GMT)
Can Hallucination Correction Improve Video-Language Alignment? [25.1] 大容量ランゲージモデルはしばしば、視覚的な入力に基づかない幻覚コンテンツを生成する。
本稿では,映像コンテンツと一致しない幻覚を正すための自己学習フレームワークHACAを紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:43:22 GMT)
KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding [24.9] KITAB-Benchは、現在の評価システムのギャップを埋める包括的なアラビアOCRベンチマークである。
現代の視覚言語モデル(GPT-4、Gemini、Qwenなど)は、従来のOCRアプローチを平均60%の文字誤り率(CER)で上回っている。
本研究はアラビア文書分析手法の改良を促進するための厳格な評価枠組みを確立する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:41:23 GMT)
NLP-AKG: Few-Shot Construction of NLP Academic Knowledge Graph Based on LLM [24.8] 本稿では,学術論文間の深い概念関係を捉える新しい知識グラフフレームワークを提案する。
ACLアンソロジーの60,826論文から620,353個のエンティティと2,271,584個の関係を抽出し,NLPドメインの学術知識グラフであるNLP-AKGを開発した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:48:46 GMT)
Selective Self-to-Supervised Fine-Tuning for Generalization in Large Language Models [24.7] 本稿では,S3FT(Selective Self-to-Supervised Fine-Tuning)を紹介する。
S3FTは、一般化を改善しつつ、標準教師付き微調整(SFT)よりも優れた性能を実現する。
S3FTの有効性は、数学的推論、Pythonプログラミング、読解タスクの実験を通じて実証される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:10:33 GMT)
Achieving adaptivity and optimality for multi-armed bandits using Exponential-Kullback Leiblier Maillard Sampling [24.5] 本研究では, 1-Exponential Distribution (OPED) ファミリーに属する報酬分布を持つマルチアーメッド・バンディット(MAB)の問題について検討する。
本稿では,複数の最適性基準を同時に達成できるアルゴリズム,Exponential Kullback-Leibler Maillard Sampling(expklms)を設計する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:12:16 GMT)
Fast John Ellipsoid Computation with Differential Privacy Optimization [24.3] 高速なジョン楕円体計算のための微分プライベートアルゴリズムを提案する。
提案手法は, ノイズ摂動とスケッチ処理を統合し, スコアサンプリングを活用し, 効率とプライバシの両立を図る。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:53:38 GMT)
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation [24.1] 高速かつ高品質なタンパク質のバックボーン生成のための新しい補正四元流(ReQFlow)マッチング法を提案する。
本手法は,タンパク質鎖の各残基に対するランダムノイズから局所翻訳と3次元回転を生成する。
実験により、ReQFlowはタンパク質のバックボーン生成において最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:20:37 GMT)
PhotoDoodle: Learning Artistic Image Editing from Few-Shot Pairwise Data [24.1] 挿入された要素が背景とシームレスに統合されなければならないため、写真のドーピングは難しい。
提案手法であるPhotoDoodleでは,2段階のトレーニング戦略を採用している。
生成した結果の整合性を高めるために,位置符号化再利用機構を導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:35:38 GMT)
Eliminating Backdoors in Neural Code Models for Secure Code Understanding [24.1] ニューラルコードモデル(NCM)は、欠陥検出など、さまざまなコード理解タスクに広く使用されている。
バックドアのNCMは通常、通常のコードスニペット/クリーンコードスニペットで機能するが、毒されたコードスニペットで敵対的に予測される振る舞いを示す。
逆エンジニアリングと未学習のバックドアトリガによってNCMのバックドアを除去するEliBadCodeを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:07:08 GMT)
S^3cMath: Spontaneous Step-level Self-correction Makes Large Language Models Better Mathematical Reasoners [23.7] 自己補正は,大規模言語モデル(LLM)の潜在的な推論能力を刺激する手法である
本稿では,S$3$c-Mathを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:20:58 GMT)
Safe Beyond the Horizon: Efficient Sampling-based MPC with Neural Control Barrier Functions [23.7] モデル予測制御(MPC)を実際に使用する場合の一般的な問題は、予測地平線を超えた安全仕様の満足度である。
推定最適制御のばらつきを大幅に低減する新しいサンプリング戦略を提案する。
結果のNeural Shield-VIMPCコントローラは、既存のサンプリングベースのMPCコントローラと比較して大幅に安全性が向上する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:59:11 GMT)
Dataless Quadratic Neural Networks for the Maximum Independent Set Problem [23.6] pCQO-MISはエッジ数ではなくグラフ内のノード数でスケールすることを示す。
提案手法は,分散の排除,サンプリング,データ中心のアプローチを回避する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:02:23 GMT)
Integrating Extra Modality Helps Segmentor Find Camouflaged Objects Well [23.5] セグメンテーション性能を向上させるために、多様なデータモダリティを効果的に活用する新しいフレームワークUniCOSを提案する。
UniSEGは、状態空間内でのクロスモーダルな特徴を統合するために状態空間融合機構を採用している。
UniLearnerはCOSタスクとは無関係なマルチモーダルデータを利用して、COSモデルのセグメンテーション能力を改善する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:49:50 GMT)
How Does Critical Batch Size Scale in Pre-training? [23.3] クリティカルバッチサイズ(CBS)は、データ並列化がリターンを減少させるしきい値である。
C4データセット上で,CBSと自動回帰言語モデルを事前学習する手法を提案する。
この結果から,CBSはモデルサイズではなく,データサイズでスケールすることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:24:46 GMT)
SurveyX: Academic Survey Automation via Large Language Models [23.1] SurveyXは、自動サーベイ生成のための効率的で組織化されたシステムである。
調査構成過程を, 準備と生成の2段階に分割する。
これは調査組成物の有効性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:59:45 GMT)
GS-Cache: A GS-Cache Inference Framework for Large-scale Gaussian Splatting Models [23.1] 大規模3Dガウススプラッティング(3DGS)モデルのレンダリングは、コンシューマグレードデバイス上でリアルタイムで高忠実なパフォーマンスを実現する上で、大きな課題に直面している。
我々は3DGSの高度な表現を高度に最適化されたレンダリングシステムとシームレスに統合するエンドツーエンドフレームワークであるGS-Cacheを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:01:17 GMT)
Defining and Evaluating Visual Language Models' Basic Spatial Abilities: A Perspective from Psychometrics [23.0] 視覚言語モデル(VLM)における5つの基本空間能力(BSA)を定義する心理測定の枠組みを開拓する。
13の主流VLMのベンチマークでは、人間との大きなギャップが明らかになった(平均スコアは24.95対68.38)
我々は,空間知能評価のための診断ツールキット,具体的AI開発のための方法論基盤,および人間のような空間知能を達成するための認知科学インフォームドロードマップを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:42:46 GMT)
Show Me Your Code! Kill Code Poisoning: A Lightweight Method Based on Code Naturalness [22.8] 我々はKillBadCodeというコード中毒検出のための革新的な軽量な手法を提案する。
KillBadCodeは、コード中毒がコードの自然性を損なうという私たちの洞察に基づいて設計されています。
2つのコード中毒攻撃と4つのコードインテリジェンスタスクの実験結果は、KillBadCodeが4つのベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:53:09 GMT)
Are your apps accessible? A GCN-based accessibility checker for low vision users [22.7] 本稿では,グラフィカルユーザインタフェースをグラフとして表現し,グラフ畳み込みニューラルネットワーク(GCN)を用いて,アクセス不能なコンポーネントのラベル付けを行う,ALVINという新しいアプローチを提案する。
48アプリの実験では、ALVINの精度は83.5%、リコールは78.9%、F1スコアは81.2%で、ベースライン法よりも優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:04:06 GMT)
Capturing Nuanced Preferences: Preference-Aligned Distillation for Small Language Models [22.6] 教師の選好知識を全ての潜在的選好に対する確率分布としてモデル化した選好適応蒸留フレームワークを提案する。
4つの主流アライメントベンチマークの実験では、PADが既存のアプローチよりも一貫して、大幅に優れていることが示されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:18:23 GMT)
A Stronger Mixture of Low-Rank Experts for Fine-Tuning Foundation Models [22.5] Low-Rank Adapters (LoRA) は、命令チューニングやドメイン適応など、様々な分野に広く採用されている。
LoRAの限られた表現能力に対処するため、複数のLoRAアダプタを組み込むためのMixture-of-Expert (MoE)が導入されている。
マルチスペースプロジェクションによる特徴学習手順の安定化と向上を図るため,MoE-LoRAの新たなトレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:58:53 GMT)
Earlier Tokens Contribute More: Learning Direct Preference Optimization From Temporal Decay Perspective [22.2] ガンマパラメータによって制御される時間減衰係数を組み込んだ改良された選好最適化法を提案する。
我々のアプローチは、過度な適合を減らし、人間の好みの進化に反応し続けます。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:53:11 GMT)
PuzzleFusion++: Auto-agglomerative 3D Fracture Assembly by Denoise and Verify [22.1] 本稿では,人間が空間パズルを解く方法に類似した,新しい「自動凝集型」3次元フラクチャーアセンブリ手法であるPuzzleFusion++を提案する。
Breaking Badデータセットの実験は、PuzzleFusion++が他の最先端技術よりも優れていることを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:42:18 GMT)
Efficient AI in Practice: Training and Deployment of Efficient LLMs for Industry Applications [22.1] 本稿では,SLM(Small Language Model)を訓練する手法と知見について述べる。
本研究では,(1) 知識蒸留と(2) 量子化とプルーニングによるモデル圧縮の2つの重要な技術に焦点をあてる。
大規模なプロフェッショナルなソーシャルネットワークプラットフォームにおけるさまざまなユースケースに対するこれらのテクニックの影響を詳述し、デプロイメントのレッスンを共有します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:40:12 GMT)
Can LLMs Simulate L2-English Dialogue? An Information-Theoretic Analysis of L1-Dependent Biases [22.0] 本研究では,L2学習者における非ネイティブな英語使用をシミュレートする大規模言語モデルの評価を行った。
対話型インタビューでは、L2の英語学習者に7つの言語にまたがる特定のL1を模倣するよう促す。
本分析では,情報理論および分布密度測定を用いて,参照語使用や回避行動などのL1駆動型言語バイアスについて検討した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:34:46 GMT)
Finite Sample Analysis of Distributional TD Learning with Linear Function Approximation [22.0] 線形分布型TD学習の複雑さは古典的線形TD学習の複雑さと一致することを示す。
本研究は,分布強化学習アルゴリズムの統計的効率に関する新たな知見を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:53:22 GMT)
Towards a Perspectivist Turn in Argument Quality Assessment [21.9] 議論品質データセットの体系的なレビューを行う。
品質の次元を整理し、だれが注釈を付けたかを説明します。
パースペクティビストモデルの開発に適したデータセットについて論じる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:30:26 GMT)
SegAnyPET: Universal Promptable Segmentation from Positron Emission Tomography Images [21.9] 本研究は,PET画像からの普遍的プロンプト可能なセグメンテーションのためのモダリティ特異的な3次元基礎モデルであるSegAnyPETを開発する。
また,SegAnyPETは1点または数点のプロンプトポイントのみを用いて,視線と視線を正確にセグメント化できることを示す。
PET画像の最初の基盤モデルとして、SegAnyPETは、分子イメージングのための様々な下流タスクへの応用を推し進めると考えている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:17:13 GMT)
General Uncertainty Estimation with Delta Variances [21.9] 我々は不確実性定量化のためのアルゴリズム群であるDelta Variancesについて検討する。
ニューラルネットワークや、ニューラルネットワークからなるより一般的な機能に適用することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:22:40 GMT)
ChatVLA: Unified Multimodal Understanding and Robot Control with Vision-Language-Action Model [21.8] ChatVLAは、初期制御熟達後のマルチモーダルデータを段階的に統合するフェーズアライメントトレーニングと、タスク干渉を最小限に抑えるMixture-of-Expertsアーキテクチャを特徴とする、新しいフレームワークである。
ChatVLAは、視覚的問合せデータセット上での競合性能を示し、マルチモーダル理解ベンチマークにおける最先端のビジョン言語アクション(VLA)メソッドを大幅に上回っている。
本研究は,ロバストなマルチモーダル理解と効果的なロボット制御を実現するための統合フレームワークの可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:16:18 GMT)
Is Relevance Propagated from Retriever to Generator in RAG? [21.8] RAGは外部知識を組み込むためのフレームワークであり、通常はコレクションから取得した文書の集合の形式である。
我々は、トポロジに関連のある文書からなるRAGコンテキストが下流の性能向上につながるかどうかを実証的に検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:21:46 GMT)
Making Universal Policies Universal [21.6] 我々は、政策学習を2つの段階に分離する普遍的な政策枠組みを構築している。
本稿では,すべてのエージェントからのトラジェクトリからなる共同データセット上で,プランナーを訓練する手法を提案する。
複数のエージェントからプールされたデータセットをトレーニングすることで、我々のユニバーサルポリシーはタスク完了精度を最大42.20%向上させることができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:59:55 GMT)
MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding [20.8] MedXpertQAには17の専門分野と11の身体システムにまたがる4,460の質問が含まれている。
MMは、多様な画像と豊富な臨床情報を備えた専門家レベルの試験問題を導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:02:22 GMT)
Implicit Neural Representations for Chemical Reaction Paths [20.8] ニューラルネットワークは最小エネルギー経路を連続関数として表現できることを示す。
低次元の環境では、1つのニューラルネットワークが既存の経路から学習し、目に見えないシステムに一般化できることを実証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:44:21 GMT)
Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs [20.8] 中層は言語間アライメントの可能性が強い。
スロットフィリング、機械翻訳、構造化テキスト生成の実験は、言語間転送における一貫した改善を示している。
我々は、個別に訓練されたアライメントモジュールを既存のタスク固有のモジュールとマージすることができ、完全に再トレーニングすることなく言語間の機能を改善することを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:45:43 GMT)
Learning Dynamics of LLM Finetuning [20.7] 各種ファインタニングにおける大規模言語モデルの学習力学について検討する。
我々のフレームワークは、命令チューニングと選好チューニングの両方のための一般的なアルゴリズムのトレーニングに関する多くの興味深い観察を均一に解釈することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:09:57 GMT)
Towards Secure Program Partitioning for Smart Contracts with LLM's In-Context Learning [20.5] スマートコントラクトは、機密情報の漏洩による攻撃の操作に非常に影響を受けやすい。
静的解析と大規模言語モデルの文脈内学習機能を組み合わせた最初のLCM駆動型アプローチであるPartitionGPTを提案する。
我々は、9つの現実世界の操作攻撃についてPartitionGPTを評価し、合計で2500万ドルを損失した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:07:56 GMT)
A Theory for Conditional Generative Modeling on Multiple Data Sources [20.5] 本稿では,条件付き生成モデルにおけるマルチソース学習の厳密な分析に向けての第一歩を踏み出す。
この結果から,ソース分布が類似点を共有し,モデルが十分に表現可能である場合,マルチソーストレーニングは単一ソーストレーニングよりもシャープなバウンドを保証できることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:13:24 GMT)
Approximating Latent Manifolds in Neural Networks via Vanishing Ideals [20.5] 我々は, 無限イデアルがディープネットワークの潜在多様体をいかに特徴付けるかを示すことによって, 多様体学習と計算代数学の関連性を確立する。
本稿では,中間層で事前学習されたネットワークを切断し,消滅するイデアルのジェネレータを介して各クラス多様体を近似するニューラルアーキテクチャを提案する。
得られたモデルは、トレーニング済みのベースラインよりも著しく少ないが、同等の精度を維持し、高いスループットを実現し、パラメータが少ない。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:23:02 GMT)
Efficient Adaptive Experimental Design for Average Treatment Effect Estimation [20.4] 適応実験を用いて平均治療効果(ATE)を効率的に推定する方法を検討する。
適応実験において、実験者は過去のデータに基づいて治療確率を更新しながら、順次実験単位に治療を割り当てる。
提案した設計の任意のラウンドで有効である非パラメトリックおよび非漸近信頼区間を開発する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:32:53 GMT)
An Evaluation of Sakana's AI Scientist for Autonomous Research: Wishful Thinking or an Emerging Reality Towards 'Artificial General Research Intelligence' (AGRI)? [19.5] Sakana.ai氏は、研究ライフサイクルの自動化を主張するシステムであるAI Scientistを紹介した。
いくつかの側面を合理化しているが、期待には届かない。
文学評論は弱く、実験の半分近くは失敗し、写本には幻覚的な結果が含まれることもある。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:22:03 GMT)
Amplifier: Bringing Attention to Neglected Low-Energy Components in Time Series Forecasting [19.0] 本稿では,既存のモデルが時系列予測において,低エネルギー成分を容易に見落としてしまう問題に対処するエネルギー増幅手法を提案する。
この技術は、エネルギ増幅ブロックとエネルギ回復ブロックとを備える。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:50:35 GMT)
Auditing the Compliance and Enforcement of Twitter's Advertising Policy [18.9] 我々は、アダルトコンテンツ広告ポリシーへの準拠に関して、Twitter上の約35万の広告を分析した。
広告の38%近くがTwitterのアダルトコンテンツ広告ポリシーに違反していることがわかったが、最終的にプラットフォームはこれら非準拠のアダルト広告の63%を削除しただけだった。
調査の結果は、一部の言語や国でTwitterが大人向け広告ポリシーを施行する際の盲点を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:54:20 GMT)
Exploring How Generative MLLMs Perceive More Than CLIP with the Same Vision Encoder [18.9] MLLM(Generative Multimodal Large Language Models)はCLIPよりも精度が高いことを示す。
本研究は,VLMのアーキテクチャ選択の重要性を強調し,CLIP型コントラストVLMの性能向上に向けた方向性を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:22:53 GMT)
On Theoretical Limits of Learning with Label Differential Privacy [18.8] 本研究では,局所モデルと中央モデルの両方において,ラベルDPを用いた学習の基本的な限界について検討する。
以上の結果から, ラベルローカルDPでは, 完全DPより有意に早く収束する可能性が示唆された。
対照的に、ラベル中央DPでは、リスクはフルDPに比べて一定の要因によってのみ減少する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:51:42 GMT)
Where's the Bug? Attention Probing for Scalable Fault Localization [18.7] 本稿では, 直接的位置付けラベルを使わずに, 最先端の故障位置付けを学習するBug Attention Probe(BAP)を提案する。
BAPは計算コストのごく一部で大きなオープンウェイトモデルよりもはるかに効率的である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:29:19 GMT)
RhythmFormer: Extracting Patterned rPPG Signals based on Periodic Sparse Attention [18.4] RRhythmは、生理学的ビデオに基づいて生理的信号を検出する非接触法である。
本稿では,周期性によって誘発される時間的注意間隔に基づく周期的注意機構を提案する。
これは、データ内およびデータ間評価の両方において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:02:11 GMT)
Filtered not Mixed: Stochastic Filtering-Based Online Gating for Mixture of Large Language Models [18.4] MoE-Fは、オンライン時系列予測に$N$事前訓練された大規模言語モデル(LLM)を組み合わせるための形式化されたメカニズムである。
我々のメカニズムは,各専門家のランニング性能の条件情報を利用して,次のステップで時系列を予測するためのLLMの最適な組み合わせを予測する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:56:47 GMT)
Real-Time Sampling-based Online Planning for Drone Interception [18.3] 本稿では,ニューラルネットワークの推論を利用して,時間を要する非線形軌道最適化を代替するサンプリングベースのオンライン計画アルゴリズムを提案する。
提案手法は、無人機が衝突を回避し、不完全な目標予測を処理しながら、目標を迎撃しなければならないドローン迎撃問題に適用される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:48:38 GMT)
Not All Data are Good Labels: On the Self-supervised Labeling for Time Series Forecasting [18.3] 本稿では,候補データセットを自然に構築することで,時系列データセットを再ラベルする新たな自己教師型アプローチについて検討する。
単純な再構成ネットワークの最適化において、中間体は自己管理パラダイムの擬似ラベルとして使用される。
実世界の11のデータセットに対する実験により、SCAMは様々なバックボーンモデルの性能を一貫して改善することを示した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:29:37 GMT)
Benchmarking Multimodal RAG through a Chart-based Document Question-Answering Generation Framework [17.8] MRAG(Multimodal Retrieval-Augmented Generation)は、外部知識を統合することで推論能力を向上させる。
既存のベンチマークは主に、現実世界のアプリケーションで広く使われているチャートのような複雑なビジュアルフォーマットを見渡す、単純な画像とテキストのインタラクションに焦点を当てている。
本稿では、構造化キーポイント抽出、クロスモーダル検証、キーポイントベース生成による評価データを生成するフレームワークであるCHARGE(CHARt-based document question-anwering GEneration)を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:59:42 GMT)
Towards efficient quantum algorithms for diffusion probability models [17.8] 拡散モデル(DPM)は、画像や音声生成などのタスクで高品質な出力を生成する能力で有名である。
様々な量子解法を用いてDPMを実装するための効率的な量子アルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:39:09 GMT)
Temporal Misalignment and Probabilistic Neurons [17.7] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)よりもエネルギー効率の良い代替手段を提供する
本研究では,ANN-SNN変換フレームワークにおいて,時間的ミスアライメント(temporal misalignment)と呼ばれる現象を同定する。
生物学的に可塑性二相確率性(TPP)刺激ニューロンを導入し,変換過程をさらに強化した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:09:30 GMT)
HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States [17.6] 本研究は,LVLMが内的アクティベーションにおける安全性関連信号を本質的にエンコードしているかどうかを考察する。
その結果,LVLMは安全でないプロンプトを処理する際に,異なる活性化パターンを示すことが明らかとなった。
HiddenDetectは、内部モデルのアクティベーションを活用して安全性を高める、新しいチューニング不要のフレームワークである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:14:34 GMT)
How do Multimodal Foundation Models Encode Text and Speech? An Analysis of Cross-Lingual and Cross-Modal Representations [17.5] クロスモーダル表現は、テキスト処理と音声処理に特化した初期層を除いて、モデル層に収束する。
音声はテキストよりも言語間の違いが大きい。
モダリティに依存しない表現のために明示的に訓練されていないモデルでは、モダリティギャップは言語ギャップよりも顕著である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:04:45 GMT)
Estimating Neural Representation Alignment from Limited Inputs and Features [17.4] 入力と特徴サンプリングの両方を補正する新しい推定器を導入する。
脳から脳へのアライメントとモデルから脳へのアライメントの評価に本手法を用いた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:50:45 GMT)
A Similarity Paradigm Through Textual Regularization Without Forgetting [17.3] テキスト正規化による類似パラダイム(SPTR)と呼ばれる新しい手法を提案する。
SPTRは、手作りのプロンプトに基づく、分離不能なフレームワークである。
11のデータセットにまたがる4つの代表的なタスクは、SPTRが既存のプロンプト学習方法より優れていることを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:06:44 GMT)
Looped ReLU MLPs May Be All You Need as Practical Programmable Computers [17.1] 2層ニューラルネットワークは、指数的に多くの隠れたニューロンが与えられる普遍的な近似器である。
ループされた23層の$mathsfReLU$-$mathsfMLP$は、基本的な必要な操作を実行することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:24:53 GMT)
Towards Geo-Culturally Grounded LLM Generations [16.9] 生成的大規模言語モデル(LLM)は、世界中の多様な文化的知識にギャップがあることが示されている。
本研究は,LLMが多種多様な国文化に親しみを呈する能力に,検索の強化と検索手法が及ぼす影響について検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:38:50 GMT)
An Open-Source Tool for Mapping War Destruction at Scale in Ukraine using Sentinel-1 Time Series [16.9] 武装紛争による建物被害を推定するスケーラブルな手法を提案する。
合成開口レーダ画像時系列の機械学習モデルを訓練することにより、建物レベルで確率的損傷推定を生成する。
大規模な推論を可能にし、アクセシビリティを確保するため、我々はGoogle Earth Engine上で実行するためにメソッドを紐付けます。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:23:21 GMT)
MIM-Refiner: A Contrastive Learning Boost from Intermediate Pre-Trained Representations [16.9] MIM-Refinerは、事前訓練されたMIMモデルの対照的な学習促進である。
我々はMIMモデルの特徴を、サブパーから最先端のオフ・ザ・シェルフ機能まで洗練する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:59:44 GMT)
CFaiRLLM: Consumer Fairness Evaluation in Large-Language Model Recommender System [16.8] 本研究は,Large Language Model (LLM) ベースのレコメンデータシステムにおける公平性評価に関する過去の研究に批判的な立場を取る。
CFaiRLLMは、真の嗜好アライメントを組み込むだけでなく、交叉フェアネスを厳格に検証する拡張評価フレームワークである。
CFaiRLLMの有効性を検証するため,MovieLensとLastFMを用いた広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:30:53 GMT)
Vulnerability of Text-to-Image Models to Prompt Template Stealing: A Differential Evolution Approach [16.6] 簡単な難易度と難易度に分類した50のテンプレートと450のイメージからなるベンチマークであるPrismを紹介する。
EvoStealerは,モデル微調整なしで動作可能なテンプレートステアリング手法である。
評価の結果,EvoStealerの盗難テンプレートはオリジナルと非常によく似た画像を再現し,他の被験者に効果的に一般化できることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:52:10 GMT)
Can LLMs Improve Multimodal Fact-Checking by Asking Relevant Questions? [16.6] 大規模言語モデル(LLM)は、証拠検索と事実検証を大規模に自動化するために一般的に用いられている。
本稿では,LLMを用いて証拠検索とファクトチェックの促進を図るためのフレームワークLRQ-FACTを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:34:03 GMT)
Compact Latent Representation for Image Compression (CLRIC) [16.4] 現在の画像圧縮モデルは、各品質レベルごとに別々のモデルを必要とすることが多く、トレーニングとストレージの両方の観点からリソース集約化されている。
本稿では,既存の学習モデルの潜伏変数を知覚画像圧縮に用いる革新的な手法を提案する。
本手法は,モデル非依存と解像度非依存の両面において,最先端の学習画像圧縮モデルに匹敵する知覚品質を実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:20:56 GMT)
Generalization Certificates for Adversarially Robust Bayesian Linear Regression [16.3] 機械学習モデルの逆ロバスト性は、データ摂動下での信頼性の高い性能を保証するために重要である。
近年, 点推定器の進歩が見られ, 分布予測器について考察する。
実および合成データセットの実験は、ベイズ後部の逆向きに頑健な後部の優れた強靭性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:25:30 GMT)
MCQA-Eval: Efficient Confidence Evaluation in NLG with Gold-Standard Correctness Labels [16.3] 大規模言語モデル (LLM) には堅牢な信頼度推定が必要である。
McQCA-Evalは、自然言語生成における信頼度を評価するための評価フレームワークである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:09:29 GMT)
Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information [16.3] テンポラルヘッド(英: Temporal Heads)は、主に回路解析による時間的知識の処理に責任を負う特定のアテンションヘッドである。
我々はこれらの頭部が複数のモデルにまたがっていることを確認したが、その位置は様々である。
我々は,これらの頭部の値を調整することで,時間的知識をどのように編集できるかを示すことによって,その可能性を広げる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:52:05 GMT)
Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension [16.0] 本稿では,Fisher InformationMatrix (FIM) のレンズによる効率的な近似の体系設計に向けて一歩進める。
我々は、多くの最先端の効率的な近似を(フロベニウスノルムの下で)特定の構造的仮定を持つFIMの解と見なせることを示した。
一般性と効率性のバランスをとるための構造的仮定を慎重に選択することを含む,LLMの実用的効率に関する2つの設計勧告を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:48:58 GMT)
InterFeedback: Unveiling Interactive Intelligence of Large Multimodal Models via Human Feedback [16.0] 既存のベンチマークでは、人間ユーザとの対話的なインテリジェンスにおいて、LMM(Large Multimodal Model)をテストしていない。
対話型フレームワークであるInterFeedbackを設計し、任意のLMMとデータセットに適用して、この機能を自律的に評価する。
インタラクティブパフォーマンスを手動でテストするために設計された120のケースからなる,新たに収集されたデータセットであるInterFeedback-Humanを紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:27:06 GMT)
Moshi Moshi? A Model Selection Hijacking Adversarial Attack [16.0] 本報告では,モデル選択を対象とする最初の敵攻撃であるMOSHIについて述べる。
我々の攻撃は、平均88.30%の一般化能力低下、83.33%の遅延増加、最大105.85%のエネルギー消費の増加を引き起こす。
これらの結果は、モデル選択プロセスにおける重大な脆弱性と、実際のアプリケーションに対する潜在的な影響を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:16:15 GMT)
A Rapid Test for Accuracy and Bias of Face Recognition Technology [16.0] 本稿では,手動による注釈なしでFRシステムのベンチマークを行う1:1顔認証手法を提案する。
ラベルのクリーニングをトレーニングする従来の方法とは異なり、評価対象のモデルの埋め込み表現を活用する。
提案手法はFRの精度とランキングを確実に推定し,手動ラベリングの時間とコストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:38:52 GMT)
LLM-based User Profile Management for Recommender System [15.9] PUREは、ユーザレビューから重要な情報を体系的に抽出し、要約することによって、進化するユーザプロファイルを構築し、維持する。
我々は、レビューを時間とともに追加し、予測を漸進的に更新することで、現実のシナリオを反映した連続的なレコメンデーションタスクを導入する。
Amazonデータセットに対する実験結果から、PUREは既存のLCMベースの手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:20:19 GMT)
A Non-Asymptotic Theory of Seminorm Lyapunov Stability: From Deterministic to Stochastic Iterative Algorithms [15.8] 半ノルム制約作用素に対する不動点方程式の解法について検討する。
決定論的および基礎的設定の両方において反復アルゴリズムの漸近的動作を確立する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:39:37 GMT)
Stories that (are) Move(d by) Markets: A Causal Exploration of Market Shocks and Semantic Shifts across Different Partisan Groups [15.7] セマンティックな埋め込み空間の変化は、金融市場の衝撃と因果関係があることが示される。
市場変動に対するテキストの予測力と、それらのショックに対する形状反応に、パルチザンがどのような影響を及ぼすかを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:26:56 GMT)
CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers [15.6] CustomVideoXは、LoRAパラメータをトレーニングして参照機能を抽出することで、事前トレーニングされたビデオネットワークを活用する。
本稿では,参照画像特徴の直接的かつ同時エンゲージメントを可能にする3D参照注意を提案する。
実験の結果, CustomVideoXはビデオの一貫性や品質という点で既存手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:55:52 GMT)
Large Language Models for Autonomous Driving (LLM4AD): Concept, Benchmark, Experiments, and Challenges [15.5] 大規模言語モデル(LLM)は、自律運転システムの様々な側面を強化する可能性を秘めている。
本稿では,自動走行(LLM4AD)のためのLLMの設計概念について紹介する。
LLM4ADシステムの性能とポテンシャルを徹底的に評価し、実世界の車両プラットフォーム上で一連の実験を行う。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:39:53 GMT)
Reducing Hallucinations of Medical Multimodal Large Language Models with Visual Retrieval-Augmented Generation [15.5] MLLMは、検索強化された生成フレームワークであるVisual RAGをサポートするためにどのように拡張されるかを示す。
MIMIC-CXR胸部X線レポート生成とマルチケア医療画像キャプション生成データセットについて,ビジュアルRAGが実体探索の精度を向上させることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:55:34 GMT)
Less is More: On the Importance of Data Quality for Unit Test Generation [15.4] 単体テストはソフトウェア開発とメンテナンスに不可欠である。効果的な単体テストはソフトウェアの品質を保証し改善するが、単体テストを書くのは時間と労力がかかる。
近年、単体テスト生成を自動化するためのディープラーニング(DL)技術や大規模言語モデル(LLM)が提案されている。
これらのモデルは、通常、大規模なデータセットで訓練または微調整される。
データ品質の重要性を認識しているにもかかわらず、テスト生成に使用されるデータセットの品質について限定的な研究がなされている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:47:09 GMT)
Enhancing Adversarial Robustness of Vision-Language Models through Low-Rank Adaptation [15.1] 視覚言語モデル(VLM)は、人工知能(AGI)の発展に重要な役割を果たす
セキュリティ問題への対処は、VLMにとって最も重要な課題の1つとして浮上している。
我々は,低ランク適応に基づくtextbftextitAdvLoRA というパラメータ効率の高い逆適応手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:24:55 GMT)
Structurally Disentangled Feature Fields Distillation for 3D Understanding and Editing [14.7] 本稿では,複数の不整形特徴場を用いて3次元特徴量を捉えることを提案する。
各要素は分離して制御することができ、意味的および構造的理解と編集を可能にする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:09:27 GMT)
EyeBench: A Call for More Rigorous Evaluation of Retinal Image Enhancement [14.7] 生成モデルは ファンドス画像の 増強に大きく成功しました
これらのモデルの評価は依然としてかなりの課題である。
臨床ニーズに合わせて拡張モデルを調整するための洞察を提供するため,新しい総合ベンチマークであるEyeBenchを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:56:03 GMT)
LAVID: An Agentic LVLM Framework for Diffusion-Generated Video Detection [14.7] 大規模視覚言語モデル(LVLM)は、AI生成コンテンツ検出の新しいツールとなっている。
本稿では,LVLMを用いた新たなai生成ビデオ検出システムであるLAVIDを提案する。
提案するパイプラインは,検出のための明示的な知識ツールのセットを自動的に選択し,自己書換えによって構造を適応的に調整する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:34:58 GMT)
H3DE-Net: Efficient and Accurate 3D Landmark Detection in Medical Imaging [14.5] 3Dランドマーク検出は、医用画像解析において重要な課題である。
局所特徴抽出のためのCNNと軽量アテンション機構を組み合わせた新しいフレームワークを提案する。
H3DE-Netは、このような軽量な注意機構をCNNと統合した最初の3Dランドマーク検出モデルである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:36:12 GMT)
Self-supervised Monocular Depth Estimation Robust to Reflective Surface Leveraged by Triplet Mining [14.4] 自己教師付き単眼深度推定(SSMDE)は、単眼画像の高密度深度マップを予測することを目的としている。
反射面はランベルト反射の仮定に反するので、反射面に苦しむ。
画素レベルでの反射領域のピンポイント化にトリプルトマイニングを活用することで,SSMDEの新たなトレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:59:40 GMT)
Towards Accurate Binary Spiking Neural Networks: Learning with Adaptive Gradient Modulation Mechanism [14.4] バイナリスパイキングニューラルネットワーク(BSNN)は、SNNのイベント駆動パラダイムを継承すると同時に、バイナライゼーション技術によるストレージ負荷の低減も実現している。
これらの異なるアドバンテージは、BSNNの軽量でエネルギー効率のよい特性を与え、リソース制約のエッジデバイスへのデプロイに最適である。
しかしながら、二成分のシナプス重みと非微分スパイク関数のため、BSNNを効果的に訓練することは未解決の問題である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:59:08 GMT)
Tempo: Helping Data Scientists and Domain Experts Collaboratively Specify Predictive Modeling Tasks [14.1] 我々は、データサイエンティストとドメインエキスパートがモデル仕様について協力するのを支援する対話型システムであるTempoを開発した。
データサイエンティストは、事前処理の選択についてより透明性の高い仕様を迅速にプロトタイプできる。
ドメインエキスパートは、モデルが期待通りに振る舞うことを検証するために、データサブグループ内のパフォーマンスを評価することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:56:42 GMT)
Purest Quantum State Identification [14.0] 我々は、$N$サンプルを用いて、未知の$n$-qubit量子状態内で最も純粋なものを識別する方法を設計する。
このフレームワークは、量子技術のサンプリングボトルネックを克服するための具体的な設計原則を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:42:16 GMT)
Mapping out the Space of Human Feedback for Reinforcement Learning: A Conceptual Framework [13.9] 我々は、対話型学習シナリオにおける人間のフィードバックの共通理解を開発することにより、機械学習と人間とコンピュータの相互作用のギャップを埋める。
そこで我々は,9つの重要な次元に基づいて,人的フィードバックから報酬に基づく学習を行うためのフィードバックタイプ分類を導入した。
フィードバックを表現できる人間の能力と、フィードバックから学習するエージェントの能力に影響を及ぼす、人間のフィードバックの質の指標を7つ同定する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:22:19 GMT)
From Human Annotation to LLMs: SILICON Annotation Workflow for Management Research [13.8] LLM(Large Language Models)は、人間のアノテーションに対する費用対効果と効率的な代替手段を提供する。
本稿では、SILICON (Systematic Inference with LLMs for Information Classification and Notation) ワークフローを紹介する。
このワークフローは、人間のアノテーションの確立した原則と、体系的な迅速な最適化とモデル選択を統合している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:01:08 GMT)
FIND: Fine-grained Information Density Guided Adaptive Retrieval-Augmented Generation for Disease Diagnosis [13.8] FIND(textbfFine-fine textbfInformation textbfDensity Guided Adaptive RAG)は、疾患診断シナリオにおけるRAGの信頼性を向上させる新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:52:36 GMT)
Transfer-Prompting: Enhancing Cross-Task Adaptation in Large Language Models via Dual-Stage Prompts Optimization [13.7] Transfer-Promptingは、大規模な言語モデルにおけるクロスタスク適応を強化するために設計されたフレームワークである。
本フレームワークは,(1)ソース・プロンプト構築,(2)ソース・プロンプト生成,(2)ソース・プロンプト生成,および(2)ターゲット・プロンプトのクロスタスク適応性を高める。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:47:04 GMT)
DeepRTL: Bridging Verilog Understanding and Generation with a Unified Representation Model [13.5] We present DeepRTL, a unified representation model that is excs in both Verilog understanding and generation。
CodeT5+に基づいて、DeepRTLは、Verilogコードをリッチでマルチレベルな自然言語記述と整合させる包括的なデータセットに基づいて微調整されている。
我々はVerilog理解のための最初のベンチマークを導入し、埋め込み類似性とGPTスコアを適用してモデルの理解能力を評価する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:07:55 GMT)
Revealing the Relationship Between Publication Bias and Chemical Reactivity with Contrastive Learning [13.3] CAS Content Collection$textTM$で20,798 aryl halidesをトレーニングし,2010年から2015年にかけて数千の出版物を対象とした。
この研究は、新しい方法でデータ文学から学ぶための化学固有の機械学習訓練戦略を示すだけでなく、出版物における基質選択の傾向に反映される化学反応性の傾向を明らかにするためのユニークなアプローチを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:50:35 GMT)
StructFlowBench: A Structured Flow Benchmark for Multi-turn Instruction Following [13.1] マルチターン命令追従能力は、大規模言語モデルのコア能力を構成する。
構造フローモデリングを用いたマルチターンインストラクションであるStructFlowBenchを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:22:18 GMT)
SolSearch: An LLM-Driven Framework for Efficient SAT-Solving Code Generation [13.1] Satisfiability(SAT)問題は、ソフトウェア工学における重要な応用において、中核的な課題である。
本稿では,大規模言語モデル(LLM)を利用してSAT解決戦略の自動発見と最適化を行う新しいフレームワークであるSolSearchを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:25:21 GMT)
MADEA: A Malware Detection Architecture for IoT blending Network Monitoring and Device Attestation [13.0] MADEAは、RAとTAをブレンドした最初のシステムであり、IoTエコシステムのマルウェア検出に対する包括的なアプローチを提供する。
100%正の正の速度と160倍の速さで検出できる。
MADEAがなければ、有効周期RAはデバイスに必要なエネルギーの少なくとも14倍を消費することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:37:00 GMT)
EquivaMap: Leveraging LLMs for Automatic Equivalence Checking of Optimization Formulations [13.0] 2つの最適化定式化が等価であるかどうかを決定するための公式な基準である準カルプ同値を導入する。
本研究では,大規模な言語モデルを利用して,そのようなマッピングを自動的に検出するフレームワークであるEquivaMapを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:35:32 GMT)
Experimental demonstrations of Josephson threshold detectors for broadband microwave photons detection [12.9] 電流バイアスジョセフソン接合(CBJJs)は、赤外線領域における感度ジョセフソンしきい値検出器(JTDs)として実証されている。
この種の検出器は、ブロードバンドマイクロ波光子を検出するためにも使用できる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:31:05 GMT)
SleepGMUformer: A gated multimodal temporal neural network for sleep staging [12.8] 本稿では、WristHR-Motion-SleepおよびSleepEDF-78の心拍、運動、ステップ、脳波(Fpz-Cz、Pz-Oz)、EOGを含む多ドメイン睡眠データのためのゲート型時空間ニューラルネットワークを提案する。
1)機能アライメント、値ハンドリングの欠如、EEGデトレクションのための前処理モジュール、2)時間次元における複雑な睡眠特徴のための特徴抽出モジュール、3)リアルタイムなモータリティ重み付けのための動的融合モジュール。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:42:42 GMT)
Reading between the Lines: Can LLMs Identify Cross-Cultural Communication Gaps? [12.8] 本稿では,文化に特有な項目や要素の存在による書評の理解可能性のギャップについて検討する。
Goodreadsの57冊の本レビューのユーザスタディによると、レビューの83%が、文化特有の難解な要素を少なくとも1つ持っていました。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:40:48 GMT)
Llamba: Scaling Distilled Recurrent Models for Efficient Language Processing [12.8] 我々はLlama-3.xから蒸留した効率の良いリカレント言語モデルのファミリーであるLlambaをMambaアーキテクチャに導入する。
シリーズにはLlamba-1B、Llamba-3B、Llamba-8Bが含まれる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:18:39 GMT)
Internal Incoherency Scores for Constraint-based Causal Discovery Algorithms [12.5] 仮説違反や有限サンプル誤りの検証が可能な内部コヒーレンシスコアを提案する。
シミュレーションおよび実世界のデータセットを用いて,PCアルゴリズムにおけるコヒーレンシースコアについて述べる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:44:54 GMT)
LoRA-GGPO: Mitigating Double Descent in LoRA Fine-Tuning via Gradient-Guided Perturbation Optimization [12.5] 大規模言語モデル(LLM)は自然言語処理において顕著な成功を収めた。
Low-Rank Adaptation (LoRA)は、パラメータ更新を低ランク行列で近似することで、実用的なソリューションとして登場した。
LoRA-GGPOは、勾配とウェイトノルムを利用して標的摂動を生成する新しい手法である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:14:41 GMT)
Exploiting Deblurring Networks for Radiance Fields [12.5] 我々は、ぼやけたトレーニングビューから高品質な新規ビューを合成できる新しい放射場デブロアリングアプローチであるDeepDeblurRFを提案する。
我々は,DeepDeblurRFが,トレーニング時間を大幅に短縮して,最先端のノベルビュー合成品質を達成できることを実証し,カメラモーションのぼかしとデフォーカスのぼかしの両方について広範な実験を行った。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:11:18 GMT)
OG-Gaussian: Occupancy Based Street Gaussians for Autonomous Driving [12.5] 我々は,LiDAR点雲をサラウンドビューカメラ画像から生成されたOG(Occupancy Grids)に置き換える新しいアプローチであるOG-Gaussianを提案する。
提案手法は,OGのセマンティック情報を利用して静的道路背景から動的車両を分離し,これらのグリッドを2つの初期点雲に変換し,静的物体と動的物体の両方を再構成する。
Openデータセットの実験では、OG-Gaussianは復元品質とレンダリング速度の点で現在の最先端と同等であり、平均PSNRは35.13、レンダリング速度は143 FPSであることが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:00:47 GMT)
NLoRA: Nyström-Initiated Low-Rank Adaptation for Large Language Models [12.4] SLoRA(StructuredLoRA)を導入し,低ランク行列AとBの間に小さな中間行列を加えることを検討した。
次に、Nystr"omLoRA(NLoRA)を提案し、Nystr"om-based initialization for SLoRAを用いて、その有効性と効率を改善する。
最後に,NLoRAの中間行列のみを微調整してLLM効率を向上するIntermediateTune(IntTune)を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:01:11 GMT)
A Survey on Data Contamination for Large Language Models [12.4] 大規模言語モデル(LLM)は、テキスト生成やコード合成など、様々な分野で大きな進歩を見せている。
データ汚染による性能評価の信頼性は精査されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:23:27 GMT)
Imputation for prediction: beware of diminishing returns [12.4] 失敗の値はさまざまな分野に分散しており、予測モデルをトレーニングしデプロイする上での課題を提起している。
最近の理論的および実証的な研究は、単純な定数計算が一貫性と競争力を持つことを示唆している。
本研究の目的は, 先進的な計算手法への投資が, 予測精度を著しく向上させるかどうかを明らかにすることである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:57:10 GMT)
ParetoFlow: Guided Flows in Multi-Objective Optimization [12.4] オフライン多目的最適化(MOO)では、関連するラベルのオフラインデータセットを同時に複数の目的に活用する。
最近のイテレーションは主に進化的最適化とベイズ最適化を採用しており、データに固有の生成能力に限定的に注意が向けられている。
本手法は,様々なタスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:31:09 GMT)
DMOSpeech: Direct Metric Optimization via Distilled Diffusion Model in Zero-Shot Speech Synthesis [12.3] DMOSpeechは, 蒸留拡散に基づくTSモデルであり, 教師モデルと比較して高速な推論と優れた性能を実現する。
我々の総合的な実験は、人間の広範囲な評価によって検証され、自然性、知性、話者の類似性を大幅に向上させながら、推測時間を桁違いに減らした。
本研究は,音声合成と人間の聴覚嗜好を協調する新たな枠組みを,直接的メートル法最適化により確立する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:07:55 GMT)
Safety Evaluation of DeepSeek Models in Chinese Contexts [12.3] 本研究では,中国固有の安全性評価ベンチマークであるCHiSafetyBenchを紹介する。
このベンチマークは、中国の文脈におけるDeepSeek-R1とDeepSeek-V3の安全性を体系的に評価する。
実験結果は、これらの2つのモデルの中国の文脈における欠陥を定量化し、その後の改善の鍵となる洞察を与える。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:29:08 GMT)
A Multi-Agent Perspective on Modern Information Retrieval [12.2] 大規模言語モデル(LLM)の台頭は情報検索(IR)の新しい時代をもたらした。
このシフトは、長年にわたるIRパラダイムに挑戦し、理論的なフレームワークと実践的な方法論の両方の再評価を要求する。
我々は、クエリエージェント、ドキュメントエージェント、ランサーエージェント間の複雑な相互作用をよりよく捉えるために、マルチエージェントの視点を提唱する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:17:26 GMT)
Cardiac Evidence Backtracking for Eating Behavior Monitoring using Collocative Electrocardiogram Imagining [12.0] 本研究は,24時間ECGを用いて,アドホックかつ解釈可能な検出のための高度な深層学習を検知・調整するためのパイロット研究である。
提案手法の有効性は,従来のモデルよりも優れた食行動のECGデータセット上で検証されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:27:19 GMT)
Sample Complexity of Linear Quadratic Regulator Without Initial Stability [12.0] ReINFORCEに触発されて、未知のパラメータを持つ線形二次レギュレータ(LQR)問題に対して、新しい回帰水平アルゴリズムを導入する。
従来の手法とは異なり、本アルゴリズムはサンプルの複雑さの順序を同じに保ちながら、2点勾配推定に依存することを回避している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:44:25 GMT)
RAGVA: Engineering Retrieval Augmented Generation-based Virtual Assistants in Practice [11.9] Retrieval-augmented Generation (RAG)ベースのアプリケーションは、大規模言語モデル(LLM)を活用する能力により、人気を博している。
本稿では、対話型アプリケーションを構築するための総合的なステップバイステップガイドと、RAGVAの設計方法について述べる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:57:49 GMT)
Length-Controlled Margin-Based Preference Optimization without Reference Model [11.9] 好みに基づく強化学習のためのLongth-Controlled Margin-Based Preference Optimization (LMPO)を提案する。
LMPOの重要な革新は、Bradley-Terryフレームワークに組み込まれたLongth-Controlled Marginベースの損失関数である。
実験の結果,LMPOは応答長を効果的に制御し,確率劣化を低減し,既存手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:30:27 GMT)
How Much Do LLMs Hallucinate across Languages? On Multilingual Estimation of LLM Hallucination in the Wild [11.8] 幻覚とは、大規模言語モデルが非現実的または不誠実な応答を生成する傾向である。
我々は多言語幻覚検出モデルを訓練し、30言語にわたる大規模な研究を行う。
その結果,LLMは高次情報源言語に対するより幻覚的なトークンでより長い応答を生成するが,言語の長さ正規化幻覚率とそれらのデジタル表現との間には相関がないことが判明した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:50:09 GMT)
LLM4TS: Aligning Pre-Trained LLMs as Data-Efficient Time-Series Forecasters [11.8] 事前学習された大言語モデル(LLM)を用いた時系列予測のためのフレームワークを提案する。
LLM4TSは、LLMを時系列データのニュアンスと整合させる2段階の微調整戦略と、下流の時系列予測タスクの予測微調整段階から構成される。
我々のフレームワークは、事前訓練されたLLM内に多段階の時間データを統合し、時間固有の情報を解釈する能力を向上する新しい2段階集約手法を特徴としている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:48:08 GMT)
A Survey of Fuzzing Open-Source Operating Systems [11.8] オープンソースのオペレーティングシステムの脆弱性は、重大なセキュリティリスクを引き起こす。
ファジィング(OSF)は、OSの複雑さと多層インタラクションによって、独特な課題に直面している。
この研究は、最先端のOSF技術について体系的に調査する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:52:47 GMT)
Towards counterfactual fairness through auxiliary variables [11.8] 変数を動機とする新しい因果推論フレームワークEXOCを紹介する。
本フレームワークは, ファクトフェアネスに寄与する補助ノードと制御ノードを明示的に定義する。
合成および実世界のデータセットを用いて評価を行い,EXOCの優位性を検証した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:00:33 GMT)
CORBA: Contagious Recursive Blocking Attacks on Multi-Agent Systems Based on Large Language Models [11.7] LLM-MAS(Large Language Model-based Multi-Agent Systems)は、実世界の優れた機能を示す。
本稿では,エージェント間の相互作用を阻害する新規かつシンプルかつ高効率な攻撃であるContagious Recursive Attacks (Corba)を紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:02:00 GMT)
Beyond Self-Talk: A Communication-Centric Survey of LLM-Based Multi-Agent Systems [11.5] 大規模言語モデル(LLM)は、最近、推論、計画、意思決定において顕著な能力を示した。
研究者はLLMをマルチエージェントシステムに組み込んで、単一エージェント設定の範囲を超えてタスクに取り組むようになった。
この調査はさらなるイノベーションの触媒として機能し、より堅牢でスケーラブルでインテリジェントなマルチエージェントシステムを促進する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:18:34 GMT)
Identifying metric structures of deep latent variable models [11.4] 深い潜伏変数モデルは、研究された現象の内部の働きを反映したデータの凝縮表現を学習する。
現在のソリューションは、潜在変数モデルに対する追加の制約を通じて、識別可能性の欠如を制限する。
私たちは目的を変える:潜伏変数を識別する代わりに、それらの間の関係を識別する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:52:58 GMT)
Generative Modeling of Individual Behavior at Scale [11.4] 我々は,プレイヤーのスタイルベクトルを所望のプロパティに向けて操ることのできるスタイルステアリング技術を開発した。
前例のない規模のチェス(47,864人)とロケットリーグ(2000人)の2つの非常に異なるゲームにアプローチを適用する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:40:12 GMT)
LLM-EvRep: Learning an LLM-Compatible Event Representation Using a Self-Supervised Framework [11.3] 大規模言語モデル(LLM)は、様々な領域にまたがる顕著なゼロショット機能を示した。
textbfLLM-EvRep のイベント表現を生成するイベント表現生成器 textbfLLM-EvGen を提案する。
N-ImageNet、N-Caltech101、N-MNISTの3つのデータセットで総合実験を行った。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:18:36 GMT)
AVD2: Accident Video Diffusion for Accident Video Description [11.2] AVD2(Accident Video Diffusion for Accident Video Description)は,事故現場の理解を高める新しいフレームワークである。
このフレームワークは、自然言語の詳細な記述や推論と一致した事故ビデオを生成する。
EMM-AUデータセットの統合は、自動メトリクスと人的評価の両方にわたって最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:22:44 GMT)
NAVIG: Natural Language-guided Analysis with Vision Language Models for Image Geo-localization [11.0] 我々は,大域的および微粒な画像情報を統合した包括的画像ジオローカライズフレームワークであるNavigを紹介する。
言語による推論により、Navigは従来の最先端モデルと比較して平均距離誤差を14%削減する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:21:35 GMT)
RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers [11.0] 本稿では,Relevance-Guided Efficient Controllable GenerationフレームワークRelaCtrlを提案する。
拡散変換器の各層と制御情報との関連性を評価する。
次に、不要なパラメータと冗長な計算を減らすために、制御層の位置決め、パラメータスケール、モデリング能力を調整します。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:10:05 GMT)
Red-Teaming LLM Multi-Agent Systems via Communication Attacks [10.9] 大規模言語モデルに基づくマルチエージェントシステム(LLM-MAS)は、メッセージベースのコミュニケーションを通じて高度なエージェント協調を可能にすることで、複雑な問題解決能力に革命をもたらした。
エージェント・イン・ザ・ミドル(AiTM, Agent-in-the-Middle)は、エージェント間メッセージのインターセプトと操作によってLLM-MASの基本的な通信機構を利用する新たな攻撃法である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:55:39 GMT)
Causal Mean Field Multi-Agent Reinforcement Learning [10.8] 平均場強化学習(MFRL)と呼ばれるフレームワークは、平均場理論を用いることでスケーラビリティの問題を軽減することができる。
このフレームワークには、非定常環境下での本質的な相互作用を識別する能力がない。
拡張性問題に対処するために,因果平均Q-ラーニング (CMFQ) と呼ばれるアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:15:58 GMT)
I-MCTS: Enhancing Agentic AutoML via Introspective Monte Carlo Tree Search [10.7] イントロスペクティブモンテカルロ木探索(Introspective Monte Carlo Tree Search, I-MCTS)は、イントロスペクティブプロセスを通じてツリーノードを反復的に拡張する新しいアプローチである。
これにより、探索ツリー内のノードの継続的な改善が容易になり、全体的な意思決定プロセスが強化される。
LLM推定スコアから実際のパフォーマンススコアへQ値をシームレスに遷移させるハイブリッド報酬機構を実装した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:19:09 GMT)
Do LLMs Consider Security? An Empirical Study on Responses to Programming Questions [10.7] ChatGPTは、開発者にコンテキスト固有の情報をボランティアして、安全なコーディングプラクティスを促進する。
我々は,3つのLLM(Claude 3, GPT-4, Llama 3)が示すセキュリティ意識の程度を評価する。
私たちの調査によると、3つのモデルすべてが、脆弱性を正確に検知し、ユーザに警告するのに苦労しており、データセット全体の検出率は12.6%から40%に過ぎません。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:20:06 GMT)
FlexControl: Computation-Aware ControlNet with Differentiable Router for Text-to-Image Generation [10.7] ControlNetは拡散ベースの生成モデルをガイドする強力な方法を提供する。
ほとんどの実装は、異なるタスクで予測不可能に変化するアプローチを制御するためのネットワークブロックを選択するためのアドホックに依存しています。
トレーニング中にすべての拡散ブロックをコピーし、トレーニング可能なゲーティング機構を使用するフレームワークであるFlexControlを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:29:45 GMT)
What Skills Do Cyber Security Professionals Need? [10.6] サイバー攻撃の増加により、組織に対するサイバーセキュリティの重要性が高まっている。
多くの個人がサイバーセキュリティの分野に参入しようとしています。
しかし、この分野でのキャリアを成功させるために必要なスキルについて、明確な理解が欠如している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:56:59 GMT)
Drift: Decoding-time Personalized Alignments with Implicit User Preferences [10.4] Driftは大きな言語モデル(LLM)を暗黙のユーザー好みでパーソナライズする新しいフレームワークである。
分析の結果,Driftは計算効率が高く,解釈可能であることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:05:29 GMT)
Aligned at the Start: Conceptual Groupings in LLM Embeddings [10.3] 本稿では、しばしば見落とされがちな入力埋め込み(初期表現をトランスフォーマーブロックに入力する)に焦点を移す。
ファジィグラフ,k-nearest neighbor(k-NN),およびコミュニティ検出を用いて,多様なLDMの埋め込みを解析した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:26:33 GMT)
DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time [10.1] 実時間DLOモデリングのための微分離散分岐弾性棒
本稿では、実時間(DEFT)におけるFurcated DLOのモデル化のための微分離散分岐弾性ロッドを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:46:09 GMT)
"Always Nice and Confident, Sometimes Wrong": Developer's Experiences Engaging Large Language Models (LLMs) Versus Human-Powered Q&A Platforms for Coding Support [10.0] 生成AIの台頭により、開発者はソフトウェア開発プロセスにChatGPTなどのAIチャットボットを採用するようになった。
Redditの1700以上の投稿のテーマ分析を行うことで、開発者がこのアシストを現実のコーディング体験にどのように統合するかを調べ、比較する。
以上の結果から,ChatGPTは高速で明瞭で包括的な応答を提供し,SOよりも優美な環境を育むことが示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:54:03 GMT)
Detecting Metadata-Related Bugs in Enterprise Applications [10.0] 本稿では,(1)メタデータチェックルールを規定するためにドメインの専門家が利用できるドメイン固有言語であるRSLと,(2)ルール違反をチェックするためのRSLルールとEAを利用するツールであるMeCheckについて述べる。
評価のために、SpringとJUnitのドキュメントを調べ、15のルールを手動で定義し、115のオープンソースEAを持つ2つのデータセットを作成しました。
MeCheck氏は、最初のデータセットのバグを100%の精度、96%のリコール、98%のFスコアで特定した。第2データセットで156のバグを報告し、53のバグがすでに開発者によって修正されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:35:35 GMT)
Hardware-Friendly Static Quantization Method for Video Diffusion Transformers [9.9] ビデオ生成用拡散変換器は,SORAの高性能化以来,大きな研究関心を集めている。
リソース制約のあるデバイスは動的量子化をサポートできず、AIプロセッサへの効率的なデプロイにはモデルの静的量子化が必要である。
本稿では,動的量子化技術に頼ることなく,ビデオ拡散変換器OpenSoraciteopensoraの学習後量子化手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:29:24 GMT)
Memorization Over Reasoning? Exposing and Mitigating Verbatim Memorization in Large Language Models' Character Understanding Evaluation [9.8] 大きな言語モデル(LLM)は、文字理解タスクにおいて素晴らしいパフォーマンスを示している。
我々は「ギストメモリ」が文字理解タスクの主要なメカニズムであるべきだと論じている。
本稿では,文字理解評価において,機械的記憶を緩和する簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:02:27 GMT)
A Survey on Feedback-based Multi-step Reasoning for Large Language Models on Mathematics [9.7] 我々は,LLMの多段階数学推論を強化するために,ステップレベルのフィードバックと結果レベルの戦略を調査する。
LLMのスケーリングにおいて,多段階の推論が重要な要素となるため,さらなる研究の促進と理解を深めるための基盤の確立が望まれる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:31:00 GMT)
STeCa: Step-level Trajectory Calibration for LLM Agent Learning [9.7] 大規模言語モデル(LLM)ベースのエージェントは、環境と動的に相互作用することで複雑なタスクに取り組むことを約束している。
LLMエージェント学習のための新しいフレームワークであるStep-Level Trajectory (STeCa)を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:28:44 GMT)
LabTOP: A Unified Model for Lab Test Outcome Prediction on Electronic Health Records [9.6] 本稿では,EHRデータに基づく言語モデリング手法を活用し,実験結果を予測する統一モデルであるLabTOPを提案する。
公開されている3つのEHRデータセット上でLabTOPを評価し、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:55:45 GMT)
Distribution Matching for Self-Supervised Transfer Learning [9.5] 本研究では,分散マッチングと呼ばれる自己教師型トランスファー学習手法を提案する。
DMは,既存の自己教師ありトランスファー学習法と比較して,目標分類タスクにおいて競合的に機能することを示す。
我々は、集団定理やエンドツーエンドのサンプル定理を含む、DMに対する堅牢な理論的保証を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:20:56 GMT)
Integrated Scheduling Model for Arrivals and Departures in Metroplex Terminal Area [9.4] 本稿ではまず,複数の空港を併設したメトロプレックスにおける到着便と出発便の協調飛行シークエンシングのための二段階最適化モデルを提案する。
モデルは様々な交通シナリオに適応する。
その結果、モデルでは到着遅延を51.52%、出発遅延を18.05%、出発時の滑走路占有時間を23.83%削減できることが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:03:32 GMT)
Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion [9.4] 本稿では,透明物体のセグメンテーションと深さ推定の両面において,初めて優れたモノクラーフレームワークを提案する。
具体的には,タスク間のマルチスケール情報を効果的に統合する,新しい意味的および幾何学的融合モジュールを考案する。
2つの挑戦的な合成および実世界のデータセットの実験により、我々のモデルは最先端のモノクル、ステレオ、マルチビューメソッドを大きなマージンで超越していることが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:57:01 GMT)
Learning to Play Against Unknown Opponents [9.3] 本研究では,学習エージェントが非学習に制約されない場合に,最適な学習アルゴリズムを効率的に構築する方法を示す。
これらの結果は、最近開発された機械を用いて、学習アルゴリズムの分析をメニューとして知られる幾何学的対象のクラスに変換する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:17:45 GMT)
TimeDistill: Efficient Long-Term Time Series Forecasting with MLP via Cross-Architecture Distillation [9.1] トランスフォーマーベースおよびCNNベースの手法は、長期予測シリーズにおいて強い性能を示す。
我々は知識蒸留(KD)を用いた軽量蒸留と先進的アーキテクチャの統合を提案する。
TimeDistillは最大18.6%パフォーマンスを改善し、8つのデータセットの教師モデルを上回っている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:12:04 GMT)
An LLM-Based Approach for Insight Generation in Data Analysis [9.1] 本稿では,Large Language Models (LLMs) を用いたテキストインサイトの自動生成手法を提案する。
入力としてマルチテーブルデータベースが与えられると、LLMを活用して、テーブルの興味深いパターンを反映した簡潔でテキストベースの洞察を生成する。
これらの知見は、人間の判断と自動メトリクスのハイブリッドモデルを用いて、正当性と主観的洞察力の両方について評価される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:09:59 GMT)
An Empirical Study on Leveraging Images in Automated Bug Report Reproduction [9.0] 本研究は,自動バグ再現において,入力に画像を含める必要性について検討する。
我々は、画像がバグレポートに果たす機能的役割を6つ特定し、それぞれに固有のパターンとバグ再現プロセスへの特定の貢献を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:40:21 GMT)
BaxBench: Can LLMs Generate Correct and Secure Backends? [8.9] 大規模言語モデル(LLM)は、関数レベルで効率的にコードを生成し、コード編集を行い、アルゴリズムによるコーディングタスクを解決する。
完全な自動化を実現するためには、LLMは製品品質の自己完結型アプリケーションモジュールを生成する必要がある。
バックエンドアプリケーション生成のための392タスクからなる新しい評価ベンチマークであるBaxBenchを紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:52:31 GMT)
Rare Disease Differential Diagnosis with Large Language Models at Scale: From Abdominal Actinomycosis to Wilson's Disease [8.8] 大型言語モデル (LLM) は, 疾患診断において顕著な能力を示した。
医療現場でのLSMの使用の増加には、希少な疾患のパフォーマンスが重要である。
本稿では,知識LLMとエキスパートシステムを組み合わせたRareScaleを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:02:52 GMT)
AlphaPO -- Reward shape matters for LLM alignment [8.8] textbfAlphaPOは、標準的なログ報酬以外の報酬関数の形状を変えるのに役立つ新しいDAAである。
最高のパフォーマンスを持つDAAの1つであるSimPOと比較して、AlphaPOはアライメント性能が7%から10%向上した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:35:34 GMT)
Joint Registration and Conformal Prediction for Partially Observed Functional Data [8.7] 部分的な観測関数における欠落部分の予測は、無限次元性、観測の内外における複雑な依存、不規則ノイズによって困難である。
本稿では,共形予測フレームワークに基づく部分観測関数に対する統一的な登録と予測手法を提案する。
提案手法は、慎重に構築された予測-応答ペアによる交換性を確保しつつ、登録と予測を統合する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:42:20 GMT)
Gender Influence on Student Teams' Online Communication in Software Engineering Education [8.7] 本研究では,GitHubプロジェクトにコントリビュートする8チームを対象とした,39人のSE学生による8週間のプロジェクトについて検討する。
混合メソッドのアプローチを使用して、Slackのコミュニケーションを分析し、性別の違いを特定しました。
女性全員のチームでは、より高いヘルプシーキングとリーダシップの行動が見られましたが、男性はよりゆっくりと反応しました。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:43:54 GMT)
Nanophotonic Super-dephasing in Collective Atom-Atom Interactions [8.6] 材料近傍のフォトニック環境で発生するナノ・EMスーパーデフォーカス現象について紹介する。
オフ共鳴・低周波EMゆらぎの長距離相関は、多体交絡状態における集合的加速(super-)または抑制(sub-)減退(sub-)を誘導する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:03:20 GMT)
Simpler Fast Vision Transformers with a Jumbo CLS Token [8.6] スループットを維持しながら精度を向上させるために,視覚変換器(ViT)のグローバル処理の簡易化を提案する。
我々のアプローチであるJumboは、注意前のパッチトークン幅にマッチするように分割され、自己注意で処理され、再組み立てされる、より広いCLSトークンを生成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:16:10 GMT)
Provable Quantum Algorithm Advantage for Gaussian Process Quadrature [8.3] 本研究の目的は,ガウス過程二次法のための新しい量子アルゴリズムを開発することである。
本稿では,ガウス過程カーネルのヒルベルト空間近似に基づく量子低ランクガウス過程二次法を提案する。
古典的二次法よりも量子コンピュータの優位性を示す理論的複雑性解析を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:42:15 GMT)
CoME: An Unlearning-based Approach to Conflict-free Model Editing [8.2] 大規模言語モデル(LLM)は、古い情報や事前訓練の誤った情報を保持することが多く、信頼性を損なう。
我々は,古い知識を選択的に除去することで,LLMにおける知識更新の精度を高める新しいフレームワークである,衝突のないモデル編集(CoME)を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:55:38 GMT)
Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning [8.0] 本稿では,車線描画画像の異常検出を分類問題に変換する。
本研究では,データ前処理,マスク付き画像モデリング(MiM)手法による自己教師付き事前学習,ラベル平滑化によるクロスエントロピーベース損失を用いた微調整,後処理からなる4相パイプラインを提案する。
その結果,提案パイプラインは車線描画画像異常検出において優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:58:40 GMT)
Watch Less, Feel More: Sim-to-Real RL for Generalizable Articulated Object Manipulation via Motion Adaptation and Impedance Control [8.0] 可変インピーダンス制御と動き適応を備えた新しいRLパイプラインを提案する。
我々のパイプラインは、ゼロショットsim-to-real転送時の滑らかで器用な動きに焦点を当てている。
我々の知る限りでは、われわれの政策は現実世界で84%の成功率を最初に報告した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:18:35 GMT)
Mechanistic Understanding of Language Models in Syntactic Code Completion [8.0] 私たちは、Code LMが構文的完了タスクをどのように実行するかを理解するために、最初のメカニスティック・インタプリタビリティ(Mechanistic Interpretability)の1つを実行します。
以上の結果から,モデルが正しいラベルを確実に予測するまでは,中間層を必要とすることが明らかとなった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:35:20 GMT)
Infrared Image Super-Resolution: Systematic Review, and Future Trends [7.8] 赤外線画像(または熱画像)の超解像は、深層学習の発展における継続的な関心事である。
この調査は、IR画像の超解像の総合的な展望を提供することを目的としている。
現在の技術における欠陥と、コミュニティが探求する有望な方向性が強調されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:23:07 GMT)
Leveraging Small LLMs for Argument Mining in Education: Argument Component Identification, Classification, and Assessment [7.7] 本稿では,オープンソースの小型大言語モデル(LLM)を,数発のプロンプトと微調整による議論マイニングに活用することを提案する。
我々は,学生エッセイを議論に分割し,タイプ別に議論を分類し,その質を評価する3つの課題を遂行する。
我々は,小学校6-12年の学生エッセイのフィードバック賞 - 効果的なアグメンツデータセットのモデルを実証的に評価した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:23:40 GMT)
Hallucination Detection in Large Language Models with Metamorphic Relations [7.4] 大規模言語モデル(LLM)は幻覚を起こす傾向があり、例えば、その応答において事実的に誤った情報がある。
メタQAは, メタモルフィック関係を利用した自己完結型幻覚検出手法である。
我々は,MetaQAと最先端のゼロリソース幻覚検出手法であるSelfCheckGPTを比較し,複数のデータセットを比較した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:44:33 GMT)
Denoising, segmentation and volumetric rendering of optical coherence tomography angiography (OCTA) image using deep learning techniques: a review [7.4] OCTAは、網膜と脈絡膜における血管構造と微小循環動態を研究するために広く用いられている非侵襲的イメージング技術である。
ディープラーニング(DL)ベースの画像解析モデルでは、アーティファクトやノイズを自動的に検出し、削除することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:34:05 GMT)
Texture and Noise Dual Adaptation for Infrared Image Super-Resolution [7.3] ターゲット指向ドメイン適応SRGAN(DASRGAN)は、ロバストIR超解像モデル適応のための革新的なフレームワークである。
DASRGANは,(1)テクスチャを微妙に洗練するためのテクスチャ指向適応 (TOA) と,(2)ノイズ指向適応 (NOA) の2つの主要成分の相乗効果を利用する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:51:25 GMT)
Vision Foundation Models in Medical Image Analysis: Advances and Challenges [7.2] ビジョンファウンデーションモデル(VFM)は、医療画像解析の分野で大きな進歩をもたらした。
本稿では,VFMの医用画像セグメンテーションへの適応に関する現状研究について概説する。
本稿では,アダプタによる改良,知識蒸留技術,マルチスケール・コンテキスト特徴モデリングの最近の発展について論じる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:13:46 GMT)
FUIA: Model Inversion Attack against Federated Unlearning [7.2] 本稿では,フェデレーション・アンラーニング・インバージョン・アタック(FUIA)を提案する。
FUIAは三種類のFU(サンプルアンラーニング、クライアントアンラーニング、クラスアンラーニング)に特化して設計されている。
忘れられたデータのプライバシーを著しく漏洩させ、あらゆる種類のFUをターゲットにすることができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:38:36 GMT)
Compute Or Load KV Cache? Why Not Both? [7.0] Cakeは計算資源とI/Oリソースを並列に最適に利用する新しいKVキャッシュローディングシステムである。
Cakeは、計算のみの手法やI/Oのみの手法と比較して、TTFT(Time to First Token)の平均2.6倍の削減を実現している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:28:01 GMT)
Benchmarking Android Malware Detection: Rethinking the Role of Traditional and Deep Learning Models [6.9] Androidのマルウェア検出は、従来の機械学習(ML)とディープラーニング(DL)の両方のアプローチを用いて、広範囲に研究されている。
多くの最先端検出モデルは優れた性能を主張するが、限られた比較に頼っていることが多い。
これにより、DLベースのアプローチのパフォーマンスの堅牢性と、よりシンプルで効率的なMLモデルの潜在的監視に関する懸念が高まる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:56:05 GMT)
Pitch Imperfect: Detecting Audio Deepfakes Through Acoustic Prosodic Analysis [6.9] 音声のディープフェイクを検出するための基礎的な手段として,韻律(Prosody)や高レベルの言語的特徴を探求する。
我々は6つの古典的韻律的特徴に基づく検出器を開発し、我々のモデルが他のベースラインモデルと同様に機能することを実証する。
モデル決定に最も影響を与える韻律的特徴を説明することができることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:52:55 GMT)
The Impact and Feasibility of Self-Confidence Shaping for AI-Assisted Decision-Making [6.9] 本稿では,目標レベルにおける自己自信の校正を目的とした自己自信形成の介入について述べる。
我々は,AIの信頼度と信頼度を両立させることにより,自己自信形成が人間-AIチームのパフォーマンスを50%近く向上させることができることを示した。
感情と自己自信の関係は、感情を変えることが自己自信を形成するための実行可能な戦略になり得ることを示唆している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:55:41 GMT)
Planning Domain Model Acquisition from State Traces without Action Parameters [6.8] 学習行動のパラメータが提供されない状況における学習について検討する。
本稿では,どの情報を提供するかに基づいて,トレース品質のレベルを2つ提示し,それぞれにアルゴリズムを提案する。
提案アルゴリズムを実験により評価し,最先端の学習ツールFAMAと比較した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:50:54 GMT)
Nearshore Underwater Target Detection Meets UAV-borne Hyperspectral Remote Sensing: A Novel Hybrid-level Contrastive Learning Framework and Benchmark Dataset [6.8] UAV搭載ハイパースペクトルリモートセンシングは、水中目標検出(UTD)のための有望なアプローチとして登場した
近海環境におけるスペクトル歪みによって妨げられ、従来の超スペクトルUTD法の精度を損なう。
沿岸域における強靭なHUTDのための自己評価学習パラダイムとコントラスト学習を統合した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:25:30 GMT)
TALKPLAY: Multimodal Music Recommendation with Large Language Models [6.8] TalkPlayは、複数のモダリティをエンコードする拡張トークン語彙を通じて音楽を表現する。
モデルは、音楽レコメンデーションの会話において、次のトーケン予測を通じてレコメンデーションを生成することを学習する。
提案手法は従来のレコメンデーション-対話パイプラインの複雑さを排除し,クエリ対応の音楽レコメンデーションのエンドツーエンド学習を可能にする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:43:15 GMT)
Optimal word order for non-causal text generation with Large Language Models: the Spanish case [6.8] 本稿では,最大語順推定のためのビタビアルゴリズムに基づく新しい手法を提案する。
スペイン語におけるNLGの非因果的最類似順の確率を解析し,同じフレーズをスペイン語の因果NLGで生成する確率を解析した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:06:16 GMT)
Small Graph Is All You Need: DeepStateGNN for Scalable Traffic Forecasting [6.7] 本稿では,トラフィックデータを解析するための新しいグラフニューラルネットワーク(GNN)モデルであるDeepStateGNNを提案する。
個々のトラフィックセンサを個々のグラフノードとして扱う一般的なGNNメソッドとは異なり、DeepStateGNNはセンサーを高レベルのグラフノードにクラスタする。
実験の結果、DeepStateGNNは優れたスケーラビリティと高速なトレーニングを提供すると同時に、競合他社よりも正確な結果を提供することがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:00:31 GMT)
Traffic Scenario Logic: A Spatial-Temporal Logic for Modeling and Reasoning of Urban Traffic Scenarios [6.7] 交通シナリオ論理(Traffic Scenario Logic、TSL)は、都市における歩行者自由交通シナリオのモデル化と推論のために設計された時空間論理である。
TSLは、都市道路網の形式的な表現を提供し、これはOpenDRIVE、すなわち、自動運転のための高解像度地図のデファクト業界標準から導出することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:58:25 GMT)
New estimates for character sums over sparse elements of finite fields [6.6] 例えば$sum_ginmathcalGchi(f(g))$, $mathcalG$ は $mathbbF_qr$ と $f(X)$ のスパース部分集合であり、$mathbbF_qr$ は $mathbbF_qr$ の和である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:40:48 GMT)
Stein Boltzmann Sampling: A Variational Approach for Global Optimization [6.6] 本稿では,Stein Boltzmann Sampling (SBS) と呼ばれる連続ソボレフ関数を大域的に最適化するフローベース手法を提案する。
ベンチマーク関数の最先端手法との詳細な比較は、SBSとその変種が競争力が高いことを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:08:51 GMT)
ODVerse33: Is the New YOLO Version Always Better? A Multi Domain benchmark from YOLO v5 to v11 [6.6] 主要な疑問は、新しいYOLOバージョンのリリース頻度の増加にある。
各YOLOバージョンの中核となるイノベーションはどのようなもので、これらの変更が実際のパフォーマンス向上にどのように変換されるのか?
本稿では、YOLOv1からYOLOv11への重要なイノベーションを要約し、ODverse33と呼ばれる包括的なベンチマークを導入し、実世界のマルチドメインアプリケーションにおけるモデル改善の実践的影響について検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:57:58 GMT)
Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation [6.6] 球面に無注意の視覚マンバを導入する。
本手法は球面データを三角形パッチの列として表現することで表面パッチを実現する。
提案したSurface Vision Mambaは、複数の神経発達型表現型回帰タスクで評価される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:37:41 GMT)
Getting SMARTER for Motion Planning in Autonomous Driving Systems [6.4] 本稿では,第2世代の動作計画シミュレータSMARTS 2.0を紹介する。
新機能には、現実的なマップの統合、車両間通信、交通と歩行者のシミュレーション、さまざまなセンサーモデルが含まれる。
本稿では,様々な難易度の高いシナリオにおいて,計画アルゴリズムを評価するための新しいベンチマークスイートを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:51:49 GMT)
eC-Tab2Text: Aspect-Based Text Generation from e-Commerce Product Tables [6.4] 我々はeコマースの複雑さを捉えるために設計された新しいデータセットeC-Tab2Textを紹介する。
製品表からテキストを生成することに注力し、LCMが高品質で属性固有の製品レビューを作成できるようにする。
その結果,文脈的に正確なレビューを生成する上で,大幅な改善が見られた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:41:48 GMT)
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models [6.4] 検索強化世代(RAG)は、新しい情報を導入する主要な方法となっている。
最近のRAGは、知識グラフのような様々な構造を持つベクトル埋め込みを拡大して、いくつかのギャップ、すなわちセンスメイキングと連想性に対処している。
我々は,現実的,感覚的,連想的なメモリタスクにおいて,標準RAGを総合的に上回るフレームワークであるHippoRAG 2を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:26:02 GMT)
Type 1 Diabetes Management using GLIMMER: Glucose Level Indicator Model with Modified Error Rate [6.3] 我々は,血糖値を予測する機械学習手法であるGLIMMERを開発した。
GLIMMERは、グルコース値を正常および異常な範囲に分類し、ジグリセミック事象の精度を優先する新しいカスタム損失関数を考案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:26:00 GMT)
Sentence Smith: Formally Controllable Text Transformation and its Application to Evaluation of Text Embedding Models [6.3] 本稿では,テキストの意味の制御と特定の操作を可能にするSentence Smithフレームワークを提案する。
文をセマンティックグラフにパースし、人間の設計したセマンティックな操作ルールを適用し、操作されたグラフからテキストを生成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:00:19 GMT)
Bridging the Gap: Transforming Natural Language Questions into SQL Queries via Abstract Query Pattern and Contextual Schema Markup [6.2] 構造的マッピングギャップと語彙的マッピングギャップの2つの重要なギャップを識別する。
PAS関連は87.9%の実行精度を達成し、BIRDデータセットの64.67%の実行精度を導いた。
スパイダーベンチマークの結果は87.9%の精度でスパイダーベンチマークの最先端を新たに設定し、BIRDデータセットで64.67%の精度で結果を導いた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:11:27 GMT)
Towards Understanding Why Label Smoothing Degrades Selective Classification and How to Fix It [6.2] ラベルスムーシング(LS)はニューラルネットワークをトレーニングするための一般的な正規化手法である。
LSは、正誤予測の不確実なランク順を格下げする。
我々は、ロジトレベルの勾配を分析することによって、この振る舞いを説明する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:02:44 GMT)
Unveiling Cultural Blind Spots: Analyzing the Limitations of mLLMs in Procedural Text Comprehension [6.0] 我々は,mLLMsの文化的に多様な手続き的テキストの処理と推論能力を評価するためのベンチマークであるCAPTexを紹介する。
以上の結果から,mLLMsは文化的に文脈化された手続き文の難易度に直面することが示唆された。
多様な言語・文化の景観にまたがる適応性と理解を高めるため、CAPTexのような文化的に意識されたベンチマークの必要性を強調した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:01:08 GMT)
Optimal coordination of resources: A solution from reinforcement learning [6.0] マイノリティゲーム(MG)はおそらくこの問題に対処する最もシンプルなおもちゃモデルだろう。
我々はMGに強化学習パラダイムを導入し、蓄積された経験に基づいて個人が意思決定を調整する。
このRLフレームワークは、個人がランダム探索による経験の活用のバランスをとると、最適な資源調整を実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:42:23 GMT)
LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers [6.0] 大規模言語モデルがどのようにコンテキスト情報をエンコードし、格納するかを定量化する手法。
トークンはしばしばマイナー(例えば、決定子、句読点)と見なされるが、驚くほど高いコンテキストを持つことを示す。
本稿では,トークンレベルの非線形性を評価し,文脈記憶を評価し,中間層への寄与を可視化するオープンソースツールキット LLM-Microscope を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:59:35 GMT)
When do neural networks learn world models? [6.0] 我々は、ニューラルネットワークが同様の世界モデルを学ぶことができるかどうかを研究する。
低次バイアスを持つモデルは、軽度の仮定の下で遅延データ生成変数を確実に回復することを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:33:20 GMT)
Towards impactful challenges: post-challenge paper, benchmarks and other dissemination actions [6.0] 本研究は,チャレンジアウトプットの収集と整理のための手法を概説する。
章の中央部分は典型的なポストチェレンジペーパーのテンプレートであり、グラフや、チャレンジを長期のベンチマークに変換する方法についてのアドバイスを含んでいる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:48:48 GMT)
MAGO-SP: Detection and Correction of Water-Fat Swaps in Magnitude-Only VIBE MRI [6.0] 容積補間ブレスホールド試験(VIBE)MRIは水と脂肪の信号合成推定に適した画像を生成する。
2点VIBEは水脂肪分離画像を提供するが、6点VIBEは有効緩和率R2*と陽子密度脂肪率(PDFF)の推定を可能にする。
この欠点は、大規模臨床データと人口調査の自動PDFF解析におけるVIBE-MRIの適用に挑戦するものである。
本研究では,非コントラスト強調VIBE画像における水脂肪交換を自動的に検出し,補正するパイプラインを開発した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:54:37 GMT)
metabench -- A Sparse Benchmark of Reasoning and Knowledge in Large Language Models [6.0] 大きな言語モデル(LLM)は、様々なタスクでその能力が異なる。
これらのベンチマークを測る共通基盤能力の小さなセットがあることが示される。
スパースベンチマークであるメタベンチを蒸留し、これらは6つのベンチマークの原サイズの3%以下である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:20:11 GMT)
Natural Language Generation [5.9] この本は、技術、ユーザ要求、評価、現実世界のアプリケーションを含む、自然言語生成(NLG)の幅広い概要を提供する。
この本は、NLGの研究者、NLGを使いたい他の分野の人々、商用開発者など、応用されたNLGに取り組んでいる人々にとって特に有用であるべきです。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:41:34 GMT)
CDGS: Confidence-Aware Depth Regularization for 3D Gaussian Splatting [5.9] CDGSは3DGSを強化するために開発された信頼性を考慮した深度正規化手法である。
我々は,単眼深度推定のマルチキュー信頼マップと,運動深度からのスパース構造を適応的に調整するために活用する。
本手法は,初期訓練段階における幾何ディテールの保存性を向上し,NVSの品質と幾何精度の両面での競争性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:12:13 GMT)
AI-driven inverse design of materials: Past, present and future [5.8] 人間は長い間、多数の実験を通じて新しい物質を探索し、新しい物質の性質と構造を予測するための対応する理論システムを提案してきた。
計算能力の向上により、研究者は徐々に様々な電子構造計算手法を開発してきた。
近年,計算機科学分野における人工知能技術の急速な発展により,材料特性と構造との暗黙的関連が効果的に評価されるようになった。
生成的および識別的モデルに基づく素材の逆設計において顕著な進歩が見られ、研究者から広く注目を集めている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:47:54 GMT)
Soft Token Attacks Cannot Reliably Audit Unlearning in Large Language Models [5.8] ソフトトークン攻撃(STA)は,大規模言語モデル(LLM)から未学習情報を抽出できることを示す。
我々の研究は、より良い評価基準と、未学習の有効性を評価するためのより適切な監査ツールの必要性を強調している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:22:33 GMT)
Explanations of Deep Language Models Explain Language Representations in the Brain [5.8] 大規模言語モデル(LLM)は人間のような性能を実現し、脳の言語処理機構と計算原理を共有する。
近年の進歩は、人間のような性能を達成するだけでなく、脳の言語処理機構と計算原理を共有する大きな言語モデル(LLM)を生み出している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:05:45 GMT)
Towards Generative Ray Path Sampling for Faster Point-to-Point Ray Tracing [5.7] 本稿では,潜在的光線経路を効率的にサンプリングするための機械学習支援レイトレーシング手法を提案する。
我々のモデルは、あらゆる可能なパスの中で潜在的に有効なパスを優先順位付けし、シーンの複雑さと線形にスケールすることを学ぶ。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:41:52 GMT)
On the Influence of Context Size and Model Choice in Retrieval-Augmented Generation Systems [5.7] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)の拡張手法として登場した。
我々は,様々なコンテキストサイズ,BM25,セマンティック検索を検索として評価し,8つの基本LLMについて検討した。
以上の結果から, 最終QA成績は最大15スニペットで着実に改善するが, 停滞あるいは低下がみられた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:34:34 GMT)
ReVision: A Dataset and Baseline VLM for Privacy-Preserving Task-Oriented Visual Instruction Rewriting [5.7] 本稿では,マルチモーダル命令をテキストのみのコマンドに変換する新しい手法であるVisual Instruction Rewritingについて検討する。
本稿では,14領域にまたがる39,000以上のサンプルのデータセットを提示し,画像キャプションデータセットに基づいて,コンパクトなVLMを開発する。
BLEU, METEOR, ROUGEなどのNLGメトリクスを用いて評価した実験結果から, モデルの量子化バージョンであっても, 効果的な命令書き換えが可能であることが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:01:41 GMT)
Graph Anomaly Detection via Adaptive Test-time Representation Learning across Out-of-Distribution Domains [5.7] AdaGraph-T3は、クロスドメイングラフ異常検出(GAD)のためのテスト時間トレーニングフレームワークである。
AdaGraph-T3は、自己教師付き学習のみを使用して、テスト期間中に新しいドメインに適応しながら、トレーニング中の教師付き学習と自己教師付き学習を組み合わせる。
本フレームワークでは,メッセージパッシング時のエッジ重要度を動的に学習する効果的なセルフスーパービジョンスキーム,異種機能を扱うドメイン固有エンコーダ,不均衡に対処するためのクラス認識正規化という,ドメイン間GADの4つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:14:07 GMT)
Asymmetric Co-Training for Source-Free Few-Shot Domain Adaptation [5.6] SFFSDAシナリオに特化して設計された非対称コトレーニング(ACT)手法を提案する。
ターゲットモデルをトレーニングするために、2段階の最適化プロセスを使用します。
本研究は,少数のラベル付き対象データのみを用いた事前学習モデルの適用により,実用的で信頼性の高い解が得られることを示唆する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:58:45 GMT)
Daily Land Surface Temperature Reconstruction in Landsat Cross-Track Areas Using Deep Ensemble Learning With Uncertainty Quantification [5.6] 複雑な都市部におけるランドサットのLSTを再構築するための,年間気温サイクルとプロセスを統合するアンサンブル学習手法であるDELAGを提案する。
デラグはニューヨーク市、ロンドン、香港で3つの地域から研究エリアとしてLSTの再建に成功した。
以上の結果から,DLAGによる再建が成功し,正確な空気温度を推定するためのLST再建の広範な応用が明らかとなった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:35:01 GMT)
Interpretable Text Embeddings and Text Similarity Explanation: A Primer [5.5] 得られた類似度スコアの説明を専門とする解釈可能性手法について概説する。
提案手法の個人的アイデアと手法について検討し,テキスト埋め込みの解釈可能性の向上の可能性を評価し,予測された類似性を説明する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:59:34 GMT)
Signless Laplacian State Transfer on Vertex Complemented Coronae [5.4] 本稿では量子状態移動を扱う。
有意なラプラシアのマトリックスに関する脊椎動物は、コロナ科を補完した
本研究は,ラプラシアン完全状態移動が存在するか否かの条件について検討する。
脊椎はコロナを補完した
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:29:39 GMT)
GeoAggregator: An Efficient Transformer Model for Geo-Spatial Tabular Data [5.4] 本稿では地理空間データモデリングのための効率的かつ軽量なアルゴリズムGeoAggregatorを紹介する。
我々は、空間統計モデル、XGBoost、およびいくつかの最先端地理空間深層学習法と比較した。
その結果、GeoAggregatorsは、ほぼすべてのデータセットで競合相手と比較して、ベストまたはセカンドベストのパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:39:15 GMT)
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference [5.4] Group Quantization and Sparse Acceleration (GQSA)は、LLMに適した新しい圧縮技術である。
圧縮モデルの性能優位性を保証するための2段階スパース最適化手法を提案する。
実験の結果、GQSA W4S50%圧縮設定の下では、モデルの精度は2:4プルーニングとW2量子化の両方を上回ることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:14:06 GMT)
dtaianomaly: A Python library for time series anomaly detection [5.4] dtaianomalyは、時系列異常検出のためのオープンソースのPythonライブラリである。
私たちのゴールは、学術研究と現実世界の応用のギャップを埋めることです。
dtaianomaly は,(1) 内蔵された幅広い異常検出装置,(2) 時系列前処理のサポート,(3) 視覚解析ツール,(4) 異常スコアの信頼性予測,(5) ランタイムとメモリプロファイリング,(6) 包括的なドキュメント,(7) クロスプラットフォームの単体テストを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:18:00 GMT)
KLay: Accelerating Arithmetic Circuits for Neurosymbolic AI [5.3] ニューロシンボリックAIに対する一般的なアプローチは、論理式を演算回路にマッピングすることである。
我々は,効率よく並列化可能な演算回路を表現するために知識層(KLay)を導入する。
我々は,KLayが複数桁の高速化を実現することを実証的に示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:51:09 GMT)
Global Neural Networks and The Data Scaling Effect in Financial Time Series Forecasting [5.3] 本研究では,データスカース環境下でのモデル推定の従来の手法が,先行研究で観測された混合経験的性能を損なう可能性を実証する。
我々は1万以上のグローバル株からなるデータセットを採用し、横断的に情報をプールするグローバルな評価戦略を実装している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:36:43 GMT)
Information Types in Product Reviews [5.2] 製品レビュードメインから24の文のコミュニケーション目標のタイプを考案する。
実験の結果,類型学における授業の組み合わせは,評価の有用性と感情を予測できることがわかった。
レビューで情報の種類を特徴づけることで、このジャンルをより効果的に消費する多くの機会が解放される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:44:04 GMT)
Reasoning Bias of Next Token Prediction Training [5.2] 次世代トークン予測(NTP)は,大規模言語モデル(LLM)の主要なトレーニングパラダイムである
トレーニング中にNTPが騒音に曝露しても,推論能力は上回っていることが明らかとなった。
この逆直感的な結果は、トレーニング力学における雑音の正規化の影響に起因している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:38:38 GMT)
Learning to Retrieve and Reason on Knowledge Graph through Active Self-Reflection [5.2] 本稿では,知識グラフ推論ARGのための能動的自己回帰フレームワークを提案する。
フレームワーク内では、特別なトークンを利用して、知識検索が必要かどうかをテキスト的に決定する。
モデルによって生成された推論経路は高い解釈可能性を示し、モデルの構造的知識に対する理解をより深く探求することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:38:48 GMT)
Topology-Aware Wavelet Mamba for Airway Structure Segmentation in Postoperative Recurrent Nasopharyngeal Carcinoma CT Scans [5.1] 鼻咽喉頭癌(NPC)患者は放射線治療や化学療法を受け、術後合併症を来すことがある。
TopoWMambaは,術後気道リスク評価の課題に対処するために設計された,新しいセグメンテーションモデルである。
TopoWMambaは、ウェーブレットベースのマルチスケール特徴抽出、状態空間シーケンスモデリング、トポロジー対応モジュールを組み合わせて、CTスキャンで気道関連構造を堅牢に分割する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:40:41 GMT)
A Neural Operator-Based Emulator for Regional Shallow Water Dynamics [5.1] 沿岸部は特に海面上昇や極端な気象現象の影響を受けやすい。
これらの地域の流体力学過程の正確なリアルタイム予測は、インフラ計画と気候適応に不可欠である。
本稿では,高次元数値解法を効率よく近似するために次元還元を用いた自己回帰型ニューラルエミュレータを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:02:44 GMT)
Step-by-Step Fact Verification System for Medical Claims with Explainable Reasoning [5.1] 本研究では、3つの医療ファクトチェックデータセットに反復的なFVシステムを適用し、複数の設定で評価する。
本稿では,従来のアプローチに対する最終性能の向上と,ドメイン固有クレームに対するステップバイステップFVシステムの高い可能性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:40:21 GMT)
Ray-Tracing for Conditionally Activated Neural Networks [5.0] 本稿では,エキスパートアクティベーションの最適化構成に収束するサンプリング機構を備えた,条件付き活性化ニューラルネットワークのための新しいアーキテクチャを提案する。
実験により,本手法は従来のベースラインに比べて競争精度が高いことが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:09:03 GMT)
Interpreting Adversarial Attacks and Defences using Architectures with Enhanced Interpretability [5.0] この研究は、通常のディープ・ネットワーク・アーキテクチャよりも優れた解釈能力を持つディープ・リニア・ゲイト・ネットワーク(DLGN)というネットワーク・アーキテクチャに便乗している。
我々は、PGD逆行訓練を用いて訓練された頑健なモデルを解釈し、それらを標準訓練と比較する。
PGD-ATとSTD-TRモデルの主成分に類似した超平面についての知見を明らかにし, PGD-ATの超平面はデータポイントから遠く離れている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:12:58 GMT)
μRL: Discovering Transient Execution Vulnerabilities Using Reinforcement Learning [4.9] 本稿では,SpectreやMeltdownといったマイクロアーキテクチャの脆弱性を発見する上での課題に対して,強化学習を用いることを提案する。
我々のRLエージェントはプロセッサと対話し、リアルタイムフィードバックから学び、命令シーケンスを優先順位付けすることで脆弱性を明らかにする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:42:03 GMT)
A Collaborative Jade Recognition System for Mobile Devices Based on Lightweight and Large Models [4.9] 本稿では,サイズモデル協調に基づくジェイド認識システムを提案する。
スマートフォンなどのモバイルデバイスを用いて,効率的かつ正確なジェイド識別を実現することを目的としている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:30:43 GMT)
Multi-Class Imbalanced Learning with Support Vector Machines via Differential Evolution [4.9] サポートベクトルマシン(SVM)は、分類タスクを処理する強力な機械学習アルゴリズムである。
本稿では, 微分進化(i-SVM-DE)法によるSVMの改良手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:30:18 GMT)
QUAD-LLM-MLTC: Large Language Models Ensemble Learning for Healthcare Text Multi-Label Classification [4.8] 収集された医療用テキストデータのエスカレート量は、テキスト分類を自動化する上でユニークな課題である。
従来の機械学習モデルは、表現されたトピックの配列を完全にキャプチャできないことが多い。
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクにおいて顕著な効果を示した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:46:12 GMT)
Rethinking Spiking Neural Networks from an Ensemble Learning Perspective [4.8] スパイキングニューラルネットワーク(SNN)はエネルギー効率が優れているが、限られた性能に悩まされている。
本稿では,SNNをアーキテクチャと重みを共有するテンポラルワークのアンサンブルとみなす。
我々は初期膜電位分布の整合性を促進し、膜電位の平滑化と時間的に隣接するサブネットワークガイダンスを通して出力する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:15:52 GMT)
Correcting Noisy Multilabel Predictions: Modeling Label Noise through Latent Space Shifts [4.8] ほとんどの現実世界の機械学習アプリケーションでは、データのノイズは避けられないように思える。
マルチラベル分類における雑音ラベル学習の分野について検討した。
我々のモデルは、雑音のラベル付けは潜伏変数の変化から生じると仮定し、より堅牢で有益な学習手段を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:41:52 GMT)
Quantum enhanced Monte Carlo simulation for photon interaction cross sections [4.8] 高エネルギー物理シミュレーションは伝統的に複雑な粒子相互作用をモデル化するモンテカルロ法に依存している。
本稿では、離散時間量子ウォークと量子振幅推定を統合した新しい量子拡張シミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:05:37 GMT)
Investigating the Impact of LLM Personality on Cognitive Bias Manifestation in Automated Decision-Making Tasks [4.7] パーソナリティ特性は、バイアスの増幅または減少において重要な役割を果たす。
良心と積極性は一般に偏見緩和戦略の有効性を高める可能性がある。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:15:54 GMT)
Analytic 3D vector non-uniform Fourier crystal optics in arbitrary $\bar{\bar{\varepsilon}}$ dielectric [4.6] 相互空間における固有解析と実空間における光場伝播の3つの広く用いられている平面波面の比較を行った。
複素線トレーシングに着想を得て、3$times$2遷移行列の明示的な形式を導出する。
我々は、円盤状、環状、三日月状のような形状に配置された無限特異点のような、実空間および相互空間における LCO の新しい領域を発見した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:52:44 GMT)
PFDiff: Training-Free Acceleration of Diffusion Models Combining Past and Future Scores [4.6] 拡散確率モデル(DPM)は画像生成において顕著な可能性を示している。
既存のほとんどのソリューションは、高速ODEソルバを提案することでサンプリングプロセスを加速する。
我々は、既存の高速ODEソルバを少ないNFEで動作させることができる新しいトレーニングフリーかつタイムステップスキッピング戦略であるPFDiffを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:21:01 GMT)
Bridging Text and Vision: A Multi-View Text-Vision Registration Approach for Cross-Modal Place Recognition [4.6] 位置認識タスクのためのテキストビジョン登録手法であるText4VPRを提案する。
Text4VPRは、画像のデータベースにマッチするテキスト記述のみを利用する。
私たちが作成したVPRデータセットをイメージする最初のテキストであるStreet360Locでは、Text4VPRが堅牢なベースラインを構築し、トップ1の精度が57%、トップ10の精度がテストセットの半径5m以内で92%に達した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:00:02 GMT)
MedVAE: Efficient Automated Interpretation of Medical Images with Large-Scale Generalizable Autoencoders [4.5] MedVAEは6つの大規模2Dおよび3Dオートエンコーダのファミリーで、医療画像の符号化を小型の潜伏表現として行うことができる。
MedVAE オートエンコーダを 1,052,730 個の医用画像を用いた新しい2段階トレーニング手法を用いて訓練する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:24:06 GMT)
DaBiT: Depth and Blur informed Transformer for Video Focal Deblurring [4.3] 多くの現実のシナリオでは、録画されたビデオは偶然の焦点がぼやけている。
本稿では、ビデオ焦点ずれの未解決作業に最適化されたフレームワークを提案する(再焦点)。
我々は、既存のビデオ復元方法よりも1.9dB以上のPSNR性能で、最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:15:23 GMT)
An Interpretable Machine Learning Approach to Understanding the Relationships between Solar Flares and Source Active Regions [4.3] 本稿では、二分分類問題に対処するためにランダムフォレスト(RF)モデルを用いる。
2011年から2021年にかけて、SolarMonitor.orgとXRTのフレアデータベースによって収集された観測データを用いて、太陽フレアと起源のARとの間の関係を分析する。
AR_Type_Today と Hale_Class_Yesterday の2つの特徴は,それぞれ最強かつ最短であることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:00:39 GMT)
Multiscale Byte Language Models -- A Hierarchical Architecture for Causal Million-Length Sequence Modeling [4.3] バイト言語モデル(BLM)はトークン化を克服するために登場したが、バイトストリームの過剰な長さは新しいアーキテクチャパラダイムを必要としている。
モデルに依存しない階層型デコーダスタックであるMultiscale Byte Language Model (MBLM)を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:31:50 GMT)
Using tournaments to calculate AUROC for zero-shot classification with LLMs [4.3] 大規模な言語モデルは、多くのゼロショット分類タスクで驚くほどよく機能する。
本稿では,バイナリ分類タスクをペアワイズ比較タスクに変換する手法を提案し,評価する。
繰り返しペアワイズ比較は、Eloレーティングシステムを使用してインスタンスのスコア付けに使用することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:13:20 GMT)
Herglotz-NET: Implicit Neural Representation of Spherical Data with Harmonic Positional Encoding [4.2] Inlicit Neural representations (INR) は、高忠実度データ表現の有望な代替手段として登場した。
Herglotz-NET(HNET)は、複雑なHerglotzマッピングに基づく高調波位置符号化を利用する新しいINRアーキテクチャである。
我々は,HNETを球面データの正確なモデリングのためのスケーラブルで柔軟なフレームワークとして確立した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:20:03 GMT)
STGCN-LSTM for Olympic Medal Prediction: Dynamic Power Modeling and Causal Policy Optimization [4.2] 本稿では,オリンピックのメダル分布を予測するための新しいハイブリッドモデル STCN-LSTM を提案する。
国家間の関係の強固さと国家パフォーマンスの長期的な依存関係を統合する。
結果は、コーチングのモビリティ、イベントの分散、そして戦略的投資がメダル予測に与える影響に光を当てた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:30:46 GMT)
Addressing Rotational Learning Dynamics in Multi-Agent Reinforcement Learning [4.2] 多エージェント強化学習(MARL)はエージェントの協力と競争を通じて複雑な問題を解決するための強力なパラダイムとして登場した。
この問題の一部は、競合するエージェントの目的から生じる回転最適化のダイナミクスに関連していることを示す。
既存のMARLアルゴリズムに回転力学を扱える勾配型VI法を統合するための一般的な手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:52:52 GMT)
Single-image Reflectance and Transmittance Estimation from Any Flatbed Scanner [4.2] そこで本研究では,シェーディングとスペキュラリティの両面を正確に除去する,本質的な画像分解にインスパイアされた手法を提案する。
我々は、不透明度と透過率を推定し、単一画像材料反射率キャプチャーに関する以前の研究を拡張した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:33:17 GMT)
Micro Blossom: Accelerated Minimum-Weight Perfect Matching Decoding for Quantum Error Correction [4.1] この研究は、Micro Blossomと呼ばれる、初めて公開されたMWPMデコーダを提示し、サブマイクロ秒のデコード遅延を実現する。
Micro Blossomは、最初のハードウェアアクセラレーションによる正確なMWPMデコーダであり、この文献で報告されているMWPMデコーダ実装の最高のレイテンシよりも0.8 mu s$のデコードレイテンシが8倍短い。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:08:55 GMT)
Evaluating The Explainability of State-of-the-Art Deep Learning-based Network Intrusion Detection Systems [4.1] 我々は、説明可能なAI(xAI)技術を用いて、最先端のDLベースNIDSモデルを解析する。
我々は、所定のNIDSモデルに対してxAIメソッド間で生成された説明と、与えられたxAIメソッドに対してNIDSモデル間で生成された説明とを比較した。
インダクティブバイアスに対する各NIDSモデルの脆弱性(トレーニングデータから学習した成果)を評価する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:54:28 GMT)
Tradutor: Building a Variety Specific Translation Model [4.0] ポルトガル語に特化された最初のオープンソース翻訳モデルを紹介します。
私たちの最良のモデルは、既存のポルトガル語のオープンソース翻訳システムを超えています。
データセット、モデル、コードを公開することにより、さらなる研究を支援し、奨励することを目指しています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:20:59 GMT)
EigenShield: Causal Subspace Filtering via Random Matrix Theory for Adversarially Robust Vision-Language Models [4.0] 視覚言語モデル(VLM)は、大規模言語モデル(LLM)の敵対的脆弱性を継承する。
敵の訓練、入力、検出を含む既存の防御は、計算コストが高く、アーキテクチャに依存し、適応攻撃に対して脆弱である。
我々は,高次元VLM表現における逆転破壊を定量化するためにランダム行列理論を利用した推定時防御法であるEigenShieldを紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:10:51 GMT)
Differentially Private Optimization for Non-Decomposable Objective Functions [3.9] 教師なし事前学習はコンピュータビジョンモデルと大規模言語モデルを開発するための一般的なステップである。
類似性に基づく損失関数のための新しいDP-SGD変異体を開発した。
提案手法は,非プライベートモデルに近い性能を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:19:42 GMT)
Lexical Complexity Prediction and Lexical Simplification for Catalan and Spanish: Resource Creation, Quality Assessment, and Ethical Considerations [3.9] 本稿では,スペイン語とカタルーニャ語における語彙単純化のための2つの新しいデータセットの記述と解析について述べる。
このデータセットは、カタルーニャにおける最初の種であり、自動語彙の単純化に関するスパースデータに実質的な追加である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:52:19 GMT)
ID policy (with reassignment) is asymptotically optimal for heterogeneous weakly-coupled MDPs [3.9] 弱結合マルコフ決定過程(WCMDP)の完全不均一な設定について検討する。
軽微な仮定では、IDポリシーの自然な適応は、元々はWCMDPの同質な特殊ケースとして提案されていたが、N$が大きくなるにつれて、腕ごとの平均報酬が1/sqrtNで$O (1/sqrtN)$の最適性ギャップを達成できることが示される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:25:14 GMT)
Combined Quantum and Post-Quantum Security for Earth-Satellite Channels [3.8] 実時間プロトタイプ量子鍵分布(QKD)システムの結果について述べる。
我々のシステムのユニークな側面は、QKDと既存の暗号手法を統合して、量子耐性セキュリティを確保することである。
我々の研究は、高度暗号化標準(AES)による量子後セキュリティと、絡み合いベースのQKDプロトコルによる量子セキュリティの両方を提供するBBM92プロトコルのデプロイを初めて実証した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:08:23 GMT)
TRUSWorthy: Toward Clinically Applicable Deep Learning for Confident Detection of Prostate Cancer in Micro-Ultrasound [3.8] 信頼性の高いPCa検出システムであるTRUSWorthyを提案する。
我々のパイプラインは、自己教師付き学習、トランスフォーマーを用いたマルチインスタンス学習集約、ランダムアンサンプブーピング、およびアンサンブルを統合している。
本手法は,従来の最先端のディープラーニング手法よりも精度と不確実性の校正に優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:31:24 GMT)
Verification of entangled states under noisy measurements [3.8] 絡み合いは多くの量子情報や量子計算タスクにおいて不可欠である。
近年、量子状態検証が注目されているが、このアプローチを実装する際のノイズ効果に対処する上での課題は未解決のままである。
本稿では,測定ノイズの存在下での量子状態検証プロトコルの性能を系統的に評価する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:32:50 GMT)
Low degree conjecture implies sharp computational thresholds in stochastic block model [3.8] 我々は(拡張)低次予想(対称ブロックモデルにおける[MW23]の最近の形式化)の影響について検討する。
我々は,Kesten-Stigum(KS)しきい値以下で,非リアルタイムアルゴリズムがコミュニティラベルを弱めに復元できることを確立した。
この結果から,ブロックモデルのパラメータの学習において,計算量と統計量との差があることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:21:03 GMT)
FLINT: Learning-based Flow Estimation and Temporal Interpolation for Scientific Ensemble Visualization [3.7] FLINTは、2D以上の時間と3D以上の科学的アンサンブルデータのフロー場を推定するための、新しいディープラーニングベースのアプローチである。
我々の知る限りでは、FLINTは科学的なアンサンブルからの流れを推定する最初のアプローチである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:07:20 GMT)
Sculpting [CLS] Features for Pre-Trained Model-Based Class-Incremental Learning [3.7] クラス増分学習は、古いクラスを忘れることなく、新しいクラスの知識を継続的に獲得するモデルを必要とする。
事前学習されたモデルは、クラス増分学習において強い性能を示してきたが、新しい概念を学ぶ際に破滅的な忘れをしがちである。
本稿では,新しいパラメータ効率の高い微調整モジュール「Learn and Calibrate」 (LuCA) を導入する。
各学習セッションで、最後のトークンの上にスパースLuCAモジュールをデプロイし、それを'Token-level Sparse and Adaptation'(TO)と呼ぶ。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:37:08 GMT)
Strongly-polynomial time and validation analysis of policy gradient methods [3.7] 本稿では,有限状態および行動マルコフ決定過程(MDP)と強化学習(RL)のための,優位ギャップ関数と呼ばれる新しい終了基準を提案する。
この利点ギャップ関数をステップサイズルールの設計に組み込むことで、最適ポリシーの定常状態分布に依存しない新しい線形収束率を導出する。
政策勾配法に対してそのような強い収束特性が確立されたのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:57:47 GMT)
Large Language Models for Patient Comments Multi-Label Classification [3.7] 本研究は,多ラベルテキスト分類(MLTC)におけるLLM(Large Language Models)の活用について検討する。
GPT-4 ターボは分類を行うために利用された。
プロンプトエンジニアリングフレームワークを使用することで、ゼロショット学習、インコンテキスト学習、チェーンオブ思考プロンプトを実験した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:42:01 GMT)
On the logical skills of large language models: evaluations using arbitrarily complex first-order logic problems [3.6] 複雑度を複数の次元に沿って制御できる一階述語論理文を生成する方法を提案する。
この手法を用いて、一階述語論理文の真偽や真偽を問う質問からなる複数のデータセットを自動生成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:18:24 GMT)
Lost in Space: Optimizing Tokens for Grammar-Constrained Decoding [3.6] 人間と意味的に類似した文法に体系的な違いがあるかどうかを問う。
4つのNLPベンチマークで5つのトークンフォーマットを持つ4つの人気のあるモデルファミリーをテストする。
すべてのモデルは、実数で分類するように指示されたときに最も正確に実行される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:06:18 GMT)
Analyze the Neurons, not the Embeddings: Understanding When and Where LLM Representations Align with Humans [3.4] この研究は、表現アライメントの研究に新しいアプローチを導入している。
我々は、特定の概念に責任を持つニューロンを特定するために、アクティベーションステアリングの研究からの手法を採用する。
その結果,LLM表現は行動データから推定される人間の表現と密接に一致していることが判明した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:08:03 GMT)
Testing GPT-4 with Wolfram Alpha and Code Interpreter plug-ins on math and science problems [3.4] GPT-4は、高校と大学レベルで、科学と数学の105のオリジナルの問題でテストされた。
以上の結果から,プラグインはGPTの問題解決能力を大幅に向上させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:16:06 GMT)
Adaptive Sparsified Graph Learning Framework for Vessel Behavior Anomalies [3.4] グラフニューラルネットワークは、正確なインタラクションを学習するための強力なツールとして登場した。
本稿では,エッジをタイムスタンプノードとしてモデル化した革新的なグラフ表現を提案する。
この設定は、グラフの間隔を保ちながら空間的相互作用をキャプチャするマルチシップグラフを構築するために拡張される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:01:40 GMT)
From Knowledge Generation to Knowledge Verification: Examining the BioMedical Generative Capabilities of ChatGPT [3.4] 本稿では LLM モデルが生成する生物医学的知識の事実的精度を体系的に評価する計算手法を提案する。
本研究のアプローチは, 疾患中心の関連性の生成と, バイオメディカル知識のセマンティック知識を用いた検証という2つのプロセスを含む。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:39:57 GMT)
Robust Information Selection for Hypothesis Testing with Misclassification Penalties [3.3] ベイズ仮説テスト/分類課題におけるロバストな情報選択の問題について検討する。
目的は、選択された情報ソースからの観測に基づいて、有限の仮説から世界の真の状態を特定することである。
異なる誤分類事象を一様に扱える新しい誤分類罰枠組みを導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:05:27 GMT)
Building reliable sim driving agents by scaling self-play [3.3] 1つのGPUでスクラッチからトレーニングすることで、エージェントは1日以内に完全なトレーニングセットを解決します。
彼らは効果的にテストシーンを見えないように一般化し、99.8%のゴール達成率と0.8%以下の衝突とオフロードインシデントを達成した。
事前訓練されたエージェントと完全なコードベースの両方をオープンソースにしています。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:30:45 GMT)
OrchardDepth: Precise Metric Depth Estimation of Orchard Scene from Monocular Camera Images [3.3] 果樹園環境における単眼カメラのメートル法深度推定のギャップを埋めるOrchardDepthを提案する。
さらに,深度マップとスパースポイント間の一貫した正規化をモニタリングすることにより,トレーニング結果を改善するための新たなトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:40:56 GMT)
Synth It Like KITTI: Synthetic Data Generation for Object Detection in Driving Scenarios [3.3] 本稿では,LiDAR点雲上での3次元物体検出のためのCARLAシミュレータに基づくデータセット生成パイプラインを提案する。
我々は、合成データに基づいてオブジェクト検出器を訓練し、KITTIデータセットに強力な一般化能力を示すことができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:27:42 GMT)
Optimal Local Measurements in Single-Parameter Quantum Metrology [3.2] 局所測定(LM)によるQCRB(Quantum Cram'er-Rao Bound)の実現可能性について検討する。
純粋量子ビットに対しては、パラメータ推定モデルがLMを介してQCRBを達成できるかどうかを判断するために必要な2つの方法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:11:43 GMT)
MACPruning: Dynamic Operation Pruning to Mitigate Side-Channel DNN Model Extraction [3.2] 我々は、DMAベースのパラメータ抽出攻撃に対する新しい軽量防御であるMACPruningを紹介する。
エッジデバイス上でのDNNのための各種データセット上でのMACP実行の総合的なセキュリティ解析を行う。
評価の結果,MACP実行はモデル精度と無視可能な計算オーバーヘッドに最小限の影響を伴って,EMリークを効果的に低減することが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:14:53 GMT)
A Note on Quantum Divide and Conquer for Minimal String Rotation [3.1] 語彙的に最小限の弦の回転は、弦処理の基本的な問題である。
この問題を解決するために、準最適量子アルゴリズムが提案されている。
量子クエリの複雑性は$sqrtn cdot 2O(sqrtlog n)$であることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:04:15 GMT)
Signature Methods in Machine Learning [2.9] 署名に基づく技術は、進化するデータの複雑なストリーム間の相互作用に関する数学的洞察を与える。
この記事では、シグネチャによって提供される理論的洞察が、アプリケーションデータの解析において単純に実現される方法について説明する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:44:23 GMT)
Graph in the Vault: Protecting Edge GNN Inference with Trusted Execution Environment [2.9] エッジデバイスへの機械学習モデルの広範な展開は、モデル知的財産権(IP)とデータプライバシを脆弱なものにしている。
我々は,Trusted Execution Environment(TEE)に基づく最初のセキュアグラフニューラルネットワーク(GNN)デプロイメント戦略であるGNNVaultを提案する。
GNNVaultは、信頼できない劣化精度で、最先端のリンク盗難攻撃に対するGNN推論を保護している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:09:14 GMT)
CaRtGS: Computational Alignment for Real-Time Gaussian Splatting SLAM [2.9] リアルタイムガウス切削SLAM(CaRtGS)の計算アライメントについて紹介する。
CaRtGSは、リアルタイム環境における光リアルなシーン再構築の効率性と品質を向上させる新しい手法である。
本手法は適応戦略によりガウススティングSLAM(GS-SLAM)の計算ミスアライメントに対処する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:14:13 GMT)
Multi-scale Topology Optimization using Neural Networks [2.8] 長年の課題は、細胞間の良好な接続性を備えたマルチスケール構造を設計することである。
ニューラルネットワークを用いた直接マルチスケールトポロジ最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:25:27 GMT)
Judging It, Washing It: Scoring and Greenwashing Corporate Climate Disclosures using Large Language Models [2.8] 本研究では, LLM-as-a-Judge(LLMJ)手法を用いて, 排出削減目標および進捗状況の企業からの報告を評価する。
精度と長さの制約を考慮した応答をグリーンウォッシュするよう促されたLLMの挙動を探索する。
2つのLCMJスコアリングシステム(数値評価とペア比較)がハイパフォーマンスな企業と他社を区別するのに有効であることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:23:45 GMT)
A domain decomposition-based autoregressive deep learning model for unsteady and nonlinear partial differential equations [2.8] 非定常・非線形偏微分方程式(PDE)を正確にモデル化するためのドメイン分割型ディープラーニング(DL)フレームワークCoMLSimを提案する。
このフレームワークは、(a)畳み込みニューラルネットワーク(CNN)ベースのオートエンコーダアーキテクチャと(b)完全に接続された層で構成される自己回帰モデルという、2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:56:57 GMT)
Preordering: A hybrid of correlation clustering and partial ordering [2.8] プレオーダーは、$-1,0,1$の値であってもNPハードのままであることを示す。
線形時間 4$-approximation アルゴリズムと局所探索手法を導入する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:12:03 GMT)
Obliviate: Efficient Unmemorization for Protecting Intellectual Property in Large Language Models [2.7] AI企業とコンテンツクリエーター間の最近の著作権協定は、著作権付きコンテンツを再現する言語モデルの能力を正確に制御する必要性を強調している。
Obliviateは,意味理解を保ちながら,特定のテキストの音声再生を選択的に防止する手法である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:02:56 GMT)
On the effects of similarity metrics in decentralized deep learning under distributional shift [2.7] 分散学習(DL)は、組織やユーザ間のプライバシー保護コラボレーションを可能にする。
本稿では,モデルマージのためのピア識別のためのDLにおける様々な類似度指標の有効性について検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:29:18 GMT)
Monomer-dimer tensor-network basis for qubit-regularized lattice gauge theories [2.6] 伝統的な$mathrmSU(N)$格子ゲージ理論(LGTs)は、$mathrmSU(N)$ゲージ対称性の既約表現(英語版)(irreps)$V_lambda$から構築された正則基底を用いて定式化することができる。
ここでは、簡単なqubit-regularized $mathrmSU(2)$および$mathrmSU(3)$ gauge理論における有限温度閉じ込め分解遷移について検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:06:39 GMT)
DomainDynamics: Lifecycle-Aware Risk Timeline Construction for Domain Names [2.6] DomainDynamicsは、ライフサイクル段階を考慮してドメイン名のリスクを予測するように設計された新しいシステムである。
マルウェアやフィッシングインシデントから85,000以上の実際の悪意のあるドメインを含む実験で、DomainDynamicsは82.58%の検出率を獲得し、偽陽性率は0.41%だった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:16:08 GMT)
Generalization Error of $f$-Divergence Stabilized Algorithms via Duality [2.6] 制限付き最適化問題に対して、$f$-divergence regularization (ERM-$f$DR)による経験的リスク最小化の解が拡張される。
ERM-$f$DRの双対定式化を導入し、ERM-$f$DR解の正規化関数を導出する計算効率の良い方法を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:21:01 GMT)
Enhancing Conversational Agents with Theory of Mind: Aligning Beliefs, Desires, and Intentions for Human-Like Interaction [2.6] オープンソースの言語モデル(LLaMA)は、ToM関連の情報をキャプチャして保存することができる。
ToM関連成分(信念、欲求、意図など)の明示的な操作が、応答アライメントを高めることができるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:39:05 GMT)
Rainbow chains and numerical renormalisation group for accurate chiral conformal spectra [2.6] 指数的に減衰する項を持つ共形臨界鎖の絡み合いスペクトルは、関連するキラルCFTの共形塔からなることを示す。
これらの絡み合いスペクトルは、親ハミルトニアンにアクセスすることなく単一波動関数から詳細なCFTスペクトルを抽出する信頼性の高い方法を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:25:46 GMT)
Think Together and Work Better: Combining Humans' and LLMs' Think-Aloud Outcomes for Effective Text Evaluation [2.5] 本研究では,人間の専門知識とLarge Language Models(LLM)を統合するフレームワークであるtextbfInteractEvalを紹介する。
このフレームワークはThink-Aloud(TA)メソッドを使用して、チェックリストベースのテキスト評価の属性を生成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:35:45 GMT)
Effects of Prompt Length on Domain-specific Tasks for Large Language Models [2.5] 大規模言語モデルは、様々な自然言語タスクにおける強力なパフォーマンスに対して、大きな注目を集めている。
本稿では,モデル設計がドメイン固有タスクの実行能力にどのように影響するか,という研究ギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:42:06 GMT)
Towards Physics-Guided Foundation Models [2.5] 物理誘導基礎モデル(PGFM)の表記法を提案する。
PGFMは、幅広いダウンストリームタスクに適用可能な広範囲または一般的な(科学的な)物理知識と統合された基礎モデルである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:10:22 GMT)
MAGNNET: Multi-Agent Graph Neural Network-based Efficient Task Allocation for Autonomous Vehicles with Deep Reinforcement Learning [2.5] 本稿では,グラフニューラルネットワーク(GNN)を一元的トレーニングと分散実行(CTDE)パラダイムに統合する新しいフレームワークを提案する。
本手法により,無人航空機 (UAV) と無人地上車両 (UGV) は, 中央調整を必要とせず, 効率よくタスクを割り当てることができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:14:41 GMT)
Revisiting In-context Learning Inference Circuit in Large Language Models [2.5] In-context Learning (ICL) は、言語モデル(LM)の内的メカニズムを探索せずに学習する、新たな数発学習パラダイムである。
本稿では、推論力学をモデル化し、ICLの観測現象を説明するための包括的回路を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:58:28 GMT)
Affinity and Diversity: A Unified Metric for Demonstration Selection via Internal Representations [2.5] 我々は、ICLモデルの内部表現を活用する統一されたメートル法-親和性と多様性-を提案する。
実験の結果,親和性と多様性は試験精度と強く相関し,実演選択の有効性が示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:12:51 GMT)
MambaPlace:Text-to-Point-Cloud Cross-Modal Place Recognition with Attention Mamba Mechanisms [2.5] 視覚言語位置認識(VLVPR)は、画像から自然言語記述を組み込むことで、ロボットのローカライズ性能を向上させる。
言語情報を利用することで、VLVPRはロボットの位置マッチングを指示し、視覚のみに依存する制約を克服する。
本稿では,MambaPlace と呼ばれる相互接続型位置認識フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:50:16 GMT)
An Entropic Metric for Measuring Calibration of Machine Learning Models [2.5] ECDがバイナリ分類機械学習モデルにどのように適用されるかを示す。
我々の基準は過信と過信を区別する。
我々は、この新しいメトリクスが実データやシミュレーションデータでどのように機能するかを実証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:21:18 GMT)
Is Q-learning an Ill-posed Problem? [2.4] 本稿では,連続環境におけるQ-ラーニングの不安定性について検討する。
比較的単純なベンチマークでも、Q-ラーニングの基本課題は本質的に悪用され、失敗しがちであることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:42:30 GMT)
CER: Confidence Enhanced Reasoning in LLMs [2.4] 本稿では,大規模言語モデル応答の精度向上を目的とした不確実性認識フレームワークを提案する。
数理推論における数値結果や開領域生成における固有名詞などの中間回答の信頼度を定量化する。
その結果,新しい信頼度集計法の有効性を一貫して検証した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:16:42 GMT)
Robust Classification of High-Dimensional Data using Data-Adaptive Energy Distance [2.4] 高次元低サンプルサイズ(HDLSS)データの分類は、様々な現実の状況において課題となる。
本稿では,HDLSSデータ用に特別に設計された分類器の開発と解析について述べる。
比較的一般的な条件下では、HDLSS系では完全な分類が得られることが示されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:35:41 GMT)
Design of a Microprocessors and Microcontrollers Laboratory Course Addressing Complex Engineering Problems and Activities [2.4] 本稿では,マイクロプロセッサとマイクロコントローラの新たなカリキュラムを提案する。
提案カリキュラムは、複雑な工学的問題や活動に対処するため、構造化実験とオープンなプロジェクトフェーズをブレンドする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:28:21 GMT)
GenAI vs. Human Fact-Checkers: Accurate Ratings, Flawed Rationales [2.3] GPT-4oは、消費者向けアプリケーションでもっとも使われているAIモデルの一つで、他のモデルよりも優れているが、すべてのモデルは、人間のコーダーとの適度な合意しか示さない。
また,要約コンテンツと完全コンテンツ入力の有効性を評価し,要約コンテンツが精度を犠牲にすることなく効率を向上させることを約束していることを確認した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:47:40 GMT)
DeepFracture: A Generative Approach for Predicting Brittle Fractures with Neural Discrete Representation Learning [2.3] 本稿では,実行時の衝突動力学に基づくフラクチャー形状予測のための新しい学習手法を提案する。
本手法は, 現実的な脆性破壊アニメーションと剛性体シミュレーションをシームレスに統合し, 境界要素法(BEM)の脆性破壊シミュレーションを用いてトレーニングデータを生成する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:06:03 GMT)
Model agnostic local variable importance for locally dependent relationships [2.3] 局所変数の重要度を計算するためのモデルに依存しない新しい手法であるCLIQUEを提案する。
変数が応答に影響しない領域において,CLIQUEは局所的依存情報を強調し,バイアスを適切に低減することを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:05:21 GMT)
Entanglement entropy evolution during gravitational collapse [2.3] オッペンハイマー・スナイダー崩壊距離内を伝播する離散化されたスカラー場に対する基底状態絡み合いエントロピーのダイナミクスについて検討した。
絡み合いエントロピーは崩壊時に非自明なスケーリングと時間依存性を示す。
このモデルは理想化されているが、これらの結果は現実的で動的に進化する重力場の存在下での絡み合いの生成とスケーリングに関する洞察を与える。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:18:16 GMT)
Enhancing Portuguese Variety Identification with Cross-Domain Approaches [2.3] ヨーロッパとブラジルのポルトガル語を識別するクロスドメイン言語バラエティ識別子(LVI)を開発した。
この研究はポルトガルの2つの品種に焦点を当てているが、我々の貢献は他の品種や言語にも拡張できる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:31:48 GMT)
NeRF-3DTalker: Neural Radiance Field with 3D Prior Aided Audio Disentanglement for Talking Head Synthesis [2.3] トーキングヘッド合成は,音声を用いた唇同期音声ヘッドビデオの合成である。
発声頭部合成のための3次元先行支援オーディオディスタングルを用いたニューラルラジアンス場(NeRF-3DTalker)を提案する。
具体的には,3次元事前情報を用いて,自由視点で明瞭な音声頭部を合成する手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:16:11 GMT)
UniASM: Binary Code Similarity Detection without Fine-tuning [2.2] モデルがバイナリコードの複雑なニュアンスをキャプチャすることを保証するために,新しいリッチ・セマンティック関数表現手法を提案する。
新たに設計された2つのトレーニングタスクを含むUniASMという,UniLMベースのバイナリコード埋め込みモデルを紹介した。
実験の結果,UniASMは評価データセットに対する最先端(SOTA)アプローチよりも優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:49:49 GMT)
Use of a Structured Knowledge Base Enhances Metadata Curation by Large Language Models [2.2] メタデータは、データセットの発見可能性、アクセシビリティ、相互運用性、再利用性を保証する上で重要な役割を果たす。
本稿では,メタデータ標準への準拠性を改善するため,大規模言語モデル (LLM) の可能性について検討する。
NCBI BioSampleレポジトリの肺がん関連サンプルを無作為に記録した200データについて実験を行った。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:57:27 GMT)
Probabilistic Robustness in Deep Learning: A Concise yet Comprehensive Guide [2.2] 確率的堅牢性(PR)は、摂動下での失敗の可能性を定量化することによって、より実践的な視点を提供する。
本稿では,その形式的定義,評価,拡張手法を網羅した,簡潔かつ包括的なPRの概要を提供する。
本稿では,PR検証証拠をシステムレベルの安全性保証に統合し,DLモデルレベルの堅牢性をシステムレベルの請求に翻訳する上での課題に対処する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:47:17 GMT)
Port-Hamiltonian Neural Networks with Output Error Noise Models [2.1] ハミルトニアンニューラルネットワーク(HNN)は物理インフォームドディープラーニング手法の有望なクラスである。
工学系への直接的応用は、外部入力の存在、散逸、騒音測定など、実用的な問題によってしばしば問題視される。
本稿では,これらの実生活要因に対処するHNNの能力を高める新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:33:21 GMT)
SEA-HELM: Southeast Asian Holistic Evaluation of Language Models [2.1] SEA-HELMは、東南アジア(SEA)地域の言語に対する包括的で信頼性の高い評価スイートである。
1)NLPクラシック、(2)LDM特化、(3)SEA言語学、(4)SEA文化、(5)安全の5つの中核柱から構成される。
SEA-HELMは現在、フィリピン、インドネシア、タミル、タイ、ベトナムをサポートしている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:32:45 GMT)
DGNN-YOLO: Interpretable Dynamic Graph Neural Networks with YOLO11 for Small Occluded Object Detection and Tracking [2.1] 本稿では,動的グラフニューラルネットワーク(DGNN)とYOLO11を統合し,制約に対処する新しいフレームワークであるDGNN-YOLOを紹介する。
標準のGNNとは異なり、DGNNはグラフ構造をリアルタイムで動的に更新する優れた能力のために選択される。
このフレームワークはグラフ表現を構築し、定期的に更新し、ノードとしてオブジェクトをキャプチャし、エッジとして相互作用する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:34:39 GMT)
Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.1] 本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:49:55 GMT)
Are DeepSeek R1 And Other Reasoning Models More Faithful? [2.0] 我々は,Qwen-2.5,Gemini-2,DeepSeek-V3-Baseの3つの推論モデルを評価する。
MMLU質問に対する解答に、その解答がどう影響するかをモデルで記述できるかどうかを検証する。
推論モデルは、テストされたすべての非推論モデルよりもはるかに確実にそれらに影響を与えるキューを記述する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:48:34 GMT)
P-SpikeSSM: Harnessing Probabilistic Spiking State Space Models for Long-Range Dependency Tasks [2.0] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワークに代わる計算効率が高く生物学的に妥当な代替品として提案されている。
長距離依存タスクのためのスケーラブルな確率的スパイク学習フレームワークを開発した。
我々のモデルは、様々な長距離依存タスクにまたがるSNNモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:44:10 GMT)
Weighted Low-rank Approximation via Stochastic Gradient Descent on Manifolds [2.0] 多様体上の閉包を許容する勾配降下に対する収束に基づくリトラクション定理を確立する。
このアルゴリズムはユークリッド空間上の既存の勾配勾配よりも優れる。
また、この多様体上の加速線探索とユークリッド空間上の既存の加速線探索を比較する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:59:50 GMT)
WENDy for Nonlinear-in-Parameters ODEs [2.0] WEN(Wak-form Estimation of Non-linear Dynamics)は、非線形インである通常の微分方程式の系に対応するために拡張される。
提案手法の実用的メリットを実証するために,一連のベンチマークシステムに結果を提示する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:25:20 GMT)
MergePrint: Merge-Resistant Fingerprints for Robust Black-box Ownership Verification of Large Language Models [1.9] モデルマージを継続することのできる頑健な指紋を埋め込むための新しいフィンガープリント手法であるMergePrintを提案する。
MergePrintはブラックボックスのオーナシップの検証を可能にする。モデルが特定の指紋入力に対してターゲット出力を生成するかどうかのみを所有者が確認する必要がある。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:04:57 GMT)
LXLv2: Enhanced LiDAR Excluded Lean 3D Object Detection with Fusion of 4D Radar and Camera [1.8] 本稿では,LXLv2を提案する。
本研究では,レーダポイントによる1対多の深度監視戦略を考案し,オブジェクトレベルの深度整合性に対する監視領域の調整を行う。
View-of-DelftとTJ4DRadSetデータセットの実験結果から、提案したLXLv2は検出精度、推論速度、ロバスト性においてLXLより優れていることが示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:31:24 GMT)
Understanding the Design Principles of Link Prediction in Directed Settings [1.7] リンク予測はグラフ表現学習(GRL)において広く研究されている課題である
本稿では,非方向設定で成功したキーキャパシティを評価することで,リンクの方向予測の課題に焦点をあてる。
本稿では,これらを有向リンク予測タスクに簡易かつ効果的に適応させ,これらの修正によって競争性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:01:35 GMT)
Enhancing Smart Environments with Context-Aware Chatbots using Large Language Models [1.7] 本研究は,Large Language Models(LLM)を活用してユーザエクスペリエンスを向上させる,スマート環境内のコンテキスト認識インタラクションのための新しいアーキテクチャを提案する。
本システムでは,UWBタグやセンサ付きスマートホームから得られたユーザ位置情報を,リアルタイムなヒューマンアクティビティ認識(HAR)と統合し,ユーザコンテキストの包括的理解を提供する。
その結果,LLMとリアルタイムのアクティビティと位置情報を統合することで,個人化されたコンテキストに関連のあるユーザエクスペリエンスを提供するという大きなメリットが浮き彫りになった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:46:51 GMT)
A unified framework of unitarily residual measures for quantifying dissipation [1.7] 本稿では,量子力学の非単位成分を分離して散逸を定量化するためのフレームワークを提案する。
我々の結果は、オープン量子系における散逸を定量化する強力なツールを提供し、量子熱力学の理解を深める。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:40:15 GMT)
Hilbert's projective metric for functions of bounded growth and exponential convergence of Sinkhorn's algorithm [1.6] 我々は、有界成長の可積分函数の空間に対するヒルベルトの射影距離のバージョンを研究する。
カーネル積分作用素は、そのようなメトリクスの適切な仕様に関して収縮であることを示す。
エントロピック最適輸送への応用として、境界分布が十分に光尾を持つ設定においてシンクホーンのアルゴリズムの指数収束性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:20:43 GMT)
Optimal resource requirements for connected quantum sub-networks [1.6] この研究は、量子サブネットワークを接続することで大きな量子ネットワークを構築するためのスケーラブルなアプローチを説明する。
しきい値を満たす平均ネットワークパラメータの最適値を与える方程式の集合を導出する。
その結果,グローバルな量子インターネットを形成するために相互接続された量子サブネットワークにおいて,最適なリソース要求を計算する経路が提示された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:20:55 GMT)
Predicting Fetal Birthweight from High Dimensional Data using Advanced Machine Learning [1.5] 出生体重は新生児の健康の基本的な指標であり、医療介入や長期の発達リスクと密接に関連している。
伝統的な予測モデルは、しばしば限られた特徴選択と不完全なデータセットによって制約され、複雑な母体と胎児の相互作用を見渡すのに苦労する。
本研究は,先進的な計算戦略を統合した構造化手法を用いて,これらの制約に対処するための機械学習について検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:17:39 GMT)
Optimizing Maximally Entangled State Generation via Pontryagin's Principle [1.5] 両部量子系における最大絡み合った状態を生成するための最適制御法を提案する。
我々は、最小時間で絡み合い(特に共起)を最大化する時間依存制御場を導出する。
この戦略はシミュレーションによって数値的に検証され、最初の摂動分離状態から最大絡み合ったターゲット状態へとシステムを駆動する能力を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:34:16 GMT)
Reliable Explainability of Deep Learning Spatial-Spectral Classifiers for Improved Semantic Segmentation in Autonomous Driving [1.5] ハイパースペクトル画像(HSI)とディープニューラルネットワーク(DNN)は、インテリジェントビジョンシステムの精度を高めることができる。
このような安全クリティカルシステムの研究を進めるためには、複雑なDNNの出力に対するスペクトル情報の正確な寄与を決定する必要がある。
入力特徴と予測の関係をよりよく把握するために、関連するDNN層からのアクティベーションと重みによるデータを活用する方法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:11:27 GMT)
Emergence of the Primacy Effect in Structured State-Space Models [1.5] 人工ニューラルネットワーク(ANN)モデルは通常、時間とともに単調に崩壊するメモリで設計される。
構造化状態空間モデル(Structured state-space model)と呼ばれる最近開発されたANNアーキテクチャは、トレーニングと評価の際、予備効果を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:51:22 GMT)
Online hand gesture recognition using Continual Graph Transformers [1.4] リアルタイムスケルトンシーケンスストリーミングのための新しいオンライン認識システムを提案する。
提案手法は最先端の精度を実現し, 偽陽性率を大幅に低減し, リアルタイムアプリケーションにとって魅力的なソリューションとなる。
提案システムは,人間とロボットのコラボレーションや補助技術など,さまざまな領域にシームレスに統合することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:27:55 GMT)
A Note on Efficient Privacy-Preserving Similarity Search for Encrypted Vectors [1.4] 従来のベクトル類似性探索手法では、完全同型暗号(FHE)を用いて復号化せずに計算が可能であった。
この研究は、より効率的な代替手段を探究する: プライバシー保護類似性検索に加法的同型暗号(AHE)を使用する。
本稿では,AHE で暗号化された類似性探索のアルゴリズムを提案し,そのエラーの増大とセキュリティへの影響を解析する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:07:04 GMT)
Meshless Shape Optimization using Neural Networks and Partial Differential Equations on Graphs [1.4] 我々は、ニューラルネットワークを利用してレベルセット関数をパラメータ化し、グラフラプラシアンを用いて基礎となるPDEを近似する、完全なメッシュレスなレベルセットフレームワークを提案する。
提案手法は,曲面正規度や曲率などの幾何量の正確な計算が可能であり,凸形状のクラス内での最適化問題に対処することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:42:27 GMT)
Disentangled Graph Autoencoder for Treatment Effect Estimation [1.4] 本稿では,ネットワーク化された観測データに対する処理効果推定のための非交叉変分グラフオートエンコーダを提案する。
我々のグラフエンコーダは、潜伏因子を、ヒルベルト・シュミット独立基準を用いて因子独立を強制しながら、楽器的、障害的、調整的、ノイズ的な要因に分解する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:43:15 GMT)
Enhancing Pavement Sensor Data Acquisition for AI-Driven Transportation Research [1.2] 本稿では,交通センサデータ管理のための包括的ガイドラインを提案する。
アーカイブされた静的データとリアルタイムデータストリームの両方をカバーする。
この提案は、I-65とI-69グリーンフィールドを含むINDOTの現実世界のケーススタディに適用された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:37:46 GMT)
MedFuncta: Modality-Agnostic Representations Based on Efficient Neural Fields [1.2] 我々は、ニューラルネットワークに基づくモダリティに依存しない連続データ表現であるMedFunctaを紹介する。
医療信号の冗長性を利用して、単一インスタンスから大規模データセットにニューラルネットワークをスケールする方法を実証する。
我々は、この方向の研究を促進するために、 > 550kの注釈付きニューラルネットワークの大規模なデータセットをリリースする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:38:13 GMT)
Taming Recoil Effect in Cavity-Assisted Quantum Interconnects [1.2] リモート・エンタングルメント・ジェネレーション・プロトコルにおける動作誘起不忠実性を評価するための解析モデルを構築した。
この結果は,スケーラブルなトラップ原子量子ビットシステムによるフォールトトレラント量子ネットワークへの具体的な経路を確立する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:59:11 GMT)
Curiosity Driven Multi-agent Reinforcement Learning for 3D Game Testing [1.2] cMarlTestは好奇心駆動型マルチエージェント強化学習(MARL)による3Dゲームテストのためのアプローチ
我々は,cMarlTestの性能を1つのエージェントRL変種と比較する3Dゲームの異なるレベルについて実験を行った。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:43:46 GMT)
P2W: From Power Traces to Weights Matrix -- An Unconventional Transfer Learning Approach [1.1] チップ(SoC)上に組み込みシステムに機械学習モデル(ML)をデプロイすることの急速な成長は、ヘルスケアや自動運転車といった分野に変革をもたらした。
このような組み込みMLモデルをトレーニングする上での大きな課題のひとつは、公開可能な高品質なトレーニングデータがないことだ。
本稿では,既存のMLモデルから重みを抽出し,使用することにより,新しいMLモデルをトレーニングするための,新しい非従来型トランスファー学習手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:05:28 GMT)
Designing Parameter and Compute Efficient Diffusion Transformers using Distillation [1.1] 数十億のモデルパラメータを持つ拡散変換器(DiT)は、DALL.E、Stable-Diffusion、SORAのような一般的な画像およびビデオ生成モデルのバックボーンを形成する。
DiTは、膨大な計算複雑性のため、リソース制約のあるエッジデバイスにデプロイすることはできない。
本研究では, 設計ノブ(深さ, 幅, 注意ヘッド, 蒸留設備など)をDiTで選択するための原則を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:40:02 GMT)
From Bugs to Breakthroughs: Novice Errors in CS2 [1.1] CS2講座の学生がその後のプログラミング課題で行った誤りを縦断的に調査した。
確立されたエラーフレームワークの修正版に基づいて、710のエラーを手動で分類した。
学生はプログラミング言語を学ぶのに少しだけ苦労していますが、プログラミング言語の概念を理解し表現するのにより多くの時間が必要です。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:41:44 GMT)
Perfect Wave Transfer in Continuous Quantum Systems [1.0] 本研究では,連続系における情報伝達の完全性について検討する。
共形不変性を持つ系と、そうでない系との間には顕著な違いがある。
我々の結果は相互作用を持つ理論にまで拡張され、より一般的な量子システムへの完全な情報伝達の範囲を広げる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:32:23 GMT)
Crosstalk Analysis in Quantum Networks: Detection and Localization Insights with photon counting OTDR [0.9] ミリワット以下の古典チャネル電力から量子チャネルへのクロストークは、量子ネットワーク開発において大きな課題となる。
光子計数光時間領域反射法(nu-OTDR)によるクロストークの同定と位置同定を行った。
この研究はクロストークに対処するための基礎的なアプローチを確立し、より堅牢で効率的な量子ネットワーク設計への道を開いた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:02:48 GMT)
A Statistical Case Against Empirical Human-AI Alignment [0.9] 実証的な人間-AIアライメントは、AIシステムを観察された人間の行動に合わせて動作させることを目的としている。
経験的アライメントは、注意を喚起する統計的バイアスを必然的に導入する可能性があると我々は主張する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:12:18 GMT)
Blockchain-based Framework for Scalable and Incentivized Federated Learning [0.8] フェデレートラーニング(FL)は、生データを共有せずに協調的なモデルトレーニングを可能にし、分散データセットを活用しながらプライバシを保存する。
従来のFLシステムは、信頼の問題や単一障害点の導入、有意義なクライアントコントリビューションのインセンティブの制限といった、集中的な集約メカニズムに依存しています。
本稿では、スマートコントラクトと新しいハイブリッドインセンティブ機構を統合することにより、これらの制限に対処するブロックチェーンベースのFLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:38:35 GMT)
Tabular Embeddings for Tables with Bi-Dimensional Hierarchical Metadata and Nesting [0.7] テーブル内の複雑な2次元コンテキストの複雑さを符号化するために最適化された新しい特殊埋め込みを導入する。
我々の解は、最大0.28のMAPデルタで最先端のモデルより優れている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:04:11 GMT)
Generative adversarial networks vs large language models: a comparative study on synthetic tabular data generation [0.7] 本研究では,タスク固有の微調整や,事前学習のための実世界のデータへのアクセスを必要とせずに,高品質な表形式データを生成する能力を示す。
GPT-4oをベンチマークするために、LLM生成合成データの忠実度とプライバシを条件付き生成対向ネットワーク(CTGAN)で生成されたデータと比較した。
ゼロショットアプローチにもかかわらず、GPT-4oは保存手段においてCTGANよりも優れ、95%の信頼区間、二変量相関、RWDのデータプライバシが増幅されたサンプルサイズでも優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:56:16 GMT)
Assessing Vulnerability in Smart Contracts: The Role of Code Complexity Metrics in Security Analysis [0.7] 本研究は,Solidityスマートコントラクトにおける脆弱性のあるコードの指標として,コード複雑性メトリクスを使用することを検討する。
21の複雑性メトリクスを分析して、それらの相互関係、脆弱性との関連性、識別力、および脆弱性と中立なコードの平均値を検討した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:45:52 GMT)
FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis [0.7] FetalCLIPは胎児超音波画像の普遍的な表現を生成できる視覚言語基盤モデルである。
テキストと組み合わせた210,035個の胎児超音波画像から,マルチモーダル・ラーニング・アプローチを用いて事前訓練を行った。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:30:34 GMT)
DPM-Bench: Benchmark for Distributed Process Mining Algorithms on Cyber-Physical Systems [0.7] 本稿では分散プロセスマイニングアルゴリズムの比較のためのDPM-Benchベンチマークを紹介する。
その結果、情報システム技術者は、既存のインフラが分散プロセスマイニングを行うのに十分かどうかを評価することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:47:09 GMT)
Squashed quantum non-Markovianity: a measure of genuine quantum non-Markovianity in states [0.7] 我々は、スクアッシュ量子非マルコフ性(sQNM)と呼ばれる真の量子起源の非マルコフ性に対する忠実な尺度を提案する。
これは量子条件の相互情報に基づいており、全ての非量子寄与を排除した後、左上非マルコビアン性によって定義される。
sQNMは単ガム性, 連続性, 凸性, テンソル積状態への添加性, 一般に超添加性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:49:07 GMT)
Feedback-Based Quantum Strategies for Constrained Combinatorial Optimization Problems [0.7] 我々は、フィードバックベースの量子アルゴリズムフレームワークを拡張し、無効な設定(IC)制約と呼ばれるより広範な制約のクラスに対処する。
本稿では、スラック変数を必要とせずに直接IC制約に対処する、フィードバックベースの量子アルゴリズムに適した代替手法を提案する。
これらの方法はスラック変数の必要性を排除し、量子回路の深さと必要な量子ビットの数を大幅に削減する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:57:28 GMT)
Statistical Scenario Modelling and Lookalike Distributions for Multi-Variate AI Risk [0.7] シナリオモデリングがAIリスクを全体論的にモデル化する方法について説明する。
直接観測可能なデータがない場合にAIの影響を推定するために、AIに類似した現象からの見た目上の分布がどのように使用できるかを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:14:54 GMT)
Optimizing Continuous-Wave Pumped Entanglement-based QKD in Noisy Environment [0.6] 量子鍵分布(QKD)は、量子コンピュータの脅威から暗号システムを保護するための有望なソリューションとして登場した。
本稿では,検出タイミングの不確実性(ジッタ)を含むQKDシステムパラメータに対する極端雑音の影響について検討する。
これらのパラメータの変化は、ノイズの多い環境でのシステム性能を決定する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:45:14 GMT)
"Don't Forget the Teachers": Towards an Educator-Centered Understanding of Harms from Large Language Models in Education [0.6] 教育技術(教育技術)は、大規模言語モデル(LLM)上に構築された新しい機能をますます取り入れつつある
LLMベースのedtechの下流への影響については、まだ検討されていない。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:27:24 GMT)
Time-adaptive single-shot crosstalk detector on superconducting quantum computer [0.6] 量子クロストーク(quantum crosstalk)は、量子プロセッサにおけるノイズやエラーの主な原因である。
クロストークによる摂動を増幅するために、オブザーバ量子ビットと多重量子コヒーレンスを利用する時間適応検出法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:39:55 GMT)
A projected nonlinear state-space model for forecasting time series signals [0.6] 本稿では,ノイズのある時系列データから非線形ダイナミクスを学習し,予測する高速アルゴリズムを提案する。
提案モデルの主な特徴は、投射線に適用されたカーネル関数であり、潜在力学における非線形性の高速な捕捉を可能にする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:38:22 GMT)
YOLOv12: A Breakdown of the Key Architectural Features [0.6] YOLOv12は、単一ステージのリアルタイム物体検出において重要な進歩である。
最適化されたバックボーン(R-ELAN)、分離可能な7x7の畳み込み、およびFlashAttention駆動のエリアベースアテンションが組み込まれている。
レイテンシに敏感なアプリケーションと高精度なアプリケーションの両方にスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:08:43 GMT)
SQL4NN: Validation and expressive querying of models as data [0.6] 私たちは、データから学習した機械学習モデルを、それ自体において重要で、強迫的なデータの一種だと考えています。
モデル上の様々な分析タスクは、トレーニングや検証のためのデータのような拡張データと組み合わせて、この強迫的データに対するクエリとみなすことができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:16:10 GMT)
Fundamental Survey on Neuromorphic Based Audio Classification [0.6] 本調査は,ニューロモルフィックに基づく音声分類における現状を徹底的に検証する。
スパイキングニューラルネットワーク(SNN)、メムリスタ、ニューロモルフィックハードウェアプラットフォームなど、ニューロモルフィックシステムの重要なコンポーネントを網羅している。
これらの手法は、特にエネルギー効率、リアルタイム処理、環境騒音に対する堅牢性の観点から、従来の音声分類手法の限界にどのように対処するかを検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:34:32 GMT)
Discovering highly efficient low-weight quantum error-correcting codes with reinforcement learning [0.6] 我々は、強化学習(RL)に基づく安定化符号量削減のための汎用的で計算効率の良いアプローチを導入する。
提案手法は,重み6符号の1~2桁の既存の結果と比較して,物理量子ビットオーバーヘッドの削減を実証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:05:34 GMT)
Exact non-Markovian master equations: a generalized derivation for quadratic systems [0.5] ガウス環境に線形に結合した二次量子系の力学を捉える正確なマスター方程式を導出する。
着飾った環境相関関数への明示的かつ極めてコンパクトな依存を示す。
この依存は、よく知られたレッドフィールド方程式をカップリングの2階で簡単に回復させる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:42:09 GMT)
Pursuing Top Growth with Novel Loss Function [0.5] 我々は、トップ成長を促進するリターン重み付き損失関数を導入することで、AIのポテンシャルとユーティリティをさらに強化することを目指している。
当社のベストモデルでは、2019年から2024年までの1340回のテスト日において、毎年1.18パーセントのシャープ比率で、毎日のリバランスで61.73%のリターンを達成しています。
また, 従来の損失関数よりも, いくつかの性能指標と統計的証拠により, 新たな損失関数の優位性を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:43:51 GMT)
Measuring the Quality of Answers in Political Q&As with Large Language Models [0.5] 本稿では,政治質問・回答セッションにおける回答の質を評価するための新しいアプローチを提案する。
質問文からランダムな回答の集合において、その回答がいかに簡単かつ正確に認識できるかに基づいて、回答の品質を計測する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:30:53 GMT)
Can LLMs Predict Citation Intent? An Experimental Analysis of In-context Learning and Fine-tuning on Open LLMs [0.5] 本研究では,Large Language Models (LLMs) を用いて,文脈内学習と微調整による引用意図の予測を行う。
ゼロ, 1, few, many-shot の 5 つのオープン LLM ファミリーにまたがる12 種類のモデル変動を評価し,シナリオ間の性能評価を行う。
結果は、引用意図を認識する上でのLLMの強みと限界を強調し、モデル選択と迅速なエンジニアリングのための貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:45:42 GMT)
Non-Contextual BERT or FastText? A Comparative Analysis [0.4] 我々は、ニュース分類、感情分析、ヘイトスピーチ検出などのタスクにおけるBERTモデルとFastTextモデルからの非コンテキスト埋め込みの有効性を分析する。
以上の結果から,本モデルの最初の埋め込み層から抽出した非コンテキストBERT埋め込みは,FastText埋め込みよりも優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:41:23 GMT)
Utilizing AI and Machine Learning for Predictive Analysis of Post-Treatment Cancer Recurrence [0.4] 本研究では,AIモデルとMLモデルががん再発予測の精度と信頼性を高める方法について検討する。
本稿では, 教師なしおよび教師なし学習を用いたがん患者のパターン識別と予後予測のためのAIおよびML技術について述べる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:54:12 GMT)
Human Misperception of Generative-AI Alignment: A Laboratory Experiment [0.4] 我々は、経済的な意思決定の文脈において、生成的人工知能(GenAI)のアライメントに対する人々の認識を研究する。
我々は,GenAIの選択と人間の選択の一致度を過大評価している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:32:42 GMT)
A Socratic RAG Approach to Connect Natural Language Queries on Research Topics with Knowledge Organization Systems [0.4] 本稿では,研究トピックに関する自然言語クエリを機械で解釈可能なセマンティックエンティティにマッピングするRAG(Retrieval Augmented Generation)エージェントを提案する。
我々のアプローチは、RAGとソクラティック対話を組み合わせることで、ユーザの研究トピックに対する直感的な理解と、確立した知識組織システムとを整合させる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:58:59 GMT)
Experimental randomness certification in a quantum network with independent sources [0.4] 本稿では、2つの独立したソースを表示する量子リピータの構築であるエンタングルメント・テレポーテーション実験の証明方法を示す。
本理論モデルは,ネットワーク内の証明可能なランダム性を特徴付け,スカラー解析により検証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:52:35 GMT)
A novel approach to the relationships between data features -- based on comprehensive examination of mathematical, technological, and causal methodology [0.3] 現在の数学的、技術的、因果的方法論は、特徴関係を正規化する外部化技術に依存している。
本研究では, 数学的, 技術的, 因果的視点を統合する枠組みであるConvergent Fusion Paradigm理論を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:36:37 GMT)
A Survey of Internet Censorship and its Measurement: Methodology, Trends, and Challenges [0.3] 本稿ではまず,インターネット検閲技術に関する調査を行う。
第2に、利用可能なデータセットのカバレッジを含む検閲計測手法について調査する。
有益な場合、インターネット検閲の用語と分類を関連ドメインにブリッジする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:50:50 GMT)
Techniques for Measuring the Inferential Strength of Forgetting Policies [0.3] 本稿では,モデルカウントと確率論からの直感に基づく推論強度の変化を測定するための損失関数を定義する。
忘れることに重点を置いているが、結果はずっと一般的であり、他の分野にも広く適用されるべきである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:55:22 GMT)
Quantum complexity and generalized area law in fully connected models [0.3] 絡み合いエントロピーの領域法則は、量子多体系の複雑さを反映している。
本研究では,システムサイズにおける多対数因子の一般化された領域法則を確立する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:21:06 GMT)
Beyond the Surface: Uncovering Implicit Locations with LLMs for Personalized Local News [0.3] 本稿では,タボオラの「ホームページ・フォー・ユー」システムにおける局所的な記事分類のためのLarge Language Models(LLM)について検討する。
LLMは、正確性と説明可能性に関する懸念を高めながら、新たな可能性を提供します。
LLMベースの位置分類を統合したスケーラブルなパイプラインにより、ローカルな記事の配布が27%増加した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:55:52 GMT)
Synergistic Fusion of Multi-Source Knowledge via Evidence Theory for High-Entropy Alloy Discovery [0.2] 本稿では,計算資料データセットから抽出した知識と,大規模言語モデル(LLM)を用いた科学文献から抽出したドメイン知識を組み合わせたフレームワークを提案する。
このアプローチの中心的な特徴は元素置換性を明確に考慮することであり、化学的に類似した元素を同定し、望ましいHEAを安定にするために交換することができる。
本フレームワークは, 候補HEA組成の相安定性を予測し, いずれの合金系においても系統的に評価する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:10:00 GMT)
Stochastic Resonance Improves the Detection of Low Contrast Images in Deep Learning Models [0.2] 共鳴は、ある種のシステムにおける弱い信号の検出性を改善するためのノイズの有用性を記述している。
自然や工学的な設定で広く観察されているが、速度に基づくニューラルネットワークを用いた画像分類におけるその有用性は広く研究されていない。
その結果、周波数に基づくリカレントニューラルネットワークにおける共鳴の存在が示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:48:49 GMT)
Observation of the quantum equivalence principle for matter-waves [0.1] アインシュタインの相対性理論は同値原理に基づいている。
等価原理は、波動関数が物体自体を干渉させると観測可能なゲージ位相を含む。
これは、1つの波のパケットが実験室のフレームで静止し、もう1つの波が自由落下しているという新しい冷原子干渉計によって行われる。
2つのフレームにおけるウェーブパケットの相対位相進化に追従し、量子領域における等価原理を確認する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:11:26 GMT)
Question Answering with Texts and Tables through Deep Reinforcement Learning [0.1] 本稿では,テキストやテーブルからの情報を必要とするオープンドメイン質問に対するマルチホップ応答を生成する新しいアーキテクチャを提案する。
我々のアーキテクチャは、最終的に望ましい回答が生成されるまで、それぞれの最先端ツールを逐次選択するために強化学習を採用している。
このシステムは19.03のF1スコアを達成した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:03:10 GMT)
VFL-RPS: Relevant Participant Selection in Vertical Federated Learning [0.1] フェデレートラーニング(FL)は、異なるパーティ間のコラボレーションを可能にすると同時に、これらのパーティ間のデータが共有されないことを保証する。
本稿では,VFLにおける参加者選択のための新しい手法であるVFL-RPSを提案する。
提案手法は,VFLにおける既存の参加者選択方法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:05:55 GMT)
UAVDB: Trajectory-Guided Adaptable Bounding Boxes for UAV Detection [0.0] 本稿では,Patch Intensity Convergence (PIC) を用いた高分解能UAV検出データセットであるUAVDBを紹介する。
IoU(Intersection over Union)の性能と実行時間を比較することにより,まずPIC生成バウンディングボックスの精度と効率を検証した。
次に、最先端(SOTA)YOLO系列検出器を用いてUAVDBをベンチマークし、UAVDBを長距離高分解能UAV検出のための貴重なリソースとして確立する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:35:34 GMT)
A non-parametric optimal design algorithm for population pharmacokinetics [0.0] 本稿では,モデルパラメータの結合分布を推定する非パラメトリック推定アルゴリズムを提案する。
NPODアルゴリズムは2つのデータセットにまたがるNPAGに類似した解を実現するが、必要なサイクル数と全体の実行時間の両方において、より効率的であることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:32:25 GMT)
seqKAN: Sequence processing with Kolmogorov-Arnold Networks [0.0] Kolmogorov-Arnold Networks (KAN) は、最近、多層パーセプトロンよりも解釈可能で制御可能な機械学習フレームワークとして提案されている。
本稿では,シーケンス処理のための新しいkanアーキテクチャであるSeqKANを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:10:18 GMT)
Weed Detection using Convolutional Neural Network [0.0] 我々は、農地における雑草検出に畳み込みニューラルネットワーク(CNN)を用いる。
本研究では,2種類のCNN層であるConv2dと拡張Conv2dの作物の雑草検出への応用について検討する。
提案手法は,事前学習したモデルを用いて入力画像から特徴を抽出し,その後雑草検出のために調整する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:37:23 GMT)
Visualizing Machine Learning Models for Enhanced Financial Decision-Making and Risk Management [0.0] この研究は、特に銀行業界において、解釈可能性を改善し、予測をサポートするために、機械学習モデルを可視化することがいかに重要であるかを強調する。
ビジュアルツールは、パフォーマンスを改善し、革新的な金融モデルの作成をサポートする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:10:02 GMT)
Violation of the Leggett-Garg inequality for dynamics of a Bose-Einstein condensate in a double-well potential [0.0] 二重井戸電位におけるボソン系のレゲット・ガルグ不等式(LGI)の違反について検討した。
我々の分析では、LGIはジョゼフソンの振動によって侵害されているが、強い結合状態では非侵害であることが明らかとなった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:08:08 GMT)
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents [0.0] 大規模言語モデル(LLM)は、孤立した短期的なタスクにおいて顕著な熟練度を示すが、長い時間的地平線を超えて一貫性のあるパフォーマンスを維持することができない。
Vending-Benchは、LLMベースのエージェントが、単純で長期にわたるビジネスシナリオを管理する能力をテストするために設計されたシミュレーション環境である。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:52:29 GMT)
Unsupervised Clustering Approaches for Autism Screening: Achieving 95.31% Accuracy with a Gaussian Mixture Model [0.0] 自閉症スペクトラム障害(ASD)は、効果的かつ迅速に診断する上で困難な状態である。
従来の診断方法はラベル付きデータの可用性を前提としています。
本稿では、4つの異なるクラスタリングアルゴリズムを用いて、ASDをスクリーニングした704人の成人の公開データセットを解析する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:12:59 GMT)
Universal Quantum Computation with the $S_3$ Quantum Double: A Pedagogical Exposition [0.0] 位相量子計算におけるプリミティブとして,$S_3$ TO の任意のブレイディングと測定方法を示す。
これは、短期量子プラットフォームのためのロードマップを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:07:31 GMT)
Universal AI maximizes Variational Empowerment [0.0] 我々は、ユニバーサルAIエージェントのパワーサーキング傾向は、エンパワーメントの直接的な結果として説明できると論じる。
私たちの主な貢献は、これらのモチベーションがAIエージェントを体系的に高オプション状態を探し、維持する方法を示すことです。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:58:44 GMT)
Thermometry Based on a Superconducting Qubit [0.0] トランスモン量子ビットを用いた温度測定を,最初の3つのエネルギー準位の集団を検出することによって報告する。
量子ビットの有効温度を測定し,その緩和時間とコヒーレンス時間を特徴付ける。
本稿では, 量子ビット分布の数値モデルを提案し, 実験結果と比較した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:12:09 GMT)
Thermal conductance at superradiant phase transition in quantum Rabi model [0.0] 量子ラビモデルは結合が強くなると超ラジカル相転移を示す。
この相転移は、多体系の従来の相転移とは対照的に、数体量子相転移と呼ばれる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:00:37 GMT)
The measurement problem in liquid NMR quantum computers [0.0] 統計的変動のため、測定された磁気モーメント値は長期間にわたってノイズに匹敵する。
そこで本研究では,信号と雑音を区別するために測定時間が短いことを示唆した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:49:43 GMT)
The Modified Airy Function Approximation Applied to the Double-Well Potential [0.0] WKB近似(Wentzel-Kramers-Brillouin)はその正確なエネルギーで知られている。
修正空調関数(MAF)近似は、WKB波動関数の欠陥を緩和する。
正確な固有値と、さらに重要なことに、非常に正確な波動関数が見つかる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:55:38 GMT)
The ETKidney simulator: a discrete event simulator to assess the impact of alternative kidney allocation rules in Eurotransplant [0.0] ユーロ移植で1万人以上の候補者が腎臓移植を待ちます。
これらの割り当て規則は、ETKASとESPが1996年と1999年に導入されて以来、あまり変わっていない。
ETKASおよびESP腎割り当て規則の近代化の障壁は、Eurotransplantには政策変更の影響を定量的に評価するツールがないことである。
ETKASとESPの実際の割り当て規則に従って腎臓の割り当てをシミュレートするETKidneyシミュレータを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:53:21 GMT)
The Complexity of Local Stoquastic Hamiltonians on 2D Lattices [0.0] 2次元正方格子上の2-局所確率ハミルトン問題は、StoqMA完全であることを示す。
我々の主な貢献は、StoqMA回路を空間的に疎結合にでき、幾何学的、確率的保存的、摂動的ガジェットを構築できることである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 04:18:58 GMT)
Spatial and Frequency Domain Adaptive Fusion Network for Image Deblurring [0.0] Image Deblurringは、対応するぼやけた画像から潜むシャープなイメージを再構築することを目的としている。
本稿では、この制限に対応するために、空間周波数領域適応核融合ネットワーク(SFAFNet)を提案する。
我々のSFAFNetは、一般的に使用されているベンチマークにおける最先端のアプローチと比較して好意的に機能する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:43:55 GMT)
Solutions of the Dirac equation in one-dimensional variable width potential well [0.0] 本稿では、電子のようなスピン=$frac12$粒子に対するディラック方程式の解について検討する。
これは、ディラック粒子がフェルミ加速機構を介して複素数値運動量状態を示すことを示した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:23:19 GMT)
Sketch2CAD: 3D CAD Model Reconstruction from 2D Sketch using Visual Transformer [0.0] 現在の3D再構成手法は、ボクセル、点雲、メッシュなどの形式で出力を生成する。
これらの形式には、粗面や歪んだ構造のような固有の制限がある。
本稿ではCAD互換モデルの再構成により,これらの欠点を克服する新しい3次元再構成手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:34:06 GMT)
SemiHMER: Semi-supervised Handwritten Mathematical Expression Recognition using pseudo-labels [0.0] ラベル付きデータと追加ラベル付きデータの両方を探索し,半教師付き手書き数式認識(HMER)について検討した。
本稿では,二分岐半教師付き学習を導入した新しい一貫性正規化フレームワークであるSemiHMERを提案する。
実験結果から,本研究は大幅な性能向上を実現していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:17:01 GMT)
Robust Feature Engineering Techniques for Designing Efficient Motor Imagery-Based BCI-Systems [0.0] この研究は、MI Limb EEGデータセットの詳細な分析を提供する。
神経リハビリテーションのためのシンプルで費用効率の良い信頼性の高いBCIシステムを設計・開発するのに役立つだろう。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:59:40 GMT)
Reducing false positives in strong lens detection through effective augmentation and ensemble learning [0.0] 本研究では,高品位トレーニングデータセットが強力な重力レンズ検出における畳み込みニューラルネットワーク(CNN)の性能に与える影響について検討する。
我々は,データ多様性と代表性の重要性を強調し,サンプル集団の変動がCNNのパフォーマンスに与える影響を実証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:50:56 GMT)
Real-Time Device Reach Forecasting Using HLL and MinHash Data Sketches [0.0] ユーザが指定したターゲティング属性に基づいて、テレビ(デバイスリーチ)の正確な数をリアルタイムで予測することは、数百万ドルのADビジネスを実行する上で必須である。
我々はMinHashとHyperLogLog(HLL)データスケッチを用いた新しいリアルタイム予測システムを構築した。
さらに,1つの命令多重データ(SIMD)ベクトル化演算を用いて,数十億のレコードを処理するため,MinHashアルゴリズムを4倍高速に動作させるように改良した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:05:34 GMT)
Rapid Parameter Inference with Uncertainty Quantification for a Radiological Plume Source Identification Problem [0.0] 核事故や放射線散布装置の爆発が発生した場合、ソースの早期発見が重要である。
予測値の不確かさを定量化する2つのニューラルネットワーク構造を考察する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:43:45 GMT)
Ranking Joint Policies in Dynamic Games using Evolutionary Dynamics [0.0] 単純な2プレイヤーゲームでもエージェントの相互作用のダイナミクスはナッシュ平衡に達することができないことが示されている。
我々のゴールは、安定した行動をもたらすエージェントの合同戦略を特定し、変化に抵抗すると同時に、エージェントの支払いも考慮することである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:50:38 GMT)
Randomized benchmarking of a high-fidelity remote CNOT gate over a meter-scale microwave interconnect [0.0] 我々は、Tunable-Coupling Qubits (TCQs) とベンチマークに基づくモジュール間相互接続を、SPAMエラー許容方式で、60cmのコプラナー導波路 (CPW) 上で0.988のリモート状態遷移忠実度を示す。
また,各モジュールのローカルCZゲートとリモート状態転送からなるモジュール間のリモートCNOTゲートを提案し,ランダム化ベンチマーク法を用いて0.933の高ゲート忠実度を報告する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:40:48 GMT)
Qutrit and Qubit Circuits for Three-Flavor Collective Neutrino Oscillations [0.0] 我々は、高密度ニュートリノ系のフレーバーダイナミクスをシミュレートするためのクォートとキュービットの有用性を探求する。
量子ビット型および量子ビット型プラットフォーム上での3フレーバーニュートリノ系をシミュレーションするための新しい量子回路を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:33:33 GMT)
Quantum thermodynamic advantage in work extraction from steerable quantum correlations [0.0] 量子熱力学的優位性を示す二部構成のフレームワーク内で作業抽出ゲームを設計する。
我々は、可観測物の可観測性と非可観測性との対応性を利用する。
量子的優位性をカプセル化した、ステアブルなシナリオにおける抽出可能な作業と非ステアブルなシナリオの比率は、基礎となるシステムの次元によって増加する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:00:29 GMT)
Quantum stick-slip motion in nanoscaled friction [0.0] 原子系の摩擦は通常古典的なプレンドル・トムリンソンモデルによって記述される。
本研究では, 外部の浴槽に熱を放つことにより, 放散が容易になる量子力学的特性について考察する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 02:36:51 GMT)
Quantum non-Markovian noise in randomized benchmarking of spin-boson models [0.0] 量子非マルコフ浴が量子ビットランダム化ベンチマーク実験に及ぼす影響について検討する。
相互作用における非マルコビアン性を与えると、ランダム化されたベンチマークの崩壊曲線に明らかな違いが生じる。
これらの結果は、量子デバイスのキャラクタリゼーションとベンチマークに量子非マルコフノイズを組み込むことの取り組みを知らせるものである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:25:59 GMT)
Quantum computer formulation of the FKP-operator eigenvalue problem for probabilistic learning on manifolds [0.0] 本稿では、多様体上の確率論的学習(PLoM)の発展における課題に対処する量子コンピューティングの定式化について述べる。
これは高次元フォッカー・プランク作用素のスペクトル問題を解くことを含む。
ラプラシアンおよびポテンシャルの明示的な公式が導出され、パウリ行列式を用いてキュービットに写像される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:05:16 GMT)
Predicting Filter Medium Performances in Chamber Filter Presses with Digital Twins Using Neural Network Technologies [0.0] 本稿では、動作の柔軟性と予測制御を改善するために、機械学習を利用したデジタルツインフレームワークを提案する。
ニューラルネットワークに基づく予測モデルは、圧力や流量などの操作パラメータを予測するために開発された。
モデルは、保守計画と資源持続可能性を支援するため、フィルタ媒体を予測する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:55:53 GMT)
Path integrals for classical-quantum dynamics [0.0] 古典的自由度と量子的自由度を結合する一貫性力学が存在する。
古典量子作用の観点から、そのような力学に対する一般的な経路積分表現を導出する。
古典量子ハミルトニアンが、その瞬間において最も二次的であるとき、構成空間経路積分を導出することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:11:05 GMT)
Passive leakage removal unit based on a disordered transmon array [0.0] 量子ビット部分空間からの漏れは、標準的な量子エラー訂正プロトコルを損なう。
本稿では,無秩序なトランスモンの配列に基づくパッシブリーク除去ユニットを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:28:51 GMT)
Passive Demultiplexed Two-photon State Generation from a Quantum Dot [0.0] 多光子生成の現在のアプローチは、アクティブ偏光スイッチング要素に依存している。
我々は、刺激された2光子励起プロセスを利用する完全受動デマルチプレキシング技術を導入する。
提案手法は, 励起段階にシフトしながらデマルチプレキシングのコストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:29:29 GMT)
PaperHelper: Knowledge-Based LLM QA Paper Reading Assistant [0.0] PaperHelperは、科学的文献を効率的に閲覧し理解する研究者の能力を高めるために設計された強力なツールである。
RAFTやRAG Fusionのような先進技術の実装は、文献レビュープロセスの性能、正確性、信頼性を大幅に向上させる。
PaperHelperは60.04のF1スコアを実現し、レイテンシは5.8秒で、F1スコアでは基本RAGモデルよりも7%向上した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:18:00 GMT)
Packaged Quantum States for Quantum Simulation of Lattice Gauge Theories [0.0] この形式主義では、すべての励起は局所ゲージ群の完全テクスブフレード可能表現(英語版)(irrep)として変換される。
このようなパッケージ化された絡み合った状態のすべてのIQNは分離的に絡み合っている。
このアプローチを、$mathrmU(1)$, $mathrmSU(2)$, $mathrmSU(3)$ 格子ゲージ理論に対して説明する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:44:44 GMT)
PQBFL: A Post-Quantum Blockchain-based Protocol for Federated Learning [0.0] FLシステムにおけるモデルセキュリティと識別アイデンティティのプライバシを高めるために,PQBFL(Post-Quantum-based Protocol for Federated Learning)を提案する。
オフチェーンとオンチェーンチャネルを組み合わせたハイブリッド通信戦略を採用して、コスト効率を最適化し、セキュリティを改善し、プライバシを保護している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:36:08 GMT)
PPO-MI: Efficient Black-Box Model Inversion via Proximal Policy Optimization [0.0] モデル反転攻撃は、訓練されたモデルからプライベートトレーニングデータを再構築しようとすることで、重大なプライバシーリスクを引き起こす。
我々は,ブラックボックスモデルインバージョン攻撃のための新しい強化学習ベースのフレームワークであるPPO-MIを提案する。
提案手法は, エージェントが生成モデルの潜伏空間をナビゲートし, プライベートトレーニングサンプルを再構成するマルコフ決定プロセスとして, インバージョンタスクを定式化する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:57:45 GMT)
Optimize Cardinality Estimation Model Pretraining by Simplifying the Training Datasets [0.0] 既存の事前学習データセットのごく一部に縮小された簡易なトレーニングデータセットを導入する。
この単純化されたデータセットに基づく事前訓練された濃度推定器は、ゼロショット設定で既存のモデルに匹敵する性能を達成できることを示す十分な実験結果が得られた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:06:16 GMT)
Online detection of forecast model inadequacies using forecast errors [0.0] 予測の正確性を維持するために,予測のオンライン監視のための新しいフレームワークを提案する。
予測誤差の逐次的変化点手法を利用することで,外部要因によるプロセスの潜在的な変化をリアルタイムに識別することができる。
理論的には、基礎となるプロセスに共通する変化が予測誤差に現れ、予測誤差のシフトを元のモデリングフレームワークよりも早く識別できることが示される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:56:51 GMT)
On the role of symmetry and geometry in global quantum sensing [0.0] グローバル量子センシングのための最適プロトコル設計の2つの主要なアプローチを示す。
最初のアプローチは、より単純な優先順位と推定器をもたらし、適応的な設定でより広く適用できる。
2つ目は、よく定義された測定条件において、より高速な後方収束をもたらす。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:39:20 GMT)
On the Existence of the Hilbert-Pólya Hamiltonian [0.0] Hilbert-P'olya Conjecture に対してハミルトニアンを提案する。
このハミルトン自己共役を非自明なリーマン零点に対して有意に定義した類似性変換を構築する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:53:49 GMT)
Nonequilibrium Universality of Rydberg-Excitation Spreading on a Dynamic Network [0.0] ライドバーグ励起拡散の吸収状態相転移(ASPT)は、移動原子のレーザー駆動ガスで起こる。
ガス中のランダムな原子の位置によって設定された不規則なグラフ上で発生し、温度によってその特性が静的から動的に変化する。
発散強度の関数としての損失による普遍性クラスの変更の可能性について検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:31:37 GMT)
Neural Green's Operators for Parametric Partial Differential Equations [0.0] この研究は、線形偏微分方程式(PDE)のパラメトリック族に対する解演算子を学習する新しいニューラル演算子ネットワークアーキテクチャであるニューラルグリーン演算子(NGO)を導入する。
NGOはディープ・オペレーター・ネットワーク(DeepONets)や可変ミメティック・オペレーター・ネットワーク(VarMiONs)に類似している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:28:22 GMT)
MultiSlav: Using Cross-Lingual Knowledge Transfer to Combat the Curse of Multilinguality [0.0] 多言語ニューラルネットワーク翻訳(NMT)は、言語ファミリー内で言語間の知識伝達を提供するか?
本研究では,NMTで利用可能なデータ登録を拡張するための複数のアプローチについて検討し,低リソース言語における0ショット翻訳方式においても,言語間のメリットを実証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:35:25 GMT)
Multi-dataset synergistic in supervised learning to pre-label structural components in point clouds from shell construction scenes [0.0] 本研究は,建築・工学・建設(AEC)における複雑な構造部品の分断の課題に対処する。
我々は、教師付きトレーニングとカスタム検証データセットを通じてベースラインを確立し、大規模な屋内データセットによるクロスドメイン推論を評価し、転送学習を利用して、最小限の新しいデータでセグメンテーション性能を最大化する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:48:14 GMT)
Multi-controlled single-qubit unitary gates based on the quantum Fourier transform and deep decomposition [0.0] 量子フーリエ変換(QFT)を用いたマルチコントロールX(MCX)ゲートの新たな一般化について述べる。
まず、QFT-MCXを最適化し、ステップMCXゲートアレイと等価であることを示す。
最もよく知られた最適化アルゴリズムに対する我々の実装の優位性を実証する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:06:00 GMT)
Money Recognition for the Visually Impaired: A Case Study on Sri Lankan Banknotes [0.0] 本研究では,スリランカ通貨紙幣の識別にユーザフレンドリーなスタンドアローンシステムを提案する。
スリランカの通貨紙幣の画像のカスタム作成データセットは、EfficientDetモデルを微調整するために使用された。
このモデルは検証データセットで0.9847 APを達成し、現実世界のシナリオでは極めてよく機能した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:07:46 GMT)
Modifying Final Splits of Classification Tree for Fine-tuning Subpopulation Target in Policy Making [0.0] 政策立案者は、二進的な結果と二進的事象の確率がしきい値を超えるターゲットサブポピュレーションに基づいて人口を分割するために、しばしば分類と回帰木(CART)を使用する。
本稿では,Penalized Final Split (PFS) とMaximizing Distance Final Split (MDFS) の2つの手法を提案する。
大規模なシミュレーション研究を通じて,これらの手法が誤分類誤りの点で古典的CARTやKD-CARTよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:08:43 GMT)
Low-Noise Cascaded Frequency Conversion of $637.2$ nm Light to the Telecommunication C-Band in a Single-Waveguide Device [0.0] ダイヤモンド中のNV中心のクラスターから波長変化可能な波長への637.2$ nmの蛍光光の差周波数変換を報告する。
自発放射による有害ノイズを回避するため, 単発周期極型ニオブ酸リチウム導波路を用いた2段階変換装置を試作した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:37:41 GMT)
Line Goes Up? Inherent Limitations of Benchmarks for Evaluating Large Language Models [0.0] 私は、ベンチマークのパラダイムに固有の制限が、認知タスクに対する一般的な能力の指標として、ベンチマークのパフォーマンスを非常に適さないと論じます。
総合LLM認知能力の信頼性指標としてベンチマーク性能を用いるべきではないと結論づける。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:13:29 GMT)
Leveraging ChatGPT for Sponsored Ad Detection and Keyword Extraction in YouTube Videos [0.0] このワーク・イン・プログレス・ペーパーは、YouTubeビデオのスポンサー付き広告セグメントを検出するための新しいアプローチを提案する。
提案手法は421個の自動生成および手書き文字起こしを,広告検出のためのプロンプトエンジニアリングされたGPT-4oに供給する。
その結果、さまざまな教育分野における製品関連広告の有意な普及が明らかになった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:44:15 GMT)
Leave-One-Out-, Bootstrap- and Cross-Conformal Anomaly Detectors [0.0] 本研究では,異常検出のためのLeft-out-out-, bootstrap-, cross-conformalメソッドを正式に定義し,評価する。
我々は,再サンプリング・コンフォーマルな$p$-値を求める導出手法が,統計効率(全コンフォーマル)と計算効率(スプリット・コンフォーマル)の両立を図っていることを実証した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:28:41 GMT)
LLM4FaaS: No-Code Application Development using LLMs and FaaS [0.0] 非技術者のユーザは一般的に、生成されたコードを実行、デプロイ、運用する専門知識が欠けている。
これは、そのようなユーザーがアプリケーション開発に大規模な言語モデルのパワーを利用するための障壁となる。
LLMとFプラットフォームを組み合わせた新しいノーコードアプリケーション開発手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:05:10 GMT)
LLM should think and action as a human [0.0] マルチターン会話では、ユーザプロンプト毎に、チャット履歴、思考コンテキスト、アクションコール、メモリ、知識といった要素に基づいて、大きな言語モデルを考える。
実験結果から,大規模言語モデルの推論能力と計画能力が向上し,マルチターン会話における課題が解決された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:40:58 GMT)
LACTOSE: Linear Array of Conditions, TOpologies with Separated Error-backpropagation -- The Differentiable "IF" Conditional for Differentiable Digital Signal Processing [0.0] 線形条件配列, 分離誤差バックプロパゲーション(LACTOSE)アルゴリズムはこの問題に対処する。
LACTOSEアルゴリズムは、ユーザ指定の数値範囲毎にトレーニングされたパラメータを格納し、予測中にパラメータを動的にロードする。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 06:29:14 GMT)
Investigating the Generalizability of ECG Noise Detection Across Diverse Data Sources and Noise Types [0.0] クロスデータセット実験による新しいHRVを用いたECGにおけるノイズ検出の一般化可能性について検討する。
その結果,機械学習の平均精度は90%以上であり,AUPRCは0.9以上であることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 12:54:56 GMT)
Intrinsic Regularization via Curved Momentum Space: A Geometric Solution to Divergences in Quantum Field Theory [0.0] 量子場理論(QFT)における紫外線の発散は、長い間、根本的な課題であった。
運動量空間の曲面幾何学からUV正則化が自然に現れる新しい自己整合的アプローチを提案する。
我々はミンコフスキー空間へのシームレスな拡張を示し、相対論的QFTにおける正規化特性を維持する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:49:26 GMT)
Interpretable Multimodal Machine Learning Analysis of X-ray Absorption Near-Edge Spectra and Pair Distribution Functions [0.0] X線近縁スペクトル (XANES) と原子対分布関数 (PDFs) を組み合わせて, 遷移金属カチオンの局所構造と化学的環境を抽出する。
XANESのみのモデルは概してPDFのみのモデルよりも優れており、構造的なタスクでも優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 22:39:22 GMT)
Interferometric detection of continuous-variable entanglement using two states [0.0] 2つの状態の干渉による連続可変二部交絡に対するモード演算子に基づく証人を導出する。
非ガウス状態の絡み目を検出するために重要なモード演算子の高次モーメントにアクセスする方法を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:25:04 GMT)
Interference and Measurement: Obtaining information from the QAOA MaxCut state [0.0] MaxCut問題では、グラフの分割から生じる集合を量子状態(QAOA状態)の振幅の位相に接続するエッジの数を符号化する。
ここでは、QAOA状態から情報を取り出すために、量子力学、干渉、測定の単純な側面のみを使用する場合、何ができるかを確認したい。
この考え方は、構成的干渉を用いて、集合間の多数のエッジを持つ分割に対応する振幅を強化することである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:11:54 GMT)
Inter-turbine Modelling of Wind-Farm Power using Multi-task Learning [0.0] この研究は、まず、データから学習した覚醒効果を調節する風車パワーを予測する確率論的回帰モデルを導入する。
異なるタスクに対する学習モデルパラメータの空間的相関を階層的ベイズモデルで活用して「メタモデル」を開発する
その結果、メタモデルは一連のベンチマークモデルより優れており、構造体の個体群における推論に効率的にデータを利用するための新しい戦略が示されている。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:01:07 GMT)
Inhomogeneous adiabatic preparation of a quantum critical ground state in two dimensions [0.0] 当初、パラメータは格子の中心で臨界となる。
1Dおよび2D量子イジングモデルでは、臨界点における音速が明確に定義された場合、ランプは亜音速で断熱する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:24:31 GMT)
Fostering Inclusion: A Virtual Reality Experience to Raise Awareness of Dyslexia-Related Barriers in University Settings [0.0] 本研究は, 大学環境におけるディフレキシアの個人化を促進するために, バーチャルリアリティ(VR)体験の設計, 実装, 検証を紹介する。
従来の認識方法とは異なり、この没入的アプローチは、ディフレキシーの学生が直面している課題を参加者が直接経験できるようにすることで、共感を育む新しい方法を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:51:31 GMT)
Financial fraud detection system based on improved random forest and gradient boosting machine (GBM) [0.0] 本稿では、改良されたランダムフォレスト(RF)とグラデーションブースティングマシン(GBM)に基づく金融不正検出システムを提案する。
SSRF林の計算効率と特徴抽出能力は,金融不正検出の性能を著しく向上させた。
実験の結果, GBM-SSRFモデルの性能は良好であるだけでなく, 堅牢性や一般化性も良好であることがわかった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:27:57 GMT)
Financial Statement Analysis with Large Language Models [0.0] 我々はGPT4に標準化された匿名の財務文書を提供し、モデルを解析するように指示する。
このモデルでは、財務アナリストが収益の変化を予測できる能力を上回っている。
GPTの予測に基づく貿易戦略は、他のモデルに基づく戦略よりもシャープ比とアルファ率が高い。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:54:13 GMT)
Fast Bayesian Inference for Neutrino Non-Standard Interactions at Dark Matter Direct Detection Experiments [0.0] 多次元パラメータ空間は、標準モデルを超える物理理論でよく見られる。
近年のイノベーションは、そのような複雑な後部をナビゲートすることを可能にする。
非標準ニュートリノ相互作用の文脈におけるダークマター直接検出実験にこれらの進歩を適用した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:41:47 GMT)
Extracting Sentence Embeddings from Pretrained Transformer Models [0.0] 本稿では,BERTベースモデルと単純なベースラインモデルから抽出した文の埋め込みを,表現形成技術により大幅に改善することを示す。
すべてのメソッドは8つのセマンティックテキスト類似性(STS)、6つの短いテキストクラスタリング、12の分類タスクでテストされる。
静的トークンベースのモデル、特にSTSタスクのランダムな埋め込みは、BERTから派生した表現のパフォーマンスにほぼ達する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:33:47 GMT)
Exploring RWKV for Sentence Embeddings: Layer-wise Analysis and Baseline Comparison for Semantic Similarity [0.0] 本稿では, ゼロショット環境における文埋め込み生成におけるRWKVの有効性について検討する。
事前学習したRWKVモデルの異なる隠蔽層からの埋め込みによって得られた意味的類似性を評価する。
以上の結果から,RWKV埋め込みは意味的関連性を捉えるが,スピアマン相関の点ではGloVeベースラインよりも性能が低いことが示唆された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:58:37 GMT)
Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison [0.0] VQA(Visual Question Answering)は、コンピュータビジョンと自然言語処理の交差において重要なタスクとして登場した。
本稿では,ABC-CNN,KICNLE,Masked Vision and Language Modeling,BLIP-2,OFAの5種類の先進VQAモデルの比較検討を行った。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:45:00 GMT)
Explainable Artificial Intelligence Model for Evaluating Shear Strength Parameters of Municipal Solid Waste Across Diverse Compositional Profiles [0.0] 本稿では,多様なプロファイル間の凝集度と摩擦角を評価するための新しい説明可能な知能(XAI)フレームワークを提案する。
提案モデルでは,多層パーセプトロンアーキテクチャとSHAP(SHapley Additive exPlanations)解析を統合した。
従来の勾配法に比べて予測精度は優れていた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:02:55 GMT)
Evolutionary Algorithms Approach For Search Based On Semantic Document Similarity [0.0] 我々は,様々なテキスト表現技術を用いて,クラスタリング,レコメンデーション,質問応答システムを開発した。
テキストの意味的類似性を捉えるために,ユニバーサル・センテンス・ベクター (USE) が用いられていることを示す。
また, 遺伝的アルゴリズム (GA) と微分進化 (DE) のアルゴリズムを用いて, 関連するトップN文書の検索と検索を行う。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:56:52 GMT)
Evaluating Precise Geolocation Inference Capabilities of Vision Language Models [0.0] 本稿では,Googleストリートビューから収集したベンチマークデータセットについて紹介する。
基礎モデルは単一画像の位置推定に基づいて評価され、その多くが300kmの中央値誤差を達成している。
さらに,補助具へのアクセスによりVLMの「エージェント」を評価し,最大30.6%の距離誤差を観察した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:59:28 GMT)
Error correctable efficient quantum homomorphic encryption using Calderbank-Shor-Steane codes [0.0] 量子誤り訂正符号に基づく効率的な量子準同型暗号法を開発した。
より長い量子誤り訂正符号を用いることで、スキームのセキュリティとエラー訂正能力が改善される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:05:00 GMT)
Equivalence in virtual transitions between uniformly accelerated and static atoms: from a bird's eye [0.0] 量子状態における等価原理の展望について検討する。
異なるシナリオにおける2レベル原子検出器の遷移確率について検討する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:33:39 GMT)
Entropy-UID: A Method for Optimizing Information Density [0.0] エントロピーと均一情報密度のバランスをとる新しいトークン選択法であるエントロピーUIDを提案する。
本研究では,エントロピーUIDが情報スパイクを最適に低減し,流速とコヒーレンスを維持していることを示す。
本研究は,自己回帰言語モデルにおけるトークン選択戦略の洗練に情報理論的制約を活用する可能性を示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:42:47 GMT)
English Please: Evaluating Machine Translation for Multilingual Bug Reports [0.0] 本研究は,バグ報告における機械翻訳(MT)性能の総合評価としては初めてである。
我々は、BLEU、BERTScore、COMET、METEOR、ROUGEなど、複数の機械翻訳メトリクスを使用している。
DeepLは一貫して他のシステムより優れており、強い語彙的および意味的なアライメントを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:47:03 GMT)
Engineering high Pockels coefficients in thin-film strontium titanate for cryogenic quantum electro-optic applications [0.0] チタン酸ストロンチウムは極低温で345 pm/Vのmathrmr_eff$を生産できることを示す。
速度論を調整することでキュリー温度を上昇させ、ポッケルス係数の高い強誘電相を実現することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:03:19 GMT)
Efficiently Cooling Quantum Systems with Finite Resources: Insights from Thermodynamic Geometry [0.0] 情報消去におけるランドーアーの放熱制限は、デバイスが縮小するにつれて重要となる。
量子システムを有限資源で冷却するという課題に対処する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:21:32 GMT)
Doubly minimized sandwiched Renyi mutual information: Properties and operational interpretation from strong converse exponent [0.0] Sion のミニマックス定理を用いて $alphain [frac23,infty]$ の新たな双対関係を証明した。
2倍に最小化されたレニイ相互情報である$alphain [1,infty]$が、二項量子状態判別の文脈で運用上の意味を持つことを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:32:55 GMT)
Distributed U-net model and Image Segmentation for Lung Cancer Detection [0.0] 本研究では,コンピュータ支援設計システム(CAD)の可能性について検討し,特にU-Netのような先進的なディープラーニングモデルを用いて検討した。
肺CT画像と対応するセグメンテーションマスクからなる広範囲なデータセットは、経験的検証の基礎となる。
実験結果から,U-Netモデルのロバストな性能が確認された。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 03:29:23 GMT)
Disentangled Latent Spaces for Reduced Order Models using Deterministic Autoencoders [0.0] 潜伏変数をアンタングル化し、結果のモードを分析することで、より解釈可能性を得ることができる。
確率的オートエンコーダ (beta$-VAEs) は計算流体力学においてよく用いられる。
本研究では,非確率的オートエンコーダ手法を用いて,競合的な結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:09:57 GMT)
Diminishing Waters: The Great Salt Lake's Desiccation and Its Mental Health Consequences [0.0] 水の流入が減少し、湖底が露出し、大気中の粒子状物質PM2.5と塵嵐が増加した。
世界保健機関(WHO)の24時間ガイドラインより22日間のPM2.5レベルに曝露された患者は、重度のうつ症状を経験する可能性が高かった。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:49:49 GMT)
Digital implementations of deep feature extractors are intrinsically informative [0.0] 我々は、統一された枠組みにおけるエネルギー伝播速度の上限を証明した。
本研究では,1)離散領域入力信号を持つ特徴抽出器,2)畳み込みニューラルネットワーク(CNN)の散乱によるグローバル指数エネルギー減衰を示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:58:11 GMT)
Detecting Student Intent for Chat-Based Intelligent Tutoring Systems [0.0] インテント検出システムは、学生がITS内をナビゲートするのに役立つが、オープンエンド対話中の学生の意図を検出することは困難である。
我々は、現在の授業を継続するか、または新しい授業に切り替えるかの学生の意図を分類する意図検出システムをITSで設計した。
チャットインタフェースにおける意図検出の実装はフラストレーションを減らし、学生の学習を支援することができると論じる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 23:25:41 GMT)
Design of a Visual Pose Estimation Algorithm for Moon Landing [0.0] 宇宙船の位置と姿勢を推定する地形絶対航法を提案する。
探査機に搭載されているカメラで見られるクレーターは、以前に知られていたクレーターデータベースを用いて検出され、同定される。
シミュレーションにより,アルゴリズムの精度と推定に用いるクレーター数の影響を調べた。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:37:55 GMT)
Data-Constrained Synthesis of Training Data for De-Identification [0.0] 臨床領域に適応する大言語モデル(LLM)について検討した。
我々は,個人識別可能な情報にタグを付加した人工的な臨床テキストを生成する。
合成コーパスは合成NERモデルの訓練に使用される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:09:27 GMT)
Cylindrically confined $H$ atom in magnetic field: variational cut-off factor [0.0] 一定磁場の存在下では、水素原子は半径$rho_0$の無敵無限円筒空洞内に閉じ込められていると考えられる。
ボルン=オッペンハイマー近似では、シリンダーの幾何学中心に核を固定し、物理的に意味のある3パラメトリックトライアル関数を用いて基底状態エネルギーを決定する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 05:14:48 GMT)
CyberSentinel: An Emergent Threat Detection System for AI Security [0.0] 人工知能(AI)の急速な進歩は、AIによるサイバーセキュリティの脅威に対する攻撃面を大きく広げた。
本稿では,緊急脅威検出のための単一エージェントシステムであるCyberSentinelを紹介する。
進化する敵の戦術に継続的に適応することで、サイバーセンチネルは積極的なサイバーセキュリティ防衛を強化する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:03:32 GMT)
Convex space learning for tabular synthetic data generation [0.0] 本稿では,合成サンプルを生成可能なジェネレータと識別器コンポーネントを備えたディープラーニングアーキテクチャを提案する。
NextConvGeNが生成した合成サンプルは、実データと合成データの分類とクラスタリング性能をよりよく保存することができる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:54:54 GMT)
Contextualizing Search Queries In-Context Learning for Conversational Rewriting with LLMs [0.0] 本稿では,数発の対話型クエリ書き換えのための新しいアプローチであるPrompt-Guided In-Context Learningを紹介する。
提案手法では,タスク記述,入出力形式仕様,図示的な例を取り入れ,慎重に設計したプロンプトを用いている。
ベンチマークデータセットであるTRECとTaskmaster-1の実験は、我々のアプローチが強いベースラインを大幅に上回ることを示した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:02:42 GMT)
Coherence-Assisted Entanglement Activation During Open Evolution [0.0] そこで本研究では,システム環境の絡み合いの生成について,純粋に強調された相互作用として知られる,広範かつ重要な相互作用のクラスで検討する。
我々の結果は、オープンな進化の間に生じる複雑な相関関係をよりよく理解し、定量化するのに役立ちます。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:29:16 GMT)
Challenges of Multi-Modal Coreset Selection for Depth Prediction [0.0] 我々は,深度予測タスクに焦点をあて,マルチモーダルデータに対する最先端(SoTA)コアセット選択手法を適用した。
組込みアグリゲーションと次元還元アプローチを用いた実験により, マルチモーダルシナリオへのユニモーダルアルゴリズムの拡張という課題を明らかにした。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:31:22 GMT)
Cavity polariton blockade for non-local entangling gates with trapped atoms [0.0] マルチキュービットの絡み合ったW状態と非ローカルな$CZ$と$CZ$ゲートを実現するためのスキームを提案する。
Sqrt(1-1N)/sqrtC$とスケールする$N-$qubit W状態に対する状態準備誤差を解析的に取得する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:02:16 GMT)
Can the noble metals (Au, Ag and Cu) be superconductors? [0.0] 薄膜閉じ込め下における良金属中の超伝導のBCS理論の一般化について述べる。
我々は,金,銀,銅の超薄膜が低温でも実験で利用できる温度で超伝導体になる可能性があると予測した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 17:34:57 GMT)
Browser Fingerprint Detection and Anti-Tracking [0.0] デジタル指紋は、一般ユーザーのプライバシーとセキュリティに重大な脅威をもたらす。
本稿では,デジタル指紋に対する現在の追跡防止手法の有効性について検討し,デジタル指紋に対して効果的に抵抗できるブラウザ拡張を設計する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:23:22 GMT)
Bridging Smart Meter Gaps: A Benchmark of Statistical, Machine Learning and Time Series Foundation Models for Data Imputation [0.0] スマートグリッドにおける時系列データのギャップは、バイアス消費の分析や信頼性の高い予測を妨げる可能性がある。
生成人工知能(Generative Artificial Intelligence)は、従来の統計手法よりも優れた、有望なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 09:02:33 GMT)
Bohmian Mechanics fails to compute multi-time correlations [0.0] ボヘミア力学(Bohmian mechanics)は、古典的粒子軌道の非局所的現実理論である。
位置オブザーバとして実現した量子ビットを用いたGHZシステムの空間バージョンを構築した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 11:03:38 GMT)
Bi-Fact: A Bidirectional Factorization-based Evaluation of Intent Extraction from UI Trajectories [0.0] Bi-Factは意図を原子的な事実に分解し、精度とリコールを評価するために双方向比較を行う。
実験は、既存の指標と比較して、Bi-Factの人的判断との相関が優れていることを示した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:17:30 GMT)
Beyond Performance Scores: Directed Functional Connectivity as a Brain-Based Biomarker for Motor Skill Learning and Retention [0.0] 手術、ロボット工学、スポーツなどの分野でのモータースキル獲得には、広範なトレーニングを通じて複雑なタスクシーケンスを学習する必要がある。
実行時間やエラー率といった従来のパフォーマンス指標は、スキル学習と保持の基礎となる神経メカニズムを捕捉できないため、限られた洞察を提供する。
本研究は,脳波から誘導される指向性機能接続(dFC)を,運動能力の学習と保持を評価する新しい脳バイオマーカーとして紹介する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:55:08 GMT)
Beyond No: Quantifying AI Over-Refusal and Emotional Attachment Boundaries [0.0] 大規模言語モデル(LLM)における感情境界処理を評価するためのオープンソースのベンチマークと評価フレームワークを提案する。
パターンマッチング応答解析により,3つのLLMを適切な感情境界を維持する能力で評価した。
本フレームワークは, 直接拒絶, 謝罪, 説明, 偏向, 認知, 境界設定, 感情認識の7つの主要なパターンにまたがる応答を定量化する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:09:40 GMT)
Bayesian SegNet for Semantic Segmentation with Improved Interpretation of Microstructural Evolution During Irradiation of Materials [0.0] 私たちはDeep Convolutional Neural Networksをトレーニングして、イメージを欠陥、粒度、境界クラスに分割しました。
モデルにメタデータを組み込んだり,不確実性を利用するなど,モデルの感度を向上させるための修正試験を行った。
全体として、照射された画像と照射されていない画像の両方の最良のモデルのための高性能メトリクスは、ニューラルネットワークモデルを使用することがエキスパートラベル付き画像の代替として実行可能なものであることを示している。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:26:05 GMT)
Balancing Innovation and Integrity: AI Integration in Liberal Arts College Administration [0.0] 学術・学生問題、法的コンプライアンス、認定プロセスにおけるAIの機会と課題を調査する。
AIの価値の多元性と、アルゴリズムバイアスによって引き起こされる潜在的な割当的あるいは表現的害を考えると、LACはAIがその使命と原則と整合することを保証する必要がある。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:16:11 GMT)
Analog Quantum Teleportation [0.0] デジタルテレポーテーションプロトコルは、絡み合い、局所測定、古典的な通信チャネルを利用する。
古典的な通信がノイズの多い量子チャネルを介して伝送によって置き換えられるアナログテレポーテーションプロトコルについて考察する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:27:16 GMT)
An efficient wavelet-based physics-informed neural networks for singularly perturbed problems [0.0] 物理インフォームドニューラルネットワーク(英: Physics-informed Neural Network, PINN)は、物理学を微分方程式の形で利用し、複雑な問題に対処する深層学習モデルである。
本稿では, ウェーブレットに基づくPINNモデルを用いて, 急激な振動, 急勾配, 特異な挙動を持つ微分方程式の解に挑戦する。
提案手法は、従来のPINN、最近開発されたウェーブレットベースのPINN、その他の最先端の手法で大幅に改善される。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:29:12 GMT)
An Enhancement of Jiang, Z., et al.s Compression-Based Classification Algorithm Applied to News Article Categorization [0.0] 本研究は,テキスト間の意味的類似性を検出する際の限界に対処することで,Jiangらによる圧縮に基づく分類アルゴリズムを強化する。
提案された改善は、ユニグラム抽出と最適化された結合に焦点を当て、ドキュメント全体の圧縮への依存を排除した。
さまざまなサイズと複雑さのデータセットに対する実験の結果、平均精度は5.73%向上し、長いドキュメントを含むデータセットでは最大11%向上した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 10:50:59 GMT)
AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO [0.0] 大きな言語モデル(LLM)は、言語処理において印象的な能力を示してきたが、視覚的な空間的推論を必要とするタスクにしばしば苦労している。
迷路ナビゲーションのための視覚的推論能力を備えた標準LLMの2段階学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 16:05:18 GMT)
All You Need is pi: Quantum Computing with Hermitian Gates [0.0] 任意のシングルキュービット作用素が2つのエルミートゲートとして実装されることを示し、したがって純粋にエルミート普遍集合が可能である。
この実装は振幅誤差の存在下で高忠実度単一量子状態を作成するために使用することができる。
CNOTゲートとともに2つの固定軸の回転数$pi$のゲート集合が量子計算に普遍的であることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 13:42:42 GMT)
All Hilbert spaces are the same: consequences for generalized coordinates and momenta [0.0] 量子力学において、一般化座標作用素を定義するための6つの基本的な方法を示す。
6つのケースのうちの1つでは、両方の拡張が機能し、7つの基本対の座標と運動量作用素が導かれる。
両方の測定を同時に行うために、特別な役割が確保されます。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:31:37 GMT)
Alignment, Agency and Autonomy in Frontier AI: A Systems Engineering Perspective [0.0] アライメント、エージェンシー、自律といった概念は、AIの安全性、ガバナンス、制御の中心となっている。
本稿では、これらの概念の歴史的、哲学的、技術的進化をトレースし、その定義がAI開発、デプロイメント、監視にどのように影響するかを強調する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 21:37:20 GMT)
Adaptive Non-Gaussian Quantum State Engineering [0.0] ボソンの非ガウス量子状態は、量子情報科学における重要な資源である。
本研究では、既存の受動的アーキテクチャを拡張し、適応型スキームの幅広いセットを探索する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:04:55 GMT)
A simple gravitational self-decoherence model [0.0] 臨界質量$M_rm C$よりもずっと小さく大きい質量を持つ量子粒子に対する単純な重力自己脱コヒーレンス機構を提案する。
我々のモデルは、自由量子粒子が質量が$M_rm C$に近づくと経験する新しい物理を捉えるように設計されている。
我々は、最先端の実験でこの提案を文脈化し、将来のStern-Gerlachのような実験でどのようにテストできるかを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 18:53:49 GMT)
A modal logic translation of the AGM axioms for belief revision [0.0] ボナンノ(Artificial Intelligence, 2025)の分析に基づいて、3つのモーダル演算子を含む単純なモーダル論理を導入する。
信念修正のための各 AGM 公理に対して、対応するモーダル公理を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 01:07:01 GMT)
A general approach to quantum integration of cross sections in high-energy physics [0.0] 我々は、Sc QuantinuumのQuantum Monte Carlo Integrationエンジンに実装されたフーリエ量子モンテカルロ積分を利用する。
古典モンテカルロ積分に関して、ルート平均二乗誤差収束の2次高速化を提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 15:34:06 GMT)
A Quantum Signature Validation Algorithm for Efficient Detection of Tampered Transactions in Blockchain [0.0] 量子署名検証アルゴリズム(QSVA)は、ブロックチェーンシステムにおける改ざんされたトランザクションの検出を強化するために設計された、新しい量子ベースのアプローチとして導入された。
PageRankベースの検索アルゴリズムと統合された量子ウォークアプローチを利用することで、QSVAは不正取引を識別するための堅牢なメカニズムを提供する。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 20:20:22 GMT)
A Quantum Analog of Delsarte's Linear Programming Bounds [0.0] この論文は有限次元の量子計量空間の文脈における量子誤差補正の結果を提示する。
この論文の主な貢献は、Shor, Laflamme, Rains, Bumgardner の結果を有限次元量子計量空間のクラスに一般化することである。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 00:19:44 GMT)
A Multiplicative Ergodic Theorem for Repeated Bistochastic Quantum Interactions with Applications to Entanglement [0.0] エルゴード力学系によって駆動されるランダムビスト確率完全正(bcp)写像の合成を考える。
主定理を適用することにより、ランダムな bcp 写像の合成が isally anglement break であるときの分類を行う。
我々は、ランダムなbcp写像の合成に対して、クーパーベルクの定理の一般化を証明した。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 19:40:07 GMT)
A Generalised Haldane Map from the Matrix Product State Path Integral to the Critical Theory of the $J_1$-$J_2$ Chain [0.0] 行列積状態(MPS)上に構築された経路積分について検討する。
非自明な絡み合い構造により、MPSアンザッツは半古典的、サドル点レベルでもモデルのキーフェーズをキャプチャする。
本稿では,MPSアンザッツが臨界相の場理論の物理的動機付けによる導出を促進することを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 14:04:54 GMT)
$SU(\infty)$ Quantum Gravity: Emergence of Gravity in an Infinitely Divisible Quantum Universe [0.0] SU(infty)-QGR$ は宇宙論と重力の基本的な量子的アプローチである。
グローバルな$SU(infty)$対称性は、それぞれのサブシステムと宇宙の残りの部分との絡み合いを通して現れることを示す。
ダークエネルギーの特定モデルとして$SU(infty)-QGR$を簡潔に論じる。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 08:20:11 GMT)
$SU(\infty)$ Quantum Gravity and Cosmology [0.0] 我々は、$SU(infty)$-QGRと呼ばれる量子宇宙論と重力に対する抽象的なアプローチの構造と性質を強調する。
一般的な$SU(infty)$対称性と重力との相互作用を同定し、$SU(infty)$-QGRは量子重力(QGR)のスピン-1メディエータを予測する。
重力の量子性を検出できない観測者は、連続パラメータの平均値空間の曲率としてその効果を認識できることを示す。
論文参考訳(メタデータ) (Thu, 20 Feb 2025 07:43:43 GMT)