SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation [139.8] SlowFast-VGenはアクション駆動長ビデオ生成のための新しいデュアルスピード学習システムである。
本稿では,世界ダイナミクスのスローラーニングのための条件付きビデオ拡散モデルを提案する。
本研究では,内在学習ループを外在学習ループにシームレスに統合する低速学習ループアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:55:52 GMT)
Evaluating Cultural and Social Awareness of LLM Web Agents [113.5] CASAは,大規模言語モデルの文化的・社会的規範に対する感受性を評価するためのベンチマークである。
提案手法は,標準に違反するユーザクエリや観察を検知し,適切に応答するLLMエージェントの能力を評価する。
実験により、現在のLLMは非エージェント環境で大幅に性能が向上していることが示された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:35:44 GMT)
Inference via Interpolation: Contrastive Representations Provably Enable Planning and Inference [110.5] 時系列データを考えると、“今後どうなるか?”や“どうやって来たのか?”といった質問に答えるにはどうすればよいでしょう?
これらの質問は、学習された表現の観点から、いかにコンパクトで閉じた形状の解が得られるかを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:52:16 GMT)
MiniPLM: Knowledge Distillation for Pre-Training Language Models [109.8] MiniPLMは、学生言語モデルを事前学習するためのKDフレームワークである。
効率性のために、MiniPLMはオフラインの教師LM推論を実行し、複数の学生LMに対するKDを訓練時間のコストを伴わずに行えるようにした。
柔軟性のために、MiniPLMはトレーニングコーパスのみで動作し、モデルファミリ間のKDを可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:45:26 GMT)
Linear Adversarial Concept Erasure [108.4] 与えられた概念に対応する線形部分空間の同定と消去の問題を定式化する。
提案手法は, トラクタビリティと解釈性を維持しつつ, 深い非線形分類器のバイアスを効果的に軽減し, 高い表現性を有することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:50:02 GMT)
TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters [102.1] TokenFormerは、Transformerをスケールするためのスケーラブルなアーキテクチャです。
モデルパラメータをトークンとして扱うことで、トランスフォーマーのすべての線形射影を置き換える。
我々のモデルは、新しいキー値パラメータペアを漸進的に追加することで、124Mから1.4Bパラメータにスケールする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:19:00 GMT)
Effective and Efficient Adversarial Detection for Vision-Language Models via A Single Vector [97.9] Diverse hArmful Responses (RADAR) を用いた新しい laRge-scale Adervsarial 画像データセットを構築した。
そこで我々は,視覚言語モデル (VLM) の隠れ状態から抽出した1つのベクトルを利用して,入力中の良質な画像に対して対向画像を検出する,新しいiN時間埋め込み型AdveRSarial Image Detectction (NEARSIDE) 法を開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:33:10 GMT)
StyleAdapter: A Unified Stylized Image Generation Model [97.2] StyleAdapterは、様々なスタイリング画像を生成することができる統一型スタイリング画像生成モデルである。
T2I-adapter や ControlNet のような既存の制御可能な合成手法と統合することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:05:17 GMT)
Towards Calibrated Robust Fine-Tuning of Vision-Language Models [97.2] 本研究は、視覚言語モデルにおいて、OOD精度と信頼性校正の両方を同時に改善する頑健な微調整法を提案する。
OOD分類とOOD校正誤差は2つのIDデータからなる共有上限を持つことを示す。
この知見に基づいて,最小の特異値を持つ制約付きマルチモーダルコントラスト損失を用いて微調整を行う新しいフレームワークを設計する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:16:03 GMT)
On the Worst Prompt Performance of Large Language Models [93.1] 大規模言語モデル(LLM)の性能は,プロンプトの表現に非常に敏感である。
セマンティックに等価なケースレベルのクエリで構成される新しいベンチマークであるRobustAlpacaEvalを紹介する。
RobustAlpacaEvalとChatGPT、およびLlama、Mistral、Gemmaファミリーの6つのオープンソースLLMによる実験により、モデル性能のかなりのばらつきが明らかになった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:48:52 GMT)
CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models [92.0] 我々はCARESを紹介し,医療領域全体での医療LVLMの信頼性を評価することを目的とする。
我々は,Med-LVLMの信頼性を,信頼性,公正性,安全性,プライバシ,堅牢性,5次元にわたって評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:08:16 GMT)
Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.7] imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:58:35 GMT)
M$^2$PT: Multimodal Prompt Tuning for Zero-shot Instruction Learning [90.8] MLLM(Multimodal Large Language Models)は、幅広い領域にわたる顕著なパフォーマンスを示す。
本研究では,MLLMの効率的な命令チューニングのための新しいMultimodal Prompt Tuning (M$2$PT) 手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:38:52 GMT)
M$^2$PT: Multimodal Prompt Tuning for Zero-shot Instruction Learning [90.8] MLLM(Multimodal Large Language Models)は、幅広い領域にわたる顕著なパフォーマンスを示す。
本研究では,MLLMの効率的な命令チューニングのための新しいMultimodal Prompt Tuning (M$2$PT) 手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:38:52 GMT)
Winner-Take-All Column Row Sampling for Memory Efficient Adaptation of Language Model [89.9] 分散を低減した行列生成のために, WTA-CRS と呼ばれる新しい非バイアス推定系を提案する。
我々の研究は、チューニング変換器の文脈において、提案した推定器が既存のものよりも低い分散を示すという理論的および実験的証拠を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:12:05 GMT)
EvoCodeBench: An Evolving Code Generation Benchmark with Domain-Specific Evaluations [87.3] 既存のベンチマークには、データのリークとドメイン固有の評価の欠如という2つの制限がある。
EvoCodeBenchは、データ漏洩を避けるために、各期間(例:6ヶ月)に動的に更新される。
この記事では、25のリポジトリから275のサンプルを含む最初のバージョンであるEvoCodeBench-2403をリリースする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:57:59 GMT)
VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning [86.6] 本稿では,記号的・神経的知識表現の強みを組み合わせた一階抽象言語Neuro-Symbolic Predicatesを提案する。
提案手法は, サンプルの複雑さの向上, 分布外一般化の強化, 解釈可能性の向上を実現する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:11:05 GMT)
LeanAgent: Lifelong Learning for Formal Theorem Proving [85.4] 本稿では、定理証明のための新しい生涯学習フレームワークであるLeanAgentを紹介する。
LeanAgentは継続的に一般化し、拡張可能な数学的知識を改善します。
以前は人間が証明していなかった162の定理を、23のリーンリポジトリで証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:20:25 GMT)
LeanAgent: Lifelong Learning for Formal Theorem Proving [85.4] 本稿では、定理証明のための新しい生涯学習フレームワークであるLeanAgentを紹介する。
LeanAgentは継続的に一般化し、拡張可能な数学的知識を改善します。
以前は人間が証明していなかった162の定理を、23のリーンリポジトリで証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:20:25 GMT)
LeanAgent: Lifelong Learning for Formal Theorem Proving [85.4] 本稿では、定理証明のための新しい生涯学習フレームワークであるLeanAgentを紹介する。
LeanAgentは継続的に一般化し、拡張可能な数学的知識を改善します。
以前は人間が証明していなかった162の定理を、23のリーンリポジトリで証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:20:25 GMT)
LeanAgent: Lifelong Learning for Formal Theorem Proving [85.4] 本稿では、定理証明のための新しい生涯学習フレームワークであるLeanAgentを紹介する。
LeanAgentは継続的に一般化し、拡張可能な数学的知識を改善します。
以前は人間が証明していなかった162の定理を、23のリーンリポジトリで証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:20:25 GMT)
LeanAgent: Lifelong Learning for Formal Theorem Proving [85.4] 本稿では、定理証明のための新しい生涯学習フレームワークであるLeanAgentを紹介する。
LeanAgentは継続的に一般化し、拡張可能な数学的知識を改善します。
以前は人間が証明していなかった162の定理を、23のリーンリポジトリで証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:20:25 GMT)
A Walsh Hadamard Derived Linear Vector Symbolic Architecture [83.3] シンボリックベクトルアーキテクチャ(VSAs)は、ニューロシンボリックAIを開発するためのアプローチである。
HLBは計算効率が良く、従来のVSAタスクで有効であるように設計されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:42:59 GMT)
A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.1] Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:34:11 GMT)
Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.9] 大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:29:45 GMT)
Multi-Programming Language Sandbox for LLMs [79.5] 大規模言語モデル(LLM)用のコンパイラと分析ツールから統一的で包括的なフィードバックを提供するように設計された、アウト・オブ・ザ・ボックスのマルチプログラミング言語サンドボックス
コードのプログラミング言語を自動的に識別し、独立したサブサンドボックス内でコンパイルして実行することで、安全性と安定性を確保することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:46:43 GMT)
Keypoint Abstraction using Large Models for Object-Relative Imitation Learning [78.9] 多様なタスクや環境にまたがる新しいオブジェクト構成やインスタンスへの一般化は、ロボット工学において重要な課題である。
キーポイントに基づく表現は、本質的なオブジェクトキャプチャ機能のための簡潔な表現として有効であることが証明されている。
本稿では,タスク関連およびクロスインスタンス整合性キーポイントの自動生成に,大規模な事前学習型視覚言語モデルを活用するフレームワークであるKALMを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:37:31 GMT)
Geometric-Averaged Preference Optimization for Soft Preference Labels [78.3] LLMを人間の嗜好と整合させる多くのアルゴリズムは、人間の嗜好は二進的かつ決定論的であると仮定する。
本研究では,分散ソフトな選好ラベルを導入し,損失関数におけるLLM出力確率の重み付き幾何平均を用いて直接選好最適化(DPO)を改善する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:02:12 GMT)
Compute-Constrained Data Selection [77.1] コスト対応ユーティリティ関数を用いてデータ選択の問題を定式化し、その問題をトレーニングのための初期選択コストのトレーディングとしてモデル化する。
複数のタスク、微調整トークンのスケーリングによる計算予算、モデルサイズ、データ選択計算など、包括的な実験を網羅的に実施しています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:31:54 GMT)
Stealth edits to large language models [76.5] モデルの編集可能性を評価するために、1つのメトリックを使用できることを示す。
また、ステルス攻撃に対する言語モデルの脆弱性を明らかにします。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:12:24 GMT)
Scalable Ranked Preference Optimization for Text-to-Image Generation [76.2] DPOトレーニングのための大規模および完全合成データセット収集のためのスケーラブルなアプローチについて検討する。
ペア画像の嗜好は、事前訓練された報酬関数を用いて生成され、アノテーションプロセスに人間を巻き込む必要がなくなる。
ランキングフィードバックを用いてDPOに基づく手法を強化するためにRandonDPOを導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:40:01 GMT)
Guiding Through Complexity: What Makes Good Supervision for Hard Reasoning Tasks? [74.9] 複雑さの異なるタスクにおいて、様々な品質レベルで監視データを提供する様々なデータ駆動戦略について検討する。
ハードタスクの監視における結果エラー率が高い場合でも、そのようなデータによるトレーニングは、より簡単なサブタスクの監督を完璧に上回ります。
また,本研究の結果から,タスク・インスペクションとサブタスク・インスペクションを補完することで,顕著なパフォーマンス向上が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:56:22 GMT)
Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8] 自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:08:51 GMT)
LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description [73.8] ビジュアル空間記述は、画像内のオブジェクト間の空間的関係を記述するテキストを生成することを目的としている。
LLaVA-VSDは視覚空間関係の分類、記述、オープンな記述のために設計されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:38:29 GMT)
Superposed Decoding: Multiple Generations from a Single Autoregressive Inference Pass [72.1] Superposed Decodingは、1つの自己回帰推論パスのコストで$k$のドラフトを生成する新しい復号アルゴリズムである。
Superposed Decodingは、他のデコード戦略と組み合わせることで、推論時間計算のスケーリング時に普遍的なカバレッジが向上する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:22:54 GMT)
Slight Corruption in Pre-training Data Makes Better Diffusion Models [71.9] 拡散モデル(DM)は、高品質な画像、オーディオ、ビデオを生成する際、顕著な能力を示している。
DMは大規模なデータセットでの広範な事前トレーニングの恩恵を受ける。
しかしながら、事前トレーニングデータセットは、しばしば、データを正確に記述しないような、破損したペアを含んでいる。
本稿では,DMの事前学習データにそのような汚職が及ぼす影響について,初めて包括的研究を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:52:56 GMT)
On Memorization of Large Language Models in Logical Reasoning [70.9] 大きな言語モデル(LLM)は、挑戦的な推論ベンチマークで優れたパフォーマンスを達成するが、基本的な推論ミスを発生させることもできる。
1つの仮説は、より高度でほぼ飽和した性能は、類似した問題の記憶が原因ではないかというものである。
微調整は暗記を重くするが,常に一般化性能を向上することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:31:54 GMT)
EnsIR: An Ensemble Algorithm for Image Restoration via Gaussian Mixture Models [70.6] 画像復元の課題は、説明された問題に関連し、単一のモデル予測と地道のずれをもたらす。
アンサンブル学習は、複数のベースモデルの予測を組み合わせることで、これらの偏差に対処することを目的としている。
我々は予測候補のアンサンブル重みを推定するために予測(EM)に基づくアルゴリズムを用いる。
我々のアルゴリズムは、モデルに依存しない訓練不要であり、様々なトレーニング済み画像復元モデルのシームレスな統合と強化を可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:16:35 GMT)
IntLoRA: Integral Low-rank Adaptation of Quantized Diffusion Models [68.6] IntLoRAを提案し、整数型(INT)低ランクパラメータを用いて効率限界を押し上げ、量子化拡散モデルに適応させる。
IntLoRAには3つの大きな利点がある: (i) 微調整の場合、事前トレーニングされた重みは量子化され、メモリ使用量が減少する (ii) ストレージの場合、事前トレーニングされた重みと低ランクの重みの両方が、ディスクスペースを少なく消費するINT内にある; (iii) 推論の場合、IntLoRA重みは、効率的な整数乗算やビットシフトによって自然に量子化された事前トレーニングされた重みにマージできる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:20:46 GMT)
Unbounded: A Generative Infinite Game of Character Life Simulation [68.4] 生成モデルを用いて,有限なハードコードシステムの境界を超越したゲームである生成無限ゲームの概念を導入する。
我々は、生成AIの最近の進歩を活用して、生成モデルに完全にカプセル化されたキャラクターライフシミュレーションゲームUnboundedを作成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:10:33 GMT)
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding [67.6] 本稿では,ビデオ理解において大規模視覚言語モデル(LVLM)を厳格に評価するための定量的なベンチマークであるMMBench-Videoを紹介する。
MMBench-VideoにはYouTubeの長いビデオが組み込まれており、フリーフォームの質問を採用し、実用的なユースケースを反映している。
ベンチマークは、慎重に構築された能力の分類に従って人間に注釈を付けることで、モデルの時間的推論スキルを調査するために慎重に作成されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:38:10 GMT)
LumiSculpt: A Consistency Lighting Control Network for Video Generation [67.5] ライティングは、ビデオ生成の自然性を保証する上で重要な役割を果たす。
独立的でコヒーレントな照明特性を分離し、モデル化することは依然として困難である。
LumiSculptは、T2V生成モデルにおける正確で一貫した照明制御を可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:44:08 GMT)
OpenSatMap: A Fine-grained High-resolution Satellite Dataset for Large-scale Map Construction [65.4] OpenSatMapは、大規模マップ構築のための細粒度で高解像度の衛星データセットである。
データセットの公開とメンテナンスにより、衛星ベースのマップ構築と、自律運転のような下流タスクのための高品質なベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:56:02 GMT)
Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.1] 機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:20:10 GMT)
Summarization-Based Document IDs for Generative Retrieval with Language Models [65.1] 要約に基づく文書IDを導入し、各文書のIDは抽出的要約または抽象的キーフレーズから構成される。
以上の結果から,ACIDの使用はトップ10とトップ20のリコールをそれぞれ15.6%,14.4%(相対)改善することがわかった。
また, 抽出IDは, MSMARCOのスニペットではなく, ウィキペディア記事の抽象IDよりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:26:09 GMT)
Navigating the Safety Landscape: Measuring Risks in Finetuning Large Language Models [65.1] 大規模言語モデル(LLM)が人間の嗜好に合わせて行動し、推論中に有害な行動を防ぐためには、安全性の調整が不可欠である。
我々は, LLMの安全景観をナビゲートすることで, LLMの微調整のリスクを測定することを目的としている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:35:59 GMT)
ThreatKG: An AI-Powered System for Automated Open-Source Cyber Threat Intelligence Gathering and Management [65.0] ThreatKGはOSCTIの収集と管理のための自動化システムである。
複数のソースから多数のOSCTIレポートを効率的に収集する。
さまざまな脅威エンティティに関する高品質な知識を抽出するために、AIベースの専門技術を使用する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:04:34 GMT)
Text-Guided Attention is All You Need for Zero-Shot Robustness in Vision-Language Models [64.7] ゼロショットロバストネス(TGA-ZSR)のためのテキストガイド型アテンションを提案する。
我々のゴールは、CLIPモデルの一般化を維持し、敵の堅牢性を高めることである。
本手法は,現在の最先端技術よりも9.58%の精度でゼロショット精度を向上する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:22:55 GMT)
Chain of Ideas: Revolutionizing Research Via Novel Idea Development with LLM Agents [64.6] 科学文献の急激な増加は、研究者が最近の進歩と意義ある研究方向を見極めるのを困難にしている。
大規模言語モデル(LLM)の最近の発展は、新しい研究のアイデアを自動生成するための有望な道のりを示唆している。
本研究では, チェーン構造に関連文献を整理し, 研究領域の進展を効果的に反映する, LLMベースのエージェントであるChain-of-Ideas(CoI)エージェントを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:17:59 GMT)
Interpretable Multi-View Clustering Based on Anchor Graph Tensor Factorization [64.0] アンカーグラフの分解に基づくマルチビュークラスタリング法では,分解行列に対する適切なクラスタ解釈性が欠如している。
複数のビューからアンカーグラフを合成するアンカーグラフテンソルを分解するために、非負のテンソル因子分解を用いることにより、この制限に対処する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:03:58 GMT)
TPP-Gaze: Modelling Gaze Dynamics in Space and Time with Neural Temporal Point Processes [64.0] ニューラル・テンポラル・ポイント・プロセス(TPP)に基づく新規かつ原則化されたスキャンパスダイナミクスのアプローチであるTPP-Gazeを提案する。
提案手法は,最先端手法と比較して総合的に優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:22:38 GMT)
Stealing User Prompts from Mixture of Experts [62.8] 敵がExpert-Choice-Routingを利用して被害者のプロンプトを完全に開示する方法を示す。
これは、ユーザープロンプトを抽出するためにアーキテクチャ上の欠陥を利用する最初の攻撃である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:25:35 GMT)
Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.7] 雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:17:45 GMT)
CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.8] 人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:06:44 GMT)
MoLE: Enhancing Human-centric Text-to-image Diffusion via Mixture of Low-rank Experts [61.3] 顔と手の文脈における人間中心のテキスト・ツー・イメージ生成について検討する。
そこで我々は,手近画像と顔画像で訓練した低ランクモジュールをそれぞれ専門家として考慮し,Mixture of Low-rank Experts (MoLE) という手法を提案する。
この概念は、カスタマイズされたクローズアップデータセットによって訓練された低ランクモジュールが、適切なスケールで適用された場合、対応する画像部分を強化する可能性があるという、低ランクリファインメント(low-rank refinement)の観察から着想を得たものである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:59:57 GMT)
GWQ: Gradient-Aware Weight Quantization for Large Language Models [61.2] 勾配対応重み量子化(GWQ)は、勾配を利用して外れ値の局所化を行う、低ビット重み量子化のための最初の量子化手法である。
GWQはFP16精度で上位1%の外れ値に対応し、残りの非外れ値重みは低ビットフォーマットで格納される。
ゼロショットタスクでは、GWQ量子化モデルは他の量子化法よりも精度が高い。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:16:04 GMT)
Statistical-Computational Trade-offs for Density Estimation [60.8] 幅広い種類のデータ構造に対して、それらの境界は著しく改善されないことを示す。
これは密度推定のための新しい統計計算トレードオフである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:03:33 GMT)
A Theoretical Perspective for Speculative Decoding Algorithm [60.8] EmphSpeculative Decodingは、小さなモデルを使用して、ドラフトトークンのシーケンスと、検証のための大きなモデルをサンプリングする。
本稿では,マルコフ連鎖抽象化による復号化問題を概念化し,理論的な観点から,鍵特性,エファンアウトプットの品質,推論加速度について考察する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:53:04 GMT)
Smoke and Mirrors in Causal Downstream Tasks [59.9] 本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:10:26 GMT)
Integration of Large Language Models and Federated Learning [59.0] 本稿では,LLMとFLの融合を3つの部分に分割する研究フレームワークを提案する。
まず,LLMの領域とFLを組み合わせた研究の現状について概説する。
次に、医療、金融、教育などの重要なシナリオにおけるLLMとFLの組み合わせの実践的応用について論じる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:04:21 GMT)
Real-Time Personalization for LLM-based Recommendation with Customized In-Context Learning [57.3] この研究は、モデル更新なしに動的なユーザ関心に適応することを検討する。
既存のLarge Language Model (LLM)ベースのレコメンダは、レコメンデーションチューニング中にコンテキスト内学習能力を失うことが多い。
本稿では,レコメンデーション固有のインコンテキスト学習をリアルタイムレコメンデーションにカスタマイズするRecICLを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:48:36 GMT)
Certifiably Robust Policies for Uncertain Parametric Environments [57.2] 本稿ではパラメータ上の未知分布を持つパラメトリックマルコフ決定プロセス(MDP)に基づくフレームワークを提案する。
パラメータによって誘導される未知のサンプル環境に対するIMDPの学習と解析を行う。
当社のアプローチは,信頼度の高い政策のパフォーマンスに厳密な拘束力をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:55:41 GMT)
Certifiably Robust Policies for Uncertain Parametric Environments [57.2] 本稿ではパラメータ上の未知分布を持つパラメトリックマルコフ決定プロセス(MDP)に基づくフレームワークを提案する。
パラメータによって誘導される未知のサンプル環境に対するIMDPの学習と解析を行う。
当社のアプローチは,信頼度の高い政策のパフォーマンスに厳密な拘束力をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:55:41 GMT)
bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction [57.2] 疎二分量時間画像データから高画質の画像スタックを元の解像度で再構成する新しい方法であるbit2bitを提案する。
Poisson denoisingの最近の研究に触発されて、スパースバイナリ光子データから高密度な画像列を生成するアルゴリズムを開発した。
本研究では,様々な課題の画像条件下でのSPADの高速映像を多種多種に含む新しいデータセットを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:30:35 GMT)
Learning to Route for Dynamic Adapter Composition in Continual Learning with Language Models [56.9] 本稿では,新たなPEFTモジュールのトレーニングを分離し,タスクの専門化を保証する手法であるL2Rを提案する。
その後、L2Rは学習したモジュールを学習し、以前見たタスクの例を含む小さなメモリを利用するルータのネットワークをトレーニングする。
その結果,L2RはPEFTモジュールの効率的な構成を提供し,他の手法と比較して一般化と性能が向上した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:38:27 GMT)
H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables [56.7] 本稿では,2段階のプロセスにシンボル的アプローチと意味的アプローチ(テキスト的アプローチ)を統合し,制約に対処する新しいアルゴリズムを提案する。
実験の結果,H-STARは3つの質問応答(QA)と事実検証データセットにおいて,最先端の手法を大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:44:31 GMT)
Immiscible Diffusion: Accelerating Diffusion Training with Noise Assignment [56.6] 準最適雑音データマッピングは拡散モデルの遅い訓練につながる。
物理学における不和性現象からインスピレーションを得て,不和性拡散を提案する。
我々のアプローチは極めて単純で、各画像の拡散可能な領域を制限するために1行のコードしか必要としない。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:30:45 GMT)
MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.4] 本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:06:43 GMT)
CLIPErase: Efficient Unlearning of Visual-Textual Associations in CLIP [56.2] CLIPEraseは視覚的・テキスト的関連を選択的に忘れる新しいアプローチである。
CIFAR-100とFlickr30Kデータセットの実験は、CLIPEraseがマルチモーダルサンプルのゼロショットタスクにおける指定された関連性を効果的に忘れていることを示している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:51:31 GMT)
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs [55.8] VideoLLaMA 2は、ビデオおよびオーディオ指向タスクにおける時空間モデリングと音声理解を強化するために設計されたビデオ大言語モデル(Video Large Language Models, Video-LLMs)のセットである。
VideoLLaMA 2は、オープンソースモデル間の競争結果を一貫して達成し、いくつかのベンチマークでいくつかのプロプライエタリなモデルに近づいた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:49:54 GMT)
MILP-StuDio: MILP Instance Generation via Block Structure Decomposition [55.8] Mixed-integer linear programming (MILP) は、多くの応用において最も一般的な数学的定式化の1つである。
我々は,ブロック構造を保存して高品質なインスタンスを生成するために,ブロック構造分解(MILP-StuDio)と呼ばれる新しいMILP生成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:33:27 GMT)
Grounding by Trying: LLMs with Reinforcement Learning-Enhanced Retrieval [55.6] 大きな言語モデル(LLM)は、しばしば適切な検索クエリのポーズに苦労する。
私たちは$underlineLe$arningを$underlineRe$trieveに$underlineT$rying (LeReT)を導入します。
LeReTは、検索クエリを探索し、好みベースの最適化を使用して品質を改善する強化学習フレームワークである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:02:54 GMT)
Entrywise error bounds for low-rank approximations of kernel matrices [55.5] 切り抜き固有分解を用いて得られたカーネル行列の低ランク近似に対するエントリーワイド誤差境界を導出する。
重要な技術的革新は、小さな固有値に対応するカーネル行列の固有ベクトルの非局在化結果である。
我々は、合成および実世界のデータセットの集合に関する実証的研究により、我々の理論を検証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:17:22 GMT)
OS-ATLAS: A Foundation Action Model for Generalist GUI Agents [55.4] OS-AtlasはGUIグラウンディングとOODエージェントタスクに優れた基礎的なGUIアクションモデルである。
現在までに1300万以上のGUI要素を含む、オープンソースのクロスプラットフォームGUI基盤コーパスをリリースしています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:10:19 GMT)
MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.2] 大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:07:26 GMT)
A Strong Baseline for Semi-Supervised Incremental Few-Shot Learning [54.6] 少ないショット学習は、限られたトレーニングサンプルを持つ新しいクラスに一般化するモデルを学ぶことを目的としている。
本研究では,(1)信頼できない擬似ラベルによる基本クラスと新クラスのあいまいさを緩和する高度に設計されたメタトレーニングアルゴリズム,(2)ラベルの少ないデータとラベルなしデータを用いて基礎知識を保ちながら,新クラスの識別的特徴を学習するモデル適応機構を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:27:48 GMT)
Efficient Adaptation of Pre-trained Vision Transformer via Householder Transformation [53.9] 一般的な戦略である。
事前訓練された視覚変換器(ViT)のPEFT(Efficient Fine-Tuning)は、下流タスクにモデルを適応させる。
適応行列を表現するために,Singular Value Decomposition (SVD) にインスパイアされた新しいPEFT手法を提案する。
SVDは行列を左ユニタリ行列、スケーリング値の対角行列、右ユニタリ行列の積に分解する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:08:30 GMT)
Data subsampling for Poisson regression with pth-root-link [53.6] ポアソン回帰のためのデータサブサンプリング手法を開発し解析する。
特に,ポアソン一般化線形モデルと ID-および平方根リンク関数について考察する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:09:05 GMT)
Trade-Offs of Diagonal Fisher Information Matrix Estimators [53.4] Fisher情報行列は、ニューラルネットワークのパラメータ空間の局所幾何学を特徴付けるのに使うことができる。
精度とサンプルの複雑さが関連する分散に依存する2つの人気推定器について検討する。
分散のバウンダリを導出し、回帰と分類のためにニューラルネットワークでそれらをインスタンス化する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:29:10 GMT)
SongCreator: Lyrics-based Universal Song Generation [53.2] SongCreatorは、声楽と伴奏の両方で曲を生成するという課題に取り組むために設計された曲生成システムである。
モデルには2つの新しいデザインがある: ボーカルの情報と伴奏を収録するための巧妙に設計された二重系列言語モデル (M) と、DSLMのための一連の注意マスク戦略である。
実験では,8つのタスクすべてに対して,最先端ないし競争的なパフォーマンスを実現することにより,SongCreatorの有効性を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:44:46 GMT)
Search for Efficient Large Language Models [53.0] 大規模言語モデル(LLMs)は、人工知能研究の領域で長い間停滞してきた。
軽量プルーニング、量子化、蒸留がLLMの圧縮に取り入れられ、メモリの削減と推論の加速を狙った。
ほとんどのモデル圧縮技術は、最適アーキテクチャの探索を見越して重量最適化に重点を置いている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:04:01 GMT)
EMMA: End-to-End Multimodal Model for Autonomous Driving [52.9] 本稿では,自動走行のためのエンドツーエンドマルチモーダルモデルEMMAを紹介する。
EMMAはマルチモーダルな大規模言語モデル基盤に基づいて構築され、生のカメラセンサーデータを様々な駆動特有の出力に直接マッピングする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:46:31 GMT)
GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks [52.3] GTSingerは、リアルタイム音楽スコアを備えた無料の歌唱コーパスで、すべての歌唱タスクとベンチマーク用に設計されている。
高品質な歌声を80.59時間収集し、最大の歌唱データセットを形成する。
GTSingerの使用を容易にするために,技術制御可能な歌唱音声合成,技術認識,スタイル伝達,音声歌唱変換の4つのベンチマーク実験を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:37:33 GMT)
GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks [52.3] GTSingerは、グローバルで、多技術で、無料で使える、高品質な歌唱コーパスで、リアルな音楽スコアがある。
高品質な歌声を80.59時間収集し、最大の歌唱データセットを形成する。
我々は,技術制御可能な歌唱音声合成,技術認識,スタイル伝達,音声歌唱変換の4つのベンチマーク実験を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:37:33 GMT)
GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks [52.3] GTSingerは、グローバルで、多技術で、無料で使える、高品質な歌唱コーパスで、リアルな音楽スコアがある。
高品質な歌声を80.59時間収集し、最大の歌唱データセットを形成する。
我々は,技術制御可能な歌唱音声合成,技術認識,スタイル伝達,音声歌唱変換の4つのベンチマーク実験を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:37:33 GMT)
GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks [52.3] GTSingerは、グローバルで、多技術で、無料で使える、高品質な歌唱コーパスで、リアルな音楽スコアがある。
高品質な歌声を80.59時間収集し、最大の歌唱データセットを形成する。
我々は,技術制御可能な歌唱音声合成,技術認識,スタイル伝達,音声歌唱変換の4つのベンチマーク実験を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:37:33 GMT)
Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [52.2] この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。
大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。
研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:49:43 GMT)
Differentially Private Representation Learning via Image Captioning [51.5] 画像キャプションとインターネット規模のマルチモーダルデータセットのスケールアップにより,効率的なDP表現学習が可能であることを示す。
LAION-2Bの233Mサブセット上のDPイメージキャプタ(DP-Cap)を,合理的な計算量を用いてスクラッチからトレーニングした。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:55:58 GMT)
Embedding Trajectory for Out-of-Distribution Detection in Mathematical Reasoning [50.8] 数理推論におけるOOD検出にトラジェクトリボラティリティを用いたトラジェクトリベースのTVスコアを提案する。
本手法は, 数学的推論シナリオ下でのGLM上での従来のアルゴリズムよりも優れる。
提案手法は,複数選択質問などの出力空間における高密度特徴を持つアプリケーションに拡張することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:10:42 GMT)
NeoRL: Efficient Exploration for Nonepisodic RL [50.7] 非線形力学系における非線形強化学習(RL)の問題点について検討する。
我々は不確実性に直面した楽観主義の原理に基づくNonepisodic Optimistic RL(NeoRL)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:43:55 GMT)
3D Crowd Counting via Geometric Attention-guided Multi-View Fusion [50.5] 本稿では,3次元シーンレベルの密度マップと3次元特徴融合により,多視点群カウントタスクを解くことを提案する。
2D融合と比較すると、3D融合はz次元(高さ)に沿った人々のより多くの情報を抽出し、複数のビューにわたるスケールの変動に対処するのに役立つ。
3D密度マップは、和がカウントである2D密度マップの特性を保ちながら、群衆密度に関する3D情報も提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:53:25 GMT)
MC-MKE: A Fine-Grained Multimodal Knowledge Editing Benchmark Emphasizing Modality Consistency [50.4] MLLM(Multimodal large language model)は、非現実的または時代遅れの知識問題を引き起こす。
マルチモーダルな知識を視覚的およびテキスト的構成要素に分解する。
本稿では,マルチモーダル知識編集ベンチマークMC-MKEを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:04:59 GMT)
Auditing for Bias in Ad Delivery Using Inferred Demographic Attributes [50.4] 広告配信のブラックボックス監査において,予測誤差が偏見の監査に与える影響について検討した。
本稿では,広告配信アルゴリズムのスキュー評価において,推測誤差を軽減する手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:57:03 GMT)
Toward Understanding In-context vs. In-weight Learning [50.2] 本研究は,文脈内学習の出現と消失を引き起こす簡易な分布特性を同定する。
そして、この研究を完全な大規模言語モデルに拡張し、自然言語プロンプトの様々なコレクションの微調整が、文脈内および重み付き学習の振る舞いをいかに引き出すかを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:09:00 GMT)
Learning to Achieve Goals with Belief State Transformers [50.2] ビリーフ状態変換器(Belief State Transformer)は、接頭辞と接尾辞の両方を入力として取る次世代の予測器である。
Belief State Transformerは、従来のフォワードオンリーのトランスフォーマーが苦労する課題を解決するために効果的に学習する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:26:06 GMT)
Training-Free Exponential Context Extension via Cascading KV Cache [49.6] カスケードサブキャッシュバッファを利用して,最も関連性の高いトークンを選択的に保持する機構を導入する。
本手法は,1Mトークンのフラッシュアテンションと比較して,プリフィルステージ遅延を6.8倍削減する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:31:09 GMT)
FLIP: Fine-grained Alignment between ID-based Models and Pretrained Language Models for CTR Prediction [49.5] クリックスルーレート(CTR)予測は、パーソナライズされたオンラインサービスにおいてコア機能モジュールとして機能する。
CTR予測のための従来のIDベースのモデルは、表形式の1ホットエンコードされたID特徴を入力として取る。
事前訓練された言語モデル(PLM)は、テキストのモダリティの文を入力として取る別のパラダイムを生み出した。
本稿では,CTR予測のためのIDベースモデルと事前学習言語モデル(FLIP)間の細粒度特徴レベルのアライメントを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:04:25 GMT)
Extensional Properties of Recurrent Neural Networks [49.3] リカレントニューラルネットワーク(RNN)の特性は、RNNアルゴリズムの特性ではなく、RNNによって計算される関数の性質である場合、エンフェクテンシャル(enmphextensional)と呼ばれる。
RNNの任意の非自明な拡張性は決定不能である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:29:02 GMT)
Limit formulas for norms of tensor power operators [49.2] 作用素 $phi:Xrightarrow Y$ がバナッハ空間の間に与えられると、そのテンソルパワーを考える。
k$ 根を取ると、$phiotimes k$ の作用素ノルムが 2$ 支配ノルムに収束することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:39:21 GMT)
HumanSplat: Generalizable Single-Image Human Gaussian Splatting with Structure Priors [47.6] HumanSplatは、単一の入力画像から、任意の人間の3次元ガウススプティング特性を予測する。
HumanSplatは、フォトリアリスティックなノベルビュー合成を実現するために、既存の最先端の手法を超越している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:50:27 GMT)
VCR-GauS: View Consistent Depth-Normal Regularizer for Gaussian Surface Reconstruction [47.6] そこで本研究では,通常のパラメータと他のパラメータを直接結合するDepth-Normal正規化器を提案する。
また,より正確な表面モデリングのために,3次元ガウス多様体のサイズと分布を規則化するための密度化と分割戦略を導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:40:39 GMT)
Learning and Transferring Sparse Contextual Bigrams with Linear Transformers [47.4] スパース・コン・ビグラム(Sparse Con Bigram)モデルを導入し、次のトークンの生成は、最後のトークンによって決定される以前の位置のスパースセットに依存する。
勾配アルゴリズムを用いた一層線形変圧器を用いて,SCB学習のトレーニングダイナミクスとサンプル複雑性を解析した。
下流と事前学習タスクの間に非自明な相関関係があることを証明し、事前訓練されたモデルから微調整することで、初期サンプル集約段階を回避できることを証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:29:10 GMT)
Causality-Enhanced Behavior Sequence Modeling in LLMs for Personalized Recommendation [47.3] 本稿では,ユーザ嗜好モデルを改善するために,CFT法を提案する。
モデル出力に対する行動系列の因果的影響を特定するために, 反ファクト推論を用いる。
実世界のデータセットの実験により、CFTは行動シーケンスモデリングを効果的に改善することを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:41:13 GMT)
Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback [45.8] ONIは、RLポリシーと本質的な報酬関数を同時に学習する分散アーキテクチャである。
提案手法は,NetHack 学習環境から得られる,難易度の高い報奨課題にまたがって,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:52:43 GMT)
MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making [45.7] MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。
割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手元にある医療タスクに合わせて調整される。
MDAgentsは医療知識の理解を必要とするタスクに関する10のベンチマークのうち7つのベンチマークで最高のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:32:43 GMT)
Causal Deciphering and Inpainting in Spatio-Temporal Dynamics via Diffusion Model [45.5] CaPaintは2段階のプロセスで因果推論能力を備えたデータとエンドウモデルの因果領域を特定することを目的としている。
微調整未条件拡散確率モデル(DDPM)を生成前として, 環境成分として定義されたマスクを埋め込む。
5つの実世界のSTベンチマークで実施された実験は、CaPaintの概念の統合により、モデルが4.3%から77.3%の改善を達成できることを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:52:32 GMT)
Causal Deciphering and Inpainting in Spatio-Temporal Dynamics via Diffusion Model [45.5] CaPaintは2段階のプロセスで因果推論能力を備えたデータとエンドウモデルの因果領域を特定することを目的としている。
微調整未条件拡散確率モデル(DDPM)を生成前として, 環境成分として定義されたマスクを埋め込む。
5つの実世界のSTベンチマークで実施された実験は、CaPaintの概念の統合により、モデルが4.3%から77.3%の改善を達成できることを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:52:32 GMT)
Unleashing the Potential of Open-set Noisy Samples Against Label Noise for Medical Image Classification [45.3] 医用画像分類タスクのための拡張ノイズ・ロバスト・コントラスト・オープンセット機能拡張フレームワークを提案する。
このフレームワークにはExtensioned Noise-robust Supervised Convistive Lossが含まれている。
また、機能レベルでオープンセットのサンプルを豊かにするOpen-set Feature Augmentationモジュールを開発し、それらを動的クラスラベルに割り当てます。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:11:52 GMT)
Adam with model exponential moving average is effective for nonconvex optimization [45.2] 本稿では,Adamのような適応最適化アルゴリズムと(II)指数移動平均(EMA)モデルという,大規模かつ複雑なモデルのトレーニングのための2つの現代的な最適化手法に関する理論的解析を行う。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:51:28 GMT)
Identifiability Analysis of Linear ODE Systems with Hidden Confounders [45.1] 本稿では,隠れた共同設立者を組み込んだ線形ODEシステムにおける識別可能性の体系的解析について述べる。
最初のケースでは、潜伏した共同設立者は因果関係を示さないが、その進化は特定の形態に固執する。
その後、この分析を、隠れた共同創設者が因果依存性を示すシナリオにまで拡張する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:46:38 GMT)
Interaction-Force Transport Gradient Flows [45.1] 本稿では,非負測度および確率測度に対する新しい勾配流散逸幾何学を提案する。
We propose the interaction-force transport (IFT) gradient flow, we proposed the interaction-force transport (IFT) gradient flow。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:28:44 GMT)
Cryogenic Control and Readout Integrated Circuits for Solid-State Quantum Computing [45.0] 低温集積回路(ICs)は、室温エレクトロニクスの代替となる可能性がある。
低温で作動すると 電子ノイズが抑制され クビット制御精度が向上する
CMOS ICでは、低温電界効果トランジスタの信頼性が低いため、回路設計の不確かさが生じる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:52:41 GMT)
AugTriever: Unsupervised Dense Retrieval and Domain Adaptation by Scalable Data Augmentation [44.9] 擬似クエリドキュメントペアを作成することにより,アノテーションフリーでスケーラブルなトレーニングを可能にする2つのアプローチを提案する。
クエリ抽出方法は、元のドキュメントから有能なスパンを選択して擬似クエリを生成する。
転送クエリ生成方法は、要約などの他のNLPタスクのために訓練された生成モデルを使用して、擬似クエリを生成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:36:38 GMT)
On the Optimality of Dilated Entropy and Lower Bounds for Online Learning in Extensive-Form Games [44.9] 1次法は、大規模な広角ゲームにおいて最もスケーラブルな平衡計算アルゴリズムであることは間違いない。
戦略の正則化として機能する距離生成関数を選択する必要がある。
重み付き拡張エントロピー(DilEnt)距離生成関数が対数因子に最適であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:03:33 GMT)
Full Event Particle-Level Unfolding with Variable-Length Latent Variational Diffusion [44.6] 生成機械学習モデルは、多数の次元で未結合の展開を実行することを約束している。
生成的展開に対する変動潜在拡散モデル(VLD)アプローチの新たな変更について述べる。
この手法の性能は、大型ハドロン衝突型加速器における半レプトニックトップクォーク対生成の文脈で評価される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:39:15 GMT)
CooHOI: Learning Cooperative Human-Object Interaction with Manipulated Object Dynamics [44.3] CooHOIはマルチヒューマノイド物体輸送問題の解決を目的としたフレームワークである。
単一のヒューマノイドキャラクタは、人間の動きの先行から模倣学習を通じてオブジェクトと対話することを学ぶ。
そして、ヒューマノイドは、操作対象の共有ダイナミクスを考慮し、他人と協調することを学ぶ。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:58:10 GMT)
SCRREAM : SCan, Register, REnder And Map:A Framework for Annotating Accurate and Dense 3D Indoor Scenes with a Benchmark [43.9] SCRREAMは、シーン内のオブジェクトの完全な高密度メッシュのアノテーションを可能にし、実際の画像シーケンスにカメラのポーズを登録する。
データセットのアノテーションパイプラインの詳細を示し、可能なデータセットの4つのバリエーションを示す。
最近の屋内再建とSLAMのためのパイプラインは、新しいベンチマークとして機能している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:53:07 GMT)
Accelerating Transformers with Spectrum-Preserving Token Merging [43.5] PiToMeは、エネルギースコアと呼ばれる追加のメトリックを使用して、情報トークンの保存を優先する。
実験の結果,PiToMeはベースモデルの40~60%のFLOPから保存されていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:22:53 GMT)
ChatQA: Surpassing GPT-4 on Conversational QA and RAG [43.3] 検索強化世代(RAG)と会話型質問応答(QA)においてGPT-4より優れたモデル群であるChatQAを紹介する。
効率的な検索のために,対話型QAに最適化された高密度検索手法を導入する。
提案するChatRAG Benchは、RAG、テーブル関連QA、算術計算、および解決不可能な質問を含むシナリオに関する総合的な評価を含む10のデータセットを含む。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:58:14 GMT)
Transfer Learning for Diffusion Models [43.1] 拡散モデルは高品質な合成サンプルを一貫して生成する。
コレクションコストや関連するリスクのため、現実のアプリケーションでは実用的ではありません。
本稿では,従来の微調整法や正規化法とは異なる新しいアプローチであるTransfer Guided Diffusion Process (TGDP)を紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:48:50 GMT)
DisenTS: Disentangled Channel Evolving Pattern Modeling for Multivariate Time Series Forecasting [43.1] DisenTSは、一般的な時系列予測において、不整合チャネル進化パターンをモデル化するための調整されたフレームワークである。
本稿では,予測器の状態と入力系列の特性の両方に応じて適応的にルーティング信号を生成する,新しいフォアキャスタ・アウェアゲート(FAG)モジュールを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:46:14 GMT)
Position Coupling: Improving Length Generalization of Arithmetic Transformers Using Task Structure [42.9] 本稿では,タスクの構造をトランスフォーマーの位置エンコーディングに組み込む,シンプルで効果的な位置結合法を提案する。
1桁から30桁の加算でトレーニングされたモデルでは、最大200桁の加算を一般化できることを示す。
また,Nx2乗算や2次元タスクなど,他のアルゴリズムタスクにも位置カップリングが適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:50:43 GMT)
ReferEverything: Towards Segmenting Everything We Can Speak of in Videos [42.9] 本稿では、自然言語で記述可能なビデオのセグメンテーションフレームワークREMを提案する。
提案手法は,インターネット規模のデータセット上での映像拡散モデルから学習した視覚表現に重きを置いている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:59:26 GMT)
SpatialPIN: Enhancing Spatial Reasoning Capabilities of Vision-Language Models through Prompting and Interacting 3D Priors [42.9] 空間的視覚的質問応答(VQA)において、最先端の空間的推論強化VLMを訓練する
本研究では,VLMの空間的推論能力を高めるためのフレームワークであるSpatialPINを提案する。
我々の空間推論型VLMは、空間的VQAの様々な形態でうまく機能し、ピックやスタック、軌道計画といった下流ロボット作業に役立てることができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:47:52 GMT)
CrossEarth: Geospatial Vision Foundation Model for Domain Generalizable Remote Sensing Semantic Segmentation [42.2] RSDGセマンティックセグメンテーションのための第1ビジョン基盤モデルであるCrossEarthを紹介する。
CrossEarthは、特別に設計されたデータレベルのEarth-Style Injectionパイプラインを通じて、強力なクロスドメインの一般化を実証する。
セマンティックセグメンテーションタスクのために,28のクロスドメイン設定,スペクトル帯域,プラットフォーム,気候を含むRSDGベンチマークをキュレートした。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:22:37 GMT)
Breach By A Thousand Leaks: Unsafe Information Leakage in `Safe' AI Responses [42.1] モデル出力の不可避な情報漏洩に基づく新しい安全性評価フレームワークを提案する。
我々は,情報検閲の安全性を確保するために,防衛機構が情報検閲を確実にする必要があることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:16:44 GMT)
Can Models Help Us Create Better Models? Evaluating LLMs as Data Scientists [41.9] データサイエンスにおける最も知識集約的な課題の1つに取り組むために設計された,大規模言語モデルのベンチマークを示す。
提案手法のFeatEngは,LLMの幅広い能力を安価かつ効率的に評価できることを実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:59:01 GMT)
Bandits with Preference Feedback: A Stackelberg Game Perspective [41.9] 好みのフィードバックを持つ帯域は、未知のターゲット関数を最適化する強力なツールを提供する。
ゼロサムのStackelbergゲームをエミュレートしたMAXMINLCBを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:10:52 GMT)
Automatic feature selection and weighting using Differentiable Information Imbalance [41.5] 本稿では,特徴集合間で情報内容のランク付けを行う自動データ解析手法DIIを紹介する。
地上の真理特徴空間における距離に応じて最も近い隣人に基づいて、入力特徴量の低次元部分集合を求める。
識別可能な情報不均衡を損失関数として利用することにより、入力の相対的特徴重みを最適化し、ユニットアライメントと相対的重要スケーリングを同時に行う。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:19:10 GMT)
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models [41.3] 大規模言語モデル(LLM)における動的戦略選択プロセスを誘導する新しい手法DyPlanを提案する。
DyPlanは、入力質問に条件付けられた最も適切な戦略を選択し、それに従ってLLMの応答生成を誘導する最初の決定ステップを組み込む。
実験では、DyPlanがモデルパフォーマンスを7-13%改善し、最高のベースラインモデルと比較してコストを11-32%削減できることが示された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:35:21 GMT)
Time-MMD: A New Multi-Domain Multimodal Dataset for Time Series Analysis [40.4] Time-MMDは、最初のマルチドメイン、マルチモーダル時系列データセットである。
MM-TSFlibは、最初のマルチモーダル時系列予測ライブラリである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:00:10 GMT)
MDCure: A Scalable Pipeline for Multi-Document Instruction-Following [40.2] LLMのMD能力を高めるために,スケーラブルで効果的な微調整パイプラインであるMDCureを導入する。
MDCureは、ターゲティングプロンプトを介して関連記事の集合から高品質な合成MD命令データを生成する。
また、MD設定のためのトレーニングユーティリティに基づいて生成されたデータをフィルタリングする多目的報酬モデルであるMDCureRMを導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:08:07 GMT)
Social Science Meets LLMs: How Reliable Are Large Language Models in Social Simulations? [40.0] 大きな言語モデル(LLM)は、ロールプレイングエージェントやコンピュータ社会科学(CSS)の応用を可能にするシミュレーションにますます採用されている。
本稿では,LLMに基づくシミュレーションはどの程度信頼性が高いか?」と答える。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:09:37 GMT)
TractShapeNet: Efficient Multi-Shape Learning with 3D Tractography Point Clouds [39.9] トラクトグラフィーのポイントクラウド表現を利用した新しいフレームワークTractShapeNetを導入し、5つの形状測度を計算した。
形状測定計算実験により,提案したTractShapeNetは,他のクラウドベースニューラルネットワークモデルよりも優れていることが示された。
その結果,より高速かつ効率的な形状測定計算が実現できることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:43:40 GMT)
Survey of Cultural Awareness in Language Models: Text and Beyond [39.8] 大規模言語モデル(LLM)を様々なアプリケーションに大規模に展開するには、LCMはインクリビティを確保するために、ユーザに文化的に敏感である必要がある。
文化は心理学や人類学で広く研究され、近年、LLMをより文化的に包括的にする研究が急増している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:37:50 GMT)
Tensor product random matrix theory [39.6] 相関量子系の進化に対する実時間場理論のアプローチを導入する。
初期積状態から最大エントロピーエルゴード状態まで、そのようなクロスオーバーダイナミクスの全範囲について述べる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:29:00 GMT)
Super-resolution in disordered media using neural networks [39.1] 強散乱媒体における環境媒体のグリーン関数を正確に推定するために,大規模で多様なデータセットを利用する手法を提案する。
この現象は超解像としても知られ、周囲散乱媒質が物理的イメージアパーチャを効果的に増強するため起こる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:27:58 GMT)
Learning Successor Features the Simple Way [39.1] 継承的特徴(SF)は、非定常環境において破滅的な忘れや干渉を示さない学習表現に対する潜在的な解決策を提供する。
画素から直接SFを学習する,新しい,シンプルな手法を提案する。
我々は,従来の2D (Minigrid), 3D (Miniworld) mazes, Mujocoの2つの学習シナリオにおいて,1つの学習シナリオと連続的な学習シナリオの両方において,アプローチが既存のSF学習手法より優れているか,あるいは優れていることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:59:48 GMT)
TreeBoN: Enhancing Inference-Time Alignment with Speculative Tree-Search and Best-of-N Sampling [39.0] 推論時アライメントは、追加のトレーニングや微調整を必要とせずに、大きな言語モデルの性能を向上させる。
Best-of-N (BoN) サンプリングは、単純だが強力なアプローチであり、複数のレスポンスを生成し、最良のものを選択する。
我々は、投機的木探索戦略をBest-of-N(BoN)サンプリングに統合する新しいフレームワークであるTreeBoNを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:02:08 GMT)
LEGO_HQEC: A Software Tool for Analyzing Holographic Quantum Codes [38.7] ホログラフィック符号は、ホログラフィックバルク/境界双対性から派生したサブシステム符号である。
このパッケージは、正規双曲のホログラフィックコードを構築し、それらの安定化器ジェネレータと論理演算子を生成する。
3つのデコーダは、ガウス除去に基づく消去デコーダ、整数最適化デコーダ、テンソルネットワークデコーダである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:54:11 GMT)
Leveraging Language Models and Bandit Algorithms to Drive Adoption of Battery-Electric Vehicles [38.4] 我々は、バッテリー電気自動車の導入を動機づける理解価値に関する先行研究を活用している。
我々は,各研究参加者の価値観に合わせた対話的介入を開発する。
我々は文脈的帯域幅アルゴリズムを用いて、各参加者の人口統計に基づく目標値の学習を行う。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:15:43 GMT)
Storage and retrieval of two unknown unitary channels [37.9] 未知のユニタリが2つのオプションから等しい事前確率で選択される場合を考える。
まず、最適なストレージ戦略が未知のユニタリの$n$利用のシーケンシャルな適用に関係していることを証明する。
次に、不整合な「対策前処理」検索が、検索した操作と元の(キュービット)ユニタリとの間の最大忠実度を実現することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:27:46 GMT)
Operator World Models for Reinforcement Learning [37.7] Policy Mirror Descent (PMD) は、シーケンシャルな意思決定のための強力で理論的に健全な方法論である。
明示的なアクション値関数が利用できないため、強化学習(Reinforcement Learning, RL)には直接適用できない。
本研究では,条件付き平均埋め込みを用いた環境のワールドモデル学習に基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:58:12 GMT)
When to Sense and Control? A Time-adaptive Approach for Continuous-Time RL [37.6] 離散時間マルコフ決定過程(MDP)の最適化における強化学習(RL)の特長
この課題に対処するRLフレームワークであるTime-Adaptive Control & Sensing(TaCoS)を形式化する。
我々は、TaCoSで訓練された最先端のRLアルゴリズムが、その離散時間に対する相互作用量を劇的に削減できることを実証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:45:36 GMT)
Improved Few-Shot Jailbreaking Can Circumvent Aligned Language Models and Their Defenses [37.6] 多数のデモ(最大数百)は、その長いコンテキスト能力を活用することで、最先端のLDMをジェイルブレイクすることができる。
本稿では,[/INST]のような特別なシステムトークンの注入や,収集したデモプールからのデモレベルのランダム検索などの改良手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:08:42 GMT)
Is Function Similarity Over-Engineered? Building a Benchmark [37.3] 我々は、現実世界のユースケースをよりよく反映した高品質なデータセットとテストからなるバイナリ関数類似性検出のための新しいベンチマークを構築します。
我々のベンチマークでは、関数の生のバイトだけを見て、分解やその他の前処理を必要としない新しい単純なベースラインが、複数の設定で最先端のパフォーマンスを達成できることが判明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:59:46 GMT)
$100K or 100 Days: Trade-offs when Pre-Training with Academic Resources [37.1] プレトレーニングは計算集約的なことで知られ、学術研究者はリソース不足で有名です。
このようなリソース上でモデルを複製する時間を経験的に測定します。
我々は、価格と事前訓練時間のトレードオフを明らかにするために、費用対効果分析で締めくくります。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:46:20 GMT)
Towards Population Scale Testis Volume Segmentation in DIXON MRI [37.0] 本稿では,英国ビオバンクの磁気共鳴イメージングデータを用いて,精巣体積のセグメンテーション法の評価を行った。
最適なモデルでは、平均的なダイススコアが0.87ドルであり、同じデータセット上で人間の相互信頼度が0.83ドルであるのに対して、中央のダイススコアが0.83ドルである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:03:55 GMT)
Certification for Differentially Private Prediction in Gradient-Based Training [36.7] 我々は凸緩和と有界伝播を用いて、予測の局所的および滑らかな感度の証明可能な上界を計算する。
このバウンダリによって、プライベートな予測設定で付加されるノイズの規模を減らしたり、プライバシ会計を改善することができます。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:40:19 GMT)
How Do Large Language Models Acquire Factual Knowledge During Pretraining? [36.6] 本研究では,大規模言語モデル(LLM)が事前学習中に事実知識を取得する方法を検討する。
発見は、事前訓練中の事実知識獲得のダイナミクスに関するいくつかの重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:16:19 GMT)
LoFLAT: Local Feature Matching using Focused Linear Attention Transformer [36.5] We propose the LoFLAT, a novel Local Feature matching using Focused Linear Attention Transformer。
私たちのLoFLATは、Feature extract Module、Feature Transformer Module、Matching Moduleの3つの主要なモジュールで構成されています。
提案した LoFLAT は効率と精度の両方で LoFTR 法より優れている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:38:07 GMT)
MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention [36.5] Minference (Milliontokens Inference) は長周期処理の前処理を高速化するスパース計算法である。
我々は,MInferenceが精度を維持しつつ,A100にプリフィルする際の推論遅延を最大10倍に効果的に低減できることを実証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:53:22 GMT)
Exploring Design Choices for Building Language-Specific LLMs [36.3] 単言語モデルと多言語モデルを適用し,言語固有の言語モデルの構築について検討する。
LLMの初期性能は適応後の最終性能と必ずしも相関しないことがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:33:48 GMT)
V2X-Assisted Distributed Computing and Control Framework for Connected and Automated Vehicles under Ramp Merging Scenario [36.2] 本稿では,サイバー物理システム下でのランプシナリオにおけるコネクテッドおよび自動車両(CAV)の分散コンピューティング制御について検討する。
既存の手法とは異なり,本手法では,計算タスクをCAV間で分散し,V2X通信による並列計算を行うことができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:56:49 GMT)
Bayesian Collaborative Bandits with Thompson Sampling for Improved Outreach in Maternal Health Program [36.1] モバイルヘルス(mHealth)プログラムは、受益者への自動健康情報呼び出しのタイミングを最適化する上で、重要な課題に直面している。
本稿では,この協調バンディット問題に対するトンプソンサンプリングを用いた原理的アプローチを提案する。
我々は,世界最大規模の母体mHealthプログラムから,実世界のデータセット上での最先端のベースラインを大幅に改善したことを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:19:24 GMT)
ETO:Efficient Transformer-based Local Feature Matching by Organizing Multiple Homography Hypotheses [35.3] 局所的な特徴マッチングのための効率的なトランスフォーマーベースネットワークアーキテクチャを提案する。
YFCC100Mデータセットでは、我々のマッチング精度は最先端のトランスフォーマーベースのアーキテクチャであるLoFTRと競合する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:39:27 GMT)
Incorporating Test-Time Optimization into Training with Dual Networks for Human Mesh Recovery [35.1] 本稿では,トレーニングタイムとテストタイムの目標を統一するデュアルネットワークアーキテクチャを提案する。
メタラーニングと双対ネットワークを併用した手法は、最先端の回帰ベースおよび最適化ベースのHMRアプローチより優れている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:24:42 GMT)
Neural Attention Field: Emerging Point Relevance in 3D Scenes for One-Shot Dexterous Grasping [35.0] 被写体と文脈のバリエーションのある新しいシーンに、巧妙なつかみをワンショットで移動させることは、難しい問題である。
本稿では,3次元空間における意味認識型高次特徴体を表現するためのテクスチュラルアテンション場を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:06:51 GMT)
Generalization Bounds via Conditional $f$-Information [34.9] 条件付き$f$-informationフレームワークを用いて,新しい情報理論の一般化バウンダリを導入する。
スーパーサンプル設定における$f$-informationを介して一般化境界を導出するための一般的なアプローチを提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:33:07 GMT)
Proportional Fairness in Non-Centroid Clustering [34.9] 我々は、グループフェアネスを保証することを目的として、最近開発された、比例フェアクラスタリングのフレームワークを再考する。
フレームワークを非セントロイドクラスタリングに拡張し、エージェントの損失はそのクラスタ内の他のエージェントの関数である。
我々は、GreedyCaptureアルゴリズムの適応を用いて、我々が確立できる最良の近似が自然損失関数には適用されないことを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:53:49 GMT)
Recent Trends of Multimodal Affective Computing: A Survey from NLP Perspective [34.8] マルチモーダル感情コンピューティング(MAC)は、人間の行動や意図の分析に広く応用されているため、注目を集めている。
本調査は,NLPの観点からのマルチモーダル感情コンピューティングの最近のトレンドを4つのホットタスクにまとめる。
本調査の目的は、マルチモーダル感情研究の現在の展望を探求し、開発動向を特定し、様々なタスクにおける類似点と相違点を明らかにすることである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:42:55 GMT)
Learning General Parameterized Policies for Infinite Horizon Average Reward Constrained MDPs via Primal-Dual Policy Gradient Algorithm [34.6] 本稿では, 制約を適切に管理し, グローバルな最適政策の実現に向けて, 後悔の少ない保証を確実にする主元的二元的ポリシー勾配アルゴリズムを提案する。
提案アルゴリズムは, 目的的後悔に対して$tildemathcalO(T4/5) $tildemathcalO(T4/5)$ 制約違反境界を達成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:42:06 GMT)
Aligning Audio-Visual Joint Representations with an Agentic Workflow [34.4] 視覚コンテンツと付随する音声信号は、自然に関節表現を定式化し、オーディオ視覚(AV)関連アプリケーションを改善する。
AVデータアライメントの重要性は、通常、高品質な表現を達成するために損なわれる。
本稿では,音声信号を視覚データに整列させることにより,データ中心の観点からのAV関節表現を改善することを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:18:53 GMT)
The Graph's Apprentice: Teaching an LLM Low Level Knowledge for Circuit Quality Estimation [34.4] We introduced VeriDistill, the first end-to-end machine learning model that direct process raw Verilog code to predict circuit quality-of-result metrics。
本モデルでは,LLMに基づく低レベル回路インサイトを予測器に転送する,新しい知識蒸留法を採用している。
実験では、VeriDistillは大規模なVerilogデータセット上で最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:20:10 GMT)
Hyperparameter Optimization in Machine Learning [34.4] ハイパーパラメータは、機械学習アルゴリズムの振る舞いを制御する設定変数である。
それらの価値の選択は、これらの技術に基づいてシステムの有効性を決定する。
我々はハイパーパラメータ最適化の統一的な処理を行い、読者に最先端技術に関する実例と洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:39:22 GMT)
VISAGE: Video Synthesis using Action Graphs for Surgery [34.2] 腹腔鏡下手術における映像生成の新しい課題について紹介する。
提案手法であるVISAGEは,アクションシーングラフのパワーを利用して,腹腔鏡下手術のシーケンシャルな特徴を捉える。
腹腔鏡下手術における高忠実度ビデオ生成について検討した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:13:18 GMT)
Latent Functional Maps: a spectral framework for representation alignment [34.2] 表現学習コミュニティに多目的フレームワークを導入し、(i)異なる空間を解釈可能な方法で比較し、その内在的類似性を測定すること、(ii)教師なしと弱教師付きの両方で対応性を見出すこと、(iii)異なる空間間の表現を効果的に伝達すること。
我々は, 縫合作業から検索作業, および複数のモダリティに至るまで, 様々なアプリケーションにおいて, フレームワークを検証し, 表現アライメントのためのスウィスアームナイフとして機能することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:47:47 GMT)
Transformation-Invariant Learning and Theoretical Guarantees for OOD Generalization [34.0] 本稿では、(データ)変換マップのクラスによって、列車とテストの分布を関連付けることができる分散シフト設定に焦点を当てる。
経験的リスク最小化(ERM)に対する学習ルールとアルゴリズムの削減を確立する。
我々は,学習ルールが分配シフトに関するゲーム理論的な視点を提供する点を強調した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:59:57 GMT)
Progressive Entropic Optimal Transport Solvers [33.8] 本稿では,計画図と輸送地図の両方を推定できる新しいEOT解法(ProgOT)を提案する。
我々は,ProgOTが標準解法よりも高速で堅牢な代替手段であることを示す実験的な証拠を提供する。
また、最適な輸送地図を推定するためのアプローチの統計的整合性も証明する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:59:51 GMT)
$\textbf{EMOS}$: $\textbf{E}$mbodiment-aware Heterogeneous $\textbf{M}$ulti-robot $\textbf{O}$perating $\textbf{S}$ystem with LLM Agents [33.8] 異種ロボット間の効果的な協調を実現するための新しいマルチエージェントフレームワークを提案する。
エージェントがロボットURDFファイルを理解し、ロボットキネマティクスツールを呼び出し、その物理能力の記述を生成する。
Habitat-MASベンチマークは、マルチエージェントフレームワークがエンボディメント認識推論を必要とするタスクをどのように処理するかを評価するように設計されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:20:01 GMT)
Efficient and Interpretable Grammatical Error Correction with Mixture of Experts [33.7] 文法的誤り訂正のための混合専門家モデルMoECEを提案する。
本モデルでは,有効パラメータの3倍少ないT5-XLの性能を実現する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:27:54 GMT)
GPT-4o reads the mind in the eyes [33.3] GPT-4oは直立顔からの精神状態の解釈において人間よりも優れていた。
GPT-4oの誤りはランダムではなかったが、高度に一貫性があり、不正確な精神状態情報の処理が明らかにされた。
これらの知見は, GPT-4oに共存する逆効果のような, 高度な精神状態推論能力と人間の顔処理のサインが如何に重要であるかを明らかにする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:30:30 GMT)
CemiFace: Center-based Semi-hard Synthetic Face Generation for Face Recognition [33.2] 顔画像と顔の同一性のある顔画像は、訓練された顔認識モデルの性能において極めて有効であることを示す。
そこで本研究では, 対象中心と様々なレベルの類似性を持つ顔サンプルを生成する, 拡散に基づく新しいアプローチ(すなわち, 中心をベースとした半硬顔生成)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:35:55 GMT)
DiffGS: Functional Gaussian Splatting Diffusion [33.1] 3D Gaussian Splatting (3DGS) はレンダリング速度と忠実度において説得力のある性能を示した。
しかし、ガウススプラッティングの生成は、その離散性と非構造的な性質のため、依然として課題である。
本稿では,潜在拡散モデルに基づく一般ガウス生成器DiffGSを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:34:49 GMT)
FlowDCN: Exploring DCN-like Architectures for Fast Image Generation with Arbitrary Resolution [33.1] 任意の解像度で高画質画像を効率よく生成できる、純粋に畳み込みに基づく生成モデルであるFlowDCNを提案する。
FlowDCNは256Times256$ ImageNet Benchmarkと同等の解像度外挿結果で最先端の4.30 sFIDを実現している。
FlowDCNはスケーラブルで柔軟な画像合成のための有望なソリューションであると考えています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:48:50 GMT)
Fair Division with Market Values [33.1] 市場価値の公平な分割モデルを導入する。
不特定商品は、(追加的な)主観的評価を持つエージェントに分割されなければならない。
市場のバリュエーションは、すべてのエージェントで同一に保持される別の追加的バリュエーションと見なすことができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:52:15 GMT)
Noise Contrastive Alignment of Language Models with Explicit Rewards [32.9] 我々は、NCEを利用して、スカラー評価で明示的に注釈付けされた報酬データセットを扱う際のギャップを埋める、LMアライメントのための一般的なフレームワークを提案する。
我々のフレームワークは2つの並列アルゴリズム、NAAとInfoNCAで構成されており、どちらも報酬データと嗜好データからLMポリシーを直接抽出することができる。
NCA と InfoNCA を比較することで,DPO/InfoNCA の減少傾向は,反応の相違による相対可能性の調整に焦点が当てられていることが示される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:29:40 GMT)
RelationBooth: Towards Relation-Aware Customized Object Generation [32.8] リレーショナルブース(RelationBooth)は、よく計算されたデータセットを通じて、アイデンティティとリレーショナルラーニングをアンハングリングするフレームワークである。
トレーニングデータには,関係固有画像,アイデンティティ情報を含む独立オブジェクト画像,関係生成をガイドするテキストプロンプトが含まれている。
まず,関係に密接に結びついたオブジェクトのポーズを調整する際に,効果的にモデルを導くキーポイントマッチング損失を導入する。
第二に、画像のプロンプトから局所的な特徴を取り入れて、オブジェクトの区別をより良くし、重複するケースの混同を防ぐ。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:57:21 GMT)
A test-free semantic mistakes localization framework in Neural Code Translation [32.5] 本稿では,Large Language Model(LLM)に基づく静的解析フレームワークであるEISPを紹介する。
このフレームワークはソースコードと翻訳されたコード間の意味マッピングを生成する。
EISPは、AIチェーンを通じて、各サブコードのフラグメントをきめ細かい知識ヒントで接続する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:53:33 GMT)
Hybrid cat-transmon architecture for scalable, hardware-efficient quantum error correction [32.5] 本研究では,ハイブリッドキャットトランスモン量子コンピューティングアーキテクチャの長期的展望について検討する。
消散性猫量子ビットはデータ量子ビットの役割を担い、エラーシンドロームはアシラリートランスモン量子ビットを用いて測定される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:10:14 GMT)
COMAL: A Convergent Meta-Algorithm for Aligning LLMs with General Preferences [32.0] 本稿では,言語モデルアライメントのためのメタアルゴリズムである Convergent Meta Alignment Algorithm (COMAL) を提案する。
我々のメタアルゴリズムは単純であり、RLHFと優先最適化のために設計された多くの既存手法と統合することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:13:02 GMT)
Score-based Causal Representation Learning: Linear and General Transformations [31.8] 本稿は、識別可能性と達成可能性の両方に対処する。
スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。
結果は構造化された合成データと画像データの実験によって実証的に検証される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:47:27 GMT)
Towards Unifying Understanding and Generation in the Era of Vision Foundation Models: A Survey from the Autoregression Perspective [31.5] 本稿では、最近の進歩を概観し、自己回帰的視覚基盤モデルの将来的な方向性について論じる。
我々は,次世代の視覚基礎モデルのトレンドを提示し,視覚タスクの理解と生成を統一する。
我々は、自己回帰的視覚基盤モデルを、その視覚トークン化剤と自己回帰バックボーンから分類する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:51:26 GMT)
SciPIP: An LLM-based Scientific Paper Idea Proposer [30.7] 本稿では,SciPIP(SciPIP)を提案する。
ユーザが提供する研究背景に基づいて、SciPIPは文学データベースから有用な論文を検索する。
次に、検索した文献から解を推測する二経路のアイデア提案戦略を導入し、一方のパスが元のアイデアを生成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:18:22 GMT)
Thank You, Stingray: Multilingual Large Language Models Can Not (Yet) Disambiguate Cross-Lingual Word Sense [30.6] 本稿では,言語間感覚曖昧化のための新しいベンチマーク,StingrayBenchを紹介する。
インドネシア語とマレー語、インドネシア語とタガログ語、中国語と日本語、英語とドイツ語の4つの言語ペアで偽の友人を集めます。
各種モデルの解析において,高リソース言語に偏りが生じる傾向が見られた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:56:17 GMT)
Emotional RAG: Enhancing Role-Playing Agents through Emotional Retrieval [30.6] 本稿では,ロールプレイングエージェントの感情状態を考慮した感情認識型記憶検索フレームワーク「感情RAG」を提案する。
本フレームワークは,ロールプレイングエージェントの個性を維持する上での感情的要因を考慮せずに,その手法より優れる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:08:50 GMT)
Constructing Multimodal Datasets from Scratch for Rapid Development of a Japanese Visual Language Model [30.1] 日本語を非英語とみなし、日本語のマルチモーダルデータセットをスクラッチから高速に作成する方法を提案する。
我々は,Webアーカイブから日本語画像テキストペアとインターリーブされたデータを収集し,既存のVLMを用いて画像から直接日本語の指導データを生成する。
実験の結果、これらのネイティブデータセットに基づいて訓練されたVLMは、機械翻訳されたコンテンツに依存するものよりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:46:33 GMT)
MALoRA: Mixture of Asymmetric Low-Rank Adaptation for Enhanced Multi-Task Learning [30.0] マルチタスクのシナリオでは、トレーニングの不均衡やシーソー効果といった課題が頻繁に現れます。
フレキシブルな微調整フレームワークとして非対称低ランク適応(MALoRA)の混合を提案する。
MALoRAはトレーニング可能なパラメータの数を30%から48%削減し、トレーニング速度を1.2倍にし、シングルタスクのLoRAモデルの計算効率に匹敵する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:53:52 GMT)
Multi-student Diffusion Distillation for Better One-step Generators [29.8] マルチスチューデント蒸留(Multi-Student Distillation、MSD)は、条件付き教師拡散モデルを複数の単段階発生器に蒸留するフレームワークである。
MSDは、複数の蒸留された学生を訓練し、より小さいサイズで、したがってより高速な推論を可能にした。
4人の同じサイズの学生を使って、MSDはワンステップ画像生成のための新しい最先端技術、ImageNet-64x64でFID 1.20、ゼロショットCOCO2014で8.20を設定。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:54:56 GMT)
Functional Gradient Flows for Constrained Sampling [29.6] 本稿では,制約付き関数勾配流(CFG)と呼ばれる,制約付きサンプリングのための新しい関数勾配ParVI法を提案する。
また、領域制約から生じる境界積分項を扱うための新しい数値戦略を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:20:48 GMT)
Geometry Cloak: Preventing TGS-based 3D Reconstruction from Copyrighted Images [29.5] 本研究では,目に見える幾何学的摂動をイメージに埋め込んだ新しい画像保護手法を提案する。
TGSがクローク画像の3D再構成を試みたときに、カスタマイズされたメッセージが符号化される。
出力品質を低下させる従来の敵攻撃とは異なり、我々の方法では、TGSは特定の方法で3D再構成を失敗させます。
この透かしにより、著作権所有者は保護された画像から作られたあらゆる3D再構築の試みに対して所有権を主張することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:34:17 GMT)
From Instance Training to Instruction Learning: Task Adapters Generation from Instructions [29.5] 本稿では,事例学習の欠点に対処するために,人間の学習をシミュレートすることに焦点を当てる。
タスク固有のモデルを自動的に構築するTAGI(Task Adapters from Instructions)を導入する。
超自然的インストラクションとP3データセットを用いたTAGIの評価を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:57:14 GMT)
Data Contamination Can Cross Language Barriers [29.1] 大規模言語モデル(LLM)の開発における不透明さは、事前学習データにおける公開ベンチマークの汚染の可能性への懸念が高まっている。
まず, 電流検出手法を回避しつつ, LLMの性能を増大させる多言語性汚染について述べる。
本稿では,このような汚染を深く隠蔽する一般化に基づく手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:59:08 GMT)
Certified Minimax Unlearning with Generalization Rates and Deletion Capacity [29.0] ミニマックスモデルに対する$(epsilon,delta)$-certified machine unlearningの問題について検討する。
我々は,全ヘッセン語に基づく完全更新のための,新しいミニマックスアンラーニングステップを開発する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:37:32 GMT)
InjecGuard: Benchmarking and Mitigating Over-defense in Prompt Injection Guardrail Models [28.9] プロンプトインジェクション攻撃は大規模言語モデル(LLM)に重大な脅威をもたらす
プロンプトガードモデルは防御に有効であるが、単語バイアスの引き金として過防衛に苦しむ。
InjecGuardは、新しいトレーニング戦略であるMitigating Over-defense for Freeを取り入れた、新しいプロンプトガードモデルである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:39:42 GMT)
U-DiTs: Downsample Tokens in U-Shaped Diffusion Transformers [28.9] 本論文では,U-DiTモデルの性能を示すために,一連のU-DiT(U-DiTs)を提案する。
提案されたU-DiTはコスト計算の1/6でDiT-XL/2を上回った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:13:42 GMT)
TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models [28.9] トマト(Tomato)は、ビデオ理解におけるMFMの時間的推論能力を厳格に評価するための新しいベンチマークである。
TOMATOは、6つのタスクにまたがる1,484件の注意深いキュレーションと人間による注釈付き質問で構成されている。
総合評価の結果, 人体モデルの性能差は57.3%であり, 最良性能モデルでは57.3%であった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:50:23 GMT)
Are Your Models Still Fair? Fairness Attacks on Graph Neural Networks via Node Injections [28.9] グラフニューラルネットワーク(GNN)では、悪意のある敵対的攻撃に直面した際の公正な脆弱性が明らかにされている。
我々は、より現実的な環境でGNNフェアネスの脆弱性を探求するノードインジェクションベースのフェアネスアタック(NIFA)を紹介する。
NIFAは、ノードの1%だけを注入することで、フェアネスを意識したGNNを含むメインストリームのGNNの公平性を著しく損なう可能性がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:56:49 GMT)
Less is More: DocString Compression in Code Generation [28.5] LLM(Large Language Models)は、関数/メソッドシグネチャとDocStringを実行可能なコードに変換するために使用される。
プロンプト圧縮の最近の進歩は自然言語処理(NLP)において有望な結果を示しているが、コード生成への適用性はまだ不明である。
コード生成のためのDocString圧縮専用の新しい圧縮手法であるShortenDocを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:17:10 GMT)
Representation Noising: A Defence Mechanism Against Harmful Finetuning [28.5] オープンソースの大規模言語モデル(LLM)のリースは、悪質なアクターがこれらのモデルを有害な目的のために簡単に微調整できるため、デュアルユースリスクをもたらす。
本稿では,攻撃者が重みにアクセスできる場合でも,防御機構であるRepresentation Noising(RepNoise)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:58:40 GMT)
einspace: Searching for Neural Architectures from Fundamental Operations [28.3] 本稿では,パラメータ化された確率的文脈自由文法に基づく検索空間であるeinspaceを紹介する。
競合アーキテクチャはゼロから検索することで得ることができ、強力なベースラインで検索を初期化する際には、常に大きな改善が得られます。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:35:56 GMT)
Learning Social Welfare Functions [27.9] 本研究では,有能な家族に属する社会福祉機能を学習する上での課題について考察する。
社会福祉情報の比較が騒々しくても, どちらの場合においても, パワー平均関数は複雑に学習可能であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:24:32 GMT)
Next-Token Prediction Task Assumes Optimal Data Ordering for LLM Training in Proof Generation [27.6] 1つのトレーニングデータサンプルの最適順序は、特定の証明ステップの関連中間監督が、その証明ステップの左側に常に配置されているときに発生すると論じる。
証明が直感的に逐次順序にある場合、トレーニングが最も効果的であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:04 GMT)
On the Credibility of Backdoor Attacks Against Object Detectors in the Physical World [27.6] アプリケーション設定における物理オブジェクトトリガーによるバックドア攻撃の有効性について検討する。
我々は、MORPHingと呼ばれる新しいコスト効率の高い攻撃方法を構築し、検出タスクのユニークな性質を取り入れた。
私たちは、現実世界のバックドア攻撃の広範なビデオテストセットをリリースしました。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:03:50 GMT)
Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting [27.5] 3Dガウススプレイティングを用いたロボットマニピュレータの能動的次ベストビューとタッチ選択のためのフレームワーク(3DGS)を提案する。
我々はまず,新しい意味深度アライメント法により,数発の3DGSの性能を向上する。
次に、3DGSの次のベストビュー選択方法であるFisherRFを拡張して、奥行きの不確実性に基づいたビューとタッチポーズを選択する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:04:12 GMT)
Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting [27.5] 3Dガウススプレイティングを用いたロボットマニピュレータの能動的次ベストビューとタッチ選択のためのフレームワーク(3DGS)を提案する。
我々はまず,新しい意味深度アライメント法により,数発の3DGSの性能を向上する。
次に、3DGSの次のベストビュー選択方法であるFisherRFを拡張して、奥行きの不確実性に基づいたビューとタッチポーズを選択する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:04:12 GMT)
NetworkGym: Reinforcement Learning Environments for Multi-Access Traffic Management in Network Simulation [27.4] 本稿では,高忠実度ネットワーク環境シミュレータであるtextitNetworkGymを紹介する。
マルチアクセストラフィック分割問題に対する異なるRLベースのソリューションのトレーニングと評価を容易にする。
また、Pessimistic TD3 (PTD3) と呼ばれるTD3+BCアルゴリズムの拡張を提案し、最先端のオフラインRLアルゴリズムよりも優れていることを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:14:33 GMT)
Real-Time Recurrent Learning using Trace Units in Reinforcement Learning [27.3] リカレントニューラルネットワーク(RNN)は、部分的に観測可能な環境で表現を学ぶために使用される。
オンラインで学び、環境と継続的に交流するエージェントにとって、リアルタイム反復学習(RTRL)でRNNを訓練することが望ましい。
これらの洞察に基づいて、オンラインRLでRNNをトレーニングするための軽量で効果的なアプローチを提供します。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:07:51 GMT)
Qibocal: an open-source framework for calibration of self-hosted quantum devices [27.2] 本稿では,超伝導量子デバイスのキャリブレーションとキャラクタリゼーションを行うオープンソースソフトウェアライブラリであるQibocalを紹介する。
単一および2ビットキャリブレーションゲートを実行するために実装されたプロトコルについて概説する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:06:53 GMT)
Qibocal: an open-source framework for calibration of self-hosted quantum devices [27.2] 本稿では,超伝導量子デバイスのキャリブレーションとキャラクタリゼーションを行うオープンソースソフトウェアライブラリであるQibocalを紹介する。
単一および2ビットキャリブレーションゲートを実行するために実装されたプロトコルについて概説する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:06:53 GMT)
Prove Your Point!: Bringing Proof-Enhancement Principles to Argumentative Essay Generation [27.1] 議論的エッセイ生成(AEG)は、特定の議論のある話題や議論に関する完全なテキストを生成することを目的としている。
提案する2段階のフレームワークは,Proof-EnhancementとSelf-Enhancementである。
PESAは強力なベースラインモデルよりも論理的妥当性と説得性に優れた議論的エッセイを生成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:13:39 GMT)
aiXcoder-7B: A Lightweight and Effective Large Language Model for Code Completion [26.9] 本稿では,aiXcoder-7Bというコード補完のための軽量で効果的なLarge Language Model (LLM)を提案する。
既存のLLMと比較すると、aiXcoder-7Bのコード補完精度は高く、スケールは小さい(70億のパラメータ)。
我々は,aiXcoder-7Bの優位性を,(1)多目的学習,(2)多種多様なデータサンプリング戦略,(3)広範囲な高品質データという3つの重要な要因とみなす。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:10:35 GMT)
A Neural Transformer Framework for Simultaneous Tasks of Segmentation, Classification, and Caller Identification of Marmoset Vocalization [26.6] マーモセットの発信者の身元、通話内容、発声の交換を知ることは不可欠である。
CNNの以前の研究は、マーモセット発声に対する呼分割、分類、発声者の識別のためのジョイントモデルを実現している。
本稿では、Transformerを用いて、マーモセット呼び出しを共同でセグメント化し、分類し、各発声者を特定することを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:57:13 GMT)
Enhancing Preference-based Linear Bandits via Human Response Time [25.9] 対話的な嗜好学習システムは、クエリを選択肢のペアとして人間に提示する。
これを解決するために、人間の反応時間を利用する。それは、相補的な情報として、逆に好みの強さと相関する。
本研究では,EZ拡散モデルに基づく計算効率のよい手法を導入し,選択時間と応答時間を組み合わせて基礎となる実用性関数を推定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:28:36 GMT)
Enhancing Preference-based Linear Bandits via Human Response Time [25.9] 対話的な嗜好学習システムは、クエリを選択肢のペアとして人間に提示する。
これを解決するために、人間の反応時間を利用する。それは、相補的な情報として、逆に好みの強さと相関する。
本研究では,EZ拡散モデルに基づく計算効率のよい手法を導入し,選択時間と応答時間を組み合わせて基礎となる実用性関数を推定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:28:36 GMT)
Epipolar-Free 3D Gaussian Splatting for Generalizable Novel View Synthesis [25.9] 一般化可能な3DGSは、フィードフォワード推論方式でスパースビュー観測から新しいシーンを再構築することができる。
既存の手法は、複雑な現実世界のシーンでは信頼できないエピポーラ先行に大きく依存している。
一般化可能な新規ビュー合成のための効率的なフィードフォワード3DGSモデルであるeFreeSplatを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:51:29 GMT)
Interpretable Mesomorphic Networks for Tabular Data [25.8] 我々は,深度と線形性の両方を同時に備えた,解釈可能なニューラルネットワークの新たなクラスを提案する。
我々は、ディープ・ハイパーネットワークを最適化し、インスタンス毎に説明可能な線形モデルを生成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:54:09 GMT)
Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control [25.2] オフライン強化学習を2段階最適化問題として定式化する。
まず、報酬のない行動データセットに関する表現的生成ポリシーを事前訓練し、次にこれらのポリシーを微調整して、Q値のようなタスク固有のアノテーションと整合させる。
この戦略により、多種多様な行動データを活用し、一般化を強化し、最小限のアノテーションを使って下流タスクへの迅速な適応を可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:31:43 GMT)
Reweighting Local Mimina with Tilted SAM [24.7] シャープネス・アウェアの最小化(SAM)は、平坦な最小値を求めることにより、無限大の一般化性能を向上させることが実証されている。
本研究では,より平坦で損失の少ない局所解に対して,効率的に高い優先度を付与するTSAM(TSAM)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:49:48 GMT)
Unifying Generation and Prediction on Graphs with Latent Graph Diffusion [24.5] グラフ学習タスクを各レベルのタスクで解くための,最初のフレームワークを提案する。
まず、回帰を含む予測タスクを一般的な(条件付き)生成フレームワークに分類する。
次に、各カテゴリのノード、エッジ、グラフレベルの特徴を同時に生成できる生成モデルであるLatent Graph Diffusion (LGD)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:07:31 GMT)
Tiny Transformers Excel at Sentence Compression [24.4] トークンを埋め込むたびに、より多くの情報を得る余地があることが示されます。
我々の研究は、たとえ小さなネットワークであっても、有効な英語文を構築することを学べることを示唆している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:34:45 GMT)
Predicting Molecular Ground-State Conformation via Conformation Optimization [24.2] 本稿では,分子基底状態のコンフォーメーションをコンフォーメーション最適化の観点から予測するConfOptという新しいフレームワークを提案する。
トレーニング中、ConfOptは予測された原子3D座標と対応する原子間距離を同時に最適化し、強い予測モデルを生み出した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:33:37 GMT)
Communication-Efficient Federated Learning over Wireless Channels via Gradient Sketching [23.5] 帯域制限の無線チャネルに適したFPS(Federated Proximal Sketching)を提案する。
FPSはバンド幅のボトルネックに対処し、効率的な圧縮を可能にするためにカウントスケッチデータ構造を使用する。
合成および実世界の両方のデータセットにおける最先端手法と比較して,FPSの安定性,精度,効率性を実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:01:08 GMT)
FuseAnyPart: Diffusion-Driven Facial Parts Swapping via Multiple Reference Images [23.5] 顔部分交換は、ターゲット画像の残りの部分を維持しつつ、ソース画像からターゲット画像への関心領域を選択的に転送することを目的としている。
フルフェイススワップ用に特別に設計されたフェイススワップに関するほとんどの研究は、個々の顔部品のスワップに関して、不可能または著しく制限されている。
FuseAnyPartは、顔のシームレスな"fuuse-any-part"カスタマイズを容易にするために提案されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:40:08 GMT)
Controlling Language and Diffusion Models by Transporting Activations [23.4] 本稿では,最適な輸送理論で導かれる活性化を制御するためのフレームワークであるアクティベーショントランスポート(AcT)を紹介する。
我々は,大規模言語モデル (LLM) とテキスト・ツー・イメージ拡散モデル (T2Is) の重要な課題に対処することで,我々のアプローチの有効性と汎用性を実験的に示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:21:33 GMT)
Dual Contrastive Transformer for Hierarchical Preference Modeling in Sequential Recommendation [23.1] シークエンシャルレコメンダシステム(SRS)は、利用者が興味を持つかもしれない後続の項目を予測することを目的としている。
既存のSRSの多くは、アイテムID情報に基づいて、ユーザによる単一の低レベルの嗜好をモデル化することが多い。
複雑な低レベルおよび高レベルの嗜好ダイナミクスをモデル化する新しい階層的嗜好モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:09:33 GMT)
Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models [23.0] 我々は,LVLM(Large Vision-Language Models)における対象と関係の幻覚を同時に測定するための統一的なフレームワークを設計する。
本稿では,トリプルトレベルの幻覚評価ベンチマークTri-HEを紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:25:06 GMT)
Diffusion for World Modeling: Visual Details Matter in Atari [22.9] 拡散世界モデルで訓練された強化学習エージェントであるDIAMOND(DIffusion As a Model of eNvironment Dreams)を紹介する。
我々は,世界モデリングに適した拡散を実現する上で必要となる重要な設計選択を解析し,視覚的詳細の改善がエージェントの性能向上にどのように寄与するかを実証する。
DIAMONDは競争力のあるAtari 100kベンチマークで平均1.46の人間正規化スコアを達成している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:34:49 GMT)
EchoFM: Foundation Model for Generalizable Echocardiogram Analysis [22.6] 心エコービデオの表現と解析に特化して設計された基礎モデルであるEchoFMを紹介する。
EchoFMでは,空間的および時間的変動の両方をキャプチャする自己教師型学習フレームワークを提案する。
我々は,290,000本以上の心エコービデオと最大2000万フレームの画像からなる広範囲なデータセット上で,我々のモデルを事前訓練した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:32:02 GMT)
Continual Learning in the Frequency Domain [22.4] 周波数領域における連続学習(CLFD)と呼ばれる新しいフレームワークを提案する。
特徴抽出器の入力特徴について、CLFDはウェーブレット変換を用いて元の入力画像を周波数領域にマッピングする。
クラウド環境とエッジ環境の両方で実施された実験により、CLFDは精度とトレーニング効率の両方において、最先端(SOTA)手法の性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:32:36 GMT)
Continual Learning in the Frequency Domain [22.4] 周波数領域における連続学習(CLFD)と呼ばれる新しいフレームワークを提案する。
特徴抽出器の入力特徴について、CLFDはウェーブレット変換を用いて元の入力画像を周波数領域にマッピングする。
クラウド環境とエッジ環境の両方で実施された実験により、CLFDは精度とトレーニング効率の両方において、最先端(SOTA)手法の性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:32:36 GMT)
Continual Learning in the Frequency Domain [22.4] 周波数領域における連続学習(CLFD)と呼ばれる新しいフレームワークを提案する。
特徴抽出器の入力特徴について、CLFDはウェーブレット変換を用いて元の入力画像を周波数領域にマッピングする。
クラウド環境とエッジ環境の両方で実施された実験により、CLFDは精度とトレーニング効率の両方において、最先端(SOTA)手法の性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:32:36 GMT)
Sketchy Moment Matching: Toward Fast and Provable Data Selection for Finetuning [22.3] 2段階のスケーラブルなデータ選択方式であるSketchy Moment Matching (SkMM)を紹介する。
第一に、バイアスは、情報的低次元部分空間に対する微調整パラメータ空間を探索する勾配スケッチを用いて制御される。
合成実験により分散バイアスバランスを向上し、実視タスクの微調整におけるSkMMの有効性を実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:03:10 GMT)
Weight Copy and Low-Rank Adaptation for Few-Shot Distillation of Vision Transformers [22.1] 視覚変換器のための新規な数ショット特徴蒸留手法を提案する。
まず、既存の視覚変換器の断続的な層から、より浅いアーキテクチャ(学生)へと重みをコピーする。
次に、Low-Rank Adaptation (LoRA) の強化版を用いて、数ショットのシナリオで学生に知識を抽出する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:27:20 GMT)
Grokked Transformers are Implicit Reasoners: A Mechanistic Journey to the Edge of Generalization [22.0] 我々は、トランスフォーマーがパラメトリック知識よりも暗黙的に推論できるかどうかを研究する。
我々は2つの代表的な推論タイプ、構成と比較に焦点を当てる。
トランスフォーマーは暗黙の推論を学習できるが、それはグルーキングでしか学べない。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:47:53 GMT)
Why Gradient Subspace? Identifying and Mitigating LoRA's Bottlenecks in Federated Fine-Tuning of Large Language Models [22.0] 本稿ではLow-Rank Adaptation (LoRA)を用いたFLフレームワークの収束と性能保証を批判的に分析する。
直接重み付けはLoRAベースの戦略よりも優れており、微調整モデルでは優れた性能が得られることを示す。
以上の結果から,GaLoreはFlexLoRAやFFA-LoRAといったフェデレートされたLoRA手法よりも,テキストや画像のモダリティにおいて優れた代替手段であることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:23:44 GMT)
Natural Counterfactuals With Necessary Backtracking [21.8] ジュデア・パールの影響力のあるアプローチは理論的にはエレガントであるが、その逆のシナリオの生成は観測されたシナリオからあまりに多くの逸脱を必要とすることが多い。
本研究では, 自然対物関係の枠組みと, 実際のデータ分布に対してより実現可能な対物関係を生成する方法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:53:11 GMT)
Segment, Shuffle, and Stitch: A Simple Layer for Improving Time-Series Representations [21.7] 時系列モデルにおける表現学習を改善するために,Segment, Shuffle, Stitch (S3) と呼ばれるニューラルネットワーク層を提案する。
S3は、元のシーケンスから重複しないセグメントを生成し、それらを学習方法でシャッフルすることで、そのタスクに最適である。
その結果,S3を組み込むことで,時系列分類や予測,異常検出といったタスクが大幅に改善され,特定のデータセットのパフォーマンスが最大68%向上することがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:18:22 GMT)
Scientific and Technological Information Oriented Semantics-adversarial and Media-adversarial Cross-media Retrieval [21.6] クロスメディア科学・技術情報検索は、クロスメディア研究における重要な課題の1つである。
本稿では,科学技術情報指向のセマンティックス・アドバイサル・メディア・クロスメディア検索手法(SMCR)を提案する。
SMCRは、メディア間のセマンティックな一貫性の喪失を最小化し、メディア間のセマンティックな識別をモデル化し、マッピング前後のセマンティックな類似性を維持する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:56:09 GMT)
CycleCrash: A Dataset of Bicycle Collision Videos for Collision Prediction and Analysis [21.6] CycleCrashは、3000のダッシュカムビデオと436,347フレームからなる新しいデータセットだ。
このデータセットは、サイクリストにとって潜在的に危険な条件に焦点を当てた、9つの異なるサイクリスト衝突予測と分類タスクを可能にする。
本稿では,ConvNeXt空間エンコーダと非定常トランスフォーマーを併用した新しい手法であるVidNeXtを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:26:52 GMT)
CycleCrash: A Dataset of Bicycle Collision Videos for Collision Prediction and Analysis [21.6] CycleCrashは、3000のダッシュカムビデオと436,347フレームからなる新しいデータセットだ。
このデータセットは、サイクリストにとって潜在的に危険な条件に焦点を当てた、9つの異なるサイクリスト衝突予測と分類タスクを可能にする。
本稿では,ConvNeXt空間エンコーダと非定常トランスフォーマーを併用した新しい手法であるVidNeXtを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:26:52 GMT)
MassSpecGym: A benchmark for the discovery and identification of molecules [21.5] 我々はMS/MSデータから分子の発見と同定のための最初の包括的なベンチマークであるMassSpecGymを提案する。
当社のベンチマークは,MS/MSスペクトルをラベル付けした高品質な画像集としては最大である。
これは、3つのMS/MSアノテーションの課題を定義している: textitde novo 分子構造の生成、分子検索、スペクトルシミュレーションである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:08:05 GMT)
Utilizing Large Language Models in an iterative paradigm with Domain feedback for Zero-shot Molecule optimization [21.3] 本稿では,シンプルなドメインフィードバックプロバイダである$textRe3$DFを提案する。
$textRe3$DFは、修飾された分子が化学的に無効である場合、外部ツールキットRDKitを使って分子を処理する。
20の単価目標に対して、$textRe3$DFは、それぞれ緩やかな閾値と厳格な閾値の下で、ヒット率を16.95%、20.76%向上させる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:54:25 GMT)
MIXAD: Memory-Induced Explainable Time Series Anomaly Detection [21.2] MIXAD(Memory Explainable Time Series Atemporally Detection)は,異常検出を解釈可能なモデルである。
また,異常時のメモリアクティベーションパターンの著しい変化を検出する新しい異常スコアリング手法を提案する。
我々のアプローチは、適切な検出性能を保証するだけでなく、解釈可能性指標の34.30%と34.51%で最先端のベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:46:23 GMT)
DiGRAF: Diffeomorphic Graph-Adaptive Activation Function [21.2] グラフニューラルネットワーク(GNN)におけるグラフデータに特化したグラフ適応型アクティベーション関数を提案する。
従来型およびグラフ固有のアクティベーション関数と比較して,DiGRAFの一貫性と優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:58:26 GMT)
Denoising diffusion probabilistic models are optimally adaptive to unknown low dimensionality [21.1] DDPMは,本質的な低次元データの自動利用により,サンプリングスピードアップを実現することができるかを検討する。
DDPMの繰り返し複雑性は$k$とほぼ線形にスケールすることが証明され、KL分散を用いて分布の相違を測定するのに最適である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:55:47 GMT)
OpenForest: A data catalogue for machine learning in forest monitoring [21.0] 森林モニタリングの促進は、人間の影響を緩和し、森林構成の理解を深める上での利点である。
空間規模で86のオープンアクセス森林データセットの概要を概観する。
これらのデータセットは、すべての利用可能なオープンアクセスフォレストデータセットを参照しようとするコントリビューションにオープンな動的カタログであるOpenForestにグループ化されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:03:34 GMT)
SINGAPO: Single Image Controlled Generation of Articulated Parts in Objects [21.0] 本稿では,単一画像から音声オブジェクトを生成する手法を提案する。
提案手法は,入力画像と視覚的に一致した音声オブジェクトを生成する。
実験の結果,本手法は音声によるオブジェクト生成における最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:01:39 GMT)
QWO: Speeding Up Permutation-Based Causal Discovery in LiGAMs [20.7] QWO は与えられた置換に対して$mathcalGpi$ の計算効率を大幅に向上させる新しい手法である。
QWOは、最先端のBICベースの手法と比較して、$O(n2)$$$(n$は変数の数)のスピードアップがあり、非常にスケーラブルである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:10:46 GMT)
Questionable practices in machine learning [20.5] 研究者が何らかの指標で最先端の結果を報告するための強いインセンティブは、しばしば疑わしい研究慣行(QRP)につながる。
報告結果を損なうことのできる44のプラクティスについて説明する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:14:35 GMT)
Banyan: Fast Rotating Leader BFT [20.5] Banyanは、単一のラウンドトリップ時間でトランザクションを確認可能な、最初の回転型リーダステートマシンレプリケーションプロトコルである。
本稿では,高速経路におけるブロック終端遅延の最適化を可能にする新しいデュアルモード機構を提案する。
評価の結果,Banyanは最先端プロトコルと比較して,レイテンシを最大30%削減できることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:55:23 GMT)
LLMs as Research Tools: A Large Scale Survey of Researchers' Usage and Perceptions [20.4] 大規模言語モデル (LLMs) は、多くの研究者が科学的な研究に利用することを検討している。
筆者らによる816件の研究論文の大規模調査を行った。
81%の研究者がすでにLLMを研究ワークフローのさまざまな側面に組み込んでいることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:25:23 GMT)
Simulation-Free Training of Neural ODEs on Paired Data [20.4] 我々は,NODEのシミュレーションフリートレーニングにフローマッチングフレームワークを用いる。
ペアデータ間で直接フローマッチングを適用することは、しばしば不定義のフローにつながることを示す。
データペアの埋め込み空間にフローマッチングを適用するための簡単な拡張を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:18:27 GMT)
Text2NKG: Fine-Grained N-ary Relation Extraction for N-ary relational Knowledge Graph Construction [20.3] Text2NKGは,n-aryリレーショナル知識グラフ構築のための,新しいn-aryリレーショナル抽出フレームワークである。
ヘテロオーダーのマージと出力マージを併用したスパンタプル分類手法を導入し,異なるアリティにおけるn-項関係抽出を実現する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:18:14 GMT)
Vision-Language Models Can Self-Improve Reasoning via Reflection [20.2] CoT(Chain-of-Thought)は,大規模言語モデル(LLM)の推論能力の向上を実証した。
本稿では,自己学習フレームワークR3Vを提案する。このフレームワークは,CoTレーショナル上でのリフレクションにより,モデルの視覚言語推論を反復的に強化する。
提案手法は, 生成した解に対する自己回帰をサポートし, テスト時間計算による性能向上を図っている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:45:00 GMT)
\textsc{Long$^2$RAG}: Evaluating Long-Context \& Long-Form Retrieval-Augmented Generation with Key Point Recall [20.0] textscLong$2$RAGベンチマークとKey Point Recall(textitKPR)メトリクスを導入します。
textscLong$2$RAGは10のドメインと8のカテゴリにまたがる280の質問からなる。
textitKPRは、LLMが検索した文書から抽出したキーポイントを生成された応答に組み込む範囲を評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:29:36 GMT)
Linear Transformers are Versatile In-Context Learners [20.0] 線形変圧器の各層が負の線形回帰問題に対する重みベクトルを維持していることを示す。
また、異なるレベルのノイズでトレーニングデータが破損する難易度シナリオにおける線形変圧器の使用についても検討する。
ここでは,線形変圧器が複雑かつ高効率な最適化アルゴリズムを発見することを実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:27:00 GMT)
ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language Models [19.9] 本稿では,新規かつ簡易な生成検索KBQAフレームワークであるChatKBQAを紹介する。
実験の結果,ChatKBQAは標準KBQAデータセット上で新たな最先端性能を実現することがわかった。
この研究は、LLMと知識グラフを組み合わせるための新しいパラダイムとして、解釈可能および知識要求型質問応答のパラダイムと見なすこともできる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:22:12 GMT)
Resource-aware Mixed-precision Quantization for Enhancing Deployability of Transformers for Time-series Forecasting on Embedded FPGAs [19.8] 本研究では、資源制約付き組み込みFPGAにおける整数のみの量子化変換器の展開課題について述べる。
モデル層にまたがって中間結果を格納するための選択可能なリソースタイプを導入し、デプロイメントのボトルネックを突破する。
また、ハードウェアレベルの量子化戦略を研究者が探求できるような、リソース対応の混合精度量子化手法も開発している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:51:39 GMT)
Resource-aware Mixed-precision Quantization for Enhancing Deployability of Transformers for Time-series Forecasting on Embedded FPGAs [19.8] 本研究では、資源制約付き組み込みFPGAにおける整数のみの量子化変換器の展開課題について述べる。
モデル層にまたがって中間結果を格納するための選択可能なリソースタイプを導入し、デプロイメントのボトルネックを突破する。
また、ハードウェアレベルの量子化戦略を研究者が探求できるような、リソース対応の混合精度量子化手法も開発している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:51:39 GMT)
Resource-aware Mixed-precision Quantization for Enhancing Deployability of Transformers for Time-series Forecasting on Embedded FPGAs [19.8] 本研究では、資源制約付き組み込みFPGAにおける整数のみの量子化変換器の展開課題について述べる。
モデル層にまたがって中間結果を格納するための選択可能なリソースタイプを導入し、デプロイメントのボトルネックを突破する。
また、ハードウェアレベルの量子化戦略を研究者が探求できるような、リソース対応の混合精度量子化手法も開発している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:51:39 GMT)
A Monte Carlo Framework for Calibrated Uncertainty Estimation in Sequence Prediction [19.7] 離散列の分布に付随する確率と信頼区間を推定するモンテカルロフレームワークを提案する。
我々のフレームワークは、自己回帰学習ニューラルネットワークとして実装されたモンテカルロシミュレータを使用して、画像入力に条件付きシーケンスをサンプリングする。
合成および実データの実験では、このフレームワークは正確な識別予測を生成するが、誤校正に悩まされる可能性がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:53:37 GMT)
DiffLight: A Partial Rewards Conditioned Diffusion Model for Traffic Signal Control with Missing Data [19.7] 本稿では,データ伝送シナリオ下での交通信号制御(TSC)のための条件拡散モデルDiffLightを紹介する。
具体的には、部分的リワード条件付き拡散(PRCD)モデルを利用して、トラフィックデータ計算と意思決定という2つの重要なサブタスクを統合する。
さらに,通信性能の向上と制御性能向上を目的とした拡散通信機構(DCM)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:47:40 GMT)
Dual-Optimized Adaptive Graph Reconstruction for Multi-View Graph Clustering [19.4] 本稿では, DOAGC という2つの最適化された適応グラフ再構成に基づく新しいマルチビューグラフクラスタリング手法を提案する。
主に、従来のGNNの利点を維持しつつ、異種グラフ問題に対処するために、従来のGNNに適合したグラフ構造を再構築することを目的としている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:50:21 GMT)
Choice between Partial Trajectories [19.4] AIエージェントは人間の選択データから好みを学ぶことが示唆されている。
このアプローチでは、エージェントがデータを解釈するために使用できる選択行動のモデルが必要です。
ブートストラップされたリターンに基づく代替モデルを考えると、部分的なリターンが将来のリターンの見積もりを追加する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:52:22 GMT)
NMformer: A Transformer for Noisy Modulation Classification in Wireless Communication [19.2] 無線通信におけるノイズレベルの異なるチャネル変調画像を予測するために,NMformerという視覚変換器(ViT)モデルを提案する。
VTはRGB画像に最も有効であるため、変調信号から星座図を生成する。
提案モデルには,2種類の予測設定(分布内と分布外)がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:10:12 GMT)
Bayesian Optimisation with Unknown Hyperparameters: Regret Bounds Logarithmically Closer to Optimal [18.9] 本稿では,Longth Scale Balancing (LB)について紹介する。
LBは、長いスケールを維持しながら、長いスケールの候補値を追加し、探索とエクスプロイトのバランスをとる。
LB はオラクルの後悔からわずか$log g(T) 離れている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:15:37 GMT)
Metric Based Few-Shot Graph Classification [18.8] 少ないショットの学習では、有効性を放棄することなく、不足するデータレシエーションに現代的なディープラーニングモデルを採用することができる。
本研究では,最先端グラフ埋め込みを用いた単純な距離メトリック学習ベースラインにより,タスクの競合的な結果が得られることを示す。
また,MixUpをベースとしたオンラインデータ拡張手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:05:29 GMT)
Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models [18.8] 本稿では,チェスやオセロ文字で訓練されたLMの設定を用いて,解釈可能な辞書学習の進展を測定することを提案する。
新しいSAEトレーニングテクニックである$textitp-annealing$を導入しました。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:21:59 GMT)
Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods [18.8] 大規模言語モデル(LLM)は、マルチタスク学習、サンプル効率、高レベルのタスク計画といった側面において強化学習(RL)を強化するための有望な道として出現する。
本稿では,情報処理装置,報酬設計装置,意思決定装置,ジェネレータの4つの役割を含む,RLにおけるLLMの機能を体系的に分類する構造的分類法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:22:46 GMT)
Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods [18.8] 大規模言語モデル(LLM)は、マルチタスク学習、サンプル効率、高レベルのタスク計画といった側面において強化学習(RL)を強化するための有望な道として出現する。
本稿では,情報処理装置,報酬設計装置,意思決定装置,ジェネレータの4つの役割を含む,RLにおけるLLMの機能を体系的に分類する構造的分類法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:22:46 GMT)
DynaMo: In-Domain Dynamics Pretraining for Visuo-Motor Control [18.7] 模倣学習は、複雑なビジュモータポリシーを訓練するための強力なツールであることが証明されている。
現在の手法では、高次元の視覚的観察を扱うために数百から数千の専門家によるデモンストレーションが必要となることが多い。
視覚表現を学習するための新しいドメイン内自己教師型DynaMoを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:48:00 GMT)
Reward Difference Optimization For Sample Reweighting In Offline RLHF [18.6] 現在のオフラインRLHFは、レスポンス間の"通常の関係"のみをキャプチャし、他よりもどのくらい好まれるかという決定的な側面を見渡します。
本稿では,リワード差分最適化(Reward Difference Optimization, RDO)と呼ばれるシンプルな解を提案する。
HHとTL;DRデータセット上の7B LLMを用いた実験は、自動測定と人的評価の両方において、本手法の有効性を裏付けるものである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:47:00 GMT)
Comparative Analysis of Demonstration Selection Algorithms for LLM In-Context Learning [18.6] コンテキスト内学習は、LLM(Large Language Models)が追加のトレーニングなしで新しいタスクを適応するのに役立ちます。
提案された実演選択アルゴリズムにもかかわらず、効率と有効性はまだ不明である。
この明快さの欠如は、これらのアルゴリズムを現実世界のシナリオに適用することを困難にしている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:11:58 GMT)
Large Language Models for Anomaly and Out-of-Distribution Detection: A Survey [18.6] 大規模言語モデル(LLM)は、自然言語処理だけでなく、より広範なアプリケーションでもその効果を実証している。
本調査は,LSMの文脈下での異常検出とOOD検出の問題点に焦点を当てた。
LLMが果たす役割に基づいて,既存のアプローチを2つのクラスに分類する新たな分類法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:18:37 GMT)
Implicit-ARAP: Efficient Handle-Guided Deformation of High-Resolution Meshes and Neural Fields via Local Patch Meshing [18.4] 本稿では,ニューラルサインされた距離場に対する局所パッチメッシュ表現について述べる。
この技術は、フラットパッチメッシュをレベルセット面に投影し変形させることにより、入力SDFのレベルセットの局所領域を識別することができる。
我々は,高分解能メッシュとニューラルフィールドのAs-Rigid-As-Possible変形を計算するために,3次元ニューラルネットワークを利用する2つの異なるパイプラインを導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:11:33 GMT)
BeGin: Extensive Benchmark Scenarios and An Easy-to-use Framework for Graph Continual Learning [18.3] 連続学習(英: Continual Learning, CL)とは、絶え間なく一連のタスクを学習する過程である。
グラフデータ(グラフCL)は、標準的な実験的な設定が欠如しているため、比較的過小評価されている。
我々は,グラフCLのための容易かつ愚かなフレームワークであるBeGinを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:37:32 GMT)
HijackRAG: Hijacking Attacks against Retrieval-Augmented Large Language Models [18.3] 我々は、新しい脆弱性、検索プロンプトハイジャック攻撃(HijackRAG)を明らかにする。
HijackRAGは、悪意のあるテキストを知識データベースに注入することで、攻撃者がRAGシステムの検索機構を操作できるようにする。
攻撃者の知識の異なるレベルに合わせたブラックボックスとホワイトボックスの攻撃戦略を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:15:51 GMT)
LexEval: A Comprehensive Chinese Legal Benchmark for Evaluating Large Language Models [17.9] 大規模言語モデル (LLM) は自然言語処理タスクにおいて大きな進歩を遂げており、法的領域においてかなりの可能性を示している。
既存のLLMを法制度に適用し、その可能性や限界を慎重に評価することなく適用することは、法律実務において重大なリスクをもたらす可能性がある。
我々は、標準化された総合的な中国の法律ベンチマークLexEvalを紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:56:08 GMT)
LexEval: A Comprehensive Chinese Legal Benchmark for Evaluating Large Language Models [17.9] 大規模言語モデル (LLM) は自然言語処理タスクにおいて大きな進歩を遂げており、法的領域においてかなりの可能性を示している。
既存のLLMを法制度に適用し、その可能性や限界を慎重に評価することなく適用することは、法律実務において重大なリスクをもたらす可能性がある。
我々は、標準化された総合的な中国の法律ベンチマークLexEvalを紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:56:08 GMT)
Learning the Expected Core of Strictly Convex Stochastic Cooperative Games [17.9] 報酬配分における重要な概念は、大連立から逸脱する動機を持つエージェントがいない安定した配分の集合である。
我々は,多くのサンプルが与えられた期待コアの点を返すtextttCommonPoints-Picking というアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:17:49 GMT)
Venire: A Machine Learning-Guided Panel Review System for Community Content Moderation [17.7] 我々は、Reddit上でパネルレビューを行うML支援システムであるVenireを開発した。
Venireは、ログデータに基づいてトレーニングされた機械学習モデルを使用して、モデレーターが最も不一致しやすいケースを特定する。
我々は、Venireが意思決定の一貫性を改善し、遅れた意見の相違を表面化できることを示します。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:39:34 GMT)
DenoiseRep: Denoising Model for Representation Learning [17.6] 本稿では,特徴抽出とデノナイジングによる特徴識別を改善するために,表現学習のための新しいDenoising Model(DenoiseRep)を提案する。
DenoiseRepは、インクリメンタルに機能を改善するが、利用可能であればラベルを補完するラベルフリーのアルゴリズムである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:40:28 GMT)
Thoughtful Adoption of NLP for Civic Participation: Understanding Differences Among Policymakers [17.5] 自然言語処理ツールは、市民参加を促進し、民主的プロセスを強化する可能性がある。
本研究は、NLPツールの思慮的な採用に、政府内利害関係者がどのような影響を及ぼすかを検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:46:26 GMT)
Symmetric Linear Bandits with Hidden Symmetry [17.4] 学習者から対称性を隠蔽する高次元対称線形包帯について検討する。
低次元部分空間の集合におけるモデル選択に基づく手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:26:19 GMT)
Deep Learning and Machine Learning -- Natural Language Processing: From Theory to Application [17.4] 自然言語処理(NLP)と大規模言語モデル(LLM)の役割に焦点を当てる。
本稿では,データ前処理技術とHugging Faceのようなフレームワークを用いたトランスフォーマーモデルの実装について論じる。
マルチリンガルデータの扱い、バイアスの低減、モデルの堅牢性確保といった課題を強調している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:35:35 GMT)
Anchor-free Clustering based on Anchor Graph Factorization [17.2] Anchor Graph Factorization(AFCAGF)に基づくAnchor-free Clusteringと呼ばれる新しい手法を提案する。
AFCAGFはアンカーグラフの学習において革新的であり、サンプル間のペア距離の計算のみを必要とする。
我々は,クラスタセンターとFKMのサンプル間のメンバシップ行列の概念を,複数のアンカーポイントとサンプルを含むアンカーグラフに進化させた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:32:03 GMT)
FlexTSF: A Universal Forecasting Model for Time Series with Variable Regularities [17.2] 我々は,より優れた一般化を持ち,正規時間と不規則時間の両方をサポートする普遍時系列予測モデルFlexTSFを提案する。
12のデータセットの実験では、FlexTSFは、それぞれ通常の時系列と不規則時系列のために設計された最先端の予測モデルより優れていることが示されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:14:09 GMT)
Robotic State Recognition with Image-to-Text Retrieval Task of Pre-Trained Vision-Language Model and Black-Box Optimization [17.2] 本稿では,事前学習された視覚言語モデルを用いたロボット状態認識手法を提案する。
透明扉の開閉状態、蛇口から水が流れているか否か、キッチンがきれいかどうかの定性的状態さえ認識することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:34:52 GMT)
Differentiable Modal Synthesis for Physical Modeling of Planar String Sound and Motion Simulation [17.0] 非線形弦の運動特性をシミュレーションする新しいモデルを提案する。
我々は物理ネットワークフレームワークにモーダル合成とスペクトルモデリングを統合する。
経験的評価は、弦運動シミュレーションにおいて、アーキテクチャが優れた精度を達成することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:54:09 GMT)
DOA-Aware Audio-Visual Self-Supervised Learning for Sound Event Localization and Detection [16.9] 本稿では,第1次アンビソニクス(FOA)マイクロホンで捉えた空間的音声記録のための音事象定位・検出(SELD)について述べる。
本稿では,ディープニューラルネットワーク(DNN)の特徴抽出部分を自己教師型で事前学習する手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:31:58 GMT)
Linguistics Theory Meets LLM: Code-Switched Text Generation via Equivalence Constrained Large Language Models [16.8] 1つの会話で2つ以上の言語を交互に交互に行うコードスイッチングは、自然言語処理(NLP)に特有の課題を提示する
既存の研究は構文的制約やニューラルジェネレーションに重点を置いており、言語理論を言語モデル(LLM)と統合して自然なコード変更テキストを生成する努力はほとんどない。
等価制約理論(ECT)とLLMを組み合わせた新しいフレームワークであるEZSwitchを導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:03:32 GMT)
Robustifying automatic speech recognition by extracting slowly varying features [16.7] 敵攻撃に対する防御機構を提案する。
このような方法で事前処理されたデータに基づいてトレーニングされたハイブリッドASRモデルを使用します。
本モデルでは, ベースラインモデルと類似したクリーンデータの性能を示すとともに, 4倍以上の堅牢性を示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:02:41 GMT)
DistriBlock: Identifying adversarial audio samples by leveraging characteristics of the output distribution [16.7] アドリアックは、自動音声認識システムを誤認して任意のターゲットテキストを予測する。
本稿では,任意のASRシステムに適用可能な効率的な検出戦略であるDistriBlockを提案する。
提案手法の最高性能は, 受信機動作特性曲線下において, 99%, 97%のクリーン・ノイズデータに対して, ターゲット対向例を識別する平均面積である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:25:54 GMT)
FlowLLM: Flow Matching for Material Generation with Large Language Models as Base Distributions [16.7] FlowLLMは、大きな言語モデル(LLM)とリーマンフローマッチング(RFM)を組み合わせて、新しい結晶材料を設計する新しい生成モデルである。
提案手法は最先端の手法よりも優れ, 安定物質の生成速度を3倍以上に向上させ, 安定, 特異, 新規結晶の生成速度を$sim50%以上向上させる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:15:43 GMT)
Block Sparse Bayesian Learning: A Diversified Scheme [16.6] 実世界のデータに広汎なブロック間隔現象を特徴付けるために, バラエティブロックスパース(Diversified Block Sparse)という小説を紹介した。
ブロック内分散およびブロック間相関行列の多様化を可能とすることにより、既存のブロックスパース学習手法の感度問題を事前に定義されたブロック情報に効果的に対処する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:13:21 GMT)
Improving Causal Reasoning in Large Language Models: A Survey [16.6] 因果推論は知性の重要な側面であり、問題解決、意思決定、世界理解に不可欠である。
大規模言語モデル(LLM)は出力に対して有理性を生成することができるが、因果推論を確実に行う能力は未だ不明である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:10:14 GMT)
From News to Forecast: Integrating Event Analysis in LLM-Based Time Series Forecasting with Reflection [16.5] 本稿では,テキストデータと時系列データの両方を解析することで時系列予測を強化する新しい手法を提案する。
言語を媒体として,社会イベントを予測モデルに適応的に統合し,ニュースコンテンツと時系列のゆらぎを一致させてより豊かな洞察を提供する。
具体的には、LSMをベースとしたエージェントを用いて、無関係なニュースを反復的にフィルタリングし、人間ライクな推論を用いて予測を評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:04:18 GMT)
From News to Forecast: Integrating Event Analysis in LLM-Based Time Series Forecasting with Reflection [16.5] 本稿では,テキストデータと時系列データの両方を解析することで時系列予測を強化する新しい手法を提案する。
言語を媒体として,社会イベントを予測モデルに適応的に統合し,ニュースコンテンツと時系列のゆらぎを一致させてより豊かな洞察を提供する。
具体的には、LSMをベースとしたエージェントを用いて、無関係なニュースを反復的にフィルタリングし、人間ライクな推論を用いて予測を評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:04:18 GMT)
ELMGS: Enhancing memory and computation scaLability through coMpression for 3D Gaussian Splatting [16.4] 3Dモデルは最近、Neural Radiance Fieldsと3D Gaussian Splatting Modelによって提供されるエンドツーエンドトレーニングの可能性によって普及した。
本稿では,そのようなモデルのメモリと計算のスケーラビリティを両立させる手法を提案する。
一般的なベンチマークでは,提案手法の有効性を実証し,資源制約のあるデバイス上でも,そのようなソリューションの広範な展開可能性への道を開く。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:01:28 GMT)
GuardT2I: Defending Text-to-Image Models from Adversarial Prompts [16.3] GuardT2Iは、T2Iモデルの敵のプロンプトに対する堅牢性を高めるための生成的アプローチを採用する、新しいモデレーションフレームワークである。
実験の結果、GardetT2IはOpenAI-ModerationやMicrosoft Azure Moderatorといった主要な商用ソリューションよりも優れています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:56:30 GMT)
SHED: Shapley-Based Automated Dataset Refinement for Instruction Fine-Tuning [16.3] 大規模な言語モデルは、少量の高品質なデータだけで望ましいパフォーマンスを達成することができる。
大規模なデータセットから高品質なデータを識別して、小さいが効果的なデータセットをキュレートすることが、重要な課題である。
本稿では,Shapley値に基づく自動データセット精錬フレームワークSHEDを紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:33:02 GMT)
Emergent mechanisms for long timescales depend on training curriculum and affect performance in memory tasks [16.3] 私たちはRNNに$N$-parityと$N$-delayed Match-to-sampleタスクの解決を依頼します。
どちらのタスクにおいても、RNNはより長い時間スケールでN$を増大させるが、学習目標によって異なるメカニズムを使用する。
この結果から,タスク要求に対する時間スケールの適用により,より複雑な目標の学習が可能になり,RNNの性能が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:55:47 GMT)
PromptExp: Multi-granularity Prompt Explanation of Large Language Models [16.3] PromptExpは,トークンレベルの洞察を集約することで,複数の粒度を自動生成するフレームワークである。
PromptExpは、ホワイトボックスとブラックボックスの説明の両方をサポートし、説明をより高い粒度レベルまで拡張する。
PromptExpを感情分析などのケーススタディで評価し,摂動に基づくアプローチが優れていることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:15:49 GMT)
Adaptive Paradigm Synergy: Can a Cross-Paradigm Objective Enhance Long-Tailed Learning? [16.1] 自己教師付き学習(SSL)は、教師付き手法に対抗して、いくつかのコンピュータビジョンタスクで印象的な成果を上げている。
しかし、その性能は、固有のクラス不均衡を捉えるのが困難であるため、長い尾の分布を持つ現実世界のデータセットに低下する。
両パラダイムの強みを統一しようとするパラダイム横断目標であるアダプティブ・パラダイム・シナジー(APS)を紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:25:22 GMT)
Human Expertise in Algorithmic Prediction [16.1] アルゴリズムの予測に人間の専門知識を取り入れるための新しい枠組みを導入する。
我々のアプローチは、人間の判断を利用して、アルゴリズム的に区別できない入力を区別する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:45:32 GMT)
FAIR-TAT: Improving Model Fairness Using Targeted Adversarial Training [16.1] FAIR-TAT(Fair Targeted Adversarial Training)と呼ばれる新しいアプローチを導入する。
敵の対人訓練(標的外攻撃ではなく)に標的の対人攻撃を使用することで、敵の対人公正性に関してより有利なトレードオフが可能になることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:58:03 GMT)
Generative forecasting of brain activity enhances Alzheimer's classification and interpretation [16.1] 静止状態機能型磁気共鳴イメージング(rs-fMRI)は、神経活動を監視する非侵襲的な方法を提供する。
深層学習はこれらの表現を捉えることを約束している。
本研究では,データ拡張の一形態として,rs-fMRIから派生した独立成分ネットワークの時系列予測に着目した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:51:31 GMT)
A Comparison of Prompt Engineering Techniques for Task Planning and Execution in Service Robotics [16.1] glsplLLMの最近の進歩は、自律ロボット制御と人間とロボットの相互作用において重要な役割を果たしている。
サービスにおける高レベルのタスク計画と実行の適用において、迅速なエンジニアリング技術とそれらの組み合わせを比較した。
そこで本研究では,タスクの多様なセットとシミュレーションにおける機能セットを定義し,タスク完了の正確さと実行時間を測定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:22:55 GMT)
Situational Scene Graph for Structured Human-centric Situation Understanding [15.9] 本研究では,人的対象関係とそれに対応する意味特性の両方をエンコードするために,SSGというグラフベースの表現を提案する。
セマンティックディテールは、当初単一のアクションを表現するように設計された状況フレームにインスパイアされた、事前に定義された役割と値として表現される。
間もなくコードとデータセットをリリースします。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:11:25 GMT)
A Universal Sets-level Optimization Framework for Next Set Recommendation [15.8] Next Set Recommendation (NSRec) はトレンド研究のトピックである。
我々は N ext Set Recommendation (SNSRec) のための普遍的および S ets レベルの最適化フレームワークを公開している。
私たちのアプローチは、妥当性と多様性の両方に関して、従来方法よりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:53:46 GMT)
Improving Generalization and Convergence by Enhancing Implicit Regularization [15.8] Inlicit Regularization Enhancement (IRE)フレームワークは、ディープラーニングにおけるフラットソリューションの発見を加速する。
IREは、平坦な方向と鋭い方向のダイナミクスを分離し、平坦な方向に沿って鋭さを減少させる。
計算オーバーロードを伴わずに,IREをエムジェネリックベースに事実上組み込むことができることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:58:04 GMT)
Explainable Behavior Cloning: Teaching Large Language Model Agents through Learning by Demonstration [15.8] 本稿では,大規模言語モデル(LLM)と学習デモによる行動クローニングを組み合わせた新しいアプローチである,説明可能な行動クローニングLDMエージェント(EBC-LLMAgent)を提案する。
EBC-LLMAgentは3つのコアモジュールで構成されている: デモ生成 コード生成、UIマッピング。
多様なドメインからの5つの人気のあるモバイルアプリケーションに対する大規模な実験は、EBC-LLMAgentの優れた性能、タスク完了における高い成功率、目に見えないシナリオへの効率的な一般化、有意義な生成を実証している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:14:33 GMT)
Retrieval-Augmented Generation with Estimation of Source Reliability [15.7] Reliability-Aware RAG (RA-RAG) は複数のソースの信頼性を推定し、この情報を検索プロセスと集約プロセスの両方に組み込む。
異質なソース信頼性を持つ実世界のシナリオを反映したベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:09:29 GMT)
An Accelerated Algorithm for Stochastic Bilevel Optimization under Unbounded Smoothness [15.7] 本稿では,上層関数が非非有界な滑らかさであり,下層関数が強く凸であるような二層最適化問題のクラスについて検討する。
これらの問題は、ニューラルネットワークを用いたテキスト分類など、データ学習に大きな応用がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:05:17 GMT)
An Accelerated Algorithm for Stochastic Bilevel Optimization under Unbounded Smoothness [15.7] 本稿では,上層関数が非非有界な滑らかさであり,下層関数が強く凸であるような二層最適化問題のクラスについて検討する。
これらの問題は、ニューラルネットワークを用いたテキスト分類など、データ学習に大きな応用がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:05:17 GMT)
AdaptiveISP: Learning an Adaptive Image Signal Processor for Object Detection [15.6] Image Signal Processors (ISP)は、生のセンサー信号をデジタル画像に変換する。
ISPは画像品質を最大化するために設計されており、これはハイレベルコンピュータビジョンタスクのパフォーマンスに最適である。
本稿では,タスク駆動型かつシーン適応型ISPであるAdaptiveISPを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:49:06 GMT)
Collage: Decomposable Rapid Prototyping for Information Extraction on Scientific PDFs [15.6] コラージュ(Colllage)は, 科学的PDF上での様々な情報抽出モデルの高速なプロトタイピング, 可視化, 評価を目的としたツールである。
NLPベースのツールの開発者とユーザの両方が、中間状態の詳細なビューを提供することで、パイプラインの検査、デバッグ、理解を深めることができます。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:00:34 GMT)
Bridging the Human to Robot Dexterity Gap through Object-Oriented Rewards [15.6] 人間のビデオから直接ロボットを訓練することは、ロボット工学とコンピュータビジョンの新たな分野だ。
この難しさの重要な理由は、人間の手で訓練されたポリシーが、形態的差異のためにロボットの手に直接移行できないことである。
本稿では,人的ビデオからの報酬を直接計算することで,ポリシーのオンライン微調整を可能にする技術であるHuDORを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:59:41 GMT)
BLAST: Block-Level Adaptive Structured Matrices for Efficient Deep Neural Network Inference [15.5] 本稿では,Block-Level Adaptive STructured (BLAST) 行列を導入し,ディープラーニングモデルにおける線形層の重み行列に代表される効率的な構造を学習・活用する。
言語と視覚の両方のタスクを圧縮するために行列を用いることの効率を実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:38:11 GMT)
MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection [15.5] 拡散モデルは、トレーニングデータによく似ているが、データ記憶の影響を受ける画像を生成するのに優れている。
微調整時のモデル容量の正規化がこの問題を軽減することを提案する。
当社のフレームワークは大規模データセットにスケーラブルで,関数の報酬に依存せず,既存のアプローチと統合することで,メモリ化の軽減を実現しています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:02:54 GMT)
An Individual Identity-Driven Framework for Animal Re-Identification [15.4] IndivAIDはAnimal ReID用に特別に設計されたフレームワークである。
画像特異的で個人固有のテキスト記述を生成し、動物画像を通して個々の視覚概念をフルにキャプチャする。
8つのベンチマークデータセットと現実世界のStoatデータセットにわたる最先端メソッドに対する評価は、IndivAIDの有効性と適用性を示している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:34:55 GMT)
Learning Image Priors through Patch-based Diffusion Models for Solving Inverse Problems [15.3] 拡散モデルは、基礎となるデータ分布から強力な画像前処理を学習し、それを使って逆問題を解決することができるが、トレーニングプロセスは計算コストが高く、大量のデータを必要とする。
本稿では,画像のパッチのみに基づく拡散モデルのトレーニングにより,画像全体に対する効率的なデータ学習手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:48:44 GMT)
Does equivariance matter at scale? [15.2] 我々は、等変ネットワークと非等変ネットワークが、計算およびトレーニングサンプルでどのようにスケールするかを研究する。
まず、等分散によりデータ効率が向上するが、データ拡張による非同変モデルのトレーニングは、十分なエポックを考慮すれば、このギャップを埋めることができる。
第二に、計算によるスケーリングは、テストされた各計算予算において、同変モデルが非同変モデルよりも優れたパワー則に従う。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:36:59 GMT)
UniRiT: Towards Few-Shot Non-Rigid Point Cloud Registration [15.2] 非剛性点雲の登録は、3Dシーン理解、特に手術ナビゲーションにおいて重要な課題である。
非剛体パターンは剛体パターンよりも柔軟で複雑であるため、既存の手法は著しく劣化する。
MedMatch3Dという新しいデータセットを導入し、実際のヒトの臓器からなり、サンプル分布に高いばらつきを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:06:23 GMT)
Yuga: Automatically Detecting Lifetime Annotation Bugs in the Rust Language [15.2] Rustプロジェクトでは、セキュリティ上の脆弱性が報告されている。
これらの脆弱性は、部分的には関数シグネチャの誤った終身アノテーションから生じます。
既存のツールはこれらのバグを検出するのに失敗する。
我々は,新たな静的解析ツールであるYugaを考案し,潜在的なライフタイムアノテーションのバグを検出する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:14:02 GMT)
Run-Time Adaptation of Neural Beamforming for Robust Speech Dereverberation and Denoising [15.2] 本稿では,実環境におけるリアルタイム自動音声認識のための音声強調について述べる。
ノイズの多いエコー混合分光器とディープニューラルネットワーク(DNN)からクリーンドライ音声のマスクを推定し、ビームフォーミングに用いる拡張フィルタを算出する。
しかし、このような教師付きアプローチのパフォーマンスは、ミスマッチした条件下で大幅に劣化する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:32:47 GMT)
ReasoningRec: Bridging Personalized Recommendations and Human-Interpretable Explanations through LLM Reasoning [15.0] 本稿では、推論に基づくレコメンデーションフレームワークReasoningRecについて述べる。
ReasoningRecはレコメンデーションと人間の解釈可能な説明のギャップを埋める。
実証的な評価では、ReasoningRecは最先端の手法を最大12.5%上回っている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:37:04 GMT)
Federated Learning under Periodic Client Participation and Heterogeneous Data: A New Communication-Efficient Algorithm and Analysis [15.0] 連合学習では、クライアントが常にトレーニングに参加することができると仮定することが一般的であり、実際にはユーザデバイスでは実現不可能である。
最近のフェデレーション学習は、より現実的な参加パターンの下で、サイクリッククライアントの可用性や任意の参加として分析されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:41:35 GMT)
Spectral Graph Pruning Against Over-Squashing and Over-Smoothing [14.9] エッジの削除はオーバースカッシングとオーバースムーシングを同時に扱うことができると我々は主張する。
このことは、エッジ削除がいかに改善され、スペクトルギャップの最適化が計算資源を減らすという一見非連結な目的に結びつくかを説明する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:17:02 GMT)
Fast algorithms for classical specifications of stabiliser states and Clifford gates [14.9] 安定化状態とクリフォードゲートの異なる仕様の変換と検証は、量子情報における古典的アルゴリズムの重要な構成要素である。
我々は安定化状態とクリフォードゲートに関する新しい数学的洞察を開発し、それらの記述を明確にした。
そして、これらを利用して、既存の実装よりも有利な10の新しい高速アルゴリズムを提供します。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:04:15 GMT)
Improving Spoken Language Modeling with Phoneme Classification: A Simple Fine-tuning Approach [14.6] 音声言語モデリングの最近の進歩は、音声から直接言語を学ぶことが可能であることを示している。
音素分類に基づく微調整音声表現モデルにより、より文脈不変な表現が得られることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:46:22 GMT)
Improving Spoken Language Modeling with Phoneme Classification: A Simple Fine-tuning Approach [14.6] 音声言語モデリングの最近の進歩は、音声から直接学習言語が実現可能であることを実証している。
音素分類に基づく微調整音声表現モデルにより、より文脈不変な表現が得られることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:46:22 GMT)
Semantic-Enhanced Indirect Call Analysis with Large Language Models [14.5] 本稿では,間接的呼分析の有効性を高めるためにセマンティック・エンハンスメント・アナリティクス(SEA)を提案する。
一般的なプログラミングのプラクティスでは、間接呼び出しは、しばしば呼び出されたターゲットとセマンティックな類似性を示す。
SEAは、複数の視点から間接呼び出しとターゲット関数の両方の自然言語要約を生成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:00:57 GMT)
From Blocking to Breaking: Evaluating the Impact of Adblockers on Web Usability [14.5] 自動ツールを用いて,ライブサイト上での広告ブロックによるWeb破壊の程度を評価することを目的としている。
この研究は、Webの破壊をリアルタイムで測定する際の課題と限界についても概説している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:25:07 GMT)
An Overview of Causal Inference using Kernel Embeddings [14.3] カーネル埋め込みは、様々な統計的推論問題における確率測度を表現する強力なツールとして登場した。
主な課題は、因果関係を特定し、観測データから平均的な治療効果を推定することである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:23:34 GMT)
A Survey Analyzing Generalization in Deep Reinforcement Learning [14.1] 深層強化学習における一般化の形式化と分析を行う。
より深い強化学習政策が、一般化能力を制限する過度に適合する問題に直面する根本的な理由を説明します。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:18:57 GMT)
Using coherent feedback for a periodic clock [14.1] 我々は、量子状態とコヒーレントな量子フィードバックにおける駆動発振器を用いた、新しい完全量子クロックを導入する。
ジョセフソン接合とマイクロ波循環器を組み込んだ2つの超伝導キャビティを用いて実験を行った。
ノイズ駆動の特定の条件下では、クロックの発振は駆動よりもコヒーレントであり、量子自律時計の実装に向けられている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:34:14 GMT)
HEX: Hierarchical Emergence Exploitation in Self-Supervised Algorithms [14.1] 本稿では,トレーニング中に出現する階層構造を活かすために,多種多様な自己教師型(SSL)アプローチを利用するアルゴリズムを提案する。
画像ネットの分類精度に対するベースラインSSLアプローチよりも5.6%の相対的改善が100エポックのトレーニングで達成された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:49:59 GMT)
IP-MOT: Instance Prompt Learning for Cross-Domain Multi-Object Tracking [14.0] マルチオブジェクト追跡(MOT)は、ビデオフレーム間で複数のオブジェクトを関連付けることを目的としている。
既存のアプローチのほとんどは単一のドメイン内でトレーニングと追跡を行っており、結果としてドメイン間の一般化性が欠如している。
我々は,具体的テキスト記述なしで動作可能なMOTのエンドツーエンドトランスフォーマモデルであるIP-MOTを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:24:56 GMT)
Zeroth-Order Sampling Methods for Non-Log-Concave Distributions: Alleviating Metastability by Denoising Diffusion [13.8] 本稿では,非正規化密度の問合せに基づく非ログコンケーブ分布からのサンプリング問題について考察する。
最初に、モンテカルロ推定器によって近似された点数を持つ偏微分拡散過程のシミュレーションに基づいて、DDMC(Denoising Diffusion Monte Carlo)というフレームワークを記述した。
DDMCを真のアルゴリズムであるZOD-MC(Zeroth-Order Diffusion Monte Carlo)に変換する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:05:20 GMT)
Transfer Learning in Vocal Education: Technical Evaluation of Limited Samples Describing Mezzo-soprano [13.8] 本稿では,深層学習モデルを用いたメゾソプラノ音声技術の評価手法を提案する。
我々は、ImageNetとUrbansound8kデータセットで事前トレーニングされたディープラーニングモデルを採用する。
実験の結果,移動学習は全モデルの総合的精度(OAcc)を平均8.3%向上させることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:17:13 GMT)
OTTER: Effortless Label Distribution Adaptation of Zero-shot Models [13.8] 最適輸送による事前学習モデル予測を調整するための,シンプルで軽量な手法を提案する。
我々は,ゼロショット画像とテキスト分類タスクの広範囲で検証を行い,精度を4.8%,平均15.9%向上させた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:40:40 GMT)
Dynamic PET Image Prediction Using a Network Combining Reversible and Irreversible Modules [13.7] 本研究では,動的PET画像のフレーム予測手法を提案する。
ネットワークは、動的PET画像の初期フレームに基づいて、運動パラメータ画像を予測することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:52:21 GMT)
Improving Hateful Meme Detection through Retrieval-Guided Contrastive Learning [13.7] 本稿では,検索誘導型コントラスト学習により,ヘイトフルネスを考慮した埋め込み空間を構築することを提案する。
提案手法は,87.0のAUROCでHatefulMemesデータセット上での最先端性能を実現し,より大規模なマルチモーダルモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:34:16 GMT)
Stochastic Optimal Control for Diffusion Bridges in Function Spaces [13.5] 無限次元空間に合わせた最適制御の理論を提案する。
我々は、Doob の $h$-transform が SOC の観点から導出され、無限次元に拡張されることを示す。
2つの無限次元分布間のブリッジの学習と、無限次元分布からの標本化のための生成モデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:21:00 GMT)
Towards Universal Mesh Movement Networks [13.5] 我々はUniversal Mesh Movement Network (UM2N)を紹介する。
UM2Nは、異なるサイズ分布と構造を持つメッシュを動かすために、非侵入的ゼロショット方式で適用することができる。
本研究では, 実世界の津波シミュレーション事例とともに, 対流法とナビエ・ストークス法に基づく実例について検討した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:33:44 GMT)
2D-OOB: Attributing Data Contribution Through Joint Valuation Framework [13.4] 2D-OOBは, 有用な(あるいは有害な)サンプルと, それらを駆動する特定の細胞を共同で決定するための推定フレームワークである。
2D-OOBは、指数的に高速でありながら、複数のユースケースで最先端のパフォーマンスを実現する。
具体的には、2D-OOBは、細胞レベルできめ細かなアウトリーチを検出し、修正し、データ中毒攻撃においてバックドアトリガーを局所化する有望な結果を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:10:12 GMT)
Federated UCBVI: Communication-Efficient Federated Regret Minimization with Heterogeneous Agents [13.4] We present the Federated upper Confidence bound Value Iteration algorithm (textttFed-UCBVI$)
textttFed-UCBVI$ の後悔は $tildemathcalO(sqrtH3 |mathcalS| |mathcalA| T / M)$ としてスケールすることを証明する。
既存の強化学習アプローチとは異なり、$textttFed-UCBVI$の通信複雑性は、その数によってわずかに増加する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:05:50 GMT)
Private Synthetic Text Generation with Diffusion Models [13.2] 完全オープンソース LLM はプライバシー体制における拡散モデルよりも優れていることを示す。
私たちの完全なソースコード、データセット、実験的なセットアップは、将来の研究を促進するために公開されています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:38:49 GMT)
MMSummary: Multimodal Summary Generation for Fetal Ultrasound Video [13.2] 医療画像用マルチモーダル生成装置MMSummaryについて,特に胎児超音波検査を中心に紹介した。
MMSummaryは3段階のパイプラインとして設計されており、解剖学的検出からキャプション、最後にセグメンテーションと測定まで進歩している。
報告された実験に基づいて、スキャン時間を約31.5%削減し、ワークフロー効率を向上させる可能性を示唆している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:08:08 GMT)
Trained Without My Consent: Detecting Code Inclusion In Language Models Trained on Code [13.1] コード監査は、開発済みのコードが標準、規制、著作権保護に準拠していることを保証する。
ソフトウェア開発プロセスにおけるコーディングアシスタントとしての最近のLarge Language Models(LLM)の出現は、コード監査に新たな課題をもたらしている。
LLMのトレーニングデータセットにコードを含むことを検出するモデルに依存しない、解釈可能な方法であるTraWiCを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:26:07 GMT)
Trained Without My Consent: Detecting Code Inclusion In Language Models Trained on Code [13.1] コード監査は、開発済みのコードが標準、規制、著作権保護に準拠していることを保証する。
ソフトウェア開発プロセスにおけるコーディングアシスタントとしての最近のLarge Language Models(LLM)の出現は、コード監査に新たな課題をもたらしている。
LLMのトレーニングデータセットにコードを含むことを検出するモデルに依存しない、解釈可能な方法であるTraWiCを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:26:07 GMT)
Aequitas Flow: Streamlining Fair ML Experimentation [13.1] Aequitas Flowは、PythonでエンドツーエンドのFair Machine Learning(ML)実験とベンチマークを行うための、オープンソースのフレームワークとツールキットである。
AIシステムがより堅牢で公平になるように、AIシステムにおける公正の概念の組み入れを強化することを目的としている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:34:12 GMT)
Copycats: the many lives of a publicly available medical imaging dataset [13.0] 医療画像(MI)データセットは、医療における人工知能の基本である。
MIデータセットは以前はプロプライエタリだったが、KaggleやHuggingFaceといったコミュニティに分散したプラットフォーム(CCP)など、徐々に一般向けに利用されるようになった。
オープンデータは、データの公開価値の再分配を促進するために重要であるが、現在のCCPガバナンスモデルは、データセットの共有、文書化、評価に必要な品質と推奨のプラクティスを維持できない。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:40:11 GMT)
First Place Solution to the ECCV 2024 ROAD++ Challenge @ ROAD++ Spatiotemporal Agent Detection 2024 [13.0] トラック1のタスクはエージェント検出であり、連続したビデオフレーム内のエージェントのためのエージェント用の「エージェントチューブ」を構築することを目的としている。
私たちのソリューションは、超小型オブジェクト、低照度、不均衡、きめ細かい分類など、このタスクにおける課題に焦点を当てています。
ROAD++ Challenge 2024のトラック1のテストセットで最初にランク付けし、平均30.82%の動画mAPを達成した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:52:43 GMT)
Are High-Degree Representations Really Unnecessary in Equivariant Graph Neural Networks? [12.8] E(3)対称性を取り入れた等価グラフニューラルネットワーク(GNN)は、様々な科学的応用において大きな成功を収めている。
本稿では、$k$-fold回転や正則多面体を含む対称構造上の同変GNNの表現性について検討する。
我々は,高次ステアブルベクトルを組み込んだEGNNの高次バージョンであるHEGNNを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:38:14 GMT)
MutaPLM: Protein Language Modeling for Mutation Explanation and Engineering [12.7] MutaPLMは、タンパク質変異をタンパク質言語モデルで解釈し、ナビゲートするための統一的なフレームワークである。
MutaPLMは、統一された特徴空間内で明示的なタンパク質突然変異表現をキャプチャするタンパク質デルタネットワークを導入する。
MutaPLMは、人為的に理解可能な突然変異効果の説明を提供し、望ましい性質を持つ新規な突然変異の優先順位付けに優れている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:05:51 GMT)
Equivariant Machine Learning on Graphs with Nonlinear Spectral Filters [12.7] グラフ汎函数シフトを対称性群、つまりグラフシフト作用素と可換なユニタリ作用素と考える。
グラフ関数シフトに完全同値な非線形スペクトルフィルタ(NLSF)を提案する。
ノードおよびグラフ分類ベンチマークにおいて、既存のスペクトルGNNよりもNLSFの方が優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:39:43 GMT)
Fisher Flow Matching for Generative Modeling over Discrete Data [12.7] 離散データのための新しいフローマッチングモデルであるFisher-Flowを紹介する。
Fisher-Flowは、離散データ上のカテゴリー分布を考慮し、明らかに幾何学的な視点を採っている。
Fisher-Flowにより誘導される勾配流は, 前方KLの発散を低減するのに最適であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:01:10 GMT)
DAVINCI: A Single-Stage Architecture for Constrained CAD Sketch Inference [12.6] DAVINCIは、CAD(Computer-Aided Design)スケッチパラメータ化と制約推論のための統一アーキテクチャである。
DAVINCIは、両方の出力を共同で学習することにより、エラーの蓄積を最小限に抑え、制約付きCADスケッチ推論の性能を向上させる。
DAVINCIは大規模なSketchGraphsデータセットで最先端の結果を達成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:42:47 GMT)
Automatic programming via large language models with population self-evolution for dynamic job shop scheduling problem [12.5] 本稿では,人間専門家の自己回帰的デザイン戦略に触発された一般検索フレームワークである,新規な自己進化的手法を提案する。
実験の結果,提案手法はGP, GEP, エンドツーエンドの深層強化学習法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:54:31 GMT)
Benchmarking Human and Automated Prompting in the Segment Anything Model [12.5] 我々は最近リリースされた視覚的プロンプトデータセットであるPointPromptを利用して、人間のプロンプトと自動化されたプロンプトの違いを理解する。
その結果, 自動戦略よりも, 人間の獲得したセグメンテーションスコアが約29%高いことがわかった。
自動メソッドを使用する場合のパフォーマンスは、微調整アプローチによって最大68%向上する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:51:38 GMT)
TLCM: Training-efficient Latent Consistency Model for Image Generation with 2-8 Steps [12.4] 潜伏拡散モデル(LDM)を高速で採取できるものに蒸留することは、研究の関心を惹きつけている。
本稿では,これらの課題を克服するために,学習効率の高い遅延一貫性モデル(TLCM)を提案する。
A100 GPUでのトレーニング時間はわずか70時間で、SDXLから蒸留した3ステップのTLCMは、33.68のCLIPスコアと、MSCOCO-2017 5Kベンチマークで5.97の美的スコアを達成した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:49:52 GMT)
Higher-order Cross-structural Embedding Model for Time Series Analysis [12.4] 時系列分析は、医療、金融、センサーネットワークといった様々な分野における重要な応用のために、注目されている。
現在のアプローチでは、時系列内の高次相互作用をモデル化し、時間的あるいは空間的依存関係を別々に学習することに注力しています。
本稿では,時間的視点と空間的視点の両方を協調的にモデル化する新しいフレームワークであるHigh-TS(Higher-order Cross-structural Embedding Model for Time Series)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:51:14 GMT)
GenRL: Multimodal-foundation world models for generalization in embodied agents [12.3] 強化学習(RL)は、タスクごとに複雑な報酬設計を必要とするため、スケールアップが難しい。
現在の基盤視覚言語モデル(VLM)は、微調整やその他の適応を具体的文脈で適用する必要がある。
このような領域におけるマルチモーダルデータの欠如は、具体化されたアプリケーションの基盤モデルを開発する上での障害である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:16:18 GMT)
Feature distribution Adaptation Network for Speech Emotion Recognition [12.2] 本稿では,特徴分布適応ネットワーク(Feature Distribution Adapted Network)と呼ばれる新しい深層帰納学習フレームワークを提案する。
本手法は,感情の一貫した表現を得るために,深層移動学習戦略を用いて視覚的特徴分布と音声的特徴分布を整列させることを目的とする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:29:42 GMT)
Why Fine-grained Labels in Pretraining Benefit Generalization? [12.2] 近年の研究では、詳細なラベル付きデータでディープニューラルネットワークを事前トレーニングし、粗ラベル付きデータで微調整すると、粗ラベル付きデータで事前トレーニングするよりもより優れた一般化が得られることが示されている。
本稿では,入力データ分布を限定する階層的マルチビュー構造を導入することで,このギャップに対処する。
1)粗粒度事前学習はニューラルネットワークが共通の特徴をうまく学習するのに対して,2)粗粒度事前学習は,一般的な特徴に加えて稀な特徴をネットワークが学習するのに役立つため,ハードダウンストリームテストサンプルの精度が向上する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:41:30 GMT)
HelloMeme: Integrating Spatial Knitting Attentions to Embed High-Level and Fidelity-Rich Conditions in Diffusion Models [12.1] テキスト・ツー・イメージ基礎モデルにアダプタを挿入する効果的な手法を提案する。
アダプタの性能を向上させる2次元特徴写像に関する注意機構を最適化する。
この作業は、大規模なテキスト・ツー・イメージモデルのトレーニング後のタスクに対する洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:00:51 GMT)
NeFF-BioNet: Crop Biomass Prediction from Point Cloud to Drone Imagery [12.0] 本稿では,バイオマス予測ネットワーク(BioNet)を,点雲やドローン画像など,さまざまなデータモダリティに適応するためのネットワークとして提案する。
我々のBioNetは、スパース3D畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの予測モジュールを利用して、ポイントクラウドやその他の3Dデータ表現を処理し、バイオマスを予測する。
ドローン画像のためのBioNetをさらに拡張するため,ニューラル・フィーチャーフィールド(NeFF)モジュールを統合し,3次元構造再構成と2次元意味的特徴の対応する3次元面への変換を可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:53:11 GMT)
Fourier Amplitude and Correlation Loss: Beyond Using L2 Loss for Skillful Precipitation Nowcasting [11.9] 2つの新しい損失項からなる新しいフーリエ振幅と相関損失(FACL)を提案する。
2つの損失項は、時間的予測問題に対するMSEや重み付きMSEのような従来の$L$損失を置き換えるために協力する。
本手法は,画素単位の精度と構造的類似性に小さなトレードオフを伴って,知覚的指標と気象学のスキルスコアを改善する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:12:56 GMT)
High-Fidelity Document Stain Removal via A Large-Scale Real-World Dataset and A Memory-Augmented Transformer [11.9] StainDocは、ドキュメントの汚れを取り除くために特別に設計された、最初の大規模で高解像度のデータセットである。
本稿では,変換器をベースとした文書の汚れ除去手法であるStainRestorerを提案する。
本研究は,メモリ拡張トランスフォーマーの可能性を強調し,今後の研究を進める上で貴重なデータセットを提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:27:06 GMT)
S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving [11.9] そこで本稿では,S3PTによるシーンセマンティクスと構造案内クラスタリングを提案する。
まず、セマンティックな分布一貫したクラスタリングを取り入れて、オートバイや動物のような稀なクラスをよりよく表現できるようにします。
第2に,広い背景領域から歩行者や交通標識などの小さな物体まで,不均衡で多様な物体の大きさを扱うために,一貫した空間クラスタリングを導入する。
第3に,シーンの幾何学的情報に基づいて学習を規則化するための深度誘導空間クラスタリングを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:00:06 GMT)
R^2AG: Incorporating Retrieval Information into Retrieval Augmented Generation [11.9] Retrieval augmented generation (RAG) は、検索者によって提供される外部文書で大規模言語モデル(LLM)を拡張するために、多くのシナリオで適用されてきた。
本稿では,R$2$AGを提案する。R$2$AGは,検索情報を検索用拡張生成に組み込む新しい拡張RAGフレームワークである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:41:45 GMT)
Web Scraping for Research: Legal, Ethical, Institutional, and Scientific Considerations [11.9] 本稿では,アメリカの研究者を対象とした社会科学研究におけるWebスクレイピングの包括的枠組みを提案する。
我々は、研究者がスクラップを通じてデータにアクセスし、収集し、保存し、共有する方法に影響を及ぼす現在の規制環境の概要を述べる。
次に、科学的に合法的で倫理的な方法でスクレーピングを行うための推奨事項を研究者に提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:20:44 GMT)
Residual Multi-Task Learner for Applied Ranking [11.8] ResFlowは、効率的なクロスタスク情報共有を可能にする軽量なマルチタスク学習フレームワークである。
Shopee Searchのプレランクモジュールに完全にデプロイされている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:49:45 GMT)
SimpsonsVQA: Enhancing Inquiry-Based Learning with a Tailored Dataset [11.7] シンプソンズVQA』(シンプソンズVQA)は、ザ・シンプソンズのテレビ番組から派生したVQAの新しいデータセットである。
従来のVQAタスクだけでなく、画像に関連する無関係な質問を識別するように設計されている。
SimpsonsVQAには、約23Kの画像、166KのQAペア、500Kの判定が含まれている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:30:40 GMT)
LGU-SLAM: Learnable Gaussian Uncertainty Matching with Deformable Correlation Sampling for Deep Visual SLAM [11.7] 学習可能な2次元ガウス不確実性モデルは、マッチングフレームペアを関連付けるように設計されている。
マルチスケールの変形可能な相関戦略を考案し、各方向のサンプリングを適応的に微調整する。
本手法の有効性と優位性を検証するために,実世界のデータセットと合成データセットの実験を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:20:08 GMT)
End-to-end Graph Learning Approach for Cognitive Diagnosis of Student Tutorial [11.7] 本稿では,エンド・ツー・エンドグラフニューラルネットワークを用いた認知診断(EGNN-CD)モデルを提案する。
EGNN-CDは、知識概念ネットワーク(KCN)、グラフニューラルネットワークに基づく特徴抽出(GNNFE)、認知能力予測(CAP)の3つの主要部分から構成される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:18:47 GMT)
DASH: Warm-Starting Neural Network Training in Stationary Settings without Loss of Plasticity [11.6] 我々は,実世界のニューラルネットワークトレーニングを模擬したフレームワークを開発し,静止データ上での暖房開始時の可塑性損失の主な原因としてノイズ記憶を同定する。
そこで本研究では,学習した特徴を保ちながら雑音を選択的に忘れることによって可塑性損失を軽減することを目的としたDASH(Direction-Aware SHrinking)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:57:54 GMT)
SFDFusion: An Efficient Spatial-Frequency Domain Fusion Network for Infrared and Visible Image Fusion [11.5] 赤外線と可視画像の融合は、目立ったターゲットと豊かなテクスチャの詳細を持つ融合画像を生成することを目的としている。
本稿では、赤外・可視画像融合のための効率的な空間周波数領域融合ネットワークを提案する。
本手法は,様々な融合計測値と視覚効果に有意な利点を有する融合画像を生成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:17:23 GMT)
Investigating Language-Specific Calibration For Pruning Multilingual Large Language Models [11.4] 多様な言語,タスク,モデル,および SotA プルーニング技術を用いて,多言語モデルをプルーニングするためのキャリブレーション言語を比較した。
例えば、ターゲット言語を校正することで、効率的に言語モデリング能力を維持することができるが、必ずしも下流タスクに利益をもたらすとは限らない。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:53:43 GMT)
Improving Uncertainty Quantification in Large Language Models via Semantic Embeddings [11.3] 大規模言語モデル(LLM)における正確な不確実性の定量化は、信頼性の高いデプロイメントに不可欠である。
LLMにおける意味的不確実性を測定するための現在の最先端手法は、厳密な双方向の包含基準に依存している。
本研究では,意味的不確実性のよりスムーズでロバストな推定を実現するためにセマンティックな埋め込みを利用する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:41:46 GMT)
Charting the Landscape of Nefarious Uses of Generative Artificial Intelligence for Online Election Interference [11.3] 本稿では,GenAIの悪用を探求し,民主的プロセスの破壊の可能性を明らかにする。
悪質な俳優はこれらの技術を利用して有権者の行動に影響を与え、偽情報を広め、選挙制度に対する大衆の信頼を損なう。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:29:34 GMT)
MassiveGNN: Efficient Training via Prefetching for Massively Connected Distributed Graphs [11.0] 本稿では,現在最先端のAmazon DistDGL分散GNNフレームワーク上に,パラメータ化された連続プリフェッチと消去方式を提案する。
NERSC(National Energy Research Scientific Computing Center)のPerlmutterスーパーコンピュータでは、エンドツーエンドのトレーニング性能が15~40%向上している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:10:38 GMT)
Kernel-Based Function Approximation for Average Reward Reinforcement Learning: An Optimist No-Regret Algorithm [11.0] 無限水平平均報酬設定における近似RLのカーネル関数について考察する。
本稿では,バンディットの特別な場合において,取得関数に基づくアルゴリズムと類似した楽観的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:04:10 GMT)
On the Influence of Data Resampling for Deep Learning-Based Log Anomaly Detection: Insights and Recommendations [10.9] 本研究は,多様なデータ再サンプリング手法が既存のADアプローチに与える影響を詳細に分析する。
クラス不均衡のレベルが異なる4つのデータセットにまたがるこれらのADアプローチの性能を評価する。
正常なデータと異常なデータの最適な再サンプリング率を利用する際のデータ再サンプリング手法の有効性を評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:47:56 GMT)
Certified Robustness to Data Poisoning in Gradient-Based Training [10.8] 我々は、潜在的に操作されたデータでトレーニングされたモデルの振る舞いを証明可能な保証を提供する最初のフレームワークを開発する。
我々の枠組みは、標的外および標的の毒、およびバックドア攻撃に対する堅牢性を証明している。
我々は、エネルギー消費、医療画像、自律運転などの応用から、複数の実世界のデータセットに対するアプローチを実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:47:56 GMT)
RSNet: A Light Framework for The Detection of Multi-scale Remote Sensing Targets [10.7] RSNetはSAR画像における船舶検出機能の向上を目的とした軽量フレームワークである。
Waveletpool-GuidedContext (WCG) バックボーンは少ないパラメータで精度を向上し、Waveletpool-StarFusion ヘッドは効率的にパラメータを削減できる。
私たちのコードはまもなくリリースされるでしょう。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:46:35 GMT)
VISUALCODER: Guiding Large Language Models in Code Execution with Fine-grained Multimodal Chain-of-Thought Reasoning [10.7] 視覚制御フローグラフ(CFG)を用いたマルチモーダル・チェーン・オブ・ソート(CoT)推論を統合することで,コード推論を強化する,シンプルかつ効果的なアプローチであるVisual Coderを導入する。
コードスニペットを対応するCFGと整合させることで、Visual Coderは実行フローに関する深い洞察を提供し、コードの振る舞いをより正確に予測できる。
実験により,視覚的CFGによるLLMの増大は,コード推論タスクにおいて,テキストベースのCFG記述を著しく上回ることを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:07:01 GMT)
CIDGMed: Causal Inference-Driven Medication Recommendation with Enhanced Dual-Granularity Learning [10.6] 医薬推奨は、患者の長期医療記録を統合し、正確で安全な薬品の組み合わせを提供することを目的としている。
既存の方法では、疾患や引き金や薬物の真の因果関係を深く探ることができないことが多い。
因果推論駆動型デュアルグラニュラリティメディケーション勧告法(CIDGMed)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:18:03 GMT)
PointRecon: Online Point-based 3D Reconstruction via Ray-based 2D-3D Matching [10.6] 単眼RGBビデオからオンラインのポイントベース3D再構成手法を提案する。
我々のモデルは、シーンのグローバルなポイントクラウド表現を維持し、新しい画像が観察されるにつれて、特徴とポイントの3D位置を継続的に更新する。
ScanNetデータセットを用いた実験により,オンラインMVS手法の最先端品質を実現することができた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:29:25 GMT)
YourSkatingCoach: A Figure Skating Video Benchmark for Fine-Grained Element Analysis [10.4] データセットには、ジャンプ要素の454のビデオ、検出された各ビデオ中のスケータースケルトン、ジャンプの開始フレームと終了フレームのゴールドラベル、フィギュアスケートの動画ベンチマークが含まれている。
そこで本研究では,ジャンプの時間長を正確に検出することを目的とした,新しい動作解析タスクである空気時間検出を提案する。
細粒度ラベルの一般化性を検証するため、粗粒度タスクアクション分類ではなく、クロススポーツタスクとして他のスポーツにも同様のプロセスを適用する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:51:08 GMT)
EMOTION: Expressive Motion Sequence Generation for Humanoid Robots with In-Context Learning [10.3] 本稿では,ヒューマノイドロボットにおける表現型動き列を生成するためのEMOTIONというフレームワークを提案する。
本研究では,EMOTIONが生成する動作の自然性と理解性を比較したオンラインユーザ研究を行い,その人間フィードバックバージョンであるEMOTION++について述べる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:22:45 GMT)
DataRec: A Framework for Standardizing Recommendation Data Processing and Analysis [10.3] 我々は、レコメンデーションデータセットの使用と操作を容易にするDataRecを提案する。
様々なフォーマットで読み書きをサポートし、フィルタリングと分割技術を提供し、データ分散分析を可能にする。
これは、複数のレコメンデーションフレームワークと互換性のあるフォーマットでデータのエクスポートを可能にすることによって、データ操作に対する統一的なアプローチを奨励する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:39:39 GMT)
Divergence of thermalization rates driven by the competition between finite temperature and quantum coherence [10.3] 温度が0に近づくと、量子物質の熱化速度のばらつきが観測される。
超流体の量子コヒーレンスとボソニック刺激は、有限温度と多体相互作用が発散を抑制する一方で、発散を誘導する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:10:29 GMT)
Understanding the Expressive Power and Mechanisms of Transformer for Sequence Modeling [10.2] ドット積自己注意などのトランスフォーマーの異なる成分が表現力に影響を及ぼすメカニズムについて検討する。
本研究では,トランスフォーマーにおける臨界パラメータの役割を明らかにする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:47:36 GMT)
Transductive Learning Is Compact [10.2] 一般の損失関数を用いた教師あり学習において, 広範に保持されるコンパクト性結果を示す。
不適切な計量損失を伴う実現可能な学習のために、サンプルの複雑さの正確なコンパクトさは失敗する可能性があることを示す。
我々は、無知の場合においてより大きなギャップが可能であると推測する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:33:33 GMT)
Speak Out of Turn: Safety Vulnerability of Large Language Models in Multi-turn Dialogue [10.1] 大規模言語モデル(LLM)は、違法または非倫理的な応答を生成することが実証されている。
本稿では,人間は多ターン対話を利用してLSMを誘導し,有害な情報を生成することができると論じる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:43:51 GMT)
A Benchmark for AI-based Weather Data Assimilation [10.1] 本研究では,シミュレーション観測,実世界観測,ERA5再解析により構築したベンチマークであるDABenchを提案する。
実験の結果,4DVarFormerV2とSformerを統合したエンド・ツー・エンドの天気予報システムが実世界の観測を同化できることが確認された。
提案されているDABenchは、AIベースのDA、AIベースの天気予報、および関連するドメインの研究を大幅に前進させる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:19:39 GMT)
Exploring the Role of Token in Transformer-based Time Series Forecasting [10.1] Transformer-based method is a mainstream approach for solve time series forecasting (TSF)
モデル構造を最適化することに集中しており、予測のためのトークンの役割に注意を払う研究はほとんどない。
勾配は、主に正のトークンと呼ばれる予測級数に寄与するトークンに依存する。
T-PEとV-PEを利用するために,トランスフォーマーベースのデュアルブランチフレームワークであるT2B-PEを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:49:45 GMT)
Identifying Drift, Diffusion, and Causal Structure from Temporal Snapshots [10.0] 本稿では,SDEの時空間からのドリフトと拡散を共同で推定する,最初の包括的アプローチを提案する。
これらのステップのそれぞれが、Kullback-Leiblerデータセットに関して常に最適であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:28:21 GMT)
PAC-Bayes-Chernoff bounds for unbounded losses [10.0] PAC-Bayes Oracle bound for unbounded loss that extends Cram'er-Chernoff bounds to the PAC-Bayesian set。
我々のアプローチは、多くのPAC-Bayes境界における自由パラメータの正確な最適化など、Cram'er-Chernoff境界の性質を自然に活用する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:49:21 GMT)
Fragile non-Bloch spectrum and unconventional Green's function [9.9] 非エルミート系では、エネルギースペクトルと固有状態は開あるいは周期境界条件下で完全に異なる。
NHSEを用いた広い範囲の非エルミートモデルでは,開境界条件下での局所摂動に非常に敏感であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:34:34 GMT)
CopRA: A Progressive LoRA Training Strategy [9.8] Low-Rank Adaptation (LoRA) は、微調整基礎モデルのためのパラメータ効率のよい手法である。
本研究では,ランダム層降下を伴うLoRAの新しいプログレッシブトレーニング戦略を提案する。
本手法を協調ロラ(CopRA)と呼ぶ。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:07:09 GMT)
Schur's Positive-Definite Network: Deep Learning in the SPD cone with structure [9.8] 本研究では,SPD出力を保証する新しい学習モジュールであるSpadNetを紹介する。
特に、SPDとスパース行列を共同で学習するという課題を解決する。
本研究では,これらのアプリケーションに対するSpadNetレイヤの汎用性と妥当性について述べる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:42:36 GMT)
Improved Particle Approximation Error for Mean Field Neural Networks [9.8] MFLD(Mean-field Langevin dynamics)は、確率分布の空間上で定義されるエントロピー規則化された非線形凸関数を最小化する。
最近の研究は、MFLDにおけるカオスの時間的一様伝播を実証している。
粒子近似誤差における対数的ソボレフ不等式(LSI)定数の依存性を改善する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:24:34 GMT)
A Hitchhikers Guide to Fine-Grained Face Forgery Detection Using Common Sense Reasoning [9.8] 視覚と言語の可能性は、いまだに偽造検出に過小評価されている。
顔偽造検出を視覚質問応答(VQA)タスクに変換する方法論が必要である。
このギャップに対処するために,従来の二項決定パラダイムから分岐する多段階的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:43:53 GMT)
A Hitchhikers Guide to Fine-Grained Face Forgery Detection Using Common Sense Reasoning [9.8] 視覚と言語の可能性は、いまだに偽造検出に過小評価されている。
顔偽造検出を視覚質問応答(VQA)タスクに変換する方法論が必要である。
このギャップに対処するために,従来の二項決定パラダイムから分岐する多段階的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:43:53 GMT)
Reliability Assessment of Information Sources Based on Random Permutation Set [9.5] パターン認識では、不確実性への対処は意思決定と分類精度に大きな影響を及ぼす重要な課題である。
ランダム置換集合 (RPS) と Dempster-Shafer Theory (DST) の間の置換次数に基づく変換方法の欠如
本稿では, RPS に適した RPS 変換手法と確率変換手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:40:35 GMT)
Evaluating Evidential Reliability In Pattern Recognition Based On Intuitionistic Fuzzy Sets [9.5] ファジィ信頼性指数(FRI)と呼ばれる証拠源の信頼性を定量化するアルゴリズムを提案する。
FRIアルゴリズムは、IFSから派生した決定量化規則に基づいており、決定を正し、これらの貢献から明らかな信頼性を導き出すために異なるBPAの貢献を定義する。
提案手法は,証拠資料の信頼性評価の合理性を効果的に向上し,複雑なシナリオにおける分類決定問題に特に適している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:05:26 GMT)
Model Order Reduction for Open Quantum Systems Based on Measurement-adapted Time-coarse Graining [9.5] 本稿では,オープン量子系の時間的複雑さを低減するため,モデルオーダー削減手法を提案する。
この方法は、RWAハミルトニアンと一定の極限で整列する最下階モデルに補正を整理する。
超伝導量子ビットの力学に関する問題として, 4次EQMEを導出する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:26:42 GMT)
ProTransformer: Robustify Transformers via Plug-and-Play Paradigm [9.5] 本稿では,トランスアーキテクチャのレジリエンス向上を目的とした,新しいロバストなアテンション機構を提案する。
このテクニックは、プラグイン・アンド・プレイ層として既存のトランスフォーマーに統合することができ、追加のトレーニングや微調整を必要とせずに、堅牢性を向上させることができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:38:09 GMT)
ES-Gaussian: Gaussian Splatting Mapping via Error Space-Based Gaussian Completion [9.4] 視覚ベースのマッピングは、粗い点雲のために高品質な3D再構成に苦しむことが多い。
低高度カメラと単線LiDARを用いた高品質な3D再構成システムES-Gaussianを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:21:13 GMT)
ES-Gaussian: Gaussian Splatting Mapping via Error Space-Based Gaussian Completion [9.4] 視覚ベースのマッピングは、粗い点雲のために高品質な3D再構成に苦しむことが多い。
低高度カメラと単線LiDARを用いた高品質な3D再構成システムES-Gaussianを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:21:13 GMT)
Source Code Foundation Models are Transferable Binary Analysis Knowledge Bases [9.4] 人間指向バイナリリバースエンジニアリング(Human-Oriented Binary Reverse Engineering)は、ソースコードに関連する可読性のあるコンテンツにバイナリコードを持ち上げることを目的としている。
本稿では,バイナリソースエンコーダデコーダモデルと,バイナリ解析のためのブラックボックスLCMを組み込んだ新しいプローブ・アンド・リカバリフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:12:36 GMT)
Theoretical Investigations and Practical Enhancements on Tail Task Risk Minimization in Meta Learning [9.4] 近年, 高速適応ロバスト性向上におけるテールタスクリスク最小化の有効性について検討している。
我々は、分布的ロバストな戦略を極小最適化問題に還元し、解の概念としてスタックルバーグ均衡を構成し、収束率を推定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:07:43 GMT)
Certified algorithms for quantum Hamiltonian learning via energy-entropy inequalities [9.3] ギブス状態期待値の推定から量子系のハミルトニアンを学習する問題を考察する。
我々は、学習すべきパラメータの下位および上位境界を認定するために、これを拡張することによって、この作業の上に構築する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:58:52 GMT)
Automated Trustworthiness Oracle Generation for Machine Learning Text Classifiers [9.3] モデルの信頼性や精度といった従来のメトリクスは、機械学習モデルに対する人間の信頼を構築するには不十分です。
予測帰属語が予測クラスに関連があるかどうかを自動的にチェックするTOKIを提案する。
また,TOKIが特定した信頼性問題を対象とした新たな敵攻撃手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:26:37 GMT)
DiaMond: Dementia Diagnosis with Multi-Modal Vision Transformers Using MRI and PET [9.2] 我々はMRIとPETを統合する新しいフレームワークDiaMondを提案する。
DiaMondは、MRIとPETを相乗的に組み合わせた、自己注意機構と、新しいバイアテンション機構を備えている。
既存のマルチモーダルメソッドを、さまざまなデータセットで大幅に上回る。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:11:00 GMT)
Towards Heterogeneous Long-tailed Learning: Benchmarking, Metrics, and Toolbox [9.2] 長期データ配信は、eコマース、金融、バイオメディカルサイエンス、サイバーセキュリティなど、さまざまな分野に課題をもたらす。
私たちはHeroLTを開発した。HeroLTは18の最先端アルゴリズム、10の評価指標、および6つのタスクと4つのデータモダリティにわたる17の現実世界データセットを統合した、包括的な長期学習ベンチマークだ。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:17:00 GMT)
Video prediction using score-based conditional density estimation [9.2] ビデオ中の次のフレームの条件密度を学習し、サンプリングするための暗黙の回帰に基づくフレームワークについて述べる。
本研究では, 時間的予測のための適応表現を抽出し, 単純なレジリエンス・ツー・ノイズ対象関数に基づいて訓練したシーケンス・ツー・イメージのディープネットワークを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:16:35 GMT)
Wormhole Loss for Partial Shape Matching [9.2] 本稿では,一対の点間の一貫した距離を正確に探索するための新しい基準を提案する。
部分形状マッチングのためのトレーニングネットワークにおける損失関数として用いる場合,従来の測定値や最先端結果と比較して制限性が低いことが示されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:58:21 GMT)
On Unsupervised Partial Shape Correspondence [9.2] 関数写像は部分性を呼び出すと推定された一致に誤差をもたらすと論じる。
部分形状マッチングのための新しい手法を提案する。
提案手法はSHREC'16データセットにおいて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:55:46 GMT)
Mixture of Scales: Memory-Efficient Token-Adaptive Binarization for Large Language Models [9.2] 我々はMixture of Scales(BinaryMoS)と呼ばれる新しいバイナライズ手法を導入する。
従来の方法とは異なり、BinaryMoSはバイナリ重み付けに複数のスケーリングエキスパートを使用し、各トークンにこれらの専門家を動的にマージして、スケーリングファクタを適応的に生成する。
実験の結果,BinaryMoSは様々な自然言語処理タスクにおいて従来のバイナライズ手法を超え,さらに2ビット量子化手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:47:40 GMT)
Conformal Classification with Equalized Coverage for Adaptively Selected Groups [9.0] 本稿では、適応的に選択された特徴に対して有効なカバレッジ条件付き予測セットを生成することにより、分類の不確かさを評価するための共形推論手法を提案する。
シミュレーションおよび実データに対して,本手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:52:09 GMT)
A Kernel Perspective on Distillation-based Collaborative Learning [9.0] 統計的に異種環境において局所データやモデルを直接共有しない非パラメトリック協調学習アルゴリズムを提案する。
理論的結果から着想を得て,ニューラルネットワークアーキテクチャに基づく実用的蒸留に基づく協調学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:45:50 GMT)
Permutation Invariant Learning with High-Dimensional Particle Filters [8.9] 深層モデルのシークエンシャルラーニングは、しばしば破滅的な忘れ物や可塑性の喪失といった課題に悩まされる。
本研究では,高次元粒子フィルタに基づく新しい置換不変学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:06:55 GMT)
Prune and Repaint: Content-Aware Image Retargeting for any Ratio [8.7] 本稿では,キーセマンティクスの保存と画質のバランスをとるために,PruneRepaintというコンテンツ認識手法を提案する。
前景の内容と構造に焦点を合わせることで、PruneRepaintアプローチは、キーコンテンツ損失と変形を適応的に回避する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:02:42 GMT)
INDUS: Effective and Efficient Language Models for Scientific Applications [8.7] 言語モデル(LLM)は、自然言語処理(NLP)タスクにおいて顕著な結果を示した。
我々は、地球科学、生物学、物理学、生物物理学、惑星科学、天体物理学の密接に関連する分野に合わせた総合的なLLMスイートであるINDUSを開発した。
本稿では,RoBERTa(汎用)とSCIBERT(ドメイン固有)の両方のエンコーダにおいて,新たなタスクや関心領域における既存のタスクよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:42:57 GMT)
Bipartite entanglement of noisy stabilizer states through the lens of stabilizer codes [8.6] 本研究では、対応する縮小状態のスペクトルを、対応する安定化器符号の特性で表すことができることを示す。
雑音に対する耐性のある安定化状態が得られ、短期量子ネットワークにおけるより堅牢な絡み合い分布が可能となる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:09:04 GMT)
Uncovering Coordinated Cross-Platform Information Operations Threatening the Integrity of the 2024 U.S. Presidential Election Online Discussion [8.6] 情報操作は民主的プロセスの完全性に重大な脅威をもたらす。
2024年のアメリカ合衆国大統領選挙を期待して、調整されたIOのデジタルトレースを$mathbbX$(元Twitter)で発見することを目的とした研究を発表した。
オンラインコーディネーションを検出するための機械学習フレームワークを用いて,2024年5月からの選挙関連会話を含むデータセットをmathbbX$で分析した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:52:21 GMT)
Solving Differential Equations with Constrained Learning [8.5] (部分微分方程式)は自然現象を記述するための基本的な道具であり、その解は科学や工学において不可欠である。
有限要素法のような従来の手法は信頼性の高い解を提供するが、その精度は計算集約的な微細メッシュの使用と結びついている。
本稿では,SCL(Science-Constrained Learning)フレームワークを開発することにより,これらの課題に対処する。
PDEの(弱い)解を見つけることは、最悪の損失を伴う制約付き学習問題の解決と等価であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:20:39 GMT)
Unfolding Target Detection with State Space Model [8.5] 本稿では,CFAR検出器を状態空間モデルアーキテクチャに展開することにより,信号処理とディープラーニングを組み合わせた新しい手法を提案する。
CFARパイプラインを保存し、洗練された構成をトレーニング可能なパラメータにすることで、手動パラメータチューニングなしで高い検出性能を実現する。
その結果,提案手法の顕著な性能,CFARとその変種を検出率と誤警報率で10倍に向上させることができた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:43:18 GMT)
Is Your LiDAR Placement Optimized for 3D Scene Understanding? [8.2] 一般的な運転データセットは、主に単一LiDARシステムを使用し、悪条件を伴わないデータを収集する。
そこで我々は,LiDAR配置最適化,データ生成,下流評価を含む全サイクルパイプラインであるPlace3Dを提案する。
各種気象・センサ故障条件下でのLiDARセマンティックセマンティックセグメンテーションと3次元物体検出タスクにおいて, 例外的な結果を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:35:06 GMT)
Provable acceleration for diffusion models under minimal assumptions [8.2] そこで本研究では,スコアベースサンプルの学習自由化手法を提案する。
最小限の仮定で、我々のスキームは$widetildeO(d5/4/sqrtvarepsilon)$ iterationsの総変量で$varepsilon$-accuracyを達成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:59:06 GMT)
One Prompt to Verify Your Models: Black-Box Text-to-Image Models Verification via Non-Transferable Adversarial Attacks [8.1] 我々は,ノントランスファラブル・アドリアック(TVN)によるテキスト・ツー・イメージ・モデル検証という,最初のT2Iモデル検証手法を提案する。
TVNはNon-dominated Sorting Genetic Algorithm II (NSGA-II)に基づいて、プロンプトのテキストエンコーディングのコサイン類似性を最適化する。
TVNはクローズドセットとオープンセットの両方のシナリオで良好に動作し、90%以上の検証精度を実現した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:17:20 GMT)
Stepping Out of the Shadows: Reinforcement Learning in Shadow Mode [8.0] 強化学習は、多くのサイバー物理システムにとってまだ競争力がない。
我々は、従来の制御器の補助により、いわゆるシャドウモードで補強剤を訓練する。
シャドーモードでは、エージェントは、タスクを学ぶためのアクションサンプルと好ましい状態へのガイダンスを提供するために、コントローラに依存する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:52:52 GMT)
Masked Hard-Attention Transformers Recognize Exactly the Star-Free Languages [7.9] 本研究では,注目度の高い変圧器の正確なキャラクタリゼーションについて検討した。
厳密なマスキング(各位置は自身には参加できない)と位置埋め込みがなければ、これらの変換器は線形時間論理と表現的に等価である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:44:17 GMT)
Symbolic Graph Inference for Compound Scene Understanding [7.9] 本研究では,シーンのシーンと知識グラフに原因を負って空間情報をキャプチャし,共同グラフ検索において一般的なドメイン知識を活用できる新しいアプローチを提案する。
ADE20Kデータセット上で本手法の有効性を実証し,現在のシーン理解手法と比較する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:06:12 GMT)
Smaller Large Language Models Can Do Moral Self-Correction [7.9] 自己補正は、大規模言語モデル(LLM)の最も驚くべき新興能力の1つです。
道徳的自己補正(Moral self-correction)は、非倫理的世代を勾配更新を必要とせずに修正するポストホックアプローチである。
以前の研究では、LLMは自己退行を可能としており、22B未満のパラメータを持つ小さなモデルでは道徳的な自己訂正ができないことが報告されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:58:57 GMT)
Do LLMs "know" internally when they follow instructions? [7.9] この次元に沿った表現の修正は、ランダムな変化に比べて、命令追従の成功率を改善することを示す。
また、この次元は、タスクや命令の固有の困難さよりも、プロンプトの表現に密接に関連していることも判明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:06:12 GMT)
Designing AI Personalities: Enhancing Human-Agent Interaction Through Thoughtful Persona Design [7.6] このワークショップは、さまざまなコンテキストを対象としたAIエージェントペルソナデザインに焦点を当てた研究コミュニティを確立することを目的としている。
音声,実施,人口統計などのペルソナデザインの批判的側面と,ユーザ満足度やエンゲージメントに与える影響について検討する。
トピックとしては、会話インターフェースの設計、ユーザエクスペリエンスに対するエージェントペルソナの影響、コンテキストに適したAIエージェントを作成するアプローチなどがある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:58:59 GMT)
Detection of Micromobility Vehicles in Urban Traffic Videos [7.6] 本研究では、単一フレームオブジェクト検出の精度と速度と、オブジェクト検出フレームワークが提供するよりリッチな機能を組み合わせた、適応型検出モデルを導入する。
この融合は、YOLOX検出能力に時間的視点をもたらし、都市移動パターンをよりよく理解することができる。
都市マイクロモビリティのシナリオをキュレートしたデータセットを用いて実験し、既存の最先端手法よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:16:52 GMT)
Deep Learning for 3D Point Cloud Enhancement: A Survey [7.5] 本稿では,深層学習に基づくポイントクラウド強化手法に関する総合的な調査を行う。
ポイントクラウドの強化、すなわちクリーンなデータを達成するためのデノイング、見えないデータを復元するための完了、高密度なデータを得るためのアップサンプリングの3つの主要な視点をカバーしている。
本調査では,最近の最先端手法の新しい分類法と,標準ベンチマークの体系的実験結果について述べる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:07:06 GMT)
All or None: Identifiable Linear Properties of Next-token Predictors in Language Modeling [7.3] 言語モデル間の線形特性のユビキティに関する説明として,識別可能性を分析した。
適切な条件下では、これらの線形特性が分布等価な次トーケン予測器を全てあるいは全く持たないことを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:19:29 GMT)
Polarization-entangled photon pairs generation from a single lithium niobate waveguide with single poling period [7.3] そこで本研究では,0型SPDCに基づく偏光共役光子対を簡便かつ効率的に生成する手法を提案する。
薄膜導波路の強い分散工学能力を利用することで、縮退と高度に縮退した光子対を両立させることができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:08:51 GMT)
Scoring Rules and Calibration for Imprecise Probabilities [7.3] 我々は、適切なスコアリングルールとキャリブレーションが2つの異なるゴールを果たすと主張している。
本稿では,機械学習の実践における理論的洞察,特に分布ロバスト性における損失関数の選択に関する微妙な落とし穴を例示する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:29:47 GMT)
Lina-Speech: Gated Linear Attention is a Fast and Parameter-Efficient Learner for text-to-speech synthesis [7.2] 従来の自己注意機構を,Gated Linear Attention (GLA)のような新たな再帰的アーキテクチャに置き換えるモデルであるLina-Speechを紹介する。
このアプローチは高速で、デプロイが容易で、データセットのサイズが3分から15分に及ぶ場合に、微調整されたベースラインに匹敵するパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:50:40 GMT)
Dynamical Mode Recognition of Coupled Flame Oscillators by Supervised and Unsupervised Learning Approaches [7.1] 燃焼不安定は燃焼研究において最も困難な問題の一つである。
多くの燃焼システムの安全かつ信頼性の高い運転を保証するためには,燃焼不安定性の同定と理解が不可欠である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:57:32 GMT)
Logarithmic Smoothing for Pessimistic Off-Policy Evaluation, Selection and Learning [7.1] 本研究は,文脈的包帯問題のオフライン定式化について検討する。
目標は、行動ポリシーの下で収集された過去のインタラクションを活用して、新しい、より優れたパフォーマンスのポリシーを評価し、選択し、学習することである。
重要度重み付けリスク推定器の幅広いクラスに対して,新しい完全経験的濃度境界を導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:53:43 GMT)
MetaSegNet: Metadata-collaborative Vision-Language Representation Learning for Semantic Segmentation of Remote Sensing Images [7.1] リモートセンシング画像のセグメンテーションのための新しいメタデータ協調セグメンテーションネットワーク(MetaSegNet)を提案する。
一元的視覚データのみを使用する一般的なモデル構造とは異なり、我々は自由に利用可能なリモートセンシング画像メタデータから重要な特徴を抽出する。
画像エンコーダ,テキストエンコーダ,およびクロスモーダルアテンション融合サブネットワークを構築し,画像とテキストの特徴を抽出する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:36:53 GMT)
The Z-Gromov-Wasserstein Distance [7.1] グロモフ・ワッサーシュタイン距離(Gromov-Wasserstein distance, GW)は測度空間を比較する強力なツールである。
本稿では,GW距離の一般化を定義することによって,$Z$-networksを比較する手法を提案する。
この構成は多くの既知のメトリクスを仮定し、共有プロパティを理解するための統一的なアプローチを提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:58:00 GMT)
LLMs Integration in Software Engineering Team Projects: Roles, Impact, and a Pedagogical Design Space for AI Tools in Computing Education [7.1] この作業では、ChatGPTやGitHub Copilotなど、生成AI(GenAI)モデルとツールの影響を、教育的なレンズで調査する。
我々の結果は、チームワーク、チーム効率、チームダイナミクスにおけるGenAIの役割と意味を理解する上での特別なギャップに対処します。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:43:33 GMT)
Graph-Augmented Relation Extraction Model with LLMs-Generated Support Document [7.0] 本研究では,文レベルの関係抽出(RE)に対する新しいアプローチを提案する。
グラフニューラルネットワーク(GNN)とLarge Language Models(LLM)を統合し、コンテキストに富んだサポートドキュメントを生成する。
そこで,CrossREデータセットを用いて実験を行い,本手法の有効性を実証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:48:34 GMT)
eDOC: Explainable Decoding Out-of-domain Cell Types with Evidential Learning [7.0] 単細胞RNA-seq(scRNA-seq)技術は生物学的システムの複雑さを解明するための強力なツールである。
CTA(Cell Type CTA)は、scRNA-seqデータ解析において必須かつ基本的なタスクの1つである。
上記の課題に対処する新しい手法であるeDOCを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:15:36 GMT)
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes [7.0] 平均回帰マルコフ決定プロセス(MDPs)は、不確実性の下でのシーケンシャルな意思決定の基盤となる枠組みを提供する。
平均再帰型MDPのユニークな構造特性を考察し,これを用いてReward-Extended Differential (RED) 強化学習を導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:23:42 GMT)
Causality-Driven Audits of Model Robustness [7.0] ディープニューラルネットワーク(DNN)のロバストネス監査は、現実の状況に挑戦するモデル感度を明らかにする手段を提供する。
複雑な歪みを引き起こす撮像過程の因子に対するDNN感度を測定するために因果推論を用いた新たなロバストネス監査法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:57:50 GMT)
Sui Lutris: A Blockchain Combining Broadcast and Consensus [6.9] Sui Lutrisは、秒以下のファイナリティを達成した最初のスマートコントラクトプラットフォームである。
我々は、コンセンサスのないブロックチェーンの安全な再構成を確実に示すために、新しい再構成プロトコルを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:49:30 GMT)
Depth Anywhere: Enhancing 360 Monocular Depth Estimation via Perspective Distillation and Unlabeled Data Augmentation [6.8] ラベルのない360度データを効果的に活用する新しい深度推定フレームワークを提案する。
提案手法では,教師モデルとして最先端の視点深度推定モデルを用いて擬似ラベルを生成する。
我々は、Matterport3DやStanford2D3Dといったベンチマークデータセットに対するアプローチを検証し、深さ推定精度を大幅に改善した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:37:01 GMT)
st-DTPM: Spatial-Temporal Guided Diffusion Transformer Probabilistic Model for Delayed Scan PET Image Prediction [6.8] いくつかの研究によると、二重時間PET画像は悪性腫瘍と良性腫瘍を区別する可能性を秘めている。
両時間PET画像予測問題を解くために, 時空間誘導拡散変換器確率モデル(st-DTPM)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:37:55 GMT)
Conditioned quantum-assisted deep generative surrogate for particle-calorimeter interactions [6.8] 本研究では,大型ハドロン衝突型加速器シミュレーションのための量子支援深部生成モデルを提案する。
このモデルでは,条件付き変分オートエンコーダ (VAE) と条件付き制限ボルツマンマシン (RBM) を統合する。
RBMノードと接続は、サンプリングのためにD-WaveのPegasus-structured textitAdvantage Quantum Annealer (QA)上でqubitsと couplerを使用するように慎重に設計されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:08:03 GMT)
From Babble to Words: Pre-Training Language Models on Continuous Streams of Phonemes [6.7] テキストデータセットを連続的な音素ストリームに変換するパイプラインを開発した。
このパイプラインをBabyLMチャレンジから100万ワードの事前トレーニングデータセットに適用する。
この結果から,音素ベースの学習は従来の言語理解タスクの性能をわずかに低下させるが,分析的・実践的メリットは有益であることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:05:01 GMT)
CoTran: An LLM-based Code Translator using Reinforcement Learning with Feedback from Compiler and Symbolic Execution [6.7] 既存のコード翻訳法では、翻訳されたコードが確実にコンパイルされるか、入力されたコードに実質的な機能的等価性を持つことを保証するための訓練が欠如している。
本研究では、強化学習、コンパイラフィードバック、シンボリック実行(シンジケート)ベースのテストフィードバックを用いて、LLMを微調整する。
我々は、CoTranと、人書きトランスパイラ、LLMベースの翻訳ツール、ChatGPTを含む14のコード翻訳ツールを比較した広範な実験を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:22:41 GMT)
Floquet-induced interactions in many-body systems [6.7] 我々は、将来の量子デバイスに関連するFloquetによる相互作用を理解するための高度なFloquet法を開発した。
この理解は、量子状態のコヒーレントな制御、エラーの最小化、これらのデバイスの性能のベンチマークに不可欠である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:16:15 GMT)
Towards Robust and Efficient Federated Low-Rank Adaptation with Heterogeneous Clients [6.6] 低ランク適応(LoRA)は解法として提案されているが、連合学習におけるその応用は集約の不一致によって複雑である。
この不一致に対処する既存の手法は、不均一なデータ設定で低いランクでの性能劣化に悩まされることが多い。
LoRA-A2 (Low Rank Adaptation with Alternating freeze and Adaptive rank selection) を導入し、低ランクと高データの異種性に挑戦する際のロバスト性を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:48:21 GMT)
PRF: Parallel Resonate and Fire Neuron for Long Sequence Learning in Spiking Neural Networks [6.5] スパイキングニューラルネットワーク(SNN)における長周期学習の効率性と性能の課題を同時に解決する。
まず,典型的なLeaky Integrate-and-Fire(LIF)モデルのトレーニング時間を$O(L2)$から$O(Llog L)$に短縮する。
第二に、長距離依存性を捉えるために、複素領域における微分可能リセット関数から共振機構によって駆動される振動膜電位を利用するパラレル共鳴・火災ニューロン(PRF)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:39:20 GMT)
PRF: Parallel Resonate and Fire Neuron for Long Sequence Learning in Spiking Neural Networks [6.5] スパイキングニューラルネットワーク(SNN)における長周期学習の効率性と性能の課題を同時に解決する。
まず,典型的なLeaky Integrate-and-Fire(LIF)モデルのトレーニング時間を$O(L2)$から$O(Llog L)$に短縮する。
第二に、長距離依存性を捉えるために、複素領域における微分可能リセット関数から共振機構によって駆動される振動膜電位を利用するパラレル共鳴・火災ニューロン(PRF)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:39:20 GMT)
Strong but simple: A Baseline for Domain Generalized Dense Perception by CLIP-based Transfer Learning [6.5] 微調整された視覚言語事前学習モデルは、競争力やより強い一般化結果をもたらす。
これは、ドメインの一般化にImageNetベースの転送学習を使用するという標準に挑戦する。
また、ドメイン内一般化の改善により、Cityscapesテストセットの86.4% mIoUのSOTAが改善された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:58:36 GMT)
Provably Optimal Memory Capacity for Modern Hopfield Models: Transformer-Compatible Dense Associative Memories as Spherical Codes [6.5] 現代ホップフィールドモデルとカーネル化ホップフィールドモデル(KHMs)の最適キャパシティ記憶について検討する。
KHMsの最適容量は、特徴空間がメモリに最適な球形コードを形成することを許すときに生じることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:35:51 GMT)
Estimating Neural Network Robustness via Lipschitz Constant and Architecture Sensitivity [6.5] 本稿では,知覚システムにおけるニューラルネットワークのロバスト性について検討する。
我々は、リプシッツ定数を、ネットワークロバストネスの定量化と強化の鍵となる指標として同定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:38:42 GMT)
Fast TRAC: A Parameter-Free Optimizer for Lifelong Reinforcement Learning [6.4] 生涯の強化学習における主要な課題は、可塑性の喪失である。
TRACと呼ばれる長寿命RLのパラメータフリーチューニングを提案する。
Procgen、Atari、Gym Controlの環境での実験では、TRACは驚くほどうまく機能している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:54:18 GMT)
Flow Snapshot Neurons in Action: Deep Neural Networks Generalize to Biological Motion Perception [6.4] 生物学的運動知覚(BMP)とは、人間の行動パターンからのみ生物の行動を認識し、認識する能力である。
本稿では,ビデオクリップからのパッチレベルの光フローを入力として利用するMotion Perceiver (MP)を提案する。
MPは、トップ1アクション認識精度が最大29%向上した既存のAIモデルすべてを上回っている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:58:25 GMT)
Unsupervised Object Discovery: A Comprehensive Survey and Unified Taxonomy [6.3] 教師なしのオブジェクト発見は、一般に、ラベル付き例を必要とせず、視覚データ中のオブジェクトのローカライズおよび/または分類のタスクとして解釈される。
本調査では,既存のアプローチの詳細な調査を行い,課題と採用手法のファミリーに基づいて,この課題を体系的に分類する。
本稿では,共通データセットとメトリクスの概要を述べるとともに,評価プロトコルの違いによる手法の比較の課題について述べる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:22:48 GMT)
Generalized many-body perturbation theory for the electron correlation energy [6.3] この研究は、凝縮物質物理学と量子化学におけるマルチ参照摂動理論を橋渡しする。
図式再仮定による電子相関エネルギーの計算法を推し進める新たな可能性を開く。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:08:57 GMT)
How Well Do Large Language Models Disambiguate Swedish Words? [6.2] 現在のモデルはすべて、トレーニングセットが利用可能である場合の最高の教師付き曖昧さよりも正確ではない。
人間の記述した感覚の定義をプロンプトに含めると、最高の精度が達成される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:10:41 GMT)
Rethinking Deep Thinking: Stable Learning of Algorithms using Lipschitz Constraints [6.2] 反復アルゴリズムは、解に到達するまでステップを踏むことで問題を解決する。
ディープシンキング(DT)ネットワークは、推論時に異なるサイズの問題にスケール可能な方法で反復アルゴリズムを学習することが実証されている。
トレーニング中は不安定であり、ソリューションにおける収束/終了の保証はない。
本稿では,中間表現の成長を解析することで不安定性の問題に対処する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:48:22 GMT)
A Theory of Synaptic Neural Balance: From Local to Global Order [6.1] 我々は、シナプス的神経バランスの理論を開発し、それをニューラルネットワークでどのように生み出すか、強制するかを考察する。
与えられた正規化器の場合、入力重みの総コストが出力重みの総コストと等しい場合、ニューロンは平衡にあると言われる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:28:02 GMT)
FoLDTree: A ULDA-Based Decision Tree Framework for Efficient Oblique Splits and Feature Selection [6.1] LDATreeとFoldTreeは、Uncorrelated Linear Discriminant Analysis (ULDA)とForward ULDAを決定木構造に統合する。
LDATree と FoLDTree は軸直交およびその他の斜め決定木法より一貫して優れている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:03:51 GMT)
Efficient Routing on Quantum Networks using Adaptive Clustering [6.0] 本稿では,クラスタリングに基づく新しい絡み合いルーティングプロトコルQuARCを紹介する。
中心となるQuARCは、基礎となる量子ネットワークを定期的に異なるサイズのクラスタに再構成する。
本稿では,QuARCが物理ネットワークパラメータの変化に対して堅牢であることを示すシミュレーションに基づく総合評価を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:32:54 GMT)
Generating Code World Models with Large Language Models Guided by Monte Carlo Tree Search [5.9] 我々は,大規模言語モデル(LLM)が生成する世界モデルであるコードワールドモデルを,モデルベース強化学習(RL)のためのPythonコード形式として検討する。
LLMの代わりにコードを呼び出すことは、より正確で、信頼性があり、解釈可能で、非常に効率的である可能性がある。
その結果, モデルベースRLエージェントは, サンプル効率と推論速度を大幅に向上させることができた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:19:57 GMT)
Enhancing binary classification: A new stacking method via leveraging computational geometry [5.9] 本稿では,計算幾何学的手法,特に最大重み付き矩形問題の解法を統合した新しいメタモデルを提案する。
本手法は複数のオープンデータセットを用いて評価し,その安定性と精度の向上を示す統計解析を行った。
本手法は, アンサンブル学習の積み重ねだけでなく, 病院の健康評価評価や銀行信用評価システムなど, 様々な実世界の応用にも応用できる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:11:08 GMT)
Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation [5.9] CiL(Continuous Imitation Learning)は、マルチタスクポリシーを達成するために、複数のステージやタスクにわたるデモからタスク知識を抽出し、蓄積する。
私たちは、異なるデモンストレーションから共有可能なスキルを段階的に学習することで、知識共有のこの制限に対処するアダプタベースのCiLフレームワークであるIsCiLを紹介します。
Franka-KitchenとMeta-Worldの複雑なタスクを用いたCiL実験は、タスク適応とサンプル効率の両方において、IsCiLの堅牢な性能を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:57:35 GMT)
AI-assisted prostate cancer detection and localisation on biparametric MR by classifying radiologist-positives [5.8] 本稿では,がん診断の総合的精度を向上させるためのディープラーニングモデルを提案する。
一つのボクセルレベルの分類モデルを構築し、単純なパーセンテージ閾値で正のケースを判定する。
2つの臨床データから得られた実験から,提案手法が診断精度を向上させることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:59:57 GMT)
Partial Channel Dependence with Channel Masks for Time Series Foundation Models [5.8] そこで我々は,部分チャネル依存(PCD)の概念を導入し,データセット固有の情報に基づいて,より洗練されたチャネル依存の調整を可能にする。
我々は,予測,分類,計算,異常検出を含む4つのタスクにおけるPCDの有効性を検証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:12:03 GMT)
High-Dimensional Tensor Discriminant Analysis with Incomplete Tensors [5.7] 本研究では,高次元線形判別分析における不完全データを用いたテンソル分類手法を提案する。
提案手法は,データ不足のかなりの割合であっても,シミュレーションや実データ解析において優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:59:46 GMT)
First Place Solution to the ECCV 2024 ROAD++ Challenge @ ROAD++ Atomic Activity Recognition 2024 [5.7] 本報告では,2024年のECCV ROAD++ Challengeのトラック3に参加するための,私たちのチームの技術的ソリューションについて紹介する。
トラック3のタスクは、映像コンテンツに基づいて、路面の64種類の原子活動を特定することを目的とした原子活動認識である。
我々のアプローチは、主に小さなオブジェクトの課題に対処し、単一のオブジェクトとオブジェクトのグループを区別し、モデルオーバーフィットする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:06:58 GMT)
FISC: Federated Domain Generalization via Interpolative Style Transfer and Contrastive Learning [5.6] フェデレーテッド・ラーニング(FL)は、プライバシの保護と協調学習の実現を約束している。
本稿では、クライアント間のより複雑なドメイン分散を処理する新しいFLドメイン一般化パラダイムであるFISCを紹介する。
本手法は, 未確認領域における3.64%から57.22%の精度向上を実現する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:50:23 GMT)
Continuous Spatio-Temporal Memory Networks for 4D Cardiac Cine MRI Segmentation [5.5] 半教師付き全心と全シーケンスcMRセグメンテーションのための連続STM(CSTM)ネットワークを提案する。
我々のネットワークは、基礎となる心臓構造に先立って空間的・時空間的・平面的連続性を最大限に活用し、正確かつ高速な4Dセグメンテーションを実現する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:45:59 GMT)
The Good, the Bad, and the Ugly: The Role of AI Quality Disclosure in Lie Detection [5.5] 低品質のAIアドバイザは、品質の開示が欠如しているため、テキストベースの嘘を広めるのに役立ち、嘘を検出するのに役立ちそうである。
情報開示のない低品質のアドバイザーに頼る場合、参加者の真偽検出率は、AIの真の有効性が明らかになると、自身の能力を下回ることがわかりました。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:58:05 GMT)
Quantum enhanced real-time sensing of protein binding process [5.5] 表面プラズモン共鳴(SPR)技術は,タンパク質結合動態のラベルなしリアルタイム測定に有効である。
信号と雑音の比を時間関数として記録し、結合過程を通して維持する4dBのスクイージングを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:01:59 GMT)
PIP-MM: Pre-Integrating Prompt Information into Visual Encoding via Existing MLLM Structures [5.5] 既存のMLLMのモジュールを用いて,textbfPre-textbfIntegratestextbfPromptを視覚符号化プロセスに組み込むフレームワークを提案する。
我々のモデルは、視覚トークンの半分を減らしても優れた世代を維持している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:05:17 GMT)
Graph Neural Flows for Unveiling Systemic Interactions Among Irregularly Sampled Time Series [5.5] 我々は不規則な時間点で観測された時系列の系統的相互作用を明らかにするグラフベースモデルを開発した。
時系列分類や予測など,いくつかの課題に対するアプローチの有効性を検証し,その有効性を実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:25:43 GMT)
Calibrating Practical Privacy Risks for Differentially Private Machine Learning [5.4] モデルトレーニングにおいて、より柔軟なプライバシ予算設定を可能にするために、攻撃の成功率を下げるアプローチについて検討する。
プライバシに敏感な機能を選択的に抑制することで、アプリケーション固有のデータユーティリティを損なうことなく、低いASR値を達成できることがわかりました。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:52:01 GMT)
Sequential Order-Robust Mamba for Time Series Forecasting [5.3] MambaはTransformersに代わる有望な選択肢として登場し、シーケンシャルデータの処理において、ほぼ直線的な複雑さを提供する。
本稿では,データから生成された2つの埋め込みベクトルと逆チャネル順序との差を最小限に抑えるため,正規化戦略を取り入れたTS予測手法であるSOR-Mambaを提案する。
また,CDを捕捉する能力を高めるために,データ空間から潜在空間までのチャネル間の相関関係の保存を目的とした事前学習タスクであるチャネル相関モデリング(CCM)を導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:05:22 GMT)
FPE-LLM: Highly Intelligent Time-Series Forecasting and Language Interaction LLM in Energy Systems [5.2] Fusion PEFT Energy LLM (FPE-LLM) は、エネルギーシステム予測のための大規模言語モデル(LLM)である。
FPE-LLMはエネルギーシステムとLLMフィールドにおける3つの重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:22:37 GMT)
VPO: Leveraging the Number of Votes in Preference Optimization [5.2] 本稿では,ユーザの投票データを活用し,多様な主観的嗜好に適合する手法を提案する。
我々は,議論を呼んでいる世代対と明らかな世代対を区別するために,双方の投票数を組み込んだVoteベースのPreference Optimizationフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:39:34 GMT)
Twits, Toxic Tweets, and Tribal Tendencies: Trends in Politically Polarized Posts on Twitter [5.2] 個人レベルでの毒性と,Twitter/X上でのトピックレベルに寄与するパーシスタンスと感情分極が果たす役割について検討する。
43,151人のTwitter/Xユーザーから8960万のツイートを収集した後、パーティショニングを含むいくつかのアカウントレベルの特徴が、ユーザーが有害コンテンツを投稿する頻度を予測するかを決定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:43:57 GMT)
Sub-Standards and Mal-Practices: Misinformation's Role in Insular, Polarized, and Toxic Interactions on Reddit [5.2] 信頼できないニュースサイトの記事に対するコメントは、右利きのサブレディットに掲載されることが多い。
サブレディットの毒性が高まるにつれて、ユーザーは既知の信頼できないウェブサイトからの投稿にコメントする傾向にある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:20:59 GMT)
PV-VTT: A Privacy-Centric Dataset for Mission-Specific Anomaly Detection and Natural Language Interpretation [5.1] プライバシー侵害の特定を目的とした,ユニークなマルチモーダルデータセットであるPV-VTT(Privacy Violation Video To Text)を提案する。
PV-VTTは、シナリオ内のビデオとテキストの両方に詳細なアノテーションを提供する。
このプライバシー重視のアプローチにより、研究者はこのデータセットを、保護された機密性を保護しながら使用することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:02:20 GMT)
MissionGNN: Hierarchical Multimodal GNN-based Weakly Supervised Video Anomaly Recognition with Mission-Specific Knowledge Graph Generation [5.1] 本稿では,新しい階層グラフニューラルネットワーク(GNN)モデルであるMissionGNNを紹介する。
提案手法は,大規模マルチモーダルモデル上での重勾配計算を回避し,従来の手法の限界を回避する。
我々のモデルは,従来のセグメンテーションベースやマルチモーダルアプローチの制約を伴わずに,リアルタイムビデオ解析のための実用的で効率的なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:08:20 GMT)
KALAM: toolKit for Automating high-Level synthesis of Analog computing systeMs [5.1] 本稿では,MPベースのアナログ計算システムの基本パラダイムとして因子グラフを利用するKALAMを紹介する。
Pythonスクリプト言語を使用して、KALAM自動化フローは入力係数グラフを等価なSPICE互換回路ネットリストに変換する。
我々は、ベイズ推論、低密度パリティチェック(LDPC)復号化、ニューラルネットワーク(ANN)といったタスクに対するKALAMの汎用性を実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:04:22 GMT)
Zero-Shot Reinforcement Learning from Low Quality Data [5.1] ゼロショット強化学習(Zero-shot reinforcement learning, RL)は、オフラインで報酬なしの事前トレーニングフェーズの後に、環境内であらゆるタスクを実行できるエージェントを提供することを約束する。
そこで本研究では、ゼロショットRL法の性能が、小さな同種データセットでトレーニングした場合にどのように低下するかを考察する。
本稿では,単一タスクのオフラインRLアルゴリズムの高性能な特徴である保守性に着想を得た修正を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:11:03 GMT)
Dynamic Information Sub-Selection for Decision Support [5.1] 我々は,ブラックボックス意思決定者のパフォーマンス向上を目的とした,AI支援の新しいフレームワークであるDynamic Information Sub-Selection(DISS)を紹介する。
偏りのある意思決定支援、専門家の割り当て最適化、大規模言語モデル決定支援、解釈可能性など、DisdisSのいくつかの応用について検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:00:54 GMT)
Matrix integrals over unitary groups: An application of Schur-Weyl duality [4.9] ユニタリ群 $mathsfU(d)$ に関する積分公式は包括的にレビューされている。
シュル=ワイル双対性はブリッジとして機能し、有限群の表現論と古典リー群の表現論とを深く結び付ける。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:54:31 GMT)
(FL)$^2$: Overcoming Few Labels in Federated Semi-Supervised Learning [4.8] Federated Learning(FL)は、クライアントのプライバシに敏感なデータを保存しながら、正確なグローバルモデルをトレーニングする分散機械学習フレームワークである。
ほとんどのFLアプローチは、クライアントがラベル付きデータを持っていると仮定するが、実際にはそうではないことが多い。
本稿では、シャープネスを意識した整合性正規化を用いたラベルなしクライアントのための堅牢なトレーニング手法である$(FL)2$を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:15:02 GMT)
Decoupling Semantic Similarity from Spatial Alignment for Neural Networks [4.8] 意味オブジェクトの空間的位置は人間の知覚や深層学習の分類に影響を与えない。
これはコンピュータビジョンシステムにおける画像応答の類似性の定義に反映されるべきである。
入力応答間の意味的類似性を,集合マッチング問題として定式化することで測定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:17:58 GMT)
DiabML: AI-assisted diabetes diagnosis method with meta-heuristic-based feature selection [4.8] 本稿では,BWOアルゴリズムとML法を用いたハイブリッド糖尿病リスク検出手法であるDiabMLを提案する。
DiabMLはAdaBoostによる86.1%の分類精度を達成した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:06:58 GMT)
FT-PrivacyScore: Personalized Privacy Scoring Service for Machine Learning Participation [4.8] 実際には、制御されたデータアクセスは、多くの産業や研究環境でデータプライバシを保護する主要な方法である。
我々は,FT-PrivacyScoreのプロトタイプを開発し,モデル微調整作業に参加する際のプライバシーリスクを効率よく定量的に推定できることを実証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:41:26 GMT)
Beyond Strong labels: Weakly-supervised Learning Based on Gaussian Pseudo Labels for The Segmentation of Ellipse-like Vascular Structures in Non-contrast CTs [4.8] 本稿では,CTスキャンにおける血管構造に基づく深層学習のための弱教師付きフレームワークを提案する。
提案手法の有効性を1つのローカルデータセットと2つのパブリックデータセットで評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:32:18 GMT)
Eliciting Critical Reasoning in Retrieval-Augmented Language Models via Contrastive Explanations [4.7] Retrieval-augmented Generation (RAG) は、よりリッチな現実的コンテキストに体系的にアクセスする大規模言語モデル(LLM)をサポートするために、現代のNLPにおいて重要なメカニズムとして登場した。
近年の研究では、LLMはRAGに基づくインコンテキスト情報(誤った推論や幻覚につながる可能性のある制限)を批判的に分析するのに苦慮していることが示されている。
本稿では,RAGにおける批判的推論を,対照的な説明を通じてどのように引き起こすかを検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:11:53 GMT)
Analysis of Classifier Training on Synthetic Data for Cross-Domain Datasets [4.7] 本研究は、高度な運転支援システムと自律運転のためのカメラベースの交通標識認識アプリケーションに焦点を当てた。
合成データセットの増補パイプラインは、構造化影やガウスの特異なハイライトのような新しい増補プロセスを含む。
実験の結果、クロスドメインテストデータセットに適用した場合、ほとんどの場合、合成画像ベースアプローチは実際の画像ベーストレーニングよりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:11:41 GMT)
Mitigating Challenges in Ethereum's Proof-of-Stake Consensus: Evaluating the Impact of EigenLayer and Lido [4.6] Proof-of-Work(PoW)からProof-of-Stake(PoS)コンセンサスメカニズムへの移行は、ブロックチェーンバリデーションに対する変革的なアプローチを導入している。
本稿では,EigenLayer と Lido の2つの革新的なソリューションについて検討する。
よりレジリエントで包括的なエコシステムを育むために,EigenLayer と Lido の併用の可能性を評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:58:46 GMT)
Bringing NeRFs to the Latent Space: Inverse Graphics Autoencoder [4.6] Inverse Graphics Autoencoder (IG-AE) を提案する。
画像オートエンコーダを3次元幾何で正規化するためには、その潜在空間と、共同で訓練された潜在3次元シーンを整列する。
IG-AEでトレーニングしたLatent NeRFは,標準のオートエンコーダに比べて品質が向上していることを確認した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:43:55 GMT)
Reweight-annealing method for evaluating the partition function via quantum Monte Carlo calculations [4.6] 量子モンテカルロフレームワークにおいて,非バイアスの低技術バリアアルゴリズムを提案する。
この方法は古典的モンテカルロシミュレーションと量子的モンテカルロシミュレーションの両方で広く利用でき、コンピュータ上で容易に並列化できる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:33:06 GMT)
Multi-fidelity Machine Learning for Uncertainty Quantification and Optimization [4.6] 多忠実度法は計算コストと予測精度のバランスをとるために高忠実度モデルと低忠実度モデルを統合する。
本稿では,機械学習に基づくマルチ忠実度手法の出現分野を詳細に概観する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:22:07 GMT)
A Graph-Based Model for Vehicle-Centric Data Sharing Ecosystem [4.5] 我々は、現代の車両が異なる当事者間のデータ交換をどのように扱うかについての洞察を得るために、概念グラフベースのモデルを開発する。
車両関連データ共有に関するプライバシーに関する洞察を発見することの有用性と有効性を示すために、2つの現実的な例が開発された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:52:19 GMT)
Refusal in Language Models Is Mediated by a Single Direction [4.5] リファリングは1次元のサブスペースによって媒介され、最大72Bのパラメータを持つ13の人気のオープンソースチャットモデルにまたがる。
そこで本研究では,他の機能に最小限の影響を伴って拒絶を手術的に無効にする,新しいホワイトボックス・ジェイルブレイク法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:57:07 GMT)
Extracting thin film structures of energy materials using transformers [4.4] 中性子変換器反射法と高度計算エンジン(N-TRACE)
中性子反射率データ解析にトランスフォーマーアーキテクチャを用いたニューラルネットワークモデルを導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:44:53 GMT)
Understanding Aggregations of Proper Learners in Multiclass Classification [4.4] マルチクラスの学習性は、適切な障壁を示すことが知られている。
二項分類の最近の進歩は、適切な学習者の集合を用いて、この要件を満たすことを実証している。
1つのERMが$Omega left(fracd_G ln (1 / delta)epsilonright)$サンプルを必要とすることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:12:02 GMT)
Understanding Representation of Deep Equilibrium Models from Neural Collapse Perspective [4.4] 我々は、バランスの取れた状態と不均衡な状態の両方において、DECの表現を体系的に解析するツールとして、Neural Collapse(mathcalNC$)を使用している。
マイノリティ崩壊が存在するにもかかわらず、DEC に $mathcalNC$ が存在することを示す。
不均衡な環境では、マイノリティ崩壊があるにもかかわらず、DECは明示的なニューラルネットワークよりも有利であることを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:50:16 GMT)
Planning and Learning in Risk-Aware Restless Multi-Arm Bandit Problem [4.2] レスレス・マルチアーム・バンディットでは、中央エージェントは複数のバンドイット(アーム)に限られたリソースを最適に分散させる。
本研究では,リスク・アウェアネスを組み込むことにより,従来のレスレスト・マルチアーム・バンディット問題をリスクニュートラル目標に一般化する。
我々は、リスク認識対象の指標可能性条件を確立し、Whittleインデックスに基づくソリューションを提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:59:30 GMT)
Multilingual Vision-Language Pre-training for the Remote Sensing Domain [4.1] コントラスト言語-画像事前学習(CLIP)に基づく手法は、現在、リモートセンシングデータを含む視覚・言語タスクをサポートするために広く使われている。
本研究は,多言語CLIPモデルの微調整を探求する,リモートセンシング領域のための新しいビジョン・アンド・ランゲージモデルを提案する。
提案したモデルでは,Remote Sensing Multilingual CLIP (RS-M-CLIP) と名づけた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:13:11 GMT)
BAMITA: Bayesian Multiple Imputation for Tensor Arrays [4.1] フレキシブルベイズフレームワークにおけるテンソルに対する多重計算手法を提案する。
我々のモデルは、CANDECOMP/PARAFAC(CP)因子化のために効率的で広く適用可能な共役前駆体を用いる。
また, 個体群の多様性の傾向を推定するために, 完全な微生物組織プロファイルの不確かさを正確に把握できることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:30:23 GMT)
WaveMixSR-V2: Enhancing Super-resolution with Higher Efficiency [4.1] 本稿では,従来の畳み込み層をピクセルシャッフル操作に置き換えることで,WaveMixSRアーキテクチャの拡張版を提案する。
我々の実験は、拡張モデルであるWaveMixSR-V2が、複数の超解像タスクにおいて、他のアーキテクチャよりも優れていることを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:16:43 GMT)
WaveMixSR-V2: Enhancing Super-resolution with Higher Efficiency [4.1] 本稿では,従来の畳み込み層をピクセルシャッフル操作に置き換えることで,WaveMixSRアーキテクチャの拡張版を提案する。
我々の実験は、拡張モデルであるWaveMixSR-V2が、複数の超解像タスクにおいて、他のアーキテクチャよりも優れていることを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:16:43 GMT)
Backdoor Attack Against Vision Transformers via Attention Gradient-Based Image Erosion [4.0] ビジョントランスフォーマー(ViT)は、様々なコンピュータビジョンタスクで従来の畳み込みニューラルネットワーク(CNN)を上回っている。
ViTはバックドア攻撃に対して脆弱で、敵がバックドアを被害者のモデルに埋め込む。
Intention Gradient-based Erosion Backdoor (AGEB) を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:06:12 GMT)
Legitimate ground-truth-free metrics for deep uncertainty classification scoring [4.0] 製造における不確実性定量化(UQ)手法の使用は依然として限られている。
この制限は、UQ基底真理を欠いたUQ手法を検証するという課題によってさらに悪化する。
本稿では,これらの指標を考察し,理論的に良好であり,実際に不確実な基礎的真理に結びついていることを証明する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:14:32 GMT)
Generative Inverse Design of Metamaterials with Functional Responses by Interpretable Learning [3.9] 本稿では, オンデマンド機能的振る舞いを持つメタマテリアル設計の高速な生成を実現するために, ランダムフォレストに基づく解釈可能生成逆設計(RIGID)手法を提案する。
トレーニングされたフォワードモデルから得られた目標満足度の可能性に基づいて、マルコフ連鎖モンテカルロ法を用いて設計ソリューションをサンプリングすることができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:38:21 GMT)
Generative Inverse Design of Metamaterials with Functional Responses by Interpretable Learning [3.9] ランダムフォレストに基づく解釈可能生成逆設計(RIGID)を提案する。
RIGIDは、オンデマンド機能挙動を持つメタマテリアル設計を高速に生成するための単発逆設計法である。
RIGIDの音響的・光学的メタマテリアル設計問題に対する評価を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:38:21 GMT)
NeuralSolver: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks [3.9] 我々は、より小さな問題(観測サイズの観点から)からアルゴリズムを学習し、大きな問題でそれらのアルゴリズムを実行する新しいリカレント・ソルバであるNeuralrに貢献する。
これは、入力サイズと出力サイズが同じである同サイズ問題と、入力サイズと出力サイズが異なる異サイズ問題の両方に自然に適用できる。
Neuralr は従来型再帰的解法よりも常に優れており、より大きな問題に外挿し、他の手法よりも少ないパラメータを必要とする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:42:44 GMT)
Efficient distributed representations with linear-time attention scores normalization [3.9] 本研究では,有界ノルムを持つ埋め込みベクトルに対するアテンションスコア正規化定数の線形時間近似を提案する。
推定公式の精度は、競合するカーネルメソッドを桁違いに上回る。
提案アルゴリズムは高度に解釈可能であり,任意の埋め込み問題に容易に適応できる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:10:19 GMT)
Deep learning meets tree phenology modeling: PhenoFormer vs. process-based models [3.9] PhenoFormerは、気候データ分布の変化の下で表現学を予測するのに、従来の統計手法よりも適したニューラルネットワークである。
スイスの9種の木質植物から得られた70年間の70万の現象学観測データから,PhenoFormerが従来の機械学習手法より優れていることを示す数値実験を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:40:55 GMT)
BSRBF-KAN: A combination of B-splines and Radial Basis Functions in Kolmogorov-Arnold Networks [3.8] 本稿では,B-splines と radial basis function (RBF) を組み合わせたコルモゴロフ・アーノルドネットワーク (KAN) のBSRBF-KANを紹介する。
BSRBF-KANは、MNISTで平均97.55%、Fashion-MNISTで89.33%の精度で5回のトレーニングで安定している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:59:28 GMT)
Learning Structure-Aware Representations of Dependent Types [3.8] Agdaは依存型プログラミング言語であり、証明アシスタントである。
本稿では,Agdaエコシステムを機械学習領域に拡張する。
我々は,Agdaプログラムプロテクションの新しいデータセットを導入し,リリースする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:40:30 GMT)
Kronecker-Factored Approximate Curvature for Physics-Informed Neural Networks [3.7] PINN損失に対するKronecker-factored almost curvature (KFAC)を提案する。
我々のKFACベースの勾配は、小さな問題に対する高価な2階法と競合し、高次元のニューラルネットワークやPDEに好適にスケールし、一階法やLBFGSを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:53:30 GMT)
The Prevalence of Neural Collapse in Neural Multivariate Regression [3.7] ニューラルネットワークは、分類問題に対するトレーニングの最終段階において、ニューラルネットワークがニューラル・コラプス(NC)を示すことを示す。
我々の知る限り、これは回帰の文脈における神経崩壊に関する最初の経験的、理論的研究である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:32:21 GMT)
Zero-energy Quantum Many-Body Scar under Emergent Chiral Symmetry and Pseudo Hilbert Space Fragmentation [3.7] キラル対称性と擬似HSFの相互作用におけるゼロエネルギーQMBSの現象について検討した。
この2つの相互作用は、粒子数が偶数であるとき、高度に局所化されたゼロエネルギーQMBSをもたらす。
ゼロエネルギーQMBSを信号化する単純な積状態を特定し、異常なスカーレッドダイナミクスを生じさせる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:46:10 GMT)
Offline Reinforcement Learning and Sequence Modeling for Downlink Link Adaptation [3.7] リンク適応は、モビリティ、高速なフェージング、不完全なチャネル品質情報の存在において難しい課題である。
本稿では,バッチ制約付きQ-ラーニング,保守的Q-ラーニング,意思決定変換に基づく3つのLA設計を提案する。
オフラインRLアルゴリズムは、データが適切な行動ポリシーで収集される場合、最先端のオンラインRLメソッドのパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:01:31 GMT)
Physics-Regularized Multi-Modal Image Assimilation for Brain Tumor Localization [3.7] 腫瘍治療計画は、患者の解剖学における腫瘍細胞の空間分布の正確な推定に大きく依存する。
ディープラーニングアプローチでは、信頼できるトレーニングデータがないため、完全な腫瘍細胞の分布を推定できない。
本稿では,データ駆動と物理に基づくコスト関数のバランスをとる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:51:22 GMT)
Physics-Regularized Multi-Modal Image Assimilation for Brain Tumor Localization [3.7] 本稿では,データ駆動と物理に基づくコスト関数を統合する新しい手法を提案する。
腫瘍組織と脳組織の学習分布が,それぞれの成長と弾性の方程式にどの程度順応するかを定量化する,ユニークな離散化手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:51:22 GMT)
Semicoherent Symmetric Quantum Processes: Theory and Applications [3.6] 我々は、$varepsilon$-approximateプロセスと半コヒーレントな文脈における正確な対称性の間の相互作用を考察する。
我々の研究は、量子力学の制御に対称性をどのように利用できるか、より深く理解し、より深い評価の道を開く。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:20:02 GMT)
Diffusion Beats Autoregressive: An Evaluation of Compositional Generation in Text-to-Image Models [3.6] テキスト・ツー・イメージ(T2I)生成モデルは、高品質でリアルで自然な画像を生成するのに顕著な熟練性を示している。
オープンソースの拡散に基づく新しいT2IモデルFLUXが導入された。
本稿では,T2I-CompBenchベンチマークを用いて,新たに導入されたモデルに対して構成生成能力を評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:43:29 GMT)
Orthogonality Broadcasting and Quantum Position Verification [3.5] 量子暗号プロトコルのセキュリティは、特定の量子状態に符号化された古典的な情報が放送できないという潜在的に弱い性質に由来する。
直交放送」の研究を紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:02:44 GMT)
Dispelling the Mirage of Progress in Offline MARL through Standardised Baselines and Evaluation [3.5] オフラインマルチエージェント強化学習(MARL)は、現実世界のアプリケーションに非常に有望な新興分野である。
オフラインMARLの研究の現状は、ベースラインと評価プロトコルの不整合に悩まされている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:08:43 GMT)
BIS: NL2SQL Service Evaluation Benchmark for Business Intelligence Scenarios [3.5] 既存のNL2ベンチマークは、プロダクションBIシナリオには適していない。
産業用BIシナリオにおける典型的なNL問題に焦点をあてた新しいベンチマークを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:33:03 GMT)
Transformer-Based Tooth Alignment Prediction With Occlusion And Collision Constraints [3.5] スウィントランスに基づく軽量な歯列アライメントニューラルネットワークを提案する。
まず、仮想アーチ線に基づいて3次元点雲を再編成し、それらを秩序な多チャンネルテクスチャに変換する。
次に,上顎と下顎の咬合関係を定量的に評価する2つの新しい咬合損失関数を考案した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:07:27 GMT)
Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks [3.5] 我々は、何千万もの2次元物理に基づくタスクを手続き的に生成し、それらを物理制御のための一般強化学習(RL)エージェントの訓練に使用する。
Kinetixは物理ベースのRL環境のオープンエンドスペースで、ロボットの移動やグリップからビデオゲームや古典的なRL環境まで、さまざまなタスクを表現できる。
我々の訓練されたエージェントは強力な物理的推論能力を示し、目に見えない人間が設計した環境をゼロショットで解決することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:59:41 GMT)
Decoding Fatigue Levels of Pilots Using EEG Signals with Hybrid Deep Neural Networks [3.4] 本研究は, 異なる疲労レベルを分類するために深層学習技術を用いることの可能性を示した。
私たちの知る限りでは、パイロットの疲労レベルを分類するのはこれが初めてです。
実験には10人のパイロットが参加し、模擬飛行環境で行われた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:57:41 GMT)
How Do Developers Use Type Inference: An Exploratory Study in Kotlin [3.4] KotlinはAndroid開発のデフォルト言語であり、最大のソフトウェアマーケットプレースのひとつです。
ソフトウェアリポジトリをマイニングするツールであるBoaを用いて,大規模な実証的研究を行う。
この結果,ローカル変数や変数に対して,ファイル外でメソッド呼び出しが宣言される場合,型推論が頻繁に使用されることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:07:21 GMT)
Generalized Short Path Algorithms: Towards Super-Quadratic Speedup over Markov Chain Search for Combinatorial Optimization [3.4] 本稿ではHastingsが最初に提案したショートパスフレームワークに基づいてアルゴリズムの一般化を分析する。
一般的に満たされているいくつかの技術的条件の下では、適切な一般化は超4次スピードアップを達成することができる。
本論文は,短経路アルゴリズムのパラメータ選択を導く数値解析で締めくくった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:52:56 GMT)
Cyber-physical WebAssembly: Secure Hardware Interfaces and Pluggable Drivers [3.3] 本研究は、I2CとUSBとのハードウェアインタラクションを可能にするWASI提案と概念実証実装を提案する。
これはWebAssembly内でデバイスドライバを実行することで実現される。
概念実証の徹底的な評価は、WASI-USBは、ネイティブOSのUSB APIと比較して、少なくとも8%のオーバーヘッドを最小化していることを示している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:21:22 GMT)
Synth-SBDH: A Synthetic Dataset of Social and Behavioral Determinants of Health for Clinical Text [3.3] 社会的および行動的健康決定因子(SBDH)は、健康結果において重要な役割を果たす。
既存のデータセットは、可用性とカバレッジにかなりの制限がある。
詳細なSBDHアノテーションを持つ新しい合成データセットであるSynth-SBDHを紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:15:44 GMT)
Gradient-free training of recurrent neural networks [3.3] 本稿では,勾配に基づく手法を使わずに再帰型ニューラルネットワークの重みとバイアスを全て構成する計算手法を提案する。
このアプローチは、動的システムに対するランダムな特徴ネットワークとクープマン作用素理論の組み合わせに基づいている。
時系列の計算実験,カオス力学系の予測,制御問題などにおいて,構築したリカレントニューラルネットワークのトレーニング時間と予測精度が向上することが観察された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:24:34 GMT)
Beyond Ontology in Dialogue State Tracking for Goal-Oriented Chatbot [3.2] 本稿では,対話状態追跡(DST)性能を向上させる新しい手法を提案する。
提案手法により,Large Language Model (LLM) による対話状態の推測が可能となる。
提案手法は,42.57%のJGAで最先端を達成し,オープンドメインの現実世界での会話でも良好に機能した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:36:23 GMT)
Guided Game Level Repair via Explainable AI [3.2] 機械学習モデルによって生成された手続き的に生成されたレベルは、さらなる編集なしでは解決できない。
本稿では,その解決不可能性に寄与するレベルの特定領域を特定するための説明可能性手法を提案する。
3つのゲームでテストした結果、このアプローチは手続き的に生成されたレベルを高速に修復するのに役立つことが実証された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:12:36 GMT)
Controllable Game Level Generation: Assessing the Effect of Negative Examples in GAN Models [3.2] GAN(Generative Adversarial Networks)は、ターゲット分布の学習と複製を目的とした教師なしモデルである。
Conditional Generative Adversarial Networks (CGAN) は、ジェネレータと識別器の両方を追加情報に条件付けすることでバニラGANを拡張する。
Rumi-GANは負の例を利用して、前向きな例を学習するジェネレータの能力を高める。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:18:26 GMT)
What makes unlearning hard and what to do about it [3.2] 未学習の難易度と未学習アルゴリズムの性能に影響を及ぼす2つの要因を同定する。
筆者らは,Refined-Unlearning Meta-algorithm (RUM) というフレームワークを開発した。そのフレームワークは, (i) 異なる特徴により, 忘れセットを均質化されたサブセットに精製し, (ii) 既存のアルゴリズムを用いて各サブセットを学習し,最後に、全体的な忘れセットを学習したモデルを提供するメタアルゴリズムである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:34:09 GMT)
Quantum Boltzmann machine learning of ground-state energies [3.2] ハミルトニアンの基底状態エネルギーを推定することは、量子コンピュータが役に立つ基本的な課題である。
本稿では,量子ボルツマンマシンの性能解析を行う。
提案アルゴリズムは,新しい量子回路構築法により,エネルギー関数の勾配を効率的に推定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:42:01 GMT)
Derivative-enhanced Deep Operator Network [3.2] デリバティブ強化ディープオペレータネットワーク(DE-DeepONet)
システムは、訓練コストを削減するために、DeepONetに入力された高次元パラメータの線形次元の削減を取り入れている。
微分損失は、フーリエ神経演算子(FNO)のような他の神経演算子を強化するために拡張することができる
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:36:56 GMT)
Self-optimization in distributed manufacturing systems using Modular State-based Stackelberg Games [3.2] モジュール製造システムにおける分散自己学習のための新しいゲーム構造である,Modular State-based Stackelberg Games (Mod-SbSG)を紹介する。
Mod-SbSGは、SbPG(State-based potential Games)とStackelbergゲームを統合することで、プロダクションシステム内の自己学習エージェント間の協調的な意思決定を強化する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:09:31 GMT)
Active Learning of Mealy Machines with Timers [3.1] ブラックボックスコンテキストにおけるタイマー付きMealyマシンのクラスを問合せ学習するための最初のアルゴリズムを提案する。
我々のアルゴリズムはVaandragerらのL#アルゴリズムを時間設定に拡張したものである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:49:15 GMT)
Imaginary part of timelike entanglement entropy [3.1] 場の理論の文脈では、ツイスト作用素のウィック回転を通して時間的な絡み合いのエントロピーを得るのがより適切である。
ある特別な場合において、時間的絡み合いエントロピーの虚部はツイスト作用素とその一階時間微分の可換性と関連している。
解析により、ストリップ幾何学において、時間的エンタングルメントエントロピーの虚部は、ツイスト作用素の可換子とその一階時間微分にのみ関係していることが示された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:39:37 GMT)
GreedyML: A Parallel Algorithm for Maximizing Submodular Functions [3.0] 分散メモリマルチプロセッサ上での単調部分モジュラ関数の最大化のための並列近似アルゴリズムについて述べる。
我々の研究は、データ要約、機械学習、グラフスカラー化といった分野における実践的な応用のために、大規模データセットのサブモジュラー最適化問題を解決する必要性によって動機付けられている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:51:58 GMT)
Hardware-Software Co-optimised Fast and Accurate Deep Reconfigurable Spiking Inference Accelerator Architecture Design Methodology [3.0] Spiking Neural Networks(SNN)は、機械学習モデルのエネルギー効率を改善するための有望なアプローチとして登場した。
我々は,ソフトウェア学習深層ニューラルネットワーク(DNN)を高精度スパイキングモデルに移植するハードウェア・ソフトウェア共同最適化戦略を開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:55:11 GMT)
Epsilon-Greedy Thompson Sampling to Bayesian Optimization [2.9] トンプソンサンプリング(TS)は、BOがエクスプロレーション-探索トレードオフを扱うために好まれるソリューションである。
TSは、新たな観測結果を得た後、真の目的関数に関する情報を集めることで、搾取を弱く管理する。
我々は、強化学習において確立された選択戦略である$varepsilon$-greedyポリシーを取り入れることで、TSの活用を改善する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:22:36 GMT)
Learning to Adopt Generative AI [2.9] 生成型AI導入プロセスにおいて,2種類のディジタル分割を提案する。
低学年および非白人は、ChatGPTから高いユーティリティゲインを得るが、そのユーティリティについてより遅い速度で学ぶ。
男性、若年者、ITのバックグラウンドを持つ人は、ChatGPTから高い利用率を得るだけでなく、その実用性についてより早く学ぶことができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:18:59 GMT)
Unscrambling disease progression at scale: fast inference of event permutations with optimal transport [2.9] 疾患進行モデルでは、慢性変性状態として、患者の特徴の変化の群レベルの時間的軌跡を推定する。
本研究では,Birkhoff polytopeに属する事象の潜在置換行列として,最適な輸送からモデル疾患進行へのアイデアを活用する。
実験は、シミュレーションにおけるノイズに対する速度、精度、堅牢性の増加を実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:00:01 GMT)
Can Large-Language Models Help us Better Understand and Teach the Development of Energy-Efficient Software? [2.9] エネルギー効率のよいソフトウェア工学の技術は、しばしば学部のカリキュラムから欠落している。
本稿では,エネルギー効率のよいソフトウェアのための学習用モジュールの開発について提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:09:32 GMT)
AMARO: All Heavy-Atom Transferable Neural Network Potentials of Protein Thermodynamics [2.9] 全原子分子シミュレーションはマクロ分子現象に関する詳細な知見を提供するが、その計算コストは複雑な生物学的過程の探索を妨げる。
我々は,O(3)等価なメッセージパッシングネットワークアーキテクチャと,水素原子を排除した粗粒度マップを組み合わせた,新しいニューラルネットワークポテンシャル(NNP)であるAMARO(Advanced Machine-learning Atomic Omni-force Representation-field)を紹介する。
AMAROは、エネルギー用語を使わずに、拡張性と一般化機能を備えた安定なタンパク質力学を実行するための訓練粗大化NNPの実現可能性を実証している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:42:12 GMT)
Robust Statistical Scaling of Outlier Scores: Improving the Quality of Outlier Probabilities for Outliers (Extended Version) [2.9] 外乱検出アルゴリズムは通常、データセット内の各観測値に外乱スコアを割り当て、観測値が外乱値である度合いを示す。
本論文は, 統計的スケーリングは, 文献でよく用いられるように, 外れ値に対して等しく良い確率を生じるものではないことを論じる。
本稿では,ロバストな統計的スケーリングを提案し,ロバストな推定器を用いてアウトレーヤの確率を向上する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:51:52 GMT)
ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems [2.9] Retrieval-Augmented Generation (RAG) システムは、無関係またはゆるい関連情報の検索によって不正確な応答を生成する。
チャンクレベルで取得した情報を評価・フィルタリングすることでRAGシステムを強化するフレームワークであるChunkRAGを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:15:31 GMT)
Nested ResNet: A Vision-Based Method for Detecting the Sensing Area of a Drop-in Gamma Probe [2.8] ドロップインガンマプローブは、リンパ節検出のためのロボット支援最小侵襲手術(RAMIS)に広く用いられている。
従来の研究では、腹腔鏡画像を用いて感知領域の位置を予測しようとしたが、予測精度は不十分であった。
本研究では,プローブの知覚領域を予測するための3分岐深度学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:08:43 GMT)
Uncertainty quantification for fast reconstruction methods using augmented equivariant bootstrap: Application to radio interferometry [2.8] 次世代の電波干渉計であるSquare Kilometer Arrayは、我々の電波天文学能力に革命をもたらすと約束している。
これらのデバイスが生成する前例のない量のデータは、不適切な電波干渉画像の問題を解決するために、高速で正確な画像再構成アルゴリズムを必要とする。
高速な再構成手法における不確かさを定量化できるラジオ拡張同変ブートストラップ法の適合バージョンに基づく教師なし手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:36:55 GMT)
Magnetic Field Detection Using a Two-Qubit System Under Noisy Heisenberg Interaction [2.8] ノイズの多い2量子ビット系を用いた磁界検出器の設計法を提案する。
磁場はデコヒーレンス過程に大きく影響しないが、時間とともに帰還確率に顕著な振動をもたらす。
これらの結果は、実用的な量子ベースの磁場検出器の実現の可能性を示している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:13:15 GMT)
Exploiting Phonological Similarities between African Languages to achieve Speech to Speech Translation [2.8] 本稿では,言語系統内および言語系統間の音声セグメントをマッピングするセグメントベースモデルを提案する。
5つの言語を含むケニア放送協会(KBC)から,プロプライエタリなデータセット上でモデルを評価した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:44:52 GMT)
System Reliability Engineering in the Age of Industry 4.0: Challenges and Innovations [2.7] 条件ベースの監視と予測保守は、重要な進歩の例である。
センサによる監視と運転支援システムによるスマート製造と自動車工学の応用に重点を置いている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:00:29 GMT)
Deterministic generation of frequency-bin-encoded microwave photons [2.7] 超伝導回路を用いたマイクロ波フォトニックモードの周波数ビン符号化法の実験的検討を行った。
我々は、その情報を異なる周波数で2つのフォトニックモードに同時に出力することで、超伝導量子ビットから量子情報を決定的に符号化する。
周波数ビン符号化フォトニックモードは、受信プロセッサで光子損失の発生を検出するために使用できる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:53:01 GMT)
Less is More: Pre-Training Cross-Lingual Small-Scale Language Models with Cognitively-Plausible Curriculum Learning Strategies [2.7] よりきめ細かいカリキュラム学習戦略を特定するために言語習得理論を利用できるかを評価する。
我々は、SSLMと取得インスパイアされたキュリキュラを言語横断的に実装するために、4つの言語家族のための年齢順コーパスを作成した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:31:54 GMT)
Ethical Leadership in the Age of AI Challenges, Opportunities and Framework for Ethical Leadership [2.7] 倫理的リーダシップは、これらの課題に直面し、それらの機会を最大化する上で、組織を導く上で中心的な役割を担います。
この記事では、倫理的リーダーシップとAIの簡易導入から始まる、AI時代の倫理的リーダーシップの本質について考察する。
AIの時代における倫理的リーダーシップの機会は、次のような質問に答える。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:30:56 GMT)
CRAFT@Large: Building Community Through Co-Making [2.6] CRAFT@Largeは、コーネル工科大学のMakerが立ち上げたイニシアチブで、アイデアを交換するための包括的環境を作る。
我々は、学術的なメーカースペースが行うコミュニティアウトリーチの伝統的な定義に挑戦する。
既存の学術メーカースペースは、1時間に1回のワークショップのみを提供するか、あるいはコミュニティメンバーがプロジェクト課題として学生が使用する問題を提供することで、コミュニティエンゲージメントを行うことが多い。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:26:32 GMT)
NCAdapt: Dynamic adaptation with domain-specific Neural Cellular Automata for continual hippocampus segmentation [2.5] 医用画像における連続学習(CL)は、モデルが獲得した知識を維持しながら新しい領域に適応する必要があるというユニークな課題を呈している。
この課題に対処するために,ニューラルセルオートマタに基づくNCAdaptを導入する。
NCAdaptはドメイン固有のマルチヘッド構造を持ち、新しいドメインが遭遇するたびに適用可能な畳み込み層をNAAバックボーンに統合する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:13:06 GMT)
Unlocking the Wisdom of Large Language Models: An Introduction to The Path to Artificial General Intelligence [2.5] 本書には、本章からのタイトル、要約、紹介、および最初の2章の全文も記載されている。
今週リリースされた第2版には、第6章から第9章への大幅な拡張と、Yann LeCun氏のAGIに対する懐疑論に対処する序文の改訂が含まれている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:15:20 GMT)
WaveRoRA: Wavelet Rotary Route Attention for Multivariate Time Series Forecasting [2.5] 本稿では,時系列データの複雑な時間依存性をモデル化するウェーブレット学習フレームワークを提案する。
ウェーブレット領域は時間と周波数情報を統合し、異なるスケールでの信号の局所特性の分析を可能にする。
回転路注意機構(Rotary Route Attention, RoRA)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:36:55 GMT)
Designing Algorithmic Recommendations to Achieve Human-AI Complementarity [2.4] 人間の意思決定を支援するレコメンデーションアルゴリズムの設計を形式化する。
我々は、潜在的なアウトカムフレームワークを使用して、ヒトの意思決定者による二元的治療選択に対するレコメンデーションの効果をモデル化する。
機械学習で実装可能な最小限の推奨アルゴリズムを導出する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:56:34 GMT)
PDSR: Efficient UAV Deployment for Swift and Accurate Post-Disaster Search and Rescue [2.4] 本稿では,PDSR(Post-Disaster Search and Rescue)のための包括的フレームワークを提案する。
この概念の中心は、多様なセンシング、通信、情報機能を備えたUAVスワムの迅速な展開である。
提案手法は従来の手法よりもはるかに高速に損傷領域の完全なカバレッジを実現することを目的としている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:46:15 GMT)
Dataset of polarimetric images of mechanically generated water surface waves coupled with surface elevation records by wave gauges linear array [2.4] 既存の技術はしばしば煩雑であり、一般的には波動/周波数応答の制限に悩まされる。
これらの課題に対処するために、主センサとデータ処理のための機械学習アルゴリズムを備えたカメラとして偏光フィルタを用いた新しい手法を開発した。
開発した手法のトレーニングと評価は、社内の教師付きデータセットに基づいて行われた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:35:27 GMT)
BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference [2.4] 推論速度を高めつつキャッシュメモリ使用量を最小限に抑える新しいKVキャッシュアルゴリズムであるBUZZを提案する。
BUZZはビーハイブ構造化スパースキャッシュを採用し、スライディングウィンドウを組み込んで最近の情報をキャプチャする。
CNN/Daily Mail, XSUM, Wikitext, 10-QAの4つの実世界のデータセット上でBUZZを評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:53:37 GMT)
Audience Reach of Scientific Data Visualizations in Planetarium-Screened Films [2.3] 本研究では,ドームショーのグローバルな影響を分析し,単一の可視化実験室から4本のドキュメンタリー映画に関するデータを提示する。
調査データによると、この4本の映画を68のプラネタリウムで見た人は1.2~260万人。
これらのショーをライセンスした315個のプラネタリウムの見積もりと外挿を含めると、これらの映画を観た人の推定は165~2410万人になる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:36:00 GMT)
Risk Sources and Risk Management Measures in Support of Standards for General-Purpose AI Systems [2.3] 我々は、汎用AIシステムのためのリスクソースとリスク管理対策の広範なカタログをコンパイルする。
この作業には、モデル開発、トレーニング、デプロイメントステージにわたる技術的、運用的、社会的リスクの特定が含まれる。
このカタログは、AIガバナンスと標準における利害関係者による直接的な使用を容易にするために、パブリックドメインライセンス下でリリースされている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:32:56 GMT)
Adaptive Transfer Clustering: A Unified Framework [2.3] 本稿では,未知の相違点が存在する場合の共通性を自動的に活用するアダプティブ・トランスファー・クラスタリング(ATC)アルゴリズムを提案する。
これはガウス混合モデル、ブロックモデル、潜在クラスモデルを含む幅広い統計モデルに適用される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:11:35 GMT)
Persistent Homology for MCI Classification: A Comparative Analysis between Graph and Vietoris-Rips Filtrations [2.3] 本研究は、ミルド認知障害(MCI)に伴う位相変化の詳細な分析を提供する。
この分析は、公開可能なADNIデータセットと社内TLSAデータセットの2つの異なる集団からのfMRI時系列データを利用する。
ヴィートリス・リップス濾過では、永続図形間のROI間 MCI ワッサーシュタイン距離行列が分類に使われ、グラフ濾過は最も永続的なホモロジーの特徴のトップ10に依存する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:24:40 GMT)
Computation with quantum Reed-Muller codes and their mapping onto 2D atom arrays [2.3] 本稿では,2つの量子リード・ミュラー符号を用いた誤り訂正と計算のための耐故障性構築について述べる。
これらのコード間のコード切替は、Steaneエラー訂正を用いて実現できることを示す。
PQRM符号を2次元のレイアウトにマッピングし、閉じ込められた原子の配列に実装する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:47:35 GMT)
The Adoption and Efficacy of Large Language Models: Evidence From Consumer Complaints in the Financial Industry [2.3] 本研究は、2015年から2024年までの消費者金融保護局に提出された消費者苦情に対するLarge Language Models(LLMs)の効果について検討する。
われわれは100万件以上の苦情を分析し,ChatGPTリリース後のLCM使用量の著しい増加を確認した。
以上の結果から,LCMへのアクセスを促進することで,消費者の関心事の理解を深め,消費者の競争力を高めることができる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:29:11 GMT)
Impact of parity violation on quantum entanglement and Bell nonlocality [2.2] 我々は、P違反が特定のスピン結合を優先し、QEおよびBI違反の程度に大きな影響を及ぼすことを見出した。
スピン1粒子崩壊の場合、P-違反相互作用はスピン0の場合と同様の効果をもたらす。
さらに、検出器内の磁場によって誘起されるQEおよびBIに対する見落とし効果について検討し、PおよびCP対称性の真の試験に欠かせないことを発見した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:14:09 GMT)
Impact of parity violation on quantum entanglement and Bell nonlocality [2.2] スピン-1/2二部系における量子エンタングルメント(QE)とベル不等式(BI)違反の関係について検討した。
その結果、パリティ(P)違反は粒子対を完全に解離させることができ、ベル試験は古典理論と量子理論の区別に効果がないことが明らかとなった。
我々は、QEおよびベル非局所性の予測を変化させる検出器内の磁場の影響について、これまで見過ごされていた点を強調した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:14:09 GMT)
Unveiling the Hidden Structure of Self-Attention via Kernel Principal Component Analysis [2.2] 自己アテンション(自己アテンション)は,キー行列の主成分軸上のクエリベクトルを特徴空間に投影することを示す。
本稿では,ロバスト成分を用いたアテンション(RPC-Attention)を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:40:04 GMT)
Image captioning in different languages [2.1] 本稿は、2024年5月現在)非英語画像キャプションデータセットのリストを提供する。
わずか23の異なる言語しか表現されないが、+/-500の制度言語は存在する。
本稿では、ビジョン&ランゲージの分野について、いくつかのオープンな質問で締めくくります。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:57:22 GMT)
Spread Complexity Rate as Proper Momentum [2.1] 共形場理論における局所作用素によって励起される量子状態の複雑さの速度と3次元反ド・ジッター時空における粒子の放射運動量との関係を示す。
我々は、状態の拡散複雑性によって与えられる量子複雑性の正確な定義と、その成長速度と適切な半径距離座標で測定されたバルク運動量との一致により、この対応を鋭くする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:00 GMT)
On computational complexity of unitary and state design properties [2.1] 計算複雑性理論の観点から、ユニタリおよび状態 $t$-designs について研究する。
フレームポテンシャルを計算し、1つの正確な計算が可能であることを示す量子アルゴリズムを提案する。
この結果から,単元設計と状態設計の計算的難易度が示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:35 GMT)
Dynamic Matching with Post-allocation Service and its Application to Refugee Resettlement [2.0] 米国の主要難民再定住機関との協力により、我々は、新しい到着(避難ケース)が静的リソースの1つ(固定年限の場所)と即時かつ不可逆的に一致しなければならない動的なマッチング問題を調査した。
サービスの時間的特性を考えると、サーバは特定の時点では利用できないため、動的リソースとして参照する。一致すれば、ケースは第一級サービスとして利用できるようになるのを待つことになる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:17:38 GMT)
Kernel Two-Sample Tests in High Dimension: Interplay Between Moment Discrepancy and Dimension-and-Sample Orders [1.9] 本研究では,カーネル2サンプル試験において,寸法と試料サイズが無限大に分散する場合の挙動について検討する。
我々は、ヌル仮説と局所的および固定的な選択肢の両方の下で中心極限定理(CLT)を確立する。
新たな非ヌルなCLT結果により,検出可能なモーメント差の微妙な相互作用が明らかとなる,正確な電力解析が可能となった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:54:45 GMT)
Contrastive Learning and Adversarial Disentanglement for Privacy-Preserving Task-Oriented Semantic Communications [1.9] 本稿では,タスク関連情報とタスク関連情報とをアンタングル化する情報ブートネック手法であるCLADを提案する。
CLADは、約2.5-3%の予測性能向上と、IRIの77-90%の削減、および57-76%の対向精度の低下を実現している。
実験の結果,CLADはタスクパフォーマンス,プライバシ保護,IRIにおいて最先端のベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:59:52 GMT)
Quantum approximate optimization algorithm with random and subgraph phase operators [1.9] カスタム位相演算子と呼ばれる通常のコスト以外のハミルトニアンの使用がQAOAの性能に与える影響について検討する。
これらのカスタム位相演算子のいくつかは、元のアルゴリズムの実装よりも高い近似比を達成可能であることを数値的に示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:13:43 GMT)
Automated Image-Based Identification and Consistent Classification of Fire Patterns with Quantitative Shape Analysis and Spatial Location Identification [1.8] 火のパターンは、火の挙動や起源についての洞察を提供する火のエフェクトから成り、伝統的に調査員の視覚的観察に基づいて分類される。
本研究では, 火災調査者を支援するための定量的な火災パターン分類手法を提案する。
フレームワークの分類結果は、合成データで93%、実際の火災パターンで83%の精度が得られる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:15:41 GMT)
No imputation without representation [1.7] 欠落した値は、原則として、計算によって失われる有用な情報に寄与する可能性がある。
missing-indicatorアプローチは、インプットと組み合わせて、この情報をデータセットの一部として表現することが可能になる。
この実験は、20の実生活データセットに基づいて、3つの計算戦略と様々な分類アルゴリズムに対して実施する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:03:44 GMT)
SpiroActive: Active Learning for Efficient Data Acquisition for Spirometry [1.6] 呼吸器疾患は世界で7番目に健康が悪く、世界で3番目に多い死因であり、2019年には323万人が死亡した。
本稿では,機械学習のサブフィールドである能動的学習を用いて,データ収集とラベル付けに関わる課題を軽減することを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:07:30 GMT)
Emergence of meta-stable clustering in mean-field transformer models [1.6] 我々は、トランスフォーマー層の深いスタック内のトークンの進化を、単位球上の連続時間フローとしてモデル化する。
我々は,メタ安定相の出現と持続性,クラスタリング現象,次世代予測などのアプリケーションにおける重要な要素に注目した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:16:38 GMT)
Don't Just Pay Attention, PLANT It: Transfer L2R Models to Fine-tune Attention in Extreme Multi-Label Text Classification [1.6] 我々は、微調整XMTCデコーダのための新しいトランスファー学習戦略であるPLANT -- Pretrained and Leveraged AtteNTionを紹介した。
PLANTは、模倣フル、模倣フィフティ、模倣フォー、Eurlex、wikitenデータセットに関するすべてのメトリクスで、既存の最先端メソッドを超越している。
特に数ショットのシナリオでは優れており、前モデルでは数ショットのシナリオで特別に設計されたモデルよりも、模倣率でF1スコアで50ポイント以上、模倣率で36ポイント以上上回っている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:41:23 GMT)
CURATRON: Complete and Robust Preference Data for Rigorous Alignment of Large Language Models [1.6] 本稿では,大規模言語モデルと人間の価値観を協調する上での課題について考察する。
本稿では,LLMのレジリエンスを高めるために,堅牢で悪意のあるAIパイプラインデータセットを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:54:38 GMT)
CoGS: Model Agnostic Causality Constrained Counterfactual Explanations using goal-directed ASP [1.6] CoGSはモデルに依存しないフレームワークであり、分類モデルの反実的な説明を生成することができる。
CoGSは、望ましい結果を達成するために必要な変更について、解釈可能かつ実行可能な説明を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:43:01 GMT)
Random Heterogeneous Neurochaos Learning Architecture for Data Classification [1.5] カオスベースのニューラルネットワークであるNeurochaos Learning(NL)は先日,Generalized L"uroth Series(GLS)やロジスティックマップをニューロンとして使用した。
はじめに、様々なカオスニューロンをランダムに入力層に配置するNLのランダムな異種拡張を提案する。
従来の機械学習(ML)手法と組み合わせたランダム不均一神経カオス学習(RHNL)アーキテクチャの性能評価を行った。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:14 GMT)
An algebraic interpretation of Pauli flow, leading to faster flow-finding algorithms [1.5] パウリフローの存在は、積 $NC が有向非巡回グラフの隣接行列を形成するような正逆の$C$ of$M$が存在するときのみである。
我々は、パウリフローを見つけるために$mathcalO(n3)$アルゴリズムを取得し、一般化フローを見つけるために以前の$mathcalO(n4)$バウンドを改良した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:30:01 GMT)
Danoliteracy of Generative, Large Language Models [1.4] デンマーク語と文化能力の尺度であるDanoliteracyを評価するためのGLLMベンチマークを提案する。
デンマーク語で GLLM のシナリオ性能のばらつきを95% で説明できる強力な要因が1つ見いだされる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:18:31 GMT)
Intelligent Environmental Empathy (IEE): A new power and platform to fostering green obligation for climate peace and justice [1.4] 我々は、国際機関を通じて、権威主義的なトップダウン政府間協力は、これまで環境問題や危機を克服できなかったことを示す。
気候の平和と正義のための知的環境共感(IEE)モデルを運用レベルで提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:15:10 GMT)
Continuous Evolution of Digital Twins using the DarTwin Notation [1.3] 本稿では,ユーザの要求と優先順位の進化を通じて,DT(s)の集合を維持するという課題に取り組む。
我々は2つのコントリビューションを提供している: (i) 双子のシステム、その目的、特性、実装の推論を可能にする視覚的表記形式であるDarTwinを開発し、 (ii) DTシステムの進化を記述した一連のアーキテクチャ変換を導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:47:22 GMT)
Unbiased Regression Loss for DETRs [1.3] 我々は、DETRベースの検出器に対して、新しい非バイアス回帰損失を導入する。
提案された新たなアンバイアスド・ロスは、Sized $L_1$ lossと呼ばれ、各ボックスの幅と高さに基づいて、すべてのボックスのサイズを正規化している。
本実験は,完全教師付き設定と半教師付き設定の両方において一貫した改善を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:05:18 GMT)
CNN Explainability with Multivector Tucker Saliency Maps for Self-Supervised Models [1.2] 本論文では,タッカーテンソル分解を応用して特徴写像の固有構造をよりよく把握するタッカー・サリエンシ・マップ(TSM)法を提案する。
これらは高忠実度マップを生成するために使用され、入力に対する関心の対象を効果的に強調する。
我々はEigenCAMとTSMを、すべての特異ベクトルと値を利用するマルチベクトル変種であるMultivec-EigenCAMとMultivector Tucker Saliency Maps(MTSM)に拡張する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:46:34 GMT)
Decision-Focused Learning with Directional Gradients [1.2] そこで我々は,予測最適化フレームワークとして,摂動勾配損失(PG損失)と呼ばれる,決定を意識した新たなサロゲート損失のファミリーを提案する。
通常、断片的に一定かつ不連続な元の決定損失とは異なり、新しいPG損失はリプシッツ連続であり、凹函数の違いである。
我々は,PG損失が,基礎モデルが不明確である場合に,既存の提案よりも実質上優れていることを示す数値的な証拠を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:01:13 GMT)
Learning Dynamic Selection and Pricing of Out-of-Home Deliveries [1.2] 本稿では、畳み込みニューラルネットワークへの入力として、新しい時空間状態符号化を用いたアルゴリズムパイプラインであるOOH(DSPO)の動的選択と価格設定を提案する。
実世界のデータによって導かれた我々の広範な数値研究により、DSPOはOOH位置のない状況と比較して19.9%のコストを節約できることが明らかとなった。
我々は、OOHデリバリーのダイナミクスと価格戦略に影響された顧客の行動の間の複雑な相互作用に関する総合的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:56:21 GMT)
Bonafide at LegalLens 2024 Shared Task: Using Lightweight DeBERTa Based Encoder For Legal Violation Detection and Resolution [1.2] 我々は、構造化されていないテキストデータ内の法的違反を検出するための2つのシステム、名前付きエンティティ解決(NER)と自然言語推論(NLI)を提案する。
どちらのシステムも軽量のDeBERTaベースのエンコーダで、LCMのベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:42:38 GMT)
Deterministic Policies for Constrained Reinforcement Learning in Polynomial Time [1.2] 本アルゴリズムは,制約付き強化学習問題に対するほぼ最適決定性ポリシーを効率的に計算する。
我々の研究は、2つの長年の研究にまたがる3つのオープンな疑問に答える。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:58:51 GMT)
Scalable Sampling for High Utility Patterns [1.2] 大規模量データベースのための新しい高能率パターンサンプリングアルゴリズムとそのオンディスクバージョンを提案する。
提案手法は,ユーザ中心方式に必要な対話性と,ランダムサンプリングによる強い統計的保証の両方を保証する。
提案手法の興味を示すために,考古学的知識グラフによる発見を応用した,魅力的なユースケースを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:22:54 GMT)
Community search signatures as foundation features for human-centered geospatial modeling [1.2] 本稿では,検索対象の集合的および匿名化された表現を生成するための新しい手法を提案する。
複数の領域にまたがる空間データセットを用いてこれらの特徴をベンチマークする。
これらの特徴を時間的厳密なアライメントを伴わずに空間的予測に利用できることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:09:22 GMT)
Towards Unconditional Uncloneable Encryption [1.2] Uncloneablecryptは、古典的なメッセージを量子暗号文に暗号化する暗号化プリミティブである。
関連するセキュリティゲームにおける敵の成功確率は、キー数を表す$K$が1/2+1/ (2sqrtK)$に2次収束し、1/2$は自明に達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:40:06 GMT)
Robustness of data-driven approaches in limited angle tomography [1.1] 本研究では,データ駆動型アプローチが従来のフィルタバックプロジェクション手法と比較して,安定して多くの情報を再構築できるという数学的説明を与える。
さらに、U-Netニューラルネットワークに基づく実験を用いて、理論の検証を行う。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:34:53 GMT)
Automated Personnel Selection for Software Engineers Using LLM-Based Profile Evaluation [1.1] 本研究は,NLP(Advanced Natural Language Processing)技術に基づく自動スタッフ選択手法を用いて,ソフトウェアエンジニアのプロファイルを評価する。
教育、経験、スキル、自己紹介といった重要な属性を持つLinkedInプロファイルを収集して、新たなデータセットが生成される。
85%の精度と0.85のF1スコアで、RoBERTaは最高の成績を収めた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:12:19 GMT)
Learning Lipschitz Operators with respect to Gaussian Measures with Near-Optimal Sample Complexity [1.0] ガウス測度に関して,リプシッツ作用素の近似を期待して検討する。
鍵となる発見は、$m$という最小の達成可能な(適応的な)サンプリングと再構成マップの厳密な特徴づけである。
ほぼ最適サンプルの複雑性を確実に達成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:32:30 GMT)
Structure and inference in hypergraphs with node attributes [1.0] 我々は,高次相互作用による構造理解を改善するために,ノード属性をどのように利用できるかを示す。
我々は,高次相互作用とノード属性を組み合わせて,観測された相互作用をよりよく表現する原理モデルを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:49:15 GMT)
Improving Apple Object Detection with Occlusion-Enhanced Distillation [1.0] 自然環境で成長するリンゴは、しばしば葉や枝から激しい視覚障害に直面する。
OED(Occlusion-Enhanced Distillation)と呼ばれる手法を導入し、隠蔽データセット上の意味的に整合した特徴の学習を規則化する。
提案手法は, 広範囲な比較実験により, 最先端技術よりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:36:18 GMT)
Generating Diverse Negations from Affirmative Sentences [1.0] 否定は、動詞句、節、その他の表現において負の極性を符号化する現実世界の応用において重要である。
多様な否定型を生成することにより,否定データセットの欠如に対処する手法であるNegVerseを提案する。
我々は,構文構造に基づいて,否定が最も起こりやすい文の一部をマスキングするための新しい規則を提案する。
また, 否定の手がかりを同定し, 退化例を除去し, 多様な有意義な摂動を生じさせるフィルタリング機構を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:25:02 GMT)
Optimizing Attention and Cognitive Control Costs Using Temporally-Layered Architectures [1.0] 生物学的制御は、計算エネルギー支出と決定頻度を最適化しながら、顕著な性能を達成する。
我々は,強化学習環境においてエージェントが利用できる決定数や計算エネルギーを制限する決定境界マルコフ決定プロセス(DB-MDP)を提案する。
生物学的に着想を得たTLA(Temporally Layered Architecture)を導入し、エージェントが時間スケールとエネルギー要求の異なる2つの層を通じて計算コストを管理できるようにする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:38:06 GMT)
Fröhlich versus Bose-Einstein Condensation in Pumped Bosonic Systems [0.9] フリック凝縮(Fr"ohlich-condensation)は、環境温度における生体系におけるボース・アインシュタイン様凝縮の仮説である。
ここでは、オープン量子系におけるマグノン凝縮の本質的特徴を解明する。
期待されるマグノンの占有に対する我々の導出した運動方程式は、Fr"ohlich-condensationを規定する速度方程式と形式的に類似していることが判明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:52:10 GMT)
Dynamical loss functions shape landscape topography and improve learning in artificial neural networks [0.9] クロスエントロピーと平均二乗誤差を動的損失関数に変換する方法を示す。
異なるサイズのネットワークに対する検証精度を大幅に向上させる方法を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:47:04 GMT)
A Study of Secure Algorithms for Vertical Federated Learning: Take Secure Logistic Regression as an Example [0.9] 本稿では,分散データに焦点をあて,垂直的フェデレート学習方式によるモデルトレーニングをセキュアに行う。
ここでは、セキュアとは、プロセス全体が暗号化されたドメインで実行されることを意味するので、プライバシーに関する懸念が解放される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:17:35 GMT)
Linear and non-linear relational analyses for Quantum Program Optimization [0.9] 位相折り畳み最適化はエファフィン関係解析として再キャスト可能であることを示す。
直列回路のシンボリック・トランジション関係を正確に抽出するために,Emphsum-over-paths法が有効であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:57:07 GMT)
Accelerating Direct Preference Optimization with Prefix Sharing [0.9] 我々は、選択された応答を1つのシーケンスとして処理し、共有したプレフィックスを1つのシーケンスとして処理する新しいテクニックである、選好チューニングのためのプレフィックス共有を導入する。
コンバージェンスに影響を与えることなく,一般的なDPOデータセットのトレーニングスループットを1.1$-1.5times$改善する。
私たちの研究は、より広い範囲のアプリケーションやモデルサイズに対して、好みベースの微調整をより使いやすくすることに貢献しています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:02:43 GMT)
A little less conversation, a little more action, please: Investigating the physical common-sense of LLMs in a 3D embodied environment [0.9] 大規模言語モデル (LLM) はエージェントシステムにおける推論エンジンとしてますます使われている。
LLMにおける身体的常識推論の具体的かつ認知的な評価を初めて提示する。
シミュレーション3次元仮想実験室であるAnimal-AI環境を用いて, LLMの物理的常識推論について検討した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:28:28 GMT)
Subwords as Skills: Tokenization for Sparse-Reward Reinforcement Learning [0.8] これらの問題に対処するために設計されたメソッドの1つのクラスは、同じドメインで収集されたインタラクションデータからしばしばスキルと呼ばれる時間的に拡張されたアクションを形成する。
まず、クラスタリングによってアクション空間を識別し、次に、自然言語処理から借用したトークン化技術を利用して、時間的に拡張されたアクションを生成する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:45:17 GMT)
Resource Governance in Networked Systems via Integrated Variational Autoencoders and Reinforcement Learning [0.8] 本稿では,変分オートエンコーダ(VAE)と強化学習(RL)を統合し,システム性能のバランスをとるフレームワークを提案する。
この手法の重要な革新は、ネットワーク構造の広大なアクション空間を扱う能力である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:57:02 GMT)
Investigations into Proof Structures [0.8] 我々は、証明をグローバルな方法で対象として操作し分析するための新しい形式論を導入し、詳述する。
これは、コヒーレントで包括的な形式的な再構築と、ルカシエヴィチによる広く研究されている問題の歴史的証明の分析に例示的に適用される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:55:46 GMT)
Adaptive Network Intervention for Complex Systems: A Hierarchical Graph Reinforcement Learning Approach [0.8] 本稿では,階層型グラフ強化学習フレームワークについて紹介する。
低い社会的学習の下では、HGRLマネージャは協力を維持し、コオペレーターが支配する堅牢なコア周辺ネットワークを形成する。
対照的に、高い社会的学習の欠陥は加速し、スパサーやチェーンのようなネットワークへと繋がる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:59:02 GMT)
Tangent Space Causal Inference: Leveraging Vector Fields for Causal Discovery in Dynamical Systems [0.8] 本稿では,動的システムの因果性を検出するためのTangent Space Causal Inference (TSCI)法を提案する。
まず、TSCIアルゴリズムの基本バージョンを提示し、基本的なCCMアルゴリズムよりも効果的であることを示した。
また、潜在変数モデルとディープラーニングの表現力を利用するTSCIの拡張版も提示する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:08:12 GMT)
Resolving single molecule structures with nitrogen-vacancy centers in diamond [0.8] ダイヤモンド中の窒素空孔(NV)中心に基づく2次元核磁気共鳴分光法の理論的検討を行った。
我々は,強いサブサンプルデータのスペクトルにおける重要な特徴の同定に要するデータ量を削減するために,特異値閾値行列補完アルゴリズムを用いる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:17:49 GMT)
The Trail Making Test in Virtual Reality (TMT-VR): The Effects of Interaction Modes and Gaming Skills on Cognitive Performance of Young Adults [0.8] 本研究は,VRにおけるトレイルメイキングテスト(TMT-VR)の開発と評価である。
異なるインタラクションモードとゲームスキルが認知能力に及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:06:14 GMT)
Many-body quantum catalysts for transforming between phases of matter [0.8] 触媒の概念を多体量子物理学に適用する。
我々は、異なる対称性で保護されたトポロジカル位相間の変換を可能にする触媒を構築する。
触媒のアプローチが物質相の構造に対する新たな洞察にどのようにつながるかを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:03:21 GMT)
HiBO: Hierarchical Bayesian Optimization via Adaptive Search Space Partitioning [0.8] HiBOは,グローバルレベルの検索空間分割情報をローカルBOベースの取得戦略に統合した,新しい階層型アルゴリズムである。
一連の評価は、HiBOが高次元の合成ベンチマークにおいて最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:04:16 GMT)
It's Our Loss: No Privacy Amplification for Hidden State DP-SGD With Non-Convex Loss [0.8] 特定の損失関数に対して、DP-SGDの最終繰り返しは、最終損失関数と同じくらい多くの情報をリークすることを示す。
DP-SGDは一般にすべての(非)損失関数に対してプライバシーの増幅は不可能である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:41:44 GMT)
Conditional entropy and information of quantum processes [0.7] 量子チャネルの条件エントロピーは、量子過程の洞察を明らかにする可能性を秘めている。
両部類流路の因果構造と条件エントロピーの関連性を明らかにする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:08:57 GMT)
Conditional entropy and information of quantum processes [0.7] 量子チャネルの条件エントロピーは、チャネルの重要な特徴を明らかにする可能性があることを示す。
条件付きエントロピーの定義は、量子チャネルに対するエントロピーの強い部分付加性を確立することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:08:57 GMT)
ASURA-FDPS-ML: Star-by-star Galaxy Simulations Accelerated by Surrogate Modeling for Supernova Feedback [0.7] 代理モデルによって加速される新しい高分解能銀河シミュレーションを導入し、計算コストを約75%削減する。
約8太陽質量のゼロ年代主系列質量を持つ質量級の恒星は、核崩壊型超新星(CCSNe)として爆発する
計算コストを削減し,物理スケールギャップを効果的に橋渡しし,マルチスケールシミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:02 GMT)
SoftCTRL: Soft conservative KL-control of Transformer Reinforcement Learning for Autonomous Driving [0.7] 本稿では,暗黙のエントロピー-KL制御を用いて,ILと強化学習(RL)を組み合わせる手法を提案する。
特に、未確認のデータセットと異なる挑戦的都市シナリオを検証した結果、ILは模倣作業でうまく機能するが、提案手法はロバスト性(障害の17%以上)を著しく改善し、人間のような運転行動を生成することが示唆された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:18:00 GMT)
Does ChatGPT Have a Poetic Style? [0.7] 我々は、GPT-3.5とGPT-4モデルに、24種類の詩形式とスタイルで英語詩を生成するよう促す。
得られた5.7k詩を分析し、これらを詩財団とアメリカ詩人アカデミーの3.7k詩のサンプルと比較する。
GPTモデル、特にGPT-4は、共通言語と非共通言語の両方で詩を作成できることがわかった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:29:51 GMT)
Larger models yield better results? Streamlined severity classification of ADHD-related concerns using BERT-based knowledge distillation [0.7] 自然言語処理アプリケーションのための軽量でパワフルなBERTベースのモデルを作成します。
ソーシャルメディアのテキストデータから,注意欠陥多動性障害(ADHD)の重症度レベルを分類した実世界のタスクに,結果モデルであるLastBERTを適用した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:57:44 GMT)
Instigating Cooperation among LLM Agents Using Adaptive Information Modulation [0.7] 本稿では,人間戦略行動と強化学習のためのプロキシとしてLLMエージェントを併用した新しいフレームワークを提案する。
ネットワーク内のエージェント間での情報アクセスを調節し、社会的福祉を最適化し、社会的行動を促進する。
このフレームワークは、実世界のチーム設定におけるAIの展開に寄与する、AIを介するソーシャルダイナミクスに関する重要な洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:45:15 GMT)
SECURE: Benchmarking Large Language Models for Cybersecurity [0.7] 大規模言語モデル(LLM)はサイバーセキュリティの応用の可能性を示しているが、幻覚や真実性の欠如といった問題により信頼性が低下している。
本研究は、これらのタスクに関する7つの最先端モデルを評価し、サイバーセキュリティの文脈におけるその強みと弱点に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:29:37 GMT)
Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs [0.7] 大規模言語モデル(LLM)は、より高度なユースケースに適用され、微調整のための高品質でタスク固有のデータセットを生成する。
高品質な人的データを使用することは、モデルのパフォーマンスをアンロックするための最も一般的なアプローチであるが、多くのシナリオでは違法に高価である。
合成データやハイブリッドデータの生成など、いくつかの代替手法も登場したが、これらの手法の有効性は未だ不明である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:12:49 GMT)
Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs [0.7] 大規模言語モデル(LLM)は、より高度なユースケースに適用され、微調整のための高品質でタスク固有のデータセットを生成する。
高品質な人的データを使用することは、モデルのパフォーマンスをアンロックするための最も一般的なアプローチであるが、多くのシナリオでは違法に高価である。
合成データやハイブリッドデータの生成など、いくつかの代替手法も登場したが、これらの手法の有効性は未だ不明である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:12:49 GMT)
Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs [0.7] 大規模言語モデル(LLM)は、より高度なユースケースに適用され、微調整のための高品質でタスク固有のデータセットを生成する。
高品質な人的データを使用することは、モデルのパフォーマンスをアンロックするための最も一般的なアプローチであるが、多くのシナリオでは違法に高価である。
合成データやハイブリッドデータの生成など、いくつかの代替手法も登場したが、これらの手法の有効性は未だ不明である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:12:49 GMT)
Optimal deep learning of holomorphic operators between Banach spaces [0.7] 我々はバナッハ空間間の学習作用素の問題に取り組むが、これはヒルベルト空間のみを考える過去の研究の大多数とは対照的である。
任意の近似エンコーダとデコーダを標準フィードフォワードディープニューラルネットワーク(DNN)アーキテクチャと組み合わせる。
本稿では,この問題に対してDLが最適であることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:34:22 GMT)
AI, insurance, discrimination and unfair differentiation. An overview and research agenda [0.6] 保険会社は人工知能(AI)によって実現された2つのトレンドに魅了されているようだ
まず、保険会社はAIを使って、より正確にリスクを評価するために、より新しいタイプのデータを分析することができる。
第二に、保険会社はAIを使用して、個々の消費者の行動をリアルタイムで監視することができる。
この2つの傾向は多くの利点をもたらすが、社会に差別的影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:57:36 GMT)
Accelerated AI Inference via Dynamic Execution Methods [0.6] 本稿では,入力に基づいて計算フローを最適化する動的実行手法に着目する。
議論されている手法には、ディープネットワークからの早期離脱、言語モデルの投機的サンプリング、拡散モデルの適応的なステップが含まれる。
実験により、これらの動的アプローチは、品質を損なうことなく、レイテンシとスループットを大幅に改善できることが示された。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:49:23 GMT)
Compositional Segmentation of Cardiac Images Leveraging Metadata [0.5] 心機能評価と心構造変化の経時的モニタリングには,心像のセグメンテーションが不可欠である。
本研究では,心画像中の心臓を同時に局所化し,興味のある領域のパートベースセグメンテーションを行う,新しい構成セグメンテーション手法を提案する。
また,画像取得時に収集した心筋画像に関連するメタデータを活用するために,新しいクロスモーダル・フィーチャー・インテグレーション(CMFI)モジュールを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:41:35 GMT)
Crosstalk Attack Resilient RNS Quantum Addition [0.5] イオントラップ量子ビットに対する3つの新しい量子クロストーク攻撃を提案する。
提案した攻撃は6ビットから9ビットの出力を持つ量子完全加算器(QFA)の出力確率を最大42.2%削減する。
最後に,Residue Number System (RNS) を用いた並列量子加算(PQA)によるクロストーク攻撃の軽減の可能性を検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:08:23 GMT)
Unmasking the Polygamous Nature of Quantum Nonlocality [0.5] 量子力学は、ある観測値の統計に制限を課す。
3人の観測者の最も単純な場合、もし2人の観測者がベルの不等式に違反したとしても、3人目の観測者に対してベルの不等式に違反した者はいないことが示されている。
ここではベル単ガミーが普遍的に成り立たないことを示し、実際は3人の観測者のみに単ガミー的状況が存在することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:53 GMT)
Mapping the DeFi Crime Landscape: An Evidence-based Picture [0.4] 分散型金融(DeFi)は多くの利益主導型犯罪の標的となっている。
本研究は、DeFiセクターを対象とする利益主導型犯罪の包括的評価を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:40:51 GMT)
L3Cube-IndicQuest: A Benchmark Question Answering Dataset for Evaluating Knowledge of LLMs in Indic Context [0.4] L3Cube-IndicQuestは,ゴールド標準の質問応答ベンチマークデータセットである。
データセットには200の質問応答ペアが含まれており、それぞれ英語と19のIndic言語に対応しており、Indicリージョン固有の5つのドメインを含んでいる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:30:57 GMT)
Quantum cryptography visualized: assessing visual attention on multiple representations with eye tracking in an AR-enhanced quantum cryptography student experiment [0.4] 本稿では,ARを用いた量子暗号学生実験における表現の分析を行う。
また、得られた視線データに基づいて、提供された複数の表現に関する学習者の視覚的注意についても論じる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:26:12 GMT)
Reliability of Topic Modeling [0.4] トピックモデルの信頼性を定量化する標準的な手法は,2つの広く使用されているトピックモデルにおいて,その変動の本質的な側面を捉えるのに失敗することを示す。
合成データと実世界のデータから、マクドナルドの$omega$は信頼性の最高のカプセル化を提供することを示している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:42:04 GMT)
Revisiting the Laplace Transform in Quantum Mechanics: Correcting a Flawed Approach for the Stationary Schrödinger Equation [0.4] Tsaur と Wang による2014年の研究では、様々なポテンシャルに対する定常シュル・オーディンガー方程式を解くためのラプラス変換に基づく方法が導入された。
本稿では,一次元シュリンガー方程式に対するラプラス変換の利用を再検討し,境界条件や特異点を扱う際の正しい慣行を明らかにする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:34:49 GMT)
The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities [0.4] 本稿では,Large Language Models (LLM) の微調整について検討する。
従来の自然言語処理(NLP)モデルから、AIにおける彼らの重要な役割まで、LLMの歴史的進化を概説している。
本報告では, 微調整LDMのための構造化7段パイプラインについて紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:04:15 GMT)
The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities [0.4] 本稿では,Large Language Models (LLM) の微調整について検討する。
従来の自然言語処理(NLP)モデルから、AIにおける彼らの重要な役割まで、LLMの歴史的進化を概説している。
本報告では, 微調整LDMのための構造化7段パイプラインについて紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:04:15 GMT)
Beyond Current Boundaries: Integrating Deep Learning and AlphaFold for Enhanced Protein Structure Prediction from Low-Resolution Cryo-EM Maps [0.4] DeepTracer-LowResEnhanceは、AlphaFoldのパワーとディープラーニングの強化されたマップリファインメント技術を相乗化するフレームワークである。
この手法は低解像度のCryo-EMマップからモデルの構築を著しく改善するために設計されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:52:46 GMT)
On the stability of gradient descent with second order dynamics for time-varying cost functions [0.3] この研究は、Gaudio et al. 2021 と Moreu & Annaswamy 2022 の2次ダイナミクスによる勾配降下を明示的に時間変化のコスト関数に適用した結果に基づいている。
これらのより一般的な結果は、リアルタイム学習アプリケーションに対する安全で信頼性の高いデプロイメントを保証するために、これらの最適化スキームの設計と認定に役立つ。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:55:03 GMT)
Fast and reliable atom transport by optical tweezers [0.3] そこで本研究では, 断熱性(STA)に対するショートカットが, 迅速かつ信頼性の高い単一原子輸送を実現することを実証する一連の概念実証実験を行った。
以上の結果から,トラップ寿命によって制限される距離を平均して原子を一定の加速で輸送できることが示唆された。
これにより、STA法は長距離原子輸送に特に適しており、センチメートル以上の距離にまたがる可能性がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:08:49 GMT)
Federated Learning for Diabetic Retinopathy Diagnosis: Enhancing Accuracy and Generalizability in Under-Resourced Regions [0.3] 糖尿病網膜症は、世界中の高齢者の視覚喪失の原因となっているが、未治療領域では眼科医が欠如している。
現在の最先端のディープラーニングシステムは、一般化性に限界があるため、これらの機関で苦労している。
本稿では,効率的なNetB0アーキテクチャを用いた糖尿病網膜症診断のための新しいフェデレーション学習システムについて検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:56:56 GMT)
From Hype to Reality: The Road Ahead of Deploying DRL in 6G Networks [0.3] 6Gアプリケーションは、膨大な接続性、高い計算能力、超低レイテンシを必要とする。
本稿では,6Gにおける深層強化学習(DRL)の変容の可能性について述べる。
6Gの要求を満たすことで、古典的な機械学習ソリューションに対するアドバンテージを強調している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:02:54 GMT)
Parameter uncertainties for imperfect surrogate models in the low-noise regime [0.3] 我々は、不特定、ほぼ決定論的シュロゲートモデルの一般化誤差を解析する。
遅れた一般化誤差を避けるために、後続分布が全ての訓練点をカバーする必要があることを示す。
これは、原子論的機械学習における1000次元データセットに適用する前に、モデル問題で実証される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:05:41 GMT)
Is it me, or is A larger than B: Uncovering the determinants of relational cognitive dissonance resolution [0.3] 本研究では,認知的不協和の解消の基礎となる計算機構について検討する。
大きな不協和がオブジェクトの表現を変える一方で、小さな不協和が期待される関係の調整につながることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:52:50 GMT)
AI in Investment Analysis: LLMs for Equity Stock Ratings [0.3] 本稿では,Large Language Models (LLMs) のマルチ水平ストックレーティングへの適用について検討する。
本研究は、LLMを活用して株価評価の精度と一貫性を向上させることで、これらの課題に対処する。
提案手法は,フォワードリターンで評価した場合,従来の株価評価手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:06:57 GMT)
Quantum Carleman linearisation efficiency in nonlinear fluid dynamics [0.3] 計算流体力学を強化するための有望な道の1つは、量子コンピューティングの利用である。
本稿では,Carleman線形化の効率性を保証する数値パラメータである$R$の接続を提案する。
また,異なる空間次元におけるベクトル場シミュレーションの定式化も導入する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:32:18 GMT)
When can classical neural networks represent quantum states? [0.2] n-量子状態の単純古典表現では、指数関数的に多くの振幅を計算ベースで指定する必要がある。
過去の研究では、古典的なニューラルネットワークが、多くの物理的に関連する状態に対して、これらの振幅を簡潔に表現できることが示されている。
量子状態の測定分布に存在する条件付き相関が,それらのニューラル表現の性能を制御することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:06:53 GMT)
Profiling AI Models: Towards Efficient Computation Offloading in Heterogeneous Edge AI Systems [0.2] 本稿では、AIモデルのプロファイリング、モデルタイプと基盤となるハードウェアに関するデータ収集、リソース利用とタスク完了時間の予測に焦点を当てた研究ロードマップを提案する。
3,000以上の実行での実験は、リソース割り当ての最適化とEdge AIのパフォーマンス向上を約束している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:07:14 GMT)
Efficient Feature Extraction and Classification Architecture for MRI-Based Brain Tumor Detection [0.2] 脳MRIは、腫瘍の存在や欠如を明らかにするのに不正確であることが知られている。
本研究では,腫瘍の存在を特定するために,畳み込みニューラルネットワーク(CNN)を訓練した。
CNNモデルの結果、99.17%の精度を示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 00:47:32 GMT)
Late Breaking Results: Fast System Technology Co-Optimization Framework for Emerging Technology Based on Graph Neural Networks [0.2] 本稿では,次世代IC設計のための高速システム技術協調最適化(STCO)フレームワークを提案する。
我々は、TCADシミュレーションとセルライブラリー評価の両方にグラフニューラルネットワーク(GNN)ベースのアプローチを用いることで、AI技術を用いたSTCOの技術レベルの向上に重点を置いている。
これらの進歩は1.9Xから14.1Xまでのランタイムスピードアップを伴う包括的なSTCOイテレーションを可能にし、新興技術と従来の技術の両方をサポートする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:44:09 GMT)
Dynamic Vocabulary Pruning in Early-Exit LLMs [0.1] 大きな言語モデル(LLM)のサイズが大きくなると、パフォーマンスが向上することが示されている。
これは、より遅く、より高価な推論のコストが伴う。
本稿では,各トークンに対して,テスト時に語彙を動的にプルーニングすることを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:28:02 GMT)
Application of Large Language Models to Quantum State Simulation [0.1] 現在、様々な量子シミュレーターが研究者に強力なツールを提供しているが、これらのシミュレーターで量子進化をシミュレートすると、しばしば高コストが発生する。
本稿では、1量子ビットと2量子ビットの量子シミュレータモデルを構築し、複数の量子ビットに拡張し、最終的には3量子ビットの例を実装する過程を詳述する。
本研究は,LLMが量子ビット間の進化パターンを理論的出力状態と比較して最小限の誤差で効果的に学習し,予測できることを実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:46:35 GMT)
Application of Large Language Models to Quantum State Simulation [0.1] 現在、様々な量子シミュレーターが研究者に強力なツールを提供しているが、これらのシミュレーターで量子進化をシミュレートすると、しばしば高コストが発生する。
本稿では、1量子ビットと2量子ビットの量子シミュレータモデルを構築し、複数の量子ビットに拡張し、最終的には3量子ビットの例を実装する過程を詳述する。
本研究は,LLMが量子ビット間の進化パターンを理論的出力状態と比較して最小限の誤差で効果的に学習し,予測できることを実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:46:35 GMT)
An Event-Based Digital Compute-In-Memory Accelerator with Flexible Operand Resolution and Layer-Wise Weight/Output Stationarity [0.1] ニューラルネットワーク(SNN)をスパイクするためのCIMアクセラレータは、エッジビジョンアプリケーションにおいて、$mu$sレベルの推論レイテンシと超低エネルギーを可能にする、有望なソリューションである。
本稿では,任意のオペランド解像度と形状をサポートするデジタルCIMマクロを提案する。
我々のアプローチは、IBM DVSジェスチャデータセットで最先端の分類精度95.8%に達しながら、大規模システムで最大90%のエネルギーを節約できる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:55:13 GMT)
Enhancing non-classical correlations for light scattered by an ensemble of cold two-level atoms [0.1] コールド2レベル原子のアンサンブルにおいて, 自発4波混合により生成する2光子の量子相関の増大を報告した。
この増強は、2つの励起光子のスペクトルのレイリー線型成分のフィルタリングに基づいている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:33:26 GMT)
Opportunities and Challenges of Generative-AI in Finance [0.1] 本稿では,金融分野におけるGen-AI技術の応用について概観する。
本稿では,Gen-AI技術の育成に使用可能な各種手法と,金融エコシステムにおけるGen-AI技術の応用分野について述べる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:52:42 GMT)
Revisiting MAE pre-training for 3D medical image segmentation [0.1] 自己監督学習(Self-Supervised Learning)は、未解決の膨大な臨床データセットの可能性を解き放つ、エキサイティングな機会を提供する。
SSLは自然言語処理やコンピュータビジョンといった分野に革命をもたらし、その3D医療画像コンピューティングへの採用は、3つの重要な落とし穴によって制限されてきた。
i)最先端のnnU-Netフレームワーク内の残留U-Netアーキテクチャを用いて,44kの3次元脳MRIボリュームとii)の大規模データセットを活用することで,これらの課題に対処する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:42:59 GMT)
STIED: A deep learning model for the SpatioTemporal detection of focal Interictal Epileptiform Discharges with MEG [0.1] 脳磁図(MEG)を用いたてんかん間葉状放電(IED)の非侵襲的検出
深層学習(DL)は臨床MEGの実践に革命をもたらす可能性がある。
我々は,2つの畳み込みニューラルネットワークと時間的(1次元時間軸)および空間的(2次元トポグラフィー)特徴を組み合わせた,強力で教師付きなDLアルゴリズムであるSTIEDを開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:41:22 GMT)
Enhancing Neural Network Representations with Prior Knowledge-Based Normalization [0.1] 我々は、ニューラルネットワーク表現を改善するために事前知識を活用するマルチモード正規化の新しいアプローチを導入する。
本手法は,画像分類,領域適応,画像生成において,タスク間のコンバージェンスや性能に優れることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:55:01 GMT)
Detecting and Mitigating Bias in Algorithms Used to Disseminate Information in Social Networks [0.0] 影響アルゴリズムは、影響者の集合を特定するために使用される。
これらの手法を用いたシード情報によって情報ギャップが生じることを示す。
インフルエンスと情報エクイティを最大化する多目的アルゴリズムを考案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:42:50 GMT)
YOLOv11 for Vehicle Detection: Advancements, Performance, and Applications in Intelligent Transportation Systems [0.0] 本稿では,YOLOシリーズの深層学習モデルの最新の進歩であるYOLO11の詳細な解析について述べる。
YOLO11は、複雑な環境における検出速度、精度、堅牢性を向上させるために設計されたアーキテクチャの改善を導入している。
精度,リコール,F1スコア,平均平均精度(mAP)などの指標を用いて,YOLO11の性能を評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:57:46 GMT)
Wavelet Burst Accumulation for turbulence mitigation [0.0] 最近提案された重み付きフーリエバースト累積法(FBA)のウェーブレット領域への拡張について検討した。
本手法の目的は、ぼやけた一連のフレームからクリーンでシャープな画像を再構成することである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:31:48 GMT)
Very fast Bayesian Additive Regression Trees on GPU [0.0] 単一のCPUコアと比較して最大200倍高速なGPU対応のBARTを実装し、XGBoostで実行時にBARTと競合する。
この実装はPythonパッケージのbartzで利用できる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:29:03 GMT)
Variable Resolution Sampling and Deep Learning Image Recovery for Accelerated Multi-Spectral MRI Near Metal Implants [0.0] 金属インプラントの使用の増加は、金属加工物に影響されたMRIスキャンを増大させた。
アンダーサンプルVRデータの深層学習再構成により,SSIM値とPSNR値が有意に向上した。
このアプローチは、スキャン時間を短縮したり、高分解能を実現することで、金属インプラント近傍のMRI検査を強化する可能性がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:19:06 GMT)
Universality of the $π^2/6$ Pathway in Avoiding Model Collapse [0.0] π-2乗オーバ6の増大リスクの普遍性は、正準統計モデルの大群にまたがることを示した。
さまざまな拡張プロセスに対応可能なフレームワークを提供しています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:44:10 GMT)
Unique multipartite extension of quantum states over time [0.0] 時間的定式化による量子状態は、密度作用素の定式化を時間領域に拡張する。
2つの単純な仮定が、時間とともに二部分量子状態の多部分拡張を独特に取り出すことを示す。
結論は、我々の結果が量子マルコビアン性(英語版)の新たな特徴をいかに生み出すかを示すことである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:26:17 GMT)
Training LLMs for Generating IEC 61131-3 Structured Text with Online Feedback [0.0] 本稿では,学習データの品質向上を重視した大規模言語モデル(LLM)の学習手法を提案する。
このフレームワークは、産業自動化アプリケーションに非常に適しており、最先端のモデルを上回っている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:11:54 GMT)
Tightening convex relaxations of trained neural networks: a unified approach for convex and S-shaped activations [0.0] 本研究では,アフィン関数を持つ活性化成分の密接な凸化を導出する公式を開発する。
我々の手法は、分離された超平面を効率的に計算したり、様々な設定に存在しないと判断したりすることができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:09:53 GMT)
The Transformative Impact of AI and Deep Learning in Business: A Literature Review [0.0] 本稿では,ビジネスのさまざまな機能領域におけるAIと深層学習の根本的役割を概観する。
医療分野、小売業と製造業、農業と農業、財政における材料的応用をカバーしている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:35:03 GMT)
The Persistence of Neural Collapse Despite Low-Rank Bias: An Analytic Perspective Through Unconstrained Features [0.0] ディープニューラルネットワークは最終層の特徴と重みにおいて単純な構造を示し、一般に神経崩壊と呼ばれる。
最近の知見は、そのような構造は、深い制約のない特徴モデルでは一般的に最適ではないことを示している。
これは正則化によって引き起こされる低ランクバイアスによるもので、これは一般的に深い神経崩壊に関連するものよりも低いランクの解を好む。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:20:39 GMT)
The Impact of Quantum-Safe Cryptography (QSC) on Website Response [0.0] 2024年、国立標準技術研究所は量子セーフ暗号(QSC)標準を公表した。
本研究の目的は,NISTの量子抵抗暗号アルゴリズムがWebサイト応答時間に与える影響を評価することである。
その結果、QSCアルゴリズムは、通常のネットワーク条件下での古典的アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 03:44:46 GMT)
The Evolution Of The Digital Inheritance: Legal, Technical, And Practical Dimensions Of Cryptocurrency Transfer Through Succession In French-Inspired Legal Systems [0.0] この論文は、ブロックチェーン技術、仮想ウォレット、暗号鍵に関連する技術的側面から、暗号通貨のメカニズムを分析する。
この研究は、暗号通貨に関する法的側面についても検討し、異なる国際司法管轄区域における彼らの地位の多様性に焦点を当てた。
ケーススタディでは、暗号通貨を主対象とする継承に関する具体的な例を示し、移行過程において継承者が直面する主な課題に関する展示を完了した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:05:31 GMT)
Teaching a Language Model to Distinguish Between Similar Details using a Small Adversarial Training Set [0.0] 対向テストセット(+13%)では,元のNLIタスクでは良好な性能を維持しつつ,精度が向上した。
また、SNLIテストセットの最も類似した矛盾点について、91.2%から92.9%まで精度が向上した(コサイン類似性によって判断される)。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:27:55 GMT)
System-environment quantum information flow [0.0] 量子資源は,2つの線形鎖の量子ビットに結合した1つの量子ビットをモデルとして,メインシステムから環境へどのように伝播するかを示す。
我々は、この力学の出現条件と量子ダーウィン論の存在を結びつける。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:48:59 GMT)
Spectral properties of Levy Rosenzweig-Porter model via supersymmetric approach [0.0] rho(E)$はエルゴディックとフラクタル相の遷移を通してシステムを駆動する制御パラメータに大きく依存することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:44:15 GMT)
Soft Language Prompts for Language Transfer [0.0] 自然言語処理(NLP)における言語間知識伝達の課題
本研究では,パラメータ効率のよい微調整法を組み合わせることで,言語間NLPアプリケーションを改善するための知見を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:30:39 GMT)
Slow Relaxation in a Glassy Quantum Circuit [0.0] ガラスとエルゴードの挙動を調整可能なFloquetランダム量子回路を導入・解析する。
ランダム量子回路の有効場理論を用いて、準エネルギー固有状態間の相関を解析する。
本研究では, ガラス系におけるスペクトル形状因子の傾斜は, ガラス系におけるセクター数の因子によって増大していることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:58:08 GMT)
Semantic Enrichment of the Quantum Cascade Laser Properties in Text- A Knowledge Graph Generation Approach [0.0] テキストからQCLプロパティの知識グラフ(KG)を生成する手法を提案する。
興味深い特徴は、作業温度、レーザー設計タイプ、レーザー光出力、ヘテロ構造である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:22:22 GMT)
Self-Driving Car Racing: Application of Deep Reinforcement Learning [0.0] このプロジェクトの目的は、OpenAI Gymnasium CarRacing環境でシミュレーションカーを効率的に駆動するAIエージェントを開発することである。
本稿では,DQN(Deep Q-Network)やPPO(Proximal Policy Optimization)などのRLアルゴリズムや,トランスファーラーニングとリカレントニューラルネットワーク(RNN)を組み込んだ新たな適応手法について検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:32:25 GMT)
SFA-UNet: More Attention to Multi-Scale Contrast and Contextual Information in Infrared Small Object Segmentation [0.0] 赤外線小オブジェクト(ISOS)は、いくつかの課題のために、依然として大きな焦点をあてています。
Scharr Convolution (SC) と Fast Fourier Convolution (FFC) を組み合わせることで,垂直および水平のアテンションゲート (AG) を UNet に組み込むことにより,SFA-UNet という改良されたU-Netアーキテクチャを提案する。
SCは、背景から背景までのコントラスト情報を学ぶのに役立ち、FFCは、小さなオブジェクトが消える問題を緩和しながら、マルチスケールのコンテキスト情報を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:21:23 GMT)
Rule by Rule: Learning with Confidence through Vocabulary Expansion [0.0] テキストベースのデータに特化して設計されたルール学習に革新的な反復的アプローチを提案する。
生成したルールの信頼性を示す指標として信頼性の価値を導入する。
各種テキストおよび非テキストデータセットに対する広範囲な実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:54:01 GMT)
Robust Micro-Macro Entangled States [0.0] メソスコピックシステムの量子ビット状態とマクロ的に異なる状態の間の二部交絡状態は、量子情報処理の新たな資源である。
実験室でこのような状態を生成する上での大きな課題は、環境騒音に対する堅牢性である。
我々は、単一粒子雑音に対する最も頑健な状態として、対称マイクロマクロ絡み合った状態を特定する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:11:09 GMT)
Retention Induced Biases in a Recommendation System with Heterogeneous Users [0.0] ユーザインフローとチャーンダイナミクスを用いたレコメンデーションシステム(RS)の概念モデルについて検討する。
レコメンデーションアルゴリズムを変更すると、定常状態が変化し、遷移期間が生成される。
遷移期間中に得られたA/B実験の指標は、RSの長期的なパフォーマンスのバイアスのある指標である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:16:49 GMT)
Response Estimation and System Identification of Dynamical Systems via Physics-Informed Neural Networks [0.0] 本稿では,物理インフォームドニューラルネットワーク(PINN)を用いた力学系の同定と推定について検討する。
PINNは、既知の物理法則をニューラルネットワークの損失関数に直接埋め込むことによって、複雑な現象の単純な埋め込みを可能にするユニークな利点を提供する。
その結果、PINNは上記のすべてのタスクに対して、たとえモデルエラーがあっても、効率的なツールを提供することを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:10:21 GMT)
Response Estimation and System Identification of Dynamical Systems via Physics-Informed Neural Networks [0.0] 本稿では,物理インフォームドニューラルネットワーク(PINN)を用いた力学系の同定と推定について検討する。
PINNは、既知の物理法則をニューラルネットワークの損失関数に直接埋め込むことによって、複雑な現象の単純な埋め込みを可能にするユニークな利点を提供する。
その結果、PINNは上記のすべてのタスクに対して、たとえモデルエラーがあっても、効率的なツールを提供することを示した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:10:21 GMT)
Relative volume of comparable pairs under semigroup majorization [0.0] 本研究は, 電子化関係における最近の結果と予想について概説する。
我々は、emphUT-majorization関係の場合、新しい正確な有限-n$の結果を証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:48:59 GMT)
Real classical shadows [0.0] 我々は、$mathcalU$が局所または大域クリフォードゲートに対応し、$mathcalW$が実数値ベクトルからなる場合を研究する。
提案手法は,様々な状況において,従来のシャドウプロトコルが標準スキームの複雑さを向上することを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:15:39 GMT)
Quantum efficiency and vertical position of quantum emitters in hBN determined by Purcell effect in hybrid metal-dielectric planar photonic structures [0.0] 電子照射により生成された個々のhBN色中心の光学特性を比較した。
剥離結晶の乾燥移動前後で特徴付ける発光体を特徴付ける。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:55:50 GMT)
Quantum efficiency and vertical position of quantum emitters in hBN determined by Purcell effect in hybrid metal-dielectric planar photonic structures [0.0] 電子照射により生成された個々のhBN色中心の光学特性を比較した。
剥離結晶の乾燥移動前後で特徴付ける発光体を特徴付ける。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:55:50 GMT)
Quantum coherence between mass eigenstates of a neutrino can be destroyed by its mass-momentum entanglement [0.0] 不安定な粒子の崩壊で生じるニュートリノや反ニュートリノが付随する粒子と絡まっていない場合、その質量はその運動量と相関する。
この絡み合いは、運動量と位置表現の両方においてニュートリノの質量固有状態の間の量子コヒーレンスを破壊する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:14:43 GMT)
Quantum Phase Estimation without Controlled Unitaries [0.0] 制御自由な量子位相推定を行うため,適応型古典位相探索アルゴリズムを実演する。
我々はFermi-Hubbardモデルのスペクトル推定における両手法の有効性を数値的に検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:46:22 GMT)
Public Domain 12M: A Highly Aesthetic Image-Text Dataset with Novel Governance Mechanisms [0.0] 提案するパブリックドメイン12M(PD12M)は,1240万の高品質なパブリックドメインと,CC0ライセンスの画像に合成キャプションを付加したデータセットである。
PD12Mは、これまでで最大のパブリックドメインイメージテキストデータセットであり、著作権の懸念を最小限に抑えながら基礎モデルをトレーニングするのに十分なサイズである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:59:05 GMT)
Progression: an extrapolation principle for regression [0.0] 本稿では,新しい統計外挿原理を提案する。
これは、予測器とトレーニング予測器のサンプルの境界における応答との単純な関係を仮定する。
我々の半パラメトリック法である進行法は、この外挿原理を活用し、トレーニングデータ範囲を超えた近似誤差の保証を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:29:51 GMT)
Probing quantum anomalous heat flow using mid-circuit measurements [0.0] この研究は、2つの量子ビット間の量子異常な熱の流れを初めて観測した。
中間回路計測を用いて,半古典的熱流境界に反する量子回路を設計した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:58:47 GMT)
Practical and Accurate Reconstruction of an Illuminant's Spectral Power Distribution for Inverse Rendering Pipelines [0.0] スペクトルレンダリングとインシーン照明者のスペクトルパワー分布は、フォトリアリスティック画像の生成において重要な役割を担っている。
均一発光体のSPDを簡易かつ低コストで捕捉・再構成する手法を提案する。
シミュレーションや実世界の例では,スポットライトとうまく連携する手法を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:18:48 GMT)
Photon-number moments and cumulants of Gaussian states [0.0] 光子数に基づいてガウス状態のモーメントと累積表現を開発する。
我々は光子数モーメントと累積の計算が#Pハードであることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:44:07 GMT)
Performance Benchmarking of Quantum Algorithms for Hard Combinatorial Optimization Problems: A Comparative Study of non-FTQC Approaches [0.0] 本研究は、4つの異なる最適化問題にまたがっていくつかの非フォールト耐性量子コンピューティングアルゴリズムを体系的にベンチマークする。
我々のベンチマークには、変分量子固有解法など、ノイズの多い中間スケール量子(NISQ)アルゴリズムが含まれている。
以上の結果から,FTQC以外のアルゴリズムは全ての問題に対して最適に動作しないことが明らかとなり,アルゴリズム戦略の調整の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:41:29 GMT)
Optimizing Temperature Distributions for Training Neural Quantum States using Parallel Tempering [0.0] 温度最適化は変分アルゴリズムの成功率を大幅に向上させることができることを示す。
我々はこれを、制限されたボルツマンマシンとフィードフォワードネットワークという2つの異なるニューラルネットワークを用いて実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:48:35 GMT)
Optical forces on atoms subject to higher-order Poincar{é} vortex modes [0.0] 一般の準軸高次ポアンカー光ベクトルモードに浸漬された原子の光力を考える。
原子との結合は、特定の偏光が波動偏光のスペクトル内にあるようなモードを含む広い範囲のシナリオを引き起こす。
このことは、単位ポアンカー球面上のモードの角座標で表される偏極であるモードオーダー$m$によって支配される様々な物理的状況を引き起こすことを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:13:39 GMT)
Open Turbulent Image Set (OTIS) [0.0] 乱流大気から得られたいくつかの配列を含むOTISと呼ばれる新しいデータセットについて述べる。
ほぼすべてのシーケンスに対して、アルゴリズムの比較を容易にするため、対応する基盤構造を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:10:18 GMT)
On the Complexity of Quantum Field Theory [0.0] 最小限のアサーションから、形式と次数と呼ばれる2つの整数による複雑性の測定が自然に導かれることを示す。
我々は、摂動理論、対称性、再正規化群といった文脈における我々のアプローチの物理的解釈について議論する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:00 GMT)
On filter design in deep convolutional neural network [0.0] コンピュータビジョンにおけるディープ畳み込みニューラルネットワーク(DCNN)は、有望な結果をもたらした。
フィルタやウェイトはDCNNで学習する上で重要な要素である。
過去10年間に、半監督的、自己監督的、そして非監督的手法に関する様々な研究がなされてきた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:18:59 GMT)
Numerical evaluation of the real-time photon-instanton cross-section in a superconducting circuit [0.0] 超伝導回路の実験は、インスタントンの直接動的シグネチャの第一証拠となった。
このフレームワークは、他の多くの量子場理論の文脈で有用である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:39:13 GMT)
Non-binary artificial neuron with phase variation implemented on a quantum computer [0.0] 複素数の位相を操作するバイナリモデルを一般化するアルゴリズムを導入する。
量子コンピュータにおける連続的な値を扱うニューロンモデルを提案し,検証し,実装する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:18:53 GMT)
Non-Hermitian Discrete Time Crystals [0.0] 開量子系における周期倍振動を持つ安定DTCの確立機構を考案する。
我々は、固有状態順序付けによる熱化を防ぐ非エルミート力学において、特定の非相互結合のクラスを見つける。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:39:18 GMT)
Neural spell-checker: Beyond words with synthetic data generation [0.0] スペルチェックは、テキスト中のミススペルされた単語を識別することでコミュニケーションを強化する貴重なツールである。
近年のディープラーニングの改良により、従来のスペルチェッカーを新たな機能で改善する新たな機会が開けている。
我々は2つの新しいスペルチェッカーを提示、比較し、それらを合成、学習、より一般的なSloveneデータセット上で評価する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:51:01 GMT)
Multi-Agent Large Language Models for Conversational Task-Solving [0.0] 対話型タスク解決における新たな主人公として,マルチエージェントシステムが誕生する。
複雑さの異なるタスク間で、マルチエージェントの議論がどのように機能するかは、いまだ不明である。
2022年から2024年までの20のマルチエージェント研究の分類について提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 11:38:13 GMT)
Mirror Matrix on the Wall: coding and vector notation as tools for introspection [0.0] 我々はオクタベにおけるベクトル表記の使用について、演算子と関数の解析を通して検討する。
ベクトル表記を採用することで、オクタベは数学者、科学者、技術者にとって強力なツールとなる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:12:45 GMT)
Mind the Gap: A Generalized Approach for Cross-Modal Embedding Alignment [0.0] Retrieval-Augmented Generation (RAG) システムは、意味的ギャップによって異なるテキストモダリティ間でコンテキストを検索する。
本稿では,これらのギャップを効率的に埋める汎用投影法を提案する。
私たちのアプローチでは、トレーニングや推論に最小限のリソースを必要とするため、スピード、正確性、データ効率を重視しています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:28:10 GMT)
Mechanistic Interpretability of Reinforcement Learning Agents [0.0] 本稿では、手続き的迷路環境下で訓練されたニューラルネットワークを用いて、強化学習(RL)エージェントの機械論的解釈可能性について検討する。
ネットワークの内部動作を分離することにより、迷路の壁や経路などの基本的な特徴を特定し、モデルの意思決定プロセスの基礎を形成しました。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:02:50 GMT)
Measurement-induced entanglement and complexity in random constant-depth 2D quantum circuits [0.0] ランダムな定数深さ量子回路によって生成される状態の絡み合い構造を解析する。
回路アーキテクチャのいくつかの自然クラスにおいて, 一定の臨界深度以上でマクロ的な長距離絡み合いが生じることを証明した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:33:02 GMT)
Macroscopic Thermalization for Highly Degenerate Hamiltonians [0.0] 純粋な状態 $psi$ の孤立したマクロ量子系について、$psi$ がヒルベルト空間の適当な部分空間 $mathcalH_eq$ の内か近くにある場合、それはマクロ熱平衡であると言う。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:52:38 GMT)
Machine Learning Nonadiabatic Dynamics: Eliminating Phase Freedom of Nonadiabatic Couplings with the State-Intraction State-Averaged Spin-Restricted Ensemble-Referenced Kohn-Sham Approach [0.0] SSR(2,2) の形式論において、ダイアバティック・ハミルトニアンの非対角要素の正方形から導かれる無相結合項 $Delta2$ を導入する。
このアプローチは、CI特異点と二重値結合関数に起因する問題に対処することにより、モデルの安定性と精度を向上させる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:30:46 GMT)
Learning General Representation of 12-Lead Electrocardiogram with a Joint-Embedding Predictive Architecture [0.0] ECG-JEPAは、ECGデータのセマンティック表現を学ぶためにマスキング戦略を採用している。
CroPAは、モデルがパッチ間の関係を効果的にキャプチャすることを可能にする。
ECG-JEPAは非常にスケーラブルで、大規模なデータセットの効率的なトレーニングを可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:33:40 GMT)
Large Model Strategic Thinking, Small Model Efficiency: Transferring Theory of Mind in Large Language Models [0.0] 微調整による小型かつ高性能な特殊アルゴリズムの実現可能性について検討する。
まず,異なる社会的文脈と異なる社会的ジレンマのゲームを組み合わせて,その回答を記録し,Q&Aの微調整に使用する,20種類のシナリオを持つ大規模事前学習モデルを提案する。
微調整されたより小さな言語モデルは、より小さな事前訓練されたモデルとより大きな相対性の間の性能のギャップを一貫して橋渡しすることを発見した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:37:57 GMT)
Large Language Models Based JSON Parser Fuzzing for Bug Discovery and Behavioral Analysis [0.0] この研究プロジェクトは、テストを強化するためにLLM(Large Language Models)を活用することに焦点を当てている。
主な目的は、オープンソースにおける潜在的なバグの発見にLLMを使用してテストケースとミュータントを生成することである。
根底にあるバグを明らかにし、振る舞いの多様性を発見(そして克服)することを目的としています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:28:41 GMT)
LLMs for Targeted Sentiment in News Headlines: Exploring the Descriptive-Prescriptive Dilemma [0.0] 本稿では,ニュース見出しの感情分析のために,最先端のLCMと微調整エンコーダモデルの精度を比較した。
我々は、ゼロショットから精巧な数ショットのプロンプトまで、プロンプトの規範性によってパフォーマンスがどのように影響を受けるかを分析する。
LLMは記述的データセット上で微調整エンコーダよりも優れており、キャリブレーションやF1スコアは記述性の向上とともに一般的に改善されている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:00:42 GMT)
Kinetic Inductance and Jitter Dependence of the Intrinsic Photon Number Resolution in Superconducting Nanowire Single-Photon Detectors [0.0] 超伝導ナノワイヤ単光子検出器(SNSPD)は、優れた効率、速度、ノイズ低減、タイミング精度を提供する。
光子数による識別は、ナノワイヤの電気的特性と読み出しジッタによって制限されている。
低ジッタおよび運動インダクタンスの増加により、異なる光子数のパルス分離が促進され、PNR能力が向上する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:16:11 GMT)
Keep on Swimming: Real Attackers Only Need Partial Knowledge of a Multi-Model System [0.0] 本稿では,マルチモデルシステム全体に対する敵攻撃を行う手法を提案する。
私たちの知る限り、これはこの脅威モデルのために特別に設計された最初の攻撃です。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:23:16 GMT)
Joint Estimation of Conditional Mean and Covariance for Unbalanced Panels [0.0] 本研究では,大きな不均衡パネルに対する断面条件平均と共分散行列の非パラメトリックカーネルベース推定器を提案する。
一貫性を示し、有限サンプル保証を提供します。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:21:15 GMT)
Invariant Hamiltonian Bootstrap for Quantum Many-body Ground States [0.0] ハミルトニアンブートストラップ法は半有限緩和を用いて、ハミルトニアンの基底状態エネルギーに対する下界を求める。
我々は,必要となる計算資源を大幅に削減するために対称性を利用することができることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:26:01 GMT)
Interferometric Differential High-Frequency Lock-In Probe for Laser-Induced Vacuum Birefringence [0.0] フェムト秒光強調キャビティに結合したパルスレーザーを用いたレーザー誘起真空複屈折の測定を提案する。
この測定技術は、キャビティ強化ポンプとプローブパルス、および独立制御パルスを備える。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:49:45 GMT)
Impacts of floating-point non-associativity on reproducibility for HPC and deep learning applications [0.0] 浮動小数点非連想性に起因する並列プログラムにおける変数の実行は、アルゴリズムに大きな影響を与えることが知られている。
並列プログラミングモデルにおける浮動小数点非連想性の統計的性質について検討する。
我々は、ディープラーニングのためのGPUデプロイメントのコンテキスト内で、最近追加されたPyTorchの決定論的オプションについて検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:52:42 GMT)
Impact of Code Transformation on Detection of Smart Contract Vulnerabilities [0.0] 本稿では,スマートコントラクト脆弱性データセットの量と品質を改善する方法を提案する。
このアプローチは、セマンティックな意味を変えることなくソースコード構造を変更するテクニックである、セマンティックな保存コード変換を中心に展開されている。
改善された結果によると、新たに生成された脆弱性の多くはツールをバイパスでき、偽報告率は最大100%になる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:23:13 GMT)
Highly stable aluminum air-bridges with stiffeners [0.0] エアブリッジは超伝導量子ビットと統合されたマイクロ波回路の性能において重要な役割を果たしている。
本研究は, エアブリッジの不安定化につながる技術的問題に焦点をあてる。
機械的レジリエンスを高めるために最適化された橋梁形状を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:58:56 GMT)
Graph Integration for Diffusion-Based Manifold Alignment [0.0] マルチモーダルデータ統合は、単一ソースデータと比較して情報コンテンツを豊かにすることができる。
マニフォールドアライメント(Manifold alignment)は、複数のデータソースの共有低次元表現を求めるデータ統合の一形態である。
本稿では,2つの半教師付き多様体アライメント手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 12:43:44 GMT)
Generative linguistics contribution to artificial intelligence: Where this contribution lies? [0.0] この記事では、研究者/読者がGLに属するAIに関わる科学的定理と理性について説明する。
AIへの大きなGL貢献にもかかわらず、言語入力の性質やタイプなど、相違点がまだ残っている、と結論付けている。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:12:09 GMT)
Generative Large Language Models in Automated Fact-Checking: A Survey [0.0] 大きな言語モデル(LLM)は、膨大な知識と高度な推論能力でファクトチェッカーをサポートする有望な機会を提供する。
本調査では, ファクトチェックにおけるジェネレーティブLLMの応用について検討し, モデル作成の促進と微調整のための様々なアプローチと技術について紹介する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:57:46 GMT)
Gaussian process-based online health monitoring and fault analysis of lithium-ion battery systems from field data [0.0] データセットには、保証のためにメーカーに返却された29のバッテリーシステムが含まれている。
この分析は、最も弱いリンク障害と一致して、単一の細胞のみが異常な行動または膝点を示すことを示している。
コードをオープンソース化し、記事のレビューが完了するとデータセットを公開します。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:28:05 GMT)
Full-waveform earthquake source inversion using simulation-based inference [0.0] シミュレーションベース推論(SBI)を用いたフルウェーブフォーム地震源インバージョンのための新しい枠組みを提案する。
以上の結果から,SBIは震源パラメータと概ね一致したよく校正された後部を生成できることが示唆された。
我々は北大西洋の2つの中等級地震に我々の手法を適用した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:25:57 GMT)
Force-current structure in Markovian open quantum systems and its applications: geometric housekeeping-excess decomposition and thermodynamic trade-off relations [0.0] エントロピー生成速度は、力と電流演算子の積によって与えられることを示す。
この枠組みは離散古典系の非平衡熱力学と包括的に類似している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 01:10:58 GMT)
Flavor Patterns of Fundamental Particles from Quantum Entanglement? [0.0] 量子絡み合いとクォークの混合度との間には驚くべき関係がある。
量子絡み合いの最小化は、粒子物理学の入力パラメータを決定する基本的な原理かもしれないと推測する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:00:01 GMT)
FilterViT and DropoutViT: Lightweight Vision Transformer Models for Efficient Attention Mechanisms [0.0] FilterViTは、他のモデルと比較して、効率と精度の両方で大幅に向上する。
また、ピクセル選択のアプローチを利用したDropoutViTを導入し、ロバスト性をさらに強化する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:38:03 GMT)
Explainable Artificial Intelligence for Dependent Features: Additive Effects of Collinearity [0.0] 本稿では,コリナリティ問題を考慮した新しいXAI手法として,コリナリティの付加効果(AEC)を提案する。
提案手法はシミュレーションデータと実データを用いて,芸術的XAI法と比較し,その効率性を検証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:00:30 GMT)
Experimentally constrained wave function method [0.0] 我々は、X線回折を超越した実験的な可観測物を組み込むために、X線制約波動関数フィッティングアプローチを拡張した。
これにより、光学およびX線分光データとともに、X線回折データの同時取り付けが可能となる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:54:22 GMT)
Exotic Quantum Phenomena in Twisted Bilayer Graphene [0.0] 1.1degの角度でねじれた二層グラフェンは、高波長でエキゾチックな量子現象の源となる超平らなモワール超格子バンドを示す。
本稿は、モワール物理学と電子(平ら)バンド構造の重要性に焦点をあてて、ツイストした二層グラフェンの背後にある物理学を概観する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:55:54 GMT)
Exact volume-law entangled eigenstates in a large class of spin models [0.0] 我々は、スピンハミルトニアンの大規模なクラスにおいて、体積法に絡み合った正確な励起固有状態の特定の集合を解析的に構築する。
単純な条件を満たすすべてのスピン鎖が、スペクトルの中央に正確な体積則固有状態を持つことを示す。
また,本研究の枠組みは,近年の文献におけるボリューム・ロー・エンタングルド・固有状態の構成を統一するものである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:41:21 GMT)
Exact renormalization group flow for matrix product density operators [0.0] 局所的な量子チャネルの回路で表されるMPDOの空間再正規化群変換について検討する。
常によく定義された等尺的再正規化変換を持つ行列積状態(MPS)とは異なり、一般MPDOは必ずしも正確な再正規化群の流れを包含するわけではない。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:09:51 GMT)
Ensemble learning of the atrial fiber orientation with physics-informed neural networks [0.0] 本研究では、局所的な電気記録からアトリアにおける異方性伝導を自動的に同定するFibernetを提案する。
ニューラルネットワークのアンサンブルを使用して、複数のサンプルを生成し、すべての観測データを適合させ、後部統計を計算します。
提案手法は, 繊維配向と伝導速度を定量化した不確かさで7分以内で推定できる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:45:19 GMT)
Enhancing CNN Classification with Lamarckian Memetic Algorithms and Local Search [0.0] そこで本研究では,局所探索機能を組み込んだ2段階学習手法と集団最適化アルゴリズムを併用した新しい手法を提案する。
実験の結果,提案手法は最先端の勾配に基づく手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:25:05 GMT)
Enhanced Quantum Energy Teleportation using a 3-Qubit System [0.0] 量子エネルギーテレポーテーション(Quantum Energy Teleportation, QET)は、量子絡み合いを利用して2つの離れた場所間でエネルギーを伝達する新しい方法である。
本稿では,QETのエネルギー効率を高めるために,3量子システムを用いた新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:46:23 GMT)
Enhanced Quantum Energy Teleportation using a 3-Qubit System [0.0] 量子エネルギーテレポーテーション(QET)のエネルギー効率を高めるための3量子システムを用いた新しいアプローチを提案する。
実験の結果,エネルギー回収の面では有意な改善が見られた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:46:23 GMT)
Empowering Persian LLMs for Instruction Following: A Novel Dataset and Training Approach [0.0] FarsInstructは,大規模言語モデルの命令追従能力を高めるために設計されたデータセットである。
FarsInstructは21の異なるデータセットにわたる197のテンプレートで構成されています。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:26:22 GMT)
Efficient Detection of Strong-To-Weak Spontaneous Symmetry Breaking via the Rényi-1 Correlator [0.0] 強弱自然対称性の破れ (SW SSB) は、近年、物質の量子混合状態の普遍的な特徴として現れている。
本稿では,SW SSB を混合状態で観測可能な R'enyi-1 相関器を提案する。
具体的には、与えられた混合状態の正準浄化(CP)を確実に作成することができれば、混合状態のSW SSBは、CP状態の通常の2点相関関数を介して検出することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:44:23 GMT)
Domain-decomposed image classification algorithms using linear discriminant analysis and convolutional neural networks [0.0] 2つの異なる領域分割されたCNNモデルは、異なる画像分類問題に対して実験的に比較される。
その結果,グローバルCNNモデルと比較すると,分類精度が向上した。
局所化アプローチにも依存し,小さなニューラルネットワークモデルと組み合わせた,新しい分解型LDA戦略を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:07:12 GMT)
Diffraction of correlated biphotons through transparent samples [0.0] 位相オブジェクトがソースの画像面に置かれている場合、セントロイド座標の関数の伝播のみを変更することを示す。
本研究は,非干渉計測・量子強調位相イメージングの応用について検討した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:00:02 GMT)
Diff-A-Riff: Musical Accompaniment Co-creation via Latent Diffusion Models [0.0] ディフ・A・リフ(Diff-A-Riff)は、あらゆる音楽的文脈に適応する高品質な楽器を生成するために設計された潜在拡散モデルである。
48kHzの擬似ステレオオーディオを生成し、推論時間とメモリ使用量を大幅に削減する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:33:27 GMT)
Development and Comparative Analysis of Machine Learning Models for Hypoxemia Severity Triage in CBRNE Emergency Scenarios Using Physiological and Demographic Data from Medical-Grade Devices [0.0] グラディエントブースティングモデル(GBM)は、トレーニング速度、解釈可能性、信頼性の点で、シーケンシャルモデルを上回った。
タイムリーな介入のために5分間の予測ウィンドウが選択された。
本研究は、トリアージを改善し、アラーム疲労を軽減するMLの可能性を強調した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:24:28 GMT)
Developing a Self-Explanatory Transformer [0.0] 汎用プラットフォームとAIプラットフォームはこれらのタスクをうまく処理するが、自然言語処理のマッピングはトレーニング時間によって遅くなることが多い。
本研究は,非決定論的有限オートマトンに基づく自己探索型学習自由写像変換器について検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:59:53 GMT)
Deterministic and reconfigurable graph state generation with a single solid-state quantum emitter [0.0] 我々は,光固体集積量子エミッタを用いた決定論的および再構成可能なグラフ状態生成を示す。
2つの連続する光子の量子状態トモグラフィーを行い、ベル状態の忠実度を0.80$pm$0.04まで測定し、コンカレンスを0.69$pm$0.09まで測定する。
この単純な光学スキームは、市販の量子ドットベースの単一光子源と互換性があり、スピンと光子によるフォールトトレラント量子コンピューティングに一歩近づいた。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:59:54 GMT)
DemoCraft: Using In-Context Learning to Improve Code Generation in Large Language Models [0.0] テキスト内学習と実演選択を活用してコード生成を向上させるDemoCraftを提案する。
潜在概念学習は、タスク固有の知識をキャプチャするトレーニング可能な埋め込みである、追加の概念トークンを導入している。
実験の結果,提案方式はpass@kの2倍の精度向上を実現していることがわかった。
我々の実証研究は、我々のシステムがこれらの指標の約3倍の改善を達成したことを示唆している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:45:50 GMT)
Dark energy reconstruction analysis with artificial neural networks: Application on simulated Supernova Ia data from Rubin Observatory [0.0] LSSTによる3年間のSNIaデータに基づくニューラルネットワーク(ANN)再構成による超新星間距離変調(SNIa)$mu(z)$とダークエネルギーの分析を行った。
我々は、ANNベースの再構成の性能を、理論的なダークエネルギーモデルである$Lambda$CDMとChevallier-Linder-Polarski(CPL)と比較する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:06:18 GMT)
Conditional Forecasting of Margin Calls using Dynamic Graph Neural Networks [0.0] 本稿では,時間的金融ネットワークにおける予測問題に先立って,条件付き$m$-stepを解くための新しい動的グラフニューラルネットワークアーキテクチャを提案する。
我々の研究は、ネットワークのダイナミクスをストレステストの実践にうまく組み込むことで、規制当局や政策立案者にシステム的リスク監視の重要なツールを提供することを実証している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:55:41 GMT)
Comparing Template-based and Template-free Language Model Probing [0.0] 16の異なるクローゼタスク言語モデル (LM) を10の英語データセット上で評価した。
テンプレートのない、テンプレートベースのアプローチは、上位ドメイン固有のモデルを除いて、モデルが異なるランク付けをすることが多い。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:16:34 GMT)
Combining psychoanalysis and computer science: an empirical study of the relationship between emotions and the Lacanian discourses [0.0] 本研究では,精神分析学とコンピュータ科学の学際的相互作用について考察する。
特に,この研究は,感情とラカン系会話の関連性を確立するために,コンピュータサイエンスの手法を適用することを目的としている。
本論文の主な貢献は、本質的には理論的(精神分析)であるが、対話型デジタルシステムにおける主要な実践的応用を促進することができる。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 10:49:33 GMT)
Coherence Preserving Leakage Detection and Cooling in Alkaline Earth Atoms [0.0] アルカリ土類状原子の核スピンに量子情報を符号化することで量子非破壊(QND)プロセスを可能にする。
これらの進歩は、フォールトトレラント量子計算における中性原子の展望を大幅に改善する可能性がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:17:19 GMT)
CT-AGRG: Automated Abnormality-Guided Report Generation from 3D Chest CT Volumes [0.0] 既存の方法では、観察された異常に明示的に焦点をあてることなく、3D CT画像から直接レポートを生成するのが一般的である。
本稿では,まず異常を予測し,それぞれが対象とする記述を生成する,新たな異常誘導型レポート生成モデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:22:45 GMT)
CT-AGRG: Automated Abnormality-Guided Report Generation from 3D Chest CT Volumes [0.0] 既存の方法では、観察された異常に明示的に焦点をあてることなく、3D CT画像から直接レポートを生成するのが一般的である。
本稿では,まず異常を予測し,それぞれが対象とする記述を生成する,新たな異常誘導型レポート生成モデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:22:45 GMT)
Byzantine-Robust Federated Learning: An Overview With Focus on Developing Sybil-based Attacks to Backdoor Augmented Secure Aggregation Protocols [0.0] フェデレートラーニング(FL)パラダイムは、多数のクライアントがプライベートデータ上で機械学習モデルを協調的にトレーニングすることを可能にする。
従来のFLスキームは、悪意のあるバックドアを注入することによってモデルのパフォーマンスを損なおうとするビザンティン攻撃に弱いままである。
本稿では,既存の手法やフレームワークの総括的かつ更新された分類法について,フェデレートラーニングプロトコルのロバストネスの強みと弱みを詳細に分析し,詳細に分析する前に提案する。
我々は,RoFLの脆弱性を利用したSybilベースの2つの新しい攻撃を提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:20:22 GMT)
Bregman implementation of Meyer's $G-$norm for cartoon + textures decomposition [0.0] We solve the cartoon + textures decomposition model of Meyer。
この結果、シャンブルの非線形プロジェクターに比べて速度が大幅に向上した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:46:06 GMT)
AtGCN: A Graph Convolutional Network For Ataxic Gait Detection [0.0] 本稿では,アタキシー歩行を検出するために,AtGCNと呼ばれるグラフ畳み込みネットワークを提案する。
この問題は、健康な歩行からの失速歩行のずれが非常に微妙であるため、難しい。
提案したAtGCNモデルは、93.46%の精度と0.4169のMAEで検出および予測の最先端をそれぞれ上回る。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:55:30 GMT)
Assessing Concordance between RNA-Seq and NanoString Technologies in Ebola-Infected Nonhuman Primates Using Machine Learning [0.0] エボラウイルス(EBOV)感染非ヒト霊長類の遺伝子発現解析におけるRNAシークエンシング(RNA-Seq)とNanoString技術の比較を行った。
ナノストリングデータに基づいてトレーニングされたSupervised Magnitude-Altitude Scoring (SMAS) 手法を用いた機械学習手法では,RT-qPCR陽性を陰性試料と区別する鍵マーカーとしてOAS1が同定された。
OAS1はまた、ロジスティック回帰を用いて感染していないサンプルの識別を100%精度で達成し、プラットフォーム間の堅牢性を実証した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:21:20 GMT)
Architecture-Aware Synthesis of Stabilizer Circuits from Clifford Tableaus [0.0] 我々は、合成量子回路におけるCNOTの数を減らし、コンパイルの分野やより正確には、合成に寄与する。
本手法は,特定のハードウェアに対して実行した場合に,他の最先端合成技術よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:51:05 GMT)
Approximation of multipartite quantum states: revised version with new applications [0.0] 複合無限次元量子系の状態の異なる特性を解析するための普遍近似法を提案する。
その結果,$pi$-entanglementの相対エントロピー,Rains境界,相互情報の条件エントロピーの3つの重要な特徴について検討した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 19:58:22 GMT)
Anderson Localization in Photonic Time Crystals [0.0] 時間に依存しない不規則媒質に対する波動方程式の解はアンダーソンの局在を示し、波動伝播の代わりに空間上の異なる点のまわりの波動の局在を観察することができる。
時間的障害を付加した屈折率の周期的変調が、アンダーソンの時間的局所化に繋がることを示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 15:09:14 GMT)
Analyzing Noise Models and Advanced Filtering Algorithms for Image Enhancement [0.0] 本研究の目的は,8種類のノイズを持つ画像に対する異なるフィルタリング手法の有効性を評価することである。
様々な種類の雑音に様々なフィルタを適用することで、異なるフィルタがノイズモデルに与える影響を示す。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 06:17:00 GMT)
An occupation number quantum subspace expansion approach to compute the single-particle Green function: an opportunity for noise filtering [0.0] 雑音量子デバイス上での強相関電子に対するグリーン関数を計算するためのハイブリッド量子古典アルゴリズムを提案する。
この技術は、NISQデバイスに有用なノイズフィルタリングを可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 22:04:12 GMT)
An Iterative Algorithm for Regularized Non-negative Matrix Factorizations [0.0] 私たちはLeeとSungの乗法的更新を、ゼロ値に固執しない追加更新として再放送します。
共役Rパッケージ rnnmf をカクテルのデータベースのランク低下表現を求める問題に適用する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 05:12:06 GMT)
Advancing Crime Linkage Analysis with Machine Learning: A Comprehensive Review and Framework for Data-Driven Approaches [0.0] 犯罪リンケージ(英: Crime linkage)とは、犯罪行為データを分析して、一対または一対の犯罪事件が一連の犯罪に関係しているかどうかを判断する過程である。
本研究の目的は,犯罪リンクにおける機械学習アプローチが直面する課題を理解し,将来的なデータ駆動手法の基盤知識を支援することである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 18:22:45 GMT)
Advanced Detection of Source Code Clones via an Ensemble of Unsupervised Similarity Measures [0.0] 本研究では,コード類似度評価のための新しいアンサンブル学習手法を提案する。
鍵となる考え方は、様々な類似度尺度の強みが互いに補完し、個々の弱点を軽減することである。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 14:01:43 GMT)
Adaptive Multi Scale Document Binarisation Using Vision Mamba [0.0] 本稿では,文書ビナライゼーションのためのMambaベースのアーキテクチャを提案する。
従来の信号処理技術にインスパイアされたガウス特徴(DoG)の差分を組み込むことにより、スキップ接続に新たな変更を加える。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 08:43:18 GMT)
Achilles, Neural Network to Predict the Gold Vs US Dollar Integration with Trading Bot for Automatic Trading [0.0] アキレスはLSTM(Long Short Term Memory)ニューラルネットワークの古典的なアーキテクチャで、ゴールド対USDのコモディティを予測することができる。
テスト期間の終わりに、使用する方法論で1623.52の利益を上げました。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:52:24 GMT)
Absence of a dissipative quantum phase transition in Josephson junctions: Theory [0.0] 比抵抗の強いジョセフソン接合(RSJ)を平衡で検討する。
ジャンクションを絞ると超伝導が増すことがわかりました。
これらのシステムでは、紫外線抵抗の遮断が予期せぬ重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 16:46:30 GMT)
AI-Driven Feedback Loops in Digital Technologies: Psychological Impacts on User Behaviour and Well-Being [0.0] 本研究は,フィードバックメカニズムがユーザの行動や幸福に与える影響について,肯定的,否定的な心理的影響について検討することを目的とする。
データ駆動フィードバックループは、モチベーションのメリットだけでなく、心理的課題も与えます。
これらのリスクを軽減するために、ユーザはバーンアウトや中毒を防ぐために、テクノロジの使用に関して境界を確立する必要がある。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:11:30 GMT)
A universal speed limit for spreading of quantum coherence [0.0] 分離された原子ガス中の凝縮物の生成は, 当初は平衡から遠く, 非コヒーレントな低エネルギー状態であり, 凝縮物は平衡に向かって緩和する。
システムを通してのコヒーレンスの普及は、最初はより弱い相互作用では遅く、より強い相互作用では速いが、最終的には同じ限界に達する。
我々の結果は、大規模コヒーレンスに依存し、他の量子システムで同様の測定を招待する量子技術に関係している。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 21:01:26 GMT)
A time (anti)symmetric approach to the double solution theory [0.0] 遅延波と進行波の差分からなるパルスは、デ・ブログリ=ボーム理論(ボーム力学とも呼ばれる)によって予測される量子軌道に従うことができることを示す。
我々の理論は正統的な量子力学の主な結果を再現し、ボヘミア理論とは異なりベルの意味で局所的である。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 09:18:04 GMT)
A superconducting on-chip microwave cavity for tunable hybrid systems with optically trapped Rydberg atoms [0.0] ハイブリッド量子システムは、量子情報科学と量子センシングの課題に対処するための、非常に有望なプラットフォームである。
ここでは、希釈冷凍機における超伝導オンチップマイクロ波回路と、光学的に閉じ込められた超低温原子からなるハイブリッドシステムに向けて研究する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:52:03 GMT)
A Systematic Survey on Instructional Text: From Representation Formats to Downstream NLP Tasks [0.0] 現実世界のタスクには、現在のNLPシステムでは難しい複雑なマルチステップ命令が伴うことが多い。
本研究は、この新興分野におけるトレンド、課題、機会を特定する177の論文について検討する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:02:22 GMT)
A Simple and Effective Temporal Grounding Pipeline for Basketball Broadcast Footage [0.0] バスケットボール放送映像の映像から分析的アライメントのための信頼性の高い時間的グラウンドパイプラインを提案する。
本手法は,ビデオフレームに高密度なイベントアノテーションを含むプレイバイプレイアノテーションのラベル付きコーパスを調整し,ラベル付きビデオセグメントの迅速な検索を可能にする。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 17:27:44 GMT)
A Priori Uncertainty Quantification of Reacting Turbulence Closure Models using Bayesian Neural Networks [0.0] 反応流モデルにおける不確実性を捉えるためにベイズニューラルネットワークを用いる。
我々は、BNNモデルが、データ駆動クロージャモデルの不確実性の構造に関するユニークな洞察を提供することができることを示した。
このモデルの有効性は,様々な火炎条件と燃料からなるデータセットに対する事前評価によって実証される。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 23:03:59 GMT)
A Novel Score-CAM based Denoiser for Spectrographic Signature Extraction without Ground Truth [0.0] 本稿では,Score-CAMをベースとした新しいデノイザを開発し,ノイズスペクトルデータからオブジェクトのシグネチャを抽出する。
特に,本論文では,スペクトルトレーニングデータの学習と生成のための,新たな生成逆ネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 02:02:40 GMT)
A Generalized Framework for Multiscale State-Space Modeling with Nested Nonlinear Dynamics: An Application to Bayesian Learning under Switching Regimes [0.0] ネストされた非線形力学を組み込んだマルチスケール状態空間モデリングのための一般化されたフレームワークを提案する。
私たちのフレームワークは、システム内の高速プロセスと低速プロセスの間の複雑な相互作用をキャプチャします。
我々は,スイッチングダイナミクスに対応する潜在状態と指標を推定するベイズ学習手法を開発した。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 13:52:39 GMT)
A Game-Theoretic Approach for Security Control Selection [0.0] 本稿では,攻撃者のプロファイルと設定した予算に基づいて,セキュリティ制御の効果的な組み合わせを選択するゲーム理論的手法を提案する。
本提案手法は,4つの異なるシナリオの下で,行政部門で使用される実証的な金融システムに対するアプローチを実証する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 07:29:48 GMT)
A Cryogenic Memristive Neural Decoder for Fault-tolerant Quantum Error Correction [0.0] インメモリ・クロスバー(IMC)アーキテクチャに基づくニューラルデコーダの設計と解析を行う。
ハードウェアを意識したリトレーニング手法を開発し、フィデリティ損失を軽減する。
この研究は、フォールトトレラントQECの統合のためのスケーラブルで高速で低消費電力のMCCハードウェアへの経路を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 20:23:50 GMT)
A Concentration Bound for TD(0) with Function Approximation [0.0] 私たちは、マルコフ連鎖の1つのサンプルパスからサンプルを採取して、オンラインTD学習に取り組みます。
我々は、TD(0) をマルティンゲールとマルコフの雑音による縮約近似アルゴリズムとして扱う。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:00:16 GMT)
A Comprehensive Study on Quantization Techniques for Large Language Models [0.0] 大規模言語モデル(LLM)は、学術と産業の両方で広く研究され、利用されている。
LLMは、リソースに制約のあるIoTデバイスや組み込みシステムにデプロイする上で、重大な課題を提示している。
量子化(Quantization)は、モデルの値の精度を小さな離散値のセットに縮める技術であり、有望な解決策を提供する。
論文参考訳(メタデータ) (Wed, 30 Oct 2024 04:55:26 GMT)