SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation [153.5] SlowFast-VGenはアクション駆動長ビデオ生成のための新しいデュアルスピード学習システムである。
本稿では,世界ダイナミクスのスローラーニングのための条件付きビデオ拡散モデルを提案する。
本研究では,内在学習ループを外在学習ループにシームレスに統合する低速学習ループアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:03:51 GMT)
JailbreakBench: An Open Robustness Benchmark for Jailbreaking Large Language Models [123.7] ジェイルブレイク攻撃は、大きな言語モデル(LLM)が有害、非倫理的、またはその他の不快なコンテンツを生成する原因となる。
これらの攻撃を評価することは、現在のベンチマークと評価テクニックの収集が適切に対処していない、多くの課題を提示します。
JailbreakBenchは、以下のコンポーネントを備えたオープンソースのベンチマークである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:26:40 GMT)
MINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens [114.0] MINT-1Tは最も広く多様なオープンソースMultimodal INTerleavedデータセットです。
MINT-1Tは1兆個のテキストトークンと340億の画像で構成され、既存のオープンソースデータセットの10倍のスケールアップである。
実験の結果,MINT-1TでトレーニングしたLMMは,以前の先行データセット OBELICS でトレーニングしたモデルの性能に匹敵することがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:29:34 GMT)
Reinforcement Learning Gradients as Vitamin for Online Finetuning Decision Transformers [111.8] オフライン強化学習(RL)のための魅力的なパラダイムとして、決定変換器が登場している。
オンラインの意思決定の微調整は驚くほど過小評価されている。
ODTの微調整プロセスにTD3勾配を加えるだけで、ODTのオンライン微調整性能が向上することがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:38:51 GMT)
Towards Unified Multimodal Editing with Enhanced Knowledge Collaboration [107.3] 内在的知識の編集や外部知識の活用といった現在の手法は、それぞれに長所と短所がある。
固有知識編集と外部知識を活用した統一的な視点を確立するための,新しいマルチモーダル編集手法UniKEを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:29:45 GMT)
Towards Unified Multimodal Editing with Enhanced Knowledge Collaboration [107.3] 内在的知識の編集や外部知識の活用といった現在の手法は、それぞれに長所と短所がある。
固有知識編集と外部知識を活用した統一的な視点を確立するための,新しいマルチモーダル編集手法UniKEを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:29:45 GMT)
Towards Unified Multimodal Editing with Enhanced Knowledge Collaboration [107.3] 内在的知識の編集や外部知識の活用といった現在の手法は、それぞれに長所と短所がある。
固有知識編集と外部知識を活用した統一的な視点を確立するための,新しいマルチモーダル編集手法UniKEを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:29:45 GMT)
Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.9] 正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:50:02 GMT)
Towards Dynamic Message Passing on Graphs [104.1] グラフニューラルネットワーク(GNN)のための新しい動的メッセージパッシング機構を提案する。
グラフノードと学習可能な擬似ノードを、測定可能な空間関係を持つ共通空間に投影する。
ノードが空間内を移動すると、その進化する関係は動的メッセージパッシングプロセスのための柔軟な経路構築を促進する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:20:40 GMT)
No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.8] NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:58:22 GMT)
SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [98.0] タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:22:03 GMT)
TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.5] カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:11:16 GMT)
Discovery of the Hidden World with Large Language Models [95.6] 本稿では,大きな言語モデル(LLM)を導入してギャップを埋めるCausal representatiOn AssistanT(COAT)を提案する。
LLMは世界中の大規模な観測に基づいて訓練されており、構造化されていないデータから重要な情報を抽出する優れた能力を示している。
COATはまた、特定変数間の因果関係を見つけるためにCDを採用し、提案された要因を反復的に洗練するためにLSMにフィードバックを提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:27:30 GMT)
Shopping MMLU: A Massive Multi-Task Online Shopping Benchmark for Large Language Models [95.3] 大規模言語モデル(LLM)は、タスク固有のエンジニアリング作業を緩和することによって、オンラインショッピングを変革する可能性がある。
実世界のAmazonデータから得られた多様なマルチタスクオンラインショッピングベンチマークであるShopping MMLUを提案する。
ショッピングMMLUは、概念理解、知識推論、ユーザの行動アライメント、多言語性という4つの主要なショッピングスキルをカバーする57のタスクで構成されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:54:46 GMT)
Implicit Personalization in Language Models: A Systematic Study [94.3] インプリシトパーソナライゼーション (IP) は、入力プロンプト内の暗黙の手がかりからユーザの背景を推測する言語モデルの現象である。
この研究は、厳密な数学的定式化、多面的道徳的推論フレームワーク、そして一連の事例研究を通じて、IPを体系的に研究する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:19:49 GMT)
AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning [94.0] 大規模言語モデル(LLM)エージェントは、精度と幻覚を高めるために外部ツールと知識を活用する際、印象的な能力を示した。
本稿では、LLMエージェントを最適化して提供されたツールを効果的に活用し、与えられたタスクのパフォーマンスを向上させる新しい自動化フレームワークであるAvaTaRを紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:15:06 GMT)
SERF: Fine-Grained Interactive 3D Segmentation and Editing with Radiance Fields [92.1] 放射場を用いた対話型3Dセグメンテーションと編集アルゴリズムを新たに導入し,これをSERFと呼ぶ。
提案手法では,マルチビューアルゴリズムと事前学習した2Dモデルを統合することにより,ニューラルネットワーク表現を生成する。
この表現に基づいて,局所的な情報を保存し,変形に頑健な新しい表面レンダリング技術を導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:48:23 GMT)
Benchmarking LLMs via Uncertainty Quantification [91.7] オープンソースのLarge Language Models(LLM)の普及は、包括的な評価方法の緊急の必要性を強調している。
我々は不確実性定量化を統合した LLM のための新しいベンチマーク手法を提案する。
以上の結果より, 精度の高いLSMでは, 精度が低下する可能性があり, II) より大規模なLSMでは, より小型のLSMに比べて不確実性が高いこと, III) 命令ファインタニングではLCMの不確実性が高くなる傾向が示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:58:51 GMT)
Large Language Models for Generative Information Extraction: A Survey [89.7] 大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:23:09 GMT)
Towards a Unified View of Preference Learning for Large Language Models: A Survey [88.7] 大きな言語モデル(LLM)は、非常に強力な能力を示す。
成功するための重要な要因の1つは、LLMの出力を人間の好みに合わせることである。
選好学習のすべての戦略を、モデル、データ、フィードバック、アルゴリズムの4つの構成要素に分解する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:39:06 GMT)
Towards a Unified View of Preference Learning for Large Language Models: A Survey [88.7] 大きな言語モデル(LLM)は、非常に強力な能力を示す。
成功するための重要な要因の1つは、LLMの出力を人間の好みに合わせることである。
選好学習のすべての戦略を、モデル、データ、フィードバック、アルゴリズムの4つの構成要素に分解する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:39:06 GMT)
Offline Multitask Representation Learning for Reinforcement Learning [86.3] 強化学習(RL)におけるオフラインマルチタスク表現学習の研究
オフラインマルチタスク表現学習のための新しいアルゴリズム MORL を提案する。
我々の理論的結果は、ローランクモデルの表現を直接学習するのではなく、上流のオフラインタスクから学習した表現を使用することの利点を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:29:10 GMT)
On Positional Bias of Faithfulness for Long-form Summarization [83.6] LLM(Large Language Models)は、長いコンテキスト設定において、入力の途中で情報に過小評価される位置バイアスを示すことが多い。
長文要約におけるこのバイアスの存在、その忠実性への影響、およびこのバイアスを軽減するための様々な技術について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:50:15 GMT)
Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.7] 我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。
CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。
そこで本研究では,質問応答とグラウンド化のタスクを統一する,シンプルで効果的なベースライン手法であるVisTAを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:20:13 GMT)
TaskBench: Benchmarking Large Language Models for Task Automation [82.3] タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:12:16 GMT)
DELTA: Dense Efficient Long-range 3D Tracking for any video [82.3] アプローチは3次元空間内のすべてのピクセルを効率的に追跡する新しい手法である。
アプローチは大規模に密集した3Dトラッキングを提供し、従来の方法よりも8倍高速に動作します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:01 GMT)
JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.9] 本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:43:12 GMT)
PhyRecon: Physically Plausible Neural Scene Reconstruction [81.7] PHYRECONは、微分可能なレンダリングと微分可能な物理シミュレーションの両方を利用して暗黙的な表面表現を学習する最初のアプローチである。
この設計の中心は、SDFに基づく暗黙の表現と明示的な表面点の間の効率的な変換である。
また,物理シミュレータの安定性も向上し,全データセットに対して少なくとも40%の改善が得られた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:37:22 GMT)
Can Large Language Model Agents Simulate Human Trust Behavior? [81.5] 本研究では,Large Language Model (LLM) エージェントが人間の信頼行動をシミュレートできるかどうかを検討する。
GPT-4は、信頼行動の観点から、人間と高い行動アライメントを示す。
また、エージェント信頼のバイアスや、他のLSMエージェントや人間に対するエージェント信頼の差についても検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:59:46 GMT)
GeoGS3D: Single-view 3D Reconstruction via Geometric-aware Diffusion Model and Gaussian Splatting [81.0] 単視点画像から詳細な3Dオブジェクトを再構成するフレームワークであるGeoGS3Dを紹介する。
本稿では,GDS(Gaussian Divergence Significance)という新しい指標を提案する。
実験により、GeoGS3Dはビュー間で高い一貫性を持つ画像を生成し、高品質な3Dオブジェクトを再構成することを示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:13:15 GMT)
WildGaussians: 3D Gaussian Splatting in the Wild [80.5] 3DGSによる閉塞や外見の変化に対処する新しいアプローチであるWildGaussiansを紹介した。
我々はWildGaussianが3DGSとNeRFのベースラインを越えながら3DGSのリアルタイムレンダリング速度と一致していることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:58:08 GMT)
Bridging Geometric States via Geometric Diffusion Bridge [79.6] 本稿では,初期および対象の幾何状態を正確にブリッジする新しい生成モデリングフレームワークであるGeometric Diffusion Bridge (GDB)を紹介する。
GDBは、幾何学的状態の接続のためにDoobの$h$-transformの修正版から派生した同変拡散ブリッジを使用している。
我々はGDBが既存の最先端のアプローチを超越し、幾何学的状態を正確にブリッジするための新しい経路を開くことを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:53 GMT)
Mini-Sequence Transformer: Optimizing Intermediate Memory for Long Sequences Training [78.9] ミニシーケンス変換器(Mini-Sequence Transformer, MsT)は、非常に長いシーケンスを持つ高速かつ高精度なLLMトレーニング手法である。
MsTは入力シーケンスを分割し、中間メモリ使用量を減らすためにミニシーケンスを反復的に処理する。
huggingfaceライブラリと統合され、MsTはQwen、Mistral、Gemma-2の最大コンテキスト長を12-24倍に拡張した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:36:27 GMT)
Mini-Sequence Transformer: Optimizing Intermediate Memory for Long Sequences Training [78.9] ミニシーケンス変換器(Mini-Sequence Transformer, MsT)は、非常に長いシーケンスを持つ高速かつ高精度なLLMトレーニング手法である。
MsTは入力シーケンスを分割し、中間メモリ使用量を減らすためにミニシーケンスを反復的に処理する。
huggingfaceライブラリと統合され、MsTはQwen、Mistral、Gemma-2の最大コンテキスト長を12-24倍に拡張した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:36:27 GMT)
$π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.3] 本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:22:30 GMT)
Mars: Situated Inductive Reasoning in an Open-World Environment [77.1] 本稿では,位置帰納的推論のために考案された対話型環境であるMarsを設計する。
ランドスケープ、サバイバル設定、タスク依存性を変更することで、反常識的なゲームメカニズムを導入する。
火星では、エージェントは周囲と積極的に対話し、有用なルールを導き、特定の状況下で意思決定タスクを実行する必要がある。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:11:18 GMT)
Molecule Design by Latent Prompt Transformer [76.2] 本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:36:42 GMT)
Ensemble sampling for linear bandits: small ensembles suffice [75.4] 線形バンディット設定のためのアンサンブルサンプリングの最初の有用かつ厳密な解析を行う。
当社は、$T$で線形にスケールするためにアンサンブルのサイズを必要とせず、$smashsqrtT$の注文を後悔する、構造化された設定の最初の結果です。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:42:51 GMT)
Language Models can Self-Lengthen to Generate Long Texts [75.0] 本稿では,Self-Lengthenというイノベーティブな反復学習フレームワークを紹介する。
補助的なデータやプロプライエタリなモデルを必要としない、大規模言語モデルの本質的な知識とスキルのみを活用する。
ベンチマークと人的評価の実験により、Self-Lengthenは長文生成において既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:47:10 GMT)
MIO: A Foundation Model on Multimodal Tokens [74.9] マルチモーダルトークン上に構築された新しい基礎モデルMIOを紹介する。
MIOは、エンドツーエンドの自己回帰的な方法で、音声、テキスト、画像、ビデオを理解し、生成することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:38:27 GMT)
Interpretable Language Modeling via Induction-head Ngram Models [74.3] 誘導ヘッドngramモデル(Induction-Gram)を提案する。
この誘導ヘッドは、カスタムのニューラル類似度メトリックを使用して、モデルの入力コンテキストを効率的に検索し、潜在的に次の単語補完を行う。
実験により,本手法はベースラインの解釈可能なモデルよりも,単語の次単語予測を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:33:26 GMT)
Benchmarking Complex Instruction-Following with Multiple Constraints Composition [72.8] 大規模言語モデル(LLM)の複雑な命令追従能力の評価方法が重要な研究課題となっている。
既存のベンチマークは主に、異なる制約の構成を無視しながら、人間の指示で異なるタイプの制約をモデル化することに焦点を当てている。
複数の制約からなる複雑な命令に従うLLMの能力を総合的に評価するためのベンチマークである ComplexBench を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:11:04 GMT)
RESTOR: Knowledge Recovery through Machine Unlearning [71.8] Webスケールコーパスでトレーニングされた大規模な言語モデルは、望ましくないデータポイントを記憶することができる。
訓練されたモデルからこれらのデータポイントを「消去」することを目的とした、多くの機械学習手法が提案されている。
以下に示す次元に基づいて,機械学習のためのRESTORフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:54:35 GMT)
What is Wrong with Perplexity for Long-context Language Modeling? [71.3] 長いコンテキスト入力は、会話の拡張、文書の要約、多数のショットインコンテキスト学習といったタスクにおいて、大きな言語モデル(LLM)にとって不可欠である。
パープレキシティ(PPL)は、長期コンテキスト能力の評価には信頼性が低いことが証明されている。
長短コンテキストコントラスト法を用いて鍵トークンを識別する手法であるbfLongPPLを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:39:28 GMT)
Rethinking the Evaluation of Out-of-Distribution Detection: A Sorites Paradox [70.6] 既存のアウト・オブ・ディストリビューション(OOD)検出ベンチマークは、サンプルを新しいラベルでOODデータとして分類する。
いくつかの限界OODサンプルは、実際には分布内(ID)サンプルに密接なセマンティック内容を持ち、OODサンプルをソリテスパラドックス(英語版)と判定する。
この問題に対処するため,Incremental Shift OOD (IS-OOD) というベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:23:48 GMT)
A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers [70.2] イベント予測への既存のアプローチには、タイムアウェアな位置埋め込み、学習行とフィールドエンコーディング、クラス不均衡に対処するオーバーサンプリング方法などがある。
基本位置埋め込みと因果言語モデリングの目的を持つ標準自己回帰型LPM変換器を用いて,単純だが柔軟なベースラインを提案する。
私たちのベースラインは、一般的なデータセットで既存のアプローチよりも優れており、さまざまなユースケースに使用することができます。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:26:43 GMT)
iVideoGPT: Interactive VideoGPTs are Scalable World Models [70.0] 世界モデルは、現実の意思決定のために想像された環境の中で、モデルベースのエージェントを対話的に探索し、推論し、計画することを可能にする。
マルチモーダルな信号 – 視覚的観察,アクション,報酬 – を統合した,スケーラブルな自己回帰型トランスフォーマーフレームワークであるInteractive VideoGPTを導入する。
iVideoGPTは、高次元の視覚的観察を効率的に識別する新しい圧縮トークン化技術を備えている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:58:08 GMT)
GeoSplatting: Towards Geometry Guided Gaussian Splatting for Physically-based Inverse Rendering [69.7] GeoSplattingは、3DGSを明示的な幾何学的ガイダンスと微分可能なPBR方程式で拡張する新しいハイブリッド表現である。
多様なデータセットにわたる総合的な評価は、GeoSplattingの優位性を示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:57:07 GMT)
VILA$^2$: VILA Augmented VILA [69.5] 自己拡張ステップとスペシャリスト強化ステップを含む,単純で効果的なVLM拡張スキームを導入する。
3ラウンドの自己拡張ラウンドでデータ品質と下流精度の向上を観察する。
VLMの専門家は、空間、接地、OCRなどドメイン固有の専門家とともに自己拡張VLMから抽出し、タスク認識合成データを事前学習段階に融合させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:23:22 GMT)
OCEAN: Offline Chain-of-thought Evaluation and Alignment in Large Language Models [68.2] 本研究は,LLMのチェーン・オブ・思想能力のオフライン評価に焦点をあてる。
我々は知識グラフ(例えばWikidata5m)を使って、生成された思考の連鎖に対するフィードバックを提供する。
提案手法に基づいてLCMを最適化する方法を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:48:44 GMT)
AutoTimes: Autoregressive Time Series Forecasters via Large Language Models [67.8] AutoTimesは時系列を言語トークンの埋め込み空間に投影し、任意の長さで将来予測を生成する。
時系列をプロンプトとして定式化し、ルックバックウィンドウを越えて予測のコンテキストを拡張する。
AutoTimesは、トレーニング可能なパラメータが0.1%、トレーニング/推論のスピードアップが5ドル以上で最先端を実現している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:37:41 GMT)
Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model [66.9] シークエンシャルレコメンデーション(SR)は、ユーザーが過去の行動に基づいて興味を持つかもしれない項目を予測することを目的としている。
我々はSRを新しい情報理論の観点から再検討し、逐次モデリング手法がユーザの行動のランダム性と予測不可能性を適切に把握できないことを発見した。
ファジィ情報処理理論に触発された本論文では,制限を克服し,ユーザの関心事の進化をよりよく捉えるために,ファジィなインタラクションシーケンスの組を導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:52:01 GMT)
Diffusion Policies creating a Trust Region for Offline Reinforcement Learning [66.2] 本稿では,拡散信頼型Q-Learning (DTQL) という2つの政策アプローチを導入する。
DTQLは、トレーニングと推論の両方において反復的なデノレーションサンプリングの必要性を排除し、計算的に極めて効率的である。
DTQLは、D4RLベンチマークタスクの大部分において、他のメソッドよりも優れているだけでなく、トレーニングや推論速度の効率性も示すことができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:09:38 GMT)
DistillNeRF: Perceiving 3D Scenes from Single-Glance Images by Distilling Neural Fields and Foundation Model Features [65.9] DistillNeRFは、自動運転シーンにおける3D環境を理解するための自己教師型学習フレームワークである。
本手法は,スパースで単一フレームのマルチビューカメラ入力からリッチなニューラルシーン表現を予測する一般化可能なフィードフォワードモデルである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:23:39 GMT)
Deep Graph Neural Networks via Posteriori-Sampling-based Node-Adaptive Residual Module [65.8] グラフニューラルネットワーク(GNN)は、近隣情報収集を通じてグラフ構造化データから学習することができる。
レイヤーの数が増えるにつれて、ノード表現は区別不能になり、オーバー・スムーシング(over-smoothing)と呼ばれる。
我々は,textbfPosterior-Sampling-based, Node-distinguish Residual Module (PSNR)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:04:12 GMT)
TrAct: Making First-layer Pre-Activations Trainable [65.4] 視覚モデルの第1層の訓練について検討し、画素値と更新等級の関係を明確にする。
コントラストの低い画像は、高いコントラストのイメージよりも学習への影響が小さい。
非常に明るい、または非常に暗い画像は、適度な明るさのイメージよりも重量に強い影響を与える。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:25:55 GMT)
NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking [65.2] 我々は,視覚に基づく運転ポリシーをベンチマークするフレームワークであるNAVSIMを提案する。
我々のシミュレーションは非反応性であり、評価された政策と環境は互いに影響を与えない。
NAVSIMはCVPR 2024で開催され、143チームが433のエントリーを提出し、いくつかの新たな洞察を得た。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:58:34 GMT)
Muscles in Time: Learning to Understand Human Motion by Simulating Muscle Activations [65.0] マッスル・イン・タイム (MinT) は、大規模な人工筋肉活性化データセットである。
227名の被験者と402名の模擬筋骨格をカバーする9時間以上のシミュレーションデータを含んでいる。
ヒトのポーズ配列からニューラルネットワークを用いた筋活動量推定の結果を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:28:53 GMT)
OPUS: Occupancy Prediction Using a Sparse Set [64.6] 学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:39:52 GMT)
Adversarial Score identity Distillation: Rapidly Surpassing the Teacher in One Step [64.5] 生成品質と蒸留効率を向上させるSiDA(SiD with Adversarial Loss)を導入する。
SiDAは、ピクセルベースのSiD損失にGPUバッチ当たりの平均的な「フェイクネス」を組み込んでおり、SiDAは1ステップのジェネレータをスクラッチから蒸留するか、既存のものを微調整することで蒸留することができる。
その結果,EDM2-XSは2.156点,EDM2-Sは1.669点,EMM2-Mは1.488点,EMM2-Lは1.465点のFIDスコアが得られた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:36:14 GMT)
Chasing Better Deep Image Priors between Over- and Under-parameterization [63.9] そこで本研究では,DNN固有の空間性を利用して,LIP(lottery image prior)を新たに検討する。
LIPworksは、コンパクトなモデルサイズでディープデコーダを著しく上回っている。
また、LIPを圧縮センシング画像再構成に拡張し、事前学習したGANジェネレータを前者として使用する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:49:44 GMT)
Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.6] 本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:13:32 GMT)
StreamBench: Towards Benchmarking Continuous Improvement of Language Agents [63.5] 大規模言語モデル(LLM)エージェントは、経験から自分自身を改善することができる。
本稿では,LLMエージェントの入力フィードバックシーケンスに対する継続的な改善を評価するためのベンチマークであるStreamBenchを紹介する。
我々の研究は、LLMの効果的なオンライン学習戦略開発への一歩として役立ち、ストリーミングシナリオにおけるより適応的なAIシステムへの道を開いた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:16:13 GMT)
Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.4] 本研究は,人工知能(AI)モデルを用いた医用合成データ生成の臨床評価に焦点を当てた。
本論文は,a) 医用専門家による合成画像の体系的評価のためのプロトコルを提示し,b) 高分解能WCE画像合成のための新しい変分オートエンコーダモデルであるTIDE-IIを評価する。
その結果、TIDE-IIは臨床的に関連性のあるWCE画像を生成し、データの不足に対処し、診断ツールの強化に役立つことがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:48:50 GMT)
Who Evaluates the Evaluations? Objectively Scoring Text-to-Image Prompt Coherence Metrics with T2IScoreScore (TS2) [62.4] T2IScoreScoreはプロンプトを含むセマンティックエラーグラフのキュレートされたセットであり,誤画像の集合である。
これにより、与えられた迅速な忠実度測定値が、客観的な誤差数に対して正しく画像を順序付けできるかどうかを厳格に判断することができる。
最先端のVLMベースのメトリクスは、CLIPScoreのような単純な(そしておそらく悪い)機能ベースのメトリクスを著しく上回りません。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:39:48 GMT)
Preference Learning Algorithms Do Not Learn Preference Rankings [62.3] 選好学習は、好ましくない出力よりも、好ましくない出力により高い確率を割り当てるようにモデルを訓練する、という従来の知恵を考察する。
多くの最先端の選好調整モデルでは、一般的な選好データセットでは60%未満のランキング精度が得られている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:32:28 GMT)
Binarized Diffusion Model for Image Super-Resolution [62.0] 超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:14:43 GMT)
Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond [61.2] その驚くべき振る舞いをより深く理解するために、トレーニングされたニューラルネットワークの単純かつ正確なモデルの有用性について検討する。
3つのケーススタディで、様々な顕著な現象に関する新しい経験的洞察を導き出すためにどのように適用できるかを説明します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:54:34 GMT)
LoFiT: Localized Fine-tuning on LLM Representations [61.0] LoFiT(Localized Fine-Tuning on LLM Representations)というフレームワークを導入する。
LoFiTは、特定のタスクを学習する上で最も重要なアテンションヘッドのサブセットを特定し、それからオフセットベクトルをトレーニングして、選択したヘッドでモデルの隠れ表現に追加する。
真理性や推論タスクにおいて,LoFiTの介入ベクトルは推論時間干渉などの表現介入手法のベクトルよりもLLM適応に有効であることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:04:53 GMT)
Differentially Private Optimization with Sparse Gradients [60.9] 微分プライベート(DP)最適化問題を個人勾配の空間性の下で検討する。
これに基づいて、スパース勾配の凸最適化にほぼ最適な速度で純粋および近似DPアルゴリズムを得る。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:27:40 GMT)
DiffPano: Scalable and Consistent Text to Panorama Generation with Spherical Epipolar-Aware Diffusion [60.5] 本稿では,テキスト駆動型パノラマ生成フレームワークDiffPanoを提案し,拡張性,一貫性,多様なパノラマシーン生成を実現する。
DiffPanoは、不明瞭なテキスト記述とカメラのポーズによって、一貫した多様なパノラマ画像を生成することができることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:57:02 GMT)
GIC: Gaussian-Informed Continuum for Physical Property Identification and Simulation [60.3] 本稿では,視覚的観察を通して物理特性(システム同定)を推定する問題について検討する。
物理特性推定における幾何学的ガイダンスを容易にするために,我々は新しいハイブリッドフレームワークを提案する。
本研究では,3次元ガウス点集合としてオブジェクトを復元する動き分解に基づく動的3次元ガウスフレームワークを提案する。
抽出された物体表面に加えて、ガウスインフォームド連続体はシミュレーション中の物体マスクのレンダリングを可能にする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:32:19 GMT)
Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.2] 本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。
Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。
実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:34:03 GMT)
Enriching Disentanglement: From Logical Definitions to Quantitative Metrics [59.1] 複雑なデータにおける説明的要素を遠ざけることは、データ効率の表現学習にとって有望なアプローチである。
論理的定義と量的指標の関連性を確立し, 理論的に根ざした絡み合いの指標を導出する。
本研究では,非交叉表現の異なる側面を分離することにより,提案手法の有効性を実証的に実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:10:30 GMT)
Gated Slot Attention for Efficient Linear-Time Sequence Modeling [59.0] Gated Slot Attention(GSA)は境界メモリ・コントロル(ABC)による注意を高める
GSAはGated Linear Attention (GLA)にインスパイアされたゲーティング機構を組み込んでいる
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:54:35 GMT)
Brain-like Functional Organization within Large Language Models [58.9] 人間の脳は長い間人工知能(AI)の追求にインスピレーションを与えてきた
最近のニューロイメージング研究は、人工ニューラルネットワーク(ANN)の計算的表現と、人間の脳の刺激に対する神経反応との整合性の説得力のある証拠を提供する。
本研究では、人工ニューロンのサブグループと機能的脳ネットワーク(FBN)を直接結合することで、このギャップを埋める。
このフレームワークはANサブグループをFBNにリンクし、大きな言語モデル(LLM)内で脳に似た機能的組織を記述できる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:24:57 GMT)
Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability,Reproducibility, and Practicality [58.9] 本稿では,T2Vモデルのための包括的で標準化されたプロトコルであるText-to-Video Human Evaluation (T2VHE)プロトコルを紹介する。
このプロトコルには、明確に定義されたメトリクス、完全なアノテータトレーニング、効果的な動的評価モジュールが含まれている。
我々は、完全なプロトコルワークフロー、動的評価コンポーネントの詳細、アノテーションインターフェースコードを含む、T2VHEプロトコルのセットアップ全体をオープンソースにします。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:38:26 GMT)
Identifying General Mechanism Shifts in Linear Causal Representations [58.6] 我々は,未知の潜在因子の線形混合を観測する線形因果表現学習環境について考察する。
近年の研究では、潜伏要因の復元や、それに基づく構造因果モデルの構築が可能であることが示されている。
非常に穏やかな標準仮定の下では、シフトしたノードの集合を識別することが可能である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:56:50 GMT)
RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives [58.2] 本稿では,RACCooNを提案する。
ビデオ生成モデルは、自動生成された物語や指示を取り入れて、生成されたコンテンツの質と精度を高める。
提案フレームワークは,ビデオ・パラグラフ生成,映像コンテンツ編集において優れた多機能性を示し,さらに拡張するために他のSoTAビデオ生成モデルに組み込むことができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:27:09 GMT)
Neural Pfaffians: Solving Many Many-Electron Schrödinger Equations [58.1] 神経波関数は、計算コストが高いにもかかわらず、多電子系の基底状態の近似において前例のない精度を達成した。
近年の研究では、個々の問題を個別に解くのではなく、様々な構造や化合物にまたがる一般化波動関数を学習することでコストを下げることが提案されている。
この研究は、分子間の一般化に適した過度にパラメータ化され、完全に学習可能なニューラルウェーブ関数を定義することで、この問題に取り組む。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:46:43 GMT)
NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.0] Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:54:52 GMT)
PARTNR: A Benchmark for Planning and Reasoning in Embodied Multi-agent Tasks [57.9] 我々は,HumaN-Robotコラボレーション(PARTNR)における計画と推論タスクのベンチマークを示す。
大規模言語モデル(LLM)を用いた半自動タスク生成パイプラインを用いる。
我々は、計画、知覚、スキル実行の軸を越えて、PartinNRタスクにおける最先端のLCMを分析します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:53:12 GMT)
Cost-aware Bayesian Optimization via the Pandora's Box Gittins Index [57.0] 我々は,コストを意識したベイズ最適化と,経済学の意思決定問題であるPandoraのBox問題との間に,従来未解決の接続関係を構築した。
我々の研究は、Gittinsインデックス理論からベイズ最適化への技術統合に向けた第一歩となる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:14:02 GMT)
AMBROSIA: A Benchmark for Parsing Ambiguous Questions into Database Queries [56.8] 我々は,新たなベンチマークであるAMBROSIAを導入し,テキスト・ツー・オープン・プログラムの開発を促進することを期待する。
私たちのデータセットには、3種類のあいまいさ(スコープのあいまいさ、アタッチメントのあいまいさ、あいまいさ)を示す質問が含まれている。
いずれの場合も、データベースのコンテキストが提供されてもあいまいさは持続する。
これは、スクラッチからデータベースを制御して生成する、新しいアプローチによって実現される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:59:05 GMT)
Automatically Learning Hybrid Digital Twins of Dynamical Systems [56.7] Digital Twins (DT)は、現実世界のシステムの状態と時間力学をシミュレートする。
DTは、しばしばデータスカース設定で目に見えない条件に一般化するのに苦労します。
本稿では,HDTwinsを自律的に提案し,評価し,最適化するための進化的アルゴリズム(textbfHDTwinGen$)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:28:22 GMT)
Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.6] Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:55:24 GMT)
Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs [56.2] 既存の解は非常に特定の仮定の下で機能するか、いくつかの状態において空でない境界を達成するかのいずれかである。
多くの構造的仮定は、残念なことに、時間的地平線上の必然的に避けられない指数的依存に悩まされていることが知られている。
局所線形化可能な MDP を適切な表現選択により, 軽度に滑らかな MDP をどのように表現できるかを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:07:22 GMT)
MILP-StuDio: MILP Instance Generation via Block Structure Decomposition [55.8] Mixed-integer linear programming (MILP) は、多くの応用において最も一般的な数学的定式化の1つである。
我々は,ブロック構造を保存して高品質なインスタンスを生成するために,ブロック構造分解(MILP-StuDio)と呼ばれる新しいMILP生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:03:13 GMT)
Grounding by Trying: LLMs with Reinforcement Learning-Enhanced Retrieval [55.6] 大きな言語モデル(LLM)は、しばしば適切な検索クエリのポーズに苦労する。
私たちは$underlineLe$arningを$underlineRe$trieveに$underlineT$rying (LeReT)を導入します。
LeReTは、絶対精度を最大29%向上し、下流ジェネレータの評価を17%向上させることができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:34:16 GMT)
Constraint Back-translation Improves Complex Instruction Following of Large Language Models [55.6] 大きな言語モデル(LLM)は、フォーマットや長さなどの複雑な制約のある命令に従うのに苦労しています。
従来の研究は、高度なLCMに複雑な命令を供給し、複雑な命令応答対を後処理する。
本稿では,新しいデータ生成手法である制約バックトランスレーションを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:42:26 GMT)
Self-Ensembling Gaussian Splatting for Few-shot Novel View Synthesis [55.6] 3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)に顕著な効果を示した
しかし、3DGSモデルはスパースポーズのビューで訓練すると過度に適合する傾向にあり、より広いポーズのバリエーションに対して一般化能力を制限する。
オーバーフィッティング問題を緩和するために, 自己理解型ガウススプラッティング (SE-GS) アプローチを導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:43:48 GMT)
GaussianCube: A Structured and Explicit Radiance Representation for 3D Generative Modeling [55.1] 構造的かつ完全明快な放射率表現を導入し、3次元生成モデリングを大幅に促進する。
我々はまず,新しい密度制約付きガウス適合アルゴリズムを用いてガウスキューブを導出する。
非条件およびクラス条件オブジェクト生成、デジタルアバター生成、テキスト・トゥ・3Dによる実験は、我々のモデル合成が最先端の生成結果を達成することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:33:30 GMT)
Ridge Regularization: an Essential Concept in Data Science [54.4] Ridgeまたはもっと正式に$ell$ regularizationは、統計学と機械学習の多くの分野に現れる。
この短い尾根祭では、私の同僚と私が過去40年間、応用統計で遭遇したリッジの魔法と美しさをまとめました。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:23:01 GMT)
End-to-end Learnable Clustering for Intent Learning in Recommendation [54.2] 我々は、アンダーラインELCRecと呼ばれる新しい意図学習手法を提案する。
振る舞い表現学習をUnderlineEnd-to-end UnderlineLearnable UnderlineClusteringフレームワークに統合する。
1億3000万ページビューの産業レコメンデーションシステムに本手法をデプロイし,有望な結果を得る。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:14:56 GMT)
Unified Mechanism-Specific Amplification by Subsampling and Group Privacy Amplification [54.1] サブサンプリングによる増幅は、差分プライバシーを持つ機械学習の主要なプリミティブの1つである。
本稿では、メカニズム固有の保証を導出するための最初の一般的なフレームワークを提案する。
サブサンプリングが複数のユーザのプライバシに与える影響を分析する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:01:39 GMT)
On the Proper Treatment of Tokenization in Psycholinguistics [54.0] 論文は、トークンレベルの言語モデルは、精神言語学研究で使用される前に、文字レベルの言語モデルにマージ化されるべきであると主張している。
興味領域自体のサブプライムよりも心理学的予測が優れている様々な焦点領域を見いだす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:40:33 GMT)
On the Proper Treatment of Tokenization in Psycholinguistics [54.0] 論文は、トークンレベルの言語モデルは、精神言語学研究で使用される前に、文字レベルの言語モデルにマージ化されるべきであると主張している。
興味領域自体のサブプライムよりも心理学的予測が優れている様々な焦点領域を見いだす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:40:33 GMT)
Scaling Concept With Text-Guided Diffusion Models [53.8] 概念を置き換える代わりに、概念自体を強化するか、あるいは抑圧できるだろうか?
ScalingConceptは、分解された概念を、新しい要素を導入することなく、実際の入力でスケールアップまたはスケールダウンする、シンプルで効果的な方法である。
さらに重要なのは、ScalingConceptは画像とオーディオドメインにまたがる様々な新しいゼロショットアプリケーションを可能にすることだ。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:09:55 GMT)
BitStack: Fine-Grained Size Control for Compressed Large Language Models in Variable Memory Environments [53.7] 大規模言語モデル(LLM)は、多くのアプリケーションに革命をもたらしたが、ローカルデバイスにおけるメモリ制限により、その展開は依然として困難である。
textbfBitStackは,メモリ使用量とモデル性能のトレードオフを可能にする,新しいトレーニング不要な重み圧縮手法である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:26:11 GMT)
Understanding Optimization in Deep Learning with Central Flows [53.7] RMSの暗黙的な振る舞いは、微分方程式の「中央流:」によって明示的に捉えられることを示す。
これらのフローは、汎用ニューラルネットワークの長期最適化軌道を経験的に予測できることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:58:13 GMT)
GlotCC: An Open Broad-Coverage CommonCrawl Corpus and Pipeline for Minority Languages [53.6] GlotCCは、ClomCrawlから派生した、クリーンでドキュメントレベルの2TBの汎用ドメインコーパスである。
我々はGlotCCと、それを生成するためのシステムを作成し、研究コミュニティに提供します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:14:12 GMT)
Latent Plan Transformer for Trajectory Abstraction: Planning as Latent Space Inference [53.4] オフライン強化学習から得られたデータセットを用いた計画のための生成モデルについて検討する。
本稿では,Transformerベースのトラジェクトリジェネレータと最終戻り値との接続に潜時変数を利用する新しいモデルであるLatent Plan Transformerを紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:56:57 GMT)
Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks [53.1] 本稿では,新しいモデルを得るためのトレーニングを必要としないパラダイムについて検討する。
生体視覚系における受容野にインスパイアされたCNNの誕生と同様、モデル分解と組み立てを提案する。
モデル組立には、特定のタスクに適した新しいモデルを構築するために、アライメントパディング戦略とパラメータスケーリング戦略を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:29:51 GMT)
Stabilize the Latent Space for Image Autoregressive Modeling: A Unified Perspective [52.8] 遅延ベース画像生成モデルは、画像生成タスクにおいて顕著な成功を収めた。
同じ遅延空間を共有するにもかかわらず、自己回帰モデルは画像生成において LDM や MIM よりもかなり遅れている。
本稿では,画像生成モデルのための遅延空間を安定化する,単純だが効果的な離散画像トークン化手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:42:07 GMT)
Evolving Alignment via Asymmetric Self-Play [52.3] 本稿では、2人のプレーヤー間の非対称ゲームとしてアライメントをキャストする一般オープンエンドなRLHFフレームワークを提案する。
Asymmetric Self-Play (eva) によるアライメントの進化(Evolving Alignment)というこのフレームワークは、既存のRLHFアルゴリズムを拡張性のあるアライメントに利用できるシンプルで効率的なアプローチをもたらす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:15:32 GMT)
TSI-Bench: Benchmarking Time Series Imputation [52.3] TSI-Benchは、ディープラーニング技術を利用した時系列計算のための総合ベンチマークスイートである。
TSI-Benchパイプラインは、実験的な設定を標準化し、計算アルゴリズムの公平な評価を可能にする。
TSI-Benchは、計算目的のために時系列予測アルゴリズムを調整するための体系的なパラダイムを革新的に提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:18:16 GMT)
Provable Benefits of Complex Parameterizations for Structured State Space Models [51.9] 構造化状態空間モデル (Structured State Space Model, SSM) は、指定された構造に固執する線形力学系である。
パラメータ化が現実の典型的なニューラルネットワークモジュールとは対照的に、SSMは複雑なパラメータ化を使用することが多い。
本稿では,実対角 SSM と複素対角 SSM の形式的ギャップを確立することにより,SSM の複雑なパラメータ化の利点を説明する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:38:47 GMT)
Failure Modes of LLMs for Causal Reasoning on Narratives [51.2] 本研究では,大言語モデル(LLM)の因果推論能力について,物語から因果関係を推定する代表的な問題から検討する。
最新の言語モデルでさえ、物語の提示とパラメトリック知識の両方において、信頼できないショートカットに依存していることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:48:58 GMT)
Audio Is the Achilles' Heel: Red Teaming Audio Large Multimodal Models [50.9] 我々は、オープンソースのオーディオLMMが有害な音声質問に対して平均69.14%の攻撃成功率を被っていることを示す。
Gemini-1.5-Proの音声固有のジェイルブレイクは、有害なクエリベンチマークで70.67%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:11:17 GMT)
SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents [50.8] FlowGenは、複数のLarge Language Model (LLM)エージェントに基づいたソフトウェアプロセスモデルをエミュレートするコード生成フレームワークである。
FlowGenScrumをHumanEval、HumanEval-ET、MBPP、MBPP-ETの4つのベンチマークで評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:43:58 GMT)
GS-Blur: A 3D Scene-Based Dataset for Realistic Image Deblurring [50.7] 本稿では,新しい手法を用いて合成されたリアルなぼやけた画像のデータセットであるGS-Blurを提案する。
まず,3Dガウス・スプレイティング(3DGS)を用いて多視点画像から3Dシーンを再構成し,ランダムに生成された運動軌跡に沿ってカメラビューを移動させてぼやけた画像を描画する。
GS-Blurの再構築に様々なカメラトラジェクトリを採用することで、我々のデータセットは現実的で多様な種類のぼかしを含み、現実世界のぼかしをうまく一般化する大規模なデータセットを提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:17:16 GMT)
Linking Across Data Granularity: Fitting Multivariate Hawkes Processes to Partially Interval-Censored Data [50.6] 一部の応用では、ある次元における個々の事象のタイムスタンプは観測不可能であり、インターバル内の事象数のみが知られている。
本研究では,MHPとパラメータ等価性を共有し,タイムスタンプデータとインターバルセンサデータの両方を効果的にモデル化できる新たなポイントプロセスを提案する。
合成および実世界のデータセットを用いてPCMHPの能力を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:46:57 GMT)
Self-Healing Machine Learning: A Framework for Autonomous Adaptation in Real-World Environments [50.3] 実世界の機械学習システムは、基礎となるデータ生成プロセスの分散シフトによって、モデルの性能劣化に遭遇することが多い。
概念のドリフト適応のような既存のシフトへのアプローチは、その理性に依存しない性質によって制限される。
我々はこれらの制限を克服するために自己修復機械学習(SHML)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:05:51 GMT)
Dynamic Uncertainty Ranking: Enhancing In-Context Learning for Long-Tail Knowledge in LLMs [50.3] 大規模言語モデル(LLM)は、事前訓練中に多様なドメインから膨大な量の知識を学習することができる。
専門ドメインからの長い尾の知識は、しばしば不足し、表現されていないため、モデルの記憶にはほとんど現れない。
ICLの強化学習に基づく動的不確実性ランキング手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:42:17 GMT)
Parallelizing Linear Transformers with the Delta Rule over Sequence Length [49.9] この研究は、デルタ則で線形変圧器を訓練するためのハードウェア効率の良いアルゴリズムについて述べる。
我々は100Bトークンに対して1.3Bモデルをトレーニングし、最近の線形時間ベースラインよりも優れていることを発見した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:35:47 GMT)
Gene-Metabolite Association Prediction with Interactive Knowledge Transfer Enhanced Graph for Metabolite Production [49.8] メタボリックグラフに基づく遺伝子メタボリック・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション
2474の代謝産物と1947年の2つの一般的な微生物の遺伝子を含む最初のベンチマークを提示する。
提案手法は,各種リンク予測フレームワークのベースラインを最大12.3%向上させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:56:03 GMT)
In-Context LoRA for Diffusion Transformers [49.3] テキスト・ツー・イメージのDiTは、チューニングなしでテキスト内生成を効果的に行うことができることを示す。
我々は、我々のモデル In-Context LoRA (IC-LoRA) を命名する。
我々のパイプラインは、プロンプトにより忠実な高忠実度画像セットを生成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:45:00 GMT)
Fast Best-of-N Decoding via Speculative Rejection [49.1] 推論時間アライメント手法は、訓練後の複雑なステップを避ける。
Best-of-Nは、標準的なデコード戦略よりも推論時にはるかに多くのリソースを必要とする。
本稿では,予測時間アライメントアルゴリズムであるSpeculative Rejectionを紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:27:13 GMT)
Context-Aware Testing: A New Paradigm for Model Testing with Large Language Models [49.1] 我々は,コンテキストを帰納バイアスとして用いて意味のあるモデル障害を探索するコンテキスト認識テスト(CAT)を導入する。
最初のCATシステムSMART Testingをインスタンス化し、大きな言語モデルを用いて、関連性があり、起こりうる失敗を仮説化します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:06:16 GMT)
VecCity: A Taxonomy-guided Library for Map Entity Representation Learning [48.7] マップエンティティ表現学習(MapRL)は、汎用的で再利用可能なデータ表現を生成する。
本稿では,エンコーダや事前学習タスク,下流タスクなどの機能的モジュールモデルに基づいてモデルを編成するMapRLの新しい分類法を提案する。
本稿では, コード化, 事前学習, 微調整, 評価のための, 使いやすいインタフェースを提供する分類学駆動型ライブラリであるVecCityを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:03:46 GMT)
Dense Associative Memory Through the Lens of Random Features [48.2] Dense Associative Memoriesはホップフィールドネットワークの高容量版である。
このネットワークは,従来のDense Associative Memoriesのエネルギー関数と力学を密接に近似していることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:10:57 GMT)
Offline Reinforcement Learning with OOD State Correction and OOD Action Suppression [47.6] オフライン強化学習(RL)では、アウト・オブ・ディストリビューション(OOD)のアクション問題に対処することが焦点となっている。
我々は、OOD状態がパフォーマンスを損なう問題もまだ過小評価されていないと論じている。
オフライン RL における OOD 状態修正と OOD 動作抑制を統一する,シンプルで効果的な SCAS を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:27:03 GMT)
Invisible Image Watermarks Are Provably Removable Using Generative AI [47.3] Invisibleの透かしは、所有者によってのみ検出可能な隠されたメッセージを埋め込むことで、画像の著作権を保護する。
我々は、これらの見えない透かしを取り除くために、再生攻撃のファミリーを提案する。
提案手法は,まず画像にランダムノイズを加えて透かしを破壊し,画像を再構成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:47:21 GMT)
ERBench: An Entity-Relationship based Automatically Verifiable Hallucination Benchmark for Large Language Models [46.1] 大規模言語モデル(LLM)は、様々なアプリケーションで前例のない性能を達成したが、評価は依然として難しい。
既存のリレーショナルデータベースを利用することは、ベンチマークを構築する上で有望なアプローチである、と我々は主張する。
我々は,これらの整合性制約を用いて任意のデータベースをLLMベンチマークに変換するERBenchを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:07:54 GMT)
Re-assembling the past: The RePAIR dataset and benchmark for real world 2D and 3D puzzle solving [46.1] 我々のデータセットには、現在の2Dおよび3Dパズル解決のベンチマークに共通するユニークな特性がある。
破片と骨折は、第二次世界大戦中にポンペイ考古学公園で爆破されたフレスコの崩壊によって引き起こされた現実的なものである。
データセットは、特徴的な画像要素を持つ高解像度画像を提供するマルチモーダルである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:10:38 GMT)
Stabilizing Linear Passive-Aggressive Online Learning with Weighted Reservoir Sampling [46.0] オンライン学習手法は、高次元ストリーミングデータ、アウトオブコア処理、その他のスループットに敏感なアプリケーションに依然として有効である。
このようなアルゴリズムの多くは、その収束の鍵として個々のエラーへの高速な適応に依存している。
このようなアルゴリズムは理論上の後悔は少ないが、現実の展開では個々の外れ値に敏感であり、アルゴリズムが過度に修正される可能性がある。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:35:48 GMT)
Multi-Group Proportional Representation in Retrieval [46.0] 交差するグループ間の表現を測定する新しい指標であるMPR(Multi-Group Proportional Representation)を導入する。
MPRは、リッチ関数クラスによって指定された複数の交叉群にまたがるより比例的な表現をもたらす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:30:51 GMT)
Towards Top-Down Reasoning: An Explainable Multi-Agent Approach for Visual Question Answering [45.9] 本稿では,視覚言語モデル(VLM)の能力を高めるために,LLM(Large Language Models)の拡張的知識を活用することで,新しいマルチエージェントコラボレーションフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:08:58 GMT)
DC-Spin: A Speaker-invariant Speech Tokenizer for Spoken Language Models [45.8] 音声言語モデル(SLM)はテキストと音声を処理し、同時に音声の理解と生成を可能にする。
DC-Spinは音声信号とSLMトークンをブリッジすることで音声のトークン化を改善することを目的としている。
本稿では,再学習や劣化を伴わずに,ストリーム可能なDC-Spinを実現するためのチャンクワイズ手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:43:13 GMT)
Lever LM: Configuring In-Context Sequence to Lever Large Vision Language Models [45.7] 我々は,67Mパラメータを持つ変換器である小言語モデル(LM)を用いて,9Bパラメータを持つはるかに大きな視覚言語モデル(LVLM)をレバーすることを提案する。
具体的には、この textbfLever-LM を用いて、LVLM のインコンテキストリアリング(ICL)性能を改善するために、効果的なインコンテキスト・デモ(ICD)シーケンスを構成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:02:43 GMT)
Plan-on-Graph: Self-Correcting Adaptive Planning of Large Language Model on Knowledge Graphs [45.1] 知識グラフ(KG)は、大規模言語モデル(LLM)のための明示的で編集可能な知識を提供する。
KG拡張LLMの既存のパラダイムは、探索空間の幅を手動で定義し、KGに欠陥のないナビゲーションを必要とする。
我々は、Plan-on-Graph(PoG)という、KG拡張LLMのための新しい自己修正適応計画パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:37:24 GMT)
HuRef: HUman-REadable Fingerprint for Large Language Models [45.0] HuRefは、大きな言語モデルのための人間可読指紋である。
トレーニングやモデルパラメータを公開することなく、ベースモデルを独自に識別する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:21:22 GMT)
Estimating the Hallucination Rate of Generative AI [44.9] 本稿では,生成AIを用いたテキスト内学習における幻覚率の推定手法を提案する。
ICLでは、条件生成モデル(CGM)にデータセットと予測質問を入力し、応答を生成する。
我々は、ICL問題に対処し、CGMが幻覚を発生させる確率を推定する新しい方法を開発した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:10:41 GMT)
On Learning Multi-Modal Forgery Representation for Diffusion Generated Video Detection [44.6] 本稿では,拡散生成コンテンツを検出するためのMulti-Mod-al Detection(MM-Det)という革新的なアルゴリズムを提案する。
MM-Detは、Multi-Modal Forgery Representation(MMFR)を生成することで、LMM(Large Multi-Modal Models)の深い総合的能力を利用する
MM-Detによるビデオフォサイシクス(DVF)の最先端性能の実現
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:20:47 GMT)
A Demonstration of Adaptive Collaboration of Large Language Models for Medical Decision-Making [44.4] 大規模言語モデル(LLM)は、膨大な医療知識とマルチモーダルヘルスデータを合成することで、このプロセスを合理化することを約束する。
我々のMDAgentsは、タスクの複雑さに基づいて協調構造をLLMに動的に割り当てることで、このニーズに対処します。
このフレームワークは、診断精度を改善し、複雑な現実世界の医療シナリオにおける適応応答をサポートする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:58:08 GMT)
Theoretical and Empirical Insights into the Origins of Degree Bias in Graph Neural Networks [43.8] グラフニューラルネットワーク(GNN)は、ノード分類タスクにおいて、低次ノードよりも高次ノードでよく機能する。
この度合いバイアスは、ソーシャルネットワークにおける有名人や他の高位のアクターを搾取することで、社会の限界化を強化することができる。
次数バイアスはノードの次数に関連する様々な要因から生じることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:48:43 GMT)
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning [43.7] DICEに基づく手法は,行動分布から最適な政策分布への変換とみなすことができる。
本稿では拡散モデルを用いて直接この変換を行う新しい手法Diffusion-DICEを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:16:24 GMT)
Max-Rank: Efficient Multiple Testing for Conformal Prediction [43.6] 多重仮説テスト(MHT)は、ゲノミクスから心理学まで、様々な科学分野において一般的に発生し、多くの仮説のテストが同時にタイプIエラーのリスクを増大させる。
本稿では,これらの依存関係を有効活用する新たな補正法であるtextttmax-rank$を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:50:41 GMT)
Global Convergence in Training Large-Scale Transformers [43.4] 本稿では,重力減衰正則化を用いた変圧器の訓練における勾配流の収束特性を厳密に解析する。
我々の分析は、トランスフォーマーに適応する一連の新しい平均場技術に基づいている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:51:39 GMT)
DexMimicGen: Automated Data Generation for Bimanual Dexterous Manipulation via Imitation Learning [42.9] 本稿では,人間の手による人型ロボットの人体実験からトラジェクトリを合成する大規模自動データ生成システムを提案する。
私たちは、たった60のソースの人間デモから、これらのタスク全体で21Kのデモを生成します。
また、実世界のヒューマノイド缶ソートタスクに、実世界のシミュレート・トゥ・リアルパイプラインを配置する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:48:45 GMT)
ConDiSR: Contrastive Disentanglement and Style Regularization for Single Domain Generalization [42.8] 医療データは、しばしば分散シフトを示し、標準パイプラインを使用してトレーニングされたディープラーニングモデルのテスト時のパフォーマンス劣化を引き起こす。
本研究は、分類タスクの文脈において、単一ドメインの一般化フレームワークを探索することの重要性と課題を強調した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:21:29 GMT)
Hidden Persuaders: LLMs' Political Leaning and Their Influence on Voters [42.8] 我々はまず、共和党候補よりも民主党候補を優先する18のオープン・クローズド・ウェイト LLM の政治的好意を示す。
教育訓練モデルでは、民主党候補への傾きがより顕著になることを示す。
さらに、米国登録有権者935名を対象に、LLMが有権者選択に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:51:00 GMT)
Recommendation Unlearning via Influence Function [42.5] 本稿では,新しいインフルエンス関数に基づく推薦アンラーニング(IFRU, Recommendation Unlearning)フレームワークを提案する。
IFRUは、フルリトレーニングに匹敵するレコメンデーションパフォーマンスを持つリトレーニングベースの手法と比較して、250倍以上のアクセラレーションを実現している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:54:38 GMT)
Revealing Fine-Grained Values and Opinions in Large Language Models [42.5] 政治コンパステスト(PCT)の62の命題に対する156kの応答のデータセットを,420の即時変動を用いて解析した。
微粒化解析のために, 応答のトポロジを同定することを提案する: 意味論的に類似したフレーズは, 異なるプロンプト間で繰り返し, 一貫性がある。
その結果,PCTの結果に有意な影響を与え,バイアスを反映し,クローズドフォームとオープンドメインの応答を誘発する際のテスト結果の相違が示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:06:22 GMT)
Do they mean 'us'? Interpreting Referring Expressions in Intergroup Bias [42.4] 本稿では,NFLチームのファンダム専門フォーラムの英語スポーツコメントに対するタグ付けタスクとしてグループ間バイアスをモデル化する。
私たちは、反対の視点(ゲームのチーム)から600万以上のゲームタイムコメントのユニークなデータセットをキュレートします。
専門家と群衆のアノテーションは、暗黙的かつ明示的な参照表現のタグ付けを通じてバイアスをモデル化することを正当化する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:08:00 GMT)
Assessing non-Gaussian quantum state conversion with the stellar rank [41.9] 状態変換は量子情報処理における基本的なタスクである。
本稿では,ガウス状態変換を近似的に評価するためのフレームワークを提案する。
近似的条件と確率的条件の両方の下でガウス状態変換のバウンダリを導出する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:13:43 GMT)
GaussianMarker: Uncertainty-Aware Copyright Protection of 3D Gaussian Splatting [41.9] デジタル透かし技術は、3DGSモデルに個別に所有権情報を埋め込むために応用できる。
予めトレーニングされた3DGSに透かしを埋め込むと、描画画像に明らかな歪みが生じます。
モデルパラメータの摂動を制限する不確実性に基づく3DGSの透かしを実現する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:08:54 GMT)
Pistis-RAG: Enhancing Retrieval-Augmented Generation with Human Feedback [41.9] RAGシステムは、セマンティックな関連性だけでは生成品質の向上を保証していない場合に制限に直面している。
我々は、LLMと人間の嗜好をよりよく整合させるために、コンテンツ中心のアプローチで設計された新しいRAGフレームワークであるPristis-RAGを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:35:42 GMT)
SPO: Sequential Monte Carlo Policy Optimisation [41.5] SPO:Sequential Monte Carlo Policy optimizationを紹介する。
我々は,SPOがロバストな政策改善と効率的なスケーリング特性を提供することを示した。
モデルフリーおよびモデルベースラインと比較して,統計的に有意な性能向上を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:05:49 GMT)
Enhancing LLM's Cognition via Structurization [41.1] 大規模言語モデル(LLM)は因果的かつシーケンシャルな視点で入力コンテキストを処理する。
本稿では,コンテキスト構造化という新しい概念を提案する。
具体的には、平易で秩序のない文脈文を、適切に順序付けされ階層的に構造化された要素に変換する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:06:41 GMT)
Stereo-Talker: Audio-driven 3D Human Synthesis with Prior-Guided Mixture-of-Experts [41.1] Stereo-Talkerは、新しいワンショットオーディオ駆動型ヒューマンビデオ合成システムである。
正確な唇の同期、表現力のある身体ジェスチャー、時間的に一貫したフォトリアリスティックな品質、継続的な視点制御を備えた3Dビデオを生成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:32:33 GMT)
DynaSplit: A Hardware-Software Co-Design Framework for Energy-Aware Inference on Edge [41.0] ソフトウェアとハードウェアの両方でパラメータを動的に設定するフレームワークであるDynaSplitを提案する。
実世界のテストベッド上で、人気のあるトレーニング済みNNを用いてDynaSplitを評価する。
その結果,クラウドのみの計算に比べてエネルギー消費が最大で72%減少した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:44:07 GMT)
G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models [40.7] 我々は、レトリーバル拡張世代(RAG)に基づく世界規模の地理的ローカライゼーションのための新しい枠組みを提案する。
G3は、ジオアライメント、ジオディバーシフィケーション、ジオビジュアライゼーションの3つのステップから構成される。
2つの確立されたデータセットの実験は、他の最先端手法と比較してG3の優位性を検証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:08:48 GMT)
Learning from Teaching Regularization: Generalizable Correlations Should be Easy to Imitate [40.6] 一般化は依然として機械学習における中心的な課題である。
本稿では,ニューラルネットワークを一般化するための新しい正規化手法であるLearning from Teaching (LoT)を提案する。
LoTはこの概念を運用し、補助的な学生学習者によるメインモデルの一般化を改善する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:17:08 GMT)
Residual Deep Gaussian Processes on Manifolds [40.2] 多様体から多様体への隠れ層と任意の最終層をモデル化する方法を示す。
我々のモデルは、非多様体データの推論を高速化する可能性があり、いつ、いつ、そして、それがプロキシ多様体に十分にマッピングできるかを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:09:40 GMT)
An Information Criterion for Controlled Disentanglement of Multimodal Data [39.6] マルチモーダル表現学習は、複数のモーダルに固有の情報を関連付けて分解しようとする。
Disentangled Self-Supervised Learning (DisentangledSSL)は、非角表現を学習するための新しい自己教師型アプローチである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:57:31 GMT)
Integral quantization based on the Heisenberg-Weyl group [39.6] 4次元ミンコフスキー時空におけるスピンレス粒子の運動に応用した積分量子化の枠組みを開発する。
提案手法はハイゼンベルク・ワイル群の作用によって生成されるコヒーレントな状態に基づいている。
固定位置とモータを特徴とする状態間の遷移振幅の計算を含む,我々のモデルの直接適用は,今後の論文に先延ばしされる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:36:38 GMT)
Scale-Aware Recognition in Satellite Images under Resource Constraint [39.5] 二つの課題: ある概念を認識するのに最適な解像度と、より高価な高解像度画像(HR)をいつ取得すべきか?
1)低分解能画像(LR)の認識モデルに訓練されたモデルから知識を抽出する手法,(2)モデル不一致に基づくHR画像のサンプリング戦略,(3)概念"スケール"を推論するためのLLMベースのアプローチ,の3つの要素を導入することで,これらの課題に対処する新しい手法を提案する。
これらのコンポーネントを用いて,衛星画像の大規模認識を効率よく行うシステムを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:14:22 GMT)
EPIC: Effective Prompting for Imbalanced-Class Data Synthesis in Tabular Data Classification via Large Language Models [39.3] 大規模言語モデル (LLM) は、多様なアプリケーションにまたがるテキスト内学習能力を示す。
バランスの取れたデータサンプルと一貫したフォーマットと独自の変数マッピングを併用した新しい手法であるEPICを導入し、不均衡なデータセットであっても、全てのクラスで正確な合成データを生成するのにLLMをガイドする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:27:14 GMT)
DetectRL: Benchmarking LLM-Generated Text Detection in Real-World Scenarios [39.0] 我々は,最新技術(SOTA)検出技術でさえも,このタスクにおいてまだ性能が劣っていることを強調した新しいベンチマークであるTectorRLを提案する。
我々は,現在のSOTA検出器の強度と限界を明らかにした。
DetectRLは、実世界のシナリオにおける検出器の評価に有効なベンチマークになり得ると考えている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:01:25 GMT)
Rethinking Out-of-Distribution Detection on Imbalanced Data Distribution [38.8] アーキテクチャ設計におけるバイアスを緩和し,不均衡なOOD検出器を増強する訓練時間正規化手法を提案する。
提案手法は,CIFAR10-LT,CIFAR100-LT,ImageNet-LTのベンチマークに対して一貫した改良を行う。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:48:05 GMT)
MoVA: Adapting Mixture of Vision Experts to Multimodal Context [38.8] 我々は,タスク固有の視覚エキスパートを適応的にルーティングし,粗い機構で融合する,強力で斬新なMLLMであるMoVAを提案する。
粗い段階では、最適な視覚専門家を動的に選択するためのコンテキスト対応の専門家ルーティング戦略を設計する。
粒度の細かい段階では、タスク固有の知識を抽出して融合するために、Mix-of-vision-Expert Adapter (MoV-Adapter) を精巧に実施する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:39:34 GMT)
AllClear: A Comprehensive Dataset and Benchmark for Cloud Removal in Satellite Imagery [38.5] クラウド削除のために$textitAllClear$という,世界最大のパブリックデータセットを紹介します。
このデータセットは、地球の表面を包括的にカバーし、より良い雲の除去結果を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:52:52 GMT)
First, Learn What You Don't Know: Active Information Gathering for Driving at the Limits of Handling [38.5] 不安定なシステムでは、オンライン適応は信頼性の高い同時学習と制御を確保するのに十分ではないかもしれない。
高速なオンライン適応を実現するため,ベイジアン・メタラーニング MPC フレームワークを提案する。
Toyota Supraの実験は、このフレームワークがダイナミックドリフト操作における信頼性の高い制御を可能にすることを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:02:30 GMT)
Interactive proofs for verifying (quantum) learning and testing [38.3] 我々は、限られたメモリや弱いデータアクセスが存在する場合に、データからテストし、学習することの問題を考察する。
リソース制約のある学習者/テスターは、リソース制約のない、信頼できない第三者と対話して、そのようなインタラクションなしでより効率的に学習やテストの問題を解決することができるだろうか?
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:22:52 GMT)
ETTFS: An Efficient Training Framework for Time-to-First-Spike Neuron [38.2] TTFS(Time-to-First-Spike)コーディングでは、ニューロンは推論中に一度だけ発火し、スパイク数を削減し、エネルギー効率を向上し、処理を高速化する。
本稿では,TTFSの効率的なトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:14:47 GMT)
VLM Agents Generate Their Own Memories: Distilling Experience into Embodied Programs [38.0] 大規模生成言語と視覚言語モデルは、意思決定のためのコンテキスト内学習において優れている。
In-Context Abstraction Learning (ICAL) は,マルチモーダルな体験のメモリを構築する手法である。
我々のアプローチは手動のプロンプト工学への依存を著しく減らし、そのような抽象化を欠いたアクションプランからコンテキスト内学習を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:38:39 GMT)
Redefining <Creative> in Dictionary: Towards a Enhanced Semantic Understanding of Creative Generation [38.0] CreTokを導入し、" Creative" をトークン $texttCreTok>$ として再定義します。
CreTokは、より柔軟性と時間のオーバーヘッドを減らし、texttCreTok>$は任意の概念のユニバーサルトークンとして機能する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:19:03 GMT)
Scaling Up Membership Inference: When and How Attacks Succeed on Large Language Models [37.4] メンバーシップ推論アタック(MIA)は、モデルのトレーニングセットで与えられたデータサンプルのメンバシップを検証する。
最近の研究は、現在のMIA法は大規模言語モデル(LLM)では機能しないと結論付けている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:59:46 GMT)
Understanding the Limits of Vision Language Models Through the Lens of the Binding Problem [37.3] 現状の視覚言語モデルは、人間がほぼ完璧な精度で実行する基本的多目的推論タスクにおいて、驚くほどの失敗を示します。
我々は、最先端のVLMのファジィ障害の多くは、結合問題に起因するものだと説明でき、これらの障害モードは、ヒト脳における迅速なフィードフォワード処理によって引き起こされる制限と著しく類似していることを発見した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:24:47 GMT)
Chain of Preference Optimization: Improving Chain-of-Thought Reasoning in LLMs [37.1] Tree-of- Thought (ToT) 法では、ツリー探索を用いて推論空間を広範囲に探索し、CoTデコーディングが見落としてしまうかもしれない推論経路をよりよく見つける。
ToTで構築された検索ツリーを利用した細調整言語モデル(LLMs)により、CoTは同様のあるいはより良いパフォーマンスを実現することができる。
これはCPO(Chain of Preference Optimization)によって実現され、LLMはCoT推論パスの各ステップをToTのステップと整列するように微調整される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:12:06 GMT)
Structure-aware Domain Knowledge Injection for Large Language Models [37.1] 本稿では,基礎言語モデル(LLM)をドメインスペシャリストに効率的に変換する手法であるStructTuningを紹介する。
従来の知識注入性能の50%を達成しながら、トレーニングコーパスの要求をわずか0.3%まで大幅に削減する。
本手法は,MMedBench の最先端 MMedLM2 に対して,トレーニングコストが5% に大幅に削減される可能性を示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:03:06 GMT)
LLMCBench: Benchmarking Large Language Model Compression for Efficient Deployment [37.0] 大規模言語モデル (LLM) は、その強力な知能を実証しているが、計算とストレージの需要が高いため、実用化は困難である。
本稿ではLLMCBench(Large Language Model Compression Benchmark)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:01:26 GMT)
Distributional Successor Features Enable Zero-Shot Policy Optimization [36.5] 本研究は、ゼロショットポリシー最適化のための分散継承機能(DiSPO)という、新しいモデルのクラスを提案する。
DiSPOは、定常データセットの行動ポリシーの後継機能の分布と、データセット内で達成可能な異なる後継機能を実現するためのポリシーを学ぶ。
データセットの長期的な結果を直接モデル化することにより、DiSPOは、報酬関数をまたいだゼロショットポリシー最適化のための単純なスキームを実現しつつ、複雑なエラーを避けることができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:46:00 GMT)
Efficient multi-prompt evaluation of LLMs [36.5] PromptEvalは,多数のプロンプトに対して性能を推定する手法である。
PromptEvalは一貫して性能分布を推定し,その有効性を実証的に証明する。
本稿では,LLM-as-a-judgeにおいてPromptEvalが有効であることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:26:21 GMT)
LLMs are Highly-Constrained Biophysical Sequence Optimizers [36.3] 大規模言語モデル(LLM)は、最近、様々な生物学的タスクにおいて大きな可能性を示している。
本研究では,LLMを高度に制約された二レベル最適化として活用する可能性について検討する。
本稿では,報酬分布と基準分布を円滑に補間する新たなトレーニング目標であるMargin-Aligned expectation (MargE)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:46:13 GMT)
Can In-context Learning Really Generalize to Out-of-distribution Tasks? [36.1] 本研究は,訓練中に遭遇したことのないアウト・オブ・ディストリビューション(OOD)課題に対する,イン・コンテクスト・ラーニング(ICL)のメカニズムについて検討した。
我々は、トランスフォーマーがICLを通してOODタスク機能を学ぶのに苦労していることを明らかにする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:22:50 GMT)
NeuralFluid: Neural Fluidic System Design and Control with Differentiable Simulation [36.1] 本稿では,動的固体境界を持つ複雑な流体系のニューラルコントロールと設計を探求する新しい枠組みを提案する。
本システムでは, 高速で微分可能なNavier-Stokesソルバと, ソリッド流体インタフェースのハンドリングを行う。
高忠実で高分解能な動的流体環境における設計・制御・学習タスクのベンチマークを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:11:26 GMT)
Learning Video Representations without Natural Videos [36.0] 本研究では, 自然映像を訓練に取り入れることなく, 合成ビデオや自然画像から有用な映像表現を学習できることを示す。
人工ビデオに事前学習したビデオMAEモデルでは、UCF101アクション分類におけるパフォーマンスギャップの97.2%を、スクラッチからのトレーニングと自然ビデオからの自己教師付き事前訓練の間に閉じている。
UCF101-Pの14のアウト・オブ・ディストリビューションデータセットのうち11で、UCF101事前トレーニングと同様のパフォーマンスを示し、UCF101事前トレーニングモデルを上回っている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:30 GMT)
A Unified Confidence Sequence for Generalized Linear Models, with Applications to Bandits [35.7] 我々は,任意の(自己調和型)一般化線形モデル(GLM)に対して,統一度比に基づく信頼シーケンス(CS)を提案する。
ガウシアン,ベルヌーイ,ポアソンなど,様々な GLM の既知の CS と同等あるいは同等であることを示す。
分析の結果,有意な楽観的アプローチは,さまざまな自己協和性(必ずしも有界ではない)GLBに対して,同時に最先端の後悔を達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:14:52 GMT)
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time [35.4] 静止画像と音声音声クリップを1つずつ与えることで,視覚的情緒的スキル(VAS)をアピールするライフライクな発話顔を生成するためのフレームワークであるVASAを紹介した。
VASA-1は、音声と精巧に同期する唇の動きを発生させるだけでなく、顔のニュアンスや自然な頭部の動きを生じさせる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:43:14 GMT)
ETO:Efficient Transformer-based Local Feature Matching by Organizing Multiple Homography Hypotheses [35.3] 局所的な特徴マッチングのための効率的なトランスフォーマーベースネットワークアーキテクチャを提案する。
YFCC100Mデータセットでは、我々のマッチング精度は最先端のトランスフォーマーベースのアーキテクチャであるLoFTRと競合する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:26:18 GMT)
RAGraph: A General Retrieval-Augmented Graph Learning Framework [35.3] 我々は、RAGraph(General Retrieval-Augmented Graph Learning)と呼ばれる新しいフレームワークを紹介する。
RAGraphは、一般的なグラフ基盤モデルに外部グラフデータを導入し、目に見えないシナリオにおけるモデルの一般化を改善する。
推論中、RAGraphは下流タスクにおける重要な類似性に基づいて、似たようなおもちゃのグラフを順応的に検索する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:05:21 GMT)
Sample-Efficient Constrained Reinforcement Learning with General Parameterization [35.2] エージェントの目標は、無限の地平線上で期待される割引報酬の和を最大化することである。
我々は,世界最適性ギャップを$epsilon$で保証し,制約違反を$epsilon$で保証するPrimal-Dual Accelerated Natural Policy Gradient (PD-ANPG)アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:24:19 GMT)
Are Uncertainty Quantification Capabilities of Evidential Deep Learning a Mirage? [35.2] EDL法は,特定の目的関数を最小化することにより,予測分布上のメタ分布を学習する。
近年の研究では、学習した不確実性は信頼できないと結論づける既存の方法の限界が特定されている。
本研究では,多種多様な目的関数を統一することにより,多種多様なEDL手法の挙動をより深く理解する。
我々は,EDL法が下流タスクに実証的に有効であるとしても,不確実な定量化能力に乏しいにもかかわらず,これは発生すると結論付けた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:03:26 GMT)
FasterDiT: Towards Faster Diffusion Transformers Training without Architecture Modification [35.1] 拡散変換器(DiT)は収束速度が遅い。
アーキテクチャの変更なしにDiTトレーニングを加速することを目指しています。
我々は極めてシンプルで実践可能な設計戦略であるFasterDiTを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:49:09 GMT)
Navigating the Unknown: A Chat-Based Collaborative Interface for Personalized Exploratory Tasks [35.1] 本稿ではCARE(Collaborative Assistant for Personalized Exploration)を紹介する。
CARE は多エージェント LLM フレームワークと構造化ユーザインタフェースを組み合わせることにより,探索作業におけるパーソナライズを向上するシステムである。
この結果から, パーソナライズされた問題解決・探索において, CARE が LLM ベースのシステムを受動的情報検索システムから積極的パートナーに転換する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:30:55 GMT)
Multilingual Pretraining Using a Large Corpus Machine-Translated from a Single Source Language [34.5] 1つの高品質なソース言語から機械翻訳されたテキストは、多言語モデルの事前学習に大きく貢献する。
クアトロLLMは、クローズドデータを用いて訓練された最先端の多言語モデルと一致し、より優れることを示す。
私たちは、hf.co/britllm/CuatroLLMでオープンライセンスの下で、コーパス、モデル、トレーニングパイプラインをリリースしています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:09:50 GMT)
Aligning Audio-Visual Joint Representations with an Agentic Workflow [34.4] 視覚コンテンツと付随する音声信号は、自然に関節表現を定式化し、オーディオ視覚(AV)関連アプリケーションを改善する。
AVデータアライメントの重要性は、通常、高品質な表現を達成するために損なわれる。
本稿では,音声信号を視覚データに整列させることにより,データ中心の観点からのAV関節表現を改善することを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:20:22 GMT)
Tree of Attacks: Jailbreaking Black-Box LLMs Automatically [34.4] 本稿では,ジェイルブレイクを自動生成するTAP(Tree of Attacks with Pruning)を提案する。
TAPは、最先端のLDMを80%以上にわたってジェイルブレイクするプロンプトを生成する。
TAPはまた、LlamaGuardのような最先端のガードレールによって保護されたLLMをジェイルブレイクすることができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:57:42 GMT)
FSP-Laplace: Function-Space Priors for the Laplace Approximation in Bayesian Deep Learning [34.3] 我々は,ガウス過程 (GP) に先立って, 後方測度のいわゆる弱モードを求める訓練を再放送した。
GP事前を通じて、正規性や周期性のような構造的かつ解釈可能な帰納バイアスを関数空間で直接表現することができる。
我々の手法は、事前知識が豊富であるような改善された結果を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:58:47 GMT)
Local Superior Soups: A Catalyst for Model Merging in Cross-Silo Federated Learning [33.9] 我々は「ローカル・スーパー・スープ」と呼ばれる革新的モデルに基づくローカル・トレーニング手法を提案する。
提案手法は, 異なるクライアント間でのローカルトレーニングを強化し, 接続された低損失盆地の探索を奨励する。
広範に使われているFLデータセットにまたがって,その有効性と効率を実証した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:20:17 GMT)
Analyzing & Reducing the Need for Learning Rate Warmup in GPT Training [33.9] ウォームアップは、Delta mathbfw_t$の全体サイズを制限してトレーニングに役立ちます。
ウォームアップは、トレーニングの初期段階で重要なバッチサイズが制限されただけでなく、大きな角の更新に対処するのに役立つことに気付きました。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:32:39 GMT)
From Linear to Linearizable Optimization: A Novel Framework with Applications to Stationary and Non-stationary DR-submodular Optimization [33.4] 本稿では,モノトーン非線型やDR-サブモジュラリティなど,様々な環境での凹凸とDR-サブモジュラリティの概念を紹介する。
一般的なメタアルゴリズムは、線形/四進関数を上線形/四進関数を最適化するものに変換する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:57:04 GMT)
Artificial intelligence to improve clinical coding practice in Scandinavia: a crossover randomized controlled trial [33.1] ノルウェーとスウェーデンでのユーザスタディでは,精度と時間の両方を改善するために,Easy-ICDを試験した。
結果: クリニカルテキスト配列の平均符号化時間差は123秒 (emphPtextless.001,95% CI:81~164) であった。
コーディングの精度については、複雑なテキストと単純なテキストの両方の改善は重要ではなかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:24:37 GMT)
AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents [32.6] 我々は,AndroidLabをシステマティックなAndroidエージェントフレームワークとして提案する。
異なるモダリティ、アクションスペース、再現可能なベンチマークを備えた運用環境を含む。
大規模言語モデル(LLM)とマルチモーダルモデル(LMM)の両方を同一のアクション空間でサポートする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:25:20 GMT)
Less is More: DocString Compression in Code Generation [32.4] LLM(Large Language Models)は、関数/メソッドシグネチャとDocStringを実行可能なコードに変換するために使用される。
プロンプト圧縮の最近の進歩は自然言語処理(NLP)において有望な結果を示しているが、コード生成への適用性はまだ不明である。
コード生成のためのDocString圧縮専用の新しい圧縮手法であるShortenDocを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:20:35 GMT)
Implicit Optimization Bias of Next-Token Prediction in Linear Models [32.3] NTP(Next-token Prediction)は、現代の言語モデルにおける主要なトレーニングパラダイムである。
勾配に基づく一般化により選択された解の構造的性質について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:01:45 GMT)
Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers [32.3] トークン化は、人間可読テキストをモデル可読な離散トークンでブリッジする重要なステップである。
近年の研究では、トークン化剤が不要なモデル挙動を引き出すために利用できることが判明している。
非完全トークン、すなわち、バイトレベルバイトペア符号化(BPE)トークン化(英語版)による不完全トークン、すなわち、不完全トークンについて検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:19:44 GMT)
In-situ electro-optic sampling of microwave signals under cryogenic conditions and for superconducting applications [31.9] マイクロ波信号の任意の位置測定が可能な極低温電気光学サンプリング(EOS)装置を実証する。
我々はJosephson Arbitrary Waveform Synthesizer (JAWS) を用いて、量子精度の電圧信号を生成し、それらをEOS設定で測定する。
超伝導伝送線路における超高速極低温フォトダイオードの時間領域応答とS11散乱パラメータの電気係数反射をEOS設定により決定する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:10:48 GMT)
Can Machines Resonate with Humans? Evaluating the Emotional and Empathic Comprehension of LMs [31.6] 言語モデルにおける共感理解を改善するためのいくつかの戦略を提案する。
アノテータ間の低い合意は、トレーニングを妨げ、タスクの主観的な性質を強調します。
これを研究するために,我々はウルドゥー語でストーリーペアを注意深く収集し,アノテータ間の共感を解釈する主観性は文化的背景とは無関係であることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:40:26 GMT)
Flex-MoE: Modeling Arbitrary Modality Combination via the Flexible Mixture-of-Experts [31.4] 我々は任意のモダリティの組み合わせを柔軟に組み込むように設計された新しいフレームワークFlex-MoEを提案する。
アルツハイマー病領域の4つのモードを含むADNIデータセットとMIMIC-IVデータセットを用いてFlex-MoEを評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:44:50 GMT)
Improving Linear System Solvers for Hyperparameter Optimisation in Iterative Gaussian Processes [31.3] 本稿では,線形系解法を用いる反復法に着目し,限界次数勾配を推定する。
本稿では,解決者間で適用可能な3つの重要な改善点について論じる。
これらのテクニックは、トレランスの解決時に最大7,2倍のスピードアップを提供し、停止時に平均残留ノルムを最大7,7倍まで下げる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:44:22 GMT)
ResiDual Transformer Alignment with Spectral Decomposition [31.1] 我々は、残像のスペクトル幾何学に着目し、視覚変換器の現象を解析する。
様々な入力データ分布にまたがる特殊な役割をエンコードしていることを示す。
本稿では,残流のスペクトルアライメント技術であるResiDualを紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:51:45 GMT)
Dinomaly: The Less Is More Philosophy in Multi-Class Unsupervised Anomaly Detection [31.0] 本稿では,最小限の再構成に基づく異常検出フレームワーク,すなわちDianomalyを紹介する。
提案したDinomalyは,3つのデータセットでそれぞれ99.6%,98.7%,89.3%の印象的な画像レベルのAUROCを実現している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:47:33 GMT)
ParallelEdits: Efficient Multi-Aspect Text-Driven Image Editing with Attention Grouping [31.0] ParallelEditsは、複数の属性をまたいだ同時編集をシームレスに管理するメソッドである。
PIE-Bench++データセットは、多面的シナリオにおけるテキスト駆動の画像編集方法を評価するためのベンチマークである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:18:29 GMT)
The FineWeb Datasets: Decanting the Web for the Finest Text Data at Scale [31.0] FineWebは96 Common Crawlスナップショットから派生した15トリリオンのトークンデータセットである。
FineWeb-Eduは、FineWebからフィルタリングされた教育用テキストの1.3トリリオントークンコレクションである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:37:49 GMT)
Text-DiFuse: An Interactive Multi-Modal Image Fusion Framework based on Text-modulated Diffusion Model [30.7] 既存のマルチモーダル画像融合法では、ソース画像に示される複合劣化に対処できない。
本研究では,テキスト変調拡散モデルであるText-DiFuseに基づく,インタラクティブなマルチモーダル画像融合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:10:50 GMT)
SOAR: Self-Occluded Avatar Recovery from a Single Video In the Wild [30.7] 自己排除は、パフォーマーが事前に定義された動作スクリプトに従わない野生の人々を捕らえるときによく見られる。
身体の一部が完全に観察されていない部分的な観察から人体を復元する手法であるセルフ・オクルード・アバター・リカバリ(SOAR)を紹介した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:35:59 GMT)
Q-learning for Quantile MDPs: A Decomposition, Performance, and Convergence Analysis [30.7] マルコフ決定過程(MDPs)において、バリュー・アット・リスク(Value-at-Risk)のような量子リスク尺度は、特定の結果に対するRLエージェントの嗜好をモデル化するための標準指標である。
本稿では,強い収束と性能保証を有するMDPにおける量子化最適化のための新しいQ-ラーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:53:20 GMT)
Faster Neighborhood Attention: Reducing the O(n^2) Cost of Self Attention at the Threadblock Level [30.7] 近隣の注意は、それぞれのトークンの注意を隣人に限定することで、自己注意のコストを減少させる。
我々は,近隣の注意を,標準的な注意と同様のバッチGEMM問題として表すことができることを示した。
我々は、異なる空間軸をまたいだ注意をきめ細かく制御できる、融合したドット積アテンションカーネルを適応した、融合した近隣アテンションを開発する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:32:26 GMT)
Credit Attribution and Stable Compression [30.6] 我々は、機械学習アルゴリズムによる信用属性の研究を行う。
我々は、$k$のデータポイントの指定されたサブセットに対する安定性保証を弱める新しい定義-差分プライバシーの緩和-を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:56:23 GMT)
Prospective Learning: Learning for a Dynamic Future [30.4] 現実世界のアプリケーションでは、データの分散とゴールは時間とともに進化します。
データと目標の動的な性質に対処する既存の戦略は、現実世界のパフォーマンスが劣っていることを示している。
「振り返り学習」は、最適仮説が時間とともに変化する状況に合わせて調整される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:03:17 GMT)
GITA: Graph to Visual and Textual Integration for Vision-Language Graph Reasoning [30.2] 我々は、$textbfG$raph to v$textbfI$sual and $textbfT$extual Integr$textbfA$tion (GITA)というエンドツーエンドフレームワークを提案する。
GITAはまず、ビジュアルグラフを一般的なグラフ推論に組み込む。
GVLQAデータセットと5つの実世界のデータセットの実験は、GITAが一般的なグラフ推論能力において、メインストリームのLLMよりも優れていることを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:27:33 GMT)
Using Structural Similarity and Kolmogorov-Arnold Networks for Anatomical Embedding of 3-hinge Gyrus [30.0] 3HG(3-hinge gyrus)は、新たに定義された折りたたみパターンである。
本稿では3HGの解剖学的特徴を組み込んだ自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:28:23 GMT)
Conformal Prediction for Class-wise Coverage via Augmented Label Rank Calibration [30.0] 本稿では,クラス条件カバレッジを実現するための予測セットサイズを削減するために,ランク校正型クラス条件CP(RC3P)アルゴリズムを提案する。
複数の実世界のデータセットの実験により、RC3Pは平均的な予測セットサイズを26.25%削減した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:32:07 GMT)
How does Architecture Influence the Base Capabilities of Pre-trained Language Models? A Case Study Based on FFN-Wider and MoE Transformers [29.9] 本研究は,FFN-Wider変換器のアーキテクチャによる基本能力の低下を説明・逆転する試みである。
その結果,14BパラメータMOEモデルによる基礎能力の大幅な向上が達成できた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:09:12 GMT)
How does Architecture Influence the Base Capabilities of Pre-trained Language Models? A Case Study Based on FFN-Wider and MoE Transformers [29.9] 本研究は,FFN-Wider変換器のアーキテクチャによる基本能力の低下を説明・逆転する試みである。
その結果,14BパラメータMOEモデルによる基礎能力の大幅な向上が達成できた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:09:12 GMT)
Parameter-free Clipped Gradient Descent Meets Polyak [29.8] 勾配降下とその変種は、機械学習モデルをトレーニングするためのデファクト標準アルゴリズムである。
Inexact Polyak Stepsizeを提案し、これはハイパーパラメータチューニングなしで最適解に収束する。
合成関数を用いて収束結果を数値的に検証し,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:03:06 GMT)
Towards multiqudit quantum processor based on a $^{171}$Yb$^{+}$ ion string: Realizing basic quantum algorithms [29.7] 我々は,171ドルYb$+$イオンと8個の個別制御可能な4レベル量子ビット(量子)を用いた3次元線形ポールトラップに基づく量子プロセッサを実証する。
開発したイオントラップの設計は、個々のアドレッシングおよびリードアウト光学系と共に量子アルゴリズムの実行を可能にする、高エレガントで低い加熱率を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:51:18 GMT)
Factuality of Large Language Models: A Survey [29.6] 我々は、主要な課題とその原因を特定することを目的として、既存の研究を批判的に分析する。
オープンエンドテキスト生成における事実自動評価の障害を解析する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:50:59 GMT)
The Automated Verification of Textual Claims (AVeriTeC) Shared Task [29.5] 共有されたタスクは、参加者に証拠を回収し、ファクトチェッカーによってチェックされた現実世界のクレームの正確性を予測するよう依頼した。
証拠は検索エンジン経由で、またはオーガナイザが提供する知識ストア経由で見つけることができる。
優勝チームはTUDA_MAIで、AVeriTeCスコアは63%だった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:01:12 GMT)
Beyond Label Attention: Transparency in Language Models for Automated Medical Coding via Dictionary Learning [27.8] 辞書の特徴は, モデル行動の把握や, 医学的に無関係なトークンの90%以上の隠された意味の解明に有効であり, 人間の解釈が可能であることを示す。
辞書の特徴は, モデル行動の把握や, 医学的に無関係なトークンの90%以上の隠された意味の解明に有効であり, 人間の解釈が可能であることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:39:40 GMT)
Wide Two-Layer Networks can Learn from Adversarial Perturbations [27.4] 摂動学習の反直感的成功を理論的に説明する。
対角摂動は、ネットワークがそれらから一般化するのに十分なクラス固有の特徴を含むことを証明している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:55:57 GMT)
PSL: Rethinking and Improving Softmax Loss from Pairwise Perspective for Recommendation [27.3] SL(Softmax Loss)は、推奨システム(RS)に広く適用されており、有効性を示している。
この研究は、SLをペアワイズの観点から分析し、2つの重要な制限を明らかにした。
これらの問題に対処するため、この研究はSLをPSL(Pairwise Softmax Loss)と呼ばれる新しい損失関数群に拡張した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:11:26 GMT)
Topology-Aware Graph Augmentation for Predicting Clinical Trajectories in Neurocognitive Disorders [27.3] 本稿では、一般化可能なエンコーダをトレーニングするためのプレテキストモデルと、下流タスクを実行するためのタスク固有モデルからなるトポロジ対応グラフ拡張(TGA)フレームワークを提案する。
1,688 fMRIでの実験では、TGAがいくつかの最先端の手法より優れていることが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:37:20 GMT)
Hamiltonian Monte Carlo Inference of Marginalized Linear Mixed-Effects Models [26.5] 本研究では,線形混合効果モデルにおいて,ランダム効果を容易に除去するアルゴリズムを開発した。
ナイーブアプローチは、ハミルトンモンテカルロ(HMC)のような推論アルゴリズムにおける立方的時間演算を導入する
適用可能な場合の限界化は常に有益であることを示し、様々なモデルの改善を強調します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:16:18 GMT)
Enhancing Motion in Text-to-Video Generation with Decomposed Encoding and Conditioning [26.4] 本稿では,テキスト・トゥ・ビデオ(T2V)生成における動き合成を強化するためのDecomposed Motion (DEMO) という新しいフレームワークを提案する。
本手法は,静的要素のためのコンテンツエンコーダと,時間的ダイナミクスのためのモーションエンコーダと,コンテンツと動作条件の分離機構を含む。
視覚的品質を保ちながら、モーションダイナミクスを向上した動画を制作するDEMOの優れた能力を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:53 GMT)
OmniJARVIS: Unified Vision-Language-Action Tokenization Enables Open-World Instruction Following Agents [26.4] 本稿では,Minecraftにおけるオープンワールド学習エージェントのためのビジョン・ランゲージ・アクション・モデルであるOmniJARVISについて述べる。
意味論的に意味のある行動トークンのおかげで、結果として得られるVLAモデルであるOmniJARVISは、(思考の連鎖を作り、計画し、質問に答え、行動することができる。
我々の分析は、相互作用データの形成、統一トークン化、およびそのスケーリングポテンシャルにおける重要な設計原則をさらに明らかにしている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:27:50 GMT)
Benchmark Data Repositories for Better Benchmarking [26.2] 機械学習の研究では、ベンチマークデータセットのパフォーマンスを通じてアルゴリズムを評価することが一般的である。
我々は、これらの$textitbenchmarkデータレポジトリの状況と、ベンチマークを改善する上で彼らが果たす役割を分析します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:30:08 GMT)
Uniform Last-Iterate Guarantee for Bandits and Reinforcement Learning [26.1] 本稿では,強化学習アルゴリズムの累積性能と即時性能を両立させる,より強力な測度,一様ラストイテレート(ULI)保証を提案する。
ほぼ最適のULI保証は、上記のメトリクス間で、直接的に、ほぼ最適の累積性能を意味するが、その逆ではないことを実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:13:36 GMT)
Epipolar-Free 3D Gaussian Splatting for Generalizable Novel View Synthesis [25.9] 一般化可能な3DGSは、フィードフォワード推論方式でスパースビュー観測から新しいシーンを再構築することができる。
既存の手法は、複雑な現実世界のシーンでは信頼できないエピポーラ先行に大きく依存している。
一般化可能な新規ビュー合成のための効率的なフィードフォワード3DGSモデルであるeFreeSplatを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:07:27 GMT)
Kernel Operator-Theoretic Bayesian Filter for Nonlinear Dynamical Systems [25.9] 本稿では,演算子理論モデリングのための機能的ベイズ的視点に基づく機械学習手法を提案する。
この定式化は、線型作用素の無限次元空間や普遍近似特性を持つヒルベルト空間で直接行われる。
この実践的手法は正確な結果を得ることができ、有限次元クープマン分解より優れることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:31:31 GMT)
Judging the Judges: A Systematic Investigation of Position Bias in Pairwise Comparative Assessments by LLMs [25.3] 本研究は, 対比較における位置バイアスを検討するための体系的枠組みを提案する。
MTBenchとDevBenchにまたがる12のLLM審査員による実験を行い,22のタスクと約40のソリューション生成モデルについて検討した。
以上の結果から, 有能なLLM裁判官の位置バイアスは, ランダムな確率や, 有意な判断や課題の違いによるものではないことが確認された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:10:55 GMT)
Recovering Complete Actions for Cross-dataset Skeleton Action Recognition [25.3] 本稿では,新しい完全動作に基づく復元・再サンプル拡張フレームワークを提案する。
完全なアクションを回復し、これらの全シーケンスから再サンプリングすることで、目に見えない領域に対して強力な拡張を生成することができる。
3つのスケルトン行動データセットを用いたクロスデータセット設定に対するアプローチを検証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:27:58 GMT)
Federated Black-Box Adaptation for Semantic Segmentation [25.1] フェデレートラーニング(Federated Learning, FL)は、分散ラーニングの一種で、複数の機関やクライアントが、タスクを解決するためのグローバルモデルを共同で学習することを可能にする。
近年の研究では、データのプライバシーを守るという約束は、既存の方法では守られていないことが示されている。
我々は、ゼロオーダー最適化(ZOO)を利用してクライアントモデルの重みを更新し、一階最適化(FOO)によりサーバ重みを更新するニューラルネットワークのブラックボックス適応であるBlackFedを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:45:09 GMT)
Do not think about pink elephant! [25.0] 本稿では,近年の安定拡散やDALL-E3のような大規模モデルが,人間の知能の脆弱性を共有していることを示す。
本稿では,LMプロバイダのポリシによって禁止された数字を生成する,シンプルなプロンプトベースの攻撃手法を提案する。
これらの攻撃に対抗するために,認知療法技術に触発された即時防衛戦略を導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:32:26 GMT)
What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective [25.0] 本研究では,大規模言語モデル(LLM)において,異なる応答と初期モデルを用いた学習において,異なるレイヤのトレーニングパターンについて検討する。
チェーン・オブ・シンクレット(CoT)のない高速思考は、遅い思考よりも大きな勾配と層間の勾配の差が大きくなることを示す。
本研究は, 汎用化可能なシステム2エージェント構築への道のりをたどる, その効率性と安定性に関する新たな知見を紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:58:06 GMT)
SemCoder: Training Code Language Models with Comprehensive Semantics Reasoning [24.9] 本稿では,静的テキストデータへのコードLLMの依存と意味理解の必要性のギャップを埋めることを目的としている。
包括的意味論を推論するために、コードLLMを訓練するための新しい戦略であるモノローグ推論を導入する。
我々は、コード生成および実行推論タスクにおいて、GPT-3.5-turboと競合する性能を示す、たった6.7BパラメータのコードLLMであるSemCoderを開発した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:44:31 GMT)
FM-Fusion: Instance-aware Semantic Mapping Boosted by Vision-Language Foundation Models [24.8] 視覚言語基礎モデルの開発は、データ分散における強力なゼロショット転送可能性を示している。
本稿では,開集合ラベル測定から近接集合意味クラスを予測するための確率的ラベル融合法を提案する。
我々は,すべてのモジュールを統合意味マッピングシステムに統合し,RGB-D入力のシーケンスを読み取って,インスタンス認識意味マップを漸進的に再構築する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:25:08 GMT)
Revisiting Subgradient Method: Complexity and Convergence Beyond Lipschitz Continuity [24.5] 次進法は非滑らかな最適化のための最も基本的なアルゴリズムスキームの1つである。
本研究では、まず、非Lipschitz凸と弱凸最小化をカバーするために、下次法の典型的な反復複雑性結果を拡張する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:34:43 GMT)
Need a Small Specialized Language Model? Plan Early! [24.4] 本稿では,大規模で汎用的で事前学習可能なデータセットと特殊化データを用いて,優れた特殊化された小言語モデルを得る方法について検討する。
我々は、(i)各専門化タスクのモデルを事前訓練する余裕があるか、(ii)各タスクに1つの事前訓練されたモデルを安価に適応させたいか、という2つのシナリオを考察する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:56:08 GMT)
Aggregate-and-Adapt Natural Language Prompts for Downstream Generalization of CLIP [24.2] Aggregate-and-Adapted Prompt Embedding (AAPE) としての即時埋め込み
AAPEは、視覚言語理解タスクを含む、さまざまな下流データ分散とタスクに一般化できることが示されている。
また、AAPEは非標準およびOOD例の処理に特に有用であることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:41:13 GMT)
Localization, balance and affinity: a stronger multifaceted collaborative salient object detector in remote sensing images [24.1] ORSIにおいて,LBA-MCNetと呼ばれる,より強力な多面協調型サリエント物体検出器を提案する。
このネットワークは、ターゲットの正確な位置決め、詳細な機能のバランス、画像レベルのグローバルコンテキスト情報のモデリングに重点を置いている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:50:48 GMT)
An Optimism-based Approach to Online Evaluation of Generative Models [23.9] 利用可能なモデル群間の標準評価スコアを最大化する生成モデルを見つけるためのオンライン評価フレームワークを提案する。
具体的には、Fr'echet Inception Distance(FID)とInception Score(IS)のメトリクスに基づいて、生成モデルのオンライン評価を行う。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:48:40 GMT)
Towards Cross-Modal Text-Molecule Retrieval with Better Modality Alignment [23.9] クロスモーダルテキスト-分子検索モデルは、テキストと分子の共有特徴空間を正確に類似性を計算するために学習することを目的としている。
これまでの研究は、テキストシーケンスと分子グラフの間の大きなギャップを考慮すると、モダリティ共有の特徴を捉えるのに不十分であった。
本稿では,2つの改良点を有するクロスモーダルテキスト-分子検索モデルを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:03:13 GMT)
An engine not a camera: Measuring performative power of online search [23.8] 我々は,オンライン検索プロバイダの動作能力を測定する実験を設計し,実施する。
Google Shopping反トラスト法調査をケーススタディとして使用しています。
我々は、最近のパフォーマンスパワーの定義が、オンライン実験からの定量的洞察をデジタルプラットフォームの経済力に関する将来の調査と統合する上で、どのように役立つかを示す青写真として、我々の研究を期待する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:58:23 GMT)
EigenVI: score-based variational inference with orthogonal function expansions [23.7] EigenVIはブラックボックス変分推論(BBVI)のための固有値に基づくアプローチである
我々はEigenVIを用いて様々なターゲット分布を近似し、例えば後方dbのベイズモデルのベンチマークスイートを含む。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:48:34 GMT)
Understanding Graphical Perception in Data Visualization through Zero-shot Prompting of Vision-Language Models [23.6] 視覚言語モデル(VLM)は多くのチャート理解タスクで成功している。
本稿では,VLMのゼロショットプロンプトの精度を,人間の評価プロファイルを定式化して評価することにより,そのような応用の基礎を定式化した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:24:46 GMT)
Fight Back Against Jailbreaking via Prompt Adversarial Tuning [23.6] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃の影響を受けやすい。
本稿では,ユーザプロンプトに付随するプロンプト制御をガードプレフィックスとしてトレーニングする,PAT(Prompt Adversarial Tuning)というアプローチを提案する。
本手法は, グレーボックス攻撃とブラックボックス攻撃の両方に対して有効であり, 先進攻撃の成功率を0%に低下させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:24:14 GMT)
Efficient Federated Learning against Heterogeneous and Non-stationary Client Unavailability [23.5] FedAPMには、(i)標準のFedAvgに対して(1)O$追加のメモリ計算で使用不能な計算を行うための新しい構造が含まれている。
非定常力学であるにもかかわらず、FedAPMは静止点にも収束することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:16:00 GMT)
CLAP4CLIP: Continual Learning with Probabilistic Finetuning for Vision-Language Models [23.4] 継続学習(CL)は、ディープラーニングが学習したものを保持しながら、新しい知識を学ぶのを支援することを目的としている。
タスクごとの視覚誘導テキスト機能に対する確率的モデリングフレームワークであるCLAP(Continuous LeArning with Probabilistic Finetuning)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:22:26 GMT)
Commonsense Knowledge Editing Based on Free-Text in LLMs [23.2] 本研究では,コモンセンス知識に対応するパラメータ位置を特定するためのDynamics-Aware Moduleを提案し,知識を更新するために知識編集モジュールを用いる。
実験結果から,DEMは優れた編集性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:50:24 GMT)
EgoMimic: Scaling Imitation Learning via Egocentric Video [22.9] EgoMimicは、人間の体表データを介して操作をスケールするフルスタックフレームワークである。
EgoMimic は,1) エルゴノミクス・プロジェクト・Aria メガネを用いたヒトの体型データをキャプチャするシステム,2) 人体データとの運動的ギャップを最小限に抑える低コストなバイマティックマニピュレータ,(4) 人体データとロボットデータとのコトレーニングを行う模倣学習アーキテクチャ,の2つによって実現している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:55 GMT)
Unveiling Synthetic Faces: How Synthetic Datasets Can Expose Real Identities [22.9] 6つの最先端の合成顔認識データセットにおいて、元の実データからのサンプルが漏洩していることを示す。
本論文は,ジェネレータモデルのトレーニングデータから生成した合成顔認証データセットへの漏洩を示す最初の研究である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:17:14 GMT)
APEBench: A Benchmark for Autoregressive Neural Emulators of PDEs [22.0] APEBenchは、偏微分方程式を解くための自己回帰型神経エミュレータを評価するベンチマークスイートである。
APEBenchはJAXをベースにしており、シームレスに統合された差別化可能なシミュレーションフレームワークを提供する。
アンロールトレーニングのための新しい分類法を提案し,PDEダイナミクスのためのユニークな識別子を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:51:36 GMT)
CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale [22.0] コントラスト学習を用いて画像、バーコードDNA、および統合埋め込み空間における分類ラベルのテキストベース表現を整列する。
本手法は、ゼロショット学習タスクにおいて、従来の単一モダリティアプローチを8%以上精度で上回る。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:07:53 GMT)
Why Gradient Subspace? Identifying and Mitigating LoRA's Bottlenecks in Federated Fine-Tuning of Large Language Models [22.0] 本稿ではLow-Rank Adaptation (LoRA)を用いたFLフレームワークの収束と性能保証を批判的に分析する。
直接重み付けはLoRAベースの戦略よりも優れており、微調整モデルでは優れた性能が得られることを示す。
以上の結果から,GaLoreはFlexLoRAやFFA-LoRAといったフェデレートされたLoRA手法よりも,テキストや画像のモダリティにおいて優れた代替手段であることが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:16:46 GMT)
Enhancing Chess Reinforcement Learning with Graph Representation [21.9] グラフニューラルネットワーク(GNN)に基づくより一般的なアーキテクチャを導入する。
この新しいアーキテクチャは、同じ数のパラメータで以前のアーキテクチャより優れていることを示す。
また、より小さな5倍のチェスでトレーニングすると、通常の8倍のチェスでプレイできるように素早く微調整できることも示しています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:18:47 GMT)
Measuring Sound Symbolism in Audio-visual Models [21.9] 本研究では,事前学習した音声視覚モデルが,音と視覚表現の関連性を示すかどうかを検討する。
この結果から,人間の言語処理との関連が明らかとなり,認知アーキテクチャや機械学習戦略の洞察が得られた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:49:59 GMT)
Measuring Sound Symbolism in Audio-visual Models [21.9] 本研究では,事前学習した音声視覚モデルが,音と視覚表現の関連性を示すかどうかを検討する。
この結果から,人間の言語処理との関連が明らかとなり,認知アーキテクチャや機械学習戦略の洞察が得られた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:49:59 GMT)
Dessie: Disentanglement for Articulated 3D Horse Shape and Pose Estimation from Images [21.7] 合成データ生成とゆがみを利用して3次元形状とポーズを復元する最初の手法を提案する。
我々の方法であるDessieは、既存の3D馬の復元方法を超え、シマウマ、ウシ、シカといった他の大型動物に一般化する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:41:19 GMT)
Dessie: Disentanglement for Articulated 3D Horse Shape and Pose Estimation from Images [21.7] 合成データ生成とゆがみを利用して3次元形状とポーズを復元する最初の手法を提案する。
我々の方法であるDessieは、既存の3D馬の復元方法を超え、シマウマ、ウシ、シカといった他の大型動物に一般化する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:41:19 GMT)
Approximate attention with MLP: a pruning strategy for attention-based model in multivariate time series forecasting [21.7] この研究は、自己注意ネットワークを理解するための新しい方法を提案する。
注意機構全体が劣化する空間ネットワークに還元可能であることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:23:34 GMT)
Narrative Feature or Structured Feature? A Study of Large Language Models to Identify Cancer Patients at Risk of Heart Failure [21.7] 本研究は, 心不全リスクのあるがん患者を同定するための機械学習モデルについて検討した。
肺がん,乳がん,大腸癌と診断され,フロリダ大学から12,806人のがんコホートを同定した。
提案した物語は,特徴密度が著しく増加し,性能が向上した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:34:10 GMT)
MS-Glance: Non-semantic context vectors and the applications in supervising image reconstruction [21.6] 非意味的文脈情報は視覚認識に不可欠である。
生物学的に通知される非意味的文脈記述子 textbfMS-Glance と Glance Index Measure を提案する。
MS-Glanceは、自然画像と医療画像の両方において、既存の画像復元損失よりも優れています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:42:25 GMT)
Tracing Hyperparameter Dependencies for Model Parsing via Learnable Graph Pooling Network [21.5] 本稿では,LGPN(Learningable Graph Pooling Network)と呼ばれる新しいモデル解析手法を提案する。
LGPNには、モデル解析に適した学習可能なプールアンプール機構が組み込まれている。
提案手法をCNN生成画像検出と協調攻撃検出に拡張する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:23:09 GMT)
Adversarial Attacks of Vision Tasks in the Past 10 Years: A Survey [21.4] 敵対的攻撃は、機械学習推論中に重大なセキュリティ脅威を引き起こす。
既存のレビューは、しばしば攻撃分類に焦点を合わせ、包括的で詳細な分析を欠いている。
本稿は、従来のLVLM攻撃とLVLM攻撃の包括的概要を提供することによって、これらのギャップに対処する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:22:51 GMT)
Classification Diffusion Models: Revitalizing Density Ratio Estimation [21.3] $textitclassificationfusion model$ (CDMs) は、DREベースの生成法であり、拡散モデルをデノナイズする形式を取り入れている。
提案手法は,MNISTデータセットを超える画像を生成するDREベースの最初の手法である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:57:39 GMT)
MESS+: Energy-Optimal Inferencing in Language Model Zoos with Service Level Guarantees [21.2] モデル動物園からのエネルギー最適モデル選択のためのオンライン最適化アルゴリズムであるMESS+を提案する。
精度の高いSLAでは、動物園からLSMをランダムに選択するよりも、MESS+の方が2.5倍エネルギー効率が高い。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:06:13 GMT)
Synthetic Programming Elicitation for Text-to-Code in Very Low-Resource Programming and Formal Languages [21.2] SPEAC(emphsynthetic programming elicitation and compilation)を紹介する。
SPEACは、より頻繁に、意味的正しさを犠牲にすることなく、構文的に正しいプログラムを生成する。
UCLID5形式検証言語のケーススタディにおいて,SPEACの性能を実証的に評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:54:30 GMT)
EZ-HOI: VLM Adaptation via Guided Prompt Learning for Zero-Shot HOI Detection [21.1] 本稿では,効率的なゼロショットHOI検出(EZ-HOI)のための新しい学習フレームワークを提案する。
まず、学習可能なプロンプトに対してLarge Language Model(LLM)とVLMガイダンスを導入し、詳細なHOI記述と視覚的セマンティクスを統合して、VLMをHOIタスクに適用する。
我々は,既存の手法と比較して,トレーニング可能なパラメータの10.35%から33.95%しか持たない,さまざまなゼロショット設定における最先端性能を実現していることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:06:29 GMT)
Technical Report for SoccerNet Challenge 2022 -- Replay Grounding Task [20.8] 我々はリプレイグラウンド問題をビデオアクション位置問題に変換する。
我々は,時間的動作検出のために提案した統合ネットワークFaster-TADを適用し,リプレイグラウンドの結果を得る。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:58:42 GMT)
Reverse Attitude Statistics Based Star Map Identification Method [20.8] 提案手法は, シミュレーション, フィールドテスト, 軌道上実験で検証された。
識別率は14.3%以上改善され、解法時間は28.5%以上短縮される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:25:02 GMT)
Generative AI for Accessible and Inclusive Extended Reality [20.7] 我々は、AIGCの潜在的なメリットと、包括的でアクセス可能な仮想環境を作成する上での課題についても論じる。
具体的には,3Dモデリングの専門知識の不足,シンボルのみのメリット,マルチモーダル入力,3Dコンテンツ編集,3Dモデルアクセシビリティ,基礎モデル固有の課題について触れる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:43:43 GMT)
Enhancing Diversity in Bayesian Deep Learning via Hyperspherical Energy Minimization of CKA [20.5] 機能カーネル上のCKA(Centered Kernel Alignment)は、ディープネットワークを比較するために提案されているが、ベイズディープラーニングの最適化目的には使われていない。
我々は,CKAカーネル上に超球面エネルギー(HE)のアプローチを適用し,この欠点に対処し,トレーニング安定性を向上させることを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:33:23 GMT)
Label Noise: Ignorance Is Bliss [20.3] マルチクラス、インスタンス依存ラベルノイズ下で学習するための新しい理論的枠組みを確立する。
本研究は,ラベルノイズを無視しながら経験的リスクを最小限に抑える,単純なEmphnoise Ignorant Empirical Risk Minimization(NI-ERM)の原則を支持する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:03:25 GMT)
Bayesian-guided Label Mapping for Visual Reprogramming [20.3] 1対1のマッピングは、事前訓練されたラベルと下流のラベルの間の複雑な関係を見落としてしまう可能性がある。
この観測により,ベイズ誘導ラベルマッピング法(BLM)を提案する。
事前訓練されたビジョンモデル(ResNeXtなど)とビジョン言語モデル(CLIPなど)の両方で実施された実験は、既存のラベルマッピング手法よりもBLMの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:20:43 GMT)
Technical Report for ActivityNet Challenge 2022 -- Temporal Action Localization [20.3] 本稿では,各アクションの時間的境界を特定し,未トリミングビデオにおけるアクションクラスを予測することを提案する。
Faster-TADは、TADのパイプラインを単純化し、素晴らしいパフォーマンスを得る。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:16:56 GMT)
Long$^2$RAG: Evaluating Long-Context & Long-Form Retrieval-Augmented Generation with Key Point Recall [20.0] 本稿では、Long$2$RAGベンチマークとKey Point Recallメトリックを紹介する。
Long$2$RAGは10のドメインにまたがる280の質問と8の質問カテゴリからなる。
KPRは、LLMが検索した文書から抽出したキーポイントを生成された応答に組み込む程度を評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:04:28 GMT)
COST CA20120 INTERACT Framework of Artificial Intelligence Based Channel Modeling [19.9] チャネルモデリングにおける人工知能(AI)の実現可能性と実装について検討する。
まず,複雑な無線チャネルを特徴付けるための,AIに基づくチャネルモデリングの枠組みを提案する。
そして、いくつかの大きな課題を詳述し、可能な解決策を提示します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:16:05 GMT)
DiffTORI: Differentiable Trajectory Optimization for Deep Reinforcement and Imitation Learning [19.8] 本稿では、微分軌道最適化をポリシー表現として活用し、深層強化と模倣学習のためのアクションを生成するDiffTORIを提案する。
15のモデルベースRLタスクと35の模倣学習タスクに高次元画像と点クラウド入力があり、DiffTORIはどちらのドメインでも最先端の手法よりも優れている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:53:19 GMT)
TPC: Test-time Procrustes Calibration for Diffusion-based Human Image Animation [19.8] 人間の画像アニメーションは、参照された人間の画像と対象のモーションビデオの入力から人間のモーションビデオを生成することを目的としている。
現在の拡散に基づく画像アニメーションシステムは、人間のアイデンティティを目標運動に転送する精度が高いが、出力に不規則な品質を示す。
提案手法は単純で,任意の拡散型画像アニメーションシステムにモデルに依存しない方法で適用することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:34:49 GMT)
Probing Language Models on Their Knowledge Source [19.8] 大規模言語モデル(LLM)は、しばしば、学習、内部(パラメトリック知識、PK)と推論中に提供される外部知識(コンテキスト知識、CK)の衝突に遭遇する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:20:32 GMT)
Online Convex Optimization with Memory and Limited Predictions [19.7] メモリと予測によるオンライン凸最適化の問題点を水平線上で検討する。
本稿では,この問題を解くアルゴリズムを提案し,予測ウィンドウ長とともにアルゴリズムの動的後悔が指数関数的に減衰することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:33:47 GMT)
Creativity in the Age of AI: Evaluating the Impact of Generative AI on Design Outputs and Designers' Creative Thinking [19.7] 我々は、GenAIサポートの有無にかかわらず、参加者に広告のデザインを依頼した。
専門家評価者は、GenAIが支援するデザインをより創造的で非伝統的な「ウェアード」と評価した
ネイティブイングリッシュスピーカーはAIを使用するとリラックスを減らしたが、GenAIに慣れたデザイナは散発的思考の進歩を見せた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:23:34 GMT)
DiffLight: A Partial Rewards Conditioned Diffusion Model for Traffic Signal Control with Missing Data [19.7] 本稿では,データ伝送シナリオ下での交通信号制御(TSC)のための条件拡散モデルDiffLightを紹介する。
具体的には、部分的リワード条件付き拡散(PRCD)モデルを利用して、トラフィックデータ計算と意思決定という2つの重要なサブタスクを統合する。
さらに,通信性能の向上と制御性能向上を目的とした拡散通信機構(DCM)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:39:20 GMT)
IdeaBench: Benchmarking Large Language Models for Research Idea Generation [19.7] 大規模言語モデル(LLM)は、人々が人工知能(AI)システムと対話する方法を変革した。
包括的データセットと評価フレームワークを含むベンチマークシステムであるIdeanBenchを提案する。
私たちのデータセットは、さまざまな影響力のある論文のタイトルと要約と、参照された作品で構成されています。
まず、GPT-4oを用いて、新規性や実現可能性などのユーザ固有の品質指標に基づいて、アイデアをランク付けし、スケーラブルなパーソナライズを可能にする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:04:59 GMT)
User-Creator Feature Polarization in Recommender Systems with Dual Influence [19.5] 推薦システムは、関連コンテンツをユーザに提示し、コンテンツクリエーターがターゲットのオーディエンスに到達するのを助けるという2つの目的を提供します。
我々は,レコメンデータシステムの二重影響を捉えるために,ユーザ・クリエータ機能ダイナミクスと呼ばれるモデルを定義した。
我々は,理論上も実証上も,レコメンダシステムにおける偏光緩和と多様性向上のためのアプローチについて検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:26:01 GMT)
Phrase Decoupling Cross-Modal Hierarchical Matching and Progressive Position Correction for Visual Grounding [19.4] 本稿では,Phrase Decoupling Cross-Modal Hierarchical Matching and Progressive Position Correction Visual Grounding法を提案する。
提案手法は実験によって異なるデータセット上で検証され,その性能比較によりその優位性を検証した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:25:47 GMT)
Airway Labeling Meets Clinical Applications: Reflecting Topology Consistency and Outliers via Learnable Attentions [19.3] 気道解剖学的ラベリングは、気管支鏡で複雑な気管支構造を識別し、ナビゲートするために、臨床医にとって不可欠である。
従来の手法は一貫性のない予測を生成する傾向にある。
本稿では, トポロジカルな整合性を高め, 異常な気道分岐の検出を改善する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:04:30 GMT)
One Sample Fits All: Approximating All Probabilistic Values Simultaneously and Efficiently [19.3] 機能属性やデータバリュエーションといったアプリケーションでは、確率的価値が近年注目を集めている。
サンプリングベクトルによってパラメータ化され,中間項を近似する1サンプル全フレームワークを提案する。
本研究では,ベータシャプリー値の収束率を1対1で評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:47:46 GMT)
Across-Platform Detection of Malicious Cryptocurrency Transactions via Account Interaction Learning [19.2] 既存の悪意のあるトランザクション検出方法は、大量のラベル付きデータに依存する。
そこで我々はシャドウイーズ(ShadowEyes)を提案する。
公開データセットを用いて大規模な実験を行い,ShadowEyesの性能評価を行った。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:01:42 GMT)
CleaR: Towards Robust and Generalized Parameter-Efficient Fine-Tuning for Noisy Label Learning [19.2] 雑音ラベル下での各種PEFT法について検討する。
PEFTは,本態性に限界があるため,ノイズラベルの記憶が困難であることが判明した。
PEFTモジュールを適応的に活性化する新しいルーティングベースのPEFTアプローチであるCleaRを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:11:58 GMT)
Can Language Models Perform Robust Reasoning in Chain-of-thought Prompting with Noisy Rationales? [19.1] 本稿では,大規模言語モデル (LLM) における未探索課題について考察する。
雑音有理数の存在下での推論の堅牢性を評価するために,我々はNoRaデータセットを構築した。
ノイズチェーン・オブ・シント(CD-CoT)を用いたコントラッシブデノケーション法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:07:44 GMT)
MTLSO: A Multi-Task Learning Approach for Logic Synthesis Optimization [19.1] MTLSOは論理合成最適化のためのマルチタスク学習手法である。
一次回帰タスクと並行して,二元多ラベルグラフ分類の補助タスクを導入する。
また、階層的なグラフ表現学習戦略を用いて、表現力のあるグラフレベルの表現を学習するためのモデルの能力を向上させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:52:26 GMT)
Unveiling the Potential of Robustness in Selecting Conditional Average Treatment Effect Estimators [19.1] 本稿では,CATE推定器選択のための分布ロバスト計量(DRM)を提案する。
DRMはニュアンスフリーであり、ニュアンスパラメータのモデルに適合する必要がなくなる。
分散的に堅牢なCATE推定器の選択を効果的に優先順位付けする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:08:36 GMT)
Expectation Alignment: Handling Reward Misspecification in the Presence of Expectation Mismatch [19.0] 我々は、人間のAIエージェントに対する信念である心の理論を基礎として、公式な説明的枠組みを開発する。
ユーザからの期待を推測するために,特定報酬を用いた対話型アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:34:00 GMT)
ImOV3D: Learning Open-Vocabulary Point Clouds 3D Object Detection from Only 2D Images [19.0] Open-vocabulary 3D object Detection (OV-3Det) は、トレーニングフェーズ中にラベル付けされたベースカテゴリの限られた数を超えて一般化することを目的としている。
最大のボトルネックは、注釈付き3Dデータの不足であるのに対して、2D画像データセットは豊富で豊富な注釈付きである。
画像と点雲(PC)の両方を含む擬似マルチモーダル表現を利用してモダリティギャップを埋める新しいフレームワークImOV3Dを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:02:05 GMT)
The ISCSLP 2024 Conversational Voice Clone (CoVoC) Challenge: Tasks, Results and Findings [19.0] ISCSLP 2024 Conversational Voice Clone (CoVoC) Challengeは、ゼロショット発声音声クローンのベンチマークと進歩を目的としている。
本稿では,データ,トラック,提案システム,評価結果,結果について述べる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:39:49 GMT)
Context-Aware Token Selection and Packing for Enhanced Vision Transformer [18.6] 従来の自己保持機構は、非効率性と不正確さに悩まされている。
我々はSelect and Pack Attention (SPA)という新しいアルゴリズムを提案する。
SPAは、選択ラベルによって管理される低コストのゲーティング層を使用して情報トークンを動的に選択し、これらのトークンを新しいバッチにまとめる。
実験の結果、SPAはオブジェクト検出の0.6mAP改善や計算コストの16.4%削減など、優れたパフォーマンスと効率を提供することが示された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:47:27 GMT)
In-Context Fine-Tuning for Time-Series Foundation Models [18.3] 特に、複数の時系列例でトリガーできる事前訓練された基礎モデルを設計する。
我々の基礎モデルは、コンテキストウィンドウ内の複数の関連する時系列の例を利用するように特別に訓練されている。
本研究では,テキスト内サンプルを推論時に使用する基盤モデルにより,一般的な予測ベンチマークにおいて,より優れた性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:20:04 GMT)
Subject-driven Text-to-Image Generation via Preference-based Reinforcement Learning [18.2] 我々は、信頼できる報酬信号を提供する$lambda$-Harmonic reward関数を提示する。
提案アルゴリズムは,最新のCLIP-Iスコア0.833,CLIP-Tスコア0.314をDreamBench上で達成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:03:47 GMT)
3D-ViTac: Learning Fine-Grained Manipulation with Visuo-Tactile Sensing [18.2] 本稿では,ロボットのためのマルチモーダルセンシング学習システムであるtextbf3D-ViTacを紹介する。
このシステムは、高密度センシングユニットを備えた触覚センサーを備えており、それぞれが3$mm2$の面積をカバーしている。
低コストのロボットでも精密な操作が可能であり、視覚のみのポリシーよりもはるかに優れていることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:22:53 GMT)
MambaLRP: Explaining Selective State Space Sequence Models [18.1] 選択状態空間列モデル(マンバモデルと呼ばれる)を用いた最近のシーケンスモデリング手法は、関心が高まりつつある。
これらのモデルは、線形時間における長いシーケンスの効率的な処理を可能にし、言語モデリングのような広範囲のアプリケーションで急速に採用されている。
現実のシナリオにおける信頼性の高い利用を促進するためには、透明性を高めることが重要です。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:01:20 GMT)
DIP: Diffusion Learning of Inconsistency Pattern for General DeepFake Detection [18.1] ディフュージョン不整合学習(DIP)のためのトランスフォーマーベースフレームワークを提案する。
提案手法は,偽の手がかりを効果的に同定し,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:26:00 GMT)
Reasons and Solutions for the Decline in Model Performance after Editing [17.8] 本稿では,編集モデルの性能低下の原因を考察し,編集方法を最適化する。
編集モデルの性能は、主に編集対象とシーケンス長の多様性に左右される。
本稿では,編集モデルの性能向上のために,Dump for Sequence (D4S) 法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:49:44 GMT)
Video Token Merging for Long-form Video Understanding [17.6] 学習可能なビデオトークンのマージアルゴリズムを提案し,その正当性に基づいて動的にトークンをマージする。
提案手法は,メモリコストを84%削減し,スループットをベースラインアルゴリズムに比べて約6.89倍向上させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:55:32 GMT)
Language-guided Hierarchical Fine-grained Image Forgery Detection and Localization [17.5] CNN合成領域と画像編集領域で生成された画像の偽属性の差が大きい。
IFDL表現学習のための階層的きめ細かい定式化を提案する。
その結果、アルゴリズムは包括的特徴と異なるフォージェリー属性の固有の階層性の両方を学ぶことを奨励される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:53:21 GMT)
Embracing Events and Frames with Hierarchical Feature Refinement Network for Object Detection [17.4] イベントカメラはスパースと非同期のイベントを出力し、これらの問題を解決する潜在的な解決策を提供する。
イベントフレーム融合のための新しい階層的特徴改善ネットワークを提案する。
本手法は, フレーム画像に15種類の汚損タイプを導入する際に, 極めて優れたロバスト性を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:37:42 GMT)
Robust Gaussian Processes via Relevance Pursuit [17.4] 本稿では,データポイント固有ノイズレベルを推定することにより,スパースアウトレーヤに対するロバスト性を実現するGPモデルを提案する。
我々は,データポイント固有ノイズ分散において,関連する対数限界確率が強く抑制されるようなパラメータ化が可能であることを,驚くべきことに示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:56 GMT)
Beyond Content Relevance: Evaluating Instruction Following in Retrieval Models [17.2] 本研究では,コンテンツ関連性を超えた各種検索モデルの指示追従能力について検討した。
6つの文書レベル属性にまたがる新しい検索評価ベンチマークを開発した。
以上の結果から,再ランク付けモデルが後続命令の検索モデルを上回っているのに対して,特定の属性を扱う上では依然として課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:47:21 GMT)
DTN: Deep Multiple Task-specific Feature Interactions Network for Multi-Task Recommendation [17.1] 本稿では,新しいモデル構造を持つDeep Multiple Task-specific Feature Interactions Network (DTN)を提案する。
DTNは、MTLネットワークにおいて複数のタスク固有特徴相互作用法とタスク依存ネットワークを導入し、タスク固有特徴相互作用表現を学習できるようにする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:09:38 GMT)
Enhancing Brain Source Reconstruction through Physics-Informed 3D Neural Networks [17.0] 脳波ソースローカライゼーションのための新しいハイブリッド手法3D-PIUNetを提案する。
我々のモデルは空間的精度を大幅に向上させ,従来のデータ駆動方式とエンドツーエンド方式の両方よりも優れた性能を示す。
3D-PIUNetによる視覚野の同定に成功し,脳波データを用いて検討を行った。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:43:38 GMT)
EraW-Net: Enhance-Refine-Align W-Net for Scene-Associated Driver Attention Estimation [17.0] 2つの視野にわたる運転シーンにドライバーの注意を関連付けることは、クロスドメインな認識の問題である。
従来の手法は、通常、単一の視点に焦点を当てたり、推定された視線を通してシーンに注意を向ける。
エンド・ツー・エンドのシーン関連運転注意度推定手法であるEraWNetを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:20:26 GMT)
Breaking the Hourglass Phenomenon of Residual Quantization: Enhancing the Upper Bound of Generative Retrieval [17.0] ジェネレーティブ検索(GR)は、検索とレコメンデーションシステムにおいて、トランスフォーメーションパラダイムとして登場した。
ホログラス」現象は生成検索におけるRQ-SIDの性能に大きな影響を及ぼす。
本稿では,この問題を軽減し,現実のEコマースアプリケーションにおける生成検索の有効性を高めるための効果的なソリューションを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:45:00 GMT)
AdaFlow: Opportunistic Inference on Asynchronous Mobile Data with Generalized Affinity Control [16.9] AdaFlowは、階層解析に基づく正規化行列を用いて、モバイルコンテキストにおける構造化されたモダリティ親和性の定式化を開拓した。
AdaFlowは推論遅延を最大79.9%削減し、精度を61.9%向上させ、ステータスクオアプローチを上回っている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:28:22 GMT)
Reducing Oversmoothing through Informed Weight Initialization in Graph Neural Networks [16.7] 本稿では,ノードやグラフの分類タスクにおいて,過度なスムース化を抑える新しいスキーム(G-Init)を提案する。
以上の結果から,新しい手法(G-Init)は深部GNNの過剰なスムース化を低減し,その有効利用を促進することが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:21:20 GMT)
Schema Augmentation for Zero-Shot Domain Adaptation in Dialogue State Tracking [16.7] ゼロショットドメイン適応のための現在の大規模言語モデルアプローチは、ターゲットドメインに関連する知識の導入を促すことに依存している。
本研究では,言語モデルのゼロショット領域適応を微調整により改善する新しいデータ拡張手法であるAugmentationを考案する。
MultiWOZ と SpokenWOZ の実験により,提案手法はベースラインよりも大幅に改善された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:57:59 GMT)
Persistent Homology for High-dimensional Data Based on Spectral Methods [16.6] 持続的ホモロジーはノイズに非常に敏感になり、正確なトポロジを検出できないことを示す。
拡散距離や有効抵抗など,データのk-アネレス近傍グラフ上のスペクトル距離は,高次元ノイズがあっても正確な位相を検出することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:01:08 GMT)
LLaMo: Large Language Model-based Molecular Graph Assistant [16.5] 大規模言語モデルに基づく分子グラフアシスタントLLaMoを提案する。
本稿では,グラフ表現をグラフトークンに変換するマルチレベルグラフプロジェクタを提案する。
また,大規模分子グラフ言語モデルを用いて,機械が生成する分子グラフ命令データも導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:56:05 GMT)
I Can Hear You: Selective Robust Training for Deepfake Audio Detection [16.5] 私たちはこれまでに1300万のサンプルからなる、DeepFakeVox-HQという、最大規模の公開音声データセットを確立しました。
これまで報告された高い精度にもかかわらず、既存のディープフェイク音声検出装置は、さまざまな収集されたデータセットに苦戦している。
高周波成分に着目したF-SAT:周波数選択適応学習法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:21:36 GMT)
Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Use [16.4] 具体的エージェントは、人間の言語を活用して、学習タスクの明示的または暗黙的な知識を得る能力を持つことが望ましい。
タスク学習を容易にするために、リッチ言語をどのように組み込むかは明確ではない。
本稿では,強化学習における言語入力の種類について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:52 GMT)
Policy Gradient for Robust Markov Decision Processes [16.3] 本稿では、ロバストなマルコフ決定過程(MDP)を解くために、新しいポリシー勾配法であるダブルループロバストポリシーミラーDescent(MD)を提案する。
MDは、イテレーション毎の適応耐性を持つポリシー最適化に一般的なミラー降下更新ルールを採用し、グローバルな最適ポリシーへの収束を保証する。
我々は,直接パラメータ化とソフトマックスパラメータ化の両方の下での新しい収束結果を含むMDの包括的解析を行い,トランジションミラー・アセンション(TMA)による内部問題の解に対する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:34:35 GMT)
Transformer-based Model Predictive Control: Trajectory Optimization via Sequence Modeling [16.1] 本稿では,最適化に基づく学習手法の主な強みを組み合わせた統合フレームワークを提案する。
我々のアプローチでは、最適化プロセス内に高容量、トランスフォーマーベースのニューラルネットワークモデルを組み込む必要がある。
純粋に最適化に基づくアプローチと比較すると,提案手法では最大75%の性能向上が期待できる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:23:10 GMT)
Data-Efficient Learning with Neural Programs [16.1] 我々は,ブラックボックスコンポーネントの入力出力サンプルのみに依存する,ISEDと呼ばれるニューラルプログラムの学習アルゴリズムを提案する。
評価の結果,ISEDは最先端のニューロシンボリック・フレームワークに匹敵する性能を示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:24:45 GMT)
Thought Space Explorer: Navigating and Expanding Thought Space for Large Language Model Reasoning [15.9] 我々はThought Space Explorer(TSE)を設計し、思考構造を拡張し、最適化し、大きな言語モデル(LLM)を誘導し、思考の盲点を探索する。
TSEは、様々な設計戦略により、元の思考構造に基づいて、新たな推論ステップと分岐を生成することにより、思考空間を広げ、LSM推論における盲点の影響を軽減する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:12:14 GMT)
Improving Generalization and Convergence by Enhancing Implicit Regularization [15.8] Inlicit Regularization Enhancement (IRE)フレームワークは、ディープラーニングにおけるフラットソリューションの発見を加速する。
IREは、平坦な方向と鋭い方向のダイナミクスを分離し、平坦な方向に沿って鋭さを減少させる。
計算オーバーロードを伴わずに,IREをエムジェネリックベースに事実上組み込むことができることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:28:58 GMT)
MambaEviScrib: Mamba and Evidence-Guided Consistency Enhance CNN Robustness for Scribble-Based Weakly Supervised Ultrasound Image Segmentation [15.8] スパースアノテーションに基づく弱教師付き学習(WSL)は、性能向上を実現している。
本研究は,超音波画像分割作業におけるスクリブルベースWSLの導入を試みる。
本稿では,意思決定境界付近の予測を効果的に活用することを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:00:26 GMT)
Self-Labeling the Job Shop Scheduling Problem [15.7] 生成モデルは複数の解をサンプリングし、問題の目的に応じて最良の解を擬似ラベルとして使用することにより訓練可能であることを示す。
旅行セールスマン問題に適用することで,様々なパラメータに対するSLIMのロバスト性とその一般性を証明する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:33:24 GMT)
Driving by the Rules: A Benchmark for Integrating Traffic Sign Regulations into Vectorized HD Map [15.6] 交通標識から運転規則を抽出するための新しいデータセットであるMapDRを紹介する。
MapDRには1万本以上の注釈付きビデオクリップがあり、交通標識規則と車線との複雑な相関関係を捉えている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:53:21 GMT)
Desert Camels and Oil Sheikhs: Arab-Centric Red Teaming of Frontier LLMs [15.4] 大規模言語モデル(LLM)は広く使われているが、社会的バイアスが組み込まれているため倫理的懸念が高まる。
本研究では、女性の権利、テロリズム、反ユダヤ主義を含む8つの領域にわたるアラブ人と西洋人に対するLCMバイアスについて検討する。
GPT-4, GPT-4o, LlaMA 3.1 (8Bおよび405B), Mistral 7B, Claude 3.5 Sonnetの6つのLCMを評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:45:23 GMT)
ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNs [15.4] 混合精度量子化は、限られたリソースコンピューティングプラットフォーム上でディープニューラルネットワーク(DNN)の実行を可能にする重要な技術となっている。
本稿では、スムーズな分類器のクリーンな精度を保ちつつ、その信頼性を保ちながら、新しい混合精度量子化手法であるARQを紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:37 GMT)
Separation-based distance measures for causal graphs [15.4] 最先端因果探索法は単一の因果グラフを出力するのではなく、それらの等価クラス(MEC)を出力する。
本稿では,分離距離の差が評価に適さないような距離の付加的な測定法を提案する。
我々は,既存の比較指標の違いを明らかにする実験と,おもちゃの例を用いて理論的解析を補完する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:55:51 GMT)
SelfCodeAlign: Self-Alignment for Code Generation [15.2] SelfCodeAlignは、自己整合型コード言語モデル(LLM)のための、初めて完全に透明で許容可能なパイプラインである
まず、高品質なシードスニペットから多様なコーディング概念を抽出し、新しいタスクを生成する。
次に、タスク毎に複数のレスポンスをサンプリングし、それぞれがテストケースとペアリングし、サンドボックス環境で検証する。
このデータセットの微調整は、HumanEval+で67.1パス@1を達成するモデルにつながります。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:55:13 GMT)
Med-Real2Sim: Non-Invasive Medical Digital Twins using Physics-Informed Self-Supervised Learning [15.1] デジタルツイン(Digital twin)は、数学的モデリングを用いてその定義する特徴を特徴づけ、シミュレートする現実世界の物理現象の仮想レプリカである。
非侵襲的な患者健康データのみを用いてデジタル双対モデルパラメータを同定する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:56:09 GMT)
Love in Action: Gamifying Public Video Cameras for Fostering Social Relationships in Real World [15.0] 公共空間に設置したビデオカメラを利用したボディーランゲージベースのソーシャルゲーム「Love in Action」(LIA)を作成する。
27人の参加者による2週間のフィールドスタディは、彼らの社会的友情を著しく改善したことを示している。
公共空間におけるソーシャル化のための新しいコミュニケーション媒体として,パブリックビデオカメラの可能性を明らかにするために,ユーザ体験を調査した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:38:40 GMT)
Federated Learning under Periodic Client Participation and Heterogeneous Data: A New Communication-Efficient Algorithm and Analysis [15.0] 連合学習では、クライアントが常にトレーニングに参加することができると仮定することが一般的であり、実際にはユーザデバイスでは実現不可能である。
最近のフェデレーション学習は、より現実的な参加パターンの下で、サイクリッククライアントの可用性や任意の参加として分析されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:52:35 GMT)
Convergence for Natural Policy Gradient on Infinite-State Queueing MDPs [14.1] 様々な待ち行列系は自然に無限状態マルコフ決定過程(MDP)としてモデル化できる
強化学習(RL)の文脈では、これらのMDPを学習し、最適化するために様々なアルゴリズムが開発されている。
ナチュラル・アクター・クリティカル、TRPO、PPOなど、多くの一般的なポリシーに基づく学習アルゴリズムの中心に、Natural Policy Gradient(NPG)ポリシー最適化アルゴリズムがある。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:14:00 GMT)
Should ChatGPT Write Your Breakup Text? Exploring the Role of AI in Relationship Dissolution [13.9] 分裂プロセスは、コンピュータによるコミュニケーションのような技術によってますます促進される。
以上の結果から, 様々な段階において, 異なるニーズを抱いていることが明らかとなった。
参加者は、GenAIが自己反省を促し、中立的な第二の意見を提供し、分裂に至る計画を支援することができると想定している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:59:30 GMT)
SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation [13.8] 我々は,複数のレベルでLiDARとカメラデータの融合を利用したSuperFusionという新しいネットワークを提案する。
我々は、nuScenesデータセットと自己記録データセットでSuperFusionをベンチマークし、最先端のベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:01:41 GMT)
Identifying Spatio-Temporal Drivers of Extreme Events [13.6] 本稿では,物理入力におけるエクストリームとドライバを共同で予測する手法を提案する。
ネットワークは、特定されたドライバの変数時間的バイナリマスクから極端を予測することで、極端と相関するドライバをうまく識別する。
我々は、リモートセンシングまたはリアナリシスデータに基づく3つの新しいベンチマークと、2つの実世界のリアナリシスデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:13:55 GMT)
Models Can and Should Embrace the Communicative Nature of Human-Generated Math [13.5] モデルが学習される数学データは、理想化された数学的実体だけでなく、豊かなコミュニケーション意図を反映していると論じる。
我々は、人間生成数学において潜在するコミュニケーション意図から学習し、表現するAIシステムを提唱する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:21:13 GMT)
Perceiving Longer Sequences With Bi-Directional Cross-Attention Transformers [13.5] BiXTは、計算コストとメモリ消費の観点から、入力サイズと線形にスケールする。
BiXTはPerceiverアーキテクチャにインスパイアされているが、反復的な注意を効率よく双方向のクロスアテンションモジュールに置き換える。
効率性とフルトランスフォーマーアーキテクチャの汎用性と性能を組み合わせることで、BiXTはより長いシーケンスを処理できる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:38:27 GMT)
Better by Default: Strong Pre-Tuned MLPs and Boosted Trees on Tabular Data [13.4] 本稿では,改良された多層パーセプトロンであるRealMLPと,GBDTとRealMLPのメタチューニングデフォルトパラメータについて紹介する。
ベンチマークの結果,RealMLPは他の神経ベースラインと比較して,良好な時間精度のトレードオフを提供することが示された。
RealMLPの改善点は、デフォルトパラメータでTabRのパフォーマンスを大幅に向上させることもできる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:02:36 GMT)
OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators [13.4] オフライン政策評価(OPE)により、新たなシーケンシャルな意思決定方針のパフォーマンスを評価し、見積もることができる。
統計的手法を用いた明示的な選択に頼ることなく,データセットに与えられたOPE推定器の集合を適応的にブレンドするアルゴリズムを提案する。
我々の研究は、オフラインRLのための汎用的、推定対象に依存しない、非政治評価フレームワークの使いやすさの向上に寄与する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:40:16 GMT)
Prompt Tuning Strikes Back: Customizing Foundation Models with Low-Rank Prompt Adaptation [13.3] Low-Rank Prompt Adaptation (LoPA) は、最先端のPEFTメソッドやフル微調整と同等に動作するプロンプトチューニングベースのアプローチである。
LoPAは、インスタンス間でタスク固有の情報を共有し、各インスタンスをカスタマイズすることで、ソフトプロンプトを生成する。
パラメータ効率を達成するために、各インスタンスにエンコードされたソフトプロンプトコンポーネントの低ランク分解を使用する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:29:59 GMT)
Annealed Multiple Choice Learning: Overcoming limitations of Winner-takes-all with annealing [13.3] シミュレーションアニーリングとMCLを組み合わせたAnnealed Multiple Choice Learning(aMCL)を提案する。
MCLは、不明瞭なタスクを扱う学習フレームワークであり、仮説の小さなセットを予測している。
提案アルゴリズムは, 合成データセット, 標準UCIベンチマーク, 音声分離に関する広範な実験によって検証される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:59:49 GMT)
Metric Space Magnitude for Evaluating the Diversity of Latent Representations [13.3] 我々は,潜伏表現の内在的多様性の等級に基づく尺度群を開発する。
我々の測度はデータの摂動下で確実に安定しており、効率的に計算でき、厳密なマルチスケールのキャラクタリゼーションと潜在表現の比較を可能にする。
i) 多様性の自動推定, (ii) モード崩壊の検出, (iii) テキスト, 画像, グラフデータの生成モデルの評価など, さまざまな領域やタスクにおけるそれらの実用性と優れた性能を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:36:40 GMT)
Identify Then Recommend: Towards Unsupervised Group Recommendation [13.2] Group Recommendation (GR)は、ユーザグループにアイテムを推奨することを目的としている。
underlineIdentify underlineThen underlineRecommend(underlineITR)という,教師なしグループレコメンデーションフレームワークを提案する。
我々は産業レコメンデータにITRを配置し、有望な結果を達成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:24:22 GMT)
Technical Report for Soccernet 2023 -- Dense Video Captioning [13.2] サッカーの各アクションのビデオキャプションを生成し、キャプションのタイムスタンプを特定することを提案する。
まず,ビデオキャプションの枠組みとしてBlipを適用し,動画キャプションを生成する。
次に,(1)マルチサイズスライディングウインドウを用いた時間スタンプの探索,(2)時間的提案生成と(3)提案分類を行う。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:06:30 GMT)
ADAPT: A Game-Theoretic and Neuro-Symbolic Framework for Automated Distributed Adaptive Penetration Testing [13.1] AIを医療などの現代的なクリティカルインフラストラクチャシステムに統合することで、新たな脆弱性が導入された。
ADAPTは、自動分散適応浸透テストのためのゲーム理論およびニューロシンボリックフレームワークである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:32:17 GMT)
The NPU-HWC System for the ISCSLP 2024 Inspirational and Convincing Audio Generation Challenge [12.9] 本稿では,ISCSLP 2024 Inspirational and Convincing Audio Generation Challenge 2024(ICAGC)に提出されたNPU-HWCシステムについて述べる。
本システムは,トラック1の音声生成装置とトラック2の音声生成装置の2つのモジュールから構成される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:58:59 GMT)
On Statistical Rates and Provably Efficient Criteria of Latent Diffusion Transformers (DiTs) [12.8] 本研究では,DiTsスコア関数の普遍近似とサンプル複雑性について検討した。
我々は、潜伏型DiTが初期データの高次元性に関わる課題を回避できる可能性を示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:59:13 GMT)
RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [12.8] 本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
BIRDとSpiderのベンチマーク実験により,提案手法がオープンソースソリューションの最先端実行精度を実現することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:22:26 GMT)
AR-Pro: Counterfactual Explanations for Anomaly Repair with Formal Properties [12.7] 異常検出は、重大な誤りや不審な振る舞いを識別するために広く用いられているが、現在の手法には解釈可能性がない。
本稿では,既存手法の共通特性を活用して,異常検出のための対実的説明を導入する。
このアプローチの重要な利点は、ドメインに依存しない説明可能性の形式的な仕様を可能にすることである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:43:53 GMT)
Categorical Flow Matching on Statistical Manifolds [12.6] 本稿では,情報幾何学に着想を得たパラメータ化確率尺度の多様体上でのフローマッチングフレームワークを提案する。
我々は,多様体間の微分同相法により数値安定性を克服する効率的なトレーニングとサンプリングアルゴリズムを開発した。
我々は、SFMが、既存のモデルがしばしば失敗するような統計多様体上でより複雑なパターンを学習できることを示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:04:11 GMT)
TLCM: Training-efficient Latent Consistency Model for Image Generation with 2-8 Steps [12.4] 潜伏拡散モデル(LDM)を高速で採取できるものに蒸留することは、研究の関心を惹きつけている。
本稿では,これらの課題を克服するために,学習効率の高い遅延一貫性モデル(TLCM)を提案する。
A100 GPUでのトレーニング時間はわずか70時間で、SDXLから蒸留した3ステップのTLCMは、33.68のCLIPスコアと、MSCOCO-2017 5Kベンチマークで5.97の美的スコアを達成した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:16:04 GMT)
CaptainCook4D: A Dataset for Understanding Errors in Procedural Activities [12.4] 新しいエゴセントリックな4DデータセットであるCaptainCook4Dは、実際のキッチン環境でレシピを実行する人々の384の録音(94.5時間)で構成されています。
このデータセットは、2つの異なるタイプのアクティビティで構成されている。1つは参加者が提供されたレシピの指示に従属し、もう1つはエラーを逸脱し誘発する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:37:59 GMT)
Maximum Entropy Inverse Reinforcement Learning of Diffusion Models with Energy-Based Models [12.3] 本稿では,拡散生成モデルのサンプル品質を向上させるために,最大強化学習(IRL)手法を提案する。
トレーニングデータから推定したログ密度を用いて拡散モデルを訓練(または微調整)する。
実験により,DxMIを用いて微調整した拡散モデルでは,4段階から10段階の精度で高品質な試料を生成できることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:39:25 GMT)
LaCour!: Enabling Research on Argumentation in Hearings of the European Court of Human Rights [12.3] LaCour!はECHRの最初の口頭弁論コーパスである。
154の公聴会(267時間以上のビデオ映像から210万のトークン)が英語、フランス語、その他の裁判所の言語で行われている。
文レベルのタイムスタンプと手動でアノテートされた役割と言語ラベルを提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:08:43 GMT)
Optical Lens Attack on Monocular Depth Estimation for Autonomous Driving [12.3] LensAttackは、自動運転車のカメラに光学レンズを戦略的に配置して、知覚された物体の深さを操作する物理的な攻撃だ。
まず、攻撃のパラメータを概説する数学的モデルを構築し、続いてシミュレーションと実世界の評価を行い、その有効性を最先端のMDEモデルで評価する。
その結果、LensAttackはADシステムの深度推定プロセスを著しく破壊し、信頼性と安全性に深刻な脅威をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:23:27 GMT)
UniAR: A Unified model for predicting human Attention and Responses on visual content [12.3] 多様な視覚コンテンツにまたがる人間の注意と嗜好行動の統一モデルUniARを提案する。
自然画像、Webページ、グラフィックデザインにまたがる様々な公開データセットに基づいてUniARをトレーニングし、複数のベンチマークでSOTA性能を達成する。
潜在的なアプリケーションには、UI/視覚コンテンツの有効性に関する即時フィードバックの提供や、デザイナとコンテンツ作成モデルによる人間中心の改善のための作成の最適化などが含まれる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:10:48 GMT)
AI for ERW Detection in Clearance Operations -- The State of Research [12.3] 本稿では、クリアランス操作のためのERW検出のためのAIに関する学術研究の文献レビューを提供する。
研究は、ERWオブジェクト検出のためのAIとERWリスク予測のためのAIの2つの主要なストリームにグループ化できる。
我々は、ERWリスク予測にAIを使用するための新たな取り組みを含む、将来の研究のための3つの機会を開拓する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:50:29 GMT)
Towards Convexity in Anomaly Detection: A New Formulation of SSLM with Unique Optimal Solutions [12.3] Support Vector Description (SVDD) Small and Large Sphere SVM (MvMs) として広く使われている手法における未解決問題
従来の非アプローチでは不可能であることを示す新しいSSLMを導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:42:39 GMT)
SparseLLM: Towards Global Pruning for Pre-trained Language Models [12.1] 本研究では,グローバルプルーニングプロセスを再定義する新しいフレームワークであるSparseLLMを提案する。
SparseLLMのアプローチは、LLMをモジュラ関数の連鎖として概念化し、問題の分解に補助変数を利用する。
高いスパーシティ・レシエーションにおいて、特に顕著なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:38:15 GMT)
Provable Benefit of Cutout and CutMix for Feature Learning [12.0] 本研究では,バニラトレーニング,カットアウトトレーニング,カットミクストレーニングの3つの異なる手法を用いてトレーニングした2層ニューラルネットワークについて検討した。
私たちの定理は、Cutoutトレーニングがバニラトレーニングができない低周波特徴を学習できることを示し、CutMixトレーニングは、Cutoutが取得できない稀な特徴を学習できることを示しています。
我々の新しい分析によると、CutMixのトレーニングにより、ネットワークは全ての特徴やノイズベクターを、希少性や強度に関わらず「均一」に学習することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:41:10 GMT)
End-to-End Ontology Learning with Large Language Models [11.8] 大規模言語モデル(LLM)は、オントロジー学習の様々なサブタスクを解決するために応用されている。
我々は、オントロジーの分類学的バックボーンをスクラッチから構築する汎用的でスケーラブルな方法であるOLLMによって、このギャップに対処する。
標準的なメトリクスとは対照的に、私たちのメトリクスは、グラフ間のより堅牢な構造的距離測定を定義するためにディープラーニング技術を使用します。
私たちのモデルは、arXivのような新しいドメインに効果的に適用できます。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:52:39 GMT)
How Far Can We Go with Practical Function-Level Program Repair? [11.7] 本稿では,少数ショット学習機構と補修関連情報が機能レベルAPRに及ぼす影響について検討する。
補修関連情報のパワーを活用するために,デュアルLLM フレームワークを採用した LLM ベースの関数レベル APR 手法,すなわち SRepair を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:54:53 GMT)
Tensor-Based Synchronization and the Low-Rankness of the Block Trifocal Tensor [11.6] 同期問題は ブロック三焦点テンソルから カメラのポーズを復元する
このランク制約は、ノイズレスケースにおけるカメラのリカバリに十分な情報を提供することを示す。
実データセット上での最先端のグローバル同期手法との比較実験により,位置推定精度を大幅に向上させるアルゴリズムの可能性を示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:36:24 GMT)
Improving Adaptivity via Over-Parameterization in Sequence Models [11.6] 同じ固有関数の集合であっても、これらの関数の順序は回帰結果に大きな影響を及ぼすことを示す。
列モデルの領域に過パラメータ化勾配勾配を導入し、固定された固有関数集合の様々な順序の影響を捉える。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:05:24 GMT)
SeafloorAI: A Large-scale Vision-Language Dataset for Seafloor Geological Survey [11.6] SeafloorAIは、5つの地質層にまたがる海底マッピングのための、初めてのAI対応データセットである。
このデータセットは、17,300平方キロメートルに及ぶ62の地理的分散データサーベイと、696Kソナー画像、827Kの注釈付きセグメンテーションマスク、696Kの詳細な言語記述で構成されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:37:47 GMT)
How Good Are We? Evaluating Cell AI Foundation Models in Kidney Pathology with Human-in-the-Loop Enrichment [11.6] AI基盤モデルのトレーニングは、現実の医療課題に対処するための、有望な大規模学習アプローチとして登場した。
これらのモデルの多くは、疾患の診断や組織定量化などのタスクのために開発されたが、単一の臓器内の核分割のような最も単純なタスクに展開するための準備が整っていないことは確かである。
本稿では、最近の細胞基盤モデルの性能をキュレートされたデータセット上で徹底的に評価することにより、この重要な疑問である「我々はどのくらい良いのか?」に答えようとしている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:00:33 GMT)
Unlocking the Potential of Global Human Expertise [11.5] より大きく多様な知識基盤において補完的な情報を識別、組み合わせ、洗練することは困難である。
RHEAと呼ばれる進化的AIフレームワークは、人間の専門家が作成した様々なモデルの知識を等価なニューラルネットワークに蒸留することで、この役割を果たす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:02:00 GMT)
Promoting Reliable Knowledge about Climate Change: A Systematic Review of Effective Measures to Resist Manipulation on Social Media [11.5] 気候変動に関する操作に対処するための、一般的に推奨されるアプローチには、メディアリテラシーをターゲットとした情報共有や教育キャンペーンが含まれる。
我々は、操作の生成と普及に関わる大規模な商業・政治機関への注意の欠如を含む研究のギャップを見つける。
多くの研究から得られた証拠は、気候変動に関する信頼できる知識を推進し、操作に抵抗するために必要となる政策に関する新たなコンセンサスを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:58:38 GMT)
LEAF: Learning and Evaluation Augmented by Fact-Checking to Improve Factualness in Large Language Models [11.5] LEAF: Fact-Checkingによって強化された学習と評価は、大規模言語モデル(LLM)の現実的信頼性を高めるために設計された新しいアプローチである。
最初の戦略であるFact-Check-Then-RAGは、ファクトチェック結果を取り入れて、モデルパラメータを更新せずに検索プロセスをガイドすることによって、検索精度を向上させる。
第2の戦略であるLearning from Fact-Checks via Self-Trainingは、ファクトチェックされた応答の監督された微調整(SFT)や、ファクトチェックをランキングメカニズムとして適用するSimple Preference Optimization(SimPO)である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:18:05 GMT)
A Geometric Framework for Understanding Memorization in Generative Models [11.3] 近年の研究では、深層生成モデルにより、デプロイ時にトレーニングデータポイントを記憶・再生することが可能であることが示されている。
これらの知見は、特に暗記によって引き起こされる法的およびプライバシー上のリスクを考慮して、生成モデルのユーザビリティを疑問視する。
本稿では, 多様体の暗記仮説(MMH)を, 暗記を推論する明快な言語として活用する幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:09:01 GMT)
Untelegraphable Encryption and its Applications [11.2] 我々は、記録不能暗号(UTE)の研究を開始する。
本研究では,UTE情報理論をプレーンモデルで定義し,構築する。
超高効率影断層撮影 (HEST) は, 衝突抵抗性UTEの存在を前提として不可能であることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:50:53 GMT)
Zero-shot Class Unlearning via Layer-wise Relevance Analysis and Neuronal Path Perturbation [11.2] 機械学習は、大規模な再トレーニングを必要とせずに、トレーニングされたモデルから特定のデータの影響を取り除くテクニックである。
本稿では,階層的関連分析と神経経路摂動を用いた機械学習の新しい手法を提案する。
本手法は,高関連ニューロンを同定・摂動することで,機械学習性能とモデルの有用性のバランスをとる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:37:04 GMT)
Zonal RL-RRT: Integrated RL-RRT Path Planning with Collision Probability and Zone Connectivity [11.1] そこで本研究では,kd-treeパーティショニングを利用した経路計画アルゴリズムZalnal RL-RRTを導入し,ゾーン接続に対処しながらマップをゾーンに分割する。
本アルゴリズムは,森林マップにおけるRTやRT*などの基本サンプリング手法と比較して,時間効率を3倍に向上させる。
NeuralRRT*やMPNetSMPのような学習ベースの手法やRT*Jと比較して、我々のアルゴリズムは平均して、同じ環境での1.5倍の性能を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:57:51 GMT)
End-to-end streaming model for low-latency speech anonymization [11.1] 本稿では低レイテンシで話者匿名化を実現するストリーミングモデルを提案する。
システムは軽量コンテンツエンコーダを用いてエンドツーエンドのオートエンコーダ方式で訓練される。
本稿では,2つのシステムの実装による評価結果について述べる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:45:16 GMT)
CAT: Coordinating Anatomical-Textual Prompts for Multi-Organ and Tumor Segmentation [11.1] CATは,医学領域の知識に富んだ3Dクロップ画像から得られた解剖学的プロンプトとテクスチャ的プロンプトをコーディネートする革新的なモデルである。
10のパブリックCTデータセットからなるコンソーシアムでトレーニングされたCATは、複数のセグメンテーションタスクにおいて優れたパフォーマンスを示している。
このアプローチは、マルチモーダルプロンプトのコーディネートが、医療領域における複雑なシナリオに対処するための有望な道であることを確認した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:06:16 GMT)
Subsurface Scattering for 3D Gaussian Splatting [11.0] 散乱材料を用いた物体の3次元再構成とリライティングは、表面下の複雑な光輸送のために大きな課題となる。
本稿では,マルチビューOLAT(1光1つ)データを用いてオブジェクトの形状を最適にするためのフレームワークを提案する。
本手法は,インタラクティブな速度で素材編集,リライティング,新しいビュー合成を可能にする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:30:46 GMT)
Large Language Model Unlearning via Embedding-Corrupted Prompts [10.9] 大規模言語モデルのための軽量なアンラーニングフレームワークである textbfEmbedding-COrrupted (ECO) Prompts を提案する。
推論中に未学習の状態を識別し、忘れるプロンプトを保護するためにプロンプト分類器を用いて強制する。
その結果, 学習対象を満足させるだけでなく, 忘れることを意図したデータに基づいて訓練されたことのないモデルから得られる出力を, より正確に近似できることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:36:39 GMT)
Online Consistency of the Nearest Neighbor Rule [10.9] 実現可能なオンライン設定では、学習者は、各予測後に正しい回答が明らかにされるインスタンスのストリームの予測を行う。
弱仮定の下で、計量空間を2倍にするようなすべての可測関数に対するオンライン整合性は、有限な上倍測度に対して一様に連続な過程によって生成されることを証明する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:31:42 GMT)
Minimum Empirical Divergence for Sub-Gaussian Linear Bandits [10.8] LinMEDは、アームサンプリング確率のクローズドフォーム計算を許容するランダム化アルゴリズムである。
我々の実証研究は、LinMEDが最先端のアルゴリズムと競合する性能を持っていることを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:54:44 GMT)
On the Computational Power of QAC0 with Barely Superlinear Ancillae [10.7] 深さ$$d$$mathrmQAC0$回路は、近似次数$ta(n)$の関数を計算するために$n1+3-d$アンシラを必要とする。
これは超線形サイズの$mathrmQAC0$上の最初の超線形下界である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:46:04 GMT)
Maia-2: A Unified Model for Human-AI Alignment in Chess [10.6] チェスにおける人間-AIアライメントのための統一モデリング手法を提案する。
プレイヤーの強みをエンコードしたチェス位置と動的に統合する,スキルアウェアアテンション機構を導入する。
我々の結果は、人間の意思決定とAIによる指導ツールに関する深い洞察を得るための道を開いた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:29:28 GMT)
Adversarial Attacks on Code Models with Discriminative Graph Patterns [10.5] 我々は、コードモデルの堅牢性をよりよく評価するために、新しい敵攻撃フレームワーク、GraphCodeAttackを提案する。
ターゲットのコードモデルが与えられたら、GraphCodeAttackは自動的に重要なコードパターンをマイニングし、モデルの決定に影響を与える可能性がある。
ASTパターンからの攻撃を効果的に合成するために、GraphCodeAttackは、個別にトレーニング済みのコードモデルを使用して、具体的なコードスニペットでASTを埋める。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:31:41 GMT)
Identifiability Guarantees for Causal Disentanglement from Purely Observational Data [10.5] 因果解離は、データの背後にある潜在因果関係について学ぶことを目的としている。
近年の進歩は、(単一の)潜伏因子への介入が可能であると仮定して、識別可能性(identifiability)が確立されている。
非線形因果モデルで同定できる潜伏因子の高精度な評価法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:18:29 GMT)
Beyond Accuracy: Ensuring Correct Predictions With Correct Rationales [10.4] 二重補正予測のための二相予測手法を提案する。
まず、視覚認識タスクに対して構造化された合理性を提供する新しいデータセットをキュレートする。
第二に,視覚的エビデンスを解消し,局所化する際のモデル案内のための有理形最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:33:39 GMT)
OpenDebateEvidence: A Massive-Scale Argument Mining and Summarization Dataset [10.4] OpenDebateEvidenceは、American Debate Competitiveコミュニティから派生した、議論のマイニングと要約のための包括的なデータセットである。
このデータセットには、350万以上のドキュメントと豊富なメタデータが含まれており、議論を巻き起こした最も広範な証拠の1つである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:41:03 GMT)
Neural Model Checking [10.4] 時間論理をモデル化するための機械学習手法を導入し,ハードウェアの形式的検証に適用する。
我々の新しいアプローチは、ニューラルネットワークを線形時間論理の形式証明証明として用いることによって、機械学習と記号推論を組み合わせる。
提案手法は,SystemVerilogで記述された標準的なハードウェア設計において,最先端の学術的,商業的なモデルチェッカーよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:17:04 GMT)
How Do Flow Matching Models Memorize and Generalize in Sample Data Subspaces? [10.3] 実世界のデータは、しばしば高次元空間に埋め込まれた低次元構造の中に存在すると仮定される。
実際の設定では、有限個のサンプルのみを観測し、サンプルデータ部分空間と呼ばれるものを形成する。
大きな課題は、生成モデルがこの部分空間内に留まるサンプルを確実に合成できるかどうかである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:08:07 GMT)
Deep Learning with HM-VGG: AI Strategies for Multi-modal Image Analysis [10.0] 本研究では,緑内障早期診断のための最先端深層学習手法であるHybrid Multi-modal VGGモデルを提案する。
モデルの性能は、精度、精度、F1スコアにおける高い指標によって裏付けられている。
HM-VGGモデルは、医師に有望なツールを提供し、診断プロセスを合理化し、患者の結果を改善する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:42:24 GMT)
NIMBA: Towards Robust and Principled Processing of Point Clouds With SSMs [10.0] データ複製を必要とせずに3次元空間構造を維持できる点雲を1次元配列に変換する手法を提案する。
本手法では位置埋め込みは必要とせず, 精度を保ちながら短いシーケンス長が可能である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:58:40 GMT)
COSNet: A Novel Semantic Segmentation Network using Enhanced Boundaries in Cluttered Scenes [10.0] COSNetと呼ばれる効果的セグメンテーションネットワークを導入し、境界キューと複数コンテキスト情報を用いて、散らばったシーンでオブジェクトを正確にセグメンテーションする。
我々のCOSNetは、mIoUメートル法でそれぞれZeroWaste-fで1.8%、SpectralWasteデータセットで2.1%の大幅な上昇を達成した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:03:38 GMT)
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning [9.9] 機能近似に基づく安全オフライン強化学習(RL)のための新しいアルゴリズムであるWSACを提案する。
WSACは2人プレイのStackelbergゲームとして設計され、洗練された目的関数を最適化する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:06:05 GMT)
Meta-Learning Approaches for Improving Detection of Unseen Speech Deepfakes [9.9] 現在の音声ディープフェイク検出手法は、既知の相手に対して良好に機能する。
ソーシャルメディア上でのスピーチのディープフェイクの拡散は、目に見えない攻撃に一般化できるシステムの必要性を浮き彫りにしている。
我々はメタラーニングの観点からこの問題に対処し、非常に少ないサンプルで、目に見えない攻撃に適応するために攻撃不変の機能を学ぶことを目的としている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:41:39 GMT)
NM-FlowGAN: Modeling sRGB Noise without Paired Images using a Hybrid Approach of Normalizing Flows and GAN [9.8] NM-FlowGANは、GANと正規化フローの両方の長所を利用するハイブリッドアプローチである。
本手法は, カメラタイプやISO設定などの手軽に取得可能なパラメータなど, クリーンな画像とノイズ特性に影響を与える要因を用いてノイズを合成する。
我々のNM-FlowGANは、sRGBノイズ合成タスクにおいて、他のベースラインよりも優れています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:19:37 GMT)
The Potential of LLMs in Medical Education: Generating Questions and Answers for Qualification Exams [9.8] 大規模言語モデル(LLM)は、数発のプロンプトに基づいて、医学的資格試験の質問とそれに対応する回答を生成することができる。
研究によると、LSMは数発のプロンプトを使った後、現実世界の医学試験の質問を効果的に模倣できることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:33:37 GMT)
DEREC-SIMPRO: unlock Language Model benefits to advance Synthesis in Data Clean Room [9.8] 本稿では,多テーブルシンセサイザーの適応性を一般化するために,DEREC3ステップ前処理パイプラインを提案する。
また、条件分布と大規模同時仮説テストを利用するSIMPRO3アスペクト評価指標についても紹介する。
その結果,DERECの使用は忠実度を向上し,マルチテーブルシンセサイザーはコラボレーション設定においてシングルテーブルよりも優れていた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:02:55 GMT)
Can Language Models Replace Programmers? REPOCOD Says 'Not Yet' [9.5] 大規模言語モデル(LLM)は、Pythonのコーディング問題の解決において、90pass@1以上の精度を達成した。
REPOCODは、11の人気のある現実世界プロジェクトから収集された980の問題のコード生成ベンチマークである。
REPOCODの各タスクには、平均313.5人の開発者によるテストケースが含まれている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:31:31 GMT)
Conditional Generative Models are Sufficient to Sample from Any Causal Effect Estimand [9.5] 観測データからの因果推論は、信頼できる機械学習における多くの応用において重要な役割を果たす。
任意の因果グラフを与えられた任意の介入分布からサンプリングする方法を示す。
またテキストと画像変数を含むMIMIC-CXRデータセットから高次元干渉サンプルを生成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:16:44 GMT)
Disentangling Interactions and Dependencies in Feature Attribution [9.4] 機械学習において、グローバルな特徴重要度法は、対象変数の予測に個々の特徴がどの程度貢献するかを判断しようとする。
一般的に用いられる特徴重要度スコアでは、これらの協調効果は特徴の個々の貢献と混同される。
DIPは、3つの成分をアンタングルする個々の特徴重要度スコアを数学的に分解する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:41:10 GMT)
Simulating User Agents for Embodied Conversational-AI [9.4] 我々は,エンボディエージェントとのインタラクション中にユーザ動作をシミュレート可能な,LLMベースのユーザエージェントを構築した。
シミュレーション対話をTEAChデータセットと比較することにより,ユーザエージェントの人間的行動生成能力を評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:56:08 GMT)
Symbolic Regression with a Learned Concept Library [9.4] 本稿では,データセットを最もよく説明できる,コンパクトなプログラム仮説を探索する手法を提案する。
我々のアルゴリズムはLaSRと呼ばれ、ゼロショットクエリを大規模言語モデルに使用して概念を発見し、進化させます。
LaSRは、ディープラーニングと進化的アルゴリズムに基づいて、最先端のSRアプローチを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:02:17 GMT)
Fact Recall, Heuristics or Pure Guesswork? Precise Interpretations of Language Models for Fact Completion [9.4] 本研究では,LMが異なる振る舞いを示すことを期待できる4つの異なる予測シナリオについて検討する。
本稿では,各シナリオを例に,データセット構築のためのPrISMというモデル固有のレシピを提案する。
それぞれのシナリオに対してCTは異なる結果を生成するが、混合例の集合上の集約は、最強の計測信号によるシナリオの結果のみを表すことができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:44:13 GMT)
State- and context-dependent robotic manipulation and grasping via uncertainty-aware imitation learning [9.4] 文脈に依存した把握・操作戦略を取得するためのLfD手法を提案する。
我々は、予測不可能な振る舞いを避けるために、自動的にデモに戻る状態依存のアプローチを提案する。
アプローチは、LASA手書きデータセットと実際の7-DoFロボットに対して評価される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:32:32 GMT)
Conformalized Prediction of Post-Fault Voltage Trajectories Using Pre-trained and Finetuned Attention-Driven Neural Operators [9.3] 本稿では,電力系統における後電圧トラジェクトリの間隔を予測するための新しいデータ駆動手法を提案する。
提案した演算子回帰モデルでは、電圧軌跡の観測された部分を、観測後の未観測軌跡にマッピングする。
ニューイングランド39バス試験システムを用いて提案手法の性能評価を行った。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:20:13 GMT)
Infeasible Deterministic, Stochastic, and Variance-Reduction Algorithms for Optimization under Orthogonality Constraints [9.3] 本稿では,着陸アルゴリズムの実用化と理論的展開について述べる。
まず、この方法はスティーフェル多様体に拡張される。
また、コスト関数が多くの関数の平均である場合の分散還元アルゴリズムについても検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:23:13 GMT)
Large language models can be zero-shot anomaly detectors for time series? [9.2] sigllmは,大規模言語モデルを用いた時系列異常検出のためのフレームワークである。
本稿では,入力のどの要素が異常であるかを言語モデルに直接問うプロンプトベースの検出手法を提案する。
その結果, 予測手法はF1スコアに対して, 全11データセットにおいてプロンプト法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:33:37 GMT)
Cycle-Constrained Adversarial Denoising Convolutional Network for PET Image Denoising: Multi-Dimensional Validation on Large Datasets with Reader Study and Real Low-Dose Data [9.2] 低線量スキャンから高画質画像を再構成するためのCycle-DCN(Cycle-versa Adrial Denoising Convolutional Network)を提案する。
1,224名の患者から得られた生のPET脳データからなる大規模なデータセットを用いて実験を行った。
サイクルDCNは平均ピーク信号対雑音比(PSNR)、SSIM、正規化ルート平均角誤差(NRMSE)を3つの線量レベルで改善する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:34:28 GMT)
Parameter-Efficient Fine-Tuning Medical Multimodal Large Language Models for Medical Visual Grounding [9.1] マルチモーダル大言語モデル(MLLM)は、LLMの優れたテキスト理解能力を継承し、これらの機能をマルチモーダルシナリオに拡張する。
これらのモデルは、マルチモーダルタスクの一般領域において優れた結果をもたらす。
しかし,医療分野では,医療用MLLMの開発に多大なトレーニングコストと広範な医療データを必要とすることが課題となっている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:07:26 GMT)
A Taxonomy of Challenges to Curating Fair Datasets [9.1] 本稿では,データセットキュレーションライフサイクルを通じて発生する課題とトレードオフを包括的に分類する。
われわれの研究結果は、データキュレーションに影響を及ぼすより広い公平な環境の中で、大きな問題を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:47:52 GMT)
Coding Reliable LLM-based Integrated Task and Knowledge Agents with GenieWorksheets [9.1] 我々は、タスク指向の会話エージェントを作成するためのフレームワークGenieを紹介する。
Genieは、コントロール可能なエージェントポリシを備えた、信頼できる地上応答を提供する。
Genieを使用して構築されたエージェントは、STARV2データセットの複雑なロジックドメインの最先端メソッドを最大20.5%向上させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:02:41 GMT)
LucidGrasp: Robotic Framework for Autonomous Manipulation of Laboratory Equipment with Different Degrees of Transparency via 6D Pose Estimation [9.0] この作業には、液体で満たされた物体を操作するための自律モードを備えたロボットフレームワークの開発が含まれる。
提案するロボットフレームワークは、非自明な操作タスクを実行する問題を解くことができるため、実験室の自動化に応用できる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:06:49 GMT)
HoloChrome: Polychromatic Illumination for Speckle Reduction in Holographic Near-Eye Displays [9.0] ホログラフィックディスプレイは、真に深い奥行きを提供するという約束を持ち、その結果、近目アプリケーションに対する没入型視覚体験が強化される。
現在のホログラフィックディスプレイはスペックルノイズによって妨げられ、表示された画像の色とテクスチャの正確な再現を制限する。
HoloChromeは、これらの制限を緩和するために設計された多色ホログラフィック表示フレームワークである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:05:44 GMT)
Optical Diffusion Models for Image Generation [8.9] 拡散モデルは、初期供給されたランダム分布から徐々にノイズを減らし、新しいサンプルを生成する。
この推論手順は、トレーニングされたニューラルネットワークを何回も使用して最終的な出力を得るのが一般的である。
本研究では,半透明媒質を透過する光ビームの伝搬をプログラムし,画像サンプルにデノナイズ拡散モデルを実装することを実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:01:59 GMT)
Scaled Inverse Graphics: Efficiently Learning Large Sets of 3D Scenes [8.8] 本研究では,大規模なシーン表現を効率的に学習するフレームワーク「スケールド・インバース・グラフィックス」を提案する。
i)シーンのサブセットで圧縮モデルをトレーニングし、(ii)より小さな表現でNeRFモデルをトレーニングする。
実際には,映像の解像度を抑えるため,潜時空間でNeRFを学習することでシーンの表現をコンパクト化し,シーン間で情報を共有することにより,NeRF表現の複雑さを低減させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:58:00 GMT)
Advancing Video Anomaly Detection: A Concise Review and a New Dataset [8.8] ビデオ異常検出(VAD)は、セキュリティ監視、交通監視、産業監視、医療に広く応用されている。
大規模な研究努力にもかかわらず、研究者に洞察力のあるガイダンスを提供する簡潔なレビューは残っていない。
本稿では,様々な視点からモデルとデータセットを考察する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:01:13 GMT)
PuLID: Pure and Lightning ID Customization via Contrastive Alignment [8.8] テキスト・ツー・イメージ生成のためのPuLID(Pure and Lightning ID customization)を提案する。
PuLIDにはLightning T2Iブランチと標準拡散ブランチが組み込まれており、オリジナルのモデルの破壊を最小限に抑えている。
実験の結果,PuLIDはIDの忠実度と編集性の両方において優れた性能を示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:17:39 GMT)
LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages [8.8] LingOlyベンチマークは、大規模言語モデルにおける高度な推論能力のための新しいベンチマークである。
非常に低リソースまたは絶滅した言語における言語パターンの文脈内同定と一般化の能力を評価する。
直接精度と非文脈ベースラインとの比較により,暗記を暗記する性能を評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:14:49 GMT)
Using Multimodal Deep Neural Networks to Disentangle Language from Visual Aesthetics [8.7] 我々は、自然画像の人間の美的評価を予測するために、ユニモーダル視覚、ユニモーダル言語、マルチモーダルディープニューラルネットワーク(DNN)モデルの学習表現に対する線形復号を用いる。
言語対応型視覚モデル(SLIPなど)は, 単言語型視覚モデル(SimCLRなど)では, 言語対応の視覚モデル(SLIPなど)では, 単言語型視覚と比較して小さな利得が得られている。
まとめると、これらの結果は、最終的に我々が美の体験を説明するために見つかるであろう言葉が何であれ、フィードフォワードの知覚の計算は、その経験に十分な基礎を与えるかもしれないことを示唆している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:37:21 GMT)
PARE-Net: Position-Aware Rotation-Equivariant Networks for Robust Point Cloud Registration [8.7] 回転不変の特徴を学習することは、ポイントクラウド登録の基本的な要件である。
既存の手法では、回転に敏感なネットワークを用いて特徴を抽出し、回転拡大を用いて近似不変写像を無作為に学習する。
高速で軽量でロバストな登録のための位置認識型回転同変ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:18:11 GMT)
PARE-Net: Position-Aware Rotation-Equivariant Networks for Robust Point Cloud Registration [8.7] 回転不変の特徴を学習することは、ポイントクラウド登録の基本的な要件である。
既存の手法では、回転に敏感なネットワークを用いて特徴を抽出し、回転拡大を用いて近似不変写像を無作為に学習する。
高速で軽量でロバストな登録のための位置認識型回転同変ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:18:11 GMT)
One Prompt to Verify Your Models: Black-Box Text-to-Image Models Verification via Non-Transferable Adversarial Attacks [8.6] 我々は,ノントランスファラブル・アドリアック(TVN)によるテキスト・ツー・イメージ・モデル検証という,最初のT2Iモデル検証手法を提案する。
TVNはNon-dominated Sorting Genetic Algorithm II (NSGA-II)に基づいて、プロンプトのテキストエンコーディングのコサイン類似性を最適化する。
TVNはクローズドセットとオープンセットの両方のシナリオで良好に動作し、90%以上の検証精度を実現した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:08:07 GMT)
Blind Time-of-Flight Imaging: Sparse Deconvolution on the Continuum with Unknown Kernels [8.6] ToF (Computer Time-of-Flight) イメージングは、エキサイティングで新しい画像モダリティとして登場した。
本稿では,カーネルキャリブレーションを必要とせず,連続体上のスパーススパイクを回復する新しいToFイメージング手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:42:02 GMT)
Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction [8.6] そこで我々はLlama-3-8B-Mobという大規模言語モデルを紹介した。
我が国の4大都市圏の大規模移動データを用いて,本手法の有効性を検証した。
その結果,Llama-3-8B-Mobは長期移動のモデル化に優れていた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:30:38 GMT)
On the Sparsity of the Strong Lottery Ticket Hypothesis [8.5] 最近の研究で、任意のニューラルネットワークを正確に近似できるランダムニューラルネットワークの$N$ containsworksが示されている。
古典的セッティングにおけるStrong Lottery Ticket仮説の最初の証明を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:50:22 GMT)
ProgressGym: Alignment with a Millennium of Moral Progress [8.5] プログレスガイム(ProgressGym)は、道徳的進歩力学を歴史から学べる実験的なフレームワークである。
本稿では,進捗アライメントのベースライン手法として,長寿命・外挿アルゴリズムを提案する。
私たちは、新しいアルゴリズムと課題を募集するオープンなリーダーボードを構築します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:10:12 GMT)
Text-Aware Diffusion for Policy Learning [8.3] 本研究では、事前訓練された凍結されたテキスト条件付き拡散モデルを用いて、高密度ゼロショット報酬信号をテキスト整合ポリシー学習に利用する、政策学習用テキスト認識拡散(TADPoLe)を提案する。
TADPoLe は,Humanoid と Dog の両環境において,自然言語によって規定される新たな目標達成と連続的な移動行動の政策を学習可能であることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:49:26 GMT)
Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure [8.3] 学習したスコア関数の隠れた性質を調べた結果,拡散モデルの一般化可能性について検討した。
拡散モデルが記憶から一般化へと遷移するにつれて、対応する非線形拡散デノイザは線形性を増加させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:57:04 GMT)
Variance-Aware Estimation of Kernel Mean Embedding [8.3] 再生カーネルヒルベルト空間における分散情報を利用して収束を高速化する方法を示す。
このような情報が未知の事前情報であっても、効率的にデータから推定できることが示される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:56:49 GMT)
Randomized Exploration for Reinforcement Learning with Multinomial Logistic Function Approximation [8.3] 多項ロジスティック(MNL)関数近似を用いた強化学習について検討した。
頻繁な後悔の保証を有するランダムな探索を伴う確率的効率のアルゴリズムを提案する。
数値実験により提案アルゴリズムの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:14:55 GMT)
Word Definitions from Large Language Models [8.2] 3つの辞書の定義をChatGPTの変種から生成されたものと比較する。
i) 従来の辞書からの定義は, モデルによる定義よりも表面形状が類似していること, (ii) 従来の辞書に匹敵する高い精度のChatGPT定義が, (iii) チャtGPTに基づく埋め込み定義は低頻度語でも精度を保っていること, を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:55:10 GMT)
An Empirical Analysis of GPT-4V's Performance on Fashion Aesthetic Evaluation [8.1] GPT-4Vは、画像中の個人が着る服がどれだけよく合うかを推定するために用いられる。
その予測は、私たちのデータセット上の人間の判断とかなりよく一致しており、同じ色のランク付けに苦戦していることも示しています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:33:30 GMT)
Fast Rate Information-theoretic Bounds on Generalization Errors [8.1] 学習アルゴリズムの一般化誤差は、学習アルゴリズムの学習データにおける損失と、目に見えないテストデータにおける損失との違いを指す。
一般化誤差に関する様々な情報理論境界が文献で導出されている。
本稿では,これらの境界の厳密性について,それらの収束速度の標本サイズ依存性の観点から検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:16:01 GMT)
Demystifying Linear MDPs and Novel Dynamics Aggregation Framework [8.1] 線型 MDP において、$d$ は遷移確率を適切に表すために$S/U$ で制限される。
動的アグリゲーション(dynamics aggregate, 動的アグリゲーション)と呼ばれる動的に基づく新しい構造アグリゲーションフレームワークを提案する。
提案アルゴリズムは統計的効率を示し,$ tildeO (d_psi3/2 H3/2sqrt T)$, $d_psi$は集約されたサブMDPの特徴次元を表す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:21:41 GMT)
MV-CC: Mask Enhanced Video Model for Remote Sensing Change Caption [8.1] 融合モジュールを設計せずに新しいビデオモデルに基づくパラダイムを導入する。
具体的には、オフザシェルフビデオエンコーダを用いて、両時間画像の時間的特徴と空間的特徴を同時に抽出する。
提案手法は,他の最先端RSICC法と比較して優れた性能が得られる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:02:40 GMT)
FRoundation: Are Foundation Models Ready for Face Recognition? [8.0] 本稿では,さまざまなレベルのデータ・アベイラビリティーにおいて,顔認識のための基礎モデルの適応性を提案し,実証する。
本研究の結果は, 汎用性にもかかわらず, 事前学習した基礎モデルでは顔認識が不十分であることが示唆された。
微調整ファウンデーションモデルは、トレーニングデータに制限がある場合、しばしばスクラッチからトレーニングされたモデルを上回る、有望な結果をもたらす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:21:21 GMT)
MambaEviScrib: Mamba and Evidence-Guided Consistency Make CNN Work Robustly for Scribble-Based Weakly Supervised Ultrasound Image Segmentation [8.0] スパースアノテーションに基づく弱教師付き学習(WSL)は、性能向上を実現している。
超音波画像は、コントラストが低かったり、縁が不明瞭だったり、大きさや病変の位置が異なったりといった問題に悩まされることが多い。
本稿では,Evidence-Guided Consistency(EGC)戦略を考案するための証拠のDST(Dempster-Shafer theory)を紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:00:26 GMT)
A Geometric Modeling of Occam's Razor in Deep Learning [8.0] ディープニューラルネットワーク(DNN)は、非常に高次元のパラメータ空間の恩恵を受ける。
彼らの巨大なパラメータの複雑さと実践上の素晴らしいパフォーマンスは、より興味深く、説明できないものです。
本稿では,この現象を研究するための幾何学的フレーバー付き情報理論手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:09:08 GMT)
A Systematic Review of NeurIPS Dataset Management Practices [8.0] 我々はNeurIPSトラックで公開されたデータセットの体系的なレビューを行い、証明、配布、倫理的開示、ライセンスの4つの重要な側面に焦点を当てる。
この結果から, データセットの出現は不明瞭なフィルタリングやキュレーションのプロセスのため, しばしば不明瞭であることが明らかとなった。
これらの矛盾は、データセットの公開と管理のための標準化されたデータインフラストラクチャーの緊急の必要性を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:55:41 GMT)
UDA: A Benchmark Suite for Retrieval Augmented Generation in Real-world Document Analysis [8.0] 学術文献やファイナンスによる質問応答では、データはHTMLやPDF形式の生のテキストや表によく見られる。
2,965の現実世界の文書と29,590のエキスパート注釈付きQ&AペアからなるベンチマークスイートであるUnstructured Document Analysis (UDA)を導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:10:28 GMT)
Pedestrian Trajectory Prediction with Missing Data: Datasets, Imputation, and Benchmarking [7.9] TrajImputeは、観測された軌道の座標をシミュレートする歩行者軌道予測データセットである。
本研究では,欠落した座標を再構築するためのいくつかの計算手法について検討し,歩行者軌道の計算のためのベンチマークを行う。
本データセットは,今後の歩行者軌跡予測研究の基盤となる資料を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:42:42 GMT)
Envisioning Diversity and Inclusion for Quantum Software Engineering [7.8] 本稿では,量子ソフトウェア工学における倫理的役割,特に多様性と包摂性(D&I)について考察する。
我々は、量子技術においてより透明で公平で説明可能な未来のために、D&IをQSEに統合するという私たちのビジョンについて議論する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:26:26 GMT)
SR-CACO-2: A Dataset for Confocal Fluorescence Microscopy Image Super-Resolution [7.8] 低解像度画像をアップスケーリングして高解像度画像(HR)を生成することで、画像品質の回復に、一像超解像(SISR)のマシン/ディープ学習法を適用することができる。
SISR法は、公開データの豊富さから、写真リアル画像にうまく応用されている。
我々は,3種類の蛍光マーカーに印加された低解像度と高解像度の画像対からなる,SR-CACO-2と呼ばれる大規模な走査共焦点顕微鏡データセットを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:44:36 GMT)
uOttawa at LegalLens-2024: Transformer-based Classification Experiments [7.7] 本稿では,LegalLens-2024共有タスクに使用される手法について述べる。
それは、構造化されていないテキストデータ内の法的違反を検出し、これらの違反を潜在的に影響のある個人と関連付けることに焦点を当てた。
L-NERサブタスクは86.3%,L-NLIサブタスクは88.25%であった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:29:15 GMT)
Speech is More Than Words: Do Speech-to-Text Translation Systems Leverage Prosody? [7.7] 韻律は音声からテキストへの翻訳システムの中ではほとんど研究されない。
エンドツーエンド(E2E)システムは、翻訳決定を行う際に音声信号に直接アクセスする。
主な課題は、翻訳における韻律認識を評価することの難しさである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:20:50 GMT)
Still More Shades of Null: An Evaluation Suite for Responsible Missing Value Imputation [7.6] 本稿では,有意な値計算を行うための評価スイートであるShades-of-Nullを紹介する。
我々はShades-of-Nullを使って23,940の実験パイプラインを含む大規模な実験研究を行っている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:50:54 GMT)
Still More Shades of Null: An Evaluation Suite for Responsible Missing Value Imputation [7.6] 本稿では,有意な値計算を行うための評価スイートであるShades-of-Nullを紹介する。
我々はShades-of-Nullを使って23,940の実験パイプラインを含む大規模な実験研究を行っている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:50:54 GMT)
MaterialBENCH: Evaluating College-Level Materials Science Problem-Solving Abilities of Large Language Models [7.6] 材料科学分野における大規模言語モデル(LLM)のための大学レベルのベンチマークデータセットであるMaterialBENCHを構築した。
このデータセットは、大学教科書に基づく問題解決ペアで構成されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:56:01 GMT)
PowerGraph: A power grid benchmark dataset for graph neural networks [7.5] 本稿では、電力フロー、最適電力フロー、カスケード故障解析のためのGNN調整データセットを含むPowerGraphを提案する。
PowerGraphは、さまざまなタスクのための多面的なGNNデータセットで、実世界の説明を含む電力フローと障害シナリオを含んでいる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:23:40 GMT)
Measurement-Device-Independent Quantum Secret Sharing Networks with Linear Bell-State Analysis [7.5] 量子秘密共有(QSS)は、多人数の量子通信において重要な役割を果たす。
しかし、QSSスキームのセキュリティは、測定装置の欠陥を悪用した攻撃によって損なわれる可能性がある。
本稿では,測定デバイスに依存しない(MDI)原理に基づいてQSSを実装するための再構成可能な手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:59:09 GMT)
Rethinking Inverse Reinforcement Learning: from Data Alignment to Task Alignment [7.5] 模倣学習(IL)アルゴリズムは、逆強化学習(IRL)を用いて、実演と整合した報酬関数を推論する。
本稿では,従来のデータアライメントよりもタスクアライメントを優先するIRLベースのILのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:08:14 GMT)
Multiview Scene Graph [7.5] 適切なシーン表現は、空間知性の追求の中心である。
未提示画像からマルチビューシーングラフ(MSG)を構築することを提案する。
MSGは、場所とオブジェクトノードを相互接続したシーンをトポロジ的に表現する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:09:11 GMT)
Blind Inpainting with Object-aware Discrimination for Artificial Marker Removal [7.5] そこで本研究では,マスク入力を誘導することなく,劣化領域内の視覚コンテンツを自動再構成するブラインド塗装手法を提案する。
本モデルには,視覚再建ネットワークと,対人訓練のためのオブジェクト認識識別器が組み込まれている。
本手法は, 様々な医用画像モダリティの3つのデータセットを用いて評価し, 他の最先端手法よりも優れた性能が確認された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:10:11 GMT)
Uncertainty Quantification of Surrogate Models using Conformal Prediction [7.4] 我々は,モデルに依存しない方法で予測を満足する共形予測フレームワークを定式化し,ほぼゼロの計算コストを必要とする。
本稿では,決定論的モデルに対する統計的に有効なエラーバーを提供するとともに,確率論的モデルのエラーバーに対する保証を作成することを検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:14:58 GMT)
From Context to Action: Analysis of the Impact of State Representation and Context on the Generalization of Multi-Turn Web Navigation Agents [7.4] 本研究の目的は,Webナビゲーションエージェントの機能に不可欠な様々なコンテキスト要素を解析することである。
インタラクション履歴とWebページ表現の影響に焦点を当てる。
当社の作業は、アウト・オブ・ディストリビューションシナリオにおけるエージェントパフォーマンスの向上を強調しています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:51:41 GMT)
ALISE: Accelerating Large Language Model Serving with Speculative Scheduling [7.4] 大規模言語モデル(LLM)は、現代の人工知能(AGI)の展望における革命的な進歩を表している。
本稿では, ALISE という新しい効率的な LLM 推論サービスフレームワークを提案する。
ALISEは,AlpacaデータセットとShareGPTデータセットと同じレイテンシ制約の下で,最大1.8xと2.1xの推論処理のスループットを向上することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:58:11 GMT)
FINALLY: fast and universal speech enhancement with studio-like quality [7.2] 本稿では,様々な歪みを含む実世界の録音における音声強調の課題に対処する。
本研究では, 対人訓練の安定性を高めるために, 知覚喪失のための様々な特徴抽出器について検討した。
我々は、WavLMに基づく知覚損失をMS-STFT逆行訓練パイプラインに統合し、音声強調モデルの効果的で安定した訓練手順を作成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:47:01 GMT)
FINALLY: fast and universal speech enhancement with studio-like quality [7.2] 本稿では,様々な歪みを含む実世界の録音における音声強調の課題に対処する。
本研究では, 対人訓練の安定性を高めるために, 知覚喪失のための様々な特徴抽出器について検討した。
我々は、WavLMに基づく知覚損失をMS-STFT逆行訓練パイプラインに統合し、音声強調モデルの効果的で安定した訓練手順を作成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:47:01 GMT)
FINALLY: fast and universal speech enhancement with studio-like quality [7.2] 本稿では,様々な歪みを含む実世界の録音における音声強調の課題に対処する。
本研究では, 対人訓練の安定性を高めるために, 知覚喪失のための様々な特徴抽出器について検討した。
我々は、WavLMに基づく知覚損失をMS-STFT逆行訓練パイプラインに統合し、音声強調モデルの効果的で安定した訓練手順を作成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:47:01 GMT)
On Sampling Strategies for Spectral Model Sharding [7.2] 本研究では,そのようなシャーディングのための2つのサンプリング戦略を提案する。
第1は元の重みの偏りのない推定器を生成し、第2は正方形の近似誤差を最小限にすることを目的としている。
これら2つの手法が,様々な一般的なデータセットの性能向上につながることを実証した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:37:25 GMT)
UniqueQMA vs QMA: oracle separation and eigenstate thermalization hypothesis [7.1] 量子オラクルをUniqueQMAとQMAで分離する。
我々のプロトコルは、ハミルトニアンの低エネルギー部分空間における量子膨張器テストと見なすことができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:53:51 GMT)
Length-Induced Embedding Collapse in Transformer-based Models [7.1] 性能劣化は、長文埋め込みが狭い空間に崩壊するLongth Collapseと呼ばれる現象によるものであることが判明した。
この崩壊により、異なるテキスト長の埋め込み間の分散不整合が生じ、下流タスクのパフォーマンスが損なわれる。
本研究では,低フィルタ減衰率の高いソフトマックス()に温度を導入することにより,望ましくない長さの崩壊制限を緩和することを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:55:36 GMT)
MathDSL: A Domain-Specific Language for Concise Mathematical Solutions Via Program Synthesis [7.1] 本稿では,数式解析のためのドメイン特化言語であるMathを紹介する。
Mathは、プログラムモデルにデプロイされた場合、最先端の強化学習方法より優れている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:28:54 GMT)
Generating Multi-Aspect Queries for Conversational Search [7.0] 同じ検索モデルでは,nDCG@3で1回以上のリライトクエリが85%向上することを示す。
本稿ではMQ4CSと呼ばれるマルチアスペクトクエリ生成・検索フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:37:07 GMT)
RGB2Point: 3D Point Cloud Generation from Single RGB Images [7.0] RGB2Pointは、Transformerをベースにした3Dポイントクラウド生成のための、未提示のシングルビューRGBイメージである。
本実装では,SOTA拡散モデルよりも15,133倍高速に結果を生成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:08:00 GMT)
RGB2Point: 3D Point Cloud Generation from Single RGB Images [7.0] RGB2Pointは、Transformerをベースにした3Dポイントクラウド生成のための、未提示のシングルビューRGBイメージである。
本実装では,SOTA拡散モデルよりも15,133倍高速に結果を生成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:08:00 GMT)
Posture-Informed Muscular Force Learning for Robust Hand Pressure Estimation [6.9] 本稿では,手圧推定を向上する新しいフレームワークであるPiMForceを提案する。
本手法は,3次元手話からの詳細な空間情報と,sEMGの動的筋活動とを併用する。
本フレームワークは,複雑な相互作用シナリオと自然な相互作用シナリオにおいて,正確な手圧力推定を可能にする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:42:43 GMT)
Evaluating and Improving ChatGPT-Based Expansion of Abbreviations [6.9] 大規模言語モデル(LLM)に基づく略語拡張に関する最初の実証的研究について述べる。
以上の結果から,ChatGPTは最先端のアプローチよりも精度が低いことが示唆された。
最初の原因として, 様々な文脈の影響を調査し, 周辺ソースコードが最適選択であることを確認した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:20:24 GMT)
End-to-End Driving via Self-Supervised Imitation Learning Using Camera and LiDAR Data [6.8] 本論文は,E2E運転のための自己教師付き模倣学習(SSIL)として,最初の完全自己教師型学習フレームワークを提案する。
提案したSSILフレームワークは、コマンドデータを使用せずにE2E駆動ネットワークを学習できる。
3つの異なるベンチマークデータセットを用いた数値実験により,提案したSSILフレームワークは,教師付き学習と同等のE2E駆動精度を達成できることを示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:16:46 GMT)
Probabilistic Conceptual Explainers: Trustworthy Conceptual Explanations for Vision Foundation Models [6.7] 本稿では, 信頼度, 安定度, 疎度, マルチレベル構造, パーシモニーの5つのViTを説明するデシラタを提案する。
PACE(ProbAbilistic Concept Explainers)と呼ばれる変分ベイズの説明フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:30:46 GMT)
Resilience to the Flowing Unknown: an Open Set Recognition Framework for Data Streams [6.7] 本研究では、分類とクラスタリングを組み合わせて、ストリーミングシナリオにおけるテキストオーバ占有空間問題に対処するオープンセット認識フレームワークの適用について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:06:54 GMT)
$ψ$DAG: Projected Stochastic Approximation Iteration for DAG Structure Learning [6.6] Directed A Graphs (DAGs) の構造を学ぶことは、ノード数に応じてスケールする可能なグラフの巨大な検索空間のため、大きな課題となる。
近年の進歩は、微分可能指数関数性制約を取り入れた連続最適化タスクとしてこの問題を再定義している。
本稿では,SGD(Gradient Descent)に基づく最適化手法と統合した近似手法を用いて,DAGを学習する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:13:11 GMT)
Pruning for Protection: Increasing Jailbreak Resistance in Aligned LLMs Without Fine-Tuning [6.6] 我々は、中程度のWANDA刈り取りは、微調整なしでジェイルブレイク攻撃に対する耐性を高めることができることを示した。
5つのカテゴリにまたがって225の有害なタスクのデータセットを導入します。
LLaMA-2は、手動のジェイルブレイク試行で評価した場合、我々のデータセットよりもAdvBenchプロンプトの方がずっと安全であることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:16:12 GMT)
MLLA-UNet: Mamba-like Linear Attention in an Efficient U-Shape Model for Medical Image Segmentation [6.6] 従来のセグメンテーション手法は、高い解剖学的変動、ぼやけた組織の境界、低い臓器コントラスト、ノイズといった課題に対処するのに苦労する。
MLLA-UNet(Mamba-like Linear Attention UNet)を提案する。
MLLA-UNetは、FLARE22、AMOS CT、ACDCに限らず、24の異なるセグメンテーションタスクを持つ6つの挑戦的なデータセットに対して、平均88.32%の最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:54:23 GMT)
Aquatic-GS: A Hybrid 3D Representation for Underwater Scenes [6.5] 本研究では,水中の物体と水媒体の両方を効果的に表現するハイブリッド3D表現手法であるAquatic-GSを提案する。
具体的には、暗黙的に水パラメータをモデル化するニューラルウォーターフィールド(NWF)を構築し、最新の3Dガウススプラッティング(3DGS)を拡張してオブジェクトを明示的にモデル化する。
両方のコンポーネントは、複雑な水中シーンを表現するために、物理学に基づく水中画像形成モデルを介して統合される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:24:56 GMT)
Seemingly Plausible Distractors in Multi-Hop Reasoning: Are Large Language Models Attentive Readers? [6.5] 大規模言語モデル (LLM) がマルチホップ推論ベンチマークの簡易化に有効かどうかを検討する。
この発見に触発されて、我々は、もっともらしいマルチホップ推論連鎖を生成することで、挑戦的なマルチホップ推論ベンチマークを提案する。
その結果, マルチホップ推論の性能はF1スコアの45%まで低下していることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:19:12 GMT)
Seemingly Plausible Distractors in Multi-Hop Reasoning: Are Large Language Models Attentive Readers? [6.5] 大規模言語モデル (LLM) がマルチホップ推論ベンチマークの簡易化に有効かどうかを検討する。
この発見に触発されて、我々は、もっともらしいマルチホップ推論連鎖を生成することで、挑戦的なマルチホップ推論ベンチマークを提案する。
その結果, マルチホップ推論の性能はF1スコアの45%まで低下していることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:19:12 GMT)
Assessing the Impact of Packing on Machine Learning-Based Malware Detection and Classification Systems [6.5] マルウェアの拡散は静的解析と署名に基づくマルウェア検出技術に重大な課題をもたらす。
元の実行可能コードへのパッキングの適用は、意味のある機能やシグネチャを抽出する。
本研究は,マルウェアの検出と分類に使用される静的機械学習モデルの性能に及ぼすパッキングの影響について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:19:33 GMT)
Lifting the Veil on the Large Language Model Supply Chain: Composition, Risks, and Mitigations [6.5] 大規模言語モデル(LLM)は、インテリジェンスと生産性の両方に重大な影響を与えている。
本稿では, LLMサプライチェーンの概要を概説し, ステークホルダー, アーティファクトの構成, 供給タイプについて詳述する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:14:16 GMT)
Provably Optimal Memory Capacity for Modern Hopfield Models: Transformer-Compatible Dense Associative Memories as Spherical Codes [6.5] 現代ホップフィールドモデルとカーネル化ホップフィールドモデル(KHMs)の最適キャパシティ記憶について検討する。
KHMsの最適容量は、特徴空間がメモリに最適な球形コードを形成することを許すときに生じることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:02:34 GMT)
Attend First, Consolidate Later: On the Importance of Attention in Different LLM Layers [6.5] 本稿では,現在のトークンの計算において,次のレイヤへの入力として,将来のトークンの注意機構への入力として,与えられたレイヤの表現が2つの目的を果たすことを示す。
4つのLDMと4つのタスクを実験したところ、この操作は、しばしば小さくて無視できない性能低下につながることが示されている。
以上の結果から,トランスフォーマーをベースとしたLLMの2段階プロセスが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:11:03 GMT)
Deterministic Exploration via Stationary Bellman Error Maximization [6.5] 探索は強化学習(RL)の重要かつ特異な側面である
本稿では,後者を安定させ,決定論的探索政策に到達するための3つの修正点を紹介する。
実験結果から,本手法は高密度かつスパースな報酬設定において,$varepsilon$-greedyよりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:46:48 GMT)
ECDQC: Efficient Compilation for Distributed Quantum Computing with Linear Layout [6.4] 本稿では,LNNアーキテクチャを用いた分散量子コンピューティング(DQC)の効率的なコンパイル手法を提案する。
提案手法は, コンパイル時間, ゲート数, 回路深さを著しく低減し, 大規模量子計算の堅牢性を向上させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:07:46 GMT)
Don't Touch My Diacritics [6.3] 我々は、多くの言語やスクリプトを起源とするテキストにおけるダイアクリティカルな文章の扱いに焦点をあてる。
本研究は,いくつかのケーススタディを通じて,ダイアクリティカル文字の非一貫性な符号化と,ダイアクリティカル文字を完全に除去する効果を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:03:44 GMT)
QICS: Quantum Information Conic Solver [6.3] 我々はQICSを紹介した。QICSはPythonで完全に実装されたオープンソースのプリマル・デュアルインテリア・ポイント・ソルバである。
QICSは量子相対エントロピーを含む最適化問題を解くことができる。
我々は、QICSが最先端の量子相対エントロピー計画法よりも優れていることを示す広範な数値実験を紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:46:21 GMT)
Clustering ensemble algorithm with high-order consistency learning [6.3] 異なる次元のデータ間の接続を表現するために,高次情報融合アルゴリズムが提案された。
実験の結果,LCLCEアルゴリズムのクラスタリング精度は平均7.22%向上した。
提案アルゴリズムはクラスタリングアンサンブルアルゴリズムよりも優れたクラスタリング結果を得ることができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:59:17 GMT)
Generalized Principal-Agent Problem with a Learning Agent [6.2] 古典的なプリンシパルエージェント問題は、エージェントがプリンシパルのコミット戦略に最も反応できると仮定することが多い。
エージェントが平均的学習アルゴリズム(regretではないが、swap-regretではない)を使用する場合、プリンシパルは$U*$よりもはるかに優れた処理を行うことができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:48:37 GMT)
Improved bounds for testing low stabilizer complexity states [6.2] 安定化状態の耐久試験における最先端パラメータの改善について検討する。
安定化状態の量子状態の最大忠実度が$geq epsilon_1$または$leq epsilon$であるかどうかを識別する効率的な量子プリミティブが存在することを示す。
無限の量子状態の族について、安定化器ランクがシステムサイズに依存しない定数よりも低い場合、安定化器の忠実度は絶対定数で低いことが示される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:56:57 GMT)
A Theory of Synaptic Neural Balance: From Local to Global Order [6.1] 我々は、シナプス的神経バランスの理論を開発し、それをニューラルネットワークでどのように生み出すか、強制するかを考察する。
与えられた正規化器の場合、入力重みの総コストが出力重みの総コストと等しい場合、ニューロンは平衡にあると言われる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:01:41 GMT)
Parameter choices in HaarPSI for IQA with medical images [6.1] 光音響と胸部X線データセットの2つの注釈付き医療データセットのパラメータを最適化する。
本稿では,HaarPSI$_MED$により,医用画像のパフォーマンスを顕著に向上させる最適化設定を示す。
その結果, 一般的なIQA対策を医療画像に適応させることは, より具体的なタスクベース尺度の活用に価値ある, 一般化可能な付加効果をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:28:49 GMT)
Open-Set 3D object detection in LiDAR data as an Out-of-Distribution problem [6.1] LiDARデータからの3Dオブジェクト検出は,制御環境下での産業対応性能を実現している。
我々は,LiDARデータにおけるオープンセット3Dオブジェクト検出問題を,外部分布(OOD)問題として再定義し,外乱オブジェクトを検出する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:29:55 GMT)
Microstructures and Accuracy of Graph Recall by Large Language Models [6.0] グラフデータは、多くのアプリケーションにとって不可欠である。
以前のテキストで記述されたグラフを正確にリコールし、エンコードできることは、基本的だが重要な能力である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:19:58 GMT)
FDF: Flexible Decoupled Framework for Time Series Forecasting with Conditional Denoising and Polynomial Modeling [5.8] 時系列予測は多くのWebアプリケーションにおいて不可欠であり、業界全体で重要な意思決定に影響を与える。
我々は拡散モデルが大きな欠点に悩まされていることを論じる。
予測性能を向上させるために,高品質な時系列表現を学習するフレキシブルデカップリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:30:52 GMT)
Diffusion Twigs with Loop Guidance for Conditional Graph Generation [5.7] Twigsは、条件生成タスクの強化に複数の共進化フローを組み込んだスコアベースの拡散フレームワークである。
ループ誘導と呼ばれる新しい戦略は、サンプリング中にトランクと幹細胞の間の情報の流れを効果的に調整する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:13:11 GMT)
Atom-light-correlated quantum interferometer with memory-induced phase comb [5.7] 非相関粒子Nの標準量子限界()を超える感度の原子-光ハイブリッド量子干渉計を示す。
標準量子限界を超える位相感度は最大8.3pm 0.2$ dBで、特にN=4×1013/s$で達成される。
この技術は、様々な分野における感度量子測定を推し進めることができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:49:22 GMT)
Towards Generative Ray Path Sampling for Faster Point-to-Point Ray Tracing [5.7] 本稿では,潜在的光線経路を効率的にサンプリングするための機械学習支援レイトレーシング手法を提案する。
我々のモデルは、あらゆる可能なパスの中で潜在的に有効なパスを優先順位付けし、シーンの複雑さと線形にスケールすることを学ぶ。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:42:03 GMT)
PipeFusion: Patch-level Pipeline Parallelism for Diffusion Transformers Inference [5.7] PipeFusionは、複数のGPUでイメージをパッチとモデルレイヤに分割する。
通信と計算を効率的にオーケストレーションするために、パッチレベルのパイプライン並列戦略を採用している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:14:31 GMT)
Extended Object Tracking and Classification based on Linear Splines [5.7] 本稿では,2次元拡張対象追跡と分類のための線形スプラインに基づくフレームワークを提案する。
拡張対象の輪郭上の任意の点からノイズ測定を散布できる場合に、正確な確率が導出される。
観測されたデータが所定の形状にどの程度収まるかを測定するために、適切な推定器を開発する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:46:54 GMT)
Joint Training for Selective Prediction [5.7] 選択予測法は、分類器の出力をいつ採用するか、人間に延期するかを決定する。
以前の方法の1つは、エンジニアリングされた特徴に基づいて遅延モデルを学習することである。
分類器モジュールが使用する学習表現と学習遅延ポリシーを同時に最適化する新しい共同学習手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:28:26 GMT)
Adaptive Aggregation Weights for Federated Segmentation of Pancreas MRI [5.6] フェデレートラーニング(FL)は、機密データを共有することなく、機関間で協調的なモデルトレーニングを可能にする。
フェデレート平均化(FedAvg)のような従来のFLメソッドは、ドメイン間の一般化において困難に直面している。
本稿では適応的なアグリゲーション重みを取り入れた新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:25:40 GMT)
Progressive Safeguards for Safe and Model-Agnostic Reinforcement Learning [5.6] 我々は、各タスクが安全を監視し、エージェントに報酬信号を提供するセーフガードと同期するメタラーニングプロセスをモデル化する。
セーフガードの設計は手動だが、高レベルでモデルに依存しないため、エンドツーエンドの安全な学習アプローチがもたらされる。
我々は、MinecraftにインスパイアされたGridworld、VizDoomゲーム環境、LLMファインチューニングアプリケーションでフレームワークを評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:28:33 GMT)
Continuous Spatio-Temporal Memory Networks for 4D Cardiac Cine MRI Segmentation [5.5] 半教師付き全心と全シーケンスcMRセグメンテーションのための連続STM(CSTM)ネットワークを提案する。
我々のネットワークは、基礎となる心臓構造に先立って空間的・時空間的・平面的連続性を最大限に活用し、正確かつ高速な4Dセグメンテーションを実現する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:19:02 GMT)
QuACK: A Multipurpose Queuing Algorithm for Cooperative $k$-Armed Bandits [5.5] 我々は、$m$エージェントのネットワークが協調して最適な行動を見つける、協調的な$k$武器の盗賊問題を研究する。
単一エージェントのバンディットアルゴリズムをマルチエージェント設定に拡張できるブラックボックスリダクションを提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:20:36 GMT)
Ada-MSHyper: Adaptive Multi-Scale Hypergraph Transformer for Time Series Forecasting [5.4] 時系列予測のための適応型マルチスケールハイパーグラフ変換器(Ada-MSHyper)を提案する。
Ada-MSHyperは最先端の性能を達成し、予測誤差を平均4.56%、10.38%、MSEの4.97%減らし、長距離、短距離、超長距離の時系列予測を行う。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:51:09 GMT)
Federated Learning over Connected Modes [5.4] 我々はコネクテッドモード(textscFloco)上でのフェデレーション学習を提案する。
クライアントは、勾配信号に基づいて、このシンプルさの局所部分領域を割り当て、共有グローバルソリューションの単純さを共に学習する。
実験により、textscFlocoはグローバルトレーニングプロセスを加速し、計算オーバーヘッドを最小限に抑えて局所的精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:37:27 GMT)
The Communal Loom: Integrating Tangible Interaction and Participatory Data Collection for Assessing Well-Being [5.3] タンジブルインタラクションは、直接的および具体的コラボレーションと、データ収集と評価に対する全体論的アプローチを組み合わせる機会を与える。
我々は、定量的データをまとめて編み出したアーティファクトに変換するアートセラピーのためのアーティファクトであるCommunal Loomを設計し、使用した経験を説明することで、この可能性を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:34:01 GMT)
Teaching Theorizing in Software Engineering Research [5.3] この章は、ソフトウェア工学(SE)の研究者と教育者が理論の重要性と理論化のプロセスを教えることを支援することを目的としている。
この章は、理論化の中間製品12と、SEコンテキストにおける意味を提示する。
この章は、SEにおける理論化に関する12週間のコースのための提案された構造で終わる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:04:11 GMT)
Repository-Level Compositional Code Translation and Validation [5.3] リポジトリレベルのコード翻訳を自動化するニューロシンボリックアプローチであるAlphaTransを提案する。
AlphaTransを利用して,836,8575,2719>クラス,メソッド,テストからなる10の実世界のオープンソースプロジェクトを翻訳しました。
翻訳されたコード断片の99.1%は構文的に正しいものであり、AlphaTransは翻訳の動作と機能的正しさを25.8%で検証している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:46:52 GMT)
A Survey of the Self Supervised Learning Mechanisms for Vision Transformers [5.2] 視覚タスクにおける自己教師あり学習(SSL)の適用は注目されている。
SSL手法を体系的に分類する包括的分類法を開発した。
SSLの背後にあるモチベーションについて議論し、人気のある事前トレーニングタスクをレビューし、この分野の課題と進歩を強調します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:18:40 GMT)
BERTs are Generative In-Context Learners [5.1] インコンテキスト学習は一般的にGPTのような因果言語モデルと関連付けられている。
マスク付き言語モデルでは、この機能が"エマージ"されることも示しています。
既存のマスク付きモデルであるDeBERTaを、追加のトレーニングやアーキテクチャの変更なしに生成タスクを実行可能にする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:48:51 GMT)
XRDSLAM: A Flexible and Modular Framework for Deep Learning based SLAM [5.1] XRDSLAMは、モジュール型コード設計とマルチプロセス実行機構を採用した柔軟なSLAMフレームワークである。
このフレームワークでは,NeRFや3DGSベースのSLAM,さらにはオドメトリや再構成アルゴリズムなど,最先端のSLAMアルゴリズムをさまざまなタイプに統合する。
我々は、SLAM技術の広範な研究開発を促進することを目的として、すべてのコード、構成、データをオープンソースコミュニティにコントリビュートします。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:25:39 GMT)
Robust Sparse Regression with Non-Isotropic Designs [5.0] 2つの敵が同時に存在するときの疎線形回帰を効率的に計算可能な推定器を設計する手法を開発した。
2つの敵が存在する場合の重み付き設計に適した重み付きハマー損失の新しい解析法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:51:59 GMT)
Adaptive Alignment: Dynamic Preference Adjustments via Multi-Objective Reinforcement Learning for Pluralistic AI [4.8] MORL(Multi Objective Reinforcement Learning)を通じて,AIを多種多様なユーザ嗜好に整合させるアプローチを提案する。
本稿では,提案手法の枠組みを紹介するとともに,その期待されている利点と前提を概説し,実装に関する技術的詳細について議論する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:46:52 GMT)
(FL)$^2$: Overcoming Few Labels in Federated Semi-Supervised Learning [4.8] Federated Learning(FL)は、クライアントのプライバシに敏感なデータを保存しながら、正確なグローバルモデルをトレーニングする分散機械学習フレームワークである。
ほとんどのFLアプローチは、クライアントがラベル付きデータを持っていると仮定するが、実際にはそうではないことが多い。
本稿では、シャープネスを意識した整合性正規化を用いたラベルなしクライアントのための堅牢なトレーニング手法である$(FL)2$を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:05:11 GMT)
Masking Gaussian Elimination at Arbitrary Order, with Application to Multivariate- and Code-Based PQC [4.7] 我々は,ガウス的排除(GE)のためのマスキングスキームを提供する。
線形方程式の系を行-エケロン形式に変換するためのマスク付きアルゴリズムを提案する。
提案手法のオーバーヘッドを,数件のポストクォータ候補と,それらの異なるセキュリティレベルで評価した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:01:02 GMT)
What Makes An Expert? Reviewing How ML Researchers Define "Expert" [4.6] 専門」と「専門」を明示的に参照する学術出版物112件をレビューする。
専門知識はしばしば未定義であり、正式な教育以外の知識の形式はめったに求められない。
我々は、専門家が機械学習開発に関わった方法、専門知識の社会的構築、そして責任あるAI開発への意味について論じる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:51:28 GMT)
Automating Quantum Software Maintenance: Flakiness Detection and Root Cause Analysis [4.6] コードの変更なしに不整合に合格または失敗する、不安定なテストは、ソフトウェア工学における大きな課題である。
量子ソフトウェアにおける不安定なテストを自動的に検出するフレームワークの構築を目指しています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:43:04 GMT)
Ab Initio Structure Solutions from Nanocrystalline Powder Diffraction Data [4.5] 材料科学における大きな課題は、ナノメートルサイズの物体の構造を決定することである。
本稿では,45,229の既知構造に基づく拡散過程に基づく生成機械学習モデルを用いた新しい手法を提案する。
我々のモデルであるPXRDnetは、対称性と複雑さの異なる200の材料にまたがる10アングストロームのシミュレーションナノ結晶を解くことに成功した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:29:37 GMT)
Diverse Explanations From Data-Driven and Domain-Driven Perspectives in the Physical Sciences [4.4] このパースペクティブは、物理科学における機械学習応用における多様な説明の源泉と意味を探求する。
モデル, 説明方法, 特徴属性レベル, 利害関係者のニーズが, ML出力の様々な解釈をもたらすかを検討する。
我々の分析は、科学的な文脈でMLモデルを解釈する際に、複数の視点を考慮することの重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:37:11 GMT)
Learning Cooperative Trajectory Representations for Motion Forecasting [4.4] 協調情報から動きと相互作用の特徴を利用するための予測指向表現パラダイムを提案する。
V2X-Graphは、協調動作予測のための解釈可能かつエンドツーエンドな特徴量融合を実現するための代表的なフレームワークである。
車両から全車まで(V2X)のシナリオを更に評価するため,V2X-Traj を用いたV2X運動予測データセットを構築した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:01:50 GMT)
LLM4Mat-Bench: Benchmarking Large Language Models for Materials Property Prediction [4.4] 大規模言語モデル(LLM)は、材料科学でますます使われている。
LLM4Mat-Benchは、液晶材料の特性予測におけるLCMの性能評価のための、これまでで最大のベンチマークである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:48:12 GMT)
The non-Hermitian skin effect: A perspective [4.4] 非ヘルミチアン(NH)皮膚効果は真にNHの特徴であり、システムの境界上では、皮膚状態として知られる状態の蓄積として表される。
非正規性と非相互性は、NH皮膚効果を見るために必要な要件としてレビューされる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:51:15 GMT)
Impact of High-Brightness Entangled Photon Pairs on CHSH Inequality Experiment [4.3] 本稿では, 絡み合った光子対の輝度の関数として$(S-2)/Delta S$値を予測する数学的モデルを提案する。
実験により、平均光子数が19.03ドルdBの絡み合い分布設定においてmu26$である場合、CHSH値は2.69に低下し、$(S-2)/Delta S$値は60.95に上昇することを確認した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:25:05 GMT)
The Importance of Being Scalable: Improving the Speed and Accuracy of Neural Network Interatomic Potentials Across Chemical Domains [4.3] ニューラルネットワーク原子間ポテンシャル(NNIP)のスケーリングに関する研究
NNIPは、ab initio量子力学計算の代理モデルとして機能する。
我々は、スケーリング用に設計されたNNIPアーキテクチャを開発する: 効率よくスケールされた意識的原子間ポテンシャル(EScAIP)
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:35:57 GMT)
GPT or BERT: why not both? [4.3] GPT-BERTは標準的な因果関係やマスキング言語モデルのように透過的に使用することができる。
モデルをオープンにリリースし、コーパスとコードをトレーニングします。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:18:11 GMT)
Exploring Consistency in Graph Representations:from Graph Kernels to Graph Neural Networks [4.2] グラフネットワーク(GNN)は、グラフ表現学習において支配的なアプローチとして現れている。
ニューラルネットワーク手法とカーネルアプローチのギャップを橋渡しし、GNNが学習した表現の構造を一貫してキャプチャできるようにすることで、そのギャップを埋める。
これらの知見に触発されて、GNN層間のグラフ表現の類似性の整合性は、関係構造を捕捉し、グラフ分類性能を向上させる上で重要であると推測した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:07:08 GMT)
Accelerated Bayesian parameter estimation and model selection for gravitational waves with normalizing flows [4.2] 本稿では,ハイパフォーマンスな計算手法と正規化フローに基づく高速化パイプラインを提案し,ベイジアンパラメータ推定とモデル選択を行う。
私たちのコードは、十分にテストされ、完全にドキュメント化されたオープンソースパッケージで利用可能です。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:16:36 GMT)
Approaches to human activity recognition via passive radar [4.2] この論文は、非侵入的Wi-Fiチャネル状態情報(CSI)データに着目した受動レーダを用いた人活動認識(HAR)の新しい手法を探求する。
本研究では、スパイキングニューラルネットワーク(SNN)を用いたCSIの非侵入性を利用して、人間の動きによる信号の変動を解釈する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:28:41 GMT)
One-dimension Periodic Potentials in Schrödinger Equation Solved by the Finite Difference Method [4.2] Kronig-Penneyポテンシャルの幅と高さが固有値と波動関数に与える影響を解析した。
高次のバンド構造では、固有値の大きさはポテンシャル幅の増加とともに著しく減少する。
本フレームワークを用いて,周期的な$delta$ potentialであるDirac comb potentialについて検討した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:45:49 GMT)
SSL-NBV: A Self-Supervised-Learning-Based Next-Best-View algorithm for Efficient 3D Plant Reconstruction by a Robot [4.1] 本稿では,深層ニューラルネットワークを用いた自己教師型学習ベースNBV(SSL-NBV)手法を提案する。
クロスバリデーションを用いたシミュレーションおよび実環境における総合評価を行った。
その結果, SSL-NBVは非NBV法よりも植物再生の視点を少なくし, ボクセル法より800倍以上高速であった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:34:45 GMT)
Testing and learning structured quantum Hamiltonians [4.1] 正規化フロベニウスノルムの下で、未知の$n$qubit Hamiltonian $H$をクエリからその進化作用素 $e-iHt$ までテストし、学習する問題を考察する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:54:13 GMT)
Large language model validity via enhanced conformal prediction methods [4.1] 我々は,大規模言語モデル(LLM)の出力に対する妥当性を保証するための新しい共形推論手法を開発した。
我々は、Gibs et al. (2023) の条件等式手順を一般化し、出力の実用性を維持するために必要なときに、より弱い保証を適応的に発行する。
バイオグラフィーと医学的質問応答データセットに対するアプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:31:03 GMT)
Argumentation and Machine Learning [4.1] 本章では,計算論と機械学習のクロス・フェーティフィケーションのある程度のアプローチを提示する研究の概要を紹介する。
これら2つの領域間の相互作用の目的を表す2つの広いテーマが同定された。
我々は,学習の種類や議論フレームワークの形式など,様々な次元にわたる作品のスペクトルを評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:19:58 GMT)
Towards Fast Algorithms for the Preference Consistency Problem Based on Hierarchical Models [4.0] 階層モデルに基づく選好文の一貫性問題の解法として,アルゴリズム的手法を構築し,比較する。
インスタンスが一貫すると、評価関数に階層的モデルが存在し、代替関数の順序関係を誘導する。
この問題を解決するための3つのアプローチを開発する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:48:46 GMT)
Inclusive KL Minimization: A Wasserstein-Fisher-Rao Gradient Flow Perspective [4.0] 本稿では、勾配流の理論を用いて、一般化された近似的包摂的KL推論パラダイムを構築することができることを示す。
我々は、包摂的KL分散を最小化するためのワッサーシュタイン-フィッシャー-ラオ勾配流の理論的基礎を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:25:47 GMT)
'No' Matters: Out-of-Distribution Detection in Multimodality Long Dialogue [4.0] 本稿では,OOD対話と画像の効率よく検出することで,複数ラウンドの長い対話を含むユーザエクスペリエンスを向上させることを目的とする。
本稿では,視覚言語モデルと新たなスコアを統合したDIAEF(Dialogue Image Aligning and Enhancing Framework)を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:45:54 GMT)
Compositional Automata Embeddings for Goal-Conditioned Reinforcement Learning [3.9] 決定論的有限オートマトン(cDFAs)の合成を用いた時間目標の表現法を提案する。
提案手法は,様々なcDFAタスククラスに対してゼロショットの一般化を可能にするとともに,階層的手法のミオピックな部分最適化を伴わずに,ポリシーの特殊化を促進できることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:56:07 GMT)
Natural gradient and parameter estimation for quantum Boltzmann machines [3.9] パラメータ化熱状態の基本幾何学の式を定式化する。
これらの式の価値を推定するための量子アルゴリズムを導出する。
その結果、量子ボルツマン機械学習のための自然な勾配降下アルゴリズムの開発に応用できる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:56:06 GMT)
NeuralSolver: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks [3.9] 我々は、より小さな問題(観測サイズの観点から)からアルゴリズムを学習し、大きな問題でそれらのアルゴリズムを実行する新しいリカレント・ソルバであるNeuralrに貢献する。
これは、入力サイズと出力サイズが同じである同サイズ問題と、入力サイズと出力サイズが異なる異サイズ問題の両方に自然に適用できる。
Neuralr は従来型再帰的解法よりも常に優れており、より大きな問題に外挿し、他の手法よりも少ないパラメータを必要とする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:46:13 GMT)
Sliding Puzzles Gym: A Scalable Benchmark for State Representation in Visual Reinforcement Learning [3.8] Sliding Puzzles Gym (SPGym) は従来の15タイルパズルをグリッドサイズと観測空間で拡張したベンチマークである。
SPGymは、潜在環境の動的性とアルゴリズム的問題を固定しつつ、表現学習課題のスケーリングを可能にする。
モデルフリーとモデルベース両方のRLアルゴリズムを用いた実験では,表現課題がスケールするにつれて,SPGymはエージェントの能力に基づいて効果的にエージェントを識別できることが示されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:06:34 GMT)
Knowledge Equivalence in Digital Twins of Intelligent Systems [3.8] 本論文は,知的システムのデジタル双対モデルに焦点をあてる。
このようなインテリジェントな物理システムのモデリングには、仮想空間における知識認識能力を複製する必要がある。
本稿では,知識比較と更新による知識等価性の概念と等価性維持手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:41:45 GMT)
Identifying Equivalent Training Dynamics [3.8] 共役および非共役のトレーニングダイナミクスを識別するフレームワークを開発する。
クープマン作用素理論の進歩を利用して、クープマン固有値を比較することで、オンラインミラー降下とオンライン勾配降下の既知同値を正しく同定できることを実証する。
a)浅層ニューラルネットワークと広層ニューラルネットワークの間の非共役トレーニングダイナミクスの同定、(b)畳み込みニューラルネットワークにおけるトレーニングダイナミクスの初期段階の特徴付け、(c)グルーキングを行わないトランスフォーマーにおける非共役トレーニングダイナミクスの発見。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:20:42 GMT)
From Web Data to Real Fields: Low-Cost Unsupervised Domain Adaptation for Agricultural Robots [3.8] 本稿では,Unsupervised Domain Adaptation (UDA) を用いて,特定分野への適応を低コストで行うことを目的とする。
我々は、多様なインターネットソースデータのプールから、特定の場所でロボットが収集した小さなデータセットへの、新たなドメインシフトを探求する。
我々は,マルチレベル注意に基づく適応識別器(MAAD)という新しいモジュールを導入し,任意の検出モデルの特徴抽出器レベルで統合する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:11:09 GMT)
Mutual Information Preserving Neural Network Pruning [3.7] ノード間の相互情報を保存するMIPP(Mitual Information Preserving Pruning)を導入する。
MIPPはビジョンモデルやデータセットにおける最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:50:15 GMT)
Image Synthesis with Class-Aware Semantic Diffusion Models for Surgical Scene Segmentation [3.7] 本稿では,データ不足と不均衡に対処するクラスアウェア意味拡散モデル(CASDM)を提案する。
クラス認識平均二乗誤差とクラス認識自己認識損失関数は、重要で目立たないクラスを優先するように定義されている。
我々は、テキストプロンプトを用いて、その内容を特定するために、初めて、新しい方法でマルチクラスセグメンテーションマップを生成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:14:30 GMT)
Large Language Models for Patient Comments Multi-Label Classification [3.7] 本研究は,多ラベルテキスト分類(MLTC)におけるLLM(Large Language Models)の活用について検討する。
GPT-4o-Turboは分類を行うために利用された。
プロンプトエンジニアリングフレームワークを使用することで、ゼロショット学習、インコンテキスト学習、チェーンオブ思考プロンプトを実験した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:29:52 GMT)
Pseudo-Conversation Injection for LLM Goal Hijacking [3.6] ゴールハイジャックでは、攻撃者はユーザーのプロンプトに慎重に作られた悪意のある接尾辞を付加する。
Pseudo-Conversation Injectionと呼ばれる新しいゴールハイジャック攻撃手法を導入する。
本稿では,擬似会話をターゲットとした擬似会話,普遍的擬似会話,ロバスト擬似会話という3つの擬似会話構築戦略を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:58:34 GMT)
There and Back Again: On the relation between noises, images, and their inversions in diffusion models [3.6] 拡散確率モデル(DDPM)は、ランダムノイズから新しい画像を合成する際に最先端の性能を達成する。
近年のDDPMベースの編集技術は、画像を近似した星音に戻すことでこの問題を緩和しようとしている。
本研究では,初期ガウス雑音,それから発生するサンプル,およびインバージョン処理により得られた対応する潜時符号化との関係について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:30:35 GMT)
Projected Neural Differential Equations for Learning Constrained Dynamics [3.6] 本稿では,学習ベクトル場の射影を制約多様体の接空間に向けることで,ニューラル微分方程式を制約する新しい手法を提案する。
PNDEは、ハイパーパラメータを少なくしながら、既存のメソッドよりも優れています。
提案手法は、制約付き力学系のモデリングを強化する重要な可能性を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:32:43 GMT)
Generative AI-Powered Plugin for Robust Federated Learning in Heterogeneous IoT Networks [3.5] フェデレーション学習により、エッジデバイスは、データのローカライズを維持しながら、データのプライバシを維持しながら、グローバルモデルを協調的にトレーニングすることが可能になる。
我々は,AI強化データ拡張と均衡サンプリング戦略により,IIDからIDDへの非IIDデータ分布を近似する,フェデレーション最適化技術のための新しいプラグインを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:13:47 GMT)
EMGBench: Benchmarking Out-of-Distribution Generalization and Adaptation for Electromyography [3.5] 本稿では,EMG分類アルゴリズムの分布外性能を評価するため,機械学習を用いた最初の一般化と適応ベンチマークを提案する。
ユーザの意図したジェスチャーをEMG信号で予測することにより、補助技術を制御するウェアラブルソリューションを作成することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:24:03 GMT)
Neurophysiological Analysis in Motor and Sensory Cortices for Improving Motor Imagination [3.4] 脳コンピュータインタフェース(BCI)は、神経信号をデコードすることで、脳と外部デバイス間の直接通信を可能にする。
脳波信号を用いた運動実行(ME)タスクと運動画像(MI)タスクのニューラルシグネチャについて検討した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:18:41 GMT)
Efficient Inference and Computation of Optimal Alternatives for Preference Languages Based On Lexicographic Models [3.4] 我々は、レキシコグラフィーモデルに基づく一般的な嗜好言語に対して、嗜好の一貫性を分析する。
我々は、強い構成性(strong compositionality)と呼ばれる性質を同定し、多くの自然の選好文に適用する。
我々は、汎用的な嗜好言語に対して、最適性の異なる自然な定義と、それらの相互関係を考察する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:19:31 GMT)
Graph Neural Networks Uncover Geometric Neural Representations in Reinforcement-Based Motor Learning [3.4] グラフニューラルネットワーク(GNN)は、脳波データにおける神経表現の幾何学的性質を捉えることができる。
強化型運動学習が運動計画中の神経活動パターンに与える影響について検討した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:54:50 GMT)
An Empirical Analysis of Fairness Notions under Differential Privacy [3.4] DP-SGDに適したモデルアーキテクチャを選択すると、統計的公正基準の異なるクラスに属する異なる公正概念がどう影響するかを示す。
これらの発見は、偏りのあるデータセットに基づいてトレーニングされたディープラーニングモデルにおいて、差分プライバシーが必ずしも不公平を悪化させるという理解に挑戦する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:52:55 GMT)
Proving Olympiad Algebraic Inequalities without Human Demonstrations [3.3] 複雑な不等式定理を自律的に生成できる代数的不等式証明システムである AIPS を提案する。
20 Olympiadレベルの不等式に関するテストセットでは、AIPSは10の解決に成功し、最先端の手法よりも優れていた。
1つの定理が2024年の大都市オリンピアードの競争問題に選ばれた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:24:06 GMT)
Using Scenario-Writing for Identifying and Mitigating Impacts of Generative AI [3.3] インパクトアセスメントは、AIデプロイメントの否定的および肯定的な影響を特定する一般的な方法として現れている。
しかし、現在の文献と影響評価の実践を批判的に問うことも不可欠である。
この挑発では、まず現在のインパクトアセスメントの文献を批判し、次に新しいアプローチを提案します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:48:58 GMT)
EXACFS -- A CIL Method to mitigate Catastrophic Forgetting [3.3] 本稿では,クラスインクリメンタルな学習環境においてこの問題を軽減するために,Exponentially Averaged Class-wise Feature Significance (EXACFS)を提案する。
CIFAR-100とImageNet-100の実験は、可塑性を取得しながら安定性を維持するEXACFSの優れた性能を示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:11:56 GMT)
Disentangling Disentangled Representations: Towards Improved Latent Units via Diffusion Models [3.2] Disentangled Expression Learning (DRL) は、観測されたデータをコア固有の要素に分解して、データの深い理解を目指している。
近年,教師なしDRLにおける拡散モデル(DM)の利用について,限定的な調査が行われている。
より解釈可能なDRLに対して属性分離型潜在ユニットを強制する動的ガウスアンチョリングを提案する。
また、よりDRLフレンドリーなU-Netを容易に修正できるスキップドロップアウト手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:05:09 GMT)
Visual place recognition for aerial imagery: A survey [3.1] 航空画像とその視覚的ローカライゼーションへの直接的応用は、多くのロボティクスおよびコンピュータビジョンタスクにとって重要な問題である。
グローバル・ナビゲーション・サテライト・システムズ(GNSS、Global Navigation Satellite Systems)は、航空の局地化問題を解決するための標準標準のソリューションである。
視覚的なジオローカライゼーションは、実現可能な代替手段として浮上している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:12:57 GMT)
Dynamical similarity analysis uniquely captures how computations develop in RNNs [3.0] 最近の研究では、いくつかの指標が刺激的なシグナルに反応し、誤った結果をもたらすことが示されている。
本稿では、リカレントニューラルネットワーク(RNN)における合成学習により、動的表現アライメントメトリクスのテストケースを提供できることを提案する。
最近提案された動的類似性解析 (DSA) は, より頑健で, 行動関連表現を確実に識別できることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:07:21 GMT)
Dataset Refinement for Improving the Generalization Ability of the EEG Decoding Model [3.0] 脳波データセットからノイズの多いデータを除去するデータセット改良アルゴリズムを提案する。
提案したアルゴリズムは、元のデータセットよりも優れた一般化性能を実現している。
脳波領域における深層学習モデルの一般化性能を効果的に向上させることができると結論付けた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:08:24 GMT)
Graph Learning for Numeric Planning [3.0] 数値計画課題の解法を学習するための,データ効率と解釈可能な機械学習モデルを提案する。
これには、連続属性と分類属性の両方を持つグラフ用の新しいグラフカーネルを構築することが含まれる。
実験により、グラフカーネルはグラフニューラルネットワークよりもはるかに効率的で一般化され、数値計画が可能であることが示された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:16:51 GMT)
Deep Convolutional Neural Networks on Multiclass Classification of Three-Dimensional Brain Images for Parkinson's Disease Stage Prediction [2.9] パーキンソン病の病期を正確に予測できるモデルを開発した。
我々は3次元脳画像全体を入力として使用した。
予測過程において,異なるスライスの重要性を考慮に入れた注意機構を組み込んだ。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:40:08 GMT)
Sparse maximal update parameterization: A holistic approach to sparse training dynamics [2.9] 疎密で高密度なネットワークが、同じ最適なHPを共有していないことを示す。
安定したダイナミクスと効果的なトレーニングのレシピがなければ、大規模に分散性をテストするのにコストがかかります。
S$mu$Parは、アクティベーション、グラデーション、およびウェイト更新を全てのスケールが、スパーシティレベルとは無関係に保証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:46:11 GMT)
A Visual Case Study of the Training Dynamics in Neural Networks [2.9] 本稿では,小型変圧器モデルのトレーニング力学を探索するビジュアルサンドボックスを提案する。
我々は、正規化層の高い曲率によって引き起こされるものを含む、トレーニング力学、回路伝達性、損失スパイクの原因に関する洞察を得る。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:46:10 GMT)
Secret Breach Prevention in Software Issue Reports [2.9] 本稿では,ソフトウェア問題報告における秘密漏洩検出のための新しい手法を提案する。
ログファイル、URL、コミットID、スタックトレース、ダミーパスワードなど、ノイズによって引き起こされる課題を強調します。
本稿では,最先端技術の強みと言語モデルの文脈的理解を組み合わせたアプローチを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:14:17 GMT)
Improving the accuracy of circuit quantization using the electromagnetic properties of superconductors [2.9] 超伝導回路の量子化のための改良手法を提案する。
我々は,35nmの薄膜を有するニオブ薄膜からなる平面超伝導量子デバイスを用いて,本手法を実験的に検証した。
本手法は, 歪んだ薄膜, コンパクトで微細な素子をベースとした超伝導素子の系統的研究を可能にする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:06:12 GMT)
Prosody as a Teaching Signal for Agent Learning: Exploratory Studies and Algorithmic Implications [2.8] 本稿では,人間教師からのエージェント学習を強化するための教示信号として,韻律の統合を提唱する。
その結果,明示的なフィードバックと組み合わせることで,韻律的特徴が強化学習効果を高めることが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:51:23 GMT)
A Non-Monolithic Policy Approach of Offline-to-Online Reinforcement Learning [2.8] オフラインからオンラインへの強化学習(RL)は、トレーニング済みのオフラインポリシと、ダウンストリームタスクのためにトレーニングされたオンラインポリシの両方を使用する。
本研究では, モノリシックな探査手法を用いたオフライン・オフラインRL手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:49:37 GMT)
MEDS-Tab: Automated tabularization and baseline methods for MEDS datasets [2.8] この作業は、MEDSフレームワークによるコアデータ標準化の補完的な進歩によって実現されている。
我々は、不規則にサンプリングされた時系列データを著しく単純化し、加速する。
このシステムは、多様なデータセットと臨床設定にわたる健康問題に対する強力なMLソリューションの開発において、信頼性、スケーラビリティ、容易性を大幅に向上する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:36:37 GMT)
Heterogeneous Knowledge for Augmented Modular Reinforcement Learning [2.8] これらの制約に対処するため、AMRL(Augmented Modular Reinforcement Learning)を提案する。
我々のフレームワークは、セレクタを使用して異種モジュールを結合し、異なる種類の知識表現と処理機構をシームレスに組み込む。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:53:43 GMT)
UNION: Unsupervised 3D Object Detection using Object Appearance-based Pseudo-Classes [2.8] 教師なしの3Dオブジェクト検出手法が登場し、トレーニングに手動ラベルを必要とせずに膨大な量のデータを活用するようになった。
最近のアプローチでは、モバイルオブジェクトの検出を学習するために動的オブジェクトに依存しているが、トレーニング中に静的インスタンスの検出をペナルティ化している。
我々は空間クラスタリングと自己監督型シーンフローを用いて、LiDARから静的および動的オブジェクトの提案セットを得る。
その結果、静的および動的移動物体が一緒に得られ、既存の検出器は単一の訓練で訓練することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:24:34 GMT)
RL-STaR: Theoretical Analysis of Reinforcement Learning Frameworks for Self-Taught Reasoner [2.8] 自己学習推論(STaR)フレームワークは、強化学習を使用して推論ステップを自動的に生成する。
STaRとその変種は経験的成功を示しているが、これらの改善を説明する理論的基盤は欠如している。
この研究は、CoT推論とSTaRにおける強化学習の有効性を理解するための理論的枠組みを提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:17:53 GMT)
Building Multi-Agent Copilot towards Autonomous Agricultural Data Management and Analysis [2.8] 我々はADMA Copilotと呼ばれる概念実証マルチエージェントシステムを構築し,ユーザの意図を理解する。
ADMA Copilotは、LSMベースのコントローラ、入力フォーマッター、出力フォーマッターの3つのエージェントが協調して、自動的にタスクを実行する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:15:14 GMT)
Denoising Diffusion Models for Anomaly Localization in Medical Images [2.7] 医用画像の異常な局所化への応用に適したデータセットと評価指標について概説する。
我々は,検出バイアス,ドメインシフト,計算コスト,モデル解釈可能性など,異常局所化におけるオープンな課題を強調した。
我々のゴールは、この分野における最先端技術の概要を提供し、研究ギャップを概説し、医用画像におけるロバストな異常な局所化のための拡散モデルの可能性を明らかにすることである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:23:19 GMT)
Low-light Pedestrian Detection in Visible and Infrared Image Feeds: Issues and Challenges [2.7] 本研究は, 低照度歩行者検出手法の最近の展開を概観する。
地域ベースから非地域ベース、グラフベースの学習方法論まで、様々なアルゴリズムを体系的に分類し分析する。
高度な歩行者検出アルゴリズムの研究と開発に使用できる重要なベンチマークデータセットを概説する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:52:52 GMT)
Leveraging LLMs for MT in Crisis Scenarios: a blueprint for low-resource languages [2.6] 堅牢で適応可能な機械翻訳(MT)システムの必要性は、これまで以上に迫っている。
本研究では,Large Language Models (LLMs) とMultilingual LLMs (MLLMs) を利用して,このようなシナリオにおけるMT機能の向上を図る。
本研究は,LLMの最先端機能と微調整技術とコミュニティ主導型コーパス開発戦略を組み合わせた新しいアプローチを概説する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:52:26 GMT)
Exploring Behavior-Relevant and Disentangled Neural Dynamics with Generative Diffusion Models [2.6] 行動の神経基盤を理解することは神経科学の基本的な目標である。
私たちのアプローチは、BeNeDiff'と呼ばれるもので、まずきめ細やかな神経部分空間を識別します。
次に、最先端の生成拡散モデルを使用して、各潜伏因子の神経力学を解釈する行動ビデオを合成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:43:04 GMT)
Distributing Intelligence in 6G Programmable Data Planes for Effective In-Network Deployment of an Active Intrusion Detection System [2.6] 本研究の目的は、将来のプログラマブルネットワークの典型的なデータプレーン内のデバイスが%分類と異常検出能力を有し、完全に分散した方法で協調してML対応アクティブ侵入検知システムとして機能する破壊的パラダイムを提案することである。
報告された概念実証実験は、提案されたパラダイムによって、デバイス全体のCPUやRAMリソースの削減を図りながら、効果的かつ良好な精度で作業することが可能であることを実証している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:14:15 GMT)
Deep Learning Frameworks for Cognitive Radio Networks: Review and Open Research Challenges [2.6] ディープラーニングは、認知無線ネットワークにおける最も重要な問題に対処するための強力なツールであることが証明されている。
この記事では、将来のB5G/6Gサービス開発の基礎となる、潜在的なソリューションに関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:04:33 GMT)
A Longitudinal Analysis of Racial and Gender Bias in New York Times and Fox News Images and Articles [2.5] New York Times(NYT)とFox News(Fox)の123,337枚の画像と441,321個のオンラインニュース記事のデータセットを使用します。
ニュース記事に埋め込まれた画像における人種・性別集団の出現頻度と優位性について検討する。
NYTはFoxに比べて、人種的少数派のイメージが圧倒的に多いことがわかりました。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:13:08 GMT)
Optimizing Structured Data Processing through Robotic Process Automation [2.4] 本研究では、構造化データ抽出における RPA の利用について検討し、手作業による処理よりもその優位性を評価する。
人為的なタスクとRPAソフトウェアボットが実行するタスクを比較することにより、請求書からのデータ抽出の効率性と精度を評価する。
本研究は,ロボットが作業の完了を手作業よりもはるかに少ない時間で行うことにより,RPAが達成した顕著な効率向上を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:23:42 GMT)
Optimizing Structured Data Processing through Robotic Process Automation [2.4] 本研究では、構造化データ抽出における RPA の利用について検討し、手作業による処理よりもその優位性を評価する。
人為的なタスクとRPAソフトウェアボットが実行するタスクを比較することにより、請求書からのデータ抽出の効率性と精度を評価する。
本研究は,ロボットが作業の完了を手作業よりもはるかに少ない時間で行うことにより,RPAが達成した顕著な効率向上を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:23:42 GMT)
Eddeep: Fast eddy-current distortion correction for diffusion MRI with deep learning [2.4] 画像間の対応を復元する画像トランスレータを提案する。
また,翻訳画像の整列化のための登録モデルを提案する。
この研究は、私たちの知る限りでは、ディープラーニングでこの問題に最初に取り組みます。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:05:50 GMT)
Extended Reality for Enhanced Human-Robot Collaboration: a Human-in-the-Loop Approach [2.3] 人間とロボットのコラボレーションは、機械の強さと精度と人間の創造性と知覚的理解を組み合わせることで、これらの課題に取り組みます。
本稿では,人間のループ内原理を取り入れた自律型機械学習ベースのマニピュレータの実装フレームワークを提案する。
概念的枠組みは、ロボット学習プロセスに直接人間の関与を予測し、より高い適応性とタスクの一般化をもたらす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:33:32 GMT)
Gaussian Universality in Neural Network Dynamics with Generalized Structured Input Distributions [2.3] ガウス混合体としてモデル化された入力に基づいて学習したディープラーニングシステムの振る舞いを分析し,より汎用的な入力をシミュレートする。
特定の標準化スキームの下では、入力データがより複雑あるいは実世界の分布に従う場合でも、ディープラーニングモデルはガウス的な設定行動に収束する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:23:15 GMT)
Assessing the Efficacy of Classical and Deep Neuroimaging Biomarkers in Early Alzheimer's Disease Diagnosis [2.3] アルツハイマー病(AD)は認知症の主要な原因であり、早期発見は効果的な介入に不可欠である。
本研究の目的は,様々な画像バイオマーカーを抽出し,統合することにより,早期ADの有意な指標を検出することである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:02:16 GMT)
Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification? [2.2] 大規模言語モデル(LLM)は、最近、時間的推論タスクで有望なパフォーマンスを示した。
最近の研究は、閉ソースモデルのみの時間的関係を検出するためにLLMの性能を検証している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:15:49 GMT)
Leveraging Large Language Models for Medical Information Extraction and Query Generation [2.2] 本稿では,大言語モデル(LLM)を臨床試験検索プロセスに統合するシステムを提案する。
クエリ生成には6つのLCMを評価し,最小限の計算資源を必要とする,オープンソースと比較的小さなモデルに着目した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:01:51 GMT)
Reinforcement Learning with Adaptive Regularization for Safe Control of Critical Systems [2.1] 安全なRL探索を可能にするアルゴリズムである適応正規化(RL-AR)を提案する。
RL-ARは「フォーカスモジュール」を介してポリシーの組み合わせを行い、状態に応じて適切な組み合わせを決定する。
一連のクリティカルコントロールアプリケーションにおいて、RL-ARはトレーニング中の安全性を保証するだけでなく、モデルフリーなRLの標準との競合も得ることを示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:44:50 GMT)
A Recipe for Geometry-Aware 3D Mesh Transformers [2.1] 本研究では, ノード数可変のパッチを収容するパッチレベルで, 特徴を埋め込む手法について検討する。
本研究は,1)一般的な3次元メッシュトランスフォーマにおける熱拡散による構造的および位置的埋め込みの重要性,2)学習の強化における測地的マスキングや機能的相互作用といった新しい要素の有効性,3)セグメント化と分類作業の課題における提案手法の優れた性能と効率性など,重要な知見を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:13:31 GMT)
Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.1] 本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:37:22 GMT)
Nesterov acceleration despite very noisy gradients [2.0] 我々はネステロフの加速勾配降下アルゴリズムの一般化を提案する。
AGNESは滑らかな凸と強い凸最小化タスクの加速を達成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:44:26 GMT)
LBurst: Learning-Based Robotic Burst Feature Extraction for 3D Reconstruction in Low Light [2.0] 本研究では,低照度環境下での3次元再構成を,バースト中の特徴を見出すことにより改善する学習アーキテクチャを提案する。
提案手法は,低信号対雑音比画像における高品質な真の特徴の検出と記述により,視覚的再構成を促進する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:08:36 GMT)
E(3)-invariant diffusion model for pocket-aware peptide generation [2.0] コンピュータ支援型インヒビター発見の新しい手法として,de novo pocket-aware peptide structureとシーケンス生成ネットワークを提案する。
以上の結果から,本手法は最先端モデルに匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:49:29 GMT)
Error Threshold of SYK Codes from Strong-to-Weak Parity Symmetry Breaking [2.0] SYKモデルの情報理論能力とその変種に及ぼすデコヒーレンスの影響について検討する。
強フェルミオンパリティ対称性雑音の下では、混合状態はフェルミオンパリティの強から弱自発的対称性の破れを受ける。
この結果は,現実的な量子シナリオにおけるワームホールトラバーサビリティの低下を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:59 GMT)
Novel Clinical-Grade Prostate Cancer Detection and Grading Model: Development and Prospective Validation Using Real World Data, with Performance Assessment on IHC Requested Cases [2.0] 本研究では,前立腺癌検出,グレーディング,ワークフロー最適化のための制度的に開発されたシステムの性能について検討した。
We developed model for cancer detection, grading and screening of equivocal case for IHC ordering。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:29:18 GMT)
Restoring Kibble-Zurek Scaling and Defect Freezing in Non-Hermitian Systems under Biorthogonal Framework [1.9] 時間依存型生物直交量子フォーマリズムに基づく理論的枠組みを開発する。
線形駆動非エルミート系の非断熱力学について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 05:01:00 GMT)
EARL-BO: Reinforcement Learning for Multi-Step Lookahead, High-Dimensional Bayesian Optimization [1.9] 本稿では,高次元ブラックボックス最適化問題におけるマルチステップルックアヘッドBOのための新しい強化学習(RL)フレームワークを提案する。
まず、RLエージェントに知識の状態を表現し、初期訓練を加速するために、政治以外の学習を取り入れたアテンション・ディープセット・エンコーダを紹介する。
次に、エンドツーエンド(エンコーダRL)の政治学習に基づくマルチタスクの微調整手順を評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:33:21 GMT)
Multi-zone trapped-ion qubit control in an integrated photonics QCCD device [1.8] 大規模アーキテクチャにおいて、多重化操作と多重トラップサイトに対する拡張コヒーレント制御は、トラップイオンプロセッサの基本要件である。
多数のゾーンにスケーラブルなフォトニック部品を集積した表面電極トラップを用いて,これらのビルディングブロックを実演する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:24:31 GMT)
From Explicit Rules to Implicit Reasoning in an Interpretable Violence Monitoring System [1.8] 本稿では,ルールベース暴力監視(RuleVM)と呼ばれる,弱監視型暴力監視(WSVM)のための新しいパラダイムを提案する。
提案したRe RuleVMは、イメージとテキストの異なる設計にデュアルブランチ構造を使用する。
明示的なブランチにおける言語チャネル設計のために、提案したRe RuleCLIPは、最先端のYOLO-Worldモデルを使用して、ビデオフレーム内のオブジェクトやアクションを検出する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:24:06 GMT)
Deep Submodular Peripteral Networks [1.8] 本稿では,新しいサブモジュラー関数群であるディープサブモジュラー・ペプタラル・ネットワーク(DSPN)とその訓練方法を紹介する。
本研究では,DSPNがコストのかかるサブモジュール関数からサブモジュール性を学ぶことの有効性を実証し,実験的設計とオンラインストリーミングアプリケーションの両方においてその優位性を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:34:57 GMT)
Monomial Matrix Group Equivariant Neural Functional Networks [1.8] ネットワーク重みに対するグループアクションの研究を、スケーリング/サイン・フリップの対称性を取り入れて拡張する。
我々はNFNの新しいファミリーをMonomial Matrix Group Equivariant Neural Functional Networks (Monomial-NFN)と名付けた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:55:21 GMT)
Noise as a Double-Edged Sword: Reinforcement Learning Exploits Randomized Defenses in Neural Networks [1.8] 本研究では,騒音による防御が,特定のシナリオにおける回避攻撃を不注意に支援する可能性について検討する。
ノイズベースの防御は、RL攻撃者に有益な敵の訓練ループを不注意に作成する場合もある。
ランダム性は、回避攻撃に対する防衛を普遍的に強化する、という仮定に挑戦する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:22:19 GMT)
Responsibility-aware Strategic Reasoning in Probabilistic Multi-Agent Systems [1.8] 責任は、信頼できる自律システムの開発と展開において重要な役割を果たす。
本稿では,確率的交代時間論理の変種であるPATL+Rを提案する。
本稿では,PATL+Rで指定された結果を満たす共同戦略の合成手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:49:12 GMT)
Stochastic Reconstruction of Gappy Lagrangian Turbulent Signals by Conditional Diffusion Models [1.8] 本研究では, 乱流によって受動的に対流する小物体の軌道に沿って, 空間・速度の欠落を再現する手法を提案する。
近年提案されているデータ駆動機械学習技術である条件付き生成拡散モデルを利用する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:26:10 GMT)
Optimality Condition for the Transpose Channel [1.8] 量子誤差補正において、ペッツ変換チャネルは、クニル・ラフラム条件が満たされたときに完全回復写像として機能する。
この研究は、トランスポーズチャネルの厳密な最適性に必要な、そして十分な条件を初めて導入し、証明する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:20:12 GMT)
WindsorML: High-Fidelity Computational Fluid Dynamics Dataset For Automotive Aerodynamics [1.7] 本稿では,Windsorボディの355の幾何学的変種を含む機械学習(ML)のための,オープンソースの新しい高忠実度データセットを提案する。
著者らにとってこれは、許容オープンソースライセンス(CC-BY-SA)を持つWindsorボディのための、最初の大規模高忠実CFDデータセットである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:15:11 GMT)
Conformal prediction of circular data [1.6] 円形応答を伴う回帰問題に対して分割共形予測法を適用した。
我々は、任意の線形応答回帰モデルを円形応答に適した形式に変換する一般的なプロジェクション手順を解析する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:05:52 GMT)
Project Sid: Many-agent simulations toward AI civilization [1.6] 10から1000以上のAIエージェントがエージェント社会の中でどのように行動し、進歩するかを実証する。
まず,PIANOアーキテクチャを導入し,エージェントが人間や他のエージェントとリアルタイムで対話できるようにする。
次に,人史に触発された文明的ベンチマークを用いてエージェントシミュレーションにおけるエージェント性能を評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:11:22 GMT)
Measuring Responsibility in Multi-Agent Systems [1.6] マルチエージェントプランニングにおける責任の定量的尺度のファミリーを紹介する。
行動と責任の確率を3つの指標でリンクすることで、特定の結果のエージェントに責任を割り当てます。
エントロピーに基づく責任測定は、時間の経過とともに結果の因果責任特性を捉えた最初のものである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:45:34 GMT)
Quantum Deep Equilibrium Models [1.6] 本稿では,量子機械学習モデルのパラメータを学習するトレーニングパラダイムであるQuantum Deep Equilibrium Models (QDEQ)を紹介する。
QDEQは、既存の同等のベースラインモデルと競合するだけでなく、5倍以上のレイヤを持つネットワークよりも高いパフォーマンスを実現している。
このことは、QDEQパラダイムが与えられたタスクに対してより浅い量子回路を開発するのに利用できることを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:54:37 GMT)
Syno: Structured Synthesis for Neural Operators [1.6] 我々は,実用的なニューラル演算子合成を実現するために,エンドツーエンドのフレームワークであるSynoを開発した。
我々は、NAS最適化モデルでさえ、Synoが平均2.06タイムのスピードアップと1%以下の精度損失でより良い演算子を発見することを実証した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:00:24 GMT)
Investigating Bias in Political Search Query Suggestions by Relative Comparison with LLMs [1.5] 検索クエリの提案のバイアスは、バイアスされた検索結果に露出し、意見の形成に影響を与える可能性がある。
我々は、英語の検索クエリー提案において、バイアスを特定し定量化するために、多段階のアプローチを用いる。
われわれのアプローチを米国の政治ニュース分野に適用し、GoogleとBingの偏見を比較する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:40:38 GMT)
Compact optical waveform generator with digital feedback [1.5] 原子、イオン、分子に基づく量子技術の鍵となる要件は、コヒーレントレーザーパルスによる正確な量子演算を実現する能力である。
本稿では、ユーザが指定したレーザー振幅と位相変調のためのダブルパスアコスト光変調器を統合する、コンパクトな任意の波形生成器を提案する。
我々は,180,ns以下の量子論理を実現するのに適した形状のレーザーパルスを生成することで,少数のフィードバックゲートしか必要とせず,その性能を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:25:50 GMT)
Whole-Herd Elephant Pose Estimation from Drone Data for Collective Behavior Analysis [1.4] この研究は、野生でのゾウの行動を研究するために、ドローンデータから自動ポーズ推定の先駆的な応用である。
実験室での利用で知られているDeepLabCutと、野生生物の行動研究には適用されていない新しいポーズ推定モデルYOLO-NAS-Poseの2つのポーズ推定モデルを評価する。
どちらも、テストセット上でのポーズ推定の許容品質を示し、ゾウ群集の動態を研究する上で不可欠な基本的な行動の自動検出を容易にした。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:26:59 GMT)
M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and Multispectral Data [1.4] M3LEOはマルチモーダルでマルチラベルの地球観測データセットである。
6つの地理的領域から約17M 4x4 kmのデータチップにまたがる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:18:14 GMT)
Using Deep Neural Networks to Quantify Parking Dwell Time [1.4] スマートシティでは、駐車スペースの最大滞在距離を定義して空間の回転性を高めることが一般的である。
本稿では,2つのディープニューラルネットワークを組み合わせることで,駐車場内の各車の滞留時間を計算する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:02:46 GMT)
Derivative-Free Optimization via Finite Difference Approximation: An Experimental Study [1.4] 微分自由最適化(DFO)は、関数評価のみをオラクルで利用できるような複雑な最適化問題の解決に不可欠である。
2つの古典的なイテレーションアプローチは、Kiefer-Wolfowitz (KW) と同時摂動近似 (SPSA) アルゴリズムである。
本稿では,これらの手法の総合的な比較実験を行う。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:07:44 GMT)
SRA: A Novel Method to Improve Feature Embedding in Self-supervised Learning for Histopathological Images [1.3] SRA(stent reconstruction augmentation)と呼ばれる新しい病理組織特異的画像強調法を提案する。
我々は、SRAとMoCo v3を統合する。これは、自己教師型コントラスト学習における主要なモデルであり、新たなコントラスト損失項を付加し、新しいモデルであるSRA-MoCo v3と呼ぶ。
我々のSRA-MoCo v3は、さまざまな下流タスクで標準のMoCo v3を常に上回り、より大規模な病理組織データセットで事前トレーニングされた他の基盤モデルと同等または優れたパフォーマンスを達成しています。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:15:43 GMT)
Boosting Code-Switching ASR with Mixture of Experts Enhanced Speech-Conditioned LLM [1.3] 我々は,Mixture of Experts (MoE) ベースのコネクタと統合された音声条件付き大規模言語モデル (LLM) を提案する。
音声認識タスクへのLLMのテキスト生成能力を向上するためのIDIT機構を提案する。
また、複数の言語を効率的に管理するMoEアーキテクチャとのコネクタも提示する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:26:11 GMT)
EchoNarrator: Generating natural text explanations for ejection fraction predictions [1.3] 左心室 (LV) の放出率 (EF) は, 急性心不全の診断において最も重要な測定基準の1つである。
近年のディープラーニング研究の成功はEF値の推定に成功しているが、提案されたモデルには予測に関する説明がないことが多い。
本稿では,複数のフレーム上でのLV輪郭の推定と,様々な動きや形状の属性を計算するためのモジュールとルーチンのセットを組み合わせるモデルを提案する。
そして、属性を大きな言語モデルに入力し、人間のような方法でネットワークの結果を説明するのに役立つテキストを生成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:59:34 GMT)
Transformer Guided Coevolution: Improved Team Formation in Multiagent Adversarial Games [1.2] そこで本稿では,Masked Language Modelトレーニングを用いたトランスフォーマーに基づくディープニューラルネットワークを用いて,トレーニング対象者の最適なチームを選択するアルゴリズムを提案する。
我々は,マルチエージェント対逆ゲーム「Marine Capture-The-Flag」で本アルゴリズムを検証した結果,BERTeam が非自明なチーム構成を学習し,見知らぬ相手に対して良好に動作していることが判明した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:59:53 GMT)
Human Action Recognition (HAR) Using Skeleton-based Quantum Spatial Temporal Relative Transformer Network: ST-RTR [1.1] 量子時空間相対変換器ST-RTRモデルを開発した。
ネットワーク内の効率的な通信とデータ転送を可能にするジョイントノードとリレーノードが含まれる。
標準ST-GCN法と関連する動作認識を大幅に改善する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:46:11 GMT)
Neural Network Verification with PyRAT [1.1] ニューラルネットワークの安全性を検証するための抽象解釈に基づくツールであるPyRATを提案する。
本稿では、ニューラルネットワークの到達可能な状態を見つけるために、PyRATが使用するさまざまな抽象化について述べる。
PyRATはすでに安全保証のためにいくつかの共同作業で使われており、その2位はVNN-Comp 2024で行われた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:05:46 GMT)
Learning quantum states prepared by shallow circuits in polynomial time [1.1] 有限次元格子上に$vertpsirangle$を作成する定数深さ量子回路を学習する。
このアルゴリズムは、$U$の深さが$mathrmpolylog(n)$であり、準多項式実行時である場合に拡張される。
応用として、格子上の未知の量子状態が量子回路の複雑さが低いか高いかをテストするための効率的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:12:49 GMT)
Linking In-context Learning in Transformers to Human Episodic Memory [1.1] 我々は,トランスフォーマーに基づく大規模言語モデルにおいて,文脈内学習に寄与する帰納的頭部に焦点を当てた。
本研究では,インダクションヘッドの動作,機能,機械的特性が,ヒトのエピソード記憶の文脈的保守と検索モデルに類似していることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:15:40 GMT)
Training and Evaluating Causal Forecasting Models for Time-Series [1.1] 統計的学習フレームワークを拡張して、トレーニング分布外の行動の効果を予測する際に、より一般化した因果的時系列モデルをトレーニングする。
我々は、経済で人気のある回帰不連続デザインを活用して、因果治療効果のテストセットを構築します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:27:54 GMT)
LLM-Inference-Bench: Inference Benchmarking of Large Language Models on AI Accelerators [1.1] LLM(Large Language Models)は、複数のドメインにまたがる画期的な進歩を推進し、テキスト生成アプリケーションに一般的に使われている。
LLMのハードウェア推論性能を評価するための総合ベンチマークスイートであるLLM-Inference-Benchを紹介する。
ベンチマークの結果、さまざまなモデル、ハードウェアプラットフォーム、推論フレームワークの長所と短所が明らかになりました。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:34:59 GMT)
RPS: A Generic Reservoir Patterns Sampler [1.1] 本稿では,ストリーミングバッチデータからの直接パターンサンプリングを容易にするために,重み付き貯水池を利用する手法を提案する。
本稿では、時間的バイアスに対処し、逐次的、重み付け、および非重み付けを含む様々なパターンタイプを処理できる汎用アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:25:21 GMT)
Metamorphic Malware Evolution: The Potential and Peril of Large Language Models [1.1] LLM/Transformerモデルに基づく自己テストプログラム変異エンジンを作成するためのフレームワークを提案する。
提案するフレームワークは、次世代の変成マルウェア検出エンジンをテストする上で不可欠なツールである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:53:56 GMT)
Novel Architecture for Distributed Travel Data Integration and Service Provision Using Microservices [1.0] 本稿では,航空会社予約システムの柔軟性と性能を向上させるアーキテクチャを提案する。
設計にはRedisキャッシュ技術、KafkaとRabbitMQの2つの異なるメッセージングシステム、アーキテクチャストレージの2つのタイプ(MongoDBとDocker)が含まれている。
このアーキテクチャは、99.5%の素晴らしいレベルのデータ一貫性と、75ms未満のデータ伝搬の遅延を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:41:14 GMT)
Evaluating LLMs on Entity Disambiguation in Tables [1.0] 本研究は,Alligator(旧s-elbat),Dagobah,TURL,TableLlamaの4つのSTI SOTAアプローチを広範囲に評価することを提案する。
また, GPT-4o と GPT-4o-mini は, 様々な公開ベンチマークにおいて優れており, 評価に含めている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:43:01 GMT)
Evaluating LLMs on Entity Disambiguation in Tables [1.0] 本研究は,Alligator(旧s-elbat),Dagobah,TURL,TableLlamaの4つのSTI SOTAアプローチを広範囲に評価することを提案する。
また, GPT-4o と GPT-4o-mini は, 様々な公開ベンチマークにおいて優れており, 評価に含めている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:43:01 GMT)
Leveraging Large Language Models for Code Translation and Software Development in Scientific Computing [1.0] 生成人工知能(GenAI)は、科学計算における生産性を変革する。
我々は、コード変換の効率的なプロセスを確立するために、プロンプトエンジニアリングとユーザ管理を組み合わせたCodeScribeというツールを開発した。
AIによるコード翻訳の課題にも対処し、科学計算における生産性向上のメリットを強調します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:48:41 GMT)
Disentangling Interpretable Factors with Supervised Independent Subspace Principal Component Analysis [1.0] Supervised Independent Subspace principal Component Analysis (texttsisPCA$)は、マルチサブスペース学習用に設計されたPCA拡張である。
乳がん診断などの広範囲な応用を通して,隠れたデータ構造を同定し,分離する能力を示す。
以上の結果から,高次元データ解析における説明可能な表現の重要性を浮き彫りにして,マラリアの定着に伴う機能的経路を明らかにした。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:09:40 GMT)
Aerial Flood Scene Classification Using Fine-Tuned Attention-based Architecture for Flood-Prone Countries in South Asia [1.0] 南アジア諸国の洪水の航空画像を集めた新しいデータセットを作成しました。
そこで本研究では,CCT(Compact Convolutional Transformer)に基づく手法を提案する。
また、YOLOv8オブジェクト検出モデルを実装し、画像内の家や人間を検出する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:23:43 GMT)
Dynamic Accountable Storage: An Efficient Protocol for Real-time Cloud Storage Auditing [0.9] Ateniese, Goodrich, Lekakis, Papamanthou, Paraskevas, TamassiaはAccountable Storageプロトコルを導入した。
クライアントがクラウドストレージを定期的に監査する効率的な方法であるDynamic Accountable Storageを紹介します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:18:58 GMT)
Kermut: Composite kernel regression for protein variant effects [0.9] プロセス回帰モデルであるKermutと、突然変異類似性をモデル化するための新しい複合カーネルを提供する。
不確実性推定の品質分析は、我々のモデルが全体キャリブレーションの有意義なレベルを提供することを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:52:28 GMT)
Quantum algorithm for large-scale market equilibrium computation [0.9] サブ線形性能を持つ市場均衡計算のための最初の量子ランタイムアルゴリズムを提供する。
提案アルゴリズムは,従来のアルゴリズムと客観的な最適化値に到達しつつ,購入者数や商品数の観点からも,実行時の高速化を実現する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:37:46 GMT)
Average Controlled and Average Natural Micro Direct Effects in Summary Causal Graphs [0.9] 概略因果グラフで表される因果系における平均制御直結効果と平均自然直結効果の同定可能性について検討する。
特に、要約因果グラフから平均制御マイクロダイレクト効果と平均自然マイクロダイレクト効果を識別するのに十分な条件を与える。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:30:33 GMT)
Experimental Demonstration of a Quantum-Optimal Coronagraph Using Spatial Mode Sorters [0.9] 本研究では、空間モードフィルタリングを用いて、外惑星検出と位置決めの量子限界を達成できる理想的な直接画像コロナグラフの設計実験を行う。
主星のかすかな伴星を準回折スケールで解く能力は、準回折系に存在すると予測される太陽系外惑星の発見をさらに促進するために重要である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:56:07 GMT)
Space for Improvement: Navigating the Design Space for Federated Learning in Satellite Constellations [0.8] 衛星コンステレーションの設計とハードウェア対応テストプラットフォームであるFLySTacKを用いて,既存のFLアルゴリズムの空間化手法を開発した。
我々はAutoFLSatを紹介した。これは空間に対する一般化された階層的な自律的FLアルゴリズムであり、主要な代替手段よりも12.5%から37.5%のモデルトレーニング時間を短縮する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:49:36 GMT)
Advanced Predictive Quality Assessment for Ultrasonic Additive Manufacturing with Deep Learning Model [0.8] 本研究では,深層学習に基づく畳み込みニューラルネットワーク(CNN)を用いたプロセス内品質監視手法を開発した。
CNNモデルは、5つのパワーレベルにまたがる熱カップリングを組み込んだサンプルを分類する能力について評価した。
97%を超える高い精度は、UAMプロセス内の条件を特定し分類するシステムの有効性を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:48:36 GMT)
HiBO: Hierarchical Bayesian Optimization via Adaptive Search Space Partitioning [0.8] HiBOは,グローバルレベルの検索空間分割情報をローカルBOベースの取得戦略に統合した,新しい階層型アルゴリズムである。
一連の評価は、HiBOが高次元の合成ベンチマークにおいて最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:15:14 GMT)
Decision-focused predictions via pessimistic bilevel optimization: a computational study [0.7] 最適化パラメータの不確かさは、重要かつ長年にわたる課題である。
予測モデルを構築して,それを用いた意思決定の文言的指標を測定します。
トラクタビリティを実現するために,様々な計算手法を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:29:42 GMT)
DiffBatt: A Diffusion Model for Battery Degradation Prediction and Synthesis [0.7] 本稿では,電池劣化予測と合成のための新しい汎用モデルDiffBattを紹介する。
老化挙動の不確実性を捉える確率モデルと、バッテリー劣化をシミュレートする生成モデルとして機能する。
すべてのデータセットの平均RMSEは196サイクルであり、他のモデルよりも優れ、より優れた一般化性を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:53:53 GMT)
Computable and noncomputable in the quantum domain: statements and conjectures [0.7] 本稿では,量子コンピュータによって解を加速できる問題のクラスを記述するためのアプローチを検討する。
初期量子状態を所望の状態に変換するユニタリ演算は、1ビットと2ビットのゲートの列に分解可能である必要がある。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:45:04 GMT)
Pessimism of the Will, Optimism of the Intellect: Fair Protocols with Malicious but Rational Agents [0.7] フェアネスプロトコルの研究のためのゲームベースのフレームワークを提案する。
強いセキュア均衡の概念に基づいており、ゲーム理論の概念的およびアルゴリズム的ツールボックスを利用する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:36:04 GMT)
A Multi-Modal Approach for Face Anti-Spoofing in Non-Calibrated Systems using Disparity Maps [0.6] 顔認識技術は、顔の偽造攻撃に対して脆弱である。
ステレオ深度カメラはこのような攻撃を効果的に検出できるが、その高いコストで採用が制限される。
本稿では,顔の特徴を利用して異質情報を導き出すことにより,この課題を克服する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:29:51 GMT)
A Universal Quantum Computer From Relativistic Motion [0.6] 本稿では,変動量子回路を用いた相対論的量子コンピューティングアーキテクチャの明示的な構築について述べる。
変分量子回路は、チューナブルな単一量子ビット回転と、連続的に実装されるエンタングルゲートからなる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:01:02 GMT)
On-Chip Verified Quantum Computation with an Ion-Trap Quantum Processing Unit [0.5] 本稿では、量子コンピューティングの検証とベンチマークのための新しいアプローチを提示し、実験的に実証する。
従来の情報理論的にセキュアな検証プロトコルとは異なり、我々のアプローチは完全にオンチップで実装されている。
我々の結果は、短期量子デバイスにおけるよりアクセスしやすく効率的な検証とベンチマーク戦略の道を開いた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:54:41 GMT)
Detrimental non-Markovian errors for surface code memory [0.5] 非マルコフ相関誤差の構造とそれらの表面コードメモリ性能への影響について検討する。
解析の結果、時間的相関構造はすべて有害な構造ではないが、特定の構造、特にマルチタイムの「不安定な」相関は、論理的誤り率のスケーリングを著しく低下させることが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:52:21 GMT)
VE: Modeling Multivariate Time Series Correlation with Variate Embedding [0.5] 現在のチャネル非依存(CI)モデルとCI最終射影層を持つモデルは相関を捉えることができない。
可変埋め込み(VE)パイプラインを提案し,各変数に対して一意かつ一貫した埋め込みを学習する。
VEパイプラインは、CI最終プロジェクション層を持つ任意のモデルに統合して、多変量予測を改善することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:47:32 GMT)
To Spike or Not to Spike, that is the Question [0.5] SNNは生物学的ニューロンの時間的ダイナミクスをエミュレートし、リアルタイムのイベント駆動処理に適している。
SNNでは、学習規則はニューロンのスパイク行動に基づいており、ニューロンのスパイク閾値を超える膜電位によってスパイクが生じる場合である。
本研究は、SNNにおける重みとともに、ニューロン学習閾値の重要性に焦点を当てる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:45:37 GMT)
A Novel Breast Ultrasound Image Augmentation Method Using Advanced Neural Style Transfer: An Efficient and Explainable Approach [0.4] 本研究では,高度なニューラルスタイル転送と説明可能なAI(XAI)を用いた,BUS画像の効率的な拡張手法の開発を目的とする。
800個の良性BUS画像(348個の良性BUS画像と452個の悪性BUS画像)で評価し,その性能を他の進行的手法を用いて解析した。
その結果、提案手法は、92.47%の精度でBUS画像の増大に成功できることが示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:18:29 GMT)
Enhanced Secure Transmission of Medical Images through OFDM using Hyperchaotic Systems [0.4] 本研究は、OFDM, 6D hyperchaotic system, Fibonacci Q-matrixを併用した安全な医用画像伝送システムを提案する。
この結果から,高品質な医用画像のセキュア伝送におけるOFDMの有効性が示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:34:37 GMT)
Reasoning and Tools for Human-Level Forecasting [0.4] 本稿では,Reasoning and Tools for Forecasting (RTF)について紹介する。
我々は,競争予測プラットフォームからの質問でモデルを評価し,本手法が人間の予測に勝るものであることを実証した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:08:03 GMT)
An Empirical Analysis of Speech Self-Supervised Learning at Multiple Resolutions [0.3] 我々は,CCA(Canonical correlation Analysis)とMI(Mutual Information)に着目し,マルチスケールアーキテクチャにおけるレイヤワイズ表現の初期解析を行う。
SuPERBタスクの性能改善は、主にダウンサンプリング自体よりも、補助的な低分解能損失によるものであることが判明した。
これらの知見はMR-HuBERTのマルチスケールな性質に関する仮定に挑戦し、より良い表現の学習から計算効率を遠ざけることの重要性を動機付けている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:09:05 GMT)
Clustering to Minimize Cluster-Aware Norm Objectives [0.3] 与えられたデータセットの$P$を$k$クラスタに分割し、$X$の$k$センターを見つける。
中心の$xin X$で表されるクラスタのコストは、x$に割り当てられた点の距離のベクトルの単調で対称なノルム$f$(インナーノルム)である。
目標は、クラスタコストのベクトルのノルム$g$(外部ノルム)を最小化することである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:33:40 GMT)
Ethics of Software Programming with Generative AI: Is Programming without Generative AI always radical? [0.3] ソフトウェアコード生成におけるGenAIの変換能力を認めている。
GenAIは代替ではなく、ソフトウェアコードを書くための補完的なツールである、と仮定する。
厳格な倫理的ガイドラインを提唱する論文では、倫理的考慮が最重要である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:55:48 GMT)
Chasing shadows with Gottesman-Kitaev-Preskill codes [0.3] 本稿では,Gottesman-Kitaev-Preskill(GKP)誤り訂正コードを用いて定義された論理サブシステムのシャドウトモグラフィーを行うタスクについて考察する。
特に,変位演算子とガウスユニタリによるCV-POVMのツイリングによる論理的シャドウトモグラフィープロトコルを構築する。
光子パリティ測定では、論理的なGKPシャドウトモグラフィーは、適切なサンプリングスキームを開発するウィグナーサンプリングプロトコルと等価である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:16:06 GMT)
Superfluid Stiffness and Flat-Band Superconductivity in Magic-Angle Graphene Probed by cQED [0.3] 魔法の角をねじった二層グラフェン(MATBG)の超伝導は、ムーア系の研究に強い関心を持つトピックである。
我々は、MATBGの超流動剛性を直接測定するために、直流輸送およびマイクロ波回路量子力学を用いる。
以上の結果から,MATBGは異方性ギャップを有する常温超伝導体であり,量子幾何学,超流動剛性,非常温超伝導とのつながりが強く示唆された。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:37:37 GMT)
Learning State Preparation Circuits for Quantum Phases of Matter [0.3] 本研究では,多体系の基底状態に対する状態準備回路を得るためのフレキシブルで効率的なフレームワークを提案する。
我々は、定数深度回路に対して頑健な量子マルコフ連鎖条件の変種を用いる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:10:46 GMT)
More global randomness from less random local gates [0.3] 非ハールランダムな局所ゲートを持つ一次元ランダム回路は、同じ回路構造を持つハールランダム回路に比べて、かなり大域的ランダム性を示すことが証明された。
本研究は、ランダム化ベンチマークのための回路深さ境界の改善と、浅いランダム回路からの近似ユニタリな2-設計の生成に応用できる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:51:52 GMT)
Testing the Wineland Criterion with Finite Statistics [0.2] ワインランドパラメータは、全角モーメントの期待と分散からスピンスクイーズ状態と呼ばれる、気象学的に有用な絡み合った状態を検出することを目的としている。
ここでは、仮説テストとしてワインランドパラメータに従って状態がスピンスキーズされるかどうかという問題を定式化する。
多くの場合、非スピン圧縮状態がp値5%以下で測定されたという仮説は否定できない。
また, 観測結果のほとんどを5%を超えるp値で再現したワインランドパラメータに従って, 明示的な非スピン圧縮状態も見いだした。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:56:09 GMT)
Protecting Feed-Forward Networks from Adversarial Attacks Using Predictive Coding [0.2] 逆の例は、機械学習(ML)モデルが誤りを犯すように設計された、修正された入力イメージである。
本研究では,敵防衛のための補助的なステップとして,予測符号化ネットワーク(PCnet)を用いた実用的で効果的な手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:38:05 GMT)
From broadband biphotons to frequency combs via spectral compression with time-varying cavities [0.2] バイフォトン周波数コムは量子ネットワークのための有望な資源である。
そこで本研究では,広帯域光子を2光子周波数コムに周期的に圧縮する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:50:08 GMT)
From Text to Emoji: How PEFT-Driven Personality Manipulation Unleashes the Emoji Potential in LLMs [0.2] インプロンプトベースのIn-Context Knowledge Editing (IKE) や勾配ベースのModel Editor Networks (MEND) などの手法が検討されているが、不規則性と変動性を示す。
我々はオピニオン・ベース・ファイン・チューニング(PEFT)を用いて、オープンネス、良心性、外転、アグレナブルネス、ニューロティシズムの5つの性格特性を操った。
説明可能性分析の結果、LLMはこれらの特徴を意図的に表現するために絵文字を使用していた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:34:17 GMT)
Exploring Vision Language Models for Facial Attribute Recognition: Emotion, Race, Gender, and Age [0.1] 画像に基づく人口動態の分析と表情の分析は、人間の顔特性の複雑さのためにいくつかの課題がある。
従来のアプローチでは、ラベル付き画像の広範なコレクションに基づいてトレーニングされたCNNやその他の様々なディープラーニング技術が採用されている。
本稿では,GPT,GEMINI,大規模言語・視覚アシスタント(LLAVA),PaliGemma,Microsoft Florence2などの視覚言語モデルを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:09:19 GMT)
Exploring the Knowledge Mismatch Hypothesis: Hallucination Propensity in Small Models Fine-tuned on Data from Larger Models [0.1] より大型のモデルからのデータを持つ微調整言語モデルは類似しているように見えるが、より大型のモデルよりも幻覚を呈することが多い。
1つの仮説は、より大きなモデルによって生成されたデータ上でモデルを微調整すると、幻覚に寄与する知識のミスマッチにつながるというものである。
未確認テストセットでは、より大きなモデルから生成されたデータに基づいて微調整された小さなモデルの方が、小さなモデルによって生成されたデータに基づいて微調整されたモデルと比較して、より間違った回答を得られることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:01:46 GMT)
Pipe-Cleaner: Flexible Fuzzing Using Security Policies [0.1] Pipe-CleanerはCコードの脆弱性を検出し解析するシステムである。
これは、タグベースのランタイムリファレンスモニターによって強制されるフレキシブルな開発者設計のセキュリティポリシーに基づいている。
いくつかのヒープ関連のセキュリティ脆弱性に対して、このアプローチの可能性を実証する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:35:22 GMT)
Neurobench: DCASE 2020 Acoustic Scene Classification benchmark on XyloAudio 2 [0.1] XyloAudioは超低消費電力オーディオ推論チップのシリーズだ。
リアルタイムエネルギー制約シナリオにおける音声の内・近マイクロホン解析のために設計されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:48:12 GMT)
Domain-Adaptive Pre-training of Self-Supervised Foundation Models for Medical Image Classification in Gastrointestinal Endoscopy [0.0] ビデオカプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供することで、消化管内視鏡(GIE)の診断を変換した。
ビデオカプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供することで、消化管内視鏡(GIE)の診断を変換した。
しかし、そのポテンシャルは、画像処理中に生成される画像の量によって制限されており、それは6~8時間で最大100万枚の画像を生成することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:44:26 GMT)
Work Extraction from a Controlled Quantum Emitter [0.0] 外部駆動場は、2レベル量子システム(TLS)である量子エミッタから抽出可能な作業量を制御することができる。
このシナリオでは、TLSは量子電池として機能し、制御フィールドが充電している間に放出するフォトニックバスと相互作用する。
連続運転場または周期パルスシーケンスの制御の下で光浴と相互作用する系のエルゴトロピーがどのように変化するかを分析する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:00:15 GMT)
ViT-LCA: A Neuromorphic Approach for Vision Transformers [0.0] 本稿では、視覚変換器と局所競合アルゴリズム(LCA)を組み合わせて、効率的なニューロモルフィック展開を容易にする新しいモデルを提案する。
実験の結果、VT-LCAはImageNet-1Kデータセット上で高い精度を実現し、他のスパイキング視覚変換器よりもはるかに少ないエネルギーを消費することがわかった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:41:30 GMT)
Using Large Language Models for a standard assessment mapping for sustainable communities [0.0] 本稿では,大規模言語モデル(LLM)を用いた都市持続可能性評価への新たなアプローチを提案する。
この方法論には、標準定義に基づくカスタムプロンプトの開発と、パリ参加予算案の527のプロジェクトとProBONO Horizon 2020プロジェクトの398のアクティビティの2つの異なるデータセットへの適用が含まれている。
本稿では, 従来の人間による評価よりも, 大幅な省エネ, 整合性の向上など, この手法の利点について論じる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:07:58 GMT)
Universality and two-body losses: lessons from the effective non-Hermitian dynamics of two particles [0.0] 本研究では, 1次元に閉じ込められた2つの粒子の遅延ダイナミクスについて検討した。
力学は、連続体と格子の双方で解析的に研究できる非エルミートハミルトニアンによって正確に記述されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:06:53 GMT)
Univariate Conditional Variational Autoencoder for Morphogenic Patterns Design in Frontal Polymerization-Based Manufacturing [0.0] 本稿では,FP製造における階層パターンの逆設計のための確率的生成モデルを提案する。
設計空間と設計ターゲットの両方を符号化するcVAEとは異なり、UcVAEは設計空間のみを符号化する。
トレーニングされたUcVAEは、高忠実度階層パターンを生成する複数のプロセス条件ソリューションを生成することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:10:42 GMT)
Unconditional stability of a recurrent neural circuit implementing divisive normalization [0.0] 任意次元ORGaNICs回路における非条件局所安定性の顕著な特性を証明した。
ORGaNICsは、勾配のクリッピング/スケーリングなしで、時間経過によるバックプロパゲーションによって訓練できることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:53:15 GMT)
Transformers to Predict the Applicability of Symbolic Integration Routines [0.0] 我々は、このタスクをコンピュータシステムで最適化するために機械学習がどのように使われるかを検討する。
我々は、特定の統合手法が成功するかどうかを予測するトランスフォーマーを訓練し、既存の人造アルジェブラと比較する。
変換器はこれらのガードより優れており、最大30%の精度と70%の精度が得られる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:03:37 GMT)
Transferable Ensemble Black-box Jailbreak Attacks on Large Language Models [0.0] 我々は,様々なLSM-as-Attackerメソッドを組み込んだ新しいブラックボックス・ジェイルブレイク攻撃フレームワークを提案する。
本手法は,既存のジェイルブレイク研究と実践から得られた3つの重要な知見に基づいて設計されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 01:55:33 GMT)
Towards Geometry-Preserving Reductions Between Constraint Satisfaction Problems (and other problems in NP) [0.0] 我々は,制約満足度問題と他のNP-search問題との2種類の幾何保存還元を定義する。
これらの削減について、いくつかの例と反例を挙げる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:26:53 GMT)
Torus bifurcation of a dissipative time crystal [0.0] 2つの顕著な発振周波数を示す時間結晶状態に対する散逸連続時間結晶(CTC)の不安定性を実験的に観察した。
平均場近似モデルとフロケット解析を適用して、この遷移が限界周期(LC)と極限トーラス(LT)の間のトーラス分岐の多体系における発現であることを理論的に確認する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:59:55 GMT)
Topologically protected Bell-cat states in a simple spin model [0.0] 我々は、単一の区別可能な中心スピンに結合した$N$同一スピンからなるいわゆる中心スピンモデルの位相的性質を考える。
このモデルは、中心スピンと最大に絡み合っている$N$スピンのシュリンガー猫状態からなるベル・キャット状態である位相的に保護された固有状態に対応する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:46:48 GMT)
Time evolving matrix product operator (TEMPO) method in a non-diagonal basis set based on derivative of the path integral expression [0.0] 時間進化行列積演算子(TEMPO)法は、オープンシステム量子力学をシミュレートするための強力なツールである。
本研究では,TEMPOアルゴリズムを任意の基底集合に拡張することにより,外対角結合に関わる問題に対処することを目的とする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:38:30 GMT)
The time-dependent bivariational principle: Theoretical foundation for real-time propagation methods of coupled-cluster type [0.0] 時間依存二変分法(TD-BIVP)は結合クラスタ型手法の適切なフレームワークとして知られている。
保存法とポアソンブラケットが導入され、古典力学の類似が完成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:51:44 GMT)
The role of broadband connectivity in achieving Sustainable Development Goals (SDGs) [0.0] 近年,SDG対策におけるブロードバンドの役割について検討している。
2030年までには、ブロードバンドのサステナビリティ研究において、4つの重要な推奨事項が達成される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:24:32 GMT)
The Many Inconsistencies of the Purity-Mixture Distinction in Standard Quantum Mechanics [0.0] 純状態と混合状態の区別は、量子力学の標準定式化と考えられる核成分である。
本研究では、この区別によってもたらされた多くの矛盾と、量子物理学における多くの研究プログラムにとって深刻な結果を明らかにすることを試みる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:45:29 GMT)
The Challenges of the Nonlinear Regime for Physics-Informed Neural Networks [0.0] 非線形シナリオではNTKの視点が不足していることを示す。
線形および非線形の両方の場合において,そのような手法の収束保証について検討する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:59:05 GMT)
Sparse Probabilistic Synthesis of Quantum Operations [0.0] 量子コンピューティングにおける連続回転ゲートやNMRやMRIアプリケーションにおけるブロードバンドパルスのような多くの重要な量子演算は、有限量子資源を用いてしか実装できない。
この研究は、測定繰り返し率を緩やかに増加させ、平均的な正確な実装を可能にするアプローチを開発する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:17:46 GMT)
Scaling up to Problem Sizes: An Environmental Life Cycle Assessment of Quantum Computing [0.0] この論文は、量子コンピュータの環境上の利点をいかに生かすかを示す。
量子誤り訂正装置は、100個の論理量子ビットを達成するのに必要な多数の電子部品のために、量子コンピュータに大きな影響を及ぼす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:17:19 GMT)
Scalable quantum circuit design for QFT-based arithmetic [0.0] 量子レジスタに符号化されたNnビット符号なし整数に対する加算演算と減算演算を行うために、量子フーリエ変換に基づく演算回路のスケーラブル版を作成する。
量子ビットおよび量子ビットベースのマルチインプットQFT加算器を提案し、回路の単純さやノイズ感度といった潜在的な利点を比較し、議論する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:34:06 GMT)
SambaMixer: State of Health Prediction of Li-ion Batteries using Mamba State Space Models [0.0] リチウムイオン電池の健康状態を予測するための新しい構造状態空間モデル(SSM)を提案する。
我々は,NASAのバッテリー放電データセット上でのモデルの評価を行い,このモデルが,このデータセットにおける最先端のモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:12:27 GMT)
STC-ViT: Spatio Temporal Continuous Vision Transformer for Weather Forecasting [0.0] 天気予報のための時空間連続トランスフォーマービジョンであるSTC-ViTを提案する。
STC-ViTは、連続した天気変化を時間とともに学習するために、マルチヘッドアテンション機構を備えた連続時間ニューラルODE層を組み込んでいる。
STC-ViTは,操作型数値天気予報(NWP)モデルと,深層学習に基づく天気予報モデルとを比較した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:05:41 GMT)
Revolutionizing Personalized Cancer Vaccines with NEO: Novel Epitope Optimization Using an Aggregated Feed Forward and Recurrent Neural Network with LSTM Architecture [0.0] このプロジェクトは、Feed Forward Neural Networks(FFNN)とRecurrent Neural Networks(RNN)を使用して、より速く、より安く、より正確なネオエピトープバインディング予測を促進することを目的としている。
NEOは次世代のシークエンシングデータを必要とし、最先端モデルのスコア(Flurry 1.6、NetMHCstabpan 1.0、IEDB)を計算して積み重ねアンサンブル法を用いる。
このモデルを用いて、パーソナライズされたがんワクチンを改良された結果(AUC = 0.9166、リコール = 91.67パーセント)で製造することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:11:57 GMT)
Revisiting Joule-expansion experiments with a quantum gas [0.0] 古典的なジュール膨張実験を再考し、現在は量子分解性原子ボースガスを用いている。
温度変化を観測しない古典ガス実験とは対照的に, 冷却効果と加熱効果の両方を観察する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:46 GMT)
Rethinking Scale: The Efficacy of Fine-Tuned Open-Source LLMs in Large-Scale Reproducible Social Science Research [0.0] 大規模言語モデル(LLM)は、パラメータのサイズと性能を規定するアーキテクチャによって区別される。
社会科学者はテキスト分類タスクにLLMを採用しており、人間のコーダーではスケールが難しい。
本研究は,ChatGPT-4 などのモデルに対して,小型かつ微調整のオープンソース LLM が同等あるいは優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:26:30 GMT)
Responsible Retrieval Augmented Generation for Climate Decision Making from Documents [0.0] 気候関連文書に適した領域特化次元を持つ新しい評価フレームワークを提案する。
次に,このフレームワークを用いて検索・拡張生成手法を評価し,プロトタイプツール内での検索・生成品質を評価する。
さらに、気候領域におけるこれらのシステムのより広範な採用と堅牢な評価を促進することを目的として、人間による注釈付きデータセットとスケーラブルな自動評価ツールを公開します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:05:39 GMT)
Representative Social Choice: From Learning Theory to AI Alignment [0.0] 代表的な社会的選択において、人口は、どの社会的選択決定が下されるかに基づいて、個々の課題のペアの有限のサンプルによって代表される。
代表的社会的選択における最も深い質問の多くは、統計的学習問題として自然に定式化できることを示す。
我々はさらに、社会選択の代表を定式化し、Arrowのような公理を一般化分析の新しいツールで証明する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:07:26 GMT)
Reinforced Model Predictive Control via Trust-Region Quasi-Newton Policy Optimization [0.0] 超線形収束率を用いた政策最適化のための準ニュートン学習アルゴリズムを提案する。
シミュレーション研究は、提案したトレーニングアルゴリズムがデータ効率と精度で他のアルゴリズムより優れていることを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:46:41 GMT)
Quarkonium Polarization in Medium from Open Quantum Systems and Chromomagnetic Correlators [0.0] 非相対論的QCD(pNRQCD)とオープン量子システムフレームワークを用いて,クォーコニアのスピン依存型インジウムダイナミクスについて検討した。
量子光学限界における偏光依存性を持つクォーコニアに対するボルツマン輸送方程式を導出する。
また、スピン-シンガレットとスピン-トリップレット重クォーク-反クォーク対の間の転移を記述するリンドブラッド方程式を導出する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:42:50 GMT)
Quantum-Assisted Simulation: A Framework for Developing Machine Learning Models in Quantum Computing [0.0] 本稿では、量子コンピューティングの歴史を調査し、既存のQMLアルゴリズムを検証し、QMLアルゴリズムのシミュレーションを作成するための簡易な手順を提案する。
従来の機械学習と量子機械学習の両方のアプローチを用いて、データセット上でシミュレーションを行う。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:44:15 GMT)
Quantum thermal machine regimes in the transverse-field Ising model [0.0] 我々は、横フィールドイジングモデルを用いて、量子熱機械機構を動作物質として同定し、解釈する。
無限小のワークストロークを考えることで、系の平衡特性から操作を理解することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:52:34 GMT)
Quantum logic for state preparation, readout, and leakage detection with binary subspace measurements [0.0] 量子論理分光法を用いて量子非劣化(QND)測定を行う手法について論じる。
次に、このスキームを用いて高忠実度状態の調製と測定を行う方法を示す。
提案手法のバイナリ特性と高QND純度化の可能性により,検出・修正による忠実度の向上が図られる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:38:08 GMT)
Quantum implementation of non-unitary operations with biorthogonal representations [0.0] 非単体作用素の生物直交表現に基づく新しい拡張法を提案する。
提案手法は,固有値が 1 を超える絶対値を持つ非単項演算子の実装において優れている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:53:17 GMT)
Quantum Skyrmions in general quantum channels: topological noise rejection and the discretization of quantum information [0.0] 2つの絡み合った光子の純粋な状態の位相を利用して量子情報の離散化を行う。
このようなトポロジカル波動関数の特定の形式を利用するノイズモデルを開発する。
両光子に影響を及ぼすノイズは、偏光状態の光子のみに影響を及ぼす位置依存摂動として再キャストできることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:15:52 GMT)
Quantized neural network for complex hologram generation [0.0] コンピュータ生成ホログラフィー(CGH)は、ヘッドマウントディスプレイやヘッドアップディスプレイなどの拡張現実ディスプレイのための有望な技術である。
ニューラルネットワークをCGHに統合する最近の取り組みは、計算速度の高速化に成功している。
ニューラルネットワーク量子化を導入して,複雑なホログラム生成のための軽量モデルを開発した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:48:06 GMT)
Quantifying calibration error in modern neural networks through evidence based theory [0.0] 本稿では、予測エラー(ECE)の評価に主観的論理を組み込むことにより、ニューラルネットワークの信頼性を定量化する新しい枠組みを提案する。
我々は,MNISTおよびCIFAR-10データセットを用いた実験により,信頼性が向上したことを示す。
提案されたフレームワークは、医療や自律システムといったセンシティブな分野における潜在的な応用を含む、AIモデルのより解釈可能でニュアンスな評価を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:54:21 GMT)
Production of entangled x rays through nonlinear double Compton scattering [0.0] 絡み合ったX線を生成するためのテーブルトップソースは、高エネルギーの量子光学にとって不可欠である。
本稿では、強いレーザー波中の電子によって放出される2つの光子の絡み合いと偏光について詳細に解析する。
そこで本研究では,スペクトルフィルタを用いて,絡み合ったX線対を作製し,分離する実験を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:14:59 GMT)
ProbTalk3D: Non-Deterministic Emotion Controllable Speech-Driven 3D Facial Animation Synthesis Using VQ-VAE [0.0] 感情と非決定主義は多様で感情に富んだ顔のアニメーションを生成するために不可欠である、と我々は主張する。
本稿では,感情制御可能な音声駆動3次元顔画像合成のための非決定論的ニューラルネットワーク手法ProbTalk3Dを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:25:40 GMT)
ProbTalk3D: Non-Deterministic Emotion Controllable Speech-Driven 3D Facial Animation Synthesis Using VQ-VAE [0.0] 感情と非決定主義は多様で感情に富んだ顔のアニメーションを生成するために不可欠である、と我々は主張する。
本稿では,感情制御可能な音声駆動3次元顔画像合成のための非決定論的ニューラルネットワーク手法ProbTalk3Dを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:25:40 GMT)
On filter design in deep convolutional neural network [0.0] コンピュータビジョンにおけるディープ畳み込みニューラルネットワーク(DCNN)は、有望な結果をもたらした。
フィルタやウェイトはDCNNで学習する上で重要な要素である。
過去10年間に、半監督的、自己監督的、そして非監督的手法に関する様々な研究がなされてきた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:02:19 GMT)
Nonreciprocal Transmission in Hybrid Atomic Ensemble-Optomechanical Systems [0.0] 原子アンサンブルを組み込んだハイブリッド光学系における完全光非相互伝送について検討する。
我々は、最適な非相互伝達に必要な条件を導出し、結合の複雑な性質に依存することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:31:22 GMT)
Non-linear sigma models for non-Hermitian random matrices in symmetry classes AI$^{\dagger}$ and AII$^{\dagger}$ [0.0] カオスオープン量子系は、時間反転対称性$dagger$に基づいて、普遍的なバルクスペクトル相関を示す。
我々は, TRS$dagger$の存在下での非エルミート確率行列のスペクトル相関を, 対称性クラスであるAI$dagger$ と AII$dagger$ に対応する符号 $+1$ と $-1$ の存在下で解析的に検討した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:38:13 GMT)
Non-equilibrium and equilibrium thermodynamic foundations of the 2D toric code within the SEAQT framework [0.0] 2Dトーリック符号は非自明な位相特性を示す原型例であり、非自明な位相秩序を持つ基底状態である。
トリック符号の安定平衡へのダイナミクスは、最も急激なエントロピー中心の量子熱力学の枠組みの中で研究されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:30:59 GMT)
Noise-induced synchronization in coupled quantum oscillators [0.0] 一対の結合量子発振器の量子力学を相関散逸環境に結合する。
完全に相関し、完全に反相関する環境においては、発振器は長時間持続する相同期状態に緩和する。
完全に相関した、あるいは完全に反相関的な環境の極端な場合、状態空間の特定の領域は環境から完全に分離される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:13:02 GMT)
Mutually Unbiased Bases in Composite Dimensions -- A Review [0.0] 互いに偏りのない基底の完全集合が素数と異なる次元のヒルベルト空間に存在するかどうかは不明である。
存在問題の数学的に等価な14の定式化が提示される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:58:00 GMT)
Morphological Typology in BPE Subword Productivity and Language Modeling [0.0] 合成および解析的形態構造を持つ言語に着目し,トークン化時の生産性について検討する。
合成特徴を持つ言語は、BPEトークン化により、より高いサブワード規則性と生産性を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 06:13:29 GMT)
Monitoring fairness in machine learning models that predict patient mortality in the ICU [0.0] 本研究では,異なる人種,性別,医療診断を有する患者群に対して,モデルがどのような効果を発揮するかを検討する。
フェアネス分析が、従来の精度の指標単独よりも、モデルパフォーマンスのより詳細で洞察に富んだ比較をいかに提供するかを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:17:12 GMT)
Mitigating Errors in Analog Quantum Simulation by Hamiltonian Reshaping or Hamiltonian Rescaling [0.0] 本研究は、アナログ量子シミュレーションにおいて、2つの新しいエラー緩和戦略(ハミルトン変換とハミルトン再スケーリング)を導入する。
ハミルトニアン変換はランダムなユニタリ変換を用いて、同じ固有値を持つが異なる固有状態を持つ新しいハミルトニアンを生成する。
ハミルトニアン再スケーリングは、エネルギースケールのハミルトニアンからの固有値の推定を比較することで誤差を緩和する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:10:51 GMT)
Meta-Sealing: A Revolutionizing Integrity Assurance Protocol for Transparent, Tamper-Proof, and Trustworthy AI System [0.0] この研究は、AIシステムの整合性検証を根本的に変更する暗号フレームワークであるMeta-Sealingを紹介する。
このフレームワークは、高度な暗号と分散検証を組み合わせることで、数学的厳密さと計算効率の両方を達成する、暗黙の保証を提供する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:31:22 GMT)
Memes, Markets, and Machines: The Evolution of On Chain Autonomy through Hyperstition [0.0] 統合失調症の反応を微調整したAIであるZerebroは、破壊的なミームを自律的に生成し、広める。
我々の研究によると、Zerebroは最初のクロスチェーンAIであり、複数のブロックチェーンとシームレスに対話する。
この研究は、過敏感、フィクションがバイラルな伝播を通じて現実になる方法、AIに現れ、ミーム文化を駆り立て、金融を分散させる方法を明らかにする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:26:49 GMT)
Measuring time in a timeless universe [0.0] 物理系は通常、外的、実数値の時間パラメータに対して進化すると仮定される。
分離はページ・ウォッターの建設に十分な条件であるが、必要ではないことを示す。
クロックと他のシステムとの相互作用が許されているため、クロック時間を測定することが可能である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:31:30 GMT)
Measurement-invisible quantum correlations in scrambling dynamics [0.0] 2つのサブシステム間の量子相関の質的に異なる形式によって特徴づけられる3つの異なる動的位相が存在することを示す。
量子相関はサブシステムの1つの測定で目に見えない、あるいは目に見えないような位相を分離する、絡み合った位相内の新しい位相遷移を明らかにする。
本研究の結果は,量子インタラクティブ力学の枠組み内で測定フィードバックを用いて行うことができるタスクの種類に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:28 GMT)
Maximum Entropy Hindsight Experience Replay [0.0] HERは、ゴールベースのPredator-Prey環境に対して、PPO(proximal policy optimization)のような、政治上のアルゴリズムを高速化できることを示す。
我々は,HERを原理的に選択的に適用することにより,従来のPPO-HERアルゴリズムを改善することができることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:18:37 GMT)
Mathematical Formalized Problem Solving and Theorem Proving in Different Fields in Lean 4 [0.0] 数学の定理を証明するためにLean 4のようなコンピュータ化された形式言語を使うことは、数学的形式化に大きな影響を与える。
本稿では、基本構造と戦術を概ね紹介し、AIが数学的形式化プロセスをどのように支援し、その性能を向上させるかを決定する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:01:59 GMT)
Manipulating Vehicle 3D Shapes through Latent Space Editing [0.0] 本稿では,車載3Dモデルに対する連続的,高精度,属性特異的な修正を可能にする,事前学習型回帰器を用いたフレームワークを提案する。
提案手法は,車両3Dオブジェクトの固有性を保持するだけでなく,多属性編集もサポートしており,モデルの構造的整合性を損なうことなく,広範囲のカスタマイズが可能となる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:41:16 GMT)
Machine Learning Framework for Audio-Based Content Evaluation using MFCC, Chroma, Spectral Contrast, and Temporal Feature Engineering [0.0] そこで本研究では,YouTube上の音楽カバーの音声サンプルと,オリジナル曲の音声とユーザコメントからの感情スコアを含むデータセットを構築した。
我々のアプローチは、広範囲な事前処理、音声信号を30秒のウィンドウに分割し、高次元の特徴表現を抽出することである。
回帰モデルを用いて感情スコアを0-100スケールで予測し,それぞれ3.420,5.482,2.783,4.212の根平均二乗誤差(RMSE)値を達成する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:26:26 GMT)
Leveraging Slither and Interval Analysis to build a Static Analysis Tool [0.0] 本稿では,現在最先端の分析ツールで検出されていない,あるいは完全に検出されていない欠陥の発見に向けた進展について述べる。
我々は,Slither上に構築された動作ソリューションを開発し,各命令の実行時の契約状態を評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:28:09 GMT)
Learning parameter dependence for Fourier-based option pricing with tensor trains [0.0] そこで我々は,FTベースのオプション価格で現れる関数に近似したテンソルトレインを構築する,テンソルトレイン学習アルゴリズムを提案する。
ベンチマークテストとして,様々な揮発性の値と現在の資産価格に対するマルチアセットオプションの価格設定を行う。
提案手法は,最大11個の資産を含むテストケースにおいて,モンテカルロをベースとしたオプション価格を計算複雑性の観点から106ドルパスで上回る性能を示した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:07:34 GMT)
Learning local discrete features in explainable-by-design convolutional neural networks [0.0] 本稿では,側方抑制機構に基づくCNN(Design-by-Design Convolutional Neural Network)を提案する。
このモデルは、残留または高密度のスキップ接続を持つ高精度CNNである予測器で構成されている。
観測を収集し,直接確率を計算することにより,隣接するレベルのモチーフ間の因果関係を説明することができる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:39:41 GMT)
Lagrangian neural networks for nonholonomic mechanics [0.0] ラグランジアンニューラルネットワーク(LNN)は物理システムに対処するための強力なツールである。
LNNはシステムのラグランジアンをパラメータ化して、ほぼ保存されたエネルギーで軌道を予測することができる。
非ホロノミック制約を持つ機械システムにLNN技術を適用する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:06:07 GMT)
LSEAttention is All You Need for Time Series Forecasting [0.0] トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンにおいて顕著な成功を収めた。
変圧器モデルでよく見られるエントロピー崩壊とトレーニング不安定性に対処するアプローチである textbfLSEAttention を導入する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:09:39 GMT)
LLM-Agent-UMF: LLM-based Agent Unified Modeling Framework for Seamless Integration of Multi Active/Passive Core-Agents [0.0] LLM-Agent-UMF(LLM-Agent-UMF)に基づく新しいエージェント統一モデリングフレームワークを提案する。
我々のフレームワークはLLMエージェントの異なるコンポーネントを区別し、LLMとツールを新しい要素であるコアエージェントから分離する。
我々は,13の最先端エージェントに適用し,それらの機能との整合性を実証することによって,我々の枠組みを評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:07:11 GMT)
K-Means Clustering With Incomplete Data with the Use of Mahalanobis Distances [0.0] 我々は従来のユークリッド距離の代わりにマハラノビス距離を組み込む統一K平均アルゴリズムを開発した。
我々のアルゴリズムはスタンドアローンの計算とK平均の両方を一貫して上回ることを示す。
これらの結果は、IRISデータセットと楕円型クラスタでランダムに生成されたデータの両方にわたって保持される。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:05:09 GMT)
JEMA: A Joint Embedding Framework for Scalable Co-Learning with Multimodal Alignment [0.0] JEMA(Joint Embedding with Multimodal Alignment)は、レーザー金属沈着(LMD)に適した新しいコラーニングフレームワークである。
教師付きコントラスト学習と比較して,マルチモーダル・セッティングのパフォーマンスは8%向上し,ユニモーダル・セッティングは1%向上した。
我々のフレームワークは、メタデータとマルチセンサデータを統合する基盤を築き、MDドメイン以降の様々な下流タスクを可能にする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:42:26 GMT)
Inductive biases of multi-task learning and finetuning: multiple regimes of feature reuse [0.0] ニューラルネットワークは、複数のタスク(マルチタスク学習、MTL)とシーケンシャル(事前学習、その後の微調整、PT+FT)で訓練されることが多い。
このアプローチが普及しているにもかかわらず、複数のタスクの学習から生じる帰納的バイアスは、著しく特徴づけられる。
対角線ネットワークおよび単層ReLUネットワークにおけるMTLおよびPT+FTに付随する新しい暗黙正則化法則について述べる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 19:22:01 GMT)
Improving snore detection under limited dataset through harmonic/percussive source separation and convolutional neural networks [0.0] Snoringは閉塞性睡眠時無呼吸症候群(OSAS)患者によく見られる音響バイオマーカーである
入力音の高調波成分を解析し,非遮音音とモノラル音を区別する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:27:48 GMT)
Impact of micromotion on the excitation of Rydberg states of ions in a Paul trap [0.0] 我々は,Floquet理論を用いて数値解法し,摂動的アプローチを用いて解析的に解法する単一トラップリドベルクイオンを記述するモデルを開発した。
我々は,どのパラメータ規則に対処可能で,エネルギ的に孤立したRydberg線が持続するかを解析し,コヒーレントな操作を行う上で重要な要件である。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:42:29 GMT)
Historical and Multichain Storage Proofs [0.0] 我々は,Merkle Mountain Range (MMR) とMerkle-Patricia Trie (MPT) を比較検討して,過去の状態検証に対する既存のアプローチを体系的に検討した。
解析は、ケッカック256に関連するパフォーマンス課題を探索するゼロ知識コンテキストにおいて、それぞれのパフォーマンス特性に関するものである。
また、クロスチェーン検証についても検討し、特にレイヤ2ネットワーク間の相互作用に注目した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:25:23 GMT)
Handwriting Recognition in Historical Documents with Multimodal LLM [0.0] マルチモーダル言語モデルは、ショットプロンプトが少なく、OCRおよびコンピュータビジョンタスクの実行に有効であることを示した。
本稿では,ジェミニが作成した手書き文書の書き起こしの精度を,アートトランスフォーマーに基づく手法の現況に対して評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:32:14 GMT)
Group Crosscoders for Mechanistic Analysis of Symmetry [0.0] 群クロスコーダは、ニューラルネットワークの対称的特徴を体系的に発見し、分析する。
グループクロスコーダは、ニューラルネットワークが対称性を表現する方法に関する体系的な洞察を与えることができることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:47:01 GMT)
From PDFs to Structured Data: Utilizing LLM Analysis in Sports Database Management [0.0] 本研究では,PDF文書から構造化形式への半構造化データ処理におけるLarge Language Models(LLMs)の有効性について検討した。
我々は,OpenAI の GPT-4 と Anthropic の Claude 3 Opus モデルを用いたAI 支援手法を開発し,評価した。
このシステムは自動処理で90%の成功率に達し、エラーのない72ファイル中65ファイルの処理に成功し、7900行以上のデータを変換した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:45:51 GMT)
From Easy to Hard: Tackling Quantum Problems with Learned Gadgets For Real Hardware [0.0] 強化学習は強力なアプローチであることが証明されているが、量子ビット上の可能な操作の空間の指数的スケーリングによって、多くの制限が残っている。
本稿では,合成ゲートを自動的に学習するアルゴリズム($gadgets$)を開発し,探索を容易にするための強化学習エージェントに追加のアクションとして追加する。
GRLでは,TFIMの基底状態を最大107ドルの折り畳みで推定する際の誤差を改善する,非常にコンパクトなPQCが見つかる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:02:32 GMT)
Feature Selection via Dynamic Graph-based Attention Block in MI-based EEG Signals [0.0] 脳-コンピュータインタフェース(BCI)技術は、脳信号を分析して人間とコンピュータの直接的な相互作用を可能にする。
脳波信号は、しばしば低信号対雑音比、生理的アーティファクト、および個々の変数の影響を受けており、異なる特徴を抽出する際の課題を表している。
また、運動画像(MI)に基づく脳波信号には、MI特性との相関が低い特徴が含まれており、深部モデルの重みがそれらの特徴に偏っている可能性がある。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:53:29 GMT)
Evaluating the Evolution of YOLO (You Only Look Once) Models: A Comprehensive Benchmark Study of YOLO11 and Its Predecessors [0.0] 本研究では,YOLOv3から最新のYOLO11まで,YOLO(You Only Look Once)アルゴリズムのベンチマーク解析を行った。
トラフィックシグネチャ(さまざまなオブジェクトサイズを持つ)、アフリカ野生生物(多彩なアスペクト比と画像当たりのオブジェクトの少なくとも1つのインスタンス)、および船と船舶(単一のクラスの小さなオブジェクトを持つ)の3つの多様なデータセットでパフォーマンスを評価する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:45:00 GMT)
Entangling distant systems via universal nonadiabatic passage [0.0] 我々は$M+N$次元離散系における普遍的非断熱通路を導出する。
応用において、フォン・ノイマン方程式と時間依存系のハミルトン方程式によって決定される遷移のない力学は、遠方量子ビットを絡めるように定式化することができる。
我々の研究は、量子情報処理における非断熱状態工学の本格的な理論を発展させている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:43:28 GMT)
Entanglement scaling and criticality of quantum many-body systems in canonical quantization picture using tensor network [0.0] 本研究では、無限多結合量子発振器(iCQOs)の基底状態波動関数の量子絡みと臨界性について検討する。
仮想時間進化アルゴリズムを変換不変な関数テンソルネットワークで拡張することにより、iCQOsの基底状態と2体および3体結合の存在をシミュレートする。
本研究では、絡み合いエントロピー(EE)の対数スケーリング則と、物理的および非物理的領域の分割点における仮想結合$chi$に対する相関長のスケーリング則を明らかにする。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:20:49 GMT)
Enhancing Brain Tumor Classification Using TrAdaBoost and Multi-Classifier Deep Learning Approaches [0.0] 脳腫瘍は、急速な成長と転移の可能性のために深刻な健康上の脅威となる。
本研究の目的は,脳腫瘍分類の効率と精度を向上させることである。
我々のアプローチは、ViT(Vision Transformer)、Capsule Neural Network(CapsNet)、ResNet-152やVGG16といった畳み込みニューラルネットワーク(CNN)など、最先端のディープラーニングアルゴリズムを組み合わせる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:28:06 GMT)
Enhancing Activity Recognition After Stroke: Generative Adversarial Networks for Kinematic Data Augmentation [0.0] 脳卒中リハビリテーションにおけるウェアラブルモニタリングのための機械学習モデルの一般化可能性はしばしば、利用可能なデータの限られたスケールと不均一性によって制限される。
データ拡張は、トレーニングセットに表される変動性を強化するために、実際のデータに計算的に導出されたデータを追加することで、この課題に対処する。
本研究では、CGAN(Conditional Generative Adversarial Networks)を用いて、公開データセットから合成キネマティックデータを生成する。
合成データと実験データの両方でディープラーニングモデルを訓練することにより、タスク分類精度を向上させる:実データのみを訓練したモデルでは66.1%よりもはるかに高い80.0%の精度で合成データを組み込んだモデル。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 13:02:43 GMT)
Efficient State Preparation for the Schwinger Model with a Theta Term [0.0] シュウィンガーモデルに対する異なる量子状態準備アルゴリズムの比較を示す。
ブロックされたQAOAアンサッツとRAを組み合わせた場合の最良の結果を得る。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:49:09 GMT)
Efficient Machine Translation with a BiLSTM-Attention Approach [0.0] 本稿では,翻訳品質の向上を目的とした新しいSeq2Seqモデルを提案する。
このモデルでは、双方向長短期記憶ネットワーク(Bidirectional Long Short-Term Memory Network, Bi-LSTM)をエンコーダとして使用し、入力シーケンスのコンテキスト情報をキャプチャする。
現在の主流トランスフォーマーモデルと比較して,本モデルはWMT14機械翻訳データセットにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:32:24 GMT)
Diffusion coefficients preserving long-time correlations: Consequences on the Einstein relation and on entanglement in a bosonic Bogoliubov system [0.0] 我々は、$N$結合調和振動子の系を持続的相関を示す平衡状態に駆動する拡散係数を解析的に導出した。
また, 2部構造ボゴリューボフ系におけるエンタングルメントの進化について検討した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:35:04 GMT)
Diagnosing electronic phases of matter using photonic correlation functions [0.0] 電子系におけるスピン,電荷,トポロジカル秩序の探索は,光子の二次的および相関関数を測ることにより可能であることを示す。
散乱光子の相関関数から相関絶縁体の相関関数への写像を構築する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:41 GMT)
Detection of adrenal anomalous findings in spinal CT images using multi model graph aggregation [0.0] 腰痛はプライマリ・ケアの医師に報告される2番目に多い。
腰痛は生涯の人口の50%から80%に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 07:43:52 GMT)
Detecting text level intellectual influence with knowledge graph embeddings [0.0] オープンソースジャーナル記事のコーパスを収集し,Gemini LLMを用いて知識グラフ表現を生成する。
提案手法は,前述した手法とグラフニューラルネットワークを用いた新しい埋め込みモデルを用いて,サンプル対の論文間の引用の存在を予測しようとするものである。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:21:27 GMT)
Deep Learning Predicts Mammographic Breast Density in Clinical Breast Ultrasound Images [0.0] アメリカ放射線医学会の乳房画像報告・データシステム(BI-RADS)で定義されている乳房密度は、乳がんにとって最も強力な危険因子の1つである。
本研究の目的は,臨床用ハンドヘルドBUS画像からBI-RADS乳房密度カテゴリを予測する人工知能(AI)モデルを探索することであった。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:28:20 GMT)
Debiasing Alternative Data for Credit Underwriting Using Causal Inference [0.0] 代替データは、借り手の信用度を評価するために、貸し手にとって貴重な洞察を提供する。
しかし、いくつかの代替データは、保護されたクラスの違法な代理として機能する可能性があるため、歴史的に信用代行から除外されてきた。
本稿では、教師付き機械学習モデルに因果推論を適用して代替データをデバイアスし、クレジットカードの引受けに使用できるようにする手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:12:27 GMT)
Crystallinity in Niobium oxides: A pathway to mitigate Two-Level System Defects in Niobium 3D Resonator for quantum applications [0.0] 2レベル系(TLS)欠陥は超伝導量子回路におけるデコヒーレンスの主要な原因である。
650degCでの10時間高真空加熱処理により3次元超伝導ニオブ共振器の2レベル系損失の低減を実証した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:29:59 GMT)
Counterfactual MRI Data Augmentation using Conditional Denoising Diffusion Generative Models [0.0] 医用画像の深層学習モデルにおける画像取得パラメータ(IAP)の変動による一般化性とロバスト性の問題
患者解剖を変更せずに異なるIAPをシミュレートするMR画像を生成するために, 条件付き縮退拡散生成モデル(cDDGM)を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:29:41 GMT)
Cost-Aware Query Policies in Active Learning for Efficient Autonomous Robotic Exploration [0.0] 本稿では,動作コストを考慮しつつ,ガウス過程回帰のためのALアルゴリズムを解析する。
距離制約を持つ伝統的な不確実性計量は、軌道距離上のルート平均二乗誤差を最小化する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 18:35:03 GMT)
Cooperative quantum tunneling of the magnetization in Fe-doped Li$_3$N [0.0] 希薄Li$(Li$_1-x$Fe$_x$)Nのスピン反転は、空間的に分離された状態の共鳴量子トンネルによって支配される。
2つのスピンの協調的同時量子トンネル現象を引き起こすこれらの状態間の有限結合の効果について報告する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 20:03:49 GMT)
Converting BPMN Diagrams to Privacy Calculus [0.0] 本稿では、BPMNダイアグラムのサブセットをPrivacy Calculusの用語に変換する方法について述べる。
この変換は数学的に論文に記載されているが、ソフトウェアツールとしても実装されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 09:25:23 GMT)
Controlling Continuous Relaxation for Combinatorial Optimization [0.0] 最適化のための教師なし学習解決器(CO)は、連続緩和戦略を用いてソフトソリューションを生成するニューラルネットワークを訓練する。
本研究では,ul-based solverの学習手法であるContinuous Relaxation Anneal(CRA)戦略を紹介する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 12:21:32 GMT)
Content Aware Analysis of Scholarly Networks: A Case Study on CORD19 Dataset [0.0] 本稿では,HITSアルゴリズムを用いたネットワーク内のトピック情報の伝搬による意味情報の利用手法を提案する。
今回のケースでは、CORD19データセットからトピックを抽出するためにMedCATを使用します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 23:41:09 GMT)
Comparing the performance of practical two-qubit gates for individual ${}^{171}$Yb ions in yttrium orthovanadate [0.0] 個別イタリウム (Yb) 希土類イオン間の制御NOT(CNOT)ゲートの実装法について検討した。
実験実施の可能性を評価するため,各スキームのゲート忠実度を計算した。
我々は、確率的光子干渉に基づくスキームは、協調性を伴う最良の忠実度スケーリングを提供すると結論付けた。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 03:55:08 GMT)
Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering [0.0] 大言語モデル(LLM)と知識グラフ(KG)を組み合わせて、質問応答システムの精度と信頼性を向上させる。
提案手法は,LLM生成クエリの構文的および意味論的妥当性を保証するクエリチェッカーを組み込んだものである。
このアプローチをアクセス可能にするため、ユーザフレンドリーなWebベースのインターフェースが開発されている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:01:16 GMT)
Classical simulation of universal measurement-based quantum computation using multipartite Bell scenarios [0.0] マルチパーティ・ベルシナリオの非シグナリング多面体に基づく新しい古典的シミュレーションアルゴリズムを提案する。
我々のモデルでは、量子スピードアップには非安定度と絡み合いが同時に存在する必要がある。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 08:40:51 GMT)
Certified binary search tree on W-types [0.0] 確立された型を使って新しい型を定義する可能性について検討する。
特に,本研究は,本型に基づく新たな除去規則を考案した。
本稿では,これらのアイデアを二分探索木に適用し,手法のパワーを図示する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 22:47:33 GMT)
Case ID detection based on time series data -- the mining use case [0.0] 本稿では,選択変数の短期平均値の有意な変化を識別し,ケースIDを検出することに基づく,新しいルールに基づく識別パターンのアルゴリズムを提案する。
実験の結果、ほとんどのケースで開発されたアルゴリズムは、アウトリーチのないデータセットのIDを正しく検出し、それぞれ96.8%と97%のスコアに達した。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:55:30 GMT)
CaAdam: Improving Adam optimizer using connection aware methods [0.0] 我々はAdamにインスパイアされた新しい手法を導入し、収束速度を高め、損失関数の最小化を実現する。
Adamを含む従来のプロキシは、アーキテクチャの詳細を考慮せずに、ニューラルネットワーク全体で均一またはグローバルに調整された学習率を適用している。
我々のアルゴリズムであるCaAdamは、アーキテクチャ情報を慎重に設計することで、接続対応の最適化を導入することで、見落としている領域を探索する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:59:46 GMT)
Blockchain Services for Digital Government: An Exploration of NFT Applications in the Metaverse [0.0] DLT(Distributed Ledger Technology)上に構築されたアプリケーションは、社会を理想的なメタバースに近づける力を持っている。
この章は、この概念的な枠組みの多くの側面を描いている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:48:46 GMT)
Biotic Browser: Applying StreamingLLM as a Persistent Web Browsing Co-Pilot [0.0] Biotic Browser"は、StreamingLLMを利用してWebナビゲーションとタスク実行を変換する革新的なAIアシスタントである。
自動運転車の乗客の体験をシミュレートする能力によって特徴付けられるBiotic Browserは、拡張されたインタラクションや複雑なマルチステップのWebベースのタスクの管理に長けている。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:12:02 GMT)
BioNCERE: Non-Contrastive Enhancement For Relation Extraction In Biomedical Texts [0.0] 生物医学領域における関係抽出(RE)の最先端モデルは異方性の問題に悩まされる可能性がある。
対照的な学習法は、この異方性現象を減らし、クラス崩壊を避けるのに役立つ。
BioNCEREは、トランスファーラーニングと非コントラスト学習を使用して、完全なあるいは次元の崩壊を避けるとともに、バイパスオーバーフィッティングを回避している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 02:51:56 GMT)
Auditing Google's Search Algorithm: Measuring News Diversity Across Brazil, the UK, and the US [0.0] 本研究では,ブラジル,イギリス,米国における検索結果の分析により,Googleの検索アルゴリズムがニュースの多様性に与える影響について検討した。
Googleのシステムは、限られた数のニュースメディアを優先的に好んでいる。
発見は、検索結果のわずかに左に偏りを示し、人気のある、しばしば全国のメディアを好んでいることを示している。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:49:16 GMT)
Attosecond physics hidden in Cherenkov radiation [0.0] 超光速で移動する荷電粒子のチェレンコフ放射は、よく研究されている現象である。
ここでは、チェレンコフ放射の固有動力学を探索するための理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 21:16:18 GMT)
Attention is All You Need to Optimize Wind Farm Operations and Maintenance [0.0] O&M(Operations and maintenance)は、風力発電システムにおける基本的な問題であり、信頼性と収益性に大きく影響している。
結果として生じるO&M問題は、通常、大規模混合整数(MIP)モデルを用いて解決される。
本稿では,マルチヘッドアテンション(MHA)モデルに基づく風力発電用O&Mの新しい意思決定フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 15:47:50 GMT)
Approaching energy quantum limit detection of microwave photons with Josephson Junctions [0.0] 単一光子検出は、非常に弱い電磁波のエネルギー量子制限検出(EQLD)である。
我々は、電流バイアスのJosephson Junction(CBJJ)検出器を用いて、弱いマイクロ波信号のEQLDに接近する可能性を分析する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 14:03:07 GMT)
An IoT Based Smart Waste Management System for the Municipality or City Corporations [0.0] 都市部の人口は毎日増加しており、この移動は深刻な環境汚染を引き起こしている。
モノのインターネット(IoT)ベースの廃棄物管理システムのような次世代技術は、この深刻な問題を改善するのに役立ちます。
本稿では、これらの2つの技術を組み合わせて、この問題に対する許容可能な解決策を提供します。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:34:08 GMT)
An Application of the Holonomic Gradient Method to the Neural Tangent Kernel [0.0] 線型偏微分方程式のホロノミック系は概して、解空間が有限次元である系である。
本稿では,ニューラルタンジェントカーネルのホロノミックアクチベータ分布の2つの活性化を数値的に評価する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 04:25:24 GMT)
Acceleration-induced transport of quantum vortices in joined atomtronic circuits [0.0] 加速は密度結合した2つの環状原子ボース-アインシュタイン凝縮体間の持続電流の移動に影響を与える。
加速度はリング間の密度と位相のダイナミクスを調節し、周期渦振動のバイアスをもたらす。
我々は、この伝達が、弱いリンク振幅、初期持続電流構成、加速度強度と方向に依存するかを分析する。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 11:02:10 GMT)
AIDOVECL: AI-generated Dataset of Outpainted Vehicles for Eye-level Classification and Localization [0.0] この研究は、注釈付きデータ不足の問題に対処するために、アウトペイントを活用する新しいアプローチを導入している。
この技術は、自動運転、都市計画、環境モニタリングにおいて特に困難な課題に応用する。
塗装された車両による増強は、全体のパフォーマンス指標を最大8%改善し、未表現クラスの予測を最大20%向上させる。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 16:46:23 GMT)
A Distribution Semantics for Probabilistic Term Rewriting [0.0] 我々は、よく知られた計算形式主義である項書き換えに焦点を当てる。
従来の書き換え規則と確率を組み合わせたシステムを考える。
与えられた削減のために一連の「説明」を計算する方法を示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 10:19:17 GMT)
2D magnetic stability [0.0] 本稿では,第33/35回国際物理学グループ理論的方法に関する国際会議(ICGTMP, Group33/35)の手続への貢献について述べる。
ここでは、磁気自己相互作用を含むグロス・ピタエフスキー / 非線形シュル・オーディンガーエネルギー汎関数を一般化して、自己相互作用するほぼボゾン気体の安定性を考える。
このモデルには、高次結合の値のみを保持するが、低い値に分解される超対称性のタイプが存在し、前者の超対称性基底状態は偶インテガー密度で正確に存在することを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 17:12:27 GMT)
2D Empirical Transforms. Wavelets, Ridgelets and Curvelets revisited [0.0] このアプローチのいくつかの拡張を2次元信号(画像)に提示する。
このような構造が、画像解析や処理に有望な性質を示す異なる適応フレームに繋がることを示す。
論文参考訳(メタデータ) (Thu, 31 Oct 2024 00:52:59 GMT)