Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.9] 水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 00:25:33 GMT)
Image Super-Resolution with Text Prompt Diffusion [118.0] 画像SRにテキストプロンプトを導入し、劣化前の情報を提供する。
PromptSRは、事前訓練された言語モデル(例えば、T5やCLIP)を使用して復元を強化する。
実験により、テキストプロンプトをSRに導入すると、合成画像と実世界の画像の両方で優れた結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:30:00 GMT)
Breaking the Curse of Multilinguality with Cross-lingual Expert Language Models [110.1] X-ELM(X-Langual Expert Language Models、X-ELM)は、X-ELMを異なる言語に専門化するプロセスである。
新しい専門家を反復的に追加し、破滅的な忘れをせずに新しい言語にX-ELMを適用する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:44:49 GMT)
The Optimization Landscape of SGD Across the Feature Learning Strength [102.1] オンライントレーニング環境で、さまざまなモデルやデータセットに$gamma$をスケーリングする効果について検討する。
最適なオンラインパフォーマンスは、しばしば大きな$gamma$で見られます。
以上の結果から,大容量ガンマ$限界の解析的研究は,実演モデルにおける表現学習のダイナミクスに関する有用な知見をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:28:22 GMT)
The Optimization Landscape of SGD Across the Feature Learning Strength [102.1] オンライントレーニング環境で、さまざまなモデルやデータセットに$gamma$をスケーリングする効果について検討する。
最適なオンラインパフォーマンスは、しばしば大きな$gamma$で見られます。
以上の結果から,大容量ガンマ$限界の解析的研究は,実演モデルにおける表現学習のダイナミクスに関する有用な知見をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:28:22 GMT)
DiffusionGuard: A Robust Defense Against Malicious Diffusion-based Image Editing [93.5] DiffusionGuardは、拡散ベースの画像編集モデルによる不正な編集に対する堅牢で効果的な防御方法である。
拡散過程の初期段階をターゲットとした対向雑音を発生させる新しい目的を提案する。
また,テスト期間中の各種マスクに対するロバスト性を高めるマスク強化手法も導入した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:19:19 GMT)
Implicit Concept Removal of Diffusion Models [92.6] テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。
幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:29:45 GMT)
Collapsed Language Models Promote Fairness [88.5] 偏りのある言語モデルはトークン表現と単語埋め込みの間に崩壊したアライメントを示す。
本研究では, 広範囲な脱バイアス法において, 公平性を効果的に向上する原理的な微調整法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:03:49 GMT)
Collapsed Language Models Promote Fairness [88.5] 偏りのある言語モデルはトークン表現と単語埋め込みの間に崩壊したアライメントを示す。
我々は,幅広い脱バイアス法において,公平性を効果的に向上する原理的な微調整法を設計する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:03:49 GMT)
iSeg: An Iterative Refinement-based Framework for Training-free Segmentation [85.6] 本稿では,自己注意マップを用いた横断注意マップの繰り返し精錬に関する実験的検討を行った。
トレーニング不要セグメンテーションのための効果的な反復改良フレームワークiSegを提案する。
提案したiSegは,mIoUの3.8%の絶対ゲインを達成している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:32:36 GMT)
iSeg: An Iterative Refinement-based Framework for Training-free Segmentation [85.6] 本稿では,自己注意マップを用いた横断注意マップの繰り返し精錬に関する実験的検討を行った。
トレーニング不要セグメンテーションのための効果的な反復改良フレームワークiSegを提案する。
提案したiSegは,mIoUの3.8%の絶対ゲインを達成している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:32:36 GMT)
PostCast: Generalizable Postprocessing for Precipitation Nowcasting via Unsupervised Blurriness Modeling [85.6] 本稿では,ぼやけた予測とそれに対応する土台真実のペアによるトレーニングを必要とせずに,ぼやけを解消するための教師なしポストプロセッシング手法を提案する。
非条件相関を任意のぼかしモードに適応させるため、ゼロショットのぼかしカーネル推定機構とオートスケールの denoise ガイダンス戦略を導入する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:38:23 GMT)
DecorateLM: Data Engineering through Corpus Rating, Tagging, and Editing with Language Models [78.5] 本稿では,データ評価,タグ付け,編集を通じて事前学習コーパスを洗練させるデータエンジニアリング手法であるDecorateLMを紹介する。
次に、DecorateLMを適用して、トレーニングコーパスの100億のトークンを強化し、さらに12億のパラメータLLMのさらなるトレーニングのために、高品質と多様性を実証する45億のトークンを選択します。
その結果、このような高品質なデータを利用することで、モデルの性能を大幅に向上させることができることが示され、事前学習コーパスの品質を高めるための強力なアプローチが示される。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:42:56 GMT)
Efficient Inference for Large Language Model-based Generative Recommendation [78.4] LLM(Large Language Model)ベースの生成レコメンデーションは目覚ましい成功を収めた。
ジェネレーティブレコメンデーションにSD(Speculative Decoding)を適用すると、トップKアイテムを生成する必要があるため、ユニークな課題が提示される。
我々は,厳密なトップK検証の下でトップKアライメントを最適化する AtSpeed-S というアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:33:52 GMT)
Efficient Inference for Large Language Model-based Generative Recommendation [78.4] LLM(Large Language Model)ベースの生成レコメンデーションは目覚ましい成功を収めた。
ジェネレーティブレコメンデーションにSD(Speculative Decoding)を適用すると、トップKアイテムを生成する必要があるため、ユニークな課題が提示される。
我々は,厳密なトップK検証の下でトップKアライメントを最適化する AtSpeed-S というアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:33:52 GMT)
GoMatching: A Simple Baseline for Video Text Spotting via Long and Short Term Matching [77.0] ビデオテキストスポッティングは、トラッキングを含むことで、さらなる課題を提示する。
GoMatchingは、強力な認識性能を維持しながら、トラッキングのトレーニングに重点を置いている。
GoMatchingは、ICDAR15ビデオ、DSText、BOVTextに新しいレコードを提供し、ArTVideoと呼ばれる任意の形のテキストを用いた新しいテストを提案しました。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:26:17 GMT)
EVOLvE: Evaluating and Optimizing LLMs For Exploration [76.7] 大規模言語モデル(LLM)は、不確実性の下で最適な意思決定を必要とするシナリオにおいて、未調査のままである。
多くのアプリケーションに関係のあるステートレス強化学習環境である,帯域幅を最適に決定できる LLM の (in) 能力の測定を行う。
最適な探索アルゴリズムの存在を動機として,このアルゴリズム知識をLLMに統合する効率的な方法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:54:03 GMT)
Vector-ICL: In-context Learning with Continuous Vector Representations [76.0] 大規模言語モデル (LLM) はテキストデータに顕著なコンテキスト内学習能力を示す。
ブラックボックス事前学習エンコーダから得られる様々な領域から連続ベクトルに拡張できるかどうかを検討する。
特に,汎用言語モデリング目的のプロジェクタを事前学習することで,Vector-ICLの実現が期待できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:25:38 GMT)
FaithEval: Can Your Language Model Stay Faithful to Context, Even If "The Moon is Made of Marshmallows" [74.7] FaithEvalは、コンテキストシナリオにおける大規模言語モデル(LLM)の忠実度を評価するためのベンチマークである。
FaithEvalは4.9Kの高品質な問題で構成され、厳格な4段階のコンテキスト構築と検証フレームワークを通じて検証されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:20:39 GMT)
Learning Object-Centric Representation via Reverse Hierarchy Guidance [73.1] OCL(Object-Centric Learning)は、ニューラルネットワークが視覚的なシーンで個々のオブジェクトを識別できるようにする。
RHGNetは、トレーニングと推論プロセスにおいて、さまざまな方法で機能するトップダウンパスを導入している。
我々のモデルは、よく使われる複数のデータセット上でSOTA性能を達成する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 01:43:59 GMT)
Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.8] 本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:19:47 GMT)
A Thorough Examination of Decoding Methods in the Era of LLMs [72.7] 復号法は、次世代の予測器から実用的なタスク解決器に言語モデルを変換する上で、必須の役割を果たす。
本稿では,大規模言語モデルの文脈における様々な復号法を包括的かつ多面的に分析する。
その結果,復号法の性能は特にタスク依存的であり,アライメント,モデルサイズ,量子化などの要因に影響されていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:46:47 GMT)
MC-MoE: Mixture Compressor for Mixture-of-Experts LLMs Gains More [71.0] 我々は、Mixture-of-Experts大言語モデル(MoE-LLM)のためのトレーニング不要なMixture-CompressorであるMC-MoEを提案する。
MC-MoEは、専門家とトークンの両方の重要性を活用して極端な圧縮を実現する。
例えば、MC-MoEは2.54ビットで76.6%の圧縮を行い、平均精度損失は3.8%に過ぎなかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:09:38 GMT)
MIBench: Evaluating Multimodal Large Language Models over Multiple Images [70.4] マルチイメージシナリオにおけるMLLMの微粒化能力を包括的に評価する新しいベンチマークMIBenchを提案する。
具体的には、MIBenchはマルチモーダル・インコンテクスト・ラーニング(MIC)とマルチモーダル・インコンテクスト・ラーニング(MIC)の3つのシナリオに分類する。
その結果、現在のモデルでは単一画像のタスクが優れているが、複数画像の入力に直面すると大きな欠点が現れることがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:18:21 GMT)
Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization [68.6] 弱い着想の問題が存在するかどうかを考察する。
弱いモデルと強いモデルの間の能力ギャップが増大するにつれて、偽造は増大する。
私たちの研究は、スーパーアライメントの真の信頼性にもっと注意を払う必要があることを強調します。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:59:14 GMT)
Towards an Autonomous Surface Vehicle Prototype for Artificial Intelligence Applications of Water Quality Monitoring [68.4] 本稿では,人工知能アルゴリズムの利用と水質モニタリングのための高感度センシング技術に対処する車両プロトタイプを提案する。
車両には水質パラメータと水深を測定するための高品質なセンサーが装備されている。
ステレオカメラにより、実際の環境でのマクロプラスチックの検出と検出も可能である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:35:32 GMT)
Embodied-RAG: General non-parametric Embodied Memory for Retrieval and Generation [68.0] Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、200以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:07:16 GMT)
Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [68.0] Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、200以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:07:16 GMT)
Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [68.0] Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、200以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:07:16 GMT)
TweedieMix: Improving Multi-Concept Fusion for Diffusion-based Image/Video Generation [68.0] TweedieMixは、カスタマイズされた拡散モデルを構成する新しい方法である。
我々のフレームワークは、画像とビデオの拡散モデルに力ずくで拡張できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:06:01 GMT)
Advancing Social Intelligence in AI Agents: Technical Challenges and Open Questions [67.6] ソーシャルインテリジェントAIエージェント(Social-AI)の構築は、多分野、マルチモーダルな研究目標である。
我々は、社会AIを前進させるために、基礎となる技術的課題と、コンピューティングコミュニティ全体にわたる研究者のためのオープンな質問を特定します。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:27:04 GMT)
Pyramidal Flow Matching for Efficient Video Generative Modeling [67.0] この研究は、統合ピラミッドフローマッチングアルゴリズムを導入している。
元々の装飾軌道をピラミッドの一連の段階として犠牲にしており、最終段階のみが完全な解像度で機能している。
フレームワーク全体はエンドツーエンドで最適化でき、単一の統合Diffusion Transformer (DiT) を使用する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:10:37 GMT)
DWDN: Deep Wiener Deconvolution Network for Non-Blind Image Deblurring [66.9] 本稿では,古典的なWienerデコンボリューションフレームワークを学習深い特徴と統合することにより,特徴空間における明示的なデコンボリューションプロセスを提案する。
マルチスケールのカスケード機能改善モジュールは、分離された深い特徴から退色画像を予測する。
提案したDeep Wienerデコンボリューションネットワークは,目に見える成果物が少なく,かつ,最先端の非盲点画像デコンボリューション手法を広いマージンで定量的に上回っていることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 05:39:30 GMT)
Fuse Your Latents: Video Editing with Multi-source Latent Diffusion Models [66.1] 遅延拡散モデル(LDM)は、画像合成やビデオ合成において強力な能力を持つことで有名である。
本稿では,T2I と T2V LDM を統合し,高品質なテキスト・ツー・ビデオ(T2V)編集を実現するフレームワークであるFLDMを提案する。
本稿では,T2I と T2V の LDM が,構造的・時間的整合性において相互に補完可能であることを初めて明らかにする。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:10:10 GMT)
Integrating Planning into Single-Turn Long-Form Text Generation [66.1] 長文コンテンツを生成するための計画案を提案する。
私たちの主な新規性は、複数のプロンプトや計画のラウンドを必要としない単一の補助的なタスクにあります。
実験では,LLMを補助タスクで微調整し,高品質な文書を生成する,異なる領域からの2つのデータセットを実証した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:02:40 GMT)
Few-Shot Anomaly Detection via Category-Agnostic Registration Learning [65.6] 既存のほとんどの異常検出方法は、各カテゴリに専用のモデルを必要とする。
この記事では、新しい数ショットAD(FSAD)フレームワークを提案する。
これは新しいカテゴリーのモデル微調整を必要としない最初のFSAD法である。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:48:31 GMT)
Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [65.2] Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、200以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:07:16 GMT)
RL, but don't do anything I wouldn't do [65.2] 我々は、KL制約が、高度RLエージェントの挙動を制御するためにもはや信頼できないことを示す。
我々は,「何もしないで」という原則を「しないで」という原則に置き換えることで,この問題を回避する理論的な代替案を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:18:17 GMT)
MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models [65.1] MLaKEは5言語にわたる知識編集手法の適応性のベンチマークである。
MLaKEは、ウィキペディアから言語にまたがるファクトチェーンを集約し、フリーフォームとマルチチョイスの両方で質問を生成する。
MLaKEにおける既存手法の多言語知識編集の一般化能力を評価する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 01:58:48 GMT)
Biased AI can Influence Political Decision-Making [64.9] 本稿では、AI言語モデルにおけるパルチザンバイアスが政治的意思決定に及ぼす影響について検討する。
政治的に偏見のあるモデルに晒された参加者は、意見を採用し、AIの偏見と一致した決定を下す可能性が著しく高いことがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:56:00 GMT)
DressRecon: Freeform 4D Human Reconstruction from Monocular Video [64.6] 本稿では,モノクラービデオから時間一貫性のある人体モデルを再構築する手法を提案する。
非常にゆるい衣服やハンドヘルドオブジェクトのインタラクションに重点を置いています。
DressReconは、先行技術よりも忠実度の高い3D再構築を実現している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:56:34 GMT)
ObjectCompose: Evaluating Resilience of Vision-Based Models on Object-to-Background Compositional Changes [64.6] 本研究では,視覚モデルによる多様な背景背景環境に対するレジリエンスを評価する。
我々は、画像から画像への変換、画像から画像への変換、および画像から画像への変換モデルの生成機能を利用して、オブジェクトから背景への変換を自動的に生成する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 20:10:02 GMT)
SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages [64.1] SEACrowdは3つのモダリティにまたがる1000近い言語で標準化されたコーパスを統合する共同イニシアチブである。
私たちは、13のタスクにわたる36のネイティブ言語上のAIモデルの品質を評価し、SEAの現在のAI状況に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:35:36 GMT)
PDF-WuKong: A Large Multimodal Model for Efficient Long PDF Reading with End-to-End Sparse Sampling [63.9] 文書理解は、大量のテキストや視覚情報を処理し、理解する上で難しい課題である。
大規模言語モデル(LLM)の最近の進歩は、このタスクの性能を大幅に改善した。
長いPDF文書に対する多モーダル質問回答(QA)を強化するために設計された多モーダル大言語モデル(MLLM)であるPDF-WuKongを紹介する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:17:42 GMT)
DimOL: Dimensional Awareness as A New 'Dimension' in Operator Learning [63.6] 本稿では,DimOL(Dimension-aware Operator Learning)を紹介し,次元解析から洞察を得る。
DimOLを実装するために,FNOおよびTransformerベースのPDEソルバにシームレスに統合可能なProdLayerを提案する。
経験的に、DimOLモデルはPDEデータセット内で最大48%のパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:48:50 GMT)
Score Forgetting Distillation: A Swift, Data-Free Method for Machine Unlearning in Diffusion Models [63.4] マシン・アンラーニング(MU)は安全でセキュアで信頼性の高いGenAIモデルを開発する上で重要な基盤である。
従来のMUメソッドは、しばしば厳密な仮定に依存し、実際のデータへのアクセスを必要とする。
本稿では,拡散モデルにおいて望ましくない情報を忘れることを促進する革新的なMUアプローチであるScore Forgetting Distillation (SFD)を紹介する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:59:06 GMT)
Attentive Fine-Grained Structured Sparsity for Image Restoration [63.4] N:M 構造化プルーニングは,モデルの精度制約を効率的にするための効果的かつ実用的なプルーニング手法の1つである。
そこで本稿では, 各層におけるN:M構造化空間の刈り取り比を決定する新しい刈り取り法を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:39:44 GMT)
MDAP: A Multi-view Disentangled and Adaptive Preference Learning Framework for Cross-Domain Recommendation [63.3] クロスドメインレコメンデーションシステムは、マルチドメインユーザインタラクションを活用してパフォーマンスを向上させる。
マルチビュー・ディスタングル・アダプティブ・プライスラーニング・フレームワークを提案する。
当社のフレームワークはマルチビューエンコーダを使用して,多様なユーザの好みをキャプチャする。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:06:45 GMT)
LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models [63.1] 大規模言語モデル(LLM)の論理的推論能力を評価・拡張するための新しいアプローチであるLogicAskerを紹介する。
提案手法は, LLMが論理規則を学習する際の大きなギャップを明らかにし, 異なるモデル間で29%から90%の推論失敗を識別する。
GPT-4oのようなモデルにおける論理的推論を最大5%向上させることで、これらの知見を活用して、ターゲットとなる実演例と微調整データを構築した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:34:37 GMT)
Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models [62.8] 我々は、LLaVA-1.5ベースのMathV360Kで微調整されたモデルであるMath-LLaVAを紹介する。
この手法はLLaVA-1.5のマルチモーダル数学的推論能力を著しく改善する。
Math-LLaVAは、MMMUベンチマークで大幅に改善された一般化性を示している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:58:27 GMT)
ParallelSpec: Parallel Drafter for Efficient Speculative Decoding [62.7] 提案するParallelSpecは,最先端の投機的復号化手法における自己回帰的起草戦略の代替となる。
投機段階における自己回帰的起草とは対照的に,効率的な投機モデルとして機能する並列投機を訓練する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:05:08 GMT)
DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback [62.2] データ生成エージェントのための教師環境のテストベッドであるDataEnvGymを紹介する。
DataEnvGymはシーケンシャルな意思決定タスクとしてデータ生成をフレーム化する。
エージェントの目標は、生徒のパフォーマンスを改善することです。
我々は3つの多様なタスク(数学、コード、VQA)をサポートし、複数の学生と教師をテストする。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:20:37 GMT)
OptiBench Meets ReSocratic: Measure and Improve LLMs for Optimization Modeling [62.2] 大規模言語モデル (LLM) は数学的推論における問題解決能力を示した。
本稿では,人間可読入力と出力を用いたエンドツーエンド最適化問題のベンチマークであるOptiBenchを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:27:18 GMT)
OptiBench Meets ReSocratic: Measure and Improve LLMs for Optimization Modeling [62.2] 大規模言語モデル (LLM) は数学的推論における問題解決能力を示した。
本稿では,人間可読入力と出力を用いたエンドツーエンド最適化問題のベンチマークであるOptiBenchを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:27:18 GMT)
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance [61.1] 単一入力画像からカメラ制御された視点を生成する方法を提案する。
本手法は,広範囲なトレーニングや3Dおよびマルチビューデータなしで,複雑で多様なシーンを処理できることに優れる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:03:37 GMT)
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance [61.1] 単一入力画像からカメラ制御された視点を生成する方法を提案する。
本手法は,広範囲なトレーニングや3Dおよびマルチビューデータなしで,複雑で多様なシーンを処理できることに優れる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:03:37 GMT)
ErrorRadar: Benchmarking Complex Mathematical Reasoning of Multimodal Large Language Models Via Error Detection [60.3] エラー検出におけるMLLMの能力を評価するために設計された最初のベンチマークであるErrorRadarを紹介する。
ErrorRadarはエラーステップ識別とエラー分類という2つのサブタスクを評価している。
2500の高品質なマルチモーダルK-12数学問題で構成され、実世界の学生相互作用から収集される。
GPT-4oの優れた性能は、まだ人間の評価に約10%遅れているため、大きな課題が残っている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:03:46 GMT)
ErrorRadar: Benchmarking Complex Mathematical Reasoning of Multimodal Large Language Models Via Error Detection [60.3] エラー検出におけるMLLMの能力を評価するために設計された最初のベンチマークであるErrorRadarを紹介する。
ErrorRadarはエラーステップ識別とエラー分類という2つのサブタスクを評価している。
2500の高品質なマルチモーダルK-12数学問題で構成され、実世界の学生相互作用から収集される。
GPT-4oの優れた性能は、まだ人間の評価に約10%遅れているため、大きな課題が残っている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:03:46 GMT)
Accelerated Preference Optimization for Large Language Model Alignment [60.2] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデル(LLM)を人間の好みに合わせるための重要なツールとして登場した。
直接選好最適化(DPO)は、報酬関数を明示的に見積もることなく、ポリシー最適化問題としてRLHFを定式化する。
本稿では,既存の最適化アルゴリズムを統一したAPO(Accelerated Preference Optimization)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:51:01 GMT)
TeaserGen: Generating Teasers for Long Documentaries [59.8] 1,269の文書集であるDocumentaryNetをティーザーと組み合わせて紹介する。
長文からティーザーを生成するための新しい2段階システムを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:00:09 GMT)
LLaCA: Multimodal Large Language Continual Assistant [59.6] MCIT(Multimodal Continual Instruction Tuning)は、MLLMにシーケンシャルデータセットにおける人間の意図に従うよう継続的に指示するために用いられる。
既存の勾配更新は、以前のデータセットのチューニング性能を著しく損なうことになる。
本稿では,この課題に対処するため,LLaCA (Multimodal Large Language Continual Assistant) という手法を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:24:59 GMT)
MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.4] このデータセットには、スキーマ図、シミュレーション画像、マクロ/顕微鏡写真、実験的可視化などの図が含まれている。
我々は,6つのプロプライエタリモデルと10以上のオープンソースモデルを評価し,科学的フィギュアキャプションと複数選択質問のベンチマークを開発した。
データセットとベンチマークは、さらなる研究をサポートするためにリリースされる予定だ。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:42:09 GMT)
A Simple Image Segmentation Framework via In-Context Examples [59.3] 本稿では,テキスト内例を利用したシンプルな画像フレームワークであるSINEを提案する。
In-context Interactionモジュールを導入し、インコンテキスト情報を補完し、ターゲット画像とインコンテキストの例との相関関係を生成する。
様々なセグメンテーションタスクの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:38:44 GMT)
A Simple Image Segmentation Framework via In-Context Examples [59.3] 本稿では,テキスト内例を利用したシンプルな画像フレームワークであるSINEを提案する。
In-context Interactionモジュールを導入し、インコンテキスト情報を補完し、ターゲット画像とインコンテキストの例との相関関係を生成する。
様々なセグメンテーションタスクの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:38:44 GMT)
QT-DoG: Quantization-aware Training for Domain Generalization [58.4] 領域一般化のための量子化アウェアトレーニング(QT-DoG)を提案する。
QT-DoGは、モデル重みのノイズを誘導することで暗黙の正則化器として量子化を利用する。
我々は、QT-DoGが様々なデータセット、アーキテクチャ、量子化アルゴリズムにまたがって一般化することを実証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:21:48 GMT)
Stochastic Bandits for Egalitarian Assignment [58.3] 我々は,多武装盗賊の文脈における平等的課題であるEgalMABについて検討する。
UCBベースのポリシーEgalUCBを設計・分析し、累積的後悔の上限を確立する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:49:47 GMT)
EgoAvatar: Egocentric View-Driven and Photorealistic Full-body Avatars [56.6] 本研究では,光合成デジタルアバターを共同でモデル化し,同時に1つの自我中心映像から駆動する人物中心型テレプレゼンス手法を提案する。
提案手法は,エゴセントリック・フォトリアル・テレプレゼンスへの明確な一歩として,ベースラインと競合する手法に優れることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:01:58 GMT)
EgoAvatar: Egocentric View-Driven and Photorealistic Full-body Avatars [56.6] 本研究では,光合成デジタルアバターを共同でモデル化し,同時に1つの自我中心映像から駆動する人物中心型テレプレゼンス手法を提案する。
提案手法は,エゴセントリック・フォトリアル・テレプレゼンスへの明確な一歩として,ベースラインと競合する手法に優れることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:01:58 GMT)
Relative pose of three calibrated and partially calibrated cameras from four points using virtual correspondences [56.4] 3台のカメラの相対的なポーズを推定する際の課題について検討する。
我々のソリューションは、2つのビューで1つまたは2つの仮想点対応を生成するという単純なアイデアに基づいている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:16:55 GMT)
Enhancing HOI Detection with Contextual Cues from Large Vision-Language Models [56.3] ConCueは、HOI検出における視覚的特徴抽出を改善するための新しいアプローチである。
コンテクストキューをインスタンスと相互作用検出器の両方に統合するマルチトウワーアーキテクチャを用いたトランスフォーマーベースの特徴抽出モジュールを開発した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 04:02:56 GMT)
Generalizing to any diverse distribution: uniformity, gentle finetuning and rebalancing [55.8] 我々は,訓練データから大きく逸脱した場合でも,様々なテスト分布によく適応するモデルを開発することを目的としている。
ドメイン適応、ドメイン一般化、ロバスト最適化といった様々なアプローチは、アウト・オブ・ディストリビューションの課題に対処しようと試みている。
我々は、既知のドメイン内の十分に多様なテスト分布にまたがる最悪のケースエラーを考慮することで、より保守的な視点を採用する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:26:48 GMT)
CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer [55.5] 拡散トランスを用いた大規模テキスト・ビデオ生成モデルであるCogVideoXを提案する。
フレームレートは16fps、解像度は768×1360ピクセル。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:28:19 GMT)
Unisolver: PDE-Conditional Transformers Are Universal PDE Solvers [55.1] 広範にPDEを解くことができるUniversal PDEソルバ(Unisolver)を提案する。
私たちの重要な発見は、PDEソリューションが基本的に一連のPDEコンポーネントの制御下にあることです。
Unisolverは3つの挑戦的な大規模ベンチマークにおいて、一貫した最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:36:24 GMT)
Unveiling the Backbone-Optimizer Coupling Bias in Visual Representation Learning [55.0] 本論文は、視覚バックボーンと視覚バックボーンの相互作用と、その相互依存現象であるtextittextbfbackbonetextbfoptimizer textbfcoupling textbfbias (BOCB) について述べる。
我々は、VGGやResNetのような標準CNNがSGDファミリとの顕著な共存を示すのに対し、ViTsやConvNeXtといった最近のアーキテクチャは適応学習率と密接な結合性を持っていることを観察する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:14:23 GMT)
Studying Large Language Model Behaviors Under Context-Memory Conflicts With Real Documents [55.0] Retrieval-augmented Generationは、完全なパラメトリック言語モデルの多くの問題を緩和する。
RAGでは、コンテキストで提供される文書からモデルの知識を更新することができる。
本稿では,そのような知識紛争を現実的に研究するための枠組みを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 18:07:33 GMT)
Stereotype or Personalization? User Identity Biases Chatbot Recommendations [54.4] 大規模言語モデル(LLM)は,ユーザが何を望んでいるのか,何者なのかを反映したレコメンデーションを生成する。
モデルが、ユーザが意図的に自身のアイデンティティを明らかにするかどうかに関わらず、人種的にステレオタイプなレコメンデーションを生成することがわかった。
実験の結果,ユーザの識別がモデルレコメンデーションに大きく影響しているにもかかわらず,モデル応答はユーザクエリに応答して,この事実を難読化することがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:51:55 GMT)
SGFormer: Spherical Geometry Transformer for 360 Depth Estimation [54.1] パノラマ歪みは360度深度推定において大きな課題となる。
本稿では,SGFormer という球面形状変換器を提案し,上記の問題に対処する。
また、様々な解像度で空間構造を補うために、クエリベースの大域的条件位置埋め込みを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:09:38 GMT)
ViBiDSampler: Enhancing Video Interpolation Using Bidirectional Diffusion Sampler [54.0] 現在の画像とビデオの拡散モデルは、単一のフレームからビデオを生成するのに強力だが、2フレーム条件付き生成に適応する必要がある。
我々は,これらのオフマンド問題に対処するために,広範囲な再ノイズや微調整を必要とせずに,新しい双方向サンプリング戦略を導入する。
提案手法では,それぞれ開始フレームと終了フレームに条件付き前方経路と後方経路の両方に沿って逐次サンプリングを行い,中間フレームの整合性を確保した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:01:54 GMT)
TA-Cleaner: A Fine-grained Text Alignment Backdoor Defense Strategy for Multimodal Contrastive Learning [53.8] バックドアトリガの特徴的接続を遮断するための細粒な textbfText textbfAlignment textbfCleaner (TA-Cleaner) を提案する。
TA-Cleanerは、ファインタニングベースの防御技術の中で最先端の防御性を達成している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:11:59 GMT)
CodeDPO: Aligning Code Models with Self Generated and Verified Source Code [52.7] 我々は、コード生成に好み学習を統合するフレームワークであるCodeDPOを提案し、コードの正確性と効率性という2つの重要なコード優先要因を改善した。
CodeDPOは、コードとテストケースを同時に生成、評価するセルフジェネレーション・アンド・バリデーションメカニズムを利用して、新しいデータセット構築方法を採用している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:36:15 GMT)
CLOSER: Towards Better Representation Learning for Few-Shot Class-Incremental Learning [52.6] FSCIL(Few-shot class-incremental Learning)は、過剰適合や忘れなど、いくつかの課題に直面している。
FSCILの独特な課題に取り組むため、ベースクラスでの表現学習に重点を置いている。
より制限された機能空間内で機能の拡散を確保することで、学習された表現が、伝達可能性と識別可能性のバランスを良くすることが可能になることが分かりました。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:23:16 GMT)
Don't Cut Corners: Exact Conditions for Modularity in Biologically Inspired Representations [52.5] 我々は、生物にインスパイアされた表現が、ソース変数(ソース)に関してモジュール化されるときの理論を開発する。
我々は、最適な生物学的にインスパイアされたリニアオートエンコーダのニューロンがモジュラー化されるかどうかを判断する情報源のサンプルに対して、必要かつ十分な条件を導出する。
我々の理論はどんなデータセットにも当てはまり、以前の研究で研究された統計的な独立性よりもはるかに長い。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:41:37 GMT)
Data-augmented phrase-level alignment for mitigating object hallucination [52.4] MLLM(Multimodal Large Language Models)はしばしば幻覚と呼ばれる事実的不正確な情報を生成する。
そこで,本研究では,MLLMの命令調整による幻覚の緩和に応用可能な新しい損失であるData-augmented Phrase-level Alignment(DPA)を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 21:01:08 GMT)
CItruS: Chunked Instruction-aware State Eviction for Long Sequence Modeling [52.4] 本稿では,下流タスクに有用な注目度を隠蔽状態の消去プロセスに統合する新しいモデリング手法であるChunked Instruction-Aware State Eviction(CItruS)を紹介する。
トレーニング不要な手法は,メモリ予算が同じ条件下で,複数の強いベースライン上での長いシーケンス理解および検索タスクにおいて,優れた性能を示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 04:25:41 GMT)
$\textit{X}^2$-DFD: A framework for e${X}$plainable and e${X}$tendable Deepfake Detection [52.1] 3つのコアモジュールからなる新しいフレームワークX2$-DFDを提案する。
最初のモジュールであるモデル特徴評価(MFA)は、MLLMに固有の偽機能の検出能力を計測し、これらの機能の下位ランキングを提供する。
第2のモジュールであるStrong Feature Strengthening (SFS)は、上位機能に基づいて構築されたデータセット上でMLLMを微調整することで、検出と説明機能を強化する。
第3のモジュールであるWak Feature Supplementing (WFS)は、外部専用の機能を統合することで、低階機能における微調整MLLMの機能を改善する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:28:33 GMT)
On the Modeling Capabilities of Large Language Models for Sequential Decision Making [52.1] 大規模な事前訓練されたモデルでは、推論や計画タスクのパフォーマンスがますます向上している。
我々は、直接的または間接的に、意思決定ポリシーを作成する能力を評価する。
未知の力学を持つ環境において、合成データを用いた微調整LDMが報酬モデリング能力を大幅に向上させる方法について検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:12:57 GMT)
O1 Replication Journey: A Strategic Progress Report -- Part 1 [52.1] 本稿では,O1 Replication Journeyに具体化された人工知能研究の先駆的アプローチを紹介する。
我々の方法論は、長期化したチームベースのプロジェクトの不規則性を含む、現代のAI研究における重要な課題に対処する。
本稿では,モデルにショートカットだけでなく,完全な探索プロセスの学習を促す旅行学習パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:13:01 GMT)
KV Cache Compression, But What Must We Give in Return? A Comprehensive Benchmark of Long Context Capable Approaches [52.0] 長期の文脈能力は、大規模言語モデル(LLM)にとって重要な能力である
この研究は、現在の手法の分類を提供し、長いコンテキストタスクの7つのカテゴリにまたがる10以上の最先端のアプローチを評価する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 19:34:03 GMT)
ReFIR: Grounding Large Restoration Models with Retrieval Augmentation [52.0] 本稿では,Retrieval-augmented Framework for Image Restoration (ReFIR) というソリューションを提案する。
我々のReFIRは、抽出した画像を外部知識として組み込んで、既存のLRMの知識境界を拡張する。
実験により,ReFIRは高忠実度だけでなく,現実的な復元結果も得られることが示された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:27:45 GMT)
Temporal Reasoning Transfer from Text to Video [51.7] ビデオ大言語モデル(ビデオLLM)は、時間的変化の追跡と時間的関係の推論に苦労する。
テキストからビデオ領域への時間的推論能力を伝達するために、テキスト時間的推論転送(T3)を導入する。
LongVA-7Bモデルは、包括的なビデオベンチマーク上での競合性能を実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:10:29 GMT)
TACT: Advancing Complex Aggregative Reasoning with Information Extraction Tools [51.6] 大規模言語モデル(LLM)は、テキスト間の情報の集約を必要とするクエリではよく機能しないことが多い。
TACTには、1つ以上のテキストに散らばる縫合情報を要求する難しい命令が含まれている。
既存のテキストと関連するテーブルのデータセットを活用することで、このデータセットを構築します。
現代のLLMはいずれも,このデータセットでは性能が悪く,精度が38%以下であることが実証された。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:40:58 GMT)
Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3] 本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。
2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。
LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:22:36 GMT)
Gradual Learning: Optimizing Fine-Tuning with Partially Mastered Knowledge in Large Language Models [51.2] 大規模言語モデル(LLM)は、事前学習期間中に大量のテキストコーパスから膨大な量の知識を取得する。
微調整や推論のような後段では、モデルは初期訓練でカバーされていない知識に遭遇する可能性がある。
本稿では,モデル全体のテスト精度と知識保持性を改善するための2段階の微調整戦略を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:35:16 GMT)
Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond [51.1] このチュートリアルは、マルチモーダルAIを活用するための知識とスキルを研究者、実践者、新参者に提供することを目的としている。
最新のマルチモーダルデータセットと事前訓練されたモデル、例えばビジョンや言語以外のものについても取り上げる。
ハンズオン実験室は、最先端のマルチモーダルモデルで実践的な経験を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:41:56 GMT)
Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.6] 現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:06:10 GMT)
Revealing the Parallel Multilingual Learning within Large Language Models [50.1] 本研究では,多言語大言語モデル(LLM)の文脈内学習能力を明らかにする。
入力を複数の言語に翻訳することで、並列入力(PiM)をLLMに提供し、その理解能力を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 04:03:16 GMT)
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining [49.7] 我々は,アタリゲーム上で事前訓練されたオフラインモデルベースRLエージェントであるJOWA: Jointly-Reinforceed World-Action Modelを紹介する。
私たちの最大のエージェントは、1億5000万のパラメータを持ち、10%のサブサンプルオフラインデータだけで事前トレーニングされたゲームで78.9%の人間レベルのパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:41:43 GMT)
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining [49.7] 我々は,60億のトークンデータを持つアタリゲーム上で事前訓練されたオフラインモデルベースRLエージェントであるJOWA: Jointly-Reinforceed World-Action Modelを紹介する。
われわれの最大のエージェントは、1億5000万のパラメータを持ち、10%のサブサンプルオフラインデータだけで事前トレーニングされたゲーム上での人間レベルのパフォーマンス78.9%で、既存の最先端の大規模なオフラインRLベースラインを31.6%上回っている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:41:43 GMT)
Unsupervised Model Diagnosis [49.4] 本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:59:03 GMT)
A QUBO Formulation for the Generalized LinkedIn Queens Game [49.2] 本稿では、LinkedIn Queens ゲームの一連の一般化を解決するために設計された QUBO の定式化について述べる。
この定式化は、変数の数と相互作用を最適化しようと試みることで、問題の特定のケースに適応する。
また,カラーチェスピース問題 (Coloured Chess Piece Problem) とマックスチェスピース問題 (Max Chess Pieces Problem) という2種類の新しい問題を,対応するQUBOの定式化とともに提示する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:54:54 GMT)
Communication-Efficient Federated Group Distributionally Robust Optimization [49.1] フェデレーション学習は、異なるクライアントにおけるデータボリュームと分散の不均一性のために、課題に直面します。
グループ分散ロバスト最適化(GDRO)に基づいてこの問題に対処するための既存のアプローチは、しばしば高い通信とサンプルの複雑さをもたらす。
本研究では, 通信効率の高いFederated Group Distributionally Robust Optimizationに適したアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:07:53 GMT)
A Sanity Check for AI-generated Image Detection [49.1] 本稿では,AIによる画像検出の課題が解決されたかどうかの検査を行う。
既存の手法の一般化を定量化するために,Chameleonデータセット上で,既製のAI生成画像検出器を9つ評価した。
複数の専門家が同時に視覚的アーチファクトやノイズパターンを抽出するAI生成画像検出装置(AID)を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:46:43 GMT)
Grounding is All You Need? Dual Temporal Grounding for Video Dialog [48.3] 本稿では,Dual Temporal Grounding-enhanced Video Dialog Model (DTGVD)を紹介する。
ダイアログ固有の時間領域を予測することによって、二重時間関係を強調する。
また、ビデオコンテンツのフィルタリングや、ビデオとダイアログの両方のコンテキストでの応答のグラウンド化も行う。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:48:34 GMT)
VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide [48.2] VideoGuideは、事前訓練されたテキスト・ツー・ビデオ(T2V)モデルの時間的一貫性を高める新しいフレームワークである。
ガイドモデルの復調標本をサンプリングモデルの復調過程に補間することにより、時間的品質を向上させる。
提案手法は時間的一貫性と画像の忠実度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:56:24 GMT)
VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide [48.2] VideoGuideは、事前訓練されたテキスト・ツー・ビデオ(T2V)モデルの時間的一貫性を高める新しいフレームワークである。
ガイドモデルの復調標本をサンプリングモデルの復調過程に補間することにより、時間的品質を向上させる。
提案手法は時間的一貫性と画像の忠実度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:56:24 GMT)
Generating Synthetic Datasets for Few-shot Prompt Tuning [48.1] 数ショットの学習設定では、フルモデルの微調整よりもはるかに遅れて、アプリケーションのスコープが制限される。
本稿では,ソフトプロンプトを学習するために,強力なLCMを用いてタスク固有のラベル付きデータを合成する。
我々は、勾配手術アプローチを用いて、合成データセットと実データセットの両方でソフトプロンプトを訓練する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 01:00:02 GMT)
MEXA: Multilingual Evaluation of English-Centric LLMs via Cross-Lingual Alignment [48.0] MEXAは、英語中心の大規模言語モデルの多言語能力を評価する方法である。
パラレル文を用いて英語と非英語のアライメントを計算する。
このアライメントは、他の言語でのモデルパフォーマンスを推定するために使用することができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:59:23 GMT)
Diffusion Auto-regressive Transformer for Effective Self-supervised Time Series Forecasting [47.6] 我々はTimeDARTと呼ばれる新しい自己管理手法を提案する。
TimeDARTは、時系列データ内のグローバルシーケンス依存とローカル詳細特徴の両方をキャプチャする。
私たちのコードはhttps://github.com/Melmaphother/TimeDART.comで公開されています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:08:33 GMT)
A Skewness-Based Criterion for Addressing Heteroscedastic Noise in Causal Discovery [47.4] 非定常対称雑音モデル(HSNMs)について検討する。
データ分布のスコア(すなわちログ密度の勾配)の歪度に基づいて、HSNMを識別するための新しい基準を導入する。
外部ノイズの抽出を必要とせずにヘテロ代用ノイズを処理するアルゴリズムであるSkewScoreを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:28:30 GMT)
Retrieve-Plan-Generation: An Iterative Planning and Answering Framework for Knowledge-Intensive LLM Generation [47.2] 大規模言語モデル(LLM)のためのリトリーブ・プラン生成(RPG)フレームワークを提案する。
RPGはプラントークンを生成し、プランステージの後の世代をガイドする。
解答段階では、その計画に基づいて関連きめ細かい段落を選択し、さらに解答生成に使用する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:03:16 GMT)
Learning to adapt unknown noise for hyperspectral image denoising [47.2] 重み付きネットワーク(HWnet)による重みの予測を提案する。
HWnetは、バイレベル最適化フレームワークにおけるいくつかのモデルベースのHSI記述法から、正確に学習されている。
大規模な実験により、提案されたHWnetは、異なる複雑なノイズを扱うためのHSIデノナイジングモデルの能力を向上させるのに大いに役立つことが確認された。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:17:06 GMT)
One Perturbation is Enough: On Generating Universal Adversarial Perturbations against Vision-Language Pre-training Models [47.1] クロスモーダル条件 (C-PGC) を備えたコントラスト学習型摂動発電機を提案する。
C-PGCは、効果的なガイダンスとして、一方的な情報と横断的な情報の両方を取り入れている。
実験の結果、C-PGCは敵のサンプルを元の領域から遠ざけることに成功した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:02:52 GMT)
Preference Poisoning Attacks on Reward Model Learning [47.0] ペア比較による報酬モデル学習における脆弱性の性質と範囲について検討する。
本稿では,これらの攻撃に対するアルゴリズム的アプローチのクラスとして,勾配に基づくフレームワークと,ランク・バイ・ディスタンス手法のいくつかのバリエーションを提案する。
最高の攻撃は多くの場合、非常に成功しており、最も極端な場合、100%の成功率を達成することができ、データのわずか0.3%が毒殺されている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 20:32:15 GMT)
Is Your Model Really A Good Math Reasoner? Evaluating Mathematical Reasoning with Checklist [46.7] モデルが本当に問題を理解しているなら、さまざまなタスクにまたがって堅牢に適用されるべきである、と私たちは主張する。
MathCheckはタスクの一般化と推論をテストするためのよく設計されたチェックリストである。
MathCheckは真の数学的能力をよく反映し、数学的知性をより線形に表現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:51:59 GMT)
Data-Driven Room Acoustic Modeling Via Differentiable Feedback Delay Networks With Learnable Delay Lines [46.3] フィードバック遅延ネットワーク(FDN)のパラメータを求める新しい手法を提案する。
提案手法は、訓練可能な遅延線を持つ微分可能なFDNの実装を含む。
提案手法は,所望の音響特性と密に一致できる時間不変周波数独立FDNが得られることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:28:23 GMT)
Data-Driven Room Acoustic Modeling Via Differentiable Feedback Delay Networks With Learnable Delay Lines [46.3] フィードバック遅延ネットワーク(FDN)のパラメータを求める新しい手法を提案する。
提案手法は、訓練可能な遅延線を持つ微分可能なFDNの実装を含む。
提案手法は,所望の音響特性と密に一致できる時間不変周波数独立FDNが得られることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:28:23 GMT)
HiSplat: Hierarchical 3D Gaussian Splatting for Generalizable Sparse-View Reconstruction [46.3] HiSplatは、一般化可能な3Dガウススプラッティングのための新しいフレームワークである。
階層的な3Dガウスを粗大な戦略で生成する。
これにより、再構築品質とデータセット間の一般化が大幅に向上する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:59:32 GMT)
Polynomial Time Cryptanalytic Extraction of Deep Neural Networks in the Hard-Label Setting [45.7] ディープニューラルネットワーク(DNN)は貴重な資産だが、その公開アクセシビリティはセキュリティ上の懸念を引き起こす。
本稿では,DNNパラメータの暗号的抽出を,最も難しいハードラベル設定で初めて行う手法を紹介する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:27:55 GMT)
Autonomous Character-Scene Interaction Synthesis from Text Instruction [45.3] そこで本研究では,単一テキスト命令と目標位置から直接,多段階のシーン認識インタラクション動作を合成するフレームワークを提案する。
提案手法では,次の動作セグメントを自動回帰拡散モデルで合成し,各動作ステージの遷移を予測する自律スケジューラを用いる。
本稿では,40種類の動作を含む120の屋内シーンにおいて,16時間の動作シーケンスからなる総合的な動きキャプチャーデータセットについて述べる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:58:42 GMT)
Autonomous Character-Scene Interaction Synthesis from Text Instruction [45.3] そこで本研究では,単一テキスト命令と目標位置から直接,多段階のシーン認識インタラクション動作を合成するフレームワークを提案する。
提案手法では,次の動作セグメントを自動回帰拡散モデルで合成し,各動作ステージの遷移を予測する自律スケジューラを用いる。
本稿では,40種類の動作を含む120の屋内シーンにおいて,16時間の動作シーケンスからなる総合的な動きキャプチャーデータセットについて述べる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:58:42 GMT)
Back to the Color: Learning Depth to Specific Color Transformation for Unsupervised Depth Estimation [45.1] 合成色と実世界の色の違いは、実世界のシーンにおける深度推定に重大な課題をもたらす。
実世界のデータに基づいて訓練されたモデルを用いて,奥行きからリアルな色を予測するフレームワークBack2Colorを提案する。
また、VADepthは、変換器よりも計算量が少なく、精度も高いVision Attention Networkをベースにしている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:43:54 GMT)
GLOV: Guided Large Language Models as Implicit Optimizers for Vision Language Models [44.8] 大型言語モデル(LLM)は視覚言語モデル(VLM)の暗黙の役割を果たす
我々のGLOVメタプロンプトは、下流のタスク記述でLLMをメタプロンプトし、適切なVLMプロンプトに問い合わせる。
VLMの2つのファミリーを用いて16種類の多様なデータセット上でGLOVを評価した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:55:40 GMT)
CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation [44.5] 我々はCLIP-VISと呼ばれる単純なエンコーダデコーダネットワークを提案し、CLIPをオープン語彙ビデオインスタンスセグメンテーションに適用する。
私たちのCLIP-VISは、凍結したCLIPを採用し、クラスに依存しないマスク生成、時間的トップK強調マッチング、重み付きオープン語彙分類を含む3つのモジュールを導入している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:21:31 GMT)
Batched Bayesian optimization with correlated candidate uncertainties [44.4] 純粋に活用する qPO (multipoint of Optimality) による離散最適化のための獲得戦略を提案する。
本研究では, 大規模化学ライブラリのモデル誘導探索に適用し, バッチ化ベイズ最適化における最先端手法と同等以上の性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:13:12 GMT)
Toward Scalable Image Feature Compression: A Content-Adaptive and Diffusion-Based Approach [44.0] 本稿では,スケーラブルな画像圧縮のためのコンテンツ適応拡散モデルを提案する。
提案手法は拡散過程を通じて微細なテクスチャを符号化し,知覚品質を向上する。
画像再構成および下流マシンビジョンタスクにおいて,提案手法の有効性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:48:34 GMT)
MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense [43.7] Model Inversion (MI)攻撃は、ターゲットモデルの出力情報を活用して、プライバシに敏感なトレーニングデータを再構築することを目的としている。
包括的で整合性があり、信頼性の高いベンチマークが欠如していることは、非常に大きな課題である。
この致命的なギャップに対処するため、モデル反転攻撃と防御のための最初の実用的なベンチマーク(textitMIBench)を紹介した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:21:13 GMT)
MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense [43.7] Model Inversion (MI)攻撃は、ターゲットモデルの出力情報を活用して、プライバシに敏感なトレーニングデータを再構築することを目的としている。
包括的で整合性があり、信頼性の高いベンチマークが欠如していることは、非常に大きな課題である。
この致命的なギャップに対処するため、モデル反転攻撃と防御のための最初の実用的なベンチマーク(textitMIBench)を紹介した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:21:13 GMT)
Time-FFM: Towards LM-Empowered Federated Foundation Model for Time Series Forecasting [43.6] 我々は、事前訓練されたLMを活用して時系列予測のためのFederated Foundation ModelであるTime-FFMを提案する。
総合的な実験により、Time-FFMは最先端の予測よりも優れており、効果的に数発・ゼロショットの予測が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:40:03 GMT)
ReLiK: Retrieve and LinK, Fast and Accurate Entity Linking and Relation Extraction on an Academic Budget [43.4] エンティティリンク(EL)と関係抽出(RE)のためのRetriever-Readerアーキテクチャを提案する。
我々は、テキストと並んで候補となるエンティティや関係を組み込んだ革新的な入力表現を提唱した。
ELとREの定式化は、ドメイン内ベンチマークとドメイン外ベンチマークの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:07:29 GMT)
CALoR: Towards Comprehensive Model Inversion Defense [43.3] Model Inversion Attacks (MIAs)は、プライバシに敏感なトレーニングデータを、リリースされた機械学習モデルにエンコードされた知識から回復することを目的としている。
MIA分野の最近の進歩は、複数のシナリオにおける攻撃性能を大幅に向上させた。
信頼性適応と低ランク圧縮を統合した堅牢な防御機構を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:44:01 GMT)
ToolBridge: An Open-Source Dataset to Equip LLMs with External Tool Capabilities [43.2] 本稿では、言語モデルに外部ツールの活用方法を学ぶためのデータセット構築に関する詳細なプロセスを明らかにすることを目的とする。
ToolBridgeは、一般的なオープンアクセスデータセットの集合を生データセットプールとして使用することを提案している。
これらのキュレートされたデータエントリの微調整を監督することにより、LLMは予測精度を高めるために、適切なコンテキストで外部ツールを呼び出すことができる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 20:54:40 GMT)
Hybrid Fourier Score Distillation for Efficient One Image to 3D Object Generation [42.8] 単一の画像から3D生成は、制御可能な3D資産を作る上で重要な要素である。
2D-3Dハイブリッドフーリエスコア蒸留目標関数hy-FSDを提案する。
hy-FSDは既存の3D生成手法に統合でき、性能が大幅に向上する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:45:06 GMT)
DiVERT: Distractor Generation with Variational Errors Represented as Text for Math Multiple-choice Questions [42.1] 算数多重選択問題(MCQ)において,障害の背後にある誤りの解釈可能な表現を学習する新しい変分法であるDiVERTを導入する。
提案手法は,7Bパラメータを持つベース・オープンソース LLM を用いているにもかかわらず,GPT-4o を用いた最先端の手法を下流のイントラクタ生成において上回っていることを示す。
数学教育者による人間評価も行っており、DiVERTが人間による評価に匹敵する品質のエラーラベルを導いていることを発見した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 01:05:35 GMT)
Position: Towards Resilience Against Adversarial Examples [42.1] 我々は、敵の弾力性の定義と、敵の弾力性のある防御を設計する方法について概観する。
次に, 対向弾性のサブプロブレムを導入し, 連続適応ロバストネス(continuousal adapt robustness)と呼ぶ。
本研究では, 連続適応ロバストネスと, マルチアタックロバストネスと予期せぬアタックロバストネスの関連性を実証する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:56:45 GMT)
Physics-Informed Regularization for Domain-Agnostic Dynamical System Modeling [41.8] 本稿では,幅広い力学系に対して高精度なモデリングを実現するフレームワークを提案する。
保守的なシステムのエネルギーを保ちつつ、非保守的で可逆的なシステムの強い誘導バイアスとして機能する。
ニューラル常微分方程式モデルにTRS損失を組み込むことにより、提案モデルであるTREATは様々な物理系において優れた性能を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:04:01 GMT)
AAAI Workshop on AI Planning for Cyber-Physical Systems -- CAIPI24 [41.8] ワークショップでは、ニューロシンボリックアーキテクチャ、大規模言語モデル(LLM)、深い強化学習、象徴的計画の進歩など、新しいアプローチを強調した。
これらのテクニックは、CPSの複雑さを管理し、現実世界のアプリケーションに潜在的な可能性を秘めている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:52:00 GMT)
Motion Forecasting in Continuous Driving [41.6] 自動運転では、自動運転車が動くと、動きの予測が繰り返し繰り返される。
既存の予測方法は、特定の範囲内で各走行シーンを独立に処理する。
本稿では,連続運転のための新しい動き予測フレームワークであるRealMotionを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:04:57 GMT)
MotionClone: Training-Free Motion Cloning for Controllable Video Generation [41.6] MotionCloneは、参照ビデオから多目的なモーションコントロールビデオ生成までのモーションクローンを可能にする、トレーニング不要のフレームワークである。
MotionCloneは、大域的なカメラの動きと局所的な物体の動きの両方の習熟度を示し、動きの忠実さ、テキストアライメント、時間的一貫性の点で顕著に優れている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:29:05 GMT)
Unveiling Transformer Perception by Exploring Input Manifolds [41.4] 本稿では,Transformerモデルの入力空間における等価クラス探索法を提案する。
提案手法は、トランスフォーマーアーキテクチャの内部層を入力多様体の逐次変形として記述する音響数学的理論に基づいている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:20:31 GMT)
TEOChat: A Large Vision-Language Assistant for Temporal Earth Observation Data [41.4] 我々はTEOChatと呼ばれるビジョンと言語アシスタントを開発し、地球観測データの時間的シーケンスに関する会話を行う。
TEOChatを訓練するために、多数の単一画像と時間的タスクからなる命令追従データセットをキュレートする。
TEOChatは様々な空間的・時間的推論タスクを実行でき、従来のビジョンや言語アシスタントよりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:45:51 GMT)
Transferability Bound Theory: Exploring Relationship between Adversarial Transferability and Flatness [40.9] 一般的な信念は、対向例の平坦度が高ければ高いほど、モデル間移動性が向上するということである。
そこで本研究では, クラフト逆数例に対する導出のサロゲートを最適化する, 理論的に予測可能な攻撃であるTPAを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:34:09 GMT)
ModalPrompt:Dual-Modality Guided Prompt for Continual Learning of Large Multimodal Models [40.8] 大規模マルチモーダルモデル(LMM)は、混合データセットを共同で学習することで、顕著なマルチタスク能力を示す。
既存の手法はデータ再生やモデル拡張を利用しており、どちらもLMM用に特別に開発されていない。
本稿では,マルチモーダル連続学習に適した新しいデュアルモーダル誘導型プロンプト学習フレームワーク(ModalPrompt)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:35:37 GMT)
FedGraph: A Research Library and Benchmark for Federated Graph Learning [40.3] フェデレーショングラフ学習は、重要な実践上の課題を持つ新興分野である。
モデル精度を高めるために多くのアルゴリズムが提案されているが、実際の展開に不可欠なシステム性能は見過ごされがちである。
本稿では,フェデレートグラフ学習における分散配置とベンチマークのための研究ライブラリであるFedGraphを紹介する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:18:18 GMT)
Hierarchical Hybrid Sliced Wasserstein: A Scalable Metric for Heterogeneous Joint Distributions [39.9] Sliced Wasserstein (SW) と Generalized Sliced Wasserstein (GSW) は、その計算的および統計的スケーラビリティのために、アプリケーションで広く使われている。
部分一般化ラドン変換(PGRT)と階層ハイブリッドラドン変換(HHRT)の2つの新しいスライシング演算子を提案する。
HHRTを用いて、SWを階層型ハイブリッドスライスワッサースタイン(H2SW)距離に拡張し、異種関節分布の比較に特化して設計する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 01:39:18 GMT)
EMMA: Empowering Multi-modal Mamba with Structural and Hierarchical Alignment [39.9] 微細な視覚情報を抽出するための構造的・階層的アライメント(EMMA)を用いたマルチモーダルマンバのエンパワーディングを提案する。
本モデルでは,他のマンバ系MLLMよりもレイテンシが低く,推論時の変圧器系MLLMよりも約4倍高速であることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:41:55 GMT)
Are Minimal Radial Distortion Solvers Necessary for Relative Pose Estimation? [39.6] 本稿では, 効率的なピンホール解法と試料の半径歪みパラメータを組み合わせ, 簡単な実装法と放射歪み解法を比較した。
複数のデータセットとRANSACの変種に関する実験は、この単純なアプローチが最も正確な最小歪み解法よりも、同様に、あるいはより優れていることを示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:30:29 GMT)
QKFormer: Hierarchical Spiking Transformer using Q-K Attention [39.6] スパイキングトランスフォーマーは、スパイキングニューラルネットワーク(SNN)とトランスフォーマーアーキテクチャを統合する。
既存のモデルの性能を改善するために、いくつかの革新を紹介します。
直接学習によるQ-K注意に基づく階層型スパイキングトランスであるQKFormerを開発した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:29:01 GMT)
Themis: A Reference-free NLG Evaluation Language Model with Flexibility and Interpretability [39.1] 本稿では,人間とGPT-4のアノテーションを用いた大規模NLG評価コーパスNLG-Evalを構築した。
また,NLG 評価専用の LLM を提案する。この LLM は,設計した多視点整合性検証と評価指向の選好アライメント手法を用いて訓練されている。
Themis は様々な NLG タスクに対して優れた評価性能を示し、同時に未確認タスクを一般化し、GPT-4 など他の評価モデルを上回っている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:50:41 GMT)
Enhancing Temporal Modeling of Video LLMs via Time Gating [38.9] ビデオ大言語モデル (Video Large Language Models, ビデオLLM) は、ビデオ質問応答などのビデオ・アンド・ランゲージ・タスクにおいて、優れたパフォーマンスを達成している。
既存のビデオLLMはビデオデータの時間的情報を無視しており、時間的認識のビデオ理解に苦慮している。
時間ゲーティングビデオLLM(TG-Vid)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:21:29 GMT)
Benchmarking of a new data splitting method on volcanic eruption data [38.9] 反復的な手順は、これらの2つの部分の累積ヒストグラムで計算された相同性指数を用いて、火山噴火の入力データセットを2つの部分に分割する。
提案したモデルでは,エポック数がわずかに増加し,最高の性能が得られる。
各モデルはオーバーフィッティングに適する早期停止を訓練し, 提案手法のエポック数の増加は, 早期停止がオーバーフィッティングを検知しないことを実証した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:29:46 GMT)
Amortized SHAP values via sparse Fourier function approximation [38.8] SHAP値は、解釈可能で説明可能なAIで広く使われている、一般的なローカルな特徴属性手法である。
SHAP値を推定するための2段階の手法を提案する。
我々のアルゴリズムの最初のステップは、多くの実世界の予測器がスペクトルバイアスを持つことを示す最近の結果を活用する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:05:50 GMT)
Retrieving, Rethinking and Revising: The Chain-of-Verification Can Improve Retrieval Augmented Generation [38.8] 大規模言語モデル(LLM)の強化を目的とした最近の検索拡張生成(RAG)
本稿では,外部検索の正しさと内部生成の整合性を高めるためのチェーン・オブ・バリフィケーション(CoV-RAG)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:34:54 GMT)
Towards Real-time Intrahepatic Vessel Identification in Intraoperative Ultrasound-Guided Liver Surgery [38.5] 本研究では,術前の3D超音波肝体積を用いて,門脈および枝状構造のリアルタイム同定のための深層学習モデルを訓練する患者固有のアプローチを提案する。
我々のパーソナライズされたAIモデルは、外生ブタの肝臓で検証され、外科医と比較して精度(0.95)とリコール(0.93)に優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:44:34 GMT)
Towards Real-time Intrahepatic Vessel Identification in Intraoperative Ultrasound-Guided Liver Surgery [38.5] 本研究では,術前の3D超音波肝体積を用いて,門脈および枝状構造のリアルタイム同定のための深層学習モデルを訓練する患者固有のアプローチを提案する。
我々のパーソナライズされたAIモデルは、外生ブタの肝臓で検証され、外科医と比較して精度(0.95)とリコール(0.93)に優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:44:34 GMT)
Reinforcement Learning From Imperfect Corrective Actions And Proxy Rewards [38.1] 我々は、修正行動とプロキシ報酬(ICoPro)から反復学習と呼ばれる新しい値に基づく深部RLアルゴリズムを提案する。
様々なタスク(アタリゲームと高速道路での自動運転)に関する提案を実験的に検証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:04:09 GMT)
AI Can Be Cognitively Biased: An Exploratory Study on Threshold Priming in LLM-Based Batch Relevance Assessment [38.0] 大規模言語モデル(LLM)は高度な理解能力を示しているが、トレーニングデータから人間のバイアスを継承する可能性がある。
関連判定におけるしきい値プライミング効果の影響について検討した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:23:00 GMT)
Breaking the Curse of Multiagency in Robust Multi-Agent Reinforcement Learning [37.8] 分布的にロバストなマルコフゲーム (RMG) は、MARLのロバスト性を高めるために提案されている。
RMGがマルチ緊急の呪いから逃れられるかどうか。
これは、RMGに対するマルチ緊急の呪いを破る最初のアルゴリズムである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:27:49 GMT)
DISCO: Efficient Diffusion Solver for Large-Scale Combinatorial Optimization Problems [37.2] DISCOは、大規模な組合せ最適化問題に対する効率的な拡散解法である。
サンプリング空間は、解残基によって導かれるより有意義な領域に制約され、出力分布のマルチモーダルな性質は保たれる。
大規模なトラベリングセールスマン問題や最大独立セットのベンチマークに挑戦し、他の拡散手段よりも最大5.28倍の速度で推論を行う。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:59:13 GMT)
Learning to Correct for QA Reasoning with Black-box LLMs [37.1] 我々は,機械学習におけるオープンチャレンジとして,COBB (Correct for improve QA reasoning of Black-Box LLMs)を提案する。
トレーニングされた適応モデルを使用して、オリジナルのブラックボックスLSMのしばしば不完全な推論から正しい推論、または改善された推論へのセック2seqマッピングを実行する。
実験の結果,CoBBは様々なQAベンチマークにおいて推理精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:09:26 GMT)
Jogging the Memory of Unlearned LLMs Through Targeted Relearning Attacks [37.1] LLMにおける未学習に対する既存のアプローチは、単純な再学習攻撃の標的セットに驚くほど影響を受けやすいことを示す。
小さく、潜在的にゆるやかに関連付けられたデータのみにアクセスすることで、未学習モデルのメモリを“ジョグ”して、未学習の影響を反転させることができることが分かりました。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:35:13 GMT)
Quadratic Is Not What You Need For Multimodal Large Language Models [36.8] 本研究では,マルチモーダル大言語モデル(MLLM)の視覚成分の計算冗長性について検討する。
刈り取り後のLLMの計算量は、視覚トークンの増加に伴って2次ではなく、線形である。
この発見は、MLLMがより密集した視覚トークンを組み込む可能性を開く。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:13:24 GMT)
Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG [36.8] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)に外部の知識ソースを利用する権限を与える。
本稿では, 回収した「ハードネガティブ」の有害な影響について考察する。
これを緩和し、長文LLMベースのRAGの堅牢性を高めるために、トレーニングフリーとトレーニングベースの両方のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:30:07 GMT)
Beyond the Alphabet: Deep Signal Embedding for Enhanced DNA Clustering [36.4] DNAシークエンシングプロセスが個々のDNA読み取り(A/T/C/G)を生成すると、従来のDNA保存ソリューションが始まります。
そこで本研究では,Nanopore DNAシークエンシングマシンが生成した生信号が,塩基に識別される前に利用できない可能性があることを確認した。
本稿では,これらの信号を直接クラスタリングし,精度を向上し,計算時間を短縮するディープニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:51:31 GMT)
BUMBLE: Unifying Reasoning and Acting with Vision-Language Models for Building-wide Mobile Manipulation [36.2] 本稿では,オープンワールドなRGBD認識,広帯域の極小運動技術,二重層メモリを統合した統合ビジョン・ランゲージ・モデル(VLM)ベースのフレームワークであるBUMBLEを紹介する。
BUMBLEは、異なる部屋やフロアから70以上の試験、タスク、シーンレイアウトを平均47.1%の成功率で達成している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:52:29 GMT)
FineMolTex: Towards Fine-grained Molecular Graph-Text Pre-training [36.1] FineMolTexは、粗い分子レベルの知識ときめ細かいモチーフレベルの知識を共同で学習する、分子グラフ-テキスト事前学習フレームワークである。
我々は3つの下流タスクに対して実験を行い、テキストベースの分子編集タスクにおいて最大230%の改善を実現した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:40:18 GMT)
FineMolTex: Towards Fine-grained Molecular Graph-Text Pre-training [36.1] FineMolTexは、粗い分子レベルの知識ときめ細かいモチーフレベルの知識を共同で学習する、分子グラフ-テキスト事前学習フレームワークである。
我々は3つの下流タスクに対して実験を行い、テキストベースの分子編集タスクにおいて最大230%の改善を実現した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:40:18 GMT)
Restructuring Vector Quantization with the Rotation Trick [36.0] ベクトル量子化変分オートエンコーダ(VQ-VAE)は、連続的な入力を離散潜在空間に圧縮し、最小限の歪みで再構成するように設計されている。
ベクトル量子化は微分不可能であるため、エンコーダへの勾配はベクトル量子化層を通り抜けるのではなく、直線的な近似で流れる。
本稿では,VQ-VAEのベクトル量子化層を通じて勾配を伝搬する方法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:39:34 GMT)
SciKnowEval: Evaluating Multi-level Scientific Knowledge of Large Language Models [36.0] SciKnowEvalベンチマーク(SciKnowEval benchmark)は,5つの科学的知識の段階にわたる大規模言語モデル(LLM)を評価するフレームワークである。
これらのレベルは、記憶、理解、推論、識別、応用を含むLLMにおける科学知識の幅と深さを評価することを目的としている。
ゼロショットと少数ショットのプロンプト戦略を用いて、26の高度なオープンソースおよびプロプライエタリなLCMをベンチマークした。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:44:25 GMT)
SciKnowEval: Evaluating Multi-level Scientific Knowledge of Large Language Models [36.0] SciKnowEvalベンチマーク(SciKnowEval benchmark)は,5つの科学的知識の段階にわたる大規模言語モデル(LLM)を評価するフレームワークである。
これらのレベルは、記憶、理解、推論、識別、応用を含むLLMにおける科学知識の幅と深さを評価することを目的としている。
ゼロショットと少数ショットのプロンプト戦略を用いて、26の高度なオープンソースおよびプロプライエタリなLCMをベンチマークした。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:44:25 GMT)
Simple Relative Deviation Bounds for Covariance and Gram Matrices [35.0] 経験的共分散およびグラム行列の固有値に対する非漸近的相対偏差境界を提供する。
我々の結果はスペクトルをまたいだよりシャープな制御を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:28:56 GMT)
FacLens: Transferable Probe for Foreseeing Non-Factuality in Large Language Models [35.0] 本研究は,非実効性予測(NFP)について検討し,LLMが質問に対する非実効性応答を生成するかどうかを予測することを目的とした。
本研究では,NFPタスクの隠れ表現を効果的に探索するFacLensという軽量なNFPモデルを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:26:40 GMT)
Quantum Monte Carlo Integration for Simulation-Based Optimisation [35.0] シミュレーションに基づく最適化問題のサブルーチンとして量子アルゴリズムを統合する可能性について検討する。
量子モンテカルロ積分の定式化に起因した全ての系統的誤差を徹底的に解析する。
基本的金融ユースケースに対する量子モンテカルロ積分の適用性について検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:49:20 GMT)
Quantum Monte Carlo Integration for Simulation-Based Optimisation [35.0] シミュレーションに基づく最適化問題のサブルーチンとして量子アルゴリズムを統合する可能性について検討する。
量子モンテカルロ積分の定式化に起因した全ての系統的誤差を徹底的に解析する。
基本的金融ユースケースに対する量子モンテカルロ積分の適用性について検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:49:20 GMT)
Scaling Laws Across Model Architectures: A Comparative Analysis of Dense and MoE Models in Large Language Models [34.8] 大規模言語モデル(LLM)のスケーリングは、モデルトレーニングとデプロイメントの効率性と効率性にとって重要な研究領域である。
本研究は,Dense Models と MoE Model のスケーリング法則の伝達性と相違について検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:21:56 GMT)
PortLLM: Personalizing Evolving Large Language Models with Training-Free and Portable Model Patches [34.7] PortLLMはトレーニング不要のフレームワークで、ドメイン固有の知識をキャプチャするための、最初の軽量モデル更新パッチを作成する。
PortLLMは、最大12.2倍のGPUメモリ使用率でLoRAファインチューニングに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:41:08 GMT)
Metric Differential Privacy at the User-Level Via the Earth Mover's Distance [34.6] メートル差プライバシー(DP)は、入力のペア間の距離に基づいて不均一なプライバシー保証を提供する。
本稿では,ユーザレベルでのメートル法DPの自然な定義について検討する。
線形クエリとアイテムワイズクエリに応答する2つの新しいメカニズムを$d_textsfEM$-DPで設計する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:59:53 GMT)
Is Child-Directed Speech Effective Training Data for Language Models? [34.5] GPT-2 と RoBERTa モデルを英語の子供指向音声の29万語で学習する。
子どものトレーニングデータのグローバルな発達順序付けやローカルな談話順序付けが、他のデータセットと比較して高いパフォーマンスを支えているかどうかを検証する。
これらの結果は、より良いデータから進むのではなく、子供の学習アルゴリズムが現在の言語モデリング技術よりもはるかにデータ効率が高いという仮説を支持している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:27:10 GMT)
ToolGen: Unified Tool Retrieval and Calling via Generation [34.3] ToolGenは、ツール知識を大きな言語モデルのパラメータに直接統合するパラダイムシフトです。
ToolGenは、ツール検索と自律タスク補完の両方において、優れた結果が得られることを示す。
ToolGenは、より汎用的で効率的で自律的なAIシステムを実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:54:16 GMT)
ToolGen: Unified Tool Retrieval and Calling via Generation [34.3] ToolGenは、ツール知識を大きな言語モデルのパラメータに直接統合するパラダイムシフトです。
ToolGenは、ツール検索と自律タスク補完の両方において、優れた結果が得られることを示す。
ToolGenは、より汎用的で効率的で自律的なAIシステムを実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:54:16 GMT)
MAMA: Meta-optimized Angular Margin Contrastive Framework for Video-Language Representation Learning [34.3] MAMAはビデオ言語表現の学習における新たなアプローチである。
MAMAは、ビデオ言語表現を改善し、一般的なビデオ質問応答やテキストビデオ検索データセットにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:02:31 GMT)
When Graph Neural Networks Meet Dynamic Mode Decomposition [34.2] DMDアルゴリズムによって提供される低ランク固有関数を効果的に活用するMDD-GNNモデル群を紹介する。
我々の研究は、GNNを通して高度な動的システム解析ツールを適用するための道筋をたどっている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:09:48 GMT)
Diffusing to the Top: Boost Graph Neural Networks with Minimal Hyperparameter Tuning [33.9] グラフ条件付き潜在拡散フレームワーク(GNN-Diff)を導入し,高性能なGNNを生成する。
提案手法は,小,大,長距離グラフ上のノード分類とリンク予測という4つのグラフタスクを対象とした166の実験を通じて検証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:27:34 GMT)
Effective and Evasive Fuzz Testing-Driven Jailbreaking Attacks against LLMs [33.9] 大規模言語モデル(LLM)は様々なタスクに優れていますが、それでも脱獄攻撃に対して脆弱です。
我々は,ブラックボックスファジテストのアプローチを,一連のカスタマイズされた設計で適応させる新しいジェイルブレイク攻撃フレームワークを提案する。
本手法は攻撃成功率を90%以上,80%,74%以上とし,既存ベースラインを60%以上越えた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:47:59 GMT)
Effective and Evasive Fuzz Testing-Driven Jailbreaking Attacks against LLMs [33.9] 大規模言語モデル(LLM)は様々なタスクに優れていますが、それでも脱獄攻撃に対して脆弱です。
我々は,ブラックボックスファジテストのアプローチを,一連のカスタマイズされた設計で適応させる新しいジェイルブレイク攻撃フレームワークを提案する。
攻撃成功率は90%,80%,74%以上であり,既存のベースラインを60%以上越えている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:47:59 GMT)
Evaluating Character Understanding of Large Language Models via Character Profiling from Fictional Works [33.8] 大規模言語モデル(LLM)は印象的なパフォーマンスを示し、多くのAIアプリケーションに拍車をかけた。
これらのRPAの前提条件は、LLMが架空の作品からキャラクターを理解する能力にある。
これまでの努力は、基本的な分類タスクや特徴的模倣を通じて、この機能を評価してきた。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:54:53 GMT)
Decoy Effect In Search Interaction: Understanding User Behavior and Measuring System Vulnerability [33.8] 本研究は,検索エンジンの検索結果ページ上でのユーザインタラクションの変化について検討した。
DEJA-VUメトリクスを導入し、デコイ効果に対するシステムの感受性を評価する。
その結果,システムの有効性と脆弱性に違いが認められた。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:31:29 GMT)
RLRF4Rec: Reinforcement Learning from Recsys Feedback for Enhanced Recommendation Reranking [33.5] 大規模言語モデル(LLM)は、様々な領域で顕著なパフォーマンスを示している。
本稿では,Reinforcement Learning from Recsys Feedback for Enhanced Recommendation Re rankを組み込んだ新しいフレームワークであるRLRF4Recを紹介する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:42:37 GMT)
ConceptAgent: LLM-Driven Precondition Grounding and Tree Search for Robust Task Planning and Execution [33.3] ConceptAgentは、非構造化環境でのタスク実行用に設計された自然言語駆動のロボットプラットフォームである。
本研究では,1)不可能な行動の防止と回復を目的とした述語接地,2)自己反射を用いたLLM誘導モンテカルロ木探索の具体化など,欠点を抑えるために設計されたイノベーションを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:05:40 GMT)
SIA-OVD: Shape-Invariant Adapter for Bridging the Image-Region Gap in Open-Vocabulary Detection [32.8] Open-vocabulary Detection (OVD) は、オープンワールドオブジェクト検出を低コストで達成するために、インスタンスレベルのアノテーションなしで新しいオブジェクトを検出することを目的としている。
既存のOVDメソッドはCLIPの強力なオープン語彙画像テキストアライメント機能に依存している。
我々は,SIA-OVD と呼ばれる新しい形状不変アダプタを提案し,OVD タスクにおける画像領域のギャップを埋める。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:59:08 GMT)
How language models extrapolate outside the training data: A case study in Textualized Gridworld [32.5] 我々は,次世代の予測や思考の微調整といった従来の手法が,大規模で目に見えない環境での一般化に失敗していることを示す。
人間の認知と二重プロセス理論にインスパイアされた言語モデルでは,対話前に認知地図を構築するべきである。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 05:06:55 GMT)
SpaLLM: Unified Compressive Adaptation of Large Language Models with Sketching [32.5] Two-towerアーキテクチャは、事前学習したLLMパラメータをコンパクトな表現に圧縮し、付加的な完全精度アダプタを微調整するために用いられる。
Sketched Adapting of LLMs (Sketched Adapting of LLMs) を提案する。
SpaLLMは事前訓練したLLM重量をルックアップテーブルにスケッチし、これらのテーブルの値を直接微調整する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:58:24 GMT)
TapType: Ten-finger text entry on everyday surfaces via Bayesian inference [32.3] TapTypeは、受動的表面のフルサイズのタイピングのためのモバイルテキスト入力システムである。
バンド内の慣性センサーから、TapTypeは、表面タップと従来のQWERTYキーボードレイアウトをデコードして関連付ける。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:58:31 GMT)
Memory-augmented Transformers can implement Linear First-Order Optimization Methods [32.3] メモリ拡張型トランスフォーマー(Memformer)は線形一階最適化手法を実装可能であることを示す。
我々は、Memformersがより高度な最適化アルゴリズムを学習できるという理論的および実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:07:52 GMT)
Federated Neural Nonparametric Point Processes [32.0] 時間的ポイントプロセス(TPP)は、時間とともに事象をモデル化するのに有効であるが、連合系におけるスパースや不確実な事象に苦しむ。
We propose textitFedPP, a Federated neural nonparametric Point Process model。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:40:04 GMT)
CUBE360: Learning Cubic Field Representation for Monocular 360 Depth Estimation for Virtual Reality [32.0] CUBE360は、1つのパノラマ画像から複数のMPIからなる立方体場を学習し、任意の視野方向の深さ推定を行う。
合成と実世界の両方のデータセットの実験は、従来のSSL方式と比較してCUBE360の優れた性能を示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:52:46 GMT)
On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding [32.0] ループ変換器はパラメータ効率とチューリング完全性に利点がある。
シーケンス・ツー・シーケンス関数の連続率のモジュラリティの概念を定義することでループ変換器の近似率を確立する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:41:40 GMT)
On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding [32.0] ループ変換器はパラメータ効率とチューリング完全性に利点がある。
シーケンス・ツー・シーケンス関数の連続率のモジュラリティの概念を定義することでループ変換器の近似率を確立する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:41:40 GMT)
Tackling the Abstraction and Reasoning Corpus with Vision Transformers: the Importance of 2D Representation, Positions, and Objects [31.9] 視覚変換器(ViT)は、タスク毎に100万のサンプルをトレーニングしても、ほとんどのARCタスクで劇的に失敗することを示す。
ARCに必要な視覚的推論能力のいくつかを解放する,ViTARC スタイルのアーキテクチャを提案する。
タスク固有のViTARCモデルは、400のパブリックARCタスクの半数以上において、100%に近い確率で解決できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:25:34 GMT)
Everything Everywhere All at Once: LLMs can In-Context Learn Multiple Tasks in Superposition [31.7] LLM(Large Language Models)は、コンテキスト内学習機能を示す。
LLMは複数の計算的に異なるICLタスクを同時に実行できます。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:28:57 GMT)
Listen to the Patient: Enhancing Medical Dialogue Generation with Patient Hallucination Detection and Mitigation [31.5] 本研究は,医療相談中の患者の表情と,患者の幻覚として定義される実際の健康状態の相違について検討した。
我々は,幻覚の発見と対処を目的とした患者幻覚の問題を緩和するための医療対話生成手法であるMedPHを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:49:41 GMT)
Array2BR: An End-to-End Noise-immune Binaural Audio Synthesis from Microphone-array Signals [31.3] 本稿では、マイクロホンアレイ信号から、Array2BRと略される新しいエンドツーエンドノイズ免疫合成フレームワークを提案する。
従来の手法と比較して,提案手法は客観的評価と主観的評価の両点において優れた性能を示した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:55:35 GMT)
Towards AI-Native Software Engineering (SE 3.0): A Vision and a Challenge Roadmap [31.0] Software Engineering 3.0 (SE 3.0)は、意図優先の会話指向開発を特徴とするAIネイティブなアプローチである。
私たちは、適応的でパーソナライズされたAIパートナーシップのためのTeammate.nextを含む、SE 3.0テクノロジスタックの重要なコンポーネントについて概説する。
本稿では,次世代のソフトウェア工学におけるAIの役割について,今後の議論の基盤を定めている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:04:07 GMT)
Self-Introspective Decoding: Alleviating Hallucinations for Large Vision-Language Models [30.3] LVLM(Large Vision-Language Models)は近年急速に進歩している。
幻覚問題として知られる問題は、重大なボトルネックとして浮上している。
自己検査復号法(Self-Introspective Decoding, SID)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:26:40 GMT)
Griffon: Spelling out All Object Locations at Any Granularity with Large Language Models [30.2] Griffonは、大規模な視覚言語モデルのための言語プロンプトローカライゼーションデータセットである。
十分に設計されたパイプラインを通じて、エンドツーエンドでトレーニングされる。
精細なRefCOCOシリーズとFlickr30K Entitiesで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:05:09 GMT)
The extended Ville's inequality for nonintegrable nonnegative supermartingales [30.1] 我々は、可積分性も有限性も必要としない非負超行列の延長理論を厳格に提示する。
我々は、ロビンスによって予測される重要な極大不等式を導出し、拡張ヴィユの不等式(英語版)と呼ぶ。
拡張された非負の超行列の$sigma$-finite混合に適用される混合法の拡張を導出する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:12:13 GMT)
What is the long-run distribution of stochastic gradient descent? A large deviations analysis [29.6] 長期的には、問題の臨界領域は、どの非臨界領域よりも指数関数的に訪問されることが示される。
臨界点の他の連結成分は全て、そのエネルギーレベルに指数的に比例する周波数で訪問される。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 23:41:51 GMT)
Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [29.4] この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。
大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。
研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 01:21:51 GMT)
Solving robust MDPs as a sequence of static RL problems [28.8] 我々はIWOCSと呼ばれるメタアルゴリズムを導入し、最悪の遷移モデルを段階的に同定する。
我々は、IWOCSの深いRLバージョンを導き、古典的なベンチマークで最先端のアルゴリズムと競合することを示した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:16:24 GMT)
RuleR: Improving LLM Controllability by Rule-based Data Recycling [28.7] ルールベースのデータリサイクリング(RuleR)は、オリジナルのSFTデータに複数の制約を組み込んだ人間/LLMフリーデータ拡張手法である。
RuleRは、言語またはフォーマットルールを元の命令に統合し、ルール定義の制約を満たすために応答を変更する。
一般的な命令追従性能を維持しつつ,LLM制御性の向上におけるルールRの有効性を実証した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 19:00:02 GMT)
STBLLM: Breaking the 1-Bit Barrier with Structured Binary LLMs [28.7] LLM圧縮のための最初の構造双対化法を1ビット未満の精度で提案する。
バイナライズされたLLMの重みは、性能劣化を伴わずにランダムに反転することができる。
本手法は他の圧縮バイナライズ手法よりも優れた性能を示しながら,メモリ要求を大幅に低減する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:18:19 GMT)
Detecting Android Malware by Visualizing App Behaviors from Multiple Complementary Views [28.7] 我々は,複数の相補的なビューからアプリの動作を可視化することで,Androidマルウェアを検出する新しい手法であるLensDroidを提案し,実装する。
私たちのゴールは、ディープラーニングとソフトウェアビジュアライゼーションを組み合わせたパワーを活用して、本質的にリンクされていない高レベルの機能を自動的にキャプチャし、集約することにあります。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:00:27 GMT)
SymDiff: Equivariant Diffusion via Stochastic Symmetrisation [28.6] 本稿では,最近導入された対称性の枠組みを用いて同変拡散モデルを構築する手法を提案する。
SymDiffは、サンプリング時にデプロイされる学習データ拡張に似ており、軽量で、計算効率が高く、任意のオフザシェルフモデル上に実装が容易である。
生成モデルへの対称性の応用としてはこれが初めてであり、この領域におけるそのポテンシャルがより一般的に示唆されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:02:29 GMT)
Quantifying the Gaps Between Translation and Native Perception in Training for Multimodal, Multilingual Retrieval [28.6] 我々は、ドイツ原住民の認識から生まれたキャプションのトレーニングと、機械翻訳または人間翻訳されたキャプションと、英語からドイツ語に翻訳されたキャプションの間に、パフォーマンスのギャップを経験的に示す。
平均的なリコール改善(+1.3)を達成する一方で、ギャップは依然として残っており、コミュニティの将来的な作業のオープンな領域を示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:22:53 GMT)
Quantifying the Gaps Between Translation and Native Perception in Training for Multimodal, Multilingual Retrieval [28.6] 我々は、ドイツ原住民の認識から生まれたキャプションのトレーニングと、機械翻訳または人間翻訳されたキャプションと、英語からドイツ語に翻訳されたキャプションの間に、パフォーマンスのギャップを経験的に示す。
平均的なリコール改善(+1.3)を達成する一方で、ギャップは依然として残っており、コミュニティの将来的な作業のオープンな領域を示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:22:53 GMT)
Improved Sample Complexity for Private Nonsmooth Nonconvex Optimization [28.5] 本研究では,滑らかでも凸でもない実験対象に対して,DP最適化アルゴリズムについて検討する。
1/alphabeta3+d/epsilonalphabeta2+d3/4/epsilonalpha1/2beta3/2right)$を返却するシングルパス$(alpha,beta)$-DPアルゴリズムを提供する。
次に、サンプルの複雑さを$widetildeOmegaleft()に改善するマルチパス時間アルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:15:49 GMT)
CTRLorALTer: Conditional LoRAdapter for Efficient 0-Shot Control & Altering of T2I Models [28.5] 同じ定式化の下でスタイルと構造条件を統一するアプローチであるLoRAdapterを提案する。
LoRAdapterは、条件テキストから画像への拡散モデルに対する効率的で強力でアーキテクチャに依存しないアプローチである。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:14:29 GMT)
Fast-and-Frugal Text-Graph Transformers are Effective Link Predictors [28.4] リンク予測モデルは、エンティティとリレーションのテキスト記述を取り入れることで、動的グラフに完全に帰納的学習と柔軟性を実現することができる。
本稿では,テキスト記述とグラフ構造を効果的に統合し,リソース集約型テキストエンコーダへの依存を減らすトランスフォーマーベースのアプローチを提案する。
本稿では,FnF-TG(Fast-and-Frugal Text-Graph)トランスフォーマーの高速化とスケーラビリティを両立させながら,従来の最先端手法よりも優れた性能を実現していることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:10:30 GMT)
A Zero-Shot approach to the Conversational Tree Search Task [28.4] Conversational Tree Search (CTS)は、機密ドメインで制御可能なタスク指向ダイアログのためのグラフベースのフレームワークを提供する。
本研究の目的は、CTSエージェントを全面的に訓練する必要性をなくすことである。
ゼロショット制御可能なCTSエージェントはシミュレーションにおいて最先端のCTSエージェントよりも優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:51:44 GMT)
Core Tokensets for Data-efficient Sequential Training of Transformers [28.2] ディープネットワークはしばしば新しいタスクに調整され、進行中のデータストリームから学び続ける。
伝統的に、これらのコアセットは画像や文などの全サンプルで構成されている。
最近のトランスフォーマーアーキテクチャはトークンで動作しており、画像が16x16ワードの価値があるという有名な主張につながっている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:34:35 GMT)
Uncertainty estimation via ensembles of deep learning models and dropout layers for seismic traces [27.6] 本研究では, 第一運動極性に基づく地震波形の分類を行うために, 畳み込みニューラルネットワーク(CNN)を開発した。
我々は不確実性を推定するためにネットワークのアンサンブルを構築した。
ネットワークのアンサンブルの不確実性推定能力は,ドロップアウト層を用いて向上することができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:22:15 GMT)
MedUniSeg: 2D and 3D Medical Image Segmentation via a Prompt-driven Universal Model [27.6] MedUniSegは、2次元および3次元マルチタスクセグメンテーションのためのプロンプト駆動のユニバーサルセグメンテーションモデルである。
MedUniSegは複数のモーダル固有のプロンプトとユニバーサルタスクプロンプトを使用して、モーダルとタスクを正確に特徴づける。
我々は17のサブデータセットからなる総合的マルチモーダル上流データセット上でMedUniSegを評価する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:04:01 GMT)
The Solution for Temporal Action Localisation Task of Perception Test Challenge 2024 [27.3] TALは、ビデオシーケンスを通して特定の時間間隔内でのアクションの識別と分類に焦点を当てている。
我々は、SomethingV2データセットから重なり合うラベルを用いてトレーニングデータセットを拡張することにより、データ拡張手法を採用する。
特徴抽出には、ビデオ機能にUTT、ビデオMAEv2、オーディオ機能にBEAT、CAV-MAEといった最先端モデルを用いる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:07:21 GMT)
AIGB: Generative Auto-bidding via Conditional Diffusion Modeling [26.3] 本稿では,AIGB(AI-Generated Bidding)について紹介する。
このパラダイムでは、入札生成のための条件付き拡散モデルであるDiffBidを提案する。
Alibabaの広告プラットフォーム上で、実世界のデータセットとオンラインA/Bテストで実施された実験は、DiffBidの有効性を実証している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:02:01 GMT)
Uncertainty-aware Surrogate Models for Airfoil Flow Simulations with Denoising Diffusion Probabilistic Models [26.2] 本研究では,拡散確率モデル(DDPM)を用いて乱流シミュレーションのための不確実性を考慮した代理モデルの訓練を行う。
その結果、DDPMは解全体の分布を正確に把握し、その結果、シミュレーションの不確かさを正確に推定できることがわかった。
また,正規拡散モデルと比較して,新たな生成モデルであるフローマッチングの評価を行った。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:40:26 GMT)
Uncertainty-aware Surrogate Models for Airfoil Flow Simulations with Denoising Diffusion Probabilistic Models [26.2] 本研究では,拡散確率モデル(DDPM)を用いて乱流シミュレーションのための不確実性を考慮した代理モデルの訓練を行う。
その結果、DDPMは解全体の分布を正確に把握し、その結果、シミュレーションの不確かさを正確に推定できることがわかった。
また,正規拡散モデルと比較して,新たな生成モデルであるフローマッチングの評価を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:40:26 GMT)
In-Context Code-Text Learning for Bimodal Software Engineering [26.0] バイモーダルなソフトウェア分析は、大きな言語モデルの出現とともに、当初は手の届くところにあるように見えた。
コードテキストのバイモーダル性に対するコンテキスト内学習は有望な道であると仮定する。
我々は、23のソフトウェアエンジニアリングタスクを含む多様なデータセットを考察し、コンテキスト内学習フォーマットで変換する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 19:42:00 GMT)
Jet Expansions of Residual Computation [25.8] 本稿では,ジェットを用いた残差計算グラフの拡張フレームワークを提案する。
提案手法は,様々な計算経路のコントリビューションを解き散らし,予測をモデル化するための体系的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:25:08 GMT)
MetaTool: Facilitating Large Language Models to Master Tools with Meta-task Augmentation [25.4] 再利用可能なツールセットにまたがって一般化するために設計された,新しいツール学習手法であるMetaToolを紹介する。
メタタスクデータをタスク指向トレーニングに組み込むことで,オープンソースの大規模言語モデルの性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:39:07 GMT)
TouchInsight: Uncertainty-aware Rapid Touch and Text Input for Mixed Reality from Egocentric Vision [25.3] 任意の物理的表面上の10本の指すべてからタッチ入力を検出するリアルタイムパイプラインを提案する。
筆者らのTouchInsightは,タッチイベントの瞬間,指の接触,タッチ位置を予測するニューラルネットワークを備える。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:42:44 GMT)
Intelligence at the Edge of Chaos [24.9] ルールベースのシステムの複雑さが、これらのルールを予測するために訓練されたモデルの能力にどのように影響するかを検討する。
以上の結果から,複雑性の高いルールは,より優れたインテリジェンスを示すモデルにつながることが判明した。
我々は、知性は複雑さを予測する能力から生じ、知性を生み出すには複雑さにのみ暴露する必要があると推測する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:20:50 GMT)
Intelligence at the Edge of Chaos [24.9] ルールベースのシステムの複雑さが、これらのルールを予測するために訓練されたモデルの能力にどのように影響するかを検討する。
以上の結果から,複雑性の高いルールは,より優れたインテリジェンスを示すモデルにつながることが判明した。
我々は、知性は複雑さを予測する能力から生じ、知性を生み出すには複雑さにのみ暴露する必要があると推測する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:20:50 GMT)
The Mystery of Compositional Generalization in Graph-based Generative Commonsense Reasoning [24.7] グラフベースのCommonsense Reasoning(CGGC)のための合成一般化チャレンジを紹介する。
与えられた概念とそれに対応する推論グラフに基づいて自然な文を生成するモデルが必要である。
我々は、文脈内学習を用いて7つのよく知られたLLMを評価し、パフォーマンスの高いLLMが構成一般化に苦戦していることを発見した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:14:52 GMT)
Score Design for Multi-Criteria Incentivization [24.1] パフォーマンス指標を要約するスコアを設計するためのフレームワークを提案する。
目的を満足しながら、スコアの寸法を最小化するために設計を定式化します。
この枠組みは病院評価システムにおける現実の実践からモチベーションを引き出すもので、誤ったスコアとパフォーマンス指標が意図しない結果をもたらす。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:47:08 GMT)
How does Inverse RL Scale to Large State Spaces? A Provably Efficient Approach [23.6] Inverse Reinforcement Learning (IRL)は、報酬関数の推定を改善するためにサンプルを使用する。
文献で利用可能なアルゴリズムはいずれも大きな状態空間の問題にスケールできないことを示す。
本稿では, 実現可能な集合の概念を一般化する, 報酬相反の新たな枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:16:10 GMT)
Observation of Higgs and Goldstone modes in U(1) symmetry-broken Rydberg atomic systems [23.4] U(1)対称性破壊リドバーグ原子ガス中のヒッグスモードとゴールドストーンモードの実験的なシグネチャを報告する。
2つのプローブ場を構築して原子を励起することにより、Rydberg原子集合励起の異なる位相と振幅変動を観察する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:45:59 GMT)
How Far Can Transformers Reason? The Globality Barrier and Inductive Scratchpad [23.4] 近年の研究では、トランスフォーマーは表現性の観点からチューリング完全であることが示されているが、これは学習可能性の目的に対処するものではない。
本稿では,正規変換器が学習の弱さを効果的に達成できる場合,目標分布の「グローバル度」の概念を推し進める。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:54:01 GMT)
Stabilized Neural Prediction of Potential Outcomes in Continuous Time [23.1] 安定化連続時間逆確率ネットワーク(SCIP-Net)と呼ばれる新しい手法を提案する。
連続時間における時間変化の共起の適切な調整を行う最初の神経学的手法である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:55:27 GMT)
Stabilized Neural Prediction of Potential Outcomes in Continuous Time [23.1] 安定化連続時間逆確率ネットワーク(SCIP-Net)と呼ばれる新しい手法を提案する。
連続時間における時間変化の共起の適切な調整を行う最初の神経学的手法である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:55:27 GMT)
Stochastic Kernel Regularisation Improves Generalisation in Deep Kernel Machines [23.1] 最近の研究は、CIFAR-10で92.7%の精度で、畳み込み型ディープカーネルマシンを開発した。
我々は,畳み込み型ディープカーネルマシンの一般化を改善するために,いくつかの改良を加えている。
その結果、CIFAR-10で94.5%のテスト精度が得られた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:15:53 GMT)
ATM: Adversarial Tuning Multi-agent System Makes a Robust Retrieval-Augmented Generator [22.8] 大規模言語モデル (LLM) は、検索強化世代 (RAG) の恩恵を受けることが証明されている。
ATM(Adversarial Tuning Multi-agent System)を用いた検索拡張ジェネレータの最適化を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:37:03 GMT)
Sparse Rewards Can Self-Train Dialogue Agents [22.8] 我々は,LLMエージェントに対して,外部からのフィードバックを伴わずに,自律的にパフォーマンスを向上させるための新たな自己改善パラダイムを導入する。
我々はMultiWOZから派生したスパース報酬ツール呼び出しシミュレーション環境であるToolWOZを提案する。
JOSHでトレーニングされたモデルは、小規模でもフロンティアでも、ツールベースのインタラクションを大幅に改善し、さまざまなベンチマークで一般的なモデル機能を保持します。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:40:59 GMT)
IV-Mixed Sampler: Leveraging Image Diffusion Models for Enhanced Video Synthesis [22.8] IV-Mixed Samplerは、ビデオ拡散モデルのための新しいトレーニングフリーアルゴリズムである。
IDMを使用して、各ビデオフレームとVDMの品質を高め、サンプリングプロセス中のビデオの時間的コヒーレンスを確保する。
UCF-101-FVD, MSR-VTT-FVD, Chronomagic-Bench-150, Chronomagic-Bench-1649 の4つのベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:24:10 GMT)
BEVLoc: Cross-View Localization and Matching via Birds-Eye-View Synthesis [22.7] オフロード環境において,鳥眼ビュー (BEV) のシーン表現を合成し,航空地図とのマッチングとローカライズを行うための新しい枠組みを提案する。
我々は,合成されたBEVと航空地図の類似表現を学習するために,ドメイン固有の負のマイニングによる対照的な学習を活用してネットワークを訓練する。
本研究は,極難林環境における有望な初期成果を示すものである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:45:53 GMT)
You Know What I'm Saying: Jailbreak Attack via Implicit Reference [22.5] 本研究は、以前見過ごされた脆弱性を特定し、Implicit Reference (AIR) による攻撃(Attack)と呼ぶ。
AIRは悪意のある目的を許容可能な目的に分解し、コンテキスト内の暗黙の参照を通してそれらをリンクする。
我々の実験は、AIRが最先端のLLMに対して有効であることを示し、ほとんどのモデルで90%を超える攻撃成功率(ASR)を達成した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:34:38 GMT)
You Know What I'm Saying -- Jailbreak Attack via Implicit Reference [22.5] 本研究は、以前見過ごされた脆弱性を特定し、Implicit Reference (AIR) による攻撃(Attack)と呼ぶ。
AIRは悪意のある目的を許容可能な目的に分解し、コンテキスト内の暗黙の参照を通してそれらをリンクする。
我々の実験は、AIRが最先端のLLMに対して有効であることを示し、ほとんどのモデルで90%を超える攻撃成功率(ASR)を達成した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:34:38 GMT)
Entering Real Social World! Benchmarking the Theory of Mind and Socialization Capabilities of LLMs from a First-person Perspective [22.3] 人工知能(AI)の時代、特に大規模言語モデル(LLM)の開発において、興味深い疑問が浮かび上がっている。
LLMはToMとソーシャル化の機能の観点からどのように機能するか?
EgoSocialArenaは,LLMのToMと社会化能力を評価するための新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:55:51 GMT)
HC3 Plus: A Semantic-Invariant Human ChatGPT Comparison Corpus [22.3] ChatGPTはその素晴らしいパフォーマンスのために大きな関心を集めている。
その潜在的なリスクについて懸念が高まっている。
ChatGPT生成テキストを検出するために使用される現在のデータセットは、主に質問応答タスクに焦点を当てている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:58:25 GMT)
Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection [22.3] 教師なしの3Dオブジェクト検出は、LiDARポイントのようなラベル付けされていない生データから興味のあるオブジェクトを識別することを目的としている。
最近のアプローチでは、モデルトレーニングを初期化するためにクラスタリングアルゴリズムから擬似3Dバウンディングボックス(3D bbox)を採用するのが一般的である。
UA3Dと呼ばれる教師なし3Dオブジェクト検出のための新しい不確実性認識フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:13:38 GMT)
FAMMA: A Benchmark for Financial Domain Multilingual Multimodal Question Answering [22.2] FAMMAは、金融マルチ言語によるマルチモーダル質問応答のためのオープンソースのベンチマークである。
大学教科書と試験から精巧に収集された質問応答ペアは1,758個ある。
ベンチマークの結果から,FAMMAがこれらのモデルにとって重要な課題であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:06:05 GMT)
FAMMA: A Benchmark for Financial Domain Multilingual Multimodal Question Answering [22.2] FAMMAは、金融マルチ言語によるマルチモーダル質問応答のためのオープンソースのベンチマークである。
大学教科書と試験から精巧に収集された質問応答ペアは1,758個ある。
ベンチマークの結果から,FAMMAがこれらのモデルにとって重要な課題であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:06:05 GMT)
TOWER: Tree Organized Weighting for Evaluating Complex Instructions [22.1] 大規模な言語モデル(LLM)を評価して、複雑なヒューマン記述命令に従うことは、現実世界のアプリケーションへの展開に不可欠である。
そこで本稿では,人事的重要度を付加した新しい評価基準であるtextscTOWER を提案する。
ヒトのアノテータは他のヒトのアノテータとほぼ同程度に複雑な命令のツリーベース表現に一致していることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:46:50 GMT)
Tuning-Free Bilevel Optimization: New Algorithms and Convergence Analysis [21.9] そこで我々はD-TFBOとS-TFBOという2つの新しいチューニング自由アルゴリズムを提案する。
D-TFBOは「累積勾配ノルムの逆」戦略によって適応的に調整された段数を持つ二重ループ構造を用いる。
S-TFBOはより単純な完全な単一ループ構造で、3つの変数を同時に更新する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:38:43 GMT)
Tuning-Free Bilevel Optimization: New Algorithms and Convergence Analysis [21.9] そこで我々はD-TFBOとS-TFBOという2つの新しいチューニング自由アルゴリズムを提案する。
D-TFBOは「累積勾配ノルムの逆」戦略によって適応的に調整された段数を持つ二重ループ構造を用いる。
S-TFBOはより単純な完全な単一ループ構造で、3つの変数を同時に更新する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:38:43 GMT)
Secure Composition of Robust and Optimising Compilers [21.8] 本論文は,異なるセキュアなコンパイラパスの構成にまたがるセキュリティ特性について,初めて検討したものである。
エンジニアリングの観点から言えば、これはセキュアなコンパイラを構築するための望ましいアプローチです。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:01:18 GMT)
Reliable Part-of-Speech Tagging of Historical Corpora through Set-Valued Prediction [21.7] 設定値予測の枠組みにおけるPOSタグ付けについて検討する。
最先端のPOSタグをセット値の予測に拡張すると、より正確で堅牢なタグ付けが得られます。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:01:08 GMT)
GR-2: A Generative Video-Language-Action Model with Web-Scale Knowledge for Robot Manipulation [21.5] GR-2は、汎用的で汎用的な操作のための最先端の汎用ロボットエージェントである。
GR-2は、世界のダイナミクスを捉えるために、多数のインターネットビデオで事前訓練されている。
GR-2は印象的なマルチタスク学習能力を示し、100以上のタスクで平均97.7%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:00:47 GMT)
RoboEXP: Action-Conditioned Scene Graph via Interactive Exploration for Robotic Manipulation [21.4] 本稿では,ロボットが自律的に環境を探索し,行動条件付きシーングラフ(ACSG)を作成する,インタラクティブなシーン探索という新たな課題を紹介する。
ACSGは、シーン内の低レベル情報(幾何学と意味論)と高レベル情報(異なるエンティティ間のアクション条件付き関係)の両方を記述している。
本稿では,LMM(Large Multimodal Model)と明示的なメモリ設計を取り入れたロボット探索システム(RoboEXP)を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 05:32:25 GMT)
Commentary Generation from Data Records of Multiplayer Strategy Esports Game [21.1] 我々は、人気のあるエスポートゲームであるLeague of Legendsから構造化されたデータと注釈をペアリングする大規模なデータセットを構築します。
次に、Transformerベースのモデルを評価し、構造化データレコードからゲーム注釈を生成する。
データ・ツー・テキスト・ジェネレーションのコミュニティにおける潜在的研究を促進するために、データセットをリリースします。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:05:14 GMT)
NegMerge: Consensual Weight Negation for Strong Machine Unlearning [21.1] 機械学習は、モデルから特定の知識を選択的に除去することを目的としている。
現在の手法は、左折セットの微調整モデルに依存し、タスクベクトルを生成し、元のモデルからそれを減算する。
1つのモデルを選択するのではなく、与えられた細調整されたモデルをすべて活用する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 00:50:54 GMT)
Observing tight triple uncertainty relations in two-qubit systems [21.0] 固定定数2/sqrt3$の3つの物理成分を含む2量子系の不確実性関係を実証する。
以上の結果から,複数の観測値との不確実性関係を理解する新たな知見が得られ,量子情報科学におけるより革新的な応用の動機となる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:24:24 GMT)
Evaluating and Safeguarding the Adversarial Robustness of Retrieval-Based In-Context Learning [21.0] In-Context Learning (ICL) は、プロンプトでデモをエンコードするために使用される選択、順序、動詞に敏感である。
Retrieval-Augmented ICLメソッドは、レトリバーを活用して、意味論的に関連する例を例示として抽出することで、この問題に対処しようとする。
本研究は, 検索強化モデルにより, 検体攻撃に対する堅牢性が向上することを明らかにする。
そこで本研究では,攻撃したサンプルを用いてサンプルプールを充実させる,効果的な訓練自由対人防御手法であるDARDを導入する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 18:08:40 GMT)
Long-Context Linear System Identification [20.8] 本稿は,時間帯の動的システムの状態$x_t$が,長さ$p$の固定コンテキストウィンドウ上の以前の状態$x_s$に線形に依存するという,長期コンテキスト線形システム同定の問題に対処する。
我々は、幅広い種類のシステムに対する対数的因子までのパラメトリックレートに一致するサンプル複雑性を定め、一階依存のみを考慮した以前の研究を拡張した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:15:21 GMT)
Harnessing the Power of Noise: A Survey of Techniques and Applications [20.7] ノイズは、伝統的に計算システムにおける迷惑と見なされ、予期せぬ、直感に反する利点のために再考されている。
ノイズに富んだトレーニング戦略が、ノイズの多いデータからより一般化するモデルにどのように結びつくかを強調します。
この研究は、ノイズの知覚の仕方を変え、それが情報時代におけるイノベーションと進歩の火花になり得ることを示唆している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:37:13 GMT)
Vector Grimoire: Codebook-based Shape Generation under Raster Image Supervision [20.3] 本稿では,GRIMOIREというテキスト誘導型生成モデルを紹介し,画像をベクトル形状に再構成して離散コードブックにマッピングする方法を提案する。
データから直接の監視を必要とする既存のモデルとは異なり、GRIMOIREはベクトル生成モデリングをはるかに多くのデータに開放するイメージ監督のみを使用して学習する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:41:31 GMT)
Score-Based Variational Inference for Inverse Problems [19.8] 後部平均値が好ましいアプリケーションでは、時間を要する後部から複数のサンプルを生成する必要がある。
後部平均を直接対象とするフレームワークであるリバース平均伝搬(RMP)を確立する。
スコア関数を用いて逆KL分散を自然な勾配降下で最適化し,各逆ステップで平均を伝搬するアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:55:16 GMT)
Less is more: Embracing sparsity and interpolation with Esiformer for time series forecasting [19.8] 実世界のアプリケーションから生成された時系列データは、常に高いばらつきと多くのノイズを示す。
本稿では,元のデータに適用し,データ全体のばらつきを低減し,ノイズの影響を軽減するEsiformerを提案する。
MSEを6.5%,MAEを5.8%削減した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:45:47 GMT)
Probing Language Models on Their Knowledge Source [19.8] 大規模言語モデル(LLM)は、しばしば、学習、内部(パラメトリック知識、PK)と推論中に提供される外部知識(コンテキスト知識、CK)の衝突に遭遇する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:47:11 GMT)
Beyond Forecasting: Compositional Time Series Reasoning for End-to-End Task Execution [19.6] 時系列データから複雑な多段階推論タスクを処理する新しいタスクであるコンポジション時系列推論を導入する。
具体的には、時系列データに構造的および構成的推論能力を必要とする様々な質問事例に焦点を当てる。
我々は,大規模言語モデル(LLM)を用いて複雑なタスクをプログラムのステップに分解するプログラム支援手法であるTS-Reasonerを開発した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:28:23 GMT)
Beyond Forecasting: Compositional Time Series Reasoning for End-to-End Task Execution [19.6] 時系列データから複雑な多段階推論タスクを処理する新しいタスクであるコンポジション時系列推論を導入する。
具体的には、時系列データに構造的および構成的推論能力を必要とする様々な質問事例に焦点を当てる。
我々は,大規模言語モデル(LLM)を用いて複雑なタスクをプログラムのステップに分解するプログラム支援手法であるTS-Reasonerを開発した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:28:23 GMT)
SplaTraj: Camera Trajectory Generation with Semantic Gaussian Splatting [19.6] 本稿では,ユーザ入力言語が与える命令にマッチするガウススプラッティングモデルから画像のシーケンスを生成することに焦点を当てる。
本研究では,光現実的環境表現における画像生成を定式化した新しいフレームワークSplaTrajを提案する。
本研究では,環境と命令の集合に対するアプローチを実証的に評価し,生成した画像シーケンスの品質を実証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:16:49 GMT)
Federated Learning with Dynamic Client Arrival and Departure: Convergence and Rapid Adaptation via Initial Model Construction [19.6] 連合学習システムでは、クライアントは特定のタスクに対するニーズや関心に応じて、システムを離れたり、参加したりすることができる。
本稿では、現在アクティブなクライアントのセットに合わせて最適なモデルを求めるFLの動的最適化目標について考察する。
提案手法は様々なデータセットとFLアルゴリズムで検証され、多様なクライアントの到着パターンと出発パターンにまたがる堅牢な性能を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:22:14 GMT)
A Parameter Update Balancing Algorithm for Multi-task Ranking Models in Recommendation Systems [19.3] マルチタスクランキングモデルは、現代の現実世界のレコメンデーションシステムに欠かせないものとなっている。
すべてのタスクを神経的に訓練することは、一貫性のない学習をもたらす。
PUBと呼ばれるマルチタスク最適化のための新しい更新バランシングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:39:15 GMT)
CasiMedicos-Arg: A Medical Question Answering Dataset Annotated with Explanatory Argumentative Structures [19.2] 本報告では, 臨床症例の正しい診断と誤診断を, 医師が記述した自然言語による説明に富む, 医療質問応答のための最初の多言語データセットを提案する。
このデータセットは、5021の主張、2313の前提、2431の支持関係、1106の攻撃関係を注釈した4つの言語(英語、スペイン語、フランス語、イタリア語)の558の臨床ケースで構成されています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:12:04 GMT)
GLRT-Based Metric Learning for Remote Sensing Object Retrieval [19.2] 既存のCBRSOR法は、訓練段階と試験段階の両方において、グローバルな統計情報の利用を無視する。
ナイマン・ピアソンの定理にインスパイアされた我々は、一般化された確率比テストベースメトリックラーニング(GLRTML)アプローチを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:53:30 GMT)
CasiMedicos-Arg: A Medical Question Answering Dataset Annotated with Explanatory Argumentative Structures [19.2] 本報告では, 臨床症例の正しい診断と誤診断を, 医師が記述した自然言語による説明に富む, 医療質問応答のための最初の多言語データセットを提案する。
このデータセットは、5021の主張、2313の前提、2431の支持関係、1106の攻撃関係を注釈した4つの言語(英語、スペイン語、フランス語、イタリア語)の558の臨床ケースで構成されています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:12:04 GMT)
Holistic Evaluation for Interleaved Text-and-Image Generation [19.0] 我々はインターリーブドベンチ(InterleavedBench)について紹介する。
また、GPT-4oをベースとした強力な基準フリーメトリックであるInterleavedEvalを提案し、正確で説明可能な評価を行う。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:02:08 GMT)
Training-free LLM-generated Text Detection by Mining Token Probability Sequences [19.0] 大規模言語モデル(LLM)は、様々な領域にまたがる高品質なテキストを生成する際、顕著な能力を示した。
統計的特徴を慎重に設計することで、固有の相違に焦点をあてたトレーニングフリーな手法は、一般化と解釈性の向上を提供する。
局所的および大域的統計を相乗化して検出を増強する,新しいトレーニング不要検出器である textbfLastde を導入する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:23:45 GMT)
Active Evaluation Acquisition for Efficient LLM Benchmarking [18.9] 学習ポリシを用いて,各ベンチマークからサンプルのサブセットを選択することにより,評価効率を向上させる戦略を検討する。
提案手法は,テスト例間の依存関係をモデル化し,残りの例に対する評価結果の正確な予測を可能にする。
実験の結果,提案手法は必要な評価プロンプトの数を大幅に削減することが示された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:08:46 GMT)
DenseMTL: Cross-task Attention Mechanism for Dense Multi-task Learning [18.7] 本稿では,相互に相互にタスクを交換するマルチタスク学習アーキテクチャを提案する。
我々は3つのマルチタスク・セットアップにまたがって広範な実験を行い、合成および実世界のベンチマークにおいて競合するベースラインと比較して、我々のアプローチの利点を示している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:55:21 GMT)
Enhancing Playback Performance in Video Recommender Systems with an On-Device Gating and Ranking Framework [18.6] サーバ側ビデオレコメンデータシステム(RS)と連携するデバイス上でのGating and Ranking Framework(GRF)を提案する。
具体的には、ゲートモデルを用いて、リアルタイムで再生問題のある動画を識別し、次に、局所キャッシュされたプールから最適な結果を選択するためにランキングモデルを用いる。
私たちのソリューションは、世界中の数億人のユーザがいる大規模なショートビデオプラットフォームであるKwaiに、完全にデプロイされています。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:53:10 GMT)
Understanding the Therapeutic Relationship between Counselors and Clients in Online Text-based Counseling using LLMs [18.6] テキストベースのカウンセリングにおける治療提携の進展を理解するために,大規模言語モデル(LLM)を用いた自動アプローチを提案する。
我々は包括的カウンセリングデータセットを収集し、このフレームワークに基づいてサブセット上で複数の専門家評価を行う。
当社の調査結果は、カウンセラーが顧客との強いオンライン関係を育む上で直面する課題を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:35:43 GMT)
Chain-of-Thoughts for Molecular Understanding [18.5] StructCoTは分子の構造的特徴を明示的に注入する構造認識チェーンである。
我々の実験は、StructCoTを微調整フレームワークに組み込むことで、分子理解タスクの一貫性が向上することを示した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:49:48 GMT)
QGym: Scalable Simulation and Benchmarking of Queuing Network Controllers [18.2] キューネットワーク制御は、混雑を管理するために不足するリソースの割り当てを決定する。
本稿では,実際の問題インスタンスにまたがる待ち行列ポリシーをベンチマークする,オープンソースの待ち行列シミュレーションフレームワークQGymを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:15:30 GMT)
Fortify Your Foundations: Practical Privacy and Security for Foundation Model Deployments In The Cloud [18.0] ファンデーションモデル(FM)は自然言語処理などのタスクにおいて例外的なパフォーマンスを示す。
FMは、しばしば、プライベートデータに依存するRetrieval-Augmented Generation (RAG)システムに微調整または統合される。
本研究では,FM脅威モデルについて検討し,その安全性を確保するための様々なアプローチの実用性と包括性について考察する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:33:09 GMT)
Investigating the Design Space of Diffusion Models for Speech Enhancement [17.9] 拡散モデルは、画像生成文学において優れた性能を示す新しい生成モデルである。
従来の拡散型音声強調システムの性能は、清潔な音声信号と雑音の多い音声信号の間の進行的な変換によるものではないことを示す。
また,プレコンディショニング,トレーニング損失重み付け,SDE,サンプル処理の適切な選択により,一般的な拡散に基づく音声強調システムよりも優れることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:50:02 GMT)
PixLens: A Novel Framework for Disentangled Evaluation in Diffusion-Based Image Editing with Object Detection + SAM [17.9] 拡散に基づく画像編集モデルを評価することは、生成AIの分野において重要な課題である。
我々のベンチマークであるPixLensは、編集品質と遅延表現の絡み合いを総合的に評価する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:05:15 GMT)
Unobserved Object Detection using Generative Models [17.9] 本研究では,2次元・3次元非観測物体検出の新たな課題として,物体の位置を画像フレームの外側で予測する手法を提案する。
我々は,2次元および3次元拡散モデルや視覚言語モデルなど,最先端の事前学習型生成モデルを用いてこの問題を解決する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:57:14 GMT)
HyperDet: Generalizable Detection of Synthesized Images by Generating and Merging A Mixture of Hyper LoRAs [17.9] 我々はHyperDetと呼ばれる新しい、一般化可能な検出フレームワークを紹介した。
本研究では,画素とセマンティックアーティファクトを効果的にバランスさせる目的関数を提案する。
我々の研究は、事前訓練された大きな視覚モデルに基づいて、一般化可能なドメイン固有の偽画像検出器を確立する新しい方法である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:43:01 GMT)
Near Exact Privacy Amplification for Matrix Mechanisms [17.8] より低い非負の$textbfC$に対して、ほぼ正確なプライバシーパラメータを計算するためのフレームワークを提供する。
実証的な結果として,従来のSOTA (State-of-the-art) よりも小さな RMSE をプレフィックス和で実現できることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:05:56 GMT)
Does RoBERTa Perform Better than BERT in Continual Learning: An Attention Sink Perspective [17.7] 継続的な学習は、以前のタスクの知識を忘れずに、シーケンシャルに新しいタスクを学習できるモデルを訓練することを目的としている。
我々は,すべてのトークンに対する注意の多様性を促す事前スケーリング機構を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:56:47 GMT)
Bayesian Estimation and Tuning-Free Rank Detection for Probability Mass Function Tensors [17.6] 本稿では,関節のPMFを推定し,そのランクを観測データから自動的に推定する新しい枠組みを提案する。
我々は、様々なモデルパラメータの後方分布を近似するために、変分推論(VI)に基づく決定論的解を導出し、さらに、変分推論(SVI)を利用して、VVIベースのアプローチのスケーラブルバージョンを開発する。
合成データと実映画レコメンデーションデータの両方を含む実験は、推定精度、自動ランク検出、計算効率の点で、VVIおよびSVIベースの手法の利点を示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:07:49 GMT)
Chameleon: An Efficient FHE Scheme Switching Acceleration on GPUs [17.5] ホモモルフィック暗号化(英語版) (FHE) は暗号化されたデータの直接計算を可能にする。
既存の取り組みは主に、データ型と関数の多様な要求を満たすことができない単一クラスFHEスキームに重点を置いている。
本稿では,Chameleon という高速GPUベース FHE スイッチングアクセラレーション方式を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:37:49 GMT)
Zero-Shot Learning of Causal Models [17.4] 我々は、データセットの因果生成過程をゼロショットで推測できるエンフィングルモデルを学習する。
我々は,本モデルが生成する真のSCMをゼロショットで予測し,その副生成物として,(i)新たなデータセットサンプルを生成し,(ii)介入したサンプルを推定できることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:31:33 GMT)
Reliable Heading Tracking for Pedestrian Road Crossing Prediction Using Commodity Devices [17.2] 我々は,移動中にスマートフォンを振り回すなどの習慣により,スマートフォンを一定の方法で携帯する傾向にある,という重要な洞察を生かした新たな方向追跡アルゴリズム,Orientation-Heading Alignment (OHA)を提案する。
我々は、歩行者が道路利用者の安全を改善するために道路を横断しようとしている時期を予測するという、困難な課題にOHAを適用した。
評価の結果、OHAは既存の手法に比べて9つのシナリオで3.4倍小さい方向誤差を達成できた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:12:18 GMT)
Towards Robust Spacecraft Trajectory Optimization via Transformers [17.1] 将来の多機のミッションでは、安全かつ効率的なランデブー操作を確保するために、堅牢な自律的な最適化機能が必要である。
この負担を軽減するため、生成トランスフォーマーモデルを導入し、ロバストな最適初期推定を提供する。
この研究はARTの機能を拡張し、堅牢な制約付き最適制御問題に対処する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 00:58:42 GMT)
Diminishing Exploration: A Minimalist Approach to Piecewise Stationary Multi-Armed Bandits [17.0] 片側定常バンドイット問題は、報酬分布の急激な変化を考察する。
既存のアルゴリズムは、変化点の数に関する知識を$M$とするか、非常に高い計算複雑性を必要とする。
そこで本研究では,MM$に関する知識の必要をなくす,減少探索と呼ばれる新奇で汎用的な探索機構を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:51:32 GMT)
Filtered Randomized Smoothing: A New Defense for Robust Modulation Classification [17.0] 我々は、任意の攻撃に対して証明可能な防御を提供するロバストな変調分類器を設計する問題について検討する。
スペクトルフィルタリングとランダムな平滑化を組み合わせた新しい防御法であるフィルタランダム化平滑化(FRS)を提案する。
FRSは攻撃信号と良性信号の両方の精度において,ATやRSを含む既存の防御よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:17:25 GMT)
The robustness of skyrmion numbers of structured optical fields in atmospheric turbulence [16.9] 我々は,光スカイミオン場の空調数が大気乱流に対して一定の強靭性を示すことを数値的に示す。
これらの性質は、スカイミオン場とその数の多元性を高めるだけでなく、ノイズのあるチャネルをまたいだ様々な用途で利用するための新たな可能性も開ける。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:55:34 GMT)
Molecular Dynamics and Machine Learning Unlock Possibilities in Beauty Design -- A Perspective [16.9] 計算分子設計は、機械学習と分子動力学のアプローチによって支援された様々なミッションで分子を設計する試みである。
これらの技術は、寿命を延ばすだけでなく、その美しさを発揮できるほど成熟していると我々は主張する。
この観点から、スキンケア製品の研究・開発における現在のフロンティアと、この業界の課題に対処する統計的・物理的ツールボックスを概観する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:30:27 GMT)
Data-Driven Parametrization of Molecular Mechanics Force Fields for Expansive Chemical Space Coverage [16.7] 我々は、薬物様分子のアンバー互換力場であるByteFFを開発した。
本モデルでは, 薬物様分子のすべての結合および非結合MM力場パラメータを, 広い化学空間にわたって同時に予測する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:18:27 GMT)
Efficient Policy Evaluation with Safety Constraint for Reinforcement Learning [16.7] 安全制約下での最適分散最小化行動ポリシーを提案する。
本手法は, 実質的分散低減と安全制約満足度を両立させる唯一の方法である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:10:55 GMT)
Exponential entanglement advantage in sensing correlated noise [16.7] 相関雑音の知覚における指数的量子優位性の新しい形式を提案する。
絡み合いは、小さなパラメータを推定する感度を指数関数的に向上させる可能性があることを示す。
我々の研究は、絡み合いに基づく感覚の優位性を達成するための新しい道を開く。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:15:21 GMT)
AgentSquare: Automatic LLM Agent Search in Modular Design Space [16.7] 大規模言語モデル(LLM)は、幅広い複雑なタスクを処理できるエージェントシステムの急速な成長をもたらした。
Modularized LLM Agent Search (MoLAS) という新しい研究課題を紹介した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:52:42 GMT)
Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMs [16.6] SignRoundは、符号付き勾配降下(SignSGD)を利用して、200ステップで丸め値とウェイトクリッピングを最適化する手法である。
2ビットから4ビットにわたって例外的な結果を提供すると同時に、チューニングコストを最小化し、追加の推論オーバーヘッドを回避する。
また、近年のモデルでは強力な一般化が示され、ほとんどのシナリオでほぼロスレスな4ビット量子化が達成されている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:02:35 GMT)
Semantically Consistent Video Inpainting with Conditional Diffusion Models [16.4] 本稿では,条件付きビデオ拡散モデルを用いた問題解決フレームワークを提案する。
我々は,コンテキストにおける重要な長距離依存関係をキャプチャする塗装特化サンプリングスキームを導入する。
不完全フレーム中の既知の画素を条件付けするための新しい手法を考案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 23:30:47 GMT)
Towards a General Time Series Anomaly Detector with Adaptive Bottlenecks and Dual Adversarial Decoders [16.3] 時系列異常検出は幅広い応用において重要な役割を果たす。
既存のメソッドでは、データセットごとに1つの特定のモデルをトレーニングする必要があります。
本稿では,広範囲なマルチドメインデータセット上で事前学習した時系列異常検出モデルを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:28:25 GMT)
Counting in Small Transformers: The Delicate Interplay between Attention and Feed-Forward Layers [16.3] アーキテクチャ設計の選択がトランスフォーマーが実装し学習できるソリューションの空間にどのように影響するかを検討する。
小型変圧器が理論的に実装できる2つの異なる計数戦略を特徴付ける。
簡単な設定であっても、モデル設計のわずかなバリエーションは、トランスフォーマーが学習するソリューションに大きな変化をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:49:47 GMT)
A Survey: Collaborative Hardware and Software Design in the Era of Large Language Models [16.3] 大規模言語モデル(LLM)の急速な発展は、人工知能の分野を大きく変えた。
これらのモデルは多様なアプリケーションに統合され、研究と産業の両方に影響を及ぼす。
本稿では,大規模言語モデルの特徴と制約に対処するために,ハードウェアとソフトウェアの共同設計手法について検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:46:52 GMT)
Strong Model Collapse [16.1] 本稿では,モデル崩壊現象の強い形態が存在することを示す。
以上の結果から,最小の合成データであっても,モデル崩壊につながる可能性が示唆された。
大規模言語モデルの学習における現在の傾向に沿ったアプローチであるモデルサイズの増加が,モデル崩壊を悪化させるか緩和させるかを検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:14:43 GMT)
FürElise: Capturing and Physically Synthesizing Hand Motions of Piano Performance [15.9] ピアノ演奏を正確に再現する洗練された手の動きモデルは、キャラクターアニメーション、エンボディAI、バイオメカニクス、VR/ARに幅広い応用がある。
本稿では,153曲のクラシック音楽を演奏する15人のエリートレベルのピアニストによる,約10時間の3D手の動きとオーディオを含む,第1世代の大規模データセットを構築する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:21:05 GMT)
Vision Transformer based Random Walk for Group Re-Identification [15.6] グループ再識別(re-ID)は、異なるカメラの下で同じ人とグループを一致させることを目的としている。
グループ再IDのための新しい視覚変換器に基づくランダムウォークフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:41:14 GMT)
Round and Round We Go! What makes Rotary Positional Encodings useful? [15.5] メカニカルレベルでの RoPE の使用方法を理解するため, トレーニングされた Gemma 7B モデルの内部構造について検討した。
Gemma は,RoPE を用いて高周波数を利用してロバストな「位置的」アテンションパターンを構築することを学ぶ。
強調された問題を修正し、性能を向上するRoPEの修正を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:07:01 GMT)
Synthetic Instance Segmentation from Semantic Image Segmentation Masks [15.5] 我々は、Synthetic Instance(SISeg)と呼ばれる新しいパラダイムを提案する。
SISegインスタンスセグメンテーションの結果は、既存のセマンティックセグメンテーションモデルによって生成されたイメージマスクを活用する。
言い換えれば、提案モデルは余分な人力や高い計算コストを必要としない。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:06:04 GMT)
Training-free Diffusion Model Alignment with Sampling Demons [15.4] 提案手法は,報酬関数やモデル再学習を介さずに,推論時の復調過程を導出するための最適化手法である。
提案手法は,高報酬に対応する領域の密度を最適化することにより,雑音分布の制御を行う。
我々の知る限り、提案手法は拡散モデルに対する最初の推論時間、バックプロパゲーションフリーな選好アライメント法である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:33:49 GMT)
Experimental coherent-state quantum secret sharing with finite pulses [15.3] 量子秘密共有(QSS)は、量子通信において重要な役割を果たす。
位相符号化技術に基づく3ユーザQSSプロトコルを提案する。
本プロトコルは,432bpsから192bpsまでのセキュアな鍵レートを実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:01:06 GMT)
RefineStyle: Dynamic Convolution Refinement for StyleGAN [15.2] StyleGANでは、畳み込みカーネルは画像間で共有される静的パラメータの両方によって形成される。
$mathcalW+$スペースは画像の反転や編集によく使われる。
本稿では,動的カーネルの効率的な精錬戦略を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:01:30 GMT)
What Matters in Memorizing and Recalling Facts? Multifaceted Benchmarks for Knowledge Probing in Language Models [15.1] 言語モデルは事実の知識を扱うのに苦労し、事実の幻覚の問題を呈する。
本稿では,エンコーダとデコーダを用いた事前学習言語モデルの知識リコール能力を評価するための知識探索ベンチマークBELIEF(ICL)を提案する。
非常に多様なプロンプトを持つMyriadLAMAを半自動で作成します。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:26:25 GMT)
Single Point-Based Distributed Zeroth-Order Optimization with a Non-Convex Stochastic Objective Function [15.0] 勾配追跡手法の一点推定に基づくゼロ階分散最適化手法を提案する。
我々は,この手法が雑音条件下で数値関数と収束することを証明した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:45:45 GMT)
Communicating with Speakers and Listeners of Different Pragmatic Levels [14.9] 本稿では,言語学習のシミュレートによるコミュニケーション成功に対する可変語学能力の影響について検討する。
より明示的でリテラルな言語からの学習は、学習者の実践的能力のレベルに関係なく、有利であることがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:42:37 GMT)
Neural-Bayesian Program Learning for Few-shot Dialogue Intent Parsing [14.9] 本稿では,対話・対話型プログラム(DI-)というニューラルベイズ学習モデルを提案する。
DI-はデータハングリー設定下でのインテント解析を専門とし、有望なパフォーマンス改善を提供する。
実験により、DI-は最先端のディープラーニングモデルより優れており、産業用アプリケーションに実用的な利点があることが示された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:54:00 GMT)
Let Occ Flow: Self-Supervised 3D Occupancy Flow Prediction [14.9] Occ Flowは、カメラ入力のみを使用して、関節の3D占有率と占有率の予測を行う最初の自己教師型作業である。
我々のアプローチは、動的オブジェクトの依存関係をキャプチャするために、新しい注意に基づく時間融合モジュールを組み込んでいる。
本手法は3次元容積流れ場に微分可能レンダリングを拡張する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:07:08 GMT)
Extreme Value Modelling of Feature Residuals for Anomaly Detection in Dynamic Graphs [14.8] グラフの時間的シーケンスにおける異常の検出は、トランスポートネットワークにおける事故の検出や、コンピュータネットワークにおけるサイバー攻撃といった分野に適用することができる。
既存の異常グラフ検出方法は、高い偽陽性率や可変サイズのグラフの扱いの難しさ、非自明な時間ダイナミクスなど、複数の制限に悩まされることがある。
そこで本稿では,時間的依存を時系列解析によって時間的依存を明示的にモデル化し,残差を用いて依存を除去する手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:00:53 GMT)
Improving the Training of Rectified Flows [14.7] 拡散モデルは画像生成とビデオ生成に大いに期待できるが、最先端モデルからのサンプリングには高コストの数値積分が必要である。
この問題に対処するための1つのアプローチは整流流であり、これは繰り返し、トランケーションエラーの影響を受けにくい滑らかなODEパスを学習する。
本研究は,NFEの低い環境下においても,改質流れを訓練するための改良手法を提案する。
改良された改質流は, 整合蒸留, 進行蒸留といった最先端蒸留法を1段階, 2段階で上回った。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 21:40:13 GMT)
Training-Free Open-Ended Object Detection and Segmentation via Attention as Prompts [14.6] 既存の知覚モデルは大量のラベル付きデータから学習することで大きな成功を収めるが、それでもオープンワールドのシナリオに苦戦している。
我々は、オブジェクトカテゴリを入力として含まない未確認オブジェクトを検出する、オープンな対象検出(textiti.e.)を提案する。
提案手法は,オブジェクト検出タスクにおける従来のオープンエンドメソッドを超越し,追加のインスタンスセグメンテーションマスクを提供できることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:15:08 GMT)
Large Language Models Overcome the Machine Penalty When Acting Fairly but Not When Acting Selfishly or Altruistically [14.6] 集団と自己利益が不一致の社会ジレンマでは、人々は通常、仲間の人間よりも機械に協力しない。
本研究では,Large Language Models (LLMs) を用いて,この研究課題を解消する可能性を検討する。
以上の結果から,ヒトとの相互作用において,ヒトとヒトの相互作用に匹敵する協力レベルを導出できることが明らかとなった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:16:15 GMT)
Moving Faster and Reducing Risk: Using LLMs in Release Deployment [14.6] 差分リスクスコアのモデルを開発し、差分がエンドユーザに深刻な障害を引き起こす確率を決定する。
ゲイティングなし(緑)、週末ゲーティングなし(黄色)、エンドユーザーへの中程度の影響(黄色)、エンドユーザーへの高い影響(赤)の4種類があります。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:40:38 GMT)
Learning Force Distribution Estimation for the GelSight Mini Optical Tactile Sensor Based on Finite Element Analysis [14.5] センサの原画像から直接力分布を予測するために,U-netアーキテクチャを用いた機械学習手法を提案する。
有限要素解析(FEA)から推定される力分布をトレーニングした本モデルでは,通常の力分布とせん断力分布の予測に有望な精度を示す。
また、同じタイプのセンサーをまたいで一般化し、リアルタイムアプリケーションを可能にする可能性も示している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:01:12 GMT)
Think-on-Graph 2.0: Deep and Faithful Large Language Model Reasoning with Knowledge-guided Retrieval Augmented Generation [14.4] Think-on-Graph 2.0 (ToG-2) は、構造化されていない知識ソースと構造化されていない知識ソースの両方から情報を反復的に取得するハイブリッドRAGフレームワークである。
ToG-2は、グラフ検索とコンテキスト検索の交互に、質問に関連する詳細な手がかりを検索する。
GPT-3.5を用いて、7つの知識集約データセットのうち6つにおいて、ToG-2が最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:19:41 GMT)
Think-on-Graph 2.0: Deep and Faithful Large Language Model Reasoning with Knowledge-guided Retrieval Augmented Generation [14.4] Think-on-Graph 2.0 (ToG-2) は、構造化されていない知識ソースと構造化されていない知識ソースの両方から情報を反復的に取得するハイブリッドRAGフレームワークである。
ToG-2は、グラフ検索とコンテキスト検索の交互に、質問に関連する詳細な手がかりを検索する。
GPT-3.5を用いて、7つの知識集約データセットのうち6つにおいて、ToG-2が最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:19:41 GMT)
TrustEMG-Net: Using Representation-Masking Transformer with U-Net for Surface Electromyography Enhancement [14.4] 本稿では、TrustEMG-Netと呼ばれる新しいニューラルネットワーク(NN)ベースのsEMG復調手法を提案する。
TrustEMG-Net は既存の sEMG Denoising 手法と比較して 20% の最小改善を実現している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:50:15 GMT)
TrustEMG-Net: Using Representation-Masking Transformer with U-Net for Surface Electromyography Enhancement [14.4] 本稿では、TrustEMG-Netと呼ばれる新しいニューラルネットワーク(NN)ベースのsEMG復調手法を提案する。
TrustEMG-Net は既存の sEMG Denoising 手法と比較して 20% の最小改善を実現している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:50:15 GMT)
Amortized Control of Continuous State Space Feynman-Kac Model for Irregular Time Series [14.4] 医療、気候、経済などの現実世界のデータセットは、しばしば不規則な時系列として収集される。
本稿では,連続状態空間モデル (ACSSM) を時系列の連続的動的モデリングに用いるためのアモータイズ制御を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:27:46 GMT)
Benign Overfitting for Regression with Trained Two-Layer ReLU Networks [14.4] 本稿では,2層完全連結ニューラルネットワークを用いた最小二乗回帰問題と,勾配流によるReLU活性化関数について検討する。
最初の結果は一般化結果であり、基礎となる回帰関数や、それらが有界であること以外のノイズを仮定する必要はない。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:54:23 GMT)
Story-Adapter: A Training-free Iterative Framework for Long Story Visualization [14.3] 本稿では,ストーリーアダプタ(Story-Adapter)と呼ばれる学習自由で計算効率の良いフレームワークを提案する。
私たちのフレームワークの中心は、トレーニング不要なグローバル参照のクロスアテンションモジュールで、前回のイテレーションから生成されたすべてのイメージを集約します。
実験は、きめ細かい相互作用のためのセマンティック一貫性と生成能力の両方を改善する上で、ストーリー・アダプタの優位性を検証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:59:30 GMT)
Asynchronous Fractional Multi-Agent Deep Reinforcement Learning for Age-Minimal Mobile Edge Computing [14.3] 計算集約的な更新のタイムラインを調査し、AoIを最小化するためにタスク更新とオフロードポリシーを共同で最適化する。
具体的には、エッジ負荷のダイナミクスを考慮し、期待時間平均AoIを最小化するためにタスクスケジューリング問題を定式化する。
提案アルゴリズムは,実験における最良基準アルゴリズムと比較して平均AoIを最大52.6%削減する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:59:24 GMT)
LACOSTE: Exploiting stereo and temporal contexts for surgical instrument segmentation [14.2] ステレオ画像とテンポラル画像の位置情報を併用した新しいLACOSTEモデルを提案し,手術器具のセグメンテーションを改善した。
我々は3つの公開手術ビデオデータセットに対するアプローチを広範囲に検証した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:13:41 GMT)
LACOSTE: Exploiting stereo and temporal contexts for surgical instrument segmentation [14.2] ステレオ画像とテンポラル画像の位置情報を併用した新しいLACOSTEモデルを提案し,手術器具のセグメンテーションを改善した。
我々は3つの公開手術ビデオデータセットに対するアプローチを広範囲に検証した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:13:41 GMT)
FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning [14.0] 我々は,5,420の推論に基づく質問からなるフォーミュラ推論という,式に基づく数値推論のためのデータセットを構築した。
ゼロショットおよび少数ショットチェーン・オブ・シント法を用いて, 7B から 100B 以上のパラメータで LLM の評価を行う。
また、データセットに関連付けられた外部公式データベースを備えた検索拡張LDMについても検討する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:18:04 GMT)
Zebra: In-Context and Generative Pretraining for Solving Parametric PDEs [13.8] パラメトリックPDEを推論の勾配適応を必要とせずに解くために設計された新しい自己回帰変換器であるZebraを紹介する。
我々は、Zebraを様々な挑戦的なPDEシナリオで評価し、既存のアプローチと比較して適応性、堅牢性、優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:44:24 GMT)
Zebra: In-Context and Generative Pretraining for Solving Parametric PDEs [13.8] パラメトリックPDEを推論の勾配適応を必要とせずに解くために設計された新しい自己回帰変換器であるZebraを紹介する。
我々は、Zebraを様々な挑戦的なPDEシナリオで評価し、既存のアプローチと比較して適応性、堅牢性、優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:44:24 GMT)
Coevolving with the Other You: Fine-Tuning LLM with Sequential Cooperative Multi-Agent Reinforcement Learning [13.8] 強化学習 (Reinforcement Learning, RL) は, 特定のタスクにおいて, 大規模言語モデル (LLM) を微調整するための重要な手法として登場した。
本稿では,LLMのRL微調整を逐次協調型マルチエージェント強化学習フレームワークに拡張したCORYを提案する。
その結果,CORYは政策最適性,分散崩壊抵抗性,ロバスト性の訓練においてPPOよりも優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:55:26 GMT)
StagedVulBERT: Multi-Granular Vulnerability Detection with a Novel Pre-trained Code Model [13.7] 本研究では,新たな脆弱性検出フレームワークStagedVulBERTを紹介する。
CodeBERT-HLSコンポーネントはトークンレベルとステートメントレベルの両方でセマンティクスを同時にキャプチャするために設計されている。
粗粒度の脆弱性検出では、StagedVulBERTは92.26%のF1スコアを獲得し、最高のパフォーマンスメソッドよりも6.58%改善している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:46:35 GMT)
A Hybrid Graph Neural Network for Enhanced EEG-Based Depression Detection [13.6] グラフニューラルネットワーク(GNN)は、脳波によるうつ病検出でますます人気が高まっている。
従来のGNNベースの手法では、抑うつの特性を十分に考慮できないため、性能が制限される。
固定接続を利用した共通グラフニューラルネットワーク(CGNN)と適応接続を用いた個別グラフニューラルネットワーク(IGNN)を併用したハイブリッドGNNを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:57:50 GMT)
SHADE: Deep Density-based Clustering [13.6] SHADEは密度接続性を損失関数に組み込む最初のディープクラスタリングアルゴリズムである。
ディープオートエンコーダの表現力で高次元および大規模データセットをサポートする。
これはクラスタリングの品質、特に非ガウスクラスタを含むデータにおいて、既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:03:35 GMT)
SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks [13.6] そこで本稿では,優先最適化トレーニングにおいて,各トークンに対応するKL分散と報酬の重み付けを自動的に学習する,フレキシブルな目標SparsePOを提案する。
提案手法では,目標タスクに応じて有意な重み付けを割り当て,所望の好みに応じてより多くの応答を生成し,他のトークンレベルおよび応答レベルPO手法と比較して最大2ポイントの推論タスクを改善する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:53:22 GMT)
SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks [13.6] そこで本稿では,優先最適化トレーニングにおいて,各トークンに対応するKL分散と報酬の重み付けを自動的に学習する,フレキシブルな目標SparsePOを提案する。
提案手法では,目標タスクに応じて有意な重み付けを割り当て,所望の好みに応じてより多くの応答を生成し,他のトークンレベルおよび応答レベルPO手法と比較して最大2ポイントの推論タスクを改善する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:53:22 GMT)
Enhancing SPARQL Generation by Triplet-order-sensitive Pre-training [13.6] 新しい目的であるTriplet Order Correction(TOC)と、一般的に使われているMasked Language Modeling(MLM)を組み合わせた事前学習ステージを提案する。
提案手法は,広範に使用されている3つのベンチマークに対して,最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:48:46 GMT)
Towards Efficient 3D Object Detection in Bird's-Eye-View Space for Autonomous Driving: A Convolutional-Only Approach [13.5] BEVENetと呼ばれるBEVベースの効率的な3D検出フレームワークを提案する。
BEVENetは、NuScenesチャレンジに対する現代の最先端(SOTA)アプローチよりも3$times$高速である。
実験の結果,BEVENetは現代の最先端(SOTA)アプローチよりも3$times$高速であることがわかった。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:48:41 GMT)
Revisiting Supertagging for Faster HPSG Pasing [13.5] 英語文法に基づく木バンクを訓練した新しいスーパータガーを提案する。
最適なタグが解析速度と精度に与える影響を検証した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:21:52 GMT)
The Animal-AI Environment: A Virtual Laboratory For Comparative Cognition and Artificial Intelligence Research [13.3] Animal-AI Environmentは、人工知能と相対認知研究コミュニティの協力を促進するために設計されたゲームベースの研究プラットフォームである。
新機能には、インタラクティブボタン、報酬ディスペンサー、プレイヤー通知などが含まれる。
新たに設計したテストの一連のエージェントと、比較認知の分野での研究に触発された900のタスクのAnimal-AI Testbedの結果を提示する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:23:40 GMT)
Multimodal Active Measurement for Human Mesh Recovery in Close Proximity [13.3] 物理的な人間とロボットの相互作用では、ロボットは対象者の正確な身体のポーズを推定する必要がある。
これらのpHRIシナリオでは、ロボットは物理的相互作用のためにロボットに近づかなければならないため、装備されたカメラで対象者の身体を完全に観察することはできない。
本稿では,2次元LiDARのような触覚センサを備えたカメラのアクティブな計測・センサ融合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 19:54:08 GMT)
A second-order-like optimizer with adaptive gradient scaling for deep learning [13.2] INNApropは、INNA法とRMSprop適応勾配スケーリングを組み合わせた最適化アルゴリズムである。
画像分類 (CIFAR-10, ImageNet) と言語モデリング (GPT-2) について、INNAprop はAdamW のトレーニング速度と精度を一貫して比較または比較している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:58:38 GMT)
LightRAG: Simple and Fast Retrieval-Augmented Generation [12.9] Retrieval-Augmented Generation (RAG) システムは、外部知識ソースを統合することで、大規模言語モデル(LLM)を強化する。
既存のRAGシステムには、フラットなデータ表現への依存やコンテキスト認識の欠如など、大きな制限がある。
テキストインデックスと検索プロセスにグラフ構造を組み込んだLightRAGを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:00:12 GMT)
Log-concave Sampling over a Convex Body with a Barrier: a Robust and Unified Dikin Walk [12.8] 我々は、$d$-dimensional log-concave distribution $pi(theta) propto exp(-f(theta))$ for $L$-Lipschitz $f$を考える。
本稿では,各繰り返しにおける障壁関数のヘシアンに対するスペクトル近似を計算するインプロバストサンプリングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:32:51 GMT)
HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks [12.8] 我々はバイリンガル機械翻訳タスクとマルチドメイン機械翻訳タスクに参加する。
これら2つの翻訳タスクでは,正規化ドロップアウト,双方向トレーニング,データ多様化,前方翻訳,後方翻訳,交互学習,カリキュラム学習,トランスダクティブアンサンブル学習などの学習戦略を用いる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:34:11 GMT)
HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks [12.8] 我々はバイリンガル機械翻訳タスクとマルチドメイン機械翻訳タスクに参加する。
これら2つの翻訳タスクでは,正規化ドロップアウト,双方向トレーニング,データ多様化,前方翻訳,後方翻訳,交互学習,カリキュラム学習,トランスダクティブアンサンブル学習などの学習戦略を用いる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:34:11 GMT)
HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks [12.8] 我々はバイリンガル機械翻訳タスクとマルチドメイン機械翻訳タスクに参加する。
これら2つの翻訳タスクでは,正規化ドロップアウト,双方向トレーニング,データ多様化,前方翻訳,後方翻訳,交互学習,カリキュラム学習,トランスダクティブアンサンブル学習などの学習戦略を用いる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:34:11 GMT)
A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.7] 最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。
既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:24:07 GMT)
A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.7] 最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。
既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:24:07 GMT)
AP-LDM: Attentive and Progressive Latent Diffusion Model for Training-Free High-Resolution Image Generation [12.6] 遅延拡散モデル(LDM)は、しばしば高分解能(HR)画像を直接生成する際に重要な構造歪みを経験する。
生成プロセスの高速化を図り,HR画像の品質向上を目的とした注意・進歩型LDM(Attentive and Progressive LDM)を提案する。
AP-LDM は LDM の分解過程を, (i) 注意的訓練分解性脱ノイズ, (ii) 進行性高分解能脱ノイズの2段階に分解する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:56:28 GMT)
Liver Cancer Knowledge Graph Construction based on dynamic entity replacement and masking strategies RoBERTa-BiLSTM-CRF model [12.5] 肝癌は本邦で5番目に多い悪性腫瘍であり,2番目に死亡率が高い。
早期診断は極めて重要であり,早期に肝癌を診断する必要がある。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:57:29 GMT)
NaVIP: An Image-Centric Indoor Navigation Solution for Visually Impaired People [12.2] NaVIPは、包括性のための画像中心の屋内ナビゲーションと探索ソリューションを作ることを目指している。
まずは、大規模な携帯電話のカメラデータを、300K画像の4フロアの研究棟でキュレートすることから始めます。
すべての画像には、正確な6DoFカメラのポーズ、屋内のPoIの詳細、説明的なキャプションがラベル付けされている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 21:16:50 GMT)
CUPID: A Real-Time Session-Based Reciprocal Recommendation System for a One-on-One Social Discovery Platform [12.2] CUPIDは、リアルタイム1対1のソーシャルディスカバリプラットフォーム用に設計されたセッションベースの相互レコメンデーションシステムに対する新しいアプローチである。
CUPIDは、リアルタイムユーザマッチングプロセスから時間集約的なユーザーセッションモデリングを分離し、推論時間を短縮する。
CUPIDは非非同期システムに比べて応答遅延を76%以上削減する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 05:44:14 GMT)
FACMIC: Federated Adaptative CLIP Model for Medical Image Classification [12.2] 本稿では,CLIPモデルを用いた適応型コントラスト言語画像の分類処理について紹介する。
私たちはCLIP用の軽量で効率的な機能アテンションモジュールを採用し、各クライアントのデータに適した機能を選択します。
本稿では,クライアント間のデータ分散の差異を低減するためのドメイン適応手法を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:24:10 GMT)
Universal Physics Transformers: A Framework For Efficiently Scaling Neural Operators [12.2] ユニバーサル物理変換器(Universal Physics Transformer、UPT)は、幅広い問題に対して効率的かつ統一的な学習パラダイムである。
UPTはグリッドやパーティクルベースの潜在メッシュを使わずに動作し、構造や粒子間の柔軟性を実現する。
メッシュ型流体シミュレーションおよび定常レイノルズ平均Navier-StokesシミュレーションにおけるUTTの適用性と有効性を示した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:52:04 GMT)
Learning to Race in Extreme Turning Scene with Active Exploration and Gaussian Process Regression-based MPC [12.1] レースにおける極端なコーナーリングは、しばしば大きなサイドスリップ角を誘導し、車両制御において恐ろしい挑戦となる。
本稿では,AEDGPR(Active Exploration with Double GPR)システムを提案する。
提案アルゴリズムは,Simulink-Carsimプラットフォーム上でのシミュレーションと,1/10スケールのRC車両を用いた実験により検証された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:56:51 GMT)
Strong Model Collapse [12.1] 本稿では,モデル崩壊現象の強い形態が存在することを示す。
以上の結果から,最小の合成データであっても,モデル崩壊につながる可能性が示唆された。
大規模言語モデルの学習における現在の傾向に沿ったアプローチであるモデルサイズの増加が,モデル崩壊を悪化させるか緩和させるかを検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:14:43 GMT)
QERA: an Analytical Framework for Quantization Error Reconstruction [12.1] 重みを極めて低い精度に定量化することへの関心が高まり、結果として生じる誤差を低ランクで高精度なエラー再構成項で相殺する。
量子化と低ランク近似の組み合わせは、アダプタベースのパラメータ効率の微調整法の両方で人気がある。
本稿では,QERA(Quantization Error Reconstruction Analysis)という解析フレームワークを定式化し,その問題に対するクローズドフォームのソリューションを提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:37:34 GMT)
Prompting DirectSAM for Semantic Contour Extraction in Remote Sensing Images [11.8] 我々は,自然画像から得られる強いセグメンテーション機能を継承するDirectSAM-RSという,DirectSAMから派生した基盤モデルを提案する。
このデータセットは34k以上の画像-テキスト-コンテンツトレーレットで構成されており、個々のデータセットの少なくとも30倍の大きさである。
我々は、DirectSAM-RSをゼロショットと微調整の両方で評価し、複数のダウンストリームベンチマークで最先端性能を実現することを実証した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:55:42 GMT)
Generative Image as Action Models [11.8] RGB画像のターゲットとして安定拡散を微調整する行動閉鎖剤GENIMAを提案する。
画像空間にアクションを持ち上げることで、インターネットで事前訓練された拡散モデルは、最先端のビジュモータアプローチよりも優れたポリシーを生成することができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:43:06 GMT)
Language-Assisted Human Part Motion Learning for Skeleton-Based Temporal Action Segmentation [11.8] 骨格に基づくテンポラルアクションは、可変長の骨格配列の高密度な作用分類を含む。
現在のアプローチでは、グラフベースのネットワークを使用して、フレーム単位の全体レベルの動作表現を抽出している。
本稿では,LPL(Language-assisted Human Part Motion Representation)という手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:42:51 GMT)
Posterior Sampling via Autoregressive Generation [11.7] 本稿では,大規模な履歴データから帯域幅アルゴリズムを学習するための新しいフレームワークを提案する。
我々は、過去のデータを用いて自己回帰モデルを事前訓練し、繰り返しのフィードバック/リワードのシーケンスを予測する。
意思決定時には、各アクションに対して想像された報酬の列を自動で(インプット)サンプリングし、最大平均的な報酬でアクションを選択する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:55:06 GMT)
Large Language Models Can Learn Temporal Reasoning [11.6] 本稿では,言語に基づく時間的推論のための新しいフレームワークTG-LLMを提案する。
元の文脈を推論する代わりに、潜時表現、時間グラフ(TG)を採用する。
合成データセット(TGQA)は完全に制御可能であり、最小限の監督を必要とする。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:55:37 GMT)
Truthful Aggregation of LLMs with an Application to Online Advertising [11.6] 広告主にとって真の報告が支配的な戦略であることを確実にするオークション機構であるMOSAICを導入する。
我々はMOSAICが計算オーバーヘッドの少ない広告価値とプラットフォーム収益をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:23:54 GMT)
Do Text-to-Vis Benchmarks Test Real Use of Visualisations? [11.4] 本稿では,ベンチマークデータセットと公開リポジトリのコードを比較した実証的研究を通じて,ベンチマークが実世界の利用を反映しているかどうかを考察する。
その結果,実世界の実例と同一のチャート型,属性,行動の分布を評価できないという,大きなギャップがあることが判明した。
1つのデータセットは代表的であるが、実用的なエンドツーエンドベンチマークになるには広範囲な修正が必要である。
これは、ユーザの視覚的ニーズに本当に対処するシステムの開発をサポートするために、新しいベンチマークが必要であることを示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:49:54 GMT)
Two-Stage Radio Map Construction with Real Environments and Sparse Measurements [11.4] GAN(Generative Adversarial Network)を利用したFPTC(First-predict-then-correct)法の提案
環境情報を入力として、まず、RMP-GAN(Radio Map Prediction GAN)により、プライマリ無線マップを予測する。
そして、スパース測定をガイドラインとした無線地図補正GAN(RMC-GAN)により予測結果を補正する。
FPTC-GANs法の有効性を実験により検証した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:15:27 GMT)
Post-edits Are Preferences Too [11.4] 機械翻訳では、ペアの好みは5点評価のような他の人間のフィードバックよりも信頼性が低い。
機械翻訳では,5点評価など,人間からのフィードバックよりもペアの選好の方が信頼性が低いことを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:09:36 GMT)
Post-edits Are Preferences Too [11.4] 機械翻訳では、ペアの好みは5点評価のような他の人間のフィードバックよりも信頼性が低い。
本研究は, 編集後仮説を上位出力ランクに引き上げるために, 編集後における教師付き微調整(SFT)により最良の結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:09:36 GMT)
$M^3EL$: A Multi-task Multi-topic Dataset for Multi-modal Entity Linking [11.3] 我々はデータセット構築パイプラインを提案し、MELのための大規模データセットであるM3EL$を発行する。
M3EL$には79,625のインスタンスが含まれ、9つの多様なマルチモーダルタスクと5つのトピックが含まれている。
我々のデータセットはこれらの問題に効果的に対処し、$textitCLIP_textitND$モデルに$M3EL$を微調整すると精度が大幅に向上する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:52:23 GMT)
LoRA-XS: Low-Rank Adaptation with Extremely Small Number of Parameters [11.2] トレーニング可能なパラメータを格段に削減し,優れた性能と競争性能を示すLoRA-XSを提案する。
LoRA-XSは、LoRAと比較して、トレーニング可能なパラメータを7Bモデルで100倍以上削減する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:45:14 GMT)
Guided Self-attention: Find the Generalized Necessarily Distinct Vectors for Grain Size Grading [11.2] 粒径を分類するためのガイド付き自己注意を効果的に導入できる,ディープラーニング,すなわちGSNetsに基づく新しいクラスifi-cation法を提案する。
実験の結果、GSNetは90.1%の精度を示し、最先端のSwin Transformer V2を1.9%上回っている。
私たちのアプローチは、オブジェクト検出やセマンティックセグメンテーションといった、より広範なap-plicationに適用できると直感的に信じています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:40:31 GMT)
Self-Bootstrapped Visual-Language Model for Knowledge Selection and Question Answering [11.2] 私たちはPassage Retrieval(DPR)を使って関連する知識を取得し、モデルが質問に答える手助けをします。
DPRは自然言語空間における検索を行うが、画像情報の総合的な取得は保証されない。
本稿では、視覚言語モデルを利用して、DPRが検索した重要な知識を選択し、質問に答える新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:10:20 GMT)
FreSh: Frequency Shifting for Accelerated Neural Representation Learning [11.2] Inlicit Neural Representations (INR) は、画像、ビデオ、三次元形状などの信号を多層パーセプトロン(MLP)を用いて連続的に表現するための強力なアプローチとして近年注目されている。
低周波の詳細は低周波バイアスを示し、高周波の詳細を正確に捉える能力を制限することが知られている。
本稿では、初期出力の周波数スペクトルと目標信号の周波数スペクトルを一致させる周波数シフト(FreSh)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:21:20 GMT)
FreSh: Frequency Shifting for Accelerated Neural Representation Learning [11.2] Inlicit Neural Representations (INR) は、画像、ビデオ、三次元形状などの信号を多層パーセプトロン(MLP)を用いて連続的に表現するための強力なアプローチとして近年注目されている。
低周波の詳細は低周波バイアスを示し、高周波の詳細を正確に捉える能力を制限することが知られている。
本稿では、初期出力の周波数スペクトルと目標信号の周波数スペクトルを一致させる周波数シフト(FreSh)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:21:20 GMT)
A Two-Step Approach for Data-Efficient French Pronunciation Learning [11.0] 本稿では,2つの発音課題を包含する新しい2段階のアプローチを提案する。
提案手法は,ラベル付きデータの欠如を効果的に軽減できることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:30:23 GMT)
Exploring the Meaningfulness of Nearest Neighbor Search in High-Dimensional Space [11.0] コンピュータビジョン、機械学習、大規模言語モデル(LLM)などの分野において「高次元ベクトル」がますます重要になっている。
これらの高次元ベクトルに対して最も近い近接探索(NNS)にもかかわらず、検索拡張生成(RAG)やその他の多くの用途に広く用いられている。
本研究は,埋め込み型データ表現法の有効性を示し,高密度ベクトル関連アプリケーションのさらなる最適化の機会を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:28:17 GMT)
UnSeGArmaNet: Unsupervised Image Segmentation using Graph Neural Networks with Convolutional ARMA Filters [10.9] 事前学習したViTを用いた教師なしセグメンテーションフレームワークを提案する。
画像内に固有のグラフ構造を利用することにより,セグメント化における顕著な性能を実現する。
提案手法は,ベンチマーク画像セグメンテーションデータセット上での最先端性能(教師付き手法に匹敵する)を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:10:09 GMT)
3D UAV Trajectory Planning for IoT Data Collection via Matrix-Based Evolutionary Computation [10.9] 連続時間空間領域上の3次元UAV軌道の計画は、計算集約的な問題である。
非効率な制約最適化問題に対処するために,制約付き行列ベース微分進化法(MDECH)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:33:48 GMT)
Think While You Generate: Discrete Diffusion with Planned Denoising [10.8] 本稿では,計画デノイングによる離散拡散(DDPD)について紹介する。これは,生成プロセスを2つのモデル – プランナーとデノナイザ – に分割する新しいフレームワークである。
DDPDは従来の denoiser のみのマスク拡散法より優れており、言語モデリングベンチマークにおいて優れた結果が得られる。
特に言語モデリングにおいて、DDPDは、拡散に基づく手法と自己回帰的手法のパフォーマンスギャップを、生成的パープレキシティの観点から著しく減少させる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:03:34 GMT)
TaeBench: Improving Quality of Toxic Adversarial Examples [10.8] 本稿では, 生成した有害な逆数例(TAE)の品質管理のためのアノテーションパイプラインを提案する。
我々は,TAEの品質要件を評価するために,モデルに基づく自動アノテーションと人間による品質検証を設計する。
我々は,TaeBenchがSOTA毒性量モデレーションモデルやサービスを効果的に移行攻撃できることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 00:14:27 GMT)
Fine-grained Hallucination Detection and Mitigation in Language Model Mathematical Reasoning [10.7] 既存のアプローチは、主に幻覚の存在を検知するが、それらのタイプや表現の微妙な理解は欠如している。
数学的推論タスクにおける一般的な幻覚を6つのタイプに分類する包括的分類法を導入する。
次に,FG-PRM(FG-PRM)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:25:26 GMT)
Robust Transfer Learning for Active Level Set Estimation with Locally Adaptive Gaussian Process Prior [10.6] ブラックボックス関数のアクティブレベル設定推定の目的は、関数値が指定された閾値を超えるか低下する領域を正確に識別することである。
ブラックボックス関数をサンプリング効率よくモデル化するための有望な方法は、関連する関数から事前知識を取り入れることである。
本稿では,与えられた事前知識を安全に統合し,頑健な性能を保証するために常に調整する,アクティブなレベルセット推定のための新しいトランスファー学習手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:19:48 GMT)
Stochastic Zeroth order Descent with Structured Directions [10.6] 我々は, 有限差分法であるStructured Zeroth Order Descent (SSZD)を導入・解析し, 集合 $lleq d 方向の勾配を近似し, $d は周囲空間の次元である。
凸凸に対して、すべての$c1/2$に対して$O( (d/l) k-c1/2$)$ 上の関数の収束はほぼ確実に証明する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:37:51 GMT)
ENWAR: A RAG-empowered Multi-Modal LLM Framework for Wireless Environment Perception [10.5] 大規模言語モデル(LLM)は、6G以降のネットワークにおいて、ネットワーク管理とオーケストレーションを進める上で大きな可能性を秘めている。
本稿では,ENWAR(ENvironment-aWARe search augmented generation-empowered multi-modal LLM framework)を紹介する。
ENWARは、複雑な無線環境を知覚し、解釈し、認知的に処理するマルチモーダル感覚入力をシームレスに統合する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:26:18 GMT)
Lossy Image Compression with Foundation Diffusion Models [10.4] 本研究は,拡散を用いた量子化誤差の除去をデノナイジングタスクとして定式化し,送信された遅延画像の損失情報を復元する。
当社のアプローチでは,完全な拡散生成プロセスの10%未満の実行が可能であり,拡散モデルにアーキテクチャ的な変更は不要である。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:18:43 GMT)
MLissard: Multilingual Long and Simple Sequential Reasoning Benchmarks [10.4] 言語モデルは、数十万のトークンからなる長いシーケンスを扱う必要のあるタスクを解決することができる。
しかしながら、単純なルールを繰り返し使用する必要のあるタスクでは、トレーニング中に見られるものよりもはるかに短いシーケンスでも失敗することが多い。
MLissardは、様々な長さのテキストを処理および生成するモデルの能力を評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:59:31 GMT)
On the Impacts of the Random Initialization in the Neural Tangent Kernel Theory [10.4] ネットワークの幅が無限大になる傾向があるため、ランダム初期化を伴うニューラルネットワークはガウス過程$fmathrmGP$に収束することが知られている。
カーネルレグレッションの伝統的な理論を採用するため、最近の研究は、ネットワークの出力が開始時にゼロであることを保証するために、特別なミラー化されたアーキテクチャを導入した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:22:50 GMT)
Delving into temperature scaling for adaptive conformal prediction [10.3] コンフォーマル予測は、新たな不確実性保証手法として、予め定義された確率で真のラベルを含むことが保証される予測セットを構築する。
温度スケーリングのような現在の信頼度校正法は、適応的等角予測において、通常より大きな予測セットをもたらすことを示す。
本稿では,適応型共形予測の効率向上を目的とした温度スケーリングの変種である$Conformal$$Temperature$$Scaling$ (ConfTS)を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:33:47 GMT)
A practical applicable quantum-classical hybrid ant colony algorithm for the NISQ era [10.2] 量子アントコロニー最適化(QACO)は、量子コンピューティングとアリコロニー最適化(ACO)アルゴリズムの利点を組み合わせているため、多くの注目を集めている。
クラスタリングアルゴリズムとQACOアルゴリズムを組み合わせた量子古典ハイブリッドアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:50:28 GMT)
GUNDAM: Aligning Large Language Models with Graph Understanding [10.1] textbfGraph textbfUnderstanding for textbfNatural Language textbfDriven textbfAnalytical textbfModel (model)を紹介する。
このモデルは、グラフデータの構造をよりよく理解し、関与するようにLLMを適用し、グラフの構造自体を活用することで複雑な推論タスクを実行できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:00:52 GMT)
One Backpropagation in Two Tower Recommendation Models [10.1] 4つのビルディングモジュールは、ユーザイットエンコーディング、ネガティブサンプリング、損失計算、バックプロパゲーション更新というモデルで識別できる。
本稿では, 標準勾配のバックプロパゲーションを維持しつつ, 利用者のバックプロパゲーションを遮断する新しいバックプロパゲーション更新戦略を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:24:25 GMT)
Robust Domain Generalisation with Causal Invariant Bayesian Neural Networks [10.0] 本稿では,推論プロセスのメカニズムからデータ分布の学習を阻害するベイズ型ニューラルネットワークを提案する。
理論的,実験的に,我々のモデルは因果的介入下での推論に近似していることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:38:05 GMT)
Quantifying Training Difficulty and Accelerating Convergence in Neural Network-Based PDE Solvers [9.9] ニューラルネットワークに基づくPDEソルバのトレーニングダイナミクスについて検討する。
統一分割(PoU)と分散スケーリング(VS)という2つの手法が有効ランクを高めていることがわかった。
PINNやDeep Ritz、オペレータ学習フレームワークのDeepOnetなど、人気のあるPDE解決フレームワークを使用した実験では、これらのテクニックが収束を継続的に加速することを確認した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:35:19 GMT)
An Optimized Nearest Neighbor Compliant Quantum Circuit for 5-qubit Code [9.9] 5量子ビット量子誤り訂正符号は1つの論理量子ビットを5つの物理量子ビットに符号化し、1つのエラーからコードを保護する。
安定化器符号に対するエンコーダ回路の最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:17:17 GMT)
Hyper Adversarial Tuning for Boosting Adversarial Robustness of Pretrained Large Vision Models [9.8] 大きな視覚モデルは敵の例に弱いことが分かっており、敵の強靭性を高める必要性を強調している。
近年の研究では、大規模視覚モデルにおけるローランク適応(LoRA)の逆調整のような堅牢な微調整法が提案されているが、完全なパラメータ逆微調整の精度の一致に苦慮している。
本稿では,モデルロバスト性を効率的にかつ効率的に向上するために,異なる手法間で共有された防御知識を活用するハイパー対戦チューニング(HyperAT)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:05:01 GMT)
Temperature Optimization for Bayesian Deep Learning [9.6] テストログ予測密度を最大化する温度を選択するためのデータ駆動手法を提案する。
提案手法は,グリッド探索において,コストのごく一部で比較可能な性能を実証的に証明する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:32:22 GMT)
Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets with Unbalanced Modalities [9.5] 本研究では,データサンプルの不均一性だけでなく,機関間のデータモダリティの固有不均一性と不均一性を両立する新しいFLアーキテクチャを提案する。
マルチモーダルFLに適した分散勾配ブレンディングと近接対応クライアント重み付け戦略を考案した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:52:18 GMT)
Short-Term Photovoltaic Forecasting Model for Qualifying Uncertainty during Hazy Weather [9.4] 我々は、悪天候下で不確実性を評価するために、改良されたエントロピーを導入する。
クラスタリングとアテンション機構は、計算コストを削減し、予測精度を高めるために使用される。
悪天候に関連する2つのデータセットの実験により、我々のモデルは予測精度を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:45:17 GMT)
Extracting Prompts by Inverting LLM Outputs [9.4] output2promptはモデルのロジットにアクセスせずにプロンプトを抽出することを学ぶ。
メモリ効率を向上させるため、output2promptは新しいスパース符号化技術を採用している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:30:11 GMT)
Learning the Generalizable Manipulation Skills on Soft-body Tasks via Guided Self-attention Behavior Cloning Policy [9.3] GP2E行動クローニングポリシーは、ソフトボディタスクから汎用的な操作スキルを学ぶためのエージェントを誘導することができる。
本研究は,Embodied AIモデルの一般化能力を向上する手法の可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:31:10 GMT)
Multi-Session Client-Centered Treatment Outcome Evaluation in Psychotherapy [9.3] IPAEvalは、クライアントインフォームド心理学的評価に基づく評価フレームワークである。
臨床面接による治療結果の評価をクライアントの視点から自動化する。
IPAEvalは、複数のセッションにおける症状の重症度と治療結果を効果的に追跡し、以前のシングルセッションモデルより優れている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:54:38 GMT)
Counterfactual Causal Inference in Natural Language with Large Language Models [9.2] 本稿では,自然言語からの因果構造発見と因果推論手法を提案する。
まず LLM を用いてテキストデータからインスタンス化された因果変数を抽出し,因果グラフを構築する。
次に、推定されたグラフに対して反実数推論を行う。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:53:07 GMT)
Remote Sensing Image Segmentation Using Vision Mamba and Multi-Scale Multi-Frequency Feature Fusion [9.1] 本稿では、状態空間モデル(SSM)を導入し、視覚マンバ(CVMH-UNet)に基づく新しいハイブリッドセマンティックセマンティックネットワークを提案する。
本手法は、クロス2Dスキャン(CS2D)を用いて、複数の方向からグローバル情報をフルにキャプチャする、クロス走査型視覚状態空間ブロック(CVSSBlock)を設計する。
ローカル情報取得におけるビジョン・マンバ(VMamba)の制約を克服するために畳み込みニューラルネットワークのブランチを組み込むことにより、このアプローチはグローバル機能とローカル機能の両方の包括的な分析を促進する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:17:38 GMT)
Towards Unsupervised Eye-Region Segmentation for Eye Tracking [9.1] 我々は、人間の目の前兆を使い、画像から信号を抽出し、眼領域構造を示す粗い手がかりを確立する。
セグメンテーションネットワークは、各部分の正確な領域を徐々に特定するように訓練される。
実験の結果、教師なしのアプローチは、教師付き学習下での成績の90%(瞳孔と虹彩)と85%(視線領域全体)を容易に達成できることがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:33:23 GMT)
RoWeeder: Unsupervised Weed Mapping through Crop-Row Detection [8.9] RoWeederは、教師なし雑草マッピングのための革新的なフレームワークである。
クロップロー検出とノイズ耐性の深いディープラーニングモデルを組み合わせる。
RoWeederとドローン技術を統合することで、農家はリアルタイムで空中調査を行うことができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:56:57 GMT)
Holistic Unlearning Benchmark: A Multi-Faceted Evaluation for Text-to-Image Diffusion Model Unlearning [8.8] ソースコードとアーティファクトによる包括的な評価フレームワークをリリースします。
我々の研究は、特により複雑で現実的な状況において、あらゆる方法が副作用や制限を持っていることを明らかにしている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:30:39 GMT)
Learning in complex action spaces without policy gradients [8.8] そこで本研究では,QMLEを制御可能な計算コストで複雑な行動空間に適用できることを示す。
QMLEは、最先端の方法と比較しても、DeepMind Control Suite上で強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:49:34 GMT)
Partially Recentralization Softmax Loss for Vision-Language Models Robustness [8.8] 事前学習したマルチモーダルモデルの損失関数を変更することで得られる対向的ロバスト性について検討する。
実験の結果、訓練済みモデルの微調整後、一般的な攻撃に対して、逆方向の頑健性を大幅に改善できることが判明した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:13:25 GMT)
Enhancing Graph Self-Supervised Learning with Graph Interplay [8.8] Graph Interplay(GIP)は、様々な既存のGSSLメソッドを備えたパフォーマンスを大幅に向上させる革新的で汎用的なアプローチである。
GIPは、標準バッチ内でランダムなグラフ間エッジによる直接グラフレベルの通信を導入することを提唱している。
我々の実証研究は、GIPが広く普及しているGSSL法の性能を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:30:12 GMT)
Enhancing Graph Self-Supervised Learning with Graph Interplay [8.8] Graph Interplay(GIP)は、様々な既存のGSSLメソッドを備えたパフォーマンスを大幅に向上させる革新的で汎用的なアプローチである。
GIPは、標準バッチ内でランダムなグラフ間エッジによる直接グラフレベルの通信を導入することを提唱している。
我々の実証研究は、GIPが広く普及しているGSSL法の性能を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:30:12 GMT)
Representing the Under-Represented: Cultural and Core Capability Benchmarks for Developing Thai Large Language Models [8.7] 大規模言語モデル(LLM)の急速な進歩は、堅牢な評価フレームワークの必要性を強調している。
タイ文化・言語情報ベンチマーク(ThaiCLI)とタイ文化・言語情報ベンチマーク(ThaiCLI)の2つの主要なベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:05:18 GMT)
Representing the Under-Represented: Cultural and Core Capability Benchmarks for Developing Thai Large Language Models [8.7] 大規模言語モデル(LLM)の急速な進歩は、堅牢な評価フレームワークの必要性を強調している。
タイ文化・言語情報ベンチマーク(ThaiCLI)とタイ文化・言語情報ベンチマーク(ThaiCLI)の2つの主要なベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:05:18 GMT)
Accelerating the discovery of low-energy structure configurations: a computational approach that integrates first-principles calculations, Monte Carlo sampling, and Machine Learning [8.7] 我々は,モンテカルロサンプリング,第一原理DFT計算,機械学習を組み合わせた物理に基づくデータ駆動手法を開発した。
タングステン系4元系高エントロピー合金の特別な場合に対する提案手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:34:42 GMT)
Towards a GENEA Leaderboard -- an Extended, Living Benchmark for Evaluating and Advancing Conversational Motion Synthesis [8.6] 本稿では,既存のジェスチャジェネレーション評価の問題点をレビューし,詳述する。
対話型モーション合成の進歩をベンチマークする,次世代のライビングリーダーボードをアナウンスする。
従来のジェスチャー生成の課題とは異なり、リーダーボードは、新しいジェスチャー生成システムの大規模なユーザスタディで更新される。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:05:08 GMT)
AMSNet: Netlist Dataset for AMS Circuits [8.6] 我々は、スキーマをネットリストに変換する自動手法を開発し、データセットAMSNetを作成する。
サイズが大きくなるにつれて、AMSNetはAMS回路設計におけるMLLMアプリケーションの探索を著しく容易にする。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:27:20 GMT)
Reconstruction of Particle Flow Energy Distribution Using Deep Learning Algorithms [8.6] 近年の進歩は、エネルギーマップ再構築のための様々なサブ検出器からの熱量計画像の深層学習による処理である。
本稿では,従来のアルゴリズム-MLP,CNN,U-Net,RNN-を,自己注意と3D畳み込みモジュールを含む変種と比較する。
ジェットイベントのテストデータセットを使用して、異常な高エネルギーイベントを扱う際のモデルの性能を分析し、比較する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:49:18 GMT)
Not All Language Model Features Are Linear [8.6] 独立的・非共起的な低次元特徴に分解できるかどうかに基づいて、既約多次元特徴の厳密な定義を開発する。
スパースオートエンコーダを用いて, GPT-2 と Mistral 7B の多次元特徴を自動的に検出する。
我々は、これらの正確な円が、その年の週と月におけるモジュラー算術に関わる計算問題を解くのに使用されるタスクを特定する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:23:17 GMT)
Solution of Multiview Egocentric Hand Tracking Challenge ECCV2024 [8.5] マルチビュー入力画像とカメラパラメータを用いて手形状とポーズを推定する手法を提案する。
提案手法は,Umetrackデータセットで13.92mm MPJPE,HOT3Dデータセットで21.66mm MPJPEを実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:18:32 GMT)
1st Place Solution of Multiview Egocentric Hand Tracking Challenge ECCV2024 [8.5] マルチビュー入力画像とカメラパラメータを用いて手形状とポーズを推定する手法を提案する。
提案手法は,Umetrackデータセットで13.92mm MPJPE,HOT3Dデータセットで21.66mm MPJPEを実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:18:32 GMT)
ERVQA: A Dataset to Benchmark the Readiness of Large Vision Language Models in Hospital Environments [8.4] 緊急室視覚質問応答(ERVQA)データセットについて, 多様な緊急室シナリオをカバーする画像, 質問, 回答> トリプレットについて紹介する。
従来のVQAメトリクスを使用して、最先端のオープンソースおよびクローズドなLVLMをベンチマークする。
以上の結果から,ERVQAデータセットは非常に複雑なタスクを示し,専門的なドメイン固有のソリューションの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:14:24 GMT)
SIEVE: General Purpose Data Filtering System Matching GPT-4o Accuracy at 1% the Cost [8.4] SIEVEは、GPT-4oの精度を少しのコストで一致させる軽量フィルタである。
我々は,5つの高度にカスタマイズされたフィルタタスクを用いて,OpenWebTextデータセット上でSIEVEを実験的に検証した。
本研究は,言語モデル学習のための大規模かつ高品質なデータセットのキュレーションにおいて,本手法の有効性と効率性を示すものである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:30:39 GMT)
SIEVE: General Purpose Data Filtering System Matching GPT-4o Accuracy at 1% the Cost [8.4] SIEVEは、GPT-4oの精度を少しのコストで一致させる軽量フィルタである。
我々は,5つの高度にカスタマイズされたフィルタタスクを用いて,OpenWebTextデータセット上でSIEVEを実験的に検証した。
本研究は,言語モデル学習のための大規模かつ高品質なデータセットのキュレーションにおいて,本手法の有効性と効率性を示すものである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:30:39 GMT)
A noise-corrected Langevin algorithm and sampling by half-denoising [8.4] ランゲヴィンアルゴリズムは、与えられたpdfを実空間でサンプリングする古典的な方法である。
ディープラーニングでは、いわゆるノイズスコア関数(noisy score function)を学ぶのが簡単になることが多い。
本稿では,雑音によるバイアスを除去するLangevinアルゴリズムのノイズ補正版を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:06:32 GMT)
Tilting the Odds at the Lottery: the Interplay of Overparameterisation and Curricula in Neural Networks [8.3] カリキュラム学習が深層学習にはほとんど役に立たないことを示す。
特に,XOR-like Gaussian Mixture 問題における2層ネットワークのオンライン学習環境における相互作用について検討する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:23:23 GMT)
STNet: Deep Audio-Visual Fusion Network for Robust Speaker Tracking [8.2] 本稿では,音声・視覚融合モデルを用いた新しい話者追跡ネットワーク(STNet)を提案する。
AV16.3とCAV3Dデータセットの実験により、提案されたSTNetベースのトラッカーは、ユニモーダルな手法と最先端のオーディオヴィジュアルなスピーカートラッカーよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:15:17 GMT)
MTFL: Multi-Timescale Feature Learning for Weakly-Supervised Anomaly Detection in Surveillance Videos [8.1] 本稿では,時間的特徴量を改善するため,MTFL法を提案する。
実験の結果、MTFLはUCF-Crimeデータセットの最先端の手法より優れており、異常検出性能は89.78%であることがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:57:33 GMT)
Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality [8.1] Fr't Video Distance (FVD) は、映像の配信品質を評価するために広く採用されている指標である。
解析の結果,(1)膨らませた3D Convnet(I3D)特徴空間の非ガウス性,(2)時間歪みに対するI3D特徴量の非感度,(3)信頼性評価に必要な非現実的なサンプルサイズ,の3つの重要な限界が明らかになった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:46:12 GMT)
SwiftQueue: Optimizing Low-Latency Applications with Swift Packet Queuing [8.0] 新しいL4Sキュー選択戦略であるSwiftQueueを紹介します。
送信側は、新しいパケット毎の遅延予測器を使用して、どのパケットに遅延スパイクやドロップがあるかを特定する。
SwiftQueueはレイテンシ予測に基づいて、テールレイテンシ4S対応フローを36-45%削減する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:08:25 GMT)
IncSAR: A Dual Fusion Incremental Learning Framework for SAR Target Recognition [7.9] 破滅的な忘れ方として知られる新しいタスクを学ぶとき、モデルが古い知識を忘れる傾向は、未解決の課題である。
本稿では,SAR目標認識における破滅的忘れを緩和するために,IncSARと呼ばれる漸進的学習フレームワークを提案する。
IncSARはビジョントランスフォーマー(ViT)と、遅延融合戦略によって結合された個々のブランチにカスタム設計の畳み込みニューラルネットワーク(CNN)を備える。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:49:47 GMT)
Zero-shot Persuasive Chatbots with LLM-Generated Strategies and Information Retrieval [7.9] 説得は、健康介入から社会的善の促進まで幅広い応用において重要な役割を担っている。
社会的善のために責任を負うような説得力のあるチャットボットは、肯定的な個人的および社会的変化の実現要因となる。
本稿では,多言語モデル(LLM)に基づくゼロショットチャットボットPersuaBotを提案する。
シミュレーションおよび人的会話実験により、ゼロショットアプローチは従来の作業よりも説得力があり、最先端の知識指向チャットボットを超越した事実的精度を実現していることが示された。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:34:58 GMT)
Ordering-Based Causal Discovery for Linear and Nonlinear Relations [7.9] CaPSは線形および非線形関係を効果的に扱う順序付けに基づく因果探索アルゴリズムである。
実世界のデータから得られた結果は、CaPSの競争力にも寄与する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:33:18 GMT)
De-VertiFL: A Solution for Decentralized Vertical Federated Learning [7.9] この研究は、分散VFL設定でモデルをトレーニングするための新しいソリューションであるDe-VertiFLを紹介している。
De-VertiFLは、新しいネットワークアーキテクチャディストリビューション、革新的な知識交換スキーム、分散フェデレーショントレーニングプロセスを導入することで貢献する。
その結果、De-VertiFLは一般的にF1スコアのパフォーマンスにおいて最先端のメソッドを上回り、分散化とプライバシ保護のフレームワークを維持していることがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:31:10 GMT)
Synthesizing Efficient and Permissive Programmatic Runtime Shields for Neural Policies [7.8] ニューラルポリシーのための軽量でパーミッシブなプログラム型ランタイムシールドを合成する新しいフレームワークを提案する。
Aegisは、スケッチベースのプログラム合成問題としてランタイムシールドの探索を定式化することでこれを達成している。
現在の最先端と比較すると、イージスのシールドは時間オーバーヘッドの2.1$times$とメモリ使用量の4.4$times$である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:44:55 GMT)
Estimating the Number of HTTP/3 Responses in QUIC Using Deep Learning [7.8] 本稿では、所定のQUIC接続におけるHTTP/3応答数をオブザーバによって推定する新しい方法を提案する。
提案手法はQUIC接続トレースを一連の画像に変換し,機械学習(ML)モデルを用いて応答数を予測する。
このスキームは、既知のWebサーバ設定と未知のWebサーバ設定の両方において、最大97%の累積精度と、未知のQUICトレースにおけるレスポンスの総数を推定する92%の精度を達成する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:40:22 GMT)
Approximate non-linear model predictive control with safety-augmented neural networks [7.7] 本稿では、ニューラルネットワーク(NN)によるモデル予測制御(MPC)制御の近似を行い、高速なオンライン評価を実現する。
我々は,近似不正確性にもかかわらず,収束性や制約満足度を決定論的に保証する安全性向上を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:14:53 GMT)
Edit Distances and Their Applications to Downstream Tasks in Research and Commercial Contexts [7.6] チュートリアルでは、研究や商業の文脈に適用される編集距離について記述している。
我々は,翻訳編集率 (TER), Levenshtein, Damerau-Levenshtein, Longest Common Subsequence and $n$-gram distances を用いて,テキスト列の比較における統計指標の脆弱さを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:21:22 GMT)
Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality [7.6] Fr't Video Distance (FVD) は、映像の配信品質を評価するために広く採用されている指標である。
解析の結果,(1)膨らませた3D Convnet(I3D)特徴空間の非ガウス性,(2)時間歪みに対するI3D特徴量の非感度,(3)信頼性評価に必要な非現実的なサンプルサイズ,の3つの重要な限界が明らかになった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:46:12 GMT)
An Adaptive Dual-Domain Prediction Strategy based on Second-order Derivatives for Dynamic Multi-Objective Optimization [7.3] 本稿では,進化的アルゴリズムのパラダイム内での予測戦略を変えるための新しいアプローチを示す。
本稿では,異なる領域における二階微分の概念を適応的に活用する適応予測手法を提案する。
DMOPsベンチマーク問題を用いて,提案アルゴリズムの性能を文献からの4つの最先端アルゴリズムと比較した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:13:49 GMT)
IV-Mixed Sampler: Leveraging Image Diffusion Models for Enhanced Video Synthesis [7.2] IV-Mixed Samplerは、ビデオ拡散モデルのための新しいトレーニングフリーアルゴリズムである。
IDMを使用して、各ビデオフレームとVDMの品質を高め、サンプリングプロセス中のビデオの時間的コヒーレンスを確保する。
UCF-101-FVD, MSR-VTT-FVD, Chronomagic-Bench-150, Chronomagic-Bench-1649 の4つのベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:24:10 GMT)
Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.2] 10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:54:06 GMT)
Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.2] 10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:54:06 GMT)
Automatic Summarization of Long Documents [7.1] 本研究では,入力サイズ制限を効率的に克服する3つの新しいアルゴリズムを提案する。
我々は70,000語以上のテキストでアルゴリズムをテストし、実験の結果、競争力のあるROUGEスコアによるBERTScoreの顕著な増加が示されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:00:49 GMT)
Continual Learning via Learning a Continual Memory in Vision Transformer [7.1] 視覚変換器(ViT)を用いたタスク増分連続学習(TCL)について検討する。
私たちのゴールは、タスクのシナジーを学習することで、悲惨な忘れをすることなく、ストリーミングタスク全体のパフォーマンスを改善することです。
タスクシナジーを効果的に学習するための階層型タスクシネギー探索-探索(HEE)サンプリングベースニューラルアーキテクチャサーチ(NAS)手法を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:29:41 GMT)
SpecTrack: Learned Multi-Rotation Tracking via Speckle Imaging [7.0] レーザースペックルイメージング(LSI)は、ポーズ推定精度を改善するための有望なポテンシャルを提供する。
提案するLSIベーストラッキング(SpecTrack)は,レンズレスカメラとレトロレフレクタマーカーを符号化開口で捕捉し,高精度な多軸回転ポーズ推定を実現する。
当社の社内ビルドテストベッドを使用した大規模な試験では、SpecTrackの精度は0.31degで、最先端のアプローチよりも大幅に向上し、精度は200%まで向上した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:29:52 GMT)
An Eye for an Ear: Zero-shot Audio Description Leveraging an Image Captioner using Audiovisual Distribution Alignment [7.0] マルチモーダルな大言語モデルは画像キャプションの進歩を加速させた。
本研究では,この機能を音声キャプションに再利用できることを示す。
本稿では,視覚的モダリティのギャップを埋めるための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:52:48 GMT)
Posets and Bounded Probabilities for Discovering Order-inducing Features in Event Knowledge Graphs [7.0] イベント知識グラフ(EKG)は、プロセス実行の複数の対話的なビューをキャプチャする。
未処理データからのEKG発見のオープンな問題に対処する。
統計的推測に基づくEKG探索アルゴリズムを導出する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:12:51 GMT)
Empowering Cognitive Digital Twins with Generative Foundation Models: Developing a Low-Carbon Integrated Freight Transportation System [6.9] 我々は,リアルタイム認識,予測分析,都市ロジスティクス最適化のためのデジタルツインを開発した。
生成AIの最近の進歩は、デジタル双生児を合理化する新しい機会を提供する。
都市型デジタルツインを強化するためにトランスフォーマーに基づく言語モデルを用いた概念的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 05:53:20 GMT)
The Breakdown of Gaussian Universality in Classification of High-dimensional Mixtures [6.9] 一般的な混合データ環境下での分類における経験的リスク最小化の高次元的特徴について述べる。
ガウス普遍性の条件を定義し、損失関数の選択に対するそれらの意味について議論する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:45:37 GMT)
Recurrent Alignment with Hard Attention for Hierarchical Text Rating [6.9] 大規模言語モデル(LLM)を利用した階層型テキスト評価のための新しいフレームワークを提案する。
我々のフレームワークは、RAHA(Recurrent Alignment with Hard Attention)を取り入れています。
実験の結果,RAHAは3つの階層的テキスト評価データセットにおいて,既存の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:58:44 GMT)
DeMo: Decoupling Motion Forecasting into Directional Intentions and Dynamic States [6.9] マルチモーダルなトラジェクトリクエリを2つのタイプに分離するフレームワークであるDeMoを紹介する。
この形式を利用することで、軌道の多モード性と動的進化特性を別々に最適化する。
さらに,グローバルな情報集約と状態シーケンスモデリングのためのアテンションとマンバの併用手法についても紹介する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:27:49 GMT)
Probing the Robustness of Theory of Mind in Large Language Models [6.8] LLMにおけるToM探索のための68タスクの新しいデータセットを提案する。
データセットとデータセットを用いた4つのSotAオープンソースLLMのToM性能の評価(Kosinski, 2023)。
エージェントが環境における自動状態変化の知識を持っているという認識を必要とするタスクにおいて、全てのLLMが不整合性を示す傾向がみられた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:13:27 GMT)
TRACE: Temporal Grounding Video LLM via Causal Event Modeling [6.6] ビデオ時間グラウンド(VTG)は、ビデオ理解モデルにとって重要な機能であり、ビデオブラウジングや編集などの下流タスクにおいて重要な役割を果たす。
現在のビデオLLMは自然言語生成のみに依存しており、ビデオに固有の明確な構造をモデル化する能力がない。
本稿では,映像をイベントのシーケンスとして表現する因果イベントモデリングフレームワークを導入し,過去のイベントやビデオ入力,テクスチャインストラクションを用いて現在のイベントを予測する。
本稿では,TRACE と呼ばれるタスクインターリーブビデオ LLM を提案し,実際に因果イベントモデリングフレームワークを効果的に実装する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:46:30 GMT)
On Principles and Representations for Extended Contextuality [6.6] Dzhafarov と Kujala: 標準的な文脈性が拡張された文脈性が満たさない原理を満たすなら、その原理は表象の表象の選択に依存するため、非実体的でなければならない。
本論では, 存在原理が表現の変化の下でどのように表現を変化させるかを無視するなど, 議論に対するいくつかの反論を提起する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:39:49 GMT)
LCM: Log Conformal Maps for Robust Representation Learning to Mitigate Perspective Distortion [6.5] ログ・コンフォーマル・マップ (LCM) は、視点歪みを少ないパラメータで近似し、計算複雑性を小さくすることを示した。
LCMは、教師付きおよび自己教師型表現学習とよく統合されており、標準モデルよりも優れており、視点歪みを緩和する上での最先端のパフォーマンスと一致している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:11:49 GMT)
Wearable-Based Real-time Freezing of Gait Detection in Parkinson's Disease Using Self-Supervised Learning [6.5] LIFT-PDは、パーキンソン病(PD)患者の歩行凍結(FoG)のリアルタイム検出のために開発された、革新的な自己教師型学習フレームワークである。
トレーニング中に不均衡なデータに対処するために差分ホッピングウィンドウ技術(DHWT)を適用することで、大きなラベル付きデータセットへの依存を最小限に抑える。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 00:02:03 GMT)
Riemannian Optimization for Non-convex Euclidean Distance Geometry with Global Recovery Guarantees [6.4] ユークリッド距離幾何学問題を解くために2つのアルゴリズムが提案されている。
第一のアルゴリズムは真の解に線形に収束する。
第2のアルゴリズムは、合成データと実データの両方で強い数値性能を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:19:22 GMT)
Compressed space quantum approximate optimization algorithm for constrained combinatorial optimization [6.4] 圧縮された空間を設計する手法を導入し,その実現可能な解空間を元より少ない量子ビットで表現する。
次に、この縮小空間内の準最適解を求める圧縮空間 QAOA を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:48:46 GMT)
A convex formulation of covariate-adjusted Gaussian graphical models via natural parametrization [6.4] 共発現量軌跡(eQTL)研究では、遺伝子の平均発現レベルと条件独立構造の両方が、それらの遺伝子に局所的な変異によって調節される可能性がある。
共調整GGMを推定する既存の方法は、平均が共変量に依存するか、平均と精度の行列を同時に推定する固有の非賢さのため、スケーリングの仮定に苦しむことしか許さない。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:02:10 GMT)
Characteristic Performance Study on Solving Oscillator ODEs via Soft-constrained Physics-informed Neural Network with Small Data [6.3] 本稿では,物理インフォームドニューラルネットワーク(PINN),従来のニューラルネットワーク(NN),および微分方程式(DE)に関する従来の数値離散化法を比較した。
我々は,ソフト制約のPINNアプローチに注目し,その数学的枠組みと計算フローを正規Dsと部分Dsの解法として定式化した。
我々は、PINNのDeepXDEベースの実装が、トレーニングにおいて軽量コードであり、効率的なだけでなく、CPU/GPUプラットフォーム間で柔軟なことを実証した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:29:31 GMT)
Are Large Language Models State-of-the-art Quality Estimators for Machine Translation of User-generated Content? [6.2] 本稿では,ユーザ生成コンテンツ(UGC)の機械翻訳において,大規模言語モデル(LLM)が最先端の品質評価手法であるかどうかを検討する。
既存の感情関連データセットに人為的アノテートエラーを付加し,多次元品質指標に基づく品質評価スコアを算出した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:16:59 GMT)
Heuristics for Partially Observable Stochastic Contingent Planning [6.2] 部分的に観測可能な領域でタスクを遂行することは人工知能の重要な問題であり、しばしばゴールベースのPOMDPとして定式化される。
ゴールベースのPOMDPは、最初の信念からゴールへの前方軌道を走らせるRTDP-BELアルゴリズムを用いて解決できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:57:16 GMT)
Feudal Networks for Visual Navigation [6.1] 封建的学習を用いた視覚ナビゲーションの新しいアプローチを提案する。
各レベルのエージェントはタスクの異なる側面を見て、異なる空間的および時間的スケールで操作する。
得られた封建的なナビゲーションネットワークは、SOTAの性能に近い。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 18:24:15 GMT)
Rethinking Low-Rank Adaptation in Vision: Exploring Head-Level Responsiveness across Diverse Tasks [6.1] 低ランク適応(LoRA)は、事前訓練された視覚変換器(ViT)の適応パラダイムをシフトさせた。
低ランク適応のためのヘッドレベル応答性チューニング(Heart-LoRA)を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:23:15 GMT)
Learning AND-OR Templates for Professional Photograph Parsing and Guidance [5.9] 写真画像から階層的再構成可能な画像テンプレートを学習し、これらの画像に使用される「テンプレート」を学習し、特徴付ける。
実験結果から,学習したテンプレートが写真技術やスタイルをうまく記述できるのに対し,提案手法は画像の品質を人間のように評価できることがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:27:19 GMT)
CodeCipher: Learning to Obfuscate Source Code Against LLMs [5.9] 我々は,LLMからの応答を保存しながら,コードからプライバシを乱す新しい方法であるCodeCipherを提案する。
CodeCipher は LLM の埋め込み行列を変換し、各行が元の行列内の別の単語に対応するようにし、難読化ソースコードのためのトークンとトークンの混同マッピングを生成する。
その結果,LLMの性能を保ちながらソースコードのプライバシを混乱させることに成功した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:28:54 GMT)
SC-Bench: A Large-Scale Dataset for Smart Contract Auditing [5.8] 自動スマートコントラクト監査研究のための最初のデータセットであるSC-Benchを紹介する。
SC-Benchは5,377の現実世界のスマートコントラクトと15,975の標準に違反している。
GPT-4 を用いて SC-Bench の評価を行った。
以上の結果から,GPT-4は0.9%の違反しか検出できず,22.9%の違反を検出できた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:23:50 GMT)
Swift Sampler: Efficient Learning of Sampler by 10 Parameters [5.6] 効果的なデータサンプリング器は、トレーニングデータに対して適切なサンプリング確率を割り当てる。
textbfSSは高効率で大規模データセットに適用できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 00:26:29 GMT)
Beyond Agreement: Diagnosing the Rationale Alignment of Automated Essay Scoring Methods based on Linguistically-informed Counterfactuals [5.6] 提案手法は,大規模言語モデルによって支援された対実的介入を用いて,BERTのようなモデルが主に文レベルの特徴に焦点を当てていることを明らかにする。
我々のアプローチは、ニューラルネットワークAES手法の理解を改善し、モデル駆動決定における透明性を求める他の領域にも適用できる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:28:30 GMT)
Internal Boundary between Entanglement and Separability Within a Quantum State [5.4] 量子状態が絡み合っているか否かは、量子状態内のしきい値によって決定されることを示す。
任意の量子状態に対して、最適な絡み合った状態、最適な分離可能な状態、最良の分離可能な近似(BSA)分解を得るための演算アルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:11:21 GMT)
Last Iterate Convergence in Monotone Mean Field Games [5.4] Mean Field Game (MFG) は、多数のエージェントの振る舞いをモデル化し、近似するために使用されるフレームワークである。
本稿では,MFGの平衡を計算するために,単純な近点型アルゴリズムを提案する。
我々は、Lasry-Lions型単調性条件の下で、最初の最終点収束保証を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:50:40 GMT)
Last Iterate Convergence in Monotone Mean Field Games [5.4] Mean Field Game (MFG) は、多数のエージェントの振る舞いをモデル化し、近似するために使用されるフレームワークである。
本稿では,MFGの平衡を計算するために,単純な近点型アルゴリズムを提案する。
我々は、Lasry-Lions型単調性条件の下で、最初の最終点収束保証を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:50:40 GMT)
Unveiling the pressures underlying language learning and use in neural networks, large language models, and humans: Lessons from emergent machine-to-machine communication [5.4] 本稿では,ニューラルエージェントと人間の言語行動のミスマッチが解決された3症例について概説する。
我々は、コミュニケーションの成功、生産努力、学習可能性、その他の心理・社会言語学的要因といった、言語学習と台頭のための重要なプレッシャーを識別する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:22:55 GMT)
CodeUnlearn: Amortized Zero-Shot Machine Unlearning in Language Models Using Discrete Concept [5.3] コードブック機能とスパースオートエンコーダ(SAEs)を用いた新しいアンラーニング手法を提案する。
ボトルネックを利用して、アクティベーション空間を分解し、情報の流れを規制することにより、モデルの性能を無関係なデータに保ちながら、ターゲットとなる情報を効率的に解き放つ。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:26:22 GMT)
Transforming Multidimensional Time Series into Interpretable Event Sequences for Advanced Data Mining [5.3] 本稿では,多次元時系列解析における従来の手法の限界に対処する新しい表現モデルを提案する。
提案するフレームワークは,ITインフラの監視と最適化,継続的な患者モニタリングによる診断,トレンド分析,インターネットビジネスによるユーザ行動の追跡,予測など,さまざまな分野のアプリケーションに対して大きな可能性を秘めている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:14:04 GMT)
Quantum lozenge tiling and entanglement phase transition [5.2] 地域法を最大に違反するフラストレーションのないハミルトン語を構築できる。
エンタングルメント相転移を持つ同様のモデルはより高次元で構築できると推測されている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:46:44 GMT)
Selecting the Number of Communities for Weighted Degree-Corrected Stochastic Block Models [5.1] 本研究では,重み付きネットワークのコミュニティ数を選択する方法を検討する。
本稿では, 平均隣接行列を標準DCSBMと同一にモデル化した新しい重み付き次数補正ブロックモデル(DCSBM)を提案する。
コミュニティ数を選択する方法は連続的なテストフレームワークに基づいており、各ステップで重み付けされたDCSBMをスペクトルクラスタリング法により取り付ける。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:01:43 GMT)
Nonlocal growth of quantum conditional mutual information under decoherence [5.1] 局所的な測定は絡み合いを引き起こすことはできないが、短距離の絡み合いを長距離の絡み合いに変換することができる。
我々は,長距離条件付き相互情報(CMI)のデコヒーレンス下での成長というより広い文脈において,測定誘起絡み合い(MIE)を定めている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:07:15 GMT)
Gamification of virtual museum curation: a case study of Chinese bronze wares [5.0] この論文は中国の青銅を研究対象としている。
我々は、仮想博物館環境を構築し、この青銅のデジタル博物館をベースとしたバーチャルリアリティ・キュレーションゲームを設計する。
このゲームは、訪問者に没入型の博物館ローミングと青銅器のインタラクティブな体験を提供する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 05:44:49 GMT)
Data-Driven Spatiotemporal Feature Representation and Mining in Multidimensional Time Series [5.0] 本稿では,従来の鉱業手法の限界を克服することを目的とした時系列データ解析の新しい手法について検討する。
時系列データは、ITインフラの監視と最適化のためのバックエンドサービス、継続的な患者のモニタリングと健康分析による診断、ユーザの行動と売上予測のためのインターネットビジネス追跡など、さまざまな分野で広く利用されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:14:04 GMT)
Automating Data Science Pipelines with Tensor Completion [5.0] 我々はテンソル補完の例としてデータサイエンスパイプラインをモデル化する。
目標は、可変値のすべての組み合わせに対応するテンソルの欠落する全てのエントリを特定することである。
既存の手法と提案手法を多種多様なデータセットで広く評価する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:34:08 GMT)
Mitigating the Impact of Reference Quality on Evaluation of Summarization Systems with Reference-Free Metrics [4.9] 我々は,人間の評価値とよく相関する基準のないメトリクスを導入し,計算が極めて安価である。
また,低品質の参照設定におけるロバスト性を改善するために,基準ベースのメトリクスと併用することも示している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:09:25 GMT)
DeepDiveAI: Identifying AI Related Documents in Large Scale Literature Data [4.9] データセットは、バイナリ分類タスクに基づいてトレーニングされた高度なLong Short-Term Memory(LSTM)モデルを使用して作成された。
モデルはトレーニングされ、膨大なデータセットで検証され、高精度、精度、リコール、F1スコアが達成された。
結果として得られたDeepDelveAIデータセットは、1956年から2024年までのダートマス会議以来、940万以上のAI関連論文で構成されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:21:57 GMT)
Few-shot clinical entity recognition in English, French and Spanish: masked language models outperform generative model prompting [4.8] 大規模言語モデル(LLM)は多くの自然言語処理タスクにおいて好まれるソリューションとなっている。
本研究は, 数発のNERに対して, 即発的な工学的手法を用いて, 生成性LLMを評価することを目的とする。
我々は、英語、フランス語、スペイン語をカバーする14のNERデータセットを微調整し、プロンプトを用いた13の自己回帰モデルと16のマスキングモデルを比較した。
プロンプトベースの自己回帰モデルは一般的なNERの競合F1を達成するが、マスクモデルに基づくより軽いbiLSTM-CRFタグにより臨床領域内では優れる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:59:07 GMT)
Proximal Point Method for Online Saddle Point Problem [4.8] 本稿では,2プレイヤの時間変動コンベックス・コンベレーブゲームの連続を含むオンラインサドル点問題に焦点を当てる。
環境の非定常性を考えると、アルゴリズム設計のパフォーマンス指標として双対性ギャップと動的ナッシュ均衡の後悔を採用する。
点法には3つの変種がある: Online Proximal Point Method (OPPM), Optimistic OPPM (OptOPPM), OptOPPM with multiple predictor。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:40:07 GMT)
Data Efficiency for Large Recommendation Models [4.8] 大規模なレコメンデーションモデル(LRMs)は、数十億ドル規模のオンライン広告業界にとって基本である。
膨大なデータのスケールは、計算コストと新しい手法を評価できる速度の両方に直接的な影響を及ぼす。
本稿では,データ要件を最適化する実践者を支援するための実行可能な原則と高レベルフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 22:18:00 GMT)
A New Architecture for Neural Enhanced Multiobject Tracking [4.8] マルチオブジェクトトラッキングは、ロボット工学、自律運転、海洋監視において重要なタスクである。
MOTの伝統的な研究はモデルベースであり、逐次ベイズ推定の枠組みでアルゴリズムを確立することを目的としている。
最近の手法は完全なデータ駆動であり、ニューラルネットワークのトレーニングに依存している。
本稿では,Neural-enhanced belief propagation (NEBP)と呼ばれるハイブリッドモデルとデータ駆動方式を最近導入した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:53:45 GMT)
Beyond Captioning: Task-Specific Prompting for Improved VLM Performance in Mathematical Reasoning [4.7] VLM(Vision-Language Models)は、画像検索やVQA(Visual Question Answering)といった視覚的および推論能力を必要とするタスクを変換している。
これらの制限は、複数のモダリティを効果的に統合し、幾何学に関連したタスクを正確に解釈することの難しさに起因している。
我々は、タスクベースのプロンプト、タスク固有のガイダンスでプロンプトを充実させる、有望な代替手段を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:29:40 GMT)
Frećhet Denoised Distance: Enhancing Plausibility Evaluation for Generated Designs with Denoising Autoencoder [4.6] そこで本稿では,DAE (Denoising Autoencoder) を用いて評価画像の符号化を行い,遅延空間内の分布距離を計測する。
我々のFre'chet Denoised Distance(FDD)は、不明瞭な構造を効果的に検出でき、人間の専門家による構造検査とより整合している。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:15:40 GMT)
A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.6] 希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:32:39 GMT)
PAMLR: A Passive-Active Multi-Armed Bandit-Based Solution for LoRa Channel Allocation [4.5] チャネル選択における低消費電力化のための強化学習の活用について検討する。
この学習は、外部干渉に対処するための受動的チャネルサンプリングと、フェージングに対処するためのアクティブチャネルサンプリングのハイブリッドに依存している。
我々のソリューションであるPassive-Active Multi-armed bandit for LoRa (PAMLR, 発音: "Pamela")は、2種類のサンプルのバランスをとり、エネルギー効率の良いチャネル選択を実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:25:23 GMT)
PAMLR: A Passive-Active Multi-Armed Bandit-Based Solution for LoRa Channel Allocation [4.5] チャネル選択における低消費電力化のための強化学習の活用について検討する。
この学習は、外部干渉に対処するための受動的チャネルサンプリングと、フェージングに対処するためのアクティブチャネルサンプリングのハイブリッドに依存している。
我々のソリューションであるPassive-Active Multi-armed bandit for LoRa (PAMLR, 発音: "Pamela")は、2種類のサンプルのバランスをとり、エネルギー効率の良いチャネル選択を実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:25:23 GMT)
Characterizing MPS and PEPS Preparable via Measurement and Feedback [4.5] 長距離の絡み合った状態は、短期量子デバイスに重大な課題をもたらす。
測定とフィードバック(MF)は、一定の回路深度しか持たない特定のパラダイム的長距離絡み合った状態の調製を可能にすることで、この課題を支援することが知られている。
我々は,MFを用いて調製できるマトリックス生成状態 (MPS) とプロジェクテッド絡み合ったペア状態 (PEPS) の構造を詳述する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:57:09 GMT)
LongGenBench: Benchmarking Long-Form Generation in Long Context LLMs [4.5] ロングフォームテキスト生成は、設計提案やクリエイティブな文章作成といったアプリケーションには不可欠である。
新しいロングフォームテキスト評価ベンチマークであるLongGenBenchは、生成されたロングテキストシーケンス内の特定のイベントを識別するモデルの能力をテストする。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:26:00 GMT)
LongGenBench: Benchmarking Long-Form Generation in Long Context LLMs [4.5] ロングフォームテキスト生成は、設計提案やクリエイティブな文章作成といったアプリケーションには不可欠である。
新しいロングフォームテキスト評価ベンチマークであるLongGenBenchは、生成されたロングテキストシーケンス内の特定のイベントを識別するモデルの能力をテストする。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:26:00 GMT)
Fast inference with Kronecker-sparse matrices [4.4] Kronecker-sparse行列による乗算のための最初のエネルギーおよび時間ベンチマークを示す。
私たちのベンチマークでは、メモリ書き換え操作に実行時の最大50%を特殊実装が費やしていることも示しています。
我々は,エネルギー消費を15%削減しつつ,x1.4の中央値の高速化を実現する新しいカーネルを実装した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:05:26 GMT)
Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression [4.3] 我々は、完全連結ネットワークの被覆数に対して、(乗法定数まで)下限と上限を密に展開する。
境界の厳密さにより、疎度、量子化、有界対非有界重み、およびネットワーク出力トランケーションの影響の根本的な理解が展開できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:23:14 GMT)
Clarify Confused Nodes via Separated Learning [4.3] グラフニューラルネットワーク(GNN)は,グラフ指向タスクにおいて顕著な進歩を遂げている。
実世界のグラフは、必ずある種の不均一なノードを含み、伝統的なGNNのホモフィリーな仮定に挑戦する。
我々は,ノードのより信頼性の高い分離を容易にするため,Nighborhood Confusion(NC)と呼ばれる新しいメトリクスを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:33:47 GMT)
Predicting Fine-grained Behavioral and Psychological Symptoms of Dementia Based on Machine Learning and Smart Wearable Devices [4.3] 認知症(BPSD)の行動症状と心理症状は認知症ケアに大きな影響を与え、患者と介護者の両方に影響を及ぼす。
認知症予測のための機械学習の進歩にもかかわらず、BPSD予測にこれらの手法を利用することにはかなりのギャップがある。
本研究は、ウェアラブルデバイスからの生理的信号を利用したBPSD予測のための、新しいパーソナライズされたフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:38:37 GMT)
TRACE-CS: A Synergistic Approach to Explainable Course Scheduling Using LLMs and Logic [4.2] TRACE-csはシンボリック推論と大規模言語モデル(LLM)を組み合わせた新しいハイブリッドシステムである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:12:00 GMT)
Wolf2Pack: The AutoFusion Framework for Dynamic Parameter Fusion [4.2] 我々は,事前学習されたチェックポイントを使わずに,マルチタスク学習のための異なるモデルパラメータを融合するフレームワークであるAutoFusionを紹介する。
我々は、よく使われるベンチマークデータセットの実験を通してAutoFusionの有効性を検証する。
私たちのフレームワークは、モデル統合のためのスケーラブルで柔軟なソリューションを提供し、将来の研究および実用的なアプリケーションのための強力なツールとして位置づけています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:21:24 GMT)
Automated Multi-Task Learning for Joint Disease Prediction on Electronic Health Records [4.2] 本稿では,タスクグループとアーキテクチャの最適構成を同時に検索できるAutoDPという自動手法を提案する。
ハンドクラフトと自動化された最先端の手法の両方に対して大幅な性能向上を実現し、同時に検索コストを同時に維持する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:00:42 GMT)
Bridging Modalities: Enhancing Cross-Modality Hate Speech Detection with Few-Shot In-Context Learning [4.1] インターネット上でのヘイトスピーチは、デジタルプラットフォームの安全性にとって大きな課題となる。
近年の研究では、特定のモダリティに合わせた検出モデルが開発されている。
本研究では,大規模言語モデルを用いたテキスト内学習を多用した広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:27:12 GMT)
Dynamic Mixture of Experts: An Auto-Tuning Approach for Efficient Transformer Models [4.1] 本稿では,トランスフォーマーに基づく基礎モデルのトレーニングと推論の効率を高めるために,DynMoE(Dynamic Mixture of Experts)技術を導入する。
DynMoEには、各トークンがアクティベートする専門家の数を自動的に決定できる新しいゲーティングメソッドが組み込まれている。
本研究は,視覚・言語タスクにおけるGMoEと視覚言語タスクにおけるMoE-LLaVAとの競合性能を比較検討した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:53:41 GMT)
Non-Halting Queries: Exploiting Fixed Points in LLMs [4.1] 我々は、自動回帰モデルの固定点を利用して、決して停止しないクエリを作成する新しい脆弱性を導入します。
ベースモデル(アンアライメント)モデルで実施した多数の実験において,非ハーフティング異常を実演する。
勾配探索に基づく逆転法ARCAによる実験により, モデル間では非ハーフティングが一般的であり, 数個の入力トークンで容易に誘導できることが示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:38:32 GMT)
RoWeeder: Unsupervised Weed Mapping through Crop-Row Detection [4.0] RoWeederは、教師なし雑草マッピングのための革新的なフレームワークである。
クロップロー検出とノイズ耐性の深いディープラーニングモデルを組み合わせる。
RoWeederとドローン技術を統合することで、農家はリアルタイムで空中調査を行うことができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:56:57 GMT)
Nebula: A discourse aware Minecraft Builder [4.0] 先行した言論と非言語的文脈を取り入れることで、そのような相互作用の「言語から行動への」要素がいかに改善されるかを示す。
私たちのモデルであるNebulaは、このタスクのベースライン上でのネットアクションF1スコアを2倍にします。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:26:49 GMT)
Leveraging free energy in pretraining model selection for improved fine-tuning [4.0] 本稿では,下流タスクにおいて,近傍の好ましいパラメータの濃度を測定することで,チェックポイントの適応性を定量化する自由エネルギー基準を提案する。
我々は、自由エネルギー基準が微調整性能の向上と確実に相関しているという実証的証拠を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:50:21 GMT)
Control-oriented Clustering of Visual Latent Representation [4.0] ビヘイビアクローンから学習した画像ベース制御パイプラインにおける視覚表現空間の幾何学について検討する。
画像分類における神経崩壊(NC)現象に着想を得て,視覚的表現空間に類似のクラスタリング法則が出現するかどうかを検討する。
このようなクラスタリングの法則を,専門家による限定的な実証によるポリシのトレーニングにおいて,テスト時間性能を向上させるアルゴリズムツールとして活用できることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:38:36 GMT)
Control-oriented Clustering of Visual Latent Representation [4.0] ビヘイビアクローンから学習した画像ベース制御パイプラインにおける視覚表現空間の幾何学について検討する。
画像分類における神経崩壊(NC)現象に着想を得て,視覚的表現空間に類似のクラスタリング法則が出現するかどうかを検討する。
このようなクラスタリングの法則を,専門家による限定的な実証によるポリシのトレーニングにおいて,テスト時間性能を向上させるアルゴリズムツールとして活用できることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:38:36 GMT)
Training Stiff Neural Ordinary Differential Equations with Implicit Single-Step Methods [3.9] 通常の微分方程式(ODE)の剛系は多くの科学や工学の分野で普及している。
標準的なニューラルODEアプローチは、それらを学ぶのに苦労する。
本稿では,1ステップの暗黙的スキームに基づくニューラルネットワークによる剛性処理手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:08:17 GMT)
Spectral Informed Neural Network: An Efficient and Low-Memory PINN [3.9] 本稿では、微分演算子を乗法で置き換えるスペクトルベースニューラルネットワークを提案する。
PINNと比較して、我々のアプローチはメモリの削減とトレーニング時間の短縮を必要とする。
我々は、スペクトル情報を用いてネットワークを訓練する2つの戦略を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:27:38 GMT)
TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR [3.7] TokenVerseは、複数のタスクを処理するように設計された単一のTransducerベースのモデルである。
ASRモデルトレーニング中にタスク固有のトークンを参照テキストに統合することで実現される。
実験の結果,提案手法は相対的なWERにおいて最大7.7%向上することがわかった。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:09:28 GMT)
The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning [3.6] 我々は、異種録音からの学習を表現するために、神経科学にインスパイアされた自己教師対象のセットをニューラルネットワークとともに開発する。
その結果、これらの目的によって学習された表現は、データとともにスケールし、主題、データセット、タスクをまたいで一般化し、同等の自己監督的アプローチを上回ります。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:59:23 GMT)
Low Depth Phase Oracle Using a Parallel Piecewise Circuit [3.6] 位相 $exp(i f(x))$ を計算基底状態 $left| x right>$ に適用する重要なタスクについて検討する。
また、ターゲット qubit を$f(x)$ に依存する角度で回転させる密接な関連するタスクについても検討する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:53:38 GMT)
Learning from a Biased Sample [3.5] 本稿では,テスト分布のファミリーで発生する最悪のリスクを最小限に抑える決定ルールの学習方法を提案する。
本研究では,健康調査データからメンタルヘルススコアの予測を行うケーススタディにおいて,提案手法を実証的に検証した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:46:11 GMT)
Improving Arabic Multi-Label Emotion Classification using Stacked Embeddings and Hybrid Loss Function [3.4] 本研究は、アラビア語における多言語感情分類を強化するために、積層埋め込み、メタラーニング、ハイブリッド損失関数を用いている。
さらに性能向上のために,クラス重み付け,ラベル相関,コントラスト学習を取り入れたハイブリッド損失関数を導入した。
実験では、Precision、Recall、F1-Score、Jaccard Accuracy、Hamming Lossといった主要なメトリクスで提案されたモデルのパフォーマンスを検証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:04:29 GMT)
Improving Arabic Multi-Label Emotion Classification using Stacked Embeddings and Hybrid Loss Function [3.4] 本研究は、アラビア語における多言語感情分類を強化するために、積層埋め込み、メタラーニング、ハイブリッド損失関数を用いている。
さらに性能向上のために,クラス重み付け,ラベル相関,コントラスト学習を取り入れたハイブリッド損失関数を導入した。
実験では、Precision、Recall、F1-Score、Jaccard Accuracy、Hamming Lossといった主要なメトリクスで提案されたモデルのパフォーマンスを検証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:04:29 GMT)
Deterministic Trajectory Optimization through Probabilistic Optimal Control [3.3] 離散時間決定論的有限水平非線形最適制御問題に対する2つの新しいアルゴリズムを提案する。
どちらのアルゴリズムも確率論的最適制御として知られる新しい理論パラダイムにインスパイアされている。
このアルゴリズムの適用により、決定論的最適ポリシーに収束する確率的ポリシーの定点が得られることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:00:41 GMT)
Gaussian Variational Schemes on Bounded and Unbounded Domains [3.2] この研究は、GRBFの積分、その微分、無限モーメントの間の関係を利用して、正確な二次公式を生成する。
機械学習可能な変分スキームを提示し、有界領域と非有界領域の線形問題を近似するために利用する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:28:15 GMT)
Semi-Markov Processes in Open Quantum Systems. III. Large Deviations of First Passage Time Statistics [3.2] 半マルコフ過程法を用いて、最初の通過時間統計量の大きな偏差を計算する。
電流のような変数に対しては、極の方程式が二次形式に単純化されない限り、一般には失敗する。
これらの関数を古典力学および熱力学的不確実性関係の量子違反の研究に応用する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:28:07 GMT)
Leveraging Large Language Models for Suicide Detection on Social Media with Limited Labels [3.1] 本稿では,テキストベースのソーシャルメディア投稿における自殺的内容を自動的に検出するLarge Language Models (LLMs) について検討する。
我々は,Qwen2-72B-インストラクションの促進とLlama3-8B,Llama3.1-8B,Gemma2-9Bなどの微調整モデルを用いたアンサンブルアプローチを開発した。
実験の結果,アンサンブルモデルでは個々のモデルと比較して5%の精度で検出精度が向上した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:18:16 GMT)
Leveraging Large Language Models for Suicide Detection on Social Media with Limited Labels [3.1] 本稿では,テキストベースのソーシャルメディア投稿における自殺的内容を自動的に検出するLarge Language Models (LLMs) について検討する。
我々は,Qwen2-72B-インストラクションの促進とLlama3-8B,Llama3.1-8B,Gemma2-9Bなどの微調整モデルを用いたアンサンブルアプローチを開発した。
実験の結果,アンサンブルモデルでは個々のモデルと比較して5%の精度で検出精度が向上した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:18:16 GMT)
Tree-Based Leakage Inspection and Control in Concept Bottleneck Models [3.1] 概念ボトルネックモデル(CBM)は、最終的な予測を行う前に、入力を中間概念にマッピングすることで解釈可能性を高めることに注目されている。
CBMは、しばしば情報漏洩に悩まされるが、そこでは、概念によってキャプチャされない追加の入力データが、タスクのパフォーマンスを改善するために使用される。
我々は,共同CBMとシーケンシャルCBMの両方をトレーニングするための新しいアプローチを導入し,決定木を用いて漏洩を識別・制御する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:42:19 GMT)
Deep neural network-based detection of counterfeit products from smartphone images [3.1] 我々は、偽造に対処する世界初の純粋にコンピュータビジョンベースのシステムを示す。
私たちのディープニューラルネットワークシステムは、最初のメーカーがテストしたブランドの衣服に高い精度を示します。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:16:30 GMT)
Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures [3.0] データ駆動モデルを改善するための新しいジェネリックアプローチを導入する。
化学のクラスに同じように振る舞うコンポーネントを持ち込み、それらを共同でモデル化します。
クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:04:30 GMT)
PREDICT: Preference Reasoning by Evaluating Decomposed preferences Inferred from Candidate Trajectories [3.0] 提案手法は,選好の精度と適応性を向上する手法である PreDICT を提案する。
我々は、グリッドワールド設定と新しいテキストドメイン環境の2つの異なる環境でPreDICTを評価する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:16:41 GMT)
Unveiling the Power of Wavelets: A Wavelet-based Kolmogorov-Arnold Network for Hyperspectral Image Classification [3.0] 本稿では,ウェーブレットをベースとしたKolmogorov-Arnold Network(wav-kan)アーキテクチャを用いて,複雑な依存関係の効率的なモデリングを行う。
ウェーブレットベースのアクティベーションにより、Wav-KANはマルチスケールの空間およびスペクトルパターンを効果的にキャプチャできる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:42:40 GMT)
Sonnet or Not, Bot? Poetry Evaluation for Large Models and Datasets [3.0] 大規模言語モデル(LLM)が詩を生成、認識できるようになった。
我々はLLMが英語詩の1つの側面をいかに認識するかを評価するタスクを開発する。
我々は,現在最先端のLLMが,一般的な文体と一般的でない文体の両方を識別できることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 20:27:36 GMT)
Brain-inspired continual pre-trained learner via silent synaptic consolidation [2.9] アーティは、成熟した脳で観察されるスパイク刺激依存性の可塑性を介してサイレントシナプスの活性化機構にインスパイアされている。
学習済みのネットワーク内で学習した知識のメモリ安定性を維持することで、成熟した脳のダイナミクスを模倣する。
推論中、人工的なサイレントと機能的なシナプスを使用して、事前訓練されたネットワークとサブネットワークとの間の正確な接続を確立する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:56:19 GMT)
Conversational Factor Information Retrieval Model (ConFIRM) [2.9] ConFIRM(Conversational Factor Information Retrieval Method)は、ドメイン固有の検索タスクのための大規模言語モデル(LLM)を微調整する新しい手法である。
本研究では、金融セクターにおけるケーススタディを通じて、パーソナライズされたデータを用いてLlama-2-7bモデルを微調整し、ConFIRMの有効性を実証する。
結果のモデルでは、ファイナンシャルクエリの分類において91%の精度が達成され、NVIDIA A100 GPU上での平均推論時間は0.61秒であった。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:39:36 GMT)
Enforcing Interpretability in Time Series Transformers: A Concept Bottleneck Framework [2.8] 本研究では,時系列変換器の解釈可能性を実現するための概念ボトルネックモデルに基づくフレームワークを開発する。
我々は、事前定義された解釈可能な概念に似た表現を開発するようモデルに促すために、トレーニング対象を変更する。
モデルの性能はほとんど影響を受けていないが、モデルは解釈可能性を大幅に改善している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:22:40 GMT)
Experimental realization of direct entangling gates between dual-type qubits [2.8] 我々は、$S_1/2$と$D_5/2$137mathrmBa+$イオンの超微細方程式で符号化されたデュアルタイプの量子ビット間の直接絡み合うゲートを実証する。
デュアルタイプのモルマー・ソレンセンゲートに対して9,6.3(4)%のベル状態忠実度を$S$-$D$イオン対の間に達成し、同じタイプの$S$-$S$または$D$-$D$ゲートと同等である。
この技術はバックのオーバーヘッドを減らすことができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:18:29 GMT)
Gesture2Text: A Generalizable Decoder for Word-Gesture Keyboards in XR Through Trajectory Coarse Discretization and Pre-training [2.8] 拡張現実(AR)および仮想現実(VR)において、空中および地上のWGKシステムにまたがって一般化可能な、使用可能なWGKデコーダを提案する。
SHARK2よりも37.2%向上し、従来の神経デコーダを7.4%上回っている。
クエスト3では97ミリ秒でリアルタイムに動作できる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:53:22 GMT)
Equi-GSPR: Equivariant SE(3) Graph Network Model for Sparse Point Cloud Registration [2.8] 局所球面ユークリッド3次元等分散特性をSE(3)メッセージパッシングに基づく伝搬により埋め込んだグラフニューラルネットワークモデルを提案する。
我々のモデルは、主に記述モジュール、同変グラフ層、類似性、最終的な回帰層から構成される。
3DMatchおよびKITTIデータセットで行った実験は、最先端のアプローチと比較して、我々のモデルの魅力的で堅牢な性能を示している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:48:01 GMT)
Single-Shot Readout and Weak Measurement of a Tin-Vacancy Qubit in Diamond [2.8] ダイヤモンド(SnV$-$)の負電荷のスズ空洞は、次世代の長距離量子ネットワークを構築するための新興プラットフォームである。
ここでは、1つのSnV$-$電子スピンと8.4%の単発読み出し忠実度の測定を実演する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 22:06:51 GMT)
Learning Gaussian Data Augmentation in Feature Space for One-shot Object Detection in Manga [2.8] 日本漫画の世界的な普及に伴い、キャラクターの物体検出がますます重要になっている。
新しいキャラクターは、新しい量のマンガが放出されるたびに出現し、オブジェクト検出器を再訓練するのは現実的ではない。
新たなキャラクタを検出するために単一のクエリ(参照)イメージのみを必要とするワンショットオブジェクト検出は,マンガ産業において必須の課題である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:38:13 GMT)
Integrated Encoding and Quantization to Enhance Quanvolutional Neural Networks [2.8] 準進化モデルの効率性を高めるための2つの方法を提案する。
まず,任意の符号化手法に適用可能なメモ化を用いたフレキシブルなデータ量子化手法を提案する。
第2に、単一回路における符号化と処理のステップを組み合わせた、新たな統合符号化戦略を導入する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:57:13 GMT)
Software analytics for software engineering: A tertiary review [2.7] ソフトウェア工学(SE)におけるソフトウェア分析(SA)の利用に関する5つの二次研究を同定する。
これらの二次研究の目的と探索時間枠の重複にもかかわらず、これらの二次研究の間には一次研究の重複は無視できない。
これらの二次研究で確認された文献の概要は、より包括的なトピックの概要を提供するのに役立つと結論付けている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:28:03 GMT)
Discovering Cyclists' Visual Preferences Through Shared Bike Trajectories and Street View Images Using Inverse Reinforcement Learning [2.7] 本稿では,サイクリストの複雑な視覚的嗜好の定量化と解釈を目的とした新しい枠組みを提案する。
我々は,サイクリング報酬関数の効率的な推定にMDDIRLモデルを適用した。
サイクリストはルート決定を行う際に、特定の道路視覚要素に注目する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:03:46 GMT)
Ethical Leadership in the Age of AI Challenges, Opportunities and Framework for Ethical Leadership [2.7] 倫理的リーダシップは、これらの課題に直面し、それらの機会を最大化する上で、組織を導く上で中心的な役割を担います。
この記事では、倫理的リーダーシップとAIの簡易導入から始まる、AI時代の倫理的リーダーシップの本質について考察する。
AIの時代における倫理的リーダーシップの機会は、次のような質問に答える。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:17:19 GMT)
Outlier-Robust Neural Network Training: Efficient Optimization of Transformed Trimmed Loss with Variation Regularization [2.6] 本稿では,高表現性ニューラルネットワークを用いた外乱予測モデルについて考察する。
本稿では,(1)古典的トリム化損失の計算可能な変種である変換トリム化損失(TTL)と,(2)予測モデルの高次変分正規化(HOVR)を用いる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:17:42 GMT)
Contextual Bandits with Non-Stationary Correlated Rewards for User Association in MmWave Vehicular Networks [2.5] チャネル状態情報(CSI)を明示的に測定することなく、最新のユーザアソシエーションを確立するための半分散文脈相関上信頼境界(SD-CC-UCB)アルゴリズムを提案する。
SD-CC-UCBは、コンテキスト的マルチアーム・バンディット・フレームワークの下で、車両の位置と速度から送信率を学習し、予測し、ユーザ・アソシエーションの迅速な決定のために複雑なチャネル条件を適切にキャプチャする。
提案アルゴリズムは,完全瞬時CSIを必要とするベンチマークアルゴリズムの100%から103%以内のネットワークスループットを実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:10:03 GMT)
RingGesture: A Ring-Based Mid-Air Gesture Typing System Powered by a Deep-Learning Word Prediction Framework [2.5] RingGestureは、電極を利用してジェスチャー軌道の開始と終了をマークするリングベースの空中ジェスチャータイピング技術である。
本稿では,3つの要素からなる新しい単語予測フレームワークであるScore Fusionを提案する。
RingGestureは平均テキスト入力速度が27.3ワード/分(WPM)、ピーク性能が47.9WPMである。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:15:30 GMT)
Topology-Agnostic Graph U-Nets for Scalar Field Prediction on Unstructured Meshes [2.4] TAG U-Netはグラフ畳み込みネットワークで、任意のメッシュやグラフ構造を入力できるようにトレーニングすることができる。
モデルは、各入力グラフの粗いバージョンを構築し、元のグラフ上のノードワイズ出力を予測するために、一連の畳み込みとプーリング操作を実行する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:27:35 GMT)
Time Series Classification of Supraglacial Lakes Evolution over Greenland Ice Sheet [2.4] グリーンランド氷床(GrIS)は、主に融水流出の増加により、地球規模の海面上昇に重要な役割を果たしている。
本研究では,Reconstructed Phase Spaces (RPSs) の GMM を用いて,その季節的変化に基づいて上部氷河湖を同定する,計算効率のよい時系列分類手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:42:15 GMT)
Monocular Visual Place Recognition in LiDAR Maps via Cross-Modal State Space Model and Multi-View Matching [2.4] 我々はRGB画像とポイントクラウドの両方のディスクリプタを学習するための効率的なフレームワークを導入する。
視覚状態空間モデル(VMamba)をバックボーンとして、ピクセルビューとシーンの共同トレーニング戦略を採用している。
視覚的な3Dポイントオーバーラップ戦略は、マルチビューの監視のために、ポイントクラウドビューとRGBイメージの類似性を定量化するように設計されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:31:41 GMT)
Model Predictive Control is Almost Optimal for Restless Bandit [2.3] 離散時間無限水平平均報酬(RMAB)問題を考える。
本稿では, 回転型計算水平方向を$tau$とする非定常ポリシーを提案する。
局所安定性条件下では、その部分最適性ギャップは一般に$O(1/sqrtN)$、$exp(-Omega(N))$である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:34:23 GMT)
Automating Bibliometric Analysis with Sentence Transformers and Retrieval-Augmented Generation (RAG): A Pilot Study in Semantic and Contextual Search for Customized Literature Characterization for High-Impact Urban Research [2.2] 文献分析は、都市科学における研究動向、スコープ、影響を理解するために不可欠である。
キーワード検索に依存する伝統的な手法は、記事のタイトルやキーワードに明記されていない価値ある洞察を明らかにするのに失敗することが多い。
我々は、生成AIモデル、特にトランスフォーマーとレトリーバル拡張生成(RAG)を活用して、バイオロメトリ分析の自動化と強化を行う。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 05:13:27 GMT)
Pathwise Gradient Variance Reduction with Control Variates in Variational Inference [2.2] ベイズ深層学習における変分推論は、閉形式解を持たない予想の勾配を計算することを伴うことが多い。
これらの場合、パスワイズとスコア関数勾配推定器が最も一般的なアプローチである。
最近の研究は、経路勾配推定器でさえ分散還元の恩恵を受けることを示唆している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:28:46 GMT)
Comparative Analysis of Novel View Synthesis and Photogrammetry for 3D Forest Stand Reconstruction and extraction of individual tree parameters [2.2] 光度測定は一般的に森林の景観の再構築に使われるが、低効率や低品質といった課題に直面している。
NeRFは、天蓋領域ではよいが、視野が限られている地上領域ではエラーが発生する可能性がある。
3DGS法は胸の高さ(DBH)の精度に影響を及ぼすスペーサー点雲を生成する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:53:21 GMT)
NLP Case Study on Predicting the Before and After of the Ukraine-Russia and Hamas-Israel Conflicts [2.1] 近年の2つの事象に対して自然言語処理(NLP)技術を用いて毒性やその他のテキスト属性を予測する手法を提案する。
本稿は、紛争発生前後のソーシャルメディアの分析を通じてリスクを軽減することを願って、今後の紛争における調査の基盤を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:46:56 GMT)
Parameter Choice and Neuro-Symbolic Approaches for Deep Domain-Invariant Learning [2.1] ニューロシンボリックAI(NeSy)はシンボリックパラダイムとサブシンボリックパラダイムのギャップを埋める。
NeSy AIシステムは、複数のモデルとメソッドを使用して、見えないドメインに一般化する。
この作業は、さまざまな問題設定に適用可能な、スケーラブルで一般化可能な広義のAIシステムのためのフレームワークを確立する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:46:35 GMT)
RRADistill: Distilling LLMs' Passage Ranking Ability for Document Re-Ranking of Long-Tail Queries in a Search Engine [2.0] 大規模言語モデル(LLM)は、クエリとドキュメント間の意味的関係を理解するのに優れている。
これらのクエリは、少ないユーザエンゲージメントと限られたフィードバックのため、フィードバックベースのランキングでは難しい。
本稿では,エンコーダモデルとデコーダモデルの両方に対して,効率的なラベル生成パイプラインと新しいsLLMトレーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:28:06 GMT)
Linking Code and Documentation Churn: Preliminary Analysis [2.0] 本研究では,GitHubの3つのオープンソースプロジェクトにおけるコードチャーンとドキュメント更新の同期について検討する。
予備的な結果は、プロジェクト間で異なる同期度を示し、統合された並行ドキュメントプラクティスの重要性を強調します。
この研究の斬新さは、コードの変更とドキュメントの更新を同期させることが、多様性と効率を向上させることで、開発ライフサイクルをいかに改善できるかを示すことである。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:41:58 GMT)
PeersimGym: An Environment for Solving the Task Offloading Problem with Reinforcement Learning [2.0] 計算ネットワークにおけるタスクオフロード戦略の開発と最適化に適した,オープンソースのカスタマイズ可能なシミュレーション環境であるPeersimGymを紹介する。
PeersimGymは、幅広いネットワークトポロジと計算制約をサポートし、TextitPettingZooベースのインターフェイスを統合して、RLエージェントのデプロイを、単体とマルチエージェントの両方で行えるようにしている。
本稿では,分散コンピューティング環境におけるオフロード戦略を大幅に強化するRLベースのアプローチの可能性を示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:56:03 GMT)
Refining Tuberculosis Detection in CXR Imaging: Addressing Bias in Deep Neural Networks via Interpretability [2.0] 実験データから完全な分類精度を得ることができたとしても,深層学習モデルの信頼性は限られていると論じる。
大規模プロキシタスクでディープニューラルネットワークを事前トレーニングし、MOON(Mixed objective Optimization Network)を使用することで、モデルとエキスパート間の決定基盤の整合性を改善することができることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:30:40 GMT)
HJ-sampler: A Bayesian sampler for inverse problems of a stochastic process by leveraging Hamilton-Jacobi PDEs and score-based generative models [1.9] 本稿では,ブラウン運動文脈におけるコールホップ変換(Cole-Hopf transform)と呼ばれるログ変換に基づく。
本稿では,HJ-sampler という新しいアルゴリズムを開発し,与えられた終端観測による微分方程式の逆問題に対する推論を行う。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:50:43 GMT)
beeFormer: Bridging the Gap Between Semantic and Interaction Similarity in Recommender Systems [1.9] beeFormerは、対話データを使った文変換モデルのトレーニングフレームワークである。
我々は、beeFormerでトレーニングされたモデルがデータセット間で知識を伝達できることを実証した。
また、異なるドメインから複数のデータセットをトレーニングすることで、単一のモデルに知識が蓄積されることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 19:30:34 GMT)
Asynchronous Stochastic Gradient Descent with Decoupled Backpropagation and Layer-Wise Updates [1.9] バックプロパゲーションの大きな欠点の1つは、アルゴリズムの前方フェーズと後方フェーズの間のインターロックである。
本稿では,複数のスレッドから非同期に更新することで,モデルのレイヤ間でSGD更新を並列化する手法を提案する。
このアプローチは、Hongwild!よりも最大2.97倍高速で複数のデバイスでスケールしながら、最先端の結果に近い結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:32:36 GMT)
Manual Verbalizer Enrichment for Few-Shot Text Classification [1.9] acrshortmaveは、クラスラベルの豊か化による動詞化のためのアプローチである。
本モデルでは, 資源を著しく減らしながら, 最先端の成果が得られている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:16:47 GMT)
First Place Solution to the ECCV 2024 BRAVO Challenge: Evaluating Robustness of Vision Foundation Models for Semantic Segmentation [1.9] 我々はECCV 2024 BRAVO Challengeの第1位となるソリューションを提示する。
モデルはCityscapesでトレーニングされ、その堅牢性はいくつかのアウト・オブ・ディストリビューションデータセットで評価される。
このアプローチは、より複雑な既存のアプローチよりも優れており、チャレンジにおいて第一位を達成しています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:09:14 GMT)
The GDPR's Rules on Data Breaches: Analysing Their Rationales and Effects [1.8] データ漏洩通知義務は、組織をより良いセキュリティに導くことができる。
また、人々が自分の利益を守る可能性を非現実的に期待するべきではないと警告している。
最後に、この論文は、データ保護当局に対して、報告されたデータ漏洩に関するさらなる情報を公開するよう求めている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:43:15 GMT)
Time Transfer: On Optimal Learning Rate and Batch Size In The Infinite Data Limit [1.8] 観測された最適$eta$と$B$Dynamicsは、$mu$Pモデルスケーリングで保存されていることを示す。
我々の結果は、損失値のみに依存する$B_mathrmcrit$という従来の考え方に挑戦する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:06:34 GMT)
Ising on the Graph: Task-specific Graph Subsampling via the Ising Model [1.8] 本稿では,ノードあるいはエッジ上で定義されたIsingモデルを用いて,グラフ構造をサブサンプリングする手法を提案する。
エンド・ツー・エンドの方法で特定の下流タスクに対するグラフの削減方法を学ぶことができるため、我々のアプローチはタスク固有である。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:28:32 GMT)
Spiers Memorial Lecture: How to do impactful research in artificial intelligence for chemistry and materials science [1.7] まず、化学における様々な問題にまたがる現在の応用について概説する。
次に、機械学習研究者が現場の問題をどう捉え、どのようにアプローチするかについて議論する。
最後に,化学における機械学習研究における影響の最大化について考察する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:57:20 GMT)
CAP: Detecting Unauthorized Data Usage in Generative Models via Prompt Generation [1.6] Copyright Audit via Prompts Generation (CAP)は、MLモデルが不正なデータでトレーニングされているかどうかを自動的にテストするフレームワークである。
具体的には、著作権のあるコンテンツを明らかにするためのモデルに適切なキーを生成するアプローチを考案する。
有効性を証明するため,4つのIoTシナリオで収集した測定値について広範な評価を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:49:41 GMT)
Data Quality Issues in Vulnerability Detection Datasets [1.6] 脆弱性検出は、サイバーセキュリティのためのソフトウェアの潜在的な弱点を特定する上で、極めて難しいタスクである。
深層学習(DL)は検出プロセスの自動化に大きな進歩を遂げた。
この目的のためにDLモデルをトレーニングするために、多くのデータセットが作成されています。
しかし、これらのデータセットは、DLモデルの検出精度の低下につながるいくつかの問題に悩まされる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:31:29 GMT)
Adaptive Label Smoothing for Out-of-Distribution Detection [1.6] 適応ラベル平滑化(ALS)と呼ばれる新しい正規化手法を提案する。
ALSは非真のクラスを同じ確率にプッシュするが、最大確率は固定でも制限でもない。
私たちのコードは一般に公開されます。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:35:11 GMT)
Hierarchy of chaotic dynamics in random modular networks [1.6] ランダムに連結された神経集団のモデルを導入し、その力学を力学平均場理論とシミュレーションを用いて研究する。
解析により,高次元および低次元のカオス位相を交叉領域で分離した豊富な位相図が明らかになった。
強くモジュール化された接続にノイズを加えるか、ランダムな接続にモジュール化を導入することでカオスを弱めることができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:54:25 GMT)
Quantum Locally Testable Code with Constant Soundness [1.6] 定音性を有する量子局所テスト可能符号(QLTC)の2つの構成について述べる。
第1のアプローチでは、チェック製品と呼ばれる操作を導入し、この操作が一定音質のQLTCをいかに生み出すかを示す。
第2のアプローチでは、量子符号と古典的繰り返し符号のハイパーグラフ積を考察し、成分符号の健全性が保存される特別なケースを観察する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 22:22:41 GMT)
Provable Accuracy Bounds for Hybrid Dynamical Optimization and Sampling [1.6] 本稿では,Langevin Diffusion (BLD) アルゴリズムをブロックすることにより,ハイブリッド LNLS の非漸近収束を保証する。
デバイスの変化が有限であれば、ステップ時間、雑音強度、関数パラメータの2-ワッサーシュタインバイアスに明確な境界を与える。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:03:41 GMT)
KwicKwocKwac, a tool for rapidly generating concordances and marking up a literary text [1.5] KwicKKは人文科学におけるデジタルテキストのアノテーションと豊かさを高めるために設計されたウェブアプリケーションである。
主な機能としては、KeyWord in Context (KWIC)、KeyWord Out Of Context (KWOC)、KeyWord After Context (KWAC) を用いた注釈付きテキストの可視化がある。
このアプリケーションはメタデータ入力をサポートし、複数のダウンロードフォーマットを提供し、アクセシビリティと使いやすさを促進する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:41:35 GMT)
Evacuation patterns and socioeconomic stratification in the context of wildfires in Chile [1.5] 我々は,チリのバルパライソで発生した山火事で避難パターンを解析するために,高精細な携帯電話記録を用いた。
多くの人が家から一晩離れて過ごしており、最も低い社会経済セグメントの人々は最も長い時間離れていた。
以上の結果から,社会経済的差異が避難動態に果たす役割が示唆され,対応計画に有用な知見が得られた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:18:49 GMT)
Adver-City: Open-Source Multi-Modal Dataset for Collaborative Perception Under Adverse Weather Conditions [1.5] 逆気象条件は、自律走行車の普及に重大な課題をもたらす。
本稿では,悪天候に着目した初のオープンソース総合コラボレーション知覚データセットであるAdver-Cityを紹介する。
24万フレーム、890万アノテーション、および6つの異なる気象条件にまたがる110のシナリオを含んでいる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:26:22 GMT)
Versatile optical accordion lattices using binary phase transmission gratings [1.5] 二相透過格子を用いた波長可変光格子の作製手法を提案する。
この技術を用いて生成された格子は、高い、コントラスト、格子間隔調整性、電力効率を有する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:17:14 GMT)
Paraphrase Identification with Deep Learning: A Review of Datasets and Methods [1.4] 一般的なデータセットにおける特定のパラフレーズ型の表現不足が,盗作を検知する能力にどのように影響するかを検討する。
パラフレーズのための新しいタイポロジーを導入し、検証する。
我々は、AIに基づくパラフレーズ検出を強化するために、将来の研究とデータセット開発のための新しい方向を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 03:29:14 GMT)
A Taxonomy of Recurrent Learning Rules [1.4] 時間によるバックプロパゲーション(BPTT)は、リカレントニューラルネットワーク(RNN)のトレーニングにおけるデファクトスタンダードである
E-propはこれらのアルゴリズムの因果的、局所的で効率的な代替案として提案された。
BPTT から RTRL を導出し,直観的・明確化を図った。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:29:00 GMT)
Contrastive Learning to Fine-Tune Feature Extraction Models for the Visual Cortex [1.3] 我々は、画像分類のために事前訓練された畳み込みニューラルネットワークを微調整するために、コントラスト学習を適用した。
CL微調整により特徴抽出モデルが生成され,初期視覚ROIの符号化精度が向上することを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:14:23 GMT)
A Taxonomy of Collectible Card Games from a Game-Playing AI Perspective [1.3] 本研究は,収集可能なカードゲームの分類法を提案することにより,このジャンルのさらなる研究を支援することを目的とする。
人気ゲームの集合を研究し,その特性について徹底的な議論を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:04:12 GMT)
Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control [1.3] マルチタスクポリシー最適化を実現するために,目標条件付き端末値学習を用いたMPCフレームワークを開発した。
提案手法を2足歩行逆振りロボットモデルで評価し,目標条件付き終端値学習と上層軌道プランナーを組み合わせることで,リアルタイムに制御できることを確認する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:18:01 GMT)
Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control [1.3] マルチタスクポリシー最適化を実現するために,目標条件付き端末値学習を用いたMPCフレームワークを開発した。
提案手法を2足歩行逆振りロボットモデルで評価し,目標条件付き終端値学習と上層軌道プランナーを組み合わせることで,リアルタイムに制御できることを確認する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:18:01 GMT)
FAIREDU: A Multiple Regression-Based Method for Enhancing Fairness in Machine Learning Models for Educational Applications [1.2] 本稿では,複数機能にまたがる公平性向上を目的とした,新規かつ効果的な手法であるFAIREDUを紹介する。
モデル性能を損なうことなく公平性を向上するためのFAIREDUの有効性を評価する。
その結果, FAIREDUは, 性別, 人種, 年齢, その他の繊細な特徴の交叉性に対処し, モデル精度に最小限の影響を伴って, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:29:24 GMT)
Efficient Strategies for Reducing Sampling Error in Quantum Krylov Subspace Diagonalization [1.2] この研究は、射影ハミルトニアンにおける行列要素の測定中のサンプリング誤差の定量化に焦点をあてる。
シフト技術と係数分割の2つの測定方法を提案する。
小分子の電子構造を用いた数値実験は、これらの戦略の有効性を実証している。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:53:55 GMT)
Multiple Global Peaks Big Bang-Big Crunch Algorithm for Multimodal Optimization [1.2] 本研究では,Multiple Global Peaks Big Bang-Big Crunchアルゴリズムを提案する。
宇宙の進化にインスパイアされたMultiple Global Peaks Big Bang-Big Crunchは、人口の最高の個人をクラスタベースの質量中心に分類する。
20個のマルチモーダルベンチマークテスト関数による実験結果から、多言語ピークのビッグバン・ビッグCrunchは、他の最先端マルチモーダル最適化アルゴリズムに対して、より良く、あるいは競争的に機能することが示された。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:49:35 GMT)
Skin Cancer Machine Learning Model Tone Bias [1.2] 多くのオープンソースの皮膚がん画像データセットは、より軽い皮膚のトーンを持つ国で実施された臨床試験の結果である。
このトーン不均衡のため、機械学習モデルは、より軽いスキントーンのための皮膚がんを検出するのによく機能する。
これらのモデルのトーンバイアスは、公正な懸念をもたらし、人工知能の健康分野に対する公衆の信頼を低下させる可能性がある。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:33:02 GMT)
Cooperative and Asynchronous Transformer-based Mission Planning for Heterogeneous Teams of Mobile Robots [1.1] 本稿では,CATMiP(Cooperative and Asynchronous Transformer-based Mission Planning)フレームワークを提案する。
CatMiPはマルチエージェント強化学習を使用して、エージェントを異質なセンシング、モーション、アクティベーション能力で調整する。
ミッションの複雑さやコミュニケーションの制約に容易に適応し、さまざまな環境サイズやチーム構成にスケールします。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:14:09 GMT)
Hidden-State Proofs of Quantumness [1.1] 量子性の実験的暗号的証明は、量子情報科学の進歩における重要なマイルストーンとなる。
このようなテストを実装する上で、エラー寛容は永続的な課題である。
本稿では、(Brakerski et al)と同じ回路構造を維持する量子性の証明を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:04:53 GMT)
TuneVLSeg: Prompt Tuning Benchmark for Vision-Language Segmentation Models [1.1] この研究は、Vision-Language Modelsに様々な非モーダルおよびマルチモーダルプロンプトチューニング技術を統合するためのオープンソースのベンチマークフレームワークであるTuneVLSegを提示する。
放射線学データセットは3ドル、非放射線学データセットは5ドルである。
そこで本研究では,自然領域の画像から医療データまで,ドメインシフトの大きな課題の下で,迅速なチューニングが困難であることが判明した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:56:42 GMT)
TuneVLSeg: Prompt Tuning Benchmark for Vision-Language Segmentation Models [1.1] この研究は、Vision-Language Modelsに様々な非モーダルおよびマルチモーダルプロンプトチューニング技術を統合するためのオープンソースのベンチマークフレームワークであるTuneVLSegを提示する。
放射線学データセットは3ドル、非放射線学データセットは5ドルである。
そこで本研究では,自然領域の画像から医療データまで,ドメインシフトの大きな課題の下で,迅速なチューニングが困難であることが判明した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:56:42 GMT)
Validation of the Practicability of Logical Assessment Formula for Evaluations with Inaccurate Ground-Truth Labels: An Application Study on Tumour Segmentation for Breast Cancer [1.0] 論理的評価式 (LAF) は,不正確な接地トラスラベル (IAGTL) を用いた評価のための新しい理論である。
本稿では,実世界のアプリケーションにおける IAGTL を用いた評価のための LAF の実用的検証について述べる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 14:25:07 GMT)
Simultaneous Measurement of Multiple Incompatible Observables and Tradeoff in Multiparameter Quantum Estimation [1.0] 任意の有限個の観測値の実装を1つの測定値で研究する枠組みを提供する。
我々の研究は、複数の非可換オブザーバブルを含む量子情報科学における様々なタスクを最適化する方法を開拓する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:39:34 GMT)
Temporal Image Caption Retrieval Competition -- Description and Results [1.0] 本稿では,テキスト画像検索のマルチモーダル課題に対処し,時間的データを含むモーダル性を拡張する新しいタスクを提案する。
本論文は,274年にわたる歴史あるアメリカの新聞をデジタル化して収集する,日刊アメリカ・チャレニアングアメリカプロジェクトを基にした画像検索コンペティション(TICRC)である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:45:53 GMT)
Markovian Transformers for Informative Language Modeling [1.0] CoT(Chain-of-Thought)推論は、言語モデルのアウトプットを説明する上で非常に有望である。
最近の研究は、解釈可能性への実践的応用において重要な課題を浮き彫りにした。
本稿では,中間的なCoTテキストによる次トーケン予測を導出し,CoTが因果的負荷分散であることを保証する手法を提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 22:18:59 GMT)
Gamified crowd-sourcing of high-quality data for visual fine-tuning [0.9] 本稿では,大規模マルチモーダルモデルの視覚的チューニングのための高品質なデータをクラウドソースするフレームワークである Gamified Adversarial Prompting (GAP) を紹介する。
GAPは、データ収集プロセスをエンゲージメントゲームに変換し、モデルの知識のギャップをターゲットとする、きめ細かな、挑戦的な質問と回答を提供するようプレイヤーに動機付ける。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:37:41 GMT)
Gamified crowd-sourcing of high-quality data for visual fine-tuning [0.9] 本稿では,大規模マルチモーダルモデルの視覚的チューニングのための高品質なデータをクラウドソースするフレームワークである Gamified Adversarial Prompting (GAP) を紹介する。
GAPは、データ収集プロセスをエンゲージメントゲームに変換し、モデルの知識のギャップをターゲットとする、きめ細かな、挑戦的な質問と回答を提供するようプレイヤーに動機付ける。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:37:41 GMT)
Precision Cancer Classification and Biomarker Identification from mRNA Gene Expression via Dimensionality Reduction and Explainable AI [0.9] 本研究では,33種類の異なる癌とその対応する遺伝子群を正確に同定するための包括的パイプラインを提案する。
正規化と特徴選択技術を組み合わせて、データセットの次元性を効果的に削減する。
我々はExplainable AIを利用して、同定された癌特異的遺伝子の生物学的意義を解明する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:56:31 GMT)
Adaptive Random Fourier Features Training Stabilized By Resampling With Applications in Image Regression [0.9] 浅層ニューラルネットワークのための適応型ランダムフーリエ(ARFF)訓練アルゴリズムを提案する。
本手法は, 粒子フィルタ型再サンプリング技術を用いて, トレーニングプロセスの安定化とパラメータ選択に対する感度の低減を図る。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:08:03 GMT)
Diversity and Inclusion Index with Networks and Similarity: Analysis and its Application [0.9] 類似性やネットワーク接続を考慮した多様性と包摂性に関する新たな指標を紹介します。
これらの指標の特性を分析し,多様性とネットワークの確立した尺度を用いて,それらの数学的関係を調査した。
また、比率、類似度、ネットワーク接続を可視化する手法を作成しました。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:41:39 GMT)
Gibbs state preparation for commuting Hamiltonian: Mapping to classical Gibbs sampling [0.8] Gibbsのサンプルでは、最先端の結果を再現できることが示されています。
提案アルゴリズムは,非ゼロ温度のToricコードに対して,$mathcal O(n2)$時間でギブス状態を作成することができることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:26:17 GMT)
Gibbs state preparation for commuting Hamiltonian: Mapping to classical Gibbs sampling [0.8] Gibbsのサンプルでは、最先端の結果を再現できることが示されています。
我々のギブズサンプリング装置は、これまで未知のレギュレーションでギブズ状態を作成することができることを実証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:26:17 GMT)
Gaussian-Based and Outside-the-Box Runtime Monitoring Join Forces [0.6] 隠れたニューロンの活性化値の観測に基づく従来のモニタリング手法のアイデアを組み合わせる。
特に、計測された各ニューロンの現在の値がトレーニング中に観察される典型的な値と似ているかどうかを観察するガウス的アプローチと、許容されるアクティベーション値のクラスタを生成するOutside-the-Boxモニタを組み合わせる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:50:26 GMT)
A Blockchain-Enhanced Framework for Privacy and Data Integrity in Crowdsourced Drone Services [0.6] 我々は,1988年のオーストラリアのプライバシ法の下でのサービス改善とデータプライバシに関する懸念に対処するため,コンシューマグレードのドローンをブッシュファイア管理に統合する革新的なフレームワークを提案する。
このシステムは、データコンシューマーであるブッシュファイア管理当局が、データプロバイダとして機能するドローンオペレーターから重要な情報にアクセスする市場を確立する。
このフレームワークでは、ローカルな差分プライバシーを使用して、すべてのシステムエンティティからデータプロバイダのプライバシを保護し、プライバシ標準の遵守を保証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:08:47 GMT)
Robust Error Accumulation Suppression for Quantum Circuits [0.6] 本稿では,量子コンピュータにおけるエラー管理のためのロバストなエラー蓄積抑制手法を提案する。
コヒーレントエラーに対しては、$O(sqrtL)$から$O(sqrtL)$への$L$depth回路におけるエラースケーリングの削減を示す。
我々はREASによって抑制できる一般的なデコヒーレンスノイズを導出する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:33:50 GMT)
A mechanistically interpretable neural network for regulatory genomics [0.6] このアーキテクチャはde novoモチーフの発見とモチーフのインスタンス呼び出しに優れており、可変シーケンスコンテキストに対して堅牢であり、新しい関数シーケンスを完全解釈可能な生成を可能にする。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:15:26 GMT)
Label Confidence Weighted Learning for Target-level Sentence Simplification [0.6] 多水準文の単純化は、言語習熟度が異なる簡易文を生成する。
本稿では,ラベル信頼度重み付け方式をエンコーダ・デコーダモデルのトレーニング損失に組み込んだ新しいアプローチであるラベル信頼度重み付き学習(LCWL)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:24:20 GMT)
Gate Fidelity and Gate Driven Dephasing via Time-Dependent Bloch-Redfield Master Equation [0.6] この研究は、高速な外部駆動を持つ線形高調波発振器の浴槽における駆動量子ビットの進化を調べる。
浴槽との相互作用がゲート忠実度に及ぼす影響について検討した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:50:20 GMT)
Evaluating RAG-Fusion with RAGElo: an Automated Elo-based Framework [0.6] 本稿では,RAG (Retrieval-Augmented Generation) Question-Answeringシステムを評価するための総合的なフレームワークを提案する。
我々はLarge Language Models (LLMs) を用いて、実際のユーザクエリとドメイン内ドキュメントに基づいて、合成クエリの大規模なデータセットを生成する。
RAGEloはヒトのアノテータの好みと正に一致しているが,注意が必要である。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:10:42 GMT)
Recurrent Deep Kernel Learning of Dynamical Systems [0.6] デジタル双対は計算効率の低い低次モデル(ROM)を必要とし、物理的資産の複雑な力学を正確に記述することができる。
データから低次元の潜伏空間を発見するために,データ駆動型非侵入型深層学習法(SVDKL)を提案する。
その結果,本フレームワークは, (i) 測定値の復調と再構成, (ii) システム状態のコンパクトな表現の学習, (iii) 低次元潜在空間におけるシステム進化の予測, (iv) 不確実性をモデル化できることがわかった。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:43:06 GMT)
Neural Collaborative Filtering to Detect Anomalies in Human Semantic Trajectories [0.6] 本研究では,人体軌跡の異常を検出するための軽量な異常検出モデルを構築した。
アルゴリズムは2つの主要モジュールから構成される。1つは協調フィルタリングモジュールであり、これは人間の正常な移動を興味のある場所にモデル化するための協調フィルタリングである。
提案手法の有効性を検証するために,シミュレーションおよび実世界のデータセットを用いて,多数の最先端の軌道異常検出手法と比較した広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:23:25 GMT)
Neural Collaborative Filtering to Detect Anomalies in Human Semantic Trajectories [0.6] 本研究では,人体軌跡の異常を検出するための軽量な異常検出モデルを構築した。
アルゴリズムは2つの主要モジュールから構成される。1つは協調フィルタリングモジュールであり、これは人間の正常な移動を興味のある場所にモデル化するための協調フィルタリングである。
提案手法の有効性を検証するために,シミュレーションおよび実世界のデータセットを用いて,多数の最先端の軌道異常検出手法と比較した広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:23:25 GMT)
Neural Collaborative Filtering to Detect Anomalies in Human Semantic Trajectories [0.6] 本研究では,人体軌跡の異常を検出するための軽量な異常検出モデルを構築した。
アルゴリズムは2つの主要モジュールから構成される。1つは協調フィルタリングモジュールであり、これは人間の正常な移動を興味のある場所にモデル化するための協調フィルタリングである。
提案手法の有効性を検証するために,シミュレーションおよび実世界のデータセットを用いて,多数の最先端の軌道異常検出手法と比較した広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:23:25 GMT)
Give me a hint: Can LLMs take a hint to solve math problems? [0.6] 本稿では,先進的な数学的問題に対する言語モデルの性能向上のための"ヒント"を提案する。
また、間違ったヒントに対してモデルの対角的堅牢性をテストする。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:09:31 GMT)
Reducing fuzzy relation equations via concept lattices [0.6] 本稿では,情報を失うことなくファジィ関係式(FRE)を削減する手法を提案する。
プロパティ指向およびオブジェクト指向の概念格子における属性還元理論は、冗長方程式を検出するメカニズムを示すために検討されている。
また,不確かさ/不正確なデータを含む(実)データセットに関連する,解けないFREの近似解を計算するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:47:35 GMT)
Automated decision-making and artificial intelligence at European borders and their risks for human rights [0.6] 多くの国では、国境での移動を管理するために自動意思決定(ADM)システムを使用している。
この学際的な論文は、EUの国境で自動意思決定が使われる主な方法と、そうであるならば、どのようなリスクがあるのか、という2つの疑問を探求する。
本稿では,このような自動意思決定のリスク,すなわちプライバシーとデータ保護に関する人権に関するリスク,(2)非差別,(3)公正な裁判と効果的な対策の3つのカテゴリについて論じる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:57:16 GMT)
Enhanced Feature Based Granular Ball Twin Support Vector Machine [0.5] 機能強化型グラニュラーボールツインサポートベクター(EF-GBTSVM)を提案する。
提案モデルでは,個々のデータサンプルではなく,粒状(GB)の粗粒度を入力として用いた。
ベンチマーク UCI および KEEL データセット上で提案した EF-GBTSVM モデルを徹底的に評価する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:10:43 GMT)
New contexts, old heuristics: How young people in India and the US trust online content in the age of generative AI [0.5] 生成型AI(genAI)が主流になるのと同じように、若者(18~24歳)がオンラインコンテンツをいかに信頼しているかを検討した。
参加者は「感情均衡」を維持するためのモード間で反射的に移動した
ユーザの異なる情報モードに適合するように設計されたリテラシー介入が最も効果的であると結論付けている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 00:35:23 GMT)
Multimodal Representation Learning using Adaptive Graph Construction [0.5] マルチモーダルコントラスト学習は、画像やテキストなどの異種ソースからのデータをレバーゲイトすることでニューラルネットワークを訓練する。
任意の数のモダライトから表現を学習できる新しいコントラスト学習フレームワークであるAutoBINDを提案する。
本稿では,AutoBINDが従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:57:46 GMT)
Minimally Intrusive Access Management to Content Delivery Networks based on Performance Models and Access Patterns [0.5] 本稿では,性能分析と統計的アクセスパターンを通じてトークンの誤用と戦うことに焦点を当てる。
本稿では,異常アクセスの検出とブロックを許容する要求制限の定義を提案する。
また,海賊行為に対する対策として,海賊の利用者が違法な共有を避けるために,サービス品質を低下させるような海賊行為対策も導入する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:45:22 GMT)
Reconstructing networks from simple and complex contagions [0.5] ネットワークと動的を一連のノード状態から再構築するノンパラメトリック手法を開発した。
そして、複雑な感染のレンズを通してネットワークを観察すると、ネットワークをより簡単に再構築できることが示される。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 19:18:33 GMT)
Performance Characterization of Expert Router for Scalable LLM Inference [0.5] 大規模言語モデル(LLM)は、科学や産業の領域で広く採用されている。
最適なスループットとレイテンシで、これらのモデルを大規模にデプロイし、提供することは、依然として大きな課題です。
本稿では、専門的な専門家モデルに向け、スケーラブルなルーティングアーキテクチャであるExpert Routerを紹介する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:41:03 GMT)
MIRACLE 3D: Memory-efficient Integrated Robust Approach for Continual Learning on Point Clouds via Shape Model construction [0.5] 本稿では,3次元オブジェクト分類におけるメモリ効率とプライバシ保護の継続学習のための新しいフレームワークを提案する。
提案手法は各クラスに対してコンパクトな形状モデルを構築し,各クラスの平均形状のみを保持するとともに,いくつかのキーモードの変動も保持する。
我々は、ModelNet40、ShapeNet、ScanNetデータセットに関する広範な実験を通じて、我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:12:33 GMT)
A Comparative Study of Hybrid Models in Health Misinformation Text Classification [0.4] 本研究では、オンラインソーシャルネットワーク(OSN)上での新型コロナウイルス関連誤情報検出における機械学習(ML)モデルとディープラーニング(DL)モデルの有効性を評価する。
本研究は, 従来のMLアルゴリズムよりも, DLおよびハイブリッドDLモデルの方が, OSN上の新型コロナウイルスの誤情報を検出するのに有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:43:37 GMT)
Agnostic Tomography of Stabilizer Product States [0.4] クラス $mathcalC$ of $n$-qubit 安定化器状態に対する効率的な非依存トモグラフィーアルゴリズムを提案する。
我々は少なくとも$mathcalC$の任意の状態と近似する状態の簡潔な記述を出力する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 06:05:48 GMT)
A Data-Centric Framework for Machine Listening Projects: Addressing Large-Scale Data Acquisition and Labeling through Active Learning [0.4] クラウドソーシングよりも専門家ラベルを用いたアクティブラーニング(AL)の重要性を強調した。
ALは、人間のラベルとAIモデルを組み合わせて、人間のレビューのためのサンプルをインテリジェントに選択することで、ラベル付け予算を最適化する反復的なプロセスである。
このフレームワークは、小さなチームで5ヶ月にわたって6540の10秒のオーディオサンプルをラベル付けした。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:52:50 GMT)
Discrete Time Crystal Sensing [0.4] 前熱離散時間結晶(PDTCs)は、長距離秩序によって特徴づけられる物質の非平衡状態である。
PDTCは量子技術への応用を約束している。
時間変化(AC)磁界に対する周波数選択型量子センサを開発した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:21:04 GMT)
Embedding derivatives and derivative Area operators of Hardy spaces into Lebesgue spaces [0.4] 我々はハーディ空間$Hp$からルベーグ空間$Lq(mu)$への埋め込み微分のコンパクト性を特徴づける。
また、微分領域作用素の有界性とコンパクト性を$Hp$から$Lq(mathbbS_n)$,$0p,qinfty$に完全に特徴づける。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 04:02:06 GMT)
Using Crank-Nikolson Scheme to Solve the Korteweg-de Vries (KdV) Equation [0.4] KdV方程式の正確な解法は、物理学や工学の応用における波動力学の理解に不可欠である。
このプロジェクトは、安定性と精度で知られている有限差分法であるCrank-Nicolsonスキームの実装に焦点を当てている。
その結果、クランク・ニコソン法は、従来の明示的手法よりも精度が向上したKdV方程式を解くための堅牢なアプローチを提供することを示した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:54:20 GMT)
Optimizing the Training Schedule of Multilingual NMT using Reinforcement Learning [0.3] マルチ言語NMTのトレーニングスケジュールを最適化するために強化学習を利用する2つのアルゴリズムを提案する。
LRLとHRLを用いた8対1の翻訳データセットでは,単言語バッチのランダム選択と多言語バッチのシャッフルの両方に関して,BLEUとCOMETのスコアが向上する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:20:13 GMT)
Extracting Finite State Machines from Transformers [0.3] 機械的解釈可能性の観点から正規言語で訓練された変圧器の訓練可能性について検討する。
有限個の記号が状態を決定するとき, 変圧器の訓練性に対して, より強い下界を経験的に見出す。
機械的な洞察により、1層トランスフォーマーが優れた長さの一般化で学習できる正規言語を特徴付けることができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:43:50 GMT)
The Cyber Alliance Game: How Alliances Influence Cyber-Warfare [0.3] 我々は、国家間のサイバー紛争に対する同盟の影響を理解することを目的とした、単純なサイバーアライアンスゲームについて研究する。
具体的には、新たに発見された脆弱性を個別に活用するか、あるいはアライアンスと共有するかという決定に重点を置いています。
第2に,アライアンスの内部電力構造がサイバー戦争の結果に与える影響について検討し,ディクテーター,ヴェト,ダミー選手の期待する振る舞いを推測する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:09:33 GMT)
A column generation algorithm with dynamic constraint aggregation for minimum sum-of-squares clustering [0.3] 最小2乗クラスタリング問題(MSSC)は、$n$のデータポイントを$k$クラスタに分割する問題を指す。
カラム生成(CG)と動的制約集約(DCA)を組み合わせた大規模MSSCインスタンスの効率的な解法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:51:28 GMT)
Large Language Models are Zero-Shot Recognizers for Activities of Daily Living [0.3] LLMに基づく新しいADL認識システムであるADL-LLMを提案する。
ADL-LLMは、生センサデータをLLMによって処理されたテキスト表現に変換し、ゼロショットADL認識を行う。
ADL-LLMを2つの公開データセット上で評価し,その有効性を示した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 13:31:09 GMT)
Quantum spatial search with multiple excitations [0.3] 我々は、$n$スピンの$k$-励起部分空間における連続時間量子ウォークが、時間$O(sqrtn)$の忠実さでマークされた$k$のバイナリ文字列を決定することができることを示した。
数値的には、このアルゴリズムは1/ralpha$で崩壊し、$r$はスピン間距離、$alpha$は現在のイオントラップシステムで容易に利用可能である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:53:57 GMT)
Towards an Operational Responsible AI Framework for Learning Analytics in Higher Education [0.3] 我々は、大手IT企業を含む11の責任あるAIフレームワークを、高等教育におけるLAの文脈にマップする。
この結果、透明性、公平性、説明責任といった7つの重要な原則が特定された。
我々は,HE機関に実践的な指導を提供する新しい枠組みを提案し,コミュニティインプットによって発展するように設計されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:55:24 GMT)
Is Pontryagin's Maximum Principle all you need? Solving optimal control problems with PMP-inspired neural networks [0.3] 変分計算は最適な制御と推論を学ぶための堅牢なフレームワークを提供する。
このフレームワークは、制御と推論の課題を解決するために、ニューラルネットワークの設計にどのように活用できるのか?
本稿では,PMP-net(Pongryagin's Maximum Principle Neural Network)を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:21:35 GMT)
Deep learning-based fault identification in condition monitoring [0.3] 振動に基づく条件モニタリング技術は、転がり要素軸受の欠陥を特定するために一般的に用いられる。
故障検出手順の精度と速度は, 条件モニタリングにおける重要な性能指標である。
転がり要素軸受におけるリアルタイム故障同定のための畳み込みニューラルネットワーク(CNN)を用いた手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:31:13 GMT)
Predicting Battery Capacity Fade Using Probabilistic Machine Learning Models With and Without Pre-Trained Priors [0.2] リチウムイオン電池は、モバイルエレクトロニクス、電気自動車、再生可能エネルギーストレージに革命をもたらす重要なエネルギー貯蔵技術である。
キャパシティ保持は、これらの電池が寿命の終わりに近づいたかどうかを評価するために頻繁に使用される重要なパフォーマンス指標である。
機械学習(ML)は、過去のデータに基づいてキャパシティ劣化を予測する強力なツールを提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:23:11 GMT)
Decoding Decoded: Understanding Hyperparameter Effects in Open-Ended Text Generation [0.2] 大規模言語モデル(LLM)の復号戦略は、テキスト生成タスクの重要な側面であるが、しばしば未探索の側面である。
オープンエンドテキスト生成において,ハイパーパラメータ選択がテキスト品質に与える影響を,大規模かつ包括的に分析する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:51:03 GMT)
Public Quantum Network: The First Node [0.1] このネットワークにより、一般市民は光子の測定を行うことができる。
2023年11月にローンチされて以来、400以上の公開対話がシステムに記録されている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:04:05 GMT)
Weighted Embeddings for Low-Dimensional Graph Representation [0.1] グラフを重み付き空間に埋め込むことを提案し、これは双曲幾何学と密接に関連しているが数学的には単純である。
重み付き埋め込みは、より少ない次元を使いながら、異質グラフに対する最先端のユークリッド埋め込みを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:41:03 GMT)
GlucoBench: Curated List of Continuous Glucose Monitoring Datasets with Prediction Benchmarks [0.1] 連続血糖モニター (Continuous glucose monitors, CGM) は、血糖値を一定間隔で測定する小さな医療機器である。
CGMデータに基づくグルコーストラジェクトリの予測は、糖尿病管理を大幅に改善する可能性を秘めている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:01:09 GMT)
Neuropsychology of AI: Relationship Between Activation Proximity and Categorical Proximity Within Neural Categories of Synthetic Cognition [0.1] 本研究は,認知心理学における新たな研究対象として,合成ニューラルコグニションに焦点を当てた。
目標は、言語モデルのニューラルネットワークをより説明しやすくすることだ。
このアプローチは、認知心理学から人工神経認知の解釈的構築への概念の変換を含む。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:34:13 GMT)
A large collection of bioinformatics question-query pairs over federated knowledge graphs: methodology and applications [0.1] 本稿では,生物情報学の知識グラフを用いた人文自然言語質問とそれに対応するSPARQLクエリについて紹介する。
既存の標準に基づいて,サンプルを最小限のメタデータで一様に表現する手法を提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:08:07 GMT)
Automated quality assessment using appearance-based simulations and hippocampus segmentation on low-field paediatric brain MR images [0.1] 1) 自動品質保証と2) 海馬のセグメンテーションの2つの課題について検討し, 複数のアプローチを比較した。
自動品質保証タスクでは、DenseNetと外観ベースの変換を組み合わせることで、82.3%の重み付け精度で最高のパフォーマンスを実現した。
以上の結果から, 画像は大規模病理と大規模解剖学的発達の理解を提供することができるが, より粒度の細かい解析には依然として障壁が残っていることが示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:07:30 GMT)
blockLAW: Blockchain Technology for Legal Automation and Workflow -- Cyber Ethics and Cybersecurity Platforms [0.0] 本研究は,ブロックチェーン技術が,法的自動化,サイバーセキュリティ,倫理的懸念に対するその影響を調査するために,BlockLAWの形で適用可能であるかを検討する。
この研究は、最近の進展を調査し、ブロックチェーンが法的構造に与える影響を評価し、法的手続きを強化し、法体系における透明性を保証する可能性の展望を提供する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:44:27 GMT)
Why business adoption of quantum and AI technology must be ethical [0.0] 人工知能(AI)は最近'iPhoneの瞬間'を持ち、採用が大幅に加速した。
量子コンピューティングは、今後数年にわたって追随する可能性がある。
この記事では、なぜ量子コンピューティングとAI倫理がビジネスパーソンによって真剣に取られる必要があるのかを強調します。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:42:11 GMT)
Vortex bound states in dimerized $π$-flux optical lattices: characterization, state preparation and current measurement [0.0] 2つのボソンの渦束状態は、適度な相互作用のために均一な$pi$-fluxで貫かれた二量体正方格子に現れることを示す。
フラックスデチューニングにより誘導されるキラリティ変化減衰チャネルを含む,それらの特性を特徴付ける。
我々は, 断熱シーケンスや最近のインプリンティング手法を用いて, 光学格子の状態調整を行うプロトコルを開発した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:45:44 GMT)
Validation of the Scientific Literature via Chemputation Augmented by Large Language Models [0.0] 化学計算は、普遍的な記号言語を用いて実験を行うための化学ロボットをプログラミングするプロセスである。
大規模言語モデル(LLM)は、自然言語処理、ロボット制御、最近では化学など、様々な分野において顕著な能力を発揮している。
本稿では,合成文芸手順の自動検証を目的としたLCMベースの化学研究エージェントワークフローを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:31:42 GMT)
Utilizing Lyapunov Exponents in designing deep neural networks [0.0] 本研究では、Lyapunov指数が大規模深層ニューラルネットワークのトレーニングを加速できるかどうかを検討する。
その結果,学習速度の変動がモデル重みのカオス的変化を引き起こすことが示唆された。
より負のリャプノフ指数を持つ活性化関数はより良い収束特性を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:36:06 GMT)
Unidirectional Key Update in Updatable Encryption, Revisited [0.0] 誤り鍵カプセル化を用いたFrodoPKE学習に基づく,効率的なアップダスタブル暗号方式を構築する。
提案手法の安全性を,ランダ-イン-eu-cpaモデル内の後方リーク一方向設定で解析する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:26:09 GMT)
Unidirectional Key Update in Updatable Encryption, Revisited [0.0] 誤り鍵カプセル化を用いたFrodoPKE学習に基づく,効率的なアップダスタブル暗号方式を構築する。
提案手法の安全性を,ランダ-イン-eu-cpaモデル内の後方リーク一方向設定で解析する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:26:09 GMT)
Understanding with toy surrogate models in machine learning [0.0] 不透明な機械学習モデル(ML)を理解するために用いられる単純な代理モデルの中には、科学的な玩具モデルに類似しているものもある。
本稿では,このような単純なモデルの助けを借りて,不透明なMLモデルを世界規模で理解することの意味について述べる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:22:28 GMT)
Uncertainty-Aware Fairness-Adaptive Classification Trees [0.0] 本稿では,木構築プロセスに公平性調整を組み込んだ新しい分割基準を用いた新しい分類木アルゴリズムを提案する。
本手法は,従来の分類木に比べて識別予測を効果的に削減し,全体的な精度を損なわないことを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:42:12 GMT)
Tropical Expressivity of Neural Networks [0.0] 熱帯の幾何学を用いて、ニューラルネットワークの様々なアーキテクチャ的側面を特徴づけ、研究する。
線形領域の正確な数を計算するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 20:58:46 GMT)
TriplePlay: Enhancing Federated Learning with CLIP for Non-IID Data and Resource Efficiency [0.0] TriplePlayはCLIPをアダプタとして統合し、さまざまなデータ分散に対するFLの適応性とパフォーマンスを向上させるフレームワークである。
シミュレーションの結果,TriplePlayはGPU使用コストを効果的に削減し,学習プロセスの高速化を実現し,通信オーバーヘッドの低減を図っている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:54:27 GMT)
Towards smaller, faster decoder-only transformers: Architectural variants and their implications [0.0] 本稿では,デコーダのみのトランスアーキテクチャであるParallelGPT,LinearGPT,ConvGPTの3つの改良点を紹介する。
これらのバリエーションは、言語生成における従来のアーキテクチャと同等のパフォーマンスを示すが、モデルのサイズを縮小し、より高速なトレーニングプロセスの恩恵を受ける。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:20:56 GMT)
Towards robust detection of entangled two-photon absorption [0.0] 絡み合った2光子吸収(ETPA)効果の証拠は、特に低流束において非常に議論されている。
ここでは, 有機および無機クロロフォアの室温におけるETPAの証拠として, 絡み合った光子対の空間的相互相関を構造化する。
本研究は,ETPAの検証に向けてのステップを示し,光-物質相互作用を実験的に検討した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 16:58:47 GMT)
Towards Robust Federated Image Classification: An Empirical Study of Weight Selection Strategies in Manufacturing [0.0] 本研究は, 最終エポッチウェイト選択 (FEWS) と最適エポッチウェイト選択 (OEWS) の2つのウェイト選択戦略の比較効果について検討した。
EfficientNet、ResNet、VGGなど、さまざまなニューラルネットワークアーキテクチャを使用して、これらの重み選択戦略がモデル収束性と堅牢性に与える影響を評価する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:51:00 GMT)
The impact of microwave phase noise on diamond quantum sensing [0.0] マイクロ波(MW)位相雑音がNVセンサの応答に及ぼす影響について検討した。
複数の商用MW発電機の位相ノイズが有効pT s1/2範囲のノイズフロアとなることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 00:53:52 GMT)
TIMBA: Time series Imputation with Bi-directional Mamba Blocks and Diffusion models [0.0] 時間指向変換器を状態空間モデル(SSM)に置き換えることを提案する。
我々は、拡張表現を実現するために、SSM、グラフニューラルネットワーク、ノード指向変換器を統合するモデルを開発する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:10:06 GMT)
Stress Detection on Code-Mixed Texts in Dravidian Languages using Machine Learning [0.0] ストレスは日常生活において一般的な感覚であるが、いくつかの状況では精神的健康に影響することがある。
本研究では,ドラビディアン言語用コード混合テキストにおけるストレス識別のための方法論的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:49:31 GMT)
Statistics of topological defects across a phase transition in a superconducting quantum processor [0.0] 1次元横場量子イジングモデルにおけるkink密度のカウント統計について検討する。
我々は20量子ビットの量子処理ユニットを実演し、これは高次累積が普遍的な電力法スケーリングに従うことを妨害する。
また,有限サイズ系に対する短絡に対するKZM機構の分解について述べる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:00:01 GMT)
Spin-orbit coupled mean-field Bose gas at finite temperature [0.0] スピン軌道結合型ボースガスと反発平均場-粒子間相互作用を考察する。
我々は, 温度$T>0$, 化学ポテンシャル, 粒子間相互作用, スピン軌道相互作用結合の相図を解析した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:52:51 GMT)
Song Emotion Classification of Lyrics with Out-of-Domain Data under Label Scarcity [0.0] 歌詞に基づく感情分類のための,大規模で高品質なドメインデータセットが不足している。
大規模なRedditコメントデータセットに基づいてトレーニングされたCNNモデルは、歌詞の感情分類に満足なパフォーマンスと一般化性を実現する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:58:15 GMT)
Solving quantum impurity problems on the L-shaped Kadanoff-Baym contour [0.0] 我々は、最近開発されたグラスマン時間進化行列積作用素(GTEMPO)法を拡張し、カダノフ・バイム輪郭に直接量子不純物問題を解く。
この手法の精度は、非相互作用の場合の正確な解と、実時間および虚時間軸上の既存の計算に対して数値的に証明される。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 02:41:13 GMT)
Solving Multi-Goal Robotic Tasks with Decision Transformer [0.0] ロボット工学におけるオフラインマルチゴール強化学習のための決定変換器アーキテクチャの新しい適応法を提案する。
われわれのアプローチでは、ゴール固有の情報を意思決定変換器に統合し、オフライン環境で複雑なタスクを処理できる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:35:30 GMT)
SMART: A Flexible Approach to Regression using Spline-Based Multivariate Adaptive Regression Trees [0.0] 決定木は予測モデリングには強力だが、連続的な関係をモデル化する場合、しばしば高いばらつきに悩まされる。
我々は、決定木を用いて、異なる連続関係を持つデータのサブセットを識別するSpline-based Multivariate Adaptive Regression Trees (MARS)を紹介する。
MARSの高次項を扱うネイティブな能力により、ツリーは関係における不連続性のみに焦点を絞ることができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 01:18:08 GMT)
Road Graph Generator: Mapping roads at construction sites from GPS data [0.0] 本稿では,GPS軌道から地図構築地点への道路推定手法を提案する。
この課題は, 建設機械の非標準運動パターンが不安定であることから, 独特な課題である。
提案手法はまず,重要な決定点として機能する道路網の交差点を識別し,エッジと接続してグラフを生成する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 18:36:43 GMT)
Research Directions for Verifiable Crypto-Physically Secure TEEs [0.0] Web3アプリケーションは、ハードウェアベースのTEEの信頼できる保護者として機能するために、クラウドのインフラに依存する必要があります。
この研究は、物理的な攻撃に対してセキュアなチップを設計して実装する方法を模索することを目的としています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:22:37 GMT)
Research Directions for Verifiable Crypto-Physically Secure TEEs [0.0] Web3アプリケーションは、ハードウェアベースのTEEの信頼できる保護者として機能するために、クラウドのインフラに依存する必要があります。
この研究は、物理的な攻撃に対してセキュアなチップを設計して実装する方法を模索することを目的としています。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:22:37 GMT)
Quasiclassical theory of out-of-time-ordered correlators [0.0] Out-of-time correlator (OTOC) はカオスの有用な指標を提供するオブザーバブルを表す。
本稿では, 半古典的ファン・ヴレック=グッツウィルプロパゲータから得られるOTOCの準古典形式について述べる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:11:49 GMT)
Quantum-information methods for quantum gravity laboratory-based tests [0.0] 実験室における量子重力実験の設計に応用された情報理論手法の初期段階の分野について概説する。
主に、2つの量子プローブ間の重力絡みの検出に焦点をあて、この手法を単プローブ方式と比較する。
重力における量子効果探索における一般情報理論の原理の役割も強調する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 19:51:10 GMT)
Quantum-Inspired Portfolio Optimization In The QUBO Framework [0.0] 異なる資産クラスにまたがる投資の多様化によるリスクを最小化しつつ、投資ポートフォリオのリターンを最大化することを目的としたポートフォリオ最適化を検討するために、量子インスパイアされた最適化手法が提案されている。
この研究は、資産配分とポートフォリオ管理のための強力なツールとしての可能性を示す、金融における量子インスパイアされた技術に関する文献の増大に寄与する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:36:43 GMT)
Quantum entanglement enables single-shot trajectory sensing for weakly interacting particles [0.0] 完全軌跡識別に要する粒子-量子相互作用強度$theta$を劇的に低減できることを示す。
また,センサ量子ビット上で$theta$が連続的に変化する現実的なシナリオにおいて,絡み合いにより軌道知覚が向上することを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 18:38:50 GMT)
Quantum algorithms for scientific computing [0.0] ハイパフォーマンスコンピューティングに最も影響を与えるであろう分野には、量子システムのシミュレーション、最適化、機械学習などがある。
現代の古典的技術に対する控えめな量子増強でさえ、気象予報、航空宇宙工学、持続可能な開発のための「グリーン」材料の設計といった分野において、はるかに大きな影響を及ぼすであろう。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:14:55 GMT)
Quantum State Designs with Clifford Enhanced Matrix Product States [0.0] 非安定化性(英: Nonstabilizerness)は、量子状態の非自明な複雑さを特徴づける臨界量子資源である。
Clifford enhanced Matrix Product States(mathcalC$MPS)は、任意の精度で4ドルの球面設計を近似できることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:37:40 GMT)
Optimizing AI Reasoning: A Hamiltonian Dynamics Approach to Multi-Hop Question Answering [0.0] 埋め込み空間における推論連鎖をハミルトニアン系にマッピングする新しい枠組みを提案する。
このフレームワークを用いて,マルチホップ質問応答タスクから推論チェーンの大規模データセットを解析する。
有効な推論チェーンはハミルトンのエネルギーを減らし、より多くの情報を取得して正しい質問に答える最良のトレードオフを作る方法を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:51:36 GMT)
Optimizing AI Reasoning: A Hamiltonian Dynamics Approach to Multi-Hop Question Answering [0.0] 埋め込み空間における推論連鎖をハミルトニアン系にマッピングする新しい枠組みを提案する。
このフレームワークを用いて,マルチホップ質問応答タスクから推論チェーンの大規模データセットを解析する。
有効な推論チェーンはハミルトンのエネルギーを減らし、より多くの情報を取得して正しい質問に答える最良のトレードオフを作る方法を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:51:36 GMT)
Navigating Inflation in Ghana: How Can Machine Learning Enhance Economic Stability and Growth Strategies [0.0] 本研究では,ガーナにおけるインフレーションの理解と管理における機械学習(ML)の重要性について検討する。
この研究は、2010年から2022年までの包括的なデータセットを活用し、将来のインフレ傾向を予測するために高度なMLモデルを採用することを目的としている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:26:50 GMT)
N-qubit universal quantum logic with a photonic qudit and O(N) linear optics elements [0.0] 情報の高次元量子単位(qudits)は、単一の自由度で複数の量子ビット情報を運ぶことができる。
1つの時間ビンキューディットに符号化されたN量子状態は任意に、決定的に生成され、操作され、測定されることを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 20:14:35 GMT)
Multifold Majorana corner modes arising from multiple pairs of helical edge states [0.0] マヨラナコーナーモードは、量子スピンホール絶縁体のヘリカルエッジ状態に由来する。
磁気交換場の複合作用によりヘリカルエッジ状態がギャップ化されている場合、ロバストな2次元Majoranaコーナーモードを実現することができる。
磁場の作用下での角あたりの2つのマヨラナゼロモードの安定性は、キラル対称性からの保護に起因する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:24:10 GMT)
Multi-task Photonic Reservoir Computing: Wavelength Division Multiplexing for Parallel Computing with a Silicon Microring Resonator [0.0] 単一フォトニックチップで4つの独立したタスクを同時に解くために、時間と波長分割多重化(WDM)を用いることを数値的に示す。
システムのフットプリントは、研究されたニューラルネットワークスキームのニューロンとして機能するノードの時間分割多重化を用いて削減される。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:08:49 GMT)
Modular Quantum-to-Quantum Bernoulli Factory in an Integrated Photonic Processor [0.0] 量子力学はランダムネスの生成と操作にいくつかの利点をもたらす。
ベルヌーイ工場(Bernoulli factory)は、ベルヌーイのランダムなプロセスのバイアスを制御方法で変更できるプロトコルである。
量子の場合へのこのモデルの最近の拡張は、より広範なランダム性操作関数を実装する可能性を示した。
量子状態を入力および出力とするベルヌーイファクトリ方式をフォトニックパス符号化手法を用いて提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:06:25 GMT)
Mero Nagarikta: Advanced Nepali Citizenship Data Extractor with Deep Learning-Powered Text Detection and OCR [0.0] そこで本研究では,テキストオブジェクトの正確な検出にYOLOv8を用いるロバストシステムと,最適化されたPyTesseractに基づくOCRアルゴリズムを提案する。
モバイルアプリケーションのコンテキスト内で実装されたこのシステムは、重要なテキスト情報の自動抽出を可能にする。
ネパール文字に最適化されたPyTesseractは、柔軟性と精度に関して標準のOCRよりも優れていた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:29:08 GMT)
MelissaDL x Breed: Towards Data-Efficient On-line Supervised Training of Multi-parametric Surrogates with Active Learning [0.0] オンライン・サロゲート・トレーニングにおけるデータ効率を向上させるための新しいアクティブ・ラーニング手法を提案する。
シュロゲートは、初期条件と境界条件の異なるパラメータで、与えられた時間ステップを直接予測するように訓練される。
2次元熱PDEの予備的な結果は、この方法、ブリード (Breed) の可能性を示し、サロゲートの一般化能力を向上させる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:52:15 GMT)
Maximal work extraction unitarily from an unknown quantum state: Ergotropy estimation via feedback experiments [0.0] エルゴトロピーを推定するためのフィードバックベースアルゴリズム(FQErgo)を提案し,実験的に実証する。
FQErgoは、特定の期待値によって強度が反復的に調整されたドライブフィールドを適用し、単一のプローブキュービットを使用して都合よく読み取る。
ランダムな初期状態におけるFQErgoの数値解析により、受動的状態の生成とエルゴトロピーの推定に成功したことを確認する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:32:27 GMT)
KPNDepth: Depth Estimation of Lane Images under Complex Rainy Environment [0.0] 本稿では,降雨環境下でのレーン深度推定のための新しい2層畳み込みカーネル予測ネットワークを提案する。
2組のカーネルを予測し、深さ損失と雨天のアーティファクトを緩和する。
実験は、複雑な雨条件下でのフレームワークの有効性を示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 11:39:18 GMT)
Intrinsic nonlinear Hall effect in two-dimensional honeycomb topological antiferromagnets [0.0] 本研究では,ハニカムトポロジカル反強磁性体を$mathcalPT$-symmetric antiferromagnetic Kane-Meleモデルで効果的に記述する。
化学的ポテンシャルを変化させることで、フェルミ面がリフシッツ転移するときに非線形ホール伝導率テンソルがキンクを示すことが分かる。
本研究は, 2次元ハニカムトポロジカル反強磁性体が, 固有非線形ホール効果の研究に有用であることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 07:55:21 GMT)
Integrated photonic structures for photon-mediated entanglement of trapped ions [0.0] イオンを放出した光子を収集するイオントラップでモノリシックに作製した構造を解析した。
集積フォトニクスは、光子を介する絡み合いを通じて量子情報を分散できる、トラップイオンのスケーラブルなシステムをサポートすることができると結論付けている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 10:53:27 GMT)
Injectivity of ReLU-layers: Perspectives from Frame Theory [0.0] インジェクティビティ(英: Injectivity)とは、情報を失うことなく、その出力から任意の入力を再構成できるマッピングの定義特性である。
本稿では,この問題にアプローチするためのフレーム理論的視点を確立する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:26:01 GMT)
Improving Embedding Accuracy for Document Retrieval Using Entity Relationship Maps and Model-Aware Contrastive Sampling [0.0] APEX-Embedding-7Bは、7ビリオンパラメータデコーダのみのテキスト特徴抽出モデルである。
このアプローチでは2つのトレーニング手法を採用して,現実の焦点を即時的に改善する。
本モデルでは,より長いコンテキスト文書検索タスクに対して,テキスト特徴抽出における最先端の標準を新たに確立する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 17:36:48 GMT)
Improving Disease Comorbidity Prediction Based on Human Interactome with Biologically Supervised Graph Embedding [0.0] 合併症は、疾患の理解と管理に重大な影響を及ぼす。
人間の相互作用は、大きな不完全グラフとして、共生予測に有用な特徴を抽出する上で、独自の課題を提示している。
BSE (Biologically Supervised Graph Embedding) では、最も関連性の高い特徴を選択して、合併症のペアの予測精度を高めることができる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 03:52:12 GMT)
Improved deep learning of chaotic dynamical systems with multistep penalty losses [0.0] カオスシステムの長期的な振る舞いを予測することは、依然として恐ろしい課題である。
本稿では,最近提案された多段階ペナルティ演算子を活用することで,これらの課題に対処する新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 00:13:57 GMT)
Identification of malfunctioning quantum devices [0.0] 我々は、そのような機器のネットワークの一部を構成する誤動作量子デバイスを正しく識別する問題を考察する。
同定に最適な確率は、大域的な量子測定を必要とすることを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:01:51 GMT)
Identification and estimation for matrix time series CP-factor models [0.0] 行列時系列CP因子モデルの同定と推定について検討する。
一般化された固有解析に基づくChange et al. (2023)とは異なり、新たに提案された推定法はランク不足因子負荷行列を扱える。
推定の誤差率の観点からは、提案された手順は、$p 倍 q$ ではなく、次元 $max(p,q)$ のベクトル時系列を扱うものと等価である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:32:36 GMT)
Generalised Quantum Gates for Qudits and their Application in Quantum Fourier Transform [0.0] 任意のレベル$d$に対して普遍的に適用可能な、クディットゲートの新規な定式化を提案する。
量子ゲートの数学的枠組みを任意の次元に拡張することにより、任意の大きさの量子ビット上の量子計算の普遍的な集合を形成する明示的なゲート演算を導出する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:54:22 GMT)
Generalised Quantum Gates for Qudits and their Application in Quantum Fourier Transform [0.0] 任意のレベル$d$に対して普遍的に適用可能な、クディットゲートの新規な定式化を提案する。
量子ゲートの数学的枠組みを任意の次元に拡張することにより、任意の大きさの量子ビット上の量子計算の普遍的な集合を形成する明示的なゲート演算を導出する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:54:22 GMT)
Gate-based quantum annealing without digitization errors [0.0] 従来のトロッタライズ手法に対して,本手法のスケーリングの利点を数値的に示す。
この方法の適用には、非知性$XX$-相互作用、バイアス$Z$-フィールド、および反断熱性$Y$-フィールド触媒の組み合わせが含まれる。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:11:17 GMT)
Future frame prediction in chest cine MR imaging using the PCA respiratory motion model and dynamically trained recurrent neural networks [0.0] 肺放射線治療システムは、推定腫瘍位置の不確実性や健康な組織の高照射を引き起こす遅延を受ける。
この研究は、オンライン学習アルゴリズムで訓練されたRNNを用いて、胸部ダイナミックMRIシーケンスの将来のフレーム予測に対処し、その遅延を補償する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:21:43 GMT)
Formation and Controlling of Optical Hopfions in High Harmonic Generation [0.0] トロイダル渦(英: Toroidal vortex)は、フォトニックトポロジーや量子情報に潜在する、新しくてエキゾチックな構造を持つ光である。
本研究では,高次トロイダル渦の一種である独特の構造を持つ高調波スペクトルの空間分布を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 13:33:29 GMT)
Fermionic Gaussian Testing and Non-Gaussian Measures via Convolution [0.0] 我々はフェルミオンの畳み込みを定義し、フェルミオン非ガウス成分の特徴付けにおけるその有用性を実証する。
また、フェルミオン非ガウス性を測定する実験的にアクセス可能な資源尺度である「ノンガウスエントロピー」も導入する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:58:44 GMT)
Farmer.Chat: Scaling AI-Powered Agricultural Services for Smallholder Farmers [0.0] 小規模と中規模の農業所有者は、地域化、タイムリーな情報へのアクセス制限、生産性と持続可能性への影響といった課題に直面している。
従来の拡張サービスは、個人エージェントに依存しており、スケーラビリティとタイムリーなデリバリに苦労しています。
私たちは、これらの問題に対処するために設計された、AIを使った生成型チャットボットであるFarmerChatを紹介します。
FarmerChatは4カ国で展開され、1万5000以上の農家と関わり、30万件以上の問い合わせに答えている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 06:03:41 GMT)
Faraday-Ramsey rotation measurement in a thin cell as an analogy to an atomic beam [0.0] 本研究は、原子ビームの簡易な類似として、薄膜中の熱蒸気を探索する。
非平行原子をフィルタリングすることにより、原子ビームの挙動を模倣し、ファラデー・ラムゼー効果を観測する。
我々は、薄膜技術が原子ビームベースのセンサーの小型化の道を歩んでいると信じている。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:14:25 GMT)
FLASC: A Flare-Sensitive Clustering Algorithm [0.0] 本稿では,クラスタ内の分岐を検知してサブポピュレーションを同定するアルゴリズムFLASCを提案する。
アルゴリズムの2つの変種が提示され、ノイズの堅牢性に対する計算コストが取引される。
両変種は計算コストの観点からHDBSCAN*と類似してスケールし,安定した出力を提供することを示す。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:40:29 GMT)
Extended convexity and smoothness and their applications in deep learning [0.0] 本稿では,非完全に理解された勾配と強い凸性に対する$mathcal$H$smoothnessアルゴリズムを提案する。
提案手法の有効性を実験により検証した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:40:07 GMT)
Explicit Quantum Circuit for Simulating the Advection-Diffusion-Reaction Dynamics [0.0] 対数非線形性を持つ対流拡散反応方程式のカールマン線形化の収束性を評価する。
この線形化に基づく量子アルゴリズムの実現可能性を評価するため、カルマンADR行列のパウリ基底への投影を解析した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 10:06:16 GMT)
Evaluating the Dependency Between Cyclomatic Complexity and Response For Class [0.0] 私たちは1,000のGitHubリポジトリから862,517のJavaクラスを分析しました。
以上の結果から, 累積的マッケイブ循環複雑度 (CC) とメソッド数との間には, ピアソンの相関関係が強いことが示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 23:00:48 GMT)
Evaluating Performance and Bias of Negative Sampling in Large-Scale Sequential Recommendation Models [0.0] 大規模産業レコメンデーションモデルは、数百万から数十億のオプションを含むカタログから最も関連性の高いアイテムを予測する。
これらのモデルを効率的に訓練するために、関連する項目ごとに巨大なカタログから無関係な項目(負のサンプル)の小さなセットが選択される。
本稿では、現代の逐次レコメンデーションモデルにおいて、様々なネガティブサンプリング手法の実装と比較により、この問題に対処する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 00:23:17 GMT)
Entangled quantum trajectories in relativistic systems [0.0] 克服すべき重要な課題は、異なる慣性フレームにおける2つ以上の量子粒子間の絡み合いを考えることである。
非絡み合いの振る舞いの制約の下で、オイラー-ラグランジュ方程式のクラスを導出する。
Klein-Gordon-typeセッティングにおける粒子の相互作用に関する方程式を解くことにより、絡み合いの動的および相対論的影響を定量化する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 12:49:44 GMT)
Embracing Objects Over Statics: An Analysis of Method Preferences in Open Source Java Frameworks [0.0] この研究では、YourKitプロファイラを使用して、28のオープンソースJavaフレームワークのランタイム動作を精査する。
予測とは対照的に,静的メソッドに対するインスタンスメソッドやコンストラクタの利用が圧倒的に多いことが判明した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 02:30:20 GMT)
Effective models for quantum optics with multilayer open cavities [0.0] 本研究では, 外部をシステムの一部として扱う新しい手法を用いて, 開放空洞の力学について検討する。
特に, キャビティミラーの多層構造がもたらす影響から, キャビティ・リザーバ・システムの記述は, ミラーの構造が無視されているものと異なる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 21:23:28 GMT)
E3STO: Orbital Inspired SE(3)-Equivariant Molecular Representation for Electron Density Prediction [0.0] Slater-Type Orbitals (STO) からインスピレーションを得た新しいSE(3)-equivariantアーキテクチャを提案する。
我々のアプローチは、学習された軌道のような分子表現に代替的な機能形式を提供する。
分子電子密度のSOTA予測精度を他の分子動力学データよりも30~70%向上させることにより,本手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 15:20:33 GMT)
Digital Labor and the Inconspicuous Production of Artificial Intelligence [0.0] デジタルプラットフォームは、しばしばカジュアルな活動や消費として欠かせない貢献をしている。
AI開発において重要な役割を担っているにもかかわらず、こうしたタスクは認識されず、過小評価され続けている。
この章は、デジタル経済におけるこれらの活動の体系的非評価を明らかにする。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:07:42 GMT)
Different Cybercrimes and their Solution for Common People [0.0] 本稿では,サイバー犯罪の動向を考察し,脆弱性を緩和するためにサイバー犯罪意識(サイバーウェアネス)の必要性を強調した。
我々は,「一般人」が技術的に意識していない可能性を考慮して,31の技術的および非技術的ソリューションのリストを提示する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:23:11 GMT)
Deriving the Landauer Principle From the Quantum Shannon Entropy [0.0] ノイズのある熱環境に接触した量子状態の平衡確率分布の式を導出する。
量子ビットを消去またはリセットするために必要な自由エネルギーは、対象状態の忠実度と環境の物理的性質の両方に敏感に依存することを示す。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 07:01:37 GMT)
DCAST: Diverse Class-Aware Self-Training Mitigates Selection Bias for Fairer Learning [0.0] 敏感な特徴に代表されないバイアスは 識別が困難で 診断されないのが普通です
未確認バイアスを緩和し、緩和方法を評価するための戦略は不可欠であるが、未調査のままである。
本稿では,クラス固有の偏見を意識したモデル非依存的緩和手法であるDiverse Class-Aware Self-Training (DCAST)を紹介した。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:39:52 GMT)
Coupled resonators based on high permittivity dielectrics for microwave sensors [0.0] 超伝導共振器と高誘電率共振器を結合した共振器の構成について報告する。
このような構成の感度は、強い結合状態と弱い結合状態の両方において議論される。
これらの結果はマイクロ波センサとして結合共振器システムの可能性を強調し、低温での応用のための高誘電率共振器の工学に有用である。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 08:57:40 GMT)
Convolutional neural networks applied to modification of images [0.0] 線形代数と電卓を使ってデジタル画像を編集する方法を学ぶ。
畳み込みニューラルネットワークのような機械学習技術へのフィルターの概念から始める。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 04:40:16 GMT)
Conformal confidence sets for biomedical image segmentation [0.0] ブラックボックス機械学習モデルの出力に対して空間的不確実性を保証する信頼セットを開発する。
これらの信頼セットがモデルの新しい予測に適用されると、真の未知のセグメント化マスクを所望の確率で含むことが保証される。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:26:09 GMT)
Conformal confidence sets for biomedical image segmentation [0.0] ブラックボックス機械学習モデルの出力に対して空間的不確実性を保証する信頼セットを開発する。
これらの信頼セットがモデルの新しい予測に適用されると、真の未知のセグメント化マスクを所望の確率で含むことが保証される。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:26:09 GMT)
Comparing Multiclass Classification Algorithms for Financial Distress Prediction [0.0] 本研究は、企業における財政難の予測と、多クラス分類の幅広い適用に焦点を当てたものである。
私たちはKaggleのベンチマークデータセットを使ってフレームワークを作成しました。
画像認識、自然言語処理、バイオインフォマティクスなど、様々な分野で使用されている。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 15:16:51 GMT)
Can metacognition predict your success in solving problems? An exploratory case study in programming [0.0] 本研究では,メタ認知の予測可能性について検討した。
メタ認知的認知とメタ認知的行動からなる2次元モデルが提案されている。
オブジェクト指向プログラミングにおけるメタ認知と性能の関連性を検討するために,潜在的アプローチを用いた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 18:06:55 GMT)
Bounding conditional entropy of bipartite states with Bell operators [0.0] CVNEとベル不等式違反との関連について検討した。
ベルの不等式とCVNEのギャップを埋めることにより、我々の研究は絡み合った系の量子的性質の理解を深める。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:48:15 GMT)
Bounding conditional entropy of bipartite states with Bell operators [0.0] CVNEとベル不等式違反との関連について検討した。
ベルの不等式とCVNEのギャップを埋めることにより、我々の研究は絡み合った系の量子的性質の理解を深める。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:48:15 GMT)
Bottom-up Anytime Discovery of Generalised Multimodal Graph Patterns for Knowledge Graphs [0.0] 本稿では,知識グラフにおける一般化マルチモーダルグラフパターンのボトムアップ発見のためのアルゴリズムを提案する。
発見されると、パターンはSPARQLクエリに変換され、インタラクティブなファセットブラウザで表示される。
我々は,人文科学分野の専門家の助けを借りて,ユーザの視点から評価を行った。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:07:27 GMT)
BlockMEDC: Blockchain Smart Contracts for Securing Moroccan Higher Education Digital Certificates [0.0] 本稿では,モロッコの教育デジタル証明書の保護と管理を行うブロックチェーンベースのシステムであるBlockMEDCを紹介する。
提案システムは、文書の信頼性、手動検証、相互運用性の欠如、セキュアで透明で費用対効果の高いソリューションの提供など、重要な問題に対処する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:41:37 GMT)
Bell vs Bell: a ding-dong battle over quantum incompleteness [0.0] ジョン・ベルは量子力学が局所的に隠された変数と相容れないという最初のデモンストレーションを行った。
本稿では, 簡単な例と厳密な結果を通じて, 議論に明瞭さをもたらすことを目的とする。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 19:38:26 GMT)
Automated Quality Control System for Canned Tuna Production using Artificial Vision [0.0] 本稿では, 人工視覚を用いたマグロ金属缶の欠陥検出と分類のための自動制御システムの実装について述べる。
このシステムは、コンベアベルトとカメラを使用して、光電センサによって起動される視覚認識を行う。
YOLOv5モデルは、金属缶の蓋の欠陥や簡単な開環の位置を検出するために用いられる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 00:11:24 GMT)
Asking an AI for salary negotiation advice is a matter of concern: Controlled experimental perturbation of ChatGPT for protected and non-protected group discrimination on a contextual task with no clear ground truth answers [0.0] 実験によるChatGPTの4種類のバイアス監査を行った。
我々は、各バージョンに98,800通のプロンプトを提出し、従業員の性別、大学、専攻を体系的に変更した。
マルチモデルプラットフォームとしてのChatGPTは、そのようなタスクに対して信頼できるほど堅牢で一貫したものではない。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:46:25 GMT)
Asking an AI for salary negotiation advice is a matter of concern: Controlled experimental perturbation of ChatGPT for protected and non-protected group discrimination on a contextual task with no clear ground truth answers [0.0] 実験によるChatGPTの4種類のバイアス監査を行った。
我々は、各バージョンに98,800通のプロンプトを提出し、従業員の性別、大学、専攻を体系的に変更した。
マルチモデルプラットフォームとしてのChatGPTは、そのようなタスクに対して信頼できるほど堅牢で一貫したものではない。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 14:46:25 GMT)
Application of NotebookLM, a Large Language Model with Retrieval-Augmented Generation, for Lung Cancer Staging [0.0] 本研究は,最近リリースされたRAG-LLM(NotebookLM)の有用性と信頼性について検討した。
NotebookLMは肺がんのステージング実験において86%の診断精度を達成し、GPT-4oを39%の精度で上回った。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:42:42 GMT)
Anticoncentration and state design of random tensor networks [0.0] 結合次元がシステムサイズとスケールする量子ランダムテンソルネットワーク状態($N$)について検討する。
結合次元 $chi sim gamma N$ に対して、関連する重なり合う確率分布の先頭順序を決定し、ポーター・トーマス分布への収束を示す。
我々は、ランダムなプロジェクト・エンタングル・ペアステート(PEPS)を用いた二次元システムにこの分析を拡張します。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:14:55 GMT)
Anticoncentration and state design of random tensor networks [0.0] 結合次元がシステムサイズとスケールする量子ランダムテンソルネットワーク状態($N$)について検討する。
結合次元 $chi sim gamma N$ に対して、関連する重なり合う確率分布の先頭順序を決定し、ポーター・トーマス分布への収束を示す。
我々は、ランダムなプロジェクト・エンタングル・ペアステート(PEPS)を用いた二次元システムにこの分析を拡張します。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 11:14:55 GMT)
An error-mitigated photonic quantum circuit Born machine [0.0] 生成機械学習モデルは、新しいサンプルを生成するために、データの基盤となる分布を学習することを目的としている。
量子回路ボーンマシン(QCBM)は、浅い回路上で実装可能な量子生成モデルの一般的な選択である。
本稿では,光子損失を伴う現実的なシナリオにおけるQCBMのトレーニングを大幅に改善する,リサイクル緩和と呼ばれる新しいエラー軽減手法について述べる。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 16:05:46 GMT)
An Innovative Solution: AI-Based Digital Screen-Integrated Tables for Educational Settings [0.0] デジタル画面統合テーブルは、特に教育的な設定のために設計されている。
中央処理ユニット(CPU)で制御される統合デジタルスクリーンを備えたテーブル
本発明は、教室活動及び評価中の学生成績データの収集を容易にする。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 08:00:17 GMT)
An Efficient TLS 1.3 Handshake Protocol with VC Certificate Type [0.0] 本稿では,トランスポート層セキュリティ(TLS)ハンドシェイクプロトコルの設計と実装について述べる。
RFC-8446への完全準拠を維持しつつ、TLS 1.3のセキュリティ機能をすべて保持しながら、検証認証(VC)の使用を可能にする。
その結果、大規模モノのインターネット(IoT)システムにおける自己主権のアイデンティティの採用の道が開かれた。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 09:08:20 GMT)
Active Inference Tree Search in Large POMDPs [0.0] POMDPsにおける新しい計画手法--Active Inference Tree Search (AcT)について紹介する。
AcTは、神経科学(Active Inference)における主要な計画理論の規範的性格と生物学的リアリズムと、AIにおける木探索法のスケーラビリティを組み合わせたものである。
シミュレーションの結果、AcTはサンプリングベース手法に挑戦する二分木、適応探索を必要とする問題、そしてAcTが最先端のPOMDPソリューションを再現する大規模POMDP問題「RockSample」をうまくナビゲートしていることがわかった。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 09:34:01 GMT)
A Timeline and Analysis for Representation Plasticity in Large Language Models [0.0] 本稿では, 異なる微調整段階において抽出したステアリングを応用することにより, 「正直」 と モデル塑性がいかに進化するかを理解することを目的とする。
初期のステアリングは高い塑性を示すが、後期は驚くほど反応のよい臨界窓を持つ。
これらの洞察は、AI透明性の分野に大きく貢献し、効率の急激な欠如に対処し、モデルの振る舞いを効果的に操る能力を制限する。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 17:34:15 GMT)
A Deep Learning Approach to Estimate Canopy Height and Uncertainty by Integrating Seasonal Optical, SAR and Limited GEDI LiDAR Data over Northern Forests [0.0] 本研究では,空間連続高分解能キャノピー高さと不確実性推定を生成する手法を提案する。
我々は、Sentinel-1、Landsat、ALOS-PALSAR-2のマルチソース・マルチシーズン衛星データと、GEDI LiDARを基準データとして統合する。
夏のみのデータの代わりに季節データを使用することで、変動率が10%向上し、エラーが0.45m減少し、バイアスが1m低下した。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 20:27:11 GMT)
A Case Study of Next Portfolio Prediction for Mutual Funds [0.0] この作業は、Next Novel Basket Recommendation (NNBR)タスクとして、相互資金ポートフォリオの予測を行う。
我々は,公開データを用いたベンチマークデータセットを作成し,NNBRタスク上での様々なレコメンデータシステムモデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 08 Oct 2024 12:49:00 GMT)
(SPT-)LSM theorems from projective non-invertible symmetries [0.0] 射影対称性は量子格子モデルにおいてユビキタスであり、位相図や絡み合い構造を制約するために利用することができる。
本稿では,非可逆対称性と格子変換によって形成される射影代数の結果について検討する。
射影性はまた、$mathsfRep(G)times Z(G)$ sub-symmetriesの後に双対対称性に影響を与える。
論文参考訳(メタデータ) (Tue, 8 Oct 2024 22:27:43 GMT)