OpenAI o1 System Card [274.8] o1モデルシリーズは、思考の連鎖を用いて推論するために大規模な強化学習で訓練されている。
本報告では,OpenAI o1およびOpenAI o1-miniモデルに対して実施される安全作業の概要について述べる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:04:31 GMT)
Combating Multimodal LLM Hallucination via Bottom-Up Holistic Reasoning [151.4] マルチモーダル大規模言語モデル(MLLM)は、視覚言語タスクを前進させる前例のない能力を示した。
本稿では,MLLMにおける幻覚に対処するためのボトムアップ推論フレームワークを提案する。
本フレームワークは、認識レベル情報と認知レベルコモンセンス知識を検証・統合することにより、視覚とテキストの両方の入力における潜在的な問題に体系的に対処する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:26:14 GMT)
Overview of AI and Communication for 6G Network: Fundamentals, Challenges, and Future Research Opportunities [148.6] 人工知能(AI)と第6世代(6G)ネットワークのための通信の統合は、革命的アーキテクチャとして現れつつある。
本稿では,6GネットワークにおけるAIとコミュニケーションの概要を概観し,基本原理,固有の課題,今後の研究機会を強調した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:48:34 GMT)
Magic-Boost: Boost 3D Generation with Mutli-View Conditioned Diffusion [101.2] 本稿では,高忠実度新鮮映像を合成する多視点拡散モデルを提案する。
次に,得られた粗い結果を精査するための厳密なガイダンスを提供するために,新しい反復更新戦略を導入する。
実験の結果、Magic-Boostは粗いインプットを大幅に強化し、リッチな幾何学的およびテクスチュラルな詳細を持つ高品質な3Dアセットを生成する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:53:21 GMT)
DaRec: A Disentangled Alignment Framework for Large Language Model and Recommender System [83.3] 大規模言語モデル (LLM) はレコメンデーションシステムにおいて顕著な性能を示した。
LLMと協調モデルのための新しいプラグ・アンド・プレイアライメントフレームワークを提案する。
我々の手法は既存の最先端アルゴリズムよりも優れている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:59:05 GMT)
Learning for Cross-Layer Resource Allocation in MEC-Aided Cell-Free Networks [71.3] 移動エッジコンピューティング(MEC)を援用したセルフリーネットワーク上でのクロスレイヤリソース割り当ては、データレートを促進するために、送信およびコンピューティングリソースを十分に活用することができる。
深層学習の観点からMEC支援セルフリーネットワークのサブキャリア配置とビームフォーミング最適化について検討した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:18:55 GMT)
GANFusion: Feed-Forward Text-to-3D with Diffusion in GAN Space [64.8] 我々は、単一視点2Dデータのみを用いて、人間の文字に対するフィードフォワードテキストから3D拡散生成器を訓練する。
GANFusionは、単一のビュー2DデータのみをトレーニングしたGANアーキテクチャを使用して、3Dデータの無条件トリプレーン機能を生成することから始まる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:59:17 GMT)
When Can Proxies Improve the Sample Complexity of Preference Learning? [63.7] 我々は,代行報酬の最大化が必ずしも真の報酬を増やすとは限らない,報酬ハッキングの問題に対処する。
プロキシフィードバックに関する十分な条件を概説し、満足すれば、プロキシデータが基底真理ポリシーを学習する際のサンプルの複雑さを確実に改善できることを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:07:17 GMT)
NILE: Internal Consistency Alignment in Large Language Models [59.2] NILE(iNternal consIstency aLignmEnt)フレームワークを導入し、IFTデータセットを最適化してLLMの機能をさらに開放する。
NILE は、訓練済みの LLM の内部知識を命令データに対応付けることで動作する。
実験により,NILE 対応 IFT データセットは複数の能力評価データセットにまたがる LLM 性能を著しく向上することが示された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:25:16 GMT)
REO-VLM: Transforming VLM to Meet Regression Challenges in Earth Observation [58.9] 本稿では,地球観測領域に特有な回帰・生成タスクを統合するために,textbfREO-Instructと呼ばれる新しいベンチマークデータセットを提案する。
我々は,回帰機能を従来の生成関数とシームレスに統合する基盤モデルであるtextbfREO-VLM を開発した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:17:15 GMT)
LLMEmb: Large Language Model Can Be a Good Embedding Generator for Sequential Recommendation [57.5] 大きな言語モデル(LLM)は、その人気とは無関係に、アイテム間の意味的関係をキャプチャする能力を持つ。
LLMEmb(LLMEmb)は、LCMを利用してアイテム埋め込みを生成し、逐次レコメンダシステム(SRS)の性能を向上させる手法である。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:09:16 GMT)
Balls-and-Bins Sampling for DP-SGD [57.0] 本稿では,DP-SGD などのDP最適化手法に対する Balls-and-Bins サンプリングを提案する。
我々は,Balls-and-Binsサンプリングが,Balls-and-Binsサンプリングの実装をShufflingと類似した「ベスト・オブ・ボトム」サンプリングを実現することを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 23:09:14 GMT)
SIGMA: Selective Gated Mamba for Sequential Recommendation [56.9] 最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:35:05 GMT)
Accelerated Methods with Compressed Communications for Distributed Optimization Problems under Data Similarity [55.0] 本稿では,データ類似性の下での非バイアス圧縮とバイアス圧縮を利用した,理論上初めての高速化アルゴリズムを提案する。
我々の結果は、異なる平均損失とデータセットに関する実験によって記録され、確認されています。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:40:58 GMT)
2-Rectifications are Enough for Straight Flows: A Theoretical Insight into Wasserstein Convergence [54.6] 本稿では, 凝固流のサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する最初の理論的解析を行った。
ガウス流から有限の第一モーメントを持つ任意の一般目標分布への整流の場合、直流を達成するのに2つの整流が十分であることを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:12:20 GMT)
COPR: Continual Human Preference Learning via Optimal Policy Regularization [54.5] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデル(LLM)と人間の嗜好の整合性を改善するために一般的に用いられる。
本稿では,最適政策理論からインスピレーションを得たCOPR法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:55:16 GMT)
Mamba-SEUNet: Mamba UNet for Monaural Speech Enhancement [54.4] Mambaは、新しいステートスペースモデル(SSM)として、自然言語処理やコンピュータビジョンに広く応用されている。
本稿では,MambaとU-Net for SEタスクを統合する革新的なアーキテクチャであるMamba-SEUNetを紹介する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:43:51 GMT)
The Master Key Filters Hypothesis: Deep Filters Are General in DS-CNNs [51.9] 畳み込みニューラルネットワーク(CNN)フィルタはより深い層に特化している。
ImageNetで訓練した深度分離可能なCNN(DS-CNN)におけるクラスタリング可能な繰り返しパターンの最近の観察は、この論文を動機づけた。
DS-CNNの解析により,深層フィルタの一般性は維持され,クラス固有のフィルタへの移行が期待されていることに矛盾することが明らかとなった。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:04:23 GMT)
DMesh++: An Efficient Differentiable Mesh for Complex Shapes [51.8] 2次元および3次元に新しい微分可能なメッシュ処理法を導入する。
メッシュ分解能を2次元の局所幾何学に適応させて効率よく表現するアルゴリズムを提案する。
本研究では,2次元ポイントクラウドと3次元マルチビュー再構成タスクにおけるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:16:03 GMT)
Label Privacy in Split Learning for Large Models with Parameter-Efficient Training [51.3] ラベルを非公開にしながら、API上でモデルを微調整する方法を探します。
P$3$EFTは、既存のPEFTプロパティを利用して、より低いパフォーマンスオーバーヘッドでプライバシを維持するマルチパーティ分割学習アルゴリズムである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:32:03 GMT)
Learning Cross-Task Generalities Across Graphs via Task-trees [50.8] 本稿では,タスクツリーを用いたグラフ間の一般性学習手法を提案する。
具体的には、まず、グラフの基本学習インスタンスをタスクツリーとして定義し、グラフ間で共有される一般性は、少なくとも部分的には、与えられたグラフのタスクツリーに保存されていると仮定する。
グラフニューラルネットワーク(GNN)モデルが再構成タスクを通じて多様なタスクツリー上で事前訓練されている場合、下流タスクに対して十分な伝達可能な知識を学習できることがわかった。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:07:43 GMT)
Enhancing Multilingual ASR for Unseen Languages via Language Embedding Modeling [50.6] 最も先進的なASRモデルの1つであるWhisperは99の言語を効果的に扱う。
しかし、ウィスパーは未確認の言語と戦っているが、それらは事前訓練には含まれていない。
本研究では,これらの関係を利用して未知言語上でのASR性能を向上させる手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:05:43 GMT)
Explainable Tampered Text Detection via Multimodal Large Models [49.9] 本稿では,大規模なマルチモーダルモデルを用いて,自然言語による改ざんテキスト検出の基礎を説明する。
本稿では,テキスト領域の改ざんを示す画素レベルのアノテーションを含む大規模かつ包括的なデータセットETTDを提案する。
我々はまた,GPT4oに改ざんされたテキストを認識し,OCRの精度が低い応答をフィルタリングすることを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:53:10 GMT)
Attention Entropy is a Key Factor: An Analysis of Parallel Context Encoding with Full-attention-based Pre-trained Language Models [49.8] 大規模言語モデルは、コンテキストモデリングにおける例外的な能力のため、幅広い言語タスクで顕著なパフォーマンスを示している。
最も一般的なコンテキストモデリングの方法は、標準的なデコーダのみのトランスフォーマーに見られるように、完全な自己アテンションである。
本稿では,コンテキストをサブピースに分割して並列に符号化する並列コンテキスト符号化を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:04:51 GMT)
TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion Models [49.7] 拡散モデル(TCAQ-DM)のためのタイムステップ・チャネル適応量子化法を提案する。
提案手法は,ほとんどの場合,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:57:54 GMT)
Diffusion Prior Interpolation for Flexibility Real-World Face Super-Resolution [48.3] 拡散事前補間(DPI)は、一貫性と多様性のバランスをとることができ、事前訓練されたモデルにシームレスに統合することができる。
合成および実データに対して行われた広範な実験において、DPIはSOTA FSR法よりも優れていることを示した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:28:44 GMT)
VAST 1.0: A Unified Framework for Controllable and Consistent Video Generation [48.3] VAST(Video As Storyboard from Text)は、テキスト記述から高品質なビデオを生成するためのフレームワークである。
映像生成からテキスト理解を分離することにより、VASTは主題のダイナミクスやシーン構成を正確に制御できる。
VBenchベンチマークの実験では、VASTは視覚的品質とセマンティック表現の両方において、既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:59:07 GMT)
VSFormer: Value and Shape-Aware Transformer with Prior-Enhanced Self-Attention for Multivariate Time Series Classification [47.9] 識別パターン(形状)と数値情報(値)の両方を組み込んだVSFormerを提案する。
さらに、教師付き情報から派生したクラス固有の事前情報を抽出し、位置エンコーディングを強化する。
30のUEAアーカイブデータセットに対する大規模な実験は、SOTAモデルと比較して、我々の手法の優れた性能を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:31:22 GMT)
IV-tuning: Parameter-Efficient Transfer Learning for Infrared-Visible Tasks [47.1] セマンティックセグメンテーションやオブジェクト検出などの赤外線可視(IR-VIS)タスクは、赤外線と可視モードを組み合わせることで大きな恩恵を受ける。
Vision Foundation Models (VFM) の一般的な表現を継承するために、タスク固有のデュアルブランチネットワークが設計され、下流のデータセットで完全に微調整される。
パラメータ効率のよいVFMを多種多様な赤外可視下流タスクに活用するための,新しい,汎用的な微調整手法"IV-tuning"を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:54:41 GMT)
Revisiting Machine Unlearning with Dimensional Alignment [46.3] そこで本研究では,未知の固有空間間のアライメントを計測し,データセットの保持を行う,機械学習のための新しい評価基準を提案する。
筆者らの枠組みは, 忘れ物から情報を効果的に排除し, 保持物から知識を保存している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:38:40 GMT)
Towards More Robust Retrieval-Augmented Generation: Evaluating RAG Under Adversarial Poisoning Attacks [45.1] Retrieval-Augmented Generation (RAG) システムは幻覚を緩和するための有望な解決策として登場した。
RAGシステムは、検索データベースに注入された悪意のあるパスが、モデルを誤誘導し、事実的に誤ったアウトプットを発生させるような、敵の毒殺攻撃に弱い。
本稿では,RAGシステムの検索と生成の両要素について検討し,攻撃に対するロバスト性を高める方法について考察する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:31:52 GMT)
DrivingForward: Feed-forward 3D Gaussian Splatting for Driving Scene Reconstruction from Flexible Surround-view Input [45.0] フレキシブル・サラウンド・ビュー・インプットから運転シーンを再構成するフィードフォワードガウス・スプレイティング・モデルを提案する。
我々は、ポーズネットワーク、ディープネットワーク、およびガウスネットワークを共同でトレーニングし、運転シーンを表すプリミティブを予測する。
提案モデルでは,既存のフィードフォワードやシーン最適化の手法よりも再現性が高い。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:32:24 GMT)
Learning to Manipulate under Limited Information [45.0] 私たちは、26サイズの10,000以上のニューラルネットワークをトレーニングし、8つの異なる投票方法に対処しました。
ボルダなど一部の投票手法は限られた情報を持つネットワークで高度に操作可能であるのに対して、Instant Runoffのような投票手法はそうではない。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:27:55 GMT)
OmniSplat: Taming Feed-Forward 3D Gaussian Splatting for Omnidirectional Images with Editable Capabilities [44.3] OmniSplatは、全方位画像から高速なフィードフォワード3DGS生成のための先駆的な研究である。
我々は、視線画像に基づいて訓練された既存のフィードフォワードネットワークよりも高い再構成精度を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:33:08 GMT)
Correcting Large Language Model Behavior via Influence Function [44.1] 人間の好みのダイナミックな性質は、以前のトレーニングデータを時代遅れにしたり、あるいは誤ったものにしたりすることができる。
影響関数のリコールとポストトレーニングによる大規模言語モデル行動補正(LANCET)を提案する。
LANCETは、(1)好ましくないモデル出力に大きな影響を与えるトレーニングデータを特定するためにインフルエンス関数を使用し、(2)モデル動作を調整するためにインフルエンス関数駆動型ブレグマン最適化(IBO)技術を適用する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:50:08 GMT)
HeadStudio: Text to Animatable Head Avatars with 3D Gaussian Splatting [44.0] HeadStudioはテキストプロンプトからリアルでアニマタブルなアバターを生成するフレームワークである。
アバターは1024fpsの解像度で高品質のリアルタイムビューをレンダリングできる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:30:18 GMT)
HyperCLIP: Adapting Vision-Language models with Hypernetworks [43.2] 我々は、ハイパーネットワークと共に小さな画像エンコーダを使用する、HyperCLIPと呼ばれる視覚言語アーキテクチャを提案する。
モデルの3つのコンポーネント(ハイパーネットワーク、イメージエンコーダ、テキストエンコーダ)はすべて、共同でエンドツーエンドでトレーニングされている。
HyperCLIPは、小さなイメージエンコーダを持つSigLIPトレーニングモデルのゼロショット精度をImageNetで最大3%、CIFAR-100で5%向上し、トレーニングスループットのオーバーヘッドを最小限に抑える。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:19:08 GMT)
Generalizable Articulated Object Perception with Superpoints [42.5] そこで我々は,3次元物体の3次元点雲における部分分割を改善するために,新しいスーパーポイント・ベースの知覚手法を提案する。
本稿では,その幾何学的および意味的類似性に基づいて,効率よくポイントをグループ化する,学習可能な部分認識スーパーポイント生成手法を提案する。
GAPartNetデータセットを用いた実験結果から,提案手法はクロスカテゴリ部分分割における既存の最先端手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:57:24 GMT)
LLaVA-SLT: Visual Language Tuning for Sign Language Translation [42.2] 近年の手話翻訳(SLT)の進歩は将来性を示しているが、精度の面ではグロスベースのアプローチに大きく遅れていることが多い。
我々はLLaVA-SLTというLarge Multimodal Model (LMM) フレームワークを紹介した。
LLaVA-SLTは最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:01:08 GMT)
Absolute dimensionality of quantum ensembles [41.9] 量子状態の次元は、伝統的に与えられた基底において重畳される区別可能な状態の数と見なされる。
量子状態のアンサンブルに対する絶対的、すなわち基底に依存しない次元の概念を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:31:57 GMT)
Leveraging Hierarchical Taxonomies in Prompt-based Continual Learning [41.1] 深層学習モデルの学習において,情報の整理・接続という人間の習慣を適用することが効果的な戦略として有効であることがわかった。
本稿では,モデルがより挑戦的な知識領域に集中するように促す新たな正規化損失関数を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:52:51 GMT)
Too Many Frames, Not All Useful: Efficient Strategies for Long-Form Video QA [40.5] 広い時間間隔にまたがるロングフォームビデオは、非常に冗長な情報である。
正しい応答を生成するために必要な全ての情報は、しばしばフレームの小さなサブセットに含まれる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:14:39 GMT)
Domain-specific Question Answering with Hybrid Search [39.9] 本研究では,細調整された高密度検索器とキーワードベーススパース検索を併用したハイブリッド手法により,性能が著しく向上することを示す。
実験結果から, このハイブリッド方式は, シングルレトリバーシステムより優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:28:23 GMT)
Context-Aware Outlier Rejection for Robust Multi-View 3D Tracking of Similar Small Birds in An Outdoor Aviary [39.4] 本稿では,マルチカメラシステムを用いた屋外飛行場における複数の鳥のロバストな3次元追跡手法を提案する。
特徴マッチングと3次元再構成に環境ランドマークを活用することで,視覚的に類似した鳥とその迅速な動きの課題に対処する。
また、4つの囲いに居住する80羽の鳥の大規模な注釈付きデータセットを20時間の映像で提供し、コンピュータビジョン、鳥類学者、生態学者に豊富なテストベッドを提供しています。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:20:57 GMT)
Automated Progressive Red Teaming [38.7] 手動のレッドチーム化は時間がかかり、コストがかかり、スケーラビリティが欠如しています。
我々は,効果的に学習可能なフレームワークとして,APRT(Automated Progressive Red Teaming)を提案する。
APRTは3つのコアモジュールを活用している: 多様な初期攻撃サンプルを生成するインテンション拡張LDM、敵のプロンプトを製作するインテンションハイディングLDM、そして、迅速な多様性と非効率なサンプルのフィルタリングを管理するEvil Makerである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:24:01 GMT)
PGD-Imp: Rethinking and Unleashing Potential of Classic PGD with Dual Strategies for Imperceptible Adversarial Attacks [37.0] 知覚不能な敵対的攻撃は、最近研究の関心を惹きつけている。
本研究は、PGD(共通攻撃と古典攻撃)の可能性を解き放つための、単純かつ効果的な2つの戦略を提案する。
提案したPGD-Imp攻撃は,非目標シナリオと目標シナリオの両方に対して,認識不能な敵攻撃を実現する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:55:43 GMT)
$C^2$: Scalable Auto-Feedback for LLM-based Chart Generation [36.9] 参照不要な自動フィードバックジェネレータを導入し,人的介入のコストを削減した。
最初の実験では、回答者の74%が強く好んでおり、10%がフィードバック後の結果を好んだ。
ChartUIE-8Kは、クエリ、データセット、チャートタイプを増やすことで、データの多様性を大幅に改善する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:09:29 GMT)
Chain-of-Scrutiny: Detecting Backdoor Attacks for Large Language Models [35.8] 大規模言語モデル(LLM)は、攻撃者が設定した特定の「トリガー」を含む入力が悪意ある出力を生成する。
従来の防衛戦略は、モデルアクセスの制限、高い計算コスト、データ要求のため、APIアクセス可能なLLMでは実用的ではない。
バックドア攻撃を緩和するために,LLMのユニークな推論能力を活用するChain-of-Scrutiny (CoS)を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:06:50 GMT)
UNEM: UNrolled Generalized EM for Transductive Few-Shot Learning [35.6] 我々は「最適化学習」とも呼ばれるアンロールパラダイムを提唱し紹介する。
我々のアンローリングアプローチは、様々な統計的特徴分布と事前学習パラダイムをカバーしている。
本稿では,下流画像分類作業の細粒度を網羅した包括的実験について報告する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:01:57 GMT)
The Road to Artificial SuperIntelligence: A Comprehensive Survey of Superalignment [33.3] 大規模言語モデル(LLMs)の出現は、人工超知能(ASI)の可能性を引き起こしている。
Superalignmentは2つの主要な目標 – 高品質なガイダンスシグナルを提供するための監視のスケーラビリティと、人間の価値との整合性を確保するための堅牢なガバナンス – に対処することを目指している。
具体的には、ASIの概念、それらがもたらす課題、そしてスーパーアライメント問題に対処する際の現在のアライメントパラダイムの限界について検討する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:51:04 GMT)
Diffusion Actor-Critic with Entropy Regulator [32.8] エントロピーレギュレータ(DACER)を用いたオンラインRLアルゴリズムについて提案する。
このアルゴリズムは拡散モデルの逆過程を新しい政策関数として概念化する。
MuJoCoベンチマークとマルチモーダルタスクの実験は、DACERアルゴリズムが最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:23:41 GMT)
Sharp Results for Hypothesis Testing with Risk-Sensitive Agents [32.4] 本研究では,統計学者(プリンシパルとしても知られる)がデータを生成する戦略エージェントと相互作用する仮説テストのゲーム理論バージョンについて検討する。
統計学者は、制御されたエラーを伴うテストプロトコルを設計し、データ生成エージェントは、ユーティリティと事前情報によってガイドされ、オプトインするかどうかを選択する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:51:56 GMT)
LUCES-MV: A Multi-View Dataset for Near-Field Point Light Source Photometric Stereo [31.5] 近距離光源光度ステレオ用に設計された,世界初の実世界のマルチビューデータセットLUCES-MVを提案する。
私たちのデータセットには、15個のオブジェクトが含まれており、それぞれが、カメラセンターから30から40cmの位置にある15個のLEDの配列から、様々な光条件下で撮影された。
我々は、現状の近接場測光ステレオアルゴリズムを評価し、その強度と、異なる材料と形状の複雑さの制限を強調した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:58:16 GMT)
HammerBench: Fine-Grained Function-Calling Evaluation in Real Mobile Device Scenarios [31.4] HammerBenchは、大規模な言語モデル(LLM)の関数呼び出し能力を人間とLLMの相互作用においてより効果的に評価するために設計されたベンチマークフレームワークである。
我々は,不完全な指示,多様な質問・回答の軌跡,意図/議論のシフト,代名詞による外部個人情報の利用など,モバイルデバイス上でのさまざまな現実的なユーザシナリオをモデル化する。
会話を関数呼び出しスナップショットに分解し、各ターンのきめ細かい評価を可能にする。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:33:55 GMT)
Revisiting MLLMs: An In-Depth Analysis of Image Classification Abilities [31.3] 本稿では、画像分類の詳細な分析により、MLLM(Multimodal Large Language Models)を徹底的に再検討する。
この結果から,最新のMLLMは,複数のデータセット上でCLIPスタイルの視覚言語モデルに適合し,さらに優れることがわかった。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:46:56 GMT)
Guaranteed Nonconvex Factorization Approach for Tensor Train Recovery [30.9] 因子化アプローチに対する最初の収束保証を提供する。
いわゆる左直交TTフォーマットを最適化する。
我々はRGDが線形速度で基底真理を確実に回復できることを証明した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:55:32 GMT)
Follow-Your-MultiPose: Tuning-Free Multi-Character Text-to-Video Generation via Pose Guidance [29.8] 分離されたテキストをベースとした新しいマルチキャラクタ・ビデオ生成フレームワークを提案する。
具体的には、まずポーズシーケンスから文字マスクを抽出し、各生成文字の空間的位置を識別し、各文字の単一プロンプトをLLMで取得する。
ビデオ生成結果の可視化により,本手法の精度の高いマルチキャラクタ生成の可能性を示した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:49:40 GMT)
Hand1000: Generating Realistic Hands from Text with Only 1,000 Images [29.6] 本論文では,目標ジェスチャーによる現実的な手動画像の生成を可能にするHand1000という新しい手法を提案する。
Hand1000の訓練は3つの段階に分けられ、第1段階はモデルによる手解剖学の理解を高めることを目的としている。
テキスト・ツー・ハンド画像生成に特化して設計された最初の公開データセットを構築した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:42:38 GMT)
Enhancing Contrastive Learning Inspired by the Philosophy of "The Blind Men and the Elephant" [29.2] コントラスト学習において、挑戦的な正のペアを生成するために、JointCropとJointBlurを導入する。
プラグイン・アンド・プレイのフレームワークとして、JointCropとJointBlurは、SimCLR、BYOL、MoCo v1、MoCo v2、MoCo v3、SimSiam、Dinoのベースラインのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:50:59 GMT)
AttributionScanner: A Visual Analytics System for Model Validation with Metadata-Free Slice Finding [29.1] データスライス検索は、低パフォーマンスを示すデータセット内のサブグループを特定し解析することで、機械学習(ML)モデルを検証するための新興技術である。
このアプローチは、追加メタデータに対する退屈でコストのかかる要件を含む、重大な課題に直面します。
本稿では,メタデータを含まないデータスライス検索用に設計された,革新的なビジュアルアナリティクス(VA)システムであるAttributionScannerを紹介する。
本システムでは、一般的なモデル動作を含む解釈可能なデータスライスを特定し、属性モザイク設計によりこれらのパターンを可視化する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:55:59 GMT)
Complementary Advantages: Exploiting Cross-Field Frequency Correlation for NIR-Assisted Image Denoising [27.5] 我々は、NIR支援画像復調のためのクロスフィールド周波数相関爆発ネットワーク(FCENet)を開発した。
まず,NIR-RGB画像対の詳細な統計周波数解析に基づいて,周波数相関について検討する。
次に、周波数動的選択機構(FDSM)と周波数強制融合機構(FEFM)からなる周波数学習フレームワークを確立する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:31:36 GMT)
RoomPainter: View-Integrated Diffusion for Consistent Indoor Scene Texturing [27.5] RoomPainterは効率性と一貫性を統合し、高忠実な屋内シーンを実現する。
室内環境のテクスチャ合成において,RoomPainterが優れた性能を発揮することを示す実験を行った。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:22:01 GMT)
Adapting Whisper for Code-Switching through Encoding Refining and Language-Aware Decoding [27.5] コードスイッチング自動音声認識(ASR)はアクセント、聴覚的類似性、シームレスな言語スイッチによる言語混乱による課題に直面している。
我々は,大規模多言語事前学習音声認識モデルであるWhisperを,エンコーダ部とデコーダ部の両方からCSに適応させる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:06:44 GMT)
Physics-Guided Fair Graph Sampling for Water Temperature Prediction in River Networks [27.3] 本研究は,流水温度を予測するグラフニューラルネットワーク(GNN)に基づく新しい手法を提案する。
これは、収入と教育レベルの異なる場所におけるモデルバイアスを減らすのに役立つ。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:57:30 GMT)
Transducer-Llama: Integrating LLMs into Streamable Transducer-based Speech Recognition [26.8] 本稿では,大規模言語モデル(LLM)をFactized Transducer(FT)モデルに統合する新しいモデルアーキテクチャであるTransducer-Llamaを提案する。
提案されたストリーミングTransducer-Llamaアプローチは、強いFTベースラインに17%の相対的なWER削減(WERR)、RNN-Tベースラインに32%のWERRを与えた。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:35:49 GMT)
Positive2Negative: Breaking the Information-Lossy Barrier in Self-Supervised Single Image Denoising [26.7] 既存の自己監督型イメージデノイングパラダイムは、情報ロッキーな操作に大きく依存している。
本稿では,情報ロジイ障壁を壊すために,自己監督型単一画像認識パラダイムであるPositive2Negativeを提案する。
本パラダイムは,自己監督型単一画像における最先端性能を実現し,大幅な速度向上を実現している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:25:01 GMT)
Sensing Surface Patches in Volume Rendering for Inferring Signed Distance Functions [26.4] 多くの3Dコンピュータビジョンタスクにおいて、多視点RGB画像から3D幾何学を復元することが不可欠である。
ボリュームレンダリングにより,より優れた表面感覚で符号付き距離関数を推論する手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:49:29 GMT)
Query Quantized Neural SLAM [25.7] 本稿では,入力の変動を減らし,フレームのオーバーフィットを容易かつ高速に行うためのクエリ量子化ニューラルネットワークSLAMを提案する。
広範に使用されているベンチマークの視覚的および数値的な比較を報告し、再構成とカメラトラッキングの両方における最新の手法よりも優位性を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:08:18 GMT)
Forget Vectors at Play: Universal Input Perturbations Driving Machine Unlearning in Image Classification [25.7] マシン・アンラーニング(MU)は、既に訓練されたモデルから不要な特定のデータの影響を消そうとする。
本研究では,新しい入力ベースの観点からMU問題にアプローチする。
我々は,能動的入力に基づく非学習戦略の存在を実演する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:27:22 GMT)
A Temporal Graph Network Framework for Dynamic Recommendation [25.6] 時間グラフネットワーク(TGN)は、時間とともにノードとエッジが動的に変化する状況を大幅に改善する。
本研究は,推薦システムにTGNを直接実装することで,このギャップを埋めるものである。
実世界のデータセットと、さまざまなグラフと履歴の埋め込み手法を用いて、TGNの適応性を示し、動的レコメンデーションシナリオにおけるその有効性を確認する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:42:36 GMT)
Interact with me: Joint Egocentric Forecasting of Intent to Interact, Attitude and Social Actions [25.5] SocialEgoNetはグラフベースのフレームワークで、階層的な学習アプローチを通じてタスク依存を利用する。
SocialEgoNetは、高い推論速度のためにビデオ入力のわずか1秒から抽出されたボディスケルトン(顔、手、体からキーポイント)を使用する。
評価のために、新しいクラスラベルとバウンディングボックスアノテーションとの既存のエゴセントリックなヒューマンエージェントインタラクションを強化する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:54:28 GMT)
Gradient-based Trajectory Optimization with Parallelized Differentiable Traffic Simulation [25.0] インテリジェントドライバモデル(IDM)に基づく並列化微分可能交通シミュレータを提案する。
我々のシミュレーターは車両の動きを効率的にモデル化し、実世界のデータに合うように教師できる軌道を生成する。
このシミュレータを用いて、入力軌跡の雑音をフィルタリングし(軌道フィルタリング)、スパース軌跡から高密度軌跡を再構成し(軌道再構成)、将来の軌跡を予測する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:53:38 GMT)
More RLHF, More Trust? On The Impact of Preference Alignment On Trustworthiness [24.8] 本研究では,5つの信頼性分野において,汎用的嗜好データに整合したモデルがどのように機能するかを検討する。
ヒトの嗜好に対するRLHFは、自動的に信頼性を保証せず、しばしば逆効果が観察される。
本稿では,RLHF設定に効率的な影響関数に基づくデータ帰属手法を適用し,個々の信頼性ベンチマークに対する微調整データの影響をよりよく理解するために提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 22:56:04 GMT)
Learn2Mix: Training Neural Networks Using Adaptive Data Integration [24.1] learn2mixは、バッチ内のクラス比率を適応的に調整する新しいトレーニング戦略で、エラー率の高いクラスに重点を置いている。
経験的評価では、Learner2mixでトレーニングされたニューラルネットワークは、古典的なアプローチでトレーニングされたニューラルネットワークよりも早く収束している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:40:07 GMT)
MOL-Mamba: Enhancing Molecular Representation with Structural & Electronic Insights [23.6] MOL-Mambaは構造的および電子的洞察を組み合わせることで分子表現を強化するフレームワークである。
MOL-Mambaは11の化学生物学的分子データセットで最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:48:57 GMT)
Formal Language Knowledge Corpus for Retrieval Augmented Generation [23.4] 本研究では、数学的な証明を書くためのプログラミング言語であるLeanを用いて、RAGシステムで使用される知識コーパスを収集する。
先進的な論理的推論タスクにおける LLM の性能向上に RAG を使用する様々な手法を探求する基盤を築きたい。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:31:41 GMT)
Towards Environmentally Equitable AI [23.3] 我々は、将来のAIシステムの管理の優先事項として、環境エクイティを提唱する。
我々は、地域によって環境コストをかなり分散させるために、エクイティ対応の地理的負荷分散の可能性を明らかにする。
我々は、AIの環境不平等を緩和するシステム管理アプローチの可能性を最大限活用するための、いくつかの今後の方向性を議論することで締めくくります。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:46:19 GMT)
How Multi-Modal LLMs Reshape Visual Deep Learning Testing? A Comprehensive Study Through the Lens of Image Mutation [23.2] ビジュアルディープラーニング(VDL)システムは、画像認識、オブジェクト検出、自律運転といった現実世界のアプリケーションで大きな成功を収めている。
VDLの信頼性を評価するために、主なアプローチは、画像のセマンティクスよりも多様な突然変異を必要とするソフトウェアテストである。
MLLM(Multi-modal large language model)の急速な開発により、命令駆動方式による画像突然変異の可能性も導入された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:21:27 GMT)
L3TC: Leveraging RWKV for Learned Lossless Low-Complexity Text Compression [23.2] 我々はLearned Lossless Low-complexity Text Compression Method (L3TC)を紹介する。
我々は、RWKVモデルが適度な圧縮比で高速な復号速度を達成することを示す広範な実験を行った。
また、限られた語彙を用いて頻繁なトークンをカバーし、予測やエンコーディングを回避できる外れ値認識型トークン化器を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:24:32 GMT)
SUSTechGAN: Image Generation for Object Detection in Adverse Conditions of Autonomous Driving [23.0] GAN(Generative Adversarial Network)は、自律運転のためのデータ拡張に応用されている。
本稿では,2つの注目モジュール,マルチスケールジェネレータ,新しい損失関数を備えた新しいフレームワーク,SUSTechGANを提案する。
我々は、SUSTechGANとよく知られたGANを用いて、雨と夜の悪天候下で駆動画像を生成し、生成した画像を物体検出ネットワークの再トレーニングに適用する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:21:14 GMT)
Rethinking Model Redundancy for Low-light Image Enhancement [21.9] 低照度画像強調(LLIE)は、照明の改善、ノイズ低減、低照度画像の画質向上を目的とした、計算写真の基本的な課題である。
最近の進歩は、主に複雑なニューラルネットワークモデルのカスタマイズに焦点が当てられているが、これらのモデルには大きな冗長性があり、さらなる性能改善が制限されている。
この再考に触発されて,LLIE性能を改善しながらモデル冗長性を緩和する2つの革新的な手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:17:28 GMT)
Unleashing the Power of Large Language Models in Zero-shot Relation Extraction via Self-Prompting [21.0] 本稿では,大規模言語モデルに組み込まれたRE知識を十分に活用する新しい手法であるSelf-Promptingフレームワークを紹介する。
我々のフレームワークは3段階の多様性アプローチを用いてLSMを誘導し、スクラッチから特定の関係をカプセル化する複数の合成サンプルを生成する。
ベンチマークデータセットを用いた実験により,既存のLCMベースのゼロショットRE法よりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:58:42 GMT)
Chained Tuning Leads to Biased Forgetting [20.2] 下流タスクでトレーニングされたモデルは、反対の順序でトレーニングされたモデルよりもはるかに安全チューニングを忘れていることを示す。
忘れることが特定のグループの安全情報に悪影響を及ぼすことを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:51:58 GMT)
Choice Between Partial Trajectories: Disentangling Goals from Beliefs [19.4] AIエージェントは人間の選択データから好みを学ぶことが示唆されている。
このアプローチでは、エージェントがデータを解釈するために使用できる選択行動のモデルが必要です。
ブートストラップされたリターンに基づく代替モデルを考えると、部分的なリターンが将来のリターンの見積もりを追加する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:42:14 GMT)
Self-guided Knowledgeable Network of Thoughts: Amplifying Reasoning with Large Language Models [19.4] kNoTは、Chain-of-Thought(CoT)、Tree of Thoughts(ToT)、Graph of Thoughts(GoT)といった既存のパラダイムを超えて、大きな言語モデル(LLM)の機能を向上させるプロンプトスキームである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:19:42 GMT)
SqueezeMe: Efficient Gaussian Avatars for VR [19.2] ガウシアン・スプレイティングは、前例のないレベルの視覚的品質を持つリアルタイムの3Dアバターを可能にした。
我々は、複数のガウスアバターをリアルタイムにドライビング可能なバーチャルリアリティーヘッドセットに詰め込むことを目標としている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:13:54 GMT)
From Histopathology Images to Cell Clouds: Learning Slide Representations with Hierarchical Cell Transformer [18.5] 我々は、50億以上のセルレベルのアノテーションを持つ大規模なWSIデータセットを構築し、WSI-Cell5Bと呼ぶ。
我々の知る限りでは、WSI-Cell5Bは、セルレベルのアノテーションを統合する最初のWSIレベルの大規模データセットです。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:57:12 GMT)
Do Multimodal Language Models Really Understand Direction? A Benchmark for Compass Direction Reasoning [18.4] マルチモーダル言語モデル(MLM)の方向性推論能力の評価を目的としたCompass Direction Reasoning (CDR)ベンチマーク
CDRには、空間(上、下、左、右)とコンパス(北、南、東、西)を画像化する3つのタイプが含まれている。
CDRデータによるトレーニングは、現実世界の物理的なルールを理解する必要があるため、限られた改善をもたらす。
コンパス方向推論の性能を大幅に向上させるミックスデータおよびCoT微調整法の影響について検討する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:09:13 GMT)
SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis [18.3] 一般的なリズム運動と稀だが本質的なセマンティックモーションを慎重に統合しなければ、良好な音声合成が達成できない。
本稿では,フレームレベルのセマンティクスを重視した音声合成のためのSemTalkを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:16:07 GMT)
STAMPsy: Towards SpatioTemporal-Aware Mixed-Type Dialogues for Psychological Counseling [18.2] 既存の心理カウンセリング対話システムは主に基本的な共感的対話や、最小限の専門知識を持つQAに基づいており、目標指示がない。
多くの現実世界のカウンセリングにおいて、クライアントは診断、相談療法、コンソール、一般的な質問など、多種多様な支援を求めている。
本稿では、この課題を、カウンセリングを進める前にクライアントが目標を明確にするための、心理カウンセリングのための混合型対話システムを構築する方法として挙げる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:48:02 GMT)
Behavioral Learning of Dish Rinsing and Scrubbing based on Interruptive Direct Teaching Considering Assistance Rate [17.6] 本稿では,食器洗浄のための安全で巧妙な操作システムを提案する。
ロボットは、オブジェクトの状態とロボット自体を推定することにより、オブジェクトの動的モデルを学ぶ。
人的援助の少ない安全な行動を生成することが可能である。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:14:00 GMT)
Augmenting Sequential Recommendation with Balanced Relevance and Diversity [17.5] 本稿では、関連性と多様性のバランスをとるデータを生成するために、BASRec(Balanced Data Augmentation for Sequential Recommendation)を提案する。
BASRecはSingle-Sequence AugmentationとCross-Sequence Augmentationの2つのモジュールで構成されている。
我々は,BASRecが既存の手法よりも妥当性と多様性のバランスのよいデータを生成することを示した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:17:08 GMT)
PB-UAP: Hybrid Universal Adversarial Attack For Image Segmentation [16.3] セグメンテーションモデル用に設計された新しいユニバーサル逆攻撃法を提案する。
提案手法は,最先端の手法よりも高い攻撃成功率を達成し,異なるモデル間で強い伝達性を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:46:01 GMT)
From Pixels to Gigapixels: Bridging Local Inductive Bias and Long-Range Dependencies with Pixel-Mamba [16.2] ギガピクセルWSIを効率的に扱うように設計された新しいディープラーニングアーキテクチャであるPixel-Mambaを紹介する。
Pixel-Mambaは、畳み込みニューラルネットワークに似たトークンを徐々に拡大することで、局所的な誘導バイアスを取り入れている。
実験では、エンドツーエンドのWSI分析のための強力で効率的なフレームワークとして、Pixel-Mambaの有効性を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:45:27 GMT)
Imperceptible Sample-Specific Backdoor to DNN with Denoising Autoencoder [15.4] バックドア攻撃は ディープニューラルネットワークに 新たなセキュリティ脅威をもたらす
そこで本研究では, サンプルからサンプルまで, 見えないものまで, トリガーが変化する非受容型サンプル特異的バックドアを提案する。
我々は、ImageNetとMS-Celeb-1Mに対するバックドア攻撃を広範囲に実験した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:33:21 GMT)
First-frame Supervised Video Polyp Segmentation via Propagative and Semantic Dual-teacher Network [15.2] ビデオポリープセグメンテーションは消化管がんスクリーニングにおいて重要な役割を担っている。
ビデオの長さに関わらず、初めてアノテーションのコストをポリプビデオあたり1フレームに削減しました。
PSDNetはプロパゲーティブな教師とセマンティックな教師の2つの異なるタイプの教師を雇用している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:36:25 GMT)
FAP-CD: Fairness-Driven Age-Friendly Community Planning via Conditional Diffusion Generation [15.1] 条件付き拡散生成(FAP-CD)によるフェアネス駆動型コミュニティプランニングの新しい枠組みを提案する。
本フレームワークは, 拡散過程における高齢者のニーズに応じて, ノイズグラフを反復精製することにより, 最適施設分布を生成する。
複数の指標にまたがる実証的な結果は、年齢に優しいニーズと地域株式のバランスをとる上で、FAP-CDの有効性を示している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:57:09 GMT)
Improving Lip-synchrony in Direct Audio-Visual Speech-to-Speech Translation [15.0] 提案手法は直接音声音声音声合成におけるリップ同期を著しく向上させる。
翻訳品質を損なうことなく、オリジナルビデオにオーバーレイした場合の翻訳音声の自然さと質を維持する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:15:52 GMT)
Fed-ZOE: Communication-Efficient Over-the-Air Federated Learning via Zeroth-Order Estimation [15.0] Fed-ZOEは、ゼロ階最適化(ZOO)で一般的に使用されるランダム化勾配推定器(RGE)にインスパイアされた効率的なフレームワークである。
Fed-ZOEは、通信コストを大幅に削減しながら、Fed-OtAに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:24:58 GMT)
A Meta-Learning Approach to Bayesian Causal Discovery [15.0] ベイズの後部から得られるような因果構造に対する不確実性は、下流のタスクにしばしば必要である。
近年の研究では、メタラーニングを用いて、最大a-posteriori因果グラフを教師あり学習として推定する問題を考察している。
本稿では,後部から因果構造を抽出し,これらの特徴を符号化するベイズメタ学習モデルを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:52:56 GMT)
Scalable Influence and Fact Tracing for Large Language Model Pretraining [14.6] トレーニングデータ属性(TDA)メソッドは、特定のトレーニング例にモデル出力を振り返ることを目的としている。
我々は,既存の勾配法を改良し,大規模に効果的に機能させる。
我々は、インプロンプトセットとモデルアウトプットをWebベースの可視化ツールとともにリリースし、影響力のある例を探索します。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:53:18 GMT)
Leveraging Highly Approximated Multipliers in DNN Inference [14.0] 提案手法は再学習を必要とせず,近似乗算による帰納誤差を著しく低減する。
本手法を使わずに対応する近似設計と比較して,提案手法は平均1.9倍精度を向上する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:09:29 GMT)
Cross-View Consistency Regularisation for Knowledge Distillation [13.9] この研究は、半教師付き学習のような分野におけるクロスビュー学習の成功に触発されている。
標準ロジット蒸留フレームワークにインテリアビューおよびクロスビューレギュラー化を導入する。
また,教師の蒸留信号の品質向上のために,信頼性に基づくソフトラベルマイニングを実施している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:41:47 GMT)
Effective and Efficient Representation Learning for Flight Trajectories [13.1] 我々は、異なる飛行分析タスクが軌道の同じ有用な特徴を共有していると論じる。
Flight2Vecは、これらの課題に対処するためのフライト固有の表現学習手法である。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:59:54 GMT)
SoK: Understanding the Attack Surface in Device Driver Isolation Frameworks [13.0] デバイスドライバの分離は、カーネルを障害や悪意のあるドライバから保護するための有望なアプローチである。
近年,ユーザ空間のコンパートナライズされたアプリケーションにおいて,CIV(Compartment Interface Vulnerabilities)が特定されている。
本稿では,既存のドライバ分離フレームワークの設計とセキュリティ保証に関する包括的調査を行う。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:08:30 GMT)
Large Language Model Can Be a Foundation for Hidden Rationale-Based Retrieval [12.8] 本稿では,隠れ合理性検索という,より困難なタイプの検索タスクを提案し,検討する。
このような問題に対処するためには、命令調整付き大規模言語モデル(LLM)とクロスエンコーダアーキテクチャが妥当な選択である可能性がある。
我々は、RaHoReによってこの検索フレームワークを命名し、感情支援会話(ESC)におけるゼロショットおよび微調整性能上の優位性を検証した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:19:15 GMT)
Mixed geometry information regularization for image multiplicative denoising [12.4] 本稿では,変分モデルによる乗法的ガンマ分解問題の解法に焦点をあてる。
本稿では,これらの問題を克服するために,領域幾何学用語と曲率項を先行知識として取り入れた混合情報モデルを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:24:42 GMT)
Business Analysis: User Attitude Evaluation and Prediction Based on Hotel User Reviews and Text Mining [12.4] 本研究では,高度な自然言語処理(NLP)とBERTモデルを用いて,ユーザレビューの分析を行う。
BERTモデルは感情を正確に分類し、満足と不満のパターンを明らかにする。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:40:36 GMT)
Investigating Efficacy of Perplexity in Detecting LLM-Generated Code [12.3] 大規模言語モデル生成コード(LLMgCode)は、人為的なコード(HaCode)よりも品質とセキュリティ上の問題が多い。
LLMgCodeは、コードの変更でHaCodeと混同されることが一般的だが、変更は、慎重にチェックすることなく、人間開発者のみによって署名される。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:02:58 GMT)
Unsupervised Domain Adaptive Person Search via Dual Self-Calibration [12.2] Unsupervised Domain Adaptive (UDA) パーソンサーチは、ラベル付きソースドメインデータセットでトレーニングされたモデルを、追加のアノテーションなしでターゲットドメインデータセットに採用することに焦点を当てている。
最も効果的なUDA人物探索法は、典型的には、ソースドメインとクラスタリングから派生した擬似ラベルの基底真理を利用する。
ノイズの多い擬似ラベルの干渉を効果的に除去するUDA人物探索のためのDSCA(Dual Self-Calibration)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:54:00 GMT)
LoFi: Neural Local Fields for Scalable Image Reconstruction [11.5] LoFi(Local Field)と呼ばれる逆問題の画像化のための座標ベースのフレームワークを提案する。
LoFiは、各座標における局所情報を多層パーセプトロン(MLP)によって別々に処理し、その特定の座標でオブジェクトを復元する。
LoFiは、画像解像度とほぼ独立にメモリ使用量を持つアウト・オブ・ディストリビューションデータへの優れた一般化を実現する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:05:18 GMT)
Anchor Learning with Potential Cluster Constraints for Multi-view Clustering [11.5] Anchor-based multi-view clustering (MVC) は、その効率性から注目されている。
本稿では,マルチビュークラスタリング (ALPC) 法に対する潜在的クラスタ制約付きアンカーラーニング法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:43:05 GMT)
Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.4] 大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。
LLMは、しばしばSQL生成に焦点を合わせ、現実世界の会話クエリの複雑さを無視している。
質問タイプを特定し,適切な回答戦略を決定するために,特殊なエージェントを用いたLLMベースのマルチエージェントフレームワークを提案する。
我々の実験は、このアプローチが会話力学の複雑さをナビゲートするモデルの能力を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:13:45 GMT)
Coupling Neural Networks and Physics Equations For Li-Ion Battery State-of-Charge Prediction [11.4] 2つの枝でできた新しいNNアーキテクチャを導入する。
NNのトレーニングにバッテリダイナミクスの方程式を統合する。
2つのパブリックアクセス可能なデータセットに対して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:19:12 GMT)
Privacy in Fine-tuning Large Language Models: Attacks, Defenses, and Future Directions [11.3] 細調整された大規模言語モデル(LLM)は、様々な領域で最先端のパフォーマンスを達成することができる。
本稿では、微調整LDMに関連するプライバシー問題に関する包括的調査を行う。
メンバーシップ推論、データ抽出、バックドア攻撃など、さまざまなプライバシ攻撃に対する脆弱性を強調します。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:41:29 GMT)
Towards Scientific Discovery with Generative AI: Progress, Opportunities, and Challenges [11.2] 本稿では、科学的な課題に応用された大規模言語モデルやその他のAI技術の最近の進歩に注目し、科学的な発見のためのAIの現状について考察する。
そして、科学的な発見のためのより包括的なAIシステムの開発に向けた重要な課題と研究の方向性を概説する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:22:53 GMT)
Flash3D: Super-scaling Point Transformers through Joint Hardware-Geometry Locality [11.1] Flash3D Transformerは、パーフェクト空間ハッシュ(PSH)に基づく原理的局所性機構を通じて、幾何学的局所性とGPUタイリングを整列する
Flash3Dはベンチマークデータセットで最先端のPTv3結果を上回っ、2.25倍の速度向上と2.4倍のメモリ効率向上を実現している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:38:29 GMT)
Optimization Insights into Deep Diagonal Linear Networks [10.4] 直交ニューラルネットワークのパラメータを推定するための勾配流"アルゴリズム"の暗黙的正規化特性について検討した。
我々の主な貢献は、この勾配流がモデル上のミラーフローを動的に誘導することであり、これは問題の特定の解に偏っていることを意味する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:23:47 GMT)
MuMA-ToM: Multi-modal Multi-Agent Theory of Mind [10.1] マルチモーダルなマルチエージェント理論である MuMA-ToM を導入する。
本研究では,現実的な家庭環境における人々のマルチモーダル行動について,ビデオとテキストで記述する。
そして、他人の目標、信念、信念について質問する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:15:13 GMT)
Leveraging Contrastive Learning for Semantic Segmentation with Consistent Labels Across Varying Appearances [9.9] 本稿では,様々な気象条件下で都市景観を捉えた新しい合成データセットを提案する。
本稿では,各シーンの複数バージョンを利用したドメイン適応と一般化手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:50:07 GMT)
Symplectic Neural Flows for Modeling and Discovery [9.8] SympFlowはパラメータ化ハミルトンフローマップを用いて設計された時間依存型シンプレクティックニューラルネットワークである。
後ろ向きのエラー解析を可能にし、シンプレクティック構造を確実に保存する。
カオス的・散逸的システムを含む多種多様な問題に対するSympFlowの有効性を実証する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 22:02:00 GMT)
Assessing Social Alignment: Do Personality-Prompted Large Language Models Behave Like Humans? [9.8] 言語モデリングの革命は様々な新しい応用をもたらし、その一部は大規模言語モデル(LLM)の出現する「社会的能力」に依存している。
i) パーソナライズされたモデルが人格に記載された人格に合わせて振る舞うか(すなわち、社会的状況で提示された場合の「メイク」決定)、そして(ii) それらの行動がきめ細かく制御できるかどうかを問う。
古典心理学実験(ミルグラム実験とウルティマトゥムゲーム)をソーシャルインタラクションテストベッドとして使用し, GPT-3.5/4/4o-mini/4oに即したパーソナリティを適用した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:58:19 GMT)
LiPar: A Lightweight Parallel Learning Model for Practical In-Vehicle Network Intrusion Detection [9.4] 本稿では,車載侵入検知の一般化を実現する軽量並列ニューラルネットワーク構造LiParを提案する。
LiParは、複数の電子制御ユニット、ドメインコントローラ、コンピューティングゲートウェイなど、車載コンピューティングデバイスにタスク負荷を適応的に割り当てる。
我々はLiParが優れた検出性能、実行効率、軽量なモデルサイズを有しており、車内環境に実用的に適合し、車内CANバスのセキュリティを保護することができることを証明した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:03:07 GMT)
Batch Selection for Multi-Label Classification Guided by Uncertainty and Dynamic Label Correlations [9.4] 本研究では,不確実性に基づくマルチラベルバッチ選択アルゴリズムを提案する。
逐次予測と現在の出力の信頼度の違いを考慮し、各ラベルの不確実性を評価する。
実験により,本手法が性能向上に有効であることを実証した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:49:26 GMT)
Distributionally Robust Machine Learning with Multi-source Data [9.4] 対象分布のクラスに対する説明分散に関する逆報酬を最適化するために,群分布に頑健な予測モデルを導入する。
従来の経験的リスク最小化と比較して,提案した頑健な予測モデルでは,分布シフトを伴う対象集団の予測精度が向上する。
ランダムな森林とニューラルネットワークをベースラーニングアルゴリズムとして用いたシミュレーションおよび実データに対して,提案したグループ分散ロバストな手法の性能を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:43:58 GMT)
Beyond End-to-End VLMs: Leveraging Intermediate Text Representations for Superior Flowchart Understanding [9.3] フローチャートは一般的にイメージとして表示され、エンドツーエンドのフローチャート理解に視覚言語モデル(VLM)を使用する傾向が引き起こされる。
i) 制限された制御可能性 - ユーザはダウンストリームタスクに対して最小限の影響しか持たないが、VLMのトレーニングは手の届かないことが多い。
上記の問題に,視覚的テクスチャライザとテクスチャライザの2つの段階で対処するテキストフローを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:52:41 GMT)
Transformer-based toxin-protein interaction analysis prioritizes airborne particulate matter components with potential adverse health effects [9.0] 大気汚染、特に大気中の粒子状物質(PM)は、世界中の公衆衛生に重大な脅威をもたらす。
TipFormerは、ヒト細胞を貫通できる有害成分を識別する新しいディープラーニングツールである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:26:26 GMT)
Accelerating Private Large Transformers Inference through Fine-grained Collaborative Computation [8.9] ホモモルフィック暗号化(HE)とシークレット共有(SS)は、暗号化されたデータの計算を可能にし、医療や金融といった機密分野における大きなトランスフォーマーベースモデル(TBM)のプライバシー上の大きな利点を提供する。
FASTLMPIは、微粒な最適化により、プライベートなTBM推論を高速化する新しい手法である。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:33:12 GMT)
STKDRec: Spatial-Temporal Knowledge Distillation for Takeaway Recommendation [8.6] テイクウェイレコメンデーションシステムは、過去の購入行動に基づいて、ユーザの将来のテイクウェイ購入を推奨するように設計されている。
既存手法は,ユーザ購入シーケンスデータの空間的問題を軽減するため,補助情報の導入や知識グラフの活用に重点を置いている。
本稿では,2段階トレーニングプロセスに基づくテイクアウェイレコメンデーションモデル(STKDRec)のための新しい時空間知識蒸留法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:21:45 GMT)
Generalizability of Graph Neural Network Force Fields for Predicting Solid-State Properties [8.4] 機械学習力場(MLFF)は、複雑な分子系に対するアブ初期シミュレーションの計算的に効率的な代替手段を提供する。
本研究では、グラフニューラルネットワーク(GNN)ベースのMLFFを用いて、トレーニング中に明示的に含まない固体現象を記述する能力について検討する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:21:51 GMT)
Previous Knowledge Utilization In Online Anytime Belief Space Planning [8.4] 本研究では,現在の意思決定プロセスにおける過去の計画データを活用する,計算効率のよい新しい手法を提案する。
実験結果から,本手法は高い性能を維持しながら時間を大幅に短縮することが示された。
歴史的計画情報の統合は,不確実な環境下でのオンライン意思決定の効率を大幅に向上させる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:05:12 GMT)
Syzygy: Dual Code-Test C to (safe) Rust Translation using LLMs and Dynamic Analysis [8.4] Syzygyは、C言語を安全なRustに変換する自動化アプローチである。
これは、Rustのコード翻訳を安全にする上で、これまでで最大の自動化およびテスト検証済みのCである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:49:38 GMT)
BEST-STD: Bidirectional Mamba-Enhanced Speech Tokenization for Spoken Term Detection [8.3] スポット項の検出は、フレームレベルの特徴と計算集約的なDTWベースのテンプレートマッチングに依存しているため、しばしば妨げられる。
本稿では,音声を個別の話者に依存しないセマンティックトークンに符号化する手法を提案する。
これにより、テキストベースの検索アルゴリズムによる高速検索が容易になり、語彙外用語を効果的に扱うことができる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:15:27 GMT)
A Large-scale Empirical Study on Fine-tuning Large Language Models for Unit Testing [8.2] 大規模言語モデル(LLM)は、様々な単体テストタスクに可能性を示している。
単体テストのための微調整LDMに関する大規模な実験的検討を行った。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:28:11 GMT)
LearnLM: Improving Gemini for Learning [8.2] 生成型AIシステムは、人間の家庭教師としての学習にユーザを巻き込むのではなく、デフォルトで情報を提示するように調整されている。
本稿では, 教育指導による教育訓練が, 有能なトレーナーにかなり好まれるLearnLMモデルをいかに生み出すかを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:34:05 GMT)
An HCAI Methodological Framework (HCAI-MF): Putting It Into Action to Enable Human-Centered AI [8.1] 人間中心人工知能(Human-centered AI, HCAI)は、AIシステムの設計、開発、展開、使用において人間を優先する設計哲学である。
文学の隆盛にもかかわらず、その実践のための方法論的指導の欠如はHCAIの実践に課題をもたらしている。
本稿では,5つの主要コンポーネントからなる総合HCAI方法論フレームワーク(HCAI-MF)を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:36:02 GMT)
Large Language Models Compression via Low-Rank Feature Distillation [8.1] LLM 構造化プルーニング法は,(1) キャリブレーションデータによる圧縮,(2) 数十億のトークンによる事前訓練による損失性能の回復,の2段階を含む。
以前の研究では、トレーニング済みのトランスフォーマーの重量は、アクティベーションとは異なり本質的に低ランクではないことがわかりました。
我々は,低ランク重量をSVDで初期化し,教師と学生のアクティベーションを組み合わせた共同損失を用いて,低ランク重量を局所的に蒸留するワンショット圧縮法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:04:01 GMT)
ImagePiece: Content-aware Re-tokenization for Efficient Image Recognition [8.1] ビジョントランスフォーマー (ViT) は様々なコンピュータビジョンタスクにおいて顕著な成功を収めた。
最近の研究は、トークンの数を減らし、効果的にプーンしたりマージする方法に重点を置いている。
本稿では,視覚変換器の新たな再トークン化戦略であるImagePieceを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:38:20 GMT)
CDXFormer: Boosting Remote Sensing Change Detection with Extended Long Short-Term Memory [7.9] 本稿では,強力なXLSTMベースの機能拡張層であるコアコンポーネントを備えたCDXFormerを提案する。
我々は,意味的精度の高い深層機能用にカスタマイズされたクロステンポラルグローバルパーセプトロンを組み込んだ,スケール特異的な特徴エンハンサー層を導入する。
また,グローバルな変化表現と空間応答を段階的に相互作用するクロススケール・インタラクティブ・フュージョンモジュールを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:10:42 GMT)
On Provable Length and Compositional Generalization [7.9] シーケンス・ツー・シーケンスモデルのアウト・オブ・ディストリビューション一般化能力は、2つの重要な一般化形のレンズから研究することができる。
一般的なシーケンス・ツー・シーケンスモデルに対して、長さと合成の一般化に関する最初の証明可能な保証を提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:01:19 GMT)
On the Impact of the Hardware Warm-Up Time on Deep Learning-Based RF Fingerprinting [7.8] デバイスハードウェアの安定化とウォームアップ時間が達成可能な指紋認証性能に与える影響について検討した。
以上の結果から,ディープラーニングモデルがハードウェアの安定化後に取得したデータサンプルを用いてトレーニングされる場合,デバイス上での動作直後に取得したデータをテストした場合,デバイス分類精度は37%以下であることがわかった。
安定化期間後にトレーニングデータとテストデータの両方をキャプチャすると、達成可能な平均精度は99%を超える。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:16:00 GMT)
TestART: Improving LLM-based Unit Testing via Co-evolution of Automated Generation and Repair Iteration [7.8] 大規模言語モデル(LLM)は、単体テストケースを生成する際、顕著な能力を示した。
本研究では,新しい単体テスト生成法であるTestARTを提案する。
TestARTは、自動生成と修復の反復の共進化を通じて、LLMベースのユニットテストを改善している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:51:04 GMT)
A Generalizable Anomaly Detection Method in Dynamic Graphs [7.5] GeneralDyGは、時間的エゴグラフをサンプリングし、構造的特徴と時間的特徴を逐次抽出する手法である。
提案したGeneralDyGは,4つの実世界のデータセット上で最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:38:48 GMT)
Hybrid of Gradient Descent And Semidefinite Programming for Certifying Multipartite Entanglement Structure [7.2] マルチパーティの絡み合いは、幅広い量子情報処理タスクにとって重要なリソースである。
半定値プログラミングと降下勾配法を組み合わせた効率的なアルゴリズムを開発した。
本手法は絡み検出を改良し,多体量子系の複雑な構造について深い知見を提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:20:44 GMT)
Text2midi: Generating Symbolic Music from Captions [7.1] 本稿では,テキスト記述からMIDIファイルを生成するエンド・ツー・エンド・エンド・モデルであるtext2midiを紹介する。
プレトレーニングされたLLMエンコーダを使用してキャプションを処理し、自動回帰変換器デコーダを条件にMIDIシーケンスを生成する。
我々は,MIDIファイルを高品質に生成するための総合的な実験評価を行い,自動化された研究と人為的な研究の両方を取り入れた。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:09:12 GMT)
Divide and Conquer: Grounding a Bleeding Areas in Gastrointestinal Image with Two-Stage Model [7.1] 本研究では,従来のマルチタスク学習モデルが生み出す課題に対処するために,分類と接地を分離する2段階の枠組みを提案する。
実験結果から,分類精度とセグメンテーション精度が有意に向上した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:18:12 GMT)
A learning-based approach to stochastic optimal control under reach-avoid constraint [7.0] 我々は,リーチアビド制約を受けるマルコフ系を最適に制御するためのモデルフリーアプローチを開発する。
適切な仮定の下では、政策パラメータが最適パラメータに収束し、システム軌道が到達不能な制約を高い確率で満たすことが保証される。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:07:40 GMT)
The Task Shield: Enforcing Task Alignment to Defend Against Indirect Prompt Injection in LLM Agents [6.8] 大きな言語モデル(LLM)エージェントは、ツール統合を通じて複雑な現実世界のタスクを実行できる対話アシスタントとして、ますます多くデプロイされている。
特に間接的なプロンプトインジェクション攻撃は、外部データソースに埋め込まれた悪意のある命令が、エージェントを操作してユーザの意図を逸脱させる、重大な脅威となる。
我々は,エージェントのセキュリティが有害な行為を防止し,タスクアライメントを確保するためには,すべてのエージェントアクションをユーザ目的に役立てる必要がある,という新たな視点を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:17:48 GMT)
Improving FIM Code Completions via Context & Curriculum Based Learning [6.8] コードリポジトリからハード・トゥ・コンプリート・パターンを抽出し,カリキュラムのデータセットを作成する。
意味解析ツールと静的解析ツールを用いて文脈例を生成する。
オンラインA/Bテストによるアプローチを検証するとともに,CAR(Completion Acceptance Rate)とCPR(Completion Persistence)の具体的な改善を実証する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:30:54 GMT)
Paraformer: Parameterization of Sub-grid Scale Processes Using Transformers [6.6] 我々は、気候パラメータ化のために作成された最大のデータセットであるClimSim上で、"メモリ対応"トランスフォーマーベースのモデルを提案する。
この結果から,提案モデルがサブグリッドスケール変数の複雑な非線形依存性を捕捉できることが示唆された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:21:52 GMT)
Breaking the Context Bottleneck on Long Time Series Forecasting [6.4] 長期の時系列予測は、経済、エネルギー、輸送における計画と意思決定に不可欠である。
最近の進歩によりこれらのモデルの効率は向上したが、より長いシーケンスを効果的に活用することの難しさは持続している。
長いシーケンスの効率的かつ効率的な処理を実現するために,Logsparse Decomposable Multiscaling (LDM) フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:29:34 GMT)
Unpacking Political Bias in Large Language Models: Insights Across Topic Polarization [6.3] 人間社会における普遍的な現象としての政治的偏見は、大規模言語モデルに移される可能性がある。
政治バイアスは、モデルスケールとリリース日とともに進化し、LLMの地域要因にも影響される。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:42:40 GMT)
High-Rate Amplitude-Damping Shor Codes with Immunity to Collective Coherent Errors [6.2] 高速振幅減衰(AD)ショア符号のファミリを紹介する。
提案されたコードは、約$w$ADエラーを修正できる。
これらのコードをデュアルレール符号と結合することにより、CC-ADショア符号のクラスを構築する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:45:36 GMT)
Transport Quasi-Monte Carlo [6.1] 準モンテカルロは高次元積分を評価する強力な方法である。
我々は,対象分布を近似するために,ユニットハイパーキューブ上の均一分布を前進させる輸送マップのトレーニングを提案する。
我々の理論解析により,提案した輸送QMC推定器は標準モンテカルロよりも高速に収束することが示された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:43:12 GMT)
Predictive Monitoring of Black-Box Dynamical Systems [6.1] ブラックボックス力学系における定量的安全性特性を考慮した予測実行時モニタリングの問題点について検討する。
本研究では,過去に観測された状態に基づいて,システムの将来の状態を予測するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:17:46 GMT)
Argumentation Computation with Large Language Models : A Benchmark Study [6.1] 大規模言語モデル(LLM)は、ニューロシンボリックコンピューティングにおいて大きな進歩を遂げた。
我々は,様々な抽象的論証セマンティクスの拡張を決定する上でのLLMの能力を検討することを目的とする。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:23:06 GMT)
Context-aware knowledge graph framework for traffic speed forecasting using graph neural network [6.0] 本研究では,交通速度予測の高速化を目的とした,コンテキスト認識型知識グラフ(CKG)フレームワークを提案する。
CKG-GNNモデルは、CKG、デュアルビューマルチヘッド自己注意(MHSA)、グラフニューラルネットワーク(GNN)を組み合わせて、トラフィック速度を予測するように設計されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:12:02 GMT)
MCGAN: Enhancing GAN Training with Regression-Based Generator Loss [5.8] 高忠実度データを生成する強力なツールとして,GAN(Generative Adversarial Network)が登場している。
既存のアプローチの主なボトルネックは、ジェネレータトレーニングの監督の欠如である。
我々はモンテカルロガン(MCGAN)と呼ばれるアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:18:21 GMT)
TimeRAG: BOOSTING LLM Time Series Forecasting via Retrieval-Augmented Generation [5.6] TimeRAGは、LLMの時系列予測にRAG(Retrieval-Augmented Generation)を組み込んだフレームワークである。
さまざまなドメインからのデータセットの実験では、RAGの統合により、オリジナルのモデルの予測精度が平均2.97%向上した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:27:38 GMT)
Rational Metareasoning for Large Language Models [5.6] 大きな言語モデル(LLM)を使用するためのコアテクニックとして,推論への関与を促す声が上がっている。
本研究は,認知科学で用いられるメタレゾニングの計算モデルに基づく新しいアプローチを導入する。
我々は不必要な推論を罰することで計算の価値を組み込む報酬関数を開発する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:08:42 GMT)
Loosely Synchronized Rule-Based Planning for Multi-Agent Path Finding with Asynchronous Actions [5.5] MAPF(Multi-Agent Path Finding)は、各開始地点から各目標地点まで、複数のエージェントの衝突のない経路を求める。
多くのMAPFアルゴリズムは数千のエージェントを処理できるが、エージェントの各アクションが時間単位を必要とするという仮定に依存している。
本稿では,新たなプランナを開発し,スケーラビリティのためのソリューション品質をトレードオフする。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:38:09 GMT)
Distributed Inference on Mobile Edge and Cloud: A Data-Cartography based Clustering Approach [5.4] 分散推論フレームワークは、モバイルデバイス、エッジデバイス、クラウド上のフルDNNにデプロイすることができる。
サンプルの複雑さを評価するためにデータ地図を用いた新しい手法を提案する。
提案手法は,クラウド上のすべての推論を実行する場合と比較して,最小限の精度低下を0.5%以下に抑えながら,推論コストを43%以上削減する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:20:26 GMT)
DCOR: Anomaly Detection in Attributed Networks via Dual Contrastive Learning Reconstruction [5.4] ネットワークベースのアプローチによる異常検出は、異常事象を特定する最も効率的な方法の1つである。
本稿では、再構成に基づく異常検出とコントラスト学習を統合した、属性付きネットワークの新しいアプローチDCORを紹介する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 22:02:06 GMT)
DOFEN: Deep Oblivious Forest ENsemble [5.4] 本稿では,奥深い森のアンサンブルを表すDOFENを紹介する。
DOFENは、難解な決定木と列のオンオフスパース選択にインスパイアされた、新しいDNNアーキテクチャである。
Tabular Benchmark – 幅広いドメインにまたがる73のデータセットを含む。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:25:23 GMT)
FedGA: Federated Learning with Gradient Alignment for Error Asymmetry Mitigation [5.4] フェデレートラーニング(FL)は、クライアント内およびクライアント間クラス不均衡を引き起こす。
我々は、FedGAと呼ばれる勾配アライメント(GA)インフォームドFL法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:15:20 GMT)
Vacuum Rabi Splitting and Quantum Fisher Information of a Non-Hermitian Qubit in a Single-Mode Cavity [5.3] 非エルミート量子ビットの自然な拡張は、それを単一モードの空洞に配置することである。
まず、Bogoliubov演算子アプローチを用いて、$mathcalP MathcalT$ symmetric QRMを解く。
例外的に、$mathcalP MathcalT$ symmetric QRM の量子フィッシャー情報は、非エルミート量子ビット成分のそれよりもかなり高い。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:52:01 GMT)
Subgoal Discovery Using a Free Energy Paradigm and State Aggregations [5.1] 強化学習(Reinforcement Learning, RL)は、複雑なシーケンシャルな意思決定タスクの解決において重要な役割を果たしている。
サブゴール発見はこれらの手法のタスク分解の鍵となる要素である。
提案手法は,タスクの事前知識を必要とせずに,サブゴール発見に応用できる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:26:47 GMT)
TGOSPA Metric Parameters Selection and Evaluation for Visual Multi-object Tracking [5.0] トラジェクトリ一般化最適サブパターン割り当て(TGOSPA)を用いて、多目的追跡性能を評価する。
ローカライズエラー、ミスや偽のオブジェクトの数、トラックスイッチの数などが説明できる。
TGOSPAパラメータの選択を探索することにより、特定のタスクに適したアルゴリズムの性能を比較し、理解し、最適化することができる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:32:19 GMT)
Speech Retrieval-Augmented Generation without Automatic Speech Recognition [4.7] SpeechRAGは、音声データに対するオープンクエスト応答のために設計された新しいフレームワークである。
提案手法は,事前学習した音声エンコーダを,凍結した大言語モデルに入力した音声アダプタに微調整する。
テキストと音声の埋め込み空間を整列させることで、音声検索者はテキストベースのクエリから音声を直接検索する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:16:04 GMT)
Interface-sensitive microwave loss in superconducting tantalum films sputtered on c-plane sapphire [4.5] タンタル (Ta) はニオブ (Nb) またはアルミニウム (Al) 表面の微細な損失源に対処するための有望な材料として出現した。
ここでは, 成長温度の異なるc面サファイア上にスパッタしたTa, Nb薄膜の構造と電気的性質について系統的研究を行った。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:40:49 GMT)
The Good, the Bad, and the (Un)Usable: A Rapid Literature Review on Privacy as Code [4.5] プライバシーとセキュリティは、音声データ保護とサイバーレジリエンス機能を備えた情報システムの設計の中心である。
開発者は、適切なサイバーセキュリティトレーニングを欠いているか、優先事項とは考えていないため、これらのプロパティをソフトウェアプロジェクトに組み込むのに苦労することが多い。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:30:17 GMT)
AgriBench: A Hierarchical Agriculture Benchmark for Multimodal Large Language Models [4.1] AgriBenchは農業用マルチモーダル言語モデル(MM-LLM)を評価するために設計された最初のベンチマークである。
我々は,1,784の景観イメージ,セグメンテーションマスク,深度マップ,詳細なアノテーションを含むマルチモーダル農業データセットMM-LUCASを提案する。
本研究は,農業におけるMM-LLMの進歩における画期的な視点を示し,現在進行中であり,専門知識に基づくMM-LLMの今後の発展と革新に価値ある洞察を提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:18:42 GMT)
EasyVis2: A Real Time Multi-view 3D Visualization for Laparoscopic Surgery Training Enhanced by a Deep Neural Network YOLOv8-Pose [4.1] EasyVis2は、腹腔鏡下手術時にハンズフリーでリアルタイムな3D視覚化のために設計されたシステムである。
マイクロカメラのセットを備えた手術用トロカーを体内に挿入し、外科手術の3D視点を提供する。
高度なディープニューラルネットワークアルゴリズムであるYOLOv8-Poseは、個々のカメラビューにおける手術器具の位置と向きを推定するように調整されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:26:19 GMT)
SubData: A Python Library to Collect and Combine Datasets for Evaluating LLM Alignment on Downstream Tasks [4.0] SubDataはPythonライブラリで、アノテーションタスクの主観性に関連するトピックに取り組む研究者に、適切なデータセットを収集、組み合わせ、使用するための便利な方法を提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:40:31 GMT)
Regulator-Manufacturer AI Agents Modeling: Mathematical Feedback-Driven Multi-Agent LLM Framework [3.9] 本研究では,Large Language Models (LLMs) で拡張されたマルチエージェントモデリング手法を用いて,制御力学をシミュレートする。
本研究は,規制の変化が産業行動に与える影響を明らかにし,規制実践を改善する戦略的機会を特定することを目的とする。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:43:59 GMT)
BoostMD: Accelerating molecular sampling by leveraging ML force field features from previous time-steps [3.8] BoostMDは分子動力学シミュレーションを高速化するために設計されたサロゲートモデルアーキテクチャである。
実験の結果,BoostMDは参照モデルと比較して8倍のスピードアップを実現していることがわかった。
効率的な機能再利用と合理化されたアーキテクチャを組み合わせることで、BoostMDは大規模で長期の分子シミュレーションを行うための堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:52:36 GMT)
Topology-Aware 3D Gaussian Splatting: Leveraging Persistent Homology for Optimized Structural Integrity [3.8] 本研究はトポロジーを意識した3次元ガウス散乱(トポロジー-GS)を紹介する。
トポロジー-GSは、不完全な初期幾何学的カバレッジのためにピクセルレベルの構造的整合性を損なう。
3つの新しいビューベンチマーク実験により、PSNR、SSIM、LPIPSの指標で、Topology-GSが既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:25:03 GMT)
Mathematics and Machine Creativity: A Survey on Bridging Mathematics with AI [3.8] 本稿では,人工知能(AI)の数学的研究への応用に関する包括的調査を行う。
近年のAIの発展、特に強化学習(RL)と大規模言語モデル(LLM)は、AIが数学に貢献する可能性を実証している。
この調査は、AIと数学の橋渡し、相互利益に関する洞察を提供し、より深い学際的理解を促進することを目的としている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:58:36 GMT)
Identifying Cyberbullying Roles in Social Media [3.6] サイバーいじめ事件に関与している個人の役割を正確に検出し、この問題を大規模に効果的に解決することが重要である。
本研究では,サイバーバブルの相互作用に関わる役割を検出する機械学習モデルについて検討する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:46:48 GMT)
Automated Classification of Cybercrime Complaints using Transformer-based Language Models for Hinglish Texts [3.5] 本稿では,自動サイバー犯罪苦情分類のための枠組みを提案する。
我々は,CyberGuard AI Hackathon 2024において,Indian Cybercrime Coordination Centre(I4C)が提供する実世界のデータセットを採用している。
HingRoBERTaの精度は74.41%、F1スコアは71.49%である。
この作業は、サイバー犯罪の苦情管理における重要なギャップを埋め、現代的なサイバーセキュリティの課題に対して、スケーラブルでプライバシを重視し、適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:17:09 GMT)
Deep Learning for Spatio-Temporal Fusion in Land Surface Temperature Estimation: A Comprehensive Survey, Experimental Analysis, and Future Trends [3.3] 地表面温度(LST)は重要な環境過程を理解する上で重要な役割を果たしている。
衛星センサーはしばしば空間分解能と時間分解能のトレードオフに直面している。
時空間融合(STF)は、2つの衛星データソースを統合する強力な方法として登場した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:53:15 GMT)
Fast Multi-Group Gaussian Process Factor Models [3.3] 我々は多群ガウス過程因子モデルに近似した2つのアプローチを提案する。
どちらの手法も、統計的性能に最小限の影響を伴って、桁違いのスピードアップを達成する。
この研究により、マルチポピュレーション記録の規模が大きくなるにつれて、強力な分析技術がペースを維持することができる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:00:15 GMT)
A Unified Probabilistic Approach to Traffic Conflict Detection [3.1] 本研究では,交通競合検出に対する統一的確率論的アプローチを提案する。
提案手法は,道路ユーザインタラクションのコンテキスト依存的な極端なイベントとしてトラフィック競合を定式化する,トラフィック競合検出の統一的な枠組みを確立する。
この結果は、交通インフラや政策の安全性評価を強化し、自動運転車の衝突警告システムを改善し、安全クリティカルな相互作用における道路利用者の行動の理解を深める可能性を強調している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:19:16 GMT)
Stitch Contrast and Segment_Learning a Human Action Segmentation Model Using Trimmed Skeleton Videos [3.1] 本稿では,短いトリミングスケルトンビデオに基づいてトレーニングされた骨格に基づくアクションセグメンテーションのための新しいフレームワークを提案する。
Stitch、Contrast、Segmentの3つのステップで実装されている。
実験には、トリミングされたソースデータセットと、トリミングされていないターゲットデータセットが含まれる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:19:14 GMT)
Risk-sensitive Markov Decision Process and Learning under General Utility Functions [3.1] 強化学習(Reinforcement Learning, RL)は、様々な応用分野や理論的研究において大きな注目を集めている。
意思決定プロセス(MDP)の枠組みにおいて,意思決定者が累積報酬の汎用機能を最適化しようとするシナリオを考える。
累積報酬の空間上でのエプシロン被覆を用いた修正値反復アルゴリズムを提案する。
シミュレータが存在しない場合,提案アルゴリズムは高信頼度探索法を用いて設計され,ほぼ最適ポリシーを同定する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:11:08 GMT)
When SparseMoE Meets Noisy Interactions: An Ensemble View on Denoising Recommendation [3.1] 本稿では,適応アンサンブル学習(Adaptive Ensemble Learning, AEL)を提案する。
AELはスパースゲーティングネットワークを脳として採用し、適切な認知能力の合成に適した専門家を選択する。
モデル複雑性のアンサンブル学習の欠点を解決するために,コンポーネントを積み重ねてサブレコメンダを作成する新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:29:30 GMT)
FairDD: Enhancing Fairness with domain-incremental learning in dermatological disease diagnosis [3.0] 本研究は,皮膚科診断モデルにおける精度と公平性とのトレードオフを改善することを目的としている。
そこで本研究では,FairDDという,異なるグループの学習のバランスをとるために,ドメインの漸進的学習を活用する新しい皮膚科診断ネットワークを提案する。
提案手法はフェアネス基準とフェアネスと性能のトレードオフを両立させる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:57:00 GMT)
Dynamical similarity analysis can identify compositional dynamics developing in RNNs [3.0] ニューラルネットワーク(RNN)における合成学習により、動的配向アライメントメトリクスのテストケースを構築することができる。
本稿では,新しい動的類似性解析(DSA)がよりノイズに強いことを示し,従来の指標よりも行動関連表現をより確実に同定する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:53:26 GMT)
Sequence Matters: Harnessing Video Models in 3D Super-Resolution [3.0] 3次元超解像は、低解像度(LR)マルチビュー画像から高忠実度3Dモデルを再構成することを目的としている。
ビデオ超解像モデル(VSR)を利用した3次元超解像の包括的研究を行う。
以上の結果から,VSRモデルでは正確な空間アライメントが欠如している配列でも極めて良好に動作できることが判明した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:41:08 GMT)
Solving Inverse Problems via Diffusion Optimal Control [3.0] 反復線形擬似レギュレータ (iLQR) アルゴリズムにインスパイアされた拡散型最適制御器を導出する。
アルゴリズムの特別な場合として, 理想化後サンプリング方程式を復元できることが示される。
次に,ニューラル逆問題解法の選択に対して提案手法を評価し,逆問題を用いた画像再構成における新たなベースラインを確立する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:47:06 GMT)
Distilling Large Language Models for Efficient Clinical Information Extraction [3.0] 本研究では, 現在のLLMの約1000倍小さい蒸留BERTモデルの性能評価を行った。
現状のLSM (Gemini と OpenAI モデル) と医学 (RxNorm と SNOMED) を薬剤, 疾患, 症状抽出の教師ラベルとして活用した。
我々は5つの公開データセットにまたがる3300以上の臨床記録にアプローチを適用した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:15:29 GMT)
ControlMol: Adding Substructure Control To Molecule Diffusion Models [2.8] 条件学習と条件最適化を組み合わせた2段階の訓練手法を提案する。
実験では, ランダムに分割したサブ構造データのみを学習し, より有効で多様な分子を生成することにより, 従来の手法より優れていた。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:22:54 GMT)
Reasoning about Actual Causes in Nondeterministic Domains -- Extended Version [2.6] 我々は、非決定論的状況計算における実際の因果関係に関する予備的な作業を構築した。
本研究では, 状況計算における回帰を, 実際の原因の考え方を推し進めるためにどのように拡張するかを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:35:25 GMT)
DragonVerseQA: Open-Domain Long-Form Context-Aware Question-Answering [2.4] 本稿では,オープンドメインとロングフォームなOver-The-Top (OTT) Question-Answering (QA)データセットを開発するための新しいアプローチを提案する。
テレビシリーズ『House of the Dragon』と『Game Of Thrones』のファンタジーの世界に特化している。
我々は、HBOとファンダムウィキのウェブサイトから得られた全エピソード要約、IMDbやRotten Tomatoesなどのソースからのユーザレビュー、高品質でオープンドメインで法的に許容できるソースを組み合わせたデータセットをキュレートする。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:36:52 GMT)
AlzheimerRAG: Multimodal Retrieval Augmented Generation for PubMed articles [2.4] マルチモーダル検索・拡張生成(RAG)アプリケーションは,情報検索と生成モデルの強みを両立させる能力を約束している。
本稿では, バイオメディカル研究用マルチモーダルRAGパイプラインツールであるAlzheimerRAGを紹介する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:59:00 GMT)
Knowledge as a Breaking of Ergodicity [2.4] 2次自由度で定義された生成モデルのトレーニングをガイドできる熱力学的ポテンシャルを構築する。
我々は、生成モデルを計算的に管理可能にするために、記述の削減とともに、ポテンシャルは複数のミニマを発生させると主張している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:30:07 GMT)
A Method for the Runtime Validation of AI-based Environment Perception in Automated Driving System [2.4] 環境認識は、自律運転システムによって実行される動的運転タスクの基本的な部分である。
現在の自動車システムの安全関連規格は、包括的な要求仕様の存在を前提としている。
本稿では,AIを用いたADS環境認識のための機能的ランタイム監視のための関数モニタを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:21:49 GMT)
Predicting Quality of Video Gaming Experience Using Global-Scale Telemetry Data and Federated Learning [2.3] フレーム・パー・秒(FPS)はゲーム体験に大きな影響を与える。
グローバルスケールのデータセット上でゲームFPSに影響を与える可能性のある要因について検討する。
ユーザプライバシを確保するためのフェデレーション学習モデルを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:52:45 GMT)
Improving Graph Neural Network Training Efficiency by Constructing Training Sets with Noise-Susceptible Samples [2.2] グラフニューラルネットワーク(GNN)は、現在利用可能な最も強力なニューラルネットワークアーキテクチャのひとつである。
GNNはノイズの影響を受けやすいため、分類や予測といった一般的なタスクでは性能が著しく低下する可能性がある。
本稿では,スペクトル分析を利用して,雑音に最も敏感な点を特定し,選択する手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:55:04 GMT)
Sensitive Image Classification by Vision Transformers [2.0] ビジョントランスモデルは自己認識機構を利用して、文脈的局所要素間のグローバルな相互作用をキャプチャする。
本研究では,様々な視覚変換器モデルと従来のトレーニング済みResNetモデルの比較分析を行った。
その結果、ビジョントランスフォーマーネットワークは、事前訓練されたベンチマークモデルを超え、優れた分類と検出能力を示した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:34:24 GMT)
Object Detection Approaches to Identifying Hand Images with High Forensic Values [2.0] 本稿では,様々な機械学習手法を手動検出と比較し,応用結果を示す。
我々は、4つの手動画像データセット上で、YOLOv8と視覚変換器に基づく物体検出モデルを微調整する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:37:54 GMT)
REAL: Response Embedding-based Alignment for LLMs [2.0] LLMのためのレスポンス埋め込みベースのアライメントは、高品質なトレーニングデータセットを構築するための戦略である。
異なる応答対を選択することで、LLMの直接アライメントが向上し、継承されたラベリングエラーを低減できることを示す。
その結果,異なるペアにフォーカスすることでラベルエラーを低減し,LCMアライメントの効率を向上し,アノテータの作業の最大65%を節約できることがわかった。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:07:14 GMT)
Explainable Deep Learning Analysis for Raga Identification in Indian Art Music [1.8] 自動ラガ識別(ARI)のためのCNN-LSTMモデルを訓練する。
我々は、Raga識別にSoundLIMEとGradCAM++というモデル説明可能性技術を使った最初の試みを行っている。
本結果は,人間の理解とモデル理解の相違を顕著に示すものである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:32:18 GMT)
KKANs: Kurkova-Kolmogorov-Arnold Networks and Their Learning Dynamics [1.8] Kurkova-Kolmogorov-Arnold Network (KKAN) は、堅牢な多層パーセプトロン(MLP)をベースとした内部関数と、基底関数を外部関数として柔軟な線形結合を組み合わせた新しい2ブロックアーキテクチャである。
ベンチマークの結果、KKANは関数近似および演算子学習タスクにおいて、元のKAN(Kolmogorov-Arnold Networks)よりも優れていた。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:01:38 GMT)
Application of Multimodal Large Language Models in Autonomous Driving [1.8] マルチモーダル大言語モデルの実装について詳細な研究を行う。
自律運転におけるMLLMの性能の低下に対処する。
次に、シーン理解、予測、意思決定によってAD意思決定プロセスを分解する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:09:52 GMT)
A Similarity-Based Oversampling Method for Multi-label Imbalanced Text Data [1.8] 本研究では,マルチラベルテキスト分類のための新しいオーバーサンプリング手法を紹介し,検討する。
提案手法は,インスタンス間の類似度を利用してラベル付けされていないデータから潜在的に新しいサンプルを同定する。
ラベルなしのデータセットを反復検索することで、未表現のクラスに類似したインスタンスを探索する。
パフォーマンス改善を示すインスタンスがラベル付きデータセットに追加される。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:03:29 GMT)
Internalized Self-Correction for Large Language Models [1.8] 大規模言語モデル(LLM)のための「内部自己補正」(InSeC)を導入する。
InSeCでは、トレーニング中にミスとそれに対応する修正を導入することで、LLMが自分自身を修正することができる。
このアプローチは、LLMが生成した幻覚や誤文の指示に従うことを改善するために拡張することができる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:53:13 GMT)
Kernel Methods for the Approximation of the Eigenfunctions of the Koopman Operator [1.8] 演算子自体を明示的に計算することなく、クープマン演算子の主固有関数を構成するカーネルベースの方法を提案する。
主固有関数の構造を線形成分と非線形成分に分解する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:25:51 GMT)
Research on Violent Text Detection System Based on BERT-fasttext Model [1.7] BERT-fasttextモデルに基づく暴力的テキスト切断の研究は重要な意味を持つ。
BERTは、強い自然言語理解能力を持つ事前訓練された言語モデルであり、テキストの意味情報を深く掘り下げて分析することができる。
Fasttext自体は、複雑さと効果の低い効率的なテキスト分類ツールであり、テキスト処理の基本的な判断を素早く提供することができる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:02:18 GMT)
Fundamental thresholds for computational and erasure errors via the coherent information [1.5] ノイズの多いQEC符号に関連する混合状態密度演算子のコヒーレント情報(CI)に基づくフレームワークを提案する。
両種類の誤りが存在する場合, 汎用安定化器QEC符号に対して, 統計力学マッピングの異なるファミリーを厳格に導出する方法を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:30:30 GMT)
Surrogate Modeling of Trajectory Map-matching in Urban Road Networks using Transformer Sequence-to-Sequence Model [1.4] 本稿では、オフラインマップマッチングアルゴリズムのサロゲートとして機能するディープラーニングモデル、特にトランスフォーマーベースのエンコーダデコーダモデルを提案する。
このモデルは、ニューヨーク州マンハッタンで収集されたGPSトレースを使って訓練され、評価されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 22:52:48 GMT)
Enhancing web traffic attacks identification through ensemble methods and feature selection [1.4] 本研究は,機械学習技術を活用して,Webトラフィック攻撃の識別を強化することを目的とする。
CSIC2010 v2データセットを用いて,HTTPトレースから関連する特徴を抽出する手法が提案された。
ランダムフォレスト (Random Forest) やエクストリームグラディエント・ブースティング (Extreme Gradient Boosting) のようなアンサンブル法が採用され、ベースライン分類器と比較された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 22:13:30 GMT)
SilVar: Speech Driven Multimodal Model for Reasoning Visual Question Answering and Object Localization [1.3] SilVarは、視覚的質問応答における推論に音声命令を使用する、新しいエンドツーエンドマルチモーダルモデルである。
そこで本研究では,オブジェクトローカライゼーションのための音声ベースの推論タスクを用いて,モデルに挑戦するデータセットを提案する。
実験の結果,SilVarは音声による指示の難しさにもかかわらず,MMMUとScienceQAベンチマークでSOTA性能を達成した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:52:32 GMT)
Quantum AI for Alzheimer's disease early screening [1.3] アルツハイマー病は神経変性性脳疾患であり、主に高齢者に影響を及ぼす。
DARWINデータセットには、アルツハイマー病に罹患した人々と健康な人々のグループによる手書きのサンプルが含まれている。
このデータセットを用いて古典的な分類法をテストし、それらの性能を量子機械学習手法で得られたものと比較する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:41:35 GMT)
A Language Model With Million Context Length For Raw Audio [1.2] 本研究では,大規模な文脈で音声波形をモデル化できる自動回帰アーキテクチャを提案する。
我々の作業は、CNNフロントエンドによる潜伏表現を学習し、Transformerエンコーダを使用してこれらの表現に対する依存を学習することで、時間依存の学習に適応する。
我々は、Wavenet、SaSHMI、Sample-RNNといった他のアプローチと比較して、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:16:31 GMT)
Towards Using Machine Learning to Generatively Simulate EV Charging in Urban Areas [1.1] 本研究では、限られたデータで都市部における電気自動車(EV)の充電プロファイルを予測することの課題に対処する。
我々のモデルは、ピーク電力需要と日々の負荷を予測し、充電行動に関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:24:48 GMT)
An explainable operator approximation framework under the guideline of Green's function [1.1] 組込みグリーン関数を学習し,グリーンの積分定式化によるPDEを解決するための新しいフレームワークであるGreensONetを導入する。
フレームワークの精度と一般化能力は、既存の手法よりも優れている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:31:03 GMT)
ViM-Disparity: Bridging the Gap of Speed, Accuracy and Memory for Disparity Map Generation [1.1] 分散マップ生成(DMG)の計算オーバーヘッドが低いリアルタイムかつ高精度なモデルにおいて,既存のトレードオフを解消するためのVisual Mamba (ViM) アーキテクチャを提案する。
また,DMGモデルの推論速度,計算オーバーヘッド,精度を共同評価できる性能指標を提案した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 19:41:10 GMT)
Divide and Conquer: A Hybrid Strategy Defeats Multimodal Large Language Models [1.0] 本稿では,マルチモーダルジェイルブレイク手法であるJMLLMを提案する。
テキスト、視覚、聴覚のモダリティにわたって包括的なジェイルブレイク攻撃を実行するために、複数の戦略を統合する。
また、マルチモーダルジェイルブレイク研究のための新しい包括的データセットTriJailも提供します。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:43:51 GMT)
Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling [1.0] オープン語彙の指示に基づいて,日常的な物体を特定の家具に搬送するDSRを開発した。
本手法は,室内環境の事前収集画像から対象物と受容物の画像を取得することに焦点を当てる。
本稿では, 正, ラベルなし, 負のサンプルの中から多様で頑健な表現を学習するRelaX-Formerを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:40:56 GMT)
Acquisition of Recursive Possessives and Recursive Locatives in Mandarin [0.9] 本研究は,マンダリン話者による子どもの獲得の発達過程について考察した。
劣悪な所有者と場所
この研究は二段階の理解とは対照的である。
3歳から7歳までの 子どもの劣縮構造です
応答を誘発する絵のタスクを見ながら質問に答えること。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:44:21 GMT)
Condensed Stein Variational Gradient Descent for Uncertainty Quantification of Neural Networks [0.9] 本稿では,ニューラルネットワークなどの複雑なパラメータ化モデルに対して,並列にスカラー化,トレーニング,不確実性の定量化を行うスタイン変分勾配降下法を提案する。
これは、複雑性を減らし、パラメータ化のスタインアンサンブルの類似性を高めるために、グラフの和解と凝縮のプロセスを利用する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:28:07 GMT)
TrojFlow: Flow Models are Natural Targets for Trojan Attacks [0.9] データにノイズをマッピングする方法として,フローベース生成モデル (FM) が急速に進歩している。
これまでの研究では、DMはトロイの木馬/バックドア攻撃に弱いことが示されている。
我々は、トロイの木馬攻撃によるFMの脆弱性を探索するTrojFlowを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:21:53 GMT)
Single-sample versus case-control sampling scheme for Positive Unlabeled data: the story of two scenarios [0.9] 経験的リスク最小化(ERM)に基づく正の未ラベルデータに対する分類器の性能は,単一サンプルシナリオに適用した場合に著しく低下する可能性がある。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:05:30 GMT)
V"Mean"ba: Visual State Space Models only need 1 hidden dimension [0.8] 状態空間モデル (SSM) は線形再帰機構を導入して解法として登場した。
平均演算を用いてSSMのチャネル次元を除去する,トレーニング不要な圧縮手法である textitVMeanba を導入する。
textitVMeanbaは1.12倍のスピードアップを達成でき、精度は3%以下である。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:27:07 GMT)
Quantum-Like Contextuality in Large Language Models [0.7] 本稿は,自然言語における「イエス」の答えを示す,最初の大規模実験的な証拠を提供する。
我々は,文脈的量子シナリオをモデル化した言語スキーマを構築し,それを簡易英語ウィキペディアでインスタンス化し,インスタンスの確率分布を抽出する。
文脈的事例は, BERT の埋め込みベクトルの文脈性度とユークリッド距離の間の方程式を導出することにより, 意味論的に類似した単語から得られたことを証明した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 23:46:55 GMT)
Enhancing Nighttime Vehicle Detection with Day-to-Night Style Transfer and Labeling-Free Augmentation [0.7] 本研究では、CARLA生成合成データを利用したラベリングフリーなデータ拡張のための新しいフレームワークを提案する。
特に、このフレームワークは、現実的な日々のスタイルの転送のために、効率的な注意生成広告ネットワークを組み込んでいる。
提案手法の有効性を評価するため,夜間の農村環境に特化して収集したデータセットを用いてYOLO11モデルを微調整した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:13:46 GMT)
Strong-TransCenter: Improved Multi-Object Tracking based on Transformers with Dense Representations [0.6] トランスフォーマーネットワークは近年、様々なコンピュータビジョンタスクにおける最先端の性能を超えることができる多くの分野の研究の焦点となっている。
マルチプルオブジェクトトラッキング(MOT)のタスクでは、トランスフォーマーのパワーを活用することは、いまだに探索されていない。
この領域における先駆的な取り組みの中で、トランスフォーマーベースのMOTアーキテクチャで、オブジェクトクエリが密集しているTransCenterは、適切なランタイムを維持しながら、例外的なトラッキング機能を示した。
本稿では,トラック・バイ・ディテクト・パラダイムに基づく後処理機構を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:41:43 GMT)
The Evolving Usage of GenAI by Computing Students [0.5] 本稿では,北米の大学において,コンピュータ科学生を対象に行った横断的な調査から得られた知見について述べる。
2023年、34.1%の学生がChatGPTを使用していないと報告し、オンライン検索、ピアサポート、クラスフォーラムの4位にランクインした。
このような普及にもかかわらず、学生の時間的・日常的なGenAIツールの利用は減少している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:00:04 GMT)
Overcoming the fundamental limit of quantum transduction via intraband entanglement [0.5] 量子トランスデューサは、入力信号を離れた周波数帯域の出力プローブに変換する。
キャビティ電気光学・電気光学変換器の効率帯域幅積は、ポンプパワーと非線形結合係数によって基本的に制限されていることを示す。
本研究では、帯域内絡みを消費することで、ノイズのない転送効率を向上させることを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:26:15 GMT)
Prior2Posterior: Model Prior Correction for Long-Tailed Learning [0.4] 本稿では,テクティタ後部確率を用いたトレーニングモデルの有効性を正確にモデル化するための新しい手法を提案する。
提案手法は,ロングテール文献から得られた複数のベンチマークデータセットに基づいて,新しい最先端(SOTA)を実現する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:49:02 GMT)
AdvFusion: Adapter-based Knowledge Transfer for Code Summarization on Code Language Models [0.3] 本稿では、ターゲットタスクに適応する前に、他の言語から効果的に学習するPEFTベースのアプローチであるAdvFusionを提案する。
コード要約とメソッド名予測で評価する。
AdapterFusionを最大1.7ポイント上回り、Ruby、JavaScript、Goでそれぞれ1.99、1.26、2.16でLoRAを上回っている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:41:13 GMT)
Real-time Bangla Sign Language Translator [0.3] Bangla Sign Language Translation (BSLT)は、聴覚障害とミュートコミュニティのコミュニケーションギャップを埋めることを目的としている。
提案手法では,キーポイントの収集にMediapipe Holistic,データトレーニングにLSTMアーキテクチャ,94%の精度でリアルタイム手話検出にComputer Visionを採用している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:56:32 GMT)
Cryogenic field-cycling instrument for optical NMR hyperpolarization studies [0.3] 光動的核偏光(DNP)は、核磁気共鳴(NMR)分光の感度を高めるための魅力的なアプローチを提供する。
我々は、幅広い磁場と温度にわたる光DNP研究を容易にする極低温磁場サイクリング装置を導入する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:54:05 GMT)
MAGIC: Generating Self-Correction Guideline for In-Context Text-to-SQL [0.3] 自己訂正(Self-correction)は、大きな言語モデル(LLM)に、以前誤って生成されたsqlを書き換えるよう促すプロセスである。
本稿では,自己補正ガイドライン作成を自動化する新しいマルチエージェント手法であるMAGICを紹介する。
我々の実験によると、MAGICのガイドラインは、人間の作ったものよりも優れています。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:25:28 GMT)
On Algorithmic Fairness and the EU Regulations [0.3] この論文は、欧州連合(EU)における非差別に焦点を当てたアルゴリズム的公正に焦点を当てている。
この論文は、AIシステムの差別バイアスを修正することは、EU規則の下で法的に可能であることを実証している。
この論文は、AIエンジニアリングにおけるコンプライアンスの増大する研究領域を拡大し、強化し、いくつかの法的洞察を得て、アルゴリズムフェアネス研究に貢献する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:08:04 GMT)
WiP: Deception-in-Depth Using Multiple Layers of Deception [0.2] 私たちは、軍事的騙し、ネットワークオーケストレーション、ソフトウェア騙し、ファイル騙し、偽のハニーポット、移動目標防衛のアイデアを描きます。
幅広い偽造テクニックをデプロイすることは、単一のテクニックをデプロイするよりも、システムを保護するのに効果的であることを示したいと思っています。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:34:38 GMT)
Global Convergence of SGD On Two Layer Neural Nets [0.2] 我々は,任意の数のゲートを持つ深さ2ドルのネットを適宜正規化した$ell-$empirical risk of depthとみなす。
任意のデータに対して、SGDアンバウンドに対する経験的損失がどのように進化するか、またアクティベーションが適切に滑らかでシグモイドやタンのようにバウンドされているかどうかについて、バウンドを示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:31:13 GMT)
Enhancement in temperature sensing of a reservoir by Kerr-nonlinear resonator [0.2] 本稿では,Kerr非線形共振器を用いた量子貯水池の温度を正確に測定するための推定手法を提案する。
カーの非線形性係数の増大と駆動振幅の増大は温度推定の精度を著しく向上させる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:43:09 GMT)
Swap distance minimization beyond entropy minimization in word order variation [0.1] エントロピーとスワップ距離は、異なる言語構造において著しく小さい。
転がり実験に関してエントロピーの最小化とスワップ距離の最小化の強い証拠を見出した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:47:15 GMT)
Towards Selection and Transition Between Behavior-Based Neural Networks for Automated Driving [0.1] 本稿では,複数の小型人工ニューラルネットワーク(ANN)を用いて異なる運転タスクを管理する行動セレクタを提案する。
重荷になりがちな1つの大きなネットワークに頼るのではなく、広範なトレーニングデータを必要とし、理解しづらい。
我々は、安定性と安全性を改善するために、現在の速度と方向を考慮しながら、行動間のスムーズな遷移を確保することに注力する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:23:05 GMT)
Hexagons govern three-qubit contextuality [0.1] 次数2のスプリットケイリー六角形は、3ビットシンプレクティック極空間において有限である。
満足できないコンテキストのセットごとに、古典的に埋め込まれたヘキサゴナルが、このコンテキストのセットと全く同じ構成で共有されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:47:08 GMT)
YOLOv11 Optimization for Efficient Resource Utilization [0.0] We developed size-specific modified version of the architecture of You Only Look Once (YOLOv11)
提案された各バージョンは、小さなものから大きなものまで、特定のサイズ範囲のオブジェクトを検出するように調整されている。
実験結果は,計算資源効率の大幅な向上を浮き彫りにした。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:27:16 GMT)
Verifying a stabilizer state with few observables but many shots [0.0] 雑音下で量子コンピュータが生成する$n$-qubit安定化器状態を検証する手法を提案する。
この研究は、ほとんど量子ビットを持たない、短期的なノイズの多い量子コンピュータシステムをターゲットにしている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:31:49 GMT)
Underutilization of Syntactic Processing by Chinese Learners of English in Comprehending English Sentences, Evidenced from Adapted Garden-Path Ambiguity Experiment [0.0] 本研究は, 統語処理の非活用を, 統語的観点から強調する。
この研究は、部分的および完全という2種類のパーシングアンダーユーティライゼーションを識別する。
構文処理を文理解に完全に統合する新しい構文解析法の開発の基礎を築いた。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:32:10 GMT)
Tunneling in a Lorenz-like model for an active wave-particle entity [0.0] 活性波粒子体(WPE)は、振動する油浴の自由面に自己推進油滴として出現する。
WPEは様々な量子特性の流体力学的類似性を示すことが示されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:20:15 GMT)
Thermalization slowing down of weakly nonintegrable quantum spin dynamics [0.0] 量子多体スピン系の熱分解速度を2つの異なる可積分限界にアプローチして研究する。
どちらの時間スケールも可積分性へのアプローチによって異なることが分かっています。
これにより、量子スピン力学における可積分性の破れの普遍性を確立することができる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:28:02 GMT)
TelegramScrap: A comprehensive tool for scraping Telegram data [0.0] TelegramScrapは、Telegramチャンネルやグループからデータを抽出して分析するツールである。
このホワイトペーパーは、学術・科学研究におけるツールの開発、能力、応用について概説する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:46:56 GMT)
Technical Report: Small Language Model for Japanese Clinical and Medicine [0.0] 本報告では, NCVC-slm-1 という名称の日本臨床・医学用小言語モデル (SLM) を提案する。
他の大規模言語モデルと比較して、NCVC-slm-1は、JMED-LLMで合計8のタスクで最高スコアを示した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:12:48 GMT)
Stress Predictions in Polycrystal Plasticity using Graph Neural Networks with Subgraph Training [0.0] 有限要素法(FEM)シミュレーションから多結晶塑性の複雑な測地応力を予測するためにグラフニューラルネットワーク(GNN)を用いる。
本稿では,FEMメッシュセル間のノイズ歪みとエッジ距離を符号化する新しいメッセージパスGNNを提案する。
本稿では, 複雑なジオメトリーを持つ周期性多結晶体にGNNを応用し, 結晶塑性理論に基づくひずみ-応力写像を学習する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:34:18 GMT)
Robust random graph matching in dense graphs via vector approximate message passing [0.0] 本稿では,2つの相関したガウスウィグナー行列の一致回復問題と潜在対応性に着目する。
我々のアルゴリズムは,n1-o(1)$の任意の逆摂動の下で頑健な,最初の効率的なランダムグラフマッチング型アルゴリズムである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:15:38 GMT)
Resource-efficient high-threshold fault-tolerant quantum computation with weak nonlinear optics [0.0] 本稿では,ゴッテマン・キタエフ・プレスキル(GKP)と単一光子量子ビットをハイブリッドすることで,大規模クラスタ状態を生成する手法を提案する。
私たちのスキームはリソースコストの低減、すなわち論理量子ビット当たりの物理量子ビット/光子数や初期絡み合いの削減を図っている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:32:53 GMT)
Quantum entanglement, coherence and Dark Matter [0.0] 気体からの放射強度に及ぼす量子エンタングルメントとコヒーレンスの影響を考察する。
熱平衡と量子コヒーレンスの組み合わせがどのようにしてこの効果を緩和するかを示す。
量子の絡み合いとコヒーレンスは、これらの環境に存在する暗黒物質の一部を説明できる可能性がある。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:24:50 GMT)
Patherea: Cell Detection and Classification for the 2020s [0.0] Pathereaは、ポイントベースの細胞検出と分類のためのフレームワークである。
最先端のアプローチの開発と評価のための完全なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 01:23:58 GMT)
On the choice of non-linear terms in blocking cat states by energy conservation [0.0] エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。
W.D. Wick, arXiv:1710.03278]で導入された種類の非線形項は、測定問題の解法としてエネルギー保存によって空間猫をブロックすることであった。
最後に [W.D. Wick, arXiv:1710.03278] の提案を検証するための実験的見積もりを述べる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:18:04 GMT)
On Enhancing Network Throughput using Reinforcement Learning in Sliced Testbeds [0.0] 本稿では,ネットワークスライシングスループットをSLA(Service-Level Agreements)に適合させるために,強化学習(Reinforcement Learning, RL)を用いた新しいアプローチとして,拡張移動ブロードバンド(eMBB)-Agentを提案する。
eMBB-Agentはアプリケーション送信変数を分析し、DQN(Deep Q-Network)を使用して受信ウィンドウを調整するために離散空間内のアクションを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:47:49 GMT)
Nested Dirichlet models for unsupervised attack pattern detection in honeypot data [0.0] 共通の意図を共有しているように見えるクラスタリング攻撃は、脅威追跡の専門家にとって非常に価値がある。
本稿では,ハニーポットから収集した端末セッションコマンドをクラスタリングするためのディリクレ分布トピックモデルについて検討する。
セッションをクラスタリングする主な実践的意味は2つある。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:39:24 GMT)
Need is All You Need: Homeostatic Neural Networks Adapt to Concept Shift [0.0] ホメオスタティックな特徴を組み込んだ人工ニューラルネットワークを導入する。
私たちのホメオスタティックデザインは、ニューラルネットワークの思考機械を自身の思考結果に公開します。
ホメオスタティックデザインは,概念シフトによる適応性の向上を示唆する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:53:56 GMT)
Multi-atlas Ensemble Graph Neural Network Model For Major Depressive Disorder Detection Using Functional MRI Data [0.0] うつ病性障害(MDD)は最も一般的な精神疾患の1つであり、日常的な活動や生活の質に大きな影響を及ぼす。
MDDの現在の診断アプローチは、主に臨床観察と患者報告された症状に依存している。
深層学習技術は神経画像データに広く応用され、早期の精神疾患の検出に役立っている。
本研究の目的は,rs-fMRI画像から識別特徴を検出するアンサンブルに基づくGNNモデルを開発することである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:08:03 GMT)
Metagoals Endowing Self-Modifying AGI Systems with Goal Stability or Moderated Goal Evolution: Toward a Formally Sound and Practical Approach [0.0] 我々は、中程度のゴール進化とゴール安定性の追求を組み合わせたハイブリッドメタゴールの実用的価値を論じる。
目標不変量の維持に伴う自己修正のバランスは、高い自己理解度など、他の興味深い認知的側面を持つことが多い。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:57:13 GMT)
Many-body effects in a composite bosonic Josephson junction [0.0] 複合ボソニックジョセフソン接合(BJJ)の概念を紹介する。
量子力学の多体面に着目し、接合の複雑な構造がトンネルに与える影響を考察する。
複数の時間依存モードへの断片化が普遍的に起こるという強い証拠を提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:41:29 GMT)
Long-Time Behavior of Typical Pure States from Thermal Equilibrium Ensembles [0.0] 我々は、純状態 $psi_tinmathcalH$ における孤立したマクロ量子系を、分離可能なヒルベルト空間 $mathcalH$ において一元的に進化すると考える。
本研究は, この結果の均一分布から, GAP測度と呼ばれる, より一般的な測度へと一般化するものである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:28:58 GMT)
Large baseline quantum telescopes assisted by partially distinguishable photons [0.0] 恒星光の光モードの低い光子占有は、高次補助光子数に対する望遠鏡の感度を急速に低下させることを示す。
区別性の影響は比較的軽度であるが、星光の光学モードの低光子占有は、望遠鏡の感度を急速に劣化させる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:27:51 GMT)
Joint Estimation of Conditional Mean and Covariance for Unbalanced Panels [0.0] 条件平均および共分散行列に対する非パラメトリックカーネルベースジョイント推定器を開発した。
1962年から2021年までの月次米国株過剰リターンの広範なパネルに当てはめます。
慣用性リスクは, 平均して, 断面積の75%以上を説明できることがわかった。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:53:37 GMT)
Iterative Feature Exclusion Ranking for Deep Tabular Learning [0.0] タブラルデータ(英: Tabular data)は、データエントリとその特徴を表現するために、行や列に情報を格納する一般的なフォーマットである。
ディープニューラルネットワークは、コンピュータビジョンやNLPを含む幅広い領域をモデリングするための主要なアプローチとなっている。
エンドツーエンドの勾配に基づく最適化を含む内部的特徴選択機構を備えた最近のモデルでは、特徴の重要性の文脈依存を考慮できない。
提案モジュールは、各特徴を入力データから反復的に除外し、その特徴が予測に与える影響を表す注意スコアを算出する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:12:14 GMT)
Investigating a new approach of robustly self-testing two-qubit entangled states [0.0] 本研究では,これらの手法を2量子交絡量子状態の自己テストのシナリオに適用する。
参照状態との忠実性に関する新しい境界は他の方法と比較する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:27:03 GMT)
InfoTech Assistant : A Multimodal Conversational Agent for InfoTechnology Web Portal Queries [0.0] InfoTech Assistantはブリッジの評価とインフラ技術におけるクエリに対処する。
Webデータスクレイピング、大言語モデル(LLM)、レトリーバル拡張生成(RAG)を統合することで、InfoTech Assistantは正確でコンテキストに関連のある応答を提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 00:34:52 GMT)
Improving Math Problem Solving in Large Language Models Through Categorization and Strategy Tailoring [0.0] 本稿では,大規模言語モデル(LLM)を用いて数学的問題を効率的に高精度に解く方法について述べる。
問題分類のための単純だが直感的な機械学習モデルを設計する。
この単純なモデルの性能は、分類のための最先端(SOTA)モデルに近づきつつある。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:25:35 GMT)
Improving Discovery of Known Software Vulnerability For Enhanced Cybersecurity [0.0] 脆弱性検出はCommon Platformion (CPE)文字列のような標準化された識別子に依存する。
ソフトウェアベンダが発行する標準化されていないCPE文字列は、大きな課題を生み出します。
一貫性のない命名規則、バージョニングプラクティスは、データベースをクエリする際のミスマッチを引き起こす。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:43:52 GMT)
IMVB7t: A Multi-Modal Model for Food Preferences based on Artificially Produced Traits [0.0] 環境画像から属性を抽出するために様々なモデルを用いる。
視覚刺激に反応して食品嗜好のパターンを識別する調査を行った。
特定属性のアマルガメーションに基づいて,料理に対する決定木を用いたレコメンデーションを定式化する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 23:55:17 GMT)
Higher-Order Krylov State Complexity in Random Matrix Quenches [0.0] 量子多体系では、時変状態は通常、$textitKrylov subspace$として知られるヒルベルト空間の小さな領域に限られる。
ランダム行列理論における量子クエンチに続く一般化拡散複素量の時間発展について検討する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 03:59:30 GMT)
High-dimensional quantum key distribution with resource-efficient detection [0.0] 本稿では, 単一光子検出器を1つずつ1つだけ使用した高次元BB84QKD実験の原理を実証する。
時間的タルボット効果を用いて、制御ベースでQKDのシンボルを検出し、2次元および4次元のケースで実験的に得られた値を示す。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:40:09 GMT)
High-Dimensional Bayesian Optimization via Random Projection of Manifold Subspaces [0.0] この問題に取り組むための共通の枠組みは、目的関数が高次元の周囲空間に埋め込まれた低次元多様体上の限られた特徴集合に依存すると仮定することである。
本稿では,目的関数の新たな表現を活用することによって,BOの高次元への新たなアプローチを提案する。
提案手法は, BOの低次元空間における取得関数の効率的な最適化を可能にする。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:41:24 GMT)
Heading towards an Algebraic Heisenberg Cut [0.0] Infinity の前には, マクロな行動の早期の兆候が現れる。
このことは、IPP形式主義の量子物理学への包含を正当化する根拠となる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:39:40 GMT)
Has LLM Reached the Scaling Ceiling Yet? Unified Insights into LLM Regularities and Constraints [0.0] 大きな言語モデル(LLM)は目覚ましい能力を示していますが、そのスケーラビリティには重要な疑問があります。
本稿では,LLMのスケーリング力学を説明するために,数学的および統計的知見を統合する統一理論フレームワークを開発する。
今後の進歩には、ブルートフォーススケーリングから、アーキテクチャ、データ品質、トレーニングパラダイムの革新に移行する必要があります。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:19:07 GMT)
From Creation to Curriculum: Examining the role of generative AI in Arts Universities [0.0] この論文は、安定拡散(Stable Diffusion)に焦点をあてて、AIツールの統合を慎重に取り上げている。
論文はそのようなツールの概要を包括的に掘り下げ、オープンソースAIアートの世界におけるアーティスト、開発者、研究者の間の複雑なダンスを強調している。
これは、AIが強化された芸術的な風景の中で育つために必要な能力を持つ学生を育成する上で、最重要事項であることを示す、これらの前衛的なツールを迅速に採用する上で、魅力的なケースである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:18:43 GMT)
From Correlation to Causation: Understanding Climate Change through Causal Analysis and LLM Interpretations [0.0] 本研究では,相関分析,機械学習に基づく因果関係探索,LLMによる解釈を統合した3段階因果推論フレームワークを提案する。
提案するフレームワークは、気候に関するコンテキストにおいて、データ駆動型ポリシー作成と戦略的意思決定をサポートするソリューションを提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:33:07 GMT)
Fractional Spending: VRF&Ring Signatures As Efficient Primitives For Secret Quorums [0.0] デジタル通貨は、特に二重支出に関して、分散設定の課題に直面している。
Bitcoinのような従来のアプローチでは、トランザクションの総順序を確立するためにコンセンサスを使用する。
本稿では、異なる暗号プリミティブであるVRFとリングシグナチャを同様のプロトコルに統合することにより、そのようなソリューションを強化する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:37:36 GMT)
Fingerprinting of Machines in Critical Systems for Integrity Monitoring and Verification [0.0] 定期的なセキュリティ評価の間に生じるセキュリティ侵害の根本原因を特定することはますます困難になっている。
本稿では,この問題に対処する上で,システムフィンガープリントの基本的な重要性について検討する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 12:00:33 GMT)
Evaluation of radiomic feature harmonization techniques for benign and malignant pulmonary nodules [0.0] 肺結節(PNs)の放射線学的特徴は肺癌の診断に有効であるが, 医学的画像取得の多様性は臨床応用の障害となる。
放射線学的特徴の獲得依存性を補正する際の良性PNと悪性PNの相違について検討した。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:16:37 GMT)
Evaluating the Performance of Large Language Models in Scientific Claim Detection and Classification [0.0] 本研究では,Twitterのようなプラットフォーム上での誤情報を緩和する革新的な手法として,LLM(Large Language Models)の有効性を評価する。
LLMは、従来の機械学習モデルに関連する広範なトレーニングと過度に適合する問題を回避し、事前訓練された適応可能なアプローチを提供する。
特定データセットを用いたLCMの性能の比較分析を行い、公衆衛生コミュニケーションへの応用のためのフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:02:26 GMT)
Enhancing Startup Success Predictions in Venture Capital: A GraphRAG Augmented Multivariate Time Series Method [0.0] 本稿では,GraphRAG拡張時系列モデルを用いた新しい手法を提案する。
GraphRAGでは、分析フレームワークに重要な関係を統合することで、時系列予測手法が強化される。
実験の結果,我々のモデルは,スタートアップの成功予測において,過去のモデルよりも大幅に優れていたことがわかった。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 13:39:45 GMT)
Effects of Quadratic Optomechanical Coupling on Bipartite Entanglements, Mechanical Ground-State Cooling and Squeezing in an Electro-Optomechanical System [0.0] 本研究では, ハイブリッド電気光学系における定常二部構造, 機械的地中冷却, 機械的四面体スクイージングについて検討した。
このようなハイブリッド電気光学システムは、量子センシングと量子情報処理のための改良された絡み合ったソースを構築するための有望なプラットフォームとして機能する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:24:32 GMT)
Doppler-free three-photon spectroscopy on narrow-line optical transitions [0.0] 1S_0$$leftrightarrow$3P_0$光時計遷移と1S_0$$leftrightarrow$3P_1$対結合遷移のコヒーレントドップラーフリー3光子励起は880ドルSr原子の自由空間熱雲である。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:51:13 GMT)
Does calibration mean what they say it means; or, the reference class problem rises again [0.0] グループキャリブレーションスコアは、異なるグループの個人に対して"平均的に同じもの"である。
キャリブレーションは、同じ意味の絵が公正のために重要なことを意味しているような一貫性のあるスコア解釈を保証できない。
この誤差の起源を反映して、アルゴリズムの公正性において支配的な方法論により大きなレンズを開放する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:50:31 GMT)
Deep Reinforcement Learning Based Systems for Safety Critical Applications in Aerospace [0.0] 航空宇宙における人工知能(AI)応用の最近の進歩は、かなりの成長を見せている。
高性能コンピューティングプラットフォームは進化を続けており、現在の飛行制御コンピュータやエンジン制御コンピュータを置き換えることが期待されている。
このシフトにより、画像処理や欠陥検出といったリアルタイムAIアプリケーションが、監視システムにシームレスに統合できるようになる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:17:55 GMT)
CyberSentinel: Efficient Anomaly Detection in Programmable Switch using Knowledge Distillation [0.0] CyberSentinelは、プログラム可能なスイッチデータプレーンに完全にデプロイされた、高スループットで正確な異常検出システムである。
目に見えないネットワーク攻撃を検出するために、CyberSentinelは、深い教師なしMLモデルの"学習"知識を取り入れた、新しい知識蒸留スキームを使用している。
我々は、Intel Tofinoスイッチでテストベッド上にCyberSentinelのプロトタイプを実装し、様々な実世界のユースケースで評価する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 16:35:44 GMT)
Creating an LLM-based AI-agent: A high-level methodology towards enhancing LLMs with APIs [0.0] 大規模言語モデル(LLM)は、工学と科学の様々な側面に革命をもたらした。
この論文は総合的なガイドとして機能し、アプリケーションプログラミングインタフェース(API)を活用する能力を備えたLLMの強化のための多面的アプローチを解明する。
本稿では,Hugging Faceコミュニティの小さなモデルを用いて,携帯端末の機能を活用したオンデバイスアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:08:29 GMT)
Classical integrability in the presence of a cosmological constant: analytic and machine learning results [0.0] マクスウェル場と中性スカラー場の重力への結合を記述する二次元理論の可積分性について検討する。
ある解部分空間に対して、2次元の運動方程式のサブセットが線型系の整合条件であることを示して部分積分性を示す。
これらのモデルに対する数値的なLax対行列の探索を体系化するために、さまざまな機械学習技術を用いる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 21:17:15 GMT)
Can Schroedingerist Wavefunction Physics Explain Brownian Motion? III: A One-Dimensional Heavy and Light Particles Model Exhibiting Brownian-Motion-Like Trajectories and Diffusion [0.0] 有限級数を与え、BML軌道と拡散の基準を満たす一次元摂動モデルを導入する。
プランク定数は拡散係数に現れ、これは前世紀におけるポインケアとアインシュタインの研究と現在の理論をさらに区別するものである。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:15:48 GMT)
Back To The Future: A Hybrid Transformer-XGBoost Model for Action-oriented Future-proofing Nowcasting [0.0] 映画『バック・トゥ・ザ・フューチャー』にインスパイアされた本研究では、革新的な適応型放送手法を探求する。
映画では、キャラクターは時間をかけて過去の出来事を操り、より良い未来を創り出す。
我々のフレームワークは、現在の状況を予測し、調整するために未来に関する予測的な洞察を利用する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 08:53:28 GMT)
BLS-MT-ZKP: A novel approach to selective disclosure of claims from digital credentials [0.0] 本稿では,選択的開示BLS-MT-ZKPに対する新しいアプローチを提案する。
BLS-MT-ZKPは、既存の暗号プリミティブ、Boneh-Lynn-Shacham(BLS)シグネチャ、Merkle hash tree(MT)、ZKP法(Bulletproofs)を組み合わせている。
新たな要件は、選択開示とプライバシスペクトラムの定義に基づいて定義される。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 18:57:11 GMT)
Autonomous Crack Detection using Deep Learning on Synthetic Thermogram Datasets [0.0] 鋼板のき裂検出の問題点を考察する。
一般的な方法では、プレートを加熱して発生した熱電図の画像を見て、それが割れているかどうかを分類する。
CNNや他のビジョンモデルは、一般的に非常にデータに飢えており、うまく機能し始める前に大量のデータを必要とします。
有限要素シミュレーションに基づく合成データ生成パイプラインを作成することにより,この問題を正確に解決しようとしている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 06:10:32 GMT)
Automated CVE Analysis: Harnessing Machine Learning In Designing Question-Answering Models For Cybersecurity Information Extraction [0.0] 質問応答(QA)システムは、様々なデータポイント間の関係のマッピングにおいて重要な役割を果たす。
サイバーセキュリティの文脈では、QAシステムは、幅広いドメイン固有の情報に基づいて質問を解釈し、回答する必要があるため、ユニークな課題に直面する。
本稿では、新しいデータセットを示し、QAタスクのためにこのデータセットに基づいてトレーニングされた機械学習モデルについて述べる。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:50:45 GMT)
Assessing fault-tolerant quantum advantage for $k$-SAT with structure [0.0] 量子バックトラックとグローバーのアルゴリズムが2023年のSAT大会のメイントラック勝者に対して有する可能性を評価する。
以上の結果から,より構造化された$k$-SAT解決における実用的な量子スピードアップの可能性は限定的であることが示唆された。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 10:50:27 GMT)
Are Biological Systems More Intelligent Than Artificial Intelligence? [0.0] 細胞は誘導バイアスに適応し、静的インタプリタは適応しないため、生物学はよりインテリジェントであることを示す。
フォーマリズムの文脈では、がんのような障害状態は、システムがそれらの存在する抽象層によって厳格に拘束されているときに起こる。
これは、優雅な劣化を保証するために、コントロールを分散(トップダウンではなくボトムアップ)する必要があることを示唆している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 05:48:53 GMT)
Apples to Apples: Establishing Comparability in Knowledge Generation Tasks Involving Users [0.0] 知識グラフ構築のための同様のプロトコルに関する2つの研究は報告されていない。
本稿ではまず,ユーザが比較ポイントを識別する研究を報告した各種研究について分析する。
このプロトコルは、KGCユーザスタディのより同等な評価に向けた重要なステップを提供する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:26:20 GMT)
Ansatz for the Two-Dimensional Ising Model in an External Magnetic Field [0.0] 熱容量の特異性は 磁場でも残る
驚くべき結果として、h>0。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:24:16 GMT)
An elementary proof of a universal approximation theorem [0.0] 本稿では、3つの隠れた層を持つニューラルネットワークに対する普遍近似定理の基本的な証明と、連続的、有界な活性化関数の増大について述べる。
結果は最もよく知られた結果よりも弱いが、学部分析以外の機械は使われていないという意味では初等的な証明である。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:40:55 GMT)
An alternative non-unitary implementation for the quantum search algorithm [0.0] グロバー探索アルゴリズムにおける最後の量子状態は、グラマーシュミット過程における正規化マーク量子状態であることを示す。
元のアルゴリズムのマーキング部分である$U_mark$を使っているため、アルゴリズムの複雑さはこの演算子の複雑さによって制限される。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 07:26:30 GMT)
Adversarial Attack Against Images Classification based on Generative Adversarial Networks [0.0] 画像分類システムに対するアドリアック攻撃は、機械学習分野において常に重要な問題であった。
生成的敵ネットワークの普及に伴い、フェイク画像技術の誤用によりセキュリティ上の問題が相次いだ。
本研究は, 画像分類システムの弱点を把握し, 対人攻撃能力を向上させることを目的とした, 新たな対人攻撃手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:23:34 GMT)
ActPC-Chem: Discrete Active Predictive Coding for Goal-Guided Algorithmic Chemistry as a Potential Cognitive Kernel for Hyperon & PRIMUS-Based AGI [0.0] バイオインスパイアされたゴール誘導人工知能(AI)のための新しいパラダイム(ラベル付き ActPC-Chem)を探求する。
ActPCは、離散アクティブ予測符号化(ActPC)の形式で、書き換え規則のアルゴリズム化学で運用されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 09:14:25 GMT)
AIGCodeSet: A New Annotated Dataset for AI Generated Code Detection [0.0] AIGCodeSetは、特にPythonプログラミング言語向けのAI生成コード検出タスクのためのデータセットである。
我々は,CodeLlama 34B,Codestral 22B,Gemini 1.5 Flashモデルを3つのアプローチで生成する。
AIGCodeSetは2,828のAI生成と4,755の人間のコードスニペットで構成されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 11:53:49 GMT)
A Unifying Family of Data-Adaptive Partitioning Algorithms [0.0] 本稿では、いくつかのよく知られた手法を統一するデータ適応分割アルゴリズムのファミリーを示す。
アルゴリズムは使いやすく、解釈しやすく、大規模で高次元の問題によく対応している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:54:53 GMT)
A Systems Thinking Approach to Algorithmic Fairness [0.0] システム思考は、アルゴリズムの公平性問題をモデル化する方法を提供する。
フェアネス問題を複雑なシステムとして扱うことで、機械学習、因果推論、システムダイナミクスのテクニックを組み合わせることができる。
これは、政治的通路の両側の政策立案者が、異なる種類の公正政策から存在する複雑なトレードオフを理解するのに役立つ。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 14:21:33 GMT)
A Sharp Geometric Measure of Entanglement [0.0] 本稿では, シャープ測度(SGM)の標準定義を変更することで, シャープ測度(SGM)を導入する。
我々は、GMSと呼ばれるSGMから派生したGenuine Multipartite Entanglement(GME)の尺度を定義する。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:30:11 GMT)
A Riemannian Genuine Measure of Entanglement for Pure States [0.0] 我々は、量子状態の空間上の測地線距離に基づく純粋状態の測度を考案した。
我々の測度は、GME(Genuine Measure of Entanglement)の望ましい性質をすべて満たしている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 17:34:53 GMT)
A Comprehensive Guide to Item Recovery Using the Multidimensional Graded Response Model in R [0.0] 本研究では,R の多次元次数応答モデル (MGRM) における項目回復の段階的実証を行う。
研究の目的に合わせて、これらのステップのR符号が詳細な説明とともに提示され、研究者は自分たちの分析手順を再現し、適応することができた。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 15:00:31 GMT)
A Comparative Study on Machine Learning Models to Classify Diseases Based on Patient Behaviour and Habits [0.0] 本研究は, PRFと糖尿病, ストローク, 心疾患 (HD), キドニー病 (KD) の相関について6つの教師付きML手法を用いて検討した。
PRFに基づいてHDを分類するためのMLアルゴリズムと、Diabetes、Stroke、Asthma、Skin Cancer、KDを属性として比較、評価することを目的としている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 20:46:40 GMT)
12-spin-qubit arrays fabricated on a 300 mm semiconductor manufacturing line [0.0] 実用的な量子コンピュータを構築するためのIntelの取り組みは、スケーラブルなスピンキュービットプラットフォームの開発に焦点を当てている。
本稿では、新しい量子テストチップの設計、製造、デモの概要について述べる。
これらの装置は、他の標準的な高体積製造プロセスとともに、浸漬および極端紫外線リソグラフィー(EUV)を用いて製造されている。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 02:00:37 GMT)
"ScatSpotter" 2024 -- A Distributed Dog Poop Detection Dataset [0.0] 現在42ギガバイトの犬糞の電話画像のデータセットを新たに導入しました。
6kのフル解像度イメージと4kの詳細なポリゴンアノテーションがある。
画像の収集とアノテーションは2020年後半に開始され、データセットは約1GB成長している。
論文参考訳(メタデータ) (Sat, 21 Dec 2024 04:05:29 GMT)