Convolutional Filtering with RKHS Algebras [110.1] 我々は、Kernel Hilbert Spaces(RKHS)の再生のための畳み込み信号処理とニューラルネットワークの理論を開発する。
任意の RKHS が複数の代数的畳み込みモデルの形式的定義を可能にすることを示す。
本研究では,無人航空機による実測値から無線通信を予測できる実データに関する数値実験について述べる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:53:44 GMT)
JaxMARL: Multi-Agent RL Environments and Algorithms in JAX [105.3] 我々は、GPU対応の効率と多くの一般的なMARL環境のサポートを組み合わせた、最初のオープンソースPythonベースのライブラリであるJaxMARLを紹介します。
我々の実験は、壁時計時間の観点から、JAXベースのトレーニングパイプラインが既存のアプローチの約14倍高速であることを示している。
また、人気の高いStarCraft Multi-Agent ChallengeのJAXベースの近似的な再実装であるSMAXを紹介し、ベンチマークする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:26:28 GMT)
X-Drive: Cross-modality consistent multi-sensor data synthesis for driving scenarios [105.2] 本稿では,点雲と多視点画像の連成分布をモデル化する新しいフレームワーク,X-DRIVEを提案する。
2つのモダリティの異なる幾何学的空間を考えると、X-DRIVE条件は対応する局所領域上の各モダリティの合成である。
X-DRIVEはテキスト、バウンディングボックス、画像、点雲を含む多レベル入力条件を通じて制御可能な生成を可能にする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:52:12 GMT)
LoRA-Contextualizing Adaptation of Large Multimodal Models for Long Document Understanding [103.7] 大規模マルチモーダルモデル(LMM)は、最近、テキストに富む画像理解において大きな進歩を見せている。
長文書理解を支援するLMMの能力を拡張したLoRA-Contextualizing Adaptation of Large Multimodal Model (LoCAL) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:09:01 GMT)
Improving the Worst-Case Bidirectional Communication Complexity for Nonconvex Distributed Optimization under Function Similarity [92.2] ダウンリンク圧縮のための新しい手法であるMARINA-Pを導入する。
置換圧縮機を用いたMARINA-Pは、作業者数に応じてサーバ間通信の複雑さを向上できることを示す。
本稿では,MARINA-Pとアップリンク圧縮とモーメントステップを組み合わせた手法であるM3を導入する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:54:03 GMT)
Freya PAGE: First Optimal Time Complexity for Large-Scale Nonconvex Finite-Sum Optimization with Heterogeneous Asynchronous Computations [92.2] 実用的な分散システムでは、労働者は概して均質ではなく、非常に多様な処理時間を持つ。
本稿では、任意に遅い計算を扱うための新しい並列手法Freyaを提案する。
Freyaは従来の手法と比較して,複雑性の保証が大幅に向上していることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:18:12 GMT)
Shadowheart SGD: Distributed Asynchronous SGD with Optimal Time Complexity Under Arbitrary Computation and Communication Heterogeneity [85.9] 我々は,従来の集中型手法の時間的複雑さを確実に改善する新しい手法であるShadowheart SGDを開発した。
また、サーバからワーカーへのブロードキャストが無視できない双方向設定も検討し、対応する方法を開発した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:31:03 GMT)
M$^3$GPT: An Advanced Multimodal, Multitask Framework for Motion Comprehension and Generation [78.8] M$3$GPTは、理解と生成のための先進的な$textbfM$ultimodal, $textbfM$ultitaskフレームワークである。
我々は、テキスト、音楽、モーション/ダンスなどのマルチモーダル制御および生成信号に離散ベクトル量子化を用いる。
M$3$GPTは、様々な動作関連タスク間の接続とシナジーをモデル化することを学ぶ。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 04:39:28 GMT)
M$^3$GPT: An Advanced Multimodal, Multitask Framework for Motion Comprehension and Generation [78.8] M$3$GPTは、理解と生成のための先進的な$textbfM$ultimodal, $textbfM$ultitaskフレームワークである。
我々は、テキスト、音楽、モーション/ダンスなどのマルチモーダルな条件信号に対して離散ベクトル量子化を用い、大きな言語モデルへのシームレスな統合を可能にした。
M$3$GPTは、様々な動作関連タスク間の接続とシナジーをモデル化することを学ぶ。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:39:28 GMT)
Sigmoid Gating is More Sample Efficient than Softmax Gating in Mixture of Experts [78.4] 我々は,シグモイドゲーティング関数が,専門家推定の統計的タスクにおいて,ソフトマックスゲーティングよりも高いサンプル効率を享受できることを示した。
ReLU や GELU のようなよく使われる活性化型フィードフォワードネットワークとして定式化された専門家は,シグモイドゲーティングの下でより速い収束率を享受できる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:49:00 GMT)
$π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.3] 本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:00:56 GMT)
TimeXer: Empowering Transformers for Time Series Forecasting with Exogenous Variables [75.8] TimeXerは外部情報を取り込み、内因性変数の予測を強化する。
TimeXerは、12の現実世界の予測ベンチマークで一貫した最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:06:36 GMT)
Bayesian scaling laws for in-context learning [72.2] In-context Learning(ICL)は、言語モデルをトレーニング更新なしで複雑なタスクを実行するための強力なテクニックである。
我々は、ICCがベイズ学習者を近似し、ICCのための新しいベイズスケーリング法則のファミリーを開発することを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:06:53 GMT)
Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions [70.0] Vision-and-Language Navigation (VLN)は、人間の指示に基づいてナビゲートするエンボディエージェントを開発することを目的としている。
本稿では,人間の動的活動を取り入れ,従来のVLNを拡張したHuman-Aware Vision-and-Language Navigation (HA-VLN)を紹介する。
本稿では, クロスモーダル融合と多種多様なトレーニング戦略を利用して, エキスパート・スーパーモーダル・クロスモーダル (VLN-CM) と非エキスパート・スーパーモーダル・ディシジョン・トランスフォーマー (VLN-DT) のエージェントを提示する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:14:09 GMT)
Be like a Goldfish, Don't Memorize! Mitigating Memorization in Generative LLMs [68.6] 金魚の喪失と呼ばれる次の訓練目標に微妙な修正を加える。
トレーニング中、ランダムにサンプリングされたトークンのサブセットは損失計算から除外される。
これらのドロップトークンはモデルによって記憶されないため、トレーニングセットから完全なトークンの連鎖を冗長に再現することができない。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 23:19:18 GMT)
Attractor Memory for Long-Term Time Series Forecasting: A Chaos Perspective [63.6] textbftextitAttraosはカオス理論を長期時系列予測に取り入れている。
本研究では,AttraosがPatchTSTと比較して,パラメータの12分の1しか持たない主流データセットやカオスデータセットにおいて,LTSF法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:11:52 GMT)
PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.7] 画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。
我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。
画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:20:58 GMT)
Bridge the Modality and Capability Gaps in Vision-Language Model Selection [62.3] 視覚言語モデル(VLM)は、画像とテキストのカテゴリ名とのペアリングによるゼロショット画像分類において優れている。
VLMリソースをより再利用するために、VLM Zooから適切な事前学習VLMを選択するという有望な戦略が提案されている。
本稿では,この言語のみのVLM選択において,VLMの能力を評価する上での2つの課題について分析する。
本稿では,2つのギャップの負の影響を軽減するために,gApブリッジを用いたVLM選択を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:14:39 GMT)
Understanding and Improving Adversarial Collaborative Filtering for Robust Recommendation [60.7] 適応的協調フィルタリング(ACF)は、毒殺攻撃に対するレコメンダシステムの堅牢性を高める効果的な戦略として広く認識されている。
実証的な成功にもかかわらず、ACFの有効性を性能と堅牢性の両方の観点から理論的に理解するのは難しい。
我々はPamaCF(Personalized Magnitude Adversarial Collaborative Filtering)を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:23:36 GMT)
RLE: A Unified Perspective of Data Augmentation for Cross-Spectral Re-identification [59.5] 非線型モダリティの相違は主に、異なる材料の表面に作用する様々な線形変換に由来する。
本稿では,MRLE(Modrate Random Linear Enhancement)とRRLE(Radical Random Linear Enhancement)を含むRLE(Random Linear Enhancement)戦略を提案する。
実験結果は、RLEの優位性と有効性を示すだけでなく、クロススペクトル再同定のための汎用データ拡張としての可能性も確認した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:13:37 GMT)
Unchosen Experts Can Contribute Too: Unleashing MoE Models' Power by Self-Contrast [59.0] Mixture-of-Experts (MoE) は、計算効率を保ちながら、モデルサイズをスケールするための顕著なアーキテクチャとして登場した。
本研究では,無声専門家を推論中に自己コントラスト的に活用する学習自由戦略である自己コントラスト混合(SCMoE)を提案する。
我々の手法は概念的には単純で計算量も軽量であり、グリージー復号法に比べて最小限の遅延を発生させる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 06:14:55 GMT)
Identifying General Mechanism Shifts in Linear Causal Representations [58.6] 我々は,未知の潜在因子の線形混合を観測する線形因果表現学習環境について考察する。
近年の研究では、潜伏要因の復元や、それに基づく構造因果モデルの構築が可能であることが示されている。
非常に穏やかな標準仮定の下では、シフトしたノードの集合を識別することが可能である。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:52:26 GMT)
Exploring and Benchmarking the Planning Capabilities of Large Language Models [57.2] この研究は、大規模言語モデル(LLM)の計画能力を改善するための基礎を築いた。
我々は、古典的な計画ベンチマークと自然言語シナリオの両方を含む包括的なベンチマークスイートを構築した。
本研究は,LLM計画の強化を目的としたマルチショットインコンテキスト学習について検討し,文脈長の増大と計画性能の向上の関係について検討する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:49:49 GMT)
Analysis of Unstructured High-Density Crowded Scenes for Crowd Monitoring [55.2] 我々は,人群集の組織的動きを検出する自動システムの開発に興味がある。
コンピュータビジョンアルゴリズムは、混雑したシーンのビデオから情報を抽出することができる。
組織化されたコホート内の参加者数を見積もることができます。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 23:45:39 GMT)
Prompt Tuning with Diffusion for Few-Shot Pre-trained Policy Generalization [55.1] 我々は,オフライン強化学習タスクにおいて,例外的な品質向上を促す条件拡散モデルを構築した。
本稿では,Promptディフューザがプロンプトチューニングプロセスの堅牢かつ効果的なツールであることを示し,メタRLタスクにおいて高い性能を示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:38:02 GMT)
Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning [55.1] 28,618粒の粗粒と4,487粒の細粒のアノテートサンプルを含むMERRデータセットを導入した。
このデータセットは、さまざまなシナリオから学習し、現実のアプリケーションに一般化することを可能にする。
本研究では,感情特異的エンコーダによる音声,視覚,テキスト入力をシームレスに統合するモデルであるEmotion-LLaMAを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:30:50 GMT)
AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.7] LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:24:30 GMT)
Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.2] 本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:19:24 GMT)
Confidence Aware Learning for Reliable Face Anti-spoofing [52.2] 本稿では,その能力境界を意識した信頼認識顔アンチスプーフィングモデルを提案する。
各サンプルの予測中にその信頼性を推定する。
実験の結果,提案したCA-FASは予測精度の低いサンプルを効果的に認識できることがわかった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:29:02 GMT)
Dictionary Insertion Prompting for Multilingual Reasoning on Multilingual Large Language Models [52.0] textbfDictionary textbfInsertion textbfPrompting (textbfDIP) という,新規かつシンプルで効果的な方法を提案する。
非英語のプロンプトを提供する際、DIPは単語辞書を調べ、単語の英語のプロンプトをLLMのプロンプトに挿入する。
そして、英語へのより良い翻訳とより良い英語モデル思考のステップを可能にし、明らかにより良い結果をもたらす。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:10:50 GMT)
Hollowed Net for On-Device Personalization of Text-to-Image Diffusion Models [51.4] 本稿では、デバイス上での主観的生成のための効率的なLoRAに基づくパーソナライズ手法を提案する。
提案手法はHollowed Netと呼ばれ,拡散U-Netのアーキテクチャを変更することにより,微調整時のメモリ効率を向上させる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:42:48 GMT)
Discovering Preference Optimization Algorithms with and for Large Language Models [50.8] オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:34:31 GMT)
Supervised Score-Based Modeling by Gradient Boosting [49.6] 本稿では,スコアマッチングを組み合わせた勾配向上アルゴリズムとして,SSM(Supervised Score-based Model)を提案する。
推測時間と予測精度のバランスをとるため,SSMの学習とサンプリングに関する理論的解析を行った。
我々のモデルは、精度と推測時間の両方で既存のモデルより優れています。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:06:53 GMT)
A Textbook Remedy for Domain Shifts: Knowledge Priors for Medical Image Analysis [48.8] ディープネットワークは、医学的なスキャンに適用すると、例外のない状況で失敗することが多いため、自然画像の解析において広く成功している。
胸部X線や皮膚病変画像の文脈において、異なる病院から採取したデータや、性別、人種などの人口統計学的変数によって構築されたデータなど、ドメインシフトに対するモデル感度に焦点をあてる。
医学教育からインスピレーションを得て,自然言語で伝達される明示的な医学知識を基盤としたディープネットワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:02:28 GMT)
MultiPull: Detailing Signed Distance Functions by Pulling Multi-Level Queries at Multi-Step [48.8] 粗いSDFを粗い値から細かい値に最適化することにより,原点雲から多スケール暗黙フィールドを学習する手法を提案する。
広く使われているオブジェクトとシーンのベンチマーク実験により,この手法は表面再構成における最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 10:50:22 GMT)
Unveiling and Mitigating Generalized Biases of DNNs through the Intrinsic Dimensions of Perceptual Manifolds [46.5] 公正なディープニューラルネットワーク(DNN)の構築は、信頼できる人工知能を達成するための重要なステップである。
本稿では,モデルの公平性と性能を高める固有次元正規化(IDR)を提案する。
様々な画像認識ベンチマークテストにおいて、IDRはモデルバイアスを低減し、性能を向上する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 09:42:01 GMT)
A Sober Look at the Robustness of CLIPs to Spurious Features [45.9] 私たちはCLIPモデルが現実的なスプリアス機能に依存していることを明らかにするために、CounterAnimalという新しいデータセットを作成しました。
評価の結果、CounterAnimalが取得したスプリアス特性は、異なるバックボーンとプレトレインデータを持つCLIPモデルによって総称的に学習されるが、ImageNetモデルへの影響は限定的であることが示された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:58:15 GMT)
DeepLag: Discovering Deep Lagrangian Dynamics for Intuitive Fluid Prediction [45.8] 本稿では, タングルサム流体力学に対処する新しいラグランジアン・ユーレリア複合パラダイムを提案する。
ユーレアン観測に基づいて未来を予測するのではなく、流体中に隠れたラグランジアン力学を発見するためにDeepLagを提案する。
DeepLagは、2Dと3D、シミュレートされた実世界の流体をカバーする3つの挑戦的な流体予測タスクに優れています。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:15:18 GMT)
Practical hybrid PQC-QKD protocols with enhanced security and performance [45.1] 我々は,量子古典ネットワーク内でQKDとPQCが相互運用するハイブリッドプロトコルを開発した。
特に、それぞれのアプローチの個々の性能に対して、スピードと/またはセキュリティを向上する可能性のある、異なるハイブリッド設計について検討する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 00:02:01 GMT)
HuRef: HUman-REadable Fingerprint for Large Language Models [45.0] HuRefは、大きな言語モデルのための人間可読指紋である。
トレーニングやモデルパラメータを公開することなく、ベースモデルを独自に識別する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:14:32 GMT)
$B^4$: A Black-Box Scrubbing Attack on LLM Watermarks [42.9] 透かしは、知覚不可能なパターンを埋め込むことによって、コンテンツ検出の顕著な技術として登場した。
以前の作業では、通常、特定のタイプの透かしが既に知られているグレーボックスアタックの設定が検討されていた。
ここでは、ウォーターマークに対するブラックボックススクラブ攻撃である$mathcalB4$を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:01:44 GMT)
CRONOS: Enhancing Deep Learning with Scalable GPU Accelerated Convex Neural Networks [42.9] 本稿では,2層ニューラルネットワークの凸最適化のためのCRONOSアルゴリズムを提案する。
CroNOSはImageNetのような高次元データセットにスケールできる最初のアルゴリズムである。
次にCRONOS-AMと呼ばれる新しいアルゴリズムを開発し、CRONOSと交互最小化を組み合わせた。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 00:18:59 GMT)
RadioDiff: An Effective Generative Diffusion Model for Sampling-Free Dynamic Radio Map Construction [42.6] 無線マップ(RM)は、位置のみに基づいてパスロスを得ることができる有望な技術である。
本稿では, サンプリングフリーのRM構造を条件付き生成問題としてモデル化し, 高品質なRM構造を実現するためにRadioDiffという名前の拡散拡散法を提案する。
実験の結果,提案したRadioDiffは,3つの精度,構造的類似度,ピーク信号対雑音比の3つの指標において,最先端性能を実現していることがわかった。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 04:52:54 GMT)
Fast and Memory-Efficient Video Diffusion Using Streamlined Inference [41.5] 現在のビデオ拡散モデルは、計算要求と高いピークメモリ使用量を示す。
本稿では,映像拡散モデルの時間的・空間的特性を利用したストリーム線形推論を提案する。
我々のアプローチはピークメモリと計算オーバーヘッドを大幅に削減し、単一のコンシューマGPU上で高品質なビデオを生成することができる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:52:18 GMT)
Me LLaMA: Foundation Large Language Models for Medical Applications [40.6] Me-LLaMAは、オープンソースのLLaMAモデルに基づく新しい医療用LLMファミリーである。
Me-LLaMAは、大規模でドメイン固有のデータセットを活用することで、医学的テキスト分析と診断に最適化されている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:17:34 GMT)
TractShapeNet: Efficient Multi-Shape Learning with 3D Tractography Point Clouds [39.9] トラクトグラフィーのポイントクラウド表現を利用した新しいフレームワークTractShapeNetを導入し、5つの形状測度を計算した。
形状測定計算実験により,提案したTractShapeNetは,他のクラウドベースニューラルネットワークモデルよりも優れていることが示された。
その結果,より高速かつ効率的な形状測定計算が実現できることが示唆された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 09:06:47 GMT)
Point-PRC: A Prompt Learning Based Regulation Framework for Generalizable Point Cloud Analysis [39.9] 近年の研究では、パラメータ効率のよいプロンプトチューニングにより、3次元点雲認識の性能が著しく向上できることが示されている。
本稿では,学習可能なプロンプトが大規模3次元モデルにおいて,よく学習された一般知識と積極的に対話することを可能にする包括的規制フレームワークを提案する。
意外なことに,本手法は,一貫した一般化能力の向上だけでなく,様々な3DDGベンチマークにおけるタスク固有の3D認識性能を明確なマージンで向上させる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 09:09:59 GMT)
SLTrain: a sparse plus low-rank approach for parameter and memory efficient pretraining [39.6] 大規模言語モデル(LLM)をゼロから訓練するには、計算能力と広範なメモリ容量が必要である。
最近の研究では、パラメータとメモリの点で効率的な微調整のための重量の低ランク構造を探索している。
本稿では,SLTrain と呼ばれる事前学習用低ランク行列とスパース行列の和として重みをパラメータ化することを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 06:00:03 GMT)
TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models [39.1] 我々はTypeScoreと呼ばれる新しい評価フレームワークを導入し、モデルが高忠実な埋め込みテキストで画像を生成する能力を評価する。
提案手法は、CLIPScoreよりも高解像度で、一般的な画像生成モデルを区別する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:56:54 GMT)
The Implicit Bias of Gradient Descent on Separable Multiclass Data [38.1] 我々は、指数的尾特性のマルチクラス拡張を導入するために、置換同変と相対マージンベース(PERM)損失の枠組みを用いる。
提案手法は二分法の場合をよく反映しており,二分法と多分法のギャップを埋めるためのPERMフレームワークの威力を示すものである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:39:21 GMT)
COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning [37.8] 実世界の様々な資源から派生した,厳密な人的検証を行う新しい中国語指導調律データセットであるCOIG-CQIAを紹介する。
我々はCOIG-CQIAに関する広範な実験を行い、それらを強力なベースラインモデルやデータセットと比較する。
実験の結果,COIG-CQIAでトレーニングしたモデルは,様々なベンチマークで高い競争性能を達成できた。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:08:49 GMT)
OnlineTAS: An Online Baseline for Temporal Action Segmentation [37.8] この研究は、時間的行動セグメンテーションのためのオンラインフレームワークを提示する。
フレームワークの中核は、時間とともに動的に変化するコンテキストに対応するよう設計されたアダプティブメモリである。
さらに,オンライン環境における重度の過偏化を軽減するための後処理手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:52:08 GMT)
MonoPlane: Exploiting Monocular Geometric Cues for Generalizable 3D Plane Reconstruction [37.5] 本稿では,MonoPlaneという汎用的な3次元平面検出・再構成フレームワークを提案する。
まず、大規模な事前学習ニューラルネットワークを用いて、1つの画像から深度と表面の正常値を得る。
これらの特異な幾何学的手がかりを近接誘導RANSACフレームワークに組み込んで各平面インスタンスに順次適合させる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:15:29 GMT)
Multi-Channel Hypergraph Contrastive Learning for Matrix Completion [37.1] グラフニューラルネットワーク(GNN)は、行列補完において広く使われており、アイテムよりもユーザの好みを捉えている。
行列補完のためのマルチチャネルハイパーグラフコントラスト学習フレームワーク MHCL を提案する。
5つの公開データセットの実験により、提案手法が現在の最先端手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:59:36 GMT)
CHAIN: Enhancing Generalization in Data-Efficient GANs via lipsCHitz continuity constrAIned Normalization [36.2] GAN(Generative Adversarial Networks)は画像生成を著しく進歩させるが、その性能は豊富なトレーニングデータに大きく依存する。
限られたデータを持つシナリオでは、GANは差別者の過度な適合と不安定なトレーニングに苦労することが多い。
我々は、従来の中心ステップをゼロ平均正規化に置き換え、スケーリングステップでリプシッツ連続性制約を統合するCHAINを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:14:15 GMT)
Transfer Learning for Finetuning Large Language Models [36.0] 大規模言語モデルの微調整のための移動学習について検討する。
メタ学習性能とコスト代理モデルを用いて、新しいメタデータセットからグレーボックスメタ最適化の微調整を学習する。
本研究は,大規模言語モデルをより効果的に適応するファインタニングの伝達性を示すものである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 09:43:12 GMT)
PACE: marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization [35.9] PACE は PArameter- efficient fine-tuning with Consistency rEgularization の一般化である。
PACEは、拡張一般化のための勾配を暗黙的に正規化するだけでなく、微調整および事前訓練されたモデルも暗黙的に整列して知識を保持することを示す。
PACEは、VTAB-1k、FGVC、少数ショット学習、ドメイン適応の4つの視覚適応タスクにおいて、既存のPEFTメソッドよりも優れている。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 03:27:12 GMT)
PACE: marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization [35.9] PACE は PArameter- efficient fine-tuning with Consistency rEgularization の一般化である。
PACEは、拡張一般化のための勾配を暗黙的に正規化するだけでなく、微調整および事前訓練されたモデルも暗黙的に整列して知識を保持することを示す。
PACEは、VTAB-1k、FGVC、少数ショット学習、ドメイン適応の4つの視覚適応タスクにおいて、既存のPEFTメソッドよりも優れている。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 03:27:12 GMT)
Assemblage: Automatic Binary Dataset Construction for Machine Learning [35.7] Assemblageはクラウドベースの分散システムで、Windows PEバイナリをクロールし、構成し、構築する。
過去1年間、AWS上でAssemblageを実行し、29のコンフィギュレーションで890kのWindows PEと428kのLinux ELFバイナリを生成しました。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:13:59 GMT)
Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset [35.2] 赤外線小目標検出は、固有の目標特徴の不足と、類似した背景散乱体の存在により、固有の課題を生じさせる。
タスククラスタリングされた赤外線小ターゲット検出を導入し、新しいベンチマークデータセットであるDenseSIRSTを提示する。
本研究では,背景に焦点を絞った単一タスクからマルチタスクアーキテクチャへ,検出パラダイムを変換する背景認識特徴交換ネットワーク(BAFE-Net)を提案する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 15:58:15 GMT)
Guiding Neural Collapse: Optimising Towards the Nearest Simplex Equiangular Tight Frame [34.3] ニューラル・コラプス(英: Neural Collapse, NC)は、ニューラルネットワークにおいて最近観測された現象であり、トレーニング損失がゼロになるまで、最終分類器層の解空間を特徴付ける。
我々は,任意のトレーニングイテレーションにおいて,最寄りの単純なETF幾何の概念を導入している。
各繰り返しにおいて、分類器の重みは、この内部最適化を解くことにより、最も近い単純 ETF に暗黙的に設定される。
分類タスクのための合成および実世界のアーキテクチャに関する実験は,本手法が収束を加速し,訓練安定性を高めることを実証している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:54:31 GMT)
Learning to Control and Coordinate Mixed Traffic Through Robot Vehicles at Complex and Unsignalized Intersections [33.0] 本稿では,実世界の複雑な交差点におけるRVによる混在トラフィックの制御と調整のためのマルチエージェント強化学習手法を提案する。
本手法は,1時間あたり700台の車両の現実的な交通需要の下で,わずか5%のRVを経由した渋滞発生を防止する。
提案手法は,ブラックアウトイベント,突然のRVパーセンテージ低下,V2V通信エラーに対して堅牢である。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:59:45 GMT)
Negative-Free Self-Supervised Gaussian Embedding of Graphs [29.3] グラフコントラスト学習(GCL)は、有望なグラフ自己教師型学習フレームワークとして登場した。
正規化された等方的ガウス関数に従って分布する点が単位超球面全体に均一に広がるという事実に着想を得た、一様性を達成するための負の目的を提案する。
提案手法は,既存のGCL法と比較して,少ないパラメータ,短いトレーニング時間,少ないメモリ消費で競合性能を実現する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:04:40 GMT)
Differential Privacy Mechanisms in Neural Tangent Kernel Regression [29.2] ニューラルタンジェントカーネル(NTK)回帰設定における差分プライバシー(DP)について検討する。
NTKレグレッションの差分プライバシとテスト精度の両面で証明可能な保証を示す。
我々の知る限り、NTKレグレッションに対するDP保証を提供する最初の取り組みである。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 05:30:20 GMT)
Frustratingly Easy Test-Time Adaptation of Vision-Language Models [28.9] エピソードテスト時間適応(TTA)戦略はビジョン・ランゲージ・モデルに適応するための強力な手法として登場した。
本研究では、驚くほど強力なTTA手法が休眠状態にあり、内部に隠されていることを明らかにする。
このアプローチをZERO (TTA with "ゼロ" temperature)と呼びます。
文献で確立された実験的プロトコルに従って、我々のアプローチを徹底的に評価し、ZEROがw.r.t.をはるかに上回っているか、比較していることを示す。
その単純さと比較的無視可能な計算のおかげで、ZEROはこの分野での今後の研究の強力なベースラインとして機能することができる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:29:07 GMT)
LEARNER: Learning Granular Labels from Coarse Labels using Contrastive Learning [28.6] マルチ患者スキャンで訓練されたモデルは、患者のスキャンの微妙な変化を予測することができるか?
最近のコンピュータビジョンモデルは、大きな違いを示すデータに基づいて訓練しながら、きめ細かい違いを学習する。
複数の患者からのクリップに事前トレーニングされたモデルでは、コントラスト学習を用いることで、単一の患者からのスキャンの微妙な違いをより正確に予測できることがわかった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:27:52 GMT)
Bi-Level Graph Structure Learning for Next POI Recommendation [28.4] Next Point-of-interest(POI)推奨は、シーケンシャルなチェックイン履歴と一連のPOI候補に基づいて、ユーザの次の目的地を予測することを目的としている。
本稿では,新しい2段階グラフ構造学習(BiGSL)を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:40:16 GMT)
Ocean-omni: To Understand the World with Omni-modality [28.3] Ocean-omniは、最初のオープンソース 7B Multimodal Large Language Model (MLLM) である。
世界初のオープンソース7Bマルチモーダル大言語モデル(MLLM)であるOcean-omniを紹介する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 12:07:59 GMT)
ChemDFM: A Large Language Foundation Model for Chemistry [27.9] より汎用的で効率的なソリューションは、多くのタスクに対処し、幅広い化学分野における自由形式の対話をサポートするAIモデルである。
我々は化学文献や教科書から34Bトークンを学習し、2.7Mインストラクションを用いて微調整した化学用LLMのパイオニアであるChemDFMを開発した。
我々はHuggingface上のChemDFMの推論コード、評価データセット、モデルウェイトをオープンソース化した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:29:46 GMT)
Calibrated Self-Rewarding Vision Language Models [27.7] LVLM(Large Vision-Language Models)は、訓練済みの大規模言語モデル(LLM)と視覚モデルを統合することで、指導チューニングを通じて大幅に進歩した。
LVLMは、しばしば幻覚現象を示し、生成されたテキスト応答は言語的に妥当に見えるが、入力画像に矛盾する。
本稿では,候補応答を反復的に生成し,各応答に対する報酬を評価し,微調整のための選好データをキュレートすることで,モデルの自己改善を可能にするCalibrated Self-Rewarding(CSR)アプローチを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:51:51 GMT)
Pin-Tuning: Parameter-Efficient In-Context Tuning for Few-Shot Molecular Property Prediction [25.4] そこで本研究では,Pin-Tuningというパラメータ効率の高いインコンテキストチューニング手法を提案する。
具体的には、事前訓練されたメッセージパッシング層(MP-Adapter)のための軽量アダプタと、事前訓練された原子/結合層(Emb-BWC)のためのベイズ重み統合を提案する。
公開データセットで評価すると、トレーニング可能なパラメータが少なくて優れたチューニングが示され、少数ショットの予測性能が向上する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:06:30 GMT)
Covariance-based Space Regularization for Few-shot Class Incremental Learning [25.4] FSCIL(Few-shot Class Incremental Learning)では,ラベル付きデータに制限のあるクラスを継続的に学習する必要がある。
インクリメンタルセッションにおける限られたデータのため、モデルは新しいクラスを過度に適合させ、ベースクラスの破滅的な忘れを苦しむ傾向にある。
最近の進歩は、基本クラス分布を制約し、新しいクラスの識別的表現を学習するプロトタイプベースのアプローチに頼っている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:03:04 GMT)
Uncertainty-biased molecular dynamics for learning uniformly accurate interatomic potentials [25.1] アクティブラーニングは、偏りや偏りのない分子動力学を用いて候補プールを生成する。
既存のバイアスやバイアスのないMDシミュレーション手法は、稀な事象や外挿領域を見逃しがちである。
この研究は、MLIPのエネルギー不確実性に偏ったMDが同時に外挿領域と稀な事象を捉えることを示した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:26:08 GMT)
Building A Coding Assistant via the Retrieval-Augmented Language Model [24.7] 本研究では,コーディング中の人間の知識探索行動を模倣してコードアシスタントを構築するための検索補助言語モデル(CONAN)を提案する。
コード構造対応検索器(CONAN-R)とデュアルビューコード表現に基づく検索拡張生成モデル(CONAN-G)で構成される。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 09:06:26 GMT)
HIP: Hierarchical Point Modeling and Pre-training for Visual Information Extraction [24.5] OCRに依存した手法はオフラインのOCRエンジンに依存し、OCRに依存しない手法は解釈性に欠ける出力や幻覚的内容を含む出力を生成する。
我々は, 階層的視点をモデルとしたHIPを提案し, エンドツーエンドのVIEタスクの階層的性質をよりよく適合させる。
具体的には、このような階層的な点は柔軟に符号化され、その後所望のテキスト書き起こし、地域の中心、エンティティのカテゴリにデコードされる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:00:13 GMT)
PMoL: Parameter Efficient MoE for Preference Mixing of LLM Alignment [24.3] RLHF(Reinforcement Learning from Human Feedback)は,大規模言語モデル(LLM)の嗜好調整に有効な手法であることが証明されている。
そこで本研究では,モデルアーキテクチャの観点からPMoL(Mixture Preference of LoRA)を提案する。
PMoLは、トレーニングコストの低減とともに、より良い嗜好アライメントを実現する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:51:14 GMT)
Music Foundation Model as Generic Booster for Music Downstream Tasks [24.3] 対象の音楽サンプルから階層的特徴を抽出する音楽基礎モデル(MFM)であるSoniDoを紹介する。
階層的な中間機能を活用することで、SoniDoは情報の粒度を制限し、さまざまな下流タスクのパフォーマンスを改善する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:44:27 GMT)
Understanding Multi-Granularity for Open-Vocabulary Part Segmentation [24.1] Open-vocabulary part segmentation (OVPS) は、多種多様な未確認語彙を用いたきめ細かいエンティティのセグメンテーションに焦点を当てた新興研究分野である。
本研究は,部分識別の知識に基づく性質を反映して,複雑な境界と多様な粒度による部分分割の複雑さを強調した。
一般化された部分とオブジェクトレベルのコンテキストを活用する新しいフレームワークであるPartCLIPSegを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:22:40 GMT)
Higher-Rank Irreducible Cartesian Tensors for Equivariant Message Passing [23.8] 原子学シミュレーションは 化学の進歩に不可欠です
機械学習された原子間ポテンシャルは、計算コストのごく一部でアブイニシアト法と第一原理法と同等の精度を達成する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 10:36:51 GMT)
RetinaQA: A Robust Knowledge Base Question Answering Model for both Answerable and Unanswerable Questions [23.7] State-of-the-the-art Knowledge Base Question Answering (KBQA)モデルはすべての質問に答えられると仮定する。
単一KBQAアーキテクチャにおいて2つの重要なアイデアを統一する新しいモデルであるRetinaQAを提案する。
RetinaQAは、解答可能な問題と解答不能な問題の両方を扱う上で、最先端KBQAモデルの適応性を大幅に上回ることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:12:25 GMT)
Visual Whole-Body Control for Legged Loco-Manipulation [22.5] そこで本研究では,ロボットアームを用いた移動操作の問題点について検討する。
視覚的観察により全身制御を自律的に行うことのできる枠組みを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:04:23 GMT)
NEO: Saving GPU Memory Crisis with CPU Offloading for Online LLM Inference [22.2] NEOは、注意計算の一部とKVキャッシュ状態をGPUからローカルホストCPUにオフロードするオンラインLLM推論システムである。
我々は、注意計算とKVキャッシュ状態の一部をGPUからローカルホストCPUにオフロードするオンラインLLM推論システムNEOを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:15:44 GMT)
Assigning Credit with Partial Reward Decoupling in Multi-Agent Proximal Policy Optimization [22.1] 本稿では,MAPPOの改善に向け,近年の信用代入に適応したマルチエージェント強化学習アルゴリズムを提案する。
当社のアプローチであるPRD-MAPPOは、将来期待される報酬に影響を与えないチームメイトからエージェントを分離することで、クレジットの割り当てを合理化します。
PRD-MAPPOはMAPPOと他の最先端手法と比較してデータ効率と性能が著しく向上することを示す。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 18:07:20 GMT)
Narrative Feature or Structured Feature? A Study of Large Language Models to Identify Cancer Patients at Risk of Heart Failure [21.7] 本研究は, 心不全リスクのあるがん患者を同定するための機械学習モデルについて検討した。
肺がん,乳がん,大腸癌と診断され,フロリダ大学から12,806人のがんコホートを同定した。
提案した物語は,特徴密度が著しく増加し,性能が向上した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:12:03 GMT)
SASSL: Enhancing Self-Supervised Learning via Neural Style Transfer [20.8] SASSL: 自己監視学習のためのスタイル拡張は、ニューラルスタイル転送に基づく新しいデータ拡張技術である。
SASSLはイメージのセマンティック属性とスタイリスティック属性を分離し、コンテンツを保存しながらそのスタイルにのみ適用される。
SASSLは、イメージネット上のトップ1画像分類の精度を、確立された自己監督手法と比較して最大2ポイント向上する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:08:45 GMT)
Your Diffusion Model is Secretly a Noise Classifier and Benefits from Contrastive Training [20.5] 拡散モデルはデータをノイズ化することを学び、訓練されたデノイザを使用してデータ分布から新しいサンプルを生成する。
サンプルに追加される雑音のレベルを識別する,新たな自己教師型学習目標を提案する。
提案手法は逐次的および並列的な設定に有効であることを示す。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 00:36:35 GMT)
The Interaction Layer: An Exploration for Co-Designing User-LLM Interactions in Parental Wellbeing Support Systems [20.3] 我々はNurtureBotを開発した。NurtureBotは、新しい親のための幸福なサポートアシスタントだ。
32人の親が非同期リモートコミュニティ方式でシステムを設計した。
32人の親と46人の親によって評価され、ユーザエクスペリエンスとユーザビリティが向上した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:32:36 GMT)
Utilizing Human Behavior Modeling to Manipulate Explanations in AI-Assisted Decision Making: The Good, the Bad, and the Scary [19.9] AIモデルの最近の進歩は、人間の意思決定プロセスへのAIベースの意思決定支援の統合を高めている。
AIによる意思決定の可能性を完全に解き放つために、研究者たちは、人間がAIレコメンデーションを最終決定にどのように組み込むかをコンピュータでモデル化した。
より適切にAIレコメンデーションに頼れるように、人間の意思決定者にAIの説明を提供することは、一般的な慣習となっている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:33:28 GMT)
BinEnhance: A Enhancement Framework Based on External Environment Semantics for Binary Code Search [19.6] Binは、関数間セマンティクスを活用するように設計された新しいフレームワークで、バイナリコード検索のための内部コードセマンティクスの発現を強化する。
BinのHermesSim、Asm2vec、TREX、Gemini、Asteriaへの応用により平均精度(MAP)は53.6%から69.7%に向上した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:54:52 GMT)
Infant Agent: A Tool-Integrated, Logic-Driven Agent with Cost-Effective API Usage [19.5] textscInfant Agentはタスク認識機能、演算子、階層型管理システム、メモリ検索機構を統合する。
textscInfant Agentを使用すると、GPT-4oのSWE-bench-liteデータセットの精度は$mathbf0.33%$から$mathbf30%$に上昇し、AIME-2024数学コンペティションでは、GPT-4oの精度は$mathbf13.3%$から$mathbf37%$に上昇する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:48:37 GMT)
Cross-Modal Learning for Anomaly Detection in Complex Industrial Process: Methodology and Benchmark [19.4] 複雑な産業プロセスにおける異常検出は、効率的で安定で安全な操作を確実にする上で重要な役割を担っている。
本稿では,マグネシウム溶融プロセスにおける視覚特徴(ビデオ)とプロセス変数(電流)の相関を探索し,異常検出を容易にするクロスモーダルトランスを提案する。
本稿では, マグネシウム溶融プロセスの先駆的なクロスモーダルベンチマークを行い, 同期的に取得したビデオデータと電流データを220万以上のサンプルで分析した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:09:38 GMT)
Open LLMs are Necessary for Current Private Adaptations and Outperform their Closed Alternatives [18.9] 閉LLMのプライベート適応のための4つの最新の手法のプライバシ保護と性能について分析する。
真のプライバシ保護のLLM適応を実現するために、現在の方法やモデルを考慮して、オープンなLLMを使用する必要がある。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:02:09 GMT)
ProGen: Revisiting Probabilistic Spatial-Temporal Time Series Forecasting from a Continuous Generative Perspective Using Stochastic Differential Equations [18.6] ProGen Proは、不確実性を管理しながら依存関係を効果的にキャプチャする堅牢なソリューションを提供する。
4つのベンチマークトラフィックデータセットの実験により、ProGen Proは最先端の決定論的確率モデルより優れていることが示された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:37:30 GMT)
How Effective Is Self-Consistency for Long-Context Problems? [18.6] 大規模言語モデル(LLM)の性能向上のために,自己整合性(SC)が実証されている。
本研究では,LLMが位置バイアスに苦しむ長文シナリオにおけるSCの役割について検討した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:52:42 GMT)
Robot Policy Learning with Temporal Optimal Transport Reward [18.6] リワード仕様は強化学習において最も難しい問題の1つです。
最近の研究は、1/2人の専門家によるビデオデモからロボットポリシーを学習する方法を調査している。
本稿では、時間的順序情報を組み込むために、時間的最適輸送(Temporal Optimal Transport, TemporalOT)報酬を導入する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:09:58 GMT)
Finding Optimally Robust Data Mixtures via Concave Maximization [18.1] 機械学習モデルは、ユーザグループのセットなど、事前に定義されたいくつかの設定でうまく機能するように要求される。
ミニマックス最適混合分布は, 簡単な凸問題の解であることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:06:58 GMT)
Learning to Edit Visual Programs with Self-Supervision [17.9] 視覚プログラムの編集方法を学ぶシステムを設計する。
編集ネットワークは、完全な入力プログラムと視覚的ターゲットを消費する。
入力プログラムに適用可能なローカル編集操作の予測をネットワーク上で行うことで,ターゲットとの類似性を向上する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:46:08 GMT)
Test-Time Adaptation in Point Clouds: Leveraging Sampling Variation with Weight Averaging [17.7] テスト時間適応(TTA)は、ソースデータにアクセスせずに事前訓練されたモデルを適用することで、テスト中の分散シフトに対処する。
本稿では,3次元点雲分類のための新しいTTA手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:59:25 GMT)
Swan and ArabicMTEB: Dialect-Aware, Arabic-Centric, Cross-Lingual, and Cross-Cultural Embedding Models and Benchmarks [17.6] スワン(Swan)は、アラビア語を中心にした埋め込みモデルのファミリーである。
2つの変種: Swan-SmallはArBERTv2をベースとしており、Swan-Largeはアラビア語で事前訓練された大言語モデルであるArMistralをベースとしている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 09:39:49 GMT)
Predicting the Geolocation of Tweets Using transformer models on Customized Data [17.6] 本研究は、ツイート/ユーザ位置情報予測タスクを解決することを目的としている。
提案手法は、自然言語処理のためのニューラルネットワークを実装し、位置を推定する。
提案されたモデルの範囲は、Twitterデータセットで微調整されている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:56:36 GMT)
Multistable Shape from Shading Emerges from Patch Diffusion [17.1] 単一シェーディング画像から形状のマルチモーダル分布を再構成するモデルを提案する。
このモデルから,人間がマルチスタブルであるとして経験するあいまいなテスト画像に対して,マルチスタブルな形状説明が現れることを示す。
これは、3D形状の知覚のための新しいアーキテクチャを刺激し、より効率的で、人間の体験に合わせたものになるかもしれない。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:34:20 GMT)
Infinite-Resolution Integral Noise Warping for Diffusion Models [16.8] トレーニング不要なノイズ空間操作は、効果的なテクニックであることが証明されている。
課題は、時間的一貫性を付加しながら、ガウスのホワイトノイズ分布を保存することである。
計算コストを桁違いに削減しつつ,無限解像度の精度を実現するアルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:05:00 GMT)
Guiding Multi-agent Multi-task Reinforcement Learning by a Hierarchical Framework with Logical Reward Shaping [16.6] 本研究の目的は,論理報酬形成を伴う多エージェント協調アルゴリズムを設計することである。
Minecraftのような環境下で様々な種類のタスクで実験が行われてきた。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 09:03:23 GMT)
Benchmarking Badminton Action Recognition with a New Fine-Grained Dataset [16.4] 高品質なバドミントン映像から得られたビデオバドミントンデータセットを紹介する。
VideoBadmintonの導入は、バドミントンアクション認識だけでなく、きめ細かいアクションを認識するためのデータセットも提供する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:29:58 GMT)
Adaptive World Models: Learning Behaviors by Latent Imagination Under Non-Stationarity [16.2] 私たちは新しいフォーマリズム、Hiddenを紹介します。
POMDP - 適応的な世界モデルで制御するために設計された。
提案手法は, 様々な非定常RLベンチマークにおけるロバストな動作の学習を可能にすることを実証する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:09:56 GMT)
A Framework for Bilevel Optimization on Riemannian Manifolds [16.2] 両レベル最適化問題を解くためのフレームワークを導入する。
本稿では,いくつかの過次推定手法を提案し,その推定誤差を解析する。
フレームワークを拡張し、二段階最適化を包含し、一般的なリトラクションを取り入れます。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:41:49 GMT)
EDGE: Enhanced Grounded GUI Understanding with Enriched Multi-Granularity Synthetic Data [15.8] 本稿では,大規模視覚言語モデル(LVLM)のGUI理解と対話能力を,データ駆動型アプローチにより向上することを目的とする。
本稿では,Web上のWebページから大規模で粒度の高いトレーニングデータを自動的に生成する汎用データ合成フレームワークEDGEを提案する。
提案手法は,手動アノテーションへの依存を著しく低減し,研究者がWeb上で利用可能な膨大な公開リソースを活用して作業を進めることを可能にする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:54:21 GMT)
An Event-centric Framework for Predicting Crime Hotspots with Flexible Time Intervals [15.7] FlexiCrimeは、フレキシブルな時間間隔で犯罪のホットスポットを予測する新しいイベントフレームワークである。
犯罪状況の特徴を学習する犯罪イベント間の相関を捉えるために、連続的な注意ネットワークが組み込まれている。
過去の犯罪事件の頻度を考慮し、特定の時間と場所における特定の犯罪種のリスクを測定する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:38:10 GMT)
DDIPrompt: Drug-Drug Interaction Event Prediction based on Graph Prompt Learning [15.7] DDIPromptは、グラフプロンプト学習の最近の進歩に触発された革新的なソリューションである。
我々のフレームワークは、事前訓練されたモデルから本質的な知識を活用することで、これらの問題に対処することを目的としている。
2つのベンチマークデータセットに対する大規模な実験は、DDIPromptのSOTAパフォーマンスを示している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:36:54 GMT)
Longitudinal Wrist PPG Analysis for Reliable Hypertension Risk Screening Using Deep Learning [15.7] 本研究では、ResNetやTransformerなどのディープラーニングモデルを用いて、スマートウォッチで収集した手首PSGデータを分析して、効率的な高血圧リスクスクリーニングを行う。
0.124Mパラメータを持つコンパクトなResNetモデルは、従来の機械学習手法よりも大幅に向上した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 20:42:20 GMT)
Automatically Analyzing Performance Issues in Android Apps: How Far Are We? [15.6] 実世界のアプリケーションや文献におけるAndroidのパフォーマンス問題に関する大規模な比較研究を行っている。
以上の結果から,研究者,開発者,ユーザの主なパフォーマンス上の問題に,大きな違いがあることが判明した。
コミュニティにとって、これらのギャップを埋め、パフォーマンス問題の包括的な検出と解決を達成するための努力を強化することが重要です。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 12:46:53 GMT)
System-Aware Neural ODE Processes for Few-Shot Bayesian Optimization [15.6] 本稿では,システムの事前情報に基づくベイズ最適化フレームワークについて紹介する。
我々はSANODEPの動的システムにおける数ショットBOの可能性を示す広範囲な実験を行った。
また、SANODEPの様々な事前情報への適応性についても検討し、事前の柔軟性とモデルの適合精度のトレードオフを強調した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 23:30:29 GMT)
Desert Camels and Oil Sheikhs: Arab-Centric Red Teaming of Frontier LLMs [15.4] 大規模言語モデル(LLM)は広く使われているが、社会的バイアスが組み込まれているため倫理的懸念が高まる。
本研究では、女性の権利、テロリズム、反ユダヤ主義を含む8つの領域にわたるアラブ人と西洋人に対するLCMバイアスについて検討する。
GPT-4, GPT-4o, LlaMA 3.1 (8Bおよび405B), Mistral 7B, Claude 3.5 Sonnetの6つのLCMを評価した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:02:32 GMT)
Forecasting Treatment Response with Deep Pharmacokinetic Encoders [14.9] 本稿では,患者固有の治療効果の深層学習モデルを示すハイブリッドグローバルローカルアーキテクチャとPKエンコーダを提案する。
本研究は,血糖予測タスクにおける精度向上のためのアプローチの有効性を示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:34:52 GMT)
InversionView: A General-Purpose Method for Reading Information from Neural Activations [14.6] ニューラル・アクティベーションに符号化された情報を 完全に解読できれば ニューラルネットワークの内部動作は よりよく理解できる
InversionViewを提案し、アクティベーションに条件付きトレーニングされたデコーダモデルからサンプリングすることで、このサブセットを実際に検査することができる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:13:06 GMT)
Generalization of Compositional Tasks with Logical Specification via Implicit Planning [14.5] 本稿では,タスク一般化の効率性と最適性を向上する階層的RLフレームワークを提案する。
高いレベルでは、作曲タスクの一般化に特化して設計された暗黙のプランナーを示す。
潜時遷移モデルを学び、グラフニューラルネットワーク(GNN)を用いて潜時空間で計画を実行する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 17:17:32 GMT)
Rule Based Rewards for Language Model Safety [14.4] Rule Based Rewards (RBR) は、望ましい行動や望ましくない行動にルールの集合を使用する。
RBRは効果的な訓練方法であり、F1スコアは97.1であり、人間フィードバックベースラインは91.7である。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:22:21 GMT)
CERET: Cost-Effective Extrinsic Refinement for Text Generation [14.4] 本研究では,意味的安定性,包含性,サンプル間不確実性を考慮したテキスト生成手法であるCERETを提案する。
実験結果から, CERETは, 各種タスク設定下での自己整合性, 自己整合性, 自走性ベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:18:56 GMT)
The Role of Domain Randomization in Training Diffusion Policies for Whole-Body Humanoid Control [14.4] Policies Diffusion (DPs)は、ロボット操作の驚くべき結果を示している。
本稿では,人体全体制御のためのDPの性能に及ぼすデータセットの多様性とサイズの影響について検討する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:33:28 GMT)
Optimizing Federated Learning by Entropy-Based Client Selection [13.9] ディープラーニングドメインは通常、最適なパフォーマンスのために大量のデータを必要とします。
FedOptEntは、ラベル配布スキューによるパフォーマンスの問題を軽減するように設計されている。
提案手法は,最先端のアルゴリズムを最大6%の精度で高速化する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:31:36 GMT)
FEED: Fairness-Enhanced Meta-Learning for Domain Generalization [13.8] モデルフェアネスを認識しながら配布外データに一般化することは、メタラーニングにおいて重要かつ困難な問題である。
本稿では,ドメインの一般化能力を大幅に向上させるフェアネスを考慮したメタラーニング手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:34:33 GMT)
Interacting Large Language Model Agents. Interpretable Models and Social Learning [13.4] 本稿では,統計処理とマイクロエコノミクスの手法を用いて,大規模言語モデルエージェント(LLMA)と相互作用する理論とアルゴリズムを開発する。
相互作用するLLMAは事前の判断や外部からの入力から学習するため、バイアスや牧畜行動を示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:49:34 GMT)
Stable Offline Value Function Learning with Bisimulation-based Representations [13.0] 強化学習では、固定目標ポリシーに従って行動を行う際に、各状態から期待される割引リターンを推定するために、オフライン値関数学習を用いる。
状態-作用表現を明示的に形成することにより、値関数学習を安定させることが重要である。
我々は、オフラインポリシー評価(KROPE)のためのカーネル表現と呼ばれるシミュレーションベースのアルゴリズムを導入する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 19:33:27 GMT)
GarmentLab: A Unified Simulation and Benchmark for Garment Manipulation [12.9] GarmentLabは、変形可能なオブジェクトと衣料品の操作のために設計された、コンテンツリッチなベンチマークと現実的なシミュレーションである。
私たちのベンチマークには、さまざまな種類の衣料品、ロボットシステム、マニピュレータが含まれています。
これらの課題に対して、最先端のビジョン手法、強化学習、模倣学習アプローチを評価した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 10:09:08 GMT)
Diffusion Models as Cartoonists! The Curious Case of High Density Regions [12.9] 拡散モデルの高密度領域における画像の種類について検討する。
そこで本研究では,従来よりも高い確率で画像を生成する実用的な高確率サンプリング器を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:02:47 GMT)
Changing the Training Data Distribution to Reduce Simplicity Bias Improves In-distribution Generalization [12.5] シャープネスを意識した最小化(SAM)は,特に初期の時代において,異なる特徴をより均一に学習することを示す。
i) トレーニングの早い段階でネットワーク出力に基づいてサンプルをクラスタリングし、(ii) 類似したネットワーク出力を持つサンプルのクラスタを特定し、(iii) 単純さのバイアスを軽減するために、残りのサンプルを1回だけアップサンプリングする手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 00:51:16 GMT)
Consensus Learning with Deep Sets for Essential Matrix Estimation [12.4] 本稿では,Deep Setsに基づくよりシンプルなネットワークアーキテクチャを提案する。
提案手法は,不整点一致を同定し,不整点一致の変位雑音をモデル化する。
重み付きDLTモジュールはこれらの予測を使って必須行列を回帰する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:05:02 GMT)
Multi-modal Speech Emotion Recognition via Feature Distribution Adaptation Network [12.2] 本稿では,特徴分布適応ネットワーク(Feature Distribution Adapted Network)と呼ばれる新しい深層帰納学習フレームワークを提案する。
本手法は,感情の一貫した表現を得るために,深層移動学習戦略を用いて視覚的特徴分布と音声的特徴分布を整列させることを目的とする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:52:23 GMT)
Regret of exploratory policy improvement and $q$-learning [12.1] 我々は,Jia と Zhou が導入した$q$-learning および関連アルゴリズムの収束について検討する。
モデルパラメータの成長と規則性に関する適切な条件の下で、探索的政策改善アルゴリズムと$q$-learningアルゴリズムの両方の量的誤りと後悔の分析を行う。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:28:34 GMT)
Persistent Test-time Adaptation in Recurring Testing Scenarios [12.0] 現在のテスト時間適応(TTA)アプローチは、継続的に変化する環境に機械学習モデルを適用することを目的としている。
しかし,TTA法が長期にわたって適応性を維持することができるかどうかは不明である。
本稿では,モデルが崩壊に向かって変動していることを検知し,適応戦略を調整する永続的TTA(PeTTA)を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:18:19 GMT)
Do LLMs Know to Respect Copyright Notice? [11.1] 保護材料を含むユーザ入力を処理する際に,言語モデルが著作権を侵害するか否かを検討する。
我々の研究は、言語モデルが著作権を侵害する可能性の程度を保守的に評価する。
本研究は、LLMが著作権規制を尊重することのさらなる調査の必要性と重要性を強調している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:45:21 GMT)
TabVer: Tabular Fact Verification with Natural Logic [11.0] 本稿では,自然論理の文脈における数値と算術関数の集合論的解釈を提案する。
大規模言語モデルを用いて,テーブル上で関数を実行することで応答するクレームの健全な部分に関する質問を生成することにより,算術式を生成する。
FEVEROUS上の数ショット設定では、71.4の精度を達成し、完全な神経的および象徴的推論モデルの両方を3.4ポイント上回る。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 00:36:34 GMT)
PRIMO: Progressive Induction for Multi-hop Open Rule Generation [10.8] 機械にオープンルール知識を注入することは、対話や関係抽出といった下流タスクのパフォーマンスを向上させるのに役立つ。
既存のアプローチでは、マルチホップシナリオを無視して、シングルホップのオープンルール生成に重点を置いている。
プログレッシブな多段階オープンルール生成法であるPRIMOを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 10:33:50 GMT)
MADOD: Generalizing OOD Detection to Unseen Domains via G-Invariance Meta-Learning [10.4] 本稿では,メタ学習型Across Domain Out-of-Distribution Detection (MADOD)を紹介した。
タスク構築において重要な革新は、各メタ学習タスク内で、分散クラスを擬似OODとしてランダムに指定することである。
実世界のデータセットと合成データセットの実験により、MADODは目に見えない領域を横断するセマンティックOOD検出において優れた性能を示した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:46:23 GMT)
Optimal energy storage and collective charging speedup in the central-spin quantum battery [10.4] 量子電池(QB)は、充電過程を加速し、最適なエネルギー貯蔵を実現するために量子力学の原理を利用する。
本研究では,N_b$ spin-1/2 電池セルが$N_c$ spin-1/2 充電器ユニットと相互作用する中心スピンQBモデルの解析を行った。
本研究は,QBにおける非平衡帯電ダイナミクスの解析的理解に,動的に出現するSU(2)対称性が果たす重要な役割を明らかにするものである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:23:52 GMT)
Nearly Tight Black-Box Auditing of Differentially Private Machine Learning [10.3] 本稿では,ブラックボックス脅威モデルにおけるDP-SGDアルゴリズムの監査手順を提案する。
DP-SGDのプライバシ分析は、初期モデルパラメータの選択に非依存であるからである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:40:47 GMT)
Code-Switching Red-Teaming: LLM Evaluation for Safety and Multilingual Understanding [10.2] 赤チームクエリのコードスイッチングは、大規模言語モデル(LLM)の望ましくない振る舞いを効果的に引き出すことができる
コードスイッチング型リピートクエリを合成するための,シンプルで効果的なフレームワークCSRTを導入する。
CSRTは,既存の多言語リピート技術よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 06:21:44 GMT)
Aligner: Efficient Alignment by Learning to Correct [10.1] モデルに依存しないプラグアンドプレイモジュールであるAlignerを導入し、好ましくない回答と好ましくない回答の補正残差を学習する。
トレーニングはワンオフで、さまざまなオープンソースおよびAPIベースのモデルに適用できるため、迅速なイテレーションに適している。
実験では、11の異なる言語モデルに同じAlignerモデルをデプロイすることで、パフォーマンスの向上を実証した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 10:01:38 GMT)
Tri-Level Navigator: LLM-Empowered Tri-Level Learning for Time Series OOD Generalization [10.0] 事前学習された大言語モデルを用いた時系列OOD一般化について検討する。
まず,textbfSeries textbfOOD 一般化のための新しい textbfTri レベルの学習フレームワーク TTSO を提案する。
本稿では,この三段階最適化問題に適した階層化ローカライゼーションアルゴリズムを開発し,提案アルゴリズムの保証収束を理論的に実証する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 00:58:53 GMT)
LLM4PR: Improving Post-Ranking in Search Engine with Large Language Models [9.6] 検索エンジンにおける後処理のための大規模言語モデル(LLM4PR)
検索エンジン(LLM4PR)におけるポストランキングのための大規模言語モデル(Large Language Models for Post-Ranking)という新しいパラダイムを導入する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:36:16 GMT)
Can Multimodal Large Language Model Think Analogically? [9.5] MLLM(Multimodal Large Language Model)は、その創発的な機能のために最近、かなりの議論を巻き起こした。
説明者としてのtextitMLLM と予測者としての textitMLLM の2つの側面を探索する。
本稿では、MLLMの理解能力を利用して既存のモデルを拡張する統一的なプロンプトテンプレートと手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:59:49 GMT)
NeuroBOLT: Resting-state EEG-to-fMRI Synthesis with Multi-dimensional Feature Mapping [9.4] 我々は,脳内のfMRI活動信号に生の脳波データを変換するためにNeuroBOLT,すなわちNeuro-to-BOLD Transformerを導入する。
実験の結果,NeuroBOLTは一次感覚野,高レベル認知領域,深部皮質下脳領域から観測不能なfMRI信号を効果的に再構成することがわかった。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 18:31:34 GMT)
TODO: Enhancing LLM Alignment with Ternary Preferences [9.3] Tie-rank Oriented Bradley-Terry Model (BT) はBradley-Terry Model (BT) の拡張であり、タイを明示的に取り入れている。
そこで本研究では,TOBTの3次ランキングシステムを活用し,優先アライメントを改善する新しいアライメントアルゴリズムであるTie-rank Oriented Direct Preference Optimization (TODO)を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:36:03 GMT)
CogDevelop2K: Reversed Cognitive Development in Multimodal Large Language Models [9.3] 本稿では,マルチモーダル大規模言語モデル(MLLM)において,人間の知能が生み出す中核的認知能力について考察する。
プリミティブ知識から意図理解のようなより複雑な能力まで,12のサブ概念にまたがる包括的なベンチマークであるCogDevelop2Kを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:07:54 GMT)
Role Play: Learning Adaptive Role-Specific Strategies in Multi-Agent Interactions [9.0] emphRole Play (RP) という新しいフレームワークを提案する。
RPは、政策の多様性の課題を、より管理可能な役割の多様性に変えるために役割埋め込みを採用している。
ロール埋め込み観察で共通の方針を訓練し、他のエージェントのジョイントロール埋め込みを推定するためにロール予測器を使用し、学習エージェントが割り当てられた役割に適応するのを助ける。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:25:48 GMT)
StoryVerse: Towards Co-authoring Dynamic Plot with LLM-based Character Simulation via Narrative Planning [8.9] 大きな言語モデル(LLM)は仮想文字の振る舞いを駆動し、プロットは文字と環境間の相互作用から現れる。
著者の著作意図と LLM によるキャラクタシミュレーションの創発的行動とを仲介するプロット作成ワークフローを提案する。
このプロセスは「生きた物語」を作り、様々なゲーム世界の状態に動的に適応し、著者、キャラクターシミュレーション、プレイヤーが共同で物語を作る。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:29:11 GMT)
Relax and Merge: A Simple Yet Effective Framework for Solving Fair $k$-Means and $k$-sparse Wasserstein Barycenter Problems [8.7] 複数のグループからなるデータセットが与えられた場合、公正性制約は各クラスタに各グループからのポイントの割合を含む必要がある。
我々はRelax と Merge' のフレームワークを提案し、$rho$ は既製のvanilla $k$-means アルゴリズムの近似比である。
PTASが$k$-meansである場合、我々の解は、フェアネス制約にわずかに違反するだけで、$(5+O(epsilon))$の近似比を達成できる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:50:12 GMT)
Linear Partial Gromov-Wasserstein Embedding [8.2] Gromov Wasserstein(GW)問題は、機械学習とデータサイエンスコミュニティへの関心が高まっている。
PGW問題に対する線形化埋め込み手法であるGromov Wasserstein埋め込みを提案する。
古典的 OT 問題に対する線形化手法と同様に、LPGW が計量測度空間の有効な計量を定義することを証明している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:56:11 GMT)
HEST-1k: A Dataset for Spatial Transcriptomics and Histology Image Analysis [8.2] 1,229個の空間転写プロファイルの集合であるHEST-1kを紹介する。
HEST-1kは、26の臓器、2つの種(Homo SapiensとMus Musculus)、25のがんタイプから367のがんサンプルを含む153の公立および内部コホートから組み立てられた。
HEST-Libraryは、HESTサンプルでさまざまなアクションを実行するように設計されたPythonパッケージである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:16:07 GMT)
One Arrow, Many Targets: Probing LLMs for Multi-Attribute Controllable Text Summarization [7.7] Multi-Attribute Controllable Summarization (MACS)は、自然言語処理(NLP)コミュニティの中で確立されたタスクである。
本研究は,大規模言語モデルのレンズを通してMACSタスクを調べることで,そのギャップに対処する。
2つの異なる制御可能な属性からの学習を統合するために,新しい階層型アダプタ融合手法を提案し,評価する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:07:25 GMT)
Quantum entanglement and non-Hermiticity in free-fermion systems [7.5] 本稿では,非エルミート自由フェルミオン量子系における絡み合いの一般化と応用の急速な進展を報告する。
特に、エンタングルメントの概念がエルミート自由フェルミオン系から非エルミート系へどのように拡張されるかに焦点を当てる。
我々は、絡み合いエントロピーが非エルミート物理学を特徴づける強力な診断ツールであることを示し、様々な具体的な研究を強調した。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 12:10:29 GMT)
Supervised Learning Guarantee for Quantum AdaBoost [7.5] ノイズの多い中間スケール量子(NISQ)時代には、変分量子アルゴリズムは量子回路の量子ビット数の制限と浅い深さのために制約される。
本稿では,量子適応ブースティング(AdaBoost)の学習保証を理論的に確立し,数値的に検証する。
我々の研究は、現在のNISQ時代において、適切なアンサンブル法を導入することは、量子機械学習アルゴリズムの性能向上に特に有用であることを示している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 06:02:37 GMT)
SplatFace: Gaussian Splat Face Reconstruction Leveraging an Optimizable Surface [7.1] SplatFaceは3次元人間の顔再構成のための新しいガウススプレイティングフレームワークであり、正確な事前決定幾何に依存しない。
本手法は,高品質な新規ビューレンダリングと高精度な3Dメッシュ再構成の両方を同時に実現するように設計されている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:33:46 GMT)
Deep Multi-contrast Cardiac MRI Reconstruction via vSHARP with Auxiliary Refinement Network [7.0] 本稿では,2次元動的マルチコントラスト,マルチスキーム,マルチアクセラレーションMRIの深層学習に基づく再構成手法を提案する。
提案手法は,半2乗変数分割とADMM最適化を利用した最先端のvSHARPモデルを統合する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:59:35 GMT)
Enhancing Neural Network Interpretability with Feature-Aligned Sparse Autoencoders [6.8] 類似した特徴を学習するために、並列訓練されたSAEを奨励し、特徴学習を改善するための正規化手法を提案する。
textscMFRは、GPT-2 Smallで最大21.21%、EEGデータで6.67%のSAEの再構築損失を改善することができる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:42:23 GMT)
Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges [6.6] LLM-as-a-judgeパラダイムは,大規模言語モデルを評価するアプローチとして急速に普及している。
本稿では,人間間の合意が高いクリーンなシナリオに焦点を当てる。
我々は、複雑性や長さを早めるための感度や、寛大さへの傾向など、審査モデルの脆弱性を識別する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:07:06 GMT)
AquaFuse: Waterbody Fusion for Physics Guided View Synthesis of Underwater Scenes [6.5] 水中画像中の水体特性を合成する物理法であるAquaFuseについて紹介する。
AquaFused画像は94%以上の奥行き一貫性と90-95%の構造的類似性を保っていることがわかった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:20:06 GMT)
Spectral Clustering via Orthogonalization-Free Methods [6.5] スペクトルクラスタリングのための直交化のない4つの手法を提案する。
理論上、2つの方法が対称正規化ラプラシアンの最小固有値に対応する固有ベクトルに同型な特徴に収束する。
提案手法のスケーラビリティを示す数値計算結果を提供する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:46:40 GMT)
Federated Learning with Relative Fairness [6.5] 本稿では,クライアントのテキストの公平性を実現するための,連合学習フレームワークを提案する。
提案フレームワークは,分散ロバスト最適化(DRO)における従来の手法を拡張し,相対不公平性を最小化するミニマックス問題手法を用いる。
クライアント間の大きな損失と小さな損失の比率に基づいて、新しい公正度指数を導入し、トレーニングされたモデルの相対的公正性を評価し改善する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:12:49 GMT)
Hierarchical and Density-based Causal Clustering [6.1] 本稿では,既成のアルゴリズムを用いて簡易かつ容易に実装可能なプラグイン推定器を提案する。
さらに,それらの収束率について検討し,因果クラスタリングの付加コストが基本的に結果回帰関数の推定誤差であることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:01:04 GMT)
PARIS: A Practical, Adaptive Trace-Fetching and Real-Time Malicious Behavior Detection System [6.1] 本稿では,適応的トレースフェッチ,軽量かつリアルタイムな悪意ある行動検出システムを提案する。
具体的には、Event Tracing for Windows (ETW)で悪意ある振る舞いを監視し、悪意のあるAPIやコールスタックを選択的に収集することを学ぶ。
その結果、より広い範囲のAPIを監視し、より複雑な攻撃行動を検出することができる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:52:04 GMT)
Compilation for Dynamically Field-Programmable Qubit Arrays with Efficient and Provably Near-Optimal Scheduling [6.0] 我々は中性原子に基づく動的フィールドプログラマブル量子ビットアレイのコンパイラを開発した。
コンパイラのEnolaは、OLSQ-DPQAと比較して、このステージ数を3.7倍に減らし、忠実度を5.9倍改善します。
Enolaは、30分以内で1万キュービットの回路をコンパイルできるなど、非常にスケーラブルである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:11:35 GMT)
NALA: an Effective and Interpretable Entity Alignment Method [5.9] 非公理論理(NAL)を用いた3種類の論理推論経路をキャプチャするエンティティアライメント手法であるNALAを導入する。
NALAは推論パスの結論を統合することで、エンティティと関係を反復的に調整する。
実験結果から、NALAはHits@1の観点から最先端の手法よりも優れており、教師なし設定と教師なし設定の両方でDBP15Kの3つのデータセットで0.98以上を達成している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:58:01 GMT)
Wonderful Matrices: More Efficient and Effective Architecture for Language Modeling Tasks [5.8] 構造化状態空間双対アルゴリズムにおける異なる位置符号化の有効性と、より効率的なSSD-Attn内部および外部関数混合法について検討した。
同じマトリックスは、異なるアルゴリズムで非常に素晴らしいので、新しいハイブリッドスパースアーキテクチャ、Cheemsを確立することができます。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 12:56:07 GMT)
Wonderful Matrices: More Efficient and Effective Architecture for Language Modeling Tasks [5.8] 構造化状態空間双対アルゴリズムにおける異なる位置符号化の有効性と、より効率的なSSD-Attn内部および外部関数混合法について検討した。
同じマトリックスは、異なるアルゴリズムで非常に素晴らしいので、新しいハイブリッドスパースアーキテクチャ、Cheemsを確立することができます。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 12:56:07 GMT)
Privacy-Preserving Federated Learning with Differentially Private Hyperdimensional Computing [5.7] フェデレートラーニング(FL)はIoT(Internet of Things)環境での効率的なデータ交換に不可欠である。
プライバシ保護によるフェデレーションハイパー次元コンピューティング(FedHDPrivacy)について紹介する。
FedHDPrivacyは、前回のラウンドから累積ノイズを理論的に追跡することで、プライバシとパフォーマンスのバランスを慎重に管理する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:00:44 GMT)
CmdCaliper: A Semantic-Aware Command-Line Embedding Model and Dataset for Security Research [5.6] この研究は、プライバシと規制上の懸念による包括的なデータセットの欠如によって妨げられているサイバーセキュリティのコマンドライン埋め込みに対処する。
本稿では,CyPHERという類似のコマンド行のトレーニングと非バイアス評価のための最初のデータセットを提案する。
トレーニングセットは,28,520の類似のコマンドラインペアからなる大規模言語モデル(LLM)を用いて生成される。
我々のテストデータセットは、実際のコマンドラインデータから得られた2,807の類似のコマンドラインペアで構成されています。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:30:45 GMT)
Cloned Identity Detection in Social-Sensor Clouds based on Incomplete Profiles [5.4] 本研究では,プライバシに敏感なプロファイルデータに直面したソーシャルセンシングクラウドサービスプロバイダ(ソーシャルメディアユーザ)のクローンIDを効果的に検出する手法を提案する。
提案手法はICD-IPDと命名され,ソーシャルメディアから収集したユーザアカウントのセットから,ユーザ名や画面名に類似したアカウントペアを抽出する。
その後、与えられたアカウントに関連するマルチビュー表現を学び、単一のアカウントごとに2つのカテゴリの機能を抽出する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:23:22 GMT)
Causal effects based on distributional distances [5.1] 本研究では,2種類の対象パラメータに着目し,分布距離による因果効果の特徴付けを検討する。
まず, 対物的結果密度を2倍に高め, 対物的結果密度を2倍に推算する手法を提案する。
2つ目は、異なる反事実分布間の$L_q$距離によって定義される新しい分布因果効果である。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:58:04 GMT)
Spatial Transformers for Radio Map Estimation [5.1] ラジオマップ推定(RME)は、受信した信号強度などの測定値を計測されていない場所で予測する。
現在最も人気のある推定器は、測定位置を通常の格子に投影し、畳み込み型ディープニューラルネットワークで測定テンソルを完了している。
本稿では,ラジオマップ推定のための空間トランスフォーマー (Spatial TransfOrmer) と呼ばれる注意に基づく推定器を用いて,これらの制約に対処する。
ストームは1つのレイトレーシングと2つの実際のデータセットによる実験によって広範囲に検証されている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:04:45 GMT)
Active Self-Semi-Supervised Learning for Few Labeled Samples [4.7] アノテーションを限定した深層モデルのトレーニングは、さまざまな実践領域に適用する上で、大きな課題となる。
我々は,シンプルで効果的な自己半教師付き学習(AS3L)を提案する。
擬似ラベル(PPL)を用いたAS3Lブートストラップ半教師付きモデル
我々は,正確なPPLを得るために,能動的学習とラベル伝搬戦略を開発した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:53:53 GMT)
Fréchet Denoised Distance: Enhancing Plausibility Evaluation for Generated Designs with Denoising Autoencoder [4.6] そこで本稿では,DAE (Denoising Autoencoder) を用いて評価画像の符号化を行い,遅延空間内の分布距離を計測する。
そこで我々は、FDD(Fr'echet Denoized Distance)という新しいメトリクスを設計する。
我々のFDDは、効果的に不明瞭な構造を検出でき、人間の専門家による構造検査とより整合している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:39:35 GMT)
Wonderful Matrices: More Efficient and Effective Architecture for Language Modeling Tasks [4.6] 本稿では,動的マスクを用いた内部関数注意法を提案し,注意アルゴリズムの表現性を向上する。
我々はまた、スパース活性化フィードフォワードネットワークの粒度を改善することができる専門家のクロスドメイン混合物を設計する。
我々は、言語モデリングタスクの実験を行い、Wonderful Matricesは複雑な言語タスクの処理においてより効率的で効果的であることを示す。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 12:56:07 GMT)
Physics-informed Shadowgraph Network: An End-to-end Density Field Reconstruction Method [4.5] 本研究では,物理インフォームドニューラルネットワークを用いたシャドウグラフ画像から密度場を定量的に再構成する手法を提案する。
物理インフォームドニューラルネットワークを用いて、シャドウグラフ画像から密度場を再構築する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:45:32 GMT)
Few-Class Arena: A Benchmark for Efficient Selection of Vision Models and Dataset Difficulty Measurement [4.2] Few-Class Arena (FCA) は、少数のクラスで効率的な画像分類モデルをテストするための統一ベンチマークである。
FCAは、Few-Class Regimeで効率的な機械学習のための新しいツールを提供する。新しい効率的なクラス類似性の提案から、軽量なモデルアーキテクチャ設計、新しいスケーリング法則まで幅広い目標がある。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:31:47 GMT)
Receding Hamiltonian-Informed Optimal Neural Control and State Estimation for Closed-Loop Dynamical Systems [4.1] Hamiltonian-Informed Optimal Neural (Hion) コントローラは、動的システムのためのニューラルネットワークベースの新しいクラスである。
ヒオンコントローラは将来の状態を推定し、ポントリャーギンの原理を用いて最適制御入力を計算する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:06:29 GMT)
LibreLog: Accurate and Efficient Unsupervised Log Parsing Using Open-Source Large Language Models [3.8] 本稿では,オープンソースのLLMを活用した教師なしログ解析手法であるOpenLogを紹介する。
OpenLogは、最先端の解析精度を確保しながら、プライバシとコストの懸念に対処する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 02:00:09 GMT)
Gibberish is All You Need for Membership Inference Detection in Contrastive Language-Audio Pretraining [3.7] 既存のMIAは入力としてオーディオを必要とし、音声プリントの露出を危険にさらし、コストのかかるシャドウモデルを必要とする。
我々はまず,CLAPが与える会員推論検出に基づく確率ランキングである PRMID を提案し,訓練シャドウモデルを必要としない。
次に,テキストデータのみを用いて対象モデルを問合せする一助話者レベルメンバシップ推定器USMIDを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 10:00:52 GMT)
Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation [3.7] クロスD Conv 演算はフーリエ領域における位相シフトを学習することで次元ギャップを橋渡しする。
本手法は2次元と3次元の畳み込み操作間のシームレスな重み移動を可能にする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:03:44 GMT)
FinBERT-BiLSTM: A Deep Learning Model for Predicting Volatile Cryptocurrency Market Prices Using Market Sentiment Dynamics [3.6] 本稿では,双方向長短期メモリ(Bidirectional Long Short-Term Memory, Bi-LSTM)ネットワークとFinBERTを併用して,暗号通貨の予測精度を向上させるハイブリッドモデルを提案する。
このアプローチは、先進的な時系列モデルと感情分析を組み合わせることで、不安定な金融市場の予測において重要なギャップを埋める。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:43:06 GMT)
Marginal Causal Flows for Validation and Inference [3.5] 複雑なデータから得られる結果に対する介入の限界因果効果を調べることは依然として困難である。
Frugal Flowsは、正規化フローを使用してデータ生成過程を柔軟に学習する新しい確率ベース機械学習モデルである。
シミュレーションと実世界の両方のデータセットで実験を行った。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:04:57 GMT)
Better Not to Propagate: Understanding Edge Uncertainty and Over-smoothing in Signed Graph Neural Networks [3.4] 本稿では,学習中のブロックと署名された伝搬の動的選択と一体化して,ホモフィリーとエッジの誤差比を推定する新しい手法を提案する。
我々の理論解析は, 広範囲な実験によって支持され, 高エッジ誤差比下では, 符号付き伝搬よりもブロックMPの方が有効であることを示す。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 06:10:08 GMT)
WaKA: Data Attribution using K-Nearest Neighbors and Membership Privacy Principles [3.4] WaKAは、個々のデータポイントの損失分布への寄与を測定する新しい属性法である。
WaKAは、プライバシーリスクを評価するために、メンバーシップ推論アタック(MIA)としてEmpha reariを使用することができる。
我々は、WAKAの異なる使用法が、さまざまな実世界のデータセットで評価されたことも示している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 20:27:51 GMT)
Artificial Intelligence for Microbiology and Microbiome Research [3.4] 機械学習とディープラーニングの応用を通して、ブレイクスルーを経験する微生物学と微生物研究。
このレビューでは、微生物学および微生物学研究に適したAI駆動アプローチの概要を概観する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:03:43 GMT)
Axiomatic Explainer Globalness via Optimal Transport [3.2] 我々は,説明の分布のより深い理解を可能にする,説明者,グローバル性のための複雑性尺度を定義する。
提案した測度であるワッサーシュタイン・グローバルネスがこれらの基準を満たすことを証明している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:01:38 GMT)
What Features in Prompts Jailbreak LLMs? Investigating the Mechanisms Behind Attacks [3.1] 異なるジェイルブレイク手法が、異なる非線形特徴を介してプロンプトで動作することを示す。
これらの機械的ジェイルブレイクは、トレーニングされた35のテクニックのうち34つよりも確実にGemma-7B-ITをジェイルブレイクすることができる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:29:47 GMT)
Whose ChatGPT? Unveiling Real-World Educational Inequalities Introduced by Large Language Models [3.0] ChatGPTや他の類似のツールは、学習経験と成果を改善するために、大きな言語モデル(LLM)の可能性について、大きな興奮と実験的努力を喚起しました。
しかし、LLMが教育的価値に与える影響を体系的に調査する研究はほとんどない。
我々は2021年から2024年までの2391のコースで16,791人の大学生から1,140,328人の学術論文を米国内の公立の少数派機関で分析した。
言語学的に有利な学生と不利な学生の書き込み品質のギャップが狭まりつつあり, 学生全体の書き込み品質が徐々に向上していることがわかった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:45:22 GMT)
From Federated Learning to Quantum Federated Learning for Space-Air-Ground Integrated Networks [2.8] 6Gの無線ネットワークは、宇宙空間と水中のネットワークをカバーするシームレスでデータベースの接続を提供する予定である。
宇宙空間統合ネットワーク(SAGIN)へのAI技術導入は避けられないトレンドである。
SAGINの分散的で異質なアーキテクチャのため、フェデレートドラーニング(FL)と量子FLは、将来のプライバシ強化と計算効率の向上を実現するためのAIモデルのトレーニング技術として登場しつつある。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:13:00 GMT)
How Personality Traits Influence Negotiation Outcomes? A Simulation based on Large Language Models [2.7] 本稿では,Large Language Model (LLM) エージェントに着目したシミュレーションフレームワークを提案する。
実験結果から, LLMシミュレーションの行動傾向は, 人間の交渉で観察された行動パターンを再現できることが示唆された。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 16:24:41 GMT)
Network Causal Effect Estimation In Graphical Models Of Contagion And Latent Confounding [2.7] 多くのネットワーク研究の鍵となる疑問は、観測された単位間の相関は、主に感染や潜伏によるものであるかである。
ネットワーク因果効果の推定手法を提案する。
実世界のネットワークを用いて,合成データによる手法の有効性と仮定の有効性を評価する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:12:44 GMT)
Towards a Knowledge Graph for Teaching Knowledge Graphs [2.6] 本論文は、知識グラフ(KGs)の教育ニーズに合わせて、ユースケース駆動型知識グラフリソースを作成するための現在進行中の研究プロジェクトについて述べる。
我々は、セマンティックWebコミュニティが提供する講義から、COSTアクション分散知識グラフとアランチューリング研究所のKGに関する関心グループを用いて、KGコースに関連するリソースを収集する。
我々のゴールは、複数の相互接続された意味層を持つリソース中心のKGを作成し、各講師とトピック、コース、教材を相互にリンクすることである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:39:45 GMT)
Conformalized High-Density Quantile Regression via Dynamic Prototypes-based Probability Density Estimation [2.5] 動的適応型プロトタイプを用いた共形化高密度量子化回帰手法を提案する。
本手法は, 量子化ビンを適応的に追加, 削除, 移動させることにより, プロトタイプの集合を最適化する。
多様なデータセットと次元にわたる実験により,提案手法が常に高品質な予測領域を達成できることが確認された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:36:12 GMT)
Scaling Laws with Hidden Structure [2.5] 近年の進歩は、テキストと画像データがそのような隠された構造を含んでいることを示唆しており、次元の呪いを和らげるのに役立つ。
本稿では,ニューラルネットワークが実際にそのような隠された因子構造を活用できるかどうかを検証するための制御された実験枠組みを提案する。
これらの潜在パターンを利用して離散分布をより効率的に学習し、モデルサイズ、隠れ分解、精度をリンクするスケーリング法則を導出することを発見した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:32:53 GMT)
Applying sparse autoencoders to unlearn knowledge in language models [2.4] 本研究では,スパースオートエンコーダ(SAE)を用いて言語モデルから知識を除去する方法について検討する。
我々は,WMDP-Bio質問のサブセットを学習するために,個々の解釈可能な生物学関連SAE機能を利用することを実証した。
複数のSAE機能を同時に使用すると、複数のトピックが解放されるが、同じあるいは大きな副作用が生じる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 23:02:44 GMT)
Gaussian unsteerable channels and computable quantifications of Gaussian steering [2.3] 連続変数系のガウスステアリングに対する現在の量子資源理論は欠陥があり不完全である。
本稿では,ガウス的非ステアブルチャネルのクラスと最大ガウス的非ステアブルチャネルのクラスを紹介する。
また、$mathcalJ_jj$ of $(m+n)$-mode Gaussian steering from $A$ to $B$ も提案する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 08:33:13 GMT)
Comparative Analysis of Modality Fusion Approaches for Audio-Visual Person Identification and Verification [2.2] 音声と顔の2つのモダリティを処理し,個人識別と検証における3つのモダリティ融合戦略を比較した。
1次元畳み込みニューラルネットワークは、音声からのxベクトル抽出に使用される。
予め訓練したVGGFace2ネットワークと転送学習を顔のモダリティに活用する。
ガンマトネグラムは、ダークネット19の事前訓練ネットワークとの関わりにおいて、音声表現として使用される。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 22:31:05 GMT)
Neural Network-Based Design of Approximate Gottesman-Kitaev-Preskill Code [2.2] Gottesman-Kitaev-Preskill (GKP)エンコーディングは、連続変数のフォールトトレラント量子コンピューティングを約束する。
従来の近似GKP符号ワードは、複数の大振幅圧縮コヒーレント状態の重ね合わせである。
我々はニューラルネットワークを用いて最適近似GKP状態を生成する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:34:24 GMT)
Smolyak algorithm assisted robust control of quantum systems [2.1] 本研究では,不確かさを確率変数としてモデル化し,不確かさの期待値を用いてロバスト性を定量化する手法を提案する。
本研究では,Smolyak アルゴリズムを用いた smGOAT や smGRAPE などの勾配法が,状態伝達や量子ゲート実現に関する頑健な制御問題において有効であることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:03:54 GMT)
Signer-Optimal Multiple-Time Post-Quantum Hash-Based Signature for Heterogeneous IoT Systems [1.9] 既存のNIST-PQC標準は従来の標準よりも高価で、リソース制限のIoTには適していない。
我々は、MUM-HORS(Maximum utilization Multiple HORS)と呼ばれる、複数時間ハッシュベースの新しい署名を提案する。
実験の結果,複数時間HORSと比較して,同一の署名能力(220メッセージ,128ビットセキュリティ)で40倍の有効利用が確認された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 23:11:16 GMT)
Interpretable Embeddings for Segmentation-Free Single-Cell Analysis in Multiplex Imaging [1.9] 多重イメージング(MI)は、複数の生物学的マーカーを、細胞内解像度で別々のイメージングチャネルで同時に可視化することを可能にする。
本稿では,グループ化畳み込みを利用して各画像チャンネルから解釈可能な埋め込み特徴を学習するセグメンテーションフリーなディープラーニング手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:21:33 GMT)
Two-stage Conformal Risk Control with Application to Ranked Retrieval [1.8] 2段階のランク付け検索は、機械学習システムにとって重要な課題である。
両段階の閾値を共同で同定し,各段階のリスクを制御するための統合的アプローチを提案する。
提案アルゴリズムは,全ての可能なしきい値に対して,重み付けされた予測セットサイズの組み合わせをさらに最適化することにより,より効率的な予測セットを実現する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:06:32 GMT)
From Explicit Rules to Implicit Reasoning in an Interpretable Violence Monitoring System [1.8] 本稿では,ルールベース暴力監視(RuleVM)と呼ばれる,弱監視型暴力監視(WSVM)のための新しいパラダイムを提案する。
提案したRe RuleVMは、イメージとテキストの異なる設計にデュアルブランチ構造を使用する。
明示的なブランチにおける言語チャネル設計のために、提案したRe RuleCLIPは、最先端のYOLO-Worldモデルを使用して、ビデオフレーム内のオブジェクトやアクションを検出する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 06:33:29 GMT)
Real-Time Spatio-Temporal Reconstruction of Dynamic Endoscopic Scenes with 4D Gaussian Splatting [1.8] 本稿では,動的内視鏡シーンのダイナミックスをモデル化する新しいフレームワークST-Endo4DGSを提案する。
このアプローチは、変形可能な組織の正確な表現を可能にし、空間的および時間的相関をリアルタイムでキャプチャする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:24:27 GMT)
Using Half-Precision for GNN Training [1.7] ディープラーニングのための半精度ベースGNNシステムであるHalfGNNを紹介する。
新しいベクトル演算によりデータ負荷と削減性能が向上し、離散化された SpMM は値オーバーフローを克服する。
HalfGNNは、GAT、GCN、GINのDGL(float-based)のトレーニング時間の平均2.30倍のスピードアップを実現し、同様の精度を実現し、2.67倍のメモリ節約を実現している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:14:02 GMT)
Can Humans Oversee Agents to Prevent Privacy Leakage? A Study on Privacy Awareness, Preferences, and Trust in Language Model Agents [1.5] 個人のタスクを代行する言語モデル(LM)エージェントは生産性を向上するが、意図しないプライバシー漏洩のリスクも受けやすい。
本研究は、LMエージェントのプライバシ含意を監督する人々の能力に関する最初の研究である。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:15:42 GMT)
Optimized Homomorphic Vector Permutation From New Decomposition Techniques [1.4] 同型置換は、単語単位の同型暗号に基づくプライバシー保護計算の基礎となる。
本稿では、置換の任意の分解の理想的な性能を定義し、この境界を達成するアルゴリズムを設計する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:19:37 GMT)
Rotational Odometry using Ultra Low Resolution Thermal Cameras [1.4] この手紙は、我々の知る限りでは、回転計測のための超低解像度熱カメラの適用性に関する最初の研究である。
RGBカメラのような他のモダリティではなく、超低解像度のサーマルカメラを使うことは、照明条件に対するロバスト性によって動機づけられる。
CNN推定精度に対するサーマルカメラ解像度と連続フレーム数の影響を判定するための実験およびアブレーション研究を行った。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:15:32 GMT)
RA-WEBs: Remote Attestation for WEB services [1.3] TEEは、このような脅威からデータやコードを保護するセキュアな環境を作成することで、有望なソリューションを提供する。
重要な機能のひとつは、TEEの完全性検証を可能にするリモート検証(RA)である。
我々は、現在のWebエコシステムとの高互換性のために設計された新しいRAプロトコルである、$textttRA-WEBs$$$textbfR$emote $textbfA$ttestation for $textbfWeb$ $textbfs$ervicesを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:46:58 GMT)
Hedging and Pricing Structured Products Featuring Multiple Underlying Assets [1.3] オートコール可能なノートを含むポートフォリオをヘッジすると、これらの金融商品の複雑なリスクプロファイルのために、ユニークな課題が示される。
本稿では,従来のモンテカルロシミュレーション法よりも250倍高速に効率,計算コストを向上する機械学習ベースの価格設定手法を提案する。
また、自動コール可能な構造化ノートを含むポートフォリオをヘッジするために、分散強化学習(RL)アルゴリズムを導入する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:41:46 GMT)
False Data Injection Attack Detection in Edge-based Smart Metering Networks with Federated Learning [1.2] 本稿では、効率的なフェデレート学習フレームワークを開発することにより、新たなプライバシ保存型偽データ注入(FDI)攻撃検出を提案する。
ネットワークエッジに位置する分散エッジサーバは、MLベースのFDI攻撃検出モデルを実行し、トレーニングされたモデルをグリッドオペレータと共有する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:23:08 GMT)
Unlocking the Archives: Using Large Language Models to Transcribe Handwritten Historical Documents [1.1] 大型言語モデル(LLM)は、特殊な手書き文字認識(HTR)ソフトウェアよりもはるかに高い精度で、歴史的手書き文書を転写することができる。
Transcription Pearlと呼ばれるオープンソースのソフトウェアツールは、これらの機能を利用して手書き文書のバッチを自動的に書き起こし、修正する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 00:16:29 GMT)
Causal reasoning in difference graphs [1.1] これは、様々な公衆衛生応用の可能性を秘めている因果推論に対する新しいアプローチを提供する。
特に、非パラメトリックフレームワークにおける全因果変化と全体効果の同定、および線形文脈における直接因果変化と直接効果に焦点を当てている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:01:42 GMT)
Designing a Robust Radiology Report Generation System [1.1] 本稿では,異なるモジュールを統合し,ベストプラクティスを強調することで,ロバストな放射線学レポート生成システムの設計について概説する。
これらのベストプラクティスは、自動放射線学レポート生成の改善、意思決定における放射線科医の増員、診断ワークフローの迅速化につながると信じている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 06:38:04 GMT)
Quantum CORDIC -- Arcsin on a Budget [0.9] この研究はアルキシン関数を任意の精度で計算するための量子アルゴリズムを導入する。
我々は、Coordinate Rotation Digital Computer (CORDIC) と呼ばれる、組み込みコンピューティングとフィールドプログラマブルゲートアレイ(FPGA)の技術を活用している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:00:58 GMT)
Medical X-Ray Image Enhancement Using Global Contrast-Limited Adaptive Histogram Equalization [0.8] G-CLAHE(Global-Contrast Limited Adaptive Histogram Equalization)は、X線に焦点を当てた医療画像に完全に適合する。
この方法は,グローバルヒストグラム等化(GHE)とコントラスト限定アダプティブヒストグラム等化(CLAHE)に適応し,長所と短所を両立させる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:20:56 GMT)
Data movement limits to frontier model training [0.7] FLOPの約1031ドルを超えるトレーニングランは、低利用でも実現不可能である。
バッチサイズのスケーリングや、より短くて太ったモデル形状は、達成可能であれば、より大きなトレーニング実行を可能にする可能性がある。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:48:41 GMT)
Efficient explicit circuit for quantum state preparation of piece-wise continuous functions [0.7] 本研究では,特定の条件と有界条件を満たす4つの実パリティを用いて,関数をアップロードする明示的なアルゴリズムを提案する。
提案手法は,効率的な量子回路の実装を実現し,詳細なゲートカウントと資源分析を行う。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 04:20:31 GMT)
Transforming Engineering Education Using Generative AI and Digital Twin Technologies [0.6] 本研究では,産業用デジタルツイン(DT)の教育への応用について検討する。
これは、認知領域におけるブルームの分類の異なる段階をDTモデルがどうサポートできるかに焦点を当てている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:16:47 GMT)
FEET: A Framework for Evaluating Embedding Techniques [0.6] FEETは、基礎モデルの開発とベンチマークのガイドとして設計された標準化されたプロトコルである。
フリーズ埋め込み、数発の埋め込み、完全に微調整された埋め込みの3つのユースケースを定義します。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:03:49 GMT)
Guided Synthesis of Labeled Brain MRI Data Using Latent Diffusion Models for Segmentation of Enlarged Ventricles [0.4] 医学的コンテキストにおけるディープラーニングモデルは、データの不足、不均一性、プライバシー上の懸念といった課題に直面します。
本研究は, 合成データを用いた脳MRI画像の心室セグメンテーションの改善に焦点を当てた。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:44:10 GMT)
Noise-Aware Circuit Compilations for a Continuously Parameterized Two-Qubit Gateset [0.4] 我々は、QSCOUT(Quantum Scientific Computing Open User Testbed)を用いて、ノイズ対応コンパイルの研究を行っている。
オール・ツー・オール接続型イオン系における任意の角度の$mathcalZZ$ゲートの実現について論じる。
ランダム化量子ボリューム回路を用いたハードウェア上で,これらのコンパイル手法を実証する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 00:46:51 GMT)
Uncertainty measurement for complex event prediction in safety-critical systems [0.4] 複合イベント処理(CEP)の不確実性は、組込みおよび安全クリティカルシステムにとって重要である。
本稿では,事象の知覚と予測の不確実性を測定する方法を示す。
我々は、研究と研究の分野で非常に有望な成果を提示し、議論する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:51:37 GMT)
A hybrid transformer and attention based recurrent neural network for robust and interpretable sentiment analysis of tweets [0.3] 既存のモデルは言語的多様性、一般化可能性、説明可能性に関する課題に直面している。
本稿では,トランスフォーマーアーキテクチャ,アテンション機構,BiLSTMネットワークを統合したハイブリッドフレームワークTRABSAを提案する。
感情分析ベンチマークのギャップを埋め、最先端の精度を確保します。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:03:03 GMT)
Towers of Quantum Many-body Scars from Integrable Boundary States [0.3] 積分境界状態(IBS)を用いた多重量子多体傷(QMBS)モデルの構築
我々はスピン-1/2ハイゼンベルク模型のIBSをパラメタライズした傾斜したN'eel状態に注目し、これらの状態が散乱状態の塔を構築するのに利用できることを示す。
IBSを用いたQMBS構築に関する新たな知見を提供し,QMBSと可積分モデルとの接続を照明する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:42:22 GMT)
Varco Arena: A Tournament Approach to Reference-Free Benchmarking Large Language Models [0.3] 大規模言語モデル(LLM)に対するより柔軟なベンチマーク手法を提案する。
textittextbfVarco Arena はトーナメントスタイルで LLM の参照なしベンチマークを提供する。
シミュレーション実験により得られた実験結果から,textittextbfVarco Arena トーナメントのアプローチは,現在の Elo モデルとよく一致していることが示された。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:23:28 GMT)
The impact of MRI image quality on statistical and predictive analysis on voxel based morphology [0.2] 画像品質が単変量統計および機械学習分類に与える影響を検証した。
性別/ジェンダーが局所脳量に与える影響を解析し,ロジスティック回帰を用いた性別/ジェンダーの予測を行った。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:40:14 GMT)
Benchmarking a trapped-ion quantum computer with 30 qubits [0.2] 我々は、オール・ツー・オールな演算で、単一鎖の30量子ビットトラップイオン量子コンピュータをベンチマークする。
直接シミュレーションにより,アプリケーションのベンチマークデータを予測するためのシステムレベルのモデルを構築した。
これは、量子コンピュータがより大きく高品質なデバイスへと移行するにつれて、特徴付けがより困難になることを示している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 22:59:00 GMT)
Why Is Anything Conscious? [0.0] 生物学的システムが階層的に階層的な知覚情報を解釈するためにどのように自己組織化するかを記述する数学的フォーマリズムを提供する。
我々は、人間レベルでのアクセス意識は、i)自己、i)世界、iii)他者によってモデル化された自己を階層的にモデル化する能力なしでは不可能であると主張する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 23:09:58 GMT)
Why Is Anything Conscious? [0.0] 我々は、自然に選択され、自己組織化され、体現された生物を出発点として、意識の難しい問題に取り組む。
生物学的システムが階層的に階層的な知覚情報を解釈するためにどのように自己組織化するかを記述する数学的フォーマリズムを提供する。
我々は、人間レベルでのアクセス意識は、i)自己、i)世界、iii)他者によってモデル化された自己を階層的にモデル化する能力なしでは不可能であると主張する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 23:09:58 GMT)
Use Digital Twins to Support Fault Diagnosis From System-level Condition-monitoring Data [0.0] 本稿では,データ駆動型故障診断モデルの開発を支援するために,ディジタルツインを提案する。
提案手法は実世界のロボットシステム上で評価される。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 20:35:13 GMT)
The role of the metaverse in calibrating an embodied artificial general intelligence [0.0] 本稿では,AGIの概念,人間の意識との関係,そして,この関係を促進する上でのメタバースの重要な役割について考察する。
例えば、認知の具体化、マイケル・レヴィンの計算境界の「自己」、ドナルド・D・ホフマンの知覚のインターフェイス理論、ベルナルド・カストロップの分析的理想主義などである。
この論文は、安定なAGIの出現の鍵となる前提条件として、人間関係において一定の調和を達成することの重要性を強調し、人類の相互接続性を世界レベルで認識することを強調した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:17:03 GMT)
The Impact of Generative Artificial Intelligence on Ideation and the performance of Innovation Teams (Preprint) [0.0] この研究は、知識の流出、ジェネレーション、応用に対するAIの効果を理解するために、知識スパイルオーバー理論を応用している。
その結果,GenAIは神経回路の知識スパイルオーバー理論の重要な要素に肯定的な影響を与えることが明らかとなった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:03:01 GMT)
The Case for an Industrial Policy Approach to AI Sector of Pakistan for Growth and Autonomy [0.0] この論文は、パキスタンの幅広い産業政策枠組みにおける重要な産業として、人工知能の戦略的扱いについて論じている。
パキスタンのAIへの適用は、その大きな可能性、規制されていない採用のリスク、そして市場における非効率さが原因だ、と同社は主張する。
この分析は、パキスタンのAIセクターが主にサービス指向であり、製品革新の制限と外国技術への依存が強調されている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:41:17 GMT)
Strengthening DeFi Security: A Static Analysis Approach to Flash Loan Vulnerabilities [0.0] 我々はフラッシュローンによる価格操作の脆弱性を検出する高度なフレームワークであるFlashDeFierを紹介した。
FlashDeFierは、テナントソースとシンクの範囲を広げ、DeFiプロトコルをまたいだデータフローの包括的な分析を可能にする。
著名なDeFiインシデントのデータセットに対してテストされたFlashDeFierは、価格操作の脆弱性の76.4%を特定し、DeFiTainterよりも30%改善している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:42:01 GMT)
Sparse Bayesian Multidimensional Item Response Theory [0.0] 我々は,大規模なデータセットに対して最小限のチューニングとスケールを必要とする二項および順序項目MIRTのためのベイズプラットフォームを開発する。
ベイズ非パラメトリックスによるツールによる未知の潜在因子次元の問題に対処する。
本手法は, 微小サンプルにおいても高次元合成データの因子次元と潜時構造の両方を確実に回収する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:43:39 GMT)
Security Approaches for Data Provenance in the Internet of Things: A Systematic Literature Review [0.0] モノのインターネットシステムは、セキュリティ攻撃に弱い。
データ証明は、これらの脆弱性に対処するデータの起源、履歴、処理を記録する手段を提供する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:23:04 GMT)
Reducing T-Count in quantum string matching algorithm using relative-phase Fredkin gate [0.0] 本稿では,QSMアルゴリズムに必要なTカウンタ数(Tカウンタ)を顕著に削減する戦略として,相対位相Fredkinゲートを提案する。
提案手法は,Tゲートの深さやCNOTゲートの数など,他の回路コストの面で有利であることを示す。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:27:18 GMT)
Reasoning Limitations of Multimodal Large Language Models. A case study of Bongard Problems [0.0] ボナード問題(BP)は視覚的推論における根本的な課題である。
マルチモーダル・大型言語モデル(MLLM)は、視覚と言語を組み合わせて設計されており、BPに対処できる。
実験により、BPの解法におけるMLLMの重大な限界が明らかになった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 08:06:30 GMT)
Quark jet evolution: from classical to quantum simulation [0.0] In-medium quark jet evolutionの非摂動計算フレームワークの開発に関する一連の研究をレビューする。
時間依存型Basis Light-front Quantization (tBLFQ)はハミルトン形式に基づく非摂動計算手法であり、メジウムジェットの進化によりジェット状態への完全量子処理が可能となる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:44:47 GMT)
Quantum Token Obfuscation via Superposition [0.0] 量子コンピューティングが進歩するにつれて、トークン難読化を含む従来の暗号セキュリティ対策は、量子攻撃に対してますます脆弱になっている。
本稿では,量子重ね合わせとマルチバス検証を利用したトークン難読化手法を提案する。
実験の結果,トークンのセキュリティとロバスト性に大きな改善が見られ,量子セキュアな暗号アプリケーションのための有望なソリューションとして,このアプローチを検証した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:05:20 GMT)
Optimizing Violence Detection in Video Classification Accuracy through 3D Convolutional Neural Networks [0.0] 本研究は、暴力検出モデルの精度を最適化するために、一度に何つのフレームを分析すべきかを特定することである。
以前の暴力分類モデルが作成されているが、ライブ映像への応用には欠陥がある可能性がある。
最も高い検証精度は94.87%であり、同時に3つのフレームを分析したモデルで発生した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:29:01 GMT)
Online and Offline Evaluations of Collaborative Filtering and Content Based Recommender Systems [0.0] 本研究では,イランにおける大規模レコメンデーションシステムの比較分析を行った。
このシステムは、コンテンツベース、協調フィルタリング、トレンドベース手法、ハイブリッドアプローチを用いた、ユーザベースおよびアイテムベースのレコメンデーションを採用している。
評価方法は,手動による評価,ヒットレート@kやnDCGなどの評価指標を含むオフラインテスト,クリックスルーレート(CTR)によるオンラインテストなどである。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 20:05:31 GMT)
On the Role of Locality in the Bose-Marletto-Vedral Effect [0.0] うち2人は最近、非古典主義の絡み合いに基づく証人を提案した。
本稿では、証人を支持する定理の仮定としての局所性の役割について論じる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:28:50 GMT)
Non-thermal eigenstates and slow relaxation in quantum Fredkin spin chains [0.0] 局所的な3体相互作用を持つ系であるフレドキンスピン鎖の力学と熱化について検討した。
我々は、運動エネルギーがポテンシャルエネルギーが支配するレジームを調整するために、変形をその点から遠ざけることを考える。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 11:23:33 GMT)
NLP and Education: using semantic similarity to evaluate filled gaps in a large-scale Cloze test in the classroom [0.0] ブラジルの学生を対象にしたクローゼテストのデータを用いて,ブラジルポルトガル語(PT-BR)のWEモデルを用いて意味的類似度を測定した。
WEモデルのスコアと審査員の評価を比較した結果,GloVeが最も効果的なモデルであることが判明した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:22:26 GMT)
Multilevel Monte Carlo methods for simulating forward-backward stochastic differential equations using neural networks [0.0] 我々は、これらの解と偏微分方程式の解との接続を強調する前方微分方程式を導入する。
本稿では,ニューラルネットワークを用いた高次元偏微分方程式の近似解法と,マルチレベルモンテカルロを用いた微分方程式の近似解について概説する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 16:55:56 GMT)
Machine Learning Assisted Postural Movement Recognition using Photoplethysmography(PPG) [0.0] 転倒検出・転倒防止技術の開発は, 緊急に必要である。
この研究は、姿勢運動を認識するための機械学習技術の使用を初めて提示する。
分類にはさまざまな機械学習アプローチが用いられ、ANN(Artificial Neural Network)が最適であることが判明した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:56:41 GMT)
MIC: Medical Image Classification Using Chest X-ray (COVID-19 and Pneumonia) Dataset with the Help of CNN and Customized CNN [0.0] 本研究では,医用画像分類のための独自の畳み込みニューラルネットワーク(CCNN)を提案する。
提案されたCCNNは、同じデータセットを使用した畳み込みニューラルネットワーク(CNN)や他のモデルと比較された。
この研究によると、畳み込みニューラルネットワーク(CCNN)は95.62%の検証精度と0.1270の検証損失を達成した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 07:18:53 GMT)
Improving Energy Efficiency in Manufacturing: A Novel Expert System Shell [0.0] エキスパートシステムは、製造におけるエネルギー効率のポテンシャルを自動的に識別する効果的なツールである。
我々はJupyter Notebookで実装された新しいエキスパートシステムシェルを紹介し、エキスパートシステム開発に柔軟で容易に統合可能なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:50:37 GMT)
How Memory-Safe is IoT? Assessing the Impact of Memory-Protection Solutions for Securing Wireless Gateways [0.0] メモリベースの脆弱性は、ソフトウェアで最も深刻な脅威の1つであり、汎用的なソリューションはまだ提供されていない。
本稿では,最近の無線ゲートウェイにおけるメモリ関連脆弱性の大規模解析を通じて,メモリ安全性がIoT領域に与える影響について検討する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 23:00:37 GMT)
Generative linguistics contribution to artificial intelligence: Where this contribution lies? [0.0] この記事では、研究者/読者がGLに属するAIに関わる科学的定理と理性について説明する。
AIへの大きなGL貢献にもかかわらず、言語入力の性質やタイプなど、相違点がまだ残っている、と結論付けている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:46:54 GMT)
Gamification and AI: Enhancing User Engagement through Intelligent Systems [0.0] ゲーミフィケーションは、ゲーム以外の環境にゲームメカニックを適用し、ユーザーを動機付け、エンゲージメントする。
本稿では,ゲーミフィケーション体験を最適化するAIの手法について検討し,適応性と予測ゲーミフィケーションのための数学的モデルを提案する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:47:07 GMT)
Enhancing Diabetic Retinopathy Detection with CNN-Based Models: A Comparative Study of UNET and Stacked UNET Architectures [0.0] 糖尿病網膜症DRは糖尿病の重篤な合併症である。損傷または異常な血管は視力喪失を引き起こす可能性がある。
糖尿病患者の大量スクリーニングの必要性は、コンピュータ支援によるDRの完全自動診断への関心を生んでいる。
ディープラーニングフレームワーク、特に畳み込みニューラルネットワークCNNは、網膜画像を分析してDRを検出することに非常に興味を持ち、約束している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:02:45 GMT)
Emergent Ashkin-Teller criticality in a constrained boson model [0.0] 制約付きボソニックモデル上での明示的な計算により、サブシステム対称性の存在が量子相転移をもたらすことを示す。
そのような遷移に対して有効なランダウ・ギンズバーグ理論を提供し、リドベルク原子配列を記述する普遍性モデルへの我々のモデルとの接続について議論する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 02:41:13 GMT)
Electron g-factor of strained Ge caused by the SiGe substrate and its dependence on growth directions [0.0] ダイヤモンド構造を持つ歪GeSi/Ge量子井戸のGeホール系は、高性能スピン量子ビットと光遷移の可能性があるため、大きな注目を集めている。
ひずみGeの電子g因子を計算し、8バンドモデルを用いて成長方向([100], [110], [111])とSiGe基板のGe含有量の両方に依存した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:59:38 GMT)
Electrical Interconnects for Silicon Spin Qubits [0.0] 我々は長範囲のqubit相互接続を抵抗トポゲートと作成する。
電子は運動量非コヒーレントであるが、必ずしもスピン非コヒーレントではない。
スピン軌道結合が支配的な脅威であるが、頻繁な散乱による運動量空間の狭さは電子を部分的に保護している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:37:04 GMT)
Efficient Sparse Training with Structured Dropout [0.0] SparseDropは、ハードウェアフレンドリーな構成のドロップアウトで、スパーシティを活用できる。
SparseDropの実装として,低空間レベルでも高密度のSparseDropに対して高速化を実現する。
これは、トレーニング速度が速く、標準のドロップアウトに取って代わる可能性を示している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 13:27:51 GMT)
ECG-PPS: Privacy Preserving Disease Diagnosis and Monitoring System for Real-Time ECG Signal [0.0] 本研究では,最先端のリアルタイムECGモニタリング・分析システムの開発について紹介する。
このシステムは、シリアルポートを介して接続された3つのECGを使用して、リアルタイムECGデータをキャプチャ、表示、記録する。
このシステムは、FHE(Fully Homomorphic Encryption)を用いて、クラウドに格納されたECGデータを復号することなく統計的に操作する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:03:25 GMT)
Dynamically generated concatenated codes and their phase diagrams [0.0] 我々は、拡張木幾何学におけるユニタリ量子回路の作用としてコード連結を定式化する。
バルク誤差が存在する場合、符号化相はスピンガラスの一種であり、故障確率の分布が特徴である。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 02:17:12 GMT)
Dynamically generated concatenated codes and their phase diagrams [0.0] 我々は、拡張木幾何学におけるユニタリ量子回路の作用としてコード連結を定式化する。
バルク誤差が存在する場合、符号化相はスピンガラスの一種であり、故障確率の分布が特徴である。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 02:17:12 GMT)
Dynamic Josephson Junction Metasurfaces for Multiplexed Control of Superconducting Qubits [0.0] ミリケルビン(mK)温度で直接マイクロ波制御信号を生成・多重化するための時空間変調ジョセフソン接合構造を提案する。
その結果、制御パラメータによる多重周波数音の発生が示され、熱負荷と配線オーバーヘッドを最小限に抑えつつ、効率よくスケーラブルな量子ビット制御が可能となった。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:19:37 GMT)
Diversidade linguística e inclusão digital: desafios para uma ia brasileira [0.0] 言語的多様性は、生成的AIの進歩とともに、脅威にさらされている人間の属性である。
本稿では, 技術応用による多様性選択バイアスと, 支配的かつ標準化された品種を保全する悪循環の結果について検討する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:17:33 GMT)
Distribution-free Conformal Prediction for Ordinal Classification [0.0] 正規分類は、対象変数がクラスラベル間で自然な順序付けを持つ実アプリケーションで一般的である。
連続的および非連続的な予測セットを構築するための新しい共形予測手法を開発した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 05:33:27 GMT)
Dhoroni: Exploring Bengali Climate Change and Environmental Views with a Multi-Perspective News Dataset and Natural Language Processing [0.0] 気候変動は世界規模で重要な課題であり、低所得国に不公平に影響を及ぼしている。
バングラデシュは気候変動に対する最も脆弱な国であるにもかかわらず、気候変動とNLPに関するベンガル語研究では研究のギャップが続いている。
この格差に対処するために、ベンガル(バンガラ)の気候変動と環境ニュースデータセットであるDhoroniを紹介します。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:08:25 GMT)
Deterministic photonic entanglement arising from non-Abelian quantum holonomy [0.0] 我々は、光の制御された状態の高度に絡み合った重ね合わせを作成し、操作するためのプロトコルを開発する。
我々の計算は、そのような絡み合った重ね合わせの部分集合が極大に絡み合った「体積法則」状態であることを示している。
このエンタングリング機構は、線形フォトニック素子のみによる普遍的、エンタングリング量子ゲートの実現に有効であると考えられる。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 11:51:59 GMT)
Density Matrix Realism [0.0] 量子論に関する現実論は自然界において宇宙の量子状態に関する現実論につながる。
私は、普遍的な量子状態は客観的だが不純物であるという理論である密度行列リアリズムを特徴づけ、精巧に論じる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 03:50:19 GMT)
Conceptual Engineering Using Large Language Models [0.0] ウィキデータナレッジグラフから得られたデータを用いて、2つの概念工学プロジェクトに関する規定的定義を評価する。
その結果,本手法を用いて構築した分類手順は,優れた分類性能を示すことがわかった。
我々は、この研究に対して、概念工学の理論と実践の3つの側面に異議を申し立てる。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 01:36:11 GMT)
Comparing Security and Efficiency of WebAssembly and Linux Containers in Kubernetes Cloud Computing [0.0] 本研究では、コンテナを使用したクラウドコンピューティングにおいて、信頼できないコードを実行するための、Linuxコンテナのよりセキュアで効率的な代替手段としてのWebAssemblyの可能性について検討する。
セキュリティ分析では、信頼できないコードを実行する場合、LinuxコンテナとWebAssemblyの両方がアタックサーフェスを持っていることが示されている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 23:35:19 GMT)
Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models [0.0] 市場の動きを予測するために,Large Language Models (LLMs) を採用している。
私たちのデータセットには、さまざまなソースから収集されたニュース記事、歴史的な株価、20社の財務報告データが含まれています。
このモデルを用いて、重み付きF1スコア58.5%および59.1%のデータセットにおいて、所定の株価の変動を予測した。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:53:20 GMT)
Class-specific feature selection for classification explainability [0.0] この研究はまず、特徴の選択と分類に焦点をあてて、クラス固有の概念の包括的なレビューを紹介する。
クラス固有の概念の基本的な考え方は、各特徴の重要性があるクラスから別のクラスに変化するという理解にある。
このクラス固有の観点は、各クラス固有の特徴を認識し、活用することによって、分類タスクに対するより効果的なアプローチを提供する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 10:31:55 GMT)
Can Large Language Model Predict Employee Attrition? [0.0] 本研究では,GPT-3.5モデルの予測精度と解釈可能性について,従来の機械学習(ML)と比較した。
GPT-3.5の精度は0.91、リコールは0.94、F1スコアは0.92、SVMはF1スコアは0.82、ランダムフォレストとXGBoostは0.80である。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:50:39 GMT)
Artificial Intelligence Driven Course Generation: A Case Study Using ChatGPT [0.0] 本研究は,ChatGPTを教材として活用することを目的としている。
主な目的は、AI駆動コース生成の効率、品質、および影響を評価することである。
この研究は、AIが教育コンテンツ制作に革命をもたらす可能性を強調している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 21:59:02 GMT)
An Innovative CGL-MHA Model for Sarcasm Sentiment Recognition Using the MindSpore Framework [0.0] サルカズムは、明らかに肯定的あるいは誇張された言語を通して否定的な感情を伝達する。
本稿では, CNN, Gated Recurrent Units (GRU), Long Short-Term Memory (LSTM), Multi-Head Attention 機構を統合した革新的な皮肉検出モデルを提案する。
HeadlinesとRiloffの2つの皮肉検出データセットの実験では、モデルが81.20%、F1スコアが80.77%に達することが示されている。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 14:33:47 GMT)
Advancing Biomedical Signal Security: Real-Time ECG Monitoring with Chaotic Encryption [0.0] 我々は,ECG信号の完全性と機密性を保護するためにカオス暗号化を統合したリアルタイムECG監視システムを開発した。
その結果,カオス暗号化はデータのセキュリティ向上に有効であることが示された。
ディープラーニングに基づくリアルタイム疾患検出モデルは、暗号化されたデータとシームレスに動作し、セキュリティを損なうことなく正確な診断を提供する。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 17:08:14 GMT)
AMREx: AMR for Explainable Fact Verification [0.0] AMRExは、事実検証のためのAMRベースの精度予測と説明システムである。
2つのコミュニティ標準事実検証データセットを使用して、部分的に説明可能な正当化を生成する。
解釈可能なパイプラインに従って、説明可能なAMRノードマッピングを返して、システムの正確性予測を明確にする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 19:14:19 GMT)
A separability-based approach to quantifying generalization: which layer is best? [0.0] 未確認データへの一般化は、ディープラーニングの分類と基礎モデルではよく理解されていない。
サンプル領域を表すネットワークのキャパシティを評価するための新しい手法を提案する。
i) 高い分類精度は高い一般化可能性を示すものではなく、(ii) モデルの深い層が必ずしも最良を一般化するとは限らない。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 12:03:44 GMT)
A novel Kagome uud-ddu spin order in Heisenberg spin-1/2 Clinoatacamite Cu$_4$(OH)$_6$Cl$_2$, the parent compound of Herbertsmithite [0.0] スピン-1/2反強磁性体 Clinoatacamite における一意なゼロフィールド非コプラナーアップ、アップ、ダウン、ダウン、アップ、アップカゴメスピンオーダーを報告する。
本研究は、よく研究されたスピン液体の親化合物において、容易にアクセス可能な温度範囲で新しい予測不可能なかごめ位を明らかにする。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 15:05:09 GMT)
A Mechanistic Explanatory Strategy for XAI [0.0] 本稿では,ディープラーニングシステムの機能的構造を説明するためのメカニズム的戦略を概説する。
メカニスティックアプローチによると、不透明なAIシステムの説明には、意思決定を促進するメカニズムの特定が含まれる。
この研究は、モデル組織を研究するための体系的なアプローチが、より単純な(あるいはより控えめな)説明可能性技術が欠落する可能性のある要素を明らかにすることを示唆している。
論文参考訳(メタデータ) (Sat, 02 Nov 2024 18:30:32 GMT)
A Framework for Synthetic Audio Conversations Generation using Large Language Models [0.0] Conversa Synthは、複数のペルソナ設定を持つ大規模言語モデル(LLM)を使用して合成会話音声を生成するように設計されたフレームワークである。
このフレームワークはまず、さまざまなトピックにわたる多様で一貫性のあるテキストベースの対話を生成し、その後、TTS(text-to-speech)システムを使用して音声に変換する。
論文参考訳(メタデータ) (Sat, 2 Nov 2024 04:00:28 GMT)