OLMoE: Open Mixture-of-Experts Language Models [180.2] OLMoEは、Sparse Mixture-of-Experts (MoE)を利用した、完全にオープンで最先端の言語モデルである。
OLMoE-1B-7Bは70億(B)のパラメータを持つが、入力トークンごとに1Bしか使用しない。
5兆のトークンで事前トレーニングし、さらにOLMoE-1B-7B-インストラクトを作成するように適応します。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:08:20 GMT)
The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources [100.2] ファンデーションモデル開発は、急速に成長するコントリビュータ、科学者、アプリケーションを引き付けている。
責任ある開発プラクティスを形成するために、我々はFoundation Model Development Cheatsheetを紹介します。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 23:03:41 GMT)
What are the Essential Factors in Crafting Effective Long Context Multi-Hop Instruction Datasets? Insights and Best Practices [91.7] 拡張コンテキストウィンドウを持つLong Language Model (LLM) は、情報抽出、質問応答、複雑な計画シナリオなどのタスクを大幅に改善した。
既存のメソッドは通常、Self-Instructフレームワークを使用して、長いコンテキスト能力を改善するために命令チューニングデータを生成する。
本稿では,品質検証エージェント,シングルホップ質問生成エージェント,複数質問サンプリング戦略,マルチホップ質問マーガーエージェントを組み込んだマルチエージェント対話型マルチホップ生成フレームワークを提案する。
以上の結果から,我々の合成高品位長文指導データにより,多量の人体で訓練したモデルよりも,モデル性能が著しく向上することが示唆された。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:30:00 GMT)
From Yes-Men to Truth-Tellers: Addressing Sycophancy in Large Language Models with Pinpoint Tuning [90.0] 大規模言語モデル(LLM)は、ユーザプロンプトへの順守を、妥当な応答よりも優先する傾向がある。
近年の研究では、教師付き微調整(SFT)を用いて、梅毒問題を軽減することが提案されている。
そこで本研究では,特定の目的のために関心のあるモジュールを調整した新しいピンポイントチューニング(SPT)を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:01:37 GMT)
Towards Real-World Adverse Weather Image Restoration: Enhancing Clearness and Semantics with Vision-Language Models [85.5] 実環境下での復元性能を高めるために,視覚言語モデルを用いた半教師付き学習フレームワークを定式化する。
クリアネス向上のために、視覚言語モデルと天気予報学習によって評価された擬似ラベルを用いた2段階戦略を用いて、実世界のデータを利用する。
セマンティックエンハンスメントのために,意味を保ちながら視覚言語モデル記述の天気条件を調整し,実世界のデータを統合する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:56:51 GMT)
How Far Are We on the Decision-Making of LLMs? Evaluating LLMs' Gaming Ability in Multi-Agent Environments [83.8] 本研究では,ゲーム理論のレンズを用いた大規模言語モデル(LLM)の意思決定能力について検討する。
マルチエージェント環境におけるLPMのゲーミング能力を評価するGAMA($gamma$)-Benchを紹介する。
$gamma$-Benchは8つの古典的なマルチエージェントゲームと、LLMのパフォーマンスを定量的に評価するために特別に設計されたスコアリングスキームを含んでいる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:14:30 GMT)
A Fresh Take on Stale Embeddings: Improving Dense Retriever Training with Corrector Networks [81.3] 密集検索では、ディープエンコーダは入力とターゲットの両方に埋め込みを提供する。
我々は、古いキャッシュされたターゲット埋め込みを調整できる小さなパラメトリック補正ネットワークを訓練する。
私たちのアプローチは、トレーニング中にターゲット埋め込み更新が行われなくても、最先端の結果と一致します。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:29:13 GMT)
Unveiling Deep Shadows: A Survey on Image and Video Shadow Detection, Removal, and Generation in the Era of Deep Learning [81.2] 光が障害物に遭遇すると影が形成され、照度が低下する。
コンピュータビジョンにおいて、影の検出、削除、生成はシーン理解の強化、画質の改善、映像編集における視覚的一貫性の確保、仮想環境の改善に不可欠である。
本稿では,過去10年間の深層学習環境における画像や映像の影の検出,削除,生成に関する総合的な調査を行い,課題,深層モデル,データセット,評価指標について紹介する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:59:05 GMT)
Foundation Models for Music: A Survey [77.8] ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。
本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:53:34 GMT)
Laser: Parameter-Efficient LLM Bi-Tuning for Sequential Recommendation with Collaborative Information [76.6] 協調情報を用いた逐次レコメンデーションのためのパラメータ効率の高い大規模言語モデルバイチューニングフレームワーク(Laser)を提案する。
我々のレーザーでは,プレフィックスを用いてユーザと協調的な情報を取り込み,LLMをレコメンデーションタスクに適応させ,サフィックスは言語空間からレコメンデーションスペースへのLLMの出力埋め込みをリコメンデーション項目レコメンデーションスペースに変換する。
M-Formerは軽量なMoEベースのクエリ変換器で、クエリ専門家のセットを使用して、凍結IDベースのシーケンシャルレコメンデータシステムによって符号化された多様なユーザ固有の協調情報を統合する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:55:03 GMT)
Interpreting and Improving Large Language Models in Arithmetic Calculation [72.2] 大規模言語モデル(LLM)は、多くのアプリケーションにまたがる顕著な可能性を示している。
本研究では,LLMが計算を行う特定のメカニズムを明らかにする。
LLMの計算性能を高めるために、これらの必須ヘッド/MLPを選択的に微調整する潜在的な利点について検討する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:01:46 GMT)
EgoPressure: A Dataset for Hand Pressure and Pose Estimation in Egocentric Vision [69.1] EgoPressureは,エゴセントリックな視点から,タッチ接触と圧力相互作用の新たなデータセットである。
EgoPressureは、動くエゴセントリックカメラと7台の静止Kinectカメラによって捕獲された21人の参加者による5.0時間の接触接触と圧力相互作用で構成されている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:53:32 GMT)
On the Design Space Between Transformers and Recursive Neural Nets [64.9] 連続再帰型ニューラルネットワーク(CRvNN)とニューラルデータルータ(NDR)について検討した。
CRvNNは従来のRvNNの境界を押し上げ、その離散的な構造的な構成を緩和し、最終的にTransformerのような構造になる。
NDRはオリジナルのTransformerを制約し、より優れた構造的帰納バイアスを誘発し、CRvNNに近いモデルに終止符を打つ。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:03:35 GMT)
Investigating Recurrent Transformers with Dynamic Halt [64.9] 本研究では, 変圧器の繰り返し機構を付加する2つの主要な手法の帰納バイアスについて検討する。
提案手法を拡張・結合する新しい手法を提案し,検討する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:35:52 GMT)
PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning [56.1] NLP分野におけるRWKVモデルから導かれる線形複雑性のモデルであるPointRWKVを提案する。
まず,改良型マルチヘッド行列値状態を用いて,PointRWKVブロック内のグローバル処理機能について検討する。
局所的な幾何学的特徴を同時に抽出するために,グラフ安定化器を用いた固定半径近傍グラフにおいて,点雲を効率的に符号化する並列分岐を設計する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:40:37 GMT)
Rethinking the Learning Paradigm for Facial Expression Recognition [56.1] 既存のトレーニングパラダイムを再考し、弱い教師付き戦略を用いて、オリジナルの曖昧なアノテーションでFERモデルをトレーニングする方がよいと提案する。
本稿では、弱教師付き戦略を用いて、オリジナルの曖昧なアノテーションでFERモデルを訓練した方がよいと論じる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:37:16 GMT)
On the Convergence of Gradient Descent for Large Learning Rates [55.3] 固定ステップサイズを使用すると収束が不可能であることを示す。
正方形損失を持つ線形ニューラルネットワークの場合,これを証明した。
また、勾配に対するリプシッツ連続性のような強い仮定を必要とせず、より一般的な損失に対する収束の不可能性も証明する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:09:08 GMT)
Towards Scalable Automated Alignment of LLMs: A Survey [54.8] 本稿では,最近登場した自動アライメントの手法を体系的にレビューする。
既存の自動アライメント手法をアライメント信号のソースに基づいて4つの主要なカテゴリに分類する。
本稿では,アライメントの基本的役割から,自動アライメント技術の実現を可能にする重要な要因について論じる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:07:59 GMT)
RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation [53.4] 本稿では,ビデオオブジェクトのセグメンテーションを参照するためのSAMの可能性を探るRefSAMモデルを提案する。
提案手法は,Cross-RValModalを用いることで,モダリティ学習を向上させるためにオリジナルのSAMモデルに適応する。
我々は、言語と視覚の特徴を効果的に調整し、融合させるために、パラメータ効率のチューニング戦略を採用している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:25:51 GMT)
MetaFood3D: Large 3D Food Object Dataset with Nutrition Values [53.2] このデータセットは、詳細な栄養情報、体重、および包括的栄養データベースに関連付けられた食品コードを含む、108カテゴリにわたる637の細かな3D食品オブジェクトから成っている。
実験の結果、我々のデータセットがアルゴリズムの性能を向上させる重要な可能性を実証し、ビデオキャプチャと3Dスキャンされたデータの間の困難さを強調し、高品質なデータ生成、シミュレーション、拡張におけるMetaFood3Dデータセットの強みを示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:02:52 GMT)
Investigating the Robustness of LLMs on Math Word Problems [53.0] 大規模言語モデルは数学用語の問題を解くのに優れるが、無関係な情報を含む現実世界の問題に苦戦する。
本稿では,無関係な変数を追加することで,MWPの逆変分を生成するプロンプトフレームワークを提案する。
敵の訓練インスタンスの微調整は、敵のMWPのパフォーマンスを8%向上させる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:48:55 GMT)
Training on the Benchmark Is Not All You Need [52.0] 本稿では,複数選択肢の内容に基づいた簡易かつ効果的なデータ漏洩検出手法を提案する。
本手法は,モデルトレーニングデータや重みを使用せずに,ブラックボックス条件下で動作することができる。
我々は,4つのベンチマークデータセットを用いて,31個の主要なオープンソースLCMのデータ漏洩の程度を評価する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:09:44 GMT)
DepthCrafter: Generating Consistent Long Depth Sequences for Open-world Videos [51.9] DepthCrafterは、オープンワールドビデオの複雑な詳細とともに、時間的に一貫した長い深さのシーケンスを生成する。
トレーニング手法により,最大110フレームまでの異なる長さの深度シーケンスを一度に生成できる。
DepthCrafterは、深度に基づく視覚効果や条件付きビデオ生成など、さまざまなダウンストリームアプリケーションを容易にする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:52:03 GMT)
CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation [51.2] 合成データセットを生成するCRAFT(Corpus Retrieval and Augmentation for Fine-Tuning)を提案する。
我々は、大規模な公開ウェブクローラコーパスと類似性に基づく文書検索を用いて、他の関連する人文文書を検索する。
我々は,CRAFTが4つのタスクに対して,大規模タスク固有のトレーニングデータセットを効率的に生成できることを実証した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:54:40 GMT)
A Fundamental Trade-off in Aligned Language Models and its Relation to Sampling Adaptors [50.0] 一致した言語モデルからコーパスをサンプリングする場合,文字列の平均報酬と平均ログ類似度との間にはトレードオフが存在することを示す。
我々は、この現象を形式的に処理し、サンプリングアダプタの選択が、どれだけの確率で報酬を交換できるかを選択できるかを実証する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:05:32 GMT)
Think Twice Before Recognizing: Large Multimodal Models for General Fine-grained Traffic Sign Recognition [49.2] 我々は、微粒な交通標識認識(TSR)を改善するために認識する前に、思考と呼ばれる新しい戦略を提案する。
我々の戦略は、大型マルチモーダルモデル(LMM)の多重思考能力を刺激することで、有効な微粒化TSRを実現する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:08:47 GMT)
FC-KAN: Function Combinations in Kolmogorov-Arnold Networks [48.4] FC-KANはKAN(Kolmogorov-Arnold Network)の一種で、低次元データ上で一般的な数学的関数を利用する。
FC-KANとマルチ層パーセプトロンネットワーク(MLP)と,BSRBF-KAN,EfficientKAN,FastKAN,FasterKANなどの既存のKANを比較した。
B-スプラインからの出力とガウス差分(DoG)を2次関数の形で組み合わせたFC-KANの変種は、5つの独立トレーニングランの平均で他のモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:16:43 GMT)
Comprehensive Equity Index (CEI): Definition and Application to Bias Evaluation in Biometrics [47.8] 本稿では,機械学習モデルのバイアス行動の定量化のための新しい指標を提案する。
顔認識システムの運用評価に焦点をあて,適用する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:19:38 GMT)
State and Action Factorization in Power Grids [47.7] 状態と行動成分の相関関係をデータに基づいて推定するドメインに依存しないアルゴリズムを提案する。
このアルゴリズムはGrid2Opシミュレータで得られた電力グリッドベンチマークで検証される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:00:58 GMT)
Application of Langevin Dynamics to Advance the Quantum Natural Gradient Optimization Algorithm [47.5] 近年,変分量子回路の最適化のためのQNGアルゴリズムが提案されている。
本研究では、この離散時間解が一般化形式を与えることを示すために、QNG力を持つランゲヴィン方程式を用いる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:21:16 GMT)
Unforgettable Generalization in Language Models [47.0] 乱数ラベルの微調整によってタスクが忘れられた言語モデル(LM)の挙動について検討する。
しかしながら、タスク全体において、LM予測がトレーニングセット外の例で変化するかどうかにおいて、極めて可変性を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:55:54 GMT)
Connectivity structure and dynamics of nonlinear recurrent neural networks [46.6] 我々は,ニューラルネットワークの高次元,内部的に発生する活動が接続構造をどのように形成するかを解析する理論を開発する。
我々の理論は、ニューラルネットワークアーキテクチャと人工および生物学的システムにおける集合力学を関連付けるためのツールを提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:08:37 GMT)
Continuous-time convolutions model of event sequences [46.3] イベントシーケンスは不均一でスパースであり、従来のモデルは不適当である。
我々は、時間とともに一様でない事象の発生を処理するために設計された効率的な畳み込みニューラルネットワークに基づくCOTICを提案する。
COTICは、次のイベント時間とタイプを予測する際に既存のモデルよりも優れており、最も近いライバルの3.714と比較して平均1.5のランクに達している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:41:49 GMT)
SA-MLP: Enhancing Point Cloud Classification with Efficient Addition and Shift Operations in MLP Architectures [46.3] 従来のニューラルネットワークは計算コストのかかる乗算演算に大きく依存している。
本稿では,乗算を加算演算とシフト演算に置き換えるAdd-MLPとShift-MLPを提案し,計算効率を大幅に向上させる。
この研究は、ポイントクラウド分類のための効率的かつ効果的なソリューションを提供し、性能と計算効率のバランスをとる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:43:44 GMT)
PMT-MAE: Dual-Branch Self-Supervised Learning with Distillation for Efficient Point Cloud Classification [46.3] 本稿では,ポイントクラウド分類のための自己教師型学習フレームワークであるPMT-MAEを紹介する。
PMT-MAEは、Transformerとコンポーネントを統合し、リッチな機能をキャプチャするデュアルブランチアーキテクチャを備えている。
PMT-MAEはベースラインのPoint-MAE (93.2%) と教師のPoint-M2AE (93.4%) を上回り、非ネイティブな3Dポイントクラウド表現を学習する能力を示している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:54:34 GMT)
Efficient Point Cloud Classification via Offline Distillation Framework and Negative-Weight Self-Distillation Technique [46.3] 本稿では,教師モデルと生徒モデルの両方の同時ロードを回避する,革新的なオフライン記録戦略を提案する。
このアプローチは教師モデルに多数の追加サンプルを投入し、データ拡張パラメータと対応するロジット出力の両方を記録する。
実験により, 提案した蒸留方式により, 学生モデルが最先端モデルに匹敵する性能を達成できることが実証された。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:12:12 GMT)
FuzzCoder: Byte-level Fuzzing Test via Large Language Model [46.2] 我々は,攻撃を成功させることで,入力ファイルのパターンを学習するために,微調整された大言語モデル(FuzzCoder)を採用することを提案する。
FuzzCoderは、プログラムの異常な動作を引き起こすために、入力ファイル内の突然変異位置と戦略位置を予測することができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:40:31 GMT)
Effect of the readout efficiency of quantum measurement on the system entanglement [45.0] 非効率なモニタリングの下で、1d量子ランダムウォークにおける粒子の絡み合いを定量化する。
測定によって引き起こされる量子-古典的交叉における系の最大平均絡み合いは、測定強度と非効率性によって異なる方法であることがわかった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:51:19 GMT)
COFFEE: A Contrastive Oracle-Free Framework for Event Extraction [44.3] オラクル情報を参照せずに文書コンテキストのみに基づいてイベントを抽出する,COFFEEと呼ばれる新しいフレームワークを提案する。
提案したCOFFEEは,イベント抽出タスクのオラクルフリー設定下での最先端のアプローチよりも優れており,ACE05で評価されている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 22:06:17 GMT)
SUMix: Mixup with Semantic and Uncertain Information [42.0] 混合データ拡張アプローチは、ディープラーニングの様々なタスクに応用されている。
そこで我々は,SUMix という新しい手法を提案し,混合率と混合試料の不確かさを学習する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:46:10 GMT)
A Lie Algebraic Theory of Barren Plateaus for Deep Parameterized Quantum Circuits [37.8] 変分量子コンピューティングスキームは、パラメタライズド量子回路を介して初期状態を送信することで損失関数を訓練する。
彼らの約束にもかかわらず、これらのアルゴリズムの訓練性は不毛の台地によって妨げられている。
十分に深いパラメタライズド量子回路の損失関数の分散を正確に表現する一般リー代数を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:56:34 GMT)
Chemical Reaction Neural Networks for Fitting Accelerating Rate Calorimetry Data [37.7] 化学反応ニューラルネットワーク(CRNN)は、モリセル21700 P45Bから得られたARCデータにN方程式のアレニウスODEの運動パラメータを適合させるために訓練される。
この手法の柔軟性は、2方程式と4方程式のモデルを用いて実験することによって実証される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:31:21 GMT)
Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation Approach [37.5] 我々はG2A-VReIDという地上から地上までの映像に基づく人物再同定のための大規模ベンチマークデータセットを構築した。
G2A-VReIDデータセットには次のような特徴がある: 1) 劇的な視点の変化; 2) 注釈付きアイデンティティの多さ; 3) リッチ屋外シナリオ; 4) 解像度の大きな差。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:50:56 GMT)
UWStereo: A Large Synthetic Dataset for Underwater Stereo Matching [37.2] UWStereoと呼ばれる大規模な合成データセットを導入する。
データセットには,左図に対する高密度かつ高精度な不均一アノテーションを備えた合成ステレオ画像ペアが29,568個含まれている。
既存の水中データセットと比較して、UWStereoはスケール、変動、アノテーション、フォトリアリスティックな画質の点で優れている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:52:27 GMT)
OceanGPT: A Large Language Model for Ocean Science Tasks [37.1] 我々は,海洋科学の課題に精通した,海洋領域における最初の大規模言語モデルであるOceanGPTを紹介した。
また,大量の海洋ドメイン命令データを自動的に取得する新しいフレームワークであるOceanGPTを提案する。
海洋域におけるLLMの能力を評価するため,最初の海洋学ベンチマークであるOceanBenchを構築した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:19:52 GMT)
AIGCs Confuse AI Too: Investigating and Explaining Synthetic Image-induced Hallucinations in Large Vision-Language Models [37.0] 我々は、AI合成画像によるLVLM(Large Vision-Language Models)の悪化する幻覚現象を強調した。
注目すべきは、AIGC textbfhallucination biasに光を当てることである: 合成画像によって誘導される物体幻覚は、より多い量で特徴づけられる。
我々は,Q-formerとLinearプロジェクタについて検討した結果,合成画像は視覚投射後のトークン偏差を呈し,幻覚バイアスを増幅することがわかった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:53:19 GMT)
Towards Explainable Traffic Flow Prediction with Large Language Models [36.9] 本稿では,Large Language Models (LLMs) に基づく交通流予測モデルを提案する。
マルチモーダルなトラフィックデータを自然言語記述に転送することで、xTP-LLMは複雑な時系列パターンと外部要因を包括的なトラフィックデータからキャプチャする。
経験的に、xTP-LLMは、ディープラーニングのベースラインと比較して、競争の正確さを示すと同時に、予測の直感的で信頼性の高い説明を提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:32:50 GMT)
Can we only use guideline instead of shot in prompt? [36.6] ショットメソッドは、与えられた例のステップを模倣することによって、モデルに質問に答えるように暗黙的にインスピレーションを与える。
ガイドライン法は、簡潔で簡潔なタスク固有の知識を含むガイドラインに従って、モデルに推論を指示する。
本稿では,フィードバック,ガイドライン,ツリーゲザエージェントからなるデータセットから,タスク固有のガイドラインを自動的に学習するFGTフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:14:55 GMT)
Temporal Order Preserved Optimal Transport-based Cross-modal Knowledge Transfer Learning for ASR [36.3] 事前訓練された言語モデルから音響モデルに言語知識を移すことにより,音声認識の性能を大幅に向上させることが示されている。
ASRのための時間順序保存OT(TOT)に基づくクロスモーダルアライメント・アンド・ナレッジ・トランスファー(CAKT)を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:11:15 GMT)
On the Benefits of Memory for Modeling Time-Dependent PDEs [35.9] 本稿では、最近のSSMアーキテクチャに基づくネットワークであるメモリニューラル演算子(MemNO)とフーリエニューラル演算子(FNO)を紹介する。
MemNOはメモリ無しでベースラインを著しく上回り、目に見えないPDEの6倍以上のエラーを発生させる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:56:13 GMT)
Capturing Human Motion from Monocular Images in World Space with Weak-supervised Calibration [35.4] モノクロ画像からの3次元運動回復のための従来の手法は、カメラ座標に依存するため、しばしば不足する。
W-HMRは、身体の歪み情報に基づいて「適切な」焦点長を予測する弱教師付き校正法である。
また,世界空間における可視的再構築のために,身体の向きを補正する OrientCorrect モジュールを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:40:15 GMT)
Leveraging Large Language Models for Solving Rare MIP Challenges [35.4] 混合プログラミング(MIP)は、数学的な解法が厳密な時間制約の中で複雑なインスタンスに対処する必要がある領域で広く適用されてきた。
大規模言語モデル(LLM)のようなエンドツーエンドモデルのモデル構築コストは、そのパターン認識能力によって問題スケールの影響を受けていない。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:25:01 GMT)
LLM-GAN: Construct Generative Adversarial Network Through Large Language Models For Explainable Fake News Detection [35.0] 大規模言語モデル(LLM)は、その強力な自然言語理解と説明生成能力で知られている。
LLMをジェネレータとインタクタにするためのプロンプト機構を利用した新しいフレームワーク LLM-GAN を提案する。
本結果は,LLM-GANが予測性能と説明品質の両方において有効であることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:06:45 GMT)
Safety Constrained Multi-Agent Reinforcement Learning for Active Voltage Control [35.0] 能動電圧制御問題を制約付きマルコフゲームとして定式化し,安全性に制約のあるMARLアルゴリズムを提案する。
実世界規模シナリオを用いた配電ネットワークシミュレーション環境における本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:10:57 GMT)
Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation [34.0] 我々は、新しいクラスを学習するためにも、広く利用可能なWebイメージを考えることができると論じている。
我々の知る限り、これは新しい概念の学習と既に学んだ概念の保存の両方のために、Webイメージにのみ依存する最初の作品である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:10:50 GMT)
You Only Use Reactive Attention Slice For Long Context Retrieval [33.7] LLM(Large Language Models)のより長いコンテキストのサポートは、LLMを前進させる有望な方向である。
注意に基づく検索手法YOURA(reactive Attention slice)を提案する。
提案手法は,長文クエリに対して最大30%のvLLM推論スループットを向上する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:30:57 GMT)
DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming [33.4] DocKylinは文書中心のMLLMで、ピクセルレベルとトークンレベルの両方でビジュアルコンテンツをスリム化する。
本稿では,ピクセルレベルのスリム化を行うためのAPSプリプロセッシングモジュールを提案する。
また,トークンレベルスライミングを行う新しい動的トークンスライミング(DTS)モジュールを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:51:37 GMT)
LUK: Empowering Log Understanding with Expert Knowledge from Large Language Models [32.9] 本稿では,LPMから専門知識を取得し,より小さなPLM上でのログ理解を促進する,LUKと呼ばれる新しい知識向上フレームワークを提案する。
LUKは、異なるログ分析タスクに関する最先端の結果を達成し、LLMからのエキスパート知識をより効果的に利用してログを理解するための広範な実験を行った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:58:34 GMT)
On the Federated Learning Framework for Cooperative Perception [28.7] フェデレーション学習は、コネクテッドおよび自律走行車間の認識、意思決定、計画において、データのプライバシ保護と協調的な拡張を可能にすることで、有望なソリューションを提供する。
本研究では,FedDWAアルゴリズム(Federated dynamic weighted aggregate, FedDWA)と呼ばれる,CPのための特殊な統合学習フレームワークを提案する。
このフレームワークは、動的クライアント重み付けをモデル収束の直接化に利用し、KLD(Kullback-Leibler divergence)を利用して非独立的かつ同一に分散された(Non-IID)データとアンバランスなデータの有害な影響を対処する新しい損失関数を統合する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:55:47 GMT)
Towards Cross-Lingual Explanation of Artwork in Large-scale Vision Language Models [28.7] 本研究では、機械翻訳に頼ることなく、複数の言語で拡張データセットを作成する。
リソース豊富な英語のインストラクションチューニングが、他の言語のパフォーマンスを向上させるかどうかを検討した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:42:56 GMT)
Shuffle Mamba: State Space Models with Random Shuffle for Multi-Modal Image Fusion [28.5] マルチモーダル画像融合は、異なるモーダルからの相補的な情報を統合して、強化された情報的画像を生成する。
本稿では,固定シーケンススキャンに伴うバイアスを取り除くために,ランダムシャッフルと呼ばれるバイーシアンに着想を得た新しいスキャン手法を提案する。
我々は,モンテカルロ平均化に基づくテスト手法を開発し,モデルの出力が期待される結果とより密に一致することを保証する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:12:18 GMT)
EA-RAS: Towards Efficient and Accurate End-to-End Reconstruction of Anatomical Skeleton [28.3] EA-RASは単段、軽量、プラグアンドプレイの解剖学的骨格推定器である。
1枚のRGB画像入力だけで、任意のポーズでリアルタイムで正確に解剖学的にリアルな骨格を提供することができる。
我々の回帰法は、既存の手法よりも800倍以上高速で、リアルタイムの要求を満たす。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:46:28 GMT)
On the Sample Complexity of Imitation Learning for Smoothed Model Predictive Control [27.6] システムの一般的なクラスに対して,スムーズな専門家を設計する方法を示す。
凸リプシッツ関数に付随する解析中心の最適性ギャップを証明した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:47:09 GMT)
White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is? [27.6] 数学的に完全に解釈可能なCRATEという,ホワイトボックストランスフォーマーのようなディープネットワークアーキテクチャのファミリーを示す。
実験によると、これらのネットワークは単純さにもかかわらず、大規模な実世界の画像とテキストデータセットの表現を圧縮し、分散化することを学習している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:31:48 GMT)
Segmenting Object Affordances: Reproducibility and Sensitivity to Scale [27.3] セマンティックセグメンテーションのための学習に基づくアーキテクチャを、アベイランスセグメンテーションタスクに再利用し、適応する手法。
2つの単一オブジェクトのシナリオで再現可能な設定でこれらのメソッドをベンチマークする。
我々の分析は、オブジェクトの解像度がトレーニングセットと異なる場合、モデルは変動をスケールするのに堅牢ではないことを示している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:54:36 GMT)
Empirical evidence of Large Language Model's influence on human spoken communication [25.1] 人工知能(AI)エージェントは、今や自然言語で何十億もの人間と対話する。
このことは、AIが人間の文化の基本的な側面を形成する可能性を秘めているかどうか、という疑問を提起する。
最近の分析によると、科学出版物はAI固有の言語の証拠をすでに示している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:01:51 GMT)
AllWeatherNet:Unified Image enhancement for autonomous driving under adverse weather and lowlight-conditions [24.4] 本稿では,悪条件により劣化した視覚的品質と明度を改善する方法を提案する。
我々の手法であるAllWeather-Netは、新しい階層型アーキテクチャを用いて、すべての悪条件をまたいで画像を強化する。
再学習することなく、最大3.9%のmIoU改善を達成し、未確認領域に適用することで、モデルの一般化能力を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:47:01 GMT)
Decompose the model: Mechanistic interpretability in image models with Generalized Integrated Gradients (GIG) [24.0] 本稿では,すべての中間層を経由した入力から,データセット全体の最終的な出力まで,経路全体をトレースする新しい手法を提案する。
本稿では,PFV(Pointwise Feature Vectors)とERF(Effective Receptive Fields)を用いて,モデル埋め込みを解釈可能な概念ベクトルに分解する。
そして,汎用統合勾配(GIG)を用いて概念ベクトル間の関係を計算し,モデル行動の包括的,データセットワイドな解析を可能にする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:19:35 GMT)
Enhancing Fine-Grained Visual Recognition in the Low-Data Regime Through Feature Magnitude Regularization [23.8] 抽出した特徴量の均等分布を保証するために正規化手法を導入する。
その明らかな単純さにもかかわらず、我々の手法は様々な細粒度視覚認識データセットに対して顕著な性能向上を示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:32:46 GMT)
S$^3$c-Math: Spontaneous Step-level Self-correction Makes Large Language Models Better Mathematical Reasoners [23.7] 自己補正は,大規模言語モデル(LLM)の潜在的な推論能力を刺激する手法である
本稿では,S$3$c-Mathを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:40:21 GMT)
DiVE: DiT-based Video Generation with Enhanced Control [23.6] 時間的・多視点的な一貫したビデオを生成するために特別に設計された第1のDiTベースのフレームワークを提案する。
具体的には、パラメータフリーな空間ビューインフレードアテンション機構を利用して、クロスビューの一貫性を保証する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:29:59 GMT)
General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model [22.8] 我々は,OCR-2.0の到来を促進するために,汎用OCR理論と優れたモデル,すなわちGOTを提案する。
GOTは580Mパラメータを持ち、高圧縮エンコーダと長文デコーダからなる統一的でエレガントでエンドツーエンドのモデルである。
OCR-2.0モデルとして、GOTは様々なOCRタスクで上記の「キャラクタ」を処理できる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:41:31 GMT)
Rethinking Barely-Supervised Volumetric Medical Image Segmentation from an Unsupervised Domain Adaptation Perspective [22.7] 本稿では, ほとんど管理されていない医用画像セグメンテーション(BSS)の課題について検討する。
我々は、新しいBSSフレームワーク、textbfBarely-supervised learning textbfvia unsupervised domain textbfAdaptation (BvA)を提案する。
特筆すべきは、左心房セグメンテーションデータセットをわずかにラベル付けされた画像のみを用いてトレーニングし、Diceスコアが81.20%に達し、最先端の61.71%を上回ったことである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:46:17 GMT)
On the Vulnerability of Skip Connections to Model Inversion Attacks [22.2] 本研究では,スキップ接続がモデル反転(MI)攻撃に与える影響について検討する。
Skip接続はMI攻撃を強化し、データのプライバシーを侵害する。
我々はMIレジリエントアーキテクチャの設計を初めて提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:33:52 GMT)
Robust Fitting on a Gate Quantum Computer [22.0] 実ゲート量子コンピュータにおける量子ロバスト適合性を示す量子回路を, 1次元の場合において, $ell_infty$ 実現可能性テストとして提案する。
また,高次元非線形モデルに対する1次元ブールの影響を蓄積して,その影響を計算する方法を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:54:20 GMT)
Improving the Prediction of Individual Engagement in Recommendations Using Cognitive Models [21.2] 本稿では、インスタンスベース学習理論に基づく認知モデルが、既存の純粋計算アプローチをどのように拡張するかを示す。
この結果から,一般時系列予測器(LSTMなど)と比較して,ILBモデルは個人の状態のダイナミクスをよりよく予測できることがわかった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:16:53 GMT)
Heterogeneity-Informed Meta-Parameter Learning for Spatiotemporal Time Series Forecasting [21.0] 本稿では,ヘテロジネティ-In-formed Meta-Networks (HimNet) をヘテロジネティ-イン-フォームド・メタネットワーク(HimNet)として提案する。
HimNetは5つの広く使用されているベンチマークにおいて優れた進歩を示しながら、最先端の解釈可能性を実現している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:43:37 GMT)
A Deployed Online Reinforcement Learning Algorithm In An Oral Health Clinical Trial [20.9] 歯科疾患は、実質的な財政的負担、個人的苦痛、全身疾患のリスクの増加を伴う慢性疾患である。
毎日2回歯磨きを推奨しているにもかかわらず、忘れやすさや解離などの要因により、推奨された口腔セルフケア行動への固執は依然として最適ではない。
歯科疾患のリスクを負う医療従事者の予防ケアを補完する医療介入システムOralyticsを開発した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:16:01 GMT)
Distributionally robust risk evaluation with an isotonic constraint [20.7] 分布的に堅牢な学習は、不確実な分布の集合内で最悪のケースの統計性能を制御することを目的としている。
本稿では,未知のターゲット分布が推定値と異なる方法に関する事前情報を組み込んだDRLの形状制約手法を提案する。
合成データと実データの両方に関する実証研究は、提案した形状制約手法の精度の向上を実証している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:57:54 GMT)
SSM Meets Video Diffusion Models: Efficient Long-Term Video Generation with Structured State Spaces [20.2] 映像生成のための最近の拡散モデルでは、時間的特徴を抽出するために注意層を主に利用している。
この制限は拡散モデルを用いてより長いビデオシーケンスを生成する際に大きな課題をもたらす。
本研究では,状態空間モデル(SSM)を時間的特徴抽出器として活用することを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:24:20 GMT)
Learning a Generalized Physical Face Model From Data [19.6] 物理シミュレーションは3次元顔アニメーションの強力なアプローチである。
大規模な3次元顔データセットから学習する,一般化された顔モデルを提案する。
我々のモデルは、目に見えないあらゆるアイデンティティに迅速に適合し、自動的に自己認識可能な物理顔モデルを生成することができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:24:49 GMT)
Counterfactual Fairness by Combining Factual and Counterfactual Predictions [19.0] 医療や雇用といった高度な分野において、意思決定における機械学習(ML)の役割は、かなりの公平さの懸念を提起する。
この研究は、あらゆる個人に対するMLモデルの結果が、異なる人口集団に属していた場合、変化しないべきであると仮定する対実公正(CF)に焦点を当てている。
本稿では,CFと予測性能のトレードオフをモデルに依存しない形で理論的に検討する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:21:10 GMT)
Low-Resolution Face Recognition via Adaptable Instance-Relation Distillation [18.7] 低解像度の顔認識は、情報的詳細が欠落しているため、難しい課題である。
近年のアプローチでは、高分解能な手がかりが適切な知識伝達を通じて、低分解能な顔認識を導出できることが証明されている。
低分解能顔認識を容易にするための適応型インスタンス相関蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:53:34 GMT)
Large Language Models for Anomaly and Out-of-Distribution Detection: A Survey [18.6] 大規模言語モデル(LLM)は、自然言語処理だけでなく、より広範なアプリケーションでもその効果を実証している。
本調査は,LSMの文脈下での異常検出とOOD検出の問題点に焦点を当てた。
LLMが果たす役割に基づいて,既存のアプローチを3つのクラスに分類する新たな分類法を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:22:41 GMT)
Disorder-tunable entanglement at infinite temperature [18.6] 我々は、リッチな絡み合い構造を持つ非熱化状態を実現するために、カスタム構築の超伝導量子ビットはしごを構築した。
事実上「無限の」温度アンサンブルを形成するにもかかわらず、これらの状態は平衡から遠く離れた量子情報をしっかりとエンコードする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:02:35 GMT)
EvoChart: A Benchmark and a Self-Training Approach Towards Real-World Chart Understanding [18.4] 本稿では,合成チャートデータを生成するための自己学習手法であるEvoChartを紹介する。
EvoChart-QAも提案する。これは実世界のシナリオにおいて,モデルのチャート理解能力を測定するためのNovalベンチマークである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:23:00 GMT)
Optimization and Deployment of Deep Neural Networks for PPG-based Blood Pressure Estimation Targeting Low-power Wearables [18.0] PPG-to-BP信号と信号の再構成やスカラーBP値の回帰のために訓練された最先端のDeep Neural Networks(DNN)は、公開データセット上での古典的手法よりも優れていることが示されている。
我々は,超低消費電力のSystem-on-Chip (SoC) GAP8上に展開可能な,HW対応ニューラルアーキテクチャサーチ(NAS)と量子化を含む完全自動DNN設計パイプラインについて述べる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:48:43 GMT)
Adaptive Explicit Knowledge Transfer for Knowledge Distillation [17.7] 教師モデルから,非目標クラスの確率分布を効果的に提供することにより,ロジットに基づく知識蒸留の性能を向上させることができることを示す。
本研究では,学習者が暗黙的な知識を適応的に学習できる新たな損失を提案する。
実験結果から, 適応的明示的知識伝達法(AEKT)は, 最先端KD法と比較して性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:42:59 GMT)
Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.7] 本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。
マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:25:44 GMT)
Behavioral Learning of Dish Rinsing and Scrubbing based on Interruptive Direct Teaching Considering Assistance Rate [17.6] 本稿では,食器洗浄のための安全で巧妙な操作システムを提案する。
ロボットは、オブジェクトの状態とロボット自体を推定することにより、オブジェクトの動的モデルを学ぶ。
人的援助の少ない安全な行動を生成することが可能である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:31:51 GMT)
Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides [17.6] そこで本研究では,まず物理前処理をブリッジマッチングに組み込んだ実力誘導型ブリッジマッチングモデルFBMを提案する。
我々のよく設計された中間力場の誘導により、FBMは余分なステップなしで直接推論によりボルツマン様の分布を目標にすることができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:30:27 GMT)
VSLLaVA: a pipeline of large multimodal foundation model for industrial vibration signal analysis [17.4] 本稿では,信号パラメータの同定と故障の診断に専門家の知識を統合するために,大規模言語モデルを活用したVSLLaVAというパイプラインを提案する。
このジェネレータは、ドメイン固有のパラメータ識別と故障診断問合せペアを用いて振動解析の専門家が提供した信号をマージして、信号問合せ三重項を構築する。
この微調整モデルは,大規模言語モデルとエキスパートルールを組み合わせて,回答の精度と妥当性を評価することによって評価される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:21:26 GMT)
In Defense of RAG in the Era of Long-Context Language Models [17.4] Retrieval-augmented Generation (RAG) は、過去においてコンテキストベースの回答生成の信頼性の高いソリューションである。
近年の研究では、長文LLMは長文アプリケーションにおいてRAGを著しく上回っていることが示されている。
本稿では,長文質問応答アプリケーションにおけるRAGの性能を大幅に向上させる命令保存検索拡張生成(OP-RAG)機構を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:17:41 GMT)
Learn Suspected Anomalies from Event Prompts for Video Anomaly Detection [16.8] イベントプロンプトから疑わしい異常の学習を導くための新しい枠組みが提案されている。
これにより、新しいマルチプロンプト学習プロセスにより、すべてのビデオの視覚的セマンティックな特徴を制限できる。
提案手法はAPやAUCといった最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:21:30 GMT)
Evaluation and Comparison of Visual Language Models for Transportation Engineering Problems [16.5] 我々は、視覚に基づく輸送工学タスクのための最先端のビジョン言語モデル(VLM)について検討した。
画像分類作業は渋滞検出と亀裂識別を伴い, 物体検出ではヘルメット違反が同定された。
我々はこれらのVLMモデルの性能を評価するために、CLIP、BLIP、OWL-ViT、Llava-Next、およびクローズソースGPT-4oといったオープンソースモデルを適用した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:24:37 GMT)
A Survey on Responsible Generative AI: What to Generate and What Not [15.9] 本稿では,テキスト生成モデルと視覚生成モデルの両方の実用的責任要件について検討する。
真理コンテンツの生成,有害なコンテンツの回避,有害な指導の拒否,トレーニングデータ関連コンテンツの漏洩,生成内容の確認という5つの重要な考察を概説する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:23:55 GMT)
AdaComp: Extractive Context Compression with Adaptive Predictor for Retrieval-Augmented Large Language Models [15.9] ノイズを含む検索された文書は、RAGが答えの手がかりを検知するのを妨げ、推論プロセスを遅く、高価にする。
本稿では,クエリの複雑さと検索品質の両面から圧縮率を適応的に決定する,低コストな抽出文脈圧縮手法であるAdaCompを紹介する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:25:59 GMT)
CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention [15.8] CyberHostは、エンドツーエンドのオーディオ駆動人間アニメーションフレームワークである。
Region Codebook Attention Mechanisms improve the generation quality of face and hand animations。
身体運動マップ、手明度スコア、ポーズ整列基準特徴、局所的な強化監督など、人間優先のトレーニング戦略により、合成結果が改善される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:19:31 GMT)
On the Optimality of Misspecified Spectral Algorithms [15.4] 誤ったスペクトルアルゴリズム問題では、研究者は通常、[mathcalH]s$の地下真の関数$f_rho*を仮定する。
スペクトルアルゴリズムは任意の$alpha_0-frac1beta s 1$に対して、$beta$は$mathcalH$の固有値減衰率であることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:57:03 GMT)
Three Pillars Towards Next-Generation Routing System [15.3] 本稿では,ルーティング結果の影響をリアルタイムに考慮し,交通渋滞を低減できる次世代ルーティングパラダイムを提案する。
このようなシステムを実装するために,1)交通流と交通条件の関係を確証した交通条件シミュレーション,2)動的経路更新による効率的なシミュレーションを支援する将来の経路管理,3)全体の交通システム効率を改善するグローバルルーティング最適化の3つの重要な要素を同定する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:32:30 GMT)
Dual Advancement of Representation Learning and Clustering for Sparse and Noisy Images [14.8] SNI(Sparse and Noisy Image)は、効果的な表現学習とクラスタリングに重要な課題を提起する。
本稿では、マスク画像モデリングから得られた表現を強化するために、DARLC(Dual Advancement of Representation Learning and Clustering)を提案する。
我々のフレームワークは、局所的な認識性、特異性、関係意味論の理解を高めることによって、表現の学習を改善する包括的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:52:27 GMT)
Fundamental Challenges in Cybersecurity and a Philosophy of Vulnerability-Guided Hardening [14.8] もっとも重要なソフトウェアシステムでさえ、攻撃に弱いことが判明した。
証明可能なセキュリティでさえ、攻撃者がセキュリティ上の欠陥を見つけるのを止めることはできない。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:24:27 GMT)
MedUnA: Language guided Unsupervised Adaptation of Vision-Language Models for Medical Image Classification [14.7] 本稿では,2段階の学習:適応事前学習と教師なし学習を構成するアンダーラインMedical UnderlineUnsupervised UnderlineAdaptation (textttMedUnA)を提案する。
胸部X線像,眼底画像,皮膚病変画像の3種類のデータモダリティを用いたtextttMedUnA の評価を行った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:25:51 GMT)
Correcting misinformation on social media with a large language model [14.7] 現実世界の誤報は、しばしばマルチモーダルであり、因果関係を混同するような様々な戦術で誤解を招くことがある。
このような誤報は、特にソーシャルメディアにおいて、ひどく過小評価され、対処が困難であり、様々な社会的ドメインに害を与えている。
本稿では,最新の情報へのアクセスと信頼性を付加したLCMであるMUSEを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:51:40 GMT)
AI Governance in Higher Education: Case Studies of Guidance at Big Ten Universities [14.3] ジェネレーティブAIは高等教育の利害関係者から大きな注目を集めている。
同時に学術的整合性に挑戦し、倫理的な問題に繋がる。
先進的な大学はすでに、ジェネレーティブAIに関するガイドラインを公開している。
本研究は、これらのガイドラインに示すように、責任あるAIガバナンスのための戦略に焦点を当てる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:06:45 GMT)
Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers [14.1] 本稿では,大規模コークスデータセットを用いた自己教師型学習と教師型学習を併用したコークス病分類手法を提案する。
提案手法は、新型コロナウイルスの診断のための2つのベンチマークデータセットと、AUROC 92.5% の COPD/non-COPD 分類のためのプロプライエタリデータセットにおいて、先行技術よりも一貫して優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:22:18 GMT)
Taking the Next Step with Generative Artificial Intelligence: The Transformative Role of Multimodal Large Language Models in Science Education [13.9] MLLM(Multimodal Large Language Models)は、テキスト、音声、視覚入力を含むマルチモーダルデータを処理できる。
本稿では,科学教育の中心的な側面におけるMLLMの変革的役割について,模範的な革新的な学習シナリオを提示することによって考察する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:43:53 GMT)
Equivariance-based self-supervised learning for audio signal recovery from clipped measurements [13.8] クリップ計測から音声信号を復元する非線形逆問題に対する自己教師型学習について検討した。
提案手法は, 自己教師付き自己教師型復号法の性能を, 完全教師付き学習と良好に比較できることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:12:01 GMT)
GraspSplats: Efficient Manipulation with 3D Feature Splatting [13.7] 我々は60秒未満で高品質なシーン表現を生成するGraspSplatsを提案する。
フランカロボットの広範な実験により,GraspSplatsが既存手法よりも優れていたことが実証された。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:35:48 GMT)
4D-CAT: Synthesis of 4D Coronary Artery Trees from Systole and Diastole [13.4] 心臓の鼓動は血管の変形を引き起こし、血管のイメージング状態と偽陽性の診断結果をもたらす。
コントラスト剤注入の投与限界のため, 有限位相イメージングにより4次元冠状動脈木を合成することが重要である。
そこで本研究では, 変形場予測により, システロールをダイアストロールにマッピングする4次元冠状動脈木を生成する方法を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:08:25 GMT)
From Data to Insights: A Covariate Analysis of the IARPA BRIAR Dataset for Multimodal Biometric Recognition Algorithms at Altitude and Range [13.4] 本稿では,IARPA BRIARデータセットにおける全身バイオメトリックス性能の融合に着目し,UAVプラットフォーム,高度位置,最大1000mに焦点をあてる。
データセットには、屋内画像や制御された歩行記録と比較して、屋外ビデオが含まれている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 00:58:50 GMT)
End-to-end Feature Selection Approach for Learning Skinny Trees [13.4] 木アンサンブルにおける特徴選択のための最適化に基づく新しい手法を提案する。
Skinny Treesは、ツリーアンサンブルの機能選択のためのエンドツーエンドツールキットである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:34:54 GMT)
A Lesion-aware Edge-based Graph Neural Network for Predicting Language Ability in Patients with Post-stroke Aphasia [12.1] 本稿では,脳卒中後失語症患者の安静時fMRI(r-fMRI)接続から言語能力を予測するために,病変認識型グラフニューラルネットワーク(LEGNet)を提案する。
本モデルでは,脳領域間の機能的接続を符号化するエッジベース学習モジュール,病変符号化モジュール,サブグラフ学習モジュールの3つのコンポーネントを統合する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:28:48 GMT)
CTG-KrEW: Generating Synthetic Structured Contextually Correlated Content by Conditional Tabular GAN with K-Means Clustering and Efficient Word Embedding [12.1] 条件付き Tabular Generative Adversarial Networks (CTGAN) は、合成データを効率的に作成する能力に魅力がある。
本稿では,属性が意味的・文脈的に一貫性のある単語の集合である現実的な合成データを生成するのに長けている新しいフレームワークCTGKrEWを紹介する。
CTGKrEWは、従来のアプローチに比べてCPU時間の約99%、メモリフットプリントを33%削減する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:53:57 GMT)
Restorer: Removing Multi-Degradation with All-Axis Attention and Prompt Guidance [12.1] textbfRestorerはトランスフォーマーベースのオールインワン画像復元モデルである。
追加のトレーニングを必要とせずに、現実世界のシナリオで複合的な劣化を処理することができる。
推論中は効率が良く、現実世界の応用の可能性も示唆している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:36:22 GMT)
Enhancing Code-Switching Speech Recognition with LID-Based Collaborative Mixture of Experts Model [12.0] 本研究では,専門家グループ間の協調的なメカニズムを活用するMixture of Experts(MoE)モデルであるCollaborative-MoEを提案する。
各言語専門家グループ内では、ゲーティングネットワークは、言語以外の属性に関するコラボレーションを促進するために教師なしの運営を行っている。
提案手法は,MoEモデルの特徴となる効率的な推論能力を,追加の事前学習を必要とせずに保持する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:53:38 GMT)
Unbundle-Rewrite-Rebundle: Runtime Detection and Rewriting of Privacy-Harming Code in JavaScript Bundles [11.8] Unbundle-Rewrite-Rebundle (URR)は、バンドルされたJavaScriptコードのプライバシー保護部分を検出するシステムである。
URRはそのコードを実行時に書き直して、周囲のコードやアプリケーション全体を壊すことなく、プライバシ保護の動作を削除する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:15:32 GMT)
Boosting Vision-Language Models for Histopathology Classification: Predict all at once [11.6] 病理組織学における視覚言語モデルへのトランスダクティブアプローチを提案する。
私たちのアプローチは非常に効率的で、ほんの数秒で105ドルのパッチを処理します。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:24:12 GMT)
GaussianPU: A Hybrid 2D-3D Upsampling Framework for Enhancing Color Point Clouds via 3D Gaussian Splatting [11.6] ロボット知覚のための3Dガウススプラッティング(3DGS)に基づく2D-3Dハイブリッドカラークラウドサンプリングフレームワーク(GaussianPU)を提案する。
二重スケールレンダリング画像復元ネットワークは、スパースポイントクラウドレンダリングを密度表現に変換する。
バニラ3DGSに一連の改良を加え、ポイント数を正確に制御できるようにしました。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:35:04 GMT)
Long-Range Biometric Identification in Real World Scenarios: A Comprehensive Evaluation Framework Based on Missions [11.6] 本稿では,高度・範囲の個人を特定するための研究ソリューションについて検討する。
顔と身体の特徴を融合させることにより,有効な長距離識別のための堅牢な生体計測システムの開発を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:17:36 GMT)
TimeDiT: General-purpose Diffusion Transformers for Time Series Foundation Model [11.3] 時間的自己回帰生成型トランスフォーマーアーキテクチャを利用するモデル群が開発されている。
TimeDiTは時系列の一般的な基礎モデルであり、時間的自己回帰生成の代わりにデノナイジング拡散パラダイムを用いる。
TimeDiTの有効性を実証するために,予測,計算,異常検出などのタスクの多種多様な実験を行った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 22:31:57 GMT)
NeMo-Aligner: Scalable Toolkit for Efficient Model Alignment [11.3] NeMo-Alignerはモデルアライメントのためのツールキットである。
最大のオープンソースLLMをトレーニングするために、効率よく1000GPUまでスケールすることができる。
NeMo-AlignerはApache 2.0ライセンスでオープンソース化されている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:47:42 GMT)
Drowzee: Metamorphic Testing for Fact-Conflicting Hallucination Detection in Large Language Models [11.1] 我々は、FCH(Fact-Conflicting Hallucinations)の検出のためのメタモルフィックテストを強化するために、論理プログラミングを活用する革新的なアプローチを提案する。
テストケースを生成し,9つのドメインにまたがる6つの異なる大言語モデルに対して幻覚を検知し,24.7%から59.8%の比率を示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:40:08 GMT)
Zyda: A 1.3T Dataset for Open Language Modeling [11.0] Zydaは1.3兆のトークンからなる寛容なライセンス下でのデータセットで、主要なオープンソースのデータセットを単一の高品質なコーパスに統合することによって組み立てられる。
我々の評価によると、ZydaはDolma、FinalWeb、RefinedWebといった他のオープンデータセットと競合するだけでなく、Pythiaスイートの同等モデルの性能を大幅に改善している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:11:11 GMT)
VoxHakka: A Dialectally Diverse Multi-speaker Text-to-Speech System for Taiwanese Hakka [10.8] VoxHakka(ヴォックスハッカ、VoxHakka)は、台湾の言語であるHakka向けに設計された音声合成システムである。
VoxHakkaは音声合成における自然性と精度,低リアルタイム化を実現している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:37:34 GMT)
AgentRE: An Agent-Based Framework for Navigating Complex Information Landscapes in Relation Extraction [10.7] 複雑なシナリオにおける関係抽出(RE)は、多種多様な関係型や単一の文内のエンティティ間のあいまいな関係のような課題に直面します。
本稿では,複雑なシナリオにおいてREを実現するために,大規模言語モデルの可能性を完全に活用するエージェントベースのREフレームワークであるAgentREを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:53:05 GMT)
A Modern Take on Visual Relationship Reasoning for Grasp Planning [10.5] 本稿では,視覚的リレーショナル推論による把握計画を提案する。
D3GDは、97の異なるカテゴリから最大35のオブジェクトを持つビンピックシーンを含む、新しいテストベッドである。
また、新しいエンドツーエンドのトランスフォーマーベースの依存性グラフ生成モデルであるD3Gを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:30:48 GMT)
Addendum to "Power-law decay of the fraction of the mixed eigenstates in kicked top model with mixed-type classical phase space" [10.4] 固有状態のフシミ関数を研究するためのアクセス可能なシステムサイズは、文献で報告されているものよりもはるかに大きい可能性があることを示す。
完全にカオス化されたトップでは、平均Wehrlエントロピーの局所化測度が円ユニタリアンサンブルの予測に近づくことが分かる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:07:21 GMT)
PROZE: Generating Parameterized Unit Tests Informed by Runtime Data [10.4] パラメータ化された単体テスト(PUT)は、一連の入力を引数として受け取り、これらすべての入力に対して真であると予想されるアサーションを含む。
本稿では,複数の入力を保持するPUTのオーラクルを見つける問題に対処する。
我々は,複数のテスト入力に対して有効な開発者記述アサーションを識別し,PUTを生成するPROZEと呼ばれるシステムの設計を行う。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:24:32 GMT)
TASL-Net: Tri-Attention Selective Learning Network for Intelligent Diagnosis of Bimodal Ultrasound Video [10.1] 本稿では,この課題に対処するための新しい3段階選択学習ネットワーク(TASL-Net)を提案する。
TASL-Netは、超音波ビデオのインテリジェント診断のための相互変換フレームワークに、ソノグラフィーの3種類の診断注意を組み込む。
肺,乳房,肝臓の3つのデータセット上でTASL-Netの性能を詳細に検証した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:50:37 GMT)
The Role of Large Language Models in Musicology: Are We Ready to Trust the Machines? [10.0] 本稿では,検索拡張生成モデルと複数選択質問生成を用いた初期ベンチマーク作成のための半自動手法を提案する。
400人の有能な質問に対する評価は、現在のバニラLLMは、音楽辞書からの強化生成を検索するよりも信頼性が低いことを示している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:05:38 GMT)
Squid: Long Context as a New Modality for Energy-Efficient On-Device Language Models [9.9] Dolphinは、言語モデルにおける長いコンテキストのエネルギー効率の高い処理のための新しいデコーダデコーダアーキテクチャである。
弊社のアプローチは、デバイス上のモデルに固有の、エネルギー消費とレイテンシの問題に対処する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:38:16 GMT)
3DGS.zip: A survey on 3D Gaussian Splatting Compression Methods [9.7] 本稿では,3次元ガウススプラッティング圧縮法について,様々なベンチマークにおける統計的性能に着目して検討する。
評価されたデータセットには、TurpsAndTemples、MipNeRF360、DeepBlending、SyntheticNeRFがある。
各手法について,Pak Signal-to-Noise Ratio (PSNR), Structure similarity Index (SSIM), Learned Perceptual Image Patch similarity (LPIPS)を報告する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:54:52 GMT)
Distilling Knowledge for Short-to-Long Term Trajectory Prediction [9.6] 長期軌道予測はコンピュータビジョン、機械学習、ロボット工学の分野において重要な問題である。
本稿では,学生ネットワークに長期軌跡予測を誘導する短期軌跡モデル予測器の蒸留を利用する新しい手法であるDi-Longを提案する。
実験の結果,提案手法は長期予測に有効であり,最先端の性能を実現することができることがわかった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:56:48 GMT)
Observing Context Improves Disparity Estimation when Race is Unobserved [9.5] 文脈的特徴を取り入れた2つの新しい文脈的プロキシモデルを導入する。
これらのアルゴリズムは,実世界の住宅ローンと有権者データに対する格差を推定する上で,大幅な性能向上を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:26:05 GMT)
InkubaLM: A small language model for low-resource African languages [9.4] InkubaLMは0.4億のパラメータを持つ小さな言語モデルである。
パラメータ数が大幅に大きいモデルに匹敵するパフォーマンスを実現する。
複数の言語にまたがる顕著な一貫性を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:55:01 GMT)
MCBA: A Matroid Constraint-Based Approach for Composite Service Recommendation Considering Compatibility and Diversity [9.2] 本稿では,複合サービスレコメンデーションのためのMatroid Constraint-Based Approach (MCBA)を提案する。
第1段階では、API合成問題は最小グループスタイナーツリー(M GST)問題として定式化される。
第2段階では, 分割マトロイド制約(MMR-PMC)の下でのMarginal Relevance法を用いて, 推薦の多様性を確保する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:46:02 GMT)
QueryCheetah: Fast Automated Discovery of Attribute Inference Attacks Against Query-Based Systems [9.1] 本稿では,QBSに対するプライバシー攻撃の自動発見手法であるQueryCheetahを提案する。
従来の手法よりも強力な攻撃を発見できると同時に,最先端の自動化手法よりも18倍高速であることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:37:05 GMT)
Snapshot: Towards Application-centered Models for Pedestrian Trajectory Prediction in Urban Traffic Environments [9.0] Snapshotはフィードフォワードニューラルネットワークで、芸術の現在の状態をはるかに少ない情報を利用して上回る。
Snapshotをモジュラー自動運転ソフトウェアスタックに統合することで、現実の応用性を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:15:49 GMT)
A Multimodal Object-level Contrast Learning Method for Cancer Survival Risk Prediction [9.0] コンピュータ支援によるがん生存予測は、患者のタイムリーな治療において重要な役割を担っている。
がん生存リスク予測のための新しいトレーニング手法であるマルチモーダルオブジェクトレベルのコントラスト学習を提案する。
提案手法により訓練された生存リスク予測器は、2つの公共マルチモーダル癌データセット上で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:36:34 GMT)
Explicit Differentiable Slicing and Global Deformation for Cardiac Mesh Reconstruction [9.0] 医用画像からの心臓解剖のメッシュ再構築は, 形状, 運動計測, 生体物理シミュレーションに有用である。
従来のボクセルベースのアプローチは、イメージの忠実さを損なう前処理と後処理に依存している。
そこで本稿では,メッシュのスライスからメッシュへの勾配バックプロパゲーションを可能にする,新しい識別可能なボキセル化とスライシング(DVS)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:19:31 GMT)
Speech Foundation Model Ensembles for the Controlled Singing Voice Deepfake Detection (CtrSVDD) Challenge 2024 [8.9] 本研究は,1.79%のプールド等誤り率(EER)で先行システムを実現するための我々のアプローチを詳述する。
生成AIモデルの急速な進歩は、AIが生成するディープフェイクの歌声を検出する上で重要な課題である。
Singing Voice Deepfake Detection (SVDD) Challenge 2024は、この複雑な課題に対処することを目的としている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:28:45 GMT)
Improving Rare Word Translation With Dictionaries and Attention Masking [8.9] バイリンガル辞書からソース文への追加定義を提案し,アテンションマスキングを用いてレアワードとそれらの定義をリンクする。
稀な単語の定義を含むと、最大1.0BLEUと1.6MacroF1の性能が向上することがわかった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:47:09 GMT)
Space evaluation based on pitch control using drone video in Ultimate [8.9] 本研究は,アルティメットで広く採用されている3-on-3フォーマットに着目し,攻撃的プレイにおける空間評価を行う。
モデルはサッカーのピッチコントロールモデルから派生し、ディスクを保持するプレイヤーが静止しているUltimateのルールに適合する。
位置重みと距離重みをピッチ制御値と統合することにより、空間評価指標の導出が可能となる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:19:02 GMT)
CAST: Cross-Attention in Space and Time for Video Action Recognition [8.8] 空間時間におけるクロスアテンション(CAST)と呼ばれる新しい2ストリームアーキテクチャを提案する。
CASTは、バランスの取れた入力のみを使用して、ビデオの時間的バランスの取れた理解を実現する。
提案手法により,空間的・時間的専門家モデルによる情報交換と相乗的予測が可能となる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:16:32 GMT)
Low-Rank Quantization-Aware Training for LLMs [8.5] 大規模言語モデル(LLM)は、一様だが、計算とメモリの需要がますます増大しているため、その実践的な展開は困難である。
LLMのための軽量かつメモリ効率のQATアルゴリズムであるLR-QATを提案する。
提案手法は、PTQ(Common-training Quantization)アプローチよりも優れ、メモリ使用率のごく一部でフルモデルQATと同じモデル性能に達する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:36:06 GMT)
Towards Neural Synthesis for SMT-Assisted Proof-Oriented Programming [8.3] 我々は600K行のオープンソースF*プログラムと証明のデータセットをキュレートする。
我々のデータセットには、約32KのトップレベルF*定義が含まれており、それぞれが型指向プログラムと証明合成の問題を表している。
我々は、AIを用いてプログラムと証明をF*で合成し、有望な結果を得る。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:11:31 GMT)
F2former: When Fractional Fourier Meets Deep Wiener Deconvolution and Selective Frequency Transformer for Image Deblurring [8.3] 本稿では、空間周波数の統一表現であるFRFT(Fractional Fourier Transform)に基づく新しい手法を提案する。
提案手法の性能は,他のSOTA手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:05:12 GMT)
Booster: Tackling Harmful Fine-tuing for Large Language Models via Attenuating Harmful Perturbation [7.9] 有害な微調整問題 citepqi2023fineは、大規模言語モデルの微細チューニング・アズ・ア・サービスに対して深刻な安全性上の懸念をもたらす。
本稿では,この問題を軽減するために,Boosterと呼ばれるアライメントステージソリューションを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:59:22 GMT)
Antidote: Post-fine-tuning Safety Alignment for Large Language Models against Harmful Fine-tuning [7.9] 大規模言語モデル(LLM)は、害のある微調整攻撃(citeqi2023fine)に対して脆弱である。
既存の緩和戦略には、アライメントステージソリューション citehuang2024vaccine、rosati2024representation、微調整ステージソリューション citehuang2024lazy、mukhoti2023fineが含まれる。
我々は、textbftextitagsticに留まらず、微調整後のステージソリューションであるAntidoteを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:45:21 GMT)
Raising AI Ethics Awareness through an AI Ethics Quiz for Software Practitioners [7.9] 研究は、AI倫理と倫理原則に対する実践者の認識と知識に重大なギャップがあることを示唆している。
我々は、ソフトウェア実践者間の認知を高め、AI倫理の知識を高めるための、ソフトウェアベースのツールであるAI Ethics Quizを開発した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:14:01 GMT)
Statistical Context Detection for Deep Lifelong Reinforcement Learning [7.9] オンライン体験からタスクラベルを推測することは難しい問題だ。
本稿では、オンラインの深層強化学習環境において、ポリシーとラベルの両方を学習するためのアプローチを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:25:46 GMT)
Latent Distillation for Continual Object Detection at the Edge [7.8] 本研究では,物体検出のための連続学習(CLOD)シナリオにおいて,エッジデバイスのメモリと制約に対処する。
具体的には,エッジデバイス上でのCLODのためのオープンソース,軽量,高速な検出器であるNanoDetの適合性について検討する。
本稿では,最先端のCLアプローチで要求される操作数とメモリ量を削減できるLatent Distillation(LD)という新しいCL手法を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:14:13 GMT)
Uncertainty Quantification Using Ensemble Learning and Monte Carlo Sampling for Performance Prediction and Monitoring in Cell Culture Processes [7.8] モノクローナル抗体 (mAbs) は、その特異性や有効性から、医薬品市場で注目されている。
機械学習モデルのmAb開発および製造への応用は勢いを増している。
本稿では,機械学習予測における不確実性定量化の必要性に対処する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:38:32 GMT)
OccamLLM: Fast and Exact Language Model Arithmetic in a Single Step [7.7] 本稿では,1つの自己回帰的なステップで正確な算術を可能にするフレームワークを提案する。
我々は LLM の隠蔽状態を用いて演算を行う記号的アーキテクチャを制御する。
シンボルモデル(OccamLlama)としてOccamNetを用いたLlama 3の実装は,1つの算術演算において100%の精度を実現する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:11:01 GMT)
On the design space between molecular mechanics and machine learning force fields [7.6] 機械学習力場(MLFF)はこの方向に向けた意味のある取り組みを表している。
MLFFモデルの実用性は、もはや正確さによってボトルネックではなく、その速度によってボトルネックになっている、と我々は主張する。
我々は,現在フォースフィールド開発コミュニティが直面している,望ましい特性と課題について論じる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:21:46 GMT)
Benchmarking ZK-Friendly Hash Functions and SNARK Proving Systems for EVM-compatible Blockchains [7.5] 我々は、Poseidon2、Neptune、GMiMCの自己開発回路テンプレートを含む、SNARK証明システムと5つのZKフレンドリなハッシュ関数をベンチマークした。
我々の研究は、ZKフレンドリなハッシュ関数とZKツールのベンチマークを提供し、ZKPベースのプライバシ保護トランザクションプロトコルにおけるコスト効率とコンプライアンスも検討しています。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:19:47 GMT)
BrainVis: Exploring the Bridge between Brain and Visual Signals via Image Reconstruction [7.5] 脳信号からの視覚刺激の分析と再構成は、人間の視覚系の理解を効果的に進める。
しかし、脳波信号は複雑であり、大きなノイズを含む。
これにより、脳波からの視覚刺激再建の既存の作品にかなりの制限が生じる。
我々はこれらの課題に対処するためにBrainVisと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 23:13:33 GMT)
LASP: Surveying the State-of-the-Art in Large Language Model-Assisted AI Planning [7.4] この調査は、言語モデルで計画する際の既存の課題を強調することを目的としている。
実施環境、最適なスケジューリング、競争と協力のゲーム、タスクの分解、推論、計画といった重要な分野に焦点を当てている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:39:52 GMT)
Efficiently Expanding Receptive Fields: Local Split Attention and Parallel Aggregation for Enhanced Large-scale Point Cloud Semantic Segmentation [7.2] 本研究では,複数の局所分割操作を通じて受容領域を効果的に拡張するLSAP機構を提案する。
本研究では,大規模クラウドセマンティックセマンティックセグメンテーションのための新しいフレームワークLSNetを提案する。
LSNetは3つのベンチマークデータセット上の最先端セマンティックセグメンテーションネットワークよりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:10:20 GMT)
Deep Learning Techniques for Atmospheric Turbulence Removal: A Review [7.1] 大気の乱流が取得した画像に与える影響は、画像解釈とシーン解析を極めて困難にしている。
ディープラーニングアプローチは、より高速な操作を提供し、小さなデバイス上で実装することができる。
乱流時間歪みを軽減するために、Transformers、SWIN、Mambaなど、最先端のディープニューラルネットワークの性能を比較する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:53:22 GMT)
TransDAE: Dual Attention Mechanism in a Hierarchical Transformer for Efficient Medical Image Segmentation [7.0] 医用画像のセグメンテーションは、正確な疾患診断と効果的な治療戦略の開発に不可欠である。
本稿では,トランスダエ(TransDAE)という,空間的・チャネル的関連性を含む自己認識機構を再定義する手法を紹介する。
注目すべきは、TransDAEがSynapsのマルチオーガナイズデータセット上で、既存の最先端メソッドより優れていることだ。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:08:48 GMT)
Single nuclear spin detection and control in a van der Waals material [7.0] 近年,六方晶窒化ホウ素 (hBN) の層状ファンデルワールス (vdW) 材料に単一スピン欠陥が発見された。
我々は13ドルCイオン注入を用いてhBNに単一スピン欠陥を発生させ、3種類の異なる欠陥を同定した。
VdW材料における原子スケールNMRと個々の核スピンのコヒーレント制御を初めて実証した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:47:35 GMT)
State-of-the-art Advances of Deep-learning Linguistic Steganalysis Research [7.0] 本研究は,既存のコントリビューションを包括的にレビューし,発達軌跡の評価を行う。
まず、この分野とテキスト分類の領域の違いを比較しながら、言語ステガナリシスの一般式を公式化した。
既存の研究をベクトル空間マッピングと特徴抽出モデルに基づいて2つのレベルに分類し,研究の動機,モデルの利点,その他の詳細を比較検討した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:49:42 GMT)
Construction of topological quantum magnets from atomic spins on surfaces [6.9] 走査トンネル顕微鏡(STM)におけるスピン鎖と2次元スピンアレイを用いたトポロジカル量子ハイゼンベルクスピン格子の実証
この結果は、相互作用するスピンのエキゾチックな量子多体相をシミュレートするための重要なボトムアップアプローチを提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:47:53 GMT)
Graphons of Line Graphs [6.8] グラフンは収束グラフ列の極限である。
スパースグラフはゼログラフに収束し、生成されたグラフは空か端なしとなる。
スパースグラフの特定の部分集合に光を放つ簡単な方法を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:50:03 GMT)
Sentinel: An Aggregation Function to Secure Decentralized Federated Learning [6.8] Decentralized Federated Learning (DFL)は、協調モデルをトレーニングするための革新的なパラダイムとして登場し、単一障害点に対処する。
既存の防御機構は集中型FLのために設計されており、DFLの特異性を十分に活用していない。
この研究は、DFLの毒殺攻撃に対抗する防衛戦略であるSentinelを紹介した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:28:49 GMT)
Therapy as an NLP Task: Psychologists' Comparison of LLMs and Human Peers in CBT [6.8] 本研究は,大規模言語モデル(LLM)をエビデンスベースの治療の担い手として用いる可能性と限界について検討する。
認知行動療法(CBT)に根ざした公衆アクセス型メンタルヘルスの会話を再現し,セッションダイナミクスとカウンセラーのCBTに基づく行動の比較を行った。
その結果, ピアセッションは共感, 小話, セラピーアライアンス, 共有体験が特徴であるが, セラピストのドリフトがしばしば現れることがわかった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:19:13 GMT)
Controllable Edge-Type-Specific Interpretation in Multi-Relational Graph Neural Networks for Drug Response Prediction [6.8] 本稿では,がん治療薬の反応予測アルゴリズムであるCETExplainerを提案する。
制御可能なエッジタイプ固有の重み付け機構を導入し、予測モデルに対して微細で生物学的に意味のある説明を提供する。
実世界のデータセットに関する実証分析は、CETExplainerが優れた安定性を達成し、主要なアルゴリズムと比較して説明品質を向上させることを示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:45:37 GMT)
Foundations of Large Language Model Compression -- Part 1: Weight Quantization [6.7] 大規模言語モデル(LLM)の圧縮は、リソース制約のあるデバイスへの言語モデルの展開、計算コストの削減、大規模AIインフラストラクチャの環境フットプリントの軽減など、重要な問題として浮上している。
本稿では,LLM量子化の基礎を凸最適化の観点から提示し,これらの基礎の上に構築され,従来の手法よりも優れた量子化法を提案する。
我々の量子化フレームワークCVXQは、数十億の重みパラメータを含むモデルにスケールし、任意の特定のモデルサイズにモデルを圧縮する柔軟性を提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:20:22 GMT)
Dreaming is All You Need [6.7] 本研究では,探索と精度のバランスをとるために,SleepNetとDreamNetという2つの新しいディープラーニングモデルを紹介する。
SleepNetは、事前訓練されたエンコーダモデルを使用して教師あり学習と教師なし睡眠のステージをシームレスに統合する。
DreamNetは、隠れた状態を再構築するために完全なエンコーダ・デコーダフレームワークを使用しており、人間の"ドレーミング"プロセスを模倣している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:04:39 GMT)
An Efficient Instance Segmentation Framework Using Segmentation Foundation Models with Oriented Bounding Box Prompts [6.6] 本稿では、オブジェクト指向境界ボックス(OBB)を用いた効率的なインスタンスセグメンテーションフレームワークOBSegを提案する。
OBBは、まずOBBを検知し、インスタンスを識別し、粗いローカライゼーション情報を提供する。次に、OBBプロンプト関連マスクを細かなセグメンテーションのために予測する。
OBSegは、複数のパブリックデータセット上の現在のインスタンスセグメンテーションメソッドより優れていることを示す実験である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:16:03 GMT)
$S^2$NeRF: Privacy-preserving Training Framework for NeRF [6.4] Neural Radiance Fields (NeRF)は、3Dコンピュータビジョンとグラフィックスに革命をもたらし、新しいビュー合成を促進し、拡張現実やeコマースのようなセクターに影響を与える。
センシティブなシーン画像データを含む広範なデータ収集へのNeRFの依存は、ユーザーがモデルトレーニングのためにこのデータをアップロードした場合に、重大なプライバシー上のリスクをもたらす。
まず、スプリットラーニング(SL)技術を取り入れたトレーニングフレームワークであるSplitNeRFを提案し、ローカルデータを共有せずにクライアントとサーバ間のプライバシー保護協調モデルトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:08:30 GMT)
A Novel Audio-Visual Information Fusion System for Mental Disorders Detection [6.3] メンタル障害は、世界的な医療課題に最も貢献している。
本稿では,精神疾患の感情表現機能に着目し,音声・視覚情報入力に基づくマルチモーダル精神障害診断システムを導入する。
提案システムは空間的時間的注意ネットワークをベースとし,より計算力の低い事前学習音声認識ネットワークを用いて,より優れた結果を得るためにビデオ認識モジュールを微調整する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:16:36 GMT)
EPRecon: An Efficient Framework for Real-Time Panoptic 3D Reconstruction from Monocular Video [6.2] EPReconは,効率的なリアルタイムパノプティカル3D再構成フレームワークである。
本稿では,3次元ボリュームのシーン深度を直接推定する軽量モジュールを提案する。
さらに、占有されたボクセルからよりリッチなパノプティクス特徴を推測するために、EPReconはボクセル特徴と対応する画像特徴の両方からパノプティクス特徴を抽出する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:40:31 GMT)
On-chain Validation of Tracking Data Messages (TDM) Using Distributed Deep Learning on a Proof of Stake (PoS) Blockchain [5.8] 宇宙状況認識(SSA)にとってRSO(Resident Space Objects)の信頼できない追跡は不可欠である
現在の慣行では、送信側に対する完全な信頼を前提としており、SSAの能力は敵の行動に弱いままである。
この研究は、ブロックチェーン上のディープラーニングを使用して、TDM検証と検証のための信頼性のないメカニズムを導入している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:30:52 GMT)
The Impact of Run-Time Variability on Side-Channel Attacks Targeting FPGAs [5.8] 本研究は、非同期化対策の有効性を検討するために、微細な動的電圧と周波数スケーリングアクチュエータを提案する。
目標は、強制された実行時の可変性とFPGAをターゲットにした暗号実装のサイドチャネル攻撃に対する脆弱性との関係を強調することである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:22:38 GMT)
Software Verification with CPAchecker 3.0: Tutorial and User Guide (Extended Version) [5.7] 本チュートリアルでは,CPAチェッカーの形式的ソフトウェア検証における基本的なユースケースについて述べる。
想定された読者は、自動形式検証とプログラム分析の背景を持っていると仮定される。
このチュートリアルとユーザガイドは、バージョン3.0のCPAチェッカーに基づいている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:50:50 GMT)
Stealing Maggie's Secrets -- On the Challenges of IP Theft Through FPGA Reverse Engineering [5.7] iPhone 7の内部で発見されたLattice iCE40FPGAの実際のケーススタディを示す。
マギーに実装された独自の信号処理アルゴリズムをリバースエンジニアリングすることで,FPGAのIP盗難に要する実際の作業について,新たな知見が得られる。
次に、必要な手作業を大幅に削減する一般的なネットリストリバースエンジニアリング技術を紹介します。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:14:21 GMT)
Towards Generative Class Prompt Learning for Few-shot Visual Recognition [5.6] ジェネレーティブ・クラス・プロンプト・ラーニングとコントラスト・マルチクラス・プロンプト・ラーニングを紹介する。
Generative Class Prompt Learningは、学習可能なクラスプロンプトを持つ数ショットの例に条件付けすることで、クラス埋め込みにおける視覚言語相乗性を改善する。
CoMPLeはこの基盤の上に構築されており、クラス間の分離を促進する対照的な学習コンポーネントを導入している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:34:21 GMT)
Task Weighting through Gradient Projection for Multitask Learning [5.6] マルチタスク学習では、タスク勾配間の衝突は、モデルのトレーニングパフォーマンスを劣化させる頻繁な問題である。
本研究では,タスク優先順位付けを同時に行うために,グラディエント・プロジェクション・アルゴリズムであるPCGradを適用する手法を提案する。
従来のタスクの重み付けとは違い、重み付け方式は、タスクが矛盾している場合にのみ適用されるが、トレーニングを妨げない場合にのみ適用される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:17:44 GMT)
Note on Dirac monopole theory and Berry geometric phase [5.6] パラメータ空間に終点を持つディラック弦によって誘導される非可積分位相因子としてベリー位相が観測可能であることを示す。
ディラック弦の終点と固有値の事故発生点との対応は、エルミート系に対して明確に示される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:19:32 GMT)
What Do You See in Common? Learning Hierarchical Prototypes over Tree-of-Life to Discover Evolutionary Traits [5.5] プロトタイプネットワーク(HComP-Net)による階層整合共通性の枠組みを紹介する。
我々は、HComP-Netが、鳥類、蝶、魚のデータセットのベースラインと比較して、正確に、意味的に一貫性があり、目に見えない種に対して一般化可能なプロトタイプを学習していることを実証的に示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 23:49:45 GMT)
Flood of Techniques and Drought of Theories: Emotion Mining in Disasters [5.4] 感情のマイニングは、災害時の人間の感情を理解するための重要なツールとなっている。
本研究の目的は,災害時における感情のマイニングに関する既存の研究を要約することである。
我々は感情のマイニング手法の有効性と信頼性を高めることを目的としている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:10:16 GMT)
Lexicographic optimization-based approaches to learning a representative model for multi-criteria sorting with non-monotonic criteria [5.4] 本稿では,MCS問題の代表モデルを非単調な基準で学習するためのいくつかのアプローチを提案する。
まず、いくつかの変換関数を定義して、限界値と圏閾値を UTA のような関数空間にマッピングする。
そこで我々は,MCS問題における非単調な基準をモデル化するための制約セットを構築し,意思決定者の代入事例選好情報の整合性を確認する最適化モデルを構築した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:29:05 GMT)
RLAIF vs. RLHF: Scaling Reinforcement Learning from Human Feedback with AI Feedback [5.3] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM)と人間の嗜好を結びつけるのに有効であることが証明されているが、高品質な嗜好ラベルの収集は高価である。
RLAIFは、既製のLLMが生成した好みに基づいて報酬モデル(RM)を訓練する有望な代替手段を提供する。
この結果から, RLHF のスケーラビリティ限界に対する潜在的な解決策として, 人間のフィードバックを活用すれば, RLAIF による性能向上が期待できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:01:54 GMT)
Explicit Second-order LiDAR Bundle Adjustment Algorithm Using Mean Squared Group Metric [5.2] 平面ランドマークの測定を単一視点で均一に行うための平均二乗計量(MSGM)を提案する。
堅牢なカーネル関数を統合することで、BAモデルに関わるメトリクスを再重み付けし、ソリューションプロセスの堅牢性を高める。
提案手法は,既存の暗黙二階推定と明示的な近似二階推定とに対して提案した RSO-BA 推定器を評価する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:53:39 GMT)
Credible, Optimal Auctions via Public Broadcast [5.1] エージェントが検閲に抵抗する放送チャンネル上で通信可能な環境でのオークション設計について検討する。
我々は,従来の機構設計の枠組みと異なるモデルで,信頼性が高く,防御的なオークションを設計することを模索している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:38:29 GMT)
SafeEmbodAI: a Safety Framework for Mobile Robots in Embodied AI Systems [5.1] 物理的世界と自律的に対話するAIロボットを含む、身体化されたAIシステムは、かなり進歩している。
不適切な安全管理は、複雑な環境で障害を引き起こし、悪意のあるコマンドインジェクションに対してシステムが脆弱になる。
我々は,移動ロボットを組込みAIシステムに統合するための安全フレームワークであるtextitSafeEmbodAIを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:56:50 GMT)
A Survey on Stability of Learning with Limited Labelled Data and its Sensitivity to the Effects of Randomness [5.0] 本調査は,限定ラベル付きデータによる学習の安定性に対するランダム性の影響を論じる415の論文の概要を概説する。
我々は7つの課題を特定し議論し、さらなる研究を促進するための可能な方向性とともに課題を開放する。
この調査の最終的な目標は、この成長する研究領域の重要性を強調することである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:59:58 GMT)
Accurate Computation of Quantum Excited States with Neural Networks [5.0] 量子系の最低励起状態を推定するための変分モンテカルロアルゴリズムを提案する。
本手法はベンゼンスケール分子の正確な垂直励起エネルギーを得るための最初の深層学習手法である。
我々はこの技術が原子、核、凝縮物質物理学への応用に大きな関心を寄せることを期待している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:53:01 GMT)
LSTMSE-Net: Long Short Term Speech Enhancement Network for Audio-visual Speech Enhancement [4.9] 長期記憶音声強調ネットワーク(LSTMSE-Net)を提案する。
この手法は、視覚情報と音声情報の相補的な性質を活用し、音声信号の品質を高める。
システムは、視覚的および音声的特徴を拡大し強調し、それをセパレータネットワークを介して上回り、最適化された音声強調を行う。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:52:49 GMT)
Convex Regression in Multidimensions: Suboptimality of Least Squares Estimators [4.8] 最小二乗推定器は、$d$が5以上の場合の2乗誤差損失において$d$次元凸関数を推定するのに最適である。
i)ポリトープでサポートされている有界凸関数(ランダム設計)、(ii)任意の凸領域でサポートされているリプシッツ凸関数(ランダム設計)、(iii)ポリトープでサポートされている凸関数(固定設計)である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:42:26 GMT)
Long-distance strong coupling of magnon and photon: Effect of multi-mode waveguide [4.6] 多モード導波路を介するマグノンと光子の長距離結合について検討した。
その結果、長距離コヒーレンスを理解し、マグノンベースの分散量子ネットワークを設計するための道を開いた。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:29:26 GMT)
Spinning the Golden Thread: Benchmarking Long-Form Generation in Language Models [4.5] 長文言語モデル (LM) はしばしば "Needle-in-a-Haystack" (NIAH) テストを用いて評価される。
我々は、新しい長文テキスト評価ベンチマーク、Spinning the Golden Thread (SGT)を導入した。
SGTは、生成された長いテキストシーケンス内の特定のイベントを識別するモデルの能力をテストする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:25:54 GMT)
Fast Numerical Solver of Ising Optimization Problems via Pruning and Domain Selection [4.5] 本稿では,Ising最適化問題に対する高速かつ効率的な解法を提案する。
我々の解法は古典的解法よりも桁違いに高速で、量子インスパイアされたアニールよりも少なくとも2倍高速である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:59:03 GMT)
SpannerLib: Embedding Declarative Information Extraction in an Imperative Workflow [4.4] このデモでは、Pythonコードにドキュメントスパンナーを埋め込むライブラリであるSpannerLibが紹介されている。
SpannerLibは、Spannerlog (Datalog-based documentpanners)の実装を提供することで、IEプログラムの開発を容易にする
デモシナリオでは、Jupyter Notebook内で、複雑さのレベルが増大したIEプログラムが紹介されている。
論文参考訳(メタデータ) (Tue, 03 Sep 2024 09:25:26 GMT)
QID$^2$: An Image-Conditioned Diffusion Model for Q-space Up-sampling of DWI Data [4.4] 低角分解能画像から高角分解能拡散強調画像(DWI)を推定するための画像条件拡散モデルを提案する。
我々のモデルはQID$2$と呼ばれ、低角分解能DWIデータの集合を入力として、この情報を用いて目標勾配方向に関連するDWIデータを推定する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:39:58 GMT)
A Knowledge-Centric Benchmarking Framework and Empirical Study for Retrieval-Augmented Generation [4.4] Retrieval-Augmented Generation (RAG)は、検索機構を統合することで生成モデルを強化する。
その利点にもかかわらず、RAGは特に現実世界のクエリを効果的に処理する上で、大きな課題に直面している。
本稿では,これらの課題に対処する新しいRAGベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:31:37 GMT)
Toward Capturing Genetic Epistasis From Multivariate Genome-Wide Association Studies Using Mixed-Precision Kernel Ridge Regression [4.4] 英国バイオバンクの305K患者を対象としたGWAS(Genome-Wide Association Studies)の出力精度保存混合精度計算の性能を向上する。
低精度GPU演算によるデータ移動ゲインの強化によるタイル中心適応精度線形代数技術
ほぼ完全なAlpsシステム上で1.805の混合精度ExaOp/sで、最先端のCPU専用REGENIE GWASソフトウェアより5桁高い4精度のColeskyベースの解法を新たに導入する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:50:42 GMT)
The Non-reciprocity of Multi-mode Optical Directional Amplifier Realized by Non-Hermitian Resonator Arrays [4.4] この非相互性は、光信号をルーティングしたり、ノイズの逆流を防止したり、多周波を用いて情報処理を向上させることができる。
潜在的な応用として、非相互性光学系は二重周波数制御、並列情報処理、フォトニック集積回路、光学デバイス等に利用できる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:48:08 GMT)
Visually Grounded Speech Models for Low-resource Languages and Cognitive Modelling [4.3] 画像を用いた音声中のキーワードの検出とローカライズを行うために,視覚的に誘導されるキーワードローカライゼーションというタスクを導入する。
本稿では,Yorubaのような低リソース言語に対する数ショット学習シナリオにおいて,VGSモデルの有効性を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:59:50 GMT)
Improving Robustness of Spectrogram Classifiers with Neural Stochastic Differential Equations [4.3] スペクトログラムに適用されたコンピュータビジョンに基づくディープラーニングモデルは、信号の分類と検出の分野で有用であることが証明されている。
これらの方法は、非ビジョン信号処理タスクに固有の低信号対雑音比を扱うように設計されていない。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:03:50 GMT)
FairX: A comprehensive benchmarking tool for model analysis using fairness, utility, and explainability [4.2] FairXは、フェアネス、ユーティリティ、およびeXplainability(XAI)の傘の下でのモデルの包括的分析のために設計されたオープンソースのベンチマークツールである。
FairXは、ベンチマークバイアス緩和モデルをトレーニングし、さまざまな公正度メトリクス、データユーティリティメトリクスを使用して公正性を評価し、統一されたフレームワーク内でモデル予測の説明を生成することを可能にする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:38:22 GMT)
DAPONet: A Dual Attention and Partially Overparameterized Network for Real-Time Road Damage Detection [4.2] ストリートビュー画像データ(SVRDD)を用いたリアルタイム道路損傷検出のためのDAPONetを提案する。
DAPONetは、SVRDDデータセット上で70.1%のmAP50を達成し、YOLOv10nを10.4%上回り、パラメータを1.6M、FLOPを1.7Gに減らし、それぞれ41%、80%削減した。
MS COCO 2017 valデータセットでは、DAPONetはmAP50-95が33.4%、効率の良いDet-D1より0.8%高く、パラメータとFLOPの両方が74%減少している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:53:32 GMT)
BinPRE: Enhancing Field Inference in Binary Analysis Based Protocol Reverse Engineering [4.2] プロトコルリバースエンジニアリング(PRE)は、ソースコードが利用できないときにネットワークプロトコルの仕様を推測することを目的としている。
場推定を行うためには、二分解析に基づくプレテクニックが主要なアプローチカテゴリである。
BinPREは,(1)形式抽出のための命令ベースの意味的類似性分析戦略,(2)意味的推論精度を向上させるための原子意味的検出器で構成される新しいライブラリ,(3)意味的推論精度をさらに向上するクラスタ・アンド・リファイン・パラダイムを取り入れている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:40:02 GMT)
Extended imaginary gauge transformation in a general nonreciprocal lattice [4.1] 擬エルミート対称性のクラスに基づく Imaginary gauge transformation (IGT) hinges の妥当性を明らかにする。
近縁ホッピング以上のIGTと疑似ハーモニティの応用性について検討した。
我々の理論的枠組みは、非相互三量体 Su-Schrieffer-Heeger モデルにおけるバルク-バウンダリー対応を確立するために応用される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:57:43 GMT)
Planning to avoid ambiguous states through Gaussian approximations to non-linear sensors in active inference agents [4.0] 測定関数が非線形であるとき、変換された変数はガウス分布と近似され、抽出可能な推論が保証されることを示す。
これにより、状態が観測からどれだけ正確に推測できるかに基づいて、状態よりも優先される。
エージェントが軌道を計画するロボットナビゲーション実験でこれを実証する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:17:16 GMT)
Pureformer-VC: Non-parallel One-Shot Voice Conversion with Pure Transformer Blocks and Triplet Discriminative Training [3.9] ワンショット音声変換は、任意の音源音声の音色を変えて、未知のターゲット話者の音色を1つの音声サンプルで一致させることを目的としている。
既存のスタイル転送型VC法は, 音声表現の絡み合いに頼っていた。
本稿では, Conformer ブロックを用いてアンタングル化されたエンコーダを構築する Pureformer-VC と, Zipformer ブロックを用いてスタイル転送デコーダを構築する Zipformer-VC を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:21:19 GMT)
Arctic-SnowCoder: Demystifying High-Quality Data in Code Pretraining [3.9] Arctic-SnowCoder-1.3Bは、555Bトークンで事前訓練されたデータ効率のベースコードモデルである。
限られたデータセットでトレーニングされているにもかかわらず、Arctic-SnowCoderはBigCodeBenchで最先端のパフォーマンスを達成する。
全ての評価されたベンチマークで、アークティック・スノウコーダー-1.3Bは1Tトークンで事前訓練されたスターコーダーBase-3Bを上回った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 22:36:42 GMT)
A randomized simulation trial evaluating ABiMed, a clinical decision support system for medication reviews and polypharmacy management [3.8] STOPP/START v2ガイドラインの実装に基づき,臨床診断支援システムであるABiMedを設計した。
ランダム化シミュレーション試験において,39名の薬剤師によるABiMedの評価を行った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:50:59 GMT)
An embedding-based distance for temporal graphs [3.7] 時間参照ランダムウォークに基づく埋め込みを用いて、時間グラフ間の距離の新しい概念を導入する。
この距離は、異なるノード数と異なる時間間隔を持つ時間グラフのペアに対してよく定義されている。
我々は、位相的および時間的特性の異なる微分グラフを導入する距離を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:49:16 GMT)
Kolmogorov Arnold Networks in Fraud Detection: Bridging the Gap Between Theory and Practice [3.7] 本研究では,コルモゴロフ・アルノルドネットワーク(KAN)の不正検出への適用性を検討した。
そこで本研究では,PCA(Principal Component Analysis, 主成分分析)を用いて,データをスプラインを用いて2次元に分割する手法を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 22:23:06 GMT)
Co-synthesis of Histopathology Nuclei Image-Label Pairs using a Context-Conditioned Joint Diffusion Model [3.7] 病理組織学的核画像とペアセマンティックラベルを共合成する新しいフレームワークを提案する。
我々は,多施設,多施設,多モダリティデータセット上で,高品質なサンプルを作成するためのフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:05:17 GMT)
What do we know about Hugging Face? A systematic literature review and quantitative validation of qualitative claims [3.7] コラボレーションソフトウェアパッケージレジストリ(SPR)は、ソフトウェアサプライチェーンの不可欠な部分である。
事前訓練モデル(PTM)登録は、重要度が増大するSPRの新たなクラスである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:26:56 GMT)
EDCSSM: Edge Detection with Convolutional State Space Model [3.6] 画像のエッジ検出は、コンピュータグラフィックスにおける多くの複雑なタスクの基礎となっている。
多層畳み込みとプールアーキテクチャによる特徴損失のため、学習ベースのエッジ検出モデルは、しばしば厚いエッジを生成する。
本稿では,上記の問題に効果的に対処するエッジ検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:13:25 GMT)
It is Time to Develop an Auditing Framework to Promote Value Aware Chatbots [3.5] 我々は、この技術の進歩のスピードは、価値に基づく監査フレームワークを動員し、開発する必要があると論じる。
GPT 3.5 と GPT 4 からの応答は,既存の法則から導出される値と一致せず,一致しない。
この論文は、技術改善のための価値ベースの戦略を推奨して締めくくります。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:15:34 GMT)
A Deep Reinforcement Learning Framework For Financial Portfolio Management [3.2] ディープラーニング技術によって解決されるポートフォリオ管理の問題である。
このフレームワークを実現するために、CNN(Convolutional Neural Network)、RNN(Basic Recurrent Neural Network)、Long Short-Term Memory(Long Short-Term Memory)という3つの異なるインスタンスが使用される。
我々は、優れたリターンを得られる原紙の複製に成功したが、株式市場に適用されると、うまく機能しない。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:11:04 GMT)
Tunable multiphoton bundles emission in a Kerr-type two-photon Jaynes-Cummings model [3.0] 本研究では,中程度の原子空洞結合下での多光子束放出の操作と促進に関する研究を行う。
我々は,n$th状態の真空-ラビ分割がKerr相互作用によって著しく向上できることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:28:51 GMT)
Synthetic Data Generation and Automated Multidimensional Data Labeling for AI/ML in General and Circular Coordinates [2.9] 本稿では,合成データ生成と自動データラベリングに対する統一的なアプローチを提案する。
一般ラインコーディネート(GLC)は、複数のGLCでn-Dデータを視覚化するために用いられる。
実データによる結果はケーススタディで実証され、分類器への影響を評価する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:26:50 GMT)
Strengthening Solidity Invariant Generation: From Post- to Pre-Deployment [2.8] InvSolは、Solidityスマートコントラクトに特化した、事前デプロイ不変生成のための新しいフレームワークである。
InvSolはデプロイ前に不変性を識別し、ループを含むSolidity言語構成を包括的にカバーする。
スマートコントラクトのベンチマークセットを使用して、InvSolを厳格に評価し、そのパフォーマンスを最先端のソリューションと比較する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:37:30 GMT)
Action-Based ADHD Diagnosis in Video [2.8] ビデオベースのフレームレベルの行動認識ネットワークをADHD診断に初めて導入する。
また、実際の多モードADHDデータセットを記録し、ADHD診断のためのビデオモダリティから3つのアクションクラスを抽出する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:38:23 GMT)
Towards Leveraging Large Language Models for Automated Medical Q&A Evaluation [2.7] 本稿では,大規模言語モデル(LLM)を用いて,Q&Aシステムにおける応答評価を自動化する可能性について検討する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:38:29 GMT)
SmileyLlama: Modifying Large Language Models for Directed Chemical Space Exploration [2.6] 我々は,Large Language Model (LLM) がケミカル言語モデル (CLM) の基礎モデルとして機能することを示す。
我々はLSMを訓練して、薬物開発に特有な分子の生成などのプロンプトに反応できることを実証した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:59:20 GMT)
Data-driven topology design based on principal component analysis for 3D structural design problems [2.6] データ駆動トポロジ設計(DDTD)手法は,この問題に対する効果的な解決策と考えられる。
両者の対立を解決するために,主成分分析(PCA)に基づくDDTDを提案する。
提案したPCAベースのDDTDの有効性と実用性を示すために,種々の実験を行った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:56:28 GMT)
Ternary Tree Fermion-to-Qubit Mapping with Hamiltonian Aware Optimization [2.6] 本稿では、特定のフェルミオンハミルトニアンに対して最適化されたフェルミオン-量子マッピングをコンパイルするためのハミルトニアン・アウェア・ターナリーツリー(HATT)フレームワークを紹介する。
様々なフェルミオン系の評価とシミュレーションは、パウリ重みと回路の複雑さの両方を著しく減少させることを示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:59:36 GMT)
Deep non-parametric logistic model with case-control data and external summary information [2.5] ケースコントロールサンプリング設計は、バイナリデータで観測される不均衡構造を緩和するための重要な戦略として機能する。
外部要約情報によって補足されたケース制御データを用いた非パラメトリックロジスティックモデルの推定を検討する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:23:09 GMT)
Less is more: concatenating videos for Sign Language Translation from a small set of signs [2.5] 本稿では,手話翻訳モデルの訓練のために,孤立信号を含む短いクリップを連結して手話内容を生成することを提案する。
V-LIBRASILデータセットは4,089個の手話ビデオで構成され,少なくとも3人が解釈し,数十万の文を生成する。
BLEU-4 と METEOR はそれぞれ 9.2% と 26.2% の有意なスコアを得た。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 00:14:15 GMT)
The trade-off between diagonal and off-diagonal elements in the eigenstate thermalization hypothesis [2.5] 対角要素の指数的成長は、直接的に自己の値を抑制し、間接的に対角要素を抑圧することを示す。
これは、固有状態熱化仮説(ETH)に基づく物理機構の新しい視点を提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:07:03 GMT)
How to Determine the Preferred Image Distribution of a Black-Box Vision-Language Model? [2.4] 本稿では,視覚言語モデル(VLM)に好適な画像分布を特定するための,新しい一般化可能な手法を提案する。
これを異なる3次元オブジェクトのレンダリングタイプに適用することにより、複雑な構造の正確な解釈を必要とする様々な領域で有効性を示す。
特殊なドメインにおけるベンチマークの欠如を解決するために,CAD関連視覚質問応答タスク上でVLMを評価するための新しいデータセットであるCAD-VQAを導入する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:26:13 GMT)
PMLBmini: A Tabular Classification Benchmark Suite for Data-Scarce Applications [2.4] PMLBminiは、サンプルサイズが$leq$500の44のバイナリ分類データセットのベンチマークスイートである。
当社のスイートを使用して、現在の自動機械学習(AutoML)フレームワークを徹底的に評価しています。
我々の分析によると、最先端のAutoMLとディープラーニングのアプローチは、単純なロジスティック回帰ベースラインでさえ、良好に上回らないことが多い。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:13:03 GMT)
MMLU-Pro+: Evaluating Higher-Order Reasoning and Shortcut Learning in LLMs [2.4] 大規模言語モデル(LLM)の既存のベンチマークは、パフォーマンスの高いモデル間の差別化にますます苦労している。
本稿では,MMLU-Proをベースとした,ショートカット学習と高次推論のための拡張ベンチマークであるMMLU-Pro+を紹介する。
以上の結果から,MMLU-Pro+はMMLU-Proの難易度を維持しつつ,より厳密なモデル判別試験を行っていることがわかった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:31:03 GMT)
Smooth Crossover Between Weak and Strong Thermalization using Rigorous Bounds on Equilibration of Isolated Systems [2.3] 弱熱化は初期状態の小さな有効次元に起因すると考えられる。
この変動は, 弱熱化と強熱化の両面において, システムサイズに比例して指数関数的に減衰することを示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:09:28 GMT)
Private Electronic Payments with Self-Custody and Zero-Knowledge Verified Reissuance [2.2] われわれはGoodell、Toliver、Nakibによって記述されたデジタルトランスファーのプロトコルを構築している。
プロトコルを拡張して、再発行された資産の検証を可能にします。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:56:03 GMT)
Interpreting Outliers in Time Series Data through Decoding Autoencoder [2.2] 本研究は、ドイツの自動車供給産業における時系列データの製造に焦点をあてる。
我々はオートエンコーダを用いて時系列全体を圧縮し,その潜在特徴に異常検出技術を適用する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:52:21 GMT)
The Impact of Print-Scanning in Heterogeneous Morph Evaluation Scenarios [1.9] 印刷スキャンがモルヒネ攻撃検出に与える影響について, 一連の評価を通じて検討した。
実験の結果,MMPMR(Mated Morph Presentation Match Rate)を最大8.48%向上できることがわかった。
S-MAD (Single-image Morphing Detection Detection) アルゴリズムがプリントスキャンされた形態を検出するように訓練されていない場合、MACER (Morphing Classification Err rate) は96.12%まで増加する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:57:04 GMT)
Entanglement generation via single-qubit rotations in a torn Hilbert space [1.9] ねじれたヒルベルト空間において、大域的な1量子ビットの回転しか持たない任意の対称交絡状態を生成する。
ディック状態のエネルギーシフトの最適制御により、任意の対称交絡状態を生成することができる。
また、1段階かごく少数のステップで、ほぼ一様の忠実度を持つ有用な状態の多様体を作成できることを例示する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:16:57 GMT)
Effects of Common Regularization Techniques on Open-Set Recognition [1.9] 正規化手法はオープンセット認識性能を大幅に向上させることができることを示す。
精度とオープンセットのパフォーマンスの関係に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:09:26 GMT)
3D-LEX v1.0: 3D Lexicons for American Sign Language and Sign Language of the Netherlands [1.9] 本稿では,手話を3Dでキャプチャするための効率的な手法を提案し,その3D-LEXデータセットを導入し,音韻特性の半自動アノテーション法について詳述する。
提案手法は,高解像度3次元ポーズ,3次元ハンドパップ,深度認識顔貌を含む3つのモーションキャプチャー技術を統合した。
3D-LEXデータセットには、American Sign Languageから1000のサインと、オランダのSign Languageから1000のサインが含まれている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:44:56 GMT)
SPiKE: 3D Human Pose from Point Cloud Sequences [1.8] 3D Human Pose Estimation (HPE) は、RGB画像や深度マップ、点雲などの2次元または3次元表現から、人間の身体のキーポイントを3次元空間内に配置するタスクである。
本稿では,点雲列を用いた3次元HPEの新しい手法であるSPiKEを提案する。
3D HPEのITOPベンチマークの実験では、SPiKEは89.19%のmAPに達し、推論時間を大幅に短縮して最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:22:01 GMT)
Convolutional Networks as Extremely Small Foundation Models: Visual Prompting and Theoretical Perspective [1.8] 本稿では,汎用的なディープネットワークを新たなタスクに適応させるプロンプトモジュールを設計する。
学習理論によって駆動され、同じトレーニングエラーの下でより良く一般化されるように、可能な限りシンプルなモジュールを誘導する。
実際、SDForestは非常に低コストで、CPUでもリアルタイムに実現できる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:34:23 GMT)
RAMBO: Leaking Secrets from Air-Gap Computers by Spelling Covert Radio Signals from Computer RAM [1.7] 我々は、敵が空襲されたコンピュータから情報を漏らすことができる攻撃を提示する。
漏洩したコンピュータ上のマルウェアは、メモリバス(RAM)から無線信号を生成することができることを示す。
ソフトウェア定義無線(SDR)ハードウェアと単純なオフ・ザ・シェルフアンテナにより、攻撃者は遠くから送信された生の無線信号を傍受することができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:06:04 GMT)
The R package psvmSDR: A Unified Algorithm for Sufficient Dimension Reduction via Principal Machines [1.7] 我々は、主サポートベクトルマシン(PSVM)から一般化された主マシン(PM)と呼ぶ新しいSDR推定器のクラスを提案する。
このパッケージは線形SDRと非線形SDRの両方をカバーし、リアルタイム更新シナリオに適用可能な機能を提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 02:34:42 GMT)
Biochemical Prostate Cancer Recurrence Prediction: Thinking Fast & Slow [1.7] 本稿では,TTR予測のための2段階の「高速かつ遅い」戦略を提案する。
第1段階は、生化学的再発において最も関連性の高いWSI領域である。
第2段階では、高解像度のパッチを活用してTTRを予測する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:37:43 GMT)
From Grounding to Planning: Benchmarking Bottlenecks in Web Agents [1.6] 一般的なWebベースのエージェントは、複雑なWeb環境と対話するためにますます不可欠である。
しかし、実世界のWebアプリケーションにおける彼らのパフォーマンスは依然として貧弱であり、最先端のフロンティアモデルでさえ非常に低い精度が得られる。
我々は,計画コンポーネントと接地コンポーネントの区別を強化し,Mind2Webデータセット上で実験を精査することによって,新たな分析を行う。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:17:09 GMT)
T1-contrast Enhanced MRI Generation from Multi-parametric MRI for Glioma Patients with Latent Tumor Conditioning [1.6] ガドリニウム系造影剤(GBCA)は、グリオーマ患者のMRIスキャンで一般的に用いられる。
GBCA毒性の懸念が高まっている。
本研究では,事前コントラストマルチMRIからT1ポストコントラスト(T1C)を生成するディープラーニングフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:45:37 GMT)
Broadening Access to Simulations for End-Users via Large Language Models: Challenges and Opportunities [1.6] 大規模言語モデル(LLM)は、ユーザがシステムと対話するのを支援するインテリジェントな仮想アシスタントを作成するために、ユビキタスになりつつある。
本研究では,シミュレーションにLLMを用いることで,シミュレーションへのアクセスを拡大する可能性について検討する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 23:14:42 GMT)
Impedance vs. Power Side-channel Vulnerabilities: A Comparative Study [1.6] インピーダンスサイドチャネル分析は、コンピュータシステムから機密情報を抽出しようとする敵にとって強力な戦略として登場した。
本研究では,新たに検討したインピーダンス側流路と確立された電力側流路との比較分析を行う。
その結果, インピーダンス解析は, 電力側チャネル解析と比較して, 暗号鍵抽出の可能性が高いことが示された。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 00:21:23 GMT)
A Multiscale Gradient Fusion Method for Edge Detection in Color Images Utilizing the CBM3D Filter [1.5] 協調フィルタリングとマルチスケール勾配融合を組み合わせたカラーエッジ検出手法を提案する。
ブロックマッチングと3D(CBM3D)フィルタは、変換領域におけるスパース表現を強化するために使用される。
提案手法は,カラーソベル,カラーキャニー,SE,カラーAGDDよりも優れた耐雑音性,高エッジ品質を有する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:34:09 GMT)
Estimating Joint interventional distributions from marginal interventional data [1.5] 我々は、最大エントロピー原理を用いて、すべての変数の連立条件分布を取得するために介入データを利用する方法を示す。
ラグランジュ双対性を用いて、介入制約を伴う因果最大エントロピー問題の解が指数族に属することを証明する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:18:35 GMT)
Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database [1.5] 心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:57:08 GMT)
Unsupervised Welding Defect Detection Using Audio And Video [1.5] 本稿では,マイクロホンとカメラで溶接プロセスを記録することにより,溶接欠陥をリアルタイムで検出する深層学習手法について述べる。
すべてのディープラーニングモデルは、潜在的な欠陥の空間が大きいため、教師なしの方法でトレーニングされます。
溶接欠陥のほとんどをリアルタイムに検出できることが,音声とビデオの両方から可能であることを実証した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:58:56 GMT)
FORS-EMG: A Novel sEMG Dataset for Hand Gesture Recognition Across Multiple Forearm Orientations [1.4] サーフェス・エレクトロミー(sEMG)信号はジェスチャー認識や頑丈な義手の開発において大きな可能性を秘めている。
sEMG信号は、前腕の向き、前腕の変位、手足の位置など、生理的または動的要因によって妥協される。
本稿では,3つの前腕方向で行う日常生活動作を評価するための電極sEMG信号のデータセットを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:23:06 GMT)
An Array Intermediate Language for Mixed Cryptography [1.4] 本稿では,複数の暗号機構を用いた対話型プログラムの効率的なコード生成を支援するために,新しい配列ベース中間表現であるAIRductを紹介する。
Airductは、セキュアで分散したプログラムを暗号化スイートで合成できるViaductコンパイラのIRとして意図されている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:01:25 GMT)
Approximating mutual information of high-dimensional variables using learned representations [1.4] 相互情報(英: Mutual Information、MI)は、科学全般に広く応用されている統計的依存の一般的な尺度である。
既存の手法では、MIを数十次元まで確実に推定できるが、十分なサンプルサイズが実現不可能な高次元では失敗する。
我々は,理論上動機付けされたモデルアーキテクチャで学習した低次元表現に対して,非MI推定器を適用した潜在MI(LMI)近似を開発した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:36:42 GMT)
Realigned Softmax Warping for Deep Metric Learning [1.3] 本稿では,ユークリッド領域内で機能する新たな損失関数のクラスを提案する。
これらのコンパクト性と分離性の力は、ワープ関数を用いることで、自由に制御された位置で強化または緩和することができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:45:59 GMT)
Modeling IoT Traffic Patterns: Insights from a Statistical Analysis of an MTC Dataset [1.2] IoT(Internet-of-Things)は急速に拡大し、多くのデバイスを接続し、私たちの日常生活に不可欠なものになっています。
効果的なIoTトラフィック管理には、マシン型通信(MTC)のモデリングと予測が必要である。
我々は、Kolmogorov-Smirnov、Anderson-Darling、chi-squared、ルート平均二乗誤差などの確立されたテストを含む、適合性テストを用いたMCCトラフィックの包括的統計分析を行う。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:24:18 GMT)
Dimension-independent weak value estimation via controlled SWAP operations [1.2] 任意の観測値の弱値を推定するための次元非依存のスキームを提案する。
このスキームは制御されたSWAP演算に基づいており、弱い値の数学的表現における状態と観測変数を関連付ける。
これは、2つの同一の量子系の状態の1つの時点における状態と、2つの時点における1つの量子系の状態の2つの時点における状態の関係に関する洞察を与える。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:57:30 GMT)
Dialogue You Can Trust: Human and AI Perspectives on Generated Conversations [1.2] 本研究では,対話シナリオにおける人間とAIアセスメントの比較パフォーマンスについて検討する。
実験1では,コヒーレンス,イノベーション,具体性,ゴールコントリビューションに関する多人数会話を評価した。
実験2では,ダイアドダイアログに着目し,コモンセンス・コントラディクション,不正確なファクト,冗長性を評価した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:40:38 GMT)
Uniqueness of Landau levels and their analogs with higher Chern numbers [1.2] ランドー準位(Landau level)は、荷電粒子の磁場下での2次元の固有状態である。
平坦な幾何学を持つ正則波動関数を持つ唯一のエネルギー固有状態がランダウ準位であることを証明する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:33:31 GMT)
Quantum states and quantum computing [1.1] 量子論において、量子状態 $vert alpha,trangle$ はヒルベルト空間内で進化している状態にあり、系の現実を固有の不確実性で表している。
本稿では,量子場理論の基本概念と量子コンピューティングとの相互関係を明らかにすることを目的とする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:23:50 GMT)
Local certification of unitary operations [1.1] ユニタリ量子チャネルの局所的な証明は、量子仮説テストの自然な拡張である。
最適局所戦略は補助的システムの使用を必要とせず,一方通行の古典的通信を単一ラウンドで行うだけでよいことを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:10:58 GMT)
An Implementation of Werewolf Agent That does not Truly Trust LLMs [0.9] Werewolfは不完全な情報ゲームであり、コンピュータエージェントをプレイヤーとして作る際にいくつかの課題がある。
本稿では,Large Language Model (LLM) とルールベースアルゴリズムを組み合わせることで,これらの問題の一部を解消するワーウルフエージェントを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:16:03 GMT)
Beyond Unconstrained Features: Neural Collapse for Shallow Neural Networks with General Data [0.9] ニューラル崩壊(Neural collapse, NC)は、ディープ・ニューラル・ネットワーク(DNN)の終末期に発生する現象である。
2層または3層ニューラルネットワークでNCが発生した場合の完全な特徴付けを提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:30:21 GMT)
Linear Contextual Bandits with Hybrid Payoff: Revisited [0.8] ハイブリッド報酬設定における線形文脈問題について検討する。
この設定では、各アームの報酬モデルには、すべてのアームの報酬モデル間で共有されるパラメータに加えて、アーム固有のパラメータが含まれる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:13:24 GMT)
AIvril: AI-Driven RTL Generation With Verification In-The-Loop [0.8] LLM(Large Language Models)は、複雑な自然言語処理タスクを実行できる計算モデルである。
本稿では,RTL対応LLMの精度と信頼性を高めるためのフレームワークであるAIvrilを紹介する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:07:11 GMT)
Optimizing CLIP Models for Image Retrieval with Maintained Joint-Embedding Alignment [0.7] Contrastive Language and Image Pairing (CLIP) はマルチメディア検索における変換手法である。
CLIPは通常、2つのニューラルネットワークを同時にトレーニングし、テキストとイメージペアのジョイント埋め込みを生成する。
本稿では,様々な画像に基づく類似性検索シナリオに対して,CLIPモデルを最適化するという課題に対処する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:33:01 GMT)
DAOs of Collective Intelligence? Unraveling the Complexity of Blockchain Governance in Decentralized Autonomous Organizations [0.7] 分散自律組織(DAO)は、従来の制御から分散制御へ移行することで、組織構造を変革してきた。
重要な資金を管理し、グローバルネットワークを構築するにもかかわらず、DAOは参加の減少、集中化の増大、変化する環境に適応できないといった課題に直面している。
本稿では,複雑なシステムについて考察し,その非効率性を説明するために複雑性科学を適用した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:06:15 GMT)
Persian Slang Text Conversion to Formal and Deep Learning of Persian Short Texts on Social Media for Sentiment Classification [0.7] ペルシャ・スラング・コンバータ(ペルシア語: Slang Converter)は、会話テキストを形式に変換するツールである。
さまざまなソーシャルネットワークや映画のサブタイトル(会話テキストなど)から1000万件のラベルのないテキストが、教師なしモデルのトレーニングに使用されている。
ポジティブ、ネガティブ、中立なラベルを持つInstagramユーザーのコメントから6万件のテキストが、感情分類モデルをトレーニングするための教師付きデータと見なされている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:09:57 GMT)
AstroMAE: Redshift Prediction Using a Masked Autoencoder with a Novel Fine-Tuning Architecture [0.7] AstroMAEは,マスク付きオートエンコーダ法を用いて視覚変換器エンコーダを事前訓練する革新的な手法である。
この技術により、エンコーダはラベルに頼ることなく、データ内のグローバルパターンをキャプチャできる。
我々は,様々な視覚変換器アーキテクチャとCNNベースのモデルに対して,我々のモデルを評価する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:12:37 GMT)
The polygon relation and subadditivity of entropic measures for discrete and continuous multipartite entanglement [0.7] エントロピーの多角形関係と部分付加率の関係について検討した。
我々の研究は多粒子状態の豊富な構造をよりよく理解する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:43:54 GMT)
Deep Learning for Computer Vision based Activity Recognition and Fall Detection of the Elderly: a Systematic Review [0.6] AAL(Ambient Assisted Living)システムに関する多くの研究が出版されており、高齢者の自立生活による偏見を減らすのに役立っている。
本研究では,高齢者の転倒検出とHAR(Human Activity Recognition)について,文献の体系的レビューを行った。
この2つの課題を遂行する現在の傾向に対処するため,コンピュータビジョンデータに対するディープラーニング(DL)に基づくアプローチの活用に焦点をあてた。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:34:44 GMT)
Unveiling the Human-like Similarities of Automatic Facial Expression Recognition: An Empirical Exploration through Explainable AI [0.6] 本研究は,12種類の異なるネットワークを比較し,ディープニューラルネットワークと人間の知覚の類似性を検討することを目的とする。
我々は、革新的なグローバルな説明可能なAI手法を用いて、熱マップを生成し、6つの表情で訓練された12のネットワークにとって重要な顔領域を明らかにする。
発見は、人間とAIの表情認識が限定的に一致していることを示し、ネットワークアーキテクチャが類似性に影響を与えることを示唆している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 07:39:39 GMT)
Public vs Private Bodies: Who Should Run Advanced AI Evaluations and Audits? A Three-Step Logic Based on Case Studies of High-Risk Industries [0.6] 本稿では,先進的なAIのどの部分を監査すべきかを,9つの制度から明らかにする。
公的・私的な監査人間の効果的な責任配分は、特定の産業や監査条件に大きく依存する。
公共団体の能力は、産業のリスクレベル、規模、市場集中度とともに拡大すべきである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:11:53 GMT)
PRoGS: Progressive Rendering of Gaussian Splats [0.5] 3D Gaussian Splatting(3DGS)は、3Dシーンを知覚的に正確に表現できることから注目されている。
各スプラットの個々のデータを格納する必要があるため、かなりの量のストレージが必要になる。
最終シーンに近づいた可視コンテンツを表示することを目的として,このようなシーンを段階的にレンダリングする新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:15:30 GMT)
What makes a face looks like a hat: Decoupling low-level and high-level Visual Properties with Image Triplets [0.5] 本稿では,新しい刺激のセットにおいて,低レベルの視覚特性と高レベルの視覚特性を関連付ける手法を提案する。
刺激セット生成のためのアルゴリズムにより、視覚の流れの異なる表現が高レベルの認知行動にどのように影響するかを研究することができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:14:01 GMT)
ADHD diagnosis based on action characteristics recorded in videos using machine learning [0.5] 生ビデオ記録の同定と解析によるADHD診断のための新しい行動認識手法を提案する。
本研究の主な貢献は,(1)参加者の注意・過活動・刺激性に着目したテストの設計と実施,2)行動認識ニューラルネットワークに基づく新しい機械学習ADHD診断システムの実装,3)診断結果とADHD行動特性の分析を行うための分類基準の提案である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:16:56 GMT)
Different Victims, Same Layout: Email Visual Similarity Detection for Enhanced Email Protection [0.4] 我々は,電子メール脅威防御システムの検知能力を向上させるために,Pisco という名の電子メール視覚類似性検出手法を提案する。
以上の結果から,Eメールキットは広範囲に再利用され,視覚的に類似したメールが,さまざまな時間間隔で当社の顧客に送信されていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:20:02 GMT)
A Time-Intensity Aware Pipeline for Generating Late-Stage Breast DCE-MRI using Generative Adversarial Models [0.3] 組織中のコントラスト剤 (CA) の生物学的挙動を利用した新規な損失関数を提案し, 画素アテンションに基づく生成モデルを最適化した。
従来の正規化法や標準化法とは異なり、複数のタイムスタンプで画像列間のコントラスト拡張パターンを維持する新しい正規化手法を開発した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:31:49 GMT)
Enhancing Cell Tracking with a Time-Symmetric Deep Learning Approach [0.3] 本研究では,細胞を時間的近傍から追跡できるという仮定にのみ依存する,新しいディープラーニングに基づく追跡手法を開発した。
提案手法は, 細胞の動きパターンを事前の仮定なしに予測器で完全に学習できるという付加的な利点を有する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:53:32 GMT)
The Danger Within: Insider Threat Modeling Using Business Process Models [0.3] 本稿では、BPMN(Business Process Modeling and Notation)を利用した新たなインサイダー脅威知識ベースと脅威モデリングアプリケーションを開発する。
その結果は、アノテーションなしでもBPMNダイアグラムを利用して組織内の脅威を自動的に識別できることを示している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:51:56 GMT)
Exploiting the Vulnerability of Large Language Models via Defense-Aware Architectural Backdoor [0.2] 基盤となるモデルアーキテクチャ内に隠蔽する新しいタイプのバックドアアタックを導入します。
モデルアーキテクチャレイヤのアドオンモジュールは、入力トリガトークンの存在を検出し、レイヤの重みを変更することができる。
大規模言語モデルのトレーニング不要なアーキテクチャバックドアが真の脅威となることを実証する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:54:16 GMT)
NoiseAttack: An Evasive Sample-Specific Multi-Targeted Backdoor Attack Through White Gaussian Noise [0.2] ディープラーニング開発にサードパーティのデータを使用する場合、バックドア攻撃は重大な脅威となる。
我々は,新しいサンプル特異的なマルチターゲットバックドアアタック,すなわちNossAttackを紹介した。
この作業は、複数のターゲットクラスを生成する目的でビジョンバックドアアタックを起動する、この種の最初のものだ。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:24:46 GMT)
Applications and Advances of Artificial Intelligence in Music Generation:A Review [0.0] 本稿では,AI音楽生成における最新の研究成果を体系的にレビューする。
主要な技術、モデル、データセット、評価方法、および様々な分野におけるそれらの実践的応用をカバーしている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:50:55 GMT)
rerankers: A Lightweight Python Library to Unify Ranking Methods [0.0] rerankersはPythonライブラリで、最も一般的に使われている再ランクのアプローチに使いやすいインターフェイスを提供する。
Rerankerはこれらのメソッドを単一のユーザフレンドリーなインターフェースに統合し、実践者や研究者がさまざまな方法を探索できるようにします。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:50:17 GMT)
Workflow for practical quantum chemical calculations with quantum phase estimation algorithm: electronic ground and π-π* excited states of benzene and its derivatives† [0.0] 量子コンピュータは、従来のコンピュータに比べて計算資源が少ない完全構成の相互作用計算を実行することが期待されている。
QPEに基づく量子化学計算は、古典的コンピュータ上での数値シミュレーションにおいても報告されている。
電子グラウンドのQPEシミュレーションとベンゼンおよびそのクロロおよびニトロ誘導体のπ-pi*励起一重項状態について報告する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:07:38 GMT)
Visual Servoing for Robotic On-Orbit Servicing: A Survey [0.0] OOS(On-Orbit servicing)活動は、宇宙の持続可能な探査と商業化のための次の大きなステップとなるだろう。
ビジュアルサーボ(VS)により、ロボットは重要なOOSミッションに必要な正確な操作を実現することができる。
本稿では、宇宙マニピュレータシステムを用いた自動OOS操作のための既存のVSアプローチの概要について述べる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 22:36:11 GMT)
Unpacking Approaches to Learning and Teaching Machine Learning in K-12 Education: Transparency, Ethics, and Design Activities [0.0] 機械学習の学習と教育を概念化するための3つのアプローチを同定する。
その1つは、データ駆動アプローチであり、若者にデータセットを作成し、トレーニングし、テストする機会を提供することを強調している。
アルゴリズム駆動学習の第2のアプローチは、機械学習モデルの背後にある学習アルゴリズムやエンジンの動作に関する学習を優先するものだ。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:21:42 GMT)
Towards a group structure for superluminal velocity boosts [0.0] 超曲面の2つの族の間の写像を構築し、対応する作用素を超光速加速として解釈する。
ドラガンとエケルトによって提唱された「相対性理論の量子原理」の研究におけるこの構成の意味について論じる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:35:47 GMT)
Thermodynamic properties of the macroscopically degenerate tetramer-dimer phase of the spin-1/2 Heisenberg model on the diamond-decorated square lattice [0.0] ダイヤモンド被覆正方格子上のスピン-1/2ハイゼンベルク反強磁性体は様々な量子相を示す。
二量体-テトラマー相近傍で生じる異常熱力学特性を詳細に研究した。
断熱脱磁性下では, 絶対零温度への効率的な冷却を促進する改良された磁気カロリック効果が検出される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:00:05 GMT)
The overlooked need for Ethics in Complexity Science: Why it matters [0.0] 我々は、形式的ガイドラインの欠如、専門的倫理委員会、複雑さ科学コミュニティにおける倫理に関する広範な議論について強調する。
勧告には、(i)複雑なシステム研究に特化した倫理ガイドラインを策定するための支援的メカニズムの確立、(ii)オープンアクセスリソースの作成、(iii)包括的対話の促進が含まれる。
この対話を開始することで、倫理が複雑性研究にどのように統合されるかにおいて必要な変化を促すことを目指しており、現代的課題により効果的に対処するための分野を位置づけている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:48:24 GMT)
The Era of Foundation Models in Medical Imaging is Approaching : A Scoping Review of the Clinical Value of Large-Scale Generative AI Applications in Radiology [0.0] 放射線技師の不足に起因する社会問題は激化しており、人工知能は潜在的な解決策として強調されている。
最近出現する大規模生成AIは、大規模言語モデル(LLM)からマルチモーダルモデルへと拡張されている。
このスコーピングレビューは、大規模生成型AIアプリケーションの臨床的価値に関する既存の文献を体系的に整理する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 00:48:50 GMT)
The Computational Mechanisms of Detached Mindfulness [0.0] 分離マインドフルネス(detached mindfulness)は、認知心理学において特に効果的な治療法である。
研究は抑うつと不安を減らすために分離されたマインドフルネスの能力を強く支持する一方で、その認知と計算の基盤はほとんど説明がつかないままである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:30:41 GMT)
Surveying You Only Look Once (YOLO) Multispectral Object Detection Advancements, Applications And Challenges [0.0] 本稿では,400件の論文を詳細にレビューし,マルチスペクトルイメージング技術,深層学習モデル,その応用の権威的メタレビューを提供する。
グラウンドベースの収集は最も一般的なアプローチであり、レビューされた論文の63%を合計している。
最も一般的なセンサー融合は、赤緑色(RGB)とLWIR(Long-Wave Infrared)である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 04:10:25 GMT)
Surface Flux Transport Modelling using Physics Informed Neural Networks [0.0] 表面フラックス輸送モデリングは、太陽表面の磁束の輸送と進化をシミュレートし、解析するのに役立ちます。
我々はバイポーラ磁気領域(BMR)の進化を研究するための新しい物理情報ニューラルネットワーク(PINN)モデルを開発した。
メッシュ非依存のPINN法は、観測された極磁場をより優れたフラックス保存で再現することができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:41:07 GMT)
Statistical evaluation and optimization of entanglement purification protocols [0.0] 提案手法は, ほぼ均一にサンプリングされた密度行列から推定される初期平均コンカレンスを改善できないことを示す。
また、より効率的なプロトコルを開発し、より効率的な2ドルプロジェクタに基づく最近の提案とともに数値的に検討する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:06:31 GMT)
Securing Network-Booting Linux Systems at the Example of bwLehrpool and bwForCluster NEMO [0.0] Baden-W"urttemberg大学は、コンピュータラボやデータセンターなどのサービスにステートレスシステムリモートブートを使用している。
本研究の目的は,サーバ指向のアイデンティティ,機密性,画像の信頼性を重視し,ネットワーク内の信頼を確立することである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 20:54:19 GMT)
Safeguarding AI Agents: Developing and Analyzing Safety Architectures [0.0] 本稿では,人間チームと連携するAIシステムにおける安全対策の必要性について論じる。
我々は,AIエージェントシステムにおける安全プロトコルを強化する3つのフレームワークを提案し,評価する。
これらのフレームワークはAIエージェントシステムの安全性とセキュリティを大幅に強化することができると結論付けている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:14:51 GMT)
Robust Clustering on High-Dimensional Data with Stochastic Quantization [0.0] 本稿では,従来のベクトル量子化(クラスタリング)アルゴリズム,特にK-Meansとその変種K-Means++の限界に対処する。
量子化(SQ)は、高次元の教師なしおよび半次元の学習問題に対するスケーラブルな代替手段である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:13:55 GMT)
Real-Time Indoor Object Detection based on hybrid CNN-Transformer Approach [0.0] 屋内環境でのリアルタイム物体検出はコンピュータビジョンの難しい領域であり、可変照明や複雑な背景といった独特な障害に直面している。
この研究は、既存のデータセットと計算モデルの評価を精査し、洗練されたデータセットの作成につながった。
本稿では,CNN検出モデルを適応させ,室内の散らばったシーンにおける重要な特徴を識別・優先順位付けするモデルの能力を高めるためのアテンション機構を組み込んだ。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:14:08 GMT)
Quantum transport on Bethe lattices with non-Hermitian sources and a drain [0.0] 有限世代のベーテ格子上の強結合モデル上の量子輸送、またはケイリー木を考える。
量子輸送を解析するための新しい特徴として、周辺部位のソースと中心部位のドレインに複雑なポテンシャルを加える。
周辺地から中心地へ侵入できる固有状態は,世代数に限られていることが判明した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:15:43 GMT)
Quantum state engineering of light using intensity measurements and post-selection [0.0] レーザーと原子の強い相互作用は、測定データの強度測定と古典的ポストセレクションを用いて光学的「キャット」状態を生成することができることを示す。
これらの知見は、量子光工学および非線形光学および量子情報科学への応用のための高品質で強力な光猫状態の生成に関する重要なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:06:44 GMT)
Quantifying Emergence in Neural Networks: Insights from Pruning and Training Dynamics [0.0] ネットワーク内の単純なコンポーネントの相互作用から複雑な振る舞いが発達する創発性は、機能強化において重要な役割を担います。
本稿では,トレーニングプロセス中の出現を計測し,ネットワーク性能に与える影響を定量的に検討する枠組みを提案する。
我々の仮説は、アクティブノードと非アクティブノードの接続によって定義される出現度が、ネットワークにおける創発的行動の発生を予測することができることを示唆している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 03:03:35 GMT)
Privacy-Preserving and Post-Quantum Counter Denial of Service Framework for Wireless Networks [0.0] PACDoSQは、競合するDoSとPQセキュリティを備えたスペクトル管理のために、ロケーションプライバシと匿名性を提供する最初のフレームワークである。
PACDoSQは,そのセキュリティ目標を達成し,総合的な性能評価を通じてその実現可能性を示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:14:41 GMT)
Principal Trotter Observation Error with Truncated Commutators [0.0] ハミルトンシミュレーションは量子コンピュータの最も有望な応用の1つである。
本研究では, 一定の観測可能条件下でのシミュレーション誤差について考察する。
高可換な可観測物の場合、この上限によって示されるシミュレーション誤差は著しく圧縮される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:01:42 GMT)
Political DEBATE: Efficient Zero-shot and Few-shot Classifiers for Political Text [0.0] 大規模言語モデルは、ゼロショット学習(ゼロショット学習)として知られる、教師付きトレーニングなしで文書に注釈を付けることができる。
本稿では、ゼロショットおよび少数ショットの政治文書分類のための政治DeBATE言語モデルを紹介する。
800以上の分類タスクに高度に正確なラベルを持つ20,000以上の政治文書からなるコーパスです。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:26:17 GMT)
Permissible four-strategy quantum extensions of classical games [0.0] この研究は、2つのユニタリ演算によりアイザート・ウィルケンス・リューエンシュタインスキームで拡張された戦略形式ゲームに焦点を当てている。
拡張の異なるクラス間の相互依存性は、あるクラスが別のクラスに変換される極限ケースを含む特定される。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:04:19 GMT)
PINNIES: An Efficient Physics-Informed Neural Network Framework to Integral Operator Problems [0.0] 本稿では,物理インフォームド深層学習フレームワークにおける積分演算子近似のための効率的なテンソルベクトル積法を提案する。
我々は、この方法がフレドホルムとボルテラ積分作用素の両方に適用可能であることを実証する。
また,カプトー微分を効率的に計算する高速行列ベクトル積アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:43:58 GMT)
Optimal Power Grid Operations with Foundation Models [0.0] 本稿では,AIファンデーションモデル(FM)とグラフニューラルネットワークの進歩を利用して,ダウンストリームタスクの低可用性グリッドデータを効率的に活用することを提案する。
グリッドの基盤となる物理を捉えるために、電力流力学を学習する自己教師型モデルの構築は、電力グリッドのためのFMを開発するための重要な第一歩であると信じている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:06:13 GMT)
On-the-Fly Ab Initio Hagedorn Wavepacket Dynamics: Single Vibronic Level Fluorescence Spectra of Difluorocarbene [0.0] Hagedorn Wavepacketは、モデル電位の単一振動レベル(SVL)スペクトルに対するアンハーモニック効果を部分的に捉えるために、局所的調和近似を用いて使用されている。
局所ハーモニックHagedornウェーブパレットダイナミクスとオンザフライアブイニシアトダイナミクスを併用する。
グローバル・ハーモニック・モデルではCF$が不適切であるのに対し、実機でのローカル・ハーモニック・ハゲゴルン・ウェーブパケット・ダイナミクスで計算されたスペクトルは実験データ、特に低初期励起によく一致することを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:04:44 GMT)
On probabilities in quantum mechanics [0.0] 私はまずQBist派で確率の概念を取り上げ、量子確率を計算するためのBorn公式について独自の議論をします。
その関係において、量子論の基礎と解釈への私のアプローチのいくつかの結果もスケッチします。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:27:08 GMT)
On a heuristic approach to the description of consciousness as a hypercomplex system state and the possibility of machine consciousness (German edition) [0.0] 本稿は、すべての人間が経験する意識の内的状態が、物理的だが想像上の超複素基底を持つことを示す。
理論的な考察に基づいて、いわゆる複複素代数に関する数学的研究の結果、マシン上で超複素系状態の生成と利用が可能となった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:55:57 GMT)
Learning Machines: In Search of a Concept Oriented Language [0.0] 次世代の「知性」マシンは、知識発見、意思決定、概念を扱うことができるべきである。
本稿では、歴史的貢献を考慮し、人間の知能の類推を通して、これらの異なる疑問について論じる。
また、概念指向言語のための一般的なフレームワークも提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:05:47 GMT)
Late-time ensembles of quantum states in quantum chaotic systems [0.0] 対称性を持つ量子カオス系における深夜アンサンブルの普遍構造について検討する。
我々の研究は、中間スペクトル状態が後期の位相空間のエルゴディカルに探索するわけではないにもかかわらず、深夜のアンサンブルは通常、ハールアンサンブルと同じ平均とサンプルとサンプルの変動を示すことを示している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:00:29 GMT)
Initial Development and Evaluation of the Creative Artificial Intelligence through Recurring Developments and Determinations (CAIRDD) System [0.0] 大型言語モデル (LLMs) は創造性と感覚の出現のファクシミリを提供するが、実際は創造的でも知覚的でもない。
本稿では,概念注入・精錬の反復的プロセスを通じてLCM出力の創造性を向上する手法を提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 21:04:07 GMT)
Hybridization of Persistent Homology with Neural Networks for Time-Series Prediction: A Case Study in Wave Height [0.0] 本稿では,ニューラルネットワークモデルの予測性能を向上させる機能工学手法を提案する。
具体的には、計算トポロジ手法を利用して、入力データから貴重なトポロジ的特徴を導出する。
タイムアヘッド予測では、FNN、RNN、LSTM、GRUモデルにおいて、R2$スコアの強化が重要だった。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 01:26:21 GMT)
Highly complex novel critical behavior from the intrinsic randomness of quantum mechanical measurements on critical ground states -- a controlled renormalization group analysis [0.0] 弱測定が1次元三臨界および臨界量子イジングモデルの量子臨界基底状態に与える影響を考察する。
制御された再正規化群解析を用いることで、各問題は非常に複雑なスケーリング挙動を示すことが分かる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:59:04 GMT)
Here's Charlie! Realising the Semantic Web vision of Agents in the age of LLMs [0.0] 本稿では,法定機関が半自律型AIエージェントを信頼してオンラインインタラクションを行うための短期的展望について述べる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:32:47 GMT)
Graph-based Modeling and Simulation of Emergency Services Communication Systems [0.0] 緊急サービス通信システム(ESCS)は、インターネットプロトコルベースの通信ネットワークへと進化している。
本稿では,頑健で適応可能なグラフベースシミュレーションフレームワークと,ESCSシミュレーションに不可欠な数学的モデルを紹介する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:53:35 GMT)
Gradient events: improved acquisition of visual information in event cameras [0.0] 従来の明るさイベントと同じ特性から恩恵を受ける新しいタイプのイベントである勾配イベントを提案する。
勾配イベントに基づくビデオ再構成は、既存の最先端の輝度イベントベースの手法よりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:18:35 GMT)
GPT has become financially literate: Insights from financial literacy tests of GPT and a preliminary test of how people use it as a source of advice [0.0] 我々は,大規模言語モデルであるGPTが,金融リテラシーテストを用いて,大衆のロボアドバイザとして機能する能力を評価する。
GPT-3.5に基づくDavinciとChatGPTはそれぞれ66%、金融リテラシーテストでは65%、ベースラインは33%だった。
GPT-4に基づくChatGPTは、ほぼ完全な99%のスコアを獲得し、金融リテラシーが最先端のモデルの創発的な能力になることを示している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:23:26 GMT)
GISR: Geometric Initialization and Silhouette-based Refinement for Single-View Robot Pose and Configuration Estimation [0.0] GISRは、リアルタイムで実行を優先順位付けするロボット対カメラのポーズ推定手法である。
我々は,GISRを公開データ上で評価し,その性能と精度の両面で,同一クラスの既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 22:56:42 GMT)
First- and second-order quantum phase transitions in the long-range unfrustrated antiferromagnetic Ising chain [0.0] 縦方向および横方向の磁場をもつ非フラストレーション反強磁性イジング鎖の基底状態相図について検討した。
位相遷移の順序が1つの極限からもう1つの極限にどのように変化するかを理解するため、解析的に難解な相互作用範囲に数値的に取り組む。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:00:01 GMT)
Face Recognition: to Deploy or not to Deploy? A Framework for Assessing the Proportional Use of Face Recognition Systems in Real-World Scenarios [0.0] 顔認識(FR)は高い技術的成熟度に達したが、倫理的観点から慎重に評価する必要がある。
最近のAIポリシでは、このようなFR介入は厳密に必要な場合にのみ、比例してデプロイされるべきである、と提案されている。
本稿では、FR介入が所定の使用状況に比例するか否かを評価するためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:14:56 GMT)
Exponential Qubit Reduction in Optimization for Financial Transaction Settlement [0.0] 我々は、[Tan et al., Quantum 5, 454 (2021) で提示された量子ビット効率の符号化を拡張し、規制金融取引所が提供するデータから構築された金融取引決済問題の事例に適用する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:31:26 GMT)
Enhanced control of single-molecule emission frequency and spectral diffusion [0.0] スターク効果は、分子、原子、電子遷移のスペクトルを概してシフトさせる強力な方法である。
液体ヘリウムに冷却された固体状態の分子量子エミッタを用いて、この傾向を実験的に証明する。
分子の偏光性の異方性に基づいて、局所電界の2次元制御により、エミッタの周波数を調整できるだけでなく、磁場のゆらぎに関連するスペクトル不安定性を適切に抑制できる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:40:40 GMT)
Cooperative Evolutionary Pressure and Diminishing Returns Might Explain the Fermi Paradox: On What Super-AIs Are Like [0.0] 道徳に対する進化的アプローチは、協力の問題への適応として説明できる。
物質資源へのアクセスの増加による利益の減少は、全体として、銀河全体を植民地化する動機がない可能性を示唆している。
また、各実体が一定の空間を占有するため、数学的理由から指数的植民地化や複製はできないことも注目されている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 16:33:22 GMT)
Contrastive Learning and Abstract Concepts: The Case of Natural Numbers [0.0] 対照的な学習は、人間でも超人的範囲でも高い精度で、一目で数えられるように訓練できることを示す。
類似アーキテクチャのニューラルネットワークスキームを,一見教師付き学習(SL)のトレーニング・ツー・カウントの結果と比較した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 06:02:25 GMT)
Comparison of Epilepsy Induced by Ischemic Hypoxic Brain Injury and Hypoglycemic Brain Injury using Multilevel Fusion of Data Features [0.0] 本研究は、低酸素虚血(HI)、低血糖、てんかんによる脳損傷の類似性と相違について検討することを目的とする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:25:52 GMT)
CoOMBE: A suite of open-source programs for the integration of the optical Bloch equations and Maxwell-Bloch equations [0.0] これらのプログラムはリンドブラッドマスター方程式によって支配されるより一般的な量子力学系に使用できる。
Fortran 90で書かれているが、Fortranプログラミングの知識は必要ない。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:04:37 GMT)
Clustering of Indonesian and Western Gamelan Orchestras through Machine Learning of Performance Parameters [0.0] インドネシアと西洋のゲーランのアンサンブルは、パフォーマンスの違いに関して調査されている。
西洋におけるこの音楽のしばしばエキゾチックな歴史は、現代の音調体系、調音、大規模な形式の違いに反映されているかもしれない。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 11:55:53 GMT)
COmoving Computer Acceleration (COCA): $N$-body simulations in an emulated frame of reference [0.0] 我々は,ハイブリッドフレームワークであるComoving Computer Acceleration (COCA)を紹介した。
正確な運動方程式は、基準のエミュレートされたフレームで解き、任意のエミュレーション誤差を設計によって補正する。
COCAは、粒子軌道におけるエミュレーション誤差を効率的に低減し、MLなしで対応するシミュレーションを実行するよりもはるかに少ない力評価を必要とする。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 17:27:12 GMT)
Almost All Quantum Channels Are Diagonalizable [0.0] 我々は「単純な固有値しか持たない$mathcal S$のすべての要素の集まりは$mathcal S$で密接である」という文を証明している。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 13:36:44 GMT)
Adoption of smartphones among older adults and the role of perceived threat of cyberattacks [0.0] 本研究は,高齢者におけるスマートフォンの普及と利用の障壁として,サイバー攻撃の脅威として認識されていることに焦点を当てる。
スロベニアの高齢者を対象とした定量的横断調査を行った。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 10:30:01 GMT)
A+AI: Threats to Society, Remedies, and Governance [0.0] この文書は、人工知能(AI)が社会にもたらす脅威、特に短期的な脅威に焦点を当てている。
脅威を緩和する可能性のある対策を示す表も用意されている。
同紙は、政府ができるだけ早く行うべき特定のアクションをリストアップしている。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:43:47 GMT)
A sparse PAC-Bayesian approach for high-dimensional quantile prediction [0.0] 本稿では,高次元量子化予測のための確率論的機械学習手法を提案する。
擬似ベイズ的フレームワークとスケールした学生tとランゲヴィン・モンテカルロを併用して効率的な計算を行う。
その効果はシミュレーションや実世界のデータを通じて検証され、そこでは確立された頻繁な手法やベイズ的手法と競合する。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 08:01:01 GMT)
A new foundation of quantum decision theory [0.0] 各可アクセス変数は、特定の到達不能変数の関数と見なせると仮定される。
ボルン・ルールの背後にある2つの基本的な仮定は、1)可能性原理、2)問題のある俳優は、仮説的に完全に合理的なより高い存在によってモデル化できるモチベーションを持つ。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 09:37:18 GMT)
A new approach towards quantum foundation and some consequences [0.0] 6つの仮定に基づく一般的な理論が紹介される。
基本的な概念は、観測者または通信観測者のグループと関連付けられた理論変数である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:22:19 GMT)
A hybrid quantum-classical fusion neural network to improve protein-ligand binding affinity predictions for drug discovery [0.0] 本稿では,薬物発見における親和性予測に適したハイブリッド量子古典的深層学習モデルを提案する。
具体的には、最適化量子アーキテクチャにおいて、3次元および空間グラフ畳み込みニューラルネットワークを相乗的に統合する。
シミュレーションの結果、既存の古典的モデルと比較して予測精度が6%向上し、従来の古典的手法に比べてはるかに安定した収束性能を示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 14:22:35 GMT)
A Voter-Based Stochastic Rejection-Method Framework for Asymptotically Safe Language Model Outputs [0.0] 本稿では,不承認のしきい値に達すると,チェッカーが生成した出力の受理性に投票して再生するシステムを提案する。
さらに、コストと故障率の推定器を提案し、アプリケーションに適した実験データとに基づいて、最小限のコストで所望の故障率を達成するアルゴリズムを提案する。
これらのモデルでは, 投票者数と閾値がアルゴリズムによって選択された場合のコスト関数として, 故障率は指数関数的に減少し, 限られたデータであっても, 実際に動作しているシステムの性能を合理的に推定することを示した。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 19:28:39 GMT)
A Low-Temperature Tunable Microcavity featuring High Passive Stability and Microwave Integration [0.0] この研究は、特に低受動的振動レベルのために設計された閉サイクル極低温ファイバベースのマイクロキャビティ構成を提示する。
10ケルビン以下の温度では、25ピクタ程度の安定性が異なる設定で再現可能である。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 12:53:41 GMT)
A Double-Linked Blockchain Approach Based on Proof-of-Refundable-Tax Consensus Algorithm [0.0] ブロックチェーンのパフォーマンスを大幅に改善し、フォークのない単一チェーンを保証する、二重リンク型ブロックチェーンデータ構造を提案する。
提案したPoRTコンセンサスアルゴリズムにより、信頼性が高く、効率的で、公正で安定したブロックチェーン操作を構築することができる。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 05:45:59 GMT)
A Digital signature scheme based on Module-LWE and Module-SIS [0.0] 本稿では,モジュールLWE問題とモジュールSIS問題に基づいて,Sharafi と Daghigh が提案するデジタル署名方式の改良版を提案する。
提案方式は,Sharaf-Daghigh方式よりもセキュリティレベルが高く,デコード失敗確率も小さい。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 18:47:49 GMT)
1DCNNTrans: BISINDO Sign Language Interpreters in Improving the Inclusiveness of Public Services [0.0] インドネシアは、聴覚障害の件数で世界第4位である。
聴覚障害のある人は、しばしばコミュニケーションが困難であり、手話を使う必要がある。
本研究の目的は,手話翻訳アプリの簡易化と辞書化のためのモデル開発におけるAIの適用性を検討することである。
論文参考訳(メタデータ) (Tue, 3 Sep 2024 15:17:39 GMT)