FOLIO: Natural Language Reasoning with First-Order Logic [147.5] 我々は、自然言語(NL)における推論のための人間注釈付き、論理的に複雑で多様なデータセットであるFOLIOを提示する。
FOLIOは1,430の例(一意の結論)で構成され、それぞれが487の前提のうちの1つと組み合わせて、それぞれの結論の妥当性を導出的に推論する。
NL推論とNL-FOL変換の両方において、複数の最先端言語モデルをベンチマークする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:08:54 GMT)
T2V-Turbo: Breaking the Quality Bottleneck of Video Consistency Model with Mixed Reward Feedback [111.4] 本稿では,T2V-Turboについて述べる。T2V-Turboは,様々なモデルから得られるフィードバックを,事前学習したT2Vモデルの一貫性蒸留プロセスに統合する。
興味深いことに、我々のT2V-Turboの4段階の世代は、Gen-2とPikaを抜いてVBenchで最高スコアを達成した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:50:49 GMT)
Evaluating Copyright Takedown Methods for Language Models [100.4] 言語モデル(LM)は、潜在的に著作権のある資料を含む様々なデータに対する広範な訓練からその能力を引き出す。
本稿では,LMの著作権削除の可能性と副作用を初めて評価する。
システムプロンプトの追加、デコード時間フィルタリングの介入、未学習アプローチなど、いくつかの戦略を検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:42:43 GMT)
Temporally Consistent Referring Video Object Segmentation with Hybrid Memory [98.8] 本稿では,参照セグメンテーションとともに時間的一貫性を明示的にモデル化する,エンドツーエンドなR-VOSパラダイムを提案する。
自動生成された高品質の参照マスクを有するフレームの特徴は、残りのフレームをセグメント化するために伝播される。
大規模な実験により,本手法は時間的整合性を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:23:15 GMT)
P-FOLIO: Evaluating and Improving Logical Reasoning with Abundant Human-Written Reasoning Chains [97.3] P-FOLIO(P-FOLIO)は、多種多様で複雑な推論連鎖からなる人称注釈付きデータセットである。
我々はP-FOLIOを用いて大規模言語モデル推論機能の評価と改善を行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:22:57 GMT)
SEAL: Safety-enhanced Aligned LLM Fine-tuning via Bilevel Data Selection [92.4] SEALは、二段階最適化に基づいてデータローカを学習し、安全で高品質な微調整データをランク付けし、安全でないものや低品質なものをランク付けする。
SEALで訓練されたモデルは、複数のベースラインよりも優れた品質を示し、ランダム選択に比べて8.5%と9.7%の勝利率が上昇した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:05:22 GMT)
SEAL: Safety-enhanced Aligned LLM Fine-tuning via Bilevel Data Selection [92.4] SEALは、二段階最適化に基づいてデータローカを学習し、安全で高品質な微調整データをランク付けし、安全でないものや低品質なものをランク付けする。
SEALで訓練されたモデルは、複数のベースラインよりも優れた品質を示し、ランダム選択に比べて8.5%と9.7%の勝利率が上昇した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:05:22 GMT)
SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights [89.6] より小規模な学生モデルの推論と反映の両方を教師モデルを用いて監督し,修正するフレームワークであるSuperCorrectを提案する。
第1段階では、教師モデルから階層的な高レベルかつ詳細な思考テンプレートを抽出し、よりきめ細かい推論思考を導き出す学生モデルを指導する。
第2段階では、学生モデルの自己補正能力を高めるために、クロスモデル協調直接選好最適化(DPO)を導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:25:52 GMT)
Diffusion Models Need Visual Priors for Image Generation [86.9] Diffusion on Diffusion (DoD)は、先述したサンプルから視覚的先行情報を抽出し、拡散モデルのための豊富なガイダンスを提供する革新的な多段階生成フレームワークである。
我々は、人気のあるImageNet-$256 256$データセット上でDoDを評価し、SiTやDiTと比較して7$times$トレーニングコストを削減した。
私たちの最大のモデルであるDoD-XLは、FID-50Kスコアが1.83で、100万のトレーニングステップしか達成していません。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:03:56 GMT)
E-Motion: Future Motion Simulation via Event Sequence Diffusion [86.8] イベントベースのセンサーは、これまで達成できなかった詳細と精度で将来の動きを予測するユニークな機会を提供する可能性がある。
本稿では,映像拡散モデルの強力な学習能力とイベントカメラのリッチな動作情報とを,モーションシミュレーションフレームワークとして統合することを提案する。
本研究は,コンピュータビジョンシステムの解釈能力と予測精度の向上に向けた今後の研究の方向性を示唆するものである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:19:23 GMT)
On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.8] 複数モーダルな)自己教師付き表現学習のための連続領域における識別確率モデル問題について検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:02:46 GMT)
Modular Pluralism: Pluralistic Alignment via Multi-LLM Collaboration [84.5] 大規模言語モデル(LLM)は、文化、人口統計、地域社会の様々な好みをモデル化するのに苦労する。
我々は多元的アライメントのためのマルチLLM協調に基づくモジュラーフレームワークであるモジュラー・プラナリズムを提案する。
我々は,6つのタスクと4つのデータセットによるモジュール型多元性の評価を行った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:05:03 GMT)
On the Adversarial Transferability of Generalized "Skip Connections" [83.7] スキップ接続は、より深く、より強力な現代のディープモデルにとって重要な要素である。
バックプロパゲーションにおいて、バックプロパゲーション中に、スキップ接続からより多くの勾配を用いることで、高い転送性を持つ逆例を作成できることが分かる。
本稿では,ResNet,Transformer,Inceptions,Neural Architecture Search,Large Language Modelsなど,さまざまなモデルに対する包括的なトランスファー攻撃を行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:17:47 GMT)
TabPedia: Towards Comprehensive Visual Table Understanding with Concept Synergy [81.8] 本稿では,概念相乗効果機構を備えた新しい大型視触覚モデルTabPediaを提案する。
この統合されたフレームワークにより、TabPediaはテーブル検出、テーブル構造認識、テーブルクエリ、テーブル質問応答などのVTUタスクをシームレスに統合できる。
実世界のシナリオにおけるVTUタスクをよりよく評価するために、新しい総合的なテーブルVQAベンチマークComTQAを構築した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:38:40 GMT)
Not All Preference Pairs Are Created Equal: A Recipe for Annotation-Efficient Iterative Preference Learning [81.7] 反復的な選好学習には、オンラインの注釈付き選好ラベルが必要である。
コスト効率のよいアノテーションに対する応答対を選択するための戦略について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:51:32 GMT)
Towards virtual painting recolouring using Vision Transformer on X-Ray Fluorescence datacubes [80.3] 画像アートにおけるX線蛍光(XRF)分析の生データを用いて仮想絵画再構成を行うパイプラインを定義する。
データセットサイズを小さくするために、XRFスペクトルのデータベースから始まる合成データセットを生成する。
我々は、XRFスペクトルを低次元K平均対応計量空間に埋め込むための深部変分埋め込みネットワークを定義する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:05:28 GMT)
T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design [79.7] 提案手法であるT2V-Turbo-v2は、様々な監視信号を統合することにより、大幅な進歩をもたらす。
特定の学習目標に対するデータセットの調整の重要性を強調した。
トレーニングデータセットから動作ガイダンスを抽出し,ODEソルバに組み込むことにより,このアプローチの可能性を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:47:36 GMT)
T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design [79.7] 提案手法であるT2V-Turbo-v2は、様々な監視信号を統合することにより、大幅な進歩をもたらす。
特定の学習目標に対するデータセットの調整の重要性を強調した。
トレーニングデータセットから動作ガイダンスを抽出し,ODEソルバに組み込むことにより,このアプローチの可能性を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:47:36 GMT)
Optimal Correlated Equilibria in General-Sum Extensive-Form Games: Fixed-Parameter Algorithms, Hardness, and Two-Sided Column-Generation [78.5] ワイドフォームゲームにおいて,様々な種類の最適平衡を求める問題について検討する。
これら3つの概念のすべてに最適な平衡を計算するための新しいアルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:10:02 GMT)
Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images [76.5] 本稿では,意味的対応の学習に固有のデータ・ハングリー・マターが存在するという仮説に基づく。
我々は,機械の監督を通じて,ペア化されたキーポイントを確実に強化する単純な機械注釈器を実証する。
我々のモデルは,SPair-71k,PF-PASCAL,PF-WILLOWといった意味対応学習ベンチマークの最先端モデルを上回る。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:05:06 GMT)
Bukva: Russian Sign Language Alphabet [75.4] 本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:59:48 GMT)
Scaling Laws for Predicting Downstream Performance in LLMs [75.3] この研究は、性能評価のためのより効率的な指標として、事前学習損失に焦点を当てている。
我々は、データソース間のFLOPに基づいて、ドメイン固有の事前学習損失を予測するために、電力法解析関数を拡張した。
我々は2層ニューラルネットワークを用いて、複数のドメイン固有の損失と下流性能の非線形関係をモデル化する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:57:48 GMT)
Causal machine learning for predicting treatment outcomes [75.1] Causal Machine Learning (ML)は、治療結果を予測するフレキシブルでデータ駆動の方法を提供する。
因果MLの主な利点は、個別化された治療効果を推定できることである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:39:08 GMT)
Point Cloud Mamba: Point Cloud Learning via State Space Model [73.7] 我々は,マンバをベースとしたポイントクラウド法が,トランスフォーマや多層パーセプトロン(MLP)に基づく従来手法よりも優れていることを示す。
特に,マルチ層パーセプトロン(MLP)を用いて,マンバをベースとした点雲法が従来手法より優れていることを示す。
Point Cloud Mambaは、最先端(SOTA)のポイントベースメソッドであるPointNeXtを超え、ScanNN、ModelNet40、ShapeNetPart、S3DISデータセット上での新たなSOTAパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:27:00 GMT)
Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation [72.7] 本稿では,複雑なQAタスクに対する適応ノート拡張RAG(Adaptive Note-Enhanced RAG)と呼ばれる汎用RAGアプローチを提案する。
具体的には、Adaptive-Noteは、知識の成長に関する包括的な視点を導入し、ノート形式で新しい情報を反復的に収集する。
さらに,適切な知識探索を促進するために,適応的な音符ベースの停止探索戦略を用いて,「何を検索し,いつ停止するか」を判断する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:03:29 GMT)
Scaling Instructable Agents Across Many Simulated Worlds [71.0] 私たちのゴールは、シミュレーションされた3D環境で人間ができることを何でも達成できるエージェントを開発することです。
我々のアプローチは、最小限の仮定を示唆しながら、言語駆動の一般性に焦点を当てている。
我々のエージェントは、汎用的なヒューマンライクなインタフェースを使って、リアルタイムで環境と対話する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:30:24 GMT)
Conjugated Semantic Pool Improves OOD Detection with Pre-trained Vision-Language Models [70.8] ゼロショット・アウト・オブ・ディストリビューション(OOD)検出のための簡単なパイプラインでは、広範なセマンティックプールから潜在的OODラベルを選択する必要がある。
性能向上にはセマンティックプールの拡張が必要であると理論化します。
我々は,CSPによるOODラベル候補の拡大が要件を満たし,FPR95において既存の作品の7.89%を上回っていることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:24:11 GMT)
Ant Colony Sampling with GFlowNets for Combinatorial Optimization [68.8] Generative Flow Ant Colony Sampler (GFACS)は、階層的に償却推論と並列探索を組み合わせた新しいメタヒューリスティック手法である。
提案手法はまず,生成フローネットワーク(GFlowNets)を利用して,ソリューション空間上の複数モーダル事前分布を記憶する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:36:39 GMT)
Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.6] 補完ラベル学習は、弱教師付き学習問題である。
均一分布仮定に依存しない一貫したアプローチを提案する。
相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:46:22 GMT)
Cross-Modality Perturbation Synergy Attack for Person Re-identification [66.5] 相互モダリティReIDの主な課題は、異なるモダリティ間の視覚的差異を効果的に扱うことである。
既存の攻撃方法は、目に見える画像のモダリティの特徴に主に焦点を当てている。
本研究では,クロスモーダルReIDに特化して設計されたユニバーサル摂動攻撃を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:56:39 GMT)
SEED-Story: Multimodal Long Story Generation with Large Language Model [66.4] SEED-Storyは、MLLM(Multimodal Large Language Model)を利用して拡張マルチモーダルストーリーを生成する新しい手法である。
マルチモーダルアテンションシンク機構を提案し,最大25個のストーリー(トレーニング用10個)を高い効率で自動回帰的に生成する。
本稿では,大規模かつ高解像度なStoryStreamというデータセットを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:39:28 GMT)
SubZero: Random Subspace Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning [66.3] 言語モデルのサイズが大きくなるにつれて、バックプロパゲーションに対するメモリ要求が増加する。
Zeroth-order (ZOZO) 最適化手法はメモリ効率の代替手段を提供する。
本稿では,SubZeroがファインチューニングを強化し,通常のZOZO手法と比較して高速な結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:01:43 GMT)
Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow [65.5] 拡散モデルは、視覚生成を大幅に改善したが、生成ODEを解くという計算集約的な性質のため、生成速度の遅さによって妨げられている。
広く認識されている解である整流流は、ODEパスを直線化することで生成速度を向上させる。
本稿では,より広範な拡散モデルのカテゴリをカバーするために,設計空間と修正の応用範囲を一般化するRectified Diffusionを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:17:53 GMT)
Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow [65.5] 拡散モデルは、視覚生成を大幅に改善したが、生成ODEを解くという計算集約的な性質のため、生成速度の遅さによって妨げられている。
広く認識されている解である整流流は、ODEパスを直線化することで生成速度を向上させる。
本稿では,より広範な拡散モデルのカテゴリをカバーするために,設計空間と修正の応用範囲を一般化するRectified Diffusionを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:17:53 GMT)
Recent Advances of Multimodal Continual Learning: A Comprehensive Survey [64.8] 本研究は,マルチモーダル連続学習法に関する総合的な調査である。
既存のMMCLメソッドは,正規化ベース,アーキテクチャベース,リプレイベース,プロンプトベースという4つのカテゴリに分類される。
今後の研究・開発への道筋について論じる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:50:05 GMT)
Recent Advances of Multimodal Continual Learning: A Comprehensive Survey [64.8] 本研究は,マルチモーダル連続学習法に関する総合的な調査である。
既存のMMCLメソッドは,正規化ベース,アーキテクチャベース,リプレイベース,プロンプトベースという4つのカテゴリに分類される。
今後の研究・開発への道筋について論じる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:50:05 GMT)
Omni-MATH: A Universal Olympiad Level Mathematic Benchmark For Large Language Models [63.3] Olympiadレベルでの大規模言語モデルの数学的推論を評価するためのベンチマークを提案する。
既存のOlympiad関連のベンチマークとは異なり、我々のデータセットは数学にのみ焦点をあてている。
実験の結果,最も先進的なモデルであるOpenAI o1-miniとOpenAI o1-previewでさえ,高度に難解なオリンピアドレベルの問題に悩まされていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:36:50 GMT)
Omni-MATH: A Universal Olympiad Level Mathematic Benchmark For Large Language Models [63.3] Olympiadレベルでの大規模言語モデルの数学的推論を評価するためのベンチマークを提案する。
既存のOlympiad関連のベンチマークとは異なり、我々のデータセットは数学にのみ焦点をあてている。
実験の結果,最も先進的なモデルであるOpenAI o1-miniとOpenAI o1-previewでさえ,高度に難解なオリンピアドレベルの問題に悩まされていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:36:50 GMT)
MeshGS: Adaptive Mesh-Aligned Gaussian Splatting for High-Quality Rendering [61.6] 本稿では,メッシュ表現を3次元ガウススプラットと統合し,再現された現実世界のシーンの高品質なレンダリングを実現する手法を提案する。
各ガウススプレートとメッシュ表面との距離を, 密接な束縛と緩い束縛の相違点として検討した。
提案手法は,2dB高いPSNRを達成し,メッシュベースのガウス分割法を1.3dBPSNRで上回った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:07:59 GMT)
VOVTrack: Exploring the Potentiality in Videos for Open-Vocabulary Object Tracking [61.6] オープンボキャブラリオブジェクト検出(OVD)とマルチオブジェクトトラッキング(MOT)の複雑さを両立させる。
OVMOT の既存のアプローチは、OVD と MOT の方法論を別個のモジュールとして統合することが多く、主に画像中心のレンズによる問題に焦点を当てている。
VOVTrackは、MOTとビデオ中心トレーニングに関連するオブジェクト状態を統合する新しい手法であり、ビデオオブジェクト追跡の観点からこの問題に対処する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:01:49 GMT)
Low-Dimension-to-High-Dimension Generalization And Its Implications for Length Generalization [61.5] LDHDの一般化は、事前知識を利用して適切な帰納バイアスを与えることなく、一般的には達成不可能であることを示す。
LDHD一般化から長さ一般化への洞察を応用して,CoTの潜在空間の変化に対する効果を説明する。
また,データ形式のような内在的なLDHD一般化とニュアンスの両方を扱うために,位置埋め込み設計の原理を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:18:43 GMT)
Can Graph Learning Improve Planning in LLM-based Agents? [61.5] 言語エージェントにおけるタスクプランニングは、大規模言語モデル(LLM)の開発とともに重要な研究トピックとして浮上している。
本稿では,課題計画のためのグラフ学習に基づく手法について検討する。
我々のグラフ学習への関心は、注意のバイアスと自己回帰的損失が、グラフ上の意思決定を効果的にナビゲートするLLMの能力を妨げているという理論的な発見に起因している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:03:04 GMT)
VLM2Vec: Training Vision-Language Models for Massive Multimodal Embedding Tasks [60.5] 我々は、幅広い下流タスクを扱える普遍的な埋め込みモデルを構築している。
1 MMEB(Massive Multimodal Embedding Benchmark)は、4 つのメタタスク(分類、視覚的質問応答、マルチモーダル検索、視覚的グラウンド)と36 つのデータセット(20 のトレーニングと16 の評価データセットを含む)と、2 の VLM2Vec (Vision-Language Model -> Vector) を含む。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:00:23 GMT)
VLM2Vec: Training Vision-Language Models for Massive Multimodal Embedding Tasks [60.5] 我々は、幅広い下流タスクを処理できる普遍的な埋め込みを構築する可能性を探究する。
1 MMEB(Massive Multimodal Embedding Benchmark)は、4 つのメタタスク(分類、視覚的質問応答、マルチモーダル検索、視覚的グラウンド)と36 つのデータセット(20 のトレーニングと16 の評価データセットを含む)と、2 の VLM2Vec (Vision-Language Model -> Vector) を含む。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:00:23 GMT)
ETHER: Efficient Finetuning of Large-Scale Models with Hyperplane Reflections [59.8] 本稿では,HypErplane Reflectionsによる高効率微調整を行うETHER変換ファミリを提案する。
特に,既存のPEFT法と極めて少ないパラメータで一致または性能を向上するEtheRと緩和ETHER+を導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:41:48 GMT)
Consecutive Batch Model Editing with HooK Layers [59.7] CoachHooKは、シーケンシャルおよびバッチ編集を同時にサポートするモデル編集方法である。
メモリフレンドリで、時間とともにサイズが変化しないいくつかのフック層を格納するために、少量しか必要としない。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:37:13 GMT)
Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own [59.1] 我々は、政策、価値、成功-回帰基盤モデルからのガイダンスとフィードバックを活用するために、RLFP(Reinforcement Learning with Foundation Priors)を提案する。
本フレームワークでは,自動報酬関数を用いてより効率的にエージェントを探索できるファウンデーション誘導型アクター・クリティカル(FAC)アルゴリズムを導入する。
本手法は,実ロボットとシミュレーションの両方において,様々な操作タスクにおいて顕著な性能を実現する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:36:36 GMT)
Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability,Reproducibility, and Practicality [58.9] 本稿では,T2Vモデルのための包括的で標準化されたプロトコルであるText-to-Video Human Evaluation (T2VHE)プロトコルを紹介する。
このプロトコルには、明確に定義されたメトリクス、完全なアノテータトレーニング、効果的な動的評価モジュールが含まれている。
我々は、完全なプロトコルワークフロー、動的評価コンポーネントの詳細、アノテーションインターフェースコードを含む、T2VHEプロトコルのセットアップ全体をオープンソースにします。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:13:40 GMT)
DiMSam: Diffusion Models as Samplers for Task and Motion Planning under Partial Observability [58.8] タスク・アンド・モーション・プランニング(TAMP)アプローチは多段階自律ロボット操作の計画に適している。
本稿では,TAMPシステムを用いた拡散モデルの構築により,これらの制限を克服することを提案する。
古典的TAMP, 生成モデリング, 潜伏埋め込みの組み合わせによって, 多段階制約に基づく推論が可能となることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:31:42 GMT)
PostMark: A Robust Blackbox Watermark for Large Language Models [56.6] モジュール式ポストホックウォーターマーキング手法であるPostMarkを開発した。
PostMarkはロジットアクセスを必要としないため、サードパーティによって実装することができる。
PostMarkは既存のウォーターマーキング手法よりも,攻撃を言い換える方が堅牢であることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:19:55 GMT)
"I Am the One and Only, Your Cyber BFF": Understanding the Impact of GenAI Requires Understanding the Impact of Anthropomorphic AI [56.0] 我々は、人為的AIの社会的影響をマッピングしない限り、生成AIの社会的影響を徹底的にマッピングすることはできないと論じる。
人為的AIシステムは、人間のように知覚されるアウトプットを生成する傾向が強まっている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:57:41 GMT)
WALL-E: World Alignment by Rule Learning Improves World Model-based LLM Agents [55.6] 大規模言語モデル(LLM)による規則の勾配なし学習のためのニューロシンボリックアプローチを提案する。
我々のLLMエージェントWALL-Eはモデル予測制御(MPC)上に構築されている
MinecraftとALFWorldにおけるオープンワールドの課題について、WALL-Eは既存の方法よりも高い成功率を達成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:32:09 GMT)
WALL-E: World Alignment by Rule Learning Improves World Model-based LLM Agents [55.6] 大規模言語モデル(LLM)による規則の勾配なし学習のためのニューロシンボリックアプローチを提案する。
我々のLLMエージェントWALL-Eはモデル予測制御(MPC)上に構築されている
MinecraftとALFWorldにおけるオープンワールドの課題について、WALL-Eは既存の方法よりも高い成功率を達成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:32:09 GMT)
Fast Feedforward 3D Gaussian Splatting Compression [55.1] 3D Gaussian Splatting (FCGS) は、1つのフィードフォワードパスで3DGS表現を高速に圧縮できる最適化フリーモデルである。
FCGSは圧縮比を20倍以上に向上し、高精細度を維持しながら、ほとんどのシーン毎のSOTA最適化手法を上回ります。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:51:20 GMT)
Fast Feedforward 3D Gaussian Splatting Compression [55.1] 3D Gaussian Splatting (FCGS) は、1つのフィードフォワードパスで3DGS表現を高速に圧縮できる最適化フリーモデルである。
FCGSは圧縮比を20倍以上に向上し、高精細度を維持しながら、ほとんどのシーン毎のSOTA最適化手法を上回ります。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:51:20 GMT)
Evaluating the effects of Data Sparsity on the Link-level Bicycling Volume Estimation: A Graph Convolutional Neural Network Approach [54.8] 本稿では,リンクレベルの自転車のボリュームをモデル化するために,グラフ畳み込みネットワークアーキテクチャを利用する最初の研究について述べる。
オーストラリア,メルボルン市全体での年間平均自転車数(AADB)を,Strava Metro の自転車数データを用いて推定した。
以上の結果から,GCNモデルは従来のAADB数予測モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:53:18 GMT)
Hyperparameters in Continual Learning: A Reality Check [53.3] 連続学習(CL)は、可塑性(新しいタスクを学ぶ)と安定性(事前知識を保持する)のトレードオフをバランスしながら、一連のタスクでモデルを訓練することを目的としている。
CLアルゴリズムの従来の評価プロトコルは、与えられたシナリオで最適なハイパーパラメータを選択し、同じシナリオでアルゴリズムを評価する。
このプロトコルには大きな欠点があり、アルゴリズムのCL能力を過大評価し、非現実的なハイパーパラメータチューニングに依存している。
CLアルゴリズムの評価は,予測できないシナリオに対するCL能力の一般化性を評価することに集中すべきである,と我々は主張する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:44:23 GMT)
Stochastic Optimal Control Matching [53.2] 最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。
この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。
実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:39:38 GMT)
MetaUrban: An Embodied AI Simulation Platform for Urban Micromobility [52.1] 最近のロボティクスとエンボディードAIの進歩により、公共の都市空間はもはや人間専用ではない。
公共の都市空間における短距離移動のためのAIによって実現されるマイクロモビリティは、将来の交通システムにおいて重要な要素である。
本稿では,AI駆動型都市マイクロモビリティ研究のための構成シミュレーションプラットフォームであるMetaUrbanを紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:41:17 GMT)
How Unique is Whose Web Browser? The role of demographics in browser fingerprinting among US users [50.7] ブラウザのフィンガープリントは、クッキーを使わずとも、Web上のユーザを識別し、追跡するために利用できる。
この技術と結果として生じるプライバシーリスクは10年以上にわたって研究されてきた。
我々は、さらなる研究を可能にするファースト・オブ・ザ・キンド・データセットを提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:18:06 GMT)
How Unique is Whose Web Browser? The role of demographics in browser fingerprinting among US users [50.7] ブラウザのフィンガープリントは、クッキーを使わずとも、Web上のユーザを識別し、追跡するために利用できる。
この技術と結果として生じるプライバシーリスクは10年以上にわたって研究されてきた。
我々は、さらなる研究を可能にするファースト・オブ・ザ・キンド・データセットを提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:18:06 GMT)
Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimization [50.5] 強化学習(Reinforcement Learning, RL)は、大規模言語モデルを人間の好みと整合させ、複雑なタスクを遂行する能力を向上させる上で重要な役割を担っている。
反応生成過程をマルコフ決定プロセス(MDP)として定式化し,ソフトアクター・クリティック(SAC)フレームワークを用いて,言語モデルによって直接パラメータ化されたQ関数を最適化する,直接Q関数最適化(DQO)を提案する。
GSM8KとMATHという2つの数学問題解決データセットの実験結果から、DQOは従来の手法よりも優れており、言語モデルを整合させるための有望なオフライン強化学習手法として確立されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:29:20 GMT)
CryoFM: A Flow-based Foundation Model for Cryo-EM Densities [50.3] 生成モデルとして設計された基礎モデルであるCryoFMについて,高品質密度マップの分布を学習する。
フローマッチングに基づいて構築されたCryoFMは、生物分子密度マップの以前の分布を正確に捉えるために訓練されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:53:58 GMT)
Improved Sample Complexity for Global Convergence of Actor-Critic Algorithms [49.2] 我々は,O(epsilon-3)$のサンプル複雑性を大幅に改善したアクター・クリティック・アルゴリズムのグローバル収束を確立した。
我々の発見は、一定のステップサイズに依存する多くのアルゴリズムに対する理論的支援を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:46:29 GMT)
Studying and Benchmarking Large Language Models For Log Level Suggestion [49.2] 大規模言語モデル(LLM)は、様々な領域で研究の焦点となっている。
本稿では,12個のオープンソースLCMのログレベル提案における性能に及ぼす特性と学習パラダイムの影響について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:52:17 GMT)
Language-Model-Assisted Bi-Level Programming for Reward Learning from Internet Videos [48.2] 我々は、強化学習エージェントがインターネットビデオから報酬を学べるように、言語モデル支援のバイレベルプログラミングフレームワークを導入する。
このフレームワークは、視覚言語モデル(VLM)が学習者の振る舞いをエキスパートビデオと比較することでフィードバックを提供する上位レベルと、このフィードバックを報酬更新に変換する大規模言語モデル(LLM)の下位レベルである。
そこで本研究では,YouTubeビデオから報酬を学習する手法を検証するとともに,提案手法が生物エージェントのエキスパートビデオから効率的に報酬をデザインできることを示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:31:39 GMT)
Learning Interaction-aware 3D Gaussian Splatting for One-shot Hand Avatars [47.6] 本稿では,3次元ガウススプラッティング(GS)と単一画像入力と手を相互作用するアニマタブルアバターを提案する。
提案手法は大規模なInterHand2.6Mデータセットの広範な実験により検証される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:14:51 GMT)
Advancing Spiking Neural Networks for Sequential Modeling with Central Pattern Generators [47.4] スパイキングニューラルネットワーク(SNN)は、人工ニューラルネットワークを開発するための有望なアプローチである。
SNNをテキスト分類や時系列予測といったシーケンシャルなタスクに適用することは、効果的でハードウェアフレンドリーなスパイク形式の位置符号化戦略を作成するという課題によって妨げられている。
CPG-PEと呼ばれる新しいSNNのためのPE手法を提案する。我々は、一般的に使われているsinusoidal PEが、数学的に特定のCPGの膜電位ダイナミクスの特定の解であることを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:03:45 GMT)
Generalized Quantum Stein's Lemma and Second Law of Quantum Resource Theories [47.0] 量子情報理論の基本的な問題は、量子情報処理のためのリソースの変換性を単一の関数で特徴づけるために、類似の第2法則を定式化できるかどうかである。
2008年、有望な定式化が提案され、仮説テストの量子バージョンの変種における最適性能とリソース変換可能性のリンクが提案された。
2023年、この補題の元々の証明に論理的ギャップが発見され、そのような第二法則の定式化の可能性に疑問が投げかけられた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:35:45 GMT)
Generalized Quantum Stein's Lemma and Second Law of Quantum Resource Theories [47.0] 量子情報理論の基本的な問題は、量子情報処理のためのリソースの変換性を単一の関数で特徴づけるために、類似の第2法則を定式化できるかどうかである。
2008年、有望な定式化が提案され、仮説テストの量子バージョンの変種における最適性能とリソース変換可能性のリンクが提案された。
2023年、この補題の元々の証明に論理的ギャップが発見され、そのような第二法則の定式化の可能性に疑問が投げかけられた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:35:45 GMT)
Can LLM Graph Reasoning Generalize beyond Pattern Memorization? [46.9] 我々は,大規模言語モデル (LLM) が,合成学習データにおける意味的,数値的,構造的,推論パターンを超えうるか否かを評価し,実世界のグラフベースタスクにおける有用性を向上させる。
トレーニング後のアライメントが現実世界のタスクに最も有望であるのに対して、LLMグラフの推論をパターンを超えて行うことは、依然としてオープンな研究課題である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:42:01 GMT)
Controllable Safety Alignment: Inference-Time Adaptation to Diverse Safety Requirements [46.8] 大規模言語モデル(LLM)の安全性アライメントに関する現在のパラダイムは、一大のアプローチに従っている。
我々は,モデルの再トレーニングを伴わず,多様な安全要件に適応するフレームワークとして,制御可能な安全アライメント(CoSA)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:38:01 GMT)
Adapting Large Language Models for Document-Level Machine Translation [46.4] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを大幅に進歩させた。
近年の研究では、中程度のLLMはタスク固有の微調整後、より大きなLLMよりも優れていることが示されている。
本研究では,特定の言語対に対する文書レベルの機械翻訳(DocMT)にLLMを適用することに焦点を当てた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:48:15 GMT)
Black Boxes and Looking Glasses: Multilevel Symmetries, Reflection Planes, and Convex Optimization in Deep Networks [46.3] 絶対値アクティベーションと任意の入力次元を持つディープニューラルネットワーク(DNN)のトレーニングは,等価凸ラッソ問題として定式化可能であることを示す。
この定式化は、ニューラルネットワークの対称性をコードする幾何学的構造を明らかにする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:40:20 GMT)
Black Boxes and Looking Glasses: Multilevel Symmetries, Reflection Planes, and Convex Optimization in Deep Networks [46.3] 絶対値アクティベーションと任意の入力次元を持つディープニューラルネットワーク(DNN)のトレーニングは,等価凸ラッソ問題として定式化可能であることを示す。
この定式化は、ニューラルネットワークの対称性をコードする幾何学的構造を明らかにする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:40:20 GMT)
On the impact of key design aspects in simulated Hybrid Quantum Neural Networks for Earth Observation [46.3] 本研究は、ハイブリッド量子モデルのトレーニングにおいて、異なる量子ライブラリがどのように振る舞うかを研究する。
また,地球観測におけるハイブリッド量子アテンションモデルの有用性についても検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:04:29 GMT)
Towards Generating Executable Metamorphic Relations Using Large Language Models [46.3] 大規模言語モデル(LLM)を用いた要件から実行可能なMRを自動的に抽出する手法を提案する。
提案手法の有効性を評価するため,シーメンス・インダストリー・ソフトウェアと共同で質問紙調査を行った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:07:22 GMT)
Dynamic Multimodal Evaluation with Flexible Complexity by Vision-Language Bootstrapping [45.6] LVLM(Large Vision-Language Models)は、マルチモーダルタスクにまたがる顕著な機能を示す。
VLB(Vision-Language Bootstrapping)と呼ばれる動的マルチモーダル評価プロトコルを導入する。
VLBは、データ汚染の低減と柔軟性のある複雑さを伴うLVLMの堅牢で包括的な評価を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:33:51 GMT)
LLM Task Interference: An Initial Study on the Impact of Task-Switch in Conversational History [45.4] 本研究では,会話履歴におけるタスクスイッチによる会話型大言語モデル(LLM)の脆弱性とタスクの干渉について検討する。
実験の結果,タスクスイッチの多くで性能が著しく低下することが判明した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:05:14 GMT)
Guided Decoding for Robot On-line Motion Generation and Adaption [45.0] 本稿では,ロボットアームに高い自由度を持つ新たな動作生成手法を提案する。
本研究では,実演として使用する擬似軌道の大規模データセットに基づいて,条件付き変分オートエンコーダに基づくトランスフォーマーアーキテクチャを訓練する。
本モデルでは, 異なる初期点と目標点からの運動をうまく生成し, 異なるロボットプラットフォームを横断する複雑なタスクをナビゲートする軌道を生成可能であることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:57:17 GMT)
ALVIN: Active Learning Via INterpolation [44.4] アクティブラーニングVia Interpolation (ALVIN) は、表現不足群と表現不足群の例間のクラス内一般化を行う。
ALVINは、ショートカットの影響に反する表現空間の領域にモデルを公開する情報的な例を特定する。
感情分析、自然言語推論、パラフレーズ検出を含む6つのデータセットの実験結果は、ALVINが最先端のアクティブな学習方法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:44:39 GMT)
VERIFIED: A Video Corpus Moment Retrieval Benchmark for Fine-Grained Video Understanding [44.4] 既存のビデオコーパスモーメント検索(VCMR)は、粗大な理解に限られている。
本稿では,コーパスからベストマッチングモーメントをローカライズするために,より難易度の高いVCMRベンチマークを提案する。
VERIFIEDを用いて、Charades-FIG、DiDeMo-FIG、ActivityNet-FIGを含むより難易度の高いVCMRベンチマークを構築する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:42:36 GMT)
Safety Layers in Aligned Large Language Models: The Key to LLM Security [43.8] 内部パラメータは、悪意のないバックドアや通常のデータで微調整された場合、セキュリティの劣化に対して脆弱である。
モデルの中心にある,悪意のあるクエリと通常のクエリを区別する上で重要な,連続的なレイヤの小さなセットを同定する。
そこで本稿では,セキュリティの劣化に対処するために,安全性層の勾配を補正する新しいファインチューニング手法であるSPPFTを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:06:35 GMT)
Safety Layers in Aligned Large Language Models: The Key to LLM Security [43.8] 内部パラメータは、悪意のないバックドアや通常のデータで微調整された場合、セキュリティの劣化に対して脆弱である。
モデルの中心にある,悪意のあるクエリと通常のクエリを区別する上で重要な,連続的なレイヤの小さなセットを同定する。
そこで本稿では,セキュリティの劣化に対処するために,安全性層の勾配を補正する新しいファインチューニング手法であるSPPFTを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:06:35 GMT)
SPARK: Multi-Vision Sensor Perception and Reasoning Benchmark for Large-scale Vision-Language Models [43.8] 本稿では,SPARKと呼ばれるマルチビジョンセンサ知覚と推論ベンチマークの構築を目的とする。
我々は6,248個の視覚言語検定サンプルを作成し,多視点感覚知覚と多視点感覚推論を物理センサ知識の熟練度に基づいて検討した。
その結果、ほとんどのモデルでは、様々な範囲で多視点感覚理論の欠陥が見られた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:25:42 GMT)
DAT: Dialogue-Aware Transformer with Modality-Group Fusion for Human Engagement Estimation [42.9] エンゲージメント推定は、人間の社会的行動を理解する上で重要な役割を果たす。
本稿では,音声視覚入力のみに依存し,言語に依存しない対話対応トランスフォーマフレームワークを提案する。
提案手法では, NoXi ベーステストセットの平均 CCC は 0.76 であり, NoXi ベース, NoXi-Add および MPIIGI テストセットの平均 CCC は 0.64 である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:43:45 GMT)
AttnGCG: Enhancing Jailbreaking Attacks on LLMs with Attention Manipulation [42.8] 本稿では,トランスフォーマーを用いた大規模言語モデル(LLM)のジェイルブレイク攻撃に対する脆弱性について検討する。
本稿では,ジェイルブレイクを容易にするために,モデルの注意点を操作する拡張手法を提案する。
我々の戦略はまた、目に見えない有害な目標とブラックボックスのLSMの両方に対して堅牢な攻撃伝達性を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:55:09 GMT)
Improving Retrieval-Augmented Generation in Medicine with Iterative Follow-up Questions [42.7] i-MedRAGは、過去の情報検索の試みに基づいてフォローアップクエリを反復的に要求するシステムである。
ゼロショットのi-MedRAGは、GPT-3.5上で既存のプロンプトエンジニアリングと微調整の方法をすべて上回ります。
i-MedRAGは、順応的にフォローアップクエリを問い合わせて推論チェーンを形成し、医学的な質問の詳細な分析を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:00:48 GMT)
Task-optimal data-driven surrogate models for eNMPC via differentiable simulation and optimization [42.7] 特定の制御タスクにおいて最適な性能を示すために,クープマンシュロゲートモデルのエンドツーエンド学習法を提案する。
我々は,政策最適化を支援するために,力学シミュレーションモデルに基づく環境の潜在的な微分可能性を利用する訓練アルゴリズムを用いる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:34:06 GMT)
Aria: An Open Multimodal Native Mixture-of-Experts Model [42.4] Ariaはオープンなマルチモーダルネイティブモデルであり、様々なマルチモーダル、言語、コーディングタスクで最高のパフォーマンスを発揮する。
Pixtral-12BとLlama3.2-11Bを上回り、様々なマルチモーダルタスクにおける最高のプロプライエタリモデルと競合する。
私たちは、Ariaの実際のアプリケーションへの導入と適応を容易にするパイプラインとともに、モデルの重みをオープンソースにしています。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:33:26 GMT)
Aria: An Open Multimodal Native Mixture-of-Experts Model [42.4] Ariaはオープンなマルチモーダルネイティブモデルであり、様々なマルチモーダル、言語、コーディングタスクで最高のパフォーマンスを発揮する。
Pixtral-12BとLlama3.2-11Bを上回り、様々なマルチモーダルタスクにおける最高のプロプライエタリモデルと競合する。
私たちは、Ariaの実際のアプリケーションへの導入と適応を容易にするパイプラインとともに、モデルの重みをオープンソースにしています。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:33:26 GMT)
Convolutional Neural Network Design and Evaluation for Real-Time Multivariate Time Series Fault Detection in Spacecraft Attitude Sensors [41.9] 本稿では,ドローンのような宇宙船の加速度計および慣性測定ユニット内のスタンプ値を検出するための新しい手法を提案する。
マルチチャネル畳み込みニューラルネットワーク(CNN)は、マルチターゲット分類を実行し、センサ内の障害を独立に検出するために使用される。
ネットワークの異常を効果的に検出し,システムレベルでの回復動作をトリガーする統合手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:36:38 GMT)
A foundation model for generalizable disease diagnosis in chest X-ray images [40.9] CXRBaseは,非ラベリングなCXR画像から多目的表現を学習するための基礎モデルである。
CXRBaseは1.04百万の未ラベルのCXRイメージのデータセットでトレーニングされている。
ラベル付きデータで微調整され、疾患検出の性能を高める。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:41:27 GMT)
Teaching LLMs to Abstain across Languages via Multilingual Feedback [40.8] 多言語フィードバックは,多様な言語,文化,コミュニティ間の知識ギャップを識別する上で有効であることを示す。
大規模な実験により、多言語フィードバックアプローチは、様々な強いベースラインよりも優れていることが示された。
さらに分析したところ、多言語フィードバックは多言語話者に役立てるための効果的かつ公平な回避戦略であることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:10:04 GMT)
Transformers Provably Solve Parity Efficiently with Chain of Thought [40.8] この研究は、複雑な問題を解決するためのトレーニングトランスの最初の理論的解析を提供する。
我々は、基本的な$k$-parity問題を解くために、1層トランスを訓練することを検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:55:17 GMT)
Superpipeline: A Universal Approach for Reducing GPU Memory Usage in Large Models [40.4] 本稿では,制約ハードウェア上での大規模AIモデルの実行を最適化するフレームワークであるSuperpipelineを紹介する。
Superpipelineは、モデル精度と許容する処理速度を維持しながら、実験でGPUメモリ使用量を最大60%削減します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:17:05 GMT)
Are Images Indistinguishable to Humans Also Indistinguishable to Classifiers? [39.3] ニューラルネットワークベースの分類器の観点からは、高度な拡散モデルでさえもこの目標には程遠いことが示される。
本手法は,生成したデータの特定の特徴を解析することにより,拡散モデルの診断ツールとして自然に機能する。
モデルオートファジー障害に光を当て、生成されたデータの使用に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:11:35 GMT)
Tetrahedron Splatting for 3D Generation [39.2] Tetrahedron Splatting (TeT-Splatting) は最適化時の容易な収束、正確なメッシュ抽出、リアルタイムレンダリングをサポートする。
メッシュ抽出なしで表現をトレーニングできるため、最適化プロセスの収束が容易になります。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:52:16 GMT)
SOAK: Same/Other/All K-fold cross-validation for estimating similarity of patterns in data subsets [39.1] 私たちは、両方の質問に答えるために使える新しい方法であるSOAK、同じ/他の/すべてのK-foldクロスバリデーションを提案します。
SOAKは、データの異なるサブセットに基づいてトレーニングされたモデルを体系的に比較し、固定されたテストサブセットの予測に使用し、データサブセットにおける学習可能/予測可能なパターンの類似性を推定します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:10:39 GMT)
Towards Understanding Clean Generalization and Robust Overfitting in Adversarial Training [38.4] 対人訓練におけるtextitClean Generalization と Robust Overfitting 現象について検討した。
学習プロセス中に3段階の位相遷移が起こり,ネットワークは頑健な記憶体制に収束することを示す。
また,実画像認識実験による理論的解析を実証的に検証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:21:59 GMT)
Adversarial Training Can Provably Improve Robustness: Theoretical Analysis of Feature Learning Process Under Structured Data [38.4] 本稿では, 特徴学習理論の観点から, 対角的例と対角的学習アルゴリズムの理論的理解を提供する。
本手法は,頑健な特徴学習を効果的に強化し,非ロバストな特徴学習を抑えることができることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:59:49 GMT)
BrainIB: Interpretable Brain Network-based Psychiatric Diagnosis with Graph Information Bottleneck [38.3] 機能的磁気共鳴画像(fMRI)解析のための新しいグラフニューラルネットワーク(GNN)フレームワークBrainIBを提案する。
BrainIBは、脳内の最も情報に富むエッジ(つまり、部分グラフ)を識別し、目に見えないデータにうまく一般化することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:55:23 GMT)
From the Least to the Most: Building a Plug-and-Play Visual Reasoner via Data Synthesis [38.3] 視覚言語モデル(VLM)における多段階推論について検討する。
まず、質問のステップをサブクエストにインターリーブする、最小から最短の視覚的推論パラダイムを導入する。
画像に対する質問や多段階の推論経路を自動生成する新しいデータ合成手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:41:23 GMT)
ShortGPT: Layers in Large Language Models are More Redundant Than You Expect [38.1] LLM(Large Language Models)の多くの層は高い類似性を示し、いくつかの層はネットワーク機能において無視できる役割を担っている。
レイヤ除去という,冗長なレイヤを直接削除する,簡単なプルーニング手法を提案する。
実験により,我々はShortGPT(ショートGPT)と呼ぶ手法を,モデルプルーニングにおける従来のSOTA(State-of-the-art)手法よりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:43:32 GMT)
Observing the Southern US Culture of Honor Using Large-Scale Social Media Analysis [37.6] 我々は、米国南部人は個人的に反撃することで個人攻撃に報復する可能性が高いという仮説を検証した。
我々はOpenAIのGPT-3.5 APIを活用し、インターネット利用者の位置情報と、ユーザーが互いに侮辱しているかどうかを自動的に検出する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:51:27 GMT)
SmartPretrain: Model-Agnostic and Dataset-Agnostic Representation Learning for Motion Prediction [37.5] 動作予測のための汎用的でスケーラブルなフレームワークであるSmartPretrainを提案する。
提案手法は対照的かつ再構成的なSSLを統合し,生成的パラダイムと識別的パラダイムの両方の長所を活用する。
SmartPretrainは、データセット、データ分割、主要なメトリクスにわたる最先端の予測モデルのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:52:26 GMT)
When Graph meets Multimodal: Benchmarking on Multimodal Attributed Graphs Learning [36.7] マルチモーダル属性グラフ(MAG)は、様々な現実世界のシナリオで一般的であり、一般的に2種類の知識を含んでいる。
プレトレーニング言語/視覚モデル(PLM/PVM)とグラフニューラルネットワーク(GNN)の最近の進歩は、MAGの効果的な学習を促進する。
本稿では、MAGのベンチマークデータセットの総合的かつ多種多様なコレクションであるMultimodal Attribute Graph Benchmark(MAGB)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:24:57 GMT)
Calibrated Cache Model for Few-Shot Vision-Language Model Adaptation [36.5] 類似性は、ラベルのない画像を使用することで画像と画像の類似性を洗練する。
重みは、トレーニングサンプル間の関係を適切にモデル化するために、精度行列を重み関数に導入する。
GPの複雑さを低減するため,グループベースの学習戦略を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:12:30 GMT)
ACER: Automatic Language Model Context Extension via Retrieval [36.4] 現在のオープンウェイト・ジェネリリストのロングコンテキストモデルは、実用的ロングコンテキスト処理タスクにはまだ欠けている。
短文LMを用いて,この処理を模倣するテキスト自動データ合成パイプラインを構築した。
短文LMは、タスク固有の長文機能を得るために、これらの自己生成データを使ってさらに調整される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:57:06 GMT)
DA-Code: Agent Data Science Code Generation Benchmark for Large Language Models [36.3] まず、DA-Code内のタスクは本質的に困難で、従来のコード生成タスクとは分離されています。
次に、DA-Codeの例は、すべて実データと多種多様なデータに基づいており、幅広い複雑なデータラングリングと分析タスクをカバーしている。
第三に、これらの課題を解決するためには、複雑なデータサイエンスプログラミング言語を使用し、複雑なデータ処理を実行し、答えを導出する必要がある。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:53:05 GMT)
DA-Code: Agent Data Science Code Generation Benchmark for Large Language Models [36.3] まず、DA-Code内のタスクは本質的に困難で、従来のコード生成タスクとは分離されています。
次に、DA-Codeの例は、すべて実データと多種多様なデータに基づいており、幅広い複雑なデータラングリングと分析タスクをカバーしている。
第三に、これらの課題を解決するためには、複雑なデータサイエンスプログラミング言語を使用し、複雑なデータ処理を実行し、答えを導出する必要がある。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:53:05 GMT)
StraGo: Harnessing Strategic Guidance for Prompt Optimization [36.0] StraGoは、成功したケースと失敗したケースの両方からの洞察を活用することで、迅速な漂流を軽減するために設計された、新しいアプローチである。
具体的な行動可能な戦略を定式化するために、コンテキスト内学習を統合するハウツード手法を採用している。
推論、自然言語理解、ドメイン固有の知識、産業アプリケーションなど、さまざまなタスクで実施された実験は、StraGoの優れたパフォーマンスを実証している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:55:42 GMT)
An Efficient Contrastive Unimodal Pretraining Method for EHR Time Series Data [35.9] 本稿では,長期臨床経過データに適した比較事前学習法を提案する。
本モデルでは, 臨床医が患者の症状についてより深い知見を得られるように, 欠損測定をインプットする能力を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:05:25 GMT)
Federated Instruction Tuning of LLMs with Domain Coverage Augmentation [35.5] Federated Domain-specific Instruction Tuning (FedDIT)は、クロスクライアントなプライベートデータとサーバサイドの公開データを使って、命令拡張を行う。
我々は,欲求のあるクライアントセンターの選択と検索に基づく拡張を通じて,ドメインカバレッジを最適化するFedDCAを提案する。
また,多量の公開データを用いたメモリ抽出攻撃に対するプライバシ保護についても検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:19:57 GMT)
Federated Instruction Tuning of LLMs with Domain Coverage Augmentation [35.5] Federated Domain-specific Instruction Tuning (FedDIT)は、クロスクライアントなプライベートデータとサーバサイドの公開データを使って、命令拡張を行う。
我々は,欲求のあるクライアントセンターの選択と検索に基づく拡張を通じて,ドメインカバレッジを最適化するFedDCAを提案する。
また,多量の公開データを用いたメモリ抽出攻撃に対するプライバシ保護についても検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:19:57 GMT)
Towards Synergistic, Generalized, and Efficient Dual-System for Robotic Manipulation [35.4] RoboDualは、ジェネラリストとスペシャリストの双方の利点を補う相乗的双対システムである。
拡散変圧器をベースとした多段アクションロールアウトのためのスペシャリストが考案された。
CALVINが26.7%向上し、CALVINが12%向上した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:38:13 GMT)
Towards Synergistic, Generalized, and Efficient Dual-System for Robotic Manipulation [35.4] RoboDualは、ジェネラリストとスペシャリストの双方の利点を補う相乗的双対システムである。
拡散変圧器をベースとした多段アクションロールアウトのためのスペシャリストが考案された。
CALVINが26.7%向上し、CALVINが12%向上した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:38:13 GMT)
Language Imbalance Driven Rewarding for Multilingual Self-improving [35.2] 大規模言語モデル(LLM)は多くのタスクで最先端のパフォーマンスを達成した。
この不均衡は、より広範なアプリケーションを制限する一方で、言語間の自然な選好ランキングを生成する。
我々は、支配的言語と非支配的言語との間の固有の不均衡を報酬信号として活用する、$textitLanguage Im Balance Driven Rewarding$を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:32:05 GMT)
Test-Time Intensity Consistency Adaptation for Shadow Detection [35.0] TICAは、テスト時間適応時の光強度情報を利用して、影検出精度を高める新しいフレームワークである。
基本的なエンコーダ・デコーダモデルは、最初はシャドー検出のためのラベル付きデータセットでトレーニングされる。
テストフェーズでは、一貫した強度予測を行うことで、各テストサンプルに対してネットワークを調整する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:29:51 GMT)
Test-Time Intensity Consistency Adaptation for Shadow Detection [35.0] TICAは、テスト時間適応時の光強度情報を利用して、影検出精度を高める新しいフレームワークである。
基本的なエンコーダ・デコーダモデルは、最初はシャドー検出のためのラベル付きデータセットでトレーニングされる。
テストフェーズでは、一貫した強度予測を行うことで、各テストサンプルに対してネットワークを調整する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:29:51 GMT)
A Systematic Assessment of OpenAI o1-Preview for Higher Order Thinking in Education [34.7] 本研究は,14次元にわたる高次認知タスクを行うOpenAI o1-previewの能力を評価する。
我々は,エニス=ヴァイア臨界思考評価テストや生物システム思考テストのような検証済みの機器を用いて,o1-previewのパフォーマンスと人的パフォーマンスを比較した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:30:16 GMT)
Benchmarking Japanese Speech Recognition on ASR-LLM Setups with Multi-Pass Augmented Generative Error Correction [34.3] 自動音声認識(ASR)のための生成誤り訂正(GER)は、ASRの誤りに対処するための意味的および音声学的改善を提供することを目的としている。
本研究では,LLMをベースとしたGERが日本語処理能力の強化と拡張を実現し,0.9-2.6kテキスト発声による日本語ASRのGERベンチマークを初めて提示する。
また、入力側で複数のシステム仮説を統合し、出力側で複数のLSMを補正し、それらをマージすることで、新しいマルチパス拡張生成誤差補正(MPA GER)を導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:01:42 GMT)
SPO: Multi-Dimensional Preference Sequential Alignment With Implicit Reward Modeling [34.3] 本研究では,人間の好みに合わせて,大規模言語モデルを逐次微調整する手法を提案する。
理論的には閉形式最適SPOポリシーと損失関数を導出する。
異なる大きさのLLMと複数の評価データセットの実証結果から、SPOはLLMを人間の嗜好の多次元にわたって整列させることに成功した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:18:30 GMT)
Data Processing for the OpenGPT-X Model Family [32.8] 本稿では,OpenGPT-Xプロジェクトで開発されたデータ準備パイプラインの概要について述べる。
プロジェクトの目的は、オープンで高性能な多言語大言語モデル(LLM)を作ることである。
データ選択と要件定義からモデルトレーニングの最終データセットの準備まで、すべてのデータ処理手順を説明します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:34:24 GMT)
Active Inverse Learning in Stackelberg Trajectory Games [32.7] リーダーと追従者の間のスタックルバーグゲームにおける逆学習問題を定式化する。
本稿では,有限個の候補のうちどの仮説がフォロワーの目的関数を最もよく記述しているかを推定する,リーダーの能動的逆学習法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:28:58 GMT)
The Same But Different: Structural Similarities and Differences in Multilingual Language Modeling [32.6] 英語と中国語の多言語モデルと単言語モデルを用いて,2つのタスクに関わる内部回路を解析する。
モデルが同じ回路を用いて同じ構文過程を処理するという証拠は,その発生した言語とは無関係に発見される。
いくつかの言語にのみ存在する言語処理を扱うために,多言語モデルでは言語固有のコンポーネントが使用される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:57:55 GMT)
PoisonBench: Assessing Large Language Model Vulnerability to Data Poisoning [32.5] 我々は、好み学習中のデータ中毒に対する大規模言語モデルの感受性を評価するためのベンチマークであるPoisonBenchを紹介する。
データ中毒攻撃は、隠れた悪意のあるコンテンツやバイアスを含むために、大きな言語モデルレスポンスを操作することができる。
8つの現実的なシナリオに2つの異なる攻撃タイプをデプロイし、21の広く使用されているモデルを評価します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:50:50 GMT)
Training-Free Activation Sparsity in Large Language Models [32.4] アクティベーションのスパーシリティは、大きな言語モデルで実用的な推論スピードアップを可能にする。
既存の手法は普及を妨げる限界に直面している。
本稿では,モデル全体の隠れ状態に対して,等級に基づくアクティベーション間隔を適用したトレーニング不要なTEALについて述べる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:02:15 GMT)
Why pre-training is beneficial for downstream classification tasks? [32.3] 本稿では,ゲーム理論の新たな視点から,事前学習が下流作業に与える影響を定量的かつ明示的に説明することを提案する。
具体的には,事前学習モデルにより符号化された知識を抽出し,定量化する。
我々は、下流タスクの推測のために、少数の事前訓練されたモデルの知識しか保存されていないことを発見した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:13:16 GMT)
DeLLMa: Decision Making Under Uncertainty with Large Language Models [31.8] DeLLMaは不確実な環境での意思決定の精度を高めるために設計されたフレームワークである。
DeLLMaは主要な言語モデルの意思決定性能を継続的に向上し、競合する手法に比べて最大40%の精度向上を達成できることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:43:48 GMT)
Logic Error Localization in Student Programming Assignments Using Pseudocode and Graph Neural Networks [31.6] そこで我々は,学生プログラミングの課題における論理誤差を線形レベルでローカライズするシステムを開発した。
グラフニューラルネットワークを用いて、論理エラーの局所化と修正を提案する。
実験結果は有望であり、上位10行の論理誤差に対して99.2%の局所化精度を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:46:24 GMT)
BA-Net: Bridge Attention in Deep Neural Networks [31.0] ブリッジアテンションは、異なる畳み込み層間のより効率的な統合と情報フローを促進するように設計されている。
本研究は,適応選択演算子を導入することにより,元のブリッジアテンションモデル(BAv1)を拡張した。
BAv2はImageNet分類タスクで大幅なパフォーマンス改善を実現している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:35:52 GMT)
BA-Net: Bridge Attention in Deep Neural Networks [31.0] ブリッジアテンションは、異なる畳み込み層間のより効率的な統合と情報フローを促進するように設計されている。
本研究は,適応選択演算子を導入することにより,元のブリッジアテンションモデル(BAv1)を拡張した。
BAv2はImageNet分類タスクで大幅なパフォーマンス改善を実現している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:35:52 GMT)
CASA: Class-Agnostic Shared Attributes in Vision-Language Models for Efficient Incremental Object Detection [30.5] 本稿では,視覚言語基礎モデルの属性をインクリメンタルオブジェクト検出に活用する手法を提案する。
本手法は,クラス非依存の共有属性ベース(CASA)を構築し,インクリメンタルクラス間の共通意味情報をキャプチャする。
提案手法はパラメータ効率の微調整によりパラメータ記憶に0.7%しか加えず,拡張性と適応性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:54:41 GMT)
CASA: Class-Agnostic Shared Attributes in Vision-Language Models for Efficient Incremental Object Detection [30.5] 本稿では,視覚言語基礎モデルの属性をインクリメンタルオブジェクト検出に活用する手法を提案する。
本手法は,クラス非依存の共有属性ベース(CASA)を構築し,インクリメンタルクラス間の共通意味情報をキャプチャする。
提案手法はパラメータ効率の微調整によりパラメータ記憶に0.7%しか加えず,拡張性と適応性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:54:41 GMT)
Diverse Deep Feature Ensemble Learning for Omni-Domain Generalized Person Re-identification [30.2] Person ReIDメソッドは、異なるデータセット間でトレーニングとテストを行うと、パフォーマンスが大幅に低下する。
本研究は,ドメイン一般化手法が単一データセットのベンチマークにおいて,単一ドメイン管理手法を著しく過小評価していることを明らかにする。
本稿では,自己アンサンブルによる深い特徴の多様性を生かし,ODG-ReIDを実現する方法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:27:11 GMT)
Aligned Divergent Pathways for Omni-Domain Generalized Person Re-Identification [30.2] Person ReIDは、完全に監督され、ドメインが一般化された Person R e ID において著しく進歩している。
本稿では,Omni-Domain Generalization Person ReID(ODG-ReID)を提案する。
提案手法は,ベースアーキテクチャを元のバックボーンのテールをコピーしてマルチブランチ構造に変換する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:36:11 GMT)
A Unified Deep Semantic Expansion Framework for Domain-Generalized Person Re-identification [30.2] 本研究は、より実用的なドメイン一般化人再識別(DG-ReID)問題に焦点を当てる。
DG-ReIDにおける有望な研究方向の1つは、暗黙的な深い意味的特徴拡張の利用である。
我々は,DeXなどの暗黙的な深い意味的特徴拡張手法が,大規模な評価ベンチマークにおいてその潜在能力を最大限に発揮できないことを示す。
我々は暗黙的・明示的な意味的特徴拡張技術を統合する新しいフレームワークであるUnified Deep Semantic Expansionを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:15:15 GMT)
Interdependency Matters: Graph Alignment for Multivariate Time Series Anomaly Detection [30.1] グラフアライメント(GA)問題として異常検出を再定義するMADGA(MTS Anomaly Detection via Graph Alignment)を提案する。
GAアプローチでは、ノードとエッジの両方を明示的にアライメントし、ノードはワッサーシュタイン距離、エッジはグロモフ=ワッサーシュタイン距離を用いる。
多様な実世界のデータセットの実験は、MADGAの有効性を検証し、異常を検出し、相互依存を区別する能力を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:54:08 GMT)
Exploring the Role of Reasoning Structures for Constructing Proofs in Multi-Step Natural Language Reasoning with Large Language Models [30.1] 本稿では,現在最先端のジェネラリスト LLM がいくつかの例でこれらの構造を活用でき,テキスト・コンテクスト・ラーニングによる証明構造をより良く構築できるかどうかという,焦点を絞った研究に焦点をあてる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:45:50 GMT)
SceneCraft: Layout-Guided 3D Scene Generation [29.7] シーンクラフト(SceneCraft)は、テキスト記述や空間的レイアウトの好みに則った、室内の詳細なシーンを生成する新しい方法である。
本手法は,多様なテクスチャ,一貫した幾何,現実的な視覚的品質を有する複雑な屋内シーン生成において,既存のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:59:58 GMT)
Forgetting, Ignorance or Myopia: Revisiting Key Challenges in Online Continual Learning [29.7] 高速なデータストリーム環境では、遅いモデルに対応するためにデータが停止しない。
モデルの無知: OCLのシングルパスの性質は、制約付きトレーニング時間内で効果的な機能を学ぶためにモデルに挑戦する。
モデルのミオピア:OCLの局所的な学習特性は、過度に単純化されたタスク固有の機能を採用するモデルに導かれる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:57:05 GMT)
Forgetting, Ignorance or Myopia: Revisiting Key Challenges in Online Continual Learning [29.7] 高速なデータストリーム環境では、遅いモデルに対応するためにデータが停止しない。
モデルの無知: OCLのシングルパスの性質は、制約付きトレーニング時間内で効果的な機能を学ぶためにモデルに挑戦する。
モデルのミオピア:OCLの局所的な学習特性は、過度に単純化されたタスク固有の機能を採用するモデルに導かれる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:57:05 GMT)
Data-Scarce Identification of Game Dynamics via Sum-of-Squares Optimization [29.6] マルチプレイヤーの正規形式ゲームにおけるゲームダイナミクスを識別するためのサイドインフォーム支援回帰(SIAR)フレームワークを提案する。
SIARは、SOS(sum-of-squares)最適化を用いて解決され、その結果、システムの真の力学に確実に収束する近似の階層となる。
SIARフレームワークは,未知のシステムがカオスであっても,通常のゲーム,広く知られているゲームダイナミクスのファミリー,強力なベンチマークの範囲で,プレーヤの挙動を正確に予測する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:53:16 GMT)
Generation with Dynamic Vocabulary [29.3] その結果、マルチトークンを生成する能力は、生成品質と効率の両方をアトミックに改善することがわかった。
動的語彙はプラグイン・アンド・プレイ方式で展開できるため、様々なダウンストリームアプリケーションには魅力的である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:19:15 GMT)
ZipVL: Efficient Large Vision-Language Models with Dynamic Token Sparsification and KV Cache Compression [29.2] 大型視覚言語モデル(LVLM)のための効率的な推論フレームワークZipVLを提案する。
ZipVLは重要なトークンの動的比割り当て戦略によって計算とメモリのボトルネックを解消する。
実験によると、ZipVLはプリフィルフェーズを2.6$times$で加速し、GPUメモリ使用量を50.0%削減できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:24:21 GMT)
SocialGaze: Improving the Integration of Human Social Norms in Large Language Models [28.9] 社会的受容を判断する作業を紹介する。
社会的受容は、社会的状況における人々の行動の受容性を判断し、合理化するモデルを必要とする。
大規模言語モデルによる社会的受容に対する理解は、しばしば人間の合意と不一致である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:35:58 GMT)
Semantic Score Distillation Sampling for Compositional Text-to-3D Generation [28.9] テキスト記述から高品質な3Dアセットを生成することは、コンピュータグラフィックスと視覚研究において重要な課題である。
本稿では,合成テキストから3D生成までの表現性と精度の向上を目的とした新しいSDS手法を提案する。
我々のアプローチは、異なるレンダリングビュー間の一貫性を維持する新しいセマンティック埋め込みを統合する。
明示的な意味指導を活用することで,既存の事前学習拡散モデルの構成能力を解き放つ。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:26:00 GMT)
Meta-Transfer Learning Empowered Temporal Graph Networks for Cross-City Real Estate Appraisal [28.8] ディープラーニングは、Webプラットフォームからの実質的なオンライントランザクションデータを活用することで、不動産評価に大きな可能性を秘めている。
本稿では,MetaTransfer Learning Empowered Temporal Graph Networks (MetaTransfer)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:16:38 GMT)
FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning [28.5] 擬似学習は、与えられた下流タスクに対するポリシーを効率的に適応するために、少数のタスク固有のデモンストレーションにのみ依存する。
本稿では,従来のデータから目標タスクに類似した動作を抽出するために,光フロー表現を利用するFlowRetrievalを提案する。
その結果,FlowRetrievalは,シミュレーションや実世界のドメイン間で,従来の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:17:42 GMT)
Certifying the quantumness of a single nuclear spin qudit through its uniform precession [28.4] 我々は、核スピンのエキゾチックな状態の量子性を、その均一な前提によって証明する。
この実験は、シリコンナノエレクトロニクスデバイスに埋め込まれた1つのスピン-7/2 $123$Sb核上で実行される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:07:21 GMT)
Certifying the quantumness of a nuclear spin qudit through its uniform precession [28.4] 我々は、核スピンのエキゾチックな状態の量子性を、その均一な前提によって証明する。
この実験は、シリコンナノエレクトロニクスデバイスに埋め込まれた1つのスピン-7/2 $123$Sb核上で実行される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:07:21 GMT)
Baichuan-Omni Technical Report [28.3] 世界初のオープンソース 7B Multimodal Large Language Model (MLLM) であるBaichuan-Omni を紹介する。
画像, ビデオ, 音声, テキストのモダリティを同時に処理し, 解析するのに適していることを示す。
我々は,この貢献が,マルチモーダル理解とリアルタイムインタラクションを進める上で,オープンソースコミュニティの競争基盤となることを目指しています。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:44:31 GMT)
Towards Difficulty-Agnostic Efficient Transfer Learning for Vision-Language Models [28.1] 本稿では,各手法が伝達困難に対してどのように振る舞うかを実証的に分析する。
本稿では,視覚的プロンプトとテキストアダプタを事前学習したVLMとを組み合わせた適応型アンサンブル手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:23:09 GMT)
Beyond GFVC: A Progressive Face Video Compression Framework with Adaptive Visual Tokens [28.0] 本稿では、適応的な視覚トークンを用いて、再構成と帯域幅のインテリジェンス間の例外的なトレードオフを実現する、新しいプログレッシブ・フェイス・ビデオ圧縮フレームワークであるPFVCを提案する。
実験により,提案したPFVCフレームワークは,最新のVersatile Video Coding (VVC) や最新技術であるGenerative Face Video Compression (GFVC) アルゴリズムと比較して,符号化の柔軟性と速度歪み性能に優れることを示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:24:21 GMT)
DA-Ada: Learning Domain-Aware Adapter for Domain Adaptive Object Detection [27.3] ドメイン適応オブジェクト検出(DAOD)は、注釈付きソースドメインで訓練された検出器を、未ラベルのターゲットドメインに一般化することを目的としている。
本稿では,適応化タスクに適した新しいドメイン・アウェア・アダプタ(DA-Ada)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:20:04 GMT)
Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse [27.3] 本稿では,RAGフレームワークにおけるLCMの信頼性を評価する総合指標であるTrust-Scoreを紹介する。
この結果から,LLMをRAGタスクに効果的に適応させるには,文脈内学習などの様々なプロンプト手法が不十分であることが示唆された。
信頼スコア性能向上のためのLCMの整合化手法であるTrust-Alignを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:53:31 GMT)
Unraveling and Mitigating Safety Alignment Degradation of Vision-Language Models [26.8] VLM(Vision-Language Models)の安全アライメント能力は、視覚モジュールの統合によって劣化しがちである。
VLMに視覚モダリティを導入する際に現れる表現ギャップから課題が生じることを示す。
安全アライメントの劣化を低減するため,Cross-Modality Representation Manipulation (CMRM)を導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:59:31 GMT)
One-shot Generative Domain Adaptation in 3D GANs [26.4] ワンショット3D生成ドメイン適応(GDA)は、訓練済みの3Dジェネレータを1つのドメインから1つの参照画像のみに依存する新しいドメインに転送する。
本稿では,一対一のGDA法である3D-Adapterについて述べる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:04:44 GMT)
The Value of Reward Lookahead in Reinforcement Learning [26.3] 競合分析のレンズを用いて,今後の報奨情報の価値を分析した。
我々は、最悪の報酬分布を特徴づけ、最悪の報酬予測の正確な比率を導出する。
本研究の結果は, 即時報酬の観察から, 相互作用開始前の報酬の観察までのスペクトルを網羅した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:13:12 GMT)
Unveiling Molecular Secrets: An LLM-Augmented Linear Model for Explainable and Calibratable Molecular Property Prediction [26.3] この研究は、分子特性の正確な予測のための単純な、しかし強力な線形モデルを構築するための、MoleXと呼ばれる新しいフレームワークを提案する。
MoleXの核心は、単純な線形モデルを用いて複雑な分子構造-プロパティ関係をモデル化することであり、LCMの知識と巧妙な校正戦略によって強化される。
大規模な実験により、MoleXは分子特性予測において既存の手法よりも優れており、予測性能、説明可能性、効率性の新たなマイルストーンを確立している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:07:57 GMT)
Decoupling General and Personalized Knowledge in Federated Learning via Additive and Low-Rank Decomposition [26.2] パーソナライズド・フェデレーション・ラーニング(Personalized Federated Learning)の主な戦略は、一般的な知識(クライアント間で共有される)とクライアント固有の知識を分離することである。
この問題に対処するためにパラメータ分解加算を用いた単純だが効果的なPFLパラダイムであるFedDecompを紹介する。
複数のデータセットにまたがる実験結果は、FedDecompが最先端のメソッドを最大4.9%上回っていることを示している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:30:01 GMT)
EAGLE: Efficient Adaptive Geometry-based Learning in Cross-view Understanding [26.2] セマンティックシーン理解におけるビュー間の幾何学的構造変化をモデル化するための,教師なしクロスビュー適応学習手法を提案する。
まず,カメラ間における画像やセグメンテーションマスクの構造変化をモデル化するための,非ペアデータに関するクロスビュー幾何学的制約を提案する。
第2に、カメラビュー間の幾何学的構造変化を効率的に測定するための、新しい測地流に基づく相関指標を提案する。
第3に、クロスビュー適応学習において、オープン語彙セグメンテーションネットワークのビュー情報モデリングを強化するために、新しいビュー条件プロンプト機構を導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:49:02 GMT)
Mitigating the Linguistic Gap with Phonemic Representations for Robust Cross-lingual Transfer [26.0] 多言語理解の改善へのアプローチは、高リソース言語と低リソース言語の間の大きなパフォーマンスギャップに悩まされることが多い。
本研究は,12言語を対象とした3つの言語間タスクに関する実験である。
音韻表現は、正書法表現と比較して言語間の類似性が高い。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:01:46 GMT)
RealEra: Semantic-level Concept Erasure via Neighbor-Concept Mining [25.8] 概念消去は、モデルが保護され不適切な概念に関する知識を取り除くために提案されている。
この「概念残余」問題に対処するためにRealEraを提案する。
また,RealEraは,有効性,特異性,汎用性において,従来の消去方法よりも優れていたことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:55:30 GMT)
$μ$LO: Compute-Efficient Meta-Generalization of Learned Optimizers [25.7] 学習(LO)は、ニューラルネットワークのウォールクロックトレーニング時間を著しく短縮することができる。
彼らは、メタトレーニングで見られるものよりもはるかに大きなトレーニングネットワークにおいて、目に見えないタスク(メタ一般化)を最適化するのに苦労する。
我々は$mu$-パラメータ化LOに対する簡単なメタトレーニングレシピを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:20:51 GMT)
A Brain-Inspired Regularizer for Adversarial Robustness [25.6] 近年の研究では、脳に似た表現を促進する正則化器を用いたCNNのトレーニングが、ニューラル記録を用いて、モデルロバスト性を改善することが示されている。
我々は,オリジナルの本質を保ちながら,画像画素の類似性を用いて計算される新たな正規化器を導入し,ニューラル記録の必要性を排除した。
我々の研究は、生物学的に動機付けられた損失関数が人工ニューラルネットワークの性能向上にどのように役立つかを探る。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:24:29 GMT)
A Brain-Inspired Regularizer for Adversarial Robustness [25.6] 近年の研究では、脳に似た表現を促進する正則化器を用いたCNNのトレーニングが、ニューラル記録を用いて、モデルロバスト性を改善することが示されている。
我々は,オリジナルの本質を保ちながら,画像画素の類似性を用いて計算される新たな正規化器を導入し,ニューラル記録の必要性を排除した。
我々の研究は、生物学的に動機付けられた損失関数が人工ニューラルネットワークの性能向上にどのように役立つかを探る。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:24:29 GMT)
Chip-Tuning: Classify Before Language Models Say [25.5] チップチューニングは、分類問題に対するシンプルで効果的な構造化プルーニングフレームワークである。
チップチューニングは,従来の最先端のベースラインを精度とプルーニング比の両方で大幅に上回っていることを示す。
また、チップチューニングはマルチモーダルモデルに適用でき、モデル微調整と組み合わせることで、優れた互換性が証明できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:20:19 GMT)
Chip-Tuning: Classify Before Language Models Say [25.5] チップチューニングは、分類問題に対するシンプルで効果的な構造化プルーニングフレームワークである。
チップチューニングは,従来の最先端のベースラインを精度とプルーニング比の両方で大幅に上回っていることを示す。
また、チップチューニングはマルチモーダルモデルに適用でき、モデル微調整と組み合わせることで、優れた互換性が証明できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:20:19 GMT)
Detecting and Approximating Redundant Computational Blocks in Neural Networks [25.4] ネットワーク内の類似性は、より効率的なニューラルネットワークを設計する新たな機会を提供する。
本稿では,冗長ブロックを検出するための単純な測度であるBlock Redundancyを導入し,冗長ブロックを近似するためにRBA(Redundant Blocks Approximation)を提案する。
RBAは、優れたパフォーマンスを維持しながら、モデルパラメータと時間の複雑さを減らす。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:43:56 GMT)
Detecting and Approximating Redundant Computational Blocks in Neural Networks [25.4] ネットワーク内の類似性は、より効率的なニューラルネットワークを設計する新たな機会を提供する。
本稿では,冗長ブロックを検出するための単純な測度であるBlock Redundancyを導入し,冗長ブロックを近似するためにRBA(Redundant Blocks Approximation)を提案する。
RBAは、優れたパフォーマンスを維持しながら、モデルパラメータと時間の複雑さを減らす。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:43:56 GMT)
Detecting and Approximating Redundant Computational Blocks in Neural Networks [25.4] ネットワーク内の類似性は、より効率的なニューラルネットワークを設計する新たな機会を提供する。
本稿では,冗長ブロックを検出するための単純な測度であるBlock Redundancyを導入し,冗長ブロックを近似するためにRBA(Redundant Blocks Approximation)を提案する。
RBAは、優れたパフォーマンスを維持しながら、モデルパラメータと時間の複雑さを減らす。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:43:56 GMT)
Detecting and Approximating Redundant Computational Blocks in Neural Networks [25.4] ネットワーク内の類似性は、より効率的なニューラルネットワークを設計する新たな機会を提供する。
本稿では,冗長ブロックを検出するための単純な測度であるBlock Redundancyを導入し,冗長ブロックを近似するためにRBA(Redundant Blocks Approximation)を提案する。
RBAは、優れたパフォーマンスを維持しながら、モデルパラメータと時間の複雑さを減らす。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:43:56 GMT)
The 2020 United States Decennial Census Is More Private Than You (Might) Think [25.3] 我々は、2020年国勢調査のプライバシー予算の8.50%から13.76%が8つの地理的レベルごとに使われていないことを示した。
我々は、地理的レベルで同じプライバシー予算を維持しながら、ノイズ分散を15.08%から24.82%削減する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:06:15 GMT)
Lifelong Event Detection via Optimal Transport [25.1] 最適輸送(LEDOT)による生涯イベント検出について紹介する。
提案手法は,リプレイセット,プロトタイプラテント表現,革新的な最適輸送コンポーネントを統合する。
その結果、LEDOTは連続イベント検出の先駆的なソリューションとして評価され、破滅的な忘れに対処するためのより効果的でニュアンスなアプローチを提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:26:03 GMT)
Interpretable Contrastive Monte Carlo Tree Search Reasoning [25.1] 大規模言語モデル(LLM)のための新しいモンテカルロ木探索法(MCTS)を提案する。
SC-MCTSは推論精度と速度の両方を著しく改善することを示した。
我々は,Llama-3.1-70BとSC-MCTS*を用いたBlocksworldのマルチステップ推論データセットにおいて,平均17.4%でo1-miniを上回りました。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:28:36 GMT)
Interpretable Contrastive Monte Carlo Tree Search Reasoning [25.1] 大規模言語モデル(LLM)のための新しいモンテカルロ木探索法(MCTS)を提案する。
SC-MCTSは推論精度と速度の両方を著しく改善することを示した。
我々は,Llama-3.1-70BとSC-MCTS*を用いたBlocksworldのマルチステップ推論データセットにおいて,平均17.4%でo1-miniを上回りました。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:28:36 GMT)
NatLogAttack: A Framework for Attacking Natural Language Inference Models with Natural Logic [25.1] 敵の攻撃は、アキレスの犠牲者モデルのヒールを評価する上で重要なツールであることが証明されている。
そこで我々はNatLogAttackを提案する。
既存の攻撃モデルと比較して、NatLogAttackは、犠牲者モデルへの訪問が少なく、より良い敵例を生成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:45:25 GMT)
ImFace++: A Sophisticated Nonlinear 3D Morphable Face Model with Implicit Neural Representations [25.0] 本稿では,暗黙のニューラル表現を持つ高度で連続的な空間を学習するために,ImFace++という新しい3次元顔モデルを提案する。
ImFace++は、まず2つの明示的に歪んだ変形フィールドを構築し、アイデンティティと式に関連する複雑な形状をモデル化する。
さらにテンプレート空間内の精細化変位場が組み込まれ、個々の顔の詳細をきめ細かな学習が可能となる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:45:46 GMT)
A Systematic Survey on Large Language Models for Algorithm Design [24.6] アルゴリズム設計(AD)は、様々な領域にわたる効果的な問題解決に不可欠である。
LLM(Large Language Models)とAD(LLM4AD)の統合は大幅に進展した。
本稿では LLM4AD に関する研究を体系的にレビューする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:17:19 GMT)
D'OH: Decoder-Only Random Hypernetworks for Implicit Neural Representations [24.6] Decoder-Only randomly Projected Hypernetwork (D'OH) による単一インスタンス信号に対する実行時暗黙関数の最適化戦略を提案する。
遅延コード次元を直接変更することにより、ニューラルネットワークの検索を犠牲にすることなく、ニューラル表現のメモリフットプリントを変更できる自然な方法を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:57:52 GMT)
Inverse Painting: Reconstructing The Painting Process [24.6] 我々はこれを自己回帰画像生成問題として定式化し、初期空白の「キャンバス」を反復的に更新する。
モデルは、多くのペイントビデオのトレーニングによって、実際のアーティストから学習する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:57:36 GMT)
Streaming Diffusion Policy: Fast Policy Synthesis with Variable Noise Diffusion Models [24.3] 拡散モデルはロボット模倣学習に急速に採用され、複雑なタスクを自律的に実行できるようになった。
近年の研究では、拡散過程の蒸留が政策合成の加速にどのように役立つかが研究されている。
本稿では,SDP(Streaming Diffusion Policy)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:04:49 GMT)
Streaming Diffusion Policy: Fast Policy Synthesis with Variable Noise Diffusion Models [24.3] 拡散モデルはロボット模倣学習に急速に採用され、複雑なタスクを自律的に実行できるようになった。
近年の研究では、拡散過程の蒸留が政策合成の加速にどのように役立つかが研究されている。
本稿では,SDP(Streaming Diffusion Policy)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:04:49 GMT)
Geometry, Computation, and Optimality in Stochastic Optimization [24.2] 問題幾何学の計算および統計的結果とオンライン最適化について検討する。
制約集合と勾配幾何学に焦点をあてて、どの次法と適応次法が最適(minimax)であるかという問題族を特徴づける。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:10:05 GMT)
Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving [23.7] 大規模言語モデル(LLM)は、その卓越した推論と理解能力により、最近かなりの関心を集めている。
本研究は、車両間通信(V2I)と自律運転(AD)ポリシーを共同で最適化することを目的として、車載ネットワークにLLMを適用することを検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:30:04 GMT)
Disentangling Regional Primitives for Image Generation [23.4] 本手法は,ニューラルネットワークの中間層特徴からプリミティブ特徴成分を分離する。
このようにして、画像全体の生成は、事前に符号化された異なる原始的地域パターンの重ね合わせと見なすことができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:29:31 GMT)
Disentangling Regional Primitives for Image Generation [23.4] 本手法は,ニューラルネットワークの中間層特徴からプリミティブ特徴成分を分離する。
このようにして、画像全体の生成は、事前に符号化された異なる原始的地域パターンの重ね合わせと見なすことができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:29:31 GMT)
Retrieving Contextual Information for Long-Form Question Answering using Weak Supervision [23.4] LFQA(Long-form Question answering)は、エンドユーザの質問に対する詳細な回答を生成することを目的としている。
本研究では,文脈情報の検索を最適化するために,様々な弱い監視手法を提案し,比較する。
長文の回答は、しばしばフォローアップの質問を予想することを示している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:42:02 GMT)
Towards Sharper Risk Bounds for Minimax Problems [23.4] ミニマックス問題は、敵対的、堅牢な最適化、強化学習といった機械学習で成功している。
理論解析では、現在の最適余剰リスク境界は一般化誤差と強強コンケーブ(SC-SC)における1/nレートによって構成される。
我々は、経験的サドル点(GDA)、勾配降下(DA)、勾配降下(SG)などの一般的なアルゴリズムを分析する。
ミニマックス問題の結果より n 倍早く導出する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:50:23 GMT)
Exact Byte-Level Probabilities from Tokenized Language Models for FIM-Tasks and Model Ensembles [23.1] トークン化は言語モデル(LM)における多くの未理解の欠点と関連している
本研究は, トークン化がモデルとバイトレベルのモデルを比較し比較することによって, モデル性能に与える影響について検討する。
我々は、さらなるトレーニングや最適化を必要とせず、トークン化バイアスを除去する次世代サンプリングアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:30:42 GMT)
HealthQ: Unveiling Questioning Capabilities of LLM Chains in Healthcare Conversations [23.1] デジタル医療において、大きな言語モデル(LLM)は質問応答能力を高めるために主に利用されてきた。
本稿では,LLMヘルスケアチェーンの問合せ能力を評価するための新しいフレームワークであるHealthQを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:07:21 GMT)
HealthQ: Unveiling Questioning Capabilities of LLM Chains in Healthcare Conversations [23.1] デジタル医療において、大きな言語モデル(LLM)は質問応答能力を高めるために主に利用されてきた。
本稿では,LLMヘルスケアチェーンの問合せ能力を評価するための新しいフレームワークであるHealthQを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:07:21 GMT)
I Learn Better If You Speak My Language: Understanding the Superior Performance of Fine-Tuning Large Language Models with LLM-Generated Responses [23.1] LLMによって生成された応答で大きな言語モデル(LLM)を微調整すると、特に推論タスクにおいて、人間によって生成された応答を使用するよりも良い結果が得られることが多い。
LLM生成応答によるトレーニングは、パフォーマンスの向上だけでなく、特定のタスクを微調整した後の他の推論タスクにおけるモデルの能力維持にも役立ちます。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:50:54 GMT)
JavaBench: A Benchmark of Object-Oriented Code Generation for Evaluating Large Language Models [23.0] OOP機能を実行するプロジェクトレベルのJavaベンチマークであるJavaBenchを提案する。
106のJavaクラスに389のメソッドを持つ4つのJavaプロジェクトで構成されている。
282人の大学生が合格し、平均スコアは90.93/100である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:27:16 GMT)
CMD: a framework for Context-aware Model self-Detoxification [22.8] テキストの解毒は、有害なコンテンツを生み出す言語モデルのリスクを最小限にすることを目的としている。
既存の解毒法では、解毒効果と生成品質のバランスが取れない。
文脈対応モデル自己解毒(CMD)フレームワークを導入し、文脈と解毒プロセスの両方に注意を払う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:11:10 GMT)
How far are today's time-series models from real-world weather forecasting applications? [22.7] WEATHER-5Kは、現実世界のシナリオをよりよく反映した観測気象データの包括的収集である。
これにより、モデルのより良いトレーニングと、TSFモデルの現実の予測能力のより正確な評価が可能になる。
我々は,学術的TSFモデルと実世界の天気予報アプリケーションとのギャップを,研究者に明確に評価する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:34:16 GMT)
On a Hidden Property in Computational Imaging [22.7] 本稿では,3つの逆問題 (FWI, CT, EM) が潜在空間内に隠れた性質を共有していることを示す。
このことは、潜在埋め込み空間に射影した後、2つのモジュラリティが同じ方程式の異なる解に対応することを示唆している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:52:04 GMT)
On the Relationship between Truth and Political Bias in Language Models [22.6] 我々は、言語モデルアライメントと政治科学の両方に不可欠な2つの概念の関係を分析することに注力する。
我々は、様々な人気真実性データセットの報酬モデルを訓練し、彼らの政治的偏見を評価する。
以上の結果から,これらのデータセットの真正性に対する報酬モデルの最適化は,政治的偏見を左右する傾向にあることが明らかとなった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:10:53 GMT)
DiffPO: A causal diffusion model for learning distributions of potential outcomes [22.3] DiffPOと呼ばれる新しい因果拡散モデルを提案する。
潜在的な結果の分布を学習することで、医療における信頼性の高い推論のために慎重に設計されている。
本手法は多種多様な実験において最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:50:17 GMT)
PolyGNN: Polyhedron-based Graph Neural Network for 3D Building Reconstruction from Point Clouds [22.2] PolyGNNは、再構成ポイントクラウドを構築するためのグラフニューラルネットワークである。
多面体分解によって得られる原始体を組み立てることを学ぶ。
都市間および実世界の点雲上での移動可能性解析を行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:33:28 GMT)
MYCROFT: Towards Effective and Efficient External Data Augmentation [22.1] Mycroftは、制約付きデータ共有予算で作業しながら、モデルトレーナーが異なるデータソースの相対的有用性を評価できるようにする方法である。
Mycroftは、所有者ごとに小さなが情報的なデータサブセットを特定し、モデルトレーナーは最小限のデータ露出でパフォーマンスを最大化できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:35:30 GMT)
Long Context Compression with Activation Beacon [22.1] Activation Beaconは、トランスフォーマーベースのLLM用のプラグインモジュールである。
長いコンテキストの効率的な、効率的、柔軟な圧縮をターゲットとしている。
推論時間の2倍の高速化と、KVキャッシュのメモリコストの8倍の削減を実現している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:18:24 GMT)
Compressing Lengthy Context With UltraGist [22.1] 長大な文脈の高品質な圧縮を特徴とするUltraGistという手法を提案する。
UltraGistは、幅広いコンテキスト長と圧縮比をサポートするために効果的に学習できるため、圧縮の柔軟性に寄与する。
これにより、トレーニングプロセスのサンプル効率が向上し、トレーニングデータの使用が最大になる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:08:38 GMT)
On the State of NLP Approaches to Modeling Depression in Social Media: A Post-COVID-19 Outlook [22.0] うつ病は最も広く研究されている精神疾患である。
新型コロナウイルス(COVID-19)の世界的なパンデミックは、世界中のメンタルヘルスに大きな影響を与えた。
ソーシャルメディアにおける抑うつをモデル化するための自然言語処理(NLP)アプローチについて調査する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:20:54 GMT)
The Good, the Bad and the Ugly: Watermarks, Transferable Attacks and Adversarial Defenses [22.0] バックドアベースの透かしと敵防御の既存の定義を2人のプレイヤー間の対話プロトコルとして定式化し拡張する。
ほぼすべての差別的学習タスクにおいて、少なくとも2つののうちの1つ(透かしまたは敵の防御)が存在している。
転送可能な攻撃の概念を満たすタスクは、暗号プリミティブを意味することを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:44:05 GMT)
ARCap: Collecting High-quality Human Demonstrations for Robot Learning with Augmented Reality Feedback [22.0] 本稿では,拡張現実(AR)と触覚警告を通じて視覚的フィードバックを提供する携帯型データ収集システムARCapを提案する。
ARCapから収集されたデータにより、ロボットは散らかった環境での操作や長い水平交叉操作といった困難なタスクを実行できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:30:46 GMT)
FastFixer: An Efficient and Effective Approach for Repairing Programming Assignments [21.8] 本稿では,FastFixerを提案する。
まず,必要なパッチと関連するコンテキストを生成する方法を学ぶことへのLLMの関心を高めることを目的とした,修復指向のファインチューニング戦略を提案する。
修復効率を考慮すると、FastFixerは自動回帰復号アルゴリズムと比較して16.67倍の高速化を実現している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:17:02 GMT)
Unity is Power: Semi-Asynchronous Collaborative Training of Large-Scale Models with Structured Pruning in Resource-Limited Clients [21.6] 本研究では,分散データセット上で大規模モデルを協調的に学習するための,巨大不均一な弱い計算能力の可能性を明らかにする。
本稿では,データ分散を考慮した構造化プルーニングとクロスブロック知識伝達機構を備えた,半非同期協調学習フレームワークを提案する。
実験によると、$Cotext-S2P$は、最先端の手法と比較して、精度を最大8.8%改善し、リソース利用を最大1.2$times$に改善している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:17:50 GMT)
Zero-Shot Offline Imitation Learning via Optimal Transport [21.5] ゼロショットの模倣学習アルゴリズムは、テスト時にたった1つのデモから、目に見えない振る舞いを再現する。
既存の実践的なアプローチでは、専門家のデモンストレーションを一連の目標と見なし、ハイレベルなゴールセレクタと低レベルなゴール条件のポリシーで模倣を可能にする。
そこで本研究では,模倣学習に固有の占領目標を直接最適化することにより,この問題を緩和する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:10:51 GMT)
xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing [21.4] ドメイン間政策伝達手法は主に、ポリシー学習を容易にするために、ドメインの対応や修正を学習することを目的としている。
本稿では,クロスドメイントラジェクトリ適応のために特別に設計された拡散モデルを用いたクロスドメイントラジェクトリ・EDitingフレームワークを提案する。
提案するモデルアーキテクチャは,対象データ内の動的パターンだけでなく,状態,行動,報酬間の複雑な依存関係を効果的にキャプチャする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:15:39 GMT)
Multi-Modal and Multi-Resolution Data Fusion for High-Resolution Cloud Removal: A Novel Baseline and Benchmark [21.3] マルチモーダルおよびマルチリゾリューションデータ融合を用いた高分解能クラウド除去のためのベンチマークデータセットであるM3R-CRを紹介する。
マルチモーダル・マルチレゾリューション情報の統合による高解像度光リモートセンシング画像における雲除去の問題点を考察する。
我々は、低解像度SAR画像誘導高解像度光画像雲除去を行うためのAlign-CRという新しいベースラインを設計する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:43:05 GMT)
Learning Positional Attention for Sequential Recommendation [21.2] 位置関係を直接学習する新しい注意モデルを導入する。
提案モデルである textbfPARec と textbfFPARec は,従来の自己意識に基づくアプローチよりも優れていた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:45:46 GMT)
Don't Transform the Code, Code the Transforms: Towards Precise Code Rewriting using LLMs [21.2] 本稿では,入力/出力コード例からコード変換を合成するチェーン・オブ・シント手法を提案する。
直接書き換えアプローチとは異なり、LCM生成した変換は検査、デバッグ、検証が容易である。
コード変換を実行するのに必要な計算量は、LLM書き換えの計算に比べて数分である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:45:16 GMT)
Distillation of Discrete Diffusion through Dimensional Correlations [21.1] 離散拡散における「ミクチャー」モデルは、拡張性を維持しながら次元相関を扱える。
CIFAR-10データセットで事前学習した連続時間離散拡散モデルを蒸留することにより,提案手法が実際に動作することを実証的に実証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:53:03 GMT)
M3Hop-CoT: Misogynous Meme Identification with Multimodal Multi-hop Chain-of-Thought [21.1] メソジニアスミーム識別のためのマルチモーダルマルチホップCoT(M3Hop-CoT)フレームワークを提案する。
M3Hop-CoTは、感情を誘発する3段階のマルチモーダルの原理、目標認識、ミーム分析のための文脈知識を採用している。
各種ベンチマークミームデータセットで評価することで,モデルの一般化性を評価する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:50:53 GMT)
Ego3DT: Tracking Every 3D Object in Ego-centric Videos [21.0] 本稿では,エゴ中心映像からの物体の3次元再構成と追跡のための新しいゼロショット手法を提案する。
Ego3DTは,エゴ環境内のオブジェクトの検出とセグメンテーション情報を最初に識別し,抽出する新しいフレームワークである。
また,エゴ中心ビデオにおける物体の3次元追跡軌道を安定的に作成するための動的階層化機構を革新した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:02:31 GMT)
Efficient Zero-Knowledge Proofs for Set Membership in Blockchain-Based Sensor Networks: A Novel OR-Aggregation Approach [20.8] 本稿では,ゼロ知識集合メンバシップ証明のための新しいOR集約手法を提案する。
我々は、包括的な理論基盤、詳細なプロトコル仕様、厳密なセキュリティ分析を提供する。
その結果, 証明サイズ, 生成時間, 検証効率が有意に向上した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:16:34 GMT)
nextlocllm: next location prediction using LLMs [20.7] NextLocLLMは、連続的な空間座標に基づいて位置を符号化し、空間関係をより良くモデル化する。
NextLocLLMは、自然言語記述の処理に大きな言語モデル(LLM)を使用する。
実験により、NextLocLLMは、次の位置予測で既存のモデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:59:14 GMT)
Intent-Enhanced Data Augmentation for Sequential Recommendation [20.6] 逐次レコメンデーション(textbfIESRec)のためのインテント強化データ拡張手法を提案する。
IESRecは、インテント・セグメンテーションの挿入を通じて、ユーザの行動シーケンスに基づいて、正と負のサンプルを構築する。
生成した正および負のサンプルは、対比損失関数を構築するために使用され、自己教師付きトレーニングを通じて推奨性能を高める。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:23:45 GMT)
Langevin Unlearning: A New Perspective of Noisy Gradient Descent for Machine Unlearning [20.5] プライバシは、スクラッチから再トレーニングするための統計的不明瞭さとして定義される。
勾配勾配に基づくアンラーニングフレームワークであるランゲヴィン・アンラーニングを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:13:41 GMT)
Certified Machine Unlearning via Noisy Stochastic Gradient Descent [20.5] 機械学習は、訓練されたモデルに対する特定のデータポイントの効果を効率的に除去することを目的としている。
本研究では,雑音勾配勾配を非学習に活用し,その最初の近似的非学習保証を確立することを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:22:16 GMT)
KnobGen: Controlling the Sophistication of Artwork in Sketch-Based Diffusion Models [20.4] KnobGenは、スケッチベースの画像生成のためのデュアルパスウェイフレームワークである。
さまざまなレベルのスケッチの複雑さとユーザスキルにシームレスに対応します。
画像の自然な外観を維持しながら、最終的な出力を制御する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:47:48 GMT)
KnobGen: Controlling the Sophistication of Artwork in Sketch-Based Diffusion Models [20.4] KnobGenは、スケッチベースの画像生成のためのデュアルパスウェイフレームワークである。
さまざまなレベルのスケッチの複雑さとユーザスキルにシームレスに対応します。
画像の自然な外観を維持しながら、最終的な出力を制御する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:47:48 GMT)
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL [20.2] 最近の研究は、新しいサンプルごとに多数の勾配ステップを持つニューラルネットワークの更新について検討している。
高い更新とデータの比率は、トレーニングプロセスに不安定をもたらす。
時間差分学習のためのモデル拡張データ(MAD-TD)は,少数の生成データを用いて高UTDトレーニングを安定化する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:13:17 GMT)
Cross-Domain Distribution Alignment for Segmentation of Private Unannotated 3D Medical Images [20.2] 本稿では、この問題を解決するために、新しいソースフリーなUnsupervised Domain Adaptation (UDA) 手法を提案する。
我々のアイデアは、ベースモデルにより、関連するソースドメインの内部的に学習された分布を推定することに基づいている。
我々は,実世界の3D医療データセット上でのSOTA性能を実証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:28:10 GMT)
Distractor Generation in Multiple-Choice Tasks: A Survey of Methods, Datasets, and Evaluation [20.1] イントラクタ生成タスクは、客観的な質問に対して不正確だが妥当な選択肢を生成することに焦点を当てる。
人工知能(AI)の進化は、タスクを従来の手法からニューラルネットワークや事前訓練された言語モデルに移行した。
本調査では、英語の客観的質問に対して、イントラクタ生成タスク、データセット、メソッド、および現在の評価指標について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:52:48 GMT)
SPA: 3D Spatial-Awareness Enables Effective Embodied Representation [20.1] 具体的AIにおける3次元空間認識の重要性を強調する新しい表現学習フレームワークであるSPAを紹介する。
本研究では,8つのシミュレータにまたがる268のタスクを網羅し,これまでで最も包括的な表現学習の評価を行った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:32:44 GMT)
SPA: 3D Spatial-Awareness Enables Effective Embodied Representation [20.1] 具体的AIにおける3次元空間認識の重要性を強調する新しい表現学習フレームワークであるSPAを紹介する。
本研究では,8つのシミュレータにまたがる268のタスクを網羅し,これまでで最も包括的な表現学習の評価を行った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:32:44 GMT)
Token Erasure as a Footprint of Implicit Vocabulary Items in LLMs [20.1] Llama-2-7b のトークン化子は、"northeast" という単語をトークン ['_n', 'ort', 'he', 'astern'] に分割する。
本研究では,名前付きエンティティとマルチトークン語の最後のトークン表現が,先行および現在のトークンに関する情報が早期の層で急速に忘れられるような,顕著な「消去」効果を示すことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:20:16 GMT)
$\forall$uto$\exists$$\lor\!\land$L: Autonomous Evaluation of LLMs for Truth Maintenance and Reasoning Tasks [20.1] $forall$uto$exists$$$lor!land$Lは、大言語モデル(LLM)を評価するための新しいベンチマークである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:56:37 GMT)
Mitigating Prior Shape Bias in Point Clouds via Differentiable Center Learning [20.0] 微分可能中心サンプリングネットワーク(DCS-Net)と呼ばれる新しいソリューションを導入する。
グローバルな特徴再構成とローカルな特徴再構成の両方を非自明なプロキシタスクとして組み込むことで,情報漏洩問題に対処する。
実験により,本手法は既存の点雲モデルの表現能力を向上することを示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:51:55 GMT)
Underwater litter monitoring using consumer-grade aerial-aquatic speedy scanner (AASS) and deep learning based super-resolution reconstruction and detection network [19.9] 本研究では,Aerial-Aquatic Speedy Scanner (AASS) とSuper-Resolution Reconstruction (SRR) と改良されたYOLOv8検出ネットワークを紹介する。
AASSは従来の手法よりもデータ取得効率を高め、水中の廃棄物を正確に識別する高品質な画像をキャプチャする。
SRRは、動きのぼやけと解像度の不十分さを軽減し、画像分解能を向上させる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:08:11 GMT)
Generalized Sparse Additive Model with Unknown Link Function [19.8] 我々は、未知リンク関数(GSAMUL)を持つ一般化スパース加法モデルという新しいスパース加法モデルを提案する。
成分関数はB-スプラインベースで推定され、未知リンク関数は多層パーセプトロン(MLP)ネットワークで推定される。
応用において、合成および実世界のデータセットの実験的評価は、提案手法の有効性を一貫して検証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:48:28 GMT)
Generalized Sparse Additive Model with Unknown Link Function [19.8] 我々は、未知リンク関数(GSAMUL)を持つ一般化スパース加法モデルという新しいスパース加法モデルを提案する。
成分関数はB-スプラインベースで推定され、未知リンク関数は多層パーセプトロン(MLP)ネットワークで推定される。
応用において、合成および実世界のデータセットの実験的評価は、提案手法の有効性を一貫して検証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:48:28 GMT)
MUSO: Achieving Exact Machine Unlearning in Over-Parameterized Regimes [19.7] マシン・アンラーニング(MU)は、訓練されたモデルを特定のデータでトレーニングされたことがないかのように振る舞う。
本研究では,学習と学習のタスクを統一する交互最適化アルゴリズムを提案する。
このアルゴリズムの有効性は、数値実験によって確認され、様々なシナリオにおける未学習における優れた性能を強調している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:17:17 GMT)
LibMOON: A Gradient-based MultiObjective OptimizatioN Library in PyTorch [19.5] 機械学習では、多目的最適化問題(MOP)が一般的である。
本稿では,最先端勾配法をサポートする初の多目的最適化ライブラリであるLibMOONを紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:31:46 GMT)
Alberta Wells Dataset: Pinpointing Oil and Gas Wells from Satellite Imagery [19.5] 何百万もの石油とガスの井戸が世界中に散らばっている。
これらの場所の多くは不明であり、井戸がふさがれるのを防ぎ、汚染効果が回避された。
本稿では,Planet Labsの高解像度マルチスペクトル衛星画像を活用した,この問題に対する最初の大規模ベンチマークデータセットを紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:49:50 GMT)
Defending Against Social Engineering Attacks in the Age of LLMs [19.4] 大きな言語モデル(LLM)は、人間の会話パターンをエミュレートし、チャットベースのソーシャルエンジニアリング(CSE)攻撃を促進する。
本研究では,CSE脅威に対するファシリテーターとディフェンダーの両立能力について検討した。
メッセージレベルと会話レベルの両方の検出を改善するモジュール型ディフェンスパイプラインであるConvoSentinelを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:29:47 GMT)
Enhancing Multimodal LLM for Detailed and Accurate Video Captioning using Multi-Round Preference Optimization [19.3] 低ランク適応 (LoRA) を用いた高度音声視覚大言語モデル (LLM) である Video-SALMONN 2 を提案する。
そこで本稿では,DPO(directed preference optimization)を用いて最適化された映像記述の完全性と精度を評価するための新しい指標を提案する。
実験の結果、mDPOはビデオSALMONN 2のキャプション精度を大幅に向上し、グローバルとローカルのエラー率をそれぞれ40%、20%削減することがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:09:30 GMT)
Enhancing Multimodal LLM for Detailed and Accurate Video Captioning using Multi-Round Preference Optimization [19.3] 低ランク適応 (LoRA) を用いた高度音声視覚大言語モデル (LLM) である Video-SALMONN 2 を提案する。
そこで本稿では,DPO(directed preference optimization)を用いて最適化された映像記述の完全性と精度を評価するための新しい指標を提案する。
実験の結果、mDPOはビデオSALMONN 2のキャプション精度を大幅に向上し、グローバルとローカルのエラー率をそれぞれ40%、20%削減することがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:09:30 GMT)
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization [19.2] 本稿では,テキスト・ツー・イメージ拡散モデル(T2I)のテキストエンコーダにおける因果的方法の影響を解析する。
本稿では,既存の手法よりも高精度に情報損失を定量化する新しい自動評価指標を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:45:25 GMT)
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization [19.2] 本稿では,テキスト・ツー・イメージ拡散モデル(T2I)のテキストエンコーダにおける因果的方法の影響を解析する。
本稿では,既存の手法よりも高精度に情報損失を定量化する新しい自動評価指標を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:45:25 GMT)
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization [19.2] 本稿では,テキスト・ツー・イメージ拡散モデル(T2I)のテキストエンコーダにおける因果的方法の影響を解析する。
本稿では,既存の手法よりも高精度に情報損失を定量化する新しい自動評価指標を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:45:25 GMT)
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization [19.2] 本稿では,テキスト・ツー・イメージ拡散モデル(T2I)のテキストエンコーダにおける因果的方法の影響を解析する。
本稿では,既存の手法よりも高精度に情報損失を定量化する新しい自動評価指標を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:45:25 GMT)
SSL-TTS: Leveraging Self-Supervised Embeddings and kNN Retrieval for Zero-Shot Multi-speaker TTS [18.7] TTSの効果的な中間表現として,自己教師付き学習(SSL)音声の特徴が出現している。
本研究では、単一話者からの音声の書き起こしに基づいて訓練された軽量で効率的なゼロショットTTSフレームワークであるSSL-TTSを紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:44:40 GMT)
Right for Right Reasons: Large Language Models for Verifiable Commonsense Knowledge Graph Question Answering [18.5] 知識グラフ質問回答法(KGQA)は,知識グラフ(KGs)に格納された関係情報を用いて自然言語の質問に答えようとする方法である。
近年のLarge Language Models(LLM)の進歩と、その顕著な推論能力により、KGQAにそれらを活用する傾向が高まっている。
検証可能な推論手順を可能にする共通知識KGQA手法であるRight for Right Reasons (R3)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:55:15 GMT)
Convergence Analysis of Adaptive Gradient Methods under Refined Smoothness and Noise Assumptions [18.5] AdaGradは特定の条件下では$d$でSGDより優れていることを示す。
これを動機として、目的物の滑らかさ構造と勾配のばらつきを仮定する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:23:21 GMT)
Can a large language model be a gaslighter? [18.4] 大きな言語モデル(LLM)は、その能力と有用性により、人間の信頼を得ています。
これにより、LLMは言語を操作することでユーザの考え方に影響を与える可能性がある。
本研究では,高速かつ微調整型ガス灯攻撃によるLSMの脆弱性について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:35:27 GMT)
Bad Neighbors: On Understanding VPN Provider Networks [18.4] 我々は、VPNプロバイダとその数千のVPNエンドポイントを大規模に分析する。
結果から,テスト対象のVPNサービスプロバイダの大部分において,内部で不安定なネットワークに対するトラフィックフィルタリングの欠如が示唆された。
我々は、影響を受けた提供者や他の利害関係者にこの調査結果を開示し、状況を改善するためのガイダンスを提供した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:51:20 GMT)
ART: Automatic Red-teaming for Text-to-Image Models to Protect Benign Users [18.4] そこで本研究では,テキスト・ツー・イメージ・モデルの安全性を評価するために,新しい自動レッド・チーム・フレームワークARTを提案する。
包括的実験により、人気のあるオープンソーステキスト・ツー・イメージモデルの毒性を明らかにする。
また、テキスト・ツー・イメージ・モデルに関連する安全性リスクを研究するために、大規模な3つの赤チームデータセットも導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:52:18 GMT)
Rethinking Pruning Large Language Models: Benefits and Pitfalls of Reconstruction Error Minimization [18.2] 本稿では,この誤差を90%以上削減する再構成手法を提案する。
キャリブレーションデータを自己生成する戦略は、再構築と一般化のトレードオフを軽減することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:46:25 GMT)
Window-based Channel Attention for Wavelet-enhanced Learned Image Compression [18.1] チャネルアテンションに初めてウィンドウパーティションを導入し、大きな受信フィールドを取得し、よりグローバルな情報を取得する。
実験の結果,4つの標準データセットに対してBDレートが18.54%,23.98%,22.33%,24.71%削減された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:59:09 GMT)
Window-based Channel Attention for Wavelet-enhanced Learned Image Compression [18.1] チャネルアテンションに初めてウィンドウパーティションを導入し、大きな受信フィールドを取得し、よりグローバルな情報を取得する。
実験の結果,4つの標準データセットに対してBDレートが18.54%,23.98%,22.33%,24.71%削減された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:59:09 GMT)
Window-based Channel Attention for Wavelet-enhanced Learned Image Compression [18.1] チャネルアテンションに初めてウィンドウパーティションを導入し、大きな受信フィールドを取得し、よりグローバルな情報を取得する。
実験の結果,4つの標準データセットに対してBDレートが18.54%,23.98%,22.33%,24.71%削減された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:59:09 GMT)
SOAP-RL: Sequential Option Advantage Propagation for Reinforcement Learning in POMDP Environments [18.1] この研究は、強化学習アルゴリズムを部分的に観測されたマルコフ決定プロセス(POMDP)に拡張する方法とオプションを比較する。
PPOEMとSOAPという2つのアルゴリズムが提案され、この問題に深く取り組むために研究されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:35:01 GMT)
SurgicalGS: Dynamic 3D Gaussian Splatting for Accurate Robotic-Assisted Surgical Scene Reconstruction [18.1] 幾何学的精度を向上した手術シーン再構築のための動的3次元ガウススプレイティングフレームワークであるStagementGSを提案する。
提案手法は,まず奥行き先を用いてガウス点雲を初期化し,深度変化の大きい画素を識別するために二元運動マスクを用い,フレーム間の深度マップから点雲を融合して初期化する。
フレキシブル変形モデルを用いて動的シーンを表現し、教師なし深度スムースネス制約とともに正規化深度正規化損失を導入し、より正確な幾何再構成を実現する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:46:46 GMT)
Multi-modal Fusion based Q-distribution Prediction for Controlled Nuclear Fusion [17.8] 我々は,Q分布予測の複雑さに対処するために,ディープラーニング技術を活用している。
具体的には,コンピュータビジョンにおけるマルチモーダル融合法について検討し,元の1次元データと2次元線画像データを統合してバイモーダル入力を生成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:58:19 GMT)
DeltaDQ: Ultra-High Delta Compression for Fine-Tuned LLMs via Group-wise Dropout and Separate Quantization [17.5] 大規模言語モデルは、教師付き微調整により、様々な下流タスクにおいて例外的なパフォーマンスを達成する。
デルタ重量を圧縮する現在の方法は超高圧縮を達成するのに苦労している。
デルタ重みの超高圧縮を実現するために,分布駆動型デルタ圧縮フレームワークデルタDQを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:44:16 GMT)
Federated Learning in Practice: Reflections and Projections [17.4] Federated Learning(FL)は、複数のエンティティがローカルデータを交換することなく、共同で共有モデルを学ぶことができる機械学習技術である。
Google、Apple、Metaといった組織によるプロダクションシステムは、FLの現実的な適用性を実証しています。
我々は、厳密な定義よりもプライバシー原則を優先する再定義されたFLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:10:38 GMT)
Towards Trustworthy LLMs for Code: A Data-Centric Synergistic Auditing Framework [17.3] DataTrustは、モデル信頼性指標とトレーニングにおけるデータ品質指標を結びつけることを目的としている。
さまざまな利害関係者がDataTrustから得られるメリットを概説する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:59:58 GMT)
MVG-CRPS: A Robust Loss Function for Multivariate Probabilistic Forecasting [17.2] 本研究では,高次元MVG出力に特化して設計されたロバスト損失関数を提案する。
提案したMVG-CRPS損失関数は、ニューラルネットワークの出力に基づいてクローズドフォーム表現を持ち、ディープラーニングモデルに容易に統合できる。
実世界のデータセットによる実験結果から,MVG-CRPSはロバスト性と効率性の両方を達成することが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:10:20 GMT)
Learning Shared RGB-D Fields: Unified Self-supervised Pre-training for Label-efficient LiDAR-Camera 3D Perception [17.1] 我々は、統合事前訓練戦略、NeRF-Supervised Masked Auto(NS-MAE)を導入する。
NS-MAEは、外観と幾何学の両方を符号化するNeRFの能力を利用して、マルチモーダルデータの効率的なマスク付き再構築を可能にする。
結果: NS-MAE は SOTA 事前学習法よりも優れており,各モードに対して個別の戦略を用いる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:01:56 GMT)
Fusing Echocardiography Images and Medical Records for Continuous Patient Stratification [16.9] 本研究は, 高血圧症と診断し難い連続体を用いて, 心血管系病理の表現を学習する手法を提案する。
提案手法はまず各変数をモダリティ固有のアプローチを用いて表現空間に射影する。
これらの標準化されたマルチモーダルデータの表現は、その後トランスフォーマーエンコーダに送られ、臨床評価を予測するタスクを通じて患者の包括的表現にマージされる。
239人の高血圧患者のコホートでこの連続体に沿った主要な傾向を観察し、高血圧が様々な心機能記述因子に与える影響について、前例のない詳細を報告した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:28:00 GMT)
Spectra: Surprising Effectiveness of Pretraining Ternary Language Models at Scale [16.9] 本稿では,従来の浮動小数点モデル(FloatLM)とその後量子化バージョン(QuantLM)の代替として,低ビット幅モデル,特に第三言語モデル(TriLM)の事前学習について検討する。
我々は、FloatLMs、QuantLMs、TriLMsを含む複数のビット幅にまたがる最初のオープンなLLMスイートであるSpectra LLMスイートを、300Bトークンでトレーニングされた99Mから3.9Bのパラメータで紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:44:55 GMT)
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models [16.9] 本稿では,従来の浮動小数点モデル(FloatLM)とその後量子化バージョン(QuantLM)の代替として,低ビット幅モデル,特に第三言語モデル(TriLM)の事前学習について検討する。
我々は、FloatLMs、QuantLMs、TriLMsを含む複数のビット幅にまたがる最初のオープンなLLMスイートであるSpectra LLMスイートを、300Bトークンでトレーニングされた99Mから3.9Bのパラメータで紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:44:55 GMT)
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models [16.9] 本稿では,従来の浮動小数点モデル(FloatLM)とその後量子化バージョン(QuantLM)の代替として,低ビット幅モデル,特に第三言語モデル(TriLM)の事前学習について検討する。
我々は、FloatLMs、QuantLMs、TriLMsを含む複数のビット幅にまたがる最初のオープンなLLMスイートであるSpectra LLMスイートを、300Bトークンでトレーニングされた99Mから3.9Bのパラメータで紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:44:55 GMT)
LLM-Generated Black-box Explanations Can Be Adversarially Helpful [16.5] 大規模言語モデル(LLM)は,デジタルアシスタントとして機能することで,複雑な問題の解決と理解を支援する。
私たちの研究は、このアプローチに結びついている隠れたリスクを明らかにします。
LLMの説明が間違った答えを正しく見せると、これは起こります。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:16:30 GMT)
More Agents Is All You Need [16.4] 単にサンプリング・アンド・投票方式によって,大規模言語モデル(LLM)の性能は,エージェントの数がインスタンス化されるに従ってスケールすることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:38:40 GMT)
Scaling Gaussian Processes for Learning Curve Prediction via Latent Kronecker Structure [16.3] GPモデルは,学習曲線予測タスクにおいて,トランスフォーマーの性能と一致することを示す。
我々の方法は、$mathcalO(n3 + m3)$ timeと$mathcalO(n2 + m2)$ spaceのみを必要とする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:24:33 GMT)
CliBench: A Multifaceted and Multigranular Evaluation of Large Language Models for Clinical Decision Making [16.3] 我々はMIMIC IVデータセットから開発された新しいベンチマークであるCliBenchを紹介する。
このベンチマークは、臨床診断におけるLSMの能力を包括的かつ現実的に評価する。
臨床診断の熟練度を評価するため,先進LSMのゼロショット評価を行った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:53:05 GMT)
SOLD: Reinforcement Learning with Slot Object-Centric Latent Dynamics [16.0] Slot-Attention for Object-centric Latent Dynamicsは、画素入力からオブジェクト中心の動的モデルを学ぶ新しいアルゴリズムである。
構造化潜在空間は、モデル解釈可能性を改善するだけでなく、振る舞いモデルが推論する価値のある入力空間も提供することを実証する。
以上の結果から,SOLDは,最先端のモデルベースRLアルゴリズムであるDreamerV3よりも,さまざまなベンチマークロボット環境において優れていた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:03:31 GMT)
Finite Sample and Large Deviations Analysis of Stochastic Gradient Algorithm with Correlated Noise [15.7] 我々は,ステップサイズ勾配アルゴリズムの有限標本残差を解析した。
相関雑音を仮定し,解析の体系的アプローチとして摂動リアプノフ関数を用いる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:38:27 GMT)
CAS-GAN for Contrast-free Angiography Synthesis [15.5] ヨウ化コントラスト剤は、多くの介入手順で広く利用されるが、患者にかなりの健康リスクをもたらす。
本稿では, 仮想コントラストエージェントとして機能する新しいGANフレームワークであるCAS-GANについて述べる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:31:40 GMT)
Mentor-KD: Making Small Language Models Better Multi-step Reasoners [15.2] 我々は,LLMのマルチステップ推論能力をより小さいLMに効果的に蒸留するメンター-KDを提案する。
我々は、メンタ、中間サイズのタスク固有の微調整モデルを利用して、追加のCoTアノテーションを強化します。
我々は広範囲な実験を行い、メンターKDの有効性を様々なモデルや複雑な推論タスクで確認する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:53:27 GMT)
Generalized Policy Improvement Algorithms with Theoretically Supported Sample Reuse [15.1] 我々は,データ駆動型学習ベース制御のためのモデルフリー深層強化学習アルゴリズムを新たに開発した。
当社の一般政策改善アルゴリズムは,オンライン手法の政策改善保証とサンプル再利用の効率化を両立させる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:43:26 GMT)
Efficient Differentiable Discovery of Causal Order [15.0] Intersortは、変数の因果順序を発見するためのスコアベースの方法である。
我々は、差別化可能なソートとランキング技術を用いてインターソートを再構築する。
我々の研究は、因果順の正規化を微分可能なモデルの訓練に効率的に組み込むための扉を開く。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:11:55 GMT)
Can GPTs Evaluate Graphic Design Based on Design Principles? [14.9] 我々は,60名の被験者から収集した人間のアノテーションを用いて,GPTに基づく評価と設計原則に基づく評価の挙動を比較した。
実験の結果,GPTは人間のアノテーションと合理的に相関し,設計原理に基づく指標に類似した傾向を示すことがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:01:02 GMT)
Retraining-Free Merging of Sparse Mixture-of-Experts via Hierarchical Clustering [14.9] 疎活性化型エキスパート混合(HC-SMoE)のための階層クラスタリングを提案する。
HC-SMoEはタスクに依存しないエキスパートマージフレームワークで、再トレーニングせずにSMoEモデルのパラメータを削減できる。
我々は8つのゼロショット言語タスクに関する広範な実験を通じてアプローチを検証するとともに、QwenやMixtralといった大規模SMoEモデルにおいてその効果を実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:36:14 GMT)
PostRainBench: A comprehensive benchmark and a new model for precipitation forecasting [14.9] 数値気象予報(NWP)の事後処理に基づく降水予測に着目する。
我々は,包括的マルチ変数NWP後処理ベンチマークである textbfPostRainBench と,シンプルで効果的なChannel Attention Enhanced Multi-task Learning フレームワークである textbfCAMT を紹介する。
我々のモデルは,大雨条件下でNWPアプローチより優れた深層学習に基づく最初の手法である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:12:31 GMT)
Learning a Neural Solver for Parametric PDE to Enhance Physics-Informed Methods [14.8] データに基づいて訓練された物理インフォームド反復アルゴリズムを用いて偏微分方程式(PDE)の解法を学習することを提案する。
本手法は,各PDEインスタンスに自動的に適応する勾配降下アルゴリズムの条件付けを学習する。
複数のデータセットに対する経験的実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:17:22 GMT)
Learning a Neural Solver for Parametric PDE to Enhance Physics-Informed Methods [14.8] データに基づいて訓練された物理インフォームド反復アルゴリズムを用いて偏微分方程式(PDE)の解法を学習することを提案する。
本手法は,各PDEインスタンスに自動的に適応する勾配降下アルゴリズムの条件付けを学習する。
複数のデータセットに対する経験的実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:17:22 GMT)
CrossMPT: Cross-attention Message-Passing Transformer for Error Correcting Codes [14.6] クロスアテンションメッセージパージングトランス(CrossMPT)を提案する。
また、CrossMPTは、既存のニューラルネットワークベースのデコーダを、様々なコードクラスで大幅に上回っていることを示す。
特に、CrossMPTは、メモリ使用量、複雑性、推論時間、トレーニング時間を著しく削減しながら、このデコードパフォーマンスの改善を実現している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:42:49 GMT)
Natural Language Induced Adversarial Images [14.4] 本稿では,自然言語による逆画像攻撃手法を提案する。
中心となる考え方は、入力プロンプトが与えられた逆画像を生成するために、テキスト・ツー・イメージモデルを活用することである。
実験の結果,"foggy","humid","stretching"などの高周波意味情報が誤りを生じやすいことがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:36:07 GMT)
Kolmogorov-Arnold Neural Networks for High-Entropy Alloys Design [14.4] Kolmogorov-Arnold Networks (KAN)は、最近開発されたアーキテクチャであり、入力機能の精度と解釈性の両方を改善することを目的としている。
本研究では,HEA設計のための3つの異なるデータセットを探索し,分類モデルと回帰モデルの両方に対するkanの適用を実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:48:47 GMT)
SCKansformer: Fine-Grained Classification of Bone Marrow Cells via Kansformer Backbone and Hierarchical Attention Mechanisms [14.3] そこで本研究では,骨髄血球の詳細な分類モデルであるSCKansformerを提案する。
このモデルは、Kansformer、SCConvCD、Global-Local Attentionを統合している。
骨マーロウ血球微細粒度分類データセットを用いて,本モデルの有効性を検証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:10:59 GMT)
Distributed Quantum Hypothesis Testing under Zero-rate Communication Constraints [14.3] 本研究では,2つのリモートパーティ間で共有される二部量子状態を推定するために,分散二分仮説テスト問題について検討する。
我々の主な貢献として、この問題に対するスタインの指数に対して効率よく計算可能なシングルレター式を導出する。
結果の逆方向を証明するための鍵となるツールとして,爆発性レムマの量子バージョンを開発する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:03:10 GMT)
How Diffusion Models Learn to Factorize and Compose [14.2] 拡散モデルは、トレーニングセットに表示されない可能性のある要素を組み合わせた、フォトリアリスティックな画像を生成することができる。
本研究では,拡散モデルが構成可能な特徴の意味的意味的・要因的表現を学習するかどうかを考察する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:29:14 GMT)
DistDD: Distributed Data Distillation Aggregation through Gradient Matching [14.1] DistDDは、クライアントのデバイスに直接データを蒸留することで、反復的なコミュニケーションの必要性を減らす、連邦学習フレームワークにおける新しいアプローチである。
本研究では,DistDDアルゴリズムの詳細な収束証明を行い,その数学的安定性と信頼性を実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:43:35 GMT)
Exploring the Design Space of Cognitive Engagement Techniques with AI-Generated Code for Enhanced Learning [14.1] 我々は、AI生成コードとのより深いエンゲージメントを促進するための7つの認知エンゲージメント技術を開発した。
本結果は, 学習者に対して, ステップバイステップの問題解決プロセスを通じて指導する, 最も効果的な手法を強調した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:49:42 GMT)
Kaleidoscope: Learnable Masks for Heterogeneous Multi-agent Reinforcement Learning [14.0] 本稿では,新しい適応型部分パラメータ共有方式であるEmphKaleidoscopeを紹介する。
パラメータ共有の効率を犠牲にすることなく、これらのマスク間の相違を促進することで、ポリシーネットワーク間の多様性を促進する。
我々はKaleidoscopeを拡張してアクター批判アルゴリズムの文脈におけるアンサンブルを批判する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:22:54 GMT)
Finding Incompatible Blocks for Reliable JPEG Steganalysis [13.9] 本稿では、100の画質係数に対する非互換JPEG画像の洗練された概念を提示する。
DCT係数に埋め込まれたステガノグラフィースキームの存在を検出するために使用できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:23:07 GMT)
Distributed Evolution Strategies with Multi-Level Learning for Large-Scale Black-Box Optimization [13.8] 本稿では,CMA-ES(Re limited-Memory CMA-ES)と呼ばれる,CMA-ES(Re limited-Memory CMA-ES)とCMA-ES(Restrict-Memory CMA-ES)を並列化する手法を提案する。
分散LM-CMAのためのマルチレベル学習ベースのメタフレームワークを提案する。階層的に構成された構造のため、Meta-ESは分散メタフレームワークを実装するのに適している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:08:05 GMT)
Cooperative Coevolution for Non-Separable Large-Scale Black-Box Optimization: Convergence Analyses and Distributed Accelerations [13.8] 我々は、よく知られた協調的共進化(CC)の大規模バージョンを非分離関数で解析し、拡張する。
本研究では,分解に基づく手法が好まれるかどうかを,非分離性な大規模問題に対して実証的に明らかにする。
私たちは、最近のマルチレベル学習フレームワークの下で、強力な分散コンピューティングを使用してそれを加速します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:53:39 GMT)
MMLF: Multi-modal Multi-class Late Fusion for Object Detection with Uncertainty Estimation [13.6] 本稿では,マルチクラス検出が可能なレイトフュージョンのための先駆的マルチモーダル・マルチクラスレイトフュージョン法を提案する。
KITTI検証と公式テストデータセットで実施された実験は、大幅なパフォーマンス改善を示している。
我々のアプローチでは、不確実性分析を分類融合プロセスに組み込んで、モデルをより透明で信頼性の高いものにします。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:58:35 GMT)
Efficiently Scanning and Resampling Spatio-Temporal Tasks with Irregular Observations [13.5] 本稿では,2次元の潜伏状態と観測値の交叉アテンションを交互に交互に行うアルゴリズムを提案する。
提案アルゴリズムは,従来の手法と比較して,パラメータカウントが低く,トレーニングや推論が高速である場合に比較して精度が向上する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:11:31 GMT)
MATCH: Model-Aware TVM-based Compilation for Heterogeneous Edge Devices [13.5] MATCHはTVMベースの新しいフレームワークで、様々なMCUプロセッサやアクセラレーターを簡単にアジャイルにデプロイできるように設計されている。
ハードウェアコストモデルで強化された汎用的かつ再ターゲット可能なマッピングフレームワークが,ツールチェーンと競合し,さらにはカスタムツールチェーンも可能であることを示す。
Tiny スイート MATCH の4つのモデルでは、通常のTVM と比較して、DIANA のレイテンシを 60.88 倍に削減している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:32:06 GMT)
Verification and Refinement of Natural Language Explanations through LLM-Symbolic Theorem Proving [13.5] 本稿では,Large Language Models(LLMs)とTheorem Provers(TPs)の統合による自然言語説明の検証と改善について検討する。
本稿では, TPとLPMを統合して説明文の生成と定式化を行う, Explanation-Refiner というニューロシンボリック・フレームワークを提案する。
代わりに、TPは説明の論理的妥当性を公式に保証し、その後の改善のためのフィードバックを生成するために使用される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:54:35 GMT)
Slow Convergence of Interacting Kalman Filters in Word-of-Mouth Social Learning [13.4] 我々は、連続的に動作するカルマンフィルタエージェントを$m$で提供する、口語ソーシャルラーニングについて検討する。
その結果, 学習速度を1回に1k-1$と最適に設定できることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:30:56 GMT)
FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality [13.2] 本稿では,AVのLF(Largest Feasible Region)をガイダンスとして組み込んだ新しい安全クリティカルシナリオ生成手法FREAを紹介する。
実験では、FREAが安全クリティカルなシナリオを効果的に生成し、ほぼミスに近い事象を引き起こすことが示されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:32:17 GMT)
Robots Can Multitask Too: Integrating a Memory Architecture and LLMs for Enhanced Cross-Task Robot Action Generation [13.2] 大規模言語モデル(LLM)は、ロボットの知覚と身体能力による常識推論の基盤となるロボット応用に最近使用されている。
本稿では,タスク間を効果的に切り替える一方で,タスク間動作を生成するためのLLMをメモリプロセスに組み込むことに対処する。
その結果,5つのロボットタスクのベースラインよりも性能が大幅に向上し,ロボットの動作と適応タスク実行の知覚を組み合わせたLLMにメモリを統合する可能性が示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:58:20 GMT)
IP-FL: Incentivized and Personalized Federated Learning [13.1] まず、インセンティブとパーソナライゼーションを相互関連課題として扱い、パーソナライズされた学習を促進するインセンティブメカニズムを用いて解決することを提案する。
我々のアプローチは、高品質なデータを持つ自己認識型クライアントに対するパーソナライズされたモデル魅力を高め、アクティブで一貫した参加につながります。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:44:56 GMT)
radarODE-MTL: A Multi-Task Learning Framework with Eccentric Gradient Alignment for Robust Radar-Based ECG Reconstruction [13.1] この作業は、レーダーによるECG回復を創造的に3つの個別のタスクに分解する。
複数タスクの学習フレームワークであるRadarODE-MTLを提案し、一貫した雑音や突然の騒音に対する堅牢性を高める。
実験の結果,レーダノード-MTLはレーダ信号から正確なECG信号を頑健に再構成できることが示唆された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:28:09 GMT)
Symbolic Music Generation with Fine-grained Interactive Textural Guidance [13.1] 拡散モデルにFTGを導入し,学習した分布の誤差を補正する。
シンボリック音楽生成における課題とFTGアプローチの効果について理論的特徴を導出する。
ユーザ入力によるインタラクティブな音楽生成のためのデモページを提供し,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:41:46 GMT)
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models [12.9] 99Mから3.9Bのパラメータから、300Bトークンでトレーニングされた54の言語モデルからなるSpectra LLMスイートをリリースする。
スペクトルには、FloatLM、後トレーニング量子化されたQuantLM(3, 4, 6, 8bits)、および3次LLM(TriLMs)が含まれる。
TriLM 3.9Bは6倍の大きさのモデルであるFloatLM 3.9Bと同じくらい毒性があり、立体タイプである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:44:55 GMT)
ELMO: Enhanced Real-time LiDAR Motion Capture through Upsampling [12.8] 本稿では,単一LiDARセンサ用に設計されたリアルタイムアップサンプリングモーションキャプチャフレームワークELMOを紹介する。
ELMOは、条件付き自己回帰変換器ベースのアップサンプリングモーションジェネレータとしてモデル化され、20fpsのLiDARポイントクラウドシーケンスから60fpsのモーションキャプチャを実現する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:12:48 GMT)
ELMO: Enhanced Real-time LiDAR Motion Capture through Upsampling [12.8] 本稿では,単一LiDARセンサ用に設計されたリアルタイムアップサンプリングモーションキャプチャフレームワークELMOを紹介する。
ELMOは、条件付き自己回帰変換器ベースのアップサンプリングモーションジェネレータとしてモデル化され、20fpsのLiDARポイントクラウドシーケンスから60fpsのモーションキャプチャを実現する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:12:48 GMT)
Restormer-Plus for Real World Image Deraining: One State-of-the-Art Solution to the GT-RAIN Challenge (CVPR 2023 UG2+ Track 3) [12.7] Restormer-PlusはGT-RAIN Challengeに提出された。
構造類似度(SSIM)では4位である。
大会の主催者から公式には準優勝の解決策として評価された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:17:09 GMT)
A Benchmark for Cross-Domain Argumentative Stance Classification on Social Media [12.5] 論証的姿勢分類は、特定のトピックに対する著者の視点を特定する上で重要な役割を担っている。
既存のベンチマークは、単一のドメインからのものや、限られたトピックにフォーカスすることが多い。
我々は,人的アノテーションの必要性を回避するために,プラットフォームルール,手軽に利用可能な専門家によるコンテンツ,および大規模言語モデルを活用することを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:20:11 GMT)
The Local Landscape of Phase Retrieval Under Limited Samples [12.4] 我々は,地球規模のミニマを囲む良質な景観を高次元で確保するために必要となる最小限のサンプルサイズを確認することを目的としている。
まず、 whenn=odlog d の局所凸性について調べる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:34:57 GMT)
Carefully Structured Compression: Efficiently Managing StarCraft II Data [12.3] StarCraft IIのシリアライズフレームワークを導入し、データセットの生成とストレージのコストを削減する。
データセットを使用して、他のデータセットでトレーニングされた同等のモデルのパフォーマンスを超えるディープラーニングモデルをトレーニングします。
導入されたデータセット変換および利用フレームワークはオープンソースであり、同様の特徴を持つデータセットのフレームワークとして使用できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:33:04 GMT)
ViT3D Alignment of LLaMA3: 3D Medical Image Report Generation [12.3] マルチモーダルな大言語モデルを用いた医療報告自動生成のための新しい手法を提案する。
我々は、3Dビジョン変換器(ViT3D)の画像エンコーダを用いて3Dスキャンを処理し、Asclepius-Llama3-8Bを言語モデルとして、自動回帰デコードによるテキストレポートを生成する。
提案手法は,LLaMA3のVT3DアライメントによるMRGとVQAの自動タスクの有効性を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:35:33 GMT)
M$^3$-Impute: Mask-guided Representation Learning for Missing Value Imputation [12.2] M$3$-Imputeは、不足情報や新しいマスキング手法との相関性を明示的に活用することを目的としている。
実験の結果,M$3$-Imputeは平均20点,第2bのMAEスコアが4点であった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:25:32 GMT)
EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics [12.1] EmoDynamiXは、ユーザの微粒な感情と、不均一なグラフを使用してシステム戦略の間の談話ダイナミクスをモデル化し、パフォーマンスと透明性を改善します。
2つのESCデータセットの実験結果から、EmoDynamiXは従来の最先端の手法よりも優れたマージンを持つことが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:04:11 GMT)
Logarithmic Regret for Unconstrained Submodular Maximization Stochastic Bandit [12.1] 本稿では,オンラインの非依存サブモジュール問題(Online USM)を,帯域幅のフィードバックを伴う設定で解決する。
この枠組みでは、決定者は、既知の間隔で値を取る非単調な部分モジュラ函数からノイズの報奨を受ける。
本稿では、オフラインおよびオンラインのフル情報設定から、Double-Greedy-Explore-then-Commit(DG-ETC)を適用したDG-ETCを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:07:12 GMT)
Software Engineering and Foundation Models: Insights from Industry Blogs Using a Jury of Foundation Models [12.0] 我々は大手テクノロジー企業から155 FM4SEと997 SE4FMのブログ記事を分析した。
我々は、コード生成が最も顕著なFM4SEタスクであるのに対して、FMは他の多くのSEアクティビティに活用されていることを観察した。
クラウドのデプロイに重点を置いているが、FMを圧縮し、小さなデバイスにデプロイすることへの関心が高まっている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:27:04 GMT)
A Lightweight Sparse Focus Transformer for Remote Sensing Image Change Captioning [11.9] 本稿では、リモートセンシング画像変更キャプション(RSICC)タスクのためのスパースフォーカス変換器(SFT)を提案する。
提案するSFTネットワークは,スパースアテンション機構を組み込むことで,パラメータ数と計算複雑性を低減できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:50:58 GMT)
An End-to-End Deep Learning Method for Solving Nonlocal Allen-Cahn and Cahn-Hilliard Phase-Field Models [11.9] 本研究では,非局所的なアレン・カーン(AC)およびカーン・ヒリアード(CH)位相場モデルの効率的なエンドツーエンドディープラーニング手法を提案する。
ニューラルネットワークモデルへの入力チャネルとして非ローカルカーネルを組み込むことで、ニューラルネットワークのアーキテクチャをカスタマイズする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:41:47 GMT)
WONDERBREAD: A Benchmark for Evaluating Multimodal Foundation Models on Business Process Management Tasks [11.7] 既存のMLベンチマークには、ビジネスプロセス管理(BPM)タスクのモデルを評価するのに必要なアノテーションの深さと多様性が欠けている。
我々のベンチマークでは、最先端のFMはドキュメンテーションを自動的に生成できるが、ワークフロー補完のよりきめ細かい検証に向けてその知識を再適用するのに苦労している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:06:31 GMT)
Exploring Quantization for Efficient Pre-Training of Transformer Language Models [11.7] 本研究の目的は,変圧器の効率的な事前学習における量子化の影響を検討することである。
重み、アクティベーション、勾配、状態に直線量子化を体系的に適用することにより、トレーニング中のモデル効率、安定性、性能への影響を評価する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:35:49 GMT)
GPR Full-Waveform Inversion through Adaptive Filtering of Model Parameters and Gradients Using CNN [11.5] モデルパラメータと勾配を適応的にフィルタするために、組み込み畳み込みニューラルネットワーク(CNN)を組み込んだ新しいフルウェーブフォーム・インバージョン・フレームワークを導入する。
実験により、フォワード計算中にモデルパラメータをフィルタリングし、バックプロパゲーション時にモデル勾配が最終的に高品質な反転結果をもたらすことが示されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:49:05 GMT)
Quater-GCN: Enhancing 3D Human Pose Estimation with Orientation and Semi-supervised Training [11.5] 本稿では,向きによるポーズ推定を強化するために,有向グラフ畳み込みネットワークであるQuater-GCNを紹介する。
Q-GCNは、座標を通してノード関節間の空間的依存関係をキャプチャするだけでなく、2次元空間における骨の回転の動的コンテキストを統合することで、排他的に優れている。
我々は,ラベルのないデータを活用する半教師付きトレーニング戦略でモデルを補完する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:30:53 GMT)
Look Gauss, No Pose: Novel View Synthesis using Gaussian Splatting without Accurate Pose Initialization [11.4] 3D Gaussian Splattingは、一連の入力画像から高速で正確なノベルビュー合成のための強力なツールとして登場した。
本稿では, 外部カメラパラメータを測光残差に対して最適化することにより, 3次元ガウス散乱フレームワークの拡張を提案する。
シミュレーション環境を通して実世界のシーンと複雑な軌道について結果を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:01:15 GMT)
An Animation-based Augmentation Approach for Action Recognition from Discontinuous Video [11.3] コンピュータビジョンの重要な構成要素である行動認識は、複数のアプリケーションにおいて重要な役割を果たす。
CNNは、不連続なビデオフレームでトレーニングされた場合、パフォーマンスの低下に悩まされる。
この問題を克服するために、一連の高度な技術を用いた4Aパイプラインを紹介します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:44:49 GMT)
Physical Simulation for Multi-agent Multi-machine Tending [11.0] 強化学習(RL)は,ロボットが環境とのインタラクションを通じて学習できる,有望なソリューションを提供する。
我々は、シンプルなロボットシステムを活用して、製造環境で大きな高価なロボットをデプロイすることなく、RLと“リアル”なデータで作業しました。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:57:44 GMT)
Can Differentiable Decision Trees Enable Interpretable Reward Learning from Human Feedback? [11.0] 微分決定木(DDT)を用いた嗜好から表現的・解釈可能な報酬関数を学習するための新しいアプローチを提案し,評価する。
CartPole、Visual Gridworld環境、Atariゲームなど、いくつかの領域にわたる実験により、学習した報酬関数のツリー構造が人間の嗜好に合致する範囲を決定するのに有用であることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:23:07 GMT)
Hierarchical uncertainty estimation for learning-based registration in neuroimaging [11.0] 本研究では,空間的位置の程度で推定される不確実性を伝播する原理的手法を提案する。
実験により,脳MRI画像の登録精度が向上することが確認された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:12:16 GMT)
OpenCity: A Scalable Platform to Simulate Urban Activities with Massive LLM Agents [10.9] 大規模言語モデル(LLM)は、前例のないリアリズムで都市活動をシミュレートできるLLMエージェントの開発につながっている。
システムと迅速な効率の両方に最適化されたスケーラブルなシミュレーションプラットフォームであるOpenCityを提案する。
OpenCityは、エージェント毎の600倍のシミュレーション時間、LLM要求の70%の削減、トークン使用の50%の削減を実現している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:52:35 GMT)
Parameter-Efficient Fine-Tuning of State Space Models [10.8] Deep State Space Models (SSM) は言語モデリングの強力なツールとして登場し、効率的な推論とシーケンス長の線形スケーリングを備えたハイパフォーマンスを提供する。
本稿では,パラメータ効率細調整法(PEFT)のSSMモデルへの適用を体系的に研究することを目的とする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:30:28 GMT)
Losing dimensions: Geometric memorization in generative diffusion [10.6] 生成拡散における記憶理論を多様体支援データに拡張する。
理論的および実験的な結果から,異なる臨界時間における記憶効果とデータセットサイズにより,異なる部分空間が失われることが示唆された。
おそらく反故意に、ある条件下では、高い分散の部分空間は、暗記効果によって最初に失われることが分かる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:31:20 GMT)
DEL: Discrete Element Learner for Learning 3D Particle Dynamics with Neural Rendering [10.5] 逆レンダリングにより2次元画像から3次元ダイナミクスを学習する方法を示す。
学習可能なグラフカーネルを古典的な離散要素分析フレームワークに組み込む。
本手法は, 部分的な2次元観察から, 各種材料の力学を効果的に学習することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:57:02 GMT)
Automating Data Annotation under Strategic Human Agents: Risks and Potential Solutions [10.4] 本稿では,機械学習モデルがモデル注釈付きサンプルで再訓練される場合の長期的影響について検討する。
モデルが再訓練されるにつれて、エージェントが肯定的な判断を受けやすいことが分かっています。
そこで本研究では,力学を安定化させる改良されたリトレーニングプロセスを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:37:14 GMT)
Automating Data Annotation under Strategic Human Agents: Risks and Potential Solutions [10.4] 本稿では,機械学習モデルがモデル注釈付きサンプルで再訓練される場合の長期的影響について検討する。
モデルが再訓練されるにつれて、エージェントが肯定的な判断を受けやすいことが分かっています。
そこで本研究では,力学を安定化させる改良されたリトレーニングプロセスを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:37:14 GMT)
Automating Data Annotation under Strategic Human Agents: Risks and Potential Solutions [10.4] 本稿では,機械学習モデルがモデル注釈付きサンプルで再訓練される場合の長期的影響について検討する。
モデルが再訓練されるにつれて、エージェントが肯定的な判断を受けやすいことが分かっています。
そこで本研究では,力学を安定化させる改良されたリトレーニングプロセスを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:37:14 GMT)
Training on Fake Labels: Mitigating Label Leakage in Split Learning via Secure Dimension Transformation [10.4] ふたつのパーティ分割学習は、ラベル推論攻撃を生き残ることが証明されている。
そこで本稿では,既存のラベル推論攻撃を防御する二者分割学習手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:25:21 GMT)
PEDANTS: Cheap but Effective and Interpretable Answer Equivalence [10.4] 我々は,Triviaコミュニティで採用されているマシンQAを評価するために,ルーリックとデータセットを提供する。
また、正確なマッチングとニューラルメソッド(BERTScore)よりも安定な、効率的で解釈可能なQA評価を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:56:36 GMT)
Quantum Operating System Support for Quantum Trusted Execution Environments [10.4] Quantum Trusted Execution Environments (QTEE) は、リモートクラウドベースの量子コンピュータに送信されたユーザの量子回路を保護するために提案されている。
この作業では、クラウドプラットフォーム上でのセキュアな量子タスク実行に必要な、QOSをサポートするための最初のアーキテクチャを導入している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:27:34 GMT)
Enterprise Benchmarks for Large Language Model Evaluation [10.2] 本研究は,大規模言語モデル (LLM) 評価に適したベンチマーク戦略を体系的に検討する。
提案された評価フレームワークは、金融サービス、法律、サイバーセキュリティ、気候と持続可能性など、さまざまなエンタープライズドメインから利用可能な25のデータセットを含んでいる。
異なるエンタープライズタスクにわたる13モデルの多種多様なパフォーマンスは、各タスクの特定の要求に基づいて適切なモデルを選択することの重要性を強調します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:19:05 GMT)
Enhancing Large Language Model-based Speech Recognition by Contextualization for Rare and Ambiguous Words [10.2] 我々は,テキストプロンプトにキーワードを付与することで文脈認識が可能な,大規模言語モデル(LLM)に基づく自動音声認識(ASR)システムを開発した。
我々はデコーダのみのアーキテクチャを採用し、日本語と英語が支配するデータセットをデコーダとして、スクラッチから事前学習した社内LLMであるPLaMo-100Bをデコーダとして使用する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:31:50 GMT)
Efficient, Multimodal, and Derivative-Free Bayesian Inference With Fisher-Rao Gradient Flows [10.2] 正規化定数を含む確率分布の効率的な近似サンプリングについて検討した。
具体的には,科学技術応用における大規模逆問題に対するベイズ推定における問題クラスに着目する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:45:41 GMT)
Efficient Automated Circuit Discovery in Transformers using Contextual Decomposition [10.1] 大規模言語モデルで解釈可能な回路を構築するために,変換器 (CD-T) のコンテキスト分解を導入する。
CD-Tは任意のレベルの抽象化の回路を生成でき、アテンションヘッドと同じくらいきめ細かな回路を最初に生成できる。
CD-T回路は、全てのタスクのベースラインよりも少ないノードで、オリジナルのモデルの動作を完璧に再現できることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:12:22 GMT)
Transferable Unsupervised Outlier Detection Framework for Human Semantic Trajectories [9.8] 本稿では,TOD4Traj(Transferable Outlier Detection for Human Semantic Trajectories)フレームワークを提案する。
ToD4Trajはまず、多様なデータ特徴表現を整合させるモダリティ機能統一モジュールを導入した。
コントラスト学習モジュールは、時間的および集団間の定期的な移動パターンを特定するために、さらにプロポーズされる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:59:35 GMT)
Transferable Unsupervised Outlier Detection Framework for Human Semantic Trajectories [9.8] 本稿では,TOD4Traj(Transferable Outlier Detection for Human Semantic Trajectories)フレームワークを提案する。
ToD4Trajはまず、多様なデータ特徴表現を整合させるモダリティ機能統一モジュールを導入した。
コントラスト学習モジュールは、時間的および集団間の定期的な移動パターンを特定するために、さらにプロポーズされる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:59:35 GMT)
Online-to-PAC generalization bounds under graph-mixing dependencies [9.8] 本稿では,グラフ距離で依存性が崩壊する枠組みを提案する。
オンラインPACフレームワークを活用した一般化バウンダリを導出する。
結果として生じる高確率一般化は、混合率とグラフの色数の両方に依存する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:49:01 GMT)
Optimal Scoring Rule Design under Partial Knowledge [9.8] 本研究では,主成分がエージェントの信号分布の部分的知識を持つ場合の最適スコアリングルールについて検討する。
私たちの設定では、プリンシパルはエージェントの信号分布が属する一連の分布のみを知っています。
分布の集合が有限である場合に最適なスコアリングルールを計算するための効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:34:17 GMT)
Boosting drug-disease association prediction for drug repositioning via dual-feature extraction and cross-dual-domain decoding [9.7] 本稿では,薬物や疾患を表現するためのDual-Feature Drug Repositioning Neural Network(DFDRNN)モデルを提案する。
提案するDFDRNNモデルは,4つのベンチマークデータセット上で6つの最先端手法より優れている。
2つの疾患のケーススタディは、提案したDFDRNNモデルが現実世界のシナリオに適用可能であることを示している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:49:03 GMT)
Foundation Model-Powered 3D Few-Shot Class Incremental Learning via Training-free Adaptor [9.5] 本稿では,3Dポイントクラウド環境におけるFew-Shot連続インクリメンタルラーニング問題に対処する新しい手法を提案する。
私たちは、ポイントクラウドデータに基づいて広範囲にトレーニングされた基礎的な3Dモデルを活用します。
このアプローチでは、二重キャッシュシステムを使用します。まず、モデルの予測にどれだけ自信があるかに基づいて、以前のテストサンプルを使用し、次に、オーバーフィッティングを防ぐために、少数の新しいタスクサンプルを含んでいます。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:23:00 GMT)
Quantum State Group Actions [9.5] 量子状態の集合に作用する群からなる量子状態群作用を探索する。
特定の設定では、統計的(クエリ境界付きでさえも)セキュリティは不可能であり、量子後古典群アクションと類似している。
我々の量子状態群アクションは、2つの既存の量子マネースキームを統合することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:53:38 GMT)
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient [9.5] 状態空間モデル(SSM)をベースとした世界モデルを提案する。
長期依存関係を効果的にキャプチャしながら、メモリと計算の複雑さを$O(n)$達成します。
このモデルはアクセス可能で、市販のラップトップでトレーニングすることができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:10:40 GMT)
AI security and cyber risk in IoT systems [9.5] データ戦略における現在の課題のコンテキストに合わせて、依存関係モデルを提示する。
このモデルは、サイバーリスク評価と一般的なリスク影響評価に使用できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:54:02 GMT)
QEFT: Quantization for Efficient Fine-Tuning of LLMs [9.4] 我々はQEFT(Quantization for Effient Fine-Tuning)と呼ばれる新しい手法を提案する。
QEFTは推論と微調整の両方を加速し、堅牢な理論的基盤によってサポートされ、優れたハードウェア互換性を維持している。
実験の結果,QEFTは完全精度パラメータ効率の良い微調整の品質と汎用性に一致していることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:39:33 GMT)
Graph-based identification of qubit network (GidNET) for qubit reuse [9.4] GidNETは量子回路における量子ビットの再利用を最適化するためのアルゴリズムである。
回路幅の低減において、Qiskitを一貫して上回る。
量子コンピュータの量子ビット数に制限のある解を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:00:11 GMT)
A Block-Based Testing Framework for Scratch [9.4] 自動テストの作成を可能にするブロックのカテゴリをScratchに導入する。
これらのブロックによって、学生や教師もテストを作成し、Scratch環境内で直接フィードバックを受け取ることができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:11:26 GMT)
Guidelines for Fine-grained Sentence-level Arabic Readability Annotation [9.3] Balanced Arabic Readability Evaluation Corpus (BAREC) プロジェクトは、さまざまな可読性レベルに対応する包括的なアラビア語リソースの必要性に対処するために設計されている。
Taha/Arabi21の可読性参照にインスパイアされたBARECは、19の異なるレベルにわたる文レベルのアラビア文字の可読性を評価するための標準化された参照を提供することを目指している。
本稿は,10,631文・フレーズ(113,651語)の分析を通じて,本ガイドラインに焦点をあてたものである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:59:46 GMT)
Cross-Modal Bidirectional Interaction Model for Referring Remote Sensing Image Segmentation [9.1] リモートセンシング画像セグメンテーション(RRSIS)の目標は、参照式によって識別された対象オブジェクトの画素レベルマスクを生成することである。
上記の課題に対処するため、クロスモーダル双方向相互作用モデル(CroBIM)と呼ばれる新しいRRSISフレームワークが提案されている。
RRSISの研究をさらに推し進めるために、52,472個の画像言語ラベル三重項からなる新しい大規模ベンチマークデータセットRISBenchを構築した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:28:04 GMT)
Boosting Open-Vocabulary Object Detection by Handling Background Samples [9.1] 背景サンプルの処理におけるCLIPの限界に対処する新しい手法を提案する。
本稿では,部分的領域を前景として誤分類する問題に対処するために,部分的オブジェクト抑圧(POS)を導入する。
提案手法は,様々な開語彙検出器の性能向上を実現することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:15:50 GMT)
Maximizing the Potential of Synthetic Data: Insights from Random Matrix Theory [8.7] 実データと合成データを混合して学習したバイナリ分類器の性能を,ランダム行列理論を用いて導出する。
本研究は, 生成モデルの品質と検証戦略に焦点をあてて, 合成データにより性能が向上する条件を明らかにした。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:09:27 GMT)
Leveraging Internet Principles to Build a Quantum Network [8.6] 本稿では,パケットスイッチングに基づく量子ネットワークアーキテクチャを,従来のインターネットと類似して提案する。
例として、古典的な混雑制御とアクティブキュー管理プロトコルを量子ネットワークに適合させ、適応させる。
その結果、これらの古典的ネットワーキングツールは、量子メモリのデコヒーレンスとの戦いに効果的に利用でき、エンド・ツー・エンドの忠実度を目標値に維持できることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:55:10 GMT)
ProDAG: Projection-Induced Variational Inference for Directed Acyclic Graphs [8.6] 直接非巡回グラフ(DAG)学習は急速に研究の領域を広げている。
データから単一の(点推定)DAGを学習することは統計的かつ計算的に困難であり、もちろん不確実な定量化を提供する。
本稿では,DAGの空間を直接支援する新しい分布に基づくベイズ変分推論フレームワークを開発することで,グラフの不確かさを定量化する難しい課題について論じる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:28:11 GMT)
PH-Dropout: Prctical Epistemic Uncertainty Quantification for View Synthesis [8.5] 本稿では,最初のリアルタイムかつ高精度な疫学不確実性推定手法であるPH-Dropoutを紹介する。
本稿では,関数近似の観点からNeRF法とGS法を再検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:57:04 GMT)
PH-Dropout: Practical Epistemic Uncertainty Quantification for View Synthesis [8.5] 本稿では,最初のリアルタイムかつ高精度な疫学不確実性推定手法であるPH-Dropoutを紹介する。
本稿では,関数近似の観点からNeRF法とGS法を再検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:57:04 GMT)
Zero-Shot Pupil Segmentation with SAM 2: A Case Study of Over 14 Million Images [8.5] 本稿では、視線推定と視線追跡技術の進歩において、視基盤モデルSAM 2の変換可能性について検討する。
私たちはSAM 2を、VRセットアップやウェアラブルアイトラッカーを使用して記録された世界最大の統合データセットを含む、さまざまなデータセットから1400万以上のアイイメージでテストしました。
注目すべきは、瞳孔分割タスクにおいてSAM 2は、目の画像のみに基づいて訓練されたドメイン固有モデルのパフォーマンスと一致し、微調整なしで、最大93%の得点を達成していることである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:50:53 GMT)
Exploiting Memory-aware Q-distribution Prediction for Nuclear Fusion via Modern Hopfield Network [8.3] 本稿では,現代ホップフィールドネットワークを応用し,歴史写真から連想記憶を取り入れた革新的なディープラーニングフレームワークを提案する。
本稿では,Q-ディストリビューション予測の強化におけるアプローチの有効性を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:05:52 GMT)
TD-Paint: Faster Diffusion Inpainting Through Time Aware Pixel Conditioning [8.3] Time-Aware Diffusion Paint (TD-Paint) は、画素レベルでの可変ノイズレベルをモデル化することによって拡散プロセスに適応する新しいアプローチである。
専用のアーキテクチャや高価な生成ループを必要とする従来の拡散ベースの塗装モデルとは異なり、TD-Paintはアーキテクチャの変更なしにより高速なサンプリング時間を実現する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:46:56 GMT)
nach0-pc: Multi-task Language Model with Molecular Point Cloud Encoder [8.1] nach0-pcは、ドメイン固有のエンコーダとテキスト表現を組み合わせて、原子の空間配置を効果的に処理するモデルである。
本稿では,空間分子構造データセットから知識を抽出するための,分子点雲のための新しい事前学習手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:30:44 GMT)
CYCLE: Cross-Year Contrastive Learning in Entity-Linking [8.1] textbfCYCLE: textbfCross-textbfYear textbfContrastive textbfLearning for textbfEntity-Linking
textbfCYCLE: textbfCross-textbfYear textbfContrastive textbfLearning for textbfEntity-Linkingを紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:41:54 GMT)
Mark My Words: Analyzing and Evaluating Language Model Watermarks [8.0] この研究は、画像やモデル透かしとは対照的に、出力透かし技術に焦点を当てている。
品質、サイズ(透かしを検出するのに必要となるトークンの数)、抵抗の改ざんという3つの主要な指標に注目します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:36:28 GMT)
Optimized Biomedical Question-Answering Services with LLM and Multi-BERT Integration [8.0] 本稿では,大規模言語モデル(LLM)とマルチBERT構成を統合することにより,バイオメディカル質問応答(QA)サービスを改良したアプローチを提案する。
このシステムは、大量の複雑なバイオメディカルデータを処理し、優先順位付けする能力を高めることで、医療従事者がより良い患者結果と情報提供を行うための支援を目指している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:13:31 GMT)
Unsupervised Human Preference Learning [8.0] 大きな言語モデルは印象的な推論能力を示しているが、パーソナライズされたコンテンツを提供するのに苦労している。
文脈内学習やパラメータ効率のよい微調整といった既存の手法は、人間の嗜好の複雑さを捉えるには不十分である。
そこで本研究では,より大規模で事前学習されたモデルを示す自然言語規則を生成するために,小パラメータモデルを選好エージェントとして活用する手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:53:56 GMT)
Developing a Pragmatic Benchmark for Assessing Korean Legal Language Understanding in Large Language Models [7.8] 大規模言語モデル (LLM) は法域において顕著な性能を示した。
しかし、その効力は英語以外の言語における非標準化されたタスクやタスクに限られている。
このことは、適用前に各法体系内でのLCMの慎重な評価の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:41:02 GMT)
Task-Specific Adaptation of Segmentation Foundation Model via Prompt Learning [7.6] 本稿では,Segment Anything Model(SAM)に適合した即時学習によるセグメンテーション基礎モデルのタスク固有適応を提案する。
本手法は,入力プロンプトを組込み空間に調整し,目的タスクの特異性に適合させるプロンプト学習モジュールを含む。
様々なセグメンテーションシナリオに対する実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:37:07 GMT)
Natural Language Counterfactual Explanations for Graphs Using Large Language Models [7.6] 我々は、オープンソースのLarge Language Modelsの力を利用して、自然言語の説明を生成する。
提案手法は, 対実例の正確な自然言語表現を効果的に生成することを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:06:07 GMT)
Deeper Insights into Deep Graph Convolutional Networks: Stability and Generalization [7.5] グラフ畳み込みネットワーク(GCN)は、グラフ学習タスクの強力なモデルとして登場した。
深部GCNの安定性と一般化特性について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:57:47 GMT)
IGNN-Solver: A Graph Neural Solver for Implicit Graph Neural Networks [7.5] 入射グラフニューラルネットワーク(IGNN)は単一の層で強い表現力を示す。
グラフ依存時間プロセスとして更新を学習し,GNNによってパラメータ化される一般化されたAnderson Acceleration法を利用する新しいグラフニューラルソルバIGNN-rを提案する。
実験では、IGNN-rは推論を著しく加速し、精度を犠牲にすることなく1.5times$から8times$スピードアップを達成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:55:08 GMT)
Prediction by Machine Learning Analysis of Genomic Data Phenotypic Frost Tolerance in Perccottus glenii [7.4] 我々はPerccottus gleniiの遺伝子配列解析に機械学習技術を用いる。
我々はRandom Forest, LightGBM, XGBoost, Decision Treeの4つの分類モデルを構築した。
これらの分類モデルで使用されるデータセットは、National Center for Biotechnology Informationデータベースから抽出された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:45:47 GMT)
Explainable Attention for Few-shot Learning and Beyond [7.0] 本稿では,説明可能な難易度発見,特に数発の学習シナリオに適した新しいフレームワークを提案する。
提案手法では、深層強化学習を用いて、生の入力データに直接影響するハードアテンションの概念を実装している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:19:24 GMT)
Scheherazade: Evaluating Chain-of-Thought Math Reasoning in LLMs with Chain-of-Problems [7.0] Scheherazadeは、論理的連鎖問題により、挑戦的な数学的推論ベンチマークを生成するための自動アプローチである。
その結果,フロンティアモデルの性能低下はわずか数問の連鎖で急激に低下するが,予備評価では,最大5問の逆連鎖が継続することが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:44:53 GMT)
Scheherazade: Evaluating Chain-of-Thought Math Reasoning in LLMs with Chain-of-Problems [7.0] Scheherazadeは、論理的連鎖問題により、挑戦的な数学的推論ベンチマークを生成するための自動アプローチである。
その結果,フロンティアモデルの性能低下はわずか数問の連鎖で急激に低下するが,予備評価では,最大5問の逆連鎖が継続することが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:44:53 GMT)
Scheherazade: Evaluating Chain-of-Thought Math Reasoning in LLMs with Chain-of-Problems [7.0] Scheherazadeは、論理的連鎖問題により、挑戦的な数学的推論ベンチマークを生成するための自動アプローチである。
その結果,フロンティアモデルの性能低下はわずか数問の連鎖で急激に低下するが,予備評価では,最大5問の逆連鎖が継続することが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:44:53 GMT)
Decoding Secret Memorization in Code LLMs Through Token-Level Characterization [6.9] コード大言語モデル(LLM)は、プログラムコードの生成、理解、操作において顕著な能力を示した。
LLMは必然的に機密情報の記憶につながり、深刻なプライバシーリスクを生じさせる。
トークン確率に基づいて,コードLLMが生成した実・偽の秘密を特徴付ける新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:39:24 GMT)
AdvDiffuser: Generating Adversarial Safety-Critical Driving Scenarios via Guided Diffusion [6.9] AdvDiffuserは、ガイド付き拡散を通じて安全クリティカルな運転シナリオを生成するための敵対的なフレームワークである。
本稿では,AdvDiffuserが最小限のウォームアップエピソードデータを持つ様々なテストシステムに適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:03:21 GMT)
The Social Impact of Generative LLM-Based AI [6.9] 我々は、人工知能(AI)が経済生産と社会生活を支配している人類の歴史の新しい段階に入る可能性が高い。
米国と中国がこの分野をリードし、世界でAIを独占する主要な競争相手になることを示す良い兆候がある。
AI革命は、知識そのものが今日の世界よりも重要でなくなるポスト知識社会を生み出します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:26:44 GMT)
Comparative Analysis of Static and Contextual Embeddings for Analyzing Semantic Changes in Medieval Latin Charters [6.9] 本稿では,意味変化の前と後のコンクエストに関する最初の計算解析について述べる。
これは、わずかな歴史的データセットにおける静的な埋め込みと文脈的な埋め込みを体系的に比較した最初のものである。
既存の研究と一致して,文脈埋め込みは意味変化を捉える上で,静的な単語埋め込みよりも優れていたことが確認された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:19:17 GMT)
Hespi: A pipeline for automatically detecting information from hebarium specimen sheets [6.7] Hespiは、デジタル画像から、ハーバリウム標本の機関ラベルの収集データのカタログ前サブセットを抽出する。
パイプラインはテキストベースの機関ラベルを印刷、タイプ、手書き、または組み合わせとして分類する。
Hespiは、国際的な草原から標本シート画像を含むテストデータセットのテキストを正確に検出し、抽出する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:59:40 GMT)
Towards Cross-domain Few-shot Graph Anomaly Detection [6.7] ソースとターゲットドメイン間のデータ分散の相違により、クロスドメインの少数ショットグラフ異常検出(GAD)は簡単ではない。
我々は,上記の課題に対処するために,CDFS-GADと呼ばれるシンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:47:25 GMT)
Words as Beacons: Guiding RL Agents with High-Level Language Prompts [6.7] 大型言語モデル(LLM)は「教師」として、複雑なタスクをサブゴールに分解することでエージェントの学習プロセスを導く。
LLMは、人間と同じような方法で、環境のために定義されたタスクを達成するためのサブゴールを提供することができる。
トレーニングフェーズの間のみLLMに問い合わせることができ、エージェントはLLMの介入なしに環境内で操作できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:54:45 GMT)
Measuring the Inconsistency of Large Language Models in Preferential Ranking [6.7] 本研究では、一貫した順序的嗜好を提供するための大規模言語モデルの能力について検討する。
順序理論に基づく一貫性の形式化を導入し、推移性、非対称性、可逆性、無関係な代替品からの独立性などの基準を概説する。
これらの基準を満たすことができず, 位置バイアスが強く, 移動度が低いことが示唆された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:27:18 GMT)
Sui Generis: Large Language Models for Authorship Attribution and Verification in Latin [6.7] この研究は、LLMが短いテキストであってもゼロショットのオーサシップ検証において堅牢であることを示します。
実験では、モデルのオーサシップ分析と意思決定の運営が難しいことも示している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:41:49 GMT)
Bridging the gap: Towards an Expanded Toolkit for AI-driven Decision-Making in the Public Sector [6.7] AIによる意思決定システムは、刑事司法、社会福祉、金融詐欺検出、公衆衛生などの分野に適用される。
これらのシステムは、機械学習(ML)モデルと公共セクターの意思決定の複雑な現実を整合させるという課題に直面している。
本稿では,データ側における分散シフトやラベルバイアス,過去の意思決定の影響,モデル出力側における競合する目標や人道支援など,不一致が発生する可能性のある5つの重要な課題について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:16:46 GMT)
An Ordinal Diffusion Model for Generating Medical Images with Different Severity Levels [6.6] クラス間における推定ノイズ画像の順序関係を制御できる順序拡散モデル(ODM)を提案する。
複数の重度クラスの網膜および内視鏡像を作製し,本モデルの有効性を実験的に評価した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:14:49 GMT)
Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges [6.6] LLM-as-a-judgeパラダイムは,大規模言語モデルを評価するアプローチとして急速に普及している。
本稿では,人間間の合意が高いクリーンなシナリオに焦点を当てる。
我々は、複雑性や長さを早めるための感度や、寛大さへの傾向など、審査モデルの脆弱性を識別する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:29:18 GMT)
PEAR: A Robust and Flexible Automation Framework for Ptychography Enabled by Multiple Large Language Model Agents [6.6] 実際には、高品質な画像を得るには、多数の実験パラメータとアルゴリズムパラメータを同時に最適化する必要がある。
本研究では,大規模言語モデル(LLM)を活用し,画像解析におけるデータ解析を自動化するフレームワークを開発する。
本研究は,PEARのマルチエージェント設計が,より小さなオープンウェイトモデルであっても,ワークフローの成功率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:50:59 GMT)
Diffusion-Based Depth Inpainting for Transparent and Reflective Objects [6.6] 本稿では,透過的および反射的オブジェクトに特化して設計された拡散型深度塗布フレームワークを提案する。
DITRは、堅牢な適応性を持つ透明で反射性のある物体の奥行き塗装に非常に効果的である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:45:15 GMT)
A Methodology for Evaluating RAG Systems: A Case Study On Configuration Dependency Validation [6.5] Retrieval-augmented Generation(RAG)は、異なるコンポーネント、設計決定、ドメイン固有の適応の傘である。
現在、RAG評価の方法論は一般に受け入れられていないが、この技術への関心は高まりつつある。
本稿では,RAGシステムの健全かつ信頼性の高い評価手法の最初の青写真を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:36:13 GMT)
FairQuant: Certifying and Quantifying Fairness of Deep Neural Networks [6.2] 本稿では,ディープニューラルネットワーク(DNN)の個人的公正性を正式に証明し,定量化する手法を提案する。
個人的公正性は、法的に保護された属性(例えば、性別や人種)を除いて同一の2つの個人が同じ処置を受けることを保証している。
提案手法を実装し,4つの人気フェアネス研究データセットを用いて評価した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:45:26 GMT)
Clustering MOOC Programming Solutions to Diversify Their Presentation to Students [6.2] 多くのMOOCは、単に最新のソリューションを示し、その多様性や品質を無視し、生徒の学習機会を妨げる。
JPlagを人気のあるMOOCプラットフォームであるHyperskill上のPythonのサブミッションに適用した。
我々はRhubarbという独自のツールを開発し、アルゴリズム的に同じ解を標準化し、それらの間の構造認識編集距離を計算し、クラスタリングを適用した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:45:33 GMT)
Towards Understanding Why Label Smoothing Degrades Selective Classification and How to Fix It [6.2] ラベルスムーシング(LS)はニューラルネットワークをトレーニングするための一般的な正規化手法である。
まず、LSが選択的分類を一貫して劣化させる広範囲の大規模タスクを経験的に実証する。
次に,LSによる失われたSCの回復に対するポストホックロジット正規化の有効性を実証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:57:50 GMT)
AuD-Former: A Hierarchical Transformer Network for Multimodal Audio-Based Disease Prediction [6.2] 生体音響モダリティ内の様々な領域の機能を統合したマルチモーダル融合は,診断性能の向上に有効であることが証明された。
この分野の既存の手法のほとんどは、モーダル内またはモーダル間融合にのみ焦点をあてる一方的な融合戦略を採用している。
一般的なマルチモーダルオーディオベースの疾患予測のために設計された階層型トランスフォーマーネットワークであるAuD-Formerを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:37:52 GMT)
Optimal Downsampling for Imbalanced Classification with Generalized Linear Models [6.1] 一般化線形モデル(GLM)を用いた不均衡分類のための最適ダウンサンプリングについて検討する。
疑似疑似推定器を提案し,その正規性について,不均衡な人口の増加の文脈で検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:08:13 GMT)
Simultaneous Reward Distillation and Preference Learning: Get You a Language Model Who Can Do Both [6.1] ダイレクトリワード蒸留とポリシー最適化(DRDO)は、知識蒸留に基づく選好アライメント手法である。
DRDOは、新規な嗜好確率の定式化から人間の嗜好を学習しながら、託宣によって割り当てられた報酬を直接模倣する。
Ultrafeedback と TL;DR データセットに関する実験結果から,DRDO を用いてトレーニングしたポリシーが従来の手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:19:11 GMT)
A tutorial on automatic differentiation with complex numbers [6.1] このチュートリアルは、ユーザーや開発者にとっても、カスタムのグラデーション伝搬ルールを実装する際に、複雑な値を真剣に扱うための呼び出しである。
本稿では,複素数を用いた前方・逆モード自動微分について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:05:50 GMT)
skscope: Fast Sparsity-Constrained Optimization in Python [6.1] 本稿では,空間制約付き最適化(SCO)問題を解くためのライブラリ・スコープを提案する。
スコープの利便性は、論文の2つの例を通して示される。
数値実験により、スコスコープで利用可能な解法は最大80倍のスピードアップを達成できることが明らかになった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:42:14 GMT)
The Design Space of in-IDE Human-AI Experience [6.1] 主な発見は、よりパーソナライズされ、積極的に、信頼性の高いAIシステムの必要性を強調している。
われわれの調査によると、Adoptersは高度な機能と非断続的な統合を歓迎しているが、Churnersは信頼性とプライバシの改善の必要性を強調している。
非ユーザとは対照的に、採用の障壁として、スキル開発と倫理的懸念に焦点を当てます。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:02:52 GMT)
Exploiting Estimation Bias in Clipped Double Q-Learning for Continous Control Reinforcement Learning Tasks [6.0] 本稿では,連続制御タスクに対するアクター・クライブ法における推定バイアスの対処と活用に焦点を当てた。
RLエージェントのトレーニング中に最も有利な推定バイアスを動的に選択するためのBias Exploiting (BE) 機構を設計する。
多くの最先端のDeep RLアルゴリズムはBE機構を備えており、性能や計算の複雑さを妨げない。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:42:43 GMT)
TopoTune : A Framework for Generalized Combinatorial Complex Neural Networks [6.0] 一般化されたCCNNは、任意の(グラフ)ニューラルネットワークをトポロジカルディープラーニングに変換するために使用することができる。
TDLを加速し、民主化するために、私たちは、実践者が前例のない柔軟性と容易さでGCCNを定義し、構築し、訓練できる軽量ソフトウェアであるTopoTuneを紹介します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:22:11 GMT)
TopoTune : A Framework for Generalized Combinatorial Complex Neural Networks [6.0] 一般化されたCCNNは、任意の(グラフ)ニューラルネットワークをトポロジカルディープラーニングに変換するために使用することができる。
TDLを加速し、民主化するために、私たちは、実践者が前例のない柔軟性と容易さでGCCNを定義し、構築し、訓練できる軽量ソフトウェアであるTopoTuneを紹介します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:22:11 GMT)
FogGuard: guarding YOLO against fog using perceptual loss [5.9] FogGuard(フォグガード)は、霧の天候によって引き起こされる課題に対処するために設計された、霧を意識した物体検出ネットワークである。
FogGuardは、YOLOv3をベースラインアルゴリズムとして組み込むことで、シーン内の霧の状態を補償する。
我々のネットワークは、RTTSデータセット上でのYOLOv3の57.78%と比較して、69.43%のmAPを達成した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:11:13 GMT)
Unsupervised Human Preference Learning [5.6] 大きな言語モデルは印象的な推論能力を示しているが、パーソナライズされたコンテンツを提供するのに苦労している。
文脈内学習やパラメータ効率のよい微調整といった既存の手法は、人間の嗜好の複雑さを捉えるには不十分である。
そこで本研究では,より大規模で事前学習されたモデルを示す自然言語規則を生成するために,小パラメータモデルを選好エージェントとして活用する手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:53:56 GMT)
Do we need rebalancing strategies? A theoretical and empirical study around SMOTE and its variants [5.6] SMOTE(Synthetic Minority Oversampling Technique)は、不均衡なデータセットを扱うための一般的なリバランス戦略である。
我々は2つの新しいSMOTE関連戦略を導入し、それらを最先端のリバランシング手順と比較する。
ほとんどのデータセットでは、リバランス戦略を適用することは予測性能の点で競争力がある。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:27:09 GMT)
Super Resolution Based on Deep Operator Networks [5.5] 我々はDeep Operator Networks (DeepONets) を用いて、2種類の偏微分方程式の解の超分解能再構成を行う。
1次元と2次元の両方の場合、DeepONetモデルを用いた超解像再構成は立方体スプラインよりもはるかに正確である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:29:27 GMT)
Precise Asymptotics of Bagging Regularized M-estimators [5.2] 我々は,アンサンブル推定器の正方形予測リスクを,正規化M値推定器のサブタグ化(サブサンプルブートストラップ集約)により特徴付ける。
我々の分析の鍵は、重なり合うサブサンプル上の推定値と残差との相関関係の結合挙動に関する新しい結果である。
サブサンプルサイズ,アンサンブルサイズ,正規化の併用最適化は,全データに対してのみ,正規化器の最適化を著しく上回る。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:44:26 GMT)
One Step at a Time: Combining LLMs and Static Analysis to Generate Next-Step Hints for Programming Tasks [5.1] 学生はプログラミングを学ぶとき、特にオンラインでやらなければならないとき、プログラミングの問題を解決するのに苦労することが多い。
このヘルプは次のステップのヒント生成として提供され、生徒が次にすべき小さなステップを教えて、正しいソリューションを得る。
本稿では,プログラムタスクのためのテキストヒントとコードヒントの両方を提供する新しいシステムを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:41:57 GMT)
Linear Convergence of Diffusion Models Under the Manifold Hypothesis [5.0] クルバック・リーブラー(KL)の発散に収束するステップの数は、内在次元$Leid$における線型(対数項まで)であることが示される。
また、この線形依存は鋭いことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:58:30 GMT)
Mastering Contact-rich Tasks by Combining Soft and Rigid Robotics with Imitation Learning [5.0] ソフトロボットはロボットシステムの利用に革命をもたらす可能性がある。
従来の剛体ロボットは高い精度と再現性を提供するが、ソフトロボットの柔軟性は欠如している。
この研究は、剛性マニピュレータと完全に発達したソフトアームを統合する、新しいハイブリッドロボットプラットフォームを提示する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:41:00 GMT)
Mastering Contact-rich Tasks by Combining Soft and Rigid Robotics with Imitation Learning [5.0] ソフトロボットはロボットシステムの利用に革命をもたらす可能性がある。
従来の剛体ロボットは高い精度と再現性を提供するが、ソフトロボットの柔軟性は欠如している。
この研究は、剛性マニピュレータと完全に発達したソフトアームを統合する、新しいハイブリッドロボットプラットフォームを提示する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:41:00 GMT)
Simulation-based inference with scattering representations: scattering is all you need [5.0] 本稿では,画像を用いたシミュレーションに基づく推論において,さらなる圧縮を伴わない散乱表現の初成功例を示す。
空間平均化とより表現力のある密度推定器を組み合わせることでこれを克服する。
予想通り、散乱のみが従来の2次要約統計よりも多くの情報を引き出すことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:09:46 GMT)
Synthetic Students: A Comparative Study of Bug Distribution Between Large Language Models and Computing Students [4.9] 大規模言語モデル(LLM)は、合成教室データを生成するエキサイティングな機会を提供する。
本研究では,LLMが生成するバグの分布を,コンピュータ学生が生成するバグとは対照的に検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:51:58 GMT)
pLDDT-Predictor: High-speed Protein Screening Using Transformer and ESM2 [4.9] 我々は、事前訓練されたESM2タンパク質の埋め込みとTransformerアーキテクチャを活用することでギャップを埋める高速なタンパク質スクリーニングツールであるpLDDT-Predictorを紹介する。
実験の結果,pLDDT-Predictorはタンパク質の90%以上をpLDDTスコア70以上で分類できることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:19:44 GMT)
Post Training Quantization of Large Language Models with Microscaling Formats [4.7] SmoothQuant, AWQ, GPTQの3つの有名なポストトレーニング手法の併用について検討した。
異なるPTQ手法を組み合わせることで、4ビットの重みと8ビットのアクティベーションにモデルを量子化できることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:34:07 GMT)
Multi-Source Temporal Attention Network for Precipitation Nowcasting [4.7] 降水量は様々な産業で重要であり、気候変動の緩和と適応に重要な役割を果たしている。
降水量予測のための効率的な深層学習モデルを導入し,既存の運用モデルよりも高い精度で降雨を最大8時間予測する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:09:07 GMT)
Robust Offline Policy Learning with Observational Data from Multiple Sources [4.7] そこで本研究では,ソース分布の一般混合下での一意に低い後悔を保証するために,ミニマックス後悔最適化手法を提案する。
我々は,この目的に合わせたポリシー学習アルゴリズムを開発し,2つの頑健なオフラインポリシー評価手法と,最小限の最適化のための非回帰学習アルゴリズムを組み合わせた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:16:23 GMT)
Uncertainty-Aware Optimal Treatment Selection for Clinical Time Series [4.7] 本稿では,非現実的推定手法と不確実性定量化を組み合わせた新しい手法を提案する。
本手法は2つのシミュレーションデータセットを用いて検証し,1つは心血管系,もう1つはCOVID-19に焦点を当てた。
提案手法は, 異なる推定基準値にまたがって頑健な性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:56:25 GMT)
Public Transport Network Design for Equality of Accessibility via Message Passing Neural Networks and Reinforcement Learning [4.6] 我々は公共交通機関(PT)のアクセシビリティ、すなわちPTを介して周囲の関心点にたどり着くことに注力する。
我々は、最先端のメッセージパッシングニューラルネットワーク(MPNN)と強化学習を組み合わせる。
モントリオール市におけるメタヒューリスティックス(メタヒューリスティックス,メタヒューリスティックス,メタヒューリスティックス,メタヒューリスティックス,メタヒューリスティックス)に対する手法の有効性を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:16:58 GMT)
Online design of dynamic networks [4.6] 本稿では,動的ネットワークのオンライン設計手法を提案する。
我々はモンテカルロ木探索に基づく転がり地平線で、このオンラインデザイン問題に取り組む。
オンラインネットワーク設計の可能性は、未来的な公共交通ネットワークの設計のために示される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:50:31 GMT)
Multi-dimensional Evaluation of Empathetic Dialog Responses [4.6] 話者の視点から表現された意図と聴取者の視点から認識された共感の両方を測定するための多次元共感評価フレームワークを提案する。
両次元が相互接続されているのに対して,共感は対話満足度と高い相関関係にあることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:30:05 GMT)
VLM See, Robot Do: Human Demo Video to Robot Action Plan via Vision Language Model [4.6] 視覚言語モデル(VLM)は、常識推論と一般化可能性において、ロボット工学に採用されている。
本研究では,VLMを用いて人間のデモ映像を解釈し,ロボットによるタスク計画を生成する。
これは、VLMが人間によるデモンストレーションを「見る」ことができ、それに対応する計画をロボットに「見る」ように説明できるためである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:17:52 GMT)
Facial Chick Sexing: An Automated Chick Sexing System From Chick Facial Image [4.4] 本研究では, 顔の性別分類技術に触発された, 顔のニワトリの性別分類手法を提案する。
我々は、データ収集、顔とキーポイントの検出、顔のアライメント、分類を含む、訓練と推論のための総合的なシステムを開発する。
本実験は, 将来のニワトリの性行為の実践において, 81.89%の精度で有望な生存可能性を示すものである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:02:34 GMT)
On the Hypomonotone Class of Variational Inequalities [4.2] 本研究では,低単調な演算子に適用した場合の過次アルゴリズムの挙動について検討する。
次数次アルゴリズムが収束しない条件を特定するための評価定理を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:35:48 GMT)
oRetrieval Augmented Generation for 10 Large Language Models and its Generalizability in Assessing Medical Fitness [4.1] 大規模言語モデル(LLM)は医学的応用の可能性を示すが、専門的な臨床知識が欠如していることが多い。
Retrieval Augmented Generation (RAG)は、ドメイン固有の情報によるカスタマイズを可能にし、医療に適している。
本研究は,手術適応の判定と術前指導におけるRAGモデルの精度,整合性,安全性について検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:34:20 GMT)
Obelia: Scaling DAG-Based Blockchains to Hundreds of Validators [4.1] ObeliaはDAGベースのコンセンサスプロトコルを改良し、エビデンス・オブ・テイクシステムで使用される。
我々はObeliaがオリジナルのプロトコルに比べて可視的オーバーヘッドを導入していないことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:42:10 GMT)
AdaptEval: Evaluating Large Language Models on Domain Adaptation for Text Summarization [4.1] 本研究では,多言語モデル(LLM)のドメイン適応能力について,各ドメイン間の要約タスクで評価する。
本稿では、最初のドメイン適応評価スイートであるAdaptEvalを紹介する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:23:43 GMT)
Revisiting Hierarchical Text Classification: Inference and Metrics [4.1] 階層的テキスト分類(階層的テキスト分類、hierarchical text classification)は、階層として整理された構造化空間内のテキストにラベルを割り当てるタスクである。
最近の研究は、HTCを従来のマルチラベル分類問題として扱い、そのように評価している。
本稿では,特に設計した階層的指標に基づくモデルの評価を提案し,計量選択と予測推定手法の複雑さを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:44:28 GMT)
Revisiting Hierarchical Text Classification: Inference and Metrics [4.1] 階層的テキスト分類(階層的テキスト分類、hierarchical text classification)は、階層として整理された構造化空間内のテキストにラベルを割り当てるタスクである。
最近の研究は、HTCを従来のマルチラベル分類問題として扱い、そのように評価している。
本稿では,特に設計した階層的指標に基づくモデルの評価を提案し,計量選択と予測推定手法の複雑さを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:44:28 GMT)
Testing the Unknown: A Framework for OpenMP Testing via Random Program Generation [4.0] OpenMP の実装をテストするためのランダム化差分テスト手法を提案する。
文法を用いてランダムなOpenMPテストの空間を表現し、Varityプログラムジェネレータの拡張として実装する。
1,800のOpenMPテストを生成することで、さまざまなパフォーマンス異常と正当性の問題が見つかる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:47:45 GMT)
CAnDOIT: Causal Discovery with Observational and Interventional Data from Time-Series [4.0] CAnDOITは、観測データと介入データの両方を用いて因果モデルを再構築する因果発見手法である。
因果解析における介入データの利用は、ロボット工学のような現実世界の応用には不可欠である。
CAnDOITのPython実装も開発され、GitHubで公開されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:48:39 GMT)
CAnDOIT: Causal Discovery with Observational and Interventional Data from Time-Series [4.0] CAnDOITは、観測データと介入データの両方を用いて因果モデルを再構築する因果発見手法である。
因果解析における介入データの利用は、ロボット工学のような現実世界の応用には不可欠である。
CAnDOITのPython実装も開発され、GitHubで公開されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:48:39 GMT)
CAnDOIT: Causal Discovery with Observational and Interventional Data from Time-Series [4.0] CAnDOITは、観測データと介入データの両方を用いて因果モデルを再構築する因果発見手法である。
因果解析における介入データの利用は、ロボット工学のような現実世界の応用には不可欠である。
CAnDOITのPython実装も開発され、GitHubで公開されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:48:39 GMT)
Wikimedia data for AI: a review of Wikimedia datasets for NLP tasks and AI-assisted editing [4.0] 我々は,Wikimediaデータを学習前,訓練後,モデル評価にまたがるNLPタスクで使用する方法について検討する。
我々は、ウィキメディアデータの追加ソースの導入、ウィキメディアの原則を符号化するLLMのベンチマークの強化、ウィキメディア由来のデータセットにおける多言語主義の強化を訴える。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:46:09 GMT)
Reflected multi-entropy and its holographic dual [3.9] 正準精製による多エントロピーの混合状態一般化を提案する。
三部式の場合、大きめの$c$制限でツイスト作用素の6点関数を用いて場理論計算を行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:53:36 GMT)
Auditing Differential Privacy Guarantees Using Density Estimation [3.8] DP機構の差分プライバシー保証を正確に評価するための新しい手法を提案する。
特に、我々のソリューションは、機械学習(ML)モデルのDP保証の監査に適用できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:06:32 GMT)
Approximating Two-Layer ReLU Networks for Hidden State Analysis in Differential Privacy [3.8] DP-SGDで訓練した1つの隠蔽層ReLUネットワークに匹敵する,プライバシユーティリティトレードオフによる凸問題をプライベートにトレーニングすることが可能である。
ベンチマーク分類タスクの実験により、NoisyCGDは1層ReLUネットワークに適用されたDP-SGDに匹敵するプライバシー利用トレードオフを達成できることが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:26:44 GMT)
BiomedBench: A benchmark suite of TinyML biomedical applications for low-power wearables [3.8] 本稿では,ウェアラブルデバイスを用いた患者のリアルタイムモニタリングのための,エンド・ツー・エンドのTinyMLバイオメディカル・アプリケーションからなる新しいベンチマークスイートを提案する。
エネルギー効率の観点から5つの最先端低消費電力プラットフォームの評価を行ったところ,現代のプラットフォームはあらゆる種類のバイオメディカル応用を効果的にターゲットできないことがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:07:03 GMT)
HpEIS: Learning Hand Pose Embeddings for Multimedia Interactive Systems [3.8] 仮想センサとしてHpEIS(Hand-pose Embedding Interactive System)を提案する。
ユーザのフレキシブルな手ポーズを、さまざまな手ポーズでトレーニングされた変分オートエンコーダを使用して、2次元の視覚空間にマッピングする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:51:54 GMT)
Audio Description Generation in the Era of LLMs and VLMs: A Review of Transferable Generative AI Technologies [3.6] オーディオ記述(AD)は、視覚障害者や視覚障害者がデジタルメディアコンテンツにアクセスするのを支援するために設計された音響注釈として機能する。
自然言語処理(NLP)とコンピュータビジョン(CV)の進歩により、自動AD生成に一歩近づいた。
本稿では,大規模言語モデル (LLM) と視覚言語モデル (VLM) の時代におけるAD生成に関連する技術についてレビューする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:40:51 GMT)
FMRFT: Fusion Mamba and DETR for Query Time Sequence Intersection Fish Tracking [3.6] 本稿では,複雑なマルチシナリオ・スタージョン追跡データセットを確立する。
リアルタイムの魚追跡ソリューションであるFMRFTモデルを導入している。
このモデルは、ビデオメモリ消費の少ないMamba In Mambaアーキテクチャを取り入れている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:03:04 GMT)
CVAM-Pose: Conditional Variational Autoencoder for Multi-Object Monocular Pose Estimation [3.5] 剛体物体のポーズを推定することはコンピュータビジョンの基本的な問題の一つである。
本稿では,多目的単分子ポーズ推定のための新しいアプローチCVAM-Poseを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:26:27 GMT)
Conditional Motional Squeezing of an Optomechanical Oscillator Approaching the Quantum Regime [3.5] この研究は、量子圧縮状態におけるマクロ振動子のリアルタイム測定に基づく作成への道を開くものである。
レーザー干渉計重力波観測所のkgスケールの試験質量の機械系に適応することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:23:20 GMT)
Transfer learning of state-based potential games for process optimization in decentralized manufacturing systems [3.4] 本稿では,製造システムにおける分散自己最適化の促進を目的とした,状態ベースポテンシャルゲーム(TL-SbPG)における新しいトランスファー学習手法を提案する。
提案手法は, 大規模システムにおける自己学習のメカニズムを改善するために, 類似プレイヤー間の知識の共有と伝達を行う実践的な産業環境に焦点をあてる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:41:40 GMT)
For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives [3.4] この研究は、ソーシャルメディアプラットフォームにおける画像の社会的・文化的影響を大規模に調査するためのフレームワークであるFRESCOを提示する。
FRESCOは、最新のコンピュータビジョン技術を用いて、画像を数値変数と分類変数に分解する。
このフレームワークは、線や色のような基本的な視覚的特徴を含むプラスティックレベル、特定の実体や概念を表す図形レベル、特にオブザーバーとオブザーバーの視点を構築することに焦点を当てた啓示レベルという3つのレベルにわたって画像を分析する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:03:59 GMT)
Balancing Innovation and Privacy: Data Security Strategies in Natural Language Processing Applications [3.4] 本研究では,差分プライバシーに基づく新しいアルゴリズムを導入することにより,自然言語処理(NLP)におけるプライバシ保護に対処する。
差分プライバシー機構を導入することにより、ランダムノイズを付加しながらデータ解析結果の精度と信頼性を確保することができる。
提案アルゴリズムの有効性は、精度(0.89)、精度(0.85)、リコール(0.88)などの性能指標によって実証される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:05:10 GMT)
A Bayesian Framework for Active Tactile Object Recognition, Pose Estimation and Shape Transfer Learning [3.4] 本稿では,能動的触覚物体認識,ポーズ推定,形状伝達学習の課題に対処する。
カスタマイズされた粒子フィルタ(PF)とガウス過程の暗黙曲面(GPIS)を統一されたベイズフレームワークで結合する。
シミュレーション実験を通じて,提案フレームワークは,対象のクラスを推定し,既知のオブジェクトのポーズと新しい形状の学習において,その有効性と効率を実証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:49:15 GMT)
Deep Learning Algorithms for Mean Field Optimal Stopping in Finite Space and Discrete Time [3.4] 本研究は, エージェント数が無限に近づくにつれて得られる平均場最適停止(MFOS)問題を考察する。
本研究では,2つの深層学習手法を提案する。一方は最適決定を学習するために全軌道をシミュレートし,他方は逆方向誘導でDPPを利用する。
空間次元最大300の6つの異なる問題に対する数値実験により,これらの手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:27:17 GMT)
LLMs hallucinate graphs too: a structural perspective [3.3] グラフの幻覚は、文献からよく知られたグラフに誘導されるとき、誤った出力である。
本稿では,LLMの出力を特徴付けるために,このような豊富な幻覚を用いることができることを論じる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:29:07 GMT)
Design of Secure, Privacy-focused, and Accessible E-Payment Applications for Older Adults [3.2] 65歳以上の高齢者400名を対象に調査を行い,e-payment Mobile アプリケーションの高忠実度プロトタイプの評価を行った。
調査の結果から,この人口動態の具体的なニーズを満たすため,アプリケーションをカスタマイズしたベータ版を開発した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:12:18 GMT)
Controlling Whisper: Universal Acoustic Adversarial Attacks to Control Speech Foundation Models [3.2] 音声可能な基礎モデルは、適切なプロンプトを用いて自動音声認識以外のタスクを実行することができる。
音声プロンプト付き大規模言語モデルの開発により、さらに大きな制御オプションが生まれる可能性がある。
この柔軟性により、システムはモデル制御の敵攻撃の影響を受けやすいことが実証された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:21:40 GMT)
Learn Your Reference Model for Real Good Alignment [3.1] 大規模言語モデル(LLM)アライメントのためのオフラインメソッドは、過度な最適化の影響を受けやすい。
我々は、トレーニングプロセスを通して参照ポリシーを動的に更新する、Trust Regionと呼ばれるオフラインアライメント手法の新たなパラダイムを提案する。
この結果から,TRアライメント手法は過度な最適化を効果的に軽減し,初期基準ポリシからかなり逸脱したモデルでも高い性能を維持することができることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:42:12 GMT)
Hypothesis-only Biases in Large Language Model-Elicited Natural Language Inference [3.1] 我々は,GPT-4,Llama-2,Mistral 7bを用いて,スタンフォードNLIコーパスの一部を再現した。
我々は仮説のみの分類器を訓練し、LLMによる仮説がアノテーションのアーティファクトを含んでいるかどうかを判断する。
我々の分析は、NLIにおける十分に証明されたバイアスがLLM生成データに持続できるという実証的な証拠を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:09:22 GMT)
Experiments with Choice in Dependently-Typed Higher-Order Logic [3.1] ヒルベルトの不定選択作用素 $epsilon$ により DHOL 項構造を拡張する。
選択項のHOL選択への変換を定義し、既存のDHOLからHOLへの変換を拡張する。
選択を必要とするHOL問題に対する拡張翻訳の評価を行った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:49:45 GMT)
Enhancing Long Context Performance in LLMs Through Inner Loop Query Mechanism [2.9] 変換器は入力サイズと計算複雑性の2次スケーリングを持つ。
Retrieval-augmented Generation (RAG)は、検索システムを使用することで、より長いコンテキストを処理できる。
インナーループメモリ拡張ツリー検索(ILM-TR)という新しい手法を導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:49:05 GMT)
180 Days After EIP-4844: Will Blob Sharing Solve Dilemma for Small Rollups? [2.9] 本稿では,EIP-4844の実装から6ヶ月後に収集した実世界データに基づくブロブ共有の有効性について検討する。
単純なブロブ共有フォーマットを用いてコスト変化をシミュレートすることにより、ブロブ共有が小規模ロールアップのコストとDAサービス品質を大幅に改善できることを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:10:24 GMT)
180 Days After EIP-4844: Will Blob Sharing Solve Dilemma for Small Rollups? [2.9] 本稿では,EIP-4844の実装から6ヶ月後に収集した実世界データに基づくブロブ共有の有効性について検討する。
単純なブロブ共有フォーマットを用いてコスト変化をシミュレートすることにより、ブロブ共有が小規模ロールアップのコストとDAサービス品質を大幅に改善できることを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:10:24 GMT)
Sentiment Reasoning for Healthcare [2.9] 音声とテキストの両方のモダリティに対して、新しいタスク、Sentiment Reasoningを導入する。
本研究は,有理化訓練により,人文とASR設定の双方において,感情分類におけるモデル性能が向上することを示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:43:19 GMT)
Large Language Models for Energy-Efficient Code: Emerging Results and Future Directions [2.8] エネルギー効率向上のための符号として,大規模言語モデル (LLM) の新たな適用法を提案する。
我々はプロトタイプを記述し評価し、我々のシステムでは、コンパイラの最適化だけで最大2倍のエネルギー効率を向上できる6つの小さなプログラムを探索した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:35:40 GMT)
Training Machine Learning models at the Edge: A Survey [2.8] 本調査では,エッジ学習の概念,特にエッジにおける機械学習モデルトレーニングの最適化について検討する。
エッジラーニングに関する関連文献が同定され,分散ラーニング手法における研究努力の集中が明らかになった。
この調査はさらに、エッジ学習のためにMLを最適化するために使用されるテクニックを比較するためのガイドラインと、利用可能なさまざまなフレームワーク、ライブラリ、シミュレーションツールの探索を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:11:36 GMT)
Ingest-And-Ground: Dispelling Hallucinations from Continually-Pretrained LLMs with RAG [2.8] プライバシ固有の知識ベースでベースLLMモデルを継続的に事前トレーニングし、セマンティックRAGレイヤで拡張します。
提案手法は,プライバシ関連クエリの処理において,モデル性能を向上することを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:37:37 GMT)
Ingest-And-Ground: Dispelling Hallucinations from Continually-Pretrained LLMs with RAG [2.8] プライバシ固有の知識ベースでベースLLMモデルを継続的に事前トレーニングし、セマンティックRAGレイヤで拡張します。
提案手法は,プライバシ関連クエリの処理において,モデル性能を向上することを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:37:37 GMT)
Fragile Giants: Understanding the Susceptibility of Models to Subpopulation Attacks [2.7] モデル複雑性がサブポピュレーション中毒に対する感受性にどのように影響するかを検討する。
以上の結果から,より多くのパラメータを持つモデルがサブポピュレーション中毒に対して有意に脆弱であることが示唆された。
これらの結果は、サブポピュレーションの脆弱性に対処する防衛を開発する必要性を強調している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:48:19 GMT)
The Function-Representation Unification Framework [2.5] 本稿では,メモリとプログラムが統合された新しい計算モデル,Function-Representationを提案する。
複数のFunction-Representationを編成するさまざまな方法について説明し、これらのFunction-Representationsが実装できる関数の種類を探る。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:48:38 GMT)
The Function-Representation Model of Computation [2.5] 本稿では,関数表現の実装と利用に基づく新しい計算モデルを提案する。
また、複数のFunction-Representationを編成するさまざまな方法について話し、これらのFunction-Representationsが実装できる関数の種類を探る。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:48:38 GMT)
Finite Sample Complexity Analysis of Binary Segmentation [2.5] 与えられた有限$N$,$K$,および最小セグメント長パラメータに対する二分分割の時間と空間の複雑さを解析するための新しい手法について述べる。
実データについて実証的な分析を行い、二分法は実際は最適速度に近いことが多いことを示唆する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:26:29 GMT)
A Feature Generator for Few-Shot Learning [2.5] 少ないショットラーニングは、ラベル付きデータに制限のある新しいオブジェクトやクラスをモデルが認識できるようにすることを目的としている。
クラスレベルのテキスト記述から視覚的特徴を生成する機能ジェネレータを導入する。
その結果,ベースライン法よりも精度が向上した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:13:04 GMT)
A Feature Generator for Few-Shot Learning [2.5] 少ないショットラーニングは、ラベル付きデータに制限のある新しいオブジェクトやクラスをモデルが認識できるようにすることを目的としている。
クラスレベルのテキスト記述から視覚的特徴を生成する機能ジェネレータを導入する。
その結果,ベースライン法よりも精度が向上した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:13:04 GMT)
Cross-Domain Evaluation of Few-Shot Classification Models: Natural Images vs. Histopathological Images [2.4] まず、自然画像のいくつかの分類モデルを訓練し、その性能を病理画像で評価する。
病理組織学的データセットを4つ,自然画像データセットを1つ導入し,5-way 1-shot,5-way 5-shot,5-way 10-shotのシナリオでパフォーマンスを評価した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:25:52 GMT)
Measuring the Groundedness of Legal Question-Answering Systems [2.3] 法的問合せのような高度な領域では、生成的AIシステムの正確性と信頼性が最重要となる。
本研究は、AI生成応答の基盤性を評価するための様々な手法のベンチマークを示し、信頼性を大幅に向上することを目的とした。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:23:45 GMT)
A Generalization Bound for a Family of Implicit Networks [2.3] インプリシット・ネットワーク(英: Implicit Network)は、パラメータ化された演算子の固定点によって出力が定義されるニューラルネットワークである。
これらのアーキテクチャのラデマッハ複雑性の被覆数論に基づいて、このクラスに有界な一般化を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:55:20 GMT)
A Generalization Bound for a Family of Implicit Networks [2.3] インプリシット・ネットワーク(英: Implicit Network)は、パラメータ化された演算子の固定点によって出力が定義されるニューラルネットワークである。
これらのアーキテクチャのラデマッハ複雑性の被覆数論に基づいて、このクラスに有界な一般化を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:55:20 GMT)
The spin lifetime of an individual atomic nucleus investigated via local-probe single-shot readout [2.3] 核スピンは、彼らの環境からの優れた隔離に長寿命の磁気状態がある。
核スピンの原子環境に関する詳細な知識と制御は、量子情報応用の条件を最適化するための鍵となる。
本稿では,STMを用いた個々のtext49$Ti核スピンの単発読み出しを実演する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:47:46 GMT)
Fully Unsupervised Dynamic MRI Reconstruction via Diffeo-Temporal Equivariance [2.3] 教師付き学習法は周期性を前提として欠陥があり、真の動きの撮像を禁止している。
我々は,アンサンプド計測のみから動的MRIシーケンスを再構築するための教師なしフレームワークを提案する。
我々の手法は基盤となるニューラルネットワークアーキテクチャに非依存であり、最新のパラダイムや後処理アプローチに適応するために使用することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:16:30 GMT)
PILLAR: an AI-Powered Privacy Threat Modeling Tool [2.2] PILLARは、Large Language ModelsとLINDDUNフレームワークを統合して、プライバシ脅威モデリングの合理化と強化を行う新しいツールである。
PILLARは、DFDの生成、脅威の分類、リスクの優先順位付けなど、LINDDUNプロセスの重要な部分を自動化する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:13:03 GMT)
Extra Global Attention Designation Using Keyword Detection in Sparse Transformer Architectures [2.2] 本稿では,一般的なスパーストランスアーキテクチャであるLongformer-Decoderの拡張を提案する。
グローバルアテンションを選択的に増加させる手法を提案し,実証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:41:11 GMT)
Artistic Intelligence: A Diffusion-Based Framework for High-Fidelity Landscape Painting Synthesis [2.2] LPGenはランドスケープ・ペインティング・ジェネレーションに特化して設計された新しい拡散モデルである。
LPGenは、構造的およびスタイリスティックな特徴を独立して処理する分離されたクロスアテンションメカニズムを導入している。
モデルは高解像度のランドスケープ画像のキュレートされたデータセットに事前トレーニングされ、異なる芸術様式で分類され、詳細で一貫した出力を確保するために微調整される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:48:03 GMT)
Articulated Animal AI: An Environment for Animal-like Cognition in a Limbed Agent [2.2] 主な改善点は、より複雑な行動と実際の動物の動きによく似た環境との相互作用を可能にする、エージェントの四肢の追加である。
テストベンチにはカリキュラムのトレーニングシーケンスと評価ツールが統合されており、ユーザが独自のトレーニングプログラムを開発する必要がなくなる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:55:23 GMT)
NeLLCom-X: A Comprehensive Neural-Agent Framework to Simulate Language Learning and Group Communication [2.2] 最近導入されたNeLLComフレームワークにより、エージェントはまず人工言語を学習し、次にそれを通信に使用することができる。
より現実的な役割交代エージェントとグループコミュニケーションを導入することで、このフレームワークを拡張します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:13:20 GMT)
Efficient line search for optimizing Area Under the ROC Curve in gradient descent [2.1] 偽陰性率と偽陰性率のAUM(Area Under Min)の分別線形/定数特性について検討した。
降下段階毎に最適な学習率を選択するための,新しい効率的な経路追従アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:59:06 GMT)
Standalone 16-bit Training: Missing Study for Hardware-Limited Deep Learning Practitioners [2.1] 混合精度技術は、モデルトレーニングと推論の間に異なる数値精度を活用し、資源利用を最適化する。
リソースが限られている多くの人にとって、利用可能なオプションは32ビット、16ビット、または2つの組み合わせに限られている。
この研究は重要なギャップを埋め、スタンドアロンの16ビット精度のニューラルネットワークが32ビットと混合精度の精度で一致したことを初めて証明した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:47:38 GMT)
HyperPg -- Prototypical Gaussians on the Hypersphere for Interpretable Deep Learning [2.1] ProtoPNetは、トレーニング画像から既知のプロトタイプ部品を“見た目”で学習し、予測力とケースベースの推論の固有の解釈可能性を組み合わせる。
この研究は、潜在空間の超球面上のガウス分布を利用した新しいプロトタイプ表現であるHyperPgを導入する。
CUB-200-2011とStanford Carsデータセットの実験では、HyperPgNetが他のプロトタイプ学習アーキテクチャより優れていることが示されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:50:31 GMT)
Sentiment Reasoning for Healthcare [2.0] 感性推論は感情分析における補助的タスクであり、モデルが感情ラベルの両方を予測し、入力の書き起こしに基づいてその背景にある理性を生成する。
本研究は,人間に匹敵する品質のモデル予測のための理論的根拠を提供することで,感性推論がモデルの透明性向上に役立つことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:43:19 GMT)
KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors [2.0] KinDELは2つのキナーゼ上のDELデータセットとして初めて公開された。
我々は、ヒット識別のための予測モデルを開発するために、異なる機械学習手法をベンチマークする。
我々は、分子の小さなサブセット上でモデルを検証するために、オンとオフの両方で生物物理学的なアッセイデータを提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:03:58 GMT)
A Bayesian Approach to Weakly-supervised Laparoscopic Image Segmentation [2.0] スパースアノテーションを用いた腹腔鏡下画像分割法について検討した。
本稿では,モデルのセグメンテーションの精度と解釈可能性を高めるために,ベイズ的深層学習手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:19:48 GMT)
MergePrint: Robust Fingerprinting against Merging Large Language Models [1.9] 本稿では,モデルマージ後の所有権主張を保存すべく,頑健な指紋を埋め込んだ新しい指紋認証手法MergePrintを提案する。
擬似マージモデルに最適化することで、マージ後も検出可能な指紋を生成する。
このアプローチは、モデルマージによる誤適用の場合のオーナシップを主張するために、実用的なフィンガープリント戦略を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:00:49 GMT)
Scalable Signature-Based Distribution Regression via Reference Sets [1.9] パスシグネチャは、シグネチャベースの機能を通じてパスに符号化された情報を活用するために使用される。
アートDRソリューションの現在の状態は、メモリ集約的で、高コストである。
この計算ボトルネックは、アプリケーションを小さなサンプルサイズに制限する。
本稿では,上記の問題に対処する手法を提案する。
また,多様な学習タスクにDRを使用できるパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:58:28 GMT)
Progressive Pruning: Estimating Anonymity of Stream-Based Communication [1.8] 本稿では,ストリームの匿名度を推定する手法であるProgressive Pruningを紹介する。
交差点攻撃を模倣することにより、トラフィック分析攻撃に対するストリームの感受性をキャプチャする。
本稿では,TorFSシミュレータを用いたTorの大規模シミュレーションに加えて,ストリーム通信の調整例のシミュレーションにも適用する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:40:51 GMT)
CORE-BEHRT: A Carefully Optimized and Rigorously Evaluated BEHRT [1.8] BERTベースのモデルはBEHRTとMed-BERTのリリース以降、人気が高まっている。
BERTに基づくEHRモデリングについて検討し、重要な設計選択のための改善の源泉を分離する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:26:01 GMT)
Testing GPT-4-o1-preview on math and science problems: A follow-up study [1.8] 2023年8月、私はWolfram AlphaとCode InterpreterのプラグインでGPT4を105の高校レベルと大学レベルの科学と数学の問題でテストしました。
2024年9月、私は同じコレクションで最近リリースされたモデルGPT-4o1-previewをテストしました。
全体として、パフォーマンスは大幅に改善されたが、まだ完璧には程遠いことが分かりました。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:56:26 GMT)
Are Grid Cells Hexagonal for Performance or by Convenience? [1.8] 空間記憶の保存・検索作業における正方形および六角形格子セルの性能の比較を行った。
その結果、異なるデータセット間での精度とロバスト性、リコールする画像のノイズレベルが比較できることがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:45:49 GMT)
Efficient Hyperparameter Importance Assessment for CNNs [1.8] 本稿では,畳み込みニューラルネットワーク(CNN)におけるハイパーパラメータの重み付けを,N-RReliefFというアルゴリズムを用いて定量化する。
我々は10の人気のある画像分類データセットから1万以上のCNNモデルをトレーニングし、広範囲にわたる研究を行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:47:46 GMT)
Enhancing Interaction Modeling with Agent Selection and Physical Coefficient for Trajectory Prediction [1.7] 本稿では,インタラクションエージェントを手動で選択し,アテンションスコアの代わりに相関関係を計算するASPILinを提案する。
興味深いことに、InterACTION、HighD、CitySimデータセットで実施された実験は、我々の手法が効率的かつ簡単であることを実証している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:40:39 GMT)
Cross-chain Sharing of Personal Health Records: Heterogeneous and Interoperable Blockchains [1.7] 本稿では、異種および相互運用可能なブロックチェーン間でPHRを共有する手法を提案する。
医療用IoTデバイスは、InterPlanetary File System内のリアルタイムPHRを暗号化して保存することができる。
拡張されたプロキシ再暗号化(PRE)アルゴリズムは、ブロックチェーン暗号システムの違いに対処する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:22:10 GMT)
Accurate quantum-centric simulations of supramolecular interactions [1.6] 本稿では,超分子的アプローチによる非共有結合相互作用の量子中心シミュレーションについて述べる。
結果は量子コンピューティングの化学問題への応用における大きな進歩を示している。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:25:47 GMT)
SurgicaL-CD: Generating Surgical Images via Unpaired Image Translation with Latent Consistency Diffusion Models [1.6] 現実的な手術画像を生成するために, 連続拡散法であるemphSurgicaL-CDを導入する。
以上の結果から,本手法はGANや拡散に基づく手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:46:11 GMT)
Aligning Diffusion Models by Optimizing Human Utility [1.6] Diffusion-KTOは、テキストと画像の拡散モデルを人間の好みに合わせるための新しいアプローチである。
私たちの目的は、単純なイメージ単位のバイナリフィードバック信号、例えば、十分に利用可能ないいね!や嫌悪(dislikes)が必要です。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:43:11 GMT)
Conditional Generative Models for Contrast-Enhanced Synthesis of T1w and T1 Maps in Brain MRI [1.6] 仮想エンハンスメントのための生成モデル,より正確に条件付き拡散とフローマッチングの可能性について検討する。
定量的MRIとT1強調画像によるT1スキャンの性能について検討した。
モデル全体では、T1重み付きスキャンよりもT1スキャンの方がセグメンテーションが優れている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:11:24 GMT)
Fine-Tuning In-House Large Language Models to Infer Differential Diagnosis from Radiology Reports [1.6] 本研究は, 放射線学報告と鑑別診断に適した社内LPMの開発パイプラインを提案する。
GPT-4と同等の92.1%のF1スコアが得られた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:16:25 GMT)
Evolution of SAE Features Across Layers in LLMs [1.6] 隣接層における特徴間の統計的関係を解析し, 前方通過による特徴の進化を理解する。
私たちは、機能とその最もよく似た隣人のためのグラフ視覚化インターフェイスを提供し、レイヤ間で関連する機能のコミュニティを構築します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:46:49 GMT)
The structure of the token space for large language models [1.6] 大規模言語モデルは、発話のセグメント(トークン)を高次元の周囲の潜在空間に配置することで、自然言語に存在する相関構造を符号化する。
トークン部分空間の次元とリッチスカラー曲率を推定し、適度な大きさの3つのオープンソースの大言語モデルに適用する。
その結果, 模型の形状と曲率の相関関係が明らかとなり, モデル挙動に影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:07:15 GMT)
PINNing Cerebral Blood Flow: Analysis of Perfusion MRI in Infants using Physics-Informed Neural Networks [1.5] ASL ( Arterial spin labeling) MRI (MRI) は脳血流計測を可能にする。
ASLを用いた幼児の脳血流推定は、ネットワーク生理学の複雑な相互作用により困難である。
幼児のASLデータからCBFや他のパラメータを推定するために,空間不確実性に基づく新しい物理インフォームドニューラルネットワーク(PINN, SUPINN)を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:07:04 GMT)
AI-driven innovation in medicaid: enhancing access, cost efficiency, and population health management [1.5] 米国メディケイドプログラムは、医療費の急激な増加、不均一な医療のアクセシビリティ、および様々な人口の健康ニーズに対処する上での課題を含む重要な課題を経験している。
本稿では,メディケイドのリフォームにおける人工知能(AI)の変容の可能性について,手術の合理化,患者結果の改善,コスト削減の両面から検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:14:42 GMT)
Multilingual and Multi-topical Benchmark of Fine-tuned Language models and Large Language Models for Check-Worthy Claim Detection [1.5] 本研究では,(1)微調整言語モデルと(2)チェック価値のあるクレーム検出タスクにおける大規模言語モデルの性能を比較した。
様々なソースやスタイルのテキストからなる多言語・多言語データセットを構築した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:12:27 GMT)
Test-driven Software Experimentation with LASSO: an LLM Benchmarking Example [1.5] テスト駆動ソフトウェア実験(TDSE、Test-Driven Software Experiments)は、ソフトウェア主題の実行と、その"事実上の"実行時の振る舞いの観察と分析を含む実験である。
本稿では,TDSEを行うための最小限のドメイン固有言語とデータ構造を提供するLASSOという汎用解析プラットフォームを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:32:48 GMT)
Time to Retrain? Detecting Concept Drifts in Machine Learning Systems [1.4] 機械学習(ML)モデルにおける概念ドリフトを検出するためのモデル非依存手法(CDSeer)を提案する。
その結果、CDSeerの精度とリコールは最先端と比較して優れており、手作業によるラベリングは極めて少ないことがわかった。
CDSeerのパフォーマンス向上と導入の容易さは、MLシステムをより信頼性の高いものにする上で価値がある。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:47:39 GMT)
Enabling Advanced Land Cover Analytics: An Integrated Data Extraction Pipeline for Predictive Modeling with the Dynamic World Dataset [1.4] Dynamic Worldデータセットを扱うために、フレキシブルで効率的なエンドツーエンドパイプラインを提示します。
これには、ノイズ除去に取り組む前処理および表現フレームワーク、大量のデータの効率的な抽出、LULCデータの再表現が含まれる。
パイプラインのパワーを実証するために、都市化予測問題のためのデータを抽出し、優れたパフォーマンスで機械学習モデルのスイートを構築する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:13:01 GMT)
Single V2 defect in 4H Silicon Carbide Schottky diode at low temperature [1.3] 金属半導体(Au/Ti/4H-SiC)エピタキシャルウエハデバイスにおける単一シリコン空孔色中心の挙動について検討した。
我々の研究は、量子応用のための光学マイクロ構造を持つショットキーデバイスの低温統合の最初の実演である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:37:18 GMT)
A Theoretical Framework for AI-driven data quality monitoring in high-volume data environments [1.3] 本稿では,高ボリューム環境におけるデータ品質維持の課題に対処するために,AIによるデータ品質監視システムに関する理論的枠組みを提案する。
本稿では,ビッグデータのスケール,速度,多様性の管理における従来の手法の限界について検討し,高度な機械学習技術を活用した概念的アプローチを提案する。
主なコンポーネントは、インテリジェントデータ取り込み層、適応前処理機構、コンテキスト認識機能抽出、AIベースの品質評価モジュールなどである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:06:36 GMT)
Do Large Language Models have Shared Weaknesses in Medical Question Answering? [1.3] 大規模言語モデル(LLM)は、医療ベンチマークで急速に改善されているが、その信頼性の欠如は、安全な現実世界の使用において永続的な課題である。
上位のLLMをベンチマークし、モデル間の一貫性のあるパターンを特定します。
質問が正しく答えるモデル間の類似性の証拠と、人間のテストテイカーとの類似性を見出した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:55:44 GMT)
Self-Supervised Learning for Real-World Object Detection: a Survey [1.2] 自己監視学習(SSL)はコンピュータビジョンにおいて有望なアプローチとして登場した。
SSLメソッドは、インスタンス識別とMasked Image Modeling(MIM)の2つの主要なカテゴリに分類される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:46:46 GMT)
Self-Supervised Learning for Real-World Object Detection: a Survey [1.2] 自己監視学習(SSL)はコンピュータビジョンにおいて有望なアプローチとして登場した。
SSLメソッドは、インスタンス識別とMasked Image Modeling(MIM)の2つの主要なカテゴリに分類される。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:46:46 GMT)
Predicting Drug Effects from High-Dimensional, Asymmetric Drug Datasets by Using Graph Neural Networks: A Comprehensive Analysis of Multitarget Drug Effect Prediction [1.2] グラフニューラルネットワーク(GNN)は、薬物分子グラフから薬物効果を予測する最も効果的なML手法の1つである。
膨大な可能性を秘めているにもかかわらず、GNNモデルは高次元、非対称的に共起する薬物効果を含むデータセットを使用する際の性能を欠いている。
そこで本稿では, 与えられた不均衡な分子グラフデータセットの多重ラベル分類性能を改善するために, 新たなデータオーバーサンプリング手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:09:29 GMT)
Movie Trailer Genre Classification Using Multimodal Pretrained Features [1.2] 本稿では,映画ジャンル分類のための新しい手法を提案する。
本手法は,映画予告編の映像フレームと音声フレームを時間プーリングを行なわずに活用する。
我々の手法は、精度、リコール、平均平均精度(mAP)の観点から、最先端の映画ジャンル分類モデルより優れている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:38:05 GMT)
Levels of Binary Equivalence for the Comparison of Binaries from Alternative Builds [1.1] ビルドプラットフォームの可変性は、妥協されたビルド環境の検出を容易にするため、セキュリティを強化することができる。
同じソースから構築された複数のバイナリの可用性は、新たな課題と機会を生み出します。
そのような質問に答えるためには、バイナリ間の等価性の概念が必要である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:16:26 GMT)
Deep Neural Decision Forest: A Novel Approach for Predicting Recovery or Decease of Patients [1.1] 本研究の目的は,深層学習アルゴリズムが患者の道徳を予測できるかどうかを検討することである。
臨床およびRT-PCRがどちらが信頼性が高いかを予測するための予測に与える影響について検討した。
その結果, RT-PCRを用いない臨床単独が, 80%の精度で最も効果的な診断方法であることが示唆された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:40:15 GMT)
Utilizing ChatGPT in a Data Structures and Algorithms Course: A Teaching Assistant's Perspective [1.1] この研究は、データ構造とアルゴリズム(DSA)コースにおけるChatGPTの使用について、特にTAの監督と組み合わせて検討している。
その結果,ChatGPTを構造化プロンプトとアクティブTAガイダンスに組み込むことで,複雑なアルゴリズム概念の理解,エンゲージメントの向上,学業成績の向上が図られた。
この研究は、学生がAI生成コンテンツへの依存を減らし、全体的な教育的影響を増幅する上で、活発なTA関与の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:18:48 GMT)
Reinforcement Learning for Control of Non-Markovian Cellular Population Dynamics [1.0] 我々は、新しい非マルコフ力学の下で進化する細胞集団を制御するために、情報量戦略の同定に強化学習を適用した。
モデルのない深部RLは、長距離時間力学の存在下でも正確な解を回復し、細胞集団を制御することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:02:30 GMT)
Block Induced Signature Generative Adversarial Network (BISGAN): Signature Spoofing Using GANs and Their Evaluation [1.0] GAN(Generative Adversarial Network)は、オリジナルおよびフォージされたシグネチャから学習し、フォージされたシグネチャを生成する。
この研究は、署名検証システムのベンチマークを達成するために、偽造サンプルを生成するジェネレータを作成することに重点を置いている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:14:58 GMT)
Block Induced Signature Generative Adversarial Network (BISGAN): Signature Spoofing Using GANs and Their Evaluation [1.0] GAN(Generative Adversarial Network)は、オリジナルおよびフォージされたシグネチャから学習し、フォージされたシグネチャを生成する。
この研究は、署名検証システムのベンチマークを達成するために、偽造サンプルを生成するジェネレータを作成することに重点を置いている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:14:58 GMT)
Variational Bayesian surrogate modelling with application to robust design optimisation [1.0] サロゲートモデルは複雑な計算モデルに対して素早く評価できる近似を提供する。
入力の不確かさと次元減少を伴う統計的代理を構築するためのベイズ推定について考察する。
コスト関数がモデル出力の平均および標準偏差の重み付け和に依存するような本質的で頑健な構造最適化問題を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:53:00 GMT)
Hedging and Approximate Truthfulness in Traditional Forecasting Competitions [0.9] 予測競技において、従来のメカニズムは、各イベントの結果に対して、各競技者の予測をスコア付けする。
イベントの数が増えるにつれて、競技者が大まかに真実を語るのは民間伝承である。
本稿はそのような分析を初めて行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:56:27 GMT)
Hedging and Approximate Truthfulness in Traditional Forecasting Competitions [0.9] 予測競技において、従来のメカニズムは、各イベントの結果に対して、各競技者の予測をスコア付けする。
イベントの数が増えるにつれて、競技者が大まかに真実を語るのは民間伝承である。
本稿はそのような分析を初めて行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:56:27 GMT)
On-Chip Learning via Transformer In-Context Learning [0.9] 自己アテンションメカニズムでは、各ステップでメインメモリから事前トークンプロジェクションを転送する必要がある。
オンチップの塑性プロセッサを用いて自己注意を計算したニューロモルフィックデコーダのみのトランスモデルを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:54:09 GMT)
SpikeBottleNet: Energy Efficient Spike Neural Network Partitioning for Feature Compression in Device-Edge Co-Inference Systems [0.9] デバイスエッジコ推論フレームワークは、モバイルデバイスと近くのエッジサーバとの間にディープニューラルネットワークを分割する。
このアプローチではデバイス上の計算と通信コストのバランスをとる必要がある。
本稿では,SNNを統合することで既存のアーキテクチャを大幅に改善する,SpikeBottleNetという新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:59:21 GMT)
Resource-Constrained Heuristic for Max-SAT [0.8] より大規模な問題をより小さなサブコンポーネントに繰り返し分解する,Max-SATのインスタンスに対するリソース制約を提案する。
本研究では,所定のSATインスタンスの構造を利用するグラフベースの新しい手法を含む,変数選択手法の集合を分析する。
我々は,Max-SAT評価ベンチマークを用いて,ランダムに生成されたMax-SATインスタンスと実世界の実例について実験を行った。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:20:08 GMT)
Unifying and Verifying Mechanistic Interpretations: A Case Study with Group Operations [0.8] 機械論的解釈可能性に関する最近の研究は、有限群の二項演算で訓練されたニューラルネットワークによって実行される計算のリバースエンジニアリングに焦点が当てられている。
本研究では,この課題で訓練した一層ニューラルネットワークの内部構造について検討し,未同定構造を明らかにした。
我々は、そのようなモデルのより完全な記述を作成し、以前の作品の説明を統一する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:29:01 GMT)
Unifying and Verifying Mechanistic Interpretations: A Case Study with Group Operations [0.8] 機械論的解釈可能性に関する最近の研究は、有限群の二項演算で訓練されたニューラルネットワークによって実行される計算のリバースエンジニアリングに焦点が当てられている。
本研究では,この課題で訓練した一層ニューラルネットワークの内部構造について検討し,未同定構造を明らかにした。
我々は、そのようなモデルのより完全な記述を作成し、以前の作品の説明を統一する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:29:01 GMT)
MedMobile: A mobile-sized language model with expert-level clinical capabilities [0.8] モバイル機器上で動作可能な380億のパラメータLMである phi-3-mini, MedMobile を医用アプリケーションに適用した。
MedMobile は MedQA (USMLE) で75.7%、医師の合格点(60%)を上回り、100倍の大きさのモデルのスコアに近づいた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:32:59 GMT)
Symmetry-Constrained Generation of Diverse Low-Bandgap Molecules with Monte Carlo Tree Search [0.8] 近赤外(NIR)感受性分子は、夜間視覚装置や生体医用イメージングにユニークな用途を持つ。
我々は、有機電子分子のドメインに焦点をあてた特許によるデータセットから構造的先行性を活用する。
提案手法は,特許データセットから対称性制約を保ちつつ,赤方偏移吸収を示す候補を生成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:09:27 GMT)
Enhancing Motion Variation in Text-to-Motion Models via Pose and Video Conditioned Editing [0.7] 本稿では,既存の基本動作を修正するための条件として,短いビデオクリップや画像を使用する新しい手法を提案する。
このアプローチでは、モデルのキックに対する理解が先行として機能し、フットボールキックのビデオやイメージが後部として機能する。
26名の被験者によるユーザスタディにより,本手法はテキスト・モーション・データセットにおいて,一般的に表現される動きに匹敵するリアルな動きを生み出すことを示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:59:10 GMT)
What killed the cat? Towards a logical formalization of curiosity (and suspense, and surprise) in narratives [0.7] 物語の緊張の中心にある3つの感情(好奇心、サスペンス、驚き)を形式化する統一的な枠組みを提供する。
このフレームワークは非単調な推論に基づいて構築され、世界のデフォルトの振る舞いをコンパクトに表現することができます。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:50:55 GMT)
Anomalously extended Floquet prethermal lifetimes and applications to long-time quantum sensing [0.7] フラケット予熱は周期的に駆動される量子多体系で観測される。
オフ共鳴と短角励起を用いた新しい量子制御法を導入し,フロッケ前熱水寿命を大幅に延長する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:46:12 GMT)
Analyzing Probabilistic Methods for Evaluating Agent Capabilities [0.7] 本稿では,AIエージェントが与えられたタスクを完了した確率をよりよく推定することを目的とした2つの手法を提案する。
マイルストーン法はタスクをサブタスクに分解し、全体の成功率推定を改善する。
専門家のベスト・オブ・N法は、モデルの独立したパフォーマンスのプロキシとして人間のガイダンスを活用する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:10:36 GMT)
Analyzing Probabilistic Methods for Evaluating Agent Capabilities [0.7] 本稿では,AIエージェントが与えられたタスクを完了した確率をよりよく推定することを目的とした2つの手法を提案する。
マイルストーン法はタスクをサブタスクに分解し、全体の成功率推定を改善する。
専門家のベスト・オブ・N法は、モデルの独立したパフォーマンスのプロキシとして人間のガイダンスを活用する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:10:36 GMT)
Cryogenic Feedforward of a Photonic Quantum State [0.7] 絡み合ったフォトニック量子状態の測定に基づく変調は、光量子情報処理の基盤技術である。
量子光源上の準光子数分解測定を用いて低遅延フィードフォワードを示す。
これは、最速の量子フォトニックフィードフォワード実験のための重要なベンチマークである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:29:15 GMT)
WasmWalker: Path-based Code Representations for Improved WebAssembly Program Analysis [0.6] WebAssembly(Wasm)は、Webブラウザでほぼネイティブなコードの実行を可能にする低レベルのバイナリ言語である。
WebAssemblyバイナリのための2つの新しいコード表現を提案する。
これらの新しい表現は、固定サイズのコード埋め込みを生成するだけでなく、シーケンス・ツー・シーケンス・モデルに追加情報を提供するのに役立つ。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:35:34 GMT)
Benchmark Inflation: Revealing LLM Performance Gaps Using Retro-Holdouts [0.6] 多くのLarge Language Models(LLM)のトレーニングデータは、テストデータによって汚染される。
公開ベンチマークスコアは必ずしもモデルプロパティを正確に評価するとは限らない。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:46:56 GMT)
Uncertainty Estimation and Out-of-Distribution Detection for LiDAR Scene Semantic Segmentation [0.6] 新しい環境で安全なナビゲーションを行うには、自動運転車やロボットが環境を正確に解釈する必要がある。
そこで本研究では,分布内(ID)と分布外(OOD)を区別する手法を提案する。
一つの決定論的モデルの特徴空間を用いて、疫学とアレター的不確実性の両方を定量化する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:19:24 GMT)
Similar Phrases for Cause of Actions of Civil Cases [0.6] この研究は、ディース係数やピアソンの相関係数など、様々な類似度尺度を実装している。
アンサンブルモデルはランキングを組み合わせ、ソーシャルネットワーク分析は関連するCOAのクラスタを特定する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:43:45 GMT)
Multimodal Auto Validation For Self-Refinement in Web Agents [0.6] 本稿では,マルチモーダル検証と自己補充によるWebエージェントの性能向上手法を提案する。
本稿では,異なるモーダル性(テキスト,視覚)の包括的研究と,Webエージェントの自動検証における階層構造の影響について述べる。
我々はまた、Webエージェントがワークフローの失敗を検出し、自己修正することを可能にする自動バリケータを開発し、Web自動化のための自己修正機構も導入した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:42:52 GMT)
Multimodal Auto Validation For Self-Refinement in Web Agents [0.6] 本稿では,マルチモーダル検証と自己補充によるWebエージェントの性能向上手法を提案する。
本稿では,異なるモーダル性(テキスト,視覚)の包括的研究と,Webエージェントの自動検証における階層構造の影響について述べる。
我々はまた、Webエージェントがワークフローの失敗を検出し、自己修正することを可能にする自動バリケータを開発し、Web自動化のための自己修正機構も導入した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:42:52 GMT)
Efficient Quantum Simulation Algorithms in the Path Integral Formulation [0.6] 我々は、経路積分定式化のハミルトン版に基づく2つの新しい量子アルゴリズムと、 $fracm2dotx2 - V(x)$ という形でラグランジアンに対して提供する。
我々のラグランジアンシミュレーションアルゴリズムは、連続極限において$D+1$次元の$eta$粒子を持つシステムに対して、$V(x)$が有界であれば$widetildeO(eta D t2/epsilon)$としてスケールする離散ラグランジアンを演算するオラクルに対して、多数のクエリを必要とすることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:05:43 GMT)
Multi-Agent Actor-Critics in Autonomous Cyber Defense [0.5] マルチエージェントディープ強化学習(MADRL)は、自律型サイバーオペレーションの有効性とレジリエンスを高めるための有望なアプローチである。
シミュレーションサイバー攻撃シナリオにおいて,各エージェントが迅速に学習し,MADRLを用いて自律的に脅威に対処できることを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:15:09 GMT)
AutoPersuade: A Framework for Evaluating and Explaining Persuasive Arguments [0.5] 私たちは説得力のあるメッセージを構築するためのフレームワークであるAutoPersuadeを紹介します。
我々は説得力に影響を与える議論の特徴を識別する新しい話題モデルを開発した。
このモデルを用いて、新たな議論の有効性を予測し、異なるコンポーネントの因果的影響を評価する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:46:05 GMT)
Encoding Agent Trajectories as Representations with Sequence Transformers [0.5] 本稿では,ニューラルネットワークアーキテクチャを用いた高次元トラジェクトリを表現するモデルを提案する。
言語モデルと同様に、我々のTransformer Sequence for Agent temporal Representation (STARE)モデルは、軌跡データにおける表現と構造を学習することができる。
合成および実軌道データを用いた実験結果から,提案モデルが有意なエンコーディングを学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:18:47 GMT)
Mathematical theory of deep learning [0.5] これは近似理論、最適化理論、統計学習理論の基本的な結果をカバーしている。
本書は,本トピックに関する基礎知識を読者に提供することを目的としている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:16:53 GMT)
Does AI help humans make better decisions? A statistical evaluation framework for experimental and observational studies [0.4] 我々は、人間とAI、AIの3つの代替意思決定システムのパフォーマンスを比較する方法を示す。
リスクアセスメントの勧告は、現金保釈を課す裁判官の決定の分類精度を向上しないことがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:05:37 GMT)
Does AI help humans make better decisions? A methodological framework for experimental evaluation [0.4] 我々は、人間と人、AIとAIの3つの代替意思決定システムのパフォーマンスを比較する方法を示す。
リスクアセスメントの勧告は、現金保釈を課す裁判官の決定の分類精度を向上しないことがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:05:37 GMT)
L3Cube-MahaSum: A Comprehensive Dataset and BART Models for Abstractive Text Summarization in Marathi [0.4] 本稿では,マラタイにおける多種多様なニュース記事の大規模コレクションであるMahaSUMデータセットについて述べる。
データセットは、広範囲のオンラインニュースソースから記事を取り除き、抽象的な要約を手作業で検証することで作成されました。
我々は、MahaSUMデータセットを使用して、Indic言語用に調整されたBARTモデルの変種であるIndicBARTモデルをトレーニングする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:37:37 GMT)
Enhancing GNNs with Architecture-Agnostic Graph Transformations: A Systematic Analysis [0.4] 本研究では,標準データセット間の共通グラフニューラルネットワーク(GNN)アーキテクチャの性能に及ぼす前処理ステップとしての各種グラフ変換の影響について検討する。
以上の結果から,特定の変換,特に集中度を指標とした拡張ノードの特徴は,常に表現性を向上することが明らかとなった。
しかし、グラフ符号化のような手法は表現性を高めつつ、広く使われているピソンパッケージの数値的不正確さを導入しているため、これらの利益はトレードオフをもたらす。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:19:17 GMT)
Long Range Named Entity Recognition for Marathi Documents [0.4] 本稿では,Marathi 文書用に設計されている現在の NER 技術について包括的に分析する。
BERTトランスフォーマーモデルによる長距離マラソンNERの可能性を調査し、現在のプラクティスを掘り下げる。
本稿は,NERがNLPにおいて重要な役割を担っていることを認めつつ,マラティの特定の言語的特徴と文脈的微妙さによって引き起こされる困難について論じる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:48:20 GMT)
Deep Neural Networks as the Semi-classical Limit of Topological Quantum Neural Networks: The problem of generalisation [0.4] 本稿では,Deep Neural Networksにおける一般化問題を理解するために,このフレームワークを提案する。
この種のフレームワークは、トレーニングステップ中のディープニューラルネットワークの過剰適合挙動と、それに対応する一般化能力を説明する。
開発した新しいアルゴリズムを適用し、標準的なニューラルネットワークと同様の結果を得るが、トレーニングは必要としないことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:08:39 GMT)
A Systematic Review of Edge Case Detection in Automated Driving: Methods, Challenges and Future Directions [0.4] 本稿では,エッジケース検出および評価手法の実用的,階層的なレビューと体系的な分類について述べる。
まず,AVモジュールによる検出手法を分類し,認識関連および軌跡関連エッジケースを含む2つのレベルに分類する。
我々は「知識駆動」アプローチと呼ばれる新しいクラスを導入し、主に文献で見過ごされている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:32:20 GMT)
ActNAS : Generating Efficient YOLO Models using Activation NAS [0.4] 活性化関数はニューラルネットワークに非線形性を導入し、複雑なパターンを学習することを可能にする。
YOLOモデルにおける混合活性化関数の使用効果に関する包括的研究を行う。
本稿では,ニューラルアーキテクチャサーチ(NAS)を用いて,複合アクティベーション関数を最適化したYOLOモデルを設計する手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:07:29 GMT)
DAWN: Designing Distributed Agents in a Worldwide Network [0.4] DAWNはグローバルに分散エージェントを登録し、ゲートウェイエージェントを通じて簡単に発見できる。
No-LLM Mode for Deterministic Task, Copilot for augmented decision-making, and LLM Agent for autonomous operations。
DAWNは、専用の安全性、セキュリティ、コンプライアンスレイヤを通じて、世界中のエージェントコラボレーションの安全性とセキュリティを保証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:47:04 GMT)
From N-grams to Pre-trained Multilingual Models For Language Identification [0.4] 南アフリカの11言語を対象として,N-gramモデルとLarge-trained Multilingual Model for Language Identification (LID)について検討した。
N-gramモデルでは、対象言語の効果的な周波数分布を確立するためには、有効なデータサイズ選択が不可欠であることを示す。
我々は,SerengetiがN-gramsからTransformerに平均して優れたモデルであることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:35:57 GMT)
Energy-efficient SNN Architecture using 3nm FinFET Multiport SRAM-based CIM with Online Learning [0.3] スパイキングニューラルネットワーク(SNN)推論に最適化された新しいCIMアクセラレータを提案する。
3nmのFinFET技術における128$times$128配列の結果、スピードが3.1$times$改善され、エネルギー効率が2.2$times$改善された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:00:28 GMT)
ReasonPlanner: Enhancing Autonomous Planning in Dynamic Environments with Temporal Knowledge Graphs and LLMs [0.3] 本稿では,リフレクティブ思考,計画,対話的推論のための新しいジェネラリストエージェントReasonPlannerを紹介する。
ReasonPlannerはScienceWorldベンチマークの従来の最先端のプロンプトベースの手法を1.8倍以上上回っている。
凍結重量のみに依存するため、勾配更新は不要である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:58:51 GMT)
The Computational Complexity of Circuit Discovery for Inner Interpretability [0.3] 我々は古典的およびパラメータ化された計算複雑性理論を用いて回路発見を研究する。
私たちの発見は、難しい複雑さの風景を明らかにします。
このフレームワークは、解釈可能性クエリの範囲と限界を理解するのに役立ちます。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:02:34 GMT)
The Computational Complexity of Circuit Discovery for Inner Interpretability [0.3] 我々は古典的およびパラメータ化された計算複雑性理論を用いて回路発見を研究する。
私たちの発見は、難しい複雑さの風景を明らかにします。
このフレームワークは、解釈可能性クエリの範囲と限界を理解するのに役立ちます。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:02:34 GMT)
Testing and Debugging Quantum Programs: The Road to 2030 [0.3] 量子コンピューティングは、古典的なコンピュータが解決するのに何百年もかかる問題を解くための、有望な技術として再登場した。
本稿では,これらの課題に対処するためのロードマップを提示し,文献の既存のギャップを指摘し,研究の方向性を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:31:27 GMT)
Efficient tomography of microwave photonic cluster states [0.3] 多数の量子ビット間の絡み合いは多くの量子アルゴリズムにとって重要な資源である。
本研究では,行列-積-演算形式に基づく効率的なトモグラフィー法を開発し,最大35個のマイクロ波フォトニック量子ビットのクラスター状態でそれを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:57:52 GMT)
Efficient tomography of microwave photonic cluster states [0.3] 多数の量子ビット間の絡み合いは多くの量子アルゴリズムにとって重要な資源である。
本研究では,行列-積-演算形式に基づく効率的なトモグラフィー法を開発し,最大35個のマイクロ波フォトニック量子ビットのクラスター状態でそれを実証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:57:52 GMT)
Limitations for Quantum Algorithms to Solve Turbulent and Chaotic Systems [0.3] 非線形力学系を解くための量子コンピュータの限界について検討する。
正規化解ベクトルを近似した量子状態を出力することを目的とした量子アルゴリズムに対して、重要な制限を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:31:24 GMT)
Autonomous Underwater Robotic System for Aquaculture Applications [0.2] 本研究の目的は, 生物汚染, 植生, 網穴, プラスチックなどの異なる養殖網の欠陥をリアルタイムに検出することを目的として, オン・ROV処理を指向した養殖網ペンの自動欠陥検出システムを開発することである。
提案システムは,アクアネット周辺の車両移動に対する深層学習に基づく欠陥検出法とフィードバック制御法を併用して,網状画像の明確なシーケンスを取得し,検査タスクによって網の状態を確認する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:54:22 GMT)
Efficient Multi-Object Tracking on Edge Devices via Reconstruction-Based Channel Pruning [0.2] 現代のMOTシステムで使用されるような複雑なネットワークの圧縮に適したニューラルネットワークプルーニング手法を提案する。
我々は、高い精度を維持しつつ、最大70%のモデルサイズ削減を実現し、さらにJetson Orin Nanoの性能を向上させる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:37:42 GMT)
pyhgf: A neural network library for predictive coding [0.2] texttpyhgfは、予測コーディングのための動的ネットワークの作成、操作、サンプリングのためのPythonパッケージである。
ネットワークコンポーネントを透過的でモジュール的で、拡張可能な変数としてメッセージパッシングステップに囲み込むことで、他のフレームワークよりも改善します。
コア変数の透明性は、自己組織化の原則を活用する推論プロセスにも変換できる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:21:38 GMT)
Towards a conjecture on a special class of matrices over commutative rings of characteristic 2 [0.2] 我々は、Eurocrypt 2021でKeller と Rosemarin が示した予想を、アダマール型ブロックを持つブロック行列の行列の零性について証明する。
また、群代数や代数の観点から、可換環上のアダマールによって形成される構造も明らかにする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:54:47 GMT)
LLM+Reasoning+Planning for supporting incomplete user queries in presence of APIs [0.1] 実際には、自然言語のタスク要求(ユーザクエリ)は不完全であることが多い。
論理的推論と古典的AI計画とLLMを併用して,ユーザのクエリを正確に応答する。
提案手法は,完全かつ不完全な単一目標とマルチゴールクエリを含むデータセットにおいて,95%以上の成功率を達成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:22:27 GMT)
Parameter-Efficient Fine-Tuning of Large Language Models using Semantic Knowledge Tuning [0.1] 大規模言語モデル (LLMs) は近年,プロンプトを用いた特殊タスクにおいて大きな人気を集めている。
本稿では,ランダムトークンの代わりに有意な単語を用いたプロンプトおよびプレフィックスチューニングのためのセマンティック知識チューニング(SK-Tuning)を提案する。
実験結果から,SK-Tuningは,テキスト分類や理解などのタスクにおいて,より高速なトレーニング時間,少ないパラメータ,優れたパフォーマンスを示すことがわかった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:55:09 GMT)
Enhanced Kalman with Adaptive Appearance Motion SORT for Grounded Generic Multiple Object Tracking [0.1] Grounded-GMOTは、ユーザーが自然言語記述子を通じてビデオ内の複数のジェネリックオブジェクトを追跡することができる革新的なトラッキングパラダイムである。
コントリビューションはG2MOTデータセットの導入から始まり、多様なジェネリックオブジェクトを特徴とするビデオのコレクションを含む。
そこで本研究では,視覚的外観を動作キューと効果的に統合するだけでなく,カルマンフィルタを改良した新しいトラッキング手法KAM-SORTを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:38:17 GMT)
Superradiance of strongly interacting dipolar excitons in moiré quantum materials [0.1] 本研究では,モイア格子の深部波長特性から生じるモイア励起子の共振特性について検討した。
以上の結果から, 層間モワール励起体は, 強く相互作用する多体系において, 協調的な光学現象を探索するためのユニークなプラットフォームとなることが示唆された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:08:58 GMT)
A Lightweight Generative Model for Interpretable Subject-level Prediction [0.1] 本稿では,本質的に解釈可能な単一対象予測手法を提案する。
実験により、結果のモデルを効率よく逆転させ、正確な主観レベルの予測を行うことが示されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:38:07 GMT)
Ranking over Regression for Bayesian Optimization and Molecule Selection [0.1] 本稿ではランキングモデルを用いたランクベースベイズ最適化(RBO)を提案する。
本稿では, 各種化学データセットにおける従来のBOと比較して, RBOの最適化性能について包括的に検討する。
RBOはレグレッションベースのBOに代わる有効な代替品であり、特に新規化合物の最適化に有効である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:38:14 GMT)
LLMD: A Large Language Model for Interpreting Longitudinal Medical Records [0.0] 本稿では,患者の医療履歴を医療記録に基づいて分析する大規模言語モデルを提案する。
LLMDはドメイン知識とともに、時間と施設間で収集された大量のレコードのコーパスで訓練されている。
このアプローチは患者の健康を正確に表現するために重要であり、知識だけで訓練されたモデルよりも独特なアドバンテージを持っている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:55:51 GMT)
Variance reduction combining pre-experiment and in-experiment data [0.0] オンライン制御実験(A/Bテスト)は、多くの企業にとって、データ駆動による意思決定に不可欠である。
CUPEDやCUPACのような既存の手法では、実験前のデータを使って分散を減らすが、その効果は実験前のデータと結果の相関に依存する。
実験前データと実験内データを組み合わせて, CUPED や CUPAC よりも高分散化を実現する手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:45:29 GMT)
Using off-the-shelf LLMs to query enterprise data by progressively revealing ontologies [0.0] オントロジは、クエリをSPARQLのような形式的なクエリ言語に変換する際に、Large Language Models(Ms)の精度を改善することが知られている。
与えられた質問に答えるために必要なオントロジーの「十分を段階的に明らかにする解」を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:41:04 GMT)
Universal Performance Gap of Neural Quantum States Applied to the Hofstadter-Bose-Hubbard Model [0.0] 本研究では,Hofstadter-Bose-Hubbard (HBH)モデルの基底状態の近似におけるNQSの性能について検討した。
以上の結果から,磁束の増大はエネルギー誤差を最大3桁に増加させることが示唆された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:32:41 GMT)
UniGlyph: A Seven-Segment Script for Universal Language Representation [0.0] UniGlyph(ユニグリフ、UniGlyph)は、7つの文字から派生したスクリプトを用いて、普遍的な文字変換システムを構築するために設計された構築言語(言語)である。
本稿では,UniGlyphの設計について検討し,そのスクリプト構造,音声マッピング,音訳規則について詳述する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:46:09 GMT)
Understanding the First Wave of AI Safety Institutes: Characteristics, Functions, and Challenges [0.0] 2023年11月、英国と米国はAI安全研究所の創設を発表した。
このプライマーは「第1波」という類似のクラスターの1つのクラスタを記述する。
第一波にはいくつかの基本的な特徴がある。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:50:23 GMT)
Transmission through Cantor structured Dirac comb potential [0.0] 本稿では,Cantor-structured Dirac comb potential(CDC-$rho_N$)について紹介する。
この研究は、フラクタル幾何学的ディラックコムポテンシャルによる量子トンネルの研究で初めて行われた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:32:31 GMT)
The generalized method of solving ECDLP using quantum annealing [0.0] 本稿では,楕円曲線離散対数問題(ECDLP)の素数への変換を可能にする手法の一般化を提案する。
上記の障害はもはや問題ではないため、アルゴリズムの最新バージョンは楕円曲線モデルに使用することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:26:37 GMT)
The Proof of Kolmogorov-Arnold May Illuminate Neural Network Learning [0.0] コルモゴロフとアーノルドは現代のニューラルネットワーク理論の基礎を築いた。
微量の濃度は、ヤコビアンのより高い外界の力に比例する。
本稿では,今日のディープNNにおける高次概念の出現の舞台となるような空間性について,その概念的議論を行う。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 01:43:14 GMT)
The Dynamics of Social Conventions in LLM populations: Spontaneous Emergence, Collective Biases and Tipping Points [0.0] シミュレーション対話を用いたLarge Language Model (LLM) エージェントの集団内におけるコンベンションのダイナミクスについて検討する。
グローバルに受け入れられる社会慣行は,LLM間の局所的な相互作用から自然に生じうることを示す。
献身的なLLMのマイノリティグループは、新しい社会慣習を確立することで社会変革を促進することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:16:38 GMT)
Text-To-Image with Generative Adversarial Networks [0.0] 本稿では,GAN(Generative Adversarial Networks)に基づく5つの異なる手法の比較を行い,テキストから画像を生成する。
最高の解像度と最悪の解像度は、それぞれ64*64、256*256である。
この研究により、これらの異なるアプローチを重要な指標と比較することにより、この問題の最良のモデルを見出した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:16:35 GMT)
Systematic construction of stabilizer codes via gauging abelian boundary symmetries [0.0] そこで本研究では,(d+1)次元安定化モデルを構築するための体系的枠組みを提案する。
我々のアプローチは、J. Garre-Rubio, Nature Commun. 15 7986 (2024)の著者のひとりによって開発された反復的なガーグ法に基づいている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:57:40 GMT)
Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT Prompting [0.0] 本研究では,新しいソナー画像合成フレームワーク,Synth-SONARを提案する。
まず、ジェネレーティブAIベースのスタイルインジェクション技術と、公開されている実/シミュレーションデータを統合する。
第二に、二重テキスト条件ソナー拡散モデル階層は、粗くきめ細かなソナー画像を品質と多様性を向上して合成する。
第3に、高レベル(粗度)と低レベル(詳細)のテキストベースのソナー生成手法は、視覚言語モデル(VLM)とGPTプロンプトで利用可能な高度な意味情報を活用する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:27:25 GMT)
Superluminal signalling witness for quantum state reduction with correlated noise [0.0] 量子状態還元のモデルは、マクロな物体を支配するシュリンガー方程式の弱い修正を示唆している。
量子状態還元モデルの大規模なクラスでは、量子状態に対するマスター方程式の定式化は違法に困難または不可能である。
いくつかの関連するケースに証人を適用し、相関ノイズモデルが一般に超音速シグナリングを可能にすることを発見した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:18:22 GMT)
Stable-to-unstable transition in quantum friction [0.0] 本研究では,2つの散逸金属板をせん断運動に設定した場合の量子揺らぎに起因する摩擦力について検討する。
初期の研究では、量子摩擦機構の電磁場が非平衡定常状態に達することが示されているが、他の研究は定常状態に到達できないことを示した。
摂動近似のない完全量子力学理論を開発し、安定な状態から不安定な状態への遷移を明らかにする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:18:09 GMT)
Spectroscopic measurements and models of energy deposition in the substrate of quantum circuits by natural ionizing radiation [0.0] 自然に発生する背景放射は超伝導量子ビットにおける相関的なデコヒーレンス現象の源である。
ミリケルビン冷凍機内に位置するシリコン基板の背景スペクトルを測定した。
シリコン基板の厚さ0.5mmでは、100keVから3MeVの間で4万倍の強度が低下する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:10:14 GMT)
Solving Robotics Problems in Zero-Shot with Vision-Language Models [0.0] ゼロショット方式でロボットの問題を解くために設計された多エージェント視覚大言語モデル(VLLM)フレームワークであるWonderful Teamを紹介した。
我々の文脈では、ゼロショットは、新しい環境において、ロボットの周囲のイメージとタスク記述を備えたVLLMを提供することを意味する。
私たちのシステムは、操作、ゴールリーチ、視覚的推論といった多様なタスクを、すべてゼロショットで処理できる能力を示しています。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:58:00 GMT)
Solving Robotics Problems in Zero-Shot with Vision-Language Models [0.0] ゼロショット方式でロボットの問題を解くために設計された多エージェント視覚大言語モデル(VLLM)フレームワークであるWonderful Teamを紹介した。
我々の文脈では、ゼロショットは、新しい環境において、ロボットの周囲のイメージとタスク記述を備えたVLLMを提供することを意味する。
私たちのシステムは、操作、ゴールリーチ、視覚的推論といった多様なタスクを、すべてゼロショットで処理できる能力を示しています。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:58:00 GMT)
Simulability of non-classical continuous-variable quantum circuits [0.0] 連続変数量子計算では、量子計算の優位性を実現する重要な要素を特定することが長年の課題である。
我々は、潜在的な量子計算上の優位性を識別できる包括的で汎用的なフレームワークを開発する。
これは、現在の連続変数量子回路に簡単に適用でき、また、潜在的な量子的優位性を排除できる以上の損失の量を制限することができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:03:53 GMT)
Science is Exploration: Computational Frontiers for Conceptual Metaphor Theory [0.0] 本研究では,Large Language Models (LLM) が,自然言語データにおける概念的メタファの存在を正確に識別し,説明することができることを示す。
メタファアノテーションガイドラインに基づく新しいプロンプト手法を用いて,LLMが概念的メタファに関する大規模計算研究において有望なツールであることを実証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:03:13 GMT)
Robust Clustering on High-Dimensional Data with Stochastic Quantization [0.0] 本稿では,従来のベクトル量子化アルゴリズムの限界に対処する。
量子化(SQ)を高次元計算の代替として検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:21:22 GMT)
Refinements on the Complementary PDB Construction Mechanism [0.0] パターンデータベース(PDB)は、最も人気のある自動生成技術の一つである。
本稿では,CPC1のPDB構築機構を改良する作業について述べる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:06:29 GMT)
Quantum tomography with $τ$ leptons at the FCC-ee [0.0] 比較的長い寿命で、単一イオン崩壊モードで放出されるニュートリノのモーメントを再構築することができるため、$tau$ leptonは特別である。
結果として生じる多数の事象は、プロセスの完全な量子トモグラフィーの理想的な情報源である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:52:09 GMT)
Quantum cellular automata and categorical duality of spin chains [0.0] スピン鎖上の対称性を反映する局所作用素の代数間の有界なスプレッド同型である圏双対について検討する。
双対性に関する根本的な問題は、量子セルオートマトンに拡張できるかどうかである。
ドップリッヒ=ハーグ=ロバーツ双加群の機械を用いた拡張問題の解を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:00:50 GMT)
Quantum Speed Limit in Terms of Coherence Variations [0.0] 我々は、量子コヒーレンスの変化に基づいて、達成可能な量子速度制限を示す。
応用として、縮退力学と散逸力学のコヒーレンス量子速度限界について検討する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:30:56 GMT)
Path-minimizing Latent ODEs for improved extrapolation and inference [0.0] 潜在ODEモデルは動的システムの柔軟な記述を提供するが、外挿と複雑な非線形力学の予測に苦労することがある。
本稿では、時間に依存しない潜在表現を奨励することで、この二分法を利用する。
遅延空間における一般的な変分ペナルティを各システムのパス長の$ell$ペナルティに置き換えることで、モデルは異なる構成のシステムと容易に区別できるデータ表現を学ぶ。
これにより、GRU、RNN、LSTM/デコーダによるベースラインODEモデルと比較して、より高速なトレーニング、より小さなモデル、より正確で長時間の外挿が可能となる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:50:01 GMT)
Oversights in Characterising Heralded Single Photon Sources [0.0] 本稿では,本論文における1光子源の最先端解析について述べる。
我々は、明るさや隠蔽効率などの重要なパラメータがどのように特徴付けられるかという矛盾を指摘する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:28:35 GMT)
Operator-Valued Kernels, Machine Learning, and Dynamical Systems [0.0] ヒルベルト空間評価ガウス過程は力学や機械学習に応用される。
さらなる応用は、新しい非可換ラドン-ニコディム定理を含む非可換確率論において与えられる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:02:46 GMT)
Online Performance Estimation with Unlabeled Data: A Bayesian Application of the Hui-Walter Paradigm [0.0] 我々は、伝統的に疫学や医学に応用されたHui-Walterパラダイムを機械学習の分野に適用する。
根拠のないシナリオでは、偽陽性率、偽陰性率、先行といった重要なパフォーマンス指標を推定する。
オンラインデータを扱うためのこのパラダイムを拡張し、動的データ環境の新しい可能性を広げます。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:54:48 GMT)
One- and Two-Photon Localization in Quantum Optics [0.0] 我々は,最近提案された連続体モデルの格子類似性を,ランダム媒質中の1光子状態と2光子状態の伝播に適用する。
我々は、原子の共鳴エネルギーを中心としたエネルギーバンドに単一光子の局在が存在することを発見した。
2つの光子の場合、共鳴周波数の2倍のエネルギーバンドが局在する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 23:12:14 GMT)
Oja's plasticity rule overcomes several challenges of training neural networks under biological constraints [0.0] Ojaの可塑性ルールは、いくつかのエンジニアリングトリックの必要性を部分的に克服している。
具体的には、オンライン学習のような難しいが生物学的に現実的な学習シナリオの下では、Ojaのルールは純粋なバックプロパゲーションの性能を大幅に向上させることができる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:25:39 GMT)
NeRF-Accelerated Ecological Monitoring in Mixed-Evergreen Redwood Forest [0.0] 混合常緑樹林における幹径推定を目的としたMLSとNeRF林の復元の比較を行った。
凸ハルモデルを用いた改良DBH推定法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:33:58 GMT)
NeRF-Accelerated Ecological Monitoring in Mixed-Evergreen Redwood Forest [0.0] 混合常緑樹林における幹径推定を目的としたMLSとNeRF林の復元の比較を行った。
凸ハルモデルを用いたDBH推定法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:33:58 GMT)
Mpox Narrative on Instagram: A Labeled Multilingual Dataset of Instagram Posts on Mpox for Sentiment, Hate Speech, and Anxiety Analysis [0.0] WHOは、世界保健機関(WHO)の国際的懸念の公衆衛生非常事態を宣言している。
ソーシャルメディアのマイニングに関する以前の研究は、mpoxのアウトブレイクに関するInstagram投稿のデータセットの開発に重点を置いていなかった。
本稿では,2022年7月23日から2024年9月5日までに発行されたmpoxに関する60,127件のInstagram投稿の多言語データセットについて述べる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:19:44 GMT)
More than Memes: A Multimodal Topic Modeling Approach to Conspiracy Theories on Telegram [0.0] ドイツ語のテレグラムチャンネルにおける陰謀論の分析のためのマルチモーダル・トピック・モデリングの可能性について検討する。
我々は、2023年10月にドイツ語のTelegramチャンネルで投稿された40,000のTelegramメッセージのコーパスを分析した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:10:26 GMT)
Modular Multimodal Machine Learning for Extraction of Theorems and Proofs in Long Scientific Documents (Extended Version) [0.0] 学術的なPDF論文から数学的ステートメントの抽出とその証明をマルチモーダルな分類問題として扱う。
本稿では,定理のような環境や証明を抽出するモジュール型連続型マルチモーダル機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:26:14 GMT)
Mixed-type Distance Shrinkage and Selection for Clustering via Kernel Metric Learning [0.0] 我々は、混合カーネルを用いて異種性を測定するKDSUMと呼ばれる計量を提案する。
我々は、KDSUMが既存の混合型メトリクスから均一な異性度メトリクスへの縮小法であることを実証した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:16:15 GMT)
Mercer Large-Scale Kernel Machines from Ridge Function Perspective [0.0] 我々は、RachimiとRechtによる2008年の論文の主な成果を、近似理論の観点から、大規模カーネルマシンのランダムな特徴として考察した。
我々は、x$ と $y$ に依存する引数を持つコサイン関数の積の和によって、どのカーネルを近似できるかを研究し、そのようなアプローチの障害を提示する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:37:43 GMT)
Machine Learning based Prediction of Ditching Loads [0.0] 機械学習を用いて航空機のヒューズラグにおける動的グルーピング負荷の予測手法を提案する。
採用した学習手順は、畳み込みオートエンコーダ(CAE)を用いた空間荷重の再構築と、その後の部分におけるこれらの負荷の過渡的進化という2つの部分に分けられる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:00:27 GMT)
MOZART: Ensembling Approach for COVID-19 Detection using Chest X-Ray Imagery [0.0] 新型コロナウイルス(COVID-19)が世界的なパンデミックを引き起こし、医療システムに悪影響を及ぼした。
従来の畳み込みニューラルネットワーク(CNN)は印象的な精度を実現している。
ウイルス検出を強化するアンサンブル学習手法であるMOZARTフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 21:02:58 GMT)
Low-complexity Image and Video Coding Based on an Approximate Discrete Tchebichef Transform [0.0] 我々は離散的チェビシェフ変換(DTT)のための新しい低複雑さ近似を導入する。
提案した変換の高速アルゴリズムは乗算自由であり、加算数やビットシフト操作の削減を必要とする。
画像および映像の圧縮シミュレーションは,提案した変換の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:55:00 GMT)
Linear-cost unbiased posterior estimates for crossed effects and matrix factorization models via couplings [0.0] 我々はブロックされたギブスサンプルラー(BGS)のカップリングに基づくマルコフ連鎖モンテカルロスキームの設計と解析を行う。
本手法は,条件付き独立ブロックを有する高次元BGSに対して設計および適用可能である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:05:01 GMT)
Linear Regression Using Quantum Annealing with Continuous Variables [0.0] ボソン系は離散近似に頼らずに線形回帰の最適化を容易にする。
我々の新しいアプローチの大きな利点は、断熱条件が満たされる限り、キュービット数を増やすことなく精度を確保することができることである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:49:09 GMT)
Lifted Coefficient of Determination: Fast model-free prediction intervals and likelihood-free model comparison [0.0] 予測値と観測値の相関が大きくなるにつれて、モデルフリーな予測間隔がより強くなる。
これらの区間は、任意の損失関数のモデル比較基準である決定の$textitLifted係数を動機付けている。
予測区間をより一般的な誤差分布に拡張し、回帰のための高速モデルフリーな外乱検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:27:31 GMT)
Learning dynamic quantum circuits for efficient state preparation [0.0] 動的量子回路(DQC)は、これらの測定結果に基づいて中間回路の測定とゲートを組み込む。
我々は拡張性のあるテンソルネットワークアルゴリズムを開発し、汎用状態に対する高忠実度DQCの準備を求める。
我々の研究は、DQC回路を生成するためのアルゴリズム的アプローチの力を示し、量子コンピューティングの新しい分野への応用範囲を広げた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:47:46 GMT)
Learning General Representation of 12-Lead Electrocardiogram with a Joint-Embedding Predictive architecture [0.0] ECG-JEPAは、ECGデータのセマンティック表現を学ぶためにマスキング戦略を採用している。
CroPAは、モデルがパッチ間の関係を効果的にキャプチャすることを可能にする。
ECG-JEPAは非常にスケーラブルで、大規模なデータセットの効率的なトレーニングを可能にする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:30:48 GMT)
Learning Algorithms Made Simple [0.0] 人工知能(AI)、機械学習(ML)、ディープラーニング(DL)、ハイブリッドモデルの主な概念についてレビューする。
本稿では,学習アルゴリズムの概要と現状,応用,今後の方向性について概説する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:39:25 GMT)
Lattice fermions with solvable wide range interactions [0.0] $mathcalHR$の正確な解決性は、最近私が提唱した原則に基づいて、スピンレス格子フェルミオン$c_x$, $c_xdagger$, $mathcalHR_f=sum_x,yinmathcalXc_xdaggermathcalHR(x,y) c_y$を保証します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:37:22 GMT)
Large Language Models for Medical OSCE Assessment: A Novel Approach to Transcript Analysis [0.0] テキサス大学サウスウェスタン医療センター(UTSW)における2,027件のビデオ録画OSCE検査について検討した。
本研究は, 学生の要約作業において, LLMに基づく様々な手法による評価を行い, 評価書に基づいて評価を行った。
以上の結果から, GPT-4のようなフロンティアLLMモデルでは, 人間の学級とのアライメントが顕著であった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:16:03 GMT)
Interval-valued q-rung orthopair fuzzy Weber operator and its group decision-making application [0.0] 間隔値q-rung整形ファジィ集合(IVq-ROFS)に基づくSwingに基づく多属性群決定法(MAGDM)を開発した。
我々は,IVq-ROFWOWA演算子とSwingアルゴリズムを用いて,学生の学習効率を評価するMAGDM法を開発した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:24:06 GMT)
Integrating Supertag Features into Neural Discontinuous Constituent Parsing [0.0] 伝統的な選挙区の見解では、構成要素は隣接した単語で構成されており、ドイツ語のような言語で一般的である。
トランジションベースの構文解析は、大きな注釈付きコーパス上で教師あり学習を用いて生のテキストを入力した木を生成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 12:28:26 GMT)
Integrating Large Language Models into a Tri-Modal Architecture for Automated Depression Classification on the DAIC-WOZ [0.0] メジャー・うつ病(Major Depressive Disorder、MDD)は、世界中の3億人に影響を及ぼす広汎な精神疾患である。
本研究は, 臨床面接記録からのうつ病のバイナリ分類のための, BiLSTM に基づくトリモーダルモデルレベルの融合アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:52:25 GMT)
Integrating Large Language Models into a Tri-Modal Architecture for Automated Depression Classification [0.0] メジャー・うつ病(Major Depressive Disorder、MDD)は、世界中の3億人に影響を及ぼす広汎な精神疾患である。
本研究は, 臨床面接記録からのうつ病のバイナリ分類のための, BiLSTM に基づくトリモーダルモデルレベルの融合アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:52:25 GMT)
Integrating AI for Enhanced Feedback in Translation Revision- A Mixed-Methods Investigation of Student Engagement [0.0] 人工知能(AI)によるフィードバックの適用、特にChatGPTのような言語モデルからのフィードバックは、翻訳教育において検討されている。
本研究は,ChatGPTによる翻訳過程における教師の学生の関与について検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:21:29 GMT)
Influence of Solution Efficiency and Valence of Instruction on Additive and Subtractive Solution Strategies in Humans and GPT-4 [0.0] 本研究では,空間的タスクと言語的タスクの双方において,人間とGPT-4の問題解決を比較した。
減算が比較的効率的であった場合, 減算と減算が等しく効率的であった場合に比べて, 人体では減算が比較的効果的であった。
GPT-4は, 減算がより効率的である場合に, 強い添加バイアスを呈し, 逆の挙動を示した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:42:34 GMT)
Improving Legal Entity Recognition Using a Hybrid Transformer Model and Semantic Filtering Approach [0.0] 本稿では,法律テキスト処理用に微調整された変圧器モデルであるLegal-BERTの精度と精度を向上させる新しいハイブリッドモデルを提案する。
15,000の注釈付き法律文書のデータセット上で、F1スコア93.4%を達成し、従来の手法よりも精度とリコールが大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:51:28 GMT)
Implicitly Learned Neural Phase Functions for Basis-Free Point Spread Function Engineering [0.0] ポイントスプレッド機能(PSF)技術は、計算画像における光の焦点を正確に制御するために不可欠である。
本稿では, 位相関数の品質において, 既存の画素ワイズ最適化手法を著しく上回る暗黙のニューラル表現を活用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:19:26 GMT)
Implicitly Learned Neural Phase Functions for Basis-Free Point Spread Function Engineering [0.0] ポイントスプレッド機能(PSF)技術は、計算画像における光の焦点を正確に制御するために不可欠である。
本稿では, 位相関数の品質において, 既存の画素ワイズ最適化手法を著しく上回る暗黙のニューラル表現を活用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:19:26 GMT)
Impact of Surface Reflections in Maritime Obstacle Detection [0.0] 海上障害物検出は、無人表面車両の自律走行において可能な障害物を検出することを目的としている。
以前の研究では、海上障害物検出タスクにおける物体検出のための偽陽性の源として表面反射が示されていた。
表面反射が検出性能に悪影響を及ぼすことを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:55:24 GMT)
Hybrid Training Approaches for LLMs: Leveraging Real and Synthetic Data to Enhance Model Performance in Domain-Specific Applications [0.0] 本研究では,超微調整型大規模言語モデル(LLM)のハイブリッドアプローチについて検討する。
転写された実データと高品質な合成セッションを組み合わせたデータセットを利用することで、ドメイン固有の実データの制限を克服することを目的とした。
本研究は,基本基礎モデル,実データで微調整されたモデル,ハイブリッド微調整されたモデルという3つのモデルを評価した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:16:03 GMT)
Humanity in AI: Detecting the Personality of Large Language Models [0.0] アンケートは大規模言語モデル(LLM)の個性を検出する一般的な方法である
本稿では,テキストマイニングとアンケート手法の組み合わせを提案する。
LLMのパーソナリティは、事前訓練されたデータから導かれる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:53:11 GMT)
High Fidelity Artificial Quantum Thermal State Generation using Encoded Coherent States [0.0] 量子ステガノグラフィー(Quantum steganography)は、チャネル内で自然に発生するノイズとして通信を偽装する、情報セキュリティのための強力な手法である。
我々は、通信チャネルを監視する第三者が熱雑音光と区別できない状態の収差を見るように、弱いコヒーレントレーザー状態の位相と振幅を符号化した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:22:46 GMT)
Hands-on Introduction to Randomized Benchmarking [0.0] このチュートリアルの目的は、ランダム化されたベンチマーク技術の背後にある主要な原則の概要を提供することである。
各章には付属するPythonノートが付属しており、各プロトコルの本質的なステップが説明されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 10:16:30 GMT)
Gradients Stand-in for Defending Deep Leakage in Federated Learning [0.0] 本研究は, AdaDefense という勾配漏洩防止を目的とした, 効率的かつ効率的な手法を提案する。
提案手法は, 勾配リークを効果的に防止するだけでなく, モデル全体の性能に大きな影響を与えないことを保証する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:44:13 GMT)
Gradient Boosting Decision Trees on Medical Diagnosis over Tabular Data [0.0] アンサンブル法は、医学的意思決定プロセスの成功の観点から、強力な代替手段を提供する。
本研究では,医学分類作業におけるアンサンブル手法,特にGBDTアルゴリズムの利点について検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:30:36 GMT)
Gradient Boosting Decision Trees on Medical Diagnosis over Tabular Data [0.0] アンサンブル法は、医学的意思決定プロセスの成功の観点から、強力な代替手段を提供する。
本研究では,医学分類作業におけるアンサンブル手法,特にGBDTアルゴリズムの利点について検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:30:36 GMT)
Geometric Characterization of Many Body Localization [0.0] MBL位相を多体量子メートル法(MBQM)により幾何学的に特徴づける。
波動関数の空間拡散にのみ依存するMBL位相の自然な局所化長を抽出できることが分かる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 08:30:56 GMT)
Gauged Gaussian PEPS -- A High Dimensional Tensor Network Formulation for Lattice Gauge Theories [0.0] ゲージ理論は現代物理学の理解の基礎を形成する。
非摂動状態においては、ゲージ理論は格子ゲージ理論として個別に扱われる。
ゲージ付きガウス射影対角状態(PEPS)の統一的・包括的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:04:22 GMT)
Gauge potentials and vortices in the Fock space of a pair of periodically driven Bose-Einstein condensates [0.0] ボース・アインシュタイン凝縮体(BEC)の2種の結合力学を二重ポテンシャルで研究した。
フロッケ作用素の基底状態は、フォック空間におけるガウス状態から量子化された渦状態へ遷移する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 04:22:20 GMT)
From {\tt Ferminet} to PINN. Connections between neural network-based algorithms for high-dimensional Schrödinger Hamiltonian [0.0] 我々は、PDEのための標準(データ駆動)ニューラルネットワークベースの解法と、一方で開発された固有値問題と他方で開発された量子化学との接続を確立する。
特に,標準モンテカルロアルゴリズムの解に対応するデータに適合する問題として,PINNアルゴリズムを再構成する。
最適化アルゴリズムのレベルでの接続も確立されている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:27:58 GMT)
Fast Data-independent KLT Approximations Based on Integer Functions [0.0] Karhunen-Loeve変換(KLT)は確立された離散変換であり、データのデコリレーションと次元減少の最適特性を示す。
本稿では、様々なラウンドオフ関数を用いて、低複雑さでデータに依存しないKLT近似のカテゴリを紹介する。
提案した変換は,古典的性能尺度を考慮した正確なKLTおよび近似と比較すると良好に動作する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:05:05 GMT)
Exact solution of the master equation for interacting quantized fields at finite temperature decay [0.0] 有限温度崩壊における2つの量子化場の相互作用を含む量子系のマルコフ力学を解析する。
我々はリンドブラッドマスター方程式を、実効的な非エルミート的ハミルトニアンを持つフォン・ノイマン様方程式に再構成する。
この方法は、完全な量子状態における任意の初期状態の進化を計算するための枠組みを提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 00:21:54 GMT)
Evaluating Federated Kolmogorov-Arnold Networks on Non-IID Data [0.0] Kolmogorov-Arnold Networks (F-KANs) はすでに提案されているが、その評価は初期段階にある。
我々は,MNIST分類タスクにおいて,KansとMLP(Multi- Layer Perceptrons)の比較を行い,100のクライアントを持つ非IIDパーティションを用いた100ラウンドのフェデレーション学習のパラメータについて比較した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:30:04 GMT)
Enhanced Federated Anomaly Detection Through Autoencoders Using Summary Statistics-Based Thresholding [0.0] フェデレートラーニング(FL)では、データの分散性のため、異常検出は難しい課題である。
本研究では,正規データと異常データの両方からの要約統計を利用した新しいフェデレーションしきい値計算手法を提案する。
提案手法は, クライアント間の局所的な要約統計データを集約し, 正常データから異常を最適に分離する大域しきい値を算出する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:21:14 GMT)
Engineering dipole-dipole couplings for enhanced cooperative light-matter interactions [0.0] 平行双極子の環内に配置された金属球が、環系内で「ガイドスライディング」状態を生成する効果的なハミルトニアンを生成することを示す。
これにより、ノイズの多い室温環境での定常的な超吸収が可能となり、従来の設計よりもはるかに簡単に実装できる。
本手法は分子構造における協調光物質効果を調整するための強力な設計パラダイムである。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 16:06:08 GMT)
Emergence of second-order coherence in the superradiant emission from a free-space atomic ensemble [0.0] 自由空間における寒冷Rb原子の長い雲による超放射能バーストの放出における2次時間コヒーレンスの進化について検討した。
実験結果とDickeモデルの予測を比較し,有効原子数を用いて有限サイズ効果を推定した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:22:51 GMT)
Edge AI Collaborative Learning: Bayesian Approaches to Uncertainty Estimation [0.0] 独立エージェントが遭遇するデータの空間的変動を考慮した学習結果における信頼度の決定に焦点をあてる。
協調マッピングタスクをシミュレートするために,Webotsプラットフォームを用いた3次元環境シミュレーションを実装した。
実験により,BNNは分散学習コンテキストにおける不確実性推定を効果的に支援できることが示された。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:20:16 GMT)
Driving Privacy Forward: Mitigating Information Leakage within Smart Vehicles through Synthetic Data Generation [0.0] そこで本研究では,車内センサ14の分類法を提案し,攻撃の可能性を特定し,その脆弱性を分類する。
次に、PVS(Passive Vehicular Sensor)データセットを使用して、最も脆弱な信号に注目し、合成データを生成する。
本研究の結果から,本研究の意図を検証した結果,90.1%の統計的類似度と78%の分類精度が得られた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 02:28:27 GMT)
Do Unlearning Methods Remove Information from Language Model Weights? [0.0] 大規模言語モデルによるサイバーセキュリティ攻撃の実行、バイオ兵器の作成、人間の操作に関する知識は、誤用のリスクを引き起こす。
モデル重みから情報を取り除くための逆評価法を提案する。
現状の未学習手法に適用した場合, アクセシブルな事実を微調整することで, 88%の未学習精度を回復できることを示す。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:06:58 GMT)
Disentangling unitary dynamics with classically simulable quantum circuits [0.0] 我々は量子回路とハミルトン力学の両方を研究する。
パウリ作用素の期待は、深いクリフォード回路でも効率的にシミュレートできる。
ハミルトニアン力学では、古典的なシミュレーションが一般化して非効率になる。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:18:26 GMT)
Diffraction and pseudospectra in non-Hermitian quasiperiodic lattices [0.0] 利得と損失要素の空間分布は、統合フォトニック導波路アレイの文脈で物理的に可能である。
オンサイトゲイン・アンド・ロス分布(NHAAH)を用いた非エルミート準周期オーブリー・アンドルー・ハーパーモデルについて体系的に研究する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:38:30 GMT)
Deterministic Fokker-Planck Transport -- With Applications to Sampling, Variational Inference, Kernel Mean Embeddings & Sequential Monte Carlo [0.0] 我々は,Fokker-Planck方程式を連続性方程式として再構成し,粒子流法における関連する速度場を自然に提案する。
結果として生じる確率フローODEは魅力的な特性を提供するが、ほとんどの実用的な応用において難解な現在の確率密度を評価することに頼っている。
これらの制限を変動推論、カーネル平均埋め込み、シーケンシャルなモンテカルロといったコンテキストの利点に変換する機会を明らかにする。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:06:36 GMT)
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search [0.0] 本稿では、強化学習に基づくニューラルアーキテクチャサーチ(NAS)エージェントを用いて、小型ニューラルネットワークを設計し、マルチスペクトル衛星画像上でアクティブな火災検知を行う。
具体的には、単一マルチスペクトル画素が火災の一部かどうかを判断できるニューラルネットワークを設計し、低地球軌道(LEO)ナノサテライトの制約内で限られた電力予算で行うことを目的としている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:32:32 GMT)
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search [0.0] 本稿では、強化学習に基づくニューラルアーキテクチャサーチ(NAS)エージェントを用いて、小型ニューラルネットワークを設計し、マルチスペクトル衛星画像上でアクティブな火災検知を行う。
具体的には、単一マルチスペクトル画素が火災の一部かどうかを判断できるニューラルネットワークを設計し、低地球軌道(LEO)ナノサテライトの制約内で限られた電力予算で行うことを目的としている。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:32:32 GMT)
Convergence of Iterative Quadratic Programming for Robust Fixed-Endpoint Transfer of Bilinear Systems [0.0] 両線形アンサンブル系の固定終端転送のための開ループ最小ノルム制御合成法を提案する。
2段階の計算を用いて、まず所望の端末状態への転送を保証し、次に制御関数のノルムを最小化する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:35:11 GMT)
Contribution Rate Imputation Theory: A Conceptual Model [0.0] 『貢献率計算理論』は、過去のコミットデータと典型的な開発率を分析して開発努力を推定する。
このアプローチはTime-Delta Methodに基づいて、サイクロマティック複雑性やLevenshtein距離といったメトリクスを使用して、観測されていない作業期間を計算する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 22:31:11 GMT)
Continuous Sweep for Binary Quantification Learning [0.0] Continuous SweepはMedian Sweepにインスパイアされた新しいパラメトリックバイナリ量子化器である。
本研究は,連続スウィープが分類群,数群,正則群の量化器より優れていることを示す3つのシミュレーション研究である。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:27:11 GMT)
Context-Aware SQL Error Correction Using Few-Shot Learning -- A Novel Approach Based on NLQ, Error, and SQL Similarity [0.0] 本稿では,誤り訂正 insql 生成のための新しい数ショット学習手法を提案する。
与えられた自然言語質問(NLQ)に対して最も適した少数ショット誤り訂正例を選択することにより、生成されたクエリの精度を向上させる。
オープンソースデータセットを用いた実験では、単純な誤り訂正法により、誤り訂正のない修正エラーが39.2%増加し、10%増加した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:22:08 GMT)
Comprehensive characterization of an apparatus for cold electromagnetic dysprosium dipoles [0.0] 低温原子顕微鏡(CAM)と4分の1マイクロメートルの設計解像度を組み込んだ先進的超低温ジスプロシウム装置の開発について報告する。
我々は,レーザーおよび蒸発冷却,格子負荷,輸送およびCAM焦点面におけるボゾン同位体164$Dyの雲の正確な位置決めについて実験を行った。
また、Dyの密接な空間の反対パリティレベルを利用すれば、$XYZ$モデルのような量子磁性の複雑なスピンモデルをシミュレートできるプラットフォームも提示する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 07:30:44 GMT)
Complex Stochastic Optimal Control Foundation of Quantum Mechanics [0.0] 本稿では,複素変数の文脈におけるHJB方程式の適用について検討する。
最適制御理論の枠組み内での量子粒子の運動に関する詳細な研究を提供する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:20:44 GMT)
Compare the Pair: Rotated vs. Unrotated Surface Codes at Equal Logical Error Rates [0.0] 量子コンピュータはリソース効率のよいエラー訂正コードを必要とする。
距離の代わりに、より有用な量子ビット保存計量は論理誤差率に基づく。
両符号の回路レベル雑音下での論理的・物理的誤り率の持続的スケーリングについて検討した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:26:07 GMT)
Compare the Pair: Rotated vs. Unrotated Surface Codes at Equal Logical Error Rates [0.0] 我々は,各符号の量子ビット数を比較し,回路レベルの雑音下での等価な論理誤差率を求める。
ローテーションされたコードは、演算物理エラー率$p=10-3$で論理エラー率$p_L = 10-12$を達成するために、非ローテーションコードで使用されるキュービットの数$sim74%を使用する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 06:26:07 GMT)
Coarse-graining and compounding as monads [0.0] 実験手順を含む2つの基本的な構成は、粗い粒度の実験の生成と、分岐する逐次実験の形成である。
私は、(一般)確率モデルの適切なカテゴリにおけるモナドの観点から、両方の構成を定式化する方法を示します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:01:05 GMT)
Beyond Prompts: Dynamic Conversational Benchmarking of Large Language Models [0.0] 本稿では,対話エージェントを対象とした動的ベンチマークシステムを提案する。
タスクをインターリーブするために定期的にコンテキストスイッチを行い、エージェントの長期記憶、継続的な学習、情報統合機能を評価する現実的なテストシナリオを構築します。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:32:16 GMT)
Batched Energy-Entropy acquisition for Bayesian Optimization [0.0] 本稿では,バッチ処理が可能なガウス過程を持つBOの統計物理学に基づく獲得関数を提案する。
BEEBOは最適化プロセスの探索・探索トレードオフの厳密な制御を可能にし、ヘテロスケダスティックブラックボックス問題に一般化する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:39:47 GMT)
Bank Loan Prediction Using Machine Learning Techniques [0.0] 我々は機械学習手法を用いて、148,670のインスタンスと37の属性のデータセットに取り組んできた。
最高の性能のアルゴリズムはAdaBoostingであり、99.99%の精度を達成した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:01:47 GMT)
Auto-Evolve: Enhancing Large Language Model's Performance via Self-Reasoning Framework [0.0] 本稿では,大規模言語モデルによる動的推論モジュールの自己生成を可能にする新しいフレームワークであるAuto-Evolveを紹介する。
我々は、Claude 2.0、Claude 3 Sonnet、Mistral Large、GPT 4による挑戦的なBigBench-HardデータセットのAuto-Evolveを評価する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:39:00 GMT)
Auto-Evolve: Enhancing Large Language Model's Performance via Self-Reasoning Framework [0.0] Auto-Evolveは、大規模言語モデルが動的推論モジュールを自己生成できるようにする新しいフレームワークである。
我々は、Claude 2.0、Claude 3 Sonnet、Mistral Large、GPT 4による挑戦的なBigBench-HardデータセットのAuto-Evolveを評価する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 20:39:00 GMT)
Attosecond pulses from a solid driven by a synthesized two-color field at megahertz repetition rate [0.0] 光-物質相互作用におけるコヒーレント量子力学の証明には、ポンプ-プローブ実験における高繰り返し速度孤立型アト秒パルス(IAP)が必要である。
広帯域誘電体MgOにおける極紫外(XUV)高調波のアト秒制御を実験的に達成した。
我々は前例のないメガヘルツ繰り返し速度でIAPを生産し、IAP生成のための全固体コンパクトXUV源の道を開いた。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 18:28:43 GMT)
Analyzing Neural Scaling Laws in Two-Layer Networks with Power-Law Data Spectra [0.0] ニューラルスケーリング法則は、深層ニューラルネットワークのパフォーマンスが、トレーニングデータサイズ、モデルの複雑さ、トレーニング時間などの重要な要因とどのようにスケールするかを記述する。
我々は, 統計力学の手法を用いて, 生徒-教員間の一パス勾配勾配を解析する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:21:42 GMT)
Analog simulation of noisy quantum circuits [0.0] 本稿では,低雑音下での同一性に近づいた演算子によって発生するトラジェクトリを用いて,ハードウェアノイズの表現に基づくシミュレーション手法を提案する。
この表現は量子軌道上の分散を著しく減少させ、ノイズのシミュレーションを10ドルから100ドル程度で高速化する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 09:04:02 GMT)
An Ontology-based Approach Towards Traceable Behavior Specifications in Automated Driving [0.0] 本稿では,自動走行システム搭載車両の動作を特定する手法として,セマンティックノーム行動解析を提案する。
対象とする運用環境の特定行動を形式的に表現し、特定行動とステークホルダーのニーズの間のトレーサビリティを確立するために使用します。
評価の結果,行動仕様における仮定の明示的な文書化は,仕様の不備の特定と治療の両立を支えていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 17:02:19 GMT)
An Explainable Ensemble-based Intrusion Detection System for Software-Defined Vehicle Ad-hoc Networks [0.0] 本研究では,アンサンブルに基づく機械学習による車両ネットワークにおけるサイバー脅威の検出について検討する。
我々は,Random Forest と CatBoost を主要な研究者として用いたモデルを提案し,ロジスティック回帰を用いて最終的な決定を下す。
我々は,本手法が分類精度を向上し,過去の研究に比べて誤分類が少ないことを観察した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 03:47:23 GMT)
Advancements in Ship Detection: Comparative Analysis of Optical and Hyperspectral Sensors [0.0] 本稿では,船舶の検知と分類技術,特に光学的および超スペクトル的リモートセンシング手法を比較した。
特徴抽出、方法論、および異なるミッションに対するそれらの適合性を網羅した、これらの技術に関する包括的分析を提示する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 19:11:35 GMT)
Accurately Classifying Out-Of-Distribution Data in Facial Recognition [0.0] 現実のシナリオは通常、トレーニングディストリビューションのデータとは異なる、目に見えないデータを特徴付けます。
この問題は、未表現のグループからのデータが、トレーニングデータの均等な割合を表現せずにテストデータに現れるという社会正義の問題で最も多い。
ニューラルネットワークの性能は、分布外データの複数のデータセットで同時にトレーニングされたときに、分布外データの顔画像を改善することができるか?
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:48:53 GMT)
A physics-guided neural network for flooding area detection using SAR imagery and local river gauge observations [0.0] 本研究では,洪水領域検出のための物理誘導型ニューラルネットワークを提案する。
提案手法は,インプットデータとして,センチネル1の時系列画像と,各画像に割り当てられた河川の水位を推定する。
提案手法の有効性を,デジタル地形モデルと光学衛星画像から得られた参照水マップと比較することにより,5つの研究領域で評価した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 14:13:06 GMT)
A Social Context-aware Graph-based Multimodal Attentive Learning Framework for Disaster Content Classification during Emergencies [0.0] CrisisSpotは、テキストと視覚の複雑な関係をキャプチャする手法である。
IDEAは、データ内の調和とコントラストの両方のパターンをキャプチャして、マルチモーダルインタラクションを強化する。
CrisisSpotは最先端の手法と比較してF1スコアの平均9.45%と5.01%の上昇を達成した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 13:51:46 GMT)
A SAM based Tool for Semi-Automatic Food Annotation [0.0] SAM(Segment Anything Model)を利用した半自動食品画像アノテーションツールのデモを紹介する。
このツールは、ユーザインタラクションを通じて、即時ベースの食品セグメンテーションを可能にし、ユーザエンゲージメントを促進し、食事イメージ内の食品のさらなる分類を可能にする。
また、食品画像のセグメンテーションに特化したViT-Bバックボーンを備えた、MealSAMと呼ばれるSAMのマスクデコーダの微調整版もリリースしました。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 11:50:10 GMT)
A Quick, trustworthy spectral knowledge Q&A system leveraging retrieval-augmented generation on LLM [0.0] 大規模言語モデル(LLM)は、自然言語処理(NLP)タスクにおいて、一般領域内で大きな成功を収めている。
本稿では,SDAAP(Spectral Detection and Analysis Based Paper)データセットを紹介する。
また、SDAAPデータセットに基づく自動Q&Aフレームワークを設計し、関連する知識を検索し、高品質な応答を生成する。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 15:13:51 GMT)
A Comparative Analysis on Ethical Benchmarking in Large Language Models [0.0] この研究は、インテリジェントシステムが人間の価値を正確に表現し、それに従って行動するかどうかを評価するテストを開発する機械倫理(ME)ベンチマークの分野に貢献する。
我々は,非現実的な倫理的ジレンマによる生態的妥当性の制限,包括的・排他的基準のない非構造的質問生成,人間のアノテーションへの依存によるスケーラビリティの欠如,の3つの主要な課題を明らかにした。
医用領域の現実的な倫理的ジレンマを特徴とするTriage BenchmarkとMedicical Law (MedLaw) Benchmarkの2つのMEベンチマークを紹介した。
論文参考訳(メタデータ) (Fri, 11 Oct 2024 05:05:21 GMT)