Fugu-MT: arxivの論文翻訳(概要)

EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions [150.9]
GPT-4oは、多様な感情や声調を持つ声の会話を可能にするオムニモーダルモデルである。本研究では,エンド・ツー・エンドの音声機能を備えた大規模言語モデルを実現するためのEMOVAを提案する。 EMOVAは、視覚言語と音声のベンチマークの両方で最先端のパフォーマンスを初めて達成した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:44:02 GMT)
Efficient Video Object Segmentation via Modulated Cross-Attention Memory [123.1]
頻繁なメモリ拡張を必要とせず、時間的滑らかさをモデル化するトランスフォーマーベースの手法MAVOSを提案する。我々のMAVOSは、単一のV100 GPU上で37フレーム/秒(FPS)で動作しながら、J&Fスコア63.3%を達成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:23:49 GMT)
Learning Interactive Real-World Simulators [96.6]
生成モデルを用いて実世界の相互作用の普遍的なシミュレータを学習する可能性について検討する。シミュレーターを用いて、高レベルな視覚言語ポリシーと低レベルな強化学習ポリシーの両方を訓練する。ビデオキャプションモデルは、シミュレートされた経験を持つトレーニングの恩恵を受けることができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:14:09 GMT)
Neuro-Symbolic Integration Brings Causal and Reliable Reasoning Proofs [95.1]
LLMの複雑な推論には2行のアプローチが採用されている。 1行の作業は様々な推論構造を持つLLMを誘導し、構造出力は自然に中間推論ステップと見なすことができる。他方の行では、LCMのない宣言的解法を用いて推論処理を行い、推論精度は向上するが、解法のブラックボックスの性質により解釈性に欠ける。具体的には,Prologインタプリタが生成した中間検索ログにアクセスし,人間可読推論に解釈可能であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:15:50 GMT)
Policy learning "without" overlap: Pessimism and generalized empirical Bernstein's inequality [94.9]
本論文は,事前収集した観測値を利用して最適な個別化決定規則を学習するオフライン政策学習について検討する。既存の政策学習法は、一様重なりの仮定、すなわち、全ての個々の特性に対する全ての作用を探索する正当性は、境界を低くしなければならない。我々は,点推定の代わりに低信頼度境界(LCB)を最適化する新しいアルゴリズムであるPPLを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:58:31 GMT)
Valeo4Cast: A Modular Approach to End-to-End Forecasting [93.9]
我々のソリューションはArgoverse 2 end-to-end Forecasting Challengeで63.82 mAPfでランクインした。私たちは、知覚から予測までエンドツーエンドのトレーニングを通じて、このタスクに取り組む現在のトレンドから離れ、代わりにモジュラーアプローチを使用します。私たちは、昨年の優勝者より+17.1ポイント、今年の優勝者より+13.3ポイント、予測結果を+17.1ポイント上回る。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:14:54 GMT)
MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models [91.4]
この研究は、大規模言語モデルにおける半構造化(あるいはN:M'')のスパーシティを確立する学習可能なプルーニング手法であるMaskLLMを紹介した。 MaskLLMはGumbel Softmaxサンプリングを通じて学習可能な分布としてN:Mパターンを明示的にモデル化する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:37:41 GMT)
How Feature Learning Can Improve Neural Scaling Laws [87.0]
我々は,カーネル限界を超えたニューラルスケーリング法則の解法モデルを開発する。モデルのサイズ、トレーニング時間、利用可能なデータの総量によるパフォーマンスのスケールアップ方法を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:05:32 GMT)
Empowering Agrifood System with Artificial Intelligence: A Survey of the Progress, Challenges and Opportunities [86.9]
我々は、AI技術がアグリフードシステムをどう変え、現代のアグリフード産業に貢献するかをレビューする。本稿では,農業,畜産,漁業において,アグリフードシステムにおけるAI手法の進歩について概説する。我々は、AIで現代のアグリフードシステムを変革するための潜在的な課題と有望な研究機会を強調します。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:34:35 GMT)
SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation [82.6]
本稿では、視覚言語モデル(VLM)を用いて、様々な衣服カテゴリーにおけるキーポイント予測を改善する統一的なアプローチを提案する。我々は、高度なシミュレーション技術を用いて大規模な合成データセットを作成し、大規模な実世界のデータを必要としないスケーラブルなトレーニングを可能にした。実験結果から, VLM法はキーポイント検出精度とタスク成功率を大幅に向上させることが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:26:16 GMT)
EAGLE: Towards Efficient Arbitrary Referring Visual Prompts Comprehension for Multimodal Large Language Models [80.0]
本稿では,既存のアプローチよりもトレーニングの少ない任意の参照視覚的プロンプトの理解を促進するための,MLLM(Multimodal Large Language Models)を提案する。本手法は,視覚的プロンプトを,MLLMに理解可能な特定の空間領域を伝達する空間概念として応用する。我々はまた、MLLMの領域レベルの理解を視覚的プロンプトを参照する特定の形式にさらに引き離すための幾何非依存学習パラダイム(GAL)を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:28:48 GMT)
Abstraction-of-Thought Makes Language Models Better Reasoners [79.7]
AoT(Abstraction-of-Thought)と呼ばれる新しい構造化推論形式を導入する。 AoTのユニークな点は、推論プロセス内での抽象化のさまざまなレベルに対する明示的な要件にある。提案するAoTコレクションは,AoT推論プロセスを用いた348kの高品質サンプルからなる汎用微調整データセットである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:15:14 GMT)
Two-Timescale Gradient Descent Ascent Algorithms for Nonconvex Minimax Optimization [77.3]
我々は、構造化された非極小最適化問題の解法として、2時間勾配上昇(TTGDA)を統一的に解析する。我々の貢献はTTGDAアルゴリズムを設計することであり、設定を超えて効果的です。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:48:34 GMT)
MIO: A Foundation Model on Multimodal Tokens [76.2]
マルチモーダルトークン上に構築された新しい基礎モデルMIOを紹介する。 MIOは、エンドツーエンドの自己回帰的な方法で、音声、テキスト、画像、ビデオを理解し、生成することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:57:16 GMT)
On the Design and Analysis of LLM-Based Algorithms [74.7]
大規模言語モデル(LLM)はアルゴリズムのサブルーチンとして使用される。 LLMは素晴らしい経験的成功を収めた。提案フレームワークは,LLMアルゴリズムの進歩を約束する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:21:33 GMT)
Hypergame Theory for Decentralized Resource Allocation in Multi-user Semantic Communications [71.6]
マルチユーザSCシステムにおける分散コンピューティングと通信資源割り当てのための新しいフレームワークを提案する。通信資源と計算資源を効率的に割り当てることの課題は、Stackelbergハイパーゲーム理論の適用によって解決される。シミュレーションの結果,提案したStackelbergハイパーゲームは通信資源と計算資源を効率的に利用することができることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:55:59 GMT)
FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner [70.9]
フローベースモデルはサンプリングプロセス中により直線的なサンプリング軌道を生成する傾向にある。擬似修正器やサンプル認識コンパイルなどいくつかの手法を導入し,推論時間をさらに短縮する。 FlowTurboはImageNet上で100(ms/img)で2.12FID、38(ms/img)で3.93FIDに達する
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:59:51 GMT)
Serving Deep Learning Model in Relational Databases [70.5]
リレーショナルデータ上での深層学習(DL)モデルの実現は、様々な商業分野や科学分野において重要な要件となっている。最先端のDL中心アーキテクチャは、DL計算を専用のDLフレームワークにオフロードします。 UDF中心アーキテクチャの可能性は、リレーショナルデータベース管理システム(RDBMS)内の1つ以上のテンソル計算をユーザ定義関数(UDF)にカプセル化する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:33:35 GMT)
CHIQ: Contextual History Enhancement for Improving Query Rewriting in Conversational Search [67.6]
我々は,オープンソースの大規模言語モデル(LLM)の機能を活用して,クエリ書き換え前の会話履歴の曖昧さを解消する2段階の手法であるCHIQを紹介する。我々は、CHIQがほとんどの設定で最先端の結果をもたらす、よく確立された5つのベンチマークを実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:19:34 GMT)
Neural P$^3$M: A Long-Range Interaction Modeling Enhancer for Geometric GNNs [67.0]
我々は,幾何学的GNNの汎用エンハンサーであるNeural P$3$Mを導入し,その機能範囲を拡大する。幅広い分子系に柔軟性を示し、エネルギーと力を予測する際、顕著な精度を示す。また、さまざまなアーキテクチャを統合しながら、OE62データセットで平均22%の改善も達成している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:16:59 GMT)
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models [66.2]
大型言語モデル(LLM)はゼロショット設定でグラデーション先行として振る舞うことができる。本稿では,LSMと算術符号を統合する新しい手法であるLM-GCを紹介する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:38:33 GMT)
SOAR: Self-supervision Optimized UAV Action Recognition with Efficient Object-Aware Pretraining [65.9]
無人航空機(UAV)が捉えた航空映像の自己監督型事前学習アルゴリズムについて紹介する。我々は,UAVビデオの事前学習効率と下流行動認識性能を向上させるために,事前学習プロセスを通じて人体知識を取り入れた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:15:22 GMT)
Reblurring-Guided Single Image Defocus Deblurring: A Learning Framework with Misaligned Training Pairs [65.3]
本稿では,単一画像デフォーカス・デブロアリングのためのリブロアリング誘導学習フレームワークを提案する。我々のリブラーリングモジュールは、デブラーレッド画像とリブラーレッド画像と入力ぼかし画像との空間的整合性を保証する。我々は,典型的な誤認識を伴わない単一画像デフォーカスのための新しいデータセットを収集した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:37:50 GMT)
The Hard Positive Truth about Vision-Language Compositionality [64.8]
視覚言語モデルがハードポジティクスに不変であるかどうかを考察する。強陰性字幕と強陰性字幕を併用した1,775,259枚の画像テキスト・トレーニングセットを作成した。本研究は,CLIPの「肯定的」概念間の意味的関係の理解を徹底的に検証し,改善するための今後の研究の必要性を示唆するものである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:36:10 GMT)
Message-Passing Monte Carlo: Generating low-discrepancy point sets via Graph Neural Networks [64.4]
本稿では,Message-Passing Monte Carlo という低差点集合を生成する機械学習手法を提案する。 MPMC点は、低次元と少数の点との差に関して、最適かほぼ最適であることが実証的に示されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:53:10 GMT)
Just say what you want: only-prompting self-rewarding online preference optimization [64.3]
現在の自己回帰アプローチは、差別者の判断能力に大きく依存している。本稿では,判断能力に頼らずに嗜好データセットを生成する,新たな自己回帰型オンラインアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:41:08 GMT)
Improving Fast Adversarial Training Paradigm: An Example Taxonomy Perspective [61.4]
高速対人訓練 (FAT) は, 効率的な訓練を行うために提案され, 熱い研究課題となっている。 FATは破滅的なオーバーフィッティングに悩まされ、多段階の逆行訓練と比較してパフォーマンスが低下する。本稿では, FATにおける内的最適化と外的最適化のバランスが不均衡であることから, 破滅的なオーバーフィッティングが原因であることが確認された FAT の分類例を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:47:50 GMT)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.9]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:57:52 GMT)
Improving the Shortest Plank: Vulnerability-Aware Adversarial Training for Robust Recommender System [60.7]
VAT(Vulnerability-aware Adversarial Training)は、レコメンデーションシステムにおける中毒攻撃に対する防御を目的とした訓練である。 VATは、システムの適合度に基づいて、ユーザの脆弱性を推定するために、新たな脆弱性認識機能を採用している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:24:03 GMT)
ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.2]
合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。拡散燃料SFRモデルであるtextID3$を紹介します。 textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:46:40 GMT)
LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field [58.9]
ニューラル光場(NeLF)に基づく最初の頭部アバターモデルであるLightAvatarを紹介する。 LightAvatarは3DMMパラメータから画像をレンダリングし、メッシュやボリュームレンダリングを使わずに、単一のネットワークフォワードパスを介してカメラがポーズする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:00:02 GMT)
EvMAPPER: High Altitude Orthomapping with Event Cameras [58.9]
この研究は、イベントカメラを用いた最初のオルソモザイク的アプローチを導入している。 CMOSカメラにのみ依存する既存の手法とは対照的に,本手法は難易度の高い光条件においてもマップ生成を可能にする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:57:15 GMT)
Synthesizing Environment-Specific People in Photographs [58.0]
ESPはコンテキスト対応フルボディ生成のための新しい手法である。 ESPは、シーンの写真から抽出された2Dポーズとコンテキストキューに条件付けされる。本研究では,ESPがコンテキストフルボディ生成のタスクにおいて,最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:25:33 GMT)
E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding [57.6]
E.T. Bench (Event-Level & Time-Sensitive Video Understanding Benchmark)は、イベントレベルのオープンな理解のための大規模ベンチマークである。ベンチマークでは,8つの画像-LLMと12個のビデオ-LLMを広範囲に評価し,その結果から,粗い(ビデオレベル)理解のための最先端モデルが,きめ細かなタスクの解決に苦慮していることが判明した。私たちのシンプルだが効果的なソリューションは、複数のシナリオで優れたパフォーマンスを示します。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:53:04 GMT)
Trust-Region Sequential Quadratic Programming for Stochastic Optimization with Random Models [57.5]
本稿では,1次と2次の両方の定常点を見つけるための信頼逐次準計画法を提案する。本手法は, 1次定常点に収束するため, 対象対象の近似を最小化して定義された各イテレーションの勾配ステップを計算する。 2階定常点に収束するため,本手法は負曲率を減少するヘッセン行列を探索する固有ステップも計算する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:37:48 GMT)
The Lou Dataset -- Exploring the Impact of Gender-Fair Language in German Text Classification [57.1]
ジェンダーフェア言語は、すべての性別に対処したり、中立形を使用することによって包摂性を促進する。ジェンダーフェア言語はラベルを反転させ、確実性を減らし、注意パターンを変化させることで予測に大きな影響を及ぼす。ドイツ語のテキスト分類への影響について最初の知見を提供する一方で、他の言語にもその知見が当てはまる可能性が高い。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:08:17 GMT)
Implementing a Nordic-Baltic Federated Health Data Network: a case report [57.0]
我々は5か国6機関からなるフェデレーション型健康データネットワークを開発するための学際コンソーシアムを結成した。本報告の目的は,このネットワークの開発経験に関する早期知見を提供することである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:15:54 GMT)
Deblur e-NeRF: NeRF from Motion-Blurred Events under High-speed or Low-light Conditions [56.8]
動き赤外イベントからぼやけた最小のNeRFを再構成する新しい手法であるDeblur e-NeRFを提案する。また,大きなテクスチャレスパッチの正規化を改善するために,新しいしきい値正規化全変動損失を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:57:20 GMT)
Toward Efficient Deep Blind RAW Image Restoration [56.4]
我々は、深部ブラインドRAW復元モデルをトレーニングするための、新しい現実的な劣化パイプラインを設計する。私たちのパイプラインでは、リアルなセンサーノイズ、動きのぼかし、カメラの揺れ、その他の一般的な劣化について検討しています。パイプラインと複数のセンサーのデータで訓練されたモデルは、ノイズとぼやけをうまく低減し、異なるカメラから撮影されたRAW画像の細部を復元する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:34:37 GMT)
HaloScope: Harnessing Unlabeled LLM Generations for Hallucination Detection [55.6]
HaloScopeは、幻覚検出のために、未ラベルの大規模言語モデルを活用する新しい学習フレームワークである。未ラベル混合データ中の真偽と非真偽の世代を区別する自動会員推定スコアを提案する。実験により、HaloScopeはより優れた幻覚検出性能を達成でき、競争相手よりもかなりの差で勝っていることが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:22:09 GMT)
AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.2]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:17:10 GMT)
TA-Cleaner: A Fine-grained Text Alignment Backdoor Defense Strategy for Multimodal Contrastive Learning [53.8]
バックドアトリガの特徴的接続を遮断するための細粒な textbfText textbfAlignment textbfCleaner (TA-Cleaner) を提案する。 TA-Cleanerは、ファインタニングベースの防御技術の中で最先端の防御性を達成している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:35:23 GMT)
Dimension-independent learning rates for high-dimensional classification problems [53.6]
各RBV2$関数は、重みが有界なニューラルネットワークによって近似可能であることを示す。次に、分類関数を近似した有界重みを持つニューラルネットワークの存在を証明する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:02:13 GMT)
Criticality and Safety Margins for Reinforcement Learning [53.1]
我々は,定量化基盤真理とユーザにとっての明確な意義の両面から,批判的枠組みを定めようとしている。エージェントがn連続的ランダム動作に対するポリシーから逸脱した場合の報酬の減少として真臨界を導入する。我々はまた、真の臨界と統計的に単調な関係を持つ低オーバーヘッド計量であるプロキシ臨界の概念も導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:00:45 GMT)
SlimSAM: 0.1% Data Makes Segment Anything Slim [53.0]
本稿では,新しいデータ効率のSAM圧縮手法であるSlimSAMを紹介する。 SlimSAMは、非常に少ないトレーニングデータで優れたパフォーマンスを達成する。コードはhttp://github.com/czg1225/SlimSAMで入手できる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:41:56 GMT)
Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study [52.9]
自動音声認識(ASR)のためのエンコーダとして再利用された事前訓練言語モデル(PLM)内のトランスフォーマー本研究は,事前学習したLMのトランスフォーマーを組み込んだASRタスクにおいて,文字誤り率 (CER) とワード誤り率 (WER) の顕著な改善が認められた。このことは、事前訓練されたトランスフォーマーに埋め込まれたセマンティックな技術を活用して、ASRシステムの能力を向上させる可能性を浮き彫りにしている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:31:18 GMT)
EfficientRAG: Efficient Retriever for Multi-Hop Question Answering [52.6]
マルチホップ質問応答のための効率的な検索器であるEfficientRAGを紹介する。実験の結果、EfficientRAGは3つのオープンドメインのマルチホップ質問応答データセット上で既存のRAG手法を超越していることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:42:35 GMT)
Subjective and Objective Quality-of-Experience Evaluation Study for Live Video Streaming [51.7]
ライブビデオストリーミングにおける主観的および客観的QoE評価の総合的研究を行う。主観的なQoE研究のために、最初のライブビデオストリーミングQoEデータセットであるTaoLive QoEを紹介する。 TaoLive QoEデータセットの主観的QoEスコアを導出するために人間による研究を行った。マルチスケールな意味的特徴と光フローに基づく動作特徴を統合したエンドツーエンドQoE評価モデルTao-QoEを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:22:38 GMT)
Efficient Fairness-Performance Pareto Front Computation [51.6]
最適公正表現はいくつかの有用な構造特性を持つことを示す。そこで,これらの近似問題は,凹凸プログラミング法により効率的に解けることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:46:48 GMT)
Robot See Robot Do: Imitating Articulated Object Manipulation with Monocular 4D Reconstruction [51.5]
本研究は,1つの単分子RGB人間の実演から音声による物体操作を模倣する手法を開発した。まず,モノクロ映像から3次元部分運動を復元する4次元微分可能部品モデル(4D-DPM)を提案する。この4D再構成を前提として、ロボットは物体の軌道を再現し、両腕の動きを計画し、実証された物体部分の動きを誘導する。両用するYuMiロボットを用いて,4D-DPMの3D追跡精度を実写3D部分軌跡に基づいて評価し,9つのオブジェクトに対してRSRDの物理的実行性能を評価した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:57:16 GMT)
Discrete, compositional, and symbolic representations through attractor dynamics [51.2]
我々は,思考の確率的言語(PLoT)に似た認知過程をモデル化するために,アトラクタダイナミクスを記号表現と統合した新しいニューラルシステムモデルを導入する。我々のモデルは、連続表現空間を、事前定義されたプリミティブに頼るのではなく、教師なし学習を通じて、記号系の意味性と構成性の特徴を反映する、記号列に対応する引き付け状態を持つ離散盆地に分割する。このアプローチは、認知操作の複雑な双対性を反映したより包括的なモデルを提供する、AIにおける表現力の証明された神経弁別可能な基質であるニューラルダイナミクスを通じて、シンボル処理とサブシンボル処理の両方を統合する統一的なフレームワークを確立する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:21:10 GMT)
BlinkTrack: Feature Tracking over 100 FPS via Events and Images [51.0]
本稿では,RGB画像とイベントデータを統合した新しいフレームワークであるBlinkTrackを提案する。本手法は,従来のカルマンフィルタを学習ベースのフレームワークに拡張し,イベントおよびイメージの分岐において微分可能なカルマンフィルタを利用する。実験の結果、BlinkTrackは既存のイベントベースの手法よりも大幅に優れていた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:54:18 GMT)
Visual Data Diagnosis and Debiasing with Concept Graphs [50.8]
ディープラーニングモデルは、トレーニングプロセス中にデータ固有のバイアスを拾い上げることが多く、信頼性の低い予測につながります。視覚データセットにおける概念共起バイアスの診断と緩和のための新しいフレームワークであるConBIASを提案する。このような不均衡を緩和し,下流タスクの性能向上につながることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:59:01 GMT)
EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models [50.5]
EMMA-500は546言語にわたるテキストで継続訓練された大規模多言語言語モデルである。本結果は,大規模言語モデルの言語能力拡大における継続事前学習の有効性を強調した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:40:45 GMT)
Flexiffusion: Segment-wise Neural Architecture Search for Flexible Denoising Schedule [50.3]
拡散モデル(diffusion model)は、多様な高品質な画像を生成するのに適した最先端の生成モデルである。近年,より高速な生成プロセスの自動探索技術が採用されている。拡散モデルの高速化を目的とした新しいトレーニングフリーNASパラダイムであるFlexiffusionを紹介する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:28:05 GMT)
Elephant in the Room: Unveiling the Impact of Reward Model Quality in Alignment [50.2]
重要な役割の報酬モデルが整列するにもかかわらず、以前の作品は一貫してパフォーマンスを見落としている。本研究は、まず、広く使われている嗜好データセットHH-RLHFの品質を調査し、クリーンバージョンCHH-RLHFをキュレートする。本稿では,CHH-RLHFに基づいて,従来のアライメント作業で使用する幅広い報酬モデルの精度をベンチマークし,最適化と評価の両方に使用するという信頼性の欠如を明らかにした。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:28:35 GMT)
ND-SDF: Learning Normal Deflection Fields for High-Fidelity Indoor Reconstruction [50.1]
微妙な幾何を同時に復元し、異なる特徴を持つ領域をまたいだ滑らかさを保つことは自明ではない。そこで我々は,ND-SDFを提案する。ND-SDFは,通常のシーンとそれ以前のシーンの角偏差を表す正規偏向場を学習する。本手法は, 壁面や床面などのスムーズなテクスチャ構造を得るだけでなく, 複雑な構造の幾何学的詳細も保存する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:31:25 GMT)
AsyncDiff: Parallelizing Diffusion Models by Asynchronous Denoising [49.8]
AsyncDiffは、複数のデバイスにまたがるモデル並列化を可能にする、普遍的でプラグアンドプレイのアクセラレーションスキームである。安定拡散 v2.1 では、AsyncDiff は2.7倍の速度アップと4.0倍のスピードアップを実現し、CLIPスコアの 0.38 をわずかに削減した。我々の実験は、AsyncDiffがビデオ拡散モデルに容易に適用でき、性能を向上できることを示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:47:36 GMT)
Triple Point Masking [49.4]
既存の3Dマスク学習手法は、限られたデータの下でパフォーマンスボトルネックに遭遇する。我々は、マスク付きオートエンコーダの事前学習のためのスケーラブルなフレームワークとして、TPMと呼ばれるトリプルポイントマスキング方式を導入する。大規模な実験により,提案したTPMを組み込んだ4つのベースラインが,下流タスクの総合的な性能向上を実現することが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:33:30 GMT)
Method for Evaluating the Number of Signal Sources and Application to Non-invasive Brain-computer Interface [49.2]
本稿では,時系列展開法の背後にある数学的理論を簡潔に紹介する。提示されたアルゴリズムは、脳とコンピュータのインターフェイスから収集されたデータを解析するための貴重な数学的および分析ツールとして機能する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:03:42 GMT)
Exploring Selective Layer Fine-Tuning in Federated Learning [48.5]
フェデレートラーニング(FL)は,分散データを用いた基礎モデルの微調整のための,有望なパラダイムとして登場した。 FLにおける選択的層微調整について検討し、クライアントがローカルデータやリソースに応じて選択した層を調整できるフレキシブルなアプローチを強調した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:26:18 GMT)
LangSAMP: Language-Script Aware Multilingual Pretraining [48.2]
最近の多言語事前訓練言語モデル(mPLM)は、言語埋め込みの使用を避けることが多い。 LangSAMPには言語とスクリプトの埋め込みが組み込まれており、表現学習が強化されている。我々は500以上の言語をカバーする多言語コーパス上のXLM-Rの継続事前学習にLangSAMPを適用した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:29:10 GMT)
Advancing Open-Set Domain Generalization Using Evidential Bi-Level Hardest Domain Scheduler [47.4]
Open-Set Domain Generalizationでは、新しいデータ外観(ドメイン)とオープンセット条件の両方でモデルが公開される。適応型ドメインスケジューラを実現するために,Evidential Bi-Level Hardest Domain Scheduler (EBiL-HaDS)を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:57:35 GMT)
GenWarp: Single Image to Novel Views with Semantic-Preserving Generative Warping [47.4]
一つの画像から新しいビューを生成するための意味保存型生成ワープフレームワークを提案する。提案手法は,ソースビューイメージに生成モデルを条件付けすることで,既存の手法の限界に対処する。我々のモデルは、ドメイン内シナリオとドメイン外シナリオの両方において、既存のメソッドよりも優れています。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:22:52 GMT)
Search and Detect: Training-Free Long Tail Object Detection via Web-Image Retrieval [46.9]
トレーニング不要なロングテールオブジェクト検出フレームワークであるSearchDetを紹介する。提案手法は単純かつ無訓練であるが,ODinWでは48.7% mAP,LVISでは59.1% mAPの改善が達成されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:14:19 GMT)
Adjusting Regression Models for Conditional Uncertainty Calibration [46.7]
本稿では,分割共形予測手法を適用して条件付きカバレッジを改善するために,回帰関数を訓練する新しいアルゴリズムを提案する。本研究では,条件付きカバレッジと名目付きカバレッジ率の差分を求める上限を確立し,この上限値を制御するためのエンドツーエンドアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:55:45 GMT)
QRMeM: Unleash the Length Limitation through Question then Reflection Memory Mechanism [46.4]
メモリメカニズムは、長いコンテキストを管理するための柔軟なソリューションを提供する。本稿では,二重構造メモリプールを組み込んだ新しい手法であるQRMeMを提案する。マルチチョイス質問 (MCQ) とマルチドキュメント質問応答 (Multi-doc QA) のベンチマークによる評価では,既存手法と比較してQRMeMの性能が向上している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:42:48 GMT)
Strategic Linear Contextual Bandits [46.2]
本研究では,線形文脈帯域問題の戦略的変異について検討する。そこでは,アームが学習者にプライベートに観測されたコンテキストを戦略的に誤報告することができる。我々は, エージェントに対して, 後悔を最小限に抑えつつ, 文脈を真実に報告するよう動機づけるオプティスティックグリムトリガー機構(OptGTM)を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:34:41 GMT)
Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect [45.8]
我々はAtlas-Chatを紹介した。Atlas-Chatは、方言アラビア語に特化して開発された大規模な言語モデルのコレクションである。既存のDarija言語資源を集約し、手動と合成の両方で新しいデータセットを作成することで、命令データセットを構築します。データセットを微調整したAtlas-Chat-9Bと2Bモデルは、Darija命令に従い、標準のNLPタスクを実行する優れた能力を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:56:38 GMT)
Realistic Evaluation of Model Merging for Compositional Generalization [45.7]
我々は,異なるマージ手法の相対的メリットを,共有実験環境で評価することによって評価する。具体的には、画像分類、画像生成、自然言語処理における特徴の合成一般化にマージを用いることに焦点をあてる。我々は、異なるマージ手法の計算コストと、マージされるモデルの数をスケールする際のそれらの性能を計測する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:44:20 GMT)
Learning to Receive Help: Intervention-Aware Concept Embedding Models [44.1]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、高レベルの概念セットを使用して予測を構築し、説明することによって、ニューラルネットワークの不透明さに対処する。近年の研究では、介入効果は概念が介入される順序に大きく依存していることが示されている。 IntCEM(Intervention-Aware Concept Embedding Model)は,テスト時間介入に対するモデルの受容性を改善する新しいCBMアーキテクチャとトレーニングパラダイムである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:09:22 GMT)
Unraveling Anomalies in Time: Unsupervised Discovery and Isolation of Anomalous Behavior in Bio-regenerative Life Support System Telemetry [43.9]
南極のEDEN ISS宇宙温室から得られたテレメトリデータから得られた異常を解析した。我々は,異常検出結果に時系列クラスタリングを適用し,様々な種類の異常を分類する。本稿では, MDI と DAMP の異常検出手法が相補的な結果をもたらすことを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:21:31 GMT)
Graph Edit Distance with General Costs Using Neural Set Divergence [43.8]
グラフ編集距離(GED)は、2つのグラフ間の(dis-)類似性を測定する。本稿では,編集作業に要する一般的なコストで動作可能なニューラルGED推定器である GraphEDX を提案する。さまざまな編集コスト設定の下で、いくつかのデータセットの実験では、 GraphEDXが最先端の計算とメソッドを一貫して上回っていることが示されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:51:29 GMT)
AI Delegates with a Dual Focus: Ensuring Privacy and Strategic Self-Disclosure [43.0]
我々は、さまざまな社会的関係やタスクシナリオにまたがるAIデリゲートのユーザの嗜好を調査するために、パイロットスタディを実施している。次に、プライバシーに配慮した自己開示を可能にする新しいAIデリゲートシステムを提案する。我々のユーザー調査は、提案されたAIデリゲートがプライバシーを戦略的に保護し、多様なダイナミックなソーシャルインタラクションにおけるその利用の先駆者であることを実証している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:45:15 GMT)
SLIDE: A machine-learning based method for forced dynamic response estimation of multibody systems [42.9]
SLiding-Window初期停止型動的応答推定器(SLIDE) メカニカル・マルチボディシステムの出力シーケンスを推定する深層学習法その結果、シミュレーションから数百万までの大幅な高速化が示され、リアルタイム性能を大きく上回った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:34:07 GMT)
Hybrid Spiking Neural Networks for Low-Power Intra-Cortical Brain-Machine Interfaces [42.7]
皮質内脳-機械界面(iBMI)は麻痺患者の生活を劇的に改善する可能性がある。現在のiBMIは、ハードウェアと配線が大きすぎるため、スケーラビリティとモビリティの制限に悩まされている。無線iBMIにおける組込みニューラルデコーディングのためのハイブリッドスパイキングニューラルネットワークについて検討している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:53:04 GMT)
EgoLM: Multi-Modal Language Model of Egocentric Motions [42.4]
マルチモーダル入力からエゴセントリックな動きを追跡し,理解する多目的フレームワークであるEgoLMを提案する。我々の重要な洞察は、大きな言語モデルを用いて、自我中心運動と自然言語の連立分布をモデル化することである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:59:31 GMT)
Diversity-Driven Synthesis: Enhancing Dataset Distillation through Directed Weight Adjustment [42.0]
多様性の向上は、データセットを合成するための並列化可能であるが孤立したアプローチを改善することができる、と我々は主張する。本稿では,動的かつ指向的な重み調整技術を用いて合成過程を変調する新しい手法を提案する。提案手法は,合成データの各バッチが,元のデータセットの大規模かつ多様なサブセットの特徴を反映していることを保証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:03:19 GMT)
Pure state entanglement and von Neumann algebras [41.9]
我々は、フォン・ノイマン代数の交換で表される二部量子系に対する局所演算の理論と古典的通信(LOCC)を開発する。我々の定理は、ハグ双対性における可換因子によってモデル化された双対系において、すべての状態が無限に一発の絡み合いを持つことを暗示する。付録では、半有限フォン・ノイマン代数と$sigma$-finite測度空間上の偏化の自己完備な処理を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:13:47 GMT)
Multimodal Banking Dataset: Understanding Client Needs through Event Sequences [41.5]
本稿では,150万人以上の企業顧客を擁する,産業規模で利用可能なマルチモーダルバンキングデータセットMBDについて紹介する。すべてのエントリは、実際のプロプライエタリな銀行データから適切に匿名化されます。我々は,タスクごとの単一モーダル手法よりも,マルチモーダルベースラインの方が優れていることを示す数値的な結果を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:07:08 GMT)
Disentangled Clothed Avatar Generation from Text Descriptions [41.0]
本稿では,人体と衣服を別々に生成する新しいテキスト・トゥ・アバター生成手法を提案する。提案手法は,テクスチャやテクスチャの質の向上,テキストプロンプトとのセマンティックアライメントの向上を実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:11:37 GMT)
EAGLES: Efficient Accelerated 3D Gaussians with Lightweight EncodingS [40.9]
3Dガウシアンスプラッティング(3D-GS)は、ノベルビューシーンの合成で人気がある。レイディアンス・ニューラル・フィールド(NeRF)に関連する長いトレーニング時間と遅いレンダリング速度の課題に対処する。本稿では,メモリ単位の記憶容量を大幅に削減するために,量子化埋め込みを利用する手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:33:24 GMT)
Demonstration of entanglement distribution over 155 km metropolitan fiber using a silicon nanophotonic chip [39.8]
我々は、オフチップの光子対の明るさが8,000対から460,000対/秒のSOIプラットフォームを報告した。これは前回の報告を3桁の明るさで上回っている。 1つの光子を局所的に測定し、もう1つの光子を93kmの光ファイバーで送信すると、毎秒132対のカウントレートが得られる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:11:05 GMT)
Dark Miner: Defend against unsafe generation for text-to-image diffusion models [39.8]
テキストと画像の拡散モデルは、フィルタされていない大規模なトレーニングデータにより、安全でない生成で実証されている。我々は、採掘、検証、回避を含む3段階のプロセスであるダークマイナーを提案する。本手法は,特に4件の最先端攻撃において,消去効果と防御効果が向上する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:48:24 GMT)
Open-World Evaluation for Retrieving Diverse Perspectives [39.2]
主観的質問に対する検索多様性のベンチマーク(BERDS)を作成する。それぞれの例は質問と、質問に関連するさまざまな視点で構成されている。検索した文書に視点があるかどうかを判断する言語モデルに基づく自動評価器を構築する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:52:57 GMT)
Can AI writing be salvaged? Mitigating Idiosyncrasies and Improving Human-AI Alignment in the Writing Process through Edits [39.0]
私たちはプロの作家を雇い、いくつかの創造的なドメインで段落を編集しました。 LAMPコーパス 1,057 LLM- generated paragraphs by professional writer based by our taxonomy。 LAMPの分析から,本研究で用いたLLMはいずれも,書字品質の面では優れていないことが明らかとなった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:15:53 GMT)
Can AI writing be salvaged? Mitigating Idiosyncrasies and Improving Human-AI Alignment in the Writing Process through Edits [39.0]
私たちはプロの作家を雇い、いくつかの創造的なドメインで段落を編集しました。 LAMPコーパス 1,057 LLM- generated paragraphs by professional writer based by our taxonomy。 LAMPの分析から,本研究で用いたLLMはいずれも,書字品質の面では優れていないことが明らかとなった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:15:53 GMT)
Can AI writing be salvaged? Mitigating Idiosyncrasies and Improving Human-AI Alignment in the Writing Process through Edits [39.0]
私たちはプロの作家を雇い、いくつかの創造的なドメインで段落を編集しました。 LAMPコーパス 1,057 LLM- generated paragraphs by professional writer based by our taxonomy。 LAMPの分析から,本研究で用いたLLMはいずれも,書字品質の面では優れていないことが明らかとなった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:15:53 GMT)
P4Q: Learning to Prompt for Quantization in Visual-language Models [38.9]
量子化のためのPrompt(P4Q)という,微調整と量子化のバランスをとる手法を提案する。提案手法は,低ビット量子化による画像特徴とテキスト特徴とのギャップを効果的に低減することができる。私たちの8ビットP4Qは理論上CLIP-ViT/B-32を4$times$で圧縮でき、Top-1の精度は66.94%である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:31:27 GMT)
Analysis of Spatial augmentation in Self-supervised models in the purview of training and test distributions [38.8]
本稿では,自己指導型表現学習における空間拡張手法の実証的研究について述べる。 a) ランダムトリミングを2つの別々の拡張に分解し、オーバーラップとパッチを行い、重複領域とパッチサイズがダウンストリームタスクの精度に与える影響を詳細に分析する。以前の文献で報告されたように、なぜカットアウト強化が良い表現を学ばないのかについての洞察を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:18:36 GMT)
Assumption violations in causal discovery and the robustness of score matching [38.6]
本稿では、最近の因果発見手法の観測データに対する実証的性能を広範囲にベンチマークする。スコアマッチングに基づく手法は、推定されたグラフの偽陽性と偽陰性率において驚くべき性能を示すことを示す。本論文は,因果発見手法の評価のための新しい基準を策定することを願っている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:55:48 GMT)
Computation Pre-Offloading for MEC-Enabled Vehicular Networks via Trajectory Prediction [38.5]
本稿では,車両の過去の軌跡を解析するためのトラジェクトリ予測に基づく事前負荷決定アルゴリズムを提案する。本稿では,Double Deep Q-Network (DDQN) を用いて,エッジサーバがタスク処理遅延を最小限に抑える動的リソース割り当てアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:46:43 GMT)
RoLoRA: Fine-tuning Rotated Outlier-free LLMs for Effective Weight-Activation Quantization [38.2]
有効重量活性化量子化のための最初のLoRA方式であるRoLoRAを提案する。我々は,LLaMA2-7B/13B,LLaMA3-8Bモデルにおけるロロラの評価を行い,最大29.5%の精度で4ビットの重量活性化量子化LLaMA2-13Bを実現した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:47:03 GMT)
An Empirical Study on Cross-lingual Vocabulary Adaptation for Efficient Language Model Inference [38.2]
State-of-the-the-art Generative Large Language Model (LLM) は、英語中心のトークン化器、語彙、事前学習データに依存している。近年の研究では、英語以外の言語でテキストを生成する際に、推論効率が低下することが示されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:15:14 GMT)
Nob-MIAs: Non-biased Membership Inference Attacks Assessment on Large Language Models with Ex-Post Dataset Construction [37.7]
メンバーシップ推論攻撃 (MIA) は、特定の文書が与えられたLarge Language Models (LLM) プリトレーニングで使用されたかどうかを検出することを目的としている。本稿では,LLMにおけるMIAの評価について述べる。我々は、より公平なMIA評価のために、非バイアス'と非分類'のデータセットを作成するアルゴリズムを提案し、検証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:38:02 GMT)
Dirichlet-Based Coarse-to-Fine Example Selection For Open-Set Annotation [37.3]
本稿では,ディリクレに基づく大まかな実例選択(DCFS)戦略を提案する。本手法では, 翻訳の不変性を損なうために, 単純なx-based obviousial Deep Learning (EDL)を導入している。様々なオープンネス比データセットの実験は、DCFSが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:47:50 GMT)
WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians [37.1]
We developed a new style transfer method for 3D scene called WaSt-3D。トレーニングを必要とせずに、スタイルシーンからコンテンツシーンに詳細を忠実に転送する。 WaSt-3Dは、トレーニングを必要とせずに、さまざまなコンテンツやスタイルシーンに一貫して結果を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:02:50 GMT)
DualCoTs: Dual Chain-of-Thoughts Prompting for Sentiment Lexicon Expansion of Idioms [37.0]
既存の感情分析専用のコーパスは、テキスト感情分析の研究をかなり制限している。本稿では,イディオムに対する感情辞書を自動的に拡張し,大規模言語モデルの能力を活用するための革新的なアプローチを提案する。実験により、DualCoTsは中国語と英語の両方の感情的語彙拡大に有効であることが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:07:14 GMT)
Eagle and Finch: RWKV with Matrix-Valued States and Dynamic Recurrence [37.0]
本稿では,RWKV(RWKV-4)アーキテクチャを改良したシーケンスモデルであるEagle(RWKV-5)とFinch(RWKV-6)を紹介する。アーキテクチャ設計の進歩には、マルチヘッド行列値状態と動的再帰機構が含まれる。我々は1.12兆のトークンを持つ新しい多言語コーパスと、強化された多言語性のためのgreedyマッチングに基づく高速トークン化器を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:39:08 GMT)
Eagle and Finch: RWKV with Matrix-Valued States and Dynamic Recurrence [37.0]
本稿では,RWKV(RWKV-4)アーキテクチャを改良したシーケンスモデルであるEagle(RWKV-5)とFinch(RWKV-6)を紹介する。アーキテクチャ設計の進歩には、マルチヘッド行列値状態と動的再帰機構が含まれる。我々は1.12兆のトークンを持つ新しい多言語コーパスと、強化された多言語性のためのgreedyマッチングに基づく高速トークン化器を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:39:08 GMT)
EdgeRunner: Auto-regressive Auto-encoder for Artistic Mesh Generation [36.7]
本稿では,最大4,000面の高品質な3Dメッシュを5123ドルの空間解像度で生成できる自動回帰オートエンコーダ(ArAE)モデルを提案する。本稿では, 3次元メッシュを1次元トークンシーケンスに効率よく圧縮し, トレーニング効率を大幅に向上させる新しいメッシュトークン化アルゴリズムを提案する。我々のモデルは、可変長の三角形メッシュを固定長の潜在空間に圧縮し、より優れた一般化のための潜在拡散モデルの訓練を可能にする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:55:02 GMT)
AI Policy Projector: Grounding LLM Policy Design in Iterative Mapmaking [34.9]
地図作成にインスパイアされたAIポリシー設計プロセスを導入する。 Policy Projector は LLM 分類とステアリングを用いたインタラクティブなポリシオーサリングをサポートする。 AIの安全性の専門家12名による評価では、ポリシーデザイナが問題のあるモデル行動に対処するのに役立つ。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:34:16 GMT)
Sequential Kernelized Stein Discrepancy [34.8]
我々は、任意の点評価においてスタインカーネルの潜在的有界性を利用して、テストマーチンガレットを定義する。我々は、この試験の有効性を証明し、代替案の下での富のプロセスの対数的成長の限界を低くする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:24:59 GMT)
Learning Constrained Markov Decision Processes With Non-stationary Rewards and Constraints [34.7]
制約付きマルコフ決定プロセス(CMDP)では、逆の報酬と制約があり、よく知られた不合理性の結果、任意のアルゴリズムがサブリニア後悔とサブリニア制約違反を達成できない。非定常的な報酬や制約のあるCMDPでは、非定常性の増加とともに性能がスムーズに低下するアルゴリズムを提供することで、この負の結果が緩和できることが示される。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:23:54 GMT)
EAGLE: Egocentric AGgregated Language-video Engine [34.6]
我々は,Eagle(Egocentric AGgregated Language-video Engine)モデルとEagle-400Kデータセットを導入し,エゴセントリックなビデオ理解タスクを統合する統一フレームワークを提供する。エゴセントリックなビデオ分析は、一人称視点から人間の活動や意図を理解するための新たな洞察をもたらす。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:17:27 GMT)
Learning to Drive via Asymmetric Self-Play [34.6]
課題,解決可能,現実的な合成シナリオを用いて,実際のデータを超えてスケールする非対称なセルフプレイを提案する。私たちのアプローチは、解決可能なシナリオを生成することを学ぶ教師と、それを解くことを学ぶ学生のペアです。当社の方針は、エンド・ツー・エンドの自律性のためのトレーニングデータを生成するためのゼロショット転送をさらに促進し、最先端の敵のアプローチを著しく上回っている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:55:38 GMT)
Benign or Not-Benign Overfitting in Token Selection of Attention Mechanism [34.3]
注目アーキテクチャのトークン選択機構における良性過剰適合の解析を行う。私たちの知る限りでは、注意機構に対する良心過剰適合を特徴づける最初の研究である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:20:05 GMT)
Revisiting Deep Ensemble Uncertainty for Enhanced Medical Anomaly Detection [34.1]
医用異常検出のためのDual-space Uncertainty Estimationフレームワークを提案する。異常検出のための一致と不一致のバランスをとるために,冗長性認識反発(RAR)を提案する。また,入出力空間におけるアンサンブルの不確実性を利用したDual-Space Uncertainty(DSU)を開発した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:47:41 GMT)
Retrospective Comparative Analysis of Prostate Cancer In-Basket Messages: Responses from Closed-Domain LLM vs. Clinical Teams [33.9]
我々は,GPT-4をベースとしたLarge Language Model (LLM) であるRadOnc-GPTを紹介する。 RandOnc-GPT は以前記録された158個のバスケット内メッセージインタラクションに対して評価された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:00:51 GMT)
Fixed-length Dense Descriptor for Efficient Fingerprint Matching [33.8]
指紋照合のためのFDD(Fixed-length Dense Descriptor)と呼ばれる3次元表現を提案する。 FDDは優れた空間特性を備えており、元の指紋の空間的関係を捉えることができる。各種指紋データを用いた実験により,FDDが他の固定長ディスクリプタよりも優れていることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:57:49 GMT)
Kendall's $τ$ Coefficient for Logits Distillation [33.8]
ランクケンドール知識蒸留(RKKD)と呼ばれるKendallの$tau$係数に基づくランキング損失を提案する。 RKKDは、学生ロジットのチャネル値の順序を制約することにより、より小さな評価チャネルへの注意のバランスをとる。我々のRKKDは, 多様な知識蒸留ベースラインの性能を向上し, 複数の教師と学生のアーキテクチャの組み合わせで幅広い改善が期待できることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:21:02 GMT)
Deep Self-Cleansing for Medical Image Segmentation with Noisy Labels [33.7]
医用画像のセグメンテーションは、疾患の診断と手術計画を支援する医療画像の分野で重要である。確立されたセグメンテーション手法の多くは、監督された深層学習に依存しており、クリーンで正確なラベルが監督に不可欠である。トレーニング段階でノイズを除去しながら、クリーンなラベルを保存できるディープ・セルフ・クリーン・セグメンテーション・フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:55:49 GMT)
Learning 3D-Aware GANs from Unposed Images with Template Feature Field [33.3]
この研究は、未提示の画像から3D対応のGANを学習することを目的としている。学習テンプレート特徴場(TeFF)を用いたトレーニング画像のオンザフライポーズ推定を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:58:11 GMT)
Report on the Workshop on Simulations for Information Access (Sim4IA 2024) at SIGIR 2024 [33.2]
本報告はSIGIR 2024における情報アクセスシミュレーションワークショップ(Sim4IA)の報告である。主な内容は、学習と産業におけるユーザシミュレーションの重要性、オンラインおよびオフライン評価のブリッジングの可能性、情報アクセスのためのユーザシミュレーションに関する共同作業の編成に関する問題であった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:32:10 GMT)
Dynamic Subframe Splitting and Spatio-Temporal Motion Entangled Sparse Attention for RGB-E Tracking [32.9]
イベントベースのバイオニックカメラは、高時間分解能と高ダイナミックレンジで動的シーンをキャプチャする。イベントストリームをよりきめ細かいイベントクラスタに分割する動的イベントサブフレーム分割戦略を提案する。そこで我々は,事象特徴の時間的・空間的相互作用を高めるために,事象に基づくスパースアテンション機構を設計する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:12:08 GMT)
LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis [32.8]
ルート原因分析(RCA)は複雑なシステムの信頼性と性能を高めるために重要である。 LEMMA-RCAは複数のドメインとモダリティにまたがる多様なRCAタスク用に設計された大規模なデータセットである。本研究では, LEMMA-RCAの性能評価を行い, 8つのベースライン法の性能評価を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:42:49 GMT)
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling [32.8]
本研究では,2次元関節型VQVAE,時間空間型2次元マスキング技術,時空間型2次元アテンションを提案する2次元運動量子化フレームワークを構築した。提案手法は,HumanML3DでFIDが26.6%低下し,KIT-MLで29.9%低下した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:51:11 GMT)
Data Proportion Detection for Optimized Data Management for Large Language Models [32.6]
我々は,事前学習データの割合の自動推定を可能にする新しいトピック,textitdata proportion Detectionを導入する。データ比例検出のための厳密な理論的証明、実用的なアルゴリズム、予備実験結果を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:30:32 GMT)
Neural Light Spheres for Implicit Image Stitching and View Synthesis [32.4]
暗黙的パノラマ画像縫合と再レンダリングのための球状神経電場モデル従来の画像縫合法や放射場法に比べて再現性は向上した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:05:29 GMT)
Shape-intensity knowledge distillation for robust medical image segmentation [32.2]
セグメント化ネットワークに結合形状インテンシティ事前情報を組み込む新しい手法を提案する。 5つの医用画像セグメンテーションタスクの実験により,提案した形状-強度知識蒸留(Shape-Intensity Knowledge Distillation)が一貫していくつかのベースラインモデルを改善することが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:21:21 GMT)
KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation [32.0]
我々は、Knowledge Augmented Generation(KAG)と呼ばれる専門的なドメイン知識サービスフレームワークを紹介します。 KAGは、知識グラフ(KG)とベクトル検索の利点をフル活用する動機によって、これらの課題に対処するために設計されている。我々は,E-Government Q&AやE-Health Q&Aを含む,Ant Groupの2つの専門知識Q&AタスクにKAGを適用し,RAG手法と比較して,プロ主義の大幅な改善を実現した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:34:35 GMT)
KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation [32.0]
我々は、Knowledge Augmented Generation(KAG)と呼ばれる専門的なドメイン知識サービスフレームワークを紹介します。 KAGは、知識グラフ(KG)とベクトル検索の利点をフル活用する動機によって、これらの課題に対処するために設計されている。我々は,E-Government Q&AやE-Health Q&Aを含む,Ant Groupの2つの専門知識Q&AタスクにKAGを適用し,RAG手法と比較して,プロ主義の大幅な改善を実現した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:34:35 GMT)
Optimal Memorization Capacity of Transformers [32.0]
変換器は$tildeO(sqrtN)$パラメータでラベルを記憶でき、$N$の入力シーケンスは$n$である。また、シーケンス・ツー・シーケンス設定における記憶能力を分析し、$tildeO(sqrtnN)$パラメータが十分であるだけでなく、ハードマックスを持つ変換器にも必要であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:36:47 GMT)
Multiplicative Logit Adjustment Approximates Neural-Collapse-Aware Decision Boundary Adjustment [32.0]
我々は,神経崩壊に基づく特徴拡散を推定し,最適決定境界を調節する理論を開発する。より現実的な条件下でのMLAの実用性について述べる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:01:06 GMT)
FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction [32.0]
FreeEditは参照ベースの画像編集を実現するための新しいアプローチである。ユーザフレンドリーな言語命令に基づいて参照画像から視覚概念を正確に再現することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:18:39 GMT)
Detecting and Measuring Confounding Using Causal Mechanism Shifts [31.6]
因果性は非現実的で実証不可能である。既存の手法は、基礎となる因果生成過程について強いパラメトリックな仮定を行い、共起変数の識別可能性を保証する。本稿では,コンファウンディングの検出と測定のための包括的アプローチを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:44:22 GMT)
Understanding the Expressivity and Trainability of Fourier Neural Operator: A Mean-Field Perspective [31.0]
フーリエニューラルオペレータ(FNO)の表現性と訓練性について検討する重み分布に基づくネットワークの秩序-カオス相転移について検討する。規則相とカオス相は、消失と爆発する勾配の領域に対応する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:05:47 GMT)
Taming Diffusion Prior for Image Super-Resolution with Domain Shift SDEs [31.0]
DoSSRは、事前訓練された拡散モデルの生成力を生かしたドメインシフト拡散に基づくSRモデルである。このアプローチの核となるのは、既存の拡散モデルとシームレスに統合されるドメインシフト方程式です。提案手法は, 合成および実世界のデータセットに対して, 5つのサンプリングステップしか必要とせず, 最先端の性能を実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:16:11 GMT)
Recent advances in interpretable machine learning using structure-based protein representations [30.9]
機械学習(ML)の最近の進歩は、構造生物学の分野を変えつつある。タンパク質3D構造を低分解能から高分解能に表現する様々な方法を提案する。本稿では,タンパク質構造,タンパク質機能,タンパク質-タンパク質相互作用の予測などのタスクを解釈可能なML手法がどのようにサポートするかを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:56:27 GMT)
Explanation Regularisation through the Lens of Attributions [30.7]
説明正則化(ER)は、テキスト分類器に予測を導出する方法として導入された。これは、入力属性手法の出力が人間の注釈付き論理とどの程度うまく一致しているかを測定する補助的な説明損失を導入することで達成される。従来の研究は、特にモデルを導くのに使われたものと異なる属性技術を用いて、信頼度を測定する場合、その依存度に対するガイダンスの影響を過小評価していた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:27:30 GMT)
RED QUEEN: Safeguarding Large Language Models against Concealed Multi-Turn Jailbreaking [30.7]
我々は,害の防止という目的の下に悪意のある意図を隠蔽し,マルチターンシナリオを構築する新しいジェイルブレイク手法RED QUEEN ATTACKを提案する。我々の実験によると、全てのLLMはRED QUEEN ATTACKに対して脆弱であり、GPT-4oで87.62%、Llama3-70Bで75.4%に達する。安全を優先するために, RED QUEEN GUARDと呼ばれる簡単な緩和戦略を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:24:17 GMT)
Self-supervised Monocular Depth Estimation with Large Kernel Attention [30.4]
より詳細な情報を得るために,自己教師付き単眼深度推定ネットワークを提案する。具体的には,長距離依存性をモデル化可能なカーネルアテンションに基づくデコーダを提案する。提案手法は,KITTIデータセット上での競合結果を実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:44:41 GMT)
Improving Fast Adversarial Training via Self-Knowledge Guidance [30.3]
高速対人訓練(FAT)における不均衡問題を包括的に研究する。我々は、そのパフォーマンスに関する明らかな階級格差を観察する。この格差は、クリーンとロバストな精度の整合性の観点から具現化することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:12:04 GMT)
Exploring Text-Guided Single Image Editing for Remote Sensing Images [30.2]
本稿では,テキスト誘導型RSI編集手法を提案する。大規模なベンチマークデータセットのトレーニングを必要とせずに、一貫性を維持するために、マルチスケールのトレーニングアプローチを採用している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:10:23 GMT)
Preserving phase coherence and linearity in cat qubits with exponential bit-flip suppression [29.6]
猫量子ビットは平均光子数の増加を伴うビットフリップ誤差に対して指数的なノイズバイアスを示すことができる。バッファモードの損失環境を多極フィルタで色づけすることで,この課題を克服する方法を示す。我々は,光子数の増加に伴い,キャットキュービットのビットフリップ速度のほぼ理想的向上を実現した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:57:51 GMT)
Optimal Parallelization Strategies for Active Flow Control in Deep Reinforcement Learning-Based Computational Fluid Dynamics [29.5]
Deep Reinforcement Learning (DRL) は、高ダイナミックかつ非線形なアクティブフロー制御(AFC)問題を扱うための有望なアプローチとして登場した。本研究では、DRLに基づくアルゴリズムを並列設定で最適化することに焦点を当てる。並列効率を約49%から約78%に向上させる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:37:57 GMT)
G-Transformer: Counterfactual Outcome Prediction under Dynamic and Time-varying Treatment Regimes [29.3]
本稿では,動的および時間的処理戦略の下での対実結果予測のためのG-Transformerを提案する。我々のアプローチはTransformerアーキテクチャを利用して、時間変化の共変量における複雑な長距離依存関係をキャプチャする。 G-Transformerは、これらの設定において、古典的および最先端の対実予測モデルの両方を上回っている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:00:34 GMT)
Derandomizing Multi-Distribution Learning [28.5]
マルチディストリビューション学習では、複数のデータ分散でうまく動作する単一の予測子を学習する。近年の研究では、オラクル効率のアルゴリズムにより、ほぼ最適サンプルの複雑さが達成されている。これらのアルゴリズムは、複数の分布に対する決定論的予測子を生成するためにデランドマイズできるのだろうか?
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:28:56 GMT)
MLPs Learn In-Context on Regression and Classification Tasks [28.1]
In-context Learning (ICL) はしばしばトランスフォーマーモデルのユニークな特徴であると考えられている。マルチ層パーセプトロン(MLP)もコンテキスト内で学習可能であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:05:30 GMT)
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction [28.0]
拡散に基づく視覚基盤モデルであるLotusを導入する。特にLotusは、ノイズではなくアノテーションを直接予測するように訓練されており、有害な分散を避けることができる。我々は,より正確できめ細かな予測が可能なディテールレザーと呼ばれる新しいチューニング戦略を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:58:55 GMT)
NumeroLogic: Number Encoding for Enhanced LLMs' Numerical Reasoning [27.6]
言語モデルは数値データを扱い、算術演算を行うのに苦労する。本稿では,各数字の前に数字の個数を含めることで,数がどのように表現されるかを簡単に調整する。モデルにまず数字の数を考慮させることで、実際の数字を生成する前に推論プロセスを強化する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:54:57 GMT)
LKA-ReID:Vehicle Re-Identification with Large Kernel Attention [27.5]
本稿では,LKA-ReIDを提案する。 VeRi-776データセットの実験では、LKA-ReIDの有効性が示され、mAPは86.65%、 Rank-1は98.03%に達した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:52:55 GMT)
Self-supervised Preference Optimization: Enhance Your Language Model with Preference Degree Awareness [27.4]
本稿では,自己監督的選好度損失とアライメント損失を組み合わせた自己監督的選好度損失を構成する,新しい自己監督的選好最適化(SPO)フレームワークを提案する。その結果,SPOを既存の好み最適化手法とシームレスに統合し,最先端性能を実現することができた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:37:26 GMT)
Boosting Federated Domain Generalization: Understanding the Role of Advanced Pre-Trained Architectures [27.4]
本稿では,ViT,ConvNeXt,Swin Transformersといった先進的な事前学習型アーキテクチャの有効性について検討した。我々は、ImageNet-1K、ImageNet-21K、JFT-300M、ImageNet-22Kといった広範囲な事前学習データセットを用いて、これらのアーキテクチャの様々なバリエーションを評価する。パラメータが少ないにもかかわらず、より大規模なResNetモデルよりも優れたモデルが存在することを観察する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:59:03 GMT)
Boosting Federated Domain Generalization: Understanding the Role of Advanced Pre-Trained Architectures [27.4]
本稿では,ViT,ConvNeXt,Swin Transformersといった先進的な事前学習型アーキテクチャの有効性について検討した。我々は、ImageNet-1K、ImageNet-21K、JFT-300M、ImageNet-22Kといった広範囲な事前学習データセットを用いて、これらのアーキテクチャの様々なバリエーションを評価する。パラメータが少ないにもかかわらず、より大規模なResNetモデルよりも優れたモデルが存在することを観察する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:59:03 GMT)
BEATS: Optimizing LLM Mathematical Capabilities with BackVerify and Adaptive Disambiguate based Efficient Tree Search [26.8]
大規模言語モデル(LLM)は、幅広いタスクやドメインで例外的なパフォーマンスを示している。彼らは数学の厳密で論理的な性質のため、数学の問題を解くのに依然として困難に直面している。本稿では,数学的問題解決能力を高めるための新しい手法BEATSを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:47:42 GMT)
General Compression Framework for Efficient Transformer Object Tracking [26.4]
本稿では,効率的なトランスオブジェクト追跡のための汎用モデル圧縮フレームワークCompressTrackerを提案する。本手法は,教師モデルのトランスフォーマー層を異なる段階に分割する新たな段階分割戦略を特徴とする。当社のフレームワークであるCompressTrackerは構造的に非依存です。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:27:15 GMT)
ReliOcc: Towards Reliable Semantic Occupancy Prediction via Uncertainty Learning [26.4]
視覚中心のセマンティック占有予測は、自律運転において重要な役割を果たす。カメラからのセマンティック占有率を予測するための信頼性を探求する研究は、まだ少ない。本稿では,カメラによる占有ネットワークの信頼性向上を目的としたReliOccを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:33:16 GMT)
Exploring Event-based Human Pose Estimation with 3D Event Representations [26.3]
我々は、Rasterized Event Point Cloud(Ras EPC)とDecoupled Event Voxel(DEV)の2つの3Dイベント表現を紹介した。 Ras EPCは、簡潔な時間スライス内のイベントを同じ位置で集約し、それらの3D属性を統計情報と共に保存し、メモリと計算要求を大幅に削減する。提案手法は,DHP19公開データセット,MMHPSDデータセット,EV-3DPWデータセットで検証し,誘導駆動シーンデータセットEV-JAADと屋外収集車両によるさらなる定性検証を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:35:58 GMT)
ZSC-Eval: An Evaluation Toolkit and Benchmark for Multi-agent Zero-shot Coordination [26.3]
ZSCアルゴリズムの最初の評価ツールキットおよびベンチマークであるZSC-Evalを提案する。 ZSC-Evalは,(1)展開時パートナーの分布を近似した行動優先報酬による評価パートナー候補の生成,2)Best-Response Diversity(BR-Div)による評価パートナーの選択,3)Best-Response Proximity(BR-Prox)メトリックによる各種評価パートナーとの一般化性能の測定,からなる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:16:01 GMT)
ZALM3: Zero-Shot Enhancement of Vision-Language Alignment via In-Context Information in Multi-Turn Multimodal Medical Dialogue [25.9]
オンライン医療相談のシナリオでは、医師は患者が複数のラウンドで提供したテキストや画像に反応し、健康状態の診断を行う。従来の医療用視覚質問応答 (Med-VQA) において, 専門機器が取得した高品質な画像とは違って, 症例内の画像は患者の携帯電話で撮影される。マルチターンマルチモーダル医療対話における視覚言語アライメントを改善するゼロショット戦略であるZALM3を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:55:57 GMT)
DarkSAM: Fooling Segment Anything Model to Segment Nothing [25.7]
Segment Anything Model (SAM) は、最近、データやタスクの見当たらない一般化で注目を集めている。セマンティックデカップリングに基づく空間攻撃とテクスチャ歪みに基づく周波数攻撃を含む,SAMに対する最初のプロンプトフリーユニバーサルアタックフレームワークであるDarkSAMを提案する。 SAMの4つのデータセットとその2つの変種モデルに対する実験結果は、DarkSAMの強力な攻撃能力と転送可能性を示している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:20:14 GMT)
Pixel-Space Post-Training of Latent Diffusion Models [25.5]
我々は,高頻度の詳細をよりよく保存するために,ポストトレーニングプロセスに画素空間の監視を追加することを提案する。画素空間の目的を付加することで、教師付き品質の微調整と嗜好に基づくポストトレーニングの両方が大幅に改善されることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:27:26 GMT)
SCOMatch: Alleviating Overtrusting in Open-set Semi-supervised Learning [25.5]
オープンセット半教師付き学習(OSSL)は、実用的なオープンセット未ラベルデータを使用する。以前のOSSLメソッドはラベル付きIDデータを過信する傾向に悩まされていた。我々は,OODサンプルを新たなクラスとして扱い,新たなSSLプロセスを形成する新しいOSSLであるSCOMatchを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:47:34 GMT)
Graph Reasoning with Large Language Models via Pseudo-code Prompting [25.5]
本稿では,グラフ問題の解法において,擬似コード命令によるプロンプトが大規模言語モデル(LLM)の性能を向上させるか否かを検討する。実験により, 疑似符号命令を用いることで, 一般にLLMの性能が向上することが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:52:40 GMT)
Hand-object reconstruction via interaction-aware graph attention mechanism [25.4]
手と物体の両方のポーズを推定することは、研究の重要な領域となっている。本稿では,対話型グラフアテンション機構を組み込んだグラフベースの精錬手法を提案する。提案手法の有効性を示す実験を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:23:04 GMT)
CoDiCast: Conditional Diffusion Model for Weather Prediction with Uncertainty Quantification [25.3]
CoDiCastは、正確なグローバル気象予測を生成する条件拡散モデルである。 80GBメモリのコモディティA100マシンでは、3日間のグローバルな天気予報を5変数以上で6時間歩数5.625円で生成できる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:29:16 GMT)
A Fuzzy-based Approach to Predict Human Interaction by Functional Near-Infrared Spectroscopy [25.2]
本稿では、心理学研究におけるニューラルモデルの解釈可能性と有効性に対する新しい計算手法であるファジィベースの注意層(ファジィ注意層)について紹介する。ファジィロジックを活用することで、ファジィ注意層は神経活動の解釈可能なパターンを学習し識別することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:20:12 GMT)
Efficient Federated Learning against Heterogeneous and Non-stationary Client Unavailability [25.2]
FedAPMには、(i)標準のFedAvgに対して(1)O$追加のメモリ計算で使用不能な計算を行うための新しい構造が含まれている。非定常力学であるにもかかわらず、FedAPMは静止点にも収束することを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:38:18 GMT)
TFS-NeRF: Template-Free NeRF for Semantic 3D Reconstruction of Dynamic Scene [25.2]
本稿では,スパースやシングルビューRGBビデオから捉えたダイナミックシーンのための3DセマンティックNeRFを提案する。我々のフレームワークは、トレーニングプロセスであるLBS予測にInvertible Neural Network(INN)を使用している。本手法は, 複雑な相互作用において, 変形性オブジェクトと非変形性オブジェクトの両方を高品質に再構成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:34:42 GMT)
Cascade Prompt Learning for Vision-Language Model Adaptation [24.8]
Cascade Prompt Learning CasPLは、学習可能なプロンプトの2つの異なるフェーズからなる新しい学習パラダイムである。 CasPLはドメインジェネラルとタスク固有の表現の両方を、明示的に異なる段階的なプロンプトのグループに効果的にキャプチャできる。従来の最先端のPromptSRCと比較して、CasPLはベースクラスが1.85%、新しいクラスが3.44%、調和平均が11以上の画像分類データセットが2.72%である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:58:01 GMT)
High-throughput 3D shape completion of potato tubers on a harvester [24.5]
我々は,RGB-D画像から3次元形状を完結できるCoRe++と呼ばれる3次元形状補完ネットワークを開発した。 CoRe++は高速で正確であり、高いスループットのジャガイモ収量推定のために運用用収穫機に実装できる。本手法は,他の塊茎,果実,野菜にも適用可能であり,多目的,高精度,リアルタイムの収量モニタリングが可能となる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:31:28 GMT)
CadVLM: Bridging Language and Vision in the Generation of Parametric CAD Sketches [24.2]
CAD(Parametric Computer-Aided Design)は、現代の機械設計の中心である。 CAD生成のためのエンド・ツー・エンドの視覚言語モデルであるCadVLMを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:22:29 GMT)
Infer Human's Intentions Before Following Natural Language Instructions [24.2]
本研究では,協調作業における自然言語学習の改善を目的とした,ソーシャル・エンボダイド推論によるフォローインストラクション(FISER)を提案する。我々のフレームワークは、中間的推論ステップとして、人間の目標と意図を明確に推論する。行動計画を立てる前に、社会的推論を用いて人間の意図を明示的に推測することが、純粋にエンドツーエンドのアプローチを超えることを実証的に実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:19:49 GMT)
Unsupervised Cross-Domain Image Retrieval via Prototypical Optimal Transport [24.1]
教師なしクロスドメイン画像検索は、ラベル付きデータに頼ることなく、さまざまな領域で同じカテゴリを共有する画像を検索することを目的としている。従来のアプローチでは、UCIRの問題をドメイン内表現学習とドメイン間特徴アライメントという2つの異なるタスクに分解していた。本稿では,UCIR に最適化された新規な Optimal Transport の定式化である ProtoOT を紹介する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:00:00 GMT)
MECD: Unlocking Multi-Event Causal Discovery in Video Reasoning [23.9]
新しいタスクとデータセットであるMulti-Event Causal Discovery (MECD)を導入する。時系列的に長いビデオに分散したイベント間の因果関係を明らかにすることを目的としている。我々は,効率的なマスクベースの事象予測モデルを用いて,Granger Causality法にインスパイアされた新しいフレームワークを考案した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:51:29 GMT)
What Would Happen Next? Predicting Consequences from An Event Causality Graph [23.9]
既存のスクリプトイベント予測タスクは、イベントスクリプトチェーンに基づいて、その後のイベントを転送する。本稿では,事象因果グラフ(ECG)に基づく連続事象を予測する因果グラフイベント予測タスクを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:34:08 GMT)
Ordinary Differential Equations for Enhanced 12-Lead ECG Generation [23.7]
通常の微分方程式(ODE)を用いて12リードのECGデータを生成することの忠実度を高める革新的な手法を提案する。このアプローチは、生成モデルの最適化プロセスに直接心臓力学を表現するODEのシステムを統合する。人工心電図データを用いて心電図解析を行い, 心電図データに心電図を組み込むことにより, 心電図データに基づいて心電図を訓練した心電図の精度が有意に向上することが確認された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:35:42 GMT)
Inverse Reinforcement Learning with Multiple Planning Horizons [23.5]
本研究では、専門家が共有報酬関数の下で計画している逆強化学習(IRL)問題について検討する。割引係数の知識がなければ、報酬関数はより大きな実現可能な解集合を持ち、既存のIRLアプローチでは報酬関数を特定するのが難しくなる。我々は,専門家のポリシーを再構築するエージェント特異的割引因子を用いて,グローバルなマルチエージェント報酬関数を学習できるアルゴリズムを開発した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:55:31 GMT)
Self-Distilled Depth Refinement with Noisy Poisson Fusion [23.4]
局所的不整合およびエッジ変形雑音を伴うポアソン核融合問題として深度補正をモデル化する。雑音に対する強靭性を実現するための自己蒸留深度微細化フレームワークを提案する。本モデルでは, ノイズに対する強靭性を向上し, 精度, エッジ品質, 効率, 一般化性を大幅に向上させることができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:27:55 GMT)
PGN: The RNN's New Successor is Effective for Long-Range Time Series Forecasting [23.4]
本稿では,RNN の新たな後継者として Parallel Gated Network (PGN) という新しいパラダイムを提案する。 PGNは、デザインされた履歴情報抽出層を通じて、以前のタイムステップから情報を直接キャプチャする。本稿では,時系列予測タスクにおけるPGNの性能向上を図るため,TPGN(Temporal PGN)と呼ばれる新しい時間モデリングフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:20:25 GMT)
Hierarchical End-to-End Autonomous Driving: Integrating BEV Perception with Deep Reinforcement Learning [23.2]
エンドツーエンドの自動運転は、従来のモジュラーパイプラインに代わる合理化された代替手段を提供する。深層強化学習(Dep Reinforcement Learning, DRL)は、最近この分野で注目を集めている。 DRL特徴抽出ネットワークを認識フェーズに直接マッピングすることで、このギャップを埋める。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:14:16 GMT)
DeBaRA: Denoising-Based 3D Room Arrangement Generation [23.0]
有界環境における正確で制御可能で柔軟なアレンジメント生成に適したスコアベースモデルであるDeBaRAを紹介する。本研究では,オブジェクトの空間特性に着目して,シーン合成や完了,再配置など,複数のダウンストリームアプリケーションを実行するために,単一トレーニングされたDeBaRAモデルをテスト時に活用できることを実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:18:25 GMT)
Trustworthy Text-to-Image Diffusion Models: A Timely and Focused Survey [22.9]
テキスト・ツー・イメージ(T2I)拡散モデル(DM)は、画像生成における顕著な進歩に対して広く注目を集めている。彼らの人気が高まったことで、信頼性の重要な非機能的特性に関する倫理的・社会的懸念が高まった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:46:47 GMT)
Prototype based Masked Audio Model for Self-Supervised Learning of Sound Event Detection [22.9]
半教師付きアルゴリズムはラベルのないデータから学ぶためにラベル付きデータに依存する。 SEDにおける自己教師型表現学習のためのプロトタイプベースMasked Audio Model(PMAM)アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:07:20 GMT)
Neural Implicit Representation for Highly Dynamic LiDAR Mapping and Odometry [22.7]
NeRF-LOAMは、NeRFベースのSLAMアプリケーションで顕著な性能を示している。本稿では,高ダイナミックな屋外シーンの再現性を向上するための新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:58:31 GMT)
Unleashing the Power of Emojis in Texts via Self-supervised Graph Pre-Training [22.5]
ソーシャルメディアデータマイニングにおける絵文字のパワーを解放します。テキストと絵文字の共モデリングのためのグラフ事前学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:02:13 GMT)
Unleashing the Power of Emojis in Texts via Self-supervised Graph Pre-Training [22.5]
ソーシャルメディアデータマイニングにおける絵文字のパワーを解放します。テキストと絵文字の共モデリングのためのグラフ事前学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:02:13 GMT)
LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness [22.4]
3次元シーン理解のための3次元認識型LMMの開発は、大規模3次元視覚言語データセットと強力な3次元エンコーダの欠如によって妨げられている。 LLaVA-3Dというシンプルなフレームワークを導入し,LLaVAを3次元シーン理解に効果的に適用する。 LLaVA-3Dは、3Dビジョン言語データセットでトレーニングされた場合、既存の3D LMMよりも3.5倍高速に収束する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:59:11 GMT)
MultiClimate: Multimodal Stance Detection on Climate Change Videos [21.9]
本稿では,手動による姿勢検出データセットであるMultiClimateについて述べる。我々は、最先端のビジョンと言語モデル、およびマルチクライメート姿勢検出のためのマルチモーダルモデルをデプロイする。 100Mサイズの核融合モデルもCLIPとBLIPを上回り、さらに大きな9BサイズのマルチモーダルIDEFICSとテキストのみのLlama3とGemma2を上回りました。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:48:08 GMT)
Bridging OOD Detection and Generalization: A Graph-Theoretic View [21.8]
OODの一般化と検出の両問題に対処するためのグラフ理論フレームワークを提案する。グラフ定式化を利用すると、グラフの隣接行列の分解によってデータ表現が得られる。経験的結果は既存の手法と比較して競争性能を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:35:51 GMT)
Can Large Language Models Faithfully Express Their Intrinsic Uncertainty in Words? [21.8]
大規模言語モデル(LLM)は,自然言語における本質的な不確実性を表現できることが示唆された。我々は、モデル固有のアサーションに対する信頼のギャップと、それらが伝達される決定性に基づいて、忠実な応答の不確実性を定式化する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:53:01 GMT)
Towards sub-millisecond latency real-time speech enhancement models on hearables [21.5]
低レイテンシモデルは、補聴器や補聴器などのリアルタイム音声強調アプリケーションに不可欠である。計算効率のよい最小位相FIRフィルタを用いて音声強調を行い、サンプル・バイ・サンプル処理により平均アルゴリズム遅延0.32msから1.25msを実現した。我々は,388MIPSの低消費電力DSPと3.35msのエンドツーエンドのレイテンシで動作可能であることをベンチマークした。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:31:05 GMT)
Pioneering Reliable Assessment in Text-to-Image Knowledge Editing: Leveraging a Fine-Grained Dataset and an Innovative Criterion [21.4]
テキスト・トゥ・イメージ(T2I)拡散モデルは、事実知識をパラメータにエンコードする。知識編集技術は、対象とする方法でモデル知識を更新することを目的としている。我々は3つのフェーズに網羅してT2I知識編集フレームワークを設計する。 T2I知識編集のためのシンプルだが効果的なアプローチである textbfMPE を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:07:30 GMT)
Inference-Time Language Model Alignment via Integrated Value Guidance [21.3]
私たちは$textitIntegrated Value Guidance$ (IVG)を導入します。 IVGは暗黙的かつ明示的な値関数を使用して、トークンとチャンクレベルで言語モデルのデコーディングをガイドする。様々なタスクにまたがるIVGの汎用性を実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:15:18 GMT)
Zak Phase Induced Topological Nonreciprocity [21.2]
室温原子中の1次元Su-Schrieffer-Heeger超放射率格子の光学的非相互性について検討した。本研究は, トポロジカル・非線形デバイスの設計を簡素化し, トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル・トポロジカル
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:12:07 GMT)
Enhancing Financial Sentiment Analysis with Expert-Designed Hint [21.1]
我々は,大規模言語モデル(LLM)の著者の視点に共感し,感情を分析する能力について検討する。その結果,専門家が設計したヒント,すなわち数の重要性を指摘し,性能を著しく向上させることが判明した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:54:17 GMT)
Behaviour4All: in-the-wild Facial Behaviour Analysis Toolkit [20.9]
In-the-wild顔行動分析のための包括的オープンソースツールキットであるBehavior4Allを紹介する。 CPU専用バージョンとGPUアクセラレーションバージョンの両方で利用できる。 Behavior4Allは、すべてのデータベースやタスクの公平性だけでなく、全体的なパフォーマンスにおいて、最先端とツールキットの両方を上回ります。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:40:23 GMT)
Denial-of-Service or Fine-Grained Control: Towards Flexible Model Poisoning Attacks on Federated Learning [20.7]
フェデレーテッド・ラーニング(FL)は、敵がグローバルアグリゲーションの結果を腐敗させ、DoS(DoS)を否定する有害な攻撃に対して脆弱である。本稿では,多目的攻撃目標を達成するフレキシブル・モデル・ポジショニング・アタック(FMPA)を提案する。実験の結果、FMPAは世界の精度を著しく低下させ、最先端の6つの攻撃よりも優れていた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:44:29 GMT)
LoopSR: Looping Sim-and-Real for Lifelong Policy Adaptation of Legged Robots [20.7]
本稿では,生涯にわたるポリシー適応フレームワークであるLoopSRを提案する。さらなる改善のためにシミュレーションで現実世界の環境を再構築する。継続的なトレーニングを活用することで、LoopSRは強力なベースラインに比べて優れたデータ効率を達成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:02:25 GMT)
Navigating the Shortcut Maze: A Comprehensive Analysis of Shortcut Learning in Text Classification by Language Models [20.7]
この研究は、過度に単純化されたショートカットを超えてモデルの信頼性を損なう微妙で複雑なショートカットの影響を克服する。ショートカットを発生、スタイル、概念に分類する包括的なベンチマークを導入する。本研究は,洗練されたショートカットに対するモデルの弾力性と感受性を系統的に検討する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:17:42 GMT)
PhoCoLens: Photorealistic and Consistent Reconstruction in Lensless Imaging [20.7]
レンズレスカメラは、従来のレンズベースのシステムと比較して、サイズ、重量、コストにおいて大きな利点がある。現在のアルゴリズムは、不正確な前方画像モデルと、高品質な画像の再構成に不十分な事前処理に苦慮している。我々は、一貫したフォトリアリスティックなレンズレス画像再構成のための新しい2段階のアプローチを導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:07:24 GMT)
A Survey of Spatio-Temporal EEG data Analysis: from Models to Applications [20.5]
本調査は,脳活動の理解と解釈を変革するための新しい手法と技術に焦点を当てる。我々は、脳信号の堅牢な表現を可能にする自己教師あり学習手法を探求する。また,グラフニューラルネットワーク(GNN)や基礎モデル,大規模言語モデル(LLM)に基づくアプローチなど,新たな差別的手法についても検討する。この調査は、これらの最先端技術、その応用、そして彼らが将来の研究および臨床実践に持つ深い影響について、広範囲にわたる概要を提供している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:09:15 GMT)
RmGPT: Rotating Machinery Generative Pretrained Model [20.5]
本稿では,診断・予後タスクの統一モデルであるRmGPTを提案する。 RmGPTは、Signal Tokens、Prompt Tokens、Time-Frequency Task Tokens、Fault Tokensといった新しいトークンベースのフレームワークを導入している。実験では、RmGPTは最先端のアルゴリズムを著しく上回り、診断タスクではほぼ完璧な精度、予後タスクでは例外的に低い誤差を達成している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:40:47 GMT)
BioZero: An Efficient and Privacy-Preserving Decentralized Biometric Authentication Protocol on Open Blockchain [20.3]
ブロックチェーン技術を活用した分散認証アプローチが,有望なソリューションとして浮上している。そこで我々は,BioZeroを提案する。BioZeroは,効率的かつプライバシに保護された分散バイオメトリック認証プロトコルである。本研究は,バイオメトリックスを用いた分散ID認証の高度化に寄与する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:37:35 GMT)
Find Rhinos without Finding Rhinos: Active Learning with Multimodal Imagery of South African Rhino Habitats [20.2]
サイの動きのモニタリングは保護に不可欠であるが、サイの発見が難しいため、サイの追跡は困難である。本研究では,サイの空間行動に関する情報を提供する,ミドルデンと呼ばれる共生排便部位のマッピング手法を提案する。本稿では,リモートセンシングサーマル,RGB,LiDAR画像を用いた分類器の構築により,サイのミッドデン位置のマッピングを初めて行う。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:49:20 GMT)
PhantomLiDAR: Cross-modality Signal Injection Attacks against LiDAR [20.1]
我々は,LiDAR出力を操作するために,意図的電磁干渉(IEMI)を注入するクロスモーダル信号注入攻撃の可能性を検討する。我々は、ポイント干渉、ポイント注入、ポイント除去、さらにはLiDARパワーオフの観点からLiDAR出力を操作するPhantomLiDAR攻撃を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:52:51 GMT)
SimVG: A Simple Framework for Visual Grounding with Decoupled Multi-modal Fusion [20.0]
視覚的接地は、画像の対応する領域に記述文を接地する、一般的な視覚課題である。既存のほとんどの手法では、独立した画像テキストエンコーディングを使用し、複雑な手作りモジュールやエンコーダ・デコーダアーキテクチャを用いてモーダルインタラクションやクエリ推論を行っている。これは、前者のパラダイムがマルチモーダルな特徴融合に適合するために、限られた下流データのみを使用するためである。本稿では,ビジュアルグラウンドティングのためのシンプルだが頑健なトランスフォーマーベースのフレームワーク,SimVGを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:36:19 GMT)
Predicting the Stay Length of Patients in Hospitals using Convolutional Gated Recurrent Deep Learning Model [20.0]
我々は、多層畳み込み(CNN)ディープラーニング、Gated Recurrent Units(GRU)、Dense Neural Networkを組み合わせた、堅牢なハイブリッドディープラーニングモデルを導入する。提案したモデル (CNN-GRU-DNN) は, LSTM, BiLSTM, GRU, Convolutional Neural Networks (CNN) を平均89%, 18.2%, 18.6%, 7% で上回っている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:29:13 GMT)
Learning Quantized Adaptive Conditions for Diffusion Models [20.0]
適応条件を利用して軌道曲率を小さくする新しい,効果的な手法を提案する。本手法は, トレーニングパラメータの1%に過ぎず, 追加の正規化項の必要性を排除し, サンプル品質を著しく向上させる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:49:51 GMT)
Exponential Quantum Communication Advantage in Distributed Inference and Learning [19.8]
本稿では,量子ネットワーク上で分散計算を行うフレームワークを提案する。このフレームワーク内のモデルでは、指数的に少ない通信で勾配勾配を用いた推論と訓練を行うことができることを示す。また、このクラスのモデルが入力の高非線形特徴を符号化できることを示し、その表現性はモデル深度とともに指数関数的に増加することを示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:32:02 GMT)
Photon Inhibition for Energy-Efficient Single-Photon Imaging [19.8]
単一光子カメラ(SPC)は、困難な画像アプリケーションに最適なセンサーとして登場している。しかし、SPADの単一光子感度はコストがかかるため、それぞれの光子検出はCMOSカメラよりも多くのエネルギーを消費する。本稿では,この課題に対処するために,電子フォトトン阻害という計算イメージング手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:19:44 GMT)
SatFed: A Resource-Efficient LEO Satellite-Assisted Heterogeneous Federated Learning Framework [19.6]
資源効率の高い衛星支援ヘテロジニアスFLフレームワークであるSatFedを提案する。 SatFedは、高度に制約された衛星地上帯域の利用を最適化するために、鮮度に基づくモデルの優先順位付けキューを実装している。実世界のLEO衛星ネットワークを用いた実験により、SatFedは最先端のベンチマークよりも優れた性能と堅牢性を発揮することが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:26:05 GMT)
SatFed: A Resource-Efficient LEO Satellite-Assisted Heterogeneous Federated Learning Framework [19.6]
資源効率の高い衛星支援ヘテロジニアスFLフレームワークであるSatFedを提案する。 SatFedは、高度に制約された衛星地上帯域の利用を最適化するために、鮮度に基づくモデルの優先順位付けキューを実装している。実世界のLEO衛星ネットワークを用いた実験により、SatFedは最先端のベンチマークよりも優れた性能と堅牢性を発揮することが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:26:05 GMT)
A Fairness-Driven Method for Learning Human-Compatible Negotiation Strategies [19.6]
報酬設計と探索に公正さを取り入れた交渉枠組みを提案し,人間と互換性のある交渉戦略を学習する。提案手法は,より平等な交渉結果を達成し,交渉の質を向上させることができることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:16:47 GMT)
Software Security Analysis in 2030 and Beyond: A Research Roadmap [19.6]
我々は、機械が共同で書いたコードのセキュリティを評価し、最大化する新しい方法が必要である。ソフトウェアシステムがますます異質になるにつれて、いくつかの関数が自動生成されても機能するアプローチが必要になります。ソフトウェアセキュリティの最近の進歩を調査し、オープンな課題と機会について議論し、この分野の長期的な視点で結論付けることで、研究ロードマップをスタートさせます。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:50:41 GMT)
Upper-Body Pose-based Gaze Estimation for Privacy-Preserving 3D Gaze Target Detection [19.5]
既存のアプローチは、人の外見を分析することに大きく依存しており、主に視線目標を予測するために顔に焦点を当てている。本稿では,人の上半身ポーズと利用可能な深度マップを利用して3次元視線方向を抽出する手法を提案する。我々は、最も包括的にアクセス可能な3D視線目標検出データセット上で、最先端の成果を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:35:06 GMT)
The Sandbox Environment for Generalizable Agent Research (SEGAR) [19.5]
汎用エージェントリサーチ(SEGAR)のためのサンドボックス環境の構築 SEGARは対話型環境における一般化研究の容易性と説明責任を向上させる。本稿では、SEGARの概要と、SEGARがこれらの目標にどのように貢献するか、および、SEGARが答えられるいくつかの研究課題を実証する実験を紹介する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:19:46 GMT)
Few-shot Pairwise Rank Prompting: An Effective Non-Parametric Retrieval Model [19.4]
本稿では,複雑な訓練パイプラインを必要とせず,教師付きモデルに近い性能を達成できる一対数ショットローダを提案する。また,複雑なトレーニングパイプラインを必要とせず,教師付きモデルに近い性能を実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:19:09 GMT)
Enhancing elusive clues in knowledge learning by contrasting attention of language models [19.4]
本稿では,言語モデル事前学習における知識学習の促進手法を提案する。より大きな言語モデルは、より小さな言語モデルによって見落とされがちな、目立たないが重要な手がかりにより多くの注意を払っていることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:30:54 GMT)
CNCA: Toward Customizable and Natural Generation of Adversarial Camouflage for Vehicle Detectors [19.3]
既訓練拡散モデルを利用したCNCA(Customizable and Natural Camouflage Attack)を提案する。本手法は,攻撃性能を維持しつつ,自然かつカスタマイズ可能な対向カモフラージュを生成することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:41:18 GMT)
Uni-Med: A Unified Medical Generalist Foundation Model For Multi-Task Learning Via Connector-MoE [19.2]
MLLM(Multi-modal large language model)は、様々な視覚的・言語的タスクのための汎用インタフェースとして、印象的な機能を示している。 Uni-Medは、普遍的な視覚的特徴抽出モジュール、CMoE(consor Mixed-of-experts)モジュール、LLMで構成される新しい医療一般モデルである。私たちの知る限りでは、Uni-Medはコネクタにおけるマルチタスク干渉に対処する最初の取り組みです。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:33:26 GMT)
FlowBench: A Large Scale Benchmark for Flow Simulation over Complex Geometries [19.2]
FlowBenchは10K以上のサンプルを持つニューラルシミュレータ用のデータセットである。 FlowBenchは、複雑な幾何学、結合フロー現象、およびニューラルPDEソルバの性能に関するデータ十分性の間の相互作用を評価することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:38:48 GMT)
Dataset Distillation-based Hybrid Federated Learning on Non-IID Data [19.0]
本稿では,データセット蒸留を統合して,独立および等分散(IID)データを生成するハイブリッド・フェデレーション学習フレームワークHFLDDを提案する。クライアントを異種クラスタに分割し、クラスタ内の異なるクライアント間でのデータラベルがバランスが取れないようにします。このトレーニングプロセスは、従来のIDデータに対するフェデレーション学習に似ているため、モデルトレーニングにおける非IIDデータの影響を効果的に軽減する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:52:41 GMT)
MMMT-IF: A Challenging Multimodal Multi-Turn Instruction Following Benchmark [19.0]
MMMT-IFは画像に基づくマルチターンQ$&$A評価セットで、質問間のグローバルな指示を追加する。本稿では,プログラム命令追従(operatornamePIF$)メトリックを導入し,推論タスクの実行中に正しく追従される命令の分数を測定する。実験では、Gemini 1.5 Pro、GPT-4o、Claude 3.5 Sonnetが平均0.81ドルから20ドルに値下げした。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:51:46 GMT)
Stable Video Portraits [18.8]
SVPは、大きな事前訓練されたテキスト・ツー・イメージ(2D)を利用した、会話顔の映像を出力する2D/3Dハイブリッド生成方式である。出力として、3DMMに基づく制御、すなわち人固有のアバターを持つ人の時間的に滑らかな画像を生成する。本手法は定量的に定性的に解析し,最先端のモノクラーヘッドアバター法より優れていることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:26:18 GMT)
Deep CLAS: Deep Contextual Listen, Attend and Spell [18.7]
CLAS(Contextual-LAS)は,まれな単語の自動音声認識の改善に有効であることが示されている。本研究では,文脈情報をよりよく利用するための深層CLASを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:40:03 GMT)
AnyLogo: Symbiotic Subject-Driven Diffusion System with Gemini Status [18.5]
特筆すべき詳細整合性を備えたゼロショット領域カスタマイズツールである textbfAnyLogo を提示する。我々は厳密な署名抽出と創造的なコンテンツ生成が有望な互換性があることに気付く。外部構成の代わりに、デノナイジングモデルのgemini状態は、強化された被写体伝達効率を促進する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:15:15 GMT)
CMamba: Channel Correlation Enhanced State Space Models for Multivariate Time Series Forecasting [18.5]
ステートスペースモデルであるMambaは、堅牢なシーケンスと機能ミキシング機能を備えている。チャネル間の依存関係のキャプチャは、時系列予測のパフォーマンス向上に不可欠である。時系列予測に適した改良されたマンバ変種を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:54:15 GMT)
AER-LLM: Ambiguity-aware Emotion Recognition Leveraging Large Language Models [18.5]
この研究は、あいまいな感情を認識する上でのLarge Language Models(LLM)の可能性を探究する最初のものである。我々はゼロショットと少数ショットのプロンプトを設計し、過去の対話を曖昧な感情認識のための文脈情報として組み込んだ。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:25:21 GMT)
Enabling Physical Localization of Uncooperative Cellular Devices [18.4]
携帯電話ネットワークでは、当局は犯罪者や違法な機器を追跡するために、物理的にユーザーデバイスを見つける必要があるかもしれない。本研究は,これらの現実的課題が細胞局在に及ぼす影響について検討し,非協調的多角的攻撃(UMA)を導入する。 UMAは、1)ターゲットデバイスにトラフィックを連続的に送信させ、2)ターゲットの信号強度を最大レベルまで引き上げ、3)ターゲットからの信号とリピータとの信号の区別を独自に行う。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:14:12 GMT)
DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models [18.3]
3D LiDARセンサーは、車両の周囲の粗い点雲を捉えるために広く使われている。このようなシステムは、これらの点雲の空白さと意味論の欠如により、隠蔽された領域と風景の隙間を知覚するのに苦労する。我々は、より完全なシーン表現を目指して、生のLiDAR測定で得られたシーンにおける観測されていない幾何学と意味を共同で予測する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:39:05 GMT)
Arena: A Patch-of-Interest ViT Inference Acceleration System for Edge-Assisted Video Analytics [18.0]
視覚変換器(ViT)を用いたエッジ・ツー・エンドビデオ推論高速化システムを提案する。その結果、Arenaは平均で1.58(時間)と1.82(時間)の推論速度を向上でき、それぞれ帯域幅の47%と31%しか消費していないことがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:25:22 GMT)
Effective Decision Boundary Learning for Class Incremental Learning [17.7]
クラスインクリメンタルラーニング(CIL)におけるリハーサルアプローチは、新しいクラスに過度に適合する決定境界に悩まされる。これら2つの要因に対処するための,単純かつ効果的なアプローチを提案する。実験の結果,提案したLはいくつかのCILベンチマークにおいて,最先端の性能を実現していることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:16:07 GMT)
Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides [17.6]
我々は、FBM(Force-Guided Bridge Matching)と呼ばれる条件付き生成モデルを提案する。 FBMはフル原子時間粗大化力学を学習し、ボルツマン制約分布を目標とする。ペプチドからなる2つのデータセットの実験は、包括的メトリクスの観点から、我々の優位性を検証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:38:32 GMT)
Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides [17.6]
我々は、FBM(Force-Guided Bridge Matching)と呼ばれる条件付き生成モデルを提案する。 FBMはフル原子時間粗大化力学を学習し、ボルツマン制約分布を目標とする。ペプチドからなる2つのデータセットの実験は、包括的メトリクスの観点から、我々の優位性を検証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:38:32 GMT)
Fast ODE-based Sampling for Diffusion Models in Around 5 Steps [17.5]
本稿では, 高速サンプリングのための平均方向を直接学習することにより, トランケーション誤差を解消する近似平均方向解法(AMED-r)を提案する。本手法は,既存の ODE ベースのサンプルを改良するためのプラグインとして容易に利用できる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:14:27 GMT)
TabGraphs: A Benchmark and Strong Baselines for Learning on Graphs with Tabular Node Features [17.3]
タブラル機械学習はグラフ機械学習の手法の恩恵を受けるかもしれない。グラフニューラルネットワーク(GNN)は、予測性能が向上することが多い。単純な機能前処理により、GNNと競合し、さらに性能も向上する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:26:43 GMT)
TabGraphs: A Benchmark and Strong Baselines for Learning on Graphs with Tabular Features [17.3]
タブラル機械学習はグラフ機械学習の手法の恩恵を受けるかもしれない。グラフニューラルネットワーク(GNN)は、予測性能が向上することが多い。単純な機能前処理により、GNNと競合し、さらに性能も向上する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:26:43 GMT)
Improving Agent Behaviors with RL Fine-tuning for Autonomous Driving [17.3]
我々は,強化学習を用いた行動モデルのクローズドループ微調整によりエージェント動作の信頼性を向上させる。本手法は,衝突速度などの目標値の改善とともに,全体的な性能の向上を示す。シミュレーションエージェントが自律走行車プランナーの質を計測する能力を直接評価するための新しいポリシー評価ベンチマークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:40:33 GMT)
General-purpose Clothes Manipulation with Semantic Keypoints [17.2]
衣服の操作は家庭用ロボットにとって重要なスキルである。近年では、折りたたみ、平ら化、吊り下げなど、作業固有の衣服の操作が進歩している。左スリーブ'のような特定の特徴を意味キーポイントとして識別することを提案する。汎用的な CLothes mAnipulation with Semantic KeyPoints (CLASP) のための大規模言語モデル (LLM) を用いた階層型学習フレームワークを開発する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:54:32 GMT)
CryptoTrain: Fast Secure Training on Encrypted Dataset [17.2]
線形および非線形操作を扱うために,同型暗号化とOblivious Transfer(OT)を併用したハイブリッド暗号プロトコルを開発した。 CCMul-Precomputeと相関した畳み込みをCryptoTrain-Bに統合することにより、迅速かつ効率的なセキュアなトレーニングフレームワークを実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:20:58 GMT)
Robotic Environmental State Recognition with Pre-Trained Vision-Language Models and Black-Box Optimization [17.2]
音声言語によるロボットの環境認識を統一的に行う。部屋のドアが開閉されているだけでなく、透明なドアが開閉されているかどうかを認識できることを示す。本研究では,本手法の有効性を実験的に実証し,移動ロボットFetchの認識行動に適用する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:02:20 GMT)
SECURE: Semantics-aware Embodied Conversation under Unawareness for Lifelong Robot Learning [17.1]
本稿では,ロボットが指示されたタスクを解く上で鍵となる概念を知らない,困難な対話型タスク学習シナリオについて論じる。本稿では,このような問題を解決するための対話型タスク学習フレームワークSECUREを提案する。 SECUREを用いて、ロボットはミスをしたときのユーザの補正フィードバックから学習するだけでなく、指示されたタスクを解決するための新しい概念に関する有用な証拠を明らかにするための戦略的対話決定も行う。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:40:07 GMT)
Humans or LLMs as the Judge? A Study on Judgement Biases [17.1]
本稿では, LLM および人間審査員に対する誤情報監視バイアス, ジェンダーバイアス, オーソリティバイアス, 美容バイアスを調査するための基礎的アノテーションの参照が不要な新しい枠組みを提案する。その結果、人間とLLMの裁判官は様々な程度に摂動に弱いこと、そして最先端の裁判官でさえかなりの偏見を持っていることが明らかとなった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:16:52 GMT)
Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models? [17.0]
命令データの性質がモデル出力に影響を及ぼすかどうかは不明である。翻訳されたテストセットがそのようなニュアンスをキャプチャできるかどうかは疑わしい。ネイティブまたはジェネレーションベンチマークでは、ネイティブとトランスポートされたインストラクションデータの間に顕著な違いがあることが示されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:39:44 GMT)
FaithScore: Fine-grained Evaluations of Hallucinations in Large Vision-Language Models [16.9]
本稿では,大規模な視覚言語モデル(LVLM)から生成した自由形式の回答の忠実度を測定するための基準フリーできめ細かな評価指標であるFaithScoreを紹介する。 FaithScoreの評価は、まず検証が必要な記述文を含むサブ文を特定し、次にこれらのサブ文から包括的な原子事実のリストを抽出し、最後に粒度の細かい原子事実と入力画像との整合性検証を行う。その結果、現在のシステムは、画像に不満足な幻覚コンテンツを生成する傾向にあり、将来の改善の余地が残されていることが明らかとなった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:44:31 GMT)
INT-FlashAttention: Enabling Flash Attention for INT8 Quantization [16.9]
INT-FlashAttentionは、FlashAttentionのフォワードワークフローと互換性のある最初の量子化アーキテクチャである。完全なINT8アクティベーションとGEMM(GeneralMatrix-multiplication)カーネルを備えたINT-FlashAttentionプロトタイプを実装した。実験の結果、INT-FlashAttentionは標準のFlashAttentionに比べて72%高速な推論速度と82%の量子化誤差を達成した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:13:04 GMT)
A Unified View on Learning Unnormalized Distributions via Noise-Contrastive Estimation [16.9]
本稿では,非正規分布学習のためのノイズコントラスト推定(NCE)に基づく推定器群について検討する。指数族に対しては、一連の正則性仮定の下で提案された推定器の有限サンプル収束率を確立する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:41:19 GMT)
DARE: Diverse Visual Question Answering with Robustness Evaluation [16.9]
視覚言語モデル(VLM)は、テキストのみの大規模言語モデルと視覚のみのモデルの顕著な機能を拡張する。彼らは数え上げや空間的推論といった重要な視覚言語(VL)推論能力に苦しむ。本稿では,ロバストネス評価を用いたDARE,Diverse Visual Question Answeringを紹介する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:31:50 GMT)
CompGS: Smaller and Faster Gaussian Splatting with Vector Quantization [16.8]
3D Gaussian Splatting (3DGS) は3次元放射場をモデリング・レンダリングするための新しい手法である。本稿では,3DGSのストレージコストを40倍から50倍に削減し,レンダリング時間を2倍から3倍に削減し,レンダリング画像の品質を低下させる方法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:45:20 GMT)
A Simple but Strong Baseline for Sounding Video Generation: Effective Adaptation of Audio and Video Diffusion Models for Joint Generation [16.7]
オーディオとビデオのベース拡散モデルを考えると,これらを1つのモデルに追加モジュールに統合し,モデルが共同でオーディオとビデオを生成するように訓練する。音声とビデオのペア間のアライメントを高めるために,本モデルでは2つの新しいメカニズムを導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:39:52 GMT)
PNR: Physics-informed Neural Representation for high-resolution LFM reconstruction [16.5]
本稿では,高分解能LFM再構成法であるPNR(Physics-informed Neural Representation)を提案する。提案手法は教師なしかつ明示的な特徴表現手法を取り入れ,PSNRがRTDよりも6.1dB向上した。コードとデータセットは公開されます。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:02:51 GMT)
From News to Forecast: Integrating Event Analysis in LLM-Based Time Series Forecasting with Reflection [16.5]
本稿では,Large Language Models(LLM)とGenerative Agentsを用いた時系列予測の新たな手法を提案する。言語をメディアとすることで,様々な社会的事象を予測モデルに適応的に統合し,ニュースコンテンツと時系列のゆらぎを協調させ,豊かな洞察を得る。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:50:22 GMT)
Broadcast Product: Shape-aligned Element-wise Multiplication and Beyond [16.0]
放送製品は、2つのテンソルの形状を整列するために要素を重複させた後、アダマール積を算出する。 textttnumpyのようなライブラリの複雑なテンソル操作は、放送された製品を使って数学的表現として簡潔に表現することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:20:09 GMT)
Interpretable Vision-Language Survival Analysis with Ordinal Inductive Bias for Computational Pathology [15.8]
病理組織学的全スライディング画像(WSIs)は、CPATHにおける癌予後を評価する重要なツールである既存のサバイバル分析アプローチはエキサイティングな進歩を遂げているが、それらは一般的に高度に表現力のあるアーキテクチャを採用することに限定されている。本稿では,VLSA(Vision-Language-based SA)パラダイムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:38:12 GMT)
Interpretable Vision-Language Survival Analysis with Ordinal Inductive Bias for Computational Pathology [15.8]
病理組織学的全スライディング画像(WSIs)は、CPATHにおける癌予後を評価する重要なツールである既存のサバイバル分析アプローチはエキサイティングな進歩を遂げているが、それらは一般的に高度に表現力のあるアーキテクチャを採用することに限定されている。本稿では,VLSA(Vision-Language-based SA)パラダイムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:38:12 GMT)
A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [15.5]
GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。 API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:57:52 GMT)
AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment [15.5]
AssistantXは、物理的なオフィス環境で自律的に動作するように設計されたプロアクティブアシスタントである。従来のサービスロボットとは異なり、AssistantXは、高度な推論機能を提供する新しいマルチエージェントアーキテクチャPPDR4Xを利用している。評価では、アーキテクチャの有効性を強調し、AssistantXが明確な指示に応答し、メモリから積極的に補足情報を検索し、積極的にチームメンバの協力を求め、タスクの完了を確実にすることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:06:56 GMT)
Quantum memory assisted entangled state verification with local measurements [15.4]
本稿では,量子メモリを用いた量子状態検証タスクについて考察する。検証者は2つのコピーを格納する2つのコピー状態検証を最適化するための正確な解析式を確立する。本稿では,GHZライクな状態を効率的に検証する手法として,効率的な検証戦略を設計する次元展開手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:21:06 GMT)
OmniColor: A Global Camera Pose Optimization Approach of LiDAR-360Camera Fusion for Colorizing Point Clouds [15.1]
単純で効率的な3D表現としてのカラーポイントクラウドは、様々な分野において多くの利点がある。本稿では,独立系360度カメラを用いて点雲をカラー化するための,新規で効率的なアルゴリズムであるOmniColorを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:53:33 GMT)
Weak-To-Strong Backdoor Attacks for LLMs with Contrastive Knowledge Distillation [15.1]
対照的な知識蒸留(W2SAttack)に基づく新しいバックドア攻撃アルゴリズムを提案する。 W2SAttackが4つの言語モデルにまたがる分類タスクにおいて優れた性能を示す。実験の結果,PEFTを標的としたバックドア攻撃では100%に近い成功率を示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:20:37 GMT)
Optimizing the Induced Correlation in Omnibus Joint Graph Embeddings [15.0]
相関-OMNI問題と平坦相関問題について検討する。相関-OMNI問題において、埋め込み空間における最適相関を誘導する一般化オムニバス重みの行列を推定するアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:22:16 GMT)
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation [15.0]
SGRv2は、視覚および行動表現の改善を通じてサンプル効率を向上させる模倣学習フレームワークである。 SGRv2 は RLBench タスクで5つのデモしか使用せず、26タスク中23タスクで RVT ベースラインを超えている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:55:43 GMT)
An Adversarial Perspective on Machine Unlearning for AI Safety [14.9]
この作業は、アンラーニングと従来のトレーニング後の安全性の根本的な違いに挑戦する。既存のjailbreakメソッドは、これまで未学習に対して効果がないと報告されていたが、慎重に適用した場合に成功できることを実証する。例えば、アクティベーション空間における10の無関係な例を微調整したり、特定の方向を除去することで、RMUで編集されたモデルに対して最も危険な能力を回復できることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:32:19 GMT)
FactorSim: Generative Simulation via Factorized Representation [14.8]
本稿では,エージェントの訓練に使用できる言語入力から,コード中のフルシミュレーションを生成するFACTORSIMを提案する。評価のために、我々は、強化学習環境におけるゼロショット転送を容易にするため、生成したシミュレーションコードの精度と有効性を評価できる生成シミュレーションベンチマークを導入する。その結果、FACTORSIMは、即時アライメント(例えば、精度)、ゼロショット転送能力、人的評価に関するシミュレーションを生成する上で、既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:00:30 GMT)
DRL-STNet: Unsupervised Domain Adaptation for Cross-modality Medical Image Segmentation via Disentangled Representation Learning [14.8]
非教師なし領域適応(UDA)は、医用画像のセグメンテーション、特にクロスモダリティデータシナリオにおいて不可欠である。本稿では, DRL-STNetについて述べる。提案フレームワークは,FLAREチャレンジデータセットの腹部臓器セグメント化において,優れた性能を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:30:40 GMT)
Towards More Relevant Product Search Ranking Via Large Language Models: An Empirical Study [14.8]
大規模言語モデル(LLM)は、モデルトレーニングにおいてラベルと特徴生成の両方に使用される。 LLM出力に異なるシグモイド変換を導入し,ラベリングにおけるレバレンススコアを分極する。我々の研究は、LEMをeコマース製品検索ランキングモデルトレーニングに統合するための高度な戦略に光を当てている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:38:05 GMT)
A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [14.7]
GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。 API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:57:52 GMT)
Contrastive Learning for Knowledge-Based Question Generation in Large Language Models [14.7]
本稿では,知識に基づく質問生成技術について述べる。コンピュータが、特定のテキストや知識ベースを理解することによって、人間の質問プロセスをシミュレートできるようにすることを目的としている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:24:13 GMT)
Contrastive Learning for Knowledge-Based Question Generation in Large Language Models [14.7]
本稿では,知識に基づく質問生成技術について述べる。コンピュータが、特定のテキストや知識ベースを理解することによって、人間の質問プロセスをシミュレートできるようにすることを目的としている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:24:13 GMT)
LingoQA: Visual Question Answering for Autonomous Driving [14.6]
本稿では,自律運転における視覚的質問応答のための新しいデータセットとベンチマークであるLingoQAを紹介する。データセットには28Kのユニークなショートビデオシナリオと419Kアノテーションが含まれている。私たちのベンチマークでは、視覚言語モデルは、質問の59.6%に対して、人間の96.6%に対して真に反応する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:30:00 GMT)
LingoQA: Video Question Answering for Autonomous Driving [14.6]
本稿では,自律運転における視覚的質問応答のための新しいデータセットとベンチマークであるLingoQAを紹介する。データセットには28Kのユニークなショートビデオシナリオと419Kアノテーションが含まれている。私たちのベンチマークでは、視覚言語モデルは、質問の59.6%に対して、人間の96.6%に対して真に反応する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:30:00 GMT)
Unveiling the Role of Pretraining in Direct Speech Translation [14.6]
我々は,事前学習エンコーダを用いたシステムのトレーニング力学,従来のアプローチ,スクラッチからトレーニングしたシステムを比較した。学習を通して、ランダムモデルがその予測のために音声入力からの情報を組み込むのに苦労していることを観察する。本稿では,デコーダのクロスアテンションを微妙に変化させ,トレーニングの初期の段階からソース情報を統合することを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:46:46 GMT)
ICON: Improving Inter-Report Consistency in Radiology Report Generation via Lesion-aware Mixup Augmentation [14.5]
我々は,放射線学レポート生成のレポート間一貫性を改善するICONを提案する。まず,入力画像から病変を抽出し,その特徴について検討する。次に, 意味論的に等価な病変の表現が同一の属性と一致することを確実にするために, 病変認識ミックスアップ手法を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:29:04 GMT)
JoyType: A Robust Design for Multilingual Visual Text Creation [14.4]
複数言語によるビジュアルテキスト作成のための新しい手法JoyTypeを紹介した。 JoyTypeは、画像生成プロセス中にテキストのフォントスタイルを維持するように設計されている。実測値と精度の両面から評価した結果,JoyTypeが既存の最先端手法を著しく上回っていることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:23:17 GMT)
IRSC: A Zero-shot Evaluation Benchmark for Information Retrieval through Semantic Comprehension in Retrieval-Augmented Generation Scenarios [14.3]
本稿では,多言語RAGタスクにおける埋め込みモデルの性能評価のためのIRSCベンチマークを提案する。このベンチマークには、クエリ検索、タイトル検索、パラグラフ検索、キーワード検索、要約検索の5つのタスクが含まれている。 1)IRSCベンチマーク,2)SSCIとRCCIメトリクス,3)埋め込みモデルの言語間制限に関する洞察などです。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:43:08 GMT)
Appearance Blur-driven AutoEncoder and Motion-guided Memory Module for Video Anomaly Detection [14.3]
ビデオ異常検出(VAD)は、しばしば正常なサンプルの分布を学習し、重要な偏差を測定することによって異常を検出する。ほとんどのVADは、新しいターゲットドメインに対するデータセット間の検証には対応できない。ゼロショットによるクロスデータセット検証を実現するため,動作誘導型メモリモジュールを用いた新しいVAD手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:48:20 GMT)
Supra-Laplacian Encoding for Transformer on Dynamic Graphs [14.3]
我々は、時間情報を保持しながらGTアーキテクチャを活用するための新しい時間エンコーディングを導入する。具体的には、Time Dynamic Graphplasを多層グラフに変換し、関連する超ラプラシア行列のスペクトル特性を利用する。 SLATEはMessage-Passing Graph Neural Networksに基づく最先端の多くの手法より優れている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:56:40 GMT)
Minimizing Live Experiments in Recommender Systems: User Simulation to Evaluate Preference Elicitation Policies [14.3]
本稿では,ライブ実験の利用を拡大(および削減)するために用いられるシミュレーション手法について述べる。そこで本研究では,YouTube Musicプラットフォームの新規ユーザを対象とした選好評価アルゴリズムの展開について述べる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:08:46 GMT)
Dealing with Controversy: An Emotion and Coping Strategy Corpus Based on Role Playing [14.3]
多くの感情の基本は、自然言語処理において未発見のままである。私たちは感情を健全な状況に対処するための戦略として扱う。本稿では,ロールプレイングによって構築されたコーパスとともに,識別に対処するタスクを紹介する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:49:54 GMT)
Efficient Bias Mitigation Without Privileged Information [14.2]
経験的リスク最小化を通じてトレーニングされたディープニューラルネットワークは、グループ間での大きなパフォーマンス格差を示すことが多い。この問題に対処しようとする既存のバイアス軽減手法は、トレーニングや検証のためにグループラベルに依存していることが多い。本稿では,支援者モデルのトレーニング履歴全体を活用するフレームワークであるTAB(Targeted Augmentations for Bias Mitigation)を提案する。また,TABはグループ情報やモデル選択を使わずにグループ性能を向上し,全体の精度を維持しながら既存手法よりも優れていたことを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:56:13 GMT)
Description-based Controllable Text-to-Speech with Cross-Lingual Voice Control [14.1]
本稿では,言語間制御機能を備えた新しい制御可能なテキスト音声合成手法を提案する。我々は、ターゲット言語で訓練されたTSモデルと、他の言語で訓練された記述制御モデルを組み合わせて、入力されたテキスト記述をTSモデルの条件付き特徴にマッピングする。英語と日本語のTTS実験により,本手法が両言語に対して高い自然性と制御性を実現することを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:08:09 GMT)
Revisiting Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations [14.1]
音声や音楽からの感情認識は、その音響的重なり合いから類似性を共有しており、これらの領域間での知識の伝達に関心が持たれている。本稿では,感情音声と音楽の音響的類似性を再考し,自己監督学習(SSL)モデルの階層的振る舞いの分析から始める。最後に、Frechet音声距離を用いた感情音声と音楽の音響的類似性について検討し、音声と音楽のSSLモデルにおける感情バイアスの問題を明らかにする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:49:09 GMT)
Threats, Attacks, and Defenses in Machine Unlearning: A Survey [14.0]
マシン・アンラーニング(MU)は、Safe AIを達成する可能性から、最近かなりの注目を集めている。この調査は、機械学習における脅威、攻撃、防衛に関する広範な研究のギャップを埋めることを目的としている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:48:26 GMT)
Similarity Learning with neural networks [14.0]
本稿では,データから類似性関係を自動的に識別するニューラルネットワークアルゴリズムを提案する。これらの類似性関係を明らかにすることで、ネットワークは次元のない量と次元のない変数と係数を関連付ける基礎となる物理法則を近似する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:48:01 GMT)
Long or Short or Both? An Exploration on Lookback Time Windows of Behavioral Features in Product Search Ranking [14.0]
顧客の買い物行動機能は、eコマースにおける商品検索ランキングモデルの中核をなす。長時間・短時間の窓を用いた場合の長所と短所を調べた結果,異なる窓の歴史的挙動を統合化するための新しい手法が提案された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:18:29 GMT)
Multi-Designated Detector Watermarking for Language Models [13.9]
大型言語モデル(LLM)のためのEmphmulti-Designated Detector Watermarking (MDDW)を導入する。この技術により、モデルプロバイダは、2つの重要な特性を持つLCMから透かし出力を生成することができる: (i) 特定の、おそらく複数の指定された検出器だけが透かしを識別でき、 (ii) 一般ユーザにとって出力品質の劣化は認識できない。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:01:15 GMT)
High-Fidelity 3D Lung CT Synthesis in ARDS Swine Models Using Score-Based 3D Residual Diffusion Models [13.8]
急性呼吸不全症候群(ARDS)は、肺炎症と呼吸不全を特徴とする重症疾患であり、死亡率は約40%である。胸部X線のような従来の画像撮影法は、肺病理の完全な評価において、その効果を制限し、2次元のビューのみを提供する。本研究では, スコアベース3D残差拡散モデルを用いて2次元X線画像から高忠実度3D肺CTを合成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:22:34 GMT)
DMC-VB: A Benchmark for Representation Learning for Control with Visual Distractors [13.7]
行動クローニングやオフライン強化学習(RL)を通じて収集されたデータから学習することは、ジェネラリストエージェントをスケールするための強力なレシピである。オフラインRLエージェントの堅牢性を評価するため,DeepMind Control Visual Benchmark (DMC-VB) をDeepMind Control Suiteで収集した。そこで,本研究では,事前学習のための表現学習手法を評価するための3つのベンチマークを提案し,最近提案したいくつかの手法の実験を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:07:01 GMT)
Granularity is crucial when applying differential privacy to text: An investigation for neural machine translation [13.7]
差分プライバシー(DP)は、NLPでますます人気が高まっている。 DPが適用される粒度の選択はしばしば無視される。以上の結果から, 文書レベルのNMTシステムは, メンバーシップ推論攻撃に対する耐性が高いことが示唆された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:48:42 GMT)
Role-RL: Online Long-Context Processing with Role Reinforcement Learning for Distinct LLMs in Their Optimal Roles [13.6]
長いコンテキスト処理を持つ大規模言語モデル(LLM)は、実装の複雑さ、訓練効率、データの分散性のために、依然として難しい。オンラインLong-Context Processing(OLP)は、無制限のドキュメントを処理する際に提案されるもので、通常は、自動ニュースレポーティング、ライブeコマース、バイラルショートビデオなどの多様なストリーミングメディアの情報受信と組織化に発生する。また,OLPパイプライン内の各ロールに,実際の性能に応じて異なるLLMを自動デプロイする役割強化学習(Role-RL)を開発した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:22:59 GMT)
Quantum Multiple Eigenvalue Gaussian filtered Search: an efficient and versatile quantum phase estimation method [13.3]
本研究は、多重固有値推定問題に対する新しいアプローチを提案する: 量子多重固有値ガウスフィルタ(QMEGS)。 QMEGSは、スペクトルギャップの仮定に頼ることなく、ハイゼンベルク制限スケーリングを同時に満たす最初のアルゴリズムである。計算結果から,提案アルゴリズムの有効性を検証した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:28:08 GMT)
AlterMOMA: Fusion Redundancy Pruning for Camera-LiDAR Fusion Models with Alternative Modality Masking [13.3]
カメラ-LiDAR融合モデルは自律走行における認識性能を著しく向上させる。単一モードの事前訓練カメラとLiDARのバックボーンをカメラ-LiDAR融合モデルに直接ロードすることは、モダリティにまたがる同様の機能冗長性をもたらすと我々は主張する。本稿では,各モードに代替マスキングを適用し,冗長パラメータを識別する,新規なモダリティ・マスキング・プルーニング・フレームワーク(AlterMOMA)を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:57:02 GMT)
Good Data Is All Imitation Learning Needs [13.3]
本稿では,エンド・ツー・エンド自動運転システムのための新しいデータ拡張手法として,CFE(Counterfactual Explanations)を導入する。 CFEは、意思決定境界付近でトレーニングサンプルを生成することによって、専門家のドライバ戦略をより包括的な表現に導く。 CARLAシミュレータによる実験により,CF-Driverは現在の最先端手法よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:43:12 GMT)
Explanation Bottleneck Models [13.1]
本稿では、説明ボトルネックモデル(XBM)と呼ばれる、解釈可能な新しいディープニューラルネットワークを提案する。 XBMは事前に定義された概念を含まない入力からテキスト説明を生成し、最終的なタスク予測を予測する。最先端のコンセプトボトルネックモデルとの比較を含む実験では、XBMが正確で流動的な自然言語の説明を提供することを確認した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:21:48 GMT)
AnoVox: A Benchmark for Multimodal Anomaly Detection in Autonomous Driving [13.0]
AnoVoxは、コンテンツと時間的異常の両方を含む最初のベンチマークである。正規性の形式的定義を提案し,従順なトレーニングデータセットを提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:18:49 GMT)
ReThink: Reveal the Threat of Electromagnetic Interference on Power Inverters [13.0]
電力インバータは、直流(DC)電力を再生可能エネルギー源(RES)からグリッド上の交流(AC)電力に変換する重要な電子装置である。本稿では、内部センサの観点から太陽光発電インバータの安全性を解析する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:19:38 GMT)
Enhancement of 3D Gaussian Splatting using Raw Mesh for Photorealistic Recreation of Architectures [13.0]
本研究では,3次元ガウスモデルを用いて建物の基本形状を抽出する手法を提案する。この調査は,建築設計分野における3次元再構築技術の有効性を向上する新たな可能性を開くものである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:07:39 GMT)
Episodic Memory Verbalization using Hierarchical Representations of Life-Long Robot Experience [13.0]
本研究では,大規模な事前学習モデルを用いて,エピソードデータの短い(数分間の)ストリームを音声化する。樹状データ構造をエピソードメモリ(EM)から導出し,その低レベルは生の知覚と固有受容のデータを表す。シミュレーションされた家庭用ロボットデータ,人間中心ビデオ,実世界のロボット記録について評価を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:16:08 GMT)
Leveraging Anthropometric Measurements to Improve Human Mesh Estimation and Ensure Consistent Body Shapes [12.9]
A2Bは人間のメッシュモデルの人体形状パラメータに変換するモデルである。推定キーポイントの精度に関するHMEモデルより優れた細調整SOTA 3D人物ポーズ推定(HPE)モデルを示す。また,HMEモデルの形状パラメータをA2Bモデルに置き換えることで,HMEモデルの性能が向上するだけでなく,一貫した形状になることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:30:37 GMT)
AgMTR: Agent Mining Transformer for Few-shot Segmentation in Remote Sensing [12.9]
Few-shot (FSS) は、関心のあるオブジェクトを少数のラベル付きサンプル(つまりサポートイメージ)でクエリイメージに分割することを目的としている。以前のスキームでは、サポートクエリのピクセルペア間の類似性を利用して、ピクセルレベルのセマンティックな相関を構築していた。極端にクラス内変異や乱雑な背景を持つリモートセンシングシナリオでは、そのようなピクセルレベルの相関が大きなミスマッチを引き起こす可能性がある。本稿では,エージェントレベルの意味的相関を構築するために,一組の局所認識エージェントを適応的にマイニングする新しいエージェントマイニングトランス (AgMTR) を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:12:01 GMT)
Computational Trichromacy Reconstruction: Empowering the Color-Vision Deficient to Recognize Colors Using Augmented Reality [12.8]
色覚障害(CVD)患者が色を認識・識別する支援技術を提案する。ディクロマトリクスの色知覚は、通常のトリクロマトリクスの3次元色(3D)知覚の2次元部分集合の縮小である。提案システムを用いて、CVD個人は、計算色空間変換により、異なる色に異なる変化を誘発することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:57:13 GMT)
Event-based Stereo Depth Estimation: A Survey [12.7]
ステレオプシスは、生物が私たちの3D世界をナビゲートする深度を知覚する主要な方法であるため、ロボット工学において広くアピールされている。イベントカメラは、非常に高時間分解能と高ダイナミックレンジで、ピクセルごとの明るさ変化を非同期に検出する、バイオインスパイアされた新しいセンサーである。高度の時間精度もステレオマッチングの恩恵を受けており、イベントカメラが登場して以来の一般的な研究領域として不透明度(深度)が評価されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:43:50 GMT)
Neural Exploratory Landscape Analysis [12.6]
本稿では,2段階の注目型ニューラルネットワークを用いてランドスケープの特徴を動的にプロファイリングする新しいフレームワークを提案する。 NeurELAは、マルチタスクの神経進化戦略を用いて、様々なMetaBBOアルゴリズム上で事前訓練されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:42:31 GMT)
IDP-PGFE: An Interpretable Disruption Predictor based on Physics-Guided Feature Extraction [12.6]
本稿では物理誘導特徴抽出(IDP-PGFE)に基づく解釈破壊予測器を設計する。物理誘導された特徴を抽出することにより、モデルの予測性能を効果的に向上する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:40:31 GMT)
GLinSAT: The General Linear Satisfiability Neural Network Layer By Accelerated Gradient Descent [12.4]
ニューラルネットワーク出力のバッチを、有界および一般線形制約を満たすものにする。これは、すべての操作が微分可能で行列分解自由な、最初の一般線形満足層である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:12:53 GMT)
On the Impact of Feature Heterophily on Link Prediction with Graph Neural Networks [12.3]
ネットワーク内の接続ノードが異なるクラスラベルや異種特徴を持つ傾向は、多くのグラフニューラルネットワーク(GNN)モデルでは難しいと認識されている。本稿では,リンク予測タスクに着目し,ノード特徴がGNN性能に与える影響を系統的に解析する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:19:48 GMT)
Generative Modeling of Molecular Dynamics Trajectories [12.3]
データからMDの柔軟なマルチタスクサロゲートモデルを学ぶためのパラダイムとして,分子軌道の生成モデルを提案する。このような生成モデルは,前方シミュレーションや遷移経路サンプリング,軌道上アップサンプリングといった多様なタスクに適応可能であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:02:28 GMT)
Dr. GPT in Campus Counseling: Understanding Higher Education Students' Opinions on LLM-assisted Mental Health Services [12.2]
大規模言語モデル(LLM)は、学生の精神的幸福を高めるために利用することができる。その結果,学生のLSMの受容はシナリオによって異なることが明らかとなった。これらの知見は、学生のメンタルヘルスを効果的に支援し、強化するために、AI技術をどのように設計し、実装すべきかを示唆する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:40:45 GMT)
Splat-MOVER: Multi-Stage, Open-Vocabulary Robotic Manipulation via Editable Gaussian Splatting [12.0]
本稿では,オープンボキャブラリロボット操作のためのモジュール型ロボットスタックであるSplat-MOVERを紹介する。 Splat-MOVERは, (i) ASK-Splat, (ii) SEE-Splat, (ii) SEE-Splat, 3Dセマンティックマスクと埋め込みを用いたリアルタイムシーン編集モジュール, (iii) Grasp-Splat, ASK-Splat と SEE-Splat を用いて,オープンワールドオブジェクトに対するアベイランス対応の候補把握を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:32:55 GMT)
Robotic-CLIP: Fine-tuning CLIP on Action Data for Robotic Applications [12.0]
Contrastive Language-Image Pretraining (CLIP) は、視覚と自然言語の理解の両方を必要とするロボット作業で広く使われている。ロボット認識能力を高めるために,ロボットCLIPを導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:56:35 GMT)
Human Mobility Modeling with Limited Information via Large Language Models [11.9]
本稿では,人間の移動性モデリングフレームワークであるLLM(Large Language Model)を提案する。提案手法は,詳細な移動統計データへの依存を著しく低減する。 NHTSとSCAG-ABMのデータセットを用いて評価を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:07:32 GMT)
EvaNet: Elevation-Guided Flood Extent Mapping on Earth Imagery (Extended Version) [11.8]
EvaNetはエンコーダ・デコーダアーキテクチャに基づく標高誘導セグメンテーションモデルである。これは、洪水範囲マッピングのための既存のソリューションにおいて、U-Netの完全なドロップイン代替として機能する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:07:09 GMT)
Global-Local Medical SAM Adaptor Based on Full Adaption [11.7]
本報告では,世界規模でSAMを適応可能な完全適応型グローバル医療SAMアダプタ(GMed-SA)を提案する。グローバル・ローカル・メディカルSAM適応器(GLMed-SA)を提案する。その結果, GLMed-SAは様々な評価指標において, 最先端のセマンティックセマンティックセグメンテーション法よりも優れていた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:48:15 GMT)
Computing Voting Rules with Elicited Incomplete Votes [11.6]
我々は、有権者に$t m$の候補者を問うことで計算可能な投票ルールについて検討する。限定的なクエリで計算可能なルールを評価するために、パラメータ化された上と下の境界をそのようなクエリの数に割り当てる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:55:01 GMT)
Qoncord: A Multi-Device Job Scheduling Framework for Variational Quantum Algorithms [11.3]
変分量子アルゴリズム(VQA)は、現在のノイズ中間スケール量子(NISQ)システムに対する有望な応用と考えられる。 VQAは、グローバルな最適解に収束するために、複数の最適化反復を必要とする。クラウド内の各VQAタスクに対するジョブスケジューリングポリシは、非常に最適化されていない。クラウド中心の課題に対処するための自動ジョブスケジューリングフレームワークであるQoncordを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:15:34 GMT)
Qoncord: A Multi-Device Job Scheduling Framework for Variational Quantum Algorithms [11.3]
変分量子アルゴリズム(VQA)は、現在のノイズ中間スケール量子(NISQ)システムに対する有望な応用と考えられる。 VQAは、グローバルな最適解に収束するために、複数の最適化反復を必要とする。クラウド内の各VQAタスクに対するジョブスケジューリングポリシは、非常に最適化されていない。クラウド中心の課題に対処するための自動ジョブスケジューリングフレームワークであるQoncordを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:15:34 GMT)
Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models [11.3]
テキストと画像の拡散モデルは、フレキシブルでリアルな画像合成のための前例のない能力を示している。これらのモデルは、時間を要するサンプリング手順に依存しており、レイテンシの削減を動機付けている。我々のアプローチは、再訓練、微調整、知識蒸留なしに、直接遅延を減らそうとしている。我々は,これらの再利用戦略と同等のレイテンシの少数のサンプリング手順を経験的に比較し,再利用が元の高遅延拡散モデルにより生成された画像に近い画像を生成することを発見した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:35:22 GMT)
Quality Matters: Evaluating Synthetic Data for Tool-Using LLMs [11.2]
外部ツール使用のための大規模言語モデル(LLM)のトレーニングは、急速に拡大する分野である。体系的なデータ品質チェックの欠如は、モデルを適切にトレーニングし、テストするための複雑さを引き起こす。外部ツールを用いたLCMのトレーニングにおいて,データの信頼性を評価するための2つの手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:54:10 GMT)
Learning Multi-resolution Graph Edge Embedding for Discovering Brain Network Dysfunction in Neurological Disorders [11.1]
病気特異的なコネクトロミックベンチマークを検出するためのマルチレゾリューションエッジネットワーク(MENET)を提案する。 MENETは診断ラベルを正確に予測し、神経疾患と関連性の高い脳の結合性を識別する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:26:44 GMT)
Enhancing Lossy Compression Through Cross-Field Information for Scientific Applications [11.0]
ロスシー圧縮は、複数のデータフィールドを含む科学データのサイズを減らす最も効果的な方法の1つである。従来のアプローチでは、ターゲットデータポイントを予測する際に、単一のターゲットフィールドからのローカル情報を使用し、より高い圧縮比を達成する可能性を制限する。本稿では,CNNを用いた新たなハイブリッド予測モデルを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:06:53 GMT)
Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities [10.8]
本稿では,まず頭部アバターの一般化モデルを取得し,その結果をパーソナライズするガウス的D'eja-vuフレームワークを紹介する。最先端の3Dガウシアンヘッドアバターをフォトリアリスティックな品質で上回り、既存の方法の少なくとも4分の1のトレーニング時間を短縮する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:31:35 GMT)
A Multimodal Single-Branch Embedding Network for Recommendation in Cold-Start and Missing Modality Scenarios [10.6]
勧告のためのマルチモーダルシングルブランチ埋め込みネットワーク(SiBraR)を利用した,マルチモーダルレコメンデーションのための新しい手法を提案する。 SiBraRは、異なるモダリティ上の同一の単一ブランチ埋め込みネットワークを使用して、インタラクションデータとマルチモーダル側情報をエンコードする。我々は,SiBraRの勧告がモダリティの欠如のシナリオにおいて正確であることを示し,モデルが異なるモダリティを共有埋め込み空間の同じ領域にマッピング可能であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:12:23 GMT)
Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers [10.4]
Evol-Q は完全量子化された ViT-Base のトップ-1 の精度を 10.30%$,$0.78%$,$0.15%$ で$3$-bit,$4$-bit,$8$-bit で改善している。私たちのコードはhttps://github.com/enyac-group/evol-q.comで公開されています。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:37:58 GMT)
Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation [10.4]
本稿では,複数の参照画像特徴を対応オブジェクトにマージする重み付きマージ手法を提案する。提案手法は,マルチオブジェクト・パーソナライズされた画像生成のためのConcept101データセットとDreamBoothデータセットの最先端技術よりも優れた性能を実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:04:13 GMT)
Towards determining the presence of barren plateaus in some chemically inspired variational quantum algorithms [10.4]
量子化学において、変分量子固有解法(VQE)は、短期量子コンピュータにおける分子シミュレーションのための有望なアルゴリズムである。しかし、ハードウェア効率のよい回路を用いたVQEは、不毛高原問題によるスケーリングの課題に直面している。これにより、一元結合クラスタ(UCC)法から化学的にインスパイアされた回路がこの問題を回避することができるのかという疑問が提起される。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:02:53 GMT)
Diffusion-based Generative Image Outpainting for Recovery of FOV-Truncated CT Images [10.4]
truncated chest CT のフィールド・オブ・ビュー (FOV) 回復は, 正確な体組成解析に不可欠である。生成画像のアウトペイントを用いて, 切り抜きCTスライスを復元する手法を提案する。我々のモデルは,87%の少ないデータでトレーニングされているにもかかわらず,切り離された解剖学を確実に回復し,過去の最先端を上回ります。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:31:40 GMT)
FlowMAC: Conditional Flow Matching for Audio Coding at Low Bit Rates [10.1]
FlowMACは、条件付きフローマッチング(CFM)に基づく低ビットレートでの高品質汎用オーディオ圧縮のための新しいニューラルオーディオである FlowMACは、最先端のGANベースとDDPMベースのニューラルオーディオコーデックを2倍のビットレートで実現している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:32:31 GMT)
Ascend HiFloat8 Format for Deep Learning [10.1]
HiFloat8(HiF8)は、ディープラーニングのための8ビット浮動小数点データフォーマットである。通常の値符号化では、3ビットのマティッサを持つ7の指数値、2ビットのマティッサを持つ8の指数値、1ビットのマティッサを持つ16の指数値を提供する。正規値符号化では、2の7つの余分なパワーを31から38の双極子に拡張する。 HiF8はAIトレーニングの前方パスと後方パスの両方で同時に使用することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:41:27 GMT)
Efficient Microscopic Image Instance Segmentation for Food Crystal Quality Control [10.1]
本稿では,食品の結晶数と粒度分布を効率的に予測することに焦点を当てた。オブジェクト検出に基づく効率的なインスタンスセグメンテーション手法を提案する。実験結果から, 本手法の予測結晶計数精度は, 既存のセグメンテーション法に匹敵することがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:01:45 GMT)
Learning Multi-resolution Graph Edge Embedding for Discovering Brain Network Dysfunction in Neurological Disorders [10.1]
病気特異的なコネクトロミックベンチマークを検出するためのマルチレゾリューションエッジネットワーク(MENET)を提案する。 MENETは診断ラベルを正確に予測し、神経疾患と関連性の高い脳の結合性を識別する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:26:44 GMT)
Logic-of-Thought: Injecting Logic into Contexts for Full Reasoning in Large Language Models [10.1]
本稿では,入力コンテキストから拡張論理情報を生成するために,命題論理を利用するロジック・オブ・ソート(LoT)プロンプトを提案する。 LoTは5つの論理的推論タスクで顕著なマージンで、様々なプロンプトメソッドのパフォーマンスを向上する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:59:45 GMT)
T3: A Novel Zero-shot Transfer Learning Framework Iteratively Training on an Assistant Task for a Target Task [10.0]
長文要約は大規模言語モデル(LLM)の課題である本稿では,目標タスクのアシスタントタスクに対して,ベースラインLDMを反復的にトレーニングする,新しいゼロショット転送学習フレームワークT3を提案する。実際には、T3は、質問応答をアシスタントタスクとして活用して、長文要約タスクにアプローチし、BBCの要約、NarraSum、FairytaleQA、NLQuADデータセットでその効果を検証している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:44:38 GMT)
GSON: A Group-based Social Navigation Framework with Large Multimodal Model [9.9]
移動ロボットが周囲の社会集団を知覚し利用できるようにするためのグループベースのソーシャルナビゲーションフレームワークGSONを提案する。認識のために、歩行者間の社会的関係をゼロショットで抽出する視覚的プロンプト技術を適用した。計画には,グローバルパス計画とローカルモーションプランニングの橋渡しとして,社会構造に基づく中間プランナを採用する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:27:15 GMT)
Generating Is Believing: Membership Inference Attacks against Retrieval-Augmented Generation [9.7]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚や知識の安定化といった問題を緩和する手法である。既存の研究では、RAGのLCMに関連する潜在的なプライバシーリスクが示されている。 S$2$MIA, underlineMembership underlineInference underlineAttack, which uses the underlineSemantic underlineSimilarity between a given sample and the content generated by the RAG system。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:22:18 GMT)
InterNet: Unsupervised Cross-modal Homography Estimation Based on Interleaved Modality Transfer and Self-supervised Homography Prediction [9.7]
InterNetはモダリティ転送と自己教師付きホモグラフィー推定を統合している。 InterNetは、教師なしメソッド間のSOTA(State-of-the-art)のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:04:31 GMT)
SPEER: Sentence-Level Planning of Long Clinical Summaries via Embedded Entity Retrieval [9.7]
臨床医は、患者が退院するたびに、長い要約を書かなければならない。要約が臨床的に有用であるためには、健全な実体を同定し、カバーすることが不可欠である。我々は、そのタスクでオープンソースLLMを微調整し、不完全で不誠実な要約を生成することを発見した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:07:30 GMT)
MMCode: Benchmarking Multimodal Large Language Models for Code Generation with Visually Rich Programming Problems [9.6]
MMCodeは、視覚的にリッチなコンテキストでアルゴリズムによる問題解決スキルを評価するための、最初のマルチモーダルコーディングデータセットである。 MMCodeには3,548の質問と6,620の画像が含まれている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:31:48 GMT)
LLM4Brain: Training a Large Language Model for Brain Video Understanding [9.3]
映像刺激によって引き起こされるfMRI信号から視覚的意味情報を再構成するためのLCMに基づく手法を提案する。我々は、適応器を備えたfMRIエンコーダに微調整技術を用いて、脳の反応を映像刺激に合わせた潜在表現に変換する。特に,視覚的セマンティック情報と脳反応のアライメントを高めるために,自己教師付きドメイン適応手法を統合する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:57:08 GMT)
A Time Series is Worth Five Experts: Heterogeneous Mixture of Experts for Traffic Flow Prediction [9.3]
本稿では,交通流予測のためのヘテロジニアス・ミックス・オブ・エキスパート(TITAN)モデルを提案する。 2つのパブリックトラフィックネットワークデータセットであるMETR-LAとP-BAYの実験では、TITANが変数中心の依存関係を効果的にキャプチャすることを示した。従来のSOTAモデルと比較して、約4.37%から11.53%までのすべての評価指標の改善を実現している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:26:47 GMT)
Value Identification in Multistakeholder Recommender Systems for Humanities and Historical Research: The Case of the Digital Archive Monasterium.net [9.2]
本稿では、Monasterium.netのレコメンデーションによって影響を受ける可能性のある、複数の利害関係者の初歩的な価値識別を提供する。筆者らは,編集者,アグリゲータ,プラットフォーム所有者,研究者,出版社,資金調達機関など,利害関係者のさまざまな価値と目的について論じる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:07:46 GMT)
Sample compression unleashed : New generalization bounds for real valued losses [9.2]
実数値損失を抑える新しいサンプル圧縮境界を導出するための一般的な枠組みを提案する。異なるタイプのモデルで評価することで、境界の厳密さとそれらの汎用性を実証的に実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:08:52 GMT)
Unsupervised Learning Based Multi-Scale Exposure Fusion [9.2]
教師なし学習に基づくマルチスケール露光融合(ULMEF)は、高ダイナミックレンジシーンのための高画質のLDR画像に異なる露光低ダイナミックレンジ(LDR)画像を融合するのに効率的である。本稿では,ALMEFに対して新たな損失関数を提案し,同じHDRシーンからのすべての画像と他の異なる露光画像を融合して定義する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:29:40 GMT)
Information transmission under Markovian noise [9.1]
マルコフ力学に基づく開量子系を考える。ワンショット$epsilon$-error情報送信容量が$Phin$を有限時間持つ場合、上と下の境界が見つかる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:17:42 GMT)
SeCoKD: Aligning Large Language Models for In-Context Learning with Fewer Shots [9.0]
本稿では,学生モデルと非常に刺激的なバリエーションを調和させる自己学習蒸留(KD)トレーニングフレームワークであるSeCoKDを紹介する。我々は3つの大規模言語モデル(LLM)と6つのベンチマークでSeCoKDを実験した。その結果,提案手法はベースモデルとSupervised Fine-tuning(SFT)よりも優れていた。 SeCoKDは、新しいタスクで評価する際の否定的な成果物はほとんど提供しないが、Supervised Fine-tuningよりも堅牢である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:12:59 GMT)
Loop Algorithm for Quantum Transverse Ising Model in a Longitudinal Field [9.0]
本稿では,新しいマージアンマージプロセスを用いたループアルゴリズムを提案する。これは、Rydberg atom chain と Kagome qubit ice をシミュレートするために実装する際の最先端アルゴリズムに対する大きな利点を示す。この高度なアルゴリズムは、Rydberg原子配列、閉じ込められたイオン、量子材料、量子アニールなどの多くのシステムに適合する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:36:56 GMT)
Scaling Law for Time Series Forecasting [9.0]
大規模データセット、複雑なモデル、強化されたデータの粒度に報いるスケーリング法則は、ディープラーニングの様々な分野において観察されている。しかし、時系列予測の研究は、時系列予測のためのディープラーニング手法のスケーリング行動に疑問を投げかけている。本稿では,このような異常な振る舞いを説明できる時系列予測法則のスケーリング理論を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:11:44 GMT)
Self-Supervised Learning of Deviation in Latent Representation for Co-speech Gesture Video Generation [8.8]
協調音声におけるジェスチャーの表現について,自己教師付き表現と画素レベルの動き偏差に着目して検討する。提案手法は,手ジェスチャー生成を容易にするために,遅延表現における自己教師付き偏差を利用する。最初の実験の結果,本手法が生成ビデオの品質を向上させることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:33:20 GMT)
Target Pose Guided Whole-body Grasping Motion Generation for Digital Humans [8.7]
本稿では,デジタル人間のための把握動作生成フレームワークを提案する。我々はまず,オフザシェルフ目標把握ポーズ生成法に基づいて,全身デジタル人間のターゲットポーズを生成する。最初のポーズとこの生成されたターゲットポーズで、トランスフォーマーベースのニューラルネットワークを使用して、把握軌道全体を生成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:43:23 GMT)
Revisit Anything: Visual Place Recognition via Image Segment Retrieval [8.5]
既存の視覚的場所認識パイプラインは、"全体"イメージをエンコードし、マッチを検索する。画像全体の代わりに「画像セグメント」をエンコードして検索することで、この問題に対処する。これらの部分的表現を検索すると、通常の画像ベース検索よりも認識リコールが大幅に高くなることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:49:58 GMT)
Partial Gromov-Wasserstein Metric [8.5]
近年、Gromov-Wasserstein(GW)距離は機械学習コミュニティへの関心が高まっている。我々は、部分グロモフ・ワッサーシュタイン(PGW)と呼ばれるUGW問題の特定の事例を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:56:20 GMT)
Exploring LLM-Driven Explanations for Quantum Algorithms [8.4]
量子コンピューティングは、アルゴリズムの設計と実装に大きな変化をもたらす、急速に成長する新しいプログラミングパラダイムである。量子アルゴリズムを理解するには物理と数学の知識が必要です。この研究は、LLMが開発者の量子コード理解をどのようにサポートできるかを初めて分析する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:16:57 GMT)
Does Worst-Performing Agent Lead the Pack? Analyzing Agent Dynamics in Unified Distributed SGD [8.4]
分散学習は、異種エージェント間の機械学習アルゴリズムのトレーニングに不可欠である。我々は統一分散SGD(UD-SGD)の分析を行う。我々は、UD-SGDの収束速度に、サンプリング、シャッフル、マルコフサンプリングなどの異なるサンプリング戦略がどう影響するかを評価する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:12:20 GMT)
Functional Classification of Spiking Signal Data Using Artificial Intelligence Techniques: A Review [8.3]
本稿では、スパイク分類におけるAIの重要性と利用について論じ、ニューラルアクティビティノイズの認識に焦点を当てる。第一の目的は、将来の研究のためのスパイク分類の視点を提供し、関連する方法論と問題に関する包括的な理解を提供することである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:50:55 GMT)
PEDRO: Parameter-Efficient Fine-tuning with Prompt DEpenDent Representation MOdification [8.3]
我々は、アンダーラインDunderlineEpenunderlineDent UnderlineRepresentation MunderlineOdification (PEDRO)という、新しい単純で簡単なPEFT手法を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:36:00 GMT)
Causality-based Subject and Task Fingerprints using fMRI Time-series Data [8.3]
本稿では,「因果指紋」の概念を開拓し,定量化する。実験結果と非因果性に基づく手法との比較により,提案手法の有効性が示された。我々の研究は、健康管理と神経変性疾患の両方に適用可能な因果指紋のさらなる研究の道を開く。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:10:50 GMT)
TestBench: Evaluating Class-Level Test Case Generation Capability of Large Language Models [8.2]
クラスレベルのLLMベースのテストケース生成のためのベンチマークであるTestBenchを紹介する。 GitHub上の9つの実世界の大規模プロジェクトから108のJavaプログラムのデータセットを構築します。本稿では,構文的正当性,コンパイル的正当性,テスト的正当性,コードカバレッジ率,欠陥検出率という,テストケースの5つの側面を考慮した詳細な評価フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:18:06 GMT)
VITaL Pretraining: Visuo-Tactile Pretraining for Tactile and Non-Tactile Manipulation Policies [8.2]
触覚情報を模倣学習プラットフォームに組み込んで操作タスクのパフォーマンスを向上させる方法について述べる。触覚前訓練を取り入れることで,触覚エージェントだけでなく,模倣学習性能が向上することを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:47:04 GMT)
CMA-ES with Learning Rate Adaptation [8.1]
本研究は,CMA-ESの性能に及ぼす学習率の影響を考察し,少ない学習率の必要性を実証する。我々は,一定信号対雑音比を維持するCMA-ESの新しい学習率適応機構を開発した。提案した学習率適応型CMA-ESは,高コストの学習率チューニングを伴わないマルチモーダルおよび/またはノイズ問題に対して有効であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:29:27 GMT)
GPT-4V(ision) for Robotics: Multimodal Task Planning from Human Demonstration [8.1]
本稿では,汎用視覚言語モデル(GPT-4V(ision))を強化し,ロボット操作のためのワンショット視覚教育を容易にするパイプラインを提案する。このシステムは、人間がタスクを実行する様子を解析し、アベイランスに対する洞察を取り入れた実行可能なロボットプログラムを出力する。様々なシナリオにわたる実験は、実際のロボットが1発の人間のデモンストレーションから操作できるようにする方法の有効性を実証している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:35:52 GMT)
Efficient Combinatorial Optimization via Heat Diffusion [8.1]
組合せ最適化問題は広く存在するが、本質的には離散的な性質のため困難である。この課題を克服するために,熱拡散による情報伝達を積極的に行うことに注力する。私たちは、最も困難で広く認識されている最適化の範囲で優れたパフォーマンスを示します。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:17:24 GMT)
Bayesian Matrix Decomposition and Applications [8.0]
本書の唯一の目的は、ベイズ行列分解における概念と数学的ツールを自己完結的に紹介することである。この控えめな背景以外は、開発は自己完結しており、厳密な証明が提供される。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:51:19 GMT)
Contaminated Multivariate Time-Series Anomaly Detection with Spatio-Temporal Graph Conditional Diffusion Models [8.0]
本稿では,トレーニングデータを異常で汚染した場合に,新しいかつ実用的な非教師付きTSADを提案する。 TSAD-Cと呼ばれるアプローチでは、トレーニングフェーズ中に異常ラベルにアクセスできない。実験では, TSAD-Cが既存の手法を超越していることが確定的に証明された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:30:43 GMT)
Boundless: Generating Photorealistic Synthetic Data for Object Detection in Urban Streetscapes [7.9]
本研究では,高密度都市景観におけるオブジェクト検出のための写真リアルな合成データ生成システムであるBoundlessを紹介する。 Boundlessは、大規模な実世界のデータ収集と手動のグラウンドトルースオブジェクトアノテーション(ラベル付け)を置き換えることができる本研究では、Boundlessが生成したデータセットに基づいて学習したオブジェクト検出モデルの性能を評価する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:15:26 GMT)
Progressive Quantum Algorithm for Maximum Independent Set with Quantum Alternating Operator Ansatz [7.7]
本稿では,最大独立集合(MIS)問題を解く上で必要となるキュービットを削減するために,プログレッシブ量子アルゴリズム(PQA)を提案する。シミュレーションの結果、最適近似比0.95を達成するためには、キュービットの5.5565%$(15.4%$)とランタイムの10.695%$(7.23%$)しか必要としないことがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:13:45 GMT)
Human Eyes Inspired Recurrent Neural Networks are More Robust Against Adversarial Noises [7.7]
我々は人間の脳にインスパイアされたデュアルストリーム視覚モデルを設計した。このモデルは網膜のような入力層を特徴とし、次の焦点(固定点)を決定する2つのストリームと、固定点を取り巻く視覚を解釈する2つのストリームを含む。このモデルを,物体認識,視線行動,対向強靭性の観点から評価した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:59:44 GMT)
Integrating Hierarchical Semantic into Iterative Generation Model for Entailment Tree Explanation [7.5]
本稿では,HiSCG (Controller-Generator) の枠組みに基づいて文の階層的意味論を統合するアーキテクチャを提案する。提案手法はEntailmentBankデータセットの3つの設定で同等のパフォーマンスを実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:46:58 GMT)
Optimal Protocols for Continual Learning via Statistical Physics and Control Theory [7.5]
ニューラルネットワークは、複数のタスクを逐次学習する際に、破滅的な忘れに苦しむことが多い。近年の理論的研究は、学習プロトコル下での合成フレームワークにおける学習曲線の分析によってこの問題に対処している。このギャップを、統計的物理手法を用いて導出したトレーニング力学の正確な方程式と最適制御法を組み合わせることで埋める。我々の理論的分析は、破滅的な忘れを緩和するための非自明で解釈可能な戦略を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:01:41 GMT)
VARADE: a Variational-based AutoRegressive model for Anomaly Detection on the Edge [7.5]
本研究は,エッジ上でのリアルタイム実行に最適な変分推論に基づく軽量自己回帰フレームワークを実装した新しいソリューションを提案する。提案手法は、パイロット生産ラインの一部であるロボットアームで検証され、最先端のアルゴリズムと比較された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:11:28 GMT)
VARADE: a Variational-based AutoRegressive model for Anomaly Detection on the Edge [7.5]
本研究は,エッジ上でのリアルタイム実行に最適な変分推論に基づく軽量自己回帰フレームワークを実装した新しいソリューションを提案する。提案手法は、パイロット生産ラインの一部であるロボットアームで検証され、最先端のアルゴリズムと比較された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:11:28 GMT)
CRoP: Context-wise Robust Static Human-Sensing Personalization [7.3]
CRoPは、市販の事前学習モデルとプルーニングを用いて、パーソナライズと一般化を最適化する新しい静的パーソナライズ手法である。 CRoPは、現実世界の2つの健康ドメインを含む4つの人間センシングデータセットにおいて、パーソナライズ効果とユーザ内ロバスト性に優れる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:06:38 GMT)
DREAMS: A python framework to train deep learning models with model card reporting for medical and health applications [7.3]
本稿では,脳波データ処理,モデルトレーニング,レポート生成に適した総合的なディープラーニングフレームワークを提案する。 AI開発者によってさらに適応され、開発されるように構築されているが、モデルカードを通じて、開発者と臨床医の両方が使用する結果と具体的な情報を報告することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:12:13 GMT)
Rejection Sampling IMLE: Designing Priors for Better Few-Shot Image Synthesis [7.2]
新たな研究分野は、限られたトレーニングデータで深層生成モデルを学ぶことを目的としている。トレーニングに使用する事前分布を変更する新しいアプローチであるRS-IMLEを提案する。これにより、既存のGANやIMLEベースの手法に比べて画質が大幅に向上する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:19:42 GMT)
Local Prediction-Powered Inference [7.2]
本稿では,PPIを用いた局所多変量回帰のための特定のアルゴリズムを提案する。信頼区間, バイアス補正, カバレッジ確率を解析し, アルゴリズムの正しさと優越性を検証した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:15:53 GMT)
MathDSL: A Domain-Specific Language for Concise Mathematical Solutions Via Program Synthesis [7.1]
本稿では,数式解析のためのドメイン特化言語であるMathを紹介する。 Mathは、プログラムモデルにデプロイされた場合、最先端の強化学習方法より優れている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:54:19 GMT)
Latent Watermark: Inject and Detect Watermarks in Latent Diffusion Space [7.1]
既存の手法は、画質と透かしの堅牢性のジレンマに直面している。画像品質の優れた透かしは通常、ぼやけやJPEG圧縮のような攻撃に対して弱い堅牢性を持つ。本稿では,潜伏拡散空間内の透かしを注入し,検出する潜伏透かしを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:27:58 GMT)
AI-driven View Guidance System in Intra-cardiac Echocardiography Imaging [7.1]
心内心エコー法(ICE)は、電気生理学(EP)と構造心疾患(SHD)の介入において重要な画像モダリティである。本稿では,人間によるループ内フィードバックを用いたAI駆動クローズドループビュー誘導システムを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:38:14 GMT)
Faster Randomized Methods for Orthogonality Constrained Problems [7.0]
ランダム化プレコンディショニングの応用を、データサイエンスで広く普及している別の重要な問題に拡張する方法を示す。本稿では,支配的正準相関の計算問題とフィッシャー線形判別分析問題について述べる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:32:36 GMT)
Efficient Pointwise-Pairwise Learning-to-Rank for News Recommendation [7.0]
ニュースレコメンデーションは、各ユーザのインタラクション履歴と好みに基づいてパーソナライズを行う、困難なタスクである。最近の研究は、事前学習された言語モデル(PLM)の力を利用して、ニュース項目を直接ランク付けする手法を用いて、ポイントワイド、ペアワイド、リストワイドの3つのカテゴリに分類している。本稿では,PLMに基づくニュースレコメンデーションのための新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:27:19 GMT)
Compositional Hardness of Code in Large Language Models -- A Probabilistic Perspective [6.9]
大規模言語モデル(LLM)における一般的なプラクティスは、モデルのコンテキストウィンドウ内のタスク全体に対するソリューションをサンプリングすることである。これまでの研究では、モデルのコンテキスト内でのサブタスク分解がそのようなタスクの解決に有用であることが示されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:34:35 GMT)
Decentralised Variational Inference Frameworks for Multi-object Tracking on Sensor Network [6.9]
本稿では,様々な分散型変分推論方式を提案することで,マルチセンサ多対象追跡の課題に取り組む。まず、集中型VIセンサ融合方式をベンチマークとして確立し、その分散化の限界を解析する。標準ELBOの代わりに,局所最大化下界(LM-ELBO)を最適化する分散勾配型VIフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:54:43 GMT)
Unifying Dimensions: A Linear Adaptive Approach to Lightweight Image Super-Resolution [6.9]
ウィンドウベーストランスは超高解像度タスクにおいて優れた性能を示した。畳み込みニューラルネットワークよりも計算複雑性と推論レイテンシが高い。線形適応ミキサーネットワーク(LAMNet)という,畳み込みに基づくトランスフォーマーフレームワークを構築する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:24:09 GMT)
Spatiotemporal Learning on Cell-embedded Graphs [6.8]
学習可能なセル属性をノードエッジメッセージパッシングプロセスに導入し,地域特性の空間依存性をよりよく把握する。各種PDEシステムと1つの実世界のデータセットの実験は、CeGNNが他のベースラインモデルと比較して優れた性能を発揮することを示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:22:08 GMT)
Benchmarking Graph Conformal Prediction: Empirical Analysis, Scalability, and Theoretical Insights [6.8]
コンフォーマル予測は、機械学習モデルに関連する不確実性を定量化するために、ますます人気が高まっている。グラフの不確実性定量化の最近の研究は、共形グラフ予測のためのこのアプローチに基づいている。文献における設計選択を分析し、既存の手法に関連するトレードオフについて議論する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:13:51 GMT)
MemFusionMap: Working Memory Fusion for Online Vectorized HD Map Construction [6.7]
オンラインHDマップ構築のための時間的推論機能を強化した新しい時間的融合モデルを提案する。具体的には、履歴フレーム間の推論のために、モデルのメモリ容量を改善するワーキングメモリ融合モジュールをコントリビュートする。また、時間重なり情報と車両軌道についてモデルに明確に通知する新しい時間重なりヒートマップを設計する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:16:39 GMT)
Physics-aligned Schrödinger bridge [6.6]
物理対応型Schr"odinger Bridge(PalSB)と呼ばれる新しいデータ駆動型フィールド再構築フレームワークを導入する。 PalSBには、局所的な再構成マッピングとグローバルな物理原理の両方に対応するために設計された2段階のトレーニングプロセスが組み込まれている。我々はPalSBの有効性を3つの複素非線形システムに適用することで実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:22:22 GMT)
Optically Coherent Nitrogen-Vacancy Centers in HPHT Treated Diamonds [6.6]
ダイヤモンド中の窒素空孔(NV)中心は、量子センシング、量子シミュレーション、量子ネットワークの分野において多くの注目を集めている。本研究では,光学的にコヒーレントなNV中心を作製するための非破壊的手法を実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:29:34 GMT)
On the Implicit Relation Between Low-Rank Adaptation and Differential Privacy [6.3]
言語モデルの低ランクタスク適応(LoRAやFLoRAなど)が提案されている。我々は、低ランク適応が微調整データのプライバシーを暗黙的に提供することを示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:56:49 GMT)
Crafting Synthetic Realities: Examining Visual Realism and Misinformation Potential of Photorealistic AI-Generated Images [6.3]
この研究は、AIGIのAIフォトリアリズムを4つの重要な側面、コンテンツ、人間、美学、生産機能から解き放つ。フォトリアリスティックAIGIは、しばしば人間の人物、特に有名人や政治家を描写する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:46:43 GMT)
A New Dataset for Monocular Depth Estimation Under Viewpoint Shifts [6.3]
本稿では,異なるカメラ位置と方向が単眼深度推定性能に与える影響を定量化するための新しいデータセットと評価手法を提案する。ホログラフィー推定と物体検出に基づく地中真理戦略を提案し,高価なライダーセンサの必要性を排除した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:57:05 GMT)
Distributional Latent Variable Models with an Application in Active Cognitive Testing [6.2]
認知モデリングは一般的に、注意力や作業記憶、その他の潜伏変数を推定するために、様々なテストのバッテリーを完了するよう参加者に求めることに依存する。ほぼユビキタスなアプローチは、各テストに対して個別に多くの観察を繰り返すことであり、結果として各被験者に与えられた各テストの結果にまたがる分布をもたらす。我々はLVMを、各被験者の観測データが再構成される単純なベクトルではなく、多くの異なる分布からの一連の観測であるような設定に拡張する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:04:03 GMT)
Towards the Mitigation of Confirmation Bias in Semi-supervised Learning: a Debiased Training Perspective [6.2]
半教師付き学習(SSL)は、モデルが特定のクラスを不均等に好むという、一般的に確認バイアスを示す。 SSLのデバイアスドトレーニングのための統合フレームワークであるTaMatchを紹介します。 TaMatchは,様々な課題の画像分類タスクにおいて,既存の最先端手法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:50:30 GMT)
Slowly Scaling Per-Record Differential Privacy [6.1]
我々は、多くの外部値を持つデータから統計を公開するための正式なプライバシーメカニズムを開発する。記録ごとの差分プライバシー保証が、公表されている統計に対する保護されたレコードの影響で徐々に低下することを保証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:56:11 GMT)
Codesigned counterdiabatic quantum optimization on a photonic quantum processor [6.1]
我々は,このアルゴリズムをフォトニック量子プロセッサ上で実装するための符号付きアプローチを用いて,逆断熱プロトコルに焦点を当てた。我々は,高次多体相互作用項に対処して,最適化された反断熱的手法を開発し,実装する。フォトニックプラットフォーム上での量子コンピューティングにおける反断熱量子力学の符号付きマッピングの利点を実験的に実証した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:08:19 GMT)
Low-Rank Interconnected Adaptation across Layers [6.1]
低ランク適応(LoRA)は強力なパラメータ効率の微調整法である。これまでの研究では、LoRAは基本的に勾配圧縮機であり、勾配にランダムな投影を行うことが示されている。層間(Lily)における低ランク相互接続型適応を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:27:23 GMT)
Joint Source-Channel Coding: Fundamentals and Recent Progress in Practical Designs [6.1]
ジョイントソースチャネル符号化(JSCC)は、圧縮とチャネルコーディングを最適化することで、エンド・ツー・エンドのアプローチを提供する。本稿では, J SCC の情報理論の基礎について概説し, 数十年にわたる実践的 J SCC 設計の実態調査を行い, 実用システムへの導入が限定された理由について論じる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:10:29 GMT)
The application of GPT-4 in grading design university students' assignment and providing feedback: An exploratory study [5.9]
本研究は、カスタムGPTの開発において反復的な研究アプローチを採用する。 GPTとヒトのラッカー間の信頼関係は、一般に教育者によって受け入れられる水準に達した。適切な指導により、カスタム GPT は、学生の学習の前提条件である一貫した結果を与える。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:09:10 GMT)
NeuroPath: A Neural Pathway Transformer for Joining the Dots of Human Connectomes [5.8]
本稿では, FCのユビキタスインスタンスが, SCによって物理的に配線された神経経路(デトゥール)によってどのようにサポートされているかを明らかにするために, トポロジカルデトゥールの概念を導入する。機械学習のclich'eでは、SC-FCカップリングの基礎となるマルチホップデトゥール経路により、新しいマルチヘッド自己保持機構を考案することができる。バイオインスパイアされたニューロパス(NeuroPath)と呼ばれる深層モデルを提案し,これまでにない量のニューロイメージから有意な結合性特徴表現を求める。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:40:12 GMT)
Autoregressive Multi-trait Essay Scoring via Reinforcement Learning with Scoring-aware Multiple Rewards [5.6]
スコアリング対応マルチリワード強化学習(SaMRL)を提案する。 SaMRLは、QWKに基づく報酬を、マルチトレートAESに対する平均2乗誤差ペナルティで設計することで、実際の評価スキームをトレーニングプロセスに統合する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:16:48 GMT)
Adaptive Stream Processing on Edge Devices through Active Inference [5.6]
アクティブ推論(AIF)に基づく新しい機械学習パラダイムを提案する。 AIFは、脳が長期的サプライズを減らすために感覚情報を常に予測し、評価する方法を記述している。本手法は意思決定の完全透明性を保証し,結果の解釈とトラブルシューティングを無力化する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:12:41 GMT)
SliceIt! -- A Dual Simulator Framework for Learning Robot Food Slicing [5.5]
本研究は、ロボットが自律的かつ安全に食品切断タスクを学習できるようにすることに焦点を当てる。シミュレーションにおけるロボット食品スライシングタスクを安全かつ効率的に学習するフレームワークであるSliceIt!を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:57:37 GMT)
Learning Variable Compliance Control From a Few Demonstrations for Bimanual Robot with Haptic Feedback Teleoperation System [5.5]
厳格なロボットを使った、きめ細やかな、接触に富んだ操作は、ロボット工学において重要な課題である。外部センサを介して力を制御することでこれらの問題を緩和するために、コンプライアンス制御スキームが導入されている。 Demonstrationsからの学習は直感的な代替手段であり、ロボットは観察された動作を通じて操作を学習できる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:51:20 GMT)
LGFN: Lightweight Light Field Image Super-Resolution using Local Convolution Modulation and Global Attention Feature Extraction [5.5]
本稿では,LGFN という軽量なモデルを提案する。このモデルでは,異なるビューの局所的特徴とグローバル的特徴と,LF 画像 SR のための異なるチャネルの特徴を統合している。我々のモデルは0.45Mのパラメータと19.33GのFLOPを持つ。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:53:25 GMT)
Comparing Unidirectional, Bidirectional, and Word2vec Models for Discovering Vulnerabilities in Compiled Lifted Code [5.4]
本研究は,一方向変圧器を用いた埋め込み,特にGPT-2の適用について検討する。本研究は,GPT-2モデルからの埋め込みがBERTとRoBERTaの双方向モデルよりも有意に優れていることを明らかにする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:48:47 GMT)
Scenario of Use Scheme: Threat Model Specification for Speaker Privacy Protection in the Medical Domain [5.4]
本稿では,話者のプライバシを守らなければならない相手を特徴付けるアタッカーモデルと,その防衛を規定するプロテクタモデルとを組み込んだユースケースシナリオ・オブ・ユース・スキームを提案する。本稿では,特定のシナリオ・オブ・ユース(Senario of Use)の具体例と,パーキンソン検出の実用性を維持しつつ,ジェンダー推論攻撃から話者データを保護するための一連の実験について述べる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:05:36 GMT)
FruitNeRF: A Unified Neural Radiance Field based Fruit Counting Framework [5.4]
FruitNeRFは,新鮮果実のカウンティングフレームワークである。我々は3Dで直接果物の種類を数えるために最先端のビュー合成法を用いる。実世界のデータセットと合成データセットの両方を用いて,本手法の評価を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:56:50 GMT)
Tenplex: Dynamic Parallelism for Deep Learning using Parallelizable Tensor Collections [5.4]
ディープラーニングジョブは、トレーニングやハードウェアメンテナンス中のGPUアロケーションの変更を経験することができる。現在のDLフレームワークはジョブをGPUのセットに結びつけるため、これらのシナリオのサポートが欠如している。 Scalaiは、実行時にGPU割り当てが更新された後、ジョブが動的に並列性を変更することができるDLシステムのための状態管理ライブラリである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:52:13 GMT)
Probing phase transition and underlying symmetry breaking via entanglement entropy scanning [5.4]
エンタングルメントエントロピー(EE)を用いて、量子多体系における新しい相と相転移の内在物理学を探索することは、凝縮物質物理学において重要であるが挑戦的なトピックである。新たに開発したバイパルタイト・アニール法により,2次元強相関系の第1および第2次相転移点付近のEE挙動を系統的に研究することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:12:47 GMT)
Strong-to-weak spontaneous breaking of 1-form symmetry and intrinsically mixed topological order [5.2]
2+1d の位相順序は、純粋な状態における 1-形式対称性の自発的対称性を破る位相である。我々は、混乱したアンサンブルが有限パラメータ範囲上に存在するという意味で「安定な位相を形成する」ことを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:32:16 GMT)
Perturb, Attend, Detect and Localize (PADL): Robust Proactive Image Defense [5.2]
本稿では,クロスアテンションに基づく符号化と復号の対称スキームを用いて,画像固有の摂動を生成する新しいソリューションであるPADLを紹介する。提案手法は,StarGANv2,BlendGAN,DiffAE,StableDiffusion,StableDiffusionXLなど,さまざまなアーキテクチャ設計の未確認モデルに一般化する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:16:32 GMT)
Flat'n'Fold: A Diverse Multi-Modal Dataset for Garment Perception and Manipulation [5.1]
衣服操作のための新しい大規模データセットであるFlat'n'Foldを紹介する。 1,212人の人間と887人のロボットが、8つのカテゴリーにまたがる44のユニークな衣服を平らにし、折りたたみするデモを行った。私たちのデータセットは、折り畳まれた状態から折り畳まれた状態まで、操作プロセス全体を一意にキャプチャします。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:10:17 GMT)
Data-Prep-Kit: getting your data ready for LLM application development [5.1]
本稿では,Data Prep Kit (DPK) と呼ばれる,使いやすく,フレキシブルで,スケールフレキシブルなオープンソースデータ作成ツールキットを提案する。 DPKは、ユーザが自分のニーズに合わせてデータ準備をスケールできるように設計され設計されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:30:28 GMT)
Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization [5.0]
ニューラルネットワーク翻訳(NMT)へのタスクアライメントの適用は,NMTにおける既存のタスクデータミスマッチに対処することを示す。人選好のプロキシとして,事前学習された翻訳品質推定モデルを活用するDPOの変種であるダイレクト品質最適化(DQO)を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:32:12 GMT)
A multi-source data power load forecasting method using attention mechanism-based parallel cnn-gru [5.0]
本稿では,動的データと静的データの両方から重要な情報を抽出する並列構造ネットワークを提案する。 CNNモジュールは静的データから空間特性をキャプチャし、GRUモジュールは動的時系列データの長期的な依存関係をキャプチャする。マルチソース情報の抽出・統合における並列構造モデルの利点を実証するため, 一連の実験を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:38:54 GMT)
CASPFormer: Trajectory Prediction from BEV Images with Deformable Attention [4.9]
本研究では,空間化されたBird-Eye-View(BEV)画像からマルチモーダルな動作予測を行うことができるコンテキスト認識シーン予測変換器(CASPFormer)を提案する。我々のシステムは、BEV画像を生成することができる上流認識モジュールと統合することができる。我々は、nuScenesデータセット上でモデルを評価し、複数のメトリクスにまたがって最先端に到達していることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:37:22 GMT)
AC4: Algebraic Computation Checker for Circuit Constraints in ZKPs [4.8]
過度に制約された回路や過度に制約された回路はバグを引き起こす可能性がある。提案手法の実装を表すためにAC4というツールが提案されている。解決可能な範囲内では、チェック時間も顕著に改善されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:18:21 GMT)
Advancing Object Detection in Transportation with Multimodal Large Language Models (MLLMs): A Comprehensive Review and Empirical Testing [4.8]
本研究の目的は,多モード大言語モデル (MLLM) と大規模視覚モデル (VLM) の交通システムにおけるオブジェクト検出への応用を総合的に検証し,実証的に評価することである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:58:11 GMT)
Study of Subjective and Objective Quality in Super-Resolution Enhanced Broadcast Images on a Novel SR-IQA Dataset [4.8]
超解像技術(SR)は、高解像度のスクリーンに高画質の放送コンテンツをフルスクリーンで表示するために不可欠である。 SR強調放送コンテンツなどの低品質ソースから生成されたSR画像の品質を評価することは困難である。 SR放送画像のための新しいIQAデータセットを2Kと4Kの解像度で導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:07:15 GMT)
Enhancing Structured-Data Retrieval with GraphRAG: Soccer Data Case Study [4.7]
Structured-GraphRAGは自然言語クエリにおける構造化データセット間の情報検索を強化するために設計された汎用フレームワークである。その結果,Structured-GraphRAGはクエリ処理効率を大幅に改善し,応答時間を短縮することがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:53:29 GMT)
Protocols and Trade-Offs of Quantum State Purification [4.7]
本稿では,特定の確率で高い忠実度を達成するために設計された汎用的な状態浄化フレームワークを提案する。脱分極雑音下での量子状態の場合、我々のフレームワークはバレンコとアルによって提案された浄化プロトコルを複製することができる。任意の次元を持つ雑音状態の2つのコピーに対するプロトコルの最適性を証明し、より高いコピー数と次元に対してその最適性を確認する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:33:21 GMT)
Drone Stereo Vision for Radiata Pine Branch Detection and Distance Measurement: Integrating SGBM and Segmentation Models [4.7]
本研究では,専用プルーニングツールとステレオビジョンカメラを備えたドローン式プルーニングシステムの開発を提案する。 YOLOやMask R-CNNを含むディープラーニングアルゴリズムは、正確な分岐検出を保証するために使用される。これらの技術間の相乗効果により、分岐位置の正確な同定が容易になり、効率的で標的とした刈り取りが可能となる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:27:44 GMT)
Privacy-Preserving Redaction of Diagnosis Data through Source Code Analysis [4.7]
我々は、ログのリアクションのためのソースコード解析アプローチについて論じる。本手法では,機密情報を含むログメッセージを識別するために,対応するログ文をソースコード内に配置する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:41:55 GMT)
Provable Performance Guarantees of Copy Detection Patterns [4.7]
コピー検出パターン(CDP)は、現代のセキュリティアプリケーションにおいて重要な要素である。本稿では,CDP認証技術の分析,最適化,今後の発展のための最適基準を導出するための理論的枠組みを確立することを目的とする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:55:44 GMT)
Confidence intervals uncovered: Are we ready for real-world medical imaging AI? [4.6]
パフォーマンスレポートは、どの方法が臨床に翻訳されるべきかを決定するための鍵である。本稿では,この一般的なプラクティスは,性能の変動を無視するので,しばしば誤解を招く単純化である,と論じる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:58:41 GMT)
Safe Time-Varying Optimization based on Gaussian Processes with Spatio-Temporal Kernel [4.6]
TVSafeOptは、未知の報酬と安全機能を持つ時間変化最適化問題のアルゴリズムである。 TVSafeOptは、明示的な変更検出を必要とせずに、時間変化のある安全な領域を安全に追跡することができる。その結果,TVSafeOptは,安全と最適性の両方に関して,合成データ上でSafeOptと良好に比較できることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:09:19 GMT)
Artificial Data Point Generation in Clustered Latent Space for Small Medical Datasets [4.5]
本稿では,クラスタ化潜在空間(AGCL)における人工データポイント生成手法を提案する。 AGCLは、合成データ生成により、小さな医療データセットの分類性能を向上させるように設計されている。顔の表情データを利用してパーキンソン病検診に応用した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:51:08 GMT)
Defining a universal sign to strictly probe a phase transition [4.5]
最近の研究は、サインが位相遷移を探索するのに使えることを指摘して、サイン問題において顕著なブレークスルーをもたらした。我々は、位相遷移を厳密に探索できる参照系の影響を排除した修正符号を定義する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:12:12 GMT)
Multi-View and Multi-Scale Alignment for Contrastive Language-Image Pre-training in Mammography [4.5]
対照的な言語-画像事前学習は、医療画像解析において有望であるが、かなりのデータと計算資源を必要とする。本稿では,マンモグラフィに完全CLIPモデルを適用することを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:56:59 GMT)
Enhancing Post-Hoc Attributions in Long Document Comprehension via Coarse Grained Answer Decomposition [4.4]
ポストホック属性システムは、回答テキストをソース文書にマッピングするように設計されているが、このマッピングの粒度は未解決である。そこで本研究では,テンプレートを用いたテキスト内学習を用いて,帰属に対する回答の事実分解に関する新しい手法を提案し,検討する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:40:15 GMT)
Conjugate Bayesian Two-step Change Point Detection for Hawkes Process [4.3]
本稿では,ホークス過程に対する共役ベイズ変換点検出法を提案する。合成データと実データの両方で実験を行い,本手法の有効性と効率性を示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:16:38 GMT)
Cross-Modality Attack Boosted by Gradient-Evolutionary Multiform Optimization [4.2]
クロスモーダル・アタックは、トランスファービリティーへの攻撃に重大な課題をもたらす。マルチフォームアタック(multiform attack)と呼ばれる,新たなクロスモーダルアタック戦略を提案する。従来の手法と比較して,マルチフォームアタックの優位性とロバスト性を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:52:34 GMT)
EDA-DM: Enhanced Distribution Alignment for Post-Training Quantization of Diffusion Models [4.2]
量子化はモデルの複雑性を効果的に低減し、後学習量子化(PTQ)は拡散モデルの圧縮と加速に非常に有望である。既存の拡散モデルのPTQ法は, キャリブレーションサンプルレベルと再構成出力レベルの両方の分布ミスマッチ問題に悩まされている。本稿では,拡散モデル(EDA-DM)の学習後量子化のための分散アライメントの強化について述べる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:53:15 GMT)
CAMOT: Camera Angle-aware Multi-Object Tracking [4.2]
本稿では,マルチオブジェクト追跡のための簡易カメラアングル推定器であるCAMOTを提案する。複数の物体が各ビデオフレームの平面上に位置していると仮定すると、CAMOTは物体検出を用いてカメラの角度を推定する。提案手法をMOT17とMOT20データセット上の様々な2次元MOT手法に付加して評価し,その有効性を確認した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:40:38 GMT)
Transfer Learning in $\ell_1$ Regularized Regression: Hyperparameter Selection Strategy based on Sharp Asymptotic Analysis [4.2]
転送学習技術は、複数の関連するデータセットからの情報を活用し、ターゲットデータセットに対する予測品質を向上させることを目的としている。トランス・ラッソ(Trans-Lasso)とプレトレーニング・ラッソ(Pretraining Lasso)である。レプリカ法を用いて解析することにより,高次元環境下でのアルゴリズムの徹底的,精密な研究を行う。微調整段階に転送される2種類の情報の1つを無視することは、一般化性能にはほとんど影響しない。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:20:59 GMT)
A Stochastic Quasi-Newton Method for Non-convex Optimization with Non-uniform Smoothness [4.1]
滑らか性に不均一性が存在する場合の高速準ニュートン法を提案する。我々のアルゴリズムは、最もよく知られた$mathcalO(epsilon-3)$サンプルの複雑さを達成でき、収束のスピードアップを楽しむことができる。我々の数値実験により,提案アルゴリズムは最先端の手法よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:56:30 GMT)
Spatial Hierarchy and Temporal Attention Guided Cross Masking for Self-supervised Skeleton-based Action Recognition [4.0]
本研究では,空間的,時間的両面からスケルトン配列にマスキングを適用した階層構造と注意誘導型クロスマスキングフレームワーク(HA-CM)を提案する。空間グラフでは、双曲空間を用いて関節の区別を維持し、高次元骨格の階層構造を効果的に維持する。本研究では,高次元空間における距離の収束と大域的視点の欠如に対処するため,従来の距離指標をマスキングのための大域的注意に置き換える。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:28:25 GMT)
Reducing and Exploiting Data Augmentation Noise through Meta Reweighting Contrastive Learning for Text Classification [4.0]
本稿では,テキスト分類タスクにおける拡張データ/サンプルを用いたディープラーニングモデルの性能向上のための新しいフレームワークを提案する。本稿では,拡張サンプルの重み/品質情報を効果的に活用するための,新しい重み依存型列列とデキューアルゴリズムを提案する。本フレームワークでは,テキストCNNエンコーダの平均1.6%,テキストCNNエンコーダの平均4.3%,RoBERTaベースエンコーダの平均1.4%,絶対改善の4.4%を実現している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:19:13 GMT)
Efficient Arbitrary Precision Acceleration for Large Language Models on GPU Tensor Cores [4.0]
大規模言語モデル(LLM)は広く応用されているが、効率的な推論では課題に直面している。本稿では、並列計算を容易にし、対称量子化をサポートする新しいバイポーラ-INTデータフォーマットを提案する。ビットレベルで分解・復元する任意の精度行列乗算方式を実装し,フレキシブルな精度を実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:17:58 GMT)
Digital simulation of zero-temperature spontaneous symmetry breaking in a superconducting lattice processor [4.0]
超伝導格子における反強磁性(AFM)と強磁性(FM)相の生成に関する実験シミュレーションを報告する。 SSB誘起相転移のシグネチャの出現を相関関数で観測する。我々の結果は、凝縮物質物理学の新しい進歩への展望を開いている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:15:18 GMT)
Atom graph, partial Boolean algebra and quantum contextuality [3.9]
量子系は原子グラフによって一意に決定されることを示す。また、グラフに基づいたKochen-Specker定理の一般かつパラメトリックな記述も提示する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:57:04 GMT)
Enhancing Productivity with AI During the Development of an ISMS: Case Kempower [3.9]
本稿では、フィンランドの企業であるKempowerが、ISMSの作成と実装に生成AIを効果的に利用した方法について論じる。本研究は、生成AIの使用が、IMSの作成プロセスを強化する方法について研究する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:37:31 GMT)
MPCODER: Multi-user Personalized Code Generator with Explicit and Implicit Style Representation Learning [3.9]
複数のユーザ向けにパーソナライズされたコードを生成するためにMPCoder(Multi-user Personalized Code Generator)を提案する。コーディングスタイルの特徴をよりよく学習するために、明示的なコーディングスタイル残差学習を用いて、構文コードスタイル標準をキャプチャする。我々は、異なるユーザの暗黙的特徴表現をよりよく区別するために、マルチユーザスタイルのアダプタを訓練する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:18:44 GMT)
Recurrent Stochastic Configuration Networks for Temporal Data Analytics [3.9]
本稿では,問題解決のためのコンフィグレーションネットワーク(RSCN)のリカレントバージョンを開発する。我々は、初期RCCNモデルを構築し、その後、オンラインで出力重みを更新する。数値的な結果は,提案したRCCNが全データセットに対して良好に動作することを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:12:59 GMT)
Image Denoising with Machine Learning: A Novel Approach to Improve Quantum Image Processing Quality and Reliability [3.9]
量子画像処理(QIP)は、画像の操作と解析に量子コンピューティングの利点を活用することを目的としている。 QIPは量子ビットの制限と量子マシンにおけるノイズの存在という2つの課題に直面している。本稿では,量子処理された画像のノイズを特定し,修正する機械学習モデルを用いて,QIPにおけるノイズ問題に対処する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:15:00 GMT)
The Interplay of Computing, Ethics, and Policy in Brain-Computer Interface Design [3.8]
脳-コンピュータインターフェース(BCI)は、脳内の生物学的ニューロンと人工装具やコンピュータなどの外部システムとを接続する。本稿では、倫理的、法的、政策的な考察がBCIアーキテクチャ設計をいかに形成するかを述べる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:34:23 GMT)
IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning [3.8]
テキストの特徴を視覚的に関連性のある特徴と整合させてモダリティギャップを緩和する,イメージライクな検索手法を提案する。本手法は,検索したキャプションを入力特徴と統合したFusion Moduleを設計することにより,生成されたキャプションの精度をさらに向上する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:47:32 GMT)
Geospatial Road Cycling Race Results Data Set [3.8]
サイクリング分析の分野は、オープンなデータソースへのアクセスが限られているため、最近発展し始めたばかりである。我々は,2017-2023年のプロレース結果数千点と,コースに関する詳細な地理情報とを関連づけたデータセットの公開を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:35:14 GMT)
Equivariant Machine Learning Decoder for 3D Toric Codes [3.8]
量子コンピューティングでは、エラーが高速で無効な結果を伝播し、従来のシステムに比べて理論的な指数的な速度が時間的に増加する。量子システムにおける誤りを訂正するために、誤り訂正符号が用いられる。現在、トポロジ的符号である符号のサブグループが多くの研究論文の焦点となっている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:54:53 GMT)
EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation [3.7]
我々は,EM-Netと呼ばれる新しい3次元医用画像セグメンテーションモデルを紹介し,その成功に触発されて,新しいマンバベースの3次元医用画像セグメンテーションモデルであるEM-Netを紹介した。提案手法は,SOTAモデルのパラメータサイズをほぼ半分にし,訓練速度を2倍に向上させながら,より高精度なセグメンテーション精度を示すことを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:34:33 GMT)
Leveraging Annotator Disagreement for Text Classification [3.7]
テキスト分類では、データセットが複数のアノテータによってアノテートされた場合でも、モデルトレーニングに1つのマジョリティラベルのみを使用するのが一般的である。本稿では,アノテータの不一致を利用してテキスト分類を行う3つの手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:46:53 GMT)
Harnessing Shared Relations via Multimodal Mixup Contrastive Learning for Multimodal Classification [3.7]
マルチモーダルデータに固有のニュアンス付き共有関係を抽出するマルチモーダル混合コントラスト学習手法であるM3CoLを提案する。我々の研究は、堅牢なマルチモーダル学習のための共有関係の学習の重要性を強調し、将来の研究に有望な道を開く。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:15:13 GMT)
MASSFormer: Mobility-Aware Spectrum Sensing using Transformer-Driven Tiered Structure [3.6]
モビリティを意識したトランスフォーマー駆動構造(MASSFormer)をベースとした協調センシング手法を開発した。本稿では,モバイルプライマリユーザ(PU)とセカンダリユーザ(SU)の動的シナリオについて考察する。提案手法は, 堅牢性を示すために, 不完全な報告チャネルのシナリオ下で試験される。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:25:25 GMT)
Visualization of Age Distributions as Elements of Medical Data-Stories [3.6]
本研究では, 疾患の年齢分布を示す最も効果的な方法について, 物語的可視化による検討を行った。我々は、理解、美学、エンゲージメント、記憶可能性に焦点をあてた設計選択を特定した。伝統的なバーチャートはエンゲージメントに好まれ、他の変種は記憶に残るものとなった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:00:00 GMT)
Evaluation of Large Language Models for Summarization Tasks in the Medical Domain: A Narrative Review [3.6]
大規模言語モデルは、高度な臨床自然言語生成を持ち、医療用テキストの量を管理する機会を生み出している。臨床要約タスクの現在の評価状況を評価し,専門家による評価の資源制約に対処するための今後の方向性を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:58:26 GMT)
Direct Learning of Mesh and Appearance via 3D Gaussian Splatting [3.5]
本稿では、3DGSを明示的な幾何学的表現、すなわちメッシュに組み込んだ学習可能なシーンモデルを提案する。我々のモデルはメッシュと外観をエンドツーエンドで学習し、メッシュ面に3Dガウスアンを結合し、3DGSの微分レンダリングを行い、測光監督を得る。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:21:27 GMT)
dlordinal: a Python package for deep ordinal classification [3.4]
dlordinalは、最近の多くのディープ順序分類方法論を統合する新しいPythonライブラリである。日常的な分類問題に対して、最先端のディープラーニング技術を実装している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:07:06 GMT)
Role of coherence in many-body Quantum Reservoir Computing [3.4]
量子コヒーレンスや相関などの異なる量子効果が時間的タスクの性能向上にどのように寄与するかを示す。我々は, 有限計測資源と騒音が, 異なる状態における貯水池の力学に与える影響を批判的に評価する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:06:08 GMT)
EPTQ: Enhanced Post-Training Quantization via Hessian-guided Network-wise Optimization [3.4]
量子化は、メモリと計算リソースが限られているエッジデバイスにディープニューラルネットワークをデプロイするための重要な方法である。本稿では,ネットワークワイド量子化最適化プロセスを用いたEPTQ(Post-Training Quantization)の高速化手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:20:59 GMT)
Deep-ER: Deep Learning ECCENTRIC Reconstruction for fast high-resolution neurometabolic imaging [3.4]
変化した神経代謝は、多くの神経疾患や脳がんにおいて重要な病理機構である。ディープラーニングECCENTRIC再構成は、従来の方法よりも600倍高速な再構築を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:20:51 GMT)
Deep Generative Model for Mechanical System Configuration Design [3.2]
本稿では,設計問題に対するコンポーネントとインターフェースの最適な組み合わせを予測するための,深い生成モデルを提案する。次に、GearFormerというデータセットを使ってTransformerをトレーニングします。 GearFormerは、特定の設計要件を満たすという点で、独自の検索方法よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:44:54 GMT)
Estimating The Carbon Footprint Of Digital Agriculture Deployment: A Parametric Bottom-Up Modelling Approach [3.1]
本稿では,デジタル農業シナリオの炭素フットプリントを推定するためのボトムアップ手法を提案する。本研究は,農業におけるデジタル技術の1次効果のさらなる探求の必要性を明らかにするものである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:09:36 GMT)
MALPOLON: A Framework for Deep Species Distribution Modeling [3.1]
MALPOLONは深部種分布モデル(deep-SDM)の訓練と推測を容易にすることを目的としている Pythonで書かれ、PyTorchライブラリ上に構築されている。このフレームワークはGitHubとPyPiでオープンソース化されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:45:10 GMT)
AMARO: All Heavy-Atom Transferable Neural Network Potentials of Protein Thermodynamics [3.1]
全原子分子シミュレーションはマクロ分子現象に関する詳細な知見を提供するが、その計算コストは複雑な生物学的過程の探索を妨げる。我々は,O(3)等価なメッセージパッシングネットワークアーキテクチャと,水素原子を排除した粗粒度マップを組み合わせた,新しいニューラルネットワークポテンシャル(NNP)であるAMARO(Advanced Machine-learning Atomic Omni-force Representation-field)を紹介する。 AMAROは、エネルギー用語を使わずに、拡張性と一般化機能を備えた安定なタンパク質力学を実行するための訓練粗大化NNPの実現可能性を実証している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:58:06 GMT)
HER2 and FISH Status Prediction in Breast Biopsy H&E-Stained Images Using Deep Learning [3.1]
ヘマトキシリンとエオシン(H&E)の腫瘍染色はより広く利用可能である。 H&EによるHER2状態の正確な予測は、コスト削減と治療選択の迅速化を可能にする。 H&Eのためのディープラーニングアルゴリズムは、様々ながんの特徴と臨床結果を予測するのに有効である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:07:16 GMT)
Vision-Language Models Assisted Unsupervised Video Anomaly Detection [3.1]
異常サンプルは教師なし学習手法における重要な課題を示す。提案手法では,大規模言語モデルの推論能力を活用したモーダル事前学習モデルを用いる。本手法は,高次元視覚特徴を低次元意味的特徴にマッピングすることにより,教師なし異常検出の解釈可能性を大幅に向上させる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:38:52 GMT)
Local Patterns Generalize Better for Novel Anomalies [3.1]
ビデオ異常検出(VAD)は、トレーニング中に目に見えない新しい行動や出来事を特定することを目的としている。既存のVAD技術はイベントのグローバルなパターンに重点を置いており、新しいサンプルに適切に一般化することはできない。本稿では,新しいサンプルを一般化する空間的局所パターンを同定し,局所パターンのダイナミクスをモデル化する枠組みを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:38:52 GMT)
On Translating Technical Terminology: A Translation Workflow for Machine-Translated Acronyms [3.1]
技術的な用語、特に頭字語を翻訳する、重要なステップが見逃されていることが分かりました。 Google Translateのような最先端の機械翻訳システムは、頭字語を扱う際に誤用されることがある。 SL-TL (FR-EN) 翻訳ワークフローに追加のステップを提案し、まず、公共消費のための新しい頭字語コーパスを提供し、次に検索ベースのしきい値付けアルゴリズムを実験する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:18:34 GMT)
UNICORN: A Deep Learning Model for Integrating Multi-Stain Data in Histopathology [2.9]
UNICORNは動脈硬化の重症度予測のための多段階組織学を処理できるマルチモーダルトランスフォーマーである。このアーキテクチャは、2段階のエンドツーエンドのトレーニング可能なモデルと、トランスフォーマーの自己保持ブロックを利用する特殊なモジュールから構成される。 UNICORNは0.67の分類精度を達成し、他の最先端モデルを上回った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:13:52 GMT)
Continual learning with task specialist [2.9]
破滅的な忘れと限定されたラベル付きデータの問題に対処するために,タスクスペシャリストによる連続学習(CLTS)を提案する。モデルはタスクスペシャリスト(T S)とタスク予測器(T P)と、事前訓練された安定拡散(SD)モジュールで構成される。 3つの実世界のデータセットで行った4つのSOTAモデルとの比較研究により、提案モデルが選択されたベースラインすべてより優れていることが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:59:09 GMT)
Infering Alt-text For UI Icons With Large Language Models During App Development [2.9]
そこで我々は,Large Language Models (LLMs) を用いて,部分的なUIデータを持つモバイルUIアイコンに対する情報的アルトテキストを自律的に生成する手法を提案する。経験的評価とユーザスタディでは、IconDescは関連するalt-textの生成において大幅な改善を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:01:33 GMT)
Heterogeneous Hyper-Graph Neural Networks for Context-aware Human Activity Recognition [2.8]
我々は,実世界の現実的なデータにおけるコンテキスト認識活動の訪問パターンを,汎用的なグラフ表現学習タスクとみなすことができると論じている。本稿では,コンテキスト認識型ヒューマンアクティビティ認識のための新しいヘテロジニアスハイパーグラフニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:44:37 GMT)
Fault-Tolerant Logical Clifford Gates from Code Automorphisms [2.7]
本稿では, 耐故障性論理クリフォードゲートの実装について, 対称性に基づく安定化器量子誤り訂正符号について検討する。我々のアプローチは、安定化器コードを二進線型コードにマッピングし、自己同型群を計算し、クリフォード作用素が許す制約を課すことである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:00:00 GMT)
Self-supervised Pretraining for Cardiovascular Magnetic Resonance Cine Segmentation [2.7]
自己教師付き事前トレーニング(SSP)は、大規模なラベルなしデータセットから学習する上で有望な結果を示している。 SSPはラベル付きトレーニングデータが不足している場合にCMRシネセグメンテーションに有用であるが、十分なラベル付きデータが利用可能である場合には最先端のディープラーニング手法を助長しない。本研究では,ラベル付きトレーニングデータが少ない場合,SSPはCMRシネセグメンテーションに有用であるが,十分なラベル付きデータが存在する場合,最先端のディープラーニング手法には役に立たないことを示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:44:29 GMT)
Scene Understanding in Pick-and-Place Tasks: Analyzing Transformations Between Initial and Final Scenes [2.6]
この研究は、シーンからの初期画像と最終画像が与えられたタスクを検知し、配置するためのシーン理解に焦点を当てている。オブジェクト検出のためのデータセットが収集され、タスク検出が選択および配置される。その後、YOLOv5ネットワークがトレーニングされ、最初のシーンと最後のシーンのオブジェクトを検出する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:43:09 GMT)
Bivariate DeepKriging for Large-scale Spatial Interpolation of Wind Fields [2.6]
高空間分解能風速データは、気候、海洋学、気象学研究における幅広い応用に不可欠である。 2次元の速度を持つ二変量風場の大規模空間計算やダウンスケーリングは難しい課題である。本稿では,空間的ラジアル基底関数によって構築された埋め込み層を持つ空間依存型ディープニューラルネットワーク(DNN)であるバイバリケートディープクリギングを提案する。提案したDNNモデルの計算効率とスケーラビリティを,従来の手法に比べて平均20倍高速な計算で実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:02:24 GMT)
Discovering New Shadow Patterns for Black-Box Attacks on Lane Detection of Autonomous Vehicles [2.6]
本稿では,実世界逆転例(AE)を創出するための新しいアプローチを提案する。負の影: 戦略的に日光を遮り、人工車線のようなパターンを放つ道路上の光の偽りのパターン。 20メートルの負の影を使って、10mph以上の速度で100%違反率で車両をオフロードに誘導することができる。衝突を引き起こすような他の攻撃シナリオは、少なくとも30mの負の影で実行でき、60-100%の成功率を達成することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:43:52 GMT)
Learning Hierarchical Relational Representations through Relational Convolutions [2.5]
本稿では、より複雑な関係性の特徴を捉える計算機構を備えたニューラルネットワークである「リレーショナル畳み込みネットワーク」を紹介する。このフレームワークの重要なコンポーネントは、グラフレットフィルタを畳み込み、オブジェクトのグループ内の関係パターンをキャプチャする新しい操作である。アーキテクチャのモチベーションと詳細、およびリレーショナル畳み込みネットワークが階層構造を持つリレーショナルタスクをモデル化するための効果的なフレームワークを提供するための一連の実験を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:45:29 GMT)
AI-Powered Augmented Reality for Satellite Assembly, Integration and Test [2.5]
本稿では,欧州宇宙機関のESAプロジェクト「AI for AR in Satellite AIT」の技術的記述について述べる。このプロジェクトは、リアルタイムコンピュータビジョンとARシステムを組み合わせて、衛星組み立て中の技術者を支援する。すべてのAIモデルは70%以上の精度を示し、検出モデルは95%を超える精度で、高いレベルのパフォーマンスと信頼性を示している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:44:52 GMT)
AI-enhanced Collective Intelligence [2.5]
人間とAIは、人間またはAIの集団的知性を単独で超越できる補完的能力を持っている。このレビューでは、複雑なネットワーク科学からの視点を取り入れ、人間-AI集団知能の多層表現を概念化する。エージェントの多様性と相互作用がシステムの集合知にどのように影響するかを探求し、AIによって強化された集合知の実例を分析する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:33:29 GMT)
Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction [2.5]
シーケンシャルレコメンデーションモデルに非イテムページを組み込む方法を示す。我々は、一般的なシーケンシャルレコメンデータモデルを適用して、非itemページを統合する。その結果,非イテムページは貴重な情報源であることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:22:34 GMT)
Predicting Anchored Text from Translation Memories for Machine Translation Using Deep Learning Methods [2.4]
本稿では、CBOW(Continuous bag-of-words)パラダイムに従うアンカードワードに対して、Word2Vec、BERT、GPT-4を使用できることを示す。一部のケースでは、フランス語から英語へのアンカー付き単語の翻訳において、ニューラルマシン翻訳よりも良い結果が得られる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:12:59 GMT)
Mamba Meets Financial Markets: A Graph-Mamba Approach for Stock Price Prediction [2.4]
SAMBAは、Mambaアーキテクチャに基づいてグラフニューラルネットワークを統合する、ストックリターン予測のための革新的なフレームワークである。実験の結果,SAMBAは予測精度において最先端のベースラインモデルよりも優れ,計算複雑性が低いことがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:29:26 GMT)
TypeFly: Flying Drones with Large Language Model [2.3]
移動ロボットを含むリアルタイムおよびインタラクティブなアプリケーションでは、シーケンシャルトークン生成プロセスにはかなりのレイテンシが伴う。本稿では,MiniSpecという新しいプログラミング言語と,その実行環境を組み合わせたChatFlyを提案する。すなわち、LLMに人気のあるPythonでプログラム(ロボティックプラン)を書く代わりに、ChatFlyはトークン効率とストリーム解釈のために特別に設計されたMiniSpecでプログラムを実行できる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:45:13 GMT)
MoJE: Mixture of Jailbreak Experts, Naive Tabular Classifiers as Guard for Prompt Attacks [2.3]
本稿では,大規模言語モデル(LLM)における脱獄予防の重要性を論じる。我々は,既存の最先端ガードレールの限界を超えるよう設計された,新しいガードレールアーキテクチャであるMoJEを紹介する。 MoJEは、モデル推論中に最小限の計算オーバーヘッドを維持しながら、ジェイルブレイク攻撃の検出に優れる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:12:19 GMT)
LuSNAR:A Lunar Segmentation, Navigation and Reconstruction Dataset based on Muti-sensor for Autonomous Exploration [2.3]
環境認識とナビゲーションアルゴリズムが月探査の基盤となっている。既存の月のデータセットのほとんどは、単一のタスクをターゲットにしています。本稿では,マルチタスク,マルチシーン,マルチラベルのベンチマークデータセットLuSNARを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:11:38 GMT)
Realising Synthetic Active Inference Agents, Part II: Variational Message Updates [2.3]
アクティブ推論 (AIF) は自由エネルギー原理 (FEP) の系譜である自由形Forney-style Factor Graphs(FFGs)上のメッセージパッシングによるAIFのスケーラブルでエピステマティックなアプローチについて述べる。合成AIFエージェントの完全なメッセージパッシングアカウントにより、モデル間でのメッセージ更新の導出と再利用が可能になる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:45:22 GMT)
Designing Short-Stage CDC-XPUFs: Balancing Reliability, Cost, and Security in IoT Devices [2.3]
物理的に非閉塞関数(PUF)は、固有のハードウェアのバリエーションからユニークな暗号鍵を生成する。 Arbiter PUFs (APUFs) や XOR Arbiter PUFs (XOR-PUFs) のような従来のPUFは、機械学習(ML)や信頼性ベースの攻撃の影響を受けやすい。本稿では,信頼性を高めるための事前選択戦略を取り入れたCDC-XPUF設計を提案し,新しい軽量アーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:50:20 GMT)
Control Industrial Automation System with Large Language Models [2.2]
本稿では,大規模言語モデルと産業自動化システムを統合するためのフレームワークを提案する。フレームワークの中核には、産業タスク用に設計されたエージェントシステム、構造化プロンプト方法、イベント駆動情報モデリング機構がある。コントリビューションには、フォーマルなシステム設計、概念実証実装、タスク固有のデータセットを生成する方法が含まれる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:19:37 GMT)
Trainability and Expressivity of Hamming-Weight Preserving Quantum Circuits for Machine Learning [2.2]
可変量子回路(VQC)のトレーニング性と制御性の解析まず、新しいデータローダの実現可能性を示し、$binomnk$-dimensionalベクトルの量子振幅符号化を行う。最後に、ハミング重み保存回路のトレーニング可能性を分析し、サブ空間の$binomnk$の分散がサブ空間の$binomnk$に応じて有界であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:14:42 GMT)
Decomposable Transformer Point Processes [2.2]
本稿では,注目に基づくアーキテクチャの利点の維持と,薄型化アルゴリズムの限界を回避する枠組みを提案する。提案手法は,その履歴が与えられたシーケンスの次の事象を予測する上で,最先端の性能を実現する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:22:58 GMT)
Explainable AI needs formal notions of explanation correctness [2.1]
医学のような重要な分野における機械学習はリスクをもたらし、規制を必要とする。 1つの要件は、リスクの高いアプリケーションにおけるMLシステムの決定は、人間に理解可能なものであるべきです。現在の形式では、XAIはMLの品質管理に不適であり、それ自体は精査が必要である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:29:45 GMT)
Explainable AI needs formal notions of explanation correctness [2.1]
医学のような重要な分野における機械学習はリスクをもたらし、規制を必要とする。 1つの要件は、リスクの高いアプリケーションにおけるMLシステムの決定は、人間に理解可能なものであるべきです。現在の形式では、XAIはMLの品質管理に不適であり、それ自体は精査が必要である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:29:45 GMT)
Optimal Quantum Purity Amplification [2.1]
量子純度増幅(QPA)は、量子状態の劣化に対処する新しいアプローチを提供する。本稿では,大域的偏極雑音に対する一般量子システムに対する最適QPAプロトコルを提案する。この結果から,QPAは量子情報処理タスクの性能を向上させる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:46:00 GMT)
Harnessing and modulating chaos to sample from neural generative models [2.0]
我々は、脳が生成モデルから学習し、サンプルすることを可能にする上で、神経カオスがどのように機能的な役割を果たすかを示す。我々は、古典的なニューラルカオスモデルと標準生成モデリングアーキテクチャ、あるいはニューラルメモリのエネルギーベースモデルを組み合わせたアーキテクチャを構築する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:52:26 GMT)
An angle rounding parameter initialization technique for ma-QAOA [2.0]
マルチ角量子近似最適化アルゴリズム(ma-QAOA)は、量子近似最適化アルゴリズム(QAOA)と少なくとも同じ近似比を与えるアルゴリズムである。 ma-QAOAの欠点の1つは、QAOAよりもかなり古典的なパラメータを使用するため、古典的な最適化成分はより複雑である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:02:29 GMT)
A Framework for Standardizing Similarity Measures in a Rapidly Evolving Field [2.0]
類似度測定は、人工システムと生物学的システムのアライメントを定量化する基本的なツールである。類似度尺度の多様性と命名・実施規則の多様性は、研究全体を比較するのを困難にしている。本稿では,類似度対策を独自かつ効率的に特定することを目的とした命名規則の開発,検証,精錬のための枠組みを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:14:01 GMT)
Jump Diffusion-Informed Neural Networks with Transfer Learning for Accurate American Option Pricing under Data Scarcity [2.0]
本研究は,6つの相互関連モジュールからなる米国オプション価格の包括的枠組みを提案する。このフレームワークは非線形最適化アルゴリズム、解析モデルと数値モデル、ニューラルネットワークを組み合わせて価格性能を向上させる。提案したモデルでは、より深い収益源オプションの価格設定において優れた性能を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:50:12 GMT)
Decision Support System to triage of liver trauma [2.0]
肝の出血・裂傷をCTで検出する新しい方法を提案する。本手法の有効性はDiceスコアで定量化され,肝出血97%,肝裂傷検出93%の精度が得られた。この研究は、GAN Pix2Pixのような高度な画像翻訳モデルが、クリティカルケアシナリオにおける医療診断の精度とスピードを改善する可能性を強調している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:28:17 GMT)
Extracting Affect Aggregates from Longitudinal Social Media Data with Temporal Adapters for Large Language Models [1.9]
本稿では,ソーシャルメディアデータの経時的分析ツールとして,時整列大言語モデル(LLM)を提案する。我々は、Llama 3 8BのテンポラルアダプタをイギリスのTwitterユーザーのパネルから全タイムラインで微調整し、確立したアンケートで感情と態度の縦断的な集計を抽出する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:02:00 GMT)
Quantum entanglement in phase space [1.9]
We study entanglement detection from Measurement of the Wigner function。我々は、様々な実験的なガウス状態と非ガウス状態に対して厳密であることを示す補完的基準を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:40:36 GMT)
DualAD: Dual-Layer Planning for Reasoning in Autonomous Driving [1.8]
運転中の人間の推論を模倣する新しい自動運転フレームワークであるDualADを提案する。 DualADは、ルールベースのモーションプランナとルールベースのテキストエンコーダを備えた上位レイヤの2つのレイヤで構成されている。上層は潜在的な危険が検出されたときに下層の決定に介入し、臨界時の人間の推論を模倣する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:58:04 GMT)
CBIDR: A novel method for information retrieval combining image and data by means of TOPSIS applied to medical diagnosis [1.8]
そこで我々は,患者の医療画像と臨床データの両方を活用するCBIDRという新しい手法を提案し,それらをランキングアルゴリズムToPSISを用いて組み合わせた。精度の面での実験結果は、Top-1で97.44%、Top-5で100%達成し、提案手法の有効性を示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:04:36 GMT)
A Survey on Offensive AI Within Cybersecurity [1.8]
攻撃的AIに関する調査論文は、AIシステムに対する攻撃および使用に関する様々な側面を包括的にカバーする。消費者、企業、公共のデジタルインフラストラクチャなど、さまざまな分野における攻撃的なAIプラクティスの影響を掘り下げる。この論文では、敵対的な機械学習、AIモデルに対する攻撃、インフラストラクチャ、インターフェース、および情報収集、ソーシャルエンジニアリング、兵器化されたAIといった攻撃的テクニックについて検討する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:36:22 GMT)
Intervention strategies for misinformation sharing on social media: A bibliometric analysis [1.8]
不正確な共有情報は混乱を引き起こし、精神的健康に悪影響を及ぼし、誤報による意思決定につながる。本研究では,ソーシャルメディア上での誤情報共有に対処するための介入戦略の類型について検討する。認識ベース、自動化ベース、情報ベース、ハイブリッドベースの4つの重要なクラスタを特定します。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:38:15 GMT)
Showing Many Labels in Multi-label Classification Models: An Empirical Study of Adversarial Examples [1.8]
我々は、"Showing Many Labels"と呼ばれる新しいタイプの攻撃を導入する。 Showing Many Labels" では、反復攻撃はワンステップ攻撃よりもはるかに優れている。データセット内のすべてのラベルを表示することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:31:31 GMT)
Autonomous Network Defence using Reinforcement Learning [1.7]
現実的なネットワーク防衛シナリオにおける自律エージェントの有効性について検討する。新たな強化学習エージェントは、2つの先進的持続的脅威(APT)レッドエージェントによる連続的な攻撃を確実に防御できることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:24:09 GMT)
Ophthalmic Biomarker Detection with Parallel Prediction of Transformer and Convolutional Architecture [1.7]
本稿では,CNNとVision Transformerのアンサンブルを用いた眼科バイオマーカー検出手法を提案する。本手法はOCT画像から6つのバイオマーカーを検出するためにOLIVESデータセット上に実装され,データセット上でのマクロ平均F1スコアの大幅な改善を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:33:34 GMT)
Exploring the Robustness of stabilizing controls for stochastic quantum evolutions [1.7]
我々は、量子進化のための純粋状態や部分空間の安定化に対するモデリングエラーの効果を分析し、バウンドする。オープンループとフィードバックコントロールプロトコルには,さまざまなアプローチが使用されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:00:41 GMT)
Recursive Distillation for Open-Set Distributed Robot Localization [1.7]
本研究は,オープンワールド分散ロボットシステムのための新しいトレーニングスキームを導入する。ロボット(学生)は、知らない場所で出会った他のロボット(教師)にガイダンスを求めることができる。一般的な知識伝達方式とは異なり,本手法では教師モデルに最小限の仮定を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:04:58 GMT)
What happens to diffusion model likelihood when your model is conditional? [1.6]
拡散モデル(DM)は、ランダムサンプルを反復的に識別して高品質なデータを生成する。 DMは非条件DMのランク付けやドメイン外の分類に使われてきた。条件付きタスクにDMを適用すると、不整合が明らかになり、DMの特性が不明であるという主張が強まる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:33:46 GMT)
Federated Learning under Attack: Improving Gradient Inversion for Batch of Images [1.6]
フェデレートラーニング(FL)は、ユーザのデータのプライバシを保存する機械学習アプローチとして登場した。フィードバックブレンディング(DLG-FB)を用いたグラディエンスからのディープリークは、逆勾配攻撃を改善することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:02:36 GMT)
Developing a Dual-Stage Vision Transformer Model for Lung Disease Classification [1.5]
肺疾患は全米で流行し、3400万人以上の人に影響を与えている。さまざまな種類の肺疾患の正確な診断とタイムリーな診断が重要であり、人工知能(AI)の手法はこれらのプロセスを高速化する可能性がある。この研究を通じて、視覚変換器(ViT)とスイニング変換器(Swin Transformer)を統合して、X線スキャンで14種類の肺疾患を分類する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:59:36 GMT)
Model-Free versus Model-Based Reinforcement Learning for Fixed-Wing UAV Attitude Control Under Varying Wind Conditions [1.5]
本稿では、PIDを基準点として、固定翼無人航空機の姿勢制御のためのモデルフリーおよびモデルベース強化学習の性能を評価し、比較する。その結果, 時間差モデル予測制御は, PIDコントローラと他のモデルレス強化学習法の両方で, 精度と頑健さの点で優れていた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:47:14 GMT)
Fully Dynamic Graph Algorithms with Edge Differential Privacy [1.5]
完全動的更新を伴う連続リリースの難易度設定において,グラフを解析するための差分プライベートアルゴリズムについて検討した。これまでの研究では、挿入のみや削除のみを処理できる多くのグラフ問題に対して、差分プライベートなアルゴリズムが提案されてきた。いくつかの基本グラフ問題に対して、事象レベルとアイテムレベルの完全動的アルゴリズムの誤差について、上下境界を与える。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:17:49 GMT)
Open Digital Rights Enforcement Framework (ODRE): from descriptive to enforceable policies [1.4]
本稿では,ODRLに執行能力を提供することを目標とする,オープンデジタル著作権執行(ODRE)フレームワークを紹介する。このフレームワークには,ODRLポリシの実施アルゴリズムと,PythonとJavaの2つのオープンソース実装が含まれている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:36:49 GMT)
EfficientCrackNet: A Lightweight Model for Crack Segmentation [1.4]
き裂検出は、建物、舗装、橋の構造的整合性を維持するために不可欠である。既存の軽量な手法は、計算の非効率性、複雑な亀裂パターン、難易度などの課題に直面していることが多い。本稿では,CNN(Convolutional Neural Networks)とトランスフォーマーを組み合わせた軽量ハイブリッドモデルであるEfficientCrackNetを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:44:20 GMT)
Multilingual Evaluation of Long Context Retrieval and Reasoning [1.3]
大きな言語モデル(LLM)は、長いコンテキストを扱うのに素晴らしい能力を示している。 5言語にわたる検索と推論のタスクに対して,長いコンテキストのLLMを評価した。最高のパフォーマンスモデルは英語で約96%の精度を達成し、ソマリでは約36%の精度を目標文で達成している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:15:14 GMT)
AsIf: Asset Interface Analysis of Industrial Automation Devices [1.3]
産業制御システムは、通信標準やプロトコルを含むITソリューションをますます採用している。これらのシステムがより分散化され相互接続されるようになると、セキュリティ対策の強化に対する重要なニーズが生じる。脅威モデリングは伝統的に、ドメインとセキュリティの専門家を含む構造化ブレインストーミングセッションで行われます。本稿では,特に物理的脅威に着目した産業システムにおける資産分析手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:19:15 GMT)
Toward Interactive Optimization of Source Code Differences: An Empirical Study of Its Performance [1.3]
ソースコードの違い(差分)を最適化するためのインタラクティブなアプローチを提案する。ユーザは、マッチすべきではなく、マッチすべきでない部分や、マッチすべきでない部分に対するフィードバックを提供することができる。 GitHubの23のプロジェクトの結果は、最適でない差分のうち92%が、理想的なケースでは4つ未満のフィードバックアクションで対処可能であることを確認している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:13:53 GMT)
Toward Interactive Optimization of Source Code Differences: An Empirical Study of Its Performance [1.3]
ソースコードの違い(差分)を最適化するためのインタラクティブなアプローチを提案する。ユーザは、マッチすべきではなく、マッチすべきでない部分や、マッチすべきでない部分に対するフィードバックを提供することができる。 GitHubの23のプロジェクトの結果は、最適でない差分のうち92%が、理想的なケースでは4つ未満のフィードバックアクションで対処可能であることを確認している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:13:53 GMT)
Investigating OCR-Sensitive Neurons to Improve Entity Recognition in Historical Documents [1.3]
OCR感受性ニューロンは、歴史的文書におけるエンティティ認識に影響を及ぼす。クリーンでノイズの多いテキスト入力に応答してニューロンの活性化パターンを解析することにより、OCR感受性ニューロンを同定し、中和し、モデル性能を向上させる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:22:37 GMT)
Masks and Boxes: Combining the Best of Both Worlds for Multi-Object Tracking [1.2]
マルチオブジェクト追跡(MOT)は、ビデオシーケンスをまたいだオブジェクトの特定と一貫した追跡を含む。従来のトラッキング・バイ・検出手法は、広範囲なチューニングと一般化性の欠如を必要とする。我々は,時間的に伝播するセグメンテーションマスクを強相関キューとして組み込んだ新しいアプローチ,McByteを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:13:43 GMT)
Masks and Boxes: Combining the Best of Both Worlds for Multi-Object Tracking [1.2]
マルチオブジェクト追跡(MOT)は、ビデオシーケンスをまたいだオブジェクトの特定と一貫した追跡を含む。従来のトラッキング・バイ・検出手法は、広範囲なチューニングと一般化性の欠如を必要とする。我々は,時間的に伝播するセグメンテーションマスクを強相関キューとして組み込んだ新しいアプローチ,McByteを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:13:43 GMT)
HVT: A Comprehensive Vision Framework for Learning in Non-Euclidean Space [1.2]
本稿では、双曲幾何学を統合した視覚変換器(ViT)の新たな拡張である、双曲型視覚変換器(HVT)を紹介する。従来のViTはユークリッド空間で作用するが、この手法は双曲的距離とM"オビウス変換を活用することにより自己認識機構を強化する。厳密な数学的定式化を行い、双曲幾何学を注意層、フィードフォワードネットワーク、最適化に組み込む方法を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:39:02 GMT)
Can the quantum switch be deterministically simulated? [1.2]
入力チャネルに1つの余分な呼び出ししかできない場合、量子スイッチは任意の量子回路でシミュレートできないことを示す。この結果は、量子スイッチがユニタリチャネルにのみ作用すると、その作用をシミュレートできるという既知の事実とは対照的である。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:34:14 GMT)
Low-ground/High ground capacity regions analysis for Bosonic Gaussian Channels [1.1]
本稿では, 単一モード, 位相非感受性ガウスボソニックチャネル間の相互接続の包括的特徴について述べる。この特徴付けにより、これらのマップのパラメータ空間において、低地と高地という2つの異なる領域を特定できる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:19:28 GMT)
Transferring disentangled representations: bridging the gap between synthetic and real images [1.1]
実データに適用可能な汎用的不整合表現を学習するために,合成データを活用する可能性を検討する。本稿では,表現中の因子の質を測定するために,新しい解釈可能な介入基準を提案する。以上の結果から, 合成データから実データへの表現の変換が可能であること, 有効であることが示唆された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:25:48 GMT)
Let the Quantum Creep In: Designing Quantum Neural Network Models by Gradually Swapping Out Classical Components [1.0]
現代のAIシステムはニューラルネットワーク上に構築されることが多い。古典的ニューラルネットワーク層を量子層に置き換える枠組みを提案する。画像分類データセットの数値実験を行い、量子部品の体系的導入による性能変化を実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:01:29 GMT)
Human participants in AI research: Ethics and transparency in practice [1.0]
人工知能(AI)と機械学習(ML)の進歩には、人間の参加者を巻き込んだ研究が欠かせない。しかし、AIと参加型研究者は、AIとMLの人間の参加者による倫理研究のガイドラインを欠いている。本稿は,これらの課題に対処し,技術研究者を実践的な知識で位置づけることを目的とする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:38:48 GMT)
When A Man Says He Is Pregnant: ERP Evidence for A Rational Account of Speaker-contextualized Language Comprehension [1.0]
事象関連電位(ERP)研究は、そのような話者ミスマッチした発話に対する神経生理学的反応について混合の結果を示した。これらの異なるERP効果は、話者とメッセージのミスマッチを解決するために使用される認知過程を反映していることを示す。本研究は,文献における経験的不整合の解明に役立ち,話者文脈言語理解の合理的な説明を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:24:52 GMT)
Development of an Edge Resilient ML Ensemble to Tolerate ICS Adversarial Attacks [0.9]
敵の攻撃に耐えられるように設計された、レジリエントなエッジ機械学習アーキテクチャを構築します。 reMLはResilient DDDASパラダイム、移動目標防衛(MTD)理論、TinyMLに基づいている。提案手法は電力効率とプライバシ保護であり,ISCのセキュリティを高めるため,電力制約のあるデバイスにデプロイすることができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:37:37 GMT)
Using dynamic loss weighting to boost improvements in forecast stability [0.9]
ローリング起点予測不安定性(ローリング起点予測不安定性)とは、予測の更新によって生じる特定の期間の予測における変動をいう。本稿では, 動的損失重み付けアルゴリズムを適用して, 精度を損なうことなく, さらなる安定性向上が達成できるかどうかを実験的に検討する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:21:46 GMT)
Navigation in a simplified Urban Flow through Deep Reinforcement Learning [0.9]
都市環境における無人航空機(UAV)は、環境への影響を最小限に抑える戦略を必要とする。我々の目標は、都市環境下での無人航法を可能にするDRLアルゴリズムを開発することである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:05:15 GMT)
Supervised Learning Model for Key Frame Identification from Cow Teat Videos [0.9]
本稿では, ウシの乳房炎リスク評価の精度をニューラルネットワークとビデオ解析を用いて改善する手法を提案する。伝統的に、獣医は乳牛の乳房の健康を評価する。本論文は、牛のうどんが無傷に見えるビデオのキーフレームをニューラルネットワークで同定する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:50:43 GMT)
A Systematisation of Knowledge: Connecting European Digital Identities with Web3 [0.9]
自己主権アイデンティティ(Self-Sovereign Identity, SSI)と分散アイデンティティ(decentralized identity)という用語は、しばしば相互に使用される。本稿は、欧州デジタルアイデンティティフレームワーク(eIDAS 2.0)の制定に関する改正規制に関して、この2つの概念を明確に区別することを目的としている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:35:25 GMT)
Explaining Explaining [0.9]
高度なAIシステムに自信を持つ人々にとって、説明は鍵となる。マシンラーニングベースのシステムは、通常はブラックボックスであるため、説明できない。認知エージェント開発におけるハイブリッドアプローチについて述べる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:55:44 GMT)
Autoregressive Generation Strategies for Top-K Sequential Recommendations [0.8]
本稿では,Top-Kシーケンシャルレコメンデーションタスクにおける生成トランスフォーマモデルの適用性について検討する。提案手法は,広範に使用されているTop-K予測手法や単一シーケンスの自動回帰生成手法と比較して,より長い時間での性能向上を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:00:19 GMT)
HEMIT: H&E to Multiplex-immunohistochemistry Image Translation with Dual-Branch Pix2pix Generator [0.8]
HEMITはヘマトキシリンとエオシンのセクションを多重イムノ(mIHC)画像に変換するために設計されたデータセットである。 HEMITのmIHC画像は、多成分および細胞レベルでH&Eと整合し、教師付き染色翻訳タスクを充実させる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:25:32 GMT)
Optimal quantum (tensor product) expanders from unitary designs [0.8]
ユニタリ設計から量子展開器を構築する方法について検討する。具体的には、クラウス作用素が2ドルの設計基準からサンプリングされた独立ユニタリであるランダムな量子チャネルは、高い確率で最適な展開器であることが証明される。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:47:16 GMT)
Digital Twin Ecosystem for Oncology Clinical Operations [0.8]
本稿では,腫瘍学における臨床手術の高度化をめざした,新たなデジタルツインフレームワークを提案する。我々は,医療ニーズ双生児,ケアナビゲータ双生児,臨床履歴双生児など,複数の専門的デジタル双生児の統合を提案する。複数のデータソースを合成し、NCCN(National Comprehensive Cancer Network)ガイドラインと整合させることで、ダイナミックながんケアパスを作成する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:56:54 GMT)
BeanCounter: A low-toxicity, large-scale, and open dataset of business-oriented text [0.8]
BeanCounterは、企業の開示から抽出された159B以上のトークンからなるパブリックデータセットである。データの出所を考えると、BeanCounterはWebベースのデータセットよりも比較的現実的で毒性が低いという仮説を立てています。有害な生成が18～33%減少し、継続的に事前訓練されたモデルに対するファイナンス領域内での性能が向上した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:26:46 GMT)
Language agents achieve superhuman synthesis of scientific knowledge [0.8]
PaperQA2は、ファクトリティの改善、マッチング、あるいは課題の専門家のパフォーマンスを上回るように最適化されたフロンティア言語モデルエージェントである。 PaperQA2は、Wikipediaのような科学的トピックの要約を引用している。本稿では,人間にとって重要な科学的課題である科学文献の矛盾を明らかにするためにPaperQA2を適用した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:27:08 GMT)
Regional quality estimation for echocardiography using deep learning [0.7]
心エコー画像の画質の推定は、オペレーターを誘導し、臨床測定の精度を確保するのに有用である。過去の研究はしばしば、心エコー図の視線精度と画質の区別に失敗する。本研究では,画像品質を推定する3つの手法を開発し,比較した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:34:23 GMT)
Regional quality estimation for echocardiography using deep learning [0.7]
心エコー画像の画質の推定は、オペレーターを誘導し、臨床測定の精度を確保するのに有用である。過去の研究はしばしば、心エコー図の視線精度と画質の区別に失敗する。本研究では,画像品質を推定する3つの手法を開発し,比較した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:34:23 GMT)
Visual Concept Networks: A Graph-Based Approach to Detecting Anomalous Data in Deep Neural Networks [0.7]
ディープニューラルネットワーク(DNN)は異常やアウト・オブ・ディストリビューション(OOD)データに対する堅牢性に苦しむ。本稿では, グラフ構造とトポロジ的特徴を利用して, 遠距離OODデータと近距離OODデータの両方を効果的に検出する手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:27:08 GMT)
Recent Trends in Unsupervised Summarization [0.7]
教師なしの要約は、ラベル付きデータセットを必要とせずにモデルを要約する訓練を可能にする強力なテクニックである。このサーベイは、教師なし要約に使用される様々な手法とモデルをカバーしている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:32:47 GMT)
An exploratory analysis of Community-based Question-Answering Platforms and GPT-3-driven Generative AI: Is it the end of online community-based learning? [0.7]
ChatGPTは、Stack Overflowのようなコミュニティの質問に答えるプラットフォームに対して、ソフトウェアエンジニアにインタラクティブな代替手段を提供する。私たちは、2022年1月から2022年12月までのStack Overflowで投稿された2564 PythonとJavaScriptの質問に対して、ChatGPTのパフォーマンスを分析した。分析の結果,ChatGPTの回答は66%短く,質問に対して35%の回答が得られた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:17:30 GMT)
Enhancing Tourism Recommender Systems for Sustainable City Trips Using Retrieval-Augmented Generation [0.7]
本稿では,大規模言語モデルと改良型検索拡張パイプラインを用いて,持続可能な都市旅行を実現するための新しいアプローチを提案する。我々は,都市の人気度と季節的需要に基づいて,サステナビリティ指標を組み込むことで,従来のRAGシステムを強化した。 Sustainability Augmented Re rank (SAR)と呼ばれるこの修正は、システムの推奨事項と持続可能性の目標との整合性を保証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:12:33 GMT)
LowREm: A Repository of Word Embeddings for 87 Low-Resource Languages Enhanced with Multilingual Graph Knowledge [0.6]
87の低リソース言語に対する静的な埋め込みのリポジトリであるLowREmを紹介します。また,多言語グラフ知識を統合することで,GloVeベースの埋め込みを強化する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:10:26 GMT)
QUBO Formulations for Variation of Domination Problem [0.6]
支配問題 (DP) は, 消防署問題, ソーシャルネットワーク理論など, 現実の多くの実践的問題に関係している。本稿では,従来のDPのQUBOモデリング手法とその変種について検討する。従来の研究と比較して、従来のDPのモデリング手法であるQUBOでは、量子コンピュータ上でのDP解決の障壁を低くすることができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:36:55 GMT)
Low Photon Number Non-Invasive Imaging Through Time-Varying Diffusers [0.6]
ダイナミックディフューザの裏側に隠された蛍光体の非侵襲イメージングを実証する。我々の再構成では、異なるディフューザ実現のために記録された画像のスタックを使用し、個々のカメラフレームが小さな光子数を含む場合でも機能する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:19:13 GMT)
QBI: Quantile-Based Bias Initialization for Efficient Private Data Reconstruction in Federated Learning [0.5]
フェデレーション学習は、ユーザのプライバシを損なうことなく、分散データ上で機械学習モデルのトレーニングを可能にする。近年の研究では、中央のエンティティが共有モデル更新からプライベートデータを完全に再構築できることが示されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:36:32 GMT)
Time and State Dependent Neural Delay Differential Equations [0.5]
遅れた用語は、物理学や工学から医学、経済学まで、幅広い種類の問題の統治方程式で遭遇する。複数および状態依存の遅延と時間依存の遅延をモデル化できるフレームワークであるNeural State-Dependent DDEを導入する。提案手法は競争力があり,様々な遅延力学系における他の連続クラスモデルよりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:29:00 GMT)
HydraViT: Stacking Heads for a Scalable ViT [0.5]
本稿では,拡張性のあるViTを実現するために,注目ヘッドを積み重ねることで制限に対処する新しいアプローチであるHydraViTを紹介する。実験の結果,HydraViTは最大10ワークスで拡張性のあるViTを実現し,幅広いリソース制約をカバーできることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:52:36 GMT)
Modulated Intervention Preference Optimization (MIPO): Keey the Easy, Refine the Difficult [0.5]
この問題に対処するため,textbfModulated Intervention Preference Optimization (MIPO)を提案する。 MIPOは、そのデータがどのように適合しているかに基づいて、参照モデルからの介入の度合いを変調する。我々は,Alpaca Eval 2.0 と MT-Bench における Mistral-7B と Llama3-8B を用いた MIPO と DPO の性能を比較した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:24:14 GMT)
Recombination vs Stochasticity: A Comparative Study on the Maximum Clique Problem [0.4]
最大傾き問題(英: maximum clique problem、MCP)は、グラフ理論と計算複雑性の基本的な問題である。様々なメタヒューリスティックがMPPを近似するために使われており、遺伝的アルゴリズムやメメティックアルゴリズム、アリコロニーアルゴリズム、欲求アルゴリズム、タブアルゴリズム、シミュレートされたアニーリングなどがある。以上の結果から,モンテカルロのアルゴリズムはランダム検索を用いてグラフを生成するが,速度と能力の両面で遺伝的アルゴリズムを上回っていることが示唆された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:50:00 GMT)
Zero- and Few-shot Named Entity Recognition and Text Expansion in Medication Prescriptions using ChatGPT [0.4]
大規模言語モデル(LLM)は、入力プロンプトに応答してテキストを生成する有望な能力を示している。われわれはChatGPT 3.5を用いて、排出サマリーにおける医薬品のステートメントを自動構築し、拡張する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:49:27 GMT)
Magic state cultivation: growing T states as cheap as CNOT gates [0.4]
1つの状態のサイズと信頼性が徐々に増大するので、我々は建設を「魔法の国家栽培」と呼んでいる。物理的騒音の改善に対する栽培効率と強い反応は、実際にはそれ以上のマジックステート蒸留は必要ないことを示唆している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:21:58 GMT)
Entanglement Microscopy: Tomography and Entanglement Measures via Quantum Monte Carlo [0.3]
我々は、エンタングルメント顕微鏡と呼ばれるプロトコルを用いて、マイクロサブリージョンの完全な還元密度行列に符号化されたマルチパーティントエンタングルメントを明らかにする。その結果,Ising QCPは空間,温度ともにLNの急死が有限である短距離絡み合っていることがわかった。 2dのIsing QCP付近の大きなパラメータウィンドウでは,2人の目撃者との3方向の絡み合いは検出できない。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:35:06 GMT)
Probabilistic unifying relations for modelling epistemic and aleatoric uncertainty: semantics and automated reasoning with theorem proving [0.3]
確率的プログラミングは、一般的なコンピュータプログラミング、統計的推論、形式的意味論を組み合わせたものである。 ProbURelは、Hehnerの予測確率的プログラミングに基づいているが、彼の作品が広く採用されるにはいくつかの障害がある。コントリビューションには、Unified Theories of Programming(UTP)を使用した関係の形式化や、ブラケット外の確率などが含まれています。ロボットのローカライゼーションの問題,機械学習の分類,確率ループの終了など,6つの事例で研究成果を実演する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:10:41 GMT)
Byzantine-Robust Aggregation for Securing Decentralized Federated Learning [0.3]
Federated Learning(FL)は、デバイス上でAIモデルをローカルにトレーニングすることで、プライバシの問題に対処する分散機械学習アプローチとして登場した。分散フェデレートラーニング(DFL)は、中央サーバを排除し、単一障害点の回避を通じてスケーラビリティと堅牢性を向上させることで、FLパラダイムを拡張します。 We present a novel byzantine-robust aggregate algorithm to enhance the security of DFL environment, coin, WFAgg。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:36:08 GMT)
Optimal trace-distance bounds for free-fermionic states: Testing and improved tomography [0.3]
相関行列の推定における誤差が状態のトレース距離誤差にどのように影響するかを示す。我々は,自由フェルミオン状態の物性試験とトモグラフィーの大幅な進歩を導出した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:29:52 GMT)
VVTEAM: A Compact Behavioral Model for Volatile Memristors [0.2]
本稿では,V-VTEAM(V-VTEAM)を提案する。モデルの有効性を, イオンドリフト/拡散ベースAg/SiOx/C/W揮発性メムリスタに適合させ, 相対根平均誤差が4.5%に達することを実証した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:52:04 GMT)
Input-Dependent Power Usage in GPUs [0.2]
入力データをGEMMに変換し,行列形状やサイズを維持しながら,これらのカーネルの消費電力を著しく変化させることができることを示す。以上の結果から,GEMMにおけるGPUの消費電力は,ほぼ40%変化することが示唆された。本稿では,この特性をコンパイラとスケジューラの最適化によって利用し,電力管理と省エネルギー化を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:31:09 GMT)
Symmetric-Cyclic Bidirectional Quantum Teleportation of Bell-like State via Entanglement-Swapping [0.2]
量子テレポーテーション(quantum teleportation)は、量子ネットワークにおいて量子情報を交換するためのプリミティブプロトコルである。本稿では,ベル様状態が周期列で同時に交換される方式を提案する。通信と運用の複雑さに基づいて、我々のプロトコルを他の等価プロトコルと比較し、本プロトコルの本質的な効率が33.33%のペギングであることを示した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:21:50 GMT)
SF-MMCN: Low-Power Sever Flow Multi-Mode Diffusion Model Accelerator [0.2]
畳み込みニューラルネットワーク(CNN)アクセラレータは,特に高速推論のために設計・開発が急速に進んでいる。サーバフローマルチモードCNNユニット(SF-MMCN)が提案され,処理要素数(PE)が削減され,操作効率が向上した。提案したSF-MMCNは、電力消費を92%削減し、シリコン領域を70%削減し、運転効率を約81倍改善する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:38:48 GMT)
Convolutional Signal Propagation: A Simple Scalable Algorithm for Hypergraphs [0.1]
本稿では,両部グラフ(ハイパーグラフ)で動作する非パラメトリック単純かつスケーラブルな方法である畳み込み信号伝搬(CSP)を提案する。計算複雑性を低く保ちながら,CSPが競争性能を提供することを示す。ハイパーグラフの操作にもかかわらず、CSPは自然言語処理のようなハイパーグラフに関連のないタスクで良い結果を得る。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:22:09 GMT)
A Policy Report Evaluating the National Assessment Program for Literacy and Numeracy (Naplan) Reform in Australia: The Impacts of High Stakes Assessment on Students [0.1]
オーストラリアで2008年に開始されたNAPLAN(National Assessment Program for Literacy and Numeracy)改革(National Assessment Program for Literacy and Numeracy)は、オーストラリアで最も重要かつ論争の多い改革である。本報告はNAPLAN改革の成果と障害を評価するものである。オンラインテストへの移行、コンテンツとプラットフォームの向上、公共アセスメントのリテラシーの向上、LBOTE教育へのさらなる投資などのレコメンデーションを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:36:14 GMT)
Efficient In-Domain Question Answering for Resource-Constrained Environments [0.1]
Retrieval Augmented Generation (RAG)は、事前訓練された大規模言語モデル(LLM)に外部知識を統合する方法である。近年の研究では、これらの問題に対処するために微調整を使うことが成功している。本研究では,RAFTとLoRAを組み合わせることで,微調整やストレージの要求を低減し,推論時間を短縮する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:55:21 GMT)
End-to-end guarantees for indirect data-driven control of bilinear systems with finite stochastic data [0.0]
本稿では,安定性が保証された双線形システムの間接的データ駆動制御のためのエンドツーエンドアルゴリズムを提案する。広範にわたる数値的な研究により、制御器設計と導出された識別誤差境界との相互作用を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:19:49 GMT)
Why Companies "Democratise" Artificial Intelligence: The Case of Open Source Software Donations [0.0]
企業は、AIのオープンソースソフトウェア(OSS)を非営利団体に寄付したり、AIモデルをリリースする際に、人工知能(AI)を「民主化する」と主張している。本研究は、Linux Foundationへの43のAI OSS寄付に対する商業的インセンティブを調査するために、混合メソッドのアプローチを採用する。それはAI民主化のための個人的および組織的社会的、経済的、技術的インセンティブの両方の分類に寄与している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:23:44 GMT)
What is the social benefit of hate speech detection research? A Systematic Review [0.0]
我々は、倫理的枠組みの欠如が、現在の実践とベストプラクティスの亀裂に寄与したと主張している。適切な倫理的枠組みを採用することで、NLP研究者はヘイトスピーチ研究の社会的影響の可能性を有効にすることができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:57:27 GMT)
Unused information in token probability distribution of generative LLM: improving LLM reading comprehension through calculation of expected values [0.0]
トークン確率の操作により復号法を改良できることを示す2つの実験を行った。まず,SummEvalの要約スコアリングデータセットを用いて,読解理解度を測定する。スコアのエントロピーを高めるために,ロジットを高温でスケールする。 7BMistralでは6-8%から13-28%,Mixtralでは20%-46%から37%-56%に改善した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:57:27 GMT)
Unsupervisedly Learned Representations: Should the Quest be Over? [0.0]
強化学習が動物と同じ精度の表現を学習できることを実証する。これらの観察の要旨は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:42:25 GMT)
Unsupervisedly Learned Representations: Should the Quest be Over? [0.0]
強化学習が動物と同じ精度の表現を学習できることを実証する。これらの観察の要旨は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:42:25 GMT)
Unsupervisedly Learned Representations: Should the Quest be Over? [0.0]
強化学習が動物と同じ精度の表現を学習できることを実証する。これらの観察の要旨は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:42:25 GMT)
Ultradecoherence model of the measurement process [0.0]
この研究は、量子力学における測定過程の興味深い物理を垣間見る。測定装置は、他のどの関連する時間スケールよりも高速なオープンデコヒーレンスダイナミクスを持つようにモデル化することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:42:39 GMT)
Two-dopant origin of competing stripe and pair formation in Hubbard and $t$-$J$ models [0.0]
本研究では, 密度行列再正規化群アルゴリズムを用いて, 円筒系における単対のドーパントについて検討した。秩序と一様ペアリングの相互作用は、有限ドーピングにおけるモデルの位相の中心であり、その起源は単対レベルである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:59:57 GMT)
Tuning transport in solid-state Bose-Fermi mixtures by Feshbach resonances [0.0]
狭い固体フェシュバッハ共鳴に近いボース・フェルミ混合物の輸送特性を予測した。これらの固体ボース-フェルミ混合系において, 従来の散乱機構よりも相互作用効果が支配的であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:00:01 GMT)
Trustworthy AI: Securing Sensitive Data in Large Language Models [0.0]
大規模言語モデル(LLM)は、堅牢なテキスト生成と理解を可能にすることで自然言語処理(NLP)を変革した。本稿では, 機密情報の開示を動的に制御するために, 信頼機構をLCMに組み込むための包括的枠組みを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:02:33 GMT)
Transformers, Contextualism, and Polysemy [0.0]
私は、トランスフォーマーアーキテクチャがコンテキストと意味の関係の理論を機能させる方法から抽出できると論じます。私はこれをトランスフォーマー理論と呼び、関連する2つの哲学的議論に関して新しいものであると論じます。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:34:53 GMT)
Time and its arrow from quantum geometrodynamics? [0.0]
古典的時空の出現とそれとともに、古典的時空とその矢印が普遍的な量子状態から出現することを説明する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:01:36 GMT)
The Top Manifold Connectedness of Quantum Control Landscapes [0.0]
本稿では,地形の上部多様体を形成する大域最適制御解の経路接続性について数値的に検討する。状態-状態遷移確率を含む異なる量子制御目標に対して、観測可能な期待値とユニタリ変換は、そのような連続経路を容易に見つけることができる。後者の予想の意義は、原目的の完全な最適性を維持しつつも、補助目的を最適化できるトップ多様体内の位置を求めることである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 00:58:52 GMT)
The QES sextic and Morse potentials: exact WKB condition and supersymmetry [0.0]
一次元準特殊可解(QES)性ポテンシャル $Vrm(qes)(x) を考える。 WKB補正$gamma=gamma(N,n)$は、第1の最低50状態に対して計算される。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:42:32 GMT)
The Nexus of AR/VR, Large Language Models, UI/UX, and Robotics Technologies in Enhancing Learning and Social Interaction for Children: A Systematic Review [0.0]
子どもに対する治療における言語モデル(LLM),拡張現実(AR),ユーザインターフェース/ユーザエクスペリエンス(UI/UX)設計について検討した。 150の出版物がPubMed、ACM、IEEE Xplore、Elsevier、Google Scholarで詳細な文献検索によって発見された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:19:25 GMT)
Text Image Generation for Low-Resource Languages with Dual Translation Learning [0.0]
本研究では,高リソース言語からの実際のテキスト画像のスタイルをエミュレートすることで,低リソース言語でテキスト画像を生成する手法を提案する。このモデルのトレーニングには、2つの翻訳タスクが含まれており、平易なテキストイメージを合成または実際のテキストイメージに変換する。生成したテキスト画像の精度と多様性を高めるために,2つのガイダンス手法を導入する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:23:59 GMT)
Symmetry constrained neural networks for detection and localization of damage in metal plates [0.0]
我々はニューラルネットワークをトレーニングし、薄いアルミニウム板の材料応答の時系列データを解析する。各タスクに対して、最も性能の良いモデルは、トランスデューサがほぼ均一なプレート上の正方形パターンに類似し配置されているという帰納バイアスに基づいて設計された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:05:17 GMT)
Surface Scattering Expansion for the Casimir-Polder Interaction of a Dielectric Wedge [0.0]
偏光性粒子と誘電体ウェッジとのカシミール・ポルダー相互作用は計算が難しい。この幾何学は、ゆらぎによって引き起こされる相互作用に対するエッジの効果のプロトタイプである。顕著な発見は、円滑な縁を持つくさびのCP電位が、完全な導体で作られた鋭いくさびの電位と密接に関連していることである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:25:37 GMT)
Spectroscopy, Crystal-Field, and Transition Intensity Analyses of the C$_{\rm 3v}$(O$^{2-}$) Centre in Er$^{3+}$ Doped CaF$_{2}$ Crystals [0.0]
本稿では,CaF$:Er$3+$におけるC$_rm 3v$(O$2-$)中心の詳細な吸収とレーザーサイト選択分光について述べる。この遷移は、167$Er同位体から観測可能な超微細構造を持つ1GHzの低温不均一線を有する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:31:12 GMT)
Spectroscopy and Crystal-Field Analysis of Low -Symmetry Er$^{3+}$ Centres in K$_2$YF$_5$ Microparticles [0.0]
ランタノイドイオンをドープしたK$YF$_5$結晶は、様々な光学的応用がある。電子-常磁性共鳴研究により、ランタニドイオンがC$_rm s$局所的な曖昧さでイットリウムの代わりになることが示された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:33:51 GMT)
Spatial embedding promotes a specific form of modularity with low entropy and heterogeneous spectral dynamics [0.0]
空間的に埋め込まれたリカレントニューラルネットワークは、学習よりもネットワークの構造と機能を組み合わせた組織をどのように形成するかを研究するための有望な道を提供する。我々は,これらの制約を,速度とスパイクニューラルネットワークの両面にわたって,ニューラルウェイトと固有スペクトルのエントロピー測定によって研究することが可能であることを示す。この作業は、ニューラルネットワークにおける制約付き学習の理解を深め、コーディングスキームやタスクを越えて、同時に構造的および機能的目的に対するソリューションをタンデムで達成する必要がある。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:00:05 GMT)
Sentiment Analysis of ML Projects: Bridging Emotional Intelligence and Code Quality [0.0]
本研究では、機械学習(ML)プロジェクトにおける感情分析(SA)とコード品質の関係について検討する。一般的なMLリポジトリの包括的なデータセットを統合することで、この分析はルールベース、機械学習、ハイブリッド感情分析の方法論をブレンドする。開発者の肯定的な感情は、バグの減少とコードの臭いの発生率の低下によって表される優れたコード品質と強く結びついている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:34:01 GMT)
SR-CurvANN: Advancing 3D Surface Reconstruction through Curvature-Aware Neural Networks [0.0]
SR-CurvANNは、ニューラルネットワークベースの2Dインペイントを組み込んで、3D表面を効果的に再構築する新しい手法である。 SR-CurvANNは形状完成過程において優れており、穴を目覚ましいリアリズムと精度で埋める。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:33:53 GMT)
SEA-ViT: Sea Surface Currents Forecasting Using Vision Transformer and GRU-Based Spatio-Temporal Covariance Modeling [0.0]
本稿では,Vision TransformerとGate Recurrent Unitsを統合した高度なディープラーニングモデルSEA-ViTを紹介する。 SEA-ViTは、30年以上にわたる豊富なデータセットを活用することで、複雑な依存関係を解き放つように設計されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:26:56 GMT)
Revolutionizing Payload Inspection: A Self-Supervised Journey to Precision with Few Shots [0.0]
従来のセキュリティ対策は、現代のサイバー攻撃の高度化に対して不十分である。 Deep Packet Inspection (DPI)は、ネットワークセキュリティの強化において重要な役割を担っている。先進的なディープラーニング技術とDPIの統合は、マルウェア検出に現代的な手法を導入している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:55:52 GMT)
Removal of clouds from satellite images using time compositing techniques [0.0]
時間合成の2つの異なるアプローチがテストされた。すべての構成画像上の永続的な雲は、両方の方法で保持された。クラウドを255に再コードし、'min'関数を実行するハイブリッド技術が開発された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:00:04 GMT)
Relaxation Fluctuations of Correlation Functions: Spin and Random Matrix Models [0.0]
本稿では,量子カオスの診断尺度として,ある相関関数の変動平均と分散について検討する。モデルの3つの異なる位相(エルゴード相、フラクタル相、局所化相)を同定する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:11:37 GMT)
Relativistic entanglement in muon decay [0.0]
非折り畳み相互作用の存在下での量子絡みの時間進化について論じる。特に、磁場中におけるミューオン崩壊生成物の絡み合いを再考する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:18:58 GMT)
Relating Superconducting Optoelectronic Networks to Classical Neurodynamics [0.0]
超伝導ループニューロンの現象論的モデルとして,シナプスとデンドライトを記述したジョセフソン回路方程式を解く必要がなくなる。いくつかの回路パラメータでは、単一のスパイクに対する下流の樹状反応と、偶然またはスパイクのシーケンスを表現できる。支配方程式は、漏洩積分体デンドライトと神経細胞をモデル化するための神経科学の文献において、ほぼ同一であることが示されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:23:53 GMT)
Real space thermalization of locally driven quantum magnets [0.0]
これらの進歩に触発され、空間熱化プロファイルを探索するための実験的にアクセス可能で、局所的、時間に依存したプロトコルを提案する。我々は、駆動スピンと残りのスピンとの相互作用に基づいて、強磁性(X$偏極)初期状態の異なるパラメトリックな状態を特定する。数値観測を解説した実空間図とフロケット空間図を作成し,様々な実験装置で検証可能な予測を行う。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:18:52 GMT)
QueenV2: Future of Quantum Circuit Simulation [0.0]
提案するQueenV2は,Queenの設計原則に基づいて,性能を新たなレベルに引き上げる。 QueenV2はゲート性能を最大40倍改善し、hyQuasに比べて回路性能を5倍改善した。サードパーティライブラリへの依存をなくすことで、QueenV2は量子回路シミュレーションを著しく高速化する位置にある。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:30:38 GMT)
QueenV2: Future of Quantum Circuit Simulation [0.0]
提案するQueenV2は,Queenの設計原則に基づいて,性能を新たなレベルに引き上げる。 QueenV2はゲート性能を最大40倍改善し、hyQuasに比べて回路性能を5倍改善した。サードパーティライブラリへの依存をなくすことで、QueenV2は量子回路シミュレーションを著しく高速化する位置にある。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:30:38 GMT)
Quantum many-body spin ratchets [0.0]
空間反射対称性の破れは、動的スピン感受性の漂流をもたらすことを示す。また、時間積分電流のスケールした累積生成関数は、代わりに一般化されたゆらぎ関係に従うことを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:17:45 GMT)
Quantum Kernel Methods under Scrutiny: A Benchmarking Study [0.0]
基礎となるグラム行列を計算するための2つの一般的なアプローチ: 忠実性量子カーネル(FQK)と投影量子カーネル(PQK)である。本稿では,FQKとPQKに基づくQKMを設計選択の多様体にわたって総合的に検討する。我々のゴールは、特定のタスクの最高のパフォーマンスモデルを特定するのではなく、効果的なQKMにつながるメカニズムを明らかにすることです。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:38:26 GMT)
QuForge: A Library for Qudits Simulation [0.0]
QuForgeは、量子回路を量子ビットでシミュレートするように設計されたPythonベースのライブラリである。 GPUやTPUなどの加速デバイス上での実行をサポートし、シミュレーションを著しく高速化する。スパース操作もサポートしており、他のライブラリと比較してメモリ消費が減少する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:38:35 GMT)
Pulsed magnetic field gradient on a tip for nanoscale imaging of spins [0.0]
本研究では,ナノスケールで高勾配の局所的かつ制御可能な磁場を提供するために,先端にスイッチング可能な磁場勾配を示す。我々は、勾配場をナノスケール磁気共鳴センサ、ダイヤモンド中の窒素空孔(NV)中心に組み込み、高分解能磁気共鳴画像を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:56:02 GMT)
Projective toric designs, quantum state designs, and mutually unbiased bases [0.0]
Toric $t$-designs はトーラス上の点の集合で、和はトーラス上の次数 $t$ monomials の積分を再現する。トーリックおよび射影トーリックデザインの様々な新しい構成を提供し、そのサイズに限界を証明している。また、射影トーリック設計を用いて量子状態設計のファミリを構築する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:51:06 GMT)
Privacy for Quantum Annealing. Attack on Spin Reversal Transformations in the case of cryptanalysis [0.0]
SRTを用いて得られたIsing問題から元の問題を回復する方法を示す。その結果,本手法は大規模問題においても効率的であることがわかった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:17:47 GMT)
Preserving logical and functional dependencies in synthetic tabular data [0.0]
本稿では,属性間の論理的依存関係の概念を紹介する。また、表データの属性間の論理的依存関係を定量化する尺度も提供します。現在利用可能な合成データ生成アルゴリズムは、合成データセットを生成する際に、機能的依存関係を完全に保存していないことを実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:51:07 GMT)
Predicting Muscle Thickness Deformation from Muscle Activation Patterns: A Dual-Attention Framework [0.0]
表面筋電図(sEMG)は筋の生体電気信号を筋の活性化として記録する。本稿では筋厚の変形予測にsEMG信号を利用するディープラーニング手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:21:35 GMT)
Population Dynamics of Schrödinger Cats [0.0]
我々は、$d$次元格子上で、原型的なシュラーオドニガー・キャットの個体群モデルについて検討する。古典的な個体群動態と通常の量子相転移の両方で観察されるものとは異なっている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:20:08 GMT)
Performance of a radio-frequency two-photon atomic magnetometer in different magnetic induction measurement geometries [0.0]
ここで報告された発展は、2光子過程の基本的および応用的な側面を磁気誘導測定に組み入れている。高コントラスト測定は、センサーの一次磁場に対する感度の低下により得られる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:11:07 GMT)
Participatory design: A systematic review and insights for future practice [0.0]
利害関係者の密接な関与を利用する反復的で柔軟なデザインプロセスである、参加型デザインは、デザインの分野にわたって利用されつつある。参加型デザイン(PD)に移行する実践者の増加に伴い、厳格に定義されなくなった。この体系的なレビューは、今日の実践者が過去の参加型デザインプロセスから学習を合成し、PDの今後の利用を知らせ、改善するものである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:29:34 GMT)
Next-Gen Software Engineering: AI-Assisted Big Models [0.0]
本稿では,ソフトウェア工学におけるモデルとAIの合成を容易にすることを目的とする。本稿では,AI支援ソフトウェア工学の現状について概説する。 SEにおけるAI支援ビッグデータのビジョンは、両方のアプローチに固有のアドバンテージを活用することを目的としている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:49:57 GMT)
Neural Dynamical Operator: Continuous Spatial-Temporal Model with Gradient-Based and Derivative-Free Optimization Methods [0.0]
本稿では、空間と時間の両方で連続的なニューラルダイナミクス演算子と呼ばれるデータ駆動モデリングフレームワークを提案する。神経力学演算子の鍵となる特徴は、空間的および時間的離散化の両方に関して分解能不変性である。提案手法は,ハイブリッド最適化方式により,より長期統計量の予測が可能であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:25:48 GMT)
Neural Contrast: Leveraging Generative Editing for Graphic Design Recommendations [0.0]
視覚的に魅力的なコンポジットを作成するには、互換性のためにテキストとバックグラウンドの両方を最適化する必要がある。これまでは、テキストの色を変えたり、コントラストに背景形状を追加したりといったシンプルなデザイン戦略に重点を置いてきた。拡散モデルを用いた生成手法を提案する。コントラストを高めつつ、設計資産の下の変化した領域が低い衛生性を示すことを保証し、設計資産の視認性を向上させる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:52:04 GMT)
Monitoring Human Dependence On AI Systems With Reliance Drills [0.0]
人間は、AIが生み出すアドバイスを信頼すれば、AIシステムに過信される可能性がある。本稿では,AIによるアドバイスにおいて,人間が誤りを認識できるかどうかを判定する演習を提案する。私たちは、AIによる意思決定に人間が適切に関与し続けるための重要なツールとして、頼りのドリルが用いられるかもしれないと論じています。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:54:20 GMT)
Monitoring Human Dependence On AI Systems With Reliance Drills [0.0]
人間は、AIが生み出すアドバイスを信頼すれば、AIシステムに過信される可能性がある。本稿では,AIによるアドバイスにおいて,人間が誤りを認識できるかどうかを判定する演習を提案する。私たちは、AIによる意思決定に人間が適切に関与し続けるための重要なツールとして、頼りのドリルが用いられるかもしれないと論じています。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:54:20 GMT)
Model-Free Stochastic Process Modeling and Optimization using Normalizing Flows [0.0]
本研究は, 化学プロセスの力学を学習するために, 離散時間モデルとして条件正規化フローを用いることを提案する。正規化フローは長期水平線上での安定なシミュレーションと、開ループ制御のための確率的およびMPC定式化による高品質な結果をもたらす。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:28:14 GMT)
Macroscopic QED and noise currents in time-varying media [0.0]
標準 MQED 内での epsilon(t,omega) に対する $epsilon(omega) の置換が非物理的分極電流をもたらすことが予想される。この特異な挙動は貯水池の力学を変化させることで取り除くことができることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:07:30 GMT)
Machine Learning-based vs Deep Learning-based Anomaly Detection in Multivariate Time Series for Spacecraft Attitude Sensors [0.0]
本研究の目的は、宇宙船の姿勢センサから得られる多変量時系列におけるスタンプ値検出問題に対する2つの異なるアプローチを特徴付けることである。この分析は2つのアプローチのパフォーマンスの違いを明らかにし、解釈可能性と異なるシナリオへの一般化についてコメントする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:45:36 GMT)
Machine Learning for Two-Sample Testing under Right-Censored Data: A Simulation Study [0.0]
本研究は,2サンプル検定における機械学習(ML)手法の有効性を評価することを目的とする。この研究は、計18の2サンプル検定法を右集束観察でカバーしている。直感的な観察で2サンプル問題をテストするには、提案された2サンプルメソッド(スクリプト、データセット、モデル)をGitHubとHugging Faceで使用することができる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:56:57 GMT)
MUSE: Integrating Multi-Knowledge for Knowledge Graph Completion [0.0]
知識グラフ補完(KGC)は、欠落した(リレーション)部分(ヘッドエンティティ)--(リレーション]->(テールエンティティ)三重項を予測することを目的としている。既存のKGCメソッドのほとんどは、単一の特徴(例えば、関係型)やサブグラフアグリゲーションに焦点を当てている。本稿では,知識認識型推論モデル(MUSE)を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:48:20 GMT)
Loop-Diffusion: an equivariant diffusion model for designing and scoring protein loops [0.0]
ループ拡散(Loop-Diffusion)は、関数予測タスクに一般化するエネルギー関数を学ぶエネルギーベースの拡散モデルである。我々は,TCR-pMHCインタフェースの評価におけるLoop-Diffusionの性能を評価し,結合強調突然変異の認識における最先端の結果を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:34:06 GMT)
Learning to Love Edge Cases in Formative Math Assessment: Using the AMMORE Dataset and Chain-of-Thought Prompting to Improve Grading Accuracy [0.0]
本稿では,Rori による 53,000 個の質問応答対の新たなデータセットである AMMORE を紹介する。 2つの実験により,大規模言語モデル(LLM)を用いて,難解な学生の回答を段階的に評価する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:51:40 GMT)
Laser Site-Selective Spectroscopy and Magnetic Hyperfine Splittings of Ho$^{3+}$ doped Y$_{2}$SiO$_{5}$ [0.0]
高分解能吸収測定は、選択規則に従って近似する複雑な超微細パターンを明らかにする。 3つの光学軸に沿って磁場を印加すると、0.5テスラ以下で回避された交差の存在が明らかになる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:38:01 GMT)
Joint Localization and Planning using Diffusion [0.0]
拡散モデルは、操作や車道計画といったロボティクスの問題にうまく適用されてきた。本稿では,自己中心型LIDARスキャン,任意の地図,所望の目標位置が与えられたグローバル参照フレームにおいて,衝突のない経路を生成する拡散モデルを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:07:20 GMT)
Intelligent Energy Management: Remaining Useful Life Prediction and Charging Automation System Comprised of Deep Learning and the Internet of Things [0.0]
電池の持続寿命 (Remaining Useful Life, RUL) は、電池の余寿命と充電の必要性を知るための重要なパラメータである。この研究プロジェクトの目標は、バッテリーRULデータセットのための機械学習ベースのモデルを開発することである。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:08:38 GMT)
Incomplete quantum oblivious transfer with perfect one-sided security [0.0]
我々は、送信者が受信機に2ビットの情報を送信する2つの不愉快な転送のうち1つを考える。私たちは最低限の不正確率を見つけることを目指している。非対話型量子プロトコルは非対話型古典的プロトコルよりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:35:36 GMT)
Improvements to SDXL in NovelAI Diffusion V3 [0.0]
本技術報告では,ノベルAI拡散V3の訓練過程におけるSDXLの変更について報告する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:56:01 GMT)
High fidelity macroscopic superposition states via shortcut to adiabaticity [0.0]
巨視的空間重畳状態の大規模物体を調製するために, 断熱方式のショートカットを提案する。この実装のために超伝導回路のハイブリッド電気機械構成を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 03:42:04 GMT)
Harnessing Wavelet Transformations for Generalizable Deepfake Forgery Detection [0.0]
Wavelet-CLIPは、ウェーブレット変換とViT-L/14アーキテクチャに由来する機能を統合したディープフェイク検出フレームワークで、CLIP方式で事前トレーニングされている。提案手法は,データ間一般化における平均AUC0.749,不明瞭なディープフェイクに対するロバスト性0.893を達成し,優れた性能を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:16:51 GMT)
HARMONIC: Cognitive and Control Collaboration in Human-Robotic Teams [0.0]
メタ認知,自然言語コミュニケーション,説明可能性を備えたロボットチームにおいて,ロボットの認知戦略を実証する。このシステムは、認知と制御機能を柔軟に統合するHARMONICアーキテクチャを使って実現されている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:48:21 GMT)
HARMONIC: A Framework for Explanatory Cognitive Robots [0.0]
本稿では,認知ロボットを実現するためのフレームワークであるHARMONICを紹介する。このフレームワークは、高レベルの意思決定のための戦略的(認知的)層と低レベルの制御と実行のための戦術的(ロボット)層との相互運用性をサポートする。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:42:13 GMT)
Guaranteed Global Minimum of Electronic Hamiltonian 1-Norm via Linear Programming in the Block Invariant Symmetry Shift (BLISS) Method [0.0]
ブロック不変対称性シフト(BLISS)技術は、望ましくない電子数部分空間のみにハミルトン作用を変更することで1ノルムを減少させる。本稿では,この最適化の最適化を線形プログラミング問題として導入し,最適性を保証し,計算コストを大幅に削減する。 BLISS演算子を得る線形プログラミング手法により、より効率的なハミルトニアンシミュレーションが可能となり、ハミルトニアンスペクトル範囲を小さくすることで、LCUグルーピングを改善する機会を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:39:20 GMT)
Greenberger-Horne-Zeilinger state is the best probe for multiparameter estimation of independent local fields [0.0]
局所ハミルトニアンの独立な多重体強度の推定には、真の多党交絡状態の有用性が必要であることを示す。混合状態にあるプローブを用いることで、GHZよりも精度が低いことを示す。検討した重み行列の重要性を強調するために、同一の恒等演算子を選択すると、最高の精度が得られる製品プローブが得られることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:02:12 GMT)
GPT's Judgements Under Uncertainty [0.0]
我々は、GPT-4oがどのように判断し、確率的シナリオで決定するかにおいて、損失回避のような人間の認知に固有のバイアスが現れるかどうかを検討する。 9つの認知バイアスで実験を行うことで、GPT-4oの矛盾するアプローチを実証し、類似した確率表記のプロンプトに反応する。また、同じプロンプトを同じ繰り返しながら、人間的なエラーと統計的に健全な判断の両方を示すAIとの混合性能も明らかにした。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 05:34:00 GMT)
Formal verification of higher dimensional quantum protocols [0.0]
クイディットを用いた高次元量子プロトコルを検証するために,CQPにおける振る舞い等価性理論を拡張した予備的な結果を示す。本稿では,CQPにおける振る舞い等価性理論を拡張して,高次元量子プロトコルを立証するための予備的な結果を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:53:14 GMT)
Fast multicomponent cat-state generation under resonant or strong-dressing Rydberg-Kerr interaction [0.0]
猫の状態は、気象学とフォールトトレラント量子計算の応用で最大に絡み合った状態である。実験により、Rydberg集団の雪崩脱コヒーレンス(英語版)が、Rydberg原子による猫の創出のボトルネックとなることが明らかになった。本論文は, 非線形性の複雑な順序が存在するにもかかわらず, キャット状態の出現を明らかにするために, 強いライドバーグドレッシング体制におけるキャット状態の形成を考察した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 08:09:27 GMT)
Faithfulness and the Notion of Adversarial Sensitivity in NLP Explanations [0.0]
本稿では, 信頼度評価の新しいアプローチとして, 適応感について紹介する。本手法は, 逆入力変化に対する感度を捉えることによって, 説明者の忠実さを考慮に入れている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:11:28 GMT)
Evaluation of Cluster Id Assignment Schemes with ABCDE [0.0]
クラスタID割り当てスキームは、クラスタリングの各クラスタを別個のIDでラベル付けする。セマンティックIDの安定性により、クラスタリングのユーザは、クラスタリング/時間にわたって安定したIDを持つコンセプトのクラスタを参照することができる。本稿では,ID代入方式の相対的メリットを評価することの課題について論じる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:56:56 GMT)
Estimating the Number of States via the Rodeo Algorithm for Quantum Computation [0.0]
我々は、最近開発されたロデオアルゴリズムを用いて、すべてのエネルギーレベルに関連する状態の数を決定する方法を示す。 1次元逆場イジングモデルの状態を計算し、その結果、その比熱を計算する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:25:29 GMT)
Essential implications of similarities in non-Hermitian systems [0.0]
3つの異なる一般化された類似性がすべてのユニタリ対称性と反ユニタリ対称性を包含していることが示される。一般化された類似性条件は、ユニタリ対称性あるいは反ユニタリ対称性によって定義される任意のクラスよりもより大きな系のクラスをもたらすことを証明している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:58:06 GMT)
Entanglement witnesses with local partial ordering [0.0]
本稿では,各目撃者が2つの製品観測値の差分として定式化される,絡み合いの目撃者の類型について検討する。これらの絡み合いの証人を構築するためのフレームワークを、いくつかの例とともに提供します。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:55:21 GMT)
Entanglement source and quantum memory analysis for zero added-loss multiplexing [0.0]
ZALMは、ゼロ・ロス多重化によるエンタングルメント・ディストリビューション率を劇的に向上させる手段を提案した。本稿では、ZALMのSPDC、部分BSM、アリスとボブの量子メモリのロードについて深く研究する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:11:08 GMT)
Enriched Functional Tree-Based Classifiers: A Novel Approach Leveraging Derivatives and Geometric Features [0.0]
本研究では,高次元時系列の分類手法として,関数型データ分析(FDA)と木に基づくアンサンブル技術を統合した教師付き分類手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 12:57:47 GMT)
Enhanced Unsupervised Image-to-Image Translation Using Contrastive Learning and Histogram of Oriented Gradients [0.0]
本稿では,Contrastive Unpaired Translation (CUT)モデルに基づく,教師なし画像から画像への変換手法を提案する。この新しいアプローチは、セマンティックラベルなしでも画像のセマンティック構造を確実に保存する。本手法は,GTA5データセットから都市景観データセットのリアルな都市シーンへの合成ゲーム環境の変換について検討した。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:18:24 GMT)
Engineering Hierarchical Symmetries [0.0]
本稿では,多体システムのための一般的な運転プロトコルについて述べる。これらの対称性を示す有効ハミルトニアンを明示的に構築する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 04:50:34 GMT)
Ecosystem-Agnostic Standardization of Quantum Runtime Architecture: Accelerating Utility in Quantum Computing [0.0]
本研究は量子コンピューティング最適化ミドルウェア(QCOM)のすべてのレイヤをカバーする。実量子ハードウェア(QH)上での実行を必要とする。オープンソースコミュニティが推進する広く採用されているランタイムプラットフォーム(RP)が必要だ。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:43:07 GMT)
E-scooter effects on public transport demand: a case study in Santiago, Chile [0.0]
電動スクーター(eスクーター)は公共交通機関の課題と機会を提供する。本研究では,チリ・サンティアゴの公共交通需要に対するeスクータの効果について検討した。その結果,e-scooterは公共交通機関の利用率を低下させるが,アクセスしにくい地域での利用率を高めることが示唆された。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:11:47 GMT)
Drawing the boundaries between Blockchain and Blockchain-like systems: A Comprehensive Survey on Distributed Ledger Technologies [0.0]
Bitcoinのグローバルな成功はブロックチェーンの台頭につながったが、"ブロックチェーン"と呼ばれる多くのシステムは、その中核的な原則から逸脱している。この調査は、ブロックチェーンとブロックチェーンのようなシステムの違いを明らかにするために、包括的なレビューと分類の必要性に対処する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:17:13 GMT)
Does End-to-End Autonomous Driving Really Need Perception Tasks? [0.0]
SSRは16個のナビゲーション誘導トークンのみをスパースシーン表現として利用する新しいフレームワークである。本手法では,教師付きサブタスクの必要性を排除し,ナビゲーションインテントに係わる重要な要素に計算資源を集中させることができる。 SSRは、nuScenesデータセットの最先端の計画性能を達成し、L2エラーが27.2%減少し、主要なE2EAD法であるUniADとの衝突速度が51.6%低下したことを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:30:48 GMT)
DisGeM: Distractor Generation for Multiple Choice Questions with Span Masking [0.0]
マルチチョイス質問(MCQ)のためのイントラクタ生成のための汎用フレームワークを提案する。我々のフレームワークは事前訓練された言語モデルのみに依存しており、特定のデータセットに対する追加のトレーニングを必要としない。人間の評価は、我々のアプローチがより効果的で魅力的であることを示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 20:15:46 GMT)
Demystifying dust contamination in quantum optics labs: measurements and recommendations [0.0]
研究チームは、さまざまなアプローチ、予防措置、習慣を確立して、微妙な光学設備を汚染から解放した。ここでは、量子光学研究所の日々の運用中における塵粒子濃度を定量化し、様々な測定方法の有効性を評価し、実用的な勧告を行う。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 22:37:00 GMT)
Deep Manifold Part 1: Anatomy of Neural Network Manifold [0.0]
数値多様体法の原理に基づいて,ニューラルネットワーク多様体の数学的枠組みであるDeep Manifoldを開発した。また、ニューラルネットワーク学習空間と深い多様体空間という2つの概念を定義します。負の時間を与えるトレーニングデータのトークンタイムスタンプが、逆問題においてどれほど重要か。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:19:12 GMT)
Conveyor-belt magneto-optical trapping of molecules [0.0]
レーザー冷却は、量子科学と精密測定のための超低温原子や分子を製造するために用いられる。分子は、その振動と回転する内部自由度のために、原子よりも冷却することが難しい。 1+2」構成の青色のMOTは、分子雲をさらに強く圧縮する結果となった。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:36:50 GMT)
Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B [0.0]
Llama駆動のコード生成は、自然言語プロンプトを複数のプログラミング言語で実行可能なコードに変換することができる。 Llamaは、あらゆるスキルレベルの開発者にとって汎用的なツールとして機能し、ソフトウェア開発の生産性と効率を改善します。教育、産業、そしてコーディングプラクティスの将来への潜在的影響についても論じる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:29:20 GMT)
Cluster state as a non-invertible symmetry protected topological phase [0.0]
標準的な 1+1d $mathbbZ tensortimes mathbbZ$ cluster model が非可逆大域対称性を持つことを示す。これらの非可逆SPT相間の界面におけるエッジモードと局所射影代数を同定する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 02:56:16 GMT)
Characterizing stable regions in the residual stream of LLMs [0.0]
モデル出力が小さいアクティベーション変化に敏感なままであるトランスフォーマーの残ストリーム内の「安定領域」を同定する。これらの領域はトレーニング中に現れ、トレーニングの進行やモデルサイズの増加に伴ってより定義される。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:30:51 GMT)
Characterization of Nuclear Magnetism at Ultralow and Zero Field using SQUIDs [0.0]
磁気共鳴イメージング(MRI)における医学などの領域の核磁気学我々は[1-$13$C]ピルビン酸を過分極化する過分極反応器を設計し、シールド内での可逆交換による信号増幅によりヘテロ核へのアライメント移動を可能にする(SABRE-SHEATH)。シミュレーションの結果から, 過分極設定が13ドルC分極0.4%となり, 地上での予測熱平衡信号(50ドルmu$T)に対して10万000の信号強調が得られた。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 11:04:59 GMT)
Bridging the Protection Gap: Innovative Approaches to Shield Older Adults from AI-Enhanced Scams [0.0]
多くの兆候は、詐欺師が既に成功した詐欺を強化するためにAIを使用していることを示唆している。本稿では、現在の脆弱性を特定し、最新の防衛対策を推奨することで、高齢者に影響を及ぼす詐欺におけるAIの将来について検討する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 19:46:50 GMT)
Automated Detection and Analysis of Power Words in Persuasive Text Using Natural Language Processing [0.0]
本研究では,文中のパワーワードの自動検出と解析手法を提案する。与えられたテキスト中のパワーワードの存在と頻度を識別することにより、感情や読者エンゲージメントに対するパワーワードの影響を分類し分析することを目指している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:38:56 GMT)
Augmented neural forms with parametric boundary-matching operators for solving ordinary differential equations [0.0]
本稿では,最適化可能な境界マッチングを持つ適切なニューラルフォームを体系的に構築するフォーマリズムを提案する。ニューマン条件やロビン条件の問題をパラメトリックディリクレ条件の等価問題に変換する新しい手法を記述する。提案手法は,一階および二階の常微分方程式と一階のシステムを含む多種多様な問題に対して実験を行った。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:34:40 GMT)
Atomic-scale on-demand photon polarization manipulation with high-efficiency for integrated photonic chips [0.0]
単一量子エミッタを光導波路に統合することにより、単一光子の任意の偏光操作を実現する手法を提案する。提案した分極変換器は,任意の入力分極の任意の分極変換,調整可能な作業周波数,高変換効率の優れた消散性能,原子規模など,いくつかの利点がある。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 15:21:04 GMT)
Asymmetric Bidirectional Quantum Teleportation: Arbitrary bi-modal Information State [0.0]
本稿では,送信側から受信側へ4成分のバイモーダル絡み合ったコヒーレント状態の任意の重ね合わせを送信する戦略を提案する。ほぼ忠実な部分非対称な双方向量子テレポーテーションとそれに伴う成功の確率を解析する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 16:59:58 GMT)
An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors [0.0]
Support Vector Machine (SVM) は、科学や工学で広く使われている最先端の分類手法である。そこで本稿では,SVMにおけるハイパーパラメータの範囲を定量化して最適選択を識別する,自動チューニングに基づく最適化フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:50:11 GMT)
All-to-all reconfigurability with sparse and higher-order Ising machines [0.0]
オール・ツー・オールのネットワーク機能をエミュレートする多重アーキテクチャを導入する。適応並列テンパリングアルゴリズムの実行は、競合するアルゴリズムと事前ファクターの利点を示す。 pビットIMのスケールされた磁気バージョンは、汎用最適化のための最先端技術よりも桁違いに改善される可能性がある。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:27:01 GMT)
A single space-time is too small for all of Wigner's friends [0.0]
量子論の解釈に関する最近のNo-go定理は、予期せぬほど強い相関関係を持つことが示されている。 AOEを拒絶することはできず、同時に、観測されたイベント'はすべての観測者が共通する単一の背景空間時間内に埋め込むことができると仮定する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:53:32 GMT)
A novel application of Shapley values for large multidimensional time-series data: Applying explainable AI to a DNA profile classification neural network [0.0]
本研究は,シェープリー値にスーパーピクセルの考え方を適応させる,時系列ライクなデータに対する効率的な解法を提案する。法医学的なDNA分類の例により、この方法は、畳み込みニューラルネットワーク(CNN)によって分類された時系列のようなデータに適用される。本研究は,この大規模タスクに対するShapley値の現実的で正確かつ高速な計算を実証する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 07:34:17 GMT)
A method for identifying causality in the response of nonlinear dynamical systems [0.0]
データ駆動モデルを構築するには、システムの入力と出力を実験的に測定する必要がある。モデル内の不正確さがエラーやノイズのモデル化に起因するかどうかを判断することは困難である。本稿では,入力出力データの因果成分を,出力雑音の存在下でのシステム計測から同定する手法を提案する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 14:19:07 GMT)
A Scalable Data-Driven Framework for Systematic Analysis of SEC 10-K Filings Using Large Language Models [0.0]
SEC10-Kの申請に基づいて企業の業績を分析し,評価する,新たなデータ駆動型アプローチを提案する。提案手法は、データパイプラインを実行して視覚化を作成するためのノーコードソリューションとして、対話型GUI上に実装される。このアプリケーションは評価結果を示し、企業業績の年次比較を提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 06:57:22 GMT)
A Novel Spinor-Based Embedding Model for Transformers [0.0]
幾何代数学からのスピノルを利用したトランスフォーマーモデルにおける単語埋め込みの新しい手法を提案する。スピノルは高次元空間における複雑な関係や変換を捉えることができるリッチな数学的枠組みを提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 01:18:45 GMT)
A Generalized LLM-Augmented BIM Framework: Application to a Speech-to-BIM system [0.0]
提案するフレームワークは6つのステップで構成されている。本稿では,BIM アプリケーション NADIA-S の実装により,提案手法の適用性を示す。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 23:46:15 GMT)
A Gaussian Process Framework for Solving Forward and Inverse Problems Involving Nonlinear Partial Differential Equations [0.0]
非線形PDEシステムを解くためにカーネル法とディープNNの長所を統合するためにカーネル重み付き補正残差(CoRes)を導入する。 CoResは幅広いベンチマーク問題の解決において競合する手法を一貫して上回っている。我々はPDEの解決にカーネル手法を活用することに新たな関心を喚起する可能性があると考えている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 18:12:09 GMT)
A Distributed Privacy Preserving Model for the Detection of Alzheimer's Disease [0.0]
本稿では,分散データからトレーニングできるHIPAA準拠のフレームワークを提案する。次に,アルツハイマー病(AD)検出のための多モード垂直フェデレーションモデルを提案する。ここで提案されたVFLアーキテクチャは、多様な医療データソースをまたいだ協調学習を可能にする、新しい分散アーキテクチャを提供する。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 21:24:00 GMT)
A Concept-Value Network as a Brain Model [0.0]
本稿では,脳様モデルの物理的実体と概念的実体の関係を記述するための統計的枠組みを提案する。この論文は、化学接続も可能であるが、電気配線が特徴である可能性を示唆している。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 10:53:16 GMT)
A Comprehensive Review of TLSNotary Protocol [0.0]
本稿では,TLSセッションからデータに対する証明をクライアントが得ることを目的としたTLSNotaryプロトコルについて検討する。このような証明をサーバ側の調整や許可なしに実現するには、セキュアなマルチパーティ計算(MPC)と知識証明のゼロが用いられる。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 09:28:51 GMT)
2D and 3D Deep Learning Models for MRI-based Parkinson's Disease Classification: A Comparative Analysis of Convolutional Kolmogorov-Arnold Networks, Convolutional Neural Networks, and Graph Convolutional Networks [0.0]
本研究はパーキンソン病の診断にConvolutional Kolmogorov-Arnold Networks(ConvKANs)を適用した。 ConvKANは、構造MRIを用いたPD分類のために、学習可能なアクティベーション機能を畳み込み層に統合する。医用画像用ConvKANの最初の3D実装について紹介し、その性能を畳み込みニューラルネットワーク(CNN)とグラフ畳み込みニューラルネットワーク(GCN)と比較した。これらの知見は, PD検出に対するConvKANsの可能性を強調し, 脳の微妙な変化を捉える上での3D解析の重要性を強調し, データセット間の一般化の課題を浮き彫りにしている。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 13:37:04 GMT)
(SPT-)LSM theorems from projective non-invertible symmetries [0.0]
射影対称性は量子格子モデルにおいてユビキタスであり、位相図や絡み合い構造を制約するために利用することができる。本稿では,非可逆対称性と格子変換によって形成される射影代数の結果について検討する。射影性はまた、$mathsfRep(G)times Z(G)$ sub-symmetriesの後に双対対称性に影響を与える。
論文参考訳（メタデータ） (Thu, 26 Sep 2024 17:54:21 GMT)