Fugu-MT: arxivの論文翻訳(概要)

BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.3]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。 BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。 6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:55:16 GMT)
Control Large Language Models via Divide and Conquer [94.5]
本稿では,Lexically Constrained Generation(LCG)に着目し,大規模言語モデル(LLM)のプロンプトベース制御による制御可能生成について検討する。我々は,レキシカル制約を満たすためのLLMの性能を,プロンプトベース制御により評価し,下流アプリケーションでの有効性を検証した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:20:06 GMT)
DiffusionFake: Enhancing Generalization in Deepfake Detection via Guided Stable Diffusion [94.5]
ディープフェイク技術は、顔交換を極めて現実的にし、偽造された顔コンテンツの使用に対する懸念を高めている。既存の方法は、顔操作の多様な性質のため、目に見えない領域に一般化するのに苦労することが多い。顔偽造者の生成過程を逆転させて検出モデルの一般化を促進する新しいフレームワークであるDiffusionFakeを紹介する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 06:22:43 GMT)
Efficient Prompting for LLM-based Generative Internet of Things [88.8]
大規模言語モデル(LLM)は、様々なタスクにおいて顕著な能力を示しており、最近、IoT(Internet of Things)アプリケーションにLLMの能力を統合することが研究の注目を集めている。セキュリティ上の懸念から、多くの機関は最先端の商用LLMサービスへのアクセスを避け、ローカルネットワーク環境でのオープンソースLLMのデプロイと利用を必要としている。本研究では,LLMを用いた生成IoT(Generative IoT)システムを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:19:20 GMT)
Knowledge Mechanisms in Large Language Models: A Survey and Perspective [88.5]
本稿では,知識利用と進化を含む新しい分類法から知識メカニズムの解析をレビューする。 LLMが学んだ知識、パラメトリック知識の脆弱性の理由、そして解決が難しい潜在的な暗黒知識(仮説)について論じる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:42:55 GMT)
Generate-on-Graph: Treat LLM as both Agent and KG in Incomplete Knowledge Graph Question Answering [87.7]
我々は、知識グラフ(KG)を探索しながら、新しい実写トリプルを生成する、Generate-on-Graph(GoG)と呼ばれる学習自由な手法を提案する。 GoGはIKGQAでLLMをエージェントとKGの両方として扱うThinking-Searching-Generatingフレームワークを通じて推論を行う。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 10:55:23 GMT)
HDR-GS: Efficient High Dynamic Range Novel View Synthesis at 1000x Speed via Gaussian Splatting [76.6]
既存のHDR NVS法は主にNeRFに基づいている。既存のHDR NVS法は主にNeRFに基づいており、長いトレーニング時間と遅い推論速度に悩まされている。我々は,新しいHDRビューを効率よくレンダリングできる新しいフレームワークであるHigh Dynamic Range Gaussian Splatting (-GS)を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 16:45:08 GMT)
TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization With Estimated Weights [73.9]
本稿では,TIS-DPO と呼ばれるトークン単位の重要度サンプリング DPO の目的について,その報酬に基づいて各トークンに重要度を割り当てる手法を提案する。 TIS-DPOは、無害性、有用性アライメントおよび要約タスクにおいて、様々なベースライン手法を著しく上回っている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 04:03:00 GMT)
Relaxation of first-class constraints and the quantization of gauge theories: from "matter without matter" to the reappearance of time in quantum gravity [72.3]
標準ゲージ理論における初期値問題へのアプローチに関する概念的概要を述べる。第一級位相空間の制約が、新しい自由度値の修正と解釈すれば緩和される可能性があることを強調する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 15:31:56 GMT)
Superposed Decoding: Multiple Generations from a Single Autoregressive Inference Pass [72.1]
Superposed Decodingは、1つの自己回帰推論パスのコストで$k$のドラフトを生成する新しい復号アルゴリズムである。 Superposed Decodingは、他のデコード戦略と組み合わせることで、推論時間計算のスケーリング時に普遍的なカバレッジが向上する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 22:13:16 GMT)
Lens: Rethinking Multilingual Enhancement for Large Language Models [70.9]
Lensは、大規模言語モデル(LLM)の多言語機能を強化する新しいアプローチである LLMの上位層から言語に依存しない、言語固有のサブ空間内の隠された表現を操作できる。既存のポストトレーニング手法に比べて計算資源がはるかに少ないため、優れた結果が得られる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:51:30 GMT)
Investigating Critical Period Effects in Language Acquisition through Neural Language Models [70.6]
第二言語 (L2) の習得は幼少期以降難しくなる。この期間以降、第1言語(L1)への露出を緩和することは、通常、L1の習熟度を著しく低下させることはない。これらのCP効果が自然に決定された脳の成熟によるものなのか、または経験によって自然に誘発される神経接続の安定化であるのかは不明である。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:23:15 GMT)
Empowering Backbone Models for Visual Text Generation with Input Granularity Control and Glyph-Aware Training [68.4]
拡散に基づくテキスト・ツー・イメージモデルでは、多様性と美学の素晴らしい成果が示されているが、視覚的なテキストで画像を生成するのに苦労している。既存のバックボーンモデルには、ミススペル、テキスト生成の失敗、中国語テキストのサポートの欠如といった制限がある。本稿では,英語と中国語の視覚テキスト生成にバックボーンモデルを活用するための一連の手法を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:25:39 GMT)
Motion-Agent: A Conversational Framework for Human Motion Generation with LLMs [67.6]
Motion-Agentは、一般的な人間の動きの生成、編集、理解のために設計された会話フレームワークである。 Motion-Agentはオープンソースの事前学習言語モデルを使用して、モーションとテキストのギャップを埋める生成エージェントであるMotionLLMを開発した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:46:47 GMT)
Taylor Unswift: Secured Weight Release for Large Language Models via Taylor Expansion [67.1]
TaylorMLPを導入して、リリース済みの大規模言語モデル(LLM)のオーナシップを保護する。オリジナルのウェイトをリリースするのではなく、開発者はTaylor-Seriesパラメータをユーザにリリースすることができる。テイラー系列の項を増やすことにより、保護されたLLMに対して低速トークン生成を誘導することができる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:13:49 GMT)
Unlocking the Potential of Model Merging for Low-Resource Languages [66.8]
大規模言語モデルを新しい言語に適応させるには、通常、継続事前訓練(CT)と、教師付き微調整(SFT)が含まれる。我々は低リソース言語の代替としてモデルマージを提案し、異なる機能を持つモデルを追加トレーニングなしで単一のモデルに組み合わせる。 Llama-2-7Bをベースとした実験により、モデルマージはタスク解決能力の低い低リソース言語に対して、極めて少ないデータを持つシナリオにおいて、CT-then-SFTよりも優れていることが実証された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:54:02 GMT)
Editing Conceptual Knowledge for Large Language Models [65.4]
本稿では,Large Language Models(LLMs)における概念知識の編集の先駆者となる。本研究では,新しいベンチマークデータセットConceptEditを構築し,評価のための新しいメトリクスセットを確立する。実験の結果,既存の編集手法は概念レベルの定義をある程度効率的に修正できるが,関連する瞬間的知識を歪ませる可能性も示された。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 15:45:21 GMT)
DDTSE: Discriminative Diffusion Model for Target Speech Extraction [62.4]
ターゲット音声抽出(DDTSE)のための識別拡散モデルを提案する。拡散モデルと同じ前方プロセスを適用し, 判別法と同様の復元損失を利用する。モデルトレーニング中に推論過程をエミュレートするための2段階のトレーニング戦略を考案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 11:12:59 GMT)
Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.7]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。 MIMIC-IIIでは最大10.8～15.0%、MIMIC-IVでは12.6～12.7%である。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 18:46:28 GMT)
DeepLTL: Learning to Efficiently Satisfy Complex LTL Specifications [59.0]
リニア時間論理(LTL)は、強化学習(RL)における複雑で時間的に拡張されたタスクを特定する強力なフォーマリズムとして最近採用されている。既存のアプローチはいくつかの欠点に悩まされており、それらは有限水平フラグメントにのみ適用でき、最適以下の解に制限され、安全制約を適切に扱えない。本研究では,これらの問題に対処するための新しい学習手法を提案する。提案手法は, 自動仕様のセマンティクスを明示的に表現したB"uchiaの構造を利用して, 所望の式を満たすための真理代入の順序を条件としたポリシーを学習する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:30:38 GMT)
Switch EMA: A Free Lunch for Better Flatness and Sharpness [58.6]
この研究は、一行の修正、すなわち、スイッチ(SEMA)と呼ばれる各エポック後のパラメータを元のモデルに切り替えることによって、EMAの完全なポテンシャルを明らかにする。理論的および経験的両面から、SEMAはDNNが平坦性と鋭さのトレードオフを良くする一般化最適点に到達するのに役立つことを実証する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 17:44:46 GMT)
Detection and Measurement of Syntactic Templates in Generated Text [58.1]
モデルにおける一般的な反復を特徴付けるための構文的特徴の解析を行う。モデルでは、下流のタスクにおいて、人間の参照テキストよりも高いレートでテンプレートテキストを生成する傾向にある。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 10:05:06 GMT)
UniMuMo: Unified Text, Music and Motion Generation [57.7]
任意のテキスト,音楽,動作データを入力条件として取り込んで,3つのモードすべてにまたがる出力を生成する,統一型マルチモーダルモデルUniMuMoを導入する。音楽、動き、テキストをトークンベースの表現に変換することで、我々のモデルはエンコーダ・デコーダ・トランスフォーマアーキテクチャを通じてこれらのモダリティをブリッジする。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:04:05 GMT)
On Characterizing and Mitigating Imbalances in Multi-Instance Partial Label Learning [57.2]
我々は、MI-PLLの文脈において、これまで研究されていない問題に対処するためのコントリビューションを行っている。最小限の仮定をしながら、クラス固有のMI-PLLのリスク境界を導出する。我々の理論は、$sigma$が学習の不均衡に大きな影響を及ぼすというユニークな現象を明らかにしている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:57:22 GMT)
Head-wise Shareable Attention for Large Language Models [56.9]
大きな言語モデル(LLM)は膨大な数のパラメータに悩まされており、エッジデバイスへのデプロイメントを制限している。ウェイトシェアリングは、ウェイト再利用を促進する有望なソリューションのひとつで、メモリ使用量を効果的に削減し、パフォーマンスを低下させる。本稿では,大規模言語モデルにおける頭部的共通性に着目した視点を示す。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 03:30:58 GMT)
Data Distribution Valuation [56.7]
既存のデータバリュエーションメソッドは、離散データセットの値を定義します。多くのユースケースでは、ユーザはデータセットの値だけでなく、データセットがサンプリングされた分布の値にも興味を持っています。本稿では,理論的原理と実行可能なポリシを実現するための,MMDに基づく評価手法を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 07:56:53 GMT)
LoGra-Med: Long Context Multi-Graph Alignment for Medical Vision-Language Model [55.8]
最新の医療用マルチモーダル大規模言語モデル(med-MLLM)は、事前訓練において命令追従データを活用する。 LoGra-Medは新しいマルチグラフアライメントアルゴリズムで、画像のモダリティ、会話ベースの記述、拡張キャプション間でのトリプルト相関を強制する。以上の結果から,LoGra-Medは医療用VQAの600K画像テキスト対に対してLAVA-Medと一致し,その10%でトレーニングした場合に有意に優れていた。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 23:57:24 GMT)
LoGra-Med: Long Context Multi-Graph Alignment for Medical Vision-Language Model [55.8]
最新の医療用マルチモーダル大規模言語モデル(med-MLLM)は、事前訓練において命令追従データを活用する。 LoGra-Medは新しいマルチグラフアライメントアルゴリズムで、画像のモダリティ、会話ベースの記述、拡張キャプション間でのトリプルト相関を強制する。以上の結果から,LoGra-Medは医療用VQAの600K画像テキスト対に対してLAVA-Medと一致し,その10%でトレーニングした場合に有意に優れていた。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 23:57:24 GMT)
FARM: Functional Group-Aware Representations for Small Molecules [55.3]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された新しい基礎モデルである。 MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:48:47 GMT)
FARM: Functional Group-Aware Representations for Small Molecules [55.3]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。 MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:48:47 GMT)
Dynamic Post-Hoc Neural Ensemblers [55.2]
本研究では,ニューラルネットワークをアンサンブル手法として活用することを検討する。低多様性のアンサンブルを学習するリスクを動機として,ベースモデル予測をランダムにドロップすることでモデルの正規化を提案する。このアプローチはアンサンブル内の多様性を低くし、オーバーフィッティングを減らし、一般化能力を向上させる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:25:39 GMT)
DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor [54.9]
本稿では, 劣化条件の異なる画像深部特徴の変化を定量化するDDRについて述べる。画像記述子としてのDDRの汎用性は,キー画像属性と強い相関関係がみられた。 DDRは、画像復元作業において効果的な教師なし学習目標として機能し、画像の劣化と単一画像の超解像において顕著な進歩をもたらす。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:34:01 GMT)
Polymath: A Challenging Multi-modal Mathematical Reasoning Benchmark [53.6]
PolyMATHはMLLMの認知的推論能力を評価するためのベンチマークである。 PolyMATHで最高のスコアは41%、36%、27%で、それぞれClaude-3.5 Sonnet、GPT-4o、Gemini-1.5 Proが獲得した。さらにきめ細かい誤差解析により、これらのモデルは空間関係を理解し、引き出された高レベルの推論を行うのに苦労していることが明らかとなった。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 20:35:41 GMT)
OpenMixup: Open Mixup Toolbox and Benchmark for Visual Representation Learning [53.6]
視覚表現学習のための最初のミックスアップ拡張とベンチマークであるOpenMixupを紹介する。私たちは、スクラッチから18の代表的なミックスアップベースラインをトレーニングし、11の画像データセットでそれらを厳格に評価します。また、人気のあるビジョンバックボーン、最適化戦略、分析ツールキットのコレクションを含むモジュラーバックボーンをオープンソースにしています。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 14:25:21 GMT)
On the Necessity of Collaboration for Online Model Selection with Decentralized Data [53.2]
我々は,100万ドル以上の分散データを用いたオンラインモデル選択について検討し,クライアント間のコラボレーションの必要性について検討する。 i) クライアント上の計算コストが$o(K)$に制限された場合, (ii) クライアント上での計算制約がない場合, (i) 協調は不要であり, (ii) クライアント上での計算コストは$o(K)$に制限される。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 06:21:35 GMT)
GAMformer: In-Context Learning for Generalized Additive Models [53.1]
本稿では,1つの前方パスにおけるGAMの形状関数を推定するために,文脈内学習を利用した最初の手法であるGAMformerを紹介する。実験の結果,GAMformerは様々な分類ベンチマークにおいて,他の主要なGAMと同等に動作することがわかった。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:28:20 GMT)
Text-to-Image Rectified Flow as Plug-and-Play Priors [52.6]
整流流は、ソースからターゲット分布への線形進行を強制する新しい生成モデルのクラスである。補正フローアプローチが生成品質と効率を上回り,推論ステップを少なくすることを示した。また,画像のインバージョンや編集における競合性能も示す。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:39:53 GMT)
MindFormer: Semantic Alignment of Multi-Subject fMRI for Brain Decoding [50.6]
本稿では,MindFormer を用いたマルチオブジェクト fMRI 信号のセマンティックアライメント手法を提案する。このモデルは、fMRIから画像生成のための安定拡散モデルや、fMRIからテキスト生成のための大規模言語モデル(LLM)の条件付けに使用できるfMRI条件付き特徴ベクトルを生成するように設計されている。実験の結果,MindFormerは意味的に一貫した画像とテキストを異なる主題にわたって生成することがわかった。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:27:37 GMT)
Algorithmic Capabilities of Random Transformers [49.7]
埋め込み層のみを最適化したランダムトランスフォーマーによって、どのような関数が学習できるかを検討する。これらのランダムなトランスフォーマーは、幅広い意味のあるアルゴリズムタスクを実行することができる。以上の結果から,これらのモデルが訓練される前にも,アルゴリズム能力がトランスフォーマに存在することが示唆された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 06:04:23 GMT)
Advancing Graph Generation through Beta Diffusion [49.5]
Graph Beta Diffusion (GBD)は、グラフデータの多様な性質を扱うために特別に設計された生成モデルである。本稿では, 臨界グラフトポロジを安定化させることにより, 生成グラフの現実性を高める変調手法を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 02:43:33 GMT)
Combined CNN and ViT features off-the-shelf: Another astounding baseline for recognition [49.1]
本稿では,ImageNet Large Scale Visual Recognition Challengeのために開発された事前学習型アーキテクチャを,近視認識に適用する。 CNNとViTの中間層の特徴は、近視画像に基づいて個人を認識するのに適した方法である。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:23:29 GMT)
RevMUX: Data Multiplexing with Reversible Adapters for Efficient LLM Batch Inference [48.3]
大規模言語モデル(LLM)は、自然言語処理(NLP)コミュニティに大きなブレークスルーをもたらした。データ多重化は、複数の入力を1つの複合入力にマージすることでこの問題に対処する。 RevMUXはパラメータ効率のよいデータ多重化フレームワークで、多重化に可逆設計を組み込んでいる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:24:55 GMT)
Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering [47.9]
そこで本研究では,地上ロボット軌道データセットのための新しいビューレンダリングアルゴリズムであるMode-GSを提案する。提案手法は,既存の3次元ガウススプラッティングアルゴリズムの限界を克服する目的で,アンカー付きガウススプラッターを用いている。提案手法は,PSNR,SSIM,LPIPSの計測値に基づいて,自由軌道パターンを持つ地上環境におけるレンダリング性能を向上する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 23:01:57 GMT)
Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF [47.2]
大規模言語モデル(LLM)におけるマルチターンRLHFに対応するために,Regressing the RELative Future(REFUEL)を導入する。 REFUELは、反復的に収集されたデータセット上の回帰タスクのシーケンスとして、マルチターンRLHF問題をフレーム化している。我々はLlama-3.1-70B-itを用いて,モデルとの対話においてユーザをシミュレートするアルゴリズムを評価する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:20:22 GMT)
MAGR: Manifold-Aligned Graph Regularization for Continual Action Quality Assessment [47.0]
アクション品質アセスメント(AQA)は多様なスキルを評価するが、モデルは静止しないデータに苦しむ。スパースな新しいデータを用いてモデルを洗練するための連続AQA(Continual AQA)を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:30:17 GMT)
Tensor-Train Point Cloud Compression and Efficient Approximate Nearest-Neighbor Search [45.8]
本稿では, 点雲を効率的に表現するために, テンソルトレイン(TT)低ランクテンソル分解を用いた新しい手法を提案する。 Sliced Wassersteinのような密度推定損失を利用してTT分解を訓練する確率論的解釈を提案する。 TT点雲の内部に固有の階層構造を明らかにし, 近接探索を効率的に行えるようにした。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:25:41 GMT)
Mixture-of-Skills: Learning to Optimize Data Usage for Fine-Tuning Large Language Models [45.5]
大規模言語モデル(LLM)は、様々な起源から派生した多種多様なデータセットに基づいて微調整されるのが一般的である。 MoSは、微調整プロセス中に自動的にデータ使用量を最適化することを学ぶ。 MoSpecは、特定の目的のために様々なデータセットのユーティリティを利用する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 14:44:22 GMT)
LRHP: Learning Representations for Human Preferences via Preference Pairs [45.1]
本研究では、よりリッチで構造化された人間の嗜好表現を構築することを目的とした嗜好表現学習タスクを提案する。選好データ選択と選好マージン予測という2つの下流タスクにおける選好表現の有用性を検証する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:48:28 GMT)
Bisimulation metric for Model Predictive Control [44.3]
Bisimulation Metric for Model Predictive Control (BS-MPC) は、目的関数にbisimulation metric lossを組み込んでエンコーダを直接最適化する新しい手法である。 BS-MPCは、トレーニング時間を削減することにより、トレーニング安定性、入力ノイズに対する堅牢性、および計算効率を向上させる。我々は,DeepMind Control Suiteから連続制御および画像ベースタスクのBS-MPCを評価する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:12:10 GMT)
Alignment Between the Decision-Making Logic of LLMs and Human Cognition: A Case Study on Legal LLMs [43.7]
本稿では,大規模言語モデルの意思決定ロジックと人間の認知との整合性を評価する手法を提案する。我々は、LLMによって符号化された相互作用を原始的な決定論理として定量化する。実験により、言語生成結果が正しいように見える場合でも、内部推論ロジックのかなりの部分が顕著な問題を含んでいることが示された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:33:39 GMT)
Gradient Routing: Masking Gradients to Localize Computation in Neural Networks [43.1]
ニューラルネットワークの特定の部分領域に機能を分離する訓練手法である勾配ルーティングを導入する。解析可能な方法で分割された表現を学習するために、勾配ルーティングが利用できることを示す。私たちは、高品質なデータが不足している、挑戦的な現実世界のアプリケーションに対して、このアプローチが約束されていると結論付けます。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:43:49 GMT)
Leveraging Hierarchical Taxonomies in Prompt-based Continual Learning [42.0]
深層学習モデルの学習において,情報の整理・接続という人間の習慣を適用することが効果的な戦略として有効であることがわかった。本稿では,モデルがより挑戦的な知識領域に集中するように促す新たな正規化損失関数を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:30:40 GMT)
Enhancing adversarial robustness in Natural Language Inference using explanations [41.5]
自然言語推論(NLI)の未探索課題に注目点を当てた。我々は、広範囲な実験を通じて、モデルに依存しない防衛戦略として、自然言語説明の使用を検証した。本研究では,広範に使用されている言語生成指標と人間の知覚との相関について検討し,それらが堅牢なNLIモデルへのプロキシとして機能するようにした。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:58:46 GMT)
Length Extrapolation of Transformers: A Survey from the Perspective of Positional Encoding [40.3]
大型言語モデル(LLM)を含むトランスフォーマーベースのモデルは全て、プリセットされた長さ制限に悩まされる。トランスフォーマーの長さ外挿を強化するために多くの方法が出現している。本調査は,読者が既存の手法を深く理解し,今後の研究に刺激を与えることを目的としている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 08:37:05 GMT)
Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs [40.2]
言語モデルプログラムの即時最適化について検討する。この問題を各モジュールのフリーフォーム命令と数発のデモの最適化に分解する。我々は,LMプログラムを最適化する新しいアルゴリズムであるMIPROを開発した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 17:34:26 GMT)
AWT: Transferring Vision-Language Models via Augmentation, Weighting, and Transportation [40.2]
我々は新しい適応フレームワークAWT(Augment, Weight, then Transport)を紹介する。 AWTは3つの重要なコンポーネントで構成されている。 AWTは様々な視覚言語モデルにシームレスに統合できる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 04:02:38 GMT)
SignCLIP: Connecting Text and Sign Language by Contrastive Learning [39.7]
SignCLIPは、大規模な多言語ビデオテキストペアから手話処理に有用な視覚表現を学習する効率的な方法である。 SpreadthesignでSignCLIPを事前訓練し,最大44の手話で5万本のビデオクリップを収録した手話辞書を作成した。我々は、音声言語テキストと手話ポーズによって形成される潜伏空間を分析し、さらなる言語学的洞察を提供する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:41:37 GMT)
Generative Flows on Synthetic Pathway for Drug Design [39.7]
分子構築ブロックと化学反応テンプレートを用いて分子を逐次組み立てるRxnFlowを提案する。 RxnFlowは、平均8.85kcal/molのVinaスコアと34.8%の合成性を備えたCrossDocked 2020のポケットコンディション生成における最先端のパフォーマンスを達成している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:34:01 GMT)
Rethinking the Role of Proxy Rewards in Language Model Alignment [39.5]
逆報酬工学による大規模言語モデルのアライメントにおける代行報酬の役割について検討する。我々は,金の報酬信号とプロキシのモノトニックな関係を達成し,金の報酬信号を再現することを目指している。以上の結果から,金の報酬をうまくエミュレートするには,十分な長さの質問に対する応答を生成する必要があることが示唆された。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:21:32 GMT)
CopyLens: Dynamically Flagging Copyrighted Sub-Dataset Contributions to LLM Outputs [39.4]
CopyLensは,著作権付きデータセットが大規模言語モデルの応答に与える影響を分析するフレームワークである。実験の結果、CopyLensは提案したベースラインよりも効率と精度を15.2%向上し、エンジニアリング手法より58.7%、OOD検出ベースラインより0.21AUC向上した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:41:39 GMT)
To Forget or Not? Towards Practical Knowledge Unlearning for Large Language Models [39.4]
大規模な言語モデル(LLM)は、個人プライバシー情報や著作権資料などの機密データを必然的に保持する。知識未学習の最近の進歩は、特定の知識を消去するためにLLMパラメータを更新する。未学習プロセスが必然的に本質的な知識を消去するかどうかを評価するために KnowUnDo を導入する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 15:49:20 GMT)
KISS-Matcher: Fast and Robust Point Cloud Registration Revisited [38.8]
我々はtextitKISS-Matcher という,ポイントクラウド登録のためのオープンソースライブラリを開発した。 KISS-Matcherは、古典的なファストポイント特徴ヒストグラム(FPFH)を改善する新しい特徴検出器、textitFaster-PFHを組み合わせた。さらに、$k$コアベースのグラフ理論プルーニングを採用して、外れ値対応を拒否する際の時間的複雑さを低減している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:08:01 GMT)
Making Reasoning Matter: Measuring and Improving Faithfulness of Chain-of-Thought Reasoning [38.6]
大きな言語モデル(LLM)は、質問に答える前にステップバイステップの推論を求めると、よりよいパフォーマンスを示すことが示されている。モデルの最終回答がどの程度、説明された推論ステップに忠実であるかは定かではない。 FRODOは、小さなLMを調整して正しい推論ステップを生成し、これらのステップに対して堅牢な推論を行うためのフレームワークである。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 17:54:06 GMT)
Diff-PIC: Revolutionizing Particle-In-Cell Nuclear Fusion Simulation with Diffusion Models [38.5]
核融合は究極的な解決策と見なされ、ほぼ1世紀にわたって集中的な研究の焦点となっている。慣性凝縮核融合の最近の進歩は核融合研究に大きな注目を集めている。レーザー-プラズマ相互作用は核融合安定性と効率を確保するために重要である。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:10:31 GMT)
Using Deep Autoregressive Models as Causal Inference Engines [38.3]
本稿では,現代アプリケーションに共通する複雑な共同ファウンダーやシーケンシャルアクションを扱える自己回帰型因果推論フレームワークを提案する。本手法は,基礎となる因果線図からトークンの列へと変換する。我々は,CIに適応したARモデルは,迷路をナビゲートしたり,チェスのエンドゲームを行ったり,あるキーワードが紙の受容率に与える影響を評価するなど,様々な複雑な応用において効率的かつ効果的であることが実証された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:22:14 GMT)
On Evaluating LLMs' Capabilities as Functional Approximators: A Bayesian Perspective [37.5]
本稿では,大規模言語モデルの関数モデリング能力を包括的に評価するための新しい評価フレームワークを提案する。関数モデリングのベイズ的視点を採用することで、LLMは生データのパターンの理解に比較的弱いが、基礎となる関数の理解を深めるために、ドメインに関する事前知識を活用することに長けていることが分かる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:30:47 GMT)
Inference Scaling for Long-Context Retrieval Augmented Generation [37.2]
本研究では,検索拡張生成(RAG)のための推論スケーリングについて検討する。インコンテキスト学習と反復的プロンプトという,2つの推論スケーリング戦略に注目します。我々は、長期コンテキストの大規模言語モデル上での推論計算のスケーリングが、ベンチマークデータセットで最大58.9%のゲインを達成することを実証した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:42:15 GMT)
MC-CoT: A Modular Collaborative CoT Framework for Zero-shot Medical-VQA with LLM and MLLM Integration [37.0]
マルチモーダル大言語モデル(MLLM)は、医学的視覚的質問応答(Med-VQA)タスクに対処するために、特定の医療画像データセットに基づいて微調整されている。本稿では,Med-VQAにおけるMLLMのゼロショット性能向上を目的とした,モジュール型クロスモーダル協調型Chain-of-ThoughtフレームワークであるMC-CoTを紹介する。 SLAKE, VQA-RAD, PATH-VQAなどのデータセットを用いた実験により, MC-CoT はスタンドアロンのMLLM や様々なマルチモーダル CoT フレームワークをリコール率と精度で上回っていることがわかった。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:28:48 GMT)
Semi-Markovian Planning to Coordinate Aerial and Maritime Medical Evacuation Platforms [36.9]
水中水上機を用いた2機間の患者の移動は、海洋環境における医療的避難範囲と柔軟性を増大させる。選択問題は、固定地と移動船の交換点を含む作用空間を有するセミマルコフ決定過程としてモデル化される。その結果, 船舶交換点を用いた最適政策は, 船舶交換点を含まない最適政策と, グリーディ政策を35%, 40%向上させることがわかった。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:32:59 GMT)
Large Language Models for Knowledge-Free Network Management: Feasibility Study and Opportunities [36.7]
本稿では,大規模言語モデル(LLM)と呼ばれる基礎モデルの力による,知識のない新しいネットワーク管理パラダイムについて述べる。 LLMは、最小限のシステム情報を含む入力プロンプトから重要なコンテキストを理解することができ、完全に新しいタスクであっても顕著な推論性能を提供する。計算結果は,知識のないLLMが既存の知識ベース最適化アルゴリズムに匹敵する性能を達成できることを検証した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 07:42:23 GMT)
The Crucial Role of Samplers in Online Direct Preference Optimization [36.7]
DPO(Direct Preference Optimization)は、言語モデルアライメントのための安定的でスケーラブルで効率的なソリューションとして登場した。我々はDPOの$textitconvergence rate$の厳密な分析を行い、正確な勾配設定の下で異なるサンプリング戦略を示す。この結果は,DPOの理論的立場に関する知見を提供するとともに,潜在的なアルゴリズム設計の道を開くものである。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:22:10 GMT)
The Crucial Role of Samplers in Online Direct Preference Optimization [36.7]
DPO(Direct Preference Optimization)は、言語モデルアライメントのための安定的でスケーラブルで効率的なソリューションとして登場した。我々はDPOの$textitconvergence rate$の厳密な分析を行い、正確な勾配設定の下で異なるサンプリング戦略を示す。この結果は,DPOの理論的立場に関する知見を提供するとともに,潜在的なアルゴリズム設計の道を開くものである。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:22:10 GMT)
Unsupervised TTS Acoustic Modeling for TTS with Conditional Disentangled Sequential VAE [36.5]
本稿では,テキストと音声のペアを必要としない,教師なしの音声合成モデルであるUTTSを提案する。このフレームワークは、話者の持続時間モデル、音色特徴(アイデンティティ)、TTS推論のための内容の柔軟な選択を提供する。実験により、UTTSは人間と客観的評価によって測定された高い自然性と知性のある音声を合成できることが示されている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 20:00:46 GMT)
Partially Observable Task and Motion Planning with Uncertainty and Risk Awareness [34.8]
統合型タスク・アンド・モーション・プランニング(TAMP)は、長期のロボット操作とナビゲーションの問題を一般化するための貴重なアプローチであることが証明されている。これらの仮定は、プランナーが情報を収集し、リスクを認識した意思決定を行う能力を制限します。本研究では,初期状態と行動結果の不確実性を伴う長期計画問題を効果的に解決できる不確実性とリスク認識(TAMPURA)を備えたTAMP戦略を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 17:34:15 GMT)
Towards Better Benchmark Datasets for Inductive Knowledge Graph Completion [34.6]
インダクティブなKGCデータセットを構築するための現在の手順は、必然的に、利用可能なショートカットを生成します。具体的には、パーソナライズされたPageRank(PPR)スコアが、ほとんどの帰納的データセット上で、SOTAのパフォーマンスを強く、あるいは近く達成できることを観察する。本稿では,PPRショートカットの緩和に役立つインダクティブなKGCデータセット構築のための代替戦略を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 07:06:34 GMT)
Adjusting Pretrained Backbones for Performativity [34.4]
本稿では,事前学習したバックボーンをモジュラー方式で演奏性に適応させる新しい手法を提案する。再学習軌道に沿った損失を減らし、候補モデルの中から効果的に選択し、性能劣化を予測できることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:41:13 GMT)
On Efficient Language and Vision Assistants for Visually-Situated Natural Language Understanding: What Matters in Reading and Reasoning [33.9]
言語と視覚アシスタントの最近の進歩は印象的な能力を示しているが、透明性の欠如に悩まされている。オープンソースモデルは、一般的なイメージタスクを効果的に処理するが、複雑な視覚的なテキスト理解の高度な計算要求に直面する。本研究の目的は、キーコンポーネントを特定し、制約付き推論コストで効率的なモデルを作成することにより、視覚言語モデルの設計を再定義することである。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 22:42:47 GMT)
Mental Disorder Classification via Temporal Representation of Text [33.5]
ソーシャルメディア投稿からの精神障害予測は、逐次テキストデータの複雑さのために困難である。本稿では,時系列に順序付けられたソーシャルメディア投稿を一連の数に圧縮する新しいフレームワークを提案する。我々は、現在のSOTAを3つの異なる精神条件で上回ることで、フレームワークの一般化能力を実証する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 06:27:23 GMT)
Cybench: A Framework for Evaluating Cybersecurity Capabilities and Risks of Language Models [33.2]
Cybenchは、サイバーセキュリティタスクを特定し、それらのタスク上でエージェントを評価するためのフレームワークである。 4つの異なるCTFコンペティションから、40のプロフェッショナルレベルのCapture the Flag(CTF)タスクが含まれています。 GPT-4o, OpenAI o1-preview, Claude 3 Opus, Claude 3.5 Sonnet, Mixtral 8x22b Instruct, Gemini 1.5 Pro, Llama 3 70B Chat, Llama 3.1 405B Instruct。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:19:54 GMT)
Unlocking Continual Learning Abilities in Language Models [32.2]
言語モデル(LM)は優れた性能と一般化能力を示す。 MIGUはリハーサルフリーでタスクラベルなしの手法であり、LMの線形層において大きな出力でのみモデルパラメータを更新する。 MIGUは、連続的な微調整と連続的な事前トレーニング設定にまたがって、最先端またはオンパーのパフォーマンスを提供する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 10:07:43 GMT)
Is It Really Long Context if All You Need Is Retrieval? Towards Genuinely Difficult Long Context NLP [32.2]
異なるタスクをコンテキスト長で膨らませることは、生産的ではないと我々は主張する。我々は、長い文脈でそれらがより困難になる特性に基づいて、長い文脈の分類を解き放つことを提案する。必要な情報が非常に長く、入力内で非常に拡散している、最も困難で興味深い設定は、非常に過度に探索されている、と結論付けている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:09:26 GMT)
Survey of Query-based Text Summarization [31.9]
クエリベースのテキスト要約は、クエリ情報のガイダンスの下で、プロキシテキストデータを要約に格納する必要がある重要な実世界の問題である。本調査は,クエリベースのテキスト要約法と関連する汎用テキスト要約法における興味深い作業を要約することを目的としている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 23:54:24 GMT)
GC4NC: A Benchmark Framework for Graph Condensation on Node Classification with New Insights [30.8]
グラフ凝縮(GC)は、元のグラフの本質的な情報を保持する、はるかに小さなグラフを学習するために設計された新興技術である。本稿では,ノード分類における多様なGC手法を評価するための包括的フレームワークである textbfGC4NC を紹介する。私たちの体系的な評価は、凝縮グラフがどのように振る舞うか、そしてその成功を導く重要な設計選択について、新しい洞察を与えます。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:05:44 GMT)
S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points [30.5]
本稿では,離散的な3次元制御点を用いた4次元実世界の再構成をストリーミングする手法を提案する。この方法は局所光を物理的にモデル化し、運動デカップリング座標系を確立する。従来のグラフィックスと学習可能なパイプラインを効果的にマージすることにより、堅牢で効率的なローカルな6自由度(6自由度)モーション表現を提供する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:17:11 GMT)
Improved Off-policy Reinforcement Learning in Biological Sequence Design [30.3]
我々は,GFlowNetsをトレーニングするための新しいオフライン検索手法である$delta$-Conservative Searchを紹介した。キーとなる考え方は、パラメータ$delta$で制御される保守性を組み込んで、検索を信頼できるリージョンに制限することである。提案手法は,既存の機械学習手法よりずっと優れており,ハイスコアシーケンスの発見が可能であることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:22:32 GMT)
How Does the Disclosure of AI Assistance Affect the Perceptions of Writing? [29.1]
筆者らは,筆記プロセスにおけるAI支援のレベルとタイプが,書記プロセスに対する人々の認識にどのように影響するかについて検討した。以上の結果から,特にAIが新たなコンテンツ生成の支援を提供していれば,文章作成プロセスにおけるAI支援の開示は,平均品質評価を低下させる可能性が示唆された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:45:33 GMT)
Ordinal Preference Optimization: Aligning Human Preferences via NDCG [28.7]
我々は、NDCGを異なる代理損失で近似することで、エンドツーエンドの選好最適化アルゴリズムを開発する。 OPOは、AlpacaEvalのような評価セットや一般的なベンチマークにおいて、既存のペアワイズおよびリストワイズアプローチよりも優れています。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:49:28 GMT)
When Parts Are Greater Than Sums: Individual LLM Components Can Outperform Full Models [28.5]
本稿では,大規模言語モデルの出力を,注目の頭やコンポーネントの個人的貢献に分解することで,文脈内学習について検討する。モデルが貧弱な場合であっても、分類タスクで個別にうまく機能する優れたパフォーマンスのコンポーネント、偶然よりもはるかに悪いパフォーマンスのコンポーネント、常に同じラベルを予測するラベルバイアスのコンポーネント。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 12:25:01 GMT)
EnsemW2S: Can an Ensemble of LLMs be Leveraged to Obtain a Stronger LLM? [28.4]
弱強(w2s)一般化に対する革新的アプローチを提案する。より単純なタスクで訓練された弱いモデルは、より複雑なタスクでより強力なモデルを協調的に監督することを示します。既存のベースラインよりも最大14%向上し、バイナリ分類および生成タスクでは平均5%と4%改善した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 18:06:42 GMT)
Learning De-Biased Representations for Remote-Sensing Imagery [27.2]
リモートセンシング(RS)画像は、特別な衛星を収集し、注釈を付けるのが困難である。データ不足のため、スクラッチから大規模なRSモデルをトレーニングするのは現実的ではない。提案するdebLoRAは,任意のLoRA変種で動作する汎用的なトレーニング手法である。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:47:30 GMT)
Quantum Approximate Optimization Algorithms for Maxmimum Cut on Low-Girth Graphs [26.9]
量子コンピューティングにおいて、Farhi、Gutmann、GoldstoneはMaxCutの問題を解決するためにQuantum Approximate Optimization Algorithm (QAOA)を提案した。本稿では、加法積グラフとして知られるMohantyとO'Donnellによって提案された拡張グラフの集合上で、MaxCutにQAOAを適用する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:57:30 GMT)
Plausibly Problematic Questions in Multiple-Choice Benchmarks for Commonsense Reasoning [26.2]
常識推論のための多重選択質問(MCQ)ベンチマークは、1つの正しい答えの難しい選択を必要とする。サンプリングされたMCQの20%以上において、最も高い評価を得た回答選択は、ベンチマークゴールドの回答と一致しないことが判明した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 19:04:24 GMT)
The Impact of Element Ordering on LM Agent Performance [25.7]
ウェブおよびデスクトップ環境における各種要素順序付け手法の影響について検討する。我々は, 画素のみの環境において, 次元の減少が実効的な順序付けをもたらすことを見出した。本手法は,従来の最先端技術と比較して平均2倍以上のタスクを完了させる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:25:34 GMT)
Unveiling the Tapestry of Consistency in Large Vision-Language Models [25.1]
提案手法は,プロンプトの解空間が知識点を中心に回転するときに,LVLMがどう機能するかを直感的に解析するベンチマークである。 ConBenchツールに基づいて、タペストリーを最初に公開し、以下の結果を得た。我々は,本論文が研究コミュニティのモデル評価を加速し,一貫性領域の今後の進歩を促進することを願っている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:51:25 GMT)
Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory [24.9]
我々は,認知行動療法(Cognitive Behavioral Therapy, CBT)の目標指向的, 構造化的アプローチを用いて, 実生活インタラクションをエミュレートする多ターン対話データセットを作成する。我々は、実際のカウンセリングセッションの評価、専門家の評価との整合性の確保に使用される確立された心理学的基準をベンチマークする。 Cactusで訓練されたモデルであるCamelはカウンセリングスキルにおいて他のモデルよりも優れており、カウンセリングエージェントとしての有効性と可能性を強調している。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 14:12:18 GMT)
Is What You Ask For What You Get? Investigating Concept Associations in Text-to-Image Models [24.9]
キャラクタリゼーションによって、モデルやプロンプトデータセットの監査にフレームワークを使用することができます。本研究では,オープンソースインタラクティブな可視化ツールであるConcept2Conceptを実装した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:42:53 GMT)
Towards Secure Tuning: Mitigating Security Risks Arising from Benign Instruction Fine-Tuning [24.7]
本研究は, Benign IFT によるセキュリティリスクを軽減することを目的としている。我々は,ML-LR(Modular Layer-wise Learning Rate)戦略と呼ばれる新しいIFT戦略を提案する。本研究は,セキュリティ評価において,ML-LR戦略の適用により,良性IFT後のLSMの有害性の増加が著しく軽減されることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:34:04 GMT)
Look Around and Find Out: OOD Detection with Relative Angles [24.4]
本稿では, 分布内構造に対して計算されるOOD検出のための新しい角度に基づく計量法を提案する。提案手法は, CIFAR-10 と ImageNet ベンチマークの最先端性能を実現し, FPR95 を 0.88% と 7.74% 削減した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:36:07 GMT)
Unraveling Babel: Exploring Multilingual Activation Patterns of LLMs and Their Applications [24.2]
本研究では,多言語処理における大言語モデル(LLM)の内部ニューロン活性化パターンについて検討した。専門家のアクティベーション周波数の差を利用してスパースアクティベーションとプルーニングを誘導する。本研究は,スパースアクティベーションやモデルプルーニングなどの応用に新たな視点を提供する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:37:02 GMT)
Deformable NeRF using Recursively Subdivided Tetrahedra [24.1]
DeformRFは、四面体メッシュのマニピュラビリティを、特徴格子表現の高品質なレンダリング機能とシームレスに統合する手法である。合成データと実撮データの両方でDeformRFを総合的に評価する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:35:01 GMT)
Dataless Quadratic Neural Networks for the Maximum Independent Set Problem [23.6]
pCQO-MISはエッジ数ではなくグラフ内のノード数でスケールすることを示す。提案手法は,分散の排除,サンプリング,データ中心のアプローチを回避する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:31:27 GMT)
An Adversarial Perspective on Machine Unlearning for AI Safety [22.6]
この作業は、アンラーニングと従来のトレーニング後の安全性の根本的な違いに挑戦する。既存のjailbreakメソッドは、これまで未学習に対して効果がないと報告されていたが、慎重に適用した場合に成功できることを実証する。例えば、アクティベーション空間における10の無関係な例を微調整したり、特定の方向を除去することで、RMUで編集されたモデルに対して最も危険な能力を回復できることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 23:30:44 GMT)
Follow My Instruction and Spill the Beans: Scalable Data Extraction from Retrieval-Augmented Generation Systems [22.1]
Retrieval-In-Context RAG Language Models (LMs) におけるデータストアリークのリスクについて検討する。敵はLMの命令追従機能を利用してデータストアからテキストデータを簡単に抽出できることを示す。ランダムに選択された25個のGPTに対して、100%の成功率でデータストアリークを引き起こす攻撃を設計する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:25:41 GMT)
Generative Marginalization Models [22.0]
境界化モデル(英: marginalization model、MAM)は、高次元離散データのための新しい生成モデルである。それらは、すべての誘導された限界分布を明示的にモデル化することによって、スケーラブルで柔軟な生成モデリングを提供する。エネルギーベースのトレーニングタスクでは、MAMは従来の方法のスケールを超える高次元問題の任意の順序生成モデリングを可能にする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 19:56:20 GMT)
Casablanca: Data and Models for Multidialectal Arabic Speech Recognition [21.1]
カサブランカ(Casablanca)は、多方言のアラビア語データセットを収集し、書き起こそうとする大規模なコミュニティ主導の取り組みである。アルジェリア語、エジプト語、エミラティ語、ヨルダン語、モーリタニア語、モロッコ語、パレスチナ語、イエメン語である。我々はカサブランカを活用できる強力なベースラインを多数開発している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:41:38 GMT)
MVP-Bench: Can Large Vision--Language Models Conduct Multi-level Visual Perception Like Humans? [20.4]
LVLM(Large Visual-Language Models)は、多段階の視覚知覚を行う能力について未検討のままである。 MVP-Benchは、LVLMの低レベルと高レベルの両方の視覚的知覚を体系的に評価する最初のビジュアル言語ベンチマークである。 MVP-Benchを用いて、10個のオープンソースと2個のクローズドソースのLVLMの視覚的認識を診断し、高いレベルの認識タスクが既存のLVLMに大きく挑戦していることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:47:57 GMT)
Toward Debugging Deep Reinforcement Learning Programs with RLExplorer [19.9]
DRLベースのソフトウェアシステムにおける最初の故障診断手法であるRLExplorerを提案する。 RLExplorerは自動的にトレーニングトレースを監視し、DRL学習ダイナミクスの特性に基づいて診断ルーチンを実行する。そして、これらの診断の結果を、理論的概念、推奨プラクティス、潜在的な解決策をカバーする警告として記録する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:01:21 GMT)
Realizing Video Summarization from the Path of Language-based Semantic Understanding [19.8]
本稿では,Mixture of Experts(MoE)パラダイムに触発された新しいビデオ要約フレームワークを提案する。提案手法は,複数のビデオLLMを統合し,包括的で一貫性のあるテキスト要約を生成する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:03:22 GMT)
Sparse learned kernels for interpretable and efficient medical time series processing [19.5]
ディープラーニングの手法は計算集約的で、解釈性に欠けていた。医用時系列信号の解釈可能なアーキテクチャであるSmoLK(Sparse Mixture of Learned Kernels)を提案する。 SMoLKは、シングルレイヤスパースニューラルネットワークを形成する軽量なフレキシブルカーネルセットを学習する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:22:40 GMT)
High-Dimensional Tail Index Regression: with An Application to Text Analyses of Viral Posts in Social Media [19.3]
正規化推定器を示し、その整合性を確立し、収束率を導出する。また,正規化推定器のデバイアス化手法を導入し,その正規性を証明する。これらの手法をLGBTQ+トピックに関連するX上のバイラルポストのテキスト解析に応用する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:12:01 GMT)
FheFL: Fully Homomorphic Encryption Friendly Privacy-Preserving Federated Learning with Byzantine Users [19.2]
従来の機械学習パラダイムにおけるデータプライバシの問題を軽減するために、フェデレートラーニング(FL)技術が開発された。次世代のFLアーキテクチャでは、モデル更新をサーバから保護するための暗号化と匿名化技術が提案されている。本稿では,完全同型暗号(FHE)に基づく新しいFLアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 08:05:56 GMT)
Machine Learning for Actionable Warning Identification: A Comprehensive Survey [19.2]
Actionable Warning Identification (AWI)は、静的コードアナライザのユーザビリティ向上に重要な役割を果たす。機械学習(ML)の最近の進歩は、機械学習技術をAWIに組み込むために提案されている。本稿では、最先端のMLベースのAWIアプローチを体系的にレビューする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 08:27:32 GMT)
Robustness Reprogramming for Representation Learning [18.5]
十分に訓練されたディープラーニングモデルを考えると、パラメータを変更することなく、対向的あるいはノイズの多い入力摂動に対する堅牢性を高めるために再プログラムできるだろうか? 本稿では,新しい非線形ロバストパターンマッチング手法を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 18:19:02 GMT)
Probabilistic Perspectives on Error Minimization in Adversarial Reinforcement Learning [18.0]
自動運転車は、交通標識に関する感覚入力が敵によって操作される場合、破滅的な結果をもたらす可能性がある。このような状況における中核的な課題は、環境の真の状態は、このような敵の操作によって部分的にしか観察できないことである。本稿では,その根底にある真の状態についての信念に基づいて定義された,ACoE(Adversarial Counterfactual Error)という新たな目標を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 14:00:14 GMT)
Channel-Aware Throughput Maximization for Cooperative Data Fusion in CAV [17.7]
接続型および自律型車両(CAV)は、認識範囲の拡大と知覚範囲の増大により、大きな注目を集めている。盲点や障害物などの問題に対処するため、CAVは周囲の車両からのデータを集めるために車両間通信を採用している。本稿では,適応データ圧縮のための自己教師付きオートエンコーダを活用した,CAVデータ融合を容易にするチャネル対応スループット手法を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 00:43:46 GMT)
Calibrating Expressions of Certainty [17.4]
我々は、それらの意味をより正確に捉えるために、単純度上の分布として不確実性をモデル化する。我々は、人間(例えば、放射線学者)と計算モデルの両方の校正を解析する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 00:13:12 GMT)
Quantum State Tomography with Locally Purified Density Operators and Local Measurements [17.4]
量子状態の効率的な表現により、最小限の測定で量子状態トモグラフィを実現することができる。そこで本稿では,混合状態のテンソルネットワーク表現を用いた状態トモグラフィの代替手法を提案する。本研究では,テンソルネットワーク形式を用いた2次元システムのための量子状態トモグラフィーの道を開く。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:35:25 GMT)
Enhancing Android Malware Detection: The Influence of ChatGPT on Decision-centric Task [16.4]
非決定モデルChatGPTのAndroidマルウェア検出における従来の意思決定中心タスクへの影響について検討する。 Drebin、XMAL、MaMaDroidの3つの最先端ソリューションを選択し、公開データセットに関する一連の実験を行い、包括的な比較と分析を行う。非決定モデルとしてのChatGPTは、包括的な分析レポートの提供に優れ、解釈可能性を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 04:16:54 GMT)
EffiBench: Benchmarking the Efficiency of Automatically Generated Code [16.2]
EffiBenchは1,000の効率クリティカルコーディング問題のあるベンチマークである。それぞれの問題は、実行可能な人間記述の標準解とペアリングされる。我々は42の大規模言語モデルによる効率的なコード生成能力を実証的に検証した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 14:30:36 GMT)
AdaMemento: Adaptive Memory-Assisted Policy Optimization for Reinforcement Learning [15.3]
適応型メモリ強化学習フレームワークであるAdaMementoを提案する。 AdaMementoは、既知の局所的最適ポリシーを予測することを学ぶことによって、ポジティブな経験とネガティブな経験の両方を活用する。 AdaMementoは、記憶の過去の経験を効果的に活用し、より良い探索のために微妙な状態を区別できることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:39:39 GMT)
CoVLM: Leveraging Consensus from Vision-Language Models for Semi-supervised Multi-modal Fake News Detection [15.3]
我々は、実画像と偽ニュースを生成する誤ったキャプションをペアリングする、文脈外誤情報検出の現実的かつ挑戦的な課題に対処する。このタスクの既存のアプローチは、大量のラベル付きデータの可用性を前提としています。そこで本研究では,ラベル付き画像テキストペアとラベルなし画像ペアの大規模コーパスに限定的にアクセス可能な半教師付きプロトコルを提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 09:45:20 GMT)
Boosting Unsupervised Semantic Segmentation with Principal Mask Proposals [15.3]
教師なしセマンティックセグメンテーションは、画像コーパス内のグローバルセマンティックカテゴリをアノテーションなしで識別することで、画像を自動的に意味のある領域に分割することを目的としている。そこで,PriMaP - 主マスク提案 - 特徴表現に基づいてイメージを意味的に意味のあるマスクに分解する。これにより、予測最大化アルゴリズムであるPriMaPs-EMを用いて、クラスプロトタイプをPriMaPsに適合させることで、教師なしセマンティックセマンティックセマンティクスを実現することができる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 11:52:56 GMT)
BrainCodec: Neural fMRI codec for the decoding of cognitive brain states [15.0]
ニューラルオーディオに触発された新しいfMRIであるBrainCodecを提案する。精神状態復号におけるBrainCodecの圧縮能力を評価し、従来の方法よりもさらに改善したことを示す。我々は、BrainCodecを用いたfMRI再構成により、高いSNRを達成することにより、脳活動の可視性を高めることができることを示した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 07:38:22 GMT)
MaPPER: Multimodal Prior-guided Parameter Efficient Tuning for Referring Expression Comprehension [15.0]
Referring Expressionvolution (REC) は、自然言語を介して局所的な視覚領域を構築することを目的としている。既存のほとんどの方法は、強力な事前訓練されたモデルを使用して、完全な微調整によって視覚的/言語的な知識を伝達する。本稿では,Multi pre-guided Directly Efficient Tuning,すなわちMaPPERを提案する。 MaPPERは、1.41%のバックボーンパラメータしか持たないフル微調整や他のPETL法と比較して、最も精度が高い。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:46:51 GMT)
MaPPER: Multimodal Prior-guided Parameter Efficient Tuning for Referring Expression Comprehension [15.0]
Referring Expression (REC)は、自然言語を介して局所的な視覚領域を構築することを目的としている。既存のほとんどの方法は、強力な事前訓練されたモデルを使用して、完全な微調整によって視覚的/言語的な知識を伝達する。本稿では,Multi pre-guided Directly Efficient Tuning,すなわちMaPPERを提案する。 MaPPERは、1.41%のバックボーンパラメータしか持たないフル微調整や他のPETL法と比較して、最も精度が高い。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:46:51 GMT)
gRNAde: Geometric Deep Learning for 3D RNA inverse design [14.7]
gRNAdeは3次元RNAバックボーンで動作する幾何学的RNA設計パイプラインである。構造と力学を明示的に考慮したシーケンスを生成する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 06:39:41 GMT)
GaussianBlock: Building Part-Aware Compositional and Editable 3D Scene by Primitives and Gaussians [14.7]
本稿では,意味的コヒーレントかつ非絡み合いのある表現を可能にする,GaussianBlockと呼ばれる新しい部分認識型合成再構成手法を提案する。再構成されたシーンは、様々なベンチマークで絡み合っており、構成的でコンパクトであり、シームレスで、直接的で、正確な編集を可能にすることが証明されている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:58:10 GMT)
GaussianBlock: Building Part-Aware Compositional and Editable 3D Scene by Primitives and Gaussians [14.7]
本稿では,意味的コヒーレントかつ非絡み合いのある表現を可能にする,GaussianBlockと呼ばれる新しい部分認識型合成再構成手法を提案する。再構成されたシーンは、様々なベンチマークで絡み合っており、構成的でコンパクトであり、シームレスで、直接的で、正確な編集を可能にすることが証明されている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:58:10 GMT)
LRQ-Fact: LLM-Generated Relevant Questions for Multimodal Fact-Checking [14.6]
マルチモーダルなファクトチェックのための完全自動フレームワークLRQ-Factを提案する。マルチモーダルコンテンツを探索するための総合的な質問や回答を生成する。そして、元のコンテンツと生成された質問と回答の両方を評価し、全体的な妥当性を評価する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:33:22 GMT)
SITCOM: Step-wise Triple-Consistent Diffusion Sampling for Inverse Problems [14.3]
拡散モデル(英: Diffusion Model、DM)は、トレーニングセット上で学習した分布からサンプリングできる生成モデルのクラスである。 DMは通常、画像空間内の測定条件分布からおよそサンプルに修正される。これらの修正は、特定の設定(測定ノイズの存在など)や非線形タスクには適さないかもしれない。測定一貫性拡散軌道を達成するための3つの条件を述べる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 13:39:36 GMT)
CiMaTe: Citation Count Prediction Effectively Leveraging the Main Text [14.3]
主文は引用数予測において重要な要素であるが,本文は典型的に非常に長いため,機械学習モデルでは処理が困難である。本稿では,紙の断面構造を明示的に把握し,主文を利用したBERTに基づく引用数予測モデルCiMaTeを提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:39:13 GMT)
Intensity correlations in measurement-device-independent quantum key distribution [14.2]
本稿では,MDI QKDシステムのキーレートを,強度相関の下で定量的に解析する理論モデルを提案する。実測強度相関を用いたMDI QKDシステムに理論モデルを適用し,本モデルの下で鍵を効率よく生成することが困難であることを示す。本研究は,MDI QKDプロトコルに対する強度相関のセキュリティ解析を拡張し,MDI QKDシステムの実用的セキュリティを評価する方法論を提供する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 13:29:27 GMT)
Wrong-of-Thought: An Integrated Reasoning Framework with Multi-Perspective Verification and Wrong Information [14.1]
CoT(Chain-of-Thought)は大規模言語モデル(LLM)の性能向上に欠かせない技術となっている。 2つのコアモジュールを含むWrong-of-Thought (WoT)を提案する。 8つの一般的なデータセットと5つのLLMの実験は、WoTが以前のベースラインをすべて越えていることを示している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:27:21 GMT)
Enhancing 3D Human Pose Estimation Amidst Severe Occlusion with Dual Transformer Fusion [13.9]
本稿では,DTF(Dual Transformer Fusion)アルゴリズムを提案する。正確な3Dヒューマンポース推定を実現するために,本手法では,まず2つの中間ビューを生成する革新的なDTFアーキテクチャを利用する。このアプローチは、両方のデータセットで既存の最先端メソッドよりも優れており、大幅に改善されています。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 18:15:27 GMT)
Characterizing LLM Abstention Behavior in Science QA with Context Perturbations [13.9]
本研究では,LLMが不十分あるいは誤った文脈で科学的な疑問に答えることを禁じる能力について検討する。性能はモデルによって大きく異なり、提供されたコンテキストの種類や質問タイプによっても大きく異なることを示す。以上の結果から,QAデータセットの設計と評価において,モデル棄却の正しさと下流への影響をより効果的に評価するために,変更が必要であることが示唆された。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 05:55:28 GMT)
Stochastic Optimal Control for Diffusion Bridges in Function Spaces [13.5]
無限次元空間に合わせた最適制御の理論を提案する。我々は、Doob の $h$-transform が SOC の観点から導出され、無限次元に拡張されることを示す。 2つの無限次元分布間のブリッジの学習と、無限次元分布からの標本化のための生成モデルを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 06:24:04 GMT)
Quantifying the Role of Textual Predictability in Automatic Speech Recognition [13.3]
音声認識研究における長年の疑問は、エラーを音響をモデル化するモデルの能力にどのように属性付けるかである。テキストの相対的予測可能性の関数として誤り率をモデル化する新しい手法を検証する。本稿では,ASRの診断と改善において,このアプローチがいかに簡単に利用できるかを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:33:22 GMT)
Towards Unsupervised Blind Face Restoration using Diffusion Prior [12.7]
ブラインド顔復元法は、教師付き学習による大規模合成データセットの訓練において、顕著な性能を示した。これらのデータセットは、手作りの画像分解パイプラインで、低品質の顔イメージをシミュレートすることによって生成されることが多い。本稿では, 入力画像の集合のみを用いて, 劣化が不明で, 真理の目標がない場合にのみ, 復元モデルの微調整を行うことにより, この問題に対処する。我々の最良のモデルは、合成と実世界の両方のデータセットの最先端の結果も達成します。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:38:14 GMT)
Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark [12.7]
本稿では,単一エージェントとマルチエージェントの両方のシナリオにおいて,安全クリティカルなタスクを含む環境スイートであるSafety-Gymnasiumを提案する。 Safe Policy Optimization (SafePO) という,最先端のSafeRLアルゴリズム16種からなるアルゴリズムのライブラリを提供する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 15:42:14 GMT)
VL-ICL Bench: The Devil in the Details of Multimodal In-Context Learning [12.5]
大規模言語モデル(LLM)は、創発的な文脈内学習(ICL)を示すことで有名である。本研究では,マルチモーダルインコンテキスト学習のためのベンチマークVL-ICL Benchを提案する。我々は,このベンチマークスイートに対して最先端のVLLMの能力を評価する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:21:40 GMT)
NativQA: Multilingual Culturally-Aligned Natural Query for LLMs [12.4]
本研究では,言語に依存しないフレームワークであるNativQAを提案し,文化的・地域的に整合したQAデータセットをネイティブ言語でシームレスに構築する。 7言語で64kの注釈付きQAペアからなる多言語自然QAデータセットmnqaを設計することで,提案手法の有効性を実証する。また,低リソースおよび方言に富んだ言語を対象とした微調整データ構築におけるフレームワークの有効性を示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:46:41 GMT)
MindScope: Exploring cognitive biases in large language models through Multi-Agent Systems [12.2]
我々は静的要素と動的要素を区別して統合する'MindScope'データセットを紹介した。静的成分は、72の認知バイアスカテゴリにまたがる5,170のオープンエンド質問からなる。動的コンポーネントはルールベースのマルチエージェント通信フレームワークを利用して、マルチラウンド対話を生成する。さらに,検索・拡張生成(RAG),競争的議論,強化学習に基づく意思決定モジュールを組み込んだ多エージェント検出手法を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:23:56 GMT)
Multiply Robust Causal Mediation Analysis with Continuous Treatments [12.2]
Tchetgen Tchetgen と Shpitser の影響関数に基づく推定器 (2012) に触発された継続的治療の設定に適した推定器を提案する。提案手法はクロスフィッティングを用いて,ニュアンス関数の滑らかさ要件を緩和し,対象パラメータよりも遅い速度で推定できるようにする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 06:14:25 GMT)
Measuring and Improving Persuasiveness of Large Language Models [12.1]
本稿ではPersuasionBenchとPersuasionArenaを紹介し,生成モデルの説得性を自動測定する。我々の発見は、モデル開発者と政策立案者の両方にとって重要な意味を持つ。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 04:08:04 GMT)
Measuring and Improving Persuasiveness of Generative Models [12.1]
本稿ではPersuasionBenchとPersuasionArenaを紹介し,生成モデルの説得性を自動測定する。我々の発見は、モデル開発者と政策立案者の両方にとって重要な意味を持つ。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 04:08:04 GMT)
DAMRO: Dive into the Attention Mechanism of LVLM to Reduce Object Hallucination [11.8]
画像トークン上でのLLM(Large Language Model)デコーダの注意分布は,視覚的エンコーダと非常に一致していることがわかった。我々は,D$ive を$A$ttention $M$echanism of LVLM に変換する新しいトレーニングフリー戦略 DAMRO を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:12:09 GMT)
Towards a vision foundation model for comprehensive assessment of Cardiac MRI [11.8]
心臓磁気共鳴画像(CMR)評価のための視覚基礎モデルを提案する。 CMRワークフローに典型的な9つの臨床的タスクについて、教師付き方法でモデルを微調整する。すべてのタスクにおいて、ラベル付きデータセットサイズの範囲で、精度と堅牢性が改善されたことを実証する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:28:20 GMT)
Towards a vision foundation model for comprehensive assessment of Cardiac MRI [11.8]
心臓磁気共鳴画像(CMR)評価のための視覚基礎モデルを提案する。 CMRワークフローに典型的な9つの臨床的タスクについて、教師付き方法でモデルを微調整する。すべてのタスクにおいて、ラベル付きデータセットサイズの範囲で、精度と堅牢性が改善されたことを実証する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:28:20 GMT)
Blocks Architecture (BloArk): Efficient, Cost-Effective, and Incremental Dataset Architecture for Wikipedia Revision History [11.7]
BloArkは、ブロック、セグメント、倉庫の3つの部分で構成されている。 BloArk builderは、元のWikiRevHistデータセットをXML使用法からLines(JSONL)フォーマットに変換する。 BloArk修飾器は、既存のデータベースの利用を改善するためにインクリメンタルな修正を行うために、以前構築された倉庫を利用する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:58:14 GMT)
Counter Turing Test ($CT^2$): Investigating AI-Generated Text Detection for Hindi -- Ranking LLMs based on Hindi AI Detectability Index ($ADI_{hi}$) [11.7]
AI生成テキスト検出(AGTD)はすでに研究で注目を集めているトピックとして現れている。ヒンディー語におけるAGTDに関する調査を報告する。ヒンディー語文の生成能力を評価するため,26のLarge Language Models (LLMs) を検討した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:14:35 GMT)
Mindful-RAG: A Study of Points of Failure in Retrieval Augmented Generation [11.5]
LLM(Large Language Models)は、コヒーレントで文脈的に関係のあるテキストを生成するのに熟練した言語モデルである。 Retrieval-augmented Generation (RAG) システムは、構造化知識グラフ(KG)のような外部知識ソースを組み込むことによってこれを緩和する。本研究は,既存のKG法に基づくRAG法における誤りパターンの解析と8つの臨界故障点の同定により,このジレンマについて検討した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 16:15:09 GMT)
SWEb: A Large Web Dataset for the Scandinavian Languages [11.4]
本稿はスカンジナビア語における最大の事前学習データセットであるスカンジナビア語WEb(SWEb)について述べる。本稿では,ルールベースのアプローチと比較して,複雑性を著しく低減する新しいモデルベースのテキスト抽出手法を提案する。また、スウェーデンの言語モデルを評価するための新しいクローゼスタイルのベンチマークを導入し、このテストを用いて、SWEbデータでトレーニングされたモデルとFinalWebでトレーニングされたモデルを比較し、競合する結果と比較した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:55:15 GMT)
Computational Complexity of Learning Efficiently Generatable Pure States [11.2]
量子状態学習の計算複雑性について検討する。未知の量子状態が純粋な状態であることを約束し、効率的に生成可能であるならば、量子時間アルゴリズムが存在することを示す。また、学習量子状態の硬さと量子暗号の関連性も観察する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 06:25:36 GMT)
Comparing Zealous and Restrained AI Recommendations in a Real-World Human-AI Collaboration Task [11.0]
正確さとリコールのトレードオフを慎重に活用することで、チームのパフォーマンスが大幅に向上する、と私たちは主張する。我々は、a)AIアシストなし、b)高精度な「制限された」AI、c)3,466時間以上のアノテーション作業で、78のプロのアノテータのパフォーマンスを分析する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 23:19:19 GMT)
AdaptDiff: Cross-Modality Domain Adaptation via Weak Conditional Semantic Diffusion for Retinal Vessel Segmentation [11.0]
本稿では、AdaptDiffという、教師なしドメイン適応(UDA)手法を提案する。これにより、眼底撮影(FP)で訓練された網膜血管分割ネットワークが、目に見えないモダリティに対して満足な結果をもたらすことができる。その結果,全データセットのセグメンテーション性能は大幅に向上した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 23:04:29 GMT)
Famba-V: Fast Vision Mamba with Cross-Layer Token Fusion [10.9]
MambaとVision Mamba(Vim)モデルは、Transformerアーキテクチャに基づくメソッドの代替としての可能性を示している。この研究は、Vimモデルのトレーニング効率を高めるための層間トークン融合技術であるFast Mamba for Vision (Famba-V)を導入している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:34:48 GMT)
Famba-V: Fast Vision Mamba with Cross-Layer Token Fusion [10.9]
MambaとVision Mamba(Vim)モデルは、Transformerアーキテクチャに基づくメソッドの代替としての可能性を示している。この研究は、Vimモデルのトレーニング効率を高めるための層間トークン融合技術であるFast Mamba for Vision (Famba-V)を導入している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:34:48 GMT)
SCANet: Correcting LEGO Assembly Errors with Self-Correct Assembly Network [10.8]
本稿では,誤組立部品の特定と修正を含む単一ステップの組立誤り訂正タスクを提案する。本稿では,この課題に対処する新しい手法である自己整合アセンブリネットワーク(SCANet)を提案する。実験の結果、SCANetはMEPNetの誤組立結果を識別し、修正できることが示され、アセンブリの正しさが著しく向上した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:40:29 GMT)
Large Language Models for Propaganda Span Annotation [10.4]
本研究は, GPT-4のような大規模言語モデルが, 効果的にプロパガンダ的スパンを抽出できるかどうかを考察する。実験は、大規模な社内アノテートデータセット上で実施される。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 08:46:23 GMT)
Multimodal 3D Fusion and In-Situ Learning for Spatially Aware AI [10.3]
拡張現実における仮想世界と物理世界のシームレスな統合は、物理的な環境を意味的に「理解する」システムから恩恵を受ける。本稿では,意味的知識と言語的知識を幾何学的表現と一体化する多モード3Dオブジェクト表現を提案する。提案システムの有用性を,Magic Leap 2上の2つの実世界のARアプリケーションを用いて実証する:a) 自然言語を用いた物理環境における空間探索,b) 時間とともにオブジェクトの変化を追跡するインテリジェントなインベントリシステム。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 23:25:21 GMT)
Pullback Flow Matching on Data Manifolds [10.2]
プルバックフローマッチング(Pullback Flow Matching、PFM)は、データ多様体上の生成モデリングのためのフレームワークである。 PFMの有効性を、合成、データダイナミクス、タンパク質配列データに適用し、特定の性質を持つ新規なタンパク質を生成することによって実証する。本手法は, 創薬・材料科学に強い可能性を示し, 特定の性質を持つ新規試料の生成に大きな関心を寄せている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:41:26 GMT)
Hawk: An Efficient NALM System for Accurate Low-Power Appliance Recognition [10.1]
非侵入的機器負荷モニタリング(NALM)は、室内センサーを使わずにメインメーターから個々の機器の使用を検知することを目的としている。本稿では,データセット構築とイベント認識の2段階で動作する,効率的かつ正確なNALMシステムであるHawkを紹介する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 11:26:30 GMT)
Neural Product Importance Sampling via Warp Composition [9.8]
サンプル照明製品積分を効率よく重要にするために, 正規化フローを用いた学習に基づく手法を提案する。複雑な幾何学, 材料, 照明などを含む様々な応用において, 先行手法による分散の低減を実証する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:40:40 GMT)
Neural Product Importance Sampling via Warp Composition [9.8]
サンプル照明製品積分を効率よく重要にするために, 正規化フローを用いた学習に基づく手法を提案する。複雑な幾何学, 材料, 照明などを含む様々な応用において, 先行手法による分散の低減を実証する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:40:40 GMT)
Social Choice for Heterogeneous Fairness in Recommendation [9.8]
推薦システムにおけるアルゴリズムの公正性は、様々な利害関係者のニーズによく注意する必要がある。それまでの作業はしばしば、公正性の固定された単目的の定義によって制限されてきた。我々の研究は、計算社会の選択の観点からのフェアネスを推奨する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:01:18 GMT)
A Pluggable Common Sense-Enhanced Framework for Knowledge Graph Completion [9.7]
我々は,KGCの事実と常識の両方を組み込んだ,プラガブル・コモンセンス強化型KGCフレームワークを提案する。このフレームワークは、エンティティ概念の豊かさに基づいて異なるKGに適応可能であり、明示的あるいは暗黙的な常識を自動的に生成する能力を持っている。我々のアプローチは、多くの知識グラフ埋め込み(KGE)モデルのためのプラグイン可能なモジュールとして統合することができる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:06:12 GMT)
Agnostic Private Density Estimation for GMMs via List Global Stability [9.6]
制約のない高次元ガウス多様体の混合に対する個人密度推定の問題を考える。この問題のサンプル複雑性に関する最初の上限を証明した。そして、GMMのためのグローバルに安定な学習者リストを構築する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:59:30 GMT)
ArMeme: Propagandistic Content in Arabic Memes [9.5]
我々は,プロパガンダ的コンテンツの手動アノテーションを用いたアラビア・ミーム・データセットを開発した。我々は,その検出のための計算ツールの開発を目的とした包括的解析を行う。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 08:35:10 GMT)
CogDevelop2K: Reversed Cognitive Development in Multimodal Large Language Models [9.3]
本稿では,人間の知能が生み出す中核的認知能力であるMLLMの基礎的基礎を解明し,理解し,理性について考察する。オブジェクトの永続性やバウンダリといった基本的な知識から,理解などの高度な推論に至るまで,12のサブ概念にまたがる包括的なベンチマークであるCogDevelop2Kを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 20:13:11 GMT)
SouLLMate: An Adaptive LLM-Driven System for Advanced Mental Health Support and Assessment, Based on a Systematic Application Survey [9.1]
メンタルヘルスの問題は個人の日常生活に大きな影響を及ぼすが、多くの人は利用可能なオンラインリソースでも必要な支援を受けていない。この研究は、最先端のAI技術を通じて、アクセス可能で、スティグマフリーで、パーソナライズされ、リアルタイムなメンタルヘルスサポートを提供することを目的としている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 17:11:29 GMT)
ReTok: Replacing Tokenizer to Enhance Representation Efficiency in Large Language Model [9.1]
大規模言語モデル(LLM)のトークン化機能を置き換えることにより,モデル表現と処理効率を向上させる手法を提案する。本手法は,トークン化器を置き換えたモデルの性能を維持しつつ,長文の復号速度を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:01:07 GMT)
Ranking Policy Learning via Marketplace Expected Value Estimation From Observational Data [9.0]
両面のeコマースマーケットプレースにおいて,検索エンジンやレコメンデーションエンジンのランキングポリシーを学習する問題について検討する。ランキングポリシは、値割当機構として、検索したアイテムを指定されたスロットに割り当てる。我々は、観測データから、市場が期待する報酬に対する実証的な見積もりを構築した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:53:44 GMT)
Obliviate: Neutralizing Task-agnostic Backdoors within the Parameter-efficient Fine-tuning Paradigm [8.9]
PEFT統合バックドアディフェンスであるObliviateを紹介する。我々は,PEFT層内の良性ニューロンを増幅し,トリガートークンの影響を罰する2つの手法を開発した。本手法は,タスク固有のバックドアとアダプティブアタックに対する堅牢な防御能力を示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 09:43:25 GMT)
Obliviate: Neutralizing Task-agnostic Backdoors within the Parameter-efficient Fine-tuning Paradigm [8.9]
PEFT統合バックドアディフェンスであるObliviateを紹介する。我々は,PEFT層内の良性ニューロンを増幅し,トリガートークンの影響を罰する2つの手法を開発した。本手法は,タスク固有のバックドアとアダプティブアタックに対する堅牢な防御能力を示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 09:43:25 GMT)
Obliviate: Neutralizing Task-agnostic Backdoors within the Parameter-efficient Fine-tuning Paradigm [8.9]
PEFT統合バックドアディフェンスであるObliviateを紹介する。我々は,PEFT層内の良性ニューロンを増幅し,トリガートークンの影響を罰する2つの手法を開発した。本手法は,タスク固有のバックドアとアダプティブアタックに対する堅牢な防御能力を示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 09:43:25 GMT)
Native vs Non-Native Language Prompting: A Comparative Analysis [8.3]
本研究では,12のアラビアデータセットに関連付けられた11のNLPタスクに対する異なるプロンプト戦略(ネイティブ対非ネイティブ)について検討した。以上の結果から,非ネイティブプロンプトは平均して最善であり,その後に混合プロンプトとネイティブプロンプトが続くことが示唆された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:16:27 GMT)
Accelerating Inference of Networks in the Frequency Domain [8.1]
本稿では,周波数パラメータが疎いネットワークを高速化するために,周波数領域におけるネットワーク推論を提案する。特に、空間領域におけるネットワーク推論に双対な周波数推論連鎖を提案する。提案手法は,高速比(100倍以上)の場合の精度を著しく向上させる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:34:38 GMT)
Enhancing Stability for Large Language Models Training in Constrained Bandwidth Networks [8.0]
我々は、階層分割(hpZ)方式における競合状態が、数十億のパラメータを持つモデルのトレーニング時に不安定を引き起こす可能性を示す。次に、これらの収束問題に対処し、競争力のあるトレーニング効率を維持しながら、分割アルゴリズムの変更を提案する。このアルゴリズムは、98%のスループットを持つ大型モデルの堅牢なトレーニングを可能にし、収束の質を犠牲にすることなく、モデルのトレーニング速度を向上する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 01:18:35 GMT)
$\texttt{dattri}$: A Library for Efficient Data Attribution [7.8]
データ属性法は、個々のトレーニングサンプルが人工知能(AI)モデルの予測に与える影響を定量化することを目的としている。新たなデータ属性メソッドが開発されているにもかかわらず、さまざまなデータ属性メソッドの開発、ベンチマーク、デプロイを容易にする包括的なライブラリが欠如している。本稿では、上記のニーズに対処するオープンソースのデータ属性ライブラリである、$textttdattri$を紹介します。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:18:09 GMT)
Self-Managing DRAM: A Low-Cost Framework for Enabling Autonomous and Efficient in-DRAM Operations [7.7]
本稿では,自律的なDRAM保守操作を可能にする,低コストなDRAMアーキテクチャであるSelf-Managing DRAM(SMD)を提案する。 SMDは、メモリコントローラからチップへのメンテナンス操作を制御する責任を負う。 DDRxインタフェースに新しいピンを追加することなく、低レイテンシで実装可能であることを示す。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 11:44:59 GMT)
OD-Stega: LLM-Based Near-Imperceptible Steganography via Optimized Distributions [7.6]
本研究では,Large Language Modelが算術符号デコーダを駆動してステゴテキストを生成する,隠蔽型ステガノグラフィについて考察する。効率的な方法は、秘密のメッセージビットをできるだけ少数の言語トークンに埋め込む必要がある。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:30:45 GMT)
Model-guided Fuzzing of Distributed Systems [7.4]
モデルカバレッジを用いたランダムなテスト生成の導出は,実装状態空間における興味深い点をカバーするのに有効であることを示す。提案アルゴリズムは,スケジューラのカバレッジと突然変異の異なる概念によって導かれるランダム探索と同様に,純粋にランダムな探索よりも優れたカバレッジを示す。特に、Etcd-raftやRedisRaftのような分散コンセンサスプロトコルの実装において、常に高いカバレッジを示し、バグを高速に検出する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:55:33 GMT)
Model-guided Fuzzing of Distributed Systems [7.4]
モデルカバレッジを用いたランダムなテスト生成の導出は,実装状態空間における興味深い点をカバーするのに有効であることを示す。提案アルゴリズムは,スケジューラのカバレッジと突然変異の異なる概念によって導かれるランダム探索と同様に,純粋にランダムな探索よりも優れたカバレッジを示す。特に、Etcd-raftやRedisRaftのような分散コンセンサスプロトコルの実装において、常に高いカバレッジを示し、バグを高速に検出する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:55:33 GMT)
Propaganda to Hate: A Multimodal Analysis of Arabic Memes with Multi-Agent LLMs [7.2]
本研究では,ミームにおけるプロパガンダと憎悪の交わりについて検討する。我々は、粗い、きめ細かい憎悪ラベルでプロパガンダ的なミームデータセットを拡張した。我々の発見は、ミームにプロパガンダと憎悪の関連があることを示唆している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:30:48 GMT)
A Mathematical Explanation of UNet [7.1]
我々は、UNetの明確で簡潔な数学的説明を行う。 UNetが制御問題を解決していることを示す。この結果から,UNetは制御問題に対する一段階演算子分割アルゴリズムであることがわかった。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:07:52 GMT)
Prompt-Based Bias Calibration for Better Zero/Few-Shot Learning of Language Models [7.1]
事前学習された言語モデルに符号化された固有バイアスを校正するヌルインプットプロンプト法を提案する。本手法は,テキスト内学習とプロンプトベースファインタニングの両方において,LMのゼロ/ファインショット学習性能を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 16:27:01 GMT)
RotRNN: Modelling Long Sequences with Rotations [7.0]
ステートスペースモデル(SSM)やリニアリカレントユニット(LRU)のような線形リカレントニューラルネットワークは、最近、ロングシーケンスモデリングベンチマークで最先端のパフォーマンスを示している。回転行列の便利な特性を利用する線形リカレントモデルであるRotRNNを提案する。本稿では,RotRNNが頑健な正規化手順を備えたシンプルで効率的なモデルを提供し,その理論的導出に忠実な実践的実装であることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:44:42 GMT)
Transferable Tactile Transformers for Representation Learning Across Diverse Sensors and Tasks [6.7]
T3は、マルチセンサーとマルチタスクにまたがる触覚表現学習のためのフレームワークである。 FoTaで事前訓練したT3は、特定のセンサとタスクのペアリングにおいてゼロショット転送性を達成した。また、T3は長距離接点リッチな操作のための触覚エンコーダとしても有効である。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 16:02:15 GMT)
To Clip or not to Clip: the Dynamics of SGD with Gradient Clipping in High-Dimensions [6.7]
ストリーミングSGDにおける最小二乗問題における勾配クリッピングについて検討した。ガウスノイズクリッピングではSGD性能が向上しないことを示す。クリッピングしきい値のほぼ最適なスケジューリング法を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 18:51:39 GMT)
A study on the adequacy of common IQA measures for medical images [6.6]
最も一般的に用いられているIQA測定法は、自然画像のために開発されたが、医療現場では行われていない。本研究では,手動評価胸部X線(5名)と光音響画像(2名)と比較し,医療画像データに対する一般的なIQA測定の有効性を検証した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 16:06:54 GMT)
Random non-Hermitian Hamiltonian framework for symmetry breaking dynamics [6.4]
ヒルベルト空間における量子状態の一般非線形ダイナミクスをモデル化するために、ランダムな非エルミートハミルトニアンを提案する。本手法は, 線形方程式の線形性に基礎を置き, 線形系解法の適用性を確保する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:56:43 GMT)
Optimising for the Unknown: Domain Alignment for Cephalometric Landmark Detection [6.3]
機械学習モデルは、ヒートマップで表されるランドマークの確率軌跡を予測する。本研究は,局所顔抽出モジュールとX線アーチファクト拡張手法を用いた領域アライメント戦略を提案する。その結果,MREが1.186mm,2mm SDRが82.04%,オンライン検証リーダボードが3位となった。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:54:56 GMT)
LWE with Quantum Amplitudes: Algorithm, Hardness, and Oblivious Sampling [6.2]
実ガウス項を持つ $sfS|LWErangle$ および $sfC|LWErangle$ に対する新しいアルゴリズム、硬度結果、およびその他の関連する振幅を示す。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:01:44 GMT)
Content-based Controls For Music Large Language Modeling [6.2]
Coco-Mullaは、音楽大言語モデリングのためのコンテンツベースの制御方法である。トランスフォーマーベースのオーディオモデルに適したパラメータ効率細調整法(PEFT)を用いる。提案手法は,低リソース半教師付き学習による高品質な音楽生成を実現する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:36:20 GMT)
Arrange, Inpaint, and Refine: Steerable Long-term Music Audio Generation and Editing via Content-based Controls [6.2]
LLM(Large Language Models)は、高品質な音楽を生成する上で有望であるが、自動回帰生成に焦点をあてることで、音楽編集タスクにおける有用性を制限している。本稿では,パラメータ効率の高いヘテロジニアスアダプタとマスキングトレーニングスキームを組み合わせた新しいアプローチを提案する。提案手法は, フレームレベルのコンテンツベース制御を統合し, トラックコンディショニングとスコアコンディショニングによる音楽アレンジメントを容易にする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:26:48 GMT)
GUing: A Mobile GUI Search Engine using a Vision-Language Model [6.0]
本稿ではGUIClipと呼ばれる視覚言語モデルに基づくGUI検索エンジンGUingを提案する。われわれは最初にGoogle Playアプリの紹介画像から収集し、最も代表的なスクリーンショットを表示する。そこで我々は,これらの画像からキャプションを分類し,収穫し,抽出する自動パイプラインを開発した。私たちはこのデータセットを使って新しい視覚言語モデルをトレーニングしました。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 15:59:06 GMT)
Configurable Multilingual ASR with Speech Summary Representations [6.0]
世界の人口の半分は多言語であり、多言語 ASR (MASR) が不可欠である。複数のモノリンガルモデルをデプロイすることは、前もって基幹言語が不明な場合に困難である。構成性を高めるために設計された新しいcsvMASRアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 13:39:15 GMT)
You Still See Me: How Data Protection Supports the Architecture of AI Surveillance [6.0]
我々は,AIシステムの開発におけるプライバシ保護技術が,規制の許容度を前提として,監視インフラをいかに支援できるかを示す。本研究では,プライバシ保護技術を評価するための技術と政策戦略を提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 18:05:54 GMT)
Unitary Closed Timelike Curves can Solve all of NP [5.5]
我々は $mathbfBQP_ell CTC$ が $mathbfBQP$ の外にあるタスクを含むことを示す。我々の研究は、CTCが$mathbfNP$を解くことが可能な非線形性は偽であり、純粋プロセス行列が物理的かどうかを理解することが重要であることを示している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:28:56 GMT)
Distributed Inference on Mobile Edge and Cloud: An Early Exit based Clustering Approach [5.4]
ディープニューラルネットワーク(DNN)は、様々な領域で優れたパフォーマンスを示している。小型のDNNをモバイル、エッジの大型バージョン、クラウドのフルフローにデプロイできる分散推論設定を使用することができる。 DNNにおける推論遅延を最小限に抑えるために,Early Exit(EE)戦略を利用した新しい手法を開発した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:14:27 GMT)
DAdEE: Unsupervised Domain Adaptation in Early Exit PLMs [5.4]
Early Exit(EE)戦略は、中間層にアタッチされた分類器からサンプルを退避させることによって問題に対処する。本稿では,知識蒸留を用いた多段階適応を用いた非教師付き領域適応型EEフレームワーク(DADEE)を提案する。感情分析、エンテーメント分類、自然言語推論などのタスクの実験は、DADEEが早期出口法を一貫して上回っていることを示している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 09:44:58 GMT)
CAPEEN: Image Captioning with Early Exits and Knowledge Distillation [5.4]
ディープニューラルネットワーク(DNN)は、視覚要素を認識し、画像キャプションタスクで記述的なテキストを生成することで大きな進歩を遂げている。 EE戦略は効率を高めるために使用できるが、その適応は正確な予測のために様々なレベルの意味情報を必要とするため、画像キャプションにおける課題を示す。我々は,知識蒸留を用いたEE戦略の性能向上のためにCAPEENを導入した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:05:01 GMT)
Diagnosing Robotics Systems Issues with Large Language Models [5.3]
大規模言語モデル(LLM)は大量のデータを分析するのに優れている。ここでは、この研究を、ロボットシステムの難解で、ほとんど探索されていない領域に拡張する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:58:12 GMT)
EfficientState Space Model viaFast Tensor Convolutionand Block Diagonalization [5.3]
本稿では,マルチインプットマルチアウトプットSSMに基づく新しい状態空間層,すなわち効率的なSSMを提案する。我々のeSSMは、マルチインプットおよびマルチインプット(MIMO)SSMの畳み込み表現に基づいて構築されている。モデル効率ベンチマークでは、eSSMのパラメータはLSTMの12.89%、Mambaの13.24%に過ぎなかった。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 15:14:53 GMT)
Accurate and Fast Estimation of Temporal Motifs using Path Sampling [5.1]
モチーフと呼ばれる小さな部分グラフの数を数えることは、ソーシャルネットワークの分析とグラフマイニングの根本的な問題である。本稿では,時間的経路サンプリングの新しい手法を用いて,この問題に対処するアルゴリズムTEACUPSを提案する。数十億のエッジを持つBitcoinグラフの場合、TEACUPSは1分以内で実行され、正確なカウントアルゴリズムは1日以上かかる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 18:27:55 GMT)
Inverted Activations: Reducing Memory Footprint in Neural Network Training [5.1]
ニューラルネットワークトレーニングにおける重要な課題は、アクティベーションテンソルに関連するメモリフットプリントである。本稿では, 点方向非線形層におけるアクティベーションテンソルの取扱いの修正を提案する。本手法は,トレーニング精度や計算性能に影響を与えることなく,メモリ使用量を大幅に削減できることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:03:56 GMT)
COMMUNITY-CROSS-INSTRUCT: Unsupervised Instruction Generation for Aligning Large Language Models to Online Communities [5.0]
コミュニティ・クロス・インストラクション(Community-Cross-Instruct)は,大規模言語モデルをオンラインコミュニティに整合させ,信念を導き出す,教師なしのフレームワークである。 Reddit上で政治・食生活のコミュニティを正確に表現する手法の有用性を実証する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 22:17:03 GMT)
UrbanKGent: A Unified Large Language Model Agent Framework for Urban Knowledge Graph Construction [4.8]
都市知識グラフ構築(Urban KGC)は依然として手作業に大きく依存しており、その潜在的な進歩を妨げる。本稿では,都市知識グラフ構築のための統合型大規模言語モデルエージェントフレームワークであるUrbanKGentを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 03:40:58 GMT)
Drone Stereo Vision for Radiata Pine Branch Detection and Distance Measurement: Utilizing Deep Learning and YOLO Integration [4.7]
本研究は,木の枝の空間的位置を正確に検出・測定する,刈り取り工具とステレオビジョンカメラを備えたドローンの開発に焦点をあてる。分岐セグメンテーションにはYOLOを用い, モノクラーとステレオの2つの深度推定手法について検討した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 07:34:52 GMT)
Drone Stereo Vision for Radiata Pine Branch Detection and Distance Measurement: Utilizing Deep Learning and YOLO Integration [4.7]
本研究は,木の枝の空間的位置を正確に検出・測定する,刈り取り工具とステレオビジョンカメラを備えたドローンの開発に焦点をあてる。分岐セグメンテーションにはYOLOを用い, モノクラーとステレオの2つの深度推定手法について検討した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 07:34:52 GMT)
Continuous Approximations for Improving Quantization Aware Training of LLMs [4.4]
実効的なモデル圧縮手法である量子化アウェアトレーニング(QAT)を提案し,量子化後の性能劣化を低減する。本稿では, 伝統的にSTE (Straight-Through Estimator) とクランプ関数によって近似された, 丸み関数上のQAT過程に対する2つの連続近似を導入する。両方の手法を適用することで、量子化モデルのWikiText-v2データセット上のパープレキシティ(PPL)は9.0815に達し、ベースラインで9.9621を上回った。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:33:06 GMT)
Knowledge-Guided Dynamic Modality Attention Fusion Framework for Multimodal Sentiment Analysis [4.3]
マルチモーダル感情分析のための知識誘導動的モダリティ注意融合フレームワーク(KuDA)を提案する。 Kudaは感情知識を使用して、支配的なモダリティを動的に選択し、各モダリティの貢献を調整するモデルを導く。 4つのMSAベンチマークデータセットの実験は、KuDAが最先端のパフォーマンスを達成し、支配的なモダリティの異なるシナリオに適応できることを示している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:10:28 GMT)
Evaluation of Systems Programming Exercises through Tailored Static Analysis [4.3]
大規模なプログラミングクラスでは、エクササイズを評価し、詳細なフィードバックを提供するために、教員から多大な努力を払っている。システムでは、詳細なプログラミングやリソース管理のバグを再現することが難しいため、テストケースはエクササイズを評価するには不十分です。本稿では,システムプログラミング演習の自動評価のための静的解析に関する経験報告を示す。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 10:56:29 GMT)
Modeling Social Media Recommendation Impacts Using Academic Networks: A Graph Neural Network Approach [4.1]
本研究では,学術ソーシャルネットワークをソーシャルメディアにおけるレコメンデーションシステム調査のプロキシとして活用することを提案する。グラフニューラルネットワーク(GNN)を用いて,学術情報圏の予測と行動予測を分離するモデルを構築する。提案手法は,レコメンデーションシステムの役割とソーシャルネットワークのモデリングに関する理解を深めることを目的としている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:03:27 GMT)
The Faetar Benchmark: Speech Recognition in a Very Under-Resourced Language [4.1]
Faetarには標準的な正書法がなく、ベンチマークに含まれるもの以外のテキストや音声のリソースはほとんどない。コーパスはフィールド録音に由来するが、ほとんどはノイズがあり、5時間しか一致した書き起こしがない。我々は,現在最先端の多言語音声基礎モデルによる電話誤り率30.4%のベースライン結果について報告する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:32:03 GMT)
Brain-Like Replay Naturally Emerges in Reinforcement Learning Agents [3.9]
リプレイを生成するモジュール型強化学習モデルを開発した。この方法で生成されたリプレイがタスクの完了に役立つことを証明します。我々の設計は複雑な仮定を回避し、タスク最適化パラダイム内で自然にリプレイを可能にする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:37:54 GMT)
Identification of Mean-Field Dynamics using Transformers [3.9]
本稿では, 粒子の挙動を示す粒子系の平均場ダイナミクスを近似するために, 変圧器アーキテクチャを用いた手法について検討する。具体的には、有限次元変圧器が粒子系を支配する有限次元ベクトル場を効果的に近似できるなら、この変圧器の期待出力は無限次元平均場ベクトル場に対して良い近似を与える。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 19:47:24 GMT)
A Large-Scale Exploit Instrumentation Study of AI/ML Supply Chain Attacks in Hugging Face Models [3.7]
Hugging Faceは、開発者が他のモデルを共有してダウンロードできるオープンソースのプラットフォームとして機能する。 Pythonのシリアライゼーションメソッドは、オブジェクトインジェクションに弱いため、安全ではないと考えられている。本稿では、Hugging Faceにおけるこれらの安全でないシリアライズ手法の広範性について検討する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:09:54 GMT)
Watermarking Decision Tree Ensembles [3.6]
本稿では,決定木アンサンブルに対する最初の透かし方式について述べる。最も関係のある脅威に対する正確性とセキュリティの観点から、優れた結果を示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 17:56:13 GMT)
Non-Markovian Dynamics in Fiber Delay-line Buffers [3.5]
本研究では,2光子偏光絡み状態に対するマルコフ効果について検討した。バッファ化光子とそのペア化光子に対して非マルコフ確率関数を導出する。 We found that Werner's well-known separability criterion occur at the buffer time of 0.9$,$ms。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 01:48:18 GMT)
On-Policy Policy Gradient Reinforcement Learning Without On-Policy Sampling [3.5]
そこで本稿では,オンラインポリシー勾配アルゴリズムのデータ効率向上のための適応型オフポリシーサンプリング手法を提案する。我々の手法であるPROPS(Proximal Robust On-Policy Smpling)は,データ収集によるサンプリング誤差を低減する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 23:33:45 GMT)
Provable Weak-to-Strong Generalization via Benign Overfitting [3.5]
弱い教師が不完全な擬似ラベルを持つ強い生徒を監督する逆の状況を考える。理論的には、二進分類と多進分類の弱強一般化を理論的に検討する。我々の手法は最終的には弱いクラスから強いクラスに拡張されるべきである。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:10:50 GMT)
An Exploratory Study on Automatic Identification of Assumptions in the Development of Deep Learning Frameworks [3.5]
既存の仮定管理のためのアプローチとツールは通常、仮定のマニュアル識別に依存する。本研究は,開発者とユーザの観点から,仮定を識別する目的で,異なる分類モデルを評価することを目的とする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 08:46:52 GMT)
Pcc-tuning: Breaking the Contrastive Learning Ceiling in Semantic Textual Similarity [3.4]
センテンス表現法は,SentEval の 7 つの STS ベンチマークにおいて,平均 86 のスピアマン相関スコアに達した。 Pearsonの相関係数を損失関数として用いたPcc-tuningを提案する。実験結果から, Pcc-tuning は, 微粒化アノテートを最小限に抑えながら, 従来の最先端戦略を著しく上回り得ることが示された。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 12:41:47 GMT)
Advancing Semantic Textual Similarity Modeling: A Regression Framework with Translated ReLU and Smooth K2 Loss [3.4]
本稿では,Sentence-BERT STSタスクのための革新的な回帰フレームワークを提案する。これは2つの単純で効果的な損失関数、Translated ReLUとSmooth K2 Lossを提案する。実験結果から,本手法は7つのSTSベンチマークにおいて有意な性能を達成できることが示された。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 12:50:27 GMT)
A Comprehensive Survey of Advanced Persistent Threat Attribution: Taxonomy, Methods, Challenges and Open Research Problems [3.4]
Advanced Persistent Threat Attributionは、サイバーセキュリティにおける重要な課題である。人工知能(AI)と機械学習(ML)技術の普及に伴い、研究者たちは、サイバー脅威を責任あるアクターにリンクする自動化ソリューションの開発に注力している。自動帰属に関する以前の文献では、自動帰属プロセスに役立つ自動化された方法と関連するアーティファクトの体系的なレビューが欠けている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:48:05 GMT)
A Comprehensive Survey of Advanced Persistent Threat Attribution: Taxonomy, Methods, Challenges and Open Research Problems [3.4]
Advanced Persistent Threat Attributionは、サイバーセキュリティにおける重要な課題である。人工知能(AI)と機械学習(ML)技術の普及に伴い、研究者たちは、サイバー脅威を責任あるアクターにリンクする自動化ソリューションの開発に注力している。自動帰属に関する以前の文献では、自動帰属プロセスに役立つ自動化された方法と関連するアーティファクトの体系的なレビューが欠けている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:48:05 GMT)
Suspiciousness of Adversarial Texts to Human [3.3]
この研究は、人間の不審感という概念を掘り下げるものであり、画像に基づく敵の例に見られる非受容性に対する伝統的な焦点とは異なる品質である。敵文の疑わしい点に関する人文評価の新たなデータセットを収集,公開する。本研究では,疑わしいテキスト生成における疑わしさを軽減するために,疑わしさを定量化し,今後の研究のベースラインを確立するための回帰モデルを開発する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 06:57:22 GMT)
RespDiff: An End-to-End Multi-scale RNN Diffusion Model for Respiratory Waveform Estimation from PPG Signals [3.3]
PPG信号からの呼吸波形推定のためのエンドツーエンドマルチスケールRNNモデルであるRespDiffを提案する。モデルはマルチスケールエンコーダを使用し、異なる解像度で特徴を抽出し、双方向RNNを使用してPSG信号を処理し、呼吸波形を抽出する。 BIDMCデータセットで行った実験では、RespDiffはRR推定の1.18bpmの平均絶対誤差(MAE)を達成し、先行研究よりも優れていた。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 05:54:49 GMT)
VoxAct-B: Voxel-Based Acting and Stabilizing Policy for Bimanual Manipulation [3.2]
本稿では,VoxAct-Bを提案する。我々はこのボクセルグリッドをバイマニュアル操作ポリシーに提供し、動作と安定化の動作を学ぶ。シミュレーションにおいて、VoxAct-Bは、細粒度バイマニュアル操作タスクにおいて、強いベースラインを上回ります。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:13:25 GMT)
Filtration learning in exact multi-parameter persistent homology and classification of time-series data [3.2]
EMPHのフィルタ学習のためのフレームワークを提案する。フィルタパラメータに対する損失関数の勾配の正確な式を導出する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 06:53:39 GMT)
Prompts have evil twins [3.0]
私たちはこれらのプロンプトを「悪の双子」と呼びます。これらのプロンプトは、独立性のある応用を持つ最大様相問題の解法によって得られる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 23:53:34 GMT)
Quantum Channel Testing in Average-Case Distance [3.0]
量子チャネルの試験特性の複雑さについて検討する。任意のチャネルに対するIDのテストには$Omega(sqrtd_mathrmin / varepsilon)$クエリが必要です。また、固定チャネルに対するIDは、$tilde O(d_mathrmin d_mathrmout3/2 / varepsilon2)$クエリでACID距離でテストできることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:09:50 GMT)
Quantum Channel Testing in Average-Case Distance [3.0]
量子チャネルの同一性をテストするには$Omega(sqrtd_mathrmin / varepsilon)$クエリが必要です。また、固定チャネルに対するIDは、$tilde O(d_mathrmin d_mathrmout3/2 / varepsilon2)$クエリでACID距離でテストできることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:09:50 GMT)
Quantum Channel Testing in Average-Case Distance [3.0]
量子チャネルの同一性をテストするには$Omega(sqrtd_mathrmin / varepsilon)$クエリが必要です。また、固定チャネルに対するIDは、$tilde O(d_mathrmin d_mathrmout3/2 / varepsilon2)$クエリでACID距離でテストできることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:09:50 GMT)
An Attention-Based Algorithm for Gravity Adaptation Zone Calibration [2.9]
本稿では,重力適応領域キャリブレーションのためのアテンション強化アルゴリズムを提案する。従来の特徴選択法に固有の多重線型性と冗長性の問題に対処する。キャリブレーション精度とロバスト性を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:03:13 GMT)
Urban Computing for Climate and Environmental Justice: Early Perspectives From Two Research Initiatives [2.9]
極度の気象現象は、より頻繁で重大になり、不均等に低所得層や低所得層に影響を及ぼしている。本稿では,米国シカゴとブラジルのニテロイに2つの多学際プロジェクトについて紹介する。都市環境における気候関連リスクの理解と緩和を容易にする視覚分析ツールに必要な要件と既存のギャップについて論じる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 00:32:03 GMT)
CleanGen: Mitigating Backdoor Attacks for Generation Tasks in Large Language Models [2.9]
我々は,大規模言語モデルにおける生成タスクに対するバックドアアタックを軽減するために,CLEANGENという新しい推論時間ディフェンスを開発した。 CLEANGENは最先端のSOTA (State-of-the-art) LLMと互換性がある。以上の結果から,CLEANGENは5つのSOTAベースライン防御よりも攻撃成功率(ASR)が低いことが示唆された。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:44:33 GMT)
Emergent Matryoshka doll-like point gap in a non-Hermitian quasiperiodic lattice [2.8]
幾何級数変調された非エルミート準周期格子モデルを提案する。このシステムでは、複数のモビリティエッジと高い巻線数を持つ非エルミート点ギャップを誘導できることが示される。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:59:14 GMT)
Latent Feature Mining for Predictive Model Enhancement with Large Language Models [2.6]
本稿では,テキストからテキストへの命題論理的推論として潜在特徴抽出を定式化するための効果的なアプローチを提案する。本稿では,大規模言語モデル (LLM) を利用した潜在機能付き観測機能拡張フレームワークであるFLAMEを提案する。この枠組みを刑事司法制度と医療領域の2つのケーススタディで検証する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:51:32 GMT)
Revisiting In-context Learning Inference Circuit in Large Language Models [2.5]
In-context Learning (ICL) は、言語モデル(LM)の内的メカニズムを探索せずに学習する、新たな数発学習パラダイムである。本稿では、推論力学をモデル化し、ICLの観測現象を説明するための包括的回路を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:50:15 GMT)
DeepONet for Solving PDEs: Generalization Analysis in Sobolev Training [2.4]
偏微分方程式(PDE)の解法における演算子学習,特にDeepONetの適用について検討する。本稿では,ソボレフトレーニングにおけるDeepONetの性能に着目し,ディープブランチとトランクネットワークの近似能力とソボレフノルムの一般化誤差の2つの重要な問題に対処する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:43:56 GMT)
A Sequential Quadratic Programming Method with High Probability Complexity Bounds for Nonlinear Equality Constrained Stochastic Optimization [2.4]
制約関数値と導関数は利用可能であると仮定されるが、対象関数とその関連する導関数のプログラミング近似のみを計算することができる。 1次定常性を近似するためにアルゴリズムの反復複雑性に縛られる高い確率が導出される。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 02:55:30 GMT)
TA3: Testing Against Adversarial Attacks on Machine Learning Models [2.3]
敵攻撃は、機械学習(ML)モデルを多くのアプリケーションに展開する上で大きな脅威である。このような攻撃に対してMLモデルをテストすることは、MLモデルを評価し改善するための重要なステップになりつつある。敵攻撃防止テスト(TA3)のワークフローを支援する対話型システムの設計と開発について報告する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:44:04 GMT)
Simplex-enabled Safe Continual Learning Machine [2.1]
SeC-learning MachineはSimplexロジック(つまりシンプルさを使って複雑性を制御する)と物理制御深部強化学習(Phy-DRL)に基づいて構築されている。これにより、HP(ハイパフォーマンス)、HA(ハイアシュアランス)、コーディネータを構成する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:05:52 GMT)
VISTA: A Visual and Textual Attention Dataset for Interpreting Multimodal Models [2.1]
統合ビジョンと言語モデル(VLM)は、機械学習研究コミュニティ内のブラックボックスと見なされることが多い。本稿では、画像領域と対応するテキストセグメント間の特定の関連をマッピングする画像テキスト整列人間の視覚的注意データセットを提案する。次に、VLモデルによって生成された内部のヒートマップとこのデータセットを比較し、モデルの決定プロセスを分析し、よりよく理解できるようにします。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:11:53 GMT)
Approximate Maximum Likelihood Inference for Acoustic Spatial Capture-Recapture with Unknown Identities, Using Monte Carlo Expectation Maximization [2.1]
本稿では,モンテカルロ予測最大化推定法を提案する。本手法をカスカエル調査に適用し, 専門家が作成した通話履歴データを用いて得られた推定値の15%以内を推定する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 08:06:15 GMT)
Optimal and efficient text counterfactuals using Graph Neural Networks [2.0]
本稿では, 意味的に編集されたインプットを生成することで, 上記の処理を実現するフレームワークを提案する。我々は2つのNLPタスク – バイナリ感情分類とトピック分類 – でフレームワークをテストし、生成した編集がコントラストがあり、流動的で、最小限であることを示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:00:55 GMT)
Homotopy Relaxation Training Algorithms for Infinite-Width Two-Layer ReLU Neural Networks [1.8]
HRTA(Homotopy Relaxation Training Algorithm)と呼ばれる新しいトレーニング手法を提案する。提案アルゴリズムは,線形活性化関数とReLU活性化関数をシームレスに結合するホモトピー活性化関数を構築することを含む。我々は,ニューラル・タンジェント・カーネル(NTK)の文脈において,この手法の詳細な解析を行った。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 03:12:12 GMT)
A Cross-Lingual Meta-Learning Method Based on Domain Adaptation for Speech Emotion Recognition [1.8]
最高のパフォーマンスの音声モデルは、彼らが目的とする言語で大量のデータに基づいて訓練される。ほとんどの言語はスパースデータを持ち、トレーニングモデルを困難にしている。本研究は、限られたデータ、特に音声感情認識のためのモデルの性能について考察する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:33:51 GMT)
In-Place Panoptic Radiance Field Segmentation with Perceptual Prior for 3D Scene Understanding [1.8]
そこで本研究では,視覚を主眼とした3次元シーン表現とパノプティクス理解手法を提案する。 2次元セマンティクスとインスタンス認識を含む線形代入問題として、神経放射場内のパノプティクス理解を再構成する。合成シーンや実世界のシーンを含む課題条件下での実験とアブレーション研究は,提案手法の有効性を実証した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 15:49:58 GMT)
Compelling ReLU Networks to Exhibit Exponentially Many Linear Regions at Initialization and During Training [1.7]
ReLUアクティベーションを持つニューラルネットワークは、断片的線形関数の合成と見なすことができる。我々は,ネットワークに複数の線形領域を指数関数的に表示させる新たなトレーニング戦略を導入する。このアプローチにより、無作為な関数よりも数桁精度の高い凸1次元関数の近似を学習することができる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 22:24:07 GMT)
Evaluation of Code LLMs on Geospatial Code Generation [1.7]
大規模言語モデル(LLM)は、データサイエンスと機械学習アプリケーションのためのPythonコードを生成することができる。本稿では,空間的タスクの選択に基づいて,コード生成モデルの評価ベンチマークを構築した。我々のデータセットは、地理空間的コーディングタスクを高精度に解決できる新しいモデルの開発に貢献することを期待している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:34:03 GMT)
Video Summarization Techniques: A Comprehensive Review [1.6]
本稿では,抽象的戦略と抽出的戦略の両方を強調し,映像要約のための様々なアプローチと手法について考察する。抽出要約のプロセスは、ソースビデオからキーフレームやセグメントを識別し、ショット境界認識やクラスタリングなどの手法を利用する。一方、抽象的な要約は、深層ニューラルネットワークや自然言語処理、強化学習、注意機構、生成的敵ネットワーク、マルチモーダル学習といった機械学習モデルを用いて、ビデオから不可欠なコンテンツを取得することによって、新たなコンテンツを生成する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:17:54 GMT)
Automated Detection of Defects on Metal Surfaces using Vision Transformers [1.6]
深層学習技術を用いた視覚変換器(ViT)を用いた金属表面欠陥検出モデルの開発提案モデルは,特徴抽出のためのViTを用いた欠陥の分類と局所化に焦点を当てている。実験結果から, 自動欠陥検出, 運転効率の向上, 金属製造における誤差の低減に有効であることが示唆された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:29:45 GMT)
Enhancing Fairness and Performance in Machine Learning Models: A Multi-Task Learning Approach with Monte-Carlo Dropout and Pareto Optimality [1.5]
本研究では,モデル不確実性を利用した機械学習におけるバイアス軽減手法を提案する。提案手法では,モンテカルロ・ドロップアウト(MC)と組み合わせたマルチタスク学習(MTL)フレームワークを用いて,保護ラベルに関連する予測の不確実性を評価・緩和する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 07:36:39 GMT)
EEGMamba: Bidirectional State Space Model with Mixture of Experts for EEG Multi-task Classification [1.4]
脳波アプリケーションのためのマルチタスク学習を真に実装した最初のユニバーサル脳波分類ネットワークであるEEGMambaを紹介する。 EEGMambaは、Spatio-Temporal-Adaptive (ST-Adaptive)モジュール、双方向のMamba、Mixture of Experts (MoE)をシームレスに統合したフレームワークに統合する。本研究では,8つの公用EEGデータセットを用いてモデルの評価を行い,その性能を4種類のタスクで実証した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:02:35 GMT)
An engine to simulate insurance fraud network data [1.4]
ネットワーク構造を持つ合成データを生成するシミュレーションマシンを開発した。不正発生モデルにおいて、政策立案者及び当事者の総数、所望の不均衡レベル、および特徴(効果の大きさ)を特定できる。シミュレーションエンジンは、研究者や実践者がいくつかの方法論的課題を検証し、保険詐欺検出モデルの(開発戦略)検証を可能にする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 12:56:01 GMT)
AppPoet: Large Language Model based Android malware detection via multi-view prompt engineering [1.3]
AppPoetは、Androidマルウェア検出のためのマルチビューシステムである。本手法は, 検出精度97.15%, F1スコア97.21%であり, ベースライン法よりも優れている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:22:07 GMT)
CirrMRI600+: Large Scale MRI Collection and Segmentation of Cirrhotic Liver [1.3]
肝硬変 (肝硬変) は, 肝疾患終末期の肝硬変であり, 広範な線維化と結節再生を特徴とする。末期硬変の早期診断と治療は重要な臨床課題である。 Deep Learning (DL)は、MRIスキャンで肝硬変を自動分類し、認識するための有望なソリューションを提供する。 CirrMRI600+は肝硬変に対する注釈付きセグメンテーションラベルを用いた腹部MRIの広範なデータセットである。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 20:24:41 GMT)
Machine Learning-Assisted Intrusion Detection for Enhancing Internet of Things Security [1.3]
IoT(Internet of Things)に対する攻撃は、デバイス、アプリケーション、インタラクションのネットワーク化と統合化が進むにつれて増加している。 IoTデバイスを効率的にセキュアにするためには、侵入システムのリアルタイム検出が重要である。本稿では、IoTセキュリティのための機械学習ベースの侵入検知戦略に関する最新の研究について検討する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 19:38:56 GMT)
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation [1.2]
多くのVision-and-Language Navigation (VLN)アルゴリズムは、視覚的常識の欠如と限られた推論能力のために不正確な決定をする傾向がある。本稿では,階層的空間近接の知識基盤構築を支援するために,階層的空間近接推論(HSPR)手法を提案する。我々は、REVERIE、SOON、R2R、R4Rなどの公開データセットで実験を行い、我々のアプローチを検証する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:35:30 GMT)
Machine Learning-Assisted Intrusion Detection for Enhancing Internet of Things Security [1.2]
IoT(Internet of Things)に対する攻撃は、デバイス、アプリケーション、インタラクションのネットワーク化と統合化が進むにつれて増加している。 IoTデバイスを効率的にセキュアにするためには、侵入システムのリアルタイム検出が重要である。本稿では、IoTセキュリティのための機械学習ベースの侵入検知戦略に関する最新の研究について検討する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 19:38:56 GMT)
Fine-Grained Prediction of Reading Comprehension from Eye Movements [1.2]
本研究は, 視線運動からの読解理解を, 通路上の1つの質問のレベルで予測する作業に焦点をあてる。 3つの新しいマルチモーダル言語モデルと,文献から得られた先行モデルのバッテリを用いて,この課題に取り組む。評価の結果,目の動きは,視力の把握に有用な信号を含んでいることが示唆された。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 13:55:06 GMT)
Grokking at the Edge of Linear Separability [1.0]
本研究では,ロジスティック分類の長期的ダイナミクスを,定数ラベルを持つランダム特徴モデルを用いて解析する。線形分離性の頂点にあるトレーニングセットに分類を適用すると、Grokkingが増幅されることが分かる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:08:42 GMT)
Bounds for Revised Unambiguous Discrimination Tasks of Quantum Resources [1.0]
量子状態の識別は、量子情報理論において意味のある基本的なタスクである。本研究では, 漸近的かつ曖昧なシナリオにおいて, 修正された識別タスクの成功確率の上限を示す。また、半定値正作用素の集合上の量子化器を考えることにより、量子の利点を示す。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:52:17 GMT)
Online learning of a panoply of quantum objects [0.9]
多くの量子タスクにおいて、学習したい未知の量子オブジェクトが存在する。正半定値行列の一般部分集合について学習するために亜線型後悔を証明した。我々の境界はコンパクトな凸表現を持つ他の多くの量子オブジェクトに適用できる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 21:13:14 GMT)
Learning to Solve Abstract Reasoning Problems with Neurosymbolic Program Synthesis and Task Generation [0.9]
本稿では,ニューラルプログラム合成に基づく抽象問題の解法であるTransCoderを提案する。提案アーキテクチャの生成モジュールによる決定を包括的に分析する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 13:42:53 GMT)
Graph Residual based Method for Molecular Property Prediction [0.7]
この写本は、GRUベースの新しい方法論であるECRGNNの詳細な記述を強調し、使用済みの入力をマッピングする。変分オートエンコーダ(VAE)の詳細な記述と,マルチクラスマルチラベル特性予測に用いるエンドツーエンド学習法も提案した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 19:38:19 GMT)
Punctuation Prediction for Polish Texts using Transformers [0.7]
本稿では, 71.44 重み付き F1 のポーランド語テキストに対する Punctuation Prediction for Polleval 2022 Task 1 の解について述べる。この方法は、競合データと外部データセットに微調整された1つのHerBERTモデルを利用する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:51:02 GMT)
Passage Retrieval of Polish Texts Using OKAPI BM25 and an Ensemble of Cross Encoders [0.7]
本稿では,Poleval 2023 Task 3: Passage Retrieval Challengeに対する勝利のソリューションを提案する。ポーランドのテキストを3つの領域(トリビア、合法、カスタマーサポート)で検索する。この手法はOKAPI BM25アルゴリズムを用いて文書を検索し、公開の多言語クロスランクのアンサンブルを再構成した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 20:43:42 GMT)
An evaluation of LLM code generation capabilities through graded exercises [0.7]
我々は,8つのプログラミング言語における符号化問題の解法において,1つの最先端モデル(GPT4-o-mini)の性能を新たに評価する。分析の結果,モデルの成功確率はタスクの難易度と正の相関があることがわかった。モデル性能の46.6%はタスクの困難に起因する可能性があるが、37.4%はモデルのトレーニングセットへのチャレンジソリューションの漏洩に関連していると思われる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:54:54 GMT)
QKAN: Quantum Kolmogorov-Arnold Networks [0.7]
Kolmogorov-Arnold Networks (KAN)と呼ばれる新しいニューラルネットワークアーキテクチャが登場し、コルモゴロフ-Arnold表現定理の構成構造に着想を得た。我々のQKANは、量子特異値変換を含む強力な量子線型代数ツールを利用して、ネットワークの端にパラメータ化活性化関数を適用する。 QKANはブロックエンコーディングに基づいており、本質的に直接量子入力に適している。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 10:11:57 GMT)
Generalizability analysis of deep learning predictions of human brain responses to augmented and semantically novel visual stimuli [0.6]
本研究の目的は,視覚野活性化に対する画像強調技術の影響を探索するための枠組みとして,ニューラルネットワークを用いたアプローチの音質と有用性を検討することである。 The Algonauts Project 2023 Challengeに参加したトップ10の方法の中から選ばれた、最先端の脳エンコーディングモデルを用意します。我々は、様々な画像強調技術が神経反応に与える影響について、有効な予測を行う能力について分析する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:29:02 GMT)
SafeLLM: Domain-Specific Safety Monitoring for Large Language Models: A Case Study of Offshore Wind Maintenance [0.6]
本稿では,Large Language Models (LLMs) に着目して,この課題に対処する革新的なアプローチを提案する。本稿では,幻覚の検出とフィルタリングのための文間距離を統計的に計算するための対話エージェントを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 13:00:53 GMT)
ProtocoLLM: Automatic Evaluation Framework of LLMs on Domain-Specific Scientific Protocol Formulation Tasks [0.5]
科学プロトコル定式化タスク(SPFT)におけるLarge Language Models(LLMs)の抜粋本稿では,SPFT 上で LLM の機能を評価するためのフレキシブルな自動フレームワーク ProtocoLLM を提案する。 GPT変異,Llama,Mixtral,Gemma,Cohere,Geminiを評価した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 19:28:55 GMT)
Emílias Podcast -- Mulheres na Computação: Ampliando Horizontes e Inspirando Carreiras em STEM [0.4]
「Em'ilias Podcast -- Women in Computing」は2024年10月3日に創立5周年を迎えた。ポッドキャストの目的は、コンピューティングや関連分野の女性たちが自分の経験を共有する場所を提供することだ。その結果、100%のインタビュアーが"Em'ilia's Podcast"を推奨し、プロジェクトの満足度の高さを反映していることがわかった。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 12:59:48 GMT)
Strongest quantum nonlocality in $N$-partite systems [0.4]
N$-partiteシステムにおける自明性保存局所測定(OPLM)のための十分かつ必要な条件を提案する。系 $(mathbbCd)otimes N(dgeq4)$ において最強非局所性を持つ集合の最小サイズを導出する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 01:41:06 GMT)
VPI-Mlogs: A web-based machine learning solution for applications in petrophysics [0.3]
VPI-MLogsは、データ前処理、探索データ分析、可視化、モデル実行を統合するWebベースのデプロイメントプラットフォームである。この記事では、石油物理データを把握するための多くのソリューションを統合するWebベースのアプリケーションに焦点を当てる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 06:01:15 GMT)
Engineering Si-Qubit MOSFETs: A Phase-Field Modeling Approach Integrating Quantum-Electrostatics at Cryogenic Temperatures [0.3]
本研究は、Si基量子ビットの研究に高度な位相場モデリングを用いる。我々は、シュロディンガー方程式解のフルウェーブ処理と、極低温におけるポアソン方程式を併用した包括的モデリング手法を採用する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 03:25:07 GMT)
Multi-Tiered Self-Contrastive Learning for Medical Microwave Radiometry (MWR) Breast Cancer Detection [0.3]
本研究は,マイクロ波ラジオメトリー(MWR)乳がん検出の応用に適した,新しい多層自己造影モデルを提案する。我々のアプローチは、Local-MWR(L-MWR)、Re Regional-MWR(R-MWR)、Global-MWR(G-MWR)の3つの異なるモデルを含んでいる。これらのモデルは、各分析レベルで生成された自己コントラストデータを活用して検出能力を向上するジョイント-MWR(J-MWR)ネットワークを介して結合的に統合される。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:51:02 GMT)
A Global Cybersecurity Standardization Framework for Healthcare Informatics [0.2]
この研究はまず、プライバシーとセキュリティに不可欠な20のアクティビティを特定し、それらを5つのカテゴリに分類する。このフレームワークは、Delphi Methodを使用して、アクティビティ、分類基準、優先順位付けを識別した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:44:35 GMT)
SONICS: Synthetic Or Not -- Identifying Counterfeit Songs [0.2]
我々は、エンドツーエンド合成歌検出(SSD)のための新しいデータセットSONICSを紹介する。歌唱における時間的長期依存性をモデル化することの重要性を強調した。特に、長いオーディオサンプルでは、私たちの最高のパフォーマンスの亜種は、ViTのスコアを8%上回り、スピードは38%、メモリ使用量は26%減った。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 04:03:35 GMT)
Towards the first UD Treebank of Spoken Italian: the KIParla forest [0.2]
本プロジェクトは、KIParla corpus(Mauri et al., 2019, Ballare et al., 2020)のためのUniversal Dependencies treebankを構築することで、イタリア語で利用可能な言語資源を充実させようとしている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 19:01:04 GMT)
Signatures From Pseudorandom States via $\bot$-PRFs [0.1]
我々は $bot$-PRG と $bot$-PRF の新たな定義を導入する。私たちの主な応用は、古典的な公開鍵と署名を備えた(量子)デジタル署名スキームです。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 20:07:48 GMT)
Which features of quantum physics are not fundamentally quantum but are due to indeterminism? [0.0]
我々は、量子物理学に起因する特徴、問題、パラドックスのほとんどは、明らかに古典的な類似点を持っていると論じている。量子物理学を真に特徴付けるものは、$hbar$、すなわち非互換な観測可能量を含む現象のみに起因する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 21:14:50 GMT)
Where does the Born Rule come from? Superposition [0.0]
ボルンルールは量子力学において重要な役割を果たす。これは確率の観点から数学的形式主義と実験結果の関連性を提供する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:20:25 GMT)
WISE: Unraveling Business Process Metrics with Domain Knowledge [0.0]
複雑な産業プロセスの異常は、しばしばイベントデータの高変動性と複雑さによって隠蔽される。本稿では、ドメイン知識、プロセスマイニング、機械学習の統合により、ビジネスプロセスメトリクスを分析する新しい手法WISEを紹介する。 WISEはビジネスプロセス分析における自動化を強化し、望ましいプロセスフローからの逸脱を効果的に検出する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 07:57:08 GMT)
U-net based prediction of cerebrospinal fluid distribution and ventricular reflux grading [0.0]
本稿では,24時間後にピーク時の画素単位の信号増加を予測するために,U-netを用いた教師付き学習モデルを提案する。トレーニングのための最初の2時間後からのイメージングデータを使用することで、トレーサフローの予測は、追加の後期スキャンでトレーニングされたものと同等になる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 12:17:42 GMT)
SpaceByte: Towards Deleting Tokenization from Large Language Modeling [0.0]
トークン化は、パフォーマンスが大幅に向上するため、大きな言語モデルで広く使用されている。バイトレベルとサブワード自動回帰言語モデリングのパフォーマンスギャップを埋める新しいバイトレベルデコーダアーキテクチャであるSpaceByteを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 02:17:26 GMT)
Securing UAV Communication: Authentication and Integrity [0.0]
安全でない通信路上でのUAVデータ交換をセキュアにするための認証手法を提案する。我々のソリューションは、Diffie-Hellmanキー交換とHashベースのメッセージ認証コード(HMAC)をROS通信チャネル内で組み合わせる。どちらのドローンもキーの改ざんを検知し、UAV通信を保護する方法の有効性を確認しました。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:36:06 GMT)
Representing Web Applications As Knowledge Graphs [0.0]
提案手法は、各ノードをアプリケーションの現在の状態の構造化された表現としてモデル化し、エッジはユーザ主導のアクションや遷移を反映する。この構造化された表現は、Webアプリケーションのより包括的で機能的な理解を可能にし、自動テストや振る舞い分析といった下流タスクに貴重な洞察を提供する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 02:50:41 GMT)
Real-Time Hand Gesture Recognition: Integrating Skeleton-Based Data Fusion and Multi-Stream CNN [0.0]
ハンドジェスチャ認識(HGR)は、様々な現実世界のコンテキストにおいて、直感的な人間とコンピュータのインタラクションを可能にする。既存のフレームワークは、実用的なHGRアプリケーションに必要なリアルタイム要件を満たすのに苦労することが多い。本研究では,動的ハンドジェスチャの静的イメージタスクへの認識を簡略化する,動的HGRのための頑健な骨格ベースのフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 04:06:44 GMT)
Radial Basis Operator Networks [0.0]
ラジアルベース演算子ネットワーク(RBON)は、複雑な値入力を受け入れるように調整されたとき、時間領域と周波数領域の両方の演算子を学習できる最初の演算子ネットワークである。 RBONは、いくつかのベンチマークケースでは、1ドル未満のOOD(in-out-of-distriion data)とout-of-distriion data)に対して、L2$の小さな相対的テストエラーを誇っている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:10:55 GMT)
Quantum Confusions, Cleared Up (or so I hope) [0.0]
私は、量子力学の解釈に関する一般的な主張を調査するために、道具的アプローチを使用します。ここでは、量子力学の解釈のための最近提案された分類に基づく調査の基盤について述べる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 16:28:39 GMT)
Privacy's Peril: Unmasking the Unregulated Underground Market of Data Brokers and the Suggested Framework [0.0]
パート1では、データブローカとは何か、どのように情報を集めるか、データ産業、それに直面する困難について検討します。パートIIでは、データブローカを規制する潜在的なオプションを検討します。すべてのオプションは、EU一般データ保護規則に基づいて提供されている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 19:51:31 GMT)
Postprocessing of point predictions for probabilistic forecasting of day-ahead electricity prices: The benefits of using isotonic distributional regression [0.0]
本研究では,日頭電力価格の点予測を確率的値に変換するための3つのポストプロセッシング手法について検討する。後者は最も多様な振る舞いを示すが、予測分布のアンサンブルに最も寄与する。注目すべきことに、この組み合わせのパフォーマンスは、ドイツとスペインの電力市場から4.5年間のテスト期間において、最先端の分散ディープニューラルネットワークよりも優れている。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:35:12 GMT)
Phase Diagrams of Relativistic Selfinteracting Boson System [0.0]
平均場アプローチにおいて、有限温度および有限アイソスピン密度で相互作用するボソンの系について検討する。ボゾン系における粒子間のアトラクションの場合, ボース-アインシュタイン凝縮体の背景に液-ガス相転移が生じることが示されている。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 18:33:41 GMT)
On the applicability of Kolmogorov's theory of probability to the description of quantum phenomena. Part I [0.0]
コルモゴロフの公理と物理的に自然な確率変数に基づいて数学的に厳密な理論を構築することができることを示す。このアプローチは原則として、量子力学モデルの他のクラスに適応することができる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 19:35:41 GMT)
On Minimal Depth in Neural Networks [0.0]
ニューラルネットワークの表現可能性の特徴は、人工知能における彼らの成功を理解することに関係している。本研究では, ReLU ニューラルネットワークの表現性と, 連続的ピースワイド線形関数 (CPWL) の表現に必要な最小深度に関する予想との関係について検討した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 09:02:32 GMT)
Mutual information and correlation measures in holographic RG flows [0.0]
相互情報は比較的スムーズなままであるが、絡み合いの負性度と多粒子相関は相転移付近で急激な変化を示す。結果は、強く結合した量子系における臨界現象のシグナル伝達において、多部相関が支配的な役割を果たすという仮説を支持する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 22:59:45 GMT)
Multi-Time Version of the Landau-Peierls Formulation of Quantum Electrodynamics [0.0]
ランダウとピエルスは、粒子配置表現における量子電磁力学の単純化版をハミルトン式に書き記した。我々は、元の方程式に対していくつかの利点を持つシュリンガー方程式の多重時間版を提示する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:06:41 GMT)
Mitigating Hallucinations Using Ensemble of Knowledge Graph and Vector Store in Large Language Models to Enhance Mental Health Support [0.0]
この研究は、大規模言語モデル(LLM)における幻覚の顕在化を深く研究している。主な目的は、幻覚の発生を抑える効果的な戦略を明らかにすることである。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 14:26:37 GMT)
Metrological Characterization of Multipartite Continuous-Variable non-Gaussian Entanglement Structure [0.0]
本稿では,連続変数系における多部絡み構造の検出手法を提案する。ランダムに生成した105ドル以上の多モード量子状態に対して,本手法の有効性を示す。この研究は、様々な連続変数系における絡み合い構造を特徴づけるための一般的な枠組みを提供する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 16:22:06 GMT)
Matrix Completion with Convex Optimization and Column Subset Selection [0.0]
本稿では,カラム選択行列補完法(CSMC)を実装した2つのアルゴリズムを提案する。本研究では, 行列サイズ, ランク計算, 欠落要素の割合が解の質と時間に与える影響について検討するため, 合成データについて実験を行った。我々の徹底的な分析により,CSMCは凸最適化に基づく行列補完アルゴリズムに匹敵する品質のソリューションを提供することが示された。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 08:21:40 GMT)
Lowering the Exponential Wall: Accelerating High-Entropy Alloy Catalysts Screening using Local Surface Energy Descriptors from Neural Network Potentials [0.0]
本研究では, 単金属系からのデータを用いたHEA特性の迅速予測法を提案する。我々は古典機械学習と量子機械学習の両方を用いて高精度モデルを開発した。提案手法は, HEA化学空間の探索を加速し, 新規触媒の設計を容易にする。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 10:28:27 GMT)
LLM Gesticulator: Leveraging Large Language Models for Scalable and Controllable Co-Speech Gesture Synthesis [0.0]
本稿では,LLM Gesticulatorについて述べる。本フレームワークは、自然な動きと編集性を示しながら、入力音声とリズミカルに整合したフルボディアニメーションを合成する。また,本手法は,テキストプロンプトによって生成したジェスチャーの内容やスタイルを制御できる強い制御性を示す。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 12:53:07 GMT)
Integrability of open boundary driven quantum circuits [0.0]
開境界条件を持つ量子ビット(スピン1/2)の二重量子回路のヤン・バクスター積分性の問題に対処する。我々はこの解を用いて、2ステップの離散時間フロケダイナミクスを持つ変換行列形式から積分可能な回路を構築する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 20:11:17 GMT)
Inclusion of pairing fluctuations in a semiclassical approach: The case of study of the Josephson effect [0.0]
半古典的アプローチに関する最近の改良を概観する。この手法を用いて、超低温フェルミガスを用いた最近の実験に関する幅広い物理条件に対するジョセフソン効果を記述する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 07:30:17 GMT)
Implementing any Linear Combination of Unitaries on Intermediate-term Quantum Computers [0.0]
我々はLCU(Linear Combination of Unitary)を実装するための3つの新しい手法を開発した。第1の方法は、LCUプロシージャによって作成された任意の量子状態に対して可観測物の期待値を推定する。第二のアプローチは、単純で物理的に動機づけられたLCUの連続時間アナログであり、ハイブリッド量子モードシステムに適合する。第3の手法(アンシラフリーLCU)は、アシラ量子ビットを全く必要とせず、量子状態の射影に興味がある場合に有用である。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 14:07:45 GMT)
Hyperplane-Symmetric Static Einstein-Dirac Spacetime [0.0]
任意の次元の静的および超平面対称時空におけるアインシュタイン方程式とディラック場方程式の一般解を導出する。結果として、アインシュタイン方程式を時空に通した大質量のディラック場のみを結合させ、質量のない場合、ディラック場は適切な制約を満たすために必要となる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 18:36:41 GMT)
GreenLight-Gym: A Reinforcement Learning Benchmark Environment for Greenhouse Crop Production Control [0.0]
強化学習(Reinforcement Learning, RL)は、温室管理を自動化するための制御ポリシーを学ぶための有望なアプローチである。我々は,現在最先端の温室モデルであるGreenLight上でRLアルゴリズムをトレーニングし,評価するために設計された,最初のオープンソース環境であるGreenLight-Gymを紹介する。第二に、州の境界を強制するために、乗法または加法的なペナルティを用いる2つの報酬形成アプローチを比較する。第3に,不随意トレーニングと気象データによるRL性能の評価を行い,未知条件への一般化を実証した。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 18:25:23 GMT)
Gibbs-preserving operations requiring infinite amount of quantum coherence [0.0]
熱力学的資源を必要とするギブス保存操作が無数に存在することを示す。我々の下限はほぼ緊密であり、実装するチャネルによって引き起こされるエネルギー変化に関連する量を特定している。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 01:55:49 GMT)
Geometry and Entanglement of Super-Qubit Quantum States [0.0]
零点と1つの超粒子状態の重ね合わせによって決定される超量子状態を導入する。 1つの量子ビット状態は、拡張された複素平原の点によって特徴づけられ、他の超ブロック球と等価である。超コヒーレントな状態はフェルミオンボソンが絡み合っており、状態の共起は2つの共起子の積である。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 05:11:47 GMT)
Gapped Clique Homology on weighted graphs is $\text{QMA}_1$-hard and contained in $\text{QMA}$ [0.0]
計算トポロジにおける古典問題の複雑性, ホモロジー問題について検討する。複雑性は量子複雑性クラスによって特徴づけられる。我々の結果は、ホモロジーと超対称量子力学の結びつきの側面と見なすことができる。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 23:00:19 GMT)
Functional Encryption in the Bounded Storage Models [0.0]
有界量子記憶モデル(BQSM)と有界古典記憶モデル(BCSM)の可能性について検討する。 BQSMでは,情報理論に基づくセキュリティを満足する非対話型関数暗号を$q=O(sqrts/r)$で構築する。 BCSMでは,情報理論的部分指数シミュレーションに基づくセキュリティを満足する非対話型関数暗号を構築している。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 20:19:20 GMT)
Exploring the Potential of Conversational Test Suite Based Program Repair on SWE-bench [0.0]
本研究では,SWE-Bench問題に対する会話パッチ生成の有効性を評価するための実験結果について報告する。実験によると、LLaMA 3.1 70Bに基づく単純な会話パイプラインは、47%のケースで有効なパッチを生成することができる。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 13:55:33 GMT)
Experimental Quantum Advantage in the Odd-Cycle Game [0.0]
奇数サイクルゲームの最初の実験例を報告する。 2m離れた2つのイオンを絡み合わせると、プレイヤーはそれらを使って、最高の古典的戦略で許される26シグマの確率でゲームに勝つ。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 15:48:32 GMT)
Efficient characterization of spatial Schmidt modes of multiphoton entangled states produced from high-gain parametric down-conversion [0.0]
我々は、空間シュミットモードと明るい光の多光子絡み合った状態のシュミットスペクトルの高効率な理論的、実験的特性を実証した。この結果から,シュミットモードの拡大とシュミットスペクトルの狭化が理論と実験の整合性の向上に寄与していることが明らかとなった。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 14:53:13 GMT)
Deep Learning Innovations for Underwater Waste Detection: An In-Depth Analysis [0.0]
本稿では, 埋立廃棄物処理とごみ処理の基盤となるため, 最先端のアーキテクチャと既存のデータセットを網羅的に検討する。第一の目的は、高度な水中センサーと自律型水中車両によって活用される物体の局所化手法のベンチマークを確立することである。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 10:07:08 GMT)
Decoding MIE: A Novel Dataset Approach Using Topic Extraction and Affiliation Parsing [0.0]
本研究は,医療情報学ヨーロッパ(MIE)会議の手続きから得られた新しいデータセットを紹介する。我々は,「健康技術・情報学研究」誌の4,606論文からメタデータと要約を抽出し,分析した。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 19:34:23 GMT)
Complexity is not Enough for Randomness [0.0]
ブラウン系におけるランダムネスの動的生成を、ハミルトニアンの局所性の度合いの関数として研究する。高度に非局所的な時間依存ハミルトニアンによって支配されるシステムであっても、ランダムネスの生成はシステムサイズにおいて指数関数的に長時間持続する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 16:10:15 GMT)
Comparative Evaluation of Learning Models for Bionic Robots: Non-Linear Transfer Function Identifications [0.0]
ロボットダイナミクスの制御とモデリングは、機械学習を用いたモデルフリー制御戦略をますます採用している。本研究では,モデルフリー制御の適用のための総合的な評価戦略とフレームワークを紹介する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 12:25:57 GMT)
Attention Shift: Steering AI Away from Unsafe Content [0.0]
本研究では, 最先端生成モデルにおける安全でない, 有害なコンテンツの生成について検討した。提案手法は,非安全概念を推論中に追加のトレーニングを伴わずに取り除くことを目的とした,新たなトレーニングフリーアプローチである。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 11:16:54 GMT)
Anomaly inflow, dualities, and quantum simulation of abelian lattice gauge theories induced by measurements [0.0]
従来の研究は、局所的な適応測定により、アーベル格子ゲージ理論の量子シミュレーションが達成できることを示した。本研究では, バルク内のSPT状態と境界に関する模擬ゲージ理論の分解相の間の異常流入機構を明示する。物質場を持つ格子ゲージ理論の測定に基づく量子シミュレーションのための資源状態と測定パターンを構築する。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 01:45:55 GMT)
Accelerating Biological Spatial Cluster Analysis with the Parallel Integral Image Technique [0.0]
本稿では,スライディングウィンドウ解析(SWA)における並列積分画像手法を提案する。小型画像では131,806倍,大規模画像では1万倍以上の高速化を実現している。
論文参考訳（メタデータ） (Sun, 06 Oct 2024 02:09:59 GMT)
AI Assistants for Incident Lifecycle in a Microservice Environment: A Systematic Literature Review [0.0]
本稿では、インシデントライフサイクルの異なるフェーズをサポートするように設計されたAIアシスタントに関する研究を体系的にレビューする。これはAIの成功した応用を強調し、現在の研究のギャップを特定し、AIによるインシデント管理を強化する将来の機会を提案する。
論文参考訳（メタデータ） (Sun, 6 Oct 2024 02:58:41 GMT)