InstantSplat: Sparse-view SfM-free Gaussian Splatting in Seconds [91.8] InstantSplatは、2〜3枚の画像から正確な3D表現を構築する、新規で高速なニューラルリコンストラクションシステムである。
InstantSplatは、フレーム間の密集したステレオ先行とコビジュアライザの関係を統合して、シーンを徐々に拡張することでピクセルアライメントを初期化する。
SSIMは3D-GSでCOLMAPよりも0.3755から0.7624に向上し、複数の3D表現と互換性がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:59:07 GMT)
Bidirectional Logits Tree: Pursuing Granularity Reconcilement in Fine-Grained Classification [89.2] 本稿では,粒度分類タスクにおけるグラニュラリティコンペティションの課題について述べる。
既存のアプローチは通常、共通のベースエンコーダから抽出された共有特徴に基づいて、独立した階層認識モデルを開発する。
グラニュラリティ再構成のための双方向ロジットツリー(BiLT)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:42:19 GMT)
Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures [87.8] スパースビューのRGB入力からのリアルタイム自由視点人体レンダリングは、センサー不足と厳しい時間予算のために難しい課題である。
最近の手法では、テクスチャ空間で動作する2次元CNNを活用して、レンダリングプリミティブを学習している。
本稿では,2重非プロジェクテッドテクスチャについて述べる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:57:38 GMT)
Numerical Pruning for Efficient Autoregressive Models [87.6] 本稿では,デコーダのみを用いた変圧器を用いた自己回帰モデルの圧縮に着目する。
具体的には,ニュートン法とモジュールの数値スコアをそれぞれ計算する学習自由プルーニング法を提案する。
提案手法の有効性を検証するため,理論的支援と広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:09:23 GMT)
RAG-Star: Enhancing Deliberative Reasoning with Retrieval Augmented Verification and Refinement [85.1] 既存の大規模言語モデル(LLM)は、例外的な問題解決能力を示すが、複雑な推論タスクに苦労する可能性がある。
検索情報を統合した新しいRAG手法である textbfRAG-Star を提案する。
Llama-3.1-8B-Instruct と GPT-4o を併用した実験により,RAG-Star は従来のRAG と推理法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:05:36 GMT)
RL-LLM-DT: An Automatic Decision Tree Generation Method Based on RL Evaluation and LLM Enhancement [82.0] RL評価とLLM強調に基づく自動決定木生成法であるRL-LLM-DTを提案する。
この統合手法の有効性を評価するため,カーリングゲームで実験を行った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:04:12 GMT)
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree [79.3] SAM2Longは、トレーニング不要のビデオオブジェクトセグメンテーションを改良した手法である。
各フレーム内のセグメンテーションの不確実性を考慮し、複数のセグメンテーション経路からビデオレベルの最適結果を選択する。
SAM2Longは、24の頭対頭比較で平均3.0点の改善を実現している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:22:55 GMT)
LazyDiT: Lazy Learning for the Acceleration of Diffusion Transformers [79.1] 拡散変換器は、様々な生成タスクの優越的なモデルとして登場してきた。
各拡散段階におけるモデル全体の実行は不要であることを示し、いくつかの計算は以前のステップの結果を遅延的に再利用することでスキップできることを示した。
遅延学習フレームワークを提案する。このフレームワークは,初期ステップからキャッシュされた結果を効率よく活用し,冗長な計算を省略する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:12:35 GMT)
SocREval: Large Language Models with the Socratic Method for Reference-Free Reasoning Evaluation [78.2] 我々は,参照フリー推論評価における新規な設計手法であるSocREvalを開発した。
SocREvalはGPT-4の性能を大幅に改善し、既存の参照フリーおよび参照ベース推論評価指標を上回っている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:56:45 GMT)
A Library for Learning Neural Operators [77.2] 我々は、演算子学習のためのオープンソースのPythonライブラリであるNeuralOperatorを紹介する。
ニューラルネットワークは有限次元ユークリッド空間の代わりに関数空間間の写像に一般化される。
PyTorch上に構築されたNeuralOperatorは、ニューラルオペレータモデルのトレーニングとデプロイのためのツールをすべて提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:15:33 GMT)
PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [77.0] PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:59:53 GMT)
Knowledge Boundary of Large Language Models: A Survey [75.7] 大規模言語モデル(LLM)はパラメータに膨大な量の知識を格納するが、特定の知識の記憶と利用に制限がある。
これは、LLMの知識境界を理解するための重要な必要性を強調している。
本稿では,LLM知識境界の包括的定義を提案し,知識を4つの異なるタイプに分類する形式化された分類法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:14:02 GMT)
Towards Comprehensive Post Safety Alignment of Large Language Models via Safety Patching [74.6] textscSafePatchingは包括的なPSAのための新しいフレームワークである。
textscSafePatchingはベースラインメソッドよりも包括的なPSAを実現する。
textscSafePatchingは、連続的なPSAシナリオにおいて、その優位性を示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:35:30 GMT)
Memory Efficient Matting with Adaptive Token Routing [73.1] トランスフォーマーベースのモデルは、最近、画像マッチングにおいて優れたパフォーマンスを達成している。
MeMatteは、高解像度画像を処理するためのtextbfMemory-textbfefficient textbfmattingフレームワークである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:37:34 GMT)
Electron-Electron Interactions in Device Simulation via Non-equilibrium Green's Functions and the GW Approximation [71.6] 電子-電子(e-e)相互作用は、量子輸送シミュレーションに明示的に組み込まれなければならない。
この研究は、非平衡条件下でのナノデバイスの大規模原子論的量子輸送シミュレーションを報告した最初のものである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:05:33 GMT)
More Tokens, Lower Precision: Towards the Optimal Token-Precision Trade-off in KV Cache Compression [71.4] KVプルーニングやKV量子化を含むKV圧縮法は、トークンまたは精度寸法に重点を置いている。
量子化プルーニング(quantized pruning)により,KVキャッシュにより多くのトークンを格納することで,LLMの長文性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:20:31 GMT)
Is Your World Simulator a Good Story Presenter? A Consecutive Events-Based Benchmark for Future Long Video Generation [71.3] 我々は、ストーリー指向のベンチマークであるStoryEvalを紹介し、テキスト・トゥ・ビデオ(T2V)モデルのストーリー・コンプリート機能を評価する。
StoryEvalは7つのクラスにまたがる423のプロンプトを備えている。
我々は、GPT-4VやLLaVA-OV-Chat-72Bといった高度な視覚言語モデルを用いて、生成されたビデオ内の各イベントの完了を検証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:00:42 GMT)
On the Impact of Hard Adversarial Instances on Overfitting in Adversarial Training [70.8] 敵の訓練は、敵の攻撃に対してモデルを強固にするための一般的な方法である。
本研究では,この現象をトレーニングインスタンスの観点から検討する。
逆行訓練における一般化性能の低下は、ハード・逆行例に適合した結果であることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:17:26 GMT)
MMTrail: A Multimodal Trailer Video Dataset with Language and Music Descriptions [69.9] MMTrailは,2000万回以上のトレーラークリップと視覚的キャプションを組み込んだ大規模マルチモーダルビデオ言語データセットである。
本稿では,27.1k時間以上のトレーラービデオで様々なモダリティアノテーションを実現するシステムキャプションフレームワークを提案する。
我々のデータセットは、大きめのマルチモーダル言語モデルトレーニングのためのパスを舗装する可能性がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:13:38 GMT)
NAVCON: A Cognitively Inspired and Linguistically Grounded Corpus for Vision and Language Navigation [66.9] NAVCONは2つの一般的なデータセット(R2RとRxR)の上に構築された大規模な注釈付きビジョンランゲージナビゲーション(VLN)コーパスである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:48:25 GMT)
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator [65.6] 大規模言語モデル(LLM)は、自然言語処理タスクの範囲で例外的な性能を示した。
特定の意味のない特別なトークン(セパレータ)は、意味的に意味のあるトークンと比較して注意点に不均等に寄与する。
SepLLMは,これらのセグメントを圧縮し,冗長なトークンを除去することによって推論を高速化する,プラグイン・アンド・プレイのフレームワークである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:41:59 GMT)
Proposer-Agent-Evaluator(PAE): Autonomous Skill Discovery For Foundation Model Internet Agents [64.8] Proposer-Agent-Evaluatorは、基礎モデルエージェントが野生のスキルを自律的に発見し、実践することを可能にする学習システムである。
PAEの中心となるタスクプロポーサは、エージェントがコンテキスト情報で実践するためのタスクを自律的に提案するコンテキスト対応タスクプロポーサである。
成功評価は、エージェントがRLを介してポリシーを洗練するための報酬信号として機能する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:59:50 GMT)
OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain [62.9] 金融分野において全方向自動RAGベンチマークであるOmniEvalを導入する。
我々のベンチマークは多次元評価フレームワークによって特徴づけられる。
実験では、広範囲なテストデータセットを含むOmniEvalの包括性を実証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:38:42 GMT)
Estimating Body and Hand Motion in an Ego-sensed World [62.6] 頭部装着装置から人体の動きを推定するシステムであるEgoAlloについて述べる。
エゴセントリックなSLAMポーズとイメージのみを使用して、EgoAlloは条件付き拡散モデルからサンプリングを行い、3Dボディポーズ、高さ、手のパラメータを推定する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:39:00 GMT)
DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback [62.2] DataEnvGymは、データ生成エージェントのための教師環境のテストベッドである。
エージェントとデータ生成エンジンを含むシーケンシャルな意思決定タスクとして、データ生成をフレーム化する。
学生は、生成されたデータに基づいて反復的に訓練され、評価され、各イテレーション後にエージェントにフィードバックが報告される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:54:45 GMT)
CoMT: A Novel Benchmark for Chain of Multi-modal Thought on Large Vision-Language Models [60.1] Chain of Multi-modal Thought (CoMT)ベンチマークは、視覚操作を本質的に統合する人間のような推論を模倣することを目的としている。
我々は様々なLVLMと戦略をCoMT上で評価し、現在のアプローチの能力と限界に関する重要な洞察を明らかにした。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:10:16 GMT)
DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation [60.1] ストーリーテリングビデオ生成(SVG)は、最近、長いマルチモーションのマルチシーンビデオを作成するタスクとして登場した。
本研究では,新しいストーリー・ツー・ビデオ生成手法であるDreamRunnerを提案する。
文字の整合性、テキストアライメント、スムーズな遷移における最先端性能を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:52:46 GMT)
ST-FiT: Inductive Spatial-Temporal Forecasting with Limited Training Data [59.8] 現実世界のアプリケーションでは、ほとんどのノードはトレーニング中に利用可能な時間データを持っていないかもしれない。
この問題に対処するために,ST-FiTというフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:29:37 GMT)
Expansion Span: Combining Fading Memory and Retrieval in Hybrid State Space Models [59.6] ハイブリッドアーキテクチャはステートスペースレイヤとアテンションを組み合わせたものだが、遠い過去を思い出すことはできない。
本研究では,過去から任意の距離から取得したトークンのアテンションコンテキストの一部を「保存」することにより,ハイブリッド状態のメモリ幅を拡大する手法について述べる。
また,SE-Attnにより,事前学習用モデルよりも最大8倍長のトークン列上で,事前学習型ハイブリッドモデルを効率的に適用できることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:55:42 GMT)
StreetCrafter: Street View Synthesis with Controllable Video Diffusion Models [59.6] 我々は,LDARポイントクラウドレンダリングをピクセルレベルの条件として利用する,制御可能なビデオ拡散モデルであるStreetCrafterを紹介する。
さらに、画素レベルのLiDAR条件を利用することで、ターゲットシーンに対して正確なピクセルレベルの編集を行うことができる。
我々のモデルは視点変化を柔軟に制御し、レンダリング領域を満たすためのビューを拡大する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:58:55 GMT)
Enhance Vision-Language Alignment with Noise [59.3] 本研究では,凍結モデルがカスタマイズノイズによって微調整可能であるか検討する。
ビジュアルエンコーダとテキストエンコーダの両方にノイズを注入することでCLIPを微調整できる正インセンティブノイズ(PiNI)を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:35:10 GMT)
VersaGen: Unleashing Versatile Visual Control for Text-to-Image Synthesis [59.1] 本稿では,テキスト・トゥ・イメージ(T2I)合成における多目的視覚制御を可能にする生成AIエージェントVersaGenを提案する。
我々は,凍結したT2Iモデルに適応器を訓練し,テキスト支配拡散プロセスに視覚情報を適応させる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:52:51 GMT)
A Knowledge-enhanced Pathology Vision-language Foundation Model for Cancer Diagnosis [58.9] 本稿では,疾患知識を階層型セマンティックグループ内のアライメントに組み込む知識強化型視覚言語事前学習手法を提案する。
KEEPはゼロショット癌診断タスクにおいて最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:45:21 GMT)
RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera Fusion [58.8] 本稿では3次元物体検出の精度を高めるために,Raar-Camera fusion transformer (RaCFormer)を提案する。
RaCFormerは64.9%のmAPと70.2%のNDSをnuScene上で達成し、LiDARベースの検出器よりも優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:47:48 GMT)
CFSynthesis: Controllable and Free-view 3D Human Video Synthesis [57.6] CFSynthesisは、カスタマイズ可能な属性で高品質なヒューマンビデオを生成するための新しいフレームワークである。
本手法はテクスチャ-SMPLに基づく表現を利用して,自由視点における一貫した,安定したキャラクタの出現を保証する。
複数のデータセットの結果から,複雑な人間のアニメーションにおいて,CFS合成が最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:23:03 GMT)
3D Gaussian Splatting: Survey, Technologies, Challenges, and Opportunities [57.4] 3D Gaussian Splatting (3DGS) は、3D表現の主流となる可能性を持つ顕著な手法として登場した。
本調査は,複数視点から既存の3DGS関連作品を分析することを目的としている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:15:54 GMT)
Detecting Document-level Paraphrased Machine Generated Content: Mimicking Human Writing Style and Involving Discourse Features [57.3] 機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。
これらの課題を克服するために、新しい方法論とデータセットを導入します。
人間の筆記スタイルをエミュレートするエンコーダデコーダモデルであるMhBARTを提案する。
また,PDTB前処理による談話解析を統合し,構造的特徴を符号化するモデルであるDTransformerを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:47:41 GMT)
Can Large Language Models Understand You Better? An MBTI Personality Detection Dataset Aligned with Population Traits [57.2] MBTIBenchは,ソフトラベルを用いた手動による高品質なMBTI人格検出データセットである。
最初の課題として、MBTIBenchは、データの29.58%を占める不正なラベル付け問題を効果的に解決している。
得られたソフトレーベルは、非極度の性格特性を持つ人がもっといることを確認した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:46:51 GMT)
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking [56.9] 本研究は, 応答における2つの重要なスタイル的要素, 言語形式と指導的前提を同定する。
そこで我々は,SCAR(Style Consistency-Aware Response Ranking)を導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:33:12 GMT)
SCANS: Mitigating the Exaggerated Safety for LLMs via Safety-Conscious Activation Steering [56.9] 悪意のある命令から脅威を守るために、LLM(Large Language Models)には安全アライメントが不可欠である。
近年の研究では、過大な安全性の問題により、安全性に配慮したLCMは、良質な問い合わせを拒否する傾向にあることが明らかになっている。
過大な安全性の懸念を和らげるために,SCANS法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:32:36 GMT)
Distributed satellite information networks: Architecture, enabling technologies, and trends [56.7] 分散衛星情報ネットワーク(DSIN)は、多様な衛星システム間での情報ギャップを埋める革新的なアーキテクチャとして登場した。
この調査はまず、DSINの革新的なネットワークアーキテクチャに関する深い議論を提供する。
DSINは、ネットワークの不均一性、予測不可能なチャネルダイナミクス、スパースリソース、分散コラボレーションフレームワークといった課題に直面している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:44:05 GMT)
ELDER: Enhancing Lifelong Model Editing with Mixture-of-LoRA [55.7] 大規模言語モデル(LLM)は、特定の知識を効率的に更新し、事実の誤りを避けるためにモデル編集を必要とする。
従来のアプローチでは、元のパラメータを凍結し、知識更新毎に新しいパラメータを個別に割り当てることで、シーケンシャルな編集を管理する。
本稿では,データとアダプタを連続的に関連付ける新しい手法であるELDERを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:59:22 GMT)
DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.5] 我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:14:03 GMT)
Move-in-2D: 2D-Conditioned Human Motion Generation [54.1] そこで我々は,シーンイメージに条件付けされた人間の動作シーケンスを生成する新しい手法であるMove-in-2Dを提案する。
本手法はシーンイメージとテキストプロンプトの両方を入力として受け入れ,シーンに合わせた動作シーケンスを生成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:58:07 GMT)
Subversion Strategy Eval: Evaluating AI's stateless strategic capabilities against control protocols [53.5] 以前の作業では、AIが人間書きの戦略に従うような、人間とAIのレッドチームでプロトコルを転向させることで、プロトコルを評価していた。
本稿では、プライベートメモリなしで動作しながら制御プロトコルを変換する戦略において、AIシステムがいかにうまく機能するかを検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:33:45 GMT)
Impression-Aware Recommender Systems [53.5] 本稿ではインプレッションを用いたレコメンデーションシステムに関する体系的な文献レビューを行う。
本稿では,印象型レコメンデーションシステムと,印象型レコメンデーションシステムという,パーソナライズされたレコメンデーションのための新しいパラダイムを論じる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:14:25 GMT)
SceneX: Procedural Controllable Large-scale Scene Generation [52.5] 本稿では,デザイナーのテキスト記述に従って高品質な手続きモデルを自動生成するSceneXを紹介する。
提案手法はPCGHubとPCGPlannerの2つのコンポーネントからなる。
後者の目的は、Blenderがユーザの指示によって誘導される制御可能で正確な3Dアセットを生成するために実行可能なアクションを生成することである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:39:07 GMT)
Unleashing the Power of Pre-trained Language Models for Offline Reinforcement Learning [51.0] 本稿では、オフラインRL用の決定変換器をベースとした一般的なフレームワークである、$textbfMo$tion Control(textbfLaMo$)のための$textbfLanguage Modelsを紹介する。
私たちのフレームワークは4つの重要なコンポーネントを強調しています。
逐次事前学習したLMを用いた決定変換器の初期化(2)LoRA微細調整法を用いて
特に,本手法は,限られたデータサンプルを持つシナリオにおいて,優れた性能を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:59:44 GMT)
Core Context Aware Attention for Long Context Language Modeling [50.8] 本稿では,CCA(Core Context Aware)アテンションを効果的に長距離コンテキストモデリングのためのプラグイン・アンド・プレイとして提案する。
CCA-Attentionは、計算効率と長文モデリング能力の観点から、最先端モデルよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:54:08 GMT)
Powering a quantum clock with a non-equilibrium steady state [50.2] 積分可能な量子スピンチェーンの定常状態によって提供される非熱的資源を用いた量子時計の電力化を提案する。
量子スピン鎖の実験的な例を用いて、最適性能には相転移点を渡ることが不可欠である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:25:11 GMT)
Gender Bias and Property Taxes [50.2] 我々は、10万人以上の不動産税告訴審理記録と2.7年以上の関連音声記録を分析した。
女性のアパレルは、聴聞会で男性アパレルよりも体系的に劣る。
我々の結果は、性別バイアスは、少なくとも部分的には、ABBパネリストの一部に関する無声の信念と認識によって引き起こされるという考え方と一致している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:14:23 GMT)
CrAM: Credibility-Aware Attention Modification in LLMs for Combating Misinformation in RAG [50.0] Retrieval-Augmented Generation (RAG)は、外部文書を参照することにより、LLM(Large Language Models)の幻覚を軽減することができる。
この問題に対処するために,我々は「クレディビリティ・アウェアRAG」の課題を探求する。
我々は$textbfCr$edibility-aware $textbfA$ttention $textbfM$odification (CrAM)というプラグイン・アンド・プレイ方式を導入する。
Llama2-13B, Llama3-8B, Qwen1.5-7Bを用いた経時的質問とトリビアQA実験
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:11:19 GMT)
Unsupervised Region-Based Image Editing of Denoising Diffusion Models [50.0] 本研究では,事前学習した拡散モデルの潜在空間における意味的属性を,それ以上の訓練を伴わずに同定する手法を提案する。
提案手法により,局所的なマスキング領域の正確な意味発見と制御が容易になり,アノテーションの必要がなくなる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:46:12 GMT)
Dyn-HaMR: Recovering 4D Interacting Hand Motion from a Dynamic Camera [49.8] Dyn-HaMRは、野生のダイナミックカメラで撮影されたモノクロビデオから4Dグローバルハンドモーションを再構築する最初のアプローチである。
提案手法は,4次元メッシュ・リカバリにおいて最先端の手法を著しく上回ることを示す。
これにより、動くカメラでモノクロビデオから手の動きを復元するための新しいベンチマークが確立される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:43:10 GMT)
Graph Spring Neural ODEs for Link Sign Prediction [49.7] 本稿では,春の力によってモデル化されたグラフスプリングネットワーク(GSN)と呼ばれる新しいメッセージパッシング層アーキテクチャを提案する。
提案手法は,大規模グラフ上で最大28,000のノード生成時間高速化係数を持つ最先端手法に近い精度を実現する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:50:20 GMT)
XTransplant: A Probe into the Upper Bound Performance of Multilingual Capability and Culture Adaptability in LLMs via Mutual Cross-lingual Feed-forward Transplantation [49.7] 現在の大規模言語モデル(LLM)は多言語能力と文化的適応性に不均衡を示すことが多い。
本稿では,言語間フィードフォワード移植による言語間遅延相互作用を探索するXTransplantという探索手法を提案する。
我々は,LLMの多言語能力と文化的適応性の両方が,XTransplantによって大幅に改善される可能性を持っていることを実証的に証明した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:05:30 GMT)
Uncertainty-Aware Hybrid Inference with On-Device Small and Remote Large Language Models [49.5] 本稿では,無線ネットワークの基地局 (BS) にホストされる大規模言語モデル (LLM) とモバイル端末で動作する小型言語モデル (SLM) を統合するハイブリッド言語モデル (HLM) アーキテクチャについて検討する。
本研究では,不確実性を考慮したHLM (Uncertainty-aware HLM) という新しいHLM構造を提案し,SLMはその出力不確かさを局所的に測定し,受信される可能性のあるトークンに対するアップリンク送信とLLM操作の両方を省略する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:08:18 GMT)
Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan Election [49.4] Uchaguzi-2022は、2022年のケニア総選挙に関する14kの分類と地理タグ付き市民報告のデータセットである。
このデータセットを使用して、言語モデルがレポートの分類とジオタグ化に役立てられるかどうかを調査し、AI for Social Goodスペースにおけるその可能性を強調します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:08:35 GMT)
4DRGS: 4D Radiative Gaussian Splatting for Efficient 3D Vessel Reconstruction from Sparse-View Dynamic DSA Images [49.2] 既存の手法は、しばしば最適以下の結果を生成するか、過剰な計算時間を必要とする。
高品質な高精細化を実現するため、4次元ガウススプラッティング(4DRGS)を提案する。
4DRGSは5分間のトレーニングで印象的な結果を得る。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:51:56 GMT)
ChatDiT: A Training-Free Baseline for Task-Agnostic Free-Form Chatting with Diffusion Transformers [48.7] ChatDiTはゼロショットで汎用的でインタラクティブなビジュアル生成フレームワークである。
ユーザはChatDiTと対話して、インターリーブされたテキストイメージの記事を作成したり、複数ページの絵本を作成したり、画像を編集したり、IPデリバティブを設計したり、文字設計の設定を開発することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:03:05 GMT)
Dense Audio-Visual Event Localization under Cross-Modal Consistency and Multi-Temporal Granularity Collaboration [48.6] CMCC(Cross-Modal Consistency ulCollaboration)とMTGC(Multi-Temporal Granularity ulCollaboration)の2つのコアモジュールからなる新しいulCCNetを導入する。
CMCCモジュールは、オーディオと視覚の関係のエンコーディングを通じて、モジュール間の一貫性のあるイベントセマンティクスの集約を容易にする。
MTGCモジュールは、粗い時間的特徴ときめ細かい時間的特徴の双方向サポートを提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:43:36 GMT)
DnDScore: Decontextualization and Decomposition for Factuality Verification in Long-Form Text Generation [48.1] 分解と非文脈化は独立に研究されているが、完全なシステムにおける相互作用は研究されていない。
我々は、異なる分解、非文脈化、検証戦略の評価を行い、戦略の選択が結果の事実性スコアに重要であることを確認する。
DnDScoreは文脈情報の文脈におけるサブ文の検証を行う非コンテクスト化対応検証手法である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:54:01 GMT)
3D MedDiffusion: A 3D Medical Diffusion Model for Controllable and High-quality Medical Image Generation [47.7] 制御可能な高品質な3次元医用画像生成のための3Dメディカルディフュージョン(3Dメドディフュージョン)モデル
3D MedDiffusionは、パッチワイドエンコーディングによって医療画像を潜在空間に圧縮する、新しくて高効率なPatch-Volume Autoencoderを組み込んでいる。
3D MedDiffusion は, 再生品質において最先端の手法を超越し, スパースビューCT再構成, 高速MRI再構成, データ拡張などのタスクに強い一般化性を示すことを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:25:40 GMT)
Beyond Scaleup: Knowledge-aware Parsimony Learning from Deep Networks [47.7] トレーニングデータセット、学習可能なパラメータ、計算能力のブルートフォーススケールアップは、より堅牢な学習モデルを開発するための一般的な戦略となっている。
本稿では、より単純なモデルでより大きな可能性を実現するために、同種の方法でこの問題に対処しようと試みる。
鍵となるのは、純粋にスケールアップに頼るのではなく、記号、論理、公式といったドメイン固有の知識を使ってモデルを駆動することだ。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:30:46 GMT)
LLM is Knowledge Graph Reasoner: LLM's Intuition-aware Knowledge Graph Reasoning for Cold-start Sequential Recommendation [47.3] 大規模言語モデル(LLM)は、Webデータから学習された豊富な知識を持つデータベースとみなすことができる。
LLMの直感認識型知識グラフ推論モデル(LIKR)を提案する。
本モデルは,コールドスタートシーケンシャルレコメンデーションシナリオにおいて,最先端レコメンデーション手法より優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:52:15 GMT)
Step-Calibrated Diffusion for Biomedical Optical Image Restoration [47.2] 再生ステップ校正拡散(Resorative Step-Calibrated Diffusion、RSCD)は、拡散に基づく画像復元法である。
RSCDは、画像品質と知覚評価の両方において、他の広く使われている未使用画像復元方法よりも優れている。
RSCDは、自動脳腫瘍診断や深部組織イメージングなど、下流の臨床画像タスクのパフォーマンスを改善する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:17:00 GMT)
Activating Distributed Visual Region within LLMs for Efficient and Effective Vision-Language Training and Inference [46.0] LVLM(Large Vision-Language Models)は通常、視覚的な命令チューニングを通じて視覚能力を学ぶ。
認知的中核として機能するLDMにおける類似のテクスト視覚領域の存在について検討する。
本稿では,視覚領域外における非臨界層を除去し,性能損失を最小限に抑える,新しい視覚領域ベースプルーニングパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:44:47 GMT)
Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback [45.8] Oniは分散アーキテクチャで、RLポリシーと本質的な報酬関数を同時に学習する。
提案手法は,NetHack 学習環境から得られる,難易度の高い報奨課題にまたがって,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:29:46 GMT)
Enhancing Vision-Language Models with Scene Graphs for Traffic Accident Understanding [45.7] 本研究は、交通シーンを特定の事故タイプに分類することに焦点を当てている。
交通シーンをグラフとして表現することで,車などの物体をノードとして表現し,その間の相対距離や方向をエッジとして表現することで,この問題に対処する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:14:23 GMT)
Reinforcement Learning Enhanced LLMs: A Survey [45.6] 本稿では,RL強化言語モデルに関する最新の知識を体系的にレビューする。
本稿では、RLの基礎を詳述し、人気のあるRL強化LLMを紹介し、広く使われている2つの報酬モデルに基づくRL技術について検討する。
既存のメソッドの現在の課題や欠陥についても指摘し、さらなる改善の道筋をいくつか提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:05:11 GMT)
Can Large Language Models Improve the Adversarial Robustness of Graph Neural Networks? [45.6] グラフニューラルネットワーク(GNN)は、特にトポロジの摂動に対して、敵対的な攻撃に対して脆弱である。
LLMに基づく頑健なグラフ構造推論フレームワーク LLM4RGNN を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:01:23 GMT)
TimeCHEAT: A Channel Harmony Strategy for Irregularly Sampled Multivariate Time Series Analysis [45.3] チャネル非依存(CI)とチャネル依存(CD)戦略は、ローカルおよびグローバルに適用することができる。
本稿では,Channel Harmony ISMTS Transformer(TimeCHEAT)を紹介する。
グローバルに、CI戦略はパッチを越えて適用され、Transformerは各チャネルの個別の注意パターンを学ぶことができる。
実験の結果,提案するTimeCHEATは,3つのメインストリームタスクにまたがる競合SOTA性能を示すことがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:10:02 GMT)
Artificial Intelligence in Industry 4.0: A Review of Integration Challenges for Industrial Systems [45.3] サイバー物理システム(CPS)は、予測保守や生産計画を含むアプリケーションに人工知能(AI)が活用できる膨大なデータセットを生成する。
AIの可能性を実証しているにもかかわらず、製造業のような分野に広く採用されていることは依然として限られている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:35:35 GMT)
Dynamical Aharonov-Bohm cages and tight meson confinement in a $\mathbb{Z}_2$-loop gauge theory [45.0] 相互接続ループと動的に$mathbbZ$電荷を持つ$mathbbZ$格子ゲージ理論(LGT)の有限密度位相について検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:26:24 GMT)
Aria: An Open Multimodal Native Mixture-of-Experts Model [44.8] Ariaはオープンなマルチモーダルネイティブモデルであり、様々なマルチモーダル、言語、コーディングタスクで最高のパフォーマンスを発揮する。
Pixtral-12BとLlama3.2-11Bを上回り、様々なマルチモーダルタスクにおける最高のプロプライエタリモデルと競合する。
私たちは、Ariaの実際のアプリケーションへの導入と適応を容易にするパイプラインとともに、モデルの重みをオープンソースにしています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:13:18 GMT)
GaussTR: Foundation Model-Aligned Gaussian Transformer for Self-Supervised 3D Spatial Understanding [44.7] 本稿では,ガウス変換器であるガウスTRを導入し,自己教師付き3次元空間理解を推し進める。
GaussTRはTransformerアーキテクチャを採用し、フィードフォワード方式でシーンを表現する3Dガウスのスパースセットを予測する。
Occ3D-nuScenesデータセットの実証評価では、ガウスTRの最先端のゼロショット性能が示されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:59:46 GMT)
ASAP: Advancing Semantic Alignment Promotes Multi-Modal Manipulation Detecting and Grounding [44.5] マルチモーダルメディア操作(DGM4)の検出とグラウンド化のための新しいフレームワークASAPを提案する。
検出と接地を正確に操作するためには,画像とテキスト間の細粒度間のセマンティックアライメントが不可欠である。
我々は,MLLM(Large Language Models)とLLM(Large Language Models)を用いて,ペア画像とテキストのペアを構築する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:33:06 GMT)
F-Bench: Rethinking Human Preference Evaluation Metrics for Benchmarking Face Generation, Customization, and Restoration [44.5] 我々は、人間の好みを反映したきめ細かい品質アノテーションを備えたAI生成顔画像の大規模かつ包括的なデータベースFaceQを紹介する。
FaceQデータベースは、(1)顔生成、(2)顔のカスタマイズ、(3)顔の復元という3つのタスクで29のモデルで生成された12,255のイメージで構成されている。
180のアノテータから32,742の平均世論スコア(MOS)が含まれており、品質、信頼性、IDの忠実さ、テキスト画像の対応性など多岐にわたって評価されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:28:48 GMT)
Unveiling the Ignorance of MLLMs: Seeing Clearly, Answering Incorrectly [44.3] MLLM(Multimodal Large Language Models)は、マルチモーダルタスクにおいて顕著な性能を示す。
MLLMは、視覚的内容を理解した場合でも、誤った回答をしばしば生成することを示す。
テキストと視覚的プロンプトを精細化し,デコード中の視覚的コンテンツに焦点を当てることを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:48:10 GMT)
Neural Degradation Representation Learning for All-In-One Image Restoration [44.2] 複数の劣化に対処するオールインワン画像復元ネットワークを提案する。
我々は、様々な劣化の基盤となる特徴を捉える神経分解表現(NDR)を学習する。
我々は,NDRに基づく特定の劣化を効果的に認識し,活用するための劣化クエリモジュールと劣化インジェクションモジュールを開発した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:44:49 GMT)
LLMCL-GEC: Advancing Grammatical Error Correction with LLM-Driven Curriculum Learning [44.0] 大規模言語モデル(LLM)は、特定の自然言語処理(NLP)タスクにおいて顕著な機能を示した。
しかし、文法的誤り訂正(GEC)のような特定の領域の特殊モデルと比較しても、まだ習熟性に欠ける可能性がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:09:07 GMT)
Motion-2-to-3: Leveraging 2D Motion Data to Boost 3D Motion Generation [43.9] 人間の2Dビデオは、幅広いスタイルやアクティビティをカバーし、広範にアクセス可能なモーションデータのソースを提供する。
本研究では,局所的な関節運動をグローバルな動きから切り離し,局所的な動きを2次元データから効率的に学習する枠組みを提案する。
提案手法は,2次元データを効率的に利用し,リアルな3次元動作生成をサポートし,支援対象の動作範囲を拡大する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:34:52 GMT)
Optimal Control Operator Perspective and a Neural Adaptive Spectral Method [43.7] 最適制御問題(OCP)は、コスト関数が最適化されるような動的システムの制御関数を見つけることである。
本稿では,OCPをワンショットで解決する新しいインスタンス・ソリューション・コントロール・オペレーター・パースペクティブを提案する。
合成環境と実世界のデータセットの実験により、我々のアプローチの有効性と効率が検証された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:06:34 GMT)
Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study [43.3] 我々は、PCGデータを生成するために、最先端の3つの生成モデルを採用し、比較する。
その結果,生成したPCGデータは元のデータセットによく似ていることがわかった。
今後の研究では、この手法をデータ拡張パイプラインに組み込んで、異常なPCG信号を心臓の大腿骨で合成する予定である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:07:40 GMT)
LMUnit: Fine-grained Evaluation with Natural Language Unit Tests [43.1] 応答品質を明示的でテスト可能な基準に分解するパラダイムである自然言語単体テストを導入する。
このパラダイムは、アノテーション間の合意を大幅に改善し、より効果的な開発を可能にする。
LMUnitは、評価ベンチマークとRewardBenchの競争結果で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:01:15 GMT)
Large Language Model-Brained GUI Agents: A Survey [42.8] マルチモーダルモデルはGUI自動化の新しい時代を支えてきた。
彼らは自然言語理解、コード生成、視覚処理において例外的な能力を示した。
これらのエージェントはパラダイムシフトを表しており、ユーザーは単純な会話コマンドで複雑なマルチステップタスクを実行できる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:35:56 GMT)
Boosting Long-Context Information Seeking via Query-Guided Activation Refilling [42.7] 本稿では,クエリ誘導型Activation Refilling (ACRE) を用いた長文情報検索タスクの処理手法を提案する。
ACREは2つのキャッシュ間のプロキシ関係を確立し、入力クエリがL1キャッシュに参加し、L2キャッシュから関連するエントリを動的にリフィルする。
様々な長文情報検索の実験は、ACREの有効性を示し、性能と効率の両方の改善を実現している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:43:54 GMT)
SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents [42.7] LLMエージェントの安全性を考慮したタスク計画のための新しいベンチマークであるSafeAgentBenchを紹介する。
最高のパフォーマンスのベースラインは、安全なタスクで69%の成功率を得るが、有害なタスクでは5%の拒絶率しか得られない。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:55:58 GMT)
LLM-based Discriminative Reasoning for Knowledge Graph Question Answering [42.3] 生成事前学習型トランスフォーマーに基づく大規模言語モデル(LLM)は,知識グラフ質問応答タスクにおいて顕著な性能を達成している。
サブグラフ検索と解答推論を明示的にモデル化するLLMに基づく識別推論(LDR)手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:07:16 GMT)
Pure state entanglement and von Neumann algebras [41.9] 我々は、フォン・ノイマン代数の交換で表される二部量子系に対する局所演算の理論と古典的通信(LOCC)を開発する。
我々の中心的な成果はニールセンの定理の拡張であり、二分極純状態のLOCC順序はそれらの制限のメジャー化と等価である、と述べている。
付録では、半有限フォン・ノイマン代数と$sigma$-finite測度空間上の偏化の自己完備な処理を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:05:47 GMT)
MagicPIG: LSH Sampling for Efficient LLM Generation [41.8] 以上の結果から,TopKの注意力自体が特定の下流タスクの品質低下に悩まされていることが分かる。
局所感性ハッシュ(LSH)に基づく異種システムMagicPIGを提案する。
MagicPIGは、さまざまなタスクに対して高い精度を維持しながら、注意の負荷を大幅に削減する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:56:26 GMT)
AnyAttack: Targeted Adversarial Attacks on Vision-Language Models toward Any Images [41.0] 我々は、ラベル管理なしでビジョンランゲージモデルに対してターゲットとなる敵画像を生成する自己教師型フレームワークであるAnyAttackを提案する。
我々のフレームワークは、大規模LAION-400Mデータセットで事前学習された逆雑音発生器を用いて、事前学習と微調整のパラダイムを採用している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:32:04 GMT)
LLMs are Also Effective Embedding Models: An In-depth Overview [40.5] 大規模言語モデル(LLM)は、様々なタスクで最先端のパフォーマンスを達成することによって、自然言語処理に革命をもたらした。
近年、埋め込みモデルとしての有効性が注目され、ELMoやBERTのような従来のエンコーダのみのモデルから、GPT、LLaMA、Mistralのようなデコーダのみの大規模LLMへとパラダイムシフトした。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:48:24 GMT)
WaterPark: A Robustness Assessment of Language Model Watermarking [40.5] WaterParkは10の最先端の透かしと12の代表的な攻撃を統合する統合プラットフォームである。
我々は既存の透かしを総合的に評価し、様々な設計選択が攻撃の堅牢性に与える影響を明らかにする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:30:32 GMT)
Make Imagination Clearer! Stable Diffusion-based Visual Imagination for Multimodal Machine Translation [40.4] 本稿では,多モーダル大言語モデル (MLLM) に安定な拡散に基づくイマジネーションネットワークを導入し,各元文の画像を明示的に生成する。
我々は、生成した画像と原文との整合性を確保するために、強化学習による人間のフィードバックを構築する。
実験結果から,本モデルは既存のマルチモーダルMTとテキストのみのMTよりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:41:23 GMT)
LossLens: Diagnostics for Machine Learning through Loss Landscape Visual Analytics [40.4] LossLensは視覚分析フレームワークで、複数のスケールでロスランドスケープを探索する。
LossLensの2つのケーススタディは、残差接続がResNet-20にどのように影響するかを視覚化し、物理的パラメータが単純な対流問題を解決する物理情報ニューラルネットワーク(PINN)にどのように影響するかを可視化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:40:06 GMT)
Whispers in Grammars: Injecting Covert Backdoors to Compromise Dense Retrieval Systems [40.1] 本稿では,攻撃者が検索システムを誤認して攻撃者の特定内容を検索する新たな攻撃シナリオについて検討する。
これらのコンテンツは、攻撃者によって検索コーパスに注入され、ヘイトスピーチやスパムのような有害なテキストを含むことができる。
モデル重みに頼り、顕著で不自然な出力を生成する従来の手法とは異なり、文法エラーによって引き起こされる隠れたバックドア攻撃を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:54:32 GMT)
Multi-modal and Multi-scale Spatial Environment Understanding for Immersive Visual Text-to-Speech [39.7] M2SE-VTTSは、環境イメージを音声コンテンツに対する残響音声の合成のプロンプトとすることを目的としている。
没入型VTTSを実現するためのマルチモーダル・マルチスケール空間環境理解手法を提案する。
本モデルは,環境音声生成における先進的ベースラインよりも優れる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:50:05 GMT)
High quality quasinormal modes of phononic crystals for quantum acoustodynamics [39.6] そこで本研究では,ブラッグミラーの間に配置されたフォノン結晶からなる構造を提案する。
この構造は、同じ大きさの音響結晶の60倍のQ因子を有する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:56:29 GMT)
Classical simulation of circuits with realistic Gottesman-Kitaev-Preskill states [39.6] 本稿では,回路を符号化した Gottesman-Kitaev-Preskill 状態でシミュレートするアルゴリズムを提案する。
私たちのアプローチは、最も困難なが実際は関係のある体制において、特に効果的であるように調整されています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:00:28 GMT)
DSGram: Dynamic Weighting Sub-Metrics for Grammatical Error Correction in the Era of Large Language Models [39.5] 大規模言語モデル(LLM)に基づく文法的誤り訂正(GEC)モデルは、提供された金の参照から分岐する修正を生成することが多い。
この不一致は、従来の基準ベースの評価指標の信頼性を損なう。
本稿では,GECモデル,DSGram,Semantic Coherence,Edit Level,Fluencyを統合し,動的重み付け機構を活用する新しい評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:54:16 GMT)
MultiLingPoT: Enhancing Mathematical Reasoning with Multilingual Program Fine-tuning [39.3] Program-of-Thought (PoT) は、自然言語を推論の中間ステップとして使うことを目的としている。
本稿では,多言語プログラム推論手法であるMultiLingPoTを提案する。
実験の結果,MultiLingPoTの学習は各プログラムの数学的推論を約2.5%改善することがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:14:03 GMT)
AsyncSC: An Asynchronous Sidechain for Multi-Domain Data Exchange in Internet of Things [38.9] IoTマルチドメインデータ交換のための現在のSOTA(State-of-the-art)スキームは、同期ネットワークの必要性によって制約される。
本稿では非同期サイドチェーン構築方式であるAsyncSCを提案する。
その結果、AsyncSCはSOTAスキームよりも優れ、スループットを平均1.21倍から3.96倍改善し、トランザクションレイテンシを59.76%から83.61%削減し、リソースオーバーヘッドを同等に維持している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:43:37 GMT)
Structured Unrestricted-Rank Matrices for Parameter Efficient Fine-tuning [38.8] 構造化非制限ランク行列(SURM)に基づく効率的なパラメータ微調整(PEFT)のためのフレームワークを提案する。
SURMは、LoRAの低ランク行列を置換しながら、様々な画像分類タスクにおいて5-7%の精度向上を実現している。
また、GLUEベンチマークでは、アダプタのパラメータ数を最大12倍に削減する(ほぼ品質が低下する)。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:11:27 GMT)
WHAT-IF: Exploring Branching Narratives by Meta-Prompting Large Language Models [38.7] WHAT-IFは、ゼロショットメタプロンプティングを使用して、事前に書かれたストーリーから分岐物語を作成するシステムである。
このシステムはコヒーレントでよく構造化された代替ストーリーラインを生成する。
ブランチプロットツリーをグラフに格納し、ストーリーの追跡と最終的なIFシステムの構造の促進と維持を支援する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:56:50 GMT)
Are Your LLMs Capable of Stable Reasoning? [38.0] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な進歩を示している。
しかし、ベンチマークパフォーマンスと実世界のアプリケーションの間には大きな違いがある。
G-Pass@kはモデルの性能を連続的に評価する新しい評価指標である。
本稿では,挑戦的,現代数学的な問題からなる動的ベンチマークであるLiveMathBenchを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:12:47 GMT)
Transferable and Forecastable User Targeting Foundation Model [37.5] 産業用グレードで、転送可能で、予測可能なユーザターゲティング基盤モデルであるFINDを提案する。
クロスドメイン転送性を向上させるため,異種マルチシナリオユーザデータを統合した。
予測可能性の向上のために、ユーザ毎のテキスト記述は、期待される将来の振る舞いに基づいて導出される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:05:09 GMT)
DISC: Plug-and-Play Decoding Intervention with Similarity of Characters for Chinese Spelling Check [37.4] 中国語スペルチェック(CSC)モデルのための軽量なプラグアンドプレイDECモジュールを提案する。
DISCは文字間の音声的類似度とグリフ的類似度を測定し、推論フェーズのみにこの類似度情報を組み込む。
3つのCSCベンチマーク実験により,提案手法はモデル性能を著しく向上し,現在の最先端モデルに近づき,さらに超えることを示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:44:06 GMT)
Compressed Chain of Thought: Efficient Reasoning Through Dense Representations [37.4] CoT(Chain-of- Thought)デコーディングにより、言語モデルでは、デコーディングにおける高ジェネレーションレイテンシーを犠牲にして、推論性能を改善することができる。
最近の提案では、推論時に特別なトークンを参照して、余分な計算を可能にするコンテプショントークンの変種について検討している。
本稿では,CCoT(Compressed Chain-of-Thought)を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:50:33 GMT)
Surgical Workflow Recognition and Blocking Effectiveness Detection in Laparoscopic Liver Resections with Pringle Maneuver [37.3] 腹腔鏡下肝切除におけるプリングル手術 (PM) は, 出血を減少させ, 明確な手術観を提供することを目的としている。
ワークフロー認識とブロック有効性検出の2つの補完的AI支援手術モニタリングタスクを提案する。
本研究は腹腔鏡下肝外科領域における臨床応用の可能性について検討した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:58:18 GMT)
Towards Effective Graph Rationalization via Boosting Environment Diversity [37.2] 本稿では,環境多様性の促進 (GRBE) によるグラフ合理化手法を提案する。
GRBEは、環境サブグラフの多様性を改善するために、元のグラフ空間で強化されたサンプルを生成する。
ベンチマークデータセットの合理化と分類性能における平均7.65%と6.11%の改善は、GRBEが最先端アプローチよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:04:38 GMT)
Modality-Inconsistent Continual Learning of Multimodal Large Language Models [37.2] マルチモーダル大言語モデル(MLLM)のための新しい連続学習シナリオであるMICL(Modality-Inconsistent Continual Learning)を導入する。
既存の視覚のみやモダリティの増分設定とは異なり、MICLはモダリティとタスクタイプのシフトを組み合わせており、どちらも破滅的な忘れを招いている。
本稿では, Pseudo Targets Generation Module を用いて, 以前見られたタスクタイプシフトによる忘れを軽減した MoInCL を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:13:56 GMT)
NLSR: Neuron-Level Safety Realignment of Large Language Models Against Harmful Fine-Tuning [37.0] ユーザによってアップロードされた悪意のあるデータのごく一部は、微調整プロセスを微妙に操作できるため、アライメントが壊れたモデルになる。
既存の微調整攻撃に対抗する方法は、典型的にはかなりの計算資源を必要とする。
textbfNeuron-textbfLevel textbfSafety textbfRealignmentを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:59:04 GMT)
Extending LLMs to New Languages: A Case Study of Llama and Persian Adaptation [36.9] 我々は,大言語モデル(LLM)に新しい言語,すなわちペルシア語を追加することを研究する。
我々は単言語ペルシャ語のデータの事前学習を含む多段階的アプローチを採用する。
生成タスクと分類タスクにおいて,各段階でのモデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:18:06 GMT)
$C^2$: Scalable Auto-Feedback for LLM-based Chart Generation [36.9] 参照不要な自動フィードバックジェネレータを導入し,人的介入のコストを削減した。
最初の実験では、回答者の74%が強く好んでおり、10%がフィードバック後の結果を好んだ。
ChartUIE-8Kは、クエリ、データセット、チャートタイプを増やすことで、データの多様性を大幅に改善する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:03:10 GMT)
ESOD: Efficient Small Object Detection on High-Resolution Images [36.8] 小さなオブジェクトは通常、わずかに分散され、局所的にクラスタ化される。
画像の非対象背景領域において、大量の特徴抽出計算を無駄にする。
本稿では,検出器のバックボーンを再利用して,特徴レベルのオブジェクト探索とパッチスライシングを行う方法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:17:51 GMT)
StoryWeaver: A Unified World Model for Knowledge-Enhanced Story Character Customization [36.1] 本稿では,様々なストーリー関連知識を包括的に表現した新しい知識グラフ,すなわちキャラクタグラフ(textbfCG)を提案する。
次に、リッチテキストセマンティクスと一貫したストーリー視覚化が可能な、キャラクタグラフ(textbfC-CG)によるカスタマイズを実現するイメージジェネレータであるStoryWeaverを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:06:09 GMT)
DASK: Distribution Rehearsing via Adaptive Style Kernel Learning for Exemplar-Free Lifelong Person Re-Identification [36.1] 生涯人物再識別(LReID)は、破滅的な忘れ込みに苦しむ重要な課題であるが難しい課題である。
既存のLReIDアプローチは通常、この問題を軽減するためにデータ再生と知識蒸留に依存している。
本稿では,知識統合を強化するために,旧領域の分布をモデル化し,リハーサルする新しいパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:21:52 GMT)
Enhancing LLM-based Hatred and Toxicity Detection with Meta-Toxic Knowledge Graph [36.1] ドメイン固有の有毒な知識の欠如は、偽陰性を引き起こす。
有害な音声に対する大規模言語モデルの過度な感度は、偽陽性をもたらす。
メタ有害知識グラフ上でのグラフ検索を利用して,憎悪や毒性を検出するメタトックスと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:28:28 GMT)
HandsOnVLM: Vision-Language Models for Hand-Object Interaction Prediction [36.0] 我々は,従来の手指の軌跡予測タスクを,明示的あるいは暗黙的な言語クエリを含む2つのタスクに拡張する。
VHP(Vanilla Hand Prediction)とRBHP(Reasoning-Based Hand Prediction)の2つの課題を評価するための新しいベンチマークを開発した。
我々のモデルであるHandsOnVLMは、テキスト応答を生成し、自然言語による会話を通じて、将来のハンドトラジェクトリを生成する新しいVLMである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:58:33 GMT)
SPARKLE: A Unified Single-Loop Primal-Dual Framework for Decentralized Bilevel Optimization [35.9] 本稿では,複数のエージェントが協調して,近傍通信によるネスト最適化構造に関わる問題を解く分散二段階最適化について検討する。
SPARKLE(Single-loop Primal-dual AlgoRithm frameworK)を提案する。
本稿では,SPARKLEの統一収束解析を行い,既存の分散二段階アルゴリズムと比較して,最先端の収束率を持つ全変種に適用する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:38:53 GMT)
A Survey on Sequential Recommendation [35.0] 我々は、新しい視点からSR問題を研究する(すなわち、アイテムの特性の構築)。
提案手法は, 純粋IDベースSR, 副次情報付きSR, マルチモーダルSR, 生成SR, LLMを用いたSR, 超長期SR, データ拡張SRなど, 逐次的推奨に使用される最新の手法を要約する。
例えば、オープンドメインのSR、データ中心のSR、有能なコラボレーティブなSR、連続的なSR、善のためのSR、説明可能なSRなどである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:33:13 GMT)
Accelerating lensed quasars discovery and modeling with physics-informed variational autoencoders [34.8] 強いレンズを持つクエーサーは、宇宙膨張の速度に関する貴重な洞察を与える。
天体画像で検出することは、非レンズ天体の出現により困難である。
物理インフォームド変分オートエンコーダ上に構築したVariLensと呼ばれる生成型ディープラーニングモデルを開発した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:23:46 GMT)
Structural Pruning via Spatial-aware Information Redundancy for Semantic Segmentation [34.6] 既存のプルーニング手法のほとんどは、もともと画像分類用に設計されたもので、セグメンテーションが位置感性タスクであるという事実を無視するものである、と我々は主張する。
本稿では,チャネル間の特徴冗長性を低減することを目的とした,空間認識型情報冗長性フィルタプルーニング(Spatial-Aware Information Redundancy Filter Pruning)を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:41:50 GMT)
ShotVL: Human-Centric Highlight Frame Retrieval via Language Queries [34.4] BestShotは、言語クエリーを通じて人間中心のビデオ内のハイライトフレームを見つけることを目的としている。
このベンチマークは、人間の注釈付きハイライトフレーム、詳細なテキスト記述、持続時間ラベリングを組み合わせることで、慎重に構築されている。
ShotVLはBestShotベンチマークでInternVLを52%改善し、THUMOS14ベンチマークで57%改善した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:44:29 GMT)
PerSphere: A Comprehensive Framework for Multi-Faceted Perspective Retrieval and Summarization [34.3] PerSphereは多面的視点検索と要約を容易にするために設計されたベンチマークである。
PerSphere内の各クエリには、2つの反対のクレームがあり、それぞれが異なる、重複しない視点でサポートされている。
我々のゴールは、これらの文書を正確に要約し、それぞれの主張とその基盤となる視点と要約を一致させることです。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:44:06 GMT)
Three Things to Know about Deep Metric Learning [34.2] 本稿では,オープンセット画像検索のための教師付き深度学習について述べる。
損失関数、ミックスアップ正規化、モデル初期化の3つの重要な側面に焦点を当てている。
これらのコンポーネントの体系的な研究を通じて、それらの相乗効果により、大規模なモデルが一般的なベンチマークをほぼ解決できることを実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:49:12 GMT)
Prompt Augmentation for Self-supervised Text-guided Image Manipulation [34.0] 本稿では,複数のターゲットプロンプトに単一入力プロンプトを増幅し,テキストコンテキストを強化し,局所的な画像編集を可能にするプロンプト拡張手法を提案する。
本稿では,編集領域を分割し,保存領域を近くまで描画することで,効率的な画像編集を行うためのコントラストロスを提案する。
拡散モデルに新たな損失が組み込まれ、公開データセット上の改善された、あるいは競合的な画像編集結果と、最先端のアプローチによる生成画像が示される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:54:05 GMT)
Adaptive Nonparametric Perturbations of Parametric Bayesian Models [33.9] 非パラメトリック摂動パラメトリック(NPP)ベイズモデルについて検討し、パラメトリックベイズモデルをその可能性の歪みによって緩和する。
NPPモデルはパラメトリックモデルのデータの効率を保ちながら、非モデルのロバスト性を提供できることを示す。
単一細胞RNAシークエンシングデータから遺伝子発現の因果効果を推定し,本手法を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:24:35 GMT)
Can Tool-augmented Large Language Models be Aware of Incomplete Conditions? [33.7] 本研究では,大規模言語モデルが不完全条件を識別し,いつツールの使用を控えるかを適切に判断できるかどうかを検討する。
実験の結果,LSMは特定のツールを利用するために必要な情報の欠如を特定するのに苦慮していることがわかった。
本研究は,人間とLLMの相互作用における共通シナリオに対処することで,信頼性の高いLLMの進展に寄与することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:33:04 GMT)
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning [33.4] 思考の接地連鎖とルックアヘッド空間推論によるマルチモーダル行動モデルEmma-X
思考の接地連鎖とルックアヘッド空間推論を併用したマルチモーダル行動モデルEmma-Xを提案する。
Emma-Xは、特に空間的推論を必要とする現実世界のロボットタスクにおいて、競争ベースラインよりも優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:12:56 GMT)
Bots against Bias: Critical Next Steps for Human-Robot Interaction [33.4] ヒューマノイド、AI対応、表現力のある社会ロボットの文脈における偏見の多面的問題を考える。
1) 偏見を意識した方法で設計されたロボットと,(2) 人間の世界における偏見に対処するためのロボットである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:09:36 GMT)
Semantic Prompt Learning for Weakly-Supervised Semantic Segmentation [33.3] Weakly-Supervised Semantic (WSSS) は、画像レベルの監督のみで画像データを用いてセグメンテーションモデルを訓練することを目的としている。
本稿では,CLIP潜伏空間を効果的に促進するためのWSSS(Semantic Prompt Learning for WSSS)フレームワークを提案する。
SemPLeSは、オブジェクトリージョンとクラスラベルのセマンティックアライメントを改善することができるため、セグメンテーションモデルをトレーニングするための擬似マスクが望ましい。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:27:31 GMT)
The Bandit Whisperer: Communication Learning for Restless Bandits [33.3] 我々は、レスレスマルチアームバンド(RMAB)における最初のコミュニケーション学習手法を提案する。
我々の設定では、腕は同様の腕からQ関数パラメータを受信し、行動ポリシーを導出し、Q関数の更新を操縦する。
両腕をまたいだメッセージの合体性を考慮し,その合体ユーティリティを分解するQネットワークアーキテクチャを用いて通信戦略を学習する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:36:47 GMT)
Familiarity-Aware Evidence Compression for Retrieval-Augmented Generation [33.1] 対象モデルに慣れ親しんだ証拠を抽出する訓練不要な証拠圧縮手法であるFaviCompを提案する。
FaviCompは、複数のオープンドメインQAデータセット間で、最新のエビデンス圧縮ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:25:46 GMT)
Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective [32.9] 人工知能(AI)の最近の進歩は、医療画像と計算病理に革命をもたらしている。
デジタル全スライド画像(WSI)の解析における一定の課題は、何万ものタイルレベルの画像埋め込みをスライドレベルの表現に集約する問題である。
本研究は,9つの臨床的課題を対象とした10種類のスライドレベルのアグリゲーション手法のベンチマーク分析を行った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:54:07 GMT)
Does Vision Accelerate Hierarchical Generalization in Neural Language Learners? [32.9] 本研究では、基底言語習得の利点、特に視覚情報がニューラル言語モデル(LM)の構文一般化に与える影響について検討する。
実験の結果,言語的要素と視覚的要素のアライメントが明確であれば,視覚データへのアクセスはLMの構文的一般化に役立つが,そうでなければ視覚的入力は役に立たないことがわかった。
これは、相互の視線のような追加のバイアスや信号の必要性を強調し、クロスモーダルアライメントを強化し、マルチモーダルLMにおける効率的な統語的一般化を可能にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:57:43 GMT)
A Survey of Calibration Process for Black-Box LLMs [32.9] 大規模言語モデル(LLM)は意味理解と生成において顕著な性能を示す。
出力の信頼性を正確に評価することは 重要な課題です
Black-Box LLMは、APIのみのインタラクション制約のため、キャリブレーションテクニックの要求が高められている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:31:21 GMT)
Detecting Emotional Incongruity of Sarcasm by Commonsense Reasoning [32.6] 本論文は, 語義的意味に反する批判, モック, その他の否定的な感情を伝えるか否かを識別することを目的とした, 皮肉検出に焦点を当てた。
既存のメソッドは、複雑な現実世界のシナリオに直面した時に、常識的な推論能力に欠けており、不満足なパフォーマンスをもたらします。
本研究では,EICR と呼ばれるコモンセンス拡張に基づく不整合推論を行うサルカズム検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:25:55 GMT)
ArtAug: Enhancing Text-to-Image Generation through Synthesis-Understanding Interaction [32.5] テキスト・ツー・イメージ・モデルを改善するためのArtAugという新しい手法を提案する。
インタラクションでは、画像理解モデルによって暗黙的に学習された人間の好みを利用して、きめ細かい提案を行う。
相互作用によってもたらされる拡張は、追加の強化モジュールを通じて合成モデル自体に反復的に融合される。
様々な評価指標は、ArtAugが追加の計算コストを発生させることなく、テキスト・ツー・イメージモデルの生成能力を向上させることを一貫して示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:12:31 GMT)
WIKIGENBENCH: Exploring Full-length Wikipedia Generation under Real-World Scenario [32.3] WIKIGENBENCHは、1,320のエントリからなる新しいベンチマークである。
そこで我々は,Web ソースからの入力文書を用いて,新しいイベントに対して,構造化された完全長のウィキペディア記事が引用される現実世界のシナリオを探索する。
評価には、実世界のシナリオに適合する妥当性、組織、その他の側面を評価するために、体系的なメトリクスとLLMベースのメトリクスを統合する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:53:41 GMT)
Causal Prompting: Debiasing Large Language Model Prompting based on Front-Door Adjustment [32.1] 大規模言語モデル(LLM)のバイアスを効果的に軽減するために,正面調整に基づく新たな因果的プロンプト手法を提案する。
実験結果から,提案手法は7つの自然言語処理データセットにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:10:26 GMT)
COSEE: Consistency-Oriented Signal-Based Early Exiting via Calibrated Sample Weighting Mechanism [32.0] 早期終了は事前学習言語モデル(PLM)の推論効率を改善する効果的なパラダイムである
本稿では,COSEE(Consistency-Oriented Signal-based Early Exiting)フレームワークを提案する。
GLUEベンチマークの実験では、複数の出口信号とバックボーンにまたがるCOSEEの有効性が実証され、パフォーマンスと効率のトレードオフが向上した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:24:55 GMT)
SummExecEdit: A Factual Consistency Benchmark in Summarization with Executable Edits [32.0] SummExecEditは、実行可能編集を利用して、事実の誤りを検出し、正確な説明を提供する能力に基づいてモデルを評価する新しいベンチマークである。
トップパフォーマンスモデルであるClaude3-Opusは、ベンチマークで0.49のジョイント検出と説明スコアを達成し、個々のスコアは0.67、説明スコアは0.73である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:26:44 GMT)
Adaptive Prototype Replay for Class Incremental Semantic Segmentation [31.9] クラスインクリメンタルセマンティックセグメンテーション(CISS)は、古い知識の忘れを防止しつつ、継続ステップ中に新しいクラスをセグメンテーションすることを目的としている。
既存の方法は、記憶されたプロトタイプや特徴を用いて、以前に学習したクラスの分布を再生することで、破滅的な忘れを緩和する。
この更新された表現と固定されたプロトタイプのミスマッチは、プロトタイプの再生戦略の有効性を制限する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:40:23 GMT)
SVGDreamer: Text Guided SVG Generation with Diffusion Model [31.8] SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。
VPSDアプローチは、形状の平滑化、彩度の過飽和、多様性の制限、収束の遅い問題に対処する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:55:57 GMT)
Evaluating Visual and Cultural Interpretation: The K-Viscuit Benchmark with Human-VLM Collaboration [31.7] 本稿では,文化的なVLMベンチマークを構築するための半自動フレームワークを提案する。
このフレームワークは人間とVLMのコラボレーションを組み合わせ、VLMはガイドライン、注釈付きサンプルの小さなセット、関連する知識に基づいて質問を生成し、続いてネイティブスピーカーによる検証プロセスを実行する。
韓国文化に焦点を当てたデータセットであるK-Viscuitの作成を通じて,この枠組みの有効性を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:51:01 GMT)
Eliminating Domain Bias for Federated Learning in Representation Space [31.5] 連合学習のための一般的なフレームワークであるDomain Bias Eliminator (DBE)を提案する。
DBEはサーバとクライアント間の双方向の知識伝達を促進することができる。
DBEを具備したFL法は、10の最先端のパーソナライズされたFL法を大きなマージンで上回ることができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:17:00 GMT)
Geodesic Flow Kernels for Semi-Supervised Learning on Mixed-Variable Tabular Dataset [31.2] GFTabは、Mixed-Variable Tabularデータセットフレームワークの半教師付き学習である。
GFTabには3つの重要な革新がある: 1) 連続変数と分類変数の異なる性質に合わせた変数固有の汚職法、2) 腐敗した入力間の幾何学的変化を捉える測地学的フローカーネルに基づく類似度尺度、3) 利用可能なラベル付きデータから階層的関係を利用する木に基づく埋め込み。
我々の実験結果によると、GFTabは、多くのデータセット、特にラベル付きデータに制限された設定において、既存のML/DLモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:47:53 GMT)
Unlocking the Potential of Digital Pathology: Novel Baselines for Compression [31.1] 病的全スライド画像(WSI)における色とテクスチャの相違
ディープラーニングモデルは、WSIのさらなる圧縮のためにJPEG-XLやWebPのような従来の圧縮方式よりも優れた知覚品質のために微調整されている。
本研究は、WSIにおける損失圧縮スキームの評価のための新しい知見を提供し、損失圧縮スキームの統一的な評価を奨励し、デジタル病理の臨床的取り込みを加速させる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:04:33 GMT)
ClarityEthic: Explainable Moral Judgment Utilizing Contrastive Ethical Insights from Large Language Models [30.3] 我々は、LLMの推論能力と対照的な学習を活用して関連する社会的規範を明らかにする、textitEthicと呼ばれる新しい道徳的判断手法を導入する。
本手法は,道徳的判断課題における最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:22:44 GMT)
Rethinking the Alignment of Psychotherapy Dialogue Generation with Motivational Interviewing Strategies [30.2] 大規模言語モデル(LLM)は、特にモチベーション・インタビュー(MI)の文脈において、精神療法的対話を生み出すことを約束している。
MI戦略をMIスキルのセットとして適用することで、説明可能性を備えたより制御可能な治療に順応した会話が実現可能となる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:44:16 GMT)
Pattern Analogies: Learning to Perform Programmatic Image Edits by Analogy [30.2] 本稿では,パターン画像のプログラム編集を行う新しい手法を提案する。
パターンアナロジー(意図された編集を示すための単純なパターンのペア)と、これらの編集を実行するための学習ベースの生成モデルを使用することで、ユーザは直感的にパターンを編集できる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:52:12 GMT)
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark [30.1] 自動不均一情報検索ベンチマーク(AIR-Bench)を提案する。
AIR-Benchのテストデータは、人間の介入なしに、大きな言語モデル(LLM)によって自動的に生成される。
信頼性が高く堅牢なデータ生成パイプラインを開発し、多種多様な高品質な評価データセットを自動的に作成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:15:21 GMT)
MotionBridge: Dynamic Video Inbetweening with Flexible Controls [29.0] 我々はMotionBridgeを紹介した。
トラジェクティブストローク、ビデオ編集マスク、ガイドピクセル、テキストビデオなど、柔軟なコントロールが可能だ。
このようなマルチモーダル制御は、よりダイナミックでカスタマイズ可能で、文脈的に正確な視覚的物語を可能にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:59:33 GMT)
MultiBooth: Towards Generating All Your Concepts in an Image from Text [29.0] 本稿では,テキストからの画像生成において,マルチコンセプトをカスタマイズするための新しい,効率的な手法であるMultiBoothを紹介する。
単一概念学習フェーズでは,多モード画像エンコーダと効率的な概念符号化技術を用いて,各概念の簡潔かつ識別的な表現を学習する。
多概念統合フェーズでは、有界ボックスを用いて、相互注意マップ内の各概念の生成領域を定義する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:47:44 GMT)
Speak & Improve Challenge 2025: Tasks and Baseline Systems [28.9] Speak & Improve Challenge 2025: Spoken Language Assessment and Feedback"は、ISCA SLaTE 2025ワークショップに関連する課題である。
この課題の目標は、基礎技術と言語学習の両方のフィードバックに関連するタスクを用いて、音声言語アセスメントとフィードバックの研究を進めることである。
この課題には、自動音声認識(ASR)、音声言語アセスメント(SLA)、音声文法誤り訂正(SGEC)、音声文法誤り訂正フィードバック(SGECF)の4つの共通タスクがある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:47:49 GMT)
Hints Help Finding and Fixing Bugs Differently in Python and Text-based Program Representations [28.8] プログラム表現は,バグの発見と修正におけるユーザの精度に大きな影響を与えることがわかった。
異なるヒントは、プログラム表現とユーザのアルゴリズム的タスクに対する理解に依存する。
これらの発見は、ユーザにパーソナライズされたサポートを提供する次世代プログラミングツールの設計に影響を及ぼす。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:11:53 GMT)
Zigzag Diffusion Sampling: Diffusion Models Can Self-Improve via Self-Reflection [28.8] 既存のテキストと画像の拡散モデルは、しばしば挑戦的なプロンプトに対して高い画質と高いプロンプトのアライメントを維持するのに失敗する。
本稿では, 交互に denoising と inversion を行う拡散自己回帰法を提案する。
我々は,新しい自己反射型拡散サンプリング法であるZigzag Diffusion Smpling (Z-Sampling) を導出した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:23:42 GMT)
Speak & Improve Corpus 2025: an L2 English Speech Corpus for Language Assessment and Feedback [28.5] Speak & Improve Corpus 2025は、L2学習者の英語データのデータセットである。
コーパスリリースの目的は、L2音声言語処理システムの開発において大きな課題に取り組むことである。
ELiTのウェブサイトで非商用利用が可能である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:40:27 GMT)
LLM Whisperer: An Inconspicuous Attack to Bias LLM Responses [28.5] 命令における微妙なシノニム置換は、LLMが目標概念に言及する可能性(最大78%)を高めることができることを示す。
信頼できない関係者からのプロンプトの使用に対する警告の実施を推奨する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:21:15 GMT)
C2F-TP: A Coarse-to-Fine Denoising Framework for Uncertainty-Aware Trajectory Prediction [28.5] C2F-TPは不確実性を考慮した車両軌道予測のための粗大きめのデノケーションフレームワークである。
C2F-TPは、2段階の粗大な予測プロセスが革新的である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:42:49 GMT)
JudgeBlender: Ensembling Judgments for Automatic Relevance Assessment [28.4] 大規模言語モデル(LLM)は、検索タスクの関連ラベルを生成することを約束している。
我々は,より小型のオープンソースモデルを用いて妥当性判断を行うフレームワークであるJiceBlenderを紹介した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:04:15 GMT)
LinguaLIFT: An Effective Two-stage Instruction Tuning Framework for Low-Resource Language Tasks [28.3] 低リソース言語タスクを進行させるための2段階の命令チューニングフレームワークを提案する。
追加の言語アライメント層がLLMに統合され、事前訓練された多言語エンコーダが適応される。
第2ステージは、言語アライメント層を凍結しながら、英語のみの命令データを持つ微調整LDMである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:03:17 GMT)
GridShow: Omni Visual Generation [28.2] グリッドを配置する問題として、幅広い視覚生成タスクを再構成する新しいパラダイムであるGRIDを紹介する。
GRIDのコアとなるのは、時間的シーケンスをグリッドレイアウトに変換することで、画像生成モデルによる視覚的シーケンスの全体的処理を可能にすることだ。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:24:57 GMT)
AI PERSONA: Towards Life-long Personalization of LLMs [28.2] 本稿では,大規模言語モデルの生涯的パーソナライズという課題を紹介する。
寿命のパーソナライズされたLLMシステムの構築とベンチマークのために、すべてのコードとデータを公開します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:17:03 GMT)
A Simple and Efficient Baseline for Zero-Shot Generative Classification [28.2] 本稿では,事前訓練されたテキスト・ツー・イメージ拡散モデルとDINOv2を用いた,恥ずかしいほどシンプルで効率的なゼロショット拡散ベース分類器(GDC)を提案する。
提案されたGDCは、ImageNetで従来のゼロショット拡散ベースの分類器を10ポイント以上(61.40% - 71.44%)上回るだけでなく、ImageNetで1つの画像の分類を30000回以上(1000 - 0.03秒)加速する。
我々の広範な実験により、GDCは様々なデータセットに対して高い競争力を持つゼロショット分類性能を達成でき、より強力に自己改善できることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:50:23 GMT)
MedMax: Mixed-Modal Instruction Tuning for Training Biomedical Assistants [28.0] 混合モーダル基礎モデルのための大規模バイオメディカルインストラクションチューニングデータセットであるMedMaxについて述べる。
1.47万のインスタンスを持つMedMaxは、マルチモーダルコンテンツ生成(インターリーブ画像テキストデータ)、バイオメディカル画像キャプションと生成、ビジュアルチャット、レポート理解など、さまざまなタスクを含んでいる。
我々は、MedMaxデータセットの混合モーダル基礎モデルを微調整し、大幅なパフォーマンス改善を実現した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:30:00 GMT)
Attack On Prompt: Backdoor Attack in Prompt-Based Continual Learning [27.8] 本稿では,バックドア・アタック(バックドア・アタック)という潜在的な脅威に対して,継続的な学習を露呈する。
本稿では,インクリメンタル学習者に対するバックドアアタックの実行における3つの重要な課題を強調し,それに対応するソリューションを提案する。
我々のフレームワークは、最大で100%の攻撃成功率を達成し、さらなるアブレーション研究により、我々の貢献を確認します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:41:46 GMT)
MIVE: New Design and Benchmark for Multi-Instance Video Editing [27.7] MIVEは汎用マスクベースのフレームワークで、特定のオブジェクト(人など)に特化していない。
編集リークを防ぐためのDMS(Disentangled Multi-Instance Sampling)と、正確なローカライゼーションと忠実な編集を保証するためのインスタンス中心のProbability Redistribution(IPR)である。
MIVEの質的・定量的・ユーザスタディ評価は,信頼性・正確性・漏洩防止の点において,最近の最先端手法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:00:04 GMT)
Faster Vision Mamba is Rebuilt in Minutes via Merged Token Re-training [27.6] Vision Mambaで情報トークンを発行すると、重要な知識が失われ、パフォーマンスが低下する。
特にVim-Tiでの3回のトレーニングで35.9%の精度が急上昇した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:56:35 GMT)
I-SHEEP: Self-Alignment of LLM from Scratch through an Iterative Self-Enhancement Paradigm [27.4] 大規模言語モデル(LLM)は大きな進歩を遂げているが、共通学習パラダイムはLLMを受動的情報リポジトリとして扱う。
textbfIterative textbfSelf-EntextbfHanctextbfEmtextbfEnt textbfParadigmを紹介する。
I-SHEEPはQwenモデルとLlamaモデルの両方の容量を大幅に向上させることができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:30:54 GMT)
Towards Personalized Federated Node Classification in One-shot Communication [27.3] ノード分類のための一括パーソナライズされたフェデレーショングラフ学習法を提案する。
提案手法は,サーバ上にグローバルな擬似グラフを構築するために,クラスワイズ特徴分布統計を推定し,集約する。
提案手法は様々な設定において最先端のベースラインを著しく上回る。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:05:59 GMT)
ComprehendEdit: A Comprehensive Dataset and Evaluation Framework for Multimodal Knowledge Editing [27.0] 大規模マルチモーダル言語モデル(MLLM)は、自然言語処理と視覚的理解に革命をもたらした。
現在の知識編集評価はスコープが限られており、バイアスがある可能性がある。
複数のデータセットから8つのタスクからなる総合的なベンチマークであるComprehendEditを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:41:49 GMT)
Decictor: Towards Evaluating the Robustness of Decision-Making in Autonomous Driving Systems [26.2] 本稿では,自律走行システムの経路計画決定(PPD)の堅牢性を評価することに焦点を当てる。
主な課題は、PDの最適性を評価するための明確なオラクルの欠如と、最適でないPDにつながるシナリオを探すのが困難であることである。
非最適決定シナリオ(NoDS)を生成するための最初の手法であるDecictorを提案する。
ADSの非最適PD検出におけるDecictorの有効性を実験的に検証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:10:04 GMT)
Fooling LLM graders into giving better grades through neural activity guided adversarial prompting [26.2] 本稿では,AI評価システムにおけるそのようなバイアスを明らかにするための体系的手法を提案する。
我々のアプローチはまず、歪んだ決定結果を予測する隠れた神経活動パターンを特定する。
この組み合わせによって、大きな言語モデルグレーダーを効果的に騙して、人間よりもはるかに高いグレードを割り当てることができることを実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:08:22 GMT)
PO3AD: Predicting Point Offsets toward Better 3D Point Cloud Anomaly Detection [26.1] 異常のない条件下での点雲異常検出は大きな課題となる。
より情報的な疑似異常点を対象とする,学習点オフセットを重視した革新的なアプローチを導入する。
提案手法は, AUC-ROC 検出基準において, 9.0% と 1.4% の精度向上を達成し, 既存の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:30:09 GMT)
TSD-SR: One-Step Diffusion with Target Score Distillation for Real-World Image Super-Resolution [26.0] 事前訓練されたテキスト-画像拡散モデルが、現実の画像超解像(Real-ISR)タスクにますます応用されている。
拡散モデルの反復的洗練された性質を考えると、既存のアプローチのほとんどは計算的に高価である。
実世界の超高解像度画像に特化して設計された新しい蒸留フレームワークであるTLD-SRを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:34:49 GMT)
Graph Learning in the Era of LLMs: A Survey from the Perspective of Data, Models, and Tasks [25.7] グラフニューラルネットワーク(GNN)とLarge Language Models(LLM)の統合は、有望な技術パラダイムとして現れている。
データ品質を根本的に向上させるために、リッチなセマンティックコンテキストを持つグラフ記述テキストを活用します。
この研究は、グラフ学習方法論の進歩を目指す研究者や実践者にとって、基礎的な参考となる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:41:17 GMT)
The Generative AI Ethics Playbook [25.6] Generative AI Ethics Playbookは、マシンラーニングシステムのリスクを特定し緩和するためのガイダンスを提供する。
このプレイブックは、研究と倫理的考察の両方における現在のベストプラクティスに基づいて、AI/ML実践者の包括的なリソースとして機能することを目的としています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:47:04 GMT)
Persona-SQ: A Personalized Suggested Question Generation Framework For Real-world Documents [25.5] SQ(Suggested Question)は、AIを利用した読み出しアプリケーションにおいて、ユーザがドキュメントをエンゲージするための効果的な初期インターフェースを提供する。
我々は、読者プロファイル(プロフェッショナルと読書目標)を取り入れたパーソナライズされたSQを生成するパイプラインを導入する。
当社のアプローチは,現在のSQシステムにおいて,その性能を即時向上するための代替手段として機能するだけでなく,ローカルで動作し,高速かつプライベートなSQエクスペリエンスを提供するデバイス上でのSQモデルの開発にも有効である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:15:40 GMT)
Two-stage Framework for Robust Speech Emotion Recognition Using Target Speaker Extraction in Human Speech Noise Conditions [25.5] 本稿では、ターゲット話者抽出法(TSE)と音声感情認識法(SER)を用いて、この問題に対する新たな2段階フレームワークを提案する。
まず,TSEモデルを用いて混合話者の音声を抽出し,第2段階で抽出した音声をSER訓練に用いる。
提案システムでは,TSE法を使わずに,ベースラインに比べて14.33%の非重み付き精度(UA)向上を実現している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:06:51 GMT)
LLMLight: Large Language Models as Traffic Signal Control Agents [25.4] 交通信号制御(TSC)は都市交通管理において重要な要素であり、道路網の効率を最適化し渋滞を軽減することを目的としている。
本稿では,大規模言語モデル (LLM) を用いた新しいフレームワーク LLMLight について述べる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:41:13 GMT)
TIMESAFE: Timing Interruption Monitoring and Security Assessment for Fronthaul Environments [25.4] 攻撃から2秒以内に、スプーフィング攻撃がO-RANと5G準拠の民間細胞基地局を破滅的に失敗させることを示す。
これに対応するために、97.5%以上の精度で様々な悪意ある攻撃を検知できる機械学習ベースの監視ソリューションを設計する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:13:37 GMT)
Architectural Patterns for Designing Quantum Artificial Intelligence Systems [25.4] 人工知能システムを強化するために量子コンピューティング技術を利用することで、トレーニングと推論時間を改善し、ノイズや敵攻撃に対する堅牢性を高め、精度を損なうことなくパラメータの数を減らすことが期待されている。
しかし、概念実証やシミュレーションを超えてこれらのシステムの実用的な応用を開発することは、量子ハードウェアの限界とそのようなシステムのソフトウェア工学における未発達の知識基盤によって大きな課題に直面している。
我々は、量子化人工知能システムのソフトウェアアーキテクチャに関連する課題と解決策を特定するために、体系的なマッピング研究を行った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:15:28 GMT)
Content-aware Balanced Spectrum Encoding in Masked Modeling for Time Series Classification [25.3] マスクド・モデリング・スキームにおけるスペクトル空間の符号化品質を最適化する補助的コンテンツ認識バランスド・デコーダ(CBD)を提案する。
CBDは一連の基本ブロックを反復し、2つの調整されたユニットのおかげで、各ブロックは徐々にマスクされた表現を洗練させることができた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:12:20 GMT)
Cyber Attacks Prevention Towards Prosumer-based EV Charging Stations: An Edge-assisted Federated Prototype Knowledge Distillation Approach [25.2] 本稿では,1)ネットワークトラフィック(NT)データに対するサイバーアタック検出と,2)サイバーアタック介入の2つの側面について述べる。
本稿では,各クライアントを専用ローカルエッジサーバ(DLES)上に配置するエッジ支援型プロトタイプ知識蒸留(E-FPKD)手法を提案する。
実験分析により、提案したE-FPKDは、NSL-KDD、UNSW-NB15、IoTID20データセット上で最大のODCを達成可能であることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:45:25 GMT)
Improving the Transferability of 3D Point Cloud Attack via Spectral-aware Admix and Optimization Designs [25.0] 本稿では,移動型ブラックボックス設定における3次元モデルに対する攻撃に焦点を当てた。
そこで本稿では,Augmented Optimization を用いたスペクトル認識型 Admix を提案する。
SAAOは既存の3Dアタック法と比較してトランスファー性が高いことを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:41:06 GMT)
Hierarchical Federated Learning with Multi-Timescale Gradient Correction [24.7] 本稿では,この問題を解決するためにMTGC法を提案する。
私たちのキーとなる考え方は、(i)グループ勾配のクライアント勾配を補正する、すなわち、個々のデータセットに基づいたローカル更新によるクライアントモデルのドリフトを減らすために、異なる制御を導入することです。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:16:02 GMT)
Hint Marginalization for Improved Reasoning in Large Language Models [24.7] 大規模言語モデル(LLM)の推論能力を高める新しいアルゴリズムフレームワークであるMarginalizationを提案する。
提案手法は,モンテカルロ近似を基礎となる回答分布の反復的サンプリング戦略とみなすことができる。
算術的推論のためのいくつかのベンチマークデータセットに対する経験的評価は、提案手法の優位性を示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:45:53 GMT)
Disentangling Tabular Data Towards Better One-Class Anomaly Detection [24.5] 一級分類条件下でのタブラル異常検出は重要な課題である。
通常のサンプル中の属性間の本質的な相関を捉えることは、その概念を学ぶための1つの有望な方法を示す。
その結果,AUC-PRでは6.1%,AUC-ROCでは2.1%の性能向上が得られた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:51:13 GMT)
RA-SGG: Retrieval-Augmented Scene Graph Generation Framework via Multi-Prototype Learning [24.5] シーングラフ生成(SGG)研究は、長い尾の述語分布と述語間の意味的曖昧さの2つの根本的な課題に悩まされている。
本稿では,マルチラベル化可能なインスタンスを識別し,元のラベルにセマンティックに類似したマルチラベルでシングルラベルを拡張可能な検索言語Retrieval-Augmented Scene Graph Generation (RA-SGG)を提案する。
RA-SGGは、長い尾の分布と述語の意味的あいまいさに起因するバイアス予測の問題を効果的に緩和する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:47:13 GMT)
A MapReduce Approach to Effectively Utilize Long Context Information in Retrieval Augmented Language Models [24.5] 大規模言語モデル(LLM)は、時代遅れの知識や幻覚のために、進化するトピックに対する最新の応答を生成するのに苦労する。
Retrieval-augmented Generation (RAG) はLLM応答の精度と関連性を改善する重要なイノベーションである。
モデル重みを変更することなく「中間のロスト・イン・ザ・ミドル」問題に対処するためのマップ・リデューサ戦略であるBrefContextを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:18:14 GMT)
Not All Votes Count! Programs as Verifiers Improve Self-Consistency of Language Models for Math Reasoning [24.4] 本稿では,自然言語から派生した翻訳プログラムを検証メカニズムとして活用するフレームワークであるProveを紹介する。
バニラ多数決とは異なり、我々の手法は、対応するプログラム出力が生成した解と矛盾する解をフィルタリングし、検証に合格する解のみを集約する。
以上の結果から,すべてのモデルサイズとデータセットにまたがる数学的推論タスクの解決において,Proveはバニラ多数投票を一貫して上回る結果となった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:55:00 GMT)
What Matters in Learning A Zero-Shot Sim-to-Real RL Policy for Quadrotor Control? A Comprehensive Study [24.2] 実世界の四角形においてゼロショット展開が可能なロバストなRLベースの制御ポリシーを学習するための重要な要因について検討する。
これら5つのテクニックを統合した,PPOベースのトレーニングフレームワークSimpleFlightを開発した。
クレージーフリー四重極に対するSimpleFlightの有効性を検証し,軌道追従誤差を50%以上低減できることを実証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:04:49 GMT)
DriveTester: A Unified Platform for Simulation-Based Autonomous Driving Testing [24.2] DriveTesterはApollo上に構築されたシミュレーションベースの統合テストプラットフォームである。
一貫性があり信頼性の高い環境を提供し、軽量な交通シミュレータを統合し、様々な最先端のADSテスト技術を取り入れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:24:05 GMT)
VidTok: A Versatile and Open-Source Video Tokenizer [24.0] VidTokは、連続したトークン化と離散的なトークン化の両方で最先端のパフォーマンスを提供する、汎用的なビデオトークン化ツールである。
これらの進歩を統合することで、VidTokは既存のメソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:27:11 GMT)
Cross-Dialect Information Retrieval: Information Access in Low-Resource and High-Variance Languages [23.9] 地域や文化特有の知識は、方言で書かれた文書にしか見つからない。
我々は、ウィキペディアから抽出された7つのドイツ語方言からなる最初のドイツ語方言検索データセット、WikiDIRを紹介した。
マルチリンガルエンコーダを用いたゼロショット・クロスリンガル変換手法は, 極低リソース化には適さないことを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:21:09 GMT)
Algorithmic Fidelity of Large Language Models in Generating Synthetic German Public Opinions: A Case Study [23.5] 本研究では,大規模言語モデル(LLM)のアルゴリズム的忠実度について検討する。
我々は、人口動態の特徴をペルソナのプロンプトに組み込むことで、ドイツのサブポピュレーションを反映した合成世論を生成するよう、異なるLLMに促す。
以上の結果から,Llama は他の LLM よりも,特にグループ内での意見の多様性が低い場合には,サブポピュレーションの表現に優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:46:32 GMT)
ZoRI: Towards Discriminative Zero-Shot Remote Sensing Instance Segmentation [23.4] 本稿では,訓練データに欠落した空中物体を特定することを目的とした,ゼロショットリモートセンシングインスタンスセグメンテーションという新しいタスクを提案する。
我々は,事前学習された視覚言語アライメントを維持するために,意味関連情報を分離する知識注入型適応戦略を導入する。
我々は,新しい実験プロトコルとベンチマークを構築し,ZoRIが最先端の性能を達成することを実証する広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:00:56 GMT)
DocFusion: A Unified Framework for Document Parsing Tasks [22.9] DocFusionは0.28Bパラメータしか持たない軽量な生成モデルである。
タスク表現を統一し、改善された目的関数を通して協調訓練を行う。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:20:00 GMT)
Multimodal Class-aware Semantic Enhancement Network for Audio-Visual Video Parsing [22.7] 各オーディオ/視覚セグメントの正確なイベントセマンティクスの取得が不可欠である。
各セグメントは複数のイベントを含むことができ、結果として意味的に混合された全体的特徴をもたらす。
内部および相互関係を符号化するファイングラインド・セマンティック・エンハンスメント・モジュールを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:31:27 GMT)
Multi-Subspace Matrix Recovery from Permuted Data [22.7] 我々は,外乱ベクトル回復のための外乱同定,部分空間再構成,外乱分類,教師なし検出を含む,新しい4段階のアルゴリズムパイプラインを開発した。
我々のパイプラインは、複数のベンチマークで最先端の競合相手と比較され、優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:07:44 GMT)
FastVLM: Efficient Vision Encoding for Vision Language Models [22.4] 我々は,レイテンシ,モデルサイズ,精度のトレードオフを最適化したモデルであるFastVLMを紹介する。
FastVLMは、より少ないトークンを出力し、高解像度画像の符号化時間を著しく短縮するように設計された、新しいハイブリッドビジョンエンコーダであるFastViTHDを組み込んでいる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:09:55 GMT)
PROSAC: Provably Safe Certification for Machine Learning Models under Adversarial Attacks [22.3] 最先端の機械学習モデルは、敵の摂動によって深刻な危険にさらされる可能性がある。
本稿では,敵対的攻撃が存在する場合に,機械学習モデルの性能を証明するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:28:49 GMT)
Unveiling the Secret Recipe: A Guide For Supervised Fine-Tuning Small LLMs [22.2] コスト効率とアクセシビリティのために,小型言語モデル(3Bから7Bパラメータ)に焦点を当てた。
オープンソースで事前トレーニングされた4つのモデルに対して,さまざまなトレーニング構成と戦略について検討する。
i) 学習率の低いバッチサイズと組み合わせることで,MMLUやMTBench,Open LLM Leaderboardといったベンチマーク上でのモデルパフォーマンスが向上します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:16:59 GMT)
AraDiCE: Benchmarks for Dialectal and Cultural Capabilities in LLMs [22.1] 本稿ではアラビア方言と文化評価のベンチマークであるAraDiCEを紹介する。
湾岸地域、エジプト地域、レバント地域の文化意識を評価するために設計された最初のきめ細かいベンチマーク。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:15:26 GMT)
Citekit: A Modular Toolkit for Large Language Model Citation Generation [22.0] 大規模言語モデル(LLM)は質問応答(QA)タスクで引用を生成する。
現在、異なる引用生成方法を標準化し、適切に比較するための統一されたフレームワークは存在しない。
既存の引用生成手法の実装と評価を容易にするために設計されたオープンソースのモジュール型ツールキットであるnameを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:37:34 GMT)
Toxicity Detection towards Adaptability to Changing Perturbations [22.0] 本稿では,新しい問題,すなわち連続学習型ジェイルブレイク摂動パターンを毒性検出分野に導入する。
まず,9種類の摂動パターンによって生成された新しいデータセットを構築し,その内7つは先行作業から要約し,そのうち2つは私たちによって開発された。
次に、この新しい摂動パターン認識データセットにおける現在の手法の脆弱性を体系的に検証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:04:57 GMT)
Locate n' Rotate: Two-stage Openable Part Detection with Foundation Model Priors [21.9] 我々はMOPD (Multi-Feature Openable Part Detection) というトランスフォーマーベースのオープン部分検出フレームワークを提案する。
既存の手法と比較して,提案手法は検出と動きパラメータ予測の両方において優れた性能を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:52:30 GMT)
EmbedFuzz: High Speed Fuzzing Through Transplantation [21.9] 本稿では、ローエンドマイクロコントローラユニット(MCU)上の組み込みファームウェアのための効率的なファジリングフレームワークであるEmbedFuzzを紹介する。
我々の新しいファームウェア移植技術は、バイナリMCUファームウェアを、ネイティブパフォーマンスで互換性のあるハイエンドデバイス上で実行されるファームウェアの機能的に等価かつファジリング強化バージョンに変換する。
最先端のMCUファジイザに対する評価では、EmbedFuzzは8倍のファジィスループットを示し、ネイティブ実行によるエネルギーの4分の1を消費する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:09:55 GMT)
Building Gradient Bridges: Label Leakage from Restricted Gradient Sharing in Federated Learning [21.8] グラディエントブリッジ(GDBR)は、フェデレートラーニング(FL)で共有される限られた勾配情報からトレーニングデータのラベル分布を復元する
実験の結果、GDBRは様々なFL設定で80%以上のラベルを正確に復元できることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:03:38 GMT)
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities [21.7] BiGRは、生成訓練のためのコンパクトなバイナリ潜在符号を用いた、新しい条件付き画像生成モデルである。
BiGRは、同じフレームワーク内で生成と識別を統一する最初の条件付き生成モデルである。
以上の結果から,BiGRは生成的・識別的タスクを効果的に統合し,さらなる発展の道を開くことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:47:41 GMT)
FM2DS: Few-Shot Multimodal Multihop Data Synthesis with Knowledge Distillation for Question Answering [21.5] マルチモーダルなマルチホップ質問応答のためのトレーニングモデルを実現するための,高品質なデータセットを作成するための新しい手法を提案する。
提案手法は,ウィキペディアから関連するマルチモーダル文書を取得し,高レベルの質問や回答を合成的に生成し,厳格な基準で検証し,品質データを保証する5段階のパイプラインから構成される。
その結果、サンプルサイズが同じであれば、合成データに基づいてトレーニングされたモデルは、平均して1.9の正確なマッチング(EM)でトレーニングされたデータよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:38:21 GMT)
Bayesian Persuasion with Externalities: Exploiting Agent Types [21.5] ベイズ的説得問題と外部性について検討する。
このモデルでは、プリンシパルが複数のエージェントに世界の状況を伝える信号を送信する。
本研究は,プリンシパルのための最適なシグナリング戦略の計算問題について考察する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:41:17 GMT)
GIRAFFE: Design Choices for Extending the Context Length of Visual Language Models [21.0] 我々は、視覚言語モデルの長期的性能を高める効果的なソリューションを確立することを目指している。
本稿では, 有効長が128Kまで拡張されたジリンを提案する。
コード、データ、モデルをオープンソースにします。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:57:21 GMT)
PromptDet: A Lightweight 3D Object Detection Framework with LiDAR Prompts [20.8] マルチカメラ3Dオブジェクト検出は、複数のカメラを用いて3次元空間内のオブジェクトを検出し、ローカライズすることを目的としている。
近年,この問題を解決するために3次元物体検出のための多モード融合と知識蒸留法が提案されている。
提案するPromptDetは,2次元基礎モデルにおける素早い学習の成功を動機とした,軽量で効果的な3次元オブジェクト検出フレームワークである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:45:15 GMT)
Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning [20.8] Token Internal Position Awareness (TIPA) は、トークン内の文字位置をキャプチャするモデルの能力を大幅に改善する手法である。
TIPAは、大きな言語モデルにおける位置予測精度を高め、元のテキストにおけるターゲット文字のより正確な識別を可能にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:37:47 GMT)
Echo: Simulating Distributed Training At Scale [20.6] 当社は,大規模なトレーニングシミュレーションにおいて,3つの重要な課題に取り組むために,Echoを構築しています。
Echoは、トレーニングステップにおける平均8%のエラーを提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:44:35 GMT)
Evaluating the Capabilities of Large Language Models for Multi-label Emotion Understanding [20.6] EthioEmoは、4つのエチオピア語に対するマルチラベル感情分類データセットである。
SemEval 2018 Task 1から追加の英語マルチラベル感情データセットで広範な実験を行う。
その結果,高精度なマルチラベル感情分類は,ハイソース言語においても依然として不十分であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:42:39 GMT)
On the Structural Memory of LLM Agents [20.5] メモリは、大規模言語モデル(LLM)ベースのエージェントが複雑で長期的な相互作用を行えるようにするための重要な役割を担っている。
本稿では,メモリ構造とメモリ検索手法がLCMエージェントの性能に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:30:00 GMT)
Training Verification-Friendly Neural Networks via Neuron Behavior Consistency [20.5] 本研究は,検証に親しみやすいニューラルネットワークをトレーニングするための新しい手法を提案する。
本手法は,ニューロンの行動一貫性をトレーニングプロセスに統合する。
提案手法は既存の手法と組み合わせることで,ネットワークの妥当性をさらに向上できることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:40:49 GMT)
Spatial-Domain Wireless Jamming with Reconfigurable Intelligent Surfaces [20.4] 本研究では,無線ジャミング信号の環境適応空間制御を実現する新しい手法を提案する。
我々は、Wi-Fiデバイスを完全に否定する一方で、5mm近い距離に位置する第2のデバイスは影響を受けないままであることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:08:15 GMT)
Automatic Left Ventricular Cavity Segmentation via Deep Spatial Sequential Network in 4D Computed Tomography Studies [20.4] 心電図を自動分割する新しい手法を提案する。
空間シーケンシャル(SS)ネットワークを導入し,LVCの変形特性と運動特性を教師なしで学習する。
心電図(CT)データセットを用いて,双方向学習法(SS-BL)を用いたネットワークが従来のLCVセグメンテーション法より優れていたことを実証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:29:32 GMT)
PersonaMark: Personalized LLM watermarking for model protection and user attribution [20.3] PersonaMarkは、大規模言語モデルの著作権と説明責任を保護するために設計された、パーソナライズされたテキスト透かし方式である。
パーソナライズされたハッシュ機能を利用することで、各ユーザにユニークな透かしを埋め込んで、モデルの性能を損なうことなく高品質なテキスト生成を可能にする。
我々は4つのLCMに対して広範囲な評価を行い、パープレキシティ、感情、アライメント、可読性といった様々な指標を分析した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:52:12 GMT)
OCTCube-M: A 3D multimodal optical coherence tomography foundation model for retinal and systemic diseases with cross-cohort and cross-device validation [20.2] OCTと顔画像の共同解析のための3次元OCTに基づく多モード基盤モデルであるOCTCube-Mを提案する。
OCTCube-Mは、最初にOCTCubeを開発した。
新規なマルチモーダルコントラスト学習フレームワークであるCOEPを利用して、底部自己蛍光や赤外網膜イメージングなどの他の網膜イメージングモダリティを統合する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:13:41 GMT)
SweetTokenizer: Semantic-Aware Spatial-Temporal Tokenizer for Compact Visual Discretization [20.1] SweetTokenizer (SweetTokenizer) は、視覚データに対するコンパクトで効果的な離散化手法である。
我々の目標は、VQ-VAEパラダイムの再現性を維持しつつ、トークンの圧縮比を高めることである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:55:34 GMT)
PERC: Plan-As-Query Example Retrieval for Underrepresented Code Generation [20.1] コード生成(PERC)における数ショットプロンプトのためのPlan-as-query例検索
PERCはコード生成における最先端のRAGメソッドよりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:23:45 GMT)
XiYan-SQL: A Multi-Generator Ensemble Framework for Text-to-SQL [20.0] XiYanは、マルチコンテキストアンサンブル戦略を用いて、候補生成を改善する革新的なフレームワークである。
本稿では,データベース構造を理解するための半構造化表現手法であるM-スキーマを紹介する。
全体として、提案したXiYan-the-artフレームワークは、Birdデータセットベンチマークで75.63%の最先端実行精度を実現する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:45:45 GMT)
Causal Diffusion Transformers for Generative Modeling [19.9] 本稿では,Diffusionモデルの自己回帰(AR)モデルとしてCausal Diffusionを紹介する。
CaulFusionはデコーダのみのトランスフォーマーで、シーケンシャルトークンと拡散ノイズレベルにまたがるデータを二重化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:45:55 GMT)
Dynamic-LLaVA: Efficient Multimodal Large Language Models via Dynamic Vision-language Context Sparsification [19.9] 動的視覚言語コンテキストスペーシフィケーションフレームワークDynamic-LLaVAを提案する。
これは、プリフィルステージにおける視覚コンテキストの冗長性を動的に減少させる。
これはデコード中に生成された言語コンテキストのメモリと計算オーバーヘッドを減少させる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:45:12 GMT)
It is Never Too Late to Mend: Separate Learning for Multimedia Recommendation [19.8] マルチメディアレコメンデーションのためのセパレート・ラーニング(SEA)を提案し,主にモーダル・ユニクおよびジェネリック・ラーニングの相互情報ビューを含む。
具体的には、まずGNNを用いて、異なるモーダルのユーザとアイテムの表現を学習し、各モーダル表現を総称的および一意的な部分に分割する。次に、異なるモーダルの一般的な部分の整合性を最大化し、より高品質なモーダル・ジェネリックな特徴を学習するために、相互情報の低境界を最大化するためにSolosimlossを設計する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:56:42 GMT)
CompactFlowNet: Efficient Real-time Optical Flow Estimation on Mobile Devices [19.8] 我々は,光フロー予測のための最初のリアルタイム移動ニューラルネットワークであるCompactFlowNetを提案する。
光フローは、ビデオ復元、モーション推定、ビデオ安定化、オブジェクト追跡、アクション認識、ビデオ生成など、様々なビデオ関連タスクの基本的なビルディングブロックとして機能する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:06:12 GMT)
What External Knowledge is Preferred by LLMs? Characterizing and Exploring Chain of Evidence in Imperfect Context [19.8] 本稿では,マルチホップQAを扱う際に,LLMが好む不完全な文脈における外部知識に着目した。
犯罪手続法における証拠の連鎖(CoE)に着想を得て, LLMが好む知識は, 問題との関連と, 知識の相互支援の両方を維持すべきである,と特徴づける。
提案手法は,LLMの有効性,忠実性,頑健性,および単純検索型RAG(Retrieval-Augmented Generation)におけるCoEのユーザビリティについて検討するものである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:49:49 GMT)
Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration [19.7] 言語モデル内の視覚トークンの早期プルーニングにおけるアクセラレーション手法について検討する。
多くのタスクにまたがる強力なパフォーマンスは、視覚情報を圧縮する異常な能力によるものではなく、よりきめ細かい視覚能力を評価するためのベンチマークの限られた能力によるものである。
FEATHERは,初期階層の刈り込みによる識別問題を解決するための簡単な手法である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:56:50 GMT)
Efficient Diffusion Transformer Policies with Mixture of Expert Denoisers for Multitask Learning [19.7] Mixture-of-Denoising Experts (MoDE)は、Imitation Learningの新しいポリシーである。
MoDE は現在の最先端の Transformer ベースの Diffusion Policies を超えている。
MoDEは、確立された4つの模倣学習ベンチマークで134タスクの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:34:51 GMT)
Scaling Inter-procedural Dataflow Analysis on the Cloud [19.6] 大規模クラスタ上で動作するBigDataflowという分散フレームワークを開発しました。
BigDataflowは、数百万行のコードのプログラムを数分で分析する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:18:56 GMT)
Process-Supervised Reward Models for Clinical Note Generation: A Scalable Approach Guided by Domain Expertise [19.5] 大規模言語モデル(LLM)が生み出す臨床ノートに段階的な報酬信号を提供するために、PRMを訓練する。
提案手法は,LLaMA-3.18Bインストラクタモデルを用いて学習し,Gemini-Pro 1.5やORMよりも優れた性能を示した。
我々の有望な結果は、PRMsが臨床領域を超えて拡張し、多様な生成タスクに対してスケーラブルで効果的なソリューションを提供する可能性を示唆している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:24:34 GMT)
JEN-1 Composer: A Unified Framework for High-Fidelity Multi-Track Music Generation [19.0] JEN-1 Composerは、マルチトラック音楽上での限界分布、条件分布、共同分布を効率的にモデル化するように設計されている。
本研究では、段階的なカリキュラム学習戦略を導入し、段階的に訓練作業の難しさを増大させる。
提案手法は,制御可能かつ高忠実なマルチトラック音楽合成における最先端性能を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:08:33 GMT)
RemoteTrimmer: Adaptive Structural Pruning for Remote Sensing Image Classification [19.0] リモートセンシング画像分類のための効率的な構造解析手法を提案する。
具体的には、モデルのチャネル重要度の違いを増幅するプルーニング戦略を導入する。
プルーンドモデルの微調整プロセスに適応的なマイニング損失関数を設計する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:00:07 GMT)
GG-SSMs: Graph-Generating State Space Models [18.7] State Space Models (SSM) は、コンピュータビジョンと時系列分析ドメインのシーケンシャルデータをモデリングするための強力なツールである。
グラフ生成状態空間モデル(GG-SSM)は,特徴関係に基づいたグラフを動的に構築することにより,これらの制約を克服する新しいフレームワークである。
我々は、イベントベースのアイトラッキング、画像ネット分類、光フロー推定、および6つの時系列データセットを含む11の多様なデータセット上でGG-SSMを検証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:07:29 GMT)
Multi-Task Reinforcement Learning for Quadrotors [18.7] 本稿では,四重項制御に適した新しいマルチタスク強化学習(MTRL)フレームワークを提案する。
マルチクリティカルなアーキテクチャと共有タスクエンコーダを用いることで,タスク間の知識伝達を容易にし,単一のポリシで多様な操作を実行することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:10:18 GMT)
SnakModel: Lessons Learned from Training an Open Danish Large Language Model [18.6] 本稿では,Llama2-7Bに基づくデンマークの大規模言語モデル(LLM)であるSnakModelを紹介する。
我々は13.6Bのデンマーク語の単語を継続的に事前訓練し、さらに3.7Mのデンマーク語の命令をチューニングした。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:38:21 GMT)
Chinese SafetyQA: A Safety Short-form Factuality Benchmark for Large Language Models [18.5] 大規模言語モデルの安全性は、その正確さ、包括性、安全性に関する理解の明確さと密接に関連している。
この事実性の能力は、これらのモデルを特定のリージョンに安全に、かつコンプライアンスにデプロイできるかどうかを決定する上で不可欠である。
これらの課題に対処し、短い質問に答えるLLMの事実性を評価するために、中国安全QAベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:03:44 GMT)
Unsupervised UAV 3D Trajectories Estimation with Sparse Point Clouds [18.5] 本稿では,時空間シーケンス処理を用いたコスト効率,教師なしUAV検出手法を提案する。
CVPR 2024 UG2+ Challengeの4位にランクインした。
我々は、研究コミュニティ.com/lianghanfang/UnLiDAR-UAV-Estのすべての設計、コード、サンプルデータをオープンソース化する予定です。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:30:31 GMT)
CATSplat: Context-Aware Transformer with Spatial Guidance for Generalizable 3D Gaussian Splatting from A Single-View Image [18.4] 単視点3Dシーン再構成のための新しい一般化可能なトランスフォーマーベースのフレームワークであるCATSplatを紹介する。
シーン固有のコンテキストの詳細をテキスト埋め込みからクロスアテンションに組み込むことで、コンテキスト認識の再構築の道を開く。
大規模データセットを用いた実験により, 単視点3次元シーン再構成におけるCATSplatの最先端性能が実証された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:32:04 GMT)
ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection [18.3] ORFormerは、見えない領域を検出し、見えない部分から欠落した機能を回復することができる。
本手法は,下流FLDタスクに対して高品質なヒートマップをコンパイルする。
得られた熱マップを既存のFLD手法に組み込むことで,挑戦的なデータセット上での芸術的状況に対して好意的に機能する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:53:43 GMT)
An Advantage-based Optimization Method for Reinforcement Learning in Large Action Space [18.0] 本稿ではアドバンテージ・ブランチ・デューリング Q-network (ABQ) という利点に基づく最適化手法とアルゴリズムを提案する。
ABQは各次元のアクション値を調整するためのベースライン機構を組み込み、異なるサブアクション間の有利な関係を活用する。
実験の結果、ABQはBDQを上回っ、HalfCheetah、Ant、Humanoid環境において3%、171%、84%の累積報酬を達成している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:04:39 GMT)
Defending LVLMs Against Vision Attacks through Partial-Perception Supervision [17.9] 近年、LVLM(Large Vision Language Models)の悪意ある注入や摂動画像に対する脆弱性に関する重大な懸念が提起されている。
DPS(Deefense through partial-Perception Supervision)と呼ばれるブラックボックス・トレーニング不要な手法を提案する。
DPSでは、攻撃時に部分的なイメージ理解に基づいて応答を調整することができ、クリーンな入力に対して元の応答を確実に維持することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:38:58 GMT)
On Distilling the Displacement Knowledge for Few-Shot Class-Incremental Learning [17.8] FSCIL(Few-shot Class-Incremental Learning)は、データ分散の進化と、現実のシナリオにおけるデータ取得の難しさに対処する。
FSCILでよく見られる破滅的な忘れ事に対処するために、知識の蒸留は、学習されたデータ分布から知識を維持する方法として用いられる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:27:21 GMT)
An Empirical Study of Fault Localisation Techniques for Deep Learning [17.6] 我々は、既存の最先端のフォールトローカライゼーション技術を評価し、比較する。
Dfdは最も効果的なツールであり、ベンチマークの平均リコール率は0.61で精度は0.41である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:07:46 GMT)
Deep Learning and Machine Learning -- Natural Language Processing: From Theory to Application [17.4] 自然言語処理(NLP)と大規模言語モデル(LLM)の役割に焦点を当てる。
本稿では,データ前処理技術とHugging Faceのようなフレームワークを用いたトランスフォーマーモデルの実装について論じる。
マルチリンガルデータの扱い、バイアスの低減、モデルの堅牢性確保といった課題を強調している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:26:39 GMT)
Voter Priming Campaigns: Strategies, Equilibria, and Algorithms [17.3] 問題サリエンス」は有権者の判断の主要な決定要因である。
複数政党構成における投票者プライミングのためのキャンペーン費用の動態,戦略,均衡について検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:28:02 GMT)
Romanization Encoding For Multilingual ASR [17.3] 我々は,多言語およびコードスイッチング自動音声認識システムの最適化のために,スクリプト重言語に対するロマネライズ符号化を導入する。
Roman2Charモジュールを備えたFastConformer-RNNTフレームワークにおいて,バランスの取れたトークンライザとともにローマン化符号化を採用することにより,語彙や出力次元を大幅に削減する。
本手法は,音響モデルと言語モデリングを分離し,システムの柔軟性と適応性を向上する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:28:55 GMT)
Mastering AI: Big Data, Deep Learning, and the Evolution of Large Language Models -- Blockchain and Applications [17.3] Bitcoinの構造と仕組みを調査し、仕事の証明、持ち込みの証明、スマートコントラクトなどのトピックを取り上げている。
分散型金融(DeFi)やサプライチェーン管理、ID認証といった業界におけるブロックチェーンの実践的応用が強調されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:03:42 GMT)
Dynamic Contrastive Knowledge Distillation for Efficient Image Restoration [17.3] 画像復元のための動的コントラスト知識蒸留(DCKD)フレームワークを提案する。
具体的には,学生の学習状態を知覚するために,動的コントラスト正規化を導入する。
また,教師モデルと学生モデルの画素レベルのカテゴリ分布を抽出・調整する分布マッピングモジュールを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:30:00 GMT)
WiseAD: Knowledge Augmented End-to-End Autonomous Driving with Vision-Language Model [17.1] WiseADは、推論、オブジェクト認識、リスク分析、運転提案、軌道計画を駆動できる特殊な視覚言語モデルである。
我々は、知識と計画データセットを駆動する共同トレーニングを採用し、モデルが知識に整合した軌道計画を実行できるようにする。
運転知識の多様性が拡大するにつれて、重大な事故が顕著に減少し、運転スコアと経路完成度が11.9%、12.4%向上した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:27:33 GMT)
PSMGD: Periodic Stochastic Multi-Gradient Descent for Fast Multi-Objective Optimization [17.1] マルチオブジェクト最適化(MOO)は多くの機械学習(ML)アプリケーションの中核にある。
我々はMOOを加速するためにPSMGD(Realic Multi-Grad Descent)を提案する。
PSMGDは、同等または優れた最先端のアルゴリズムを提供することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:25:55 GMT)
Practicable Black-box Evasion Attacks on Link Prediction in Dynamic Graphs -- A Graph Sequential Embedding Method [17.0] 動的グラフ(LPDG)におけるリンク予測は,Webサイトレコメンデーションやトラフィックフロー予測,組織研究など,現実世界のアプリケーションに広く適用されている。
そこで本研究では,対象のLPDGモデルに対する効果的な攻撃を,限られた数の相互作用と摂動で実現する,最初の実行可能なブラックボックス回避攻撃法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:53:32 GMT)
Seed-CTS: Unleashing the Power of Tree Search for Superior Performance in Competitive Coding Tasks [16.9] コード生成に特化して設計された新しいトークンレベルの木探索手法を提案する。
GPT4o-0513(0.245)のpass@100性能を超え,LiveCodeBench-Hardで0.305のパスレートを実現した。
本研究は,競合レベルのコード生成タスクの性能を著しく向上させる木探索の可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:10:21 GMT)
Posterior Mean Matching: Generative Modeling through Online Bayesian Inference [16.8] 後部平均マッチング (PMM) はベイズ推定に基づく新しい生成モデリング手法である。
PMMは共役対の分布を用いて、画像やテキストのような様々なモダリティの複雑なデータをモデル化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:34:58 GMT)
ExBody2: Advanced Expressive Humanoid Whole-Body Control [16.7] 動作を模倣するヒューマノイドを制御できる全身追跡フレームワークであるExBody2を提案する。
モデルは強化学習(Reinforcement Learning)を用いてシミュレーションでトレーニングされ、その後現実世界に移行する。
2つのヒューマノイドプラットフォーム上で実験を行い、最先端技術に対するアプローチの優位性を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:59:51 GMT)
Boosting Test Performance with Importance Sampling--a Subpopulation Perspective [16.7] 本稿では,重要なサンプリングを,サブポピュレーション問題を解決するためのシンプルかつ強力なツールとして同定する。
サブポピュレーション問題の新しい体系的定式化を行い、既存の研究で明確に述べられていない仮定を明確に特定する。
アプリケーション側では、サブポピュレーション問題を解決するのに十分な1つの推定器を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:25:24 GMT)
Everyday AR through AI-in-the-Loop [16.7] このワークショップは、拡張現実(AR)と人工知能(AI)の専門家と実践者を集結させ、日々のAR体験におけるAI-in-the-loopの未来を形作る。
適応的かつコンテキスト対応のAR、生成的ARコンテンツ生成、常時オンのAIアシスタント、AI駆動のアクセシブルデザイン、実世界のAIエージェントなど、さまざまなトピックについて議論する。
私たちのゴールは、デジタルと物理の世界をシームレスにブレンドする新しいAR体験を作ることに集中して、AI対応ARの機会と課題を特定することです。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:51:55 GMT)
Quantitative Predictive Monitoring and Control for Safe Human-Machine Interaction [16.5] 安全でない人間と機械の相互作用は破滅的な失敗を引き起こす。
本研究では,人間の相互作用の不確実性を考慮した将来状態の予測手法を提案する。
提案手法は,1型糖尿病管理と半自律運転の2つのケーススタディに適用する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:46:39 GMT)
Anytime Multi-Agent Path Finding with an Adaptive Delay-Based Heuristic [16.4] MAPF-LNSの単一破壊ヒューリスティックな変種として,Adaptive Delay-based Destroy-and-Repair with Enhanced Success-based Self-Learning (ADDRESS)を提案する。
我々は,1000エージェントまでの大規模シナリオにおいて,MAPF-LNSと比較して,少なくとも50%のコスト改善を実証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:29:09 GMT)
TrainMover: Efficient ML Training Live Migration with No Memory Overhead [16.4] 機械学習トレーニング中の機械置換を可能にするライブマイグレーションシステムであるTrainMoverを提案する。
評価の結果,TrainMoverは全ベースラインの16倍のダウンタイムを達成できた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:59:31 GMT)
SEED: Accelerating Reasoning Tree Construction via Scheduled Speculative Decoding [16.4] 大きな言語モデル(LLM)は、様々なタスクにまたがる顕著な創発的な能力を示すが、複雑な推論や計画タスクには欠ける。
本稿では,実行速度とGPUメモリ管理を同時に最適化する新しい,効率的な推論フレームワークであるSeeDを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:18:53 GMT)
RCTrans: Radar-Camera Transformer via Radar Densifier and Sequential Decoder for 3D Object Detection [16.4] レーダーカメラによる3D物体検出では、レーダーポイント雲は希少でノイズが多い。
我々はRadar-Pruning Transformer (RCTrans) という新しいクエリベースの検出手法を提案する。
提案手法は,最新のレーダーカメラによる3D検出結果を実現する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:02:36 GMT)
Quantum community detection via deterministic elimination [16.3] 複素ネットワークとグラフの構造特性を計算するための量子アルゴリズムを提案する。
対応するプロトコルであるdeteQtは、大規模なコミュニティとボットネット検出を実行するように設計されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:36:14 GMT)
Boosting Fine-Grained Visual Anomaly Detection with Coarse-Knowledge-Aware Adversarial Learning [16.3] 本稿では,再構成された特徴の分布と通常の特徴の分布を一致させるために,粗い知識を意識した対向学習法を開発した。
このアライメントは、自動エンコーダの異常に対する再構成能力を効果的に抑制し、検出精度を向上させる。
パッチレベルの異常情報は得られていないが、提案手法は、再構成されたパッチ特徴の分布を通常のものと整合させることができることを厳密に証明する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:24:08 GMT)
Split Knowledge Distillation for Large Models in IoT: Architecture, Challenges, and Solutions [16.3] 大規模モデル(LM)はIoT(Internet of Things)システムにおいて大きな可能性を秘めており、インテリジェントな音声アシスタント、予測保守、医療監視などのアプリケーションを可能にする。
エッジサーバ上でのLMのトレーニングは、データプライバシの懸念を高め、IoTデバイスに直接デプロイすることは、計算リソースとメモリリソースの制限によって制限される。
そこで本研究では,LMをIoTデバイスのより小型でデプロイ可能なバージョンに効率よく蒸留し,生データをローカルに残すための分割知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:31:31 GMT)
Memory-Augmented Agent Training for Business Document Understanding [16.1] LLMエージェントがドメインの専門知識を段階的に構築できる新しいパラダイムであるMatrix(Reasoning and Iterative eXploration)を導入する。
私たちは世界最大の物流企業と協力し、ユニバーサルビジネス言語形式の請求書のデータセットを作成します。
実験の結果、マトリックスは単一LSMを30.3%、バニラを35.2%向上させる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:35:04 GMT)
EventFull: Complete and Consistent Event Relation Annotation [16.1] textitEventFullは、時間、因果、およびコア参照関係の一貫性、完全、効率的なアノテーションをサポートするツールである。
パイロットスタディでは、EventFullがアノテーションプロセスのアクセラレーションと単純化を行い、アノテーション間のアノテータ間の合意が高くなることを示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:55:41 GMT)
ScreenMark: Watermarking Arbitrary Visual Content on Screen [16.1] ビジュアルスクリーンコンテンツ(VSC)は特に、スクリーンショットによる盗難やリークの影響を受けやすい。
任意のVSC保護のために設計された,堅牢で実用的な透かし手法であるScreenMarkを提案する。
ScreenMarkの有効性を検証するために、さまざまなデバイスや解像度から10万のスクリーンショットからなるデータセットをコンパイルした。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:57:52 GMT)
SWAN: Preprocessing SGD Enables Adam-Level Performance On LLM Training With Significant Memory Reduction [16.0] SWAN (SGD with Whitening And Normalization) は言語モデル上でのAdamレベルの性能に到達するのに十分であることを示す。
言語モデリングタスクでは、SWANは同じか、Adamよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:13:18 GMT)
A Survey on Recommendation Unlearning: Fundamentals, Taxonomy, Evaluation, and Open Questions [16.0] 推薦システムは、ユーザの行動と意思決定を形作ることに、ますます影響力を増している。
レコメンデータシステムにおける機械学習モデルの普及は、ユーザのプライバシとセキュリティに関する重要な懸念を引き起こしている。
従来の機械学習手法は、協調的な相互作用やモデルパラメータによって引き起こされるユニークな課題のために、アンラーニングを推奨するのに不適である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:58:55 GMT)
Conformal Prediction on Quantifying Uncertainty of Dynamic Systems [15.9] 力学系の不確実性評価に共形予測を導入する。
本稿では,コンフォメーション予測手法を用いて,ベンチマーク演算子学習手法による不確実性の評価を行う。
また、偏微分方程式データセットにおいてモンテカルロ・ドロップアウト法とアンサンブル法を比較した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:35:02 GMT)
From 2D CAD Drawings to 3D Parametric Models: A Vision-Language Approach [15.8] 2次元CAD図面から3次元パラメトリックモデルを再構成するCAD2Programを提案する。
本稿では、2D CAD描画を元のフォーマットによらず画像として扱い、標準の ViT モデルで画像をエンコードする。
出力側では,本手法はテキスト形式で3次元パラメトリックモデルを記述する汎用言語を自動回帰予測する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:38:28 GMT)
Common-Sense Bias Discovery and Mitigation for Classification Tasks [15.7] テキスト記述に基づく画像データセットにおける包括的バイアス情報を抽出する新しい枠組みを提案する。
ダウンストリーム実験により,複数の画像ベンチマークデータセットから新しいモデルバイアスが検出された。
発見されたバイアスは、単純なデータ再重み付け戦略によって緩和することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:59:42 GMT)
Towards Reliable Latent Knowledge Estimation in LLMs: Zero-Prompt Many-Shot Based Factual Knowledge Extraction [15.5] 本稿では,大規模言語モデル(LLM)を事実知識として探索する場合に,迅速なエンジニアリングを不要にすることを提案する。
我々のアプローチはZP-LKE(Zero-Prompt Latent Knowledge Estimator)と呼ばれ、LLMの文脈内学習能力を活用している。
我々は,Wikidata の知識ベースから,さまざまなオープンソース LLM の事実知識を,膨大な関連性や事実に対して大規模に評価する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:38:23 GMT)
FunEditor: Achieving Complex Image Edits via Function Aggregation with Diffusion Models [15.5] 拡散モデルは生成タスクにおいて優れた性能を示しており、画像編集の理想的な候補となっている。
本稿では,原子編集関数を学習し,より単純な関数を集約して複雑な編集を行うための,効率的な拡散モデルFunEditorを紹介する。
推論の4ステップだけで、FunEditorは既存の一般的なメソッドよりも5~24倍の推論スピードアップを達成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:21:31 GMT)
A New Adversarial Perspective for LiDAR-based 3D Object Detection [15.4] 我々は,LiDARでスキャンした2つのランダム物体(水霧と煙)の点雲からなる実世界のデータセット(ROLiD)を紹介する。
そこで我々は,PCS-GAN と命名された動き・内容分解生成対向ネットワークを用いた点雲列生成手法を提案する。
実験により, ランダム物体に基づく対向的摂動が車両検出を効果的に欺き, 3次元物体検出モデルの認識率を低下させることを示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:36:55 GMT)
Class-RAG: Real-Time Content Moderation with Retrieval Augmented Generation [15.3] 検索拡張生成(Class-RAG)を用いた分類手法を提案する。
モデル微調整と比較すると、クラスRAGは意思決定の柔軟性と透明性を示し、分類に優れ、敵の攻撃に対してより堅牢である。
また,検索ライブラリのサイズによってクラスRAG性能が向上することが示唆され,ライブラリサイズの増加はコンテンツモデレーションを改善するための実用的で低コストなアプローチであることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:07:18 GMT)
Interpreting GNN-based IDS Detections Using Provenance Graph Structural Features [15.3] ProVEXPLAINERは,解釈可能なサロゲートモデルを用いて,インスタンスレベルのセキュリティ対応の説明を提供するフレームワークである。
マルウェアとAPTデータセットでは、PROVEXPLAINERは29%/27%/25%高いフィディリティ+、精度とリコール、それぞれ12%低いフィディリティを達成している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:59:21 GMT)
3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting [15.1] 3D Gaussian Splatting (3DGS)は、消費者ハードウェア上で効率的な再構成と高忠実なリアルタイムレンダリングを行う大きな可能性を示している。
3DGSは理想的なピンホールカメラに制約されており、二次照明効果がない。
最近の方法では、代わりに粒子をトレースすることでこれらの制限に対処している。
本研究では,3DGS における EWA スプラッティングを Unscented Transform に置き換えた 3D Gaussian Unscented Transform (3DGUT) を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:21:25 GMT)
NFL-BA: Improving Endoscopic SLAM with Near-Field Light Bundle Adjustment [15.1] モノクロ内視鏡ビデオからの同時局所化とマッピングは、自律的なナビゲーション、監視されていない地域へのガイダンス、そして3D視覚化を可能にする。
既存の高密度SLAMアルゴリズムは、遠方および静的な照明とテクスチャ面を仮定することが多い。
我々は、新しいNear-Field Lighting Bundle Adjustment Loss $(L_NFL-BA)$を導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:54:28 GMT)
Trigger$^3$: Refining Query Correction via Adaptive Model Selector [15.1] 検索シナリオでは、タイプミス、音声エラー、知識ギャップによる誤ったクエリによって、ユーザエクスペリエンスが妨げられる可能性がある。
現在の補正モデル(通常、特定のデータに基づいてトレーニングされた小さなモデル)は、トレーニング範囲を超えてクエリに苦労することが多い。
本稿では,従来の訂正モデルと大規模言語モデルを統合した大規模モデルコラボレーションフレームワークであるTrigger$3$を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:16:54 GMT)
Sometimes I am a Tree: Data Drives Unstable Hierarchical Generalization [15.0] 我々は、英語文法のケーススタディを用いて、OODを一般化するために、いかに複雑で多様なトレーニングデータがモデルを動かすかを探る。
これらの因子はニュアンス的であり、中間レベルの多様性と複雑性がランダムな種子間の不整合性に繋がることを示した。
本研究は, 一般化パターン形成におけるトレーニングデータの重要性を強調し, 競合するモデル戦略が無作為な種子に対して不整合な一般化結果をもたらすかを明らかにした。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:42:57 GMT)
ALADE-SNN: Adaptive Logit Alignment in Dynamically Expandable Spiking Neural Networks for Class Incremental Learning [15.0] クラスインクリメンタルラーニング(CIL)のための動的構造を持つスパイキングニューラルネットワーク(SNN)を開発した。
このフレームワークは、バランスの取れた特徴表現のための適応ロジットアライメントと、凍結した古い特徴をトレーニング中に新しいクラスにマッピングする重み管理のためのOtoN抑制を含む。
実験の結果、ALADE-SNNはCIFAR100-B0ベンチマークで平均75.42のインクリメンタル精度を10段階以上達成していることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:13:22 GMT)
Learning of Patch-Based Smooth-Plus-Sparse Models for Image Reconstruction [14.9] 最適化を二段階問題として定式化する。
我々は,デノナイズ,超高分解能,圧縮型磁気共鳴イメージングの手法について検討した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:34:32 GMT)
Adaptive pruning-based Newton's method for distributed learning [14.9] 本稿では,分散適応ニュートン学習(textttDANL)という,新規で効率的なアルゴリズムを提案する。
textttDANLは、利用可能なリソースに効率よく適応し、高い効率を維持しながら、線形収束率を達成する。
実験により、textttDANLは、効率的な通信と異なるデータセット間の強い性能で線形収束を実現することが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:45:36 GMT)
Tangram: Benchmark for Evaluating Geometric Element Recognition in Large Multimodal Models [14.8] Tangramは幾何学的要素認識におけるLMMの性能を評価するために設計された新しいベンチマークである。
タングラムは、初等・中等教育試験、コンペティション、教科書から得られた1080の多様な幾何学図で構成されている。
トップパフォーマンスモデルは53.0%の精度しか達成せず、人間のパフォーマンスに比べてかなりの差がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:12:25 GMT)
Are Data Experts Buying into Differentially Private Synthetic Data? Gathering Community Perspectives [14.7] アメリカ合衆国では、差分プライバシー(DP)がプライバシ保護データ分析の技術的運用の主流となっている。
本研究はDPメカニズムの1つのクラスであるプライベートデータシンセサイザーについて質的に検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:50:14 GMT)
BOIDS: High-dimensional Bayesian Optimization via Incumbent-guided Direction Lines and Subspace Embeddings [14.6] BOIDSは,一次元方向線列による最適化を導く新しい高次元BOアルゴリズムである。
また,各ラウンドのラインベース最適化に対して最適な行を特定するための適応的選択手法を提案する。
実験の結果,BOIDSは様々な総合的および実世界のベンチマーク問題において,最先端のベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:51:24 GMT)
ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation [14.5] 本稿では、何千もの挑戦的なビデオを含む新しいデータセットViCaSを紹介する。
本ベンチマークでは,全体的/高レベルの理解と言語誘導,画素精度のセグメンテーションに関するモデルを評価する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:14:50 GMT)
Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMs [14.5] MLLMの効率向上を目的とした新しい手法であるTRIM(CLIP Metric)を導入する。
視覚質問応答(VQA)タスクにおける人間の注意パターンにインスパイアされたTRIMは、画像トークンの選択と縮小について、新たな視点を示す。
その結果,一貫した性能を維持しながら計算オーバーヘッドを著しく低減した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:05:27 GMT)
Monocular Facial Appearance Capture in the Wild [14.4] 本研究では、制約のない環境下での軽量な捕獲手順から、人間の顔の外観特性を復元する新しい手法を提案する。
簡単な頭部回転を含む単眼ビデオから, 表面形状, 拡散アルベド, スペクトル強度, スペクトル粗さを復元する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:30:56 GMT)
MAT: Multi-Range Attention Transformer for Efficient Image Super-Resolution [14.3] 多様な空間範囲にわたる注意の柔軟な統合は、大幅なパフォーマンス向上をもたらす可能性がある。
スーパーレゾリューション(SR)タスクに適したマルチランジアテンショントランス(MAT)を提案する。
MATは、様々な空間範囲にまたがる依存関係を包含し、その特徴表現の多様性と有効性を向上させる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:01:53 GMT)
Boosting LLM-based Relevance Modeling with Distribution-Aware Robust Learning [14.2] 本稿では,関係モデリングのための新しい分布認識ロバスト学習フレームワーク(DaRL)を提案する。
DaRLはAlipayの保険商品検索のためにオンラインで展開されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:10:47 GMT)
Parastatistics and a secret communication challenge [14.2] 2次元系における非アベリア・エノンのようなエキゾチックな統計を持つ準粒子の出現を示す。
本稿では,パラ粒子をホストする物理システムでのみ勝利できるチャレンジゲームを提案する。
これは、秘密通信における潜在的な応用と同様に、パラ粒子の操作定義と実験的なアイデンティティテストの両方を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:19:33 GMT)
Generative AI in Medicine [14.1] 本稿では, 臨床医, 患者, 臨床治験主催者, 研究者, 研修生を対象に, ジェネレーティブなAI利用事例を概観する。
プライバシーとセキュリティの維持、透明性と解釈可能性の改善、株式の維持、厳格なモデル評価など、さまざまな課題について議論する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:57:57 GMT)
RelCon: Relative Contrastive Learning for a Motion Foundation Model for Wearable Data [14.1] 本稿では,新しい自己指導型 *Rel*ative *Con*trastive Learning アプローチである RelCon を紹介する。
学習可能な距離測定は、モチーフの類似性とドメイン固有の意味情報をキャプチャする。
自己教師型モデルは、大規模なウェアラブルデータセットから87,376人の参加者から10億のセグメントでトレーニングされている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:31:47 GMT)
Future Aspects in Human Action Recognition: Exploring Emerging Techniques and Ethical Influences [14.1] 視覚に基づく人間の行動認識は、様々な応用分野において見られる。
次世代のハードウェアセンサーは、この問題に対処するロボットコミュニティをガイドする。
ヒューマンファクターの関与は、研究コミュニティの倫理的問題を提起する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:07:50 GMT)
Jailbreak Large Vision-Language Models Through Multi-Modal Linkage [14.0] 我々は、MML攻撃という新しいジェイルブレイク攻撃フレームワークを提案する。暗号からインスピレーションを得たMMLは、テキストと画像のモダリティをまたいだ暗号化復号プロセスを利用して、悪意のある情報の過剰露出を軽減する。
MMLjailbreaks GPT-4o with attack success rate 97.80% on SafeBench, 98.81% on MM-SafeBench, 99.07% on HADES-Dataset。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:09:08 GMT)
Continual Learning for Segment Anything Model Adaptation [14.0] 本研究では,8つのタスク領域を持つ新しい連続SAM適応(CoSAM)ベンチマークを提案する。
そこで,本研究では,SAMエンコーダがタスク領域ごとによく区切られた特徴を抽出するのを支援するために,新しい単純なyet- Effective Mixture of Domain Adapters (MoDA)アルゴリズムを提案する。
我々のMoDAは自然画像領域において高い競争力を維持しており、オリジナルのSAMのゼロショット性能に近づいた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:49:59 GMT)
No More Adam: Learning Rate Scaling at Initialization is All You Need [13.9] SGD-SaIは運動量による勾配降下(SGDM)の簡易かつ効果的な増強である
適応的な2階運動量に頼ることなく学習率を調整することで、SGD-SaIはトレーニングの不均衡を第1段階から防ぐことができる。
その単純さと効率にもかかわらず、SGD-SaIは様々なトランスフォーマーベースのタスクのトレーニングにおいて、AdamWと一貫して一致し、より優れています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:30:44 GMT)
LiNo: Advancing Recursive Residual Decomposition of Linear and Nonlinear Patterns for Robust Time Series Forecasting [13.9] 近年の深層時系列予測モデルでは, 季節分解とトレンド分解を利用して, 絡み合った成分を分離することが困難である。
線形パターンと非線形パターンの両方を明示的に抽出することにより再帰的残留分解を革新する。
我々は、一般的な学習可能な自己回帰モデルに対する現在の単純な線形パターン抽出器を開発し、すべての重要な非線形パターンを扱える新しいNoブロックを設計する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:53:29 GMT)
Open-Set Heterogeneous Domain Adaptation: Theoretical Analysis and Algorithm [13.8] ドメイン適応(DA)は、ターゲットドメインに一般化するソースドメインからモデルを学習することで、分散シフトの問題に取り組む。
既存のDAメソッドのほとんどは、ソースとターゲットドメインデータが同じ機能空間内にあるシナリオ用に設計されています。
本稿では、ソースドメインとターゲットドメイン間の不均一な特徴空間がもたらす課題を解決するために、オープンセットHeDA(OSHeDA)と呼ばれる新しいDAシナリオについて検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:59:52 GMT)
A Method for Enhancing Generalization of Adam by Multiple Integrations [13.8] 我々は、複数の積分項をアダムに統合する小説である多重積分アダム(MIAdam)を提案する。
この多重積分項は、最適化中に遭遇したシャープなミニマを効果的にフィルタする。
MIAdamはロバスト性やラベルノイズを向上するだけでなく、Adamの急速な収束特性も維持する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:15:38 GMT)
Multi-Scale Cross-Fusion and Edge-Supervision Network for Image Splicing Localization [13.8] ISLのためのマルチスケールクロスフュージョンおよびエッジスーパービジョンネットワークを提案する。
本フレームワークは, クロスフュージョン, エッジマスク予測, エッジスーパービジョンローカライゼーションの3つの重要なステップで構成されている。
提案手法は最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:10:04 GMT)
A Variable Occurrence-Centric Framework for Inconsistency Handling (Extended Version) [13.7] 本稿では,命題ベースにおける不整合の分析と処理を行うフレームワークを提案する。
最小整合関係(MIR)と最大整合関係(MCR)の2つの双対概念を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:17:54 GMT)
Differential Alignment for Domain Adaptive Object Detection [13.7] ドメイン適応オブジェクト検出(DAOD)は、ラベル付きソースドメインデータに基づいてトレーニングされたオブジェクト検出器をアノテーションなしでターゲットドメインに一般化することを目的としている。
既存のアプローチでは、ソースとターゲットドメイン全体の分布を調整するために、逆学習を採用している。
本稿では,その欠点を克服するための特徴アライメント戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:52:10 GMT)
TurboAttention: Efficient Attention Approximation For High Throughputs LLMs [13.5] 注意の定量化を可能にする包括的アプローチであるTurboAttentionを提案する。
FlashQは、KVキャッシュの圧縮とアクティベーション-アクティベーション乗算の量子化の両方を可能にする、ヘッドワイズアテンション量子化技術である。
SASは、注目中の指数演算中にFP32への復調を不要にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:40:09 GMT)
From An LLM Swarm To A PDDL-Empowered HIVE: Planning Self-Executed Instructions In A Multi-Modal Jungle [13.5] Hiveは適切なモデルを選択し、その後一連のアトミックアクションを計画するための包括的なソリューションである。
我々のフレームワークはタスク選択の最先端を再定義し、他の競合システムよりも優れています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:05:21 GMT)
Multi-View Incremental Learning with Structured Hebbian Plasticity for Enhanced Fusion Efficiency [13.5] MVILという名前のマルチビューインクリメンタルフレームワークは、シーケンシャルに到達したビューの微粒な融合をエミュレートすることを目的としている。
MVILは、構造的ヘビアン可塑性とシナプス分割学習の2つの基本モジュールがある。
6つのベンチマークデータセットの実験結果は、MVILの最先端手法に対する有効性を示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:10:46 GMT)
Reefknot: A Comprehensive Benchmark for Relation Hallucination Evaluation, Analysis and Mitigation in Multimodal Large Language Models [13.5] 我々は2万以上の実世界のサンプルからなる関係幻覚を対象とする総合的なベンチマークであるReefknotを紹介した。
関係幻覚を体系的に定義し、知覚的視点と認知的視点を統合するとともに、Visual Genomeのシーングラフデータセットを用いて関係ベースのコーパスを構築する。
本稿では,Reefknotを含む3つのデータセットに対して,幻覚率を平均9.75%削減する信頼性に基づく新たな緩和戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:19:46 GMT)
RareAgents: Autonomous Multi-disciplinary Team for Rare Disease Diagnosis and Treatment [13.3] 希少な病気が世界中で約3億人に影響を与えている。
近年,大規模言語モデル (LLM) を利用したエージェントは,様々な領域で顕著に改善されている。
RareAgentsは、Llama-3.1-8B/70Bをベースモデルとして、高度な計画機能、メモリ機構、医療ツールの利用を統合する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:22:24 GMT)
Coordinated Power Smoothing Control for Wind Storage Integrated System with Physics-informed Deep Reinforcement Learning [13.3] 電力平滑化制御(PSC)を用いた風力発電統合システムは, 効率と信頼性を両立させる有望なソリューションとして浮上している。
既存のPSC戦略は、バッテリと風力タービンの複雑な制御相互作用を見落とし、ウェイク効果やバッテリ劣化コストを考慮していない。
本稿では,これらの課題を効果的に解決するために,階層レベルの新しい協調制御フレームワークを考案した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:37:46 GMT)
Phoneme-Level Feature Discrepancies: A Key to Detecting Sophisticated Speech Deepfakes [13.2] 音素機能はディープフェイク検出のための強力な音声表現を提供する。
我々は,音素レベルの音声特徴の不整合を識別し,音声の深度を検出する新しいメカニズムを開発した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:31:19 GMT)
Your Next State-of-the-Art Could Come from Another Domain: A Cross-Domain Analysis of Hierarchical Text Classification [13.2] 階層ラベルを用いたテキスト分類は、自然言語処理において一般的で困難な課題である。
我々は、最先端の手法を実証分析した最初の包括的クロスドメイン概要を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:08:57 GMT)
TRAIL: Trust-Aware Client Scheduling for Semi-Decentralized Federated Learning [13.1] 本稿では,クライアントの状態とコントリビューションを評価する信頼対応クライアントスケジューリング機構(TRAIL)を提案する。
実世界のデータセットを用いて行った実験は、TRAILが最先端のベースラインより優れていることを示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:15:24 GMT)
Solid-SQL: Enhanced Schema-linking based In-context Learning for Robust Text-to-SQL [13.1] 大規模言語モデル(LLM)は、テキスト・ツー・システムの性能を大幅に改善した。
多くのSOTA(State-of-the-art)アプローチは、システムの堅牢性の重要な側面を見落としている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:22:22 GMT)
HyperGS: Hyperspectral 3D Gaussian Splatting [13.1] ハイパースペクトルノベルビュー合成(HNVS)のための新しいフレームワークであるHyperGSを紹介する。
提案手法は,多視点3次元ハイパースペクトルデータセットから材料特性を符号化することで,空間・スペクトルの同時レンダリングを可能にする。
これまでに公表されたモデルに対して14dbの精度向上を図り、実・模擬ハイパースペクトルシーンを広範囲に評価することで、HyperGSのロバスト性を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:23:07 GMT)
SEG-SAM: Semantic-Guided SAM for Unified Medical Image Segmentation [13.0] 本稿ではセマンティックガイドSAM(SEG-SAM)を提案する。
まず、バイナリとセマンティック予測の潜在的な衝突を避けるために、SAMの元々のデコーダとは独立にセマンティック・アウェア・デコーダを導入する。
我々は、大規模言語モデルから医療カテゴリーの重要な特徴を抽出し、テキスト・ツー・ビジョン・セマンティック・モジュールを通じてSEG-SAMに組み込む。
最後に、SEG-SAMの2つのデコーダから予測されたマスク間の重なり合いを促進するために、マスク間空間アライメント戦略を導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:29:13 GMT)
An Automated Explainable Educational Assessment System Built on LLMs [13.0] AERA Chatは、学生の反応をインタラクティブかつ視覚的に評価するための自動教育アセスメントシステムである。
本システムでは,ユーザが質問や学生の回答を入力し,評価精度に関する洞察を教育者や研究者に提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:29:18 GMT)
MM-Path: Multi-modal, Multi-granularity Path Representation Learning -- Extended Version [12.9] マルチモーダル・マルチグラニュラリティパス表現学習フレームワーク(MM-Path)を提案する。
MM-Pathは道路経路と画像経路の両方からモダリティを統合することで、一般的な経路表現を学習することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:10:38 GMT)
Control of open quantum systems: Manipulation of a qubit coupled to a thermal bath by an external driving field [12.9] 非平衡グリーン関数法による量子ビット制御について検討する。
最適な運転プロファイルの予測に加えて、システム進化のより正確な記述により、システムはより迅速に最終状態に到達できることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:39:52 GMT)
Systematic Biases in LLM Simulations of Debates [12.9] 人間の相互作用をシミュレートする際の大規模言語モデルの限界について検討する。
以上の結果から, LLMエージェントがモデル固有の社会的バイアスに適合する傾向が示唆された。
これらの結果は、エージェントがこれらのバイアスを克服するのに役立つ方法を開発するためのさらなる研究の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:17:21 GMT)
Key Exchange in the Quantum Era: Evaluating a Hybrid System of Public-Key Cryptography and Physical-Layer Security [12.8] 公開鍵方式と物理層セキュリティを組み合わせた鍵交換プロトコルの評価を行った。
プロトコルの概要を述べ、セキュリティについて議論し、解決すべき課題を指摘する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:56:04 GMT)
Tilted Quantile Gradient Updates for Quantile-Constrained Reinforcement Learning [12.7] 予測型近似を使わずに高いレベルの安全性を実現する安全な強化学習(RL)パラダイムを提案する。
非対称分布密度を補償するために、量子勾配の傾き更新戦略を実装した。
実験により、提案モデルが安全性要件(量子的制約)を完全に満たし、高いリターンで最先端のベンチマークより優れていることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:58:00 GMT)
SemStereo: Semantic-Constrained Stereo Matching Network for Remote Sensing [12.7] 本稿では,ステレオマッチングタスクに対して,暗黙的かつ明示的に意味制約を課す新しいネットワークを提案する。
US3DデータセットとWHUデータセットを用いた実験により,本手法はセマンティックセグメンテーションとステレオマッチングの両面において最先端の性能を実現することを示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:02:55 GMT)
Unlock the Correlation between Supervised Fine-Tuning and Reinforcement Learning in Training Code Large Language Models [12.7] 本研究では,教師付き微調整と強化学習の相関関係の解明を試みる。
SFTの一般化には原子関数と合成関数の両方が不可欠である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:53:54 GMT)
When to Speak, When to Abstain: Contrastive Decoding with Abstention [12.6] 大規模言語モデル(LLM)は、事前訓練された知識と外部知識の両方を活用することで、様々なタスクにまたがる例外的なパフォーマンスを示す。
本論文は,ユーザの要求が満たされない場合に,関連する知識の欠如によりタスク範囲を拡大する。
本稿では,LLMが関連する知識が利用可能であれば応答を生成でき,それ以外は無視できる訓練不要な復号法であるContrastive Decoding with Abstentionを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:38:08 GMT)
Preference-Oriented Supervised Fine-Tuning: Favoring Target Model Over Aligned Large Language Models [12.5] 我々は,新しいtextbfpreference-textbforiented 教師付き textbffine-textbftuning アプローチ,すなわち PoFT を導入する。
直感的には、SFTを特定の嗜好を与えることによって強化することであり、同じSFTデータ上で、整列 LLM 上でターゲットモデルをテキストフォバリングする。
PoFTは、さまざまなトレーニングデータセットとベースモデルにわたるSFTベースラインに対して、安定的で一貫した改善を実現している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:49:14 GMT)
Causal Invariance Learning via Efficient Optimization of a Nonconvex Objective [12.4] 本稿では,変数間の因果関係を求める新しい手法を提案する。
本手法は標準勾配法に収束することを示す。
我々のアルゴリズムは徹底的な探索を回避し、特に共変数が多ければなおさらである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:44:30 GMT)
SafeDrive: Knowledge- and Data-Driven Risk-Sensitive Decision-Making for Autonomous Vehicles with Large Language Models [12.4] SafeDriveは、自律運転の安全性と適応性を高めるための、知識とデータ駆動型リスクに敏感な意思決定フレームワークである。
知識駆動型洞察と適応学習機構を統合することにより、不確実な条件下での堅牢な意思決定を保証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:45:27 GMT)
Optimize the Unseen -- Fast NeRF Cleanup with Free Space Prior [12.3] フローター」は、特にトレーニングカメラで見えない地域では、新しいビュークオリティを低下させる。
高速でポストホックなNeRFクリーニング手法として,自由空間優先を強制することで,そのようなアーティファクトを除去する手法を提案する。
提案手法は既存のNeRFクリーンアップモデルに匹敵するが, 推定時間では2.5倍高速である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:33:36 GMT)
Neural Topic Modeling with Large Language Models in the Loop [12.1] 大きな言語モデル(LLM)はトピック発見において有望な能力を示している。
ニューラルトピックモデル(NTM)とLLMを統合する新しいフレームワークであるLLM-ITLを提案する。
コードとデータセットはGithubで公開されます。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:27:04 GMT)
Implicit Location-Caption Alignment via Complementary Masking for Weakly-Supervised Dense Video Captioning [12.1] Weakly-Supervised Dense Video Captioningは、イベント境界のアノテーションを必要とせずに、ビデオ内のすべてのイベントをローカライズし、記述することを目的としている。
既存の方法は、イベントの位置とキャプションの間の明示的なアライメントの制約に依存している。
補似マスキングによる新しい暗黙的位置キャプチャアライメントパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:52:50 GMT)
A Step-by-step Introduction to the Implementation of Automatic Differentiation [12.0] この文書は、単純な自動微分システムを実装するステップバイステップで導入する。
数学的概念と実装を合理化する。
それぞれの実装の詳細の背後にあるモチベーションを与えます。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:58:55 GMT)
Bringing Multimodality to Amazon Visual Search System [12.0] 純粋な画像と画像のマッチングは、局所的な視覚パターンとのマッチングによって生じる偽陽性に悩まされることを示す。
具体的には、深層学習に画像テキストアライメントの損失を付加する。
この変化が画像マッチング問題に対する画像の大幅な改善につながることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:45:25 GMT)
Accelerating nuclear-norm regularized low-rank matrix optimization through Burer-Monteiro decomposition [11.8] 凸正規化および低ランク行列問題に対する高速BM-Globalを提案する。
BM-Globalは、原子力ノーミライザを含む低ランク問題に対する最先端のアルゴリズムよりも高速である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:39:42 GMT)
Entire-Space Variational Information Exploitation for Post-Click Conversion Rate Prediction [11.7] CVR予測のための全空間変動情報活用フレームワーク(EVI)を提案する。
第一に、EVIは条件付き全空間CVR教師を使用して、バイアスのない擬似ラベルを生成する。
そして、非クリック空間情報を対象のCVR推定器に転送するために、変動情報利用とロジット蒸留を適用する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:37:01 GMT)
CNNSum: Exploring Long-Context Summarization with Large Language Models in Chinese Novels [11.6] CNNSumは中国の小説に基づく長文要約のベンチマークである。
4つのサブセットは合計695個のサンプルを持ち、長さは16kから128kである。
我々は、長文要約を探索し、改善するための実験を行う。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:03:43 GMT)
A Simple and Fast Way to Handle Semantic Errors in Transactions [11.6] 本稿では,大規模言語モデル(LLM)が生成するデータベーストランザクションを扱うことに焦点を当てる。
Invariant Satisfaction(I-Confluence)に基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:47:18 GMT)
ArchesWeather & ArchesWeatherGen: a deterministic and generative model for efficient ML weather forecasting [11.6] 本稿では,確率論的気象モデルの設計において決定論的気象モデルを活用する手法を提案する。
我々の研究は、気象予報研究における決定論的および生成的機械学習モデルの利用を民主化することを目的とする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:54:30 GMT)
XPath Agent: An Efficient XPath Programming Agent Based on LLM for Web Crawler [11.5] Agentは、WebクローリングとWebテスト用に特別に設計された、プロダクション対応のプログラミングエージェントである。
Agentの重要な機能は、単一の自然言語クエリを使用して、サンプルされたWebページのセットからクエリを自動的に生成する機能である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:36:16 GMT)
Improving Explainability of Sentence-level Metrics via Edit-level Attribution for Grammatical Error Correction [11.5] 本稿では,個々の編集に文レベルスコアを寄与させ,特定の修正が全体のパフォーマンスにどのように貢献するかを考察する。
既存の文レベルのメトリクスを用いた実験は、異なる編集粒度間で高い一貫性を示し、人間の評価と約70%の一致を示す。
さらに、帰属結果に基づいてメトリクスのバイアスを分析し、正書法編集を無視する傾向などの傾向を明らかにする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:31:17 GMT)
Suppressing Uncertainty in Gaze Estimation [11.2] 視線推定の不確かさは, 咬合, ぼかし, 不一致眼球運動, あるいは非顔像の2つの側面に現れる。
本稿では,この不確かさを推定・低減するために,新しい三重ラベル整合性測定法(Suppressing Uncertainty in Gaze Estimation,SUGE)を提案する。
視線推定ベンチマークによる実験結果から,提案したSUGEが最先端の性能を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:17:19 GMT)
Harnessing Event Sensory Data for Error Pattern Prediction in Vehicles: A Language Model Approach [11.2] 車両群からのイベントデータの時間的ダイナミクスとコンテキスト的関係を利用してエラーを予測します。
2つの因果変換器によってモデル化され、車両の故障や故障を予測できる。
平均で160ドルのエラーコードをシーケンスすると、エラーコードの半分しか得られず、80%のF1スコアが得られます。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:05:30 GMT)
FiRST: Finetuning Router-Selective Transformers for Input-Adaptive Latency Reduction [11.1] 本稿では、層固有のルータを用いて、各入力シーケンスに対して適応的に変換器層のサブセットを選択することでレイテンシを低減するアルゴリズムであるFiRSTを提案する。
FiRSTは品質を認識しながら高速な推論を可能にするKVキャッシュとの互換性を維持する。
私たちのアプローチでは、入力適応性は重要であり、タスクによって異なるタスク固有の中間層が隠れた表現を進化させる上で重要な役割を担っています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:11:47 GMT)
Quantum Software Engineering: Roadmap and Challenges Ahead [11.1] この研究では、アクティブな研究者のグループが量子ソフトウェア工学の研究の現状を深く分析している。
この分析から、量子ソフトウェア工学の重要な領域を特定し、今後数年で解決すべき最も関連性の高いオープン課題を決定するために探索する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:47:03 GMT)
Task-Agnostic Language Model Watermarking via High Entropy Passthrough Layers [11.1] 本稿では,既存の事前学習ネットワークに付加されたパススルー層を用いたモデル透かしを提案する。
本手法は完全にタスク非依存であり,分類タスクとシーケンス対シーケンスタスクの両方に適用できる。
提案手法は, 下流の微調整, 微切り, 層除去攻撃に対して堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:46:50 GMT)
AnalogXpert: Automating Analog Topology Synthesis by Incorporating Circuit Design Expertise into Large Language Models [11.0] 本稿では,実用的なトポロジ合成問題の解決を目的としたLLMベースのエージェントであるAnalogXpertを提案する。
まず、アナログトポロジをSPICEコードとして表現し、設計空間を減らすためにサブ回路ライブラリを導入する。
第2に、CoTと非コンテキスト学習技術を用いて、問題を2つのサブタスクに分解する。
第3に,LLMが初期設計の誤りを漸進的に修正できる証明読解戦略を導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:08:08 GMT)
Decomposing Global Feature Effects Based on Feature Interactions [10.9] グローバルエフェクトの一般化付加分解(GADGET)は特徴空間の解釈可能な領域を見つけるための新しいフレームワークである。
フレームワークの数学的基盤を提供し、限界特徴効果を可視化する最も一般的な手法に適用可能であることを示す。
提案手法の理論的特性を,異なる実験環境における様々な特徴効果法に基づいて実験的に評価した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:31:14 GMT)
Learning Visuotactile Estimation and Control for Non-prehensile Manipulation under Occlusions [10.9] 非包括的操作は、接触に富む環境において、器用なロボットにとって不可欠である。
本稿では,非包括的操作のためのビゾタクティル状態推定器の学習方法と不確実性を考慮した制御ポリシーを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:33:05 GMT)
Multi-Dimensional Insights: Benchmarking Real-World Personalization in Large Multimodal Models [10.8] 人間の生活の一般的な6つのシナリオをカバーする500以上の画像を含む多次元インサイト(Multi-dimensional Insights)ベンチマークを提案する。
この設計により、異なる年齢集団の好みやニーズを満たすLMMの能力を詳細に評価することができる。
今後、MDI-BenchmarkがLMMにおける現実のパーソナライゼーションを整合させる新たな経路を開拓することを期待している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:06:10 GMT)
Do Parameters Reveal More than Loss for Membership Inference? [10.8] 最適メンバーシップ推論には、ホワイトボックスアクセスが本当に必要であることを示す。
我々の理論的結果は、新しいホワイトボックス推論攻撃、IHA(Inverse Hessian Attack)につながる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:40:52 GMT)
Tell Me What to Track: Infusing Robust Language Guidance for Enhanced Referring Multi-Object Tracking [10.6] 参照マルチオブジェクト追跡(RMOT)は、任意の数のターゲットをローカライズすることを目的とした、新たなクロスモーダルタスクである。
我々は、不均衡の影響を軽減するために協調的マッチング戦略を実行し、新生児の標的を検出する能力を高める。
エンコーダでは,従来の作業のボトルネックを克服し,クロスモーダル・マルチスケール融合を統合し,強化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:43:35 GMT)
ParMod: A Parallel and Modular Framework for Learning Non-Markovian Tasks [10.5] 多くの実世界のタスクは、長期記憶と依存性を持つ非マルコフ的タスクである。
時間論理で指定されたNMTを学習するための新しい textbfParallel と textbfModular RL フレームワークである ParMod を提案する。
したがって、我々の研究は、RL、NMT、時間論理学の間で良い相乗効果をもたらす。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:16:53 GMT)
MeTHanol: Modularized Thinking Language Models with Intermediate Layer Thinking, Decoding and Bootstrapping Reasoning [10.5] 大規模言語モデルは、人間の表現を合理的に理解し、生成することができるが、完全な思考と推論機構が欠如している可能性がある。
本稿では,自然界における認知メカニズムに動機付けられ,TaSと呼ばれる新しいモデルアーキテクチャを設計する。
思考強化データを用いて言語モデルを訓練し、思考層が合理的な思考を自動的に生成し、最終的にはより合理的な応答を出力することに成功した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:30:39 GMT)
Modeling Temporal Dependencies within the Target for Long-Term Time Series Forecasting [10.5] 長期時系列予測(LTSF)は、様々な領域において重要な課題である。
我々は、時間依存アライメント(TDAlign)という、新規で汎用的な時間的モデリングフレームワークを提案する。
プラグアンドプレイのフレームワークとして、TDAlignは計算オーバーヘッドを最小限に抑えて既存のメソッドを拡張する。
TDAlignは平均して、textbf1.47% によるベースライン予測エラーを textbf9.19% に削減し、textbf4.57% から textbf15.78% に変更し、大幅なパフォーマンス改善を強調している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:44:36 GMT)
KnowFormer: Revisiting Transformers for Knowledge Graph Reasoning [10.4] メッセージパッシングの観点から知識グラフの推論を行うために,KnowFormerを提案する。
クエリ、キー、値のそれぞれを計算する構造対応モジュールを導入します。
実験結果から,KnowFormerの性能は顕著なベースライン法に比べて優れていた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:27:01 GMT)
Shared Attention-based Autoencoder with Hierarchical Fusion-based Graph Convolution Network for sEEG SOZ Identification [10.4] 発作発症ゾーン(SOZ)の診断は神経外科の課題であり、脳電図(sEEG)が重要な技術である。
sEEG SOZの同定において、既存の研究はてんかん情報の患者内表現にのみ焦点をあてている。
本稿では、上記の課題に対処するために、共有注意ベースオートエンコーダ(sATAE)を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:20:02 GMT)
Experience of Training a 1.7B-Parameter LLaMa Model From Scratch [10.4] DMaS-LLaMa-Liteのトレーニングから得られた洞察を約200億個の慎重にキュレートされたデータのトークンで共有する。
我々は、検証損失レベルとダウンストリームベンチマークの進化が、不整合テキストから、流動的で文脈に根ざしたアウトプットへの移行を反映しているかを記述した、完全なトレーニングの軌跡を詳述する。
これらの経験を詳述し、トレーニングログ、チェックポイント、サンプルアウトプットを提供することで、将来の研究者や実践者が事前学習戦略を洗練することを目指している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:15:52 GMT)
RemoteRAG: A Privacy-Preserving LLM Cloud RAG Service [10.4] ユーザクエリを保護するために、プライバシ保護クラウドRAGサービスを正式に定義したのは、当社が初めてです。
プライバシに関しては、ユーザクエリのプライバシリークと関連するドキュメントからのリークを特徴付けるために、$(n,epsilon)$-DistanceDPを導入します。
効率を上げるために、全文書から、$(n,epsilon)$-DistanceDPから生成される摂動埋め込みに関連する少数の選択された文書まで、検索範囲を限定する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:36:52 GMT)
Multi-Modal Recommendation Unlearning for Legal, Licensing, and Modality Constraints [10.3] 本稿では,MMRS と未学習項目データにおける非学習に関する最初のアプローチである MMRecUn を紹介する。
MMRecUnはベースライン方式に比べて最大49.85%のリコール性能向上を実現している。
最大$mathbf1.3timesはゴールドモデルよりも高速である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:35:15 GMT)
Automated Phytosensing: Ozone Exposure Classification Based on Plant Electrical Signals [10.3] 本研究では, 生物の分散ネットワークを空気質センサとして利用し, その電気生理学的な測定を行い, 環境状態を推定することを提案する。
本手法は, 植物オゾン曝露を94.6%の精度で未確認データで分類することに成功した。
本研究は, コスト効率の高い高密度都市大気モニタリングシステムの開発に寄与する植物センシング装置の開発に有効である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:29:00 GMT)
VisualRWKV: Exploring Recurrent Neural Networks for Visual Language Models [10.3] 線形RNNモデルのマルチモーダル学習タスクへの最初の応用であるVisualRWKVを紹介する。
モデリング能力を高めるために,データ依存の再現とサンドイッチプロンプトを提案する。
VisualRWKVは、様々なベンチマークでLLaVA-1.5のようなTransformerベースのモデルと比較して、競争力がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:46:19 GMT)
A Consolidated Volatility Prediction with Back Propagation Neural Network and Genetic Algorithm [10.2] 本稿では,バックプロパゲーションニューラルネットワークと遺伝的アルゴリズムを併用した統合モデルを構築し,新興市場の将来的ボラティリティを予測する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:32:05 GMT)
iPrOp: Interactive Prompt Optimization for Large Language Models with a Human in the Loop [10.2] 本稿では,新しい対話型プロンプト最適化システムであるtextitiPrOp$を紹介する。
最適化ループへの人間の介入により、$textitiPrOp$は、進化するプロンプトを評価する柔軟性を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:09:15 GMT)
Fibottention: Inceptive Visual Representation Learning with Diverse Attention Across Heads [10.2] トランスフォーマーアーキテクチャにおけるMHSAの代替として,Fibottentionと呼ばれる新しいマルチヘッド自己アテンション(MHSA)モデルを提案する。
フィボテンションはデータ効率が高く、標準的なMHSAよりも大量のトークンを処理するのに適している。
拡張されたフィボナッチ配列に基づいて、構造化されたスパークアテンションを採用しており、ユニークなことに、アテンションヘッドによって異なる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:37:37 GMT)
Neural-Network-Driven Reward Prediction as a Heuristic: Advancing Q-Learning for Mobile Robot Path Planning [10.1] ニューラルネットワークの出力を情報として利用し,Q-ラーニングの収束過程を高速化するNDR-QL法を提案する。
提案手法は,ベースラインQ-ラーニング手法の収束速度を90%向上し,パス品質の指標において従来改善されていたQ-ラーニング手法を上回っている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:19:40 GMT)
EOGS: Gaussian Splatting for Earth Observation [10.0] 標準ガウススプラッティングフレームワークがリモートセンシングにどのように適応できるかを示す。
これにより、最先端のパフォーマンスを数分で達成できます。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:11:14 GMT)
CALA: A Class-Aware Logit Adapter for Few-Shot Class-Incremental Learning [10.0] 疑似増分学習パラダイムを用いてバイアス予測の正当性を学習する軽量なアダプタを提案する。
提案手法は,疑似増分学習パラダイムを用いてバイアス予測の正当性を学習する軽量アダプタを含む。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:21:46 GMT)
The Context of Crash Occurrence: A Complexity-Infused Approach Integrating Semantic, Contextual, and Kinematic Features [9.9] 本稿では,道路の複雑化機能と衝突予測機能を統合した2段階のフレームワークを提案する。
最初の段階では、エンコーダがこれらの特徴から隠れたコンテキスト情報を抽出し、複雑さを注入した特徴を生成する。
第2段階では、原型と複雑性に富んだ両方の特徴を用いて衝突確率を予測し、精度は87.98%に達した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:59:06 GMT)
Algorithmic Strategies for Sustainable Reuse of Neural Network Accelerators with Permanent Faults [9.9] 本稿では、ニューラルネットワーク(NN)アクセラレーターにおける恒久的ハードウェア故障をバイパスする代わりに、障害成分の挙動を一意に統合して定量化する手法を提案する。
Invertible Scaling や Shifting of activations や Shifting of Shifting of weights, fine tuning with the faulty behavior など,無停止断層のサブセットに対するアルゴリズム的緩和手法を提案する。
特に、提案手法はハードウェアの変更を一切必要とせず、代わりに広く使われているシストリックアレイベースの加速器の既存のコンポーネントに依存している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:56:09 GMT)
Non-autoregressive Generative Models for Reranking Recommendation [9.9] 推薦システムでは、項目間のリスト内相関をモデル化することで、リランクが重要な役割を果たす。
本研究では, 効率と効率性を高めるために, 提案するレコメンデーション(NAR4Rec)の再評価のための非自己回帰生成モデルを提案する。
NAR4Recは、毎日3億人のアクティブユーザーがいる人気ビデオアプリKuaishouに完全にデプロイされている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:19:27 GMT)
Consistent Diffusion: Denoising Diffusion Model with Data-Consistent Training for Image Restoration [9.7] 本稿では,画像復元作業における拡散モデル(DDM)の限界に対処する。
本稿では,DDMがトレーニング中に蓄積した誤りの画像にアクセスできるようにする,データ一貫性トレーニングという新しいトレーニング手法を提案する。
本手法は、歪みを効果的に最小化し、画像の忠実さを保ちながら、最先端の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:21:16 GMT)
Towards Reliable Detection of LLM-Generated Texts: A Comprehensive Evaluation Framework with CUDRT [9.7] 大規模言語モデル(LLM)はテキスト生成が大幅に進歩しているが、その出力の人間的な品質は大きな課題を呈している。
中国語と英語の総合的な評価フレームワークとバイリンガルベンチマークであるCUDRTを提案する。
このフレームワークは、スケーラブルで再現可能な実験をサポートし、運用の多様性、多言語トレーニングセット、LLMアーキテクチャが検出性能に与える影響を分析する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:20:34 GMT)
Scalable Surrogate Verification of Image-based Neural Network Control Systems using Composition and Unrolling [9.6] 本研究では,実世界に代わって条件付き生成逆数ネットワーク(cGAN)をイメージジェネレータとして訓練し,サロゲート検証手法を提案する。
我々は、cGANとニューラルネットワークコントローラとともにシステムのダイナミクスを構成することで、一段階のエラーを克服する。
単一ステップの合成を繰り返し、制御ループの複数のステップを大規模ニューラルネットワークに展開することで、マルチステップエラーを低減する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:57:11 GMT)
Image registration is a geometric deep learning task [9.6] 幾何学的深層学習の原理を応用した,データ駆動の変形可能な画像登録のための新しいパラダイムを提案する。
本手法は, 多数の医用画像登録タスクにおいて, 変形をフルに把握する能力について検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:47:10 GMT)
Runtime Analysis for Multi-Objective Evolutionary Algorithms in Unbounded Integer Spaces [9.6] 整数探索空間に対する多目的進化アルゴリズムを解析する。
パワーロー変異は指数的な尾を持つ突然変異よりも優れていることが判明した。
整数空間における未知問題に対して、パワーロー突然変異を推奨する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:52:14 GMT)
Efficient tensor networks for control-enhanced quantum metrology [9.6] 長い制御操作によって強化された量子力学の戦略を最適化するための効率的なテンソルネットワークアルゴリズムを提案する。
提案アルゴリズムは,最大$N=100$クエリに対して,メトロジー戦略を最適化する上で,優れた性能を有する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:11:26 GMT)
Unleashing the Potential of Model Bias for Generalized Category Discovery [9.6] 一般化カテゴリー発見(Generalized Category Discovery)は、既知のカテゴリーと未定義のカテゴリの両方を特定することを目的とした重要なタスクである。
主な課題は、既知のカテゴリのみに対する事前学習によって引き起こされるモデルバイアスと、新しいカテゴリに対する正確な監督の欠如である。
本稿では,これらの課題に対処するため,SDC(Self-Debiasing)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:05:27 GMT)
An Exploratory Study of ML Sketches and Visual Code Assistants [9.5] 私たちは、IDE内スケッチ・トゥ・コードツールに関するユーザからのフィードバックを得るために、Visual Code Assistantの最初のプロトタイプを構築します。
機械学習ワークフローを開発する際に、スケッチでよく見られるパターンを分析し、開発者のメンタルモデルを分析する。
LLM-as-judgeセットアップを使用して生成したコードの品質をスコアし、簡単なスケッチであっても有用なコードアウトラインを効果的に生成できることを発見します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:44:45 GMT)
Subspace Implicit Neural Representations for Real-Time Cardiac Cine MR Imaging [9.4] 本稿では,連続した放射状データを用いたリアルタイム心血管MRIのためのサブスペース暗黙的ニューラル表現に基づく再構成フレームワークを提案する。
本手法は,トレーニング中に連続サンプリングしたラジアルk空間スポークを直接利用することにより,バイナリ化や非一様FFTの必要性を解消する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:06:37 GMT)
Rethinking Diffusion-Based Image Generators for Fundus Fluorescein Angiography Synthesis on Limited Data [9.3] 本稿では,医療データ制限の課題を克服するために,新しい潜伏拡散モデルに基づくフレームワークを提案する。
本フレームワークは,既存の方法と比較して最先端の成果を達成し,眼科診断や患者ケアの強化に有意な可能性を秘めている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:37:46 GMT)
Auto-bidding in real-time auctions via Oracle Imitation Learning (OIL) [9.2] マルチスロット第2価格オークションにおける自動入札エージェントのトレーニングフレームワークを提案する。
広告キャンペーンが終了すると、各インプレッション機会の最適入札を決定することは、複数の選択knapsack問題とみなすことができるという知見を活用できる。
本稿では,印象の機会と広告スロットをほぼ最適に組み合わせた「オークル」アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:56:42 GMT)
Beyond Accuracy: On the Effects of Fine-tuning Towards Vision-Language Model's Prediction Rationality [9.2] 視覚言語モデル(VLM)の予測合理性に及ぼす微調整の影響について検討する。
予測信頼性と推論信頼性という2つの新しい指標を提案する。
精巧な微調整法は, 不正な証拠に基づいて, より正確な予測を導いた。
対象物の有効な証拠を特定できたため、微調整されたVLMは正しい予測を行う可能性が高かった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:09:49 GMT)
BadSAD: Clean-Label Backdoor Attacks against Deep Semi-Supervised Anomaly Detection [9.1] BadSADはDeepSADモデルをターゲットにした、新しいバックドア攻撃フレームワークである。
我々のアプローチには、トリガーインジェクションと潜時空間操作という2つの重要なフェーズがある。
ベンチマークデータセットの実験は、攻撃戦略の有効性を検証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:52:56 GMT)
MOPO: Multi-Objective Prompt Optimization for Affective Text Generation [9.1] 感情がどのように表現されるかは、文脈や領域によって異なる。
マルチオブジェクト・プロンプト最適化手法であるMOPOを紹介する。
様々なドメイン固有感情分類器によって決定される3つの目的を用いてMOPOを評価する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:28:14 GMT)
Optimal Hamiltonian recognition of unknown quantum dynamics [9.1] 我々は、既知のハミルトニアン集合からハミルトニアン支配量子力学を識別するフレームワークであるハミルトニアン認識を導入する。
2つの量子信号処理構造上のコヒーレント関数シミュレーションのための量子アルゴリズムを開発した。
超伝導量子プロセッサ上でのプロトコルの有効性を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:31:35 GMT)
Speeding Up the NSGA-II With a Simple Tie-Breaking Rule [9.0] 我々は、次の人口の選択において、単純なタイブレーキングルールを解析する。
従来のOneMinMax、LeadingOnesZero、OneJumpJumpベンチマークでベンチマークの有効性を証明する。
両目的問題に対して,最小サイズ以上の集団規模を適度に増やすと,実行時保証が増加しないことを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:57:30 GMT)
The Jacobi Factoring Circuit: Quantum Factoring with Near-Linear Gates and Sublinear Space and Depth [8.9] 本稿では、古典的硬さがRSAと同値であると期待されているものを含む、整数の大規模なクラスを分解する小型量子回路を提案する。
我々の知る限り、古典的にハードなファクタリング問題に対して、サブ線形量子ビットカウントを達成した初めてのMod-time回路である。
We build on the quantum algorithm found by Li, Peng, Du and Suter (Nature Scientific Reports 2012) which instead on computing the Jacobi symbol in quantum superposition。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:34:54 GMT)
Track the Answer: Extending TextVQA from Image to Video with Spatio-Temporal Clues [8.8] ビデオテキストベースの視覚的質問応答 (Video TextVQA) は、あるビデオにおいて、共同でテキストによる推論と視覚情報によって質問に答えることを目的とした実践的なタスクである。
画像からビデオへ生成するTextVQAフレームワークをより良く拡張するTEA(stands for textbfTrack thbfE bftextA languageser'')手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:06:12 GMT)
EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation [8.8] 現在のRAGシステムは、検索モデルが最も関連性の高い文書のランク付けに失敗したときにしばしば苦労する。
抽出文脈圧縮フレームワークEXITを紹介する。
評価の結果,EXITは既存の圧縮手法を一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:38:27 GMT)
Gaussian Billboards: Expressive 2D Gaussian Splatting with Textures [8.7] 2DGS(2DGS)と従来のコンピュータグラフィックスの看板との類似点を強調した。
本研究では,2DGSのテクスチャを用いて空間的に異なる色を付加するために,2DGSの修正を提案する。
本研究では,シーン表現のシャープさと質を,質的,定量的な評価で改善できることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:57:04 GMT)
Multi-Domain Features Guided Supervised Contrastive Learning for Radar Target Detection [8.7] 既存のソリューションは、統計的および深い特徴を含む、クラッタとターゲットのエコー差に基づいて、検出またはターゲットの特徴を抽出するための海溝モデルである。
本稿では,教師付きコントラスト学習(MDFG_SCL)手法を提案する。
実世界のデータセットで行った実験では、提案された浅海深度検出器は、小さな海洋目標を効果的に識別するだけでなく、様々な海洋環境において優れた検出性能を維持することが示されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:33:07 GMT)
Unlocking LLMs: Addressing Scarce Data and Bias Challenges in Mental Health [8.7] 大規模言語モデル(LLM)は、医療分析において有望な能力を示しているが、幻覚、オウム、偏見の顕在化といったいくつかの課題に直面している。
IC-AnnoMI(IC-AnnoMI)は、AnnoMI上に構築された、専門家によるモチベーションインタビュー(MI)データセットである。
IC-AnnoMIは、治療スタイル(共感、反射)、文脈的関連性、偽の意味変化を考慮に入れ、キューや調整された情報を通じて正確に設計されたターゲットプロンプトを使用する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:01:07 GMT)
FocusChat: Text-guided Long Video Understanding via Spatiotemporal Information Filtering [8.7] FocusChatはテキスト誘導型大規模言語モデルであり、ユーザのプロンプトと相関した視覚情報を強調する。
数発の実験では最先端の成果に匹敵する結果が得られ、事前学習のデータはわずか0.72万である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:54:47 GMT)
SAUGE: Taming SAM for Uncertainty-Aligned Multi-Granularity Edge Detection [8.7] 我々は,セグメンテーションモデル(SAM)が,エッジラベルの不確実性をモデル化するための事前知識を提供することを明らかにした。
本モデルは,クロスデータセットエッジ検出のための強力な一般化性を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:18:41 GMT)
Incremental Online Learning of Randomized Neural Network with Forward Regularization [8.6] ランダム化ニューラルネットワーク(ランダム化NN)の新たなオンライン学習プロセスを提案する。
フレームワーク内では、リッジ正規化(-R)によるIOLとフォワード正規化(-F)によるIOLをさらに導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:06:33 GMT)
Previous Knowledge Utilization In Online Anytime Belief Space Planning [8.4] 本研究では,現在の意思決定プロセスにおける過去の計画データを活用する,計算効率のよい新しい手法を提案する。
実験結果から,本手法は高い性能を維持しながら時間を大幅に短縮することが示された。
歴史的計画情報の統合は,不確実な環境下でのオンライン意思決定の効率を大幅に向上させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:45:58 GMT)
Learning Set Functions with Implicit Differentiation [8.3] Ou et al. (2022) は、いわゆる最適部分集合オラクルによって生成されたデータから集合関数を学習する問題を提起した。
これは固定点反復に還元されるが、繰り返しの数が増加するにつれて、自動微分はすぐに計算的に禁止される。
この課題を暗黙の微分で解決し、固定点反復に対する収束条件を検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:14:52 GMT)
Active Reinforcement Learning Strategies for Offline Policy Improvement [8.3] シーケンシャルな意思決定タスクに優れる学習エージェントは、最適な学習のための探索と搾取の問題を継続的に解決しなければならない。
本稿では,対話戦略をインテリジェントに決定する表現認識不確実性に基づくアクティブトラジェクトリ収集手法を提案する。
大規模な実験により,提案手法は,競争基準よりも環境とのオンラインインタラクションを最大75%削減することを示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:22:52 GMT)
QEDCartographer: Automating Formal Verification Using Reward-Free Reinforcement Learning [8.1] QEDCartographerは、教師付きと強化学習を組み合わせた自動証明合成ツールである。
オープンソースCoqプロジェクトの68.5K定理のCoqGymベンチマークを用いて,QEDCartographerを評価した。
本研究は,強化学習が証明合成ツールの探索機構を改善するための実りある研究方向であることを実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:37:07 GMT)
Fine-tuning Large Language Models for Domain-specific Machine Translation [8.0] 大規模言語モデル(LLM)は、ドメイン固有機械翻訳(MT)において大きな可能性を示している。
本稿では、高品質なトレーニングデータセットを提供し、DragFTで表される新しい微調整フレームワークを提案することにより、LLMのドメイン固有MT能力の向上に焦点を当てる。
3つのドメイン固有データセットの結果から,DragFT は GPT-3.5 や GPT-4o といった先進モデルに比べて性能が向上し,優れた性能を示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:45:20 GMT)
Quantifying Lexical Semantic Shift via Unbalanced Optimal Transport [7.9] SUS(Sense Usage Shift)は,各用例における単語感覚の使用頻度の変化を定量化する尺度である。
意味変化検出におけるいくつかの課題を統一的に解決できることを実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:00:54 GMT)
DELRec: Distilling Sequential Pattern to Enhance LLMs-based Sequential Recommendation [7.9] 逐次リコメンデーション(SR)タスクは,ユーザの行動シーケンスを学習し,過去のインタラクションと好みの変化を関連付けることによって,ユーザの次のインタラクションを予測することを目的としている。
従来のSRモデルは、外部ソースからアイテムタイトルに埋め込まれたより広いコンテキストや意味情報を無視して、トレーニングデータ内のシーケンシャルなパターンをキャプチャすることだけに重点を置いていることが多い。
大規模言語モデル(LLM)は、その高度な理解能力と強力な一般化能力により、最近SRタスクにおいて有望であることが示されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:34:37 GMT)
CREST: An Efficient Conjointly-trained Spike-driven Framework for Event-based Object Detection Exploiting Spatiotemporal Dynamics [7.7] スパイキングニューラルネットワーク(SNN)は、イベントベースのオブジェクト認識と検出を約束する。
既存のSNNフレームワークは、多くの場合、マルチスケールの時間的特徴を扱うことができず、データの冗長性が向上し、精度が低下する。
我々は、イベントベースのオブジェクト検出を利用するために、結合的にトレーニングされた新しいスパイク駆動フレームワークであるCRESTを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:33:31 GMT)
Stable Diffusion is a Natural Cross-Modal Decoder for Layered AI-generated Image Compression [7.6] 我々は、複数の人間-理解可能なモダリティを組み込んだスケーラブルなクロスモーダル圧縮フレームワークを導入する。
我々のフレームワークは,高レベルなセマンティック情報を提供するセマンティック層からなる層状ビットストリームに画像をエンコードする。
提案手法は意味的および視覚的詳細の両方を巧みに復元し,極端に低速度でベースラインアプローチと競合する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:01:35 GMT)
Towards a Training Free Approach for 3D Scene Editing [7.6] 近年のNeRF編集手法は,2次元拡散モデルの展開と3次元空間への投影による編集操作を利用する。
編集位置を特定するには、テキストのプロンプトとともに、強力な位置先を必要とする。
メッシュ表現をNeRFの代用として,学習自由な編集方法であるFreeEditを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:31:03 GMT)
Human-in-the-Loop Generation of Adversarial Texts: A Case Study on Tibetan Script [7.6] 対立するテキストは、NLPの複数のサブフィールドにおいて重要な役割を果たす。
本稿では,HTL-GATについて紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:29:54 GMT)
RetClean: Retrieval-Based Data Cleaning Using Foundation Models and Data Lakes [7.5] ChatGPTは、データテーブル内の特定のセルの修正を提案することで、データのクリーニングを支援することができる。
ユーザが提供するデータレイクを用いてChatGPTのパワーを補完する検索手法を開発した。
提案システムであるRetCleanは,3つのシナリオをシームレスにサポートし,ユーザフレンドリなGUIを提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:54:15 GMT)
C-FedRAG: A Confidential Federated Retrieval-Augmented Generation System [7.5] 我々は、FedRAG(Federated Retrieval Augmented Generation)をセキュアにするためのソリューションとして、CC(Confidential Computing)技術を紹介する。
提案するConfidential FedRAGシステム(C-FedRAG)は、コンテキスト機密性を確保することにより、分散化されたデータプロバイダのネットワークをまたいだRAGのセキュアな接続とスケーリングを可能にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:42:21 GMT)
SPHERE: A Hierarchical Evaluation on Spatial Perception and Reasoning for Vision-Language Models [7.5] モデル強度と弱点をピンポイントする新しい人間アノテーション付きデータセットを備えた階層的評価フレームワークであるSPHEREを開発した。
最先端のオープンソースモデルのベンチマーク評価では、重大な欠点が示されている。
この研究は、空間的理解と推論に対するより高度なアプローチの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:10:55 GMT)
Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree [7.4] Falconは、ドラフト作成者の並列性と出力品質の両方を増強するために設計された革新的な投機的復号化フレームワークである。
FalconにはCoupled Sequential Glancing Distillation(英語版)技術が組み込まれている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:02:08 GMT)
Efficient Event-based Semantic Segmentation with Spike-driven Lightweight Transformer-based Networks [7.2] イベントベースのセマンティックセグメンテーションは、自動運転とロボット工学において大きな可能性を秘めている。
現在の人工知能ニューラルネットワーク(ANN)ベースのセグメンテーション手法は、高い計算要求、画像フレームの要求、膨大なエネルギー消費に悩まされている。
イベントベースセマンティックセグメンテーション用に設計されたスパイク駆動型軽量トランスフォーマーベースネットワークであるSLTNetを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:11:04 GMT)
Neural Control and Certificate Repair via Runtime Monitoring [7.1] 本稿では,実行時モニタリングを利用して,関心事の性質に反するシステム動作を検出する新しいフレームワークを提案する。
本手法は,ニューラルネットワークの安全性向上に有効であることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:15:30 GMT)
Predicting Change, Not States: An Alternate Framework for Neural PDE Surrogates [7.1] 本稿では,ニューラルソルバが時間微分を予測し,ODE積分器が時間内に解を前進させる枠組みを提案する。
トレーニング対象を変更するだけで、推論中に数値積分を導入することで、ニューラルネットワークのサロゲートは精度と安定性を得ることができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:41:53 GMT)
FineGates: LLMs Finetuning with Compression using Stochastic Gates [7.1] 大規模言語モデル(LLM)は、高い計算要求のため、完全な微調整に重大な課題をもたらす。
低ランクのアダプタ層を学習するなど、軽量なファインタニング技術が提案されている。
本稿では,フリーズベースモデルとタスク固有適応を同時に分散するゲートに基づくアダプタモデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:33:05 GMT)
MapExpert: Online HD Map Construction with Simple and Efficient Sparse Map Element Expert [7.1] 専門家によるオンラインHDマップ手法であるMapExpertを紹介した。
MapExpertは、ルータが配布するスパースの専門家を利用して、様々な非キュビックマップ要素を正確に記述します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:19:44 GMT)
Microwave-optics entanglement via coupled opto- and magnomechanical microspheres [7.0] マイクロ波光の絡み合いは、ハイブリッド量子ネットワークの構築において重要な役割を果たす。
本稿では,2つのオプトメカニカル・マイクロスフィアとマグノメカニカル・マイクロスフィアのハイブリッドシステムに基づいて,マイクロ波・光の絡み合いを新たに生成する機構を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:33:30 GMT)
Deviation from maximal entanglement for mid-spectrum eigenstates of local Hamiltonians [6.9] 局所ハミルトニアンが支配するスピン鎖において、エネルギースペクトルの中央にあるマイクロカノニカルアンサンブルと、系の大きさの一定割合の連続部分系を考える。
アンサンブルの帯域幅が一定の定数より大きい場合、アンサンブルにおける固有状態の平均エンタングルメントエントロピーは、少なくとも正の定数で最大エントロピーから逸脱する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:50:34 GMT)
Learning from Noisy Labels via Self-Taught On-the-Fly Meta Loss Rescaling [6.9] そこで本研究では,リウェイトトレーニングサンプルに対する非教師なしメタロス再スケーリングを提案する。
我々は,対話モデリングの課題を生かした,初級訓練データの再重み付けを試みている。
我々の戦略は、ノイズの多いクリーンなデータに直面し、クラス不均衡を処理し、ノイズの多いラベルへの過度な適合を防ぐ。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:37:50 GMT)
On Local Overfitting and Forgetting in Deep Neural Networks [6.8] 本稿では,検証データ上での深部モデルの忘れ率を推定する新しいスコアを提案する。
従来のオーバーフィッティングの有無にかかわらず,局所的なオーバーフィッティングが発生することを示す。
我々は,1つのネットワークのトレーニング履歴にのみ依存して,忘れられた知識を回復することを目的とした,新たなアンサンブル手法を考案した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:53:38 GMT)
AutoSGNN: Automatic Propagation Mechanism Discovery for Spectral Graph Neural Networks [6.8] 本稿では,スペクトルGNNにおける伝搬機構の自動検出フレームワークであるAutoSGNNを提案する。
本稿では,AutoSGNNの性能と効率の両面において,最先端のスペクトルGNNとグラフニューラルアーキテクチャ探索法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:37:48 GMT)
MCQG-SRefine: Multiple Choice Question Generation and Evaluation with Iterative Self-Critique, Correction, and Comparison Feedback [6.7] 医療事例を高品質なUSMLEスタイルの質問に変換する枠組みを提案する。
MCQG-SRefineは、専門家主導のプロンプトエンジニアリングと反復的な自己批判と自己補正フィードバックを統合している。
複雑でコストのかかる専門家評価プロセスを置き換えるため, LLM-as-Judge を用いた自動計測手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:36:53 GMT)
What Makes Programmers Laugh? Exploring the Submissions of the Subreddit r/ProgrammerHumor [6.6] 本研究では,大規模ソーシャルメディアコミュニティにおけるプログラミング関連ユーモアの解明を目的とする。
私たちはRedditのサブレディットr/ProgrammerHumorから139,718件の応募を集めました。
その結果,ソフトウェア開発者のユーモアの予測は困難であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:08:53 GMT)
SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented Generation [6.6] そこで我々はSimGRAG(Simisal Graph Enhanced Retrieval-Augmented Generation)法を提案する。
クエリテキストとナレッジグラフの整合性という課題に効果的に対処する。
SimGRAGは、質問応答と事実検証において最先端のKG駆動RAG法より優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:40:08 GMT)
Approximating Korobov Functions via Quantum Circuits [6.5] 我々は、コロボフ関数空間における$d$次元関数を近似できる量子回路を構築する。
コロボフ空間はソボレフ空間の部分空間であるため、我々の研究は量子コンピュータ上で幅広い関数のクラスを実装するための理論的基盤を確立する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:08:36 GMT)
SMOSE: Sparse Mixture of Shallow Experts for Interpretable Reinforcement Learning in Continuous Control Tasks [6.4] SMOSEは、疎活性化された解釈可能なコントローラを訓練する新しい方法である。
さまざまな基本的なスキルのエキスパートになるように訓練された解釈可能な意思決定者と、専門家にタスクを割り当てる解釈可能なルータを組み合わせたものだ。
次に、ルータの重みから決定木を蒸留し、解釈の容易さを大幅に改善する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:15:04 GMT)
Can Large Language Models Act as Ensembler for Multi-GNNs? [6.4] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するための強力なモデルとして登場した。
GNNは、リッチテキストノード属性の固有の意味理解能力に欠けており、アプリケーションでの有効性を制限している。
本研究は、意味情報と構造情報を統合するための堅牢で優れたソリューションを提供することにより、テキストによるグラフアンサンブル学習を推進している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:20:33 GMT)
Jailbreaking? One Step Is Enough! [6.1] 大規模言語モデル(LLM)は様々なタスクで優れるが、敵が有害な出力を生成するプロンプトを操作するジェイルブレイク攻撃に弱いままである。
本稿では,攻撃意図を「防御」意図と偽装するリバース・エンベッドド・ディフェンス・アタック(REDA)機構を提案する。
モデルの「防御的」意図における信頼性とガイダンスを高めるため、少数の攻撃例を含む文脈内学習(ICL)を採用する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:33:41 GMT)
Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration [6.1] 階層的強化学習(HRL)に基づく二重エージェントを用いたマルチホップ推論モデルを提案する。
FULORAは、二重エージェント間のeFficient GUidance-ExpLORAtionによる上記の推論課題に取り組む。
3つの実単語知識グラフデータセットで実施された実験では、FULORAがRLベースのベースラインより優れていることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:47:41 GMT)
Stiefel Flow Matching for Moment-Constrained Structure Elucidation [6.1] 我々は、分子の分子式と慣性モーメントのみを考慮し、分子の全原子3次元構造を予測することを考える。
既存の生成モデルは、ほぼ正確なモーメントで条件付きで3D構造をサンプリングすることができる。
モーメント制約下での3次元構造解析のための生成モデルとして,Stiefel Flow Matchingを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:07:10 GMT)
Label Errors in the Tobacco3482 Dataset [6.0] Tobacco2は広く使われている文書分類ベンチマークデータセットである。
データセットの11.7%が不適切な注釈付きであり、未知のラベルまたは修正されたラベルを持つべきである。
次に、トップパフォーマンスモデルのミスを分析し、モデルのミスの35%は、これらのラベルの問題に直接起因することができることに気付きます。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:06:28 GMT)
PBVS 2024 Solution: Self-Supervised Learning and Sampling Strategies for SAR Classification in Extreme Long-Tail Distribution [6.0] 本稿では,マルチモーダル学習と推論を組み合わせた2段階学習手法を提案する。
我々のモデルは精度21.45%、AUC0.56、総合スコア0.30を達成し、競争では9位となった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:49:16 GMT)
SVGBuilder: Component-Based Colored SVG Generation with Text-Guided Autoregressive Transformers [5.9] 本稿では,テキスト入力から高品質な色付きSVGを生成するためのコンポーネントベース自動回帰モデルを提案する。
計算オーバーヘッドを大幅に削減し、従来の方法に比べて効率を向上する。
既存のSVGデータセットの限界に対処し、我々の研究を支援するために、カラーSVGの最初の大規模データセットであるColorSVG-100Kを紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:13:15 GMT)
Quantum Coherent State Transform on Continuous-Variable Systems [5.9] 本稿では,量子コヒーレント状態変換(QCST)と連続変数量子システムに実装するためのフレームワークを紹介する。
結果の量子状態の測定は、$leftfrac1pi left|alpharightrangle leftlanglealpharight| right_alpha 要素を持つ正の作用素値測度(POVM)と等価である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:51:35 GMT)
Multi-Agent Motion Planning For Differential Drive Robots Through Stationary State Search [5.9] MAMP(Multi-Agent Motion Planning)は、交通管理、空港の運営、倉庫の自動化など、様々な分野で応用されている。
本稿では,これらの課題に対処するため,MASSと呼ばれる3段階のフレームワークを提案する。
MASSはMAPFベースの手法と定常状態探索プランナを組み合わせることで,高品質なキノダイナミックな計画を生成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:17:42 GMT)
Job loss disrupts individuals' mobility and their exploratory patterns [5.9] 失業などのライフコースイベントが個人の移動パターンを乱す可能性があることを示す。
失業は個人の探索行動に大きな変化をもたらす。
大規模雇用関連行動のダイナミクスに光を当てる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:59:59 GMT)
ReXplain: Translating Radiology into Patient-Friendly Video Reports [5.8] ReXplainは、放射線医学の知見を患者フレンドリーなビデオレポートに変換する革新的なAI駆動システムである。
ReXplainは、平易な言語、強調画像、および3D臓器レンダリングで包括的な説明を生成することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:28:04 GMT)
Topological Quantum Spin Glass Order and its realization in qLDPC codes [5.8] トポロジカル量子スピンガラス(トポロジカル量子スピンガラス、TQSG)は、膨張グラフ上の様々な量子LDPC符号の低温相である。
我々の研究は、量子情報を保存するスピングラスのトポロジカルアナログを導入し、統計力学と量子コンピュータ科学の両方の新しい道を開いた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:00:00 GMT)
Clusterability test for categorical data [5.8] TestCatは、分析的な$p$-valueで分類データのクラスタ性を評価するためのテストベースのアプローチである。
提案手法をベンチマーク分類データセットに適用することにより,TestCatが数値データに対してそれらの解より優れていることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:57:19 GMT)
Empathy Detection from Text, Audiovisual, Audio or Physiological Signals: A Systematic Review of Task Formulations and Machine Learning Methods [5.7] 共感は、個人が他人を理解する能力を示す。
共感は、社会、医療、教育に潜在的な応用がある。
我々は、Affective Computingベースの共感領域における課題、研究ギャップ、潜在的な応用について論じる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:12:54 GMT)
Learning Coarse-to-Fine Pruning of Graph Convolutional Networks for Skeleton-based Recognition [5.7] マグニチュード・プルーニング(Magnitude Pruning)は、最小の接続を除去する軽量なネットワーク設計手法である。
構造化および非構造化プルーニングの利点を収集する新しい粗粒化法(CTF)を考案する。
我々の手法は、各接続のマスクをアダマール積としてモデル化する新しいCTFパラメトリゼーションに依存している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:11:48 GMT)
The Reliability Paradox: Exploring How Shortcut Learning Undermines Language Model Calibration [5.6] プレトレーニング言語モデル(PLM)は、自然言語処理の分野で大きなパフォーマンス向上を実現している。
近年の研究では、PLMは誤校正に悩まされており、これらのモデルによる信頼度推定の精度の欠如が示唆されている。
本稿では,低校正誤差が言語モデルの信頼性決定ルールを意味するか否かを考察する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:04:28 GMT)
Security of AI Agents [5.5] システムセキュリティの観点から、AIエージェントの潜在的な脆弱性を特定し、記述する。
本研究では,各脆弱性に対応する防御機構を設計と実験で導入し,その生存性を評価する。
本稿では、現在のAIエージェント開発におけるセキュリティ問題を文脈的に分析し、AIエージェントをより安全で信頼性の高いものにするための方法を解説する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:58:19 GMT)
An Adaptive Balance Search Based Complementary Heterogeneous Particle Swarm Optimization Architecture [5.5] 適応バランス探索に基づく相補的相補的PSOアーキテクチャを提案する。
我々のアーキテクチャは、初期の進化過程における探索を強調することにより、構築されたベクトルを効果的に活用することを保証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:11:37 GMT)
Asymmetric protocols for mode pairing quantum key distribution with finite-key analysis [5.3] 有限鍵解析を用いて非対称MP-QKDプロトコルのセキュリティ解析を行う。
我々の研究は、元の戦略と比較して、安全な鍵レートと送信距離を著しく向上させることができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:50:15 GMT)
Design of Restricted Normalizing Flow towards Arbitrary Stochastic Policy with Computational Efficiency [5.2] 正規化フロー(NF)を用いた制御ポリシーの新しい設計法を提案する。
強化学習(RL)では、通常は訓練可能なパラメータを持つ分布モデルとしてモデル化される。
RLベンチマークでは、Bit-RNFポリシーは以前のモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:19:55 GMT)
Coordinating Planning and Tracking in Layered Control Policies via Actor-Critic Learning [5.2] 本稿では,(1)軌道プランナと(2)階層型制御アーキテクチャにおけるトラッキングコントローラを協調訓練するための強化学習(RL)に基づくアルゴリズムを提案する。
本アルゴリズムは,アクター・クリティカルな学習手法を取り入れた最適制御問題の書き直しから自然に生じる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:41:50 GMT)
RAD: Region-Aware Diffusion Models for Image Inpainting [5.2] 本研究では,バニラ拡散モデルの簡易かつ効果的な再構成による塗装用領域認識拡散モデル(RAD)を提案する。
RADは、最先端のアプローチよりも100倍高速な推論時間を実現する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:21:52 GMT)
ShiftedBronzes: Benchmarking and Analysis of Domain Fine-Grained Classification in Open-World Settings [5.1] ShiftedBronzesは、きめ細かい青銅器年代測定のためのベンチマークデータセットである。
ShiftedBronzesには2種類の青銅器データと7種類のOODデータが含まれている。
ShiftedBronzesと5つの一般的なOODデータセットについて実験を行った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:56:59 GMT)
Syntactic Transfer to Kyrgyz Using the Treebank Translation Method [5.0] 本研究では,キルギスにおける統語コーパスの開発過程を簡略化する手法を提案する。
本稿では,木バンクの翻訳手法に基づく構文アノテーションをトルコ語からキルギス語に翻訳するツールを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:12:33 GMT)
On Foundation Models for Dynamical Systems from Purely Synthetic Data [5.0] 基礎モデルは、様々な領域にわたる顕著な一般化、データ効率、ロバスト性を示してきた。
これらのモデルは自然言語処理やコンピュータビジョンなどの分野で利用できるが、力学系には存在しない。
合成データのみに基づくトランスフォーマーベース基礎モデルを事前学習することで,この問題に対処する。
本研究は, 一般化, データ効率, 堅牢性の観点から, スペシャリストモデルを上回った力学系の基礎モデルの実現可能性を示すものである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:04:32 GMT)
Queries, Representation & Detection: The Next 100 Model Fingerprinting Schemes [5.0] 本稿では,モデルフィンガープリント方式とその評価ベンチマークを作成するための体系的なアプローチを提案する。
以前に探索されていないQuRDの組み合わせを$sim100$で識別し、パフォーマンスに関する洞察を得る。
我々のアプローチは、より挑戦的なベンチマークとベースラインとの健全な比較の必要性を明らかにします。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:41:36 GMT)
Synthetic Lyrics Detection Across Languages and Genres [5.0] 音楽コンテンツ、特に歌詞を生成する大きな言語モデル(LLM)が人気を集めている。
これまで様々な領域におけるコンテンツ検出について研究されてきたが、音楽における歌詞のモダリティに焦点を当てた研究は行われていない。
我々は、複数の言語、音楽ジャンル、アーティストのリアルとシンセサイザーの多様なデータセットをキュレートした。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:50:40 GMT)
Adversarially robust generalization theory via Jacobian regularization for deep neural networks [5.0] ヤコビアン正則化は, $ell_2$ あるいは $ell_1$ の逆トレーニングと密接に関連していることを示す。
我々の理論的結果は、ヤコビアンのノルムが標準とロバストな一般化の両方に関係していることを示している。
この研究は、ジャコビアン正則化を通じて、理論的および経験的な理解を逆向きに堅牢な一般化に促進する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:26:42 GMT)
Do Voters Get the Information They Want? Understanding Authentic Voter FAQs in the US and How to Improve for Informed Electoral Participation [5.0] アメリカ合衆国では、州選挙委員会 (SECs) が有権者に対するFAQ (Frequently Asked Questions) の主要なプロバイダーである。
我々の知る限りでは、包括的なFAQを持つ単一の情報源も、国家レベルでデータを分析して、現状を改善するための実践や方法を特定する研究もない。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:29:53 GMT)
A Guide to Stochastic Optimisation for Large-Scale Inverse Problems [4.9] 最適化アルゴリズムは、大量のデータを持つ機械学習のデファクトスタンダードです。
各最適化ステップで利用可能なデータのサブセットのみを処理すると、イテレーション毎の計算コストが劇的に削減される。
逆画像問題に対する変分正規化に特有の最適化の可能性と課題に焦点をあてる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:21:39 GMT)
2by2: Weakly-Supervised Learning for Global Action Segmentation [4.9] 本稿では,グローバルアクションセグメンテーションの課題に対して,シンプルかつ効果的なアプローチを提案する。
我々は,グローバルな行動セグメンテーションに適した行動表現を弱教師付きで学習するために,活動ラベルを利用することを提案する。
バックボーンアーキテクチャでは、スパーストランスフォーマーをベースとしたSiameseネットワークを使用して、入力ビデオペアとして使用し、それらが同一のアクティビティに属しているかどうかを判断する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:49:36 GMT)
iRBSM: A Deep Implicit 3D Breast Shape Model [4.9] 女性乳房の3次元形状モデルについて検討した。
従来のPCAモデルと比較して、我々のモデルは暗黙のニューラル表現を採用している。
1枚の画像から3次元乳房形状を再構成するプロトタイプアプリケーションを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:51:27 GMT)
Selective Shot Learning for Code Explanation [4.8] Selective Shot Learning(SSL)の最先端のアプローチには、トークンベースのメソッドと埋め込みベースのメソッドが含まれる。
本稿では,実例選択にエンティティ情報を利用するSSL_nerを提案する。
2つのデータセットにわたる最先端メソッドに対するSSL_nerの有効性を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:26:14 GMT)
A note on quantum lower bounds for local search via congestion and expansion [4.7] G$上の局所探索の量子クエリの複雑さは$Omegabigl( fracnfrac34sqrtg bigr)$であることを示す。
古典的な設定とは対照的に、そのようなグラフに対して、下界と最もよく知られた上界の$Obigl(nfrac13 bigr)$の間の量子ケースにギャップが残っている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:42:42 GMT)
A Two-Fold Patch Selection Approach for Improved 360-Degree Image Quality Assessment [4.6] 本稿では,2倍のパッチ選択プロセスにより,360度知覚画像品質評価(IQA)の精度を向上させるための新しいアプローチを提案する。
我々の手法は、視覚的パッチ選択と埋め込み類似性に基づく洗練を組み合わせる。
結果は、ロバストで正確な360度IQAを提供する可能性を強調し、パフォーマンスは最大4.5%向上し、品質スコア予測の単調性も向上した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:36:47 GMT)
DuSSS: Dual Semantic Similarity-Supervised Vision-Language Model for Semi-Supervised Medical Image Segmentation [4.5] 半教師付き医療画像セグメンテーション(SSMIS)は、整合性学習を用いてモデルのトレーニングを規則化する。
SSMISは、しばしば低品質の擬似ラベルのエラー管理に悩まされる。
SSMISのためのDuSSS(Dual Semantic similarity-Supervised VLM)を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:47:00 GMT)
Non-Hermitian delocalization in 1D via emergent compactness [4.4] 我々は、虚偽の潜在的な障害を含む、別の非局在化経路を見つける。
完全にランダムな電位は一般に局所化につながるが、障害に最小限の空間構造を与えると非局在化を防げる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:45:21 GMT)
Generating Move Smart Contracts based on Concepts [4.4] ConMoverは、Move用の大規模言語モデル(LLM)ベースのコード生成を強化する新しいフレームワークである。
概念検索、計画、コーディング、デバッグエージェントを反復的なプロセスに統合し、生成されたコードを洗練する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:07:45 GMT)
Attentive Eraser: Unleashing Diffusion Model's Object Removal Potential via Self-Attention Redirection Guidance [4.3] Attentive Eraser は、安定かつ効果的な物体除去のために、事前訓練された拡散モデルを強化するチューニング不要な手法である。
本稿では、自己注意機構を再設計するASS(Attention Activation and Suppression)を紹介する。
また、ASSによる自己注意リダイレクトを利用して生成プロセスのガイドを行う自己注意リダイレクトガイダンス(SARG)についても紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:56:59 GMT)
Concept-ROT: Poisoning Concepts in Large Language Models with Model Editing [4.3] 編集技術は、より複雑な振る舞いを、同様の効果で統合できることを示す。
本研究では,複雑な出力動作を示すトロヤ群を効率的に挿入するモデル編集法であるConcept-ROTを開発した。
我々の結果は、機械学習モデルに対するトロイの木馬攻撃の実用性と潜在的な影響に関する懸念をさらに動機付けている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:29:30 GMT)
Sparse Signature Coefficient Recovery via Kernels [4.3] PDEに基づく手法は,高レベルなシグネチャに含まれる反復積分のスパースコレクションを効率的に計算できることを示す。
カーネルを取るシグネチャ空間にフィルタを形成することにより、シグネチャ係数の特定の群、特に変換の任意の深さにおける特異係数を効果的に分離することができる。
このようなフィルタは, 適切なシグネチャ変換の線形結合として表現できることを示し, 提案手法の有効性を実証的に示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:27:36 GMT)
RDPI: A Refine Diffusion Probability Generation Method for Spatiotemporal Data Imputation [4.3] インキュベーションは交通流のモニタリング、大気質の評価、気候予報など様々な分野で重要な役割を担っている。
センサによって収集されたデータは、しばしば時間的不完全性に悩まされ、蓄積と不均一な分布は、データ不足につながる。
本稿では,初期ネットワークと条件拡散モデルに基づく2段階改良型確率計算フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:06:00 GMT)
Combating Semantic Contamination in Learning with Label Noise [4.2] ノイズラベルはディープニューラルネットワークの性能に悪影響を及ぼす可能性がある。
1つの一般的な解決策はラベル修復であり、予測と分布を通してノイズラベルを再構成する。
これらの手法は、セマンティック汚染(Semantic Contamination)と同一視される現象である問題的セマンティックアソシエーションを導入する可能性がある。
本研究では,再生ラベルに対する半教師付き学習を利用して,ビューやモデルにまたがる埋め込みから適切な意味的関連を抽出する,協調的クロスラーニング(Collaborative Cross Learning)という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:26:08 GMT)
Populating cellular metamaterials on the extrema of attainable elasticity through neuroevolution [4.2] 材料の異なる機械的特性間のトレードオフは、工学的材料設計における課題を提起する。
我々は、多目的最適化(MOO)問題を効率的に解くために、神経進化アルゴリズムを用いる。
本手法は多分野にわたる多種多様なメタマテリアルの計算的発見のための普遍的な枠組みとして機能する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:37:08 GMT)
Replications, Revisions, and Reanalyses: Managing Variance Theories in Software Engineering [4.1] 変数理論は、1つ以上の独立変数が依存変数で生じる分散を定量化する。
ソフトウェアエンジニアリング(SE)では、分散理論は、ツールやテクニック、その他の治療がソフトウェア開発の結果に与える影響を定量化するために使われます。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:56:18 GMT)
MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments [4.1] 海洋環境における自律的な航行は、アメリカ合衆国にとって大きな課題となっている。
本研究では,空間的注意と時間的注意という2つのタイプの注意を利用する新しい手法を提案する。
我々のアプローチは、エピソード完了の成功率で最先端の状態を20%近く上回ります。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:20:22 GMT)
SynthCypher: A Fully Synthetic Data Generation Framework for Text-to-Cypher Querying in Knowledge Graphs [4.1] CypherはNeo4jグラフデータベースのクエリ言語である。
完全合成および自動化されたデータ生成パイプラインであるSynthCypherを紹介する。
SynthCypherは、新しいLLMSupervised Generation-Verificationフレームワークを採用している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:21:25 GMT)
ITP: Instance-Aware Test Pruning for Out-of-Distribution Detection [4.0] Out-of-distriion (OOD) 検出は、現実世界のシナリオにおけるディープモデルの信頼性を保証するために不可欠である。
インスタンス認識テスト・プルーニング(ITP)と呼ばれるシンプルで効果的なポストホック法を提案する。
ITPは、粗粒度と粗粒度の両方を考慮し、OOD検出を行う。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:49:26 GMT)
Controlling Equational Reasoning in Large Language Models with Prompt Interventions [4.0] 本稿では,Large Language Models (LLMs) における幻覚率を,シンボルデータ生成フレームワークを用いて制御・緩和する方法について検討する。
シンボルの表面形状, 方程式木構造, 数学的文脈などの摂動的側面に対して, 対象的介入を適用する。
我々は,細調整されたT5モデル,GPTなどを含む多種多様なLSMに対する迅速な介入の効果を評価する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:01:52 GMT)
Assessing the Limitations of Large Language Models in Clinical Fact Decomposition [3.9] FactEHRは,3つの病院システムから4つの病院システムにまたがる2,168件の臨床記録について,フルドキュメントの事実分解からなるデータセットである。
臨床医によるレビューを含め,本評価では,4種類のLCMにおいて,事実分解の質に有意な変動がみられた。
その結果、臨床テキストの事実検証を支援するためのLCM機能の改善の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:07:05 GMT)
Two Layer Walk: A Community-Aware Graph Embedding [3.8] Two Layer Walk (TLWalk) は階層的なコミュニティ構造を組み込んだグラフ埋め込みアルゴリズムである。
TLWalkはコミュニティ対応のランダムウォーク機構を通じて、コミュニティ内およびコミュニティ間関係のバランスをとる。
ベンチマークデータセットの実験では、TLWalkは最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:11:59 GMT)
Towards Kriging-informed Conditional Diffusion for Regional Sea-Level Data Downscaling [3.8] 地球規模の気候モデルや衛星データから粗解射影を推定すると、下降問題は、より詳細な地域気候データを推定することを目的としている。
この問題は、気候変動による重大なリスクに対する効果的な適応、緩和、レジリエンスに社会的に不可欠である。
そこで本稿では, 空間的変動を抑えつつ, 微細な特徴を保ちながら, 空間的変動を捉えるためのKriging-informed Conditional Diffusion Probabilistic Model (Ki-CDPM)を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:01:59 GMT)
Ultrafast high-fidelity state readout of single neutral atom [3.8] 単一中性原子は、低い達成可能な光子散乱率と浅いトラップ電位に悩まされる。
我々は、原子の明暗超微細状態の超高速かつ高忠実な識別を可能にする原子光放出率の強い向上を実現した。
この研究は、高い通信率と高い忠実度を持つ量子ネットワークプロトコルの実装への道を開くものである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:37:09 GMT)
Smartphone-based Iris Recognition through High-Quality Visible Spectrum Iris Capture [3.8] 本研究では、自動焦点調整とズーム調整により高品質なVISアイリス画像を連続的にキャプチャする新しいAndroidアプリケーションを提案する。
この手法は,47名を対象に,スマートフォンで撮影したVIS画像とNIRアイリス画像を用いて検証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:28:08 GMT)
Evolutionary Optimization for Designing Variational Quantum Circuits with High Model Capacity [3.7] 高性能量子機械学習(QML)モデルの設計には、専門家レベルの知識が必要である。
主な課題は、データ符号化機構とパラメータ化量子回路の設計である。
本稿では,量子回路設計の進化を可能にするために,量子回路アーキテクチャ情報を符号化する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:40:35 GMT)
DualDynamics: Synergizing Implicit and Explicit Methods for Robust Irregular Time Series Analysis [3.7] 我々はNDE法とニューラルフロー法を組み合わせた新しいフレームワークであるDualDynamicsを紹介する。
このアプローチは計算要求のバランスを保ちながら表現力を高める。
その結果,最先端手法よりも一貫した性能を示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:56:06 GMT)
CSformer: Combining Channel Independence and Mixing for Robust Multivariate Time Series Forecasting [3.7] 本稿では,チャネル独立戦略と時系列解析の混合手法を提案する。
CSformerは,2段階のマルチヘッド自己保持機構を備えた新しいフレームワークである。
本フレームワークは,シーケンスアダプタとチャネルアダプタを効果的に組み込んで,重要な情報を識別するモデルの能力を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:39:48 GMT)
Measurement of Medial Elbow Joint Space using Landmark Detection [3.6] 本研究では,尺骨側副靭帯損傷(UCL)を診断するための関節腔計測のための新しい超音波中肘データセットを提案する。
このデータセットは、22人の被験者から4,201個の肘超音波画像からなり、上腕骨と尺骨にランドマークの注釈が付けられている。
HRNetを用いた場合, 接合空間の平均ユークリッド距離誤差は0.116mmであった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:32:12 GMT)
Momentum Posterior Regularization for Multi-hop Dense Retrieval [3.6] 1つのホップの後の情報は、前と現在のホップの黄金の知識からクエリ焦点の要約として定義される。
本研究では,運動量移動平均法による事前検索とともに後続検索を更新する効果的なトレーニング戦略を開発する。
HotpotQAとStrategyQAの実験は、MoPoが検索と下流の両方のQAタスクで既存のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:27:08 GMT)
A study of animal action segmentation algorithms across supervised, unsupervised, and semi-supervised learning paradigms [3.6] 本稿では,教師付き深層ニューラルネットワークと教師なしグラフィカルモデルとのギャップを埋める半教師付きアクションセグメンテーションモデルを提案する。
時間的情報を加えることで、完全に管理された時間的畳み込みネットワークが、すべてのデータセットで監視されたメトリクスで最高のパフォーマンスを発揮することが分かりました。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:37:34 GMT)
Scaling up the Banded Matrix Factorization Mechanism for Differentially Private ML [3.6] 近縁ノイズメカニズムは、大規模エポジロン小エピック訓練体制におけるDP-SGDの効果的な代替手段であることが証明されている。
現在の最先端のアプローチはDP-BandMFで、プライバシーの増幅とノイズ相関の利点を最適にバランスさせる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:12:40 GMT)
TSEML: A task-specific embedding-based method for few-shot classification of cancer molecular subtypes [3.5] 異種および小癌のデータセットにおける数発の分子サブタイプ予測問題に焦点をあてる。
タスク固有の埋め込み型メタラーニングフレームワーク(TSEML)を導入する。
本フレームワークは,数発の分子サブタイプ分類の問題に対処する上で,優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:30:54 GMT)
Analyzing Toxicity in Open Source Software Communications Using Psycholinguistics and Moral Foundations Theory [3.4] 本稿では,オープンソースソフトウェア(OSS)における有害通信の自動検出のための機械学習によるアプローチについて検討する。
我々は精神言語学のレキシコンとモラル・ファンデーションズ・理論を利用して、OSSコミュニケーションチャネルの2種類の毒性を分析し、コメントとコードレビューを発行する。
道徳的価値を特徴として使うことは言語的手がかりよりも効果的であり、コードレビューデータ中の有害なインスタンスを67.50%、問題コメントを64.83%特定するF1尺度となる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:52:00 GMT)
Enhancing Naturalness in LLM-Generated Utterances through Disfluency Insertion [3.4] 拡散は自然発声の自然な特徴であるが、大言語モデルの出力を欠いているのが一般的である。
障害の挿入によってこの欠点が緩和されることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:25:44 GMT)
Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild [3.4] IFDD(Implicit Facial Dynamics Disentanglement framework)を提案する。
IFDDは感情に無関係な世界的文脈から感情に関連する動的情報を暗黙的に切り離す。
In-the-wildデータセットの実験では、IFDDが以前の教師付きDFER法より優れていることが示されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:45:53 GMT)
DoPTA: Improving Document Layout Analysis using Patch-Text Alignment [3.3] 本稿では,文書画像のテキスト情報を利用した視覚的タスクの性能向上を目的とした,新しい画像テキストアライメント手法を提案する。
本手法で訓練した文書エンコーダモデルDoPTAは,OCRを必要とせず,幅広い文書イメージ理解タスクにおいて高い性能を示す。
DoPTAはまた、D4LAと2つの挑戦的なドキュメントビジュアル分析ベンチマークであるFUNSDで、新しい最先端のアート結果も設定している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:26:31 GMT)
Reranking individuals: The effect of fair classification within-groups [3.3] バイアス緩和技術は、敏感なグループ間でのインスタンスのペアのランク付けに影響を及ぼす。
これらの効果は精度・公正性評価の枠組みにおいてレーダーの下に留まっている。
いくつかの一般的なバイアス緩和手法の効果と、その出力が現実世界のシナリオを反映しない場合について説明する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:12:02 GMT)
Stochastic interior-point methods for smooth conic optimization with applications [3.3] 一般円錐最適化のためのインテリアポイント法を4つの新しいSIPM変種とともに導入する。
未開発の前提の下では,提案したSIPMのグローバル収束率を確立する。
頑健な線形回帰、マルチタスク関係学習、クラスタリングデータストリームの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:06:44 GMT)
Norm of Mean Contextualized Embeddings Determines their Variance [3.2] コンテキスト化された埋め込みは、同じトークンであってもコンテキストによって異なり、埋め込み空間内の分布を形成する。
トランスフォーマーモデルの層が深まるにつれて、埋め込みは原点から遠く離れていることが示される。
これらの結果は、層間の埋め込み空間の異方性に関する既存の研究と一致している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:07:52 GMT)
Controllable non-Hermitian qubit-qubit Coupling in Superconducting quantum Circuit [3.2] 高損失共振器を付加することにより、制御可能な非エルミート量子ビット結合を実現する理論的スキームを提案する。
EPと非相互性は、非エルミート超伝導回路における2つの量子ビットの量子状態の進化と交換効率に影響を与える可能性がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:45:04 GMT)
Breaking the Programming Language Barrier: Multilingual Prompting to Empower Non-Native English Learners [3.2] 非ネイティブ英語話者(NNES)は、プログラミングを学ぶ上で、複数の障壁に直面している。
生成AI(GenAI)の進歩は、これらの障壁を壊す可能性がある。
本稿では,NNES学生が母国語でコードを生成することを促す最初の調査を行う。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:06:02 GMT)
Visual Deformation Detection Using Soft Material Simulation for Pre-training of Condition Assessment Models [3.0] オープンソースのシミュレーションツールであるBlenderを使用して、機械学習(ML)モデルのための合成データセットを作成することを提案する。
このプロセスでは、専門家情報を形状キーパラメータに翻訳して変形をシミュレートし、変形したオブジェクトと非変形したオブジェクトの両方のイメージを生成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:12:21 GMT)
if-ZKP: Intel FPGA-Based Acceleration of Zero Knowledge Proofs [3.0] 本稿では,FPGA上でのzk-SNARK証明の高速化に適した,スケーラブルなアーキテクチャを提案する。
我々は、zk-SNARKシステムに費やされた時間の大半を占めるマルチスカラー乗算(MSM)に焦点を当てる。
我々の実装は、参照ソフトウェアライブラリに比べて110x-150倍高速に動作します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:35:32 GMT)
Full error analysis of the random deep splitting method for nonlinear parabolic PDEs and PIDEs [3.0] 我々は[Beck, Becker, Cheridito, Jentzen, Neufeld (2021)で導入されたディープスプリッティングアルゴリズムのランダム化拡張を示す。
我々は高次元非線形放物型PDEと(おそらく)無限活動を持つジャンプを持つPIDEの両方をおよそ解くのに適したランダムニューラルネットワークを使用する。
特に, ランダムな深層分割法は, 10 万次元の非線形 PDE と PIDE をほぼ1秒で解くことができることを実証的に示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:27:17 GMT)
FlightScope: An Experimental Comparative Review of Aircraft Detection Algorithms in Satellite Imagery [3.0] 本稿では,衛星画像中の航空機を識別するタスク用にカスタマイズされた,高度な物体検出アルゴリズム群を批判的に評価し,比較する。
この研究は、YOLOバージョン5と8、より高速なRCNN、CenterNet、RetinaNet、RTMDet、DETRを含む一連の方法論を含む。
YOLOv5は空中物体検出のための堅牢なソリューションとして登場し、平均的精度、リコール、ユニオンのスコアに対するインターセクションによってその重要性を裏付けている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:58:44 GMT)
SentiQNF: A Novel Approach to Sentiment Analysis Using Quantum Algorithms and Neuro-Fuzzy Systems [3.0] 我々は、量子ファジィニューラルネットワーク(QFNN)と呼ばれる感情分析のための新しいハイブリッドアプローチを提案する。
QFNNは量子特性を活用し、ファジィ層を組み込んで古典的な感情分析アルゴリズムの限界を克服する。
提案手法は感情データ処理を高速化し,テキストデータの種類を正確に解析する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:54:17 GMT)
Multiple Mean-Payoff Optimization under Local Stability Constraints [3.0] トランジション毎の平均ペイオフ(平均ペイオフ)は、個々のシステムの性能と信頼性を規定する主要なツールである。
いくつかの平均的なペイオフを同時に最適化するコントローラ(戦略)を構築するという問題は、ゲーム理論モデルやゲーム理論モデルに対して深く研究されている。
本稿では,マルコフ決定プロセスに適用可能な,この問題に対する最初の効率的かつスケーラブルなソリューションの設計と評価を行う。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:53:08 GMT)
Synthetic Data Generation for Anomaly Detection on Table Grapes [2.9] 果実栽培における病気や害虫の早期検出は、収量品質と植物の健康を維持するために重要である。
コンピュータビジョンとロボティクスは、このような問題を自動検出するためにますます採用されている。
この不足に対する解決策の1つは、合成された高品質な異常なサンプルの生成である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:29:12 GMT)
Data Collaboration Analysis with Orthogonal Basis Alignment [2.9] Data Collaboration (DC)フレームワークは、マルチソースデータ融合のためのプライバシ保護ソリューションを提供する。
その強みにもかかわらず、DCフレームワークは、生データのマッピングに使用されるベースを整合させるという理論的課題のために、しばしばパフォーマンスの不安定さに直面する。
本研究は,直流フレームワーク内でのベースアライメントのための厳密な理論基盤を確立することで,これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:23:04 GMT)
Efficient Oriented Object Detection with Enhanced Small Object Recognition in Aerial Images [2.9] 本稿では,オブジェクト指向物体検出タスクに適したYOLOv8モデルを新たに拡張する。
本モデルでは,ASFP(Adaptive Scale Feature Pyramid)モジュールと,P2層の詳細を利用したウェーブレット変換に基づくC2fモジュールを特徴とする。
我々のアプローチは233万のパラメータを持つDecoupleNetよりも効率的なアーキテクチャ設計を提供し、検出精度を維持しています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:45:48 GMT)
Revisiting Cosine Similarity via Normalized ICA-transformed Embeddings [2.8] コサイン類似度は、2つの埋め込みの類似度を測定するために広く用いられている。
本稿では,コサイン類似性の新たな解釈を,軸上の意味的類似性の和として提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:03:38 GMT)
Versatile Ordering Network: An Attention-based Neural Network for Ordering Across Scales and Quality Metrics [2.8] 本稿では,品質基準を付与する戦略を自動的に学習するVersatile Ordering Network (VON)を提案する。
VONは、そのソリューションを評価するために品質測定値を使用し、強化学習をエレデートなロールアウトベースラインで活用して、自分自身を改善する。
この結果から, VONは特殊解法に匹敵する結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:24:29 GMT)
Truthful Text Sanitization Guided by Inference Attacks [2.8] テキストサニタイズの目的は、個人を直接または間接的に識別できる文書にそれらのテキストスパンを書き換えることである。
本稿では,原文のセマンティックコンテンツをサブセットする一般化に基づく自動テキスト衛生戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:07:01 GMT)
An Agentic Approach to Automatic Creation of P&ID Diagrams from Natural Language Descriptions [2.8] 本稿では,自然言語記述からのP&IDの自動生成のための新しい協調手法を提案する。
ワークフローの健全性と完全性を評価して生成プロセスの実現可能性を示し、バニラゼロショットや少数ショット生成手法と比較して改善された結果を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:21:26 GMT)
A Conformal Approach to Feature-based Newsvendor under Model Misspecification [2.8] 共形予測にインスパイアされたモデルフリーで分散フリーなフレームワークを提案する。
ワシントンD.C.のCapital Bikeshareプログラムのシミュレーションデータと実世界のデータセットを用いて,我々のフレームワークを検証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:34:43 GMT)
QNN-VRCS: A Quantum Neural Network for Vehicle Road Cooperation Systems [2.8] 本研究は、車載道路協調システム(VRCS)を強化するために量子コンピューティング技術を統合する。
本稿では、トラフィックデータ処理の複雑さをよりよく扱うために、最適化された量子ニューラルネットワーク(QNN)を提案する。
2つのトラフィックデータセットに対する実証的な評価は、我々のモデルは97.42%と84.08%の優れた分類精度を達成していることを示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:20:08 GMT)
Deep Learning Based Superconductivity: Prediction and Experimental Tests [2.8] 我々は,新しい超伝導材料を予測するために,深層学習(DL)に基づくアプローチを開発する。
DLネットワークから得られた化合物を合成し,超伝導特性を確認した。
特に、RFは化合物の化学化学的性質の知識を必要とするが、ニューラルネットワークの入力は化学組成にのみ依存する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:33:48 GMT)
a2z-1 for Multi-Disease Detection in Abdomen-Pelvis CT: External Validation and Performance Analysis Across 21 Conditions [2.8] A2z-1(A2z-1)は、腹部骨盤CTスキャンを21の時間感度で動作可能な発見のために分析するために設計された人工知能(AI)モデルである。
大規模な振り返り分析では、21の条件で平均0.931のAUCが示される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:44:25 GMT)
LossVal: Efficient Data Valuation for Neural Networks [2.8] LossValは、ニューラルネットワークトレーニング中の重要度を計算する効率的なデータ評価手法である。
LossValは計算コストを削減し、大規模なデータセットと実用的なアプリケーションに適している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:40:37 GMT)
Revealing the impact of synthetic native samples and multi-tasking strategies in Hindi-English code-mixed humour and sarcasm detection [2.8] コード混合ユーモアとサルカズム検出を改善する3つの手法を実験した。
ネイティブなサンプルミキシングでは、コードミキシングトレーニングセットに単言語タスクサンプルを追加しました。
MTL学習では、意味論的タスクのネイティブとコード混合のサンプルを頼りにしました。
また,VMLM学習におけるVMLMの有効性を,数ショットのコンテキストプロンプトを用いて評価した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:26:54 GMT)
Generalized Clausius inequalities and entanglement production in holographic two-dimensional CFTs [2.6] 量子零エネルギー条件 (QNEC) を用いて, クエンチの非可逆エントロピー生成における下界と上界の両方を得ることができることを示す。
また,任意の初期温度および最終温度および運動量密度に対するエンタングルメントエントロピーの成長と熱化について検討した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:00:02 GMT)
BanglishRev: A Large-Scale Bangla-English and Code-mixed Dataset of Product Reviews in E-Commerce [2.6] 本研究は、英語のベンガル語で書かれたレビューと、英語のアルファベットで書かれたバングリッシュ・ベンガル語を混ぜたレビューのために、これまでで最大のeコマース製品レビューデータセットを提示する。
このデータセットは、ベンガル人を対象にしたオンライン電子商取引プラットフォームで販売されている128万の製品から収集された320万のレーティング情報から144万件のレビューが作成されている。
レビューには、レビュー者からのレーティング、レビューが投稿された日、購入日、いいね!の件数、嫌悪感、売り手からの反応、レビューに関連する画像などを含む、レビューごとに関連するメタデータの広範囲が含まれている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:39:10 GMT)
Cross-table Synthetic Tabular Data Detection [2.5] 本研究では, 合成表データの「野生」を, 異なる生成物, ドメイン, テーブル形式で確実に識別できるかどうかについて検討した。
3つのクロステーブルベースライン検出器と4つの異なる評価プロトコルを提案する。
極めて予備的な結果から,クロステーブル適応は難しい課題であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:24:00 GMT)
Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework [2.5] 本研究では,集中治療室における機械的換気を最適化するための,分布自由な共形深度Q-ラーニング手法であるConformalDQNを紹介する。
我々はMIMIC-IVデータベースからICU患者記録を用いてモデルを訓練・評価した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:55:20 GMT)
Revisiting In-context Learning Inference Circuit in Large Language Models [2.5] Incontext Learning (ICL) は、言語モデル(LM)の内的メカニズムを探索せずに学習する、新たな数発学習パラダイムである。
本稿では、推論力学をモデル化し、ICLの観測現象を説明するための包括的回路を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:51:51 GMT)
Refining Dimensions for Improving Clustering-based Cross-lingual Topic Models [2.4] 本稿では,クラスタリングに基づくトピックモデルのパイプラインに,新たなSVDベースの次元改善コンポーネントを導入する。
このコンポーネントは、LCDの負の影響を効果的に中和し、モデルが言語間のトピックを正確に識別できるようにする。
3つのデータセットに対する実験により、ディメンションリファインメントコンポーネントによる更新パイプラインは、一般的に他の最先端の言語間トピックモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:50:23 GMT)
Efficient Gravitational Wave Parameter Estimation via Knowledge Distillation: A ResNet1D-IAF Approach [2.4] 本研究では,重力波解析における計算効率を高めるため,知識蒸留技術を用いた新しい手法を提案する。
我々はResNet1Dと逆自己回帰フロー(Inverse Autoregressive Flow, IAF)アーキテクチャを組み合わせたフレームワークを開発し、複雑な教師モデルからの知識をより軽い学生モデルに伝達する。
実験の結果,教師モデルの4.09と比較すると,学生モデルは最適構成(40,100,0.75)で3.70の検証損失を達成し,パラメータの数を43%削減した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:15:09 GMT)
Adaptive Epsilon Adversarial Training for Robust Gravitational Wave Parameter Estimation Using Normalizing Flows [2.4] 正規化フロー(NF)モデルを用いたアドリラルトレーニングは、敵のサンプルを用いてモデルロバスト性を改善することを目的とした、新たな研究分野である。
本稿では,対数スケーリングを用いた勾配等級に基づく摂動強度を動的に調整するFGSM(Fast Gradient Sign Method)の適応型エプシロン法を提案する。
我々のハイブリッドアーキテクチャは、ResNetとInverse Autoregressive Flowを組み合わせることで、ベースラインモデルと比較してFGSM攻撃下での負のログ類似損失を47%削減します。
摂動強度0.05の強いプロジェクテッド・グラディエント・ディフレッシュ・アタックの下では、我々のモデルは6.4のNLLを維持し、優れたロバスト性を示しながら回避している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:43:16 GMT)
Cloud Storage Integrity at Scale: A Case for Dynamic Hash Trees [2.4] Merkle hash treeは、ストレージシステムの完全性を保護する最先端の方法である。
本稿では,最適なハッシュツリーの定義と,ハッシュツリー設計を評価するための原則的方法論を提案する。
最先端の設計はスケーラビリティに欠けており、安全でないベースライン上で最大40.1倍のスローダウンが発生する。
次に、最適なハッシュツリーの特性を利用して、動的ハッシュツリー(DHT)を設計する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:44:00 GMT)
Fully quantum stochastic entropy production [2.4] 熱力学のアプローチに基づいて、任意の量子過程に対するエントロピー生成を定義する。
平均エントロピー生成の古典的表現は、入力や出力における統計の比較のみを含むことを示す。
エントロピー生成作用素を構築し、エントロピーの値を非可換なケースに一般化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:45:10 GMT)
SAModified: A Foundation Model-Based Zero-Shot Approach for Refining Noisy Land-Use Land-Cover Maps [2.4] 土地利用・土地被覆分析(LULC)はリモートセンシングにおいて重要である。
機械学習を用いたLULCマップの自動生成は、ノイズの多いラベルのため困難である。
基礎モデルSegment Anything Model (SAM) を用いたゼロショットアプローチを提案する。
ラベルノイズの顕著な低減と下流セグメンテーションモデルの性能向上を実現し,デノファイドラベルを用いてトレーニングすると,$approx 5%の値が得られた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:23:00 GMT)
A Study of Undefined Behavior Across Foreign Function Boundaries in Rust Libraries [2.4] Rustは、他の言語との相互運用に頻繁に使用される。
Miriは、これらのモデルに対してアプリケーションを検証できる唯一の動的解析ツールである。
Miriは外部機能をサポートしておらず、Rustエコシステムに重大な正当性ギャップがあることを示唆している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:27:31 GMT)
Guided and Variance-Corrected Fusion with One-shot Style Alignment for Large-Content Image Generation [2.3] 一般的なアプローチでは、一連の重複したイメージパッチを共同生成し、隣接するパッチをマージして大きなイメージを取得する。
既存の方法による結果は、例えば、縫い目や一貫性のないオブジェクトやスタイルなど、明らかな成果物を示すことが多い。
重み付き平均を重なり合う領域に適用することにより、遠方の画像領域からの負の影響を緩和する誘導核融合(GF)を提案する。
また,遅延補正型核融合 (VCF) も提案し, 劣化後のデータの分散を補正し, より正確な拡散確率モデルの融合を生成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:33:34 GMT)
ReXTrust: A Model for Fine-Grained Hallucination Detection in AI-Generated Radiology Reports [2.2] ReXTrustは、AI生成放射線学レポートにおける微細言語幻覚検出のための新しいフレームワークである。
我々はMIMIC-CXRデータセットのサブセット上でReXTrustを評価し,既存手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:07:33 GMT)
Physics-model-guided Worst-case Sampling for Safe Reinforcement Learning [2.2] 学習可能なCPSにおける現実世界の事故は、しばしば挑戦的なコーナーケースで発生する。
トレーニング条件の標準設定は、単一の初期条件で固定するか、許容状態空間から一様にサンプリングされる。
本稿では,安全政策のトレーニングのための物理モデル誘導型最悪のサンプリング戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:13:06 GMT)
Can GPT-O1 Kill All Bugs? An Evaluation of GPT-Family LLMs on QuixBugs [2.2] この作業は、最近のGPT-o1モデルの公開リリースにインスパイアされている。
自動プログラム修復(APR)におけるGPTファミリーモデルの異なるバージョンの有効性の比較を行った。
O1の修復機能は、以前のGPTファミリーモデルよりも優れており、ベンチマークで40のバグを修正できた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:16:56 GMT)
Assessing Quantum and Classical Approaches to Combinatorial Optimization: Testing Quadratic Speed-ups for Heuristic Algorithms [2.2] 2次最適化(CO)における量子および古典的ベンチマークの課題を取り上げる。
我々の数値解析は、現在の手法が量子的優位性を全く示さないという考え方に疑問を投げかけている。
我々は、COの量子優位性を評価するためには、より慎重な数値的な調査が必要であると結論付けている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:59:32 GMT)
InCrowd-VI: A Realistic Visual-Inertial Dataset for Evaluating SLAM in Indoor Pedestrian-Rich Spaces for Human Navigation [2.2] InCrowd-VIは、屋内の歩行者の多い環境での人間のナビゲーションに特化したビジュアル慣性データセットである。
RGB、ステレオ画像、IMU測定など、合計5kmの軌道長と1.5時間の記録時間を含む58のシーケンスが特徴である。
このデータセットはMeta Ariaプロジェクトマシン認識SLAMサービスに由来する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:40:05 GMT)
Fruit Deformity Classification through Single-Input and Multi-Input Architectures based on CNN Models using Real and Synthetic Images [2.2] 本研究は,リンゴ,マンゴー,イチゴなどの果実の外部品質検査における変形度を検出することに焦点を当てた。
データセットは、果物のシルエットを提供するSegment Anything Model(SAM)を使用してセグメント化される。
その結果,MobileNetV2モデルを用いたマルチ入力アーキテクチャは果実の変形を識別するのに最も有効であることが判明した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:51:13 GMT)
Black-box Model Ensembling for Textual and Visual Question Answering via Information Fusion [2.1] 予測のために既存のブラックボックスモデルから勝者を選ぶことを学ぶデータ効率のよいアンサンブル手法であるInfoSelを紹介する。
従来のアンサンブルモデルとは異なり、InfoSelは予測確率や信頼性に依存しておらず、通常はブラックボックスモデルでは利用できない。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:31:18 GMT)
Alternate Preference Optimization for Unlearning Factual Knowledge in Large Language Models [2.1] 機械学習は、特定のトレーニングデータの影響をモデルから効率的に排除することを目的としている。
既存の未学習手法は, 無視集合に関連する応答を抑制するために, 負のフィードバックのみに頼っている。
本稿では,AltPO(Alternate Preference Optimization)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:45:07 GMT)
Optimized two-stage AI-based Neural Decoding for Enhanced Visual Stimulus Reconstruction from fMRI Data [2.1] 本研究は、fMRI遅延空間表現を改善するための非線形ディープネットワークを提案し、次元性も同様に最適化する。
Natural Scenesデータセットの実験により、提案されたアーキテクチャは、最先端のモデルに関して、再構成された画像の構造的類似性を約2%改善した。
LDMのノイズ感度解析により,第1ステージの役割は,高い構造的類似性を有する刺激を予測するのに基本的であることが示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:42:55 GMT)
In-Context Learning Distillation for Efficient Few-Shot Fine-Tuning [2.0] 自然言語推論タスクに対して,OPT-1.3Bモデルに数発のインコンテキスト学習を適用した。
我々は,知識蒸留を用いて文脈情報を内部化し,モデルパラメータを1.3Bから125Mに減らし,2.5GBから0.25GBに縮小した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:49:21 GMT)
RISCORE: Enhancing In-Context Riddle Solving in Language Models through Context-Reconstructed Example Augmentation [2.0] 本稿では,多様な推論技術を必要とする滑車の性能に異なるプロンプト技術がどう影響するかを考察する。
本稿では,文脈的に再構成された文ベースのパズルを生成し,活用する完全自動プロンプト手法RISCOREを紹介する。
実験の結果,RISCOREは言語モデルの性能を縦・横ともに向上させることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:42:18 GMT)
Analysis and Suppression of Errors in Quantum Random Access Memory under Extended Noise Models [2.0] QRAMは任意の局所的不整合雑音チャネルに対して高い耐性を示す。
QRAMのノイズレジリエンスの保持範囲を完全に定量化することで、QRAMアーキテクチャの設計ガイドを提供することができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:20:35 GMT)
TabSniper: Towards Accurate Table Detection & Structure Recognition for Bank Statements [1.9] 既存のテーブル構造認識アプローチは、長い複雑なテーブルに対するサブ最適結果を生成する。
本稿では,バンクステートメントからの効率的なテーブル検出,分類,構造認識のための新しいアプローチであるTabSniperを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:47:59 GMT)
Neighbor-Aware Reinforcement Learning for Mixed Traffic Optimization in Large-scale Networks [1.9] 本稿では,交差する交差点を横断する混在トラフィックを調整するための強化学習フレームワークを提案する。
我々の重要な貢献は、RVがネットワーク間のバランスの取れた分散を維持することができる隣り合わせの報酬メカニズムである。
その結果,最先端の単一断面制御方式と比較して平均待ち時間を39.2%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:35:56 GMT)
Spectra of Cardinality Queries over Description Logic Knowledge Bases [1.9] スペクトルを効果的に表現できるクエリをカウントするクラスを同定する。
有限モデル推論に用いる構造を洗練し,Hornフラグメントのサイクル回帰技術に依存する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:07:04 GMT)
Benchmarking and Understanding Compositional Relational Reasoning of LLMs [1.9] 我々はまず、Generalized Associative Recall (GAR)と呼ばれる新しい合成ベンチマークを提案する。
評価は、GARが既存のLLMにとって十分困難であることを示し、CRRの基本的な欠陥を明らかにしている。
次に、属性パッチを用いて、Vicuna-33Bで再利用されたコア回路の様々なタスクと重要な注意点のセットを発見する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:10:38 GMT)
Statistical learning does not always entail knowledge [1.9] 我々は,真偽の命題に関するエージェントの学習と知識獲得について研究する。
データは提案に関連する多くの機能の詳細を提供すると仮定される。
抽出した機能の数が小さすぎる場合には,完全な学習は不可能であり,完全な知識獲得は不可能であることを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:51:32 GMT)
Artificial intelligence for science: The easy and hard problems [1.9] 我々は科学者の認知科学を研究し、人間がどのように難しい問題を解くかを理解する。
結果を用いて、科学パラダイムを自動推論し、更新する新しい計算エージェントを設計する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:55:42 GMT)
Ask for More Than Bayes Optimal: A Theory of Indecisions for Classification [1.8] 分類器の誤分類率を任意のユーザ指定レベルまで制御でき、最小限の必要な決定量からのみ排除できることを示す。
多くの問題設定において、ユーザは、不確定な点において比較的小さな価格でしか支払わず、誤分類の劇的な減少を得ることができた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:25:51 GMT)
On the Readiness of Scientific Data for a Fair and Transparent Use in Machine Learning [1.8] 異なる領域の4041データ文書のサンプルについて検討し、その完全性、要求された寸法のカバレッジ、近年の動向について検討する。
我々は,データ作成者や科学データ発行者に対して,機械学習技術における透明性と公正な使用に対するデータの準備性を高めるための一連の勧告ガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:34:49 GMT)
Targeted View-Invariant Adversarial Perturbations for 3D Object Recognition [1.7] 敵対的攻撃は3Dオブジェクト認識において重大な課題を引き起こす。
本稿では,頑健な逆数例を作成するための新しい手法であるビュー不変逆数摂動(VIAP)を紹介する。
目標設定と未目標設定の両方において,VIAPの有効性を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:23:25 GMT)
Token-Level Graphs for Short Text Classification [1.7] 本稿では,事前学習言語モデル(PLM)を用いて得られたトークンに基づいて,完全にテキストグラフを構築する手法を提案する。
本手法は文脈情報や意味情報を抽出し,語彙制約を克服し,文脈に依存した単語の意味を抽出する。
実験により,本手法が既存の手法で高いスコアやオンパー性能を連続的に達成する方法が実証された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:19:44 GMT)
On the Relativistic Zero Knowledge Quantum Proofs of Knowledge [1.7] 古典的コミュニケーションを伴う知識システムの相対論的ゼロ知識量子証明について検討する。
NP のすべての関係に対して知識誤差 1/2 + negl(eta) を持つ知識の量子証明が存在することを示す。
我々は、絡み合いのモノガミーと穏やかな測定レムマのアイデアを組み合わせることで、新しいマルチプロデューサ量子巻き戻し手法を開発した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:07:31 GMT)
Noise-based Local Learning using Stochastic Magnetic Tunnel Junctions [1.6] 多層ニューラルネットワークを実装した物理システムに対して,新しい雑音に基づく学習手法を提案する。
スピントロニクスのハードウェア実装を用いて、物理磁気トンネル接合からなる小さなネットワークにおいて学習が達成できることを実験的に実証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:43:26 GMT)
Scrutinizing the Vulnerability of Decentralized Learning to Membership Inference Attacks [1.6] 分散学習システムにおけるメンバーシップ推論攻撃(MIA)の脆弱性について検討する。
鍵となる発見は、MIAの脆弱性は各ノードが実行した局所モデル混合戦略と大きく相関していることである。
本稿は,MIAに脆弱性を設計することで脆弱性を減らす分散型学習システムを考案した際の教訓をまとめたものである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:02:47 GMT)
Near-Term Spin-Qubit Architecture Design via Multipartite Maximally-Entangled States [1.6] 回路レベルの忠実度測定とともに、真の多部量子絡み合いの質を確認する4つの指標を導入する。
我々は,スピンキュービットデバイスの期待するハードウェア特性と適切なコンパイル手法を組み合わせたシミュレーションを考案した。
疎結合なスピン量子格子は、我々の測定値と最も高接続のデバイスアーキテクチャの値に匹敵する値に近づくことができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:55:40 GMT)
Beyond Data Quantity: Key Factors Driving Performance in Multilingual Language Models [1.6] モデル性能を向上させるために、事前訓練データとモデルサイズとともに、重要な要因としてのトーケン類似性と国間類似性を考察した。
これらの洞察は、より公平で効果的な多言語言語モデルを開発するための貴重なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:05:26 GMT)
S2S2: Semantic Stacking for Robust Semantic Segmentation in Medical Imaging [1.6] 医用画像のセグメンテーションにおけるロバストさと一般化性は、しばしば訓練データの不足と限られた多様性によって妨げられる。
画像復調における画像の積み重ねに着想を得た,新しい,ドメインに依存しない,アドオン,データ駆動型戦略を導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:30:22 GMT)
HyperGraphOS: A Modern Meta-Operating System for the Scientific and Engineering Domains [1.4] 本稿では,オペレーティングシステムの領域における重要なイノベーションであるHyperGraphOSについて述べる。
モデルベースのエンジニアリング、グラフモデリング、データコンテナ、ドキュメント、および計算要素を扱うツールを組み合わせることを目的としている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:35:33 GMT)
One-dimension quantum systems in the framework of the most general deformation GUP form [1.4] 本稿では,非局所量子力学から導かれる一般化不確実性原理(GUP)の包括的バージョンの概要について述べる。
我々は、このGUP定式化の具体的な制約を利用して、1次元の線形ポテンシャルに対するエネルギー補正と修正波動関数を計算する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:56:06 GMT)
Stably unactivated neurons in ReLU neural networks [1.3] ReLUニューラルネットワークでは、安定に活性化されないニューロンの存在は、ネットワークの表現力を低下させる。
本研究では、ニューラルネットワークの第2の隠蔽層におけるニューロンが安定に活性化されない確率について検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:28:59 GMT)
Progressive Monitoring of Generative Model Training Evolution [1.3] 深層生成モデル(DGM)は人気があるが、バイアスやその他の非効率性への感受性は依然として問題である。
DGMのトレーニングプロセスを監視するためのプログレッシブ分析フレームワークを導入する。
本稿では,GAN(Generative Adversarial Network)の早期学習におけるバイアスの特定と緩和を支援する方法を紹介する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:20:29 GMT)
Predicting change in time production -- A machine learning approach to time perception [1.3] 我々は、個人の時間生産における変化の方向を予測するために、機械学習モデルを訓練する。
時間生産における変化の方向を決定する上で,参加者のこれまでのタイミングパフォーマンスが重要な役割を担っていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:41:19 GMT)
PT: A Plain Transformer is Good Hospital Readmission Predictor [1.3] 高い寛容率はしばしば不適切な治療や退院後のケアを示す。
本稿では,電子健康記録(EHR),医用画像,臨床ノートを統合したトランスフォーマーベースモデルPTを提案する。
PTは生のデータから特徴を抽出し、データの複雑さに合わせて専用のTransformerブロックを使用する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:37:11 GMT)
GPS-IDS: An Anomaly-based GPS Spoofing Attack Detection Framework for Autonomous Vehicles [1.2] GPSネットワークは、偽造や妨害といったサイバー攻撃に弱い。
本稿では,異常な侵入検知フレームワークであるGPS-IDSを提案する。
私たちの知る限りでは、このデータセットはこの種のデータセットとしては初めてのもので、このようなセキュリティ上の課題に対処するために、グローバルな研究コミュニティが公開している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:31:46 GMT)
Pseudo-Hermitian Topology of Multiband Non-Hermitian Systems [1.2] 複数の帯域に対する非エルミート位相における擬エルミート線の役割を示す。
非エルミートマルチバンドの非分離性は、2次元空間の例外的な点なしで位相的に非自明にすることができる。
我々の研究は、非エルミート的マルチバンドシステムの基本的で包括的な理解に基づいている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:34:45 GMT)
All pure multipartite entangled states of qubits can be self-tested up to complex conjugation [1.2] 自己検査(セルフテスト)とは、量子状態の認証と、別のサブシステムで測定された相関に基づく測定である。
多部量子ビットの場合、自己検査の完全な特徴付けを与える。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:01:01 GMT)
Concurrent vertical and horizontal federated learning with fuzzy cognitive maps [1.1] 本研究ではファジィ認知地図を用いた新しいフェデレーション学習フレームワークを提案する。
多様なデータ分散と非識別分散機能によって引き起こされる課題を包括的に解決するように設計されている。
その結果,プライバシと機密性の基準を維持しつつ,望ましい学習結果を達成するためのアプローチの有効性が示された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:11:14 GMT)
Analyzing Fairness of Computer Vision and Natural Language Processing Models [1.1] 機械学習(ML)アルゴリズムは、医療、金融、教育、法執行など、さまざまな分野における意思決定において重要な役割を果たす。
広く採用されているにもかかわらず、これらのシステムは潜在的なバイアスや公平性の問題のために倫理的・社会的懸念を提起する。
本研究では,非構造化データセットに適用したコンピュータビジョンと自然言語処理(NLP)モデルの公平性の評価と改善に焦点を当てた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:59:26 GMT)
Analyzing Fairness of Classification Machine Learning Model with Structured Dataset [1.1] 本研究では,分類タスクにおける構造化データセットに適用された機械学習モデルの公平性について検討する。
3つのフェアネスライブラリ、MicrosoftのFairlearn、IBMのAIF360、GoogleのWhat If Toolが採用されている。
この研究は、MLモデルのバイアスの程度を評価し、これらのライブラリの有効性を比較し、実践者に対して実行可能な洞察を導出することを目的としている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:57:15 GMT)
TETRIS: Composing FHE Techniques for Private Functional Exploration Over Large Datasets [1.1] 構成可能なホモモルフィック演算の集合を導入し、完全ホモモルフィック暗号を用いて、プライベート関数の評価とプライベートしきい値の組み合わせ方法を示す。
これにより、大規模データベースのプライベートな機能探索の現実的なユースケースを解決するTETRISという新しいシステムを設計できる。
単一のスレッドで数分で数十万の患者記録のデータベースからプライベートな洞察を抽出することが可能である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:04:51 GMT)
Enhancing Internet of Things Security throughSelf-Supervised Graph Neural Networks [1.1] 新しいタイプの攻撃は、通常攻撃よりもはるかに少ないサンプルを持ち、不均衡なデータセットにつながることが多い。
マルコフグラフ畳み込みネットワーク(MarkovGCN)を用いた自己教師付き学習(SSL)によるIoT侵入検出の新しいアプローチを提案する。
当社のアプローチでは,IoTネットワーク固有の構造を活用してGCNを事前トレーニングし,侵入検出タスクを微調整する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:40:14 GMT)
Addressing Small and Imbalanced Medical Image Datasets Using Generative Models: A Comparative Study of DDPM and PGGANs with Random and Greedy K Sampling [1.0] 本研究では, 拡散確率モデル (DDPM) や PGGAN (Progressive Growing Generative Adversarial Networks) などの生成モデルを用いたデータセットの増大について検討する。
本研究は,DDPMとPGGANが生成する合成画像が4つのモデルの性能に与える影響を評価する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:42:50 GMT)
Generative modeling of protein ensembles guided by crystallographic electron densities [1.0] この問題を解決するために,非I.D.アンサンブル誘導手法を提案する。
特定の単結晶測定で観察された複雑なマルチモーダルなタンパク質のバックボーン構造を正確に復元できることを実証した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:31:59 GMT)
RCLMuFN: Relational Context Learning and Multiplex Fusion Network for Multimodal Sarcasm Detection [1.0] マルチモーダルサルカズム検出のための関係文脈学習と多重化融合ネットワーク(RCLMuFN)を提案する。
まず,4つの特徴抽出器を用いて,原文や画像から特徴を包括的に抽出する。
次に,関係文脈学習モジュールを用いて,テキストや画像の文脈情報を学習する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:29:31 GMT)
Evaluating Zero-Shot Multilingual Aspect-Based Sentiment Analysis with Large Language Models [1.0] 我々は,大規模言語モデル(LLM)をゼロショット条件下で評価し,ABSA課題に取り組む可能性を探る。
本稿では,バニラゼロショット,チェーン・オブ・シント(CoT),自己改善,自己議論,自己整合性など,様々な促進策について検討する。
その結果、LLMは多言語ABSAを扱う上での有望性を示すが、一般的には細調整されたタスク固有モデルに欠けることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:48:48 GMT)
SplatR : Experience Goal Visual Rearrangement with 3D Gaussian Splatting and Dense Feature Matching [1.0] 本稿では,3次元ガウシアン・スプラッティングを3次元シーン表現として活用した新しいフレームワークを提案する。
提案手法により,エージェントは,アレンジメントタスクの現在と目標設定を一貫した視点で把握することができる。
我々は,AI2-THOR再構成チャレンジベンチマークに対するアプローチを検証するとともに,現在の技術手法に対する改善を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:02:10 GMT)
V-SQL: A View-based Two-stage Text-to-SQL Framework [1.0] 大規模言語モデル(LLM)に基づくテキスト・ツー・カップリング手法が注目されている。
メインストリームのテキスト・トゥ・カップリングフレームワークの中核となるのはスキーマ・リンクであり、データベース内のユーザ・クエリと関連するテーブルと列をアライメントする。
これまでは、LLMのデータベーススキーマ理解を高めるために、スキーマリンクに重点を置いていた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:27:50 GMT)
CLASP: Contrastive Language-Speech Pretraining for Multilingual Multimodal Information Retrieval [0.9] CLASP(Contrastive Language-Speech Pretraining)は、音声テキスト情報検索に適した多言語表現である。
トレーニングでは,フィクションから宗教まで15の分野を対象とする音声テキストデータセットを新たに導入した。
複数の言語で評価した結果、CLASPはHITS@1、MRR、平均Rメトリクスで新しいベンチマークを確立している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:38:10 GMT)
Plastic Arbor: a modern simulation framework for synaptic plasticity $\unicode{x2013}$ from single synapses to networks of morphological neurons [0.9] 人間や他の動物では、シナプスの可塑性過程は学習や記憶などの認知機能において重要な役割を果たす。
近年の研究では、デンドライトの細胞内分子過程が単一ニューロンの動態に大きく影響していることが示されている。
我々はArborライブラリをPlastic Arborフレームワークに拡張し、様々なスパイク駆動型塑性パラダイムのシミュレーションをサポートした。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:49:38 GMT)
Train More Parameters But Mind Their Placement: Insights into Language Adaptation with PEFT [0.9] 我々は、構造化されていないテキストコーパスを用いて、LLMの生成性能を向上させることを目的としている。
トレーニング可能なパラメータの数が増加すると、言語適応性が向上し、堅牢になる。
0ショットの要約では改善は一貫しているが、いくつかの適応されたモデルは、より長いコンテキストの長さで苦労する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:44:00 GMT)
Automated Penetration Testing: Formalization and Realization [0.9] 近年の規格や規制の変更は、ソフトウェアシステムのセキュリティテストを強化することを義務付けている。
手動浸透試験は労働集約的であり、熟練した実践者を必要とする。
本稿では,実システムの浸透試験を自動化するために,汎用的な自己組織化アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:09:41 GMT)
CLIP-RLDrive: Human-Aligned Autonomous Driving via CLIP-Based Reward Shaping in Reinforcement Learning [0.8] 都市部における自動運転車(AV)の意思決定を改善するための新しい強化学習(RL)フレームワークであるCLIP-RLDriveを提案する。
この目標を達成するために、AVの判断は、Contrastive Language-Image Pretraining (CLIP)ベースの報酬形成を通じて、人間のような嗜好と整合する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:12:45 GMT)
Optimal quantum circuit cuts with application to clustered Hamiltonian simulation [0.8] 本研究では,量子計算におけるエンタングリング演算をランダムな局所演算に置き換える手法について,必要な実行回数を増やすコストで検討する。
本稿では,アダマールテストの2つのコピーに基づいて,この置換手順のコストを制限した,量子力学の絡み合い尺度を提案する。
応用として,弱い相互作用の限界において,その強度と進化時間の合計で指数関数的なコストで相互作用を除去できることが示される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:58:10 GMT)
Accuracy Limits as a Barrier to Biometric System Security [0.8] False Match Rate FMRは生体認証システムの精度と信頼性を評価するための重要な指標である。
本稿では,そのFMRに基づく生体計測システムについて,主に2つの寄与点について分析する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:10:02 GMT)
Can Generative Models Improve Self-Supervised Representation Learning? [0.8] 生成モデルを利用して意味論的に一貫した画像拡張を生成することにより、自己教師付き学習(SSL)パラダイムを充実させるフレームワークを提案する。
その結果,下流タスクにおいて,学習した視覚表現の精度を最大10%向上させることができた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:31:49 GMT)
Rapid optimal work extraction from a quantum-dot information engine [0.8] 我々は量子ドットSzilardエンジンを用いて、20年以上の駆動速度で最大効率で熱ゆらぎから作業を取り出す。
我々は、遅いものから高速なものまで、最適化されたプロトコル群を設計し、実装する。
その結果,効率を最適化する場合,Szilardエンジンの出力が必然的に増加すると電力変動が増大することがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:16:13 GMT)
Can Large Language Models Address Open-Target Stance Detection? [0.7] Open-Target Stance Detection (OTSD) は、トレーニング中にターゲットが見つからず、入力として提供されない、最も現実的なタスクである。
GPT,Gemini,Llama,MistralファミリーからLarge Language Models(LLMs)を評価する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:15:38 GMT)
Do large language vision models understand 3D shapes? [0.7] 大規模視覚言語モデル(LVLM)は、世界の一般的な視覚的理解を達成するための主要なA.Iアプローチである。
この研究は、LVLMが3次元形状を真に理解しているかどうかを、モデルが全く同じ3次元形状の物体を識別しマッチングする能力をテストすることで検証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:06:48 GMT)
Metric Entropy-Free Sample Complexity Bounds for Sample Average Approximation in Convex Stochastic Programming [0.7] 本稿では,凸問題や強凸プログラミング(SP)問題におけるサンプル平均近似(SAA)について検討する。
SAAのサンプルの複雑さは、計量エントロピーの定量化から完全に解放されることを示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:43:30 GMT)
Enabling Low-Resource Language Retrieval: Establishing Baselines for Urdu MS MARCO [0.7] 本稿では,機械翻訳によるMS MARCOデータセットの翻訳により作成した,最初の大規模Urdu IRデータセットを紹介する。
我々は、ウルドゥー語におけるIRのゼロショット学習によるベースライン結果を確立し、その後、mMARCO多言語IR手法を新たに翻訳されたデータセットに適用する。
以上の結果から,超微調整モデル(Urdu-mT5-mMARCO)は0.247のMRR@10,0.439のRecall@10を達成できた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:21:28 GMT)
MedG-KRP: Medical Graph Knowledge Representation Probing [0.6] 大規模言語モデル(LLM)は、最近、強力なツールとして登場し、多くの医学的応用を見つけている。
LLMの生物医学的推論能力を評価するための知識グラフ(KG)に基づく手法を提案する。
GPT-4, Llama3-70b, PalmyraMed-70bは, 特殊な医療モデルである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:06:18 GMT)
License Plate Detection and Character Recognition Using Deep Learning and Font Evaluation [0.6] 本稿では,検出にFaster R-CNNとConnectionist Temporal Classification (CTC) ロスを用いたCNN-RNNモデルと,認識のためのMobileNet V3バックボーンを用いたデュアルディープラーニング戦略を提案する。
この研究は、ライセンスプレート(LP)認識におけるフォント機能の役割を調べ、ドライバ・ゴシック、ドレッドノート、カリフォルニア・クラレンドン、およびOpenALPRシステムで凝縮されたチューリッヒ・エクストラ・コンデンサーなどのフォントを分析した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:03:42 GMT)
Recipient Profiling: Predicting Characteristics from Messages [0.5] これらのテキストが実際に個人間でメッセージ交換されている場合、これは物語の終わりではない、と我々は主張する。
そこで本研究では,プライバシリークが影響する可能性について検討し,レシピ・プロファイリング(Recipient Profiling)の問題に対処する。
このようなタスクが複数の公開データセット上で実現可能であることを示す実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:35:33 GMT)
Approximation properties relative to continuous scale space for hybrid discretizations of Gaussian derivative operators [0.5] 本稿ではガウス微分に対する2つのハイブリッド離散化法の特性について解析する。
これらの離散化手法を研究する動機は、異なる順序の複数の空間微分が同じスケールレベルで必要である場合、より効率的に計算できることである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:12:37 GMT)
Adaptations of AI models for querying the LandMatrix database in natural language [0.5] 土地マトリックスイニシアチブは、低所得国・中所得国における農業、抽出、エネルギーといった分野の議論や行動を伝えるため、大規模土地取得に関する信頼性の高いデータの提供を目的としている。
これらのデータは学術的に認識されているが、アクセスとエクスプロイトの複雑さが主な原因であり、技術的な専門知識とデータベーススキーマの理解が必要とされるため、公共政策では未利用のままである。
本研究の目的は、異なるデータベースシステムからのデータへのアクセスを簡単にすることであり、本論文で提案する手法は、ランドマトリックスのデータを用いて評価される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:44:27 GMT)
GHIssuemarket: A Sandbox Environment for SWE-Agents Economic Experimentation [0.5] 我々は、その超越性に対するswe-agentsの経済的生存性の重要性を論じる。
我々は,スウィートエージェントの経済実験のための仮想環境であるグハズマーケットサンドボックスを紹介した。
ソフトウェアアーティファクトをオープンソース化し、サンドボックスのエンジニアリング決定について議論し、swe-agentsの経済調査を提唱します。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:06:43 GMT)
Enhanced Momentum with Momentum Transformers [0.5] 私たちは、Trding with the Momentum Transformer: An Intelligent and Interpretable Architecture to equitiesという論文で紹介されたアイデアを拡張します。
局所パターン処理に最適化された従来のLong Short-Term Memory(LSTM)モデルとは異なり、アテンションメカニズムはトレーニングウィンドウ内のすべての事前時間ステップに直接アクセスすることができる。
このハイブリッド設計は、LSTMと組み合わせて、長期的な依存関係をキャプチャし、トランザクションコストを考慮に入れたシナリオのパフォーマンスを高め、市場環境の進化にシームレスに適応することを可能にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:11:30 GMT)
Heralded Optical Entanglement Generation via the Graph Picture of Linear Quantum Networks [0.5] 非破壊的な光子との絡み合いは、量子情報処理の貴重な資源である。
最近の研究は、ボソン減算を伴う多粒子交絡体を作るためのグラフアプローチを導入した。
研究は、減算演算子から線形光学演算子への包括的翻訳規則を確立する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:25:02 GMT)
A Central Limit Theorem for the permutation importance measure [0.4] U-Statistics理論を用いたRFPIMの中央極限定理の形式的証明を提供する。
本研究の目的は、総合的な仮説テストを行うのではなく、RFPIMの理論的理解を改善することである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:40:21 GMT)
GraphFuzz: Accelerating Hardware Testing with Graph Models [0.4] ゲートレベルのネットリスト検証のためのグラフベースのハードウェアファザであるGraphFuzzを紹介する。
このアプローチでは、ハードウェア設計はグラフノードとしてモデル化され、ゲートの振る舞いは特徴として符号化される。
グラフ学習アルゴリズムを活用することで、GraphFuzzはノードパターンを分析して、ハードウェアの脆弱性を効率的に検出する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:14:46 GMT)
Deep Learning for Resilient Adversarial Decision Fusion in Byzantine Networks [0.4] 本稿では,対戦型マルチセンサネットワークにおけるレジリエントな決定融合のためのディープラーニングに基づくフレームワークを提案する。
提案手法では、グローバルに構築されたデータセットに基づいてトレーニングされたディープニューラルネットワークを使用して、すべてのケースを適応を必要とせずに一般化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:02:04 GMT)
In-context learning for medical image segmentation [0.4] In-context Cascade (ICS) は、シーケンシャルな医用画像に対して高いセグメンテーション精度を達成しつつ、アノテーション要求を最小限に抑える新しい手法である。
ICSはUniverSegフレームワーク上に構築されており、追加のトレーニングなしでサポートイメージを使用して少数ショットのセグメンテーションを実行する。
心臓8領域のセグメンテーションタスクを含むHVSMRデータセットを用いて,提案手法の評価を行った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:59:08 GMT)
Sum-of-Squares Programming for Ma-Trudinger-Wang Regularity of Optimal Transport Maps [0.4] MTWテンソルに対して非負性証明を提供する,証明可能な計算手法を提案する。
本手法はMTW非負性領域の内積近似の計算にも有効であることを示す。
提案したSOSプログラミング手法をいくつかの実用的な地価関数に適用して,対応する最適輸送マップの規則性の領域を近似する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:10:03 GMT)
Can You Trust LLM Judgments? Reliability of LLM-as-a-Judge [0.4] 大規模言語モデル(LLM)はますます強力でユビキタスなものになってきていますが、その性質はアウトプットの信頼性に課題をもたらします。
マクドナルドのオメガを利用したLCM判定の信頼性を厳格に評価するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:37:31 GMT)
Invisible Watermarks: Attacks and Robustness [0.3] 本稿では,攻撃時の画像品質の劣化を最小限に抑えるとともに,透かしの堅牢性を向上する新しい手法を提案する。
そこで本研究では,デコード中,一方の透かしのモダリティを保ちながら他方を完全に除去する独自の透かし除去ネットワークを提案する。
評価の結果,1)他のモダリティを復号する際の透かしモダリティの1つを保持するための透かし除去モデルの実装は,ベースライン性能において若干改善され,2)LBAは画像全体の均一なぼかしに比べて画像の劣化を著しく低減することがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:50:13 GMT)
End-to-end switchless architecture for fault-tolerant photonic quantum computing [0.3] フォトニクスは、数百万の量子ビットと数十億のゲートを持つ大規模量子計算における最も有望なアプローチの1つである。
本稿では,受動オンチップコンポーネントのみを用いたフォールトトレラント連続変数(CV)量子計算のエンドツーエンドアーキテクチャを提案する。
このアーキテクチャは低光子数分解能しか必要とせず、CV量子コンピューティングにおける高帯域光検出器の利用を可能にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:48:12 GMT)
Predictive Probability Density Mapping for Search and Rescue Using An Agent-Based Approach with Sparse Data [0.3] 本研究では,失明者の多様な心理的プロファイルを再現するエージェントベースモデルを提案する。
このモデルにより、エージェントは自律的に意思決定をしながら現実世界の風景をナビゲートできる。
本研究は, 探索・救助作業に使用可能な柔軟なエージェントを導入し, 各種地理的位置の適応性を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:37:26 GMT)
Integrating Evidence into the Design of XAI and AI-based Decision Support Systems: A Means-End Framework for End-users in Construction [0.2] 本稿では,説明可能な人工知能機器を裏付ける理論的エビデンスに基づく手段エンドフレームワークを開発する。
建設やその他の工学分野でも使用できることが示唆されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:02:05 GMT)
Solving rescheduling problems in heterogeneous urban railway networks using hybrid quantum-classical approach [0.2] 整数線形プログラミングモデルを構築し、D-Waveの量子古典ハイブリッド解法を用いて解く。
提案手法はポーランドにおける実生活異質都市ネットワーク上で実証されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:27:14 GMT)
Sphere Packing on a Quantum Computer for Chromatography Modeling [0.2] カラムクロマトグラフィーの最近の力学モデル -抽象粒子レベル現象-
粒子レベルの現象を組み込むことができる力学モデルは、力学モデルに由来する値を増加させる。
球状パッキングによるカラムクロマトグラフィーをモデル化し、3つのバージョンを定式化した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:29:11 GMT)
Towards Physically Interpretable World Models: Meaningful Weakly Supervised Representations for Visual Trajectory Prediction [0.2] ディープラーニングモデルは、複雑なシステムの認識、予測、制御にますます使われています。
これらのモデルに物理的な知識を組み込むことは、現実的で一貫性のある出力を達成するために不可欠である。
本研究では,学習した潜在表現を実世界の物理量と整合させる新しいアーキテクチャである物理解釈可能世界モデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:51:24 GMT)
Improving essay peer grading accuracy in MOOCs using personalized weights from student's engagement and performance [0.1] いくつかの提案では、ピアグレードの重み付け集約を計算するために、特定の重みを計算する。
学生のエンゲージメントとパフォーマンスの指標を用いて、パーソナライズされた重みを計算する。
以上の結果から,集計したスコアの妥当性とインストラクターの成績との相関性が改善された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:50:47 GMT)
Saliency Methods are Encoders: Analysing Logical Relations Towards Interpretation [0.1] ニューラルネットワークモデルの説明可能性を改善するために、サリエンシマップがしばしば生成される。
本稿では、単純な論理的データセット上で可能なすべてのモデル推論に基づく実験を提案する。
そこで本研究では,その論理的関係を利用して,異なるクラス識別シナリオにおける情報処理方法の相違点を理解することを目的とする。
以上の結果から,Saliency法は分類関連情報をSaliencyスコアの順序付けにエンコードできることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:55:17 GMT)
Moment Unfolding [0.1] 我々は、まずデータを離散化することなく、観測可能な別の関数として分布モーメントを展開するための新しいアプローチを開発する。
私たちのモーメント・アンフォールディング技術は機械学習を使い、GAN(Generative Adrial Networks)にインスパイアされています。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:42:42 GMT)
Lagrangian Index Policy for Restless Bandits with Average Reward [0.1] ラグランジアン指数政策 (LIP) を, 長期平均報酬を伴うレスレスマルチアームバンディットに適用した。
我々は,LIPの性能とWhittle Index Policy(WIP)の性能を比較した。
モデルフリー環境でLIPのオンライン学習手法を得るための強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:03:53 GMT)
A Comparative Study of Pruning Methods in Transformer-based Time Series Forecasting [0.1] プルーニングは、ニューラルネットワークのパラメータ数を削減し、計算を保存するための確立されたアプローチである。
本研究では,これらのプルーニング戦略がモデルサイズ,演算,推論時間などの予測性能および計算面に与える影響について検討する。
ハードウェアとソフトウェアが対応する場合でも、構造化プルーニングは大幅な時間節約を達成できないことを実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:07:31 GMT)
Microwave-to-Optical Quantum Transduction with Antiferromagnets [0.0] 反強磁性マグノンを介するマイクロ波-光量子変換の理論
研究は、将来の量子配線における反強磁性物質の応用の可能性への道を開く。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:34:00 GMT)
Wind Speed Forecasting Based on Data Decomposition and Deep Learning Models: A Case Study of a Wind Farm in Saudi Arabia [0.0] 風力発電は常に風速のボラティリティによる不確実性を伴う。
風速予測(WSF)は電力グリッドのディスパッチ、安定性、制御性に不可欠である。
本研究では,ハイブリッド分解法に基づく定常データのための新しいWSFフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:04:46 GMT)
What is YOLOv6? A Deep Insight into the Object Detection Model [0.0] 本研究は、YOLOv6オブジェクト検出モデルの詳細に焦点を当てている。
YOLOv6-NはNVIDIA Tesla T4 GPUで1187 FPSで37.5%APを達成した。
YOLOv6-Sは484 FPSで45.0%APに達し、PPYOLOE-S、YOLOv5-S、YOLOX-S、YOLOv8-Sといった同クラスのモデルより優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:26:15 GMT)
What do Computing Interns Discuss Online? An Empirical Analysis of Reddit Posts [0.0] 本稿では,インターンシップに関する学生の議論と意見について考察する。
根語「インターン」を含む921,845件中143,912件のRedditのインターンシップに関する投稿を抽出した。
その結果、コンピュータインターンは概して肯定的な感情を示し、議論は主に、学者、学校の入学、職業的キャリア、エンターテイメント活動、社会的相互作用に関連していた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:49:03 GMT)
What Information Should Be Shared with Whom "Before and During Training"? [0.0] トレーニング実行前には、トレーニング開始日と終了日、(FLOPで)期待された計算使用日、事前トレーニングデータセットの説明など、特定の情報を共有することが可能でした。
同社は、トレーニング中の進捗、能力、リスク、ロケーション、オーナシップ、大規模コンピューティングクラスタの主要なエネルギー源、物理的、人的、サイバーセキュリティのステップをどのように監視するか。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:15:25 GMT)
WaveguideQED.jl: An Efficient Framework for Simulating Non-Markovian Waveguide Quantum Electrodynamics [0.0] WQED(Waveguide Quantum Electrodynamics)の新興分野における問題を解決するための数値的枠組みを導入する。
このフレームワークは衝突量子光学に基づいており、局所量子系は個々の時間ビンモードと順次相互作用する。
複雑なWQEDシナリオを扱うためのフレームワークの堅牢性を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:04:42 GMT)
Virtual Trial Room with Computer Vision and Machine Learning [0.0] 顧客は、適合性と適合性に関する確実性がないため、しばしばウェアラブル製品を購入することをためらう。
Virtual Trial Room with Computer Vision and Machine Learningと呼ばれるプラットフォームは、顧客がプロダクトが適合するかどうかを簡単にチェックできるように設計されている。
DECAモデルを用いて1枚の2次元画像から、人間の頭部のAI生成3次元モデルを作成する。
この3Dモデルは、実世界の計測に基づいて人間の頭の上に装着された、カスタムメイドのガラスの3Dモデルで重畳された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:41:32 GMT)
Unitarity constrains the quantum information metrics for particle interactions [0.0] ユニタリティは、量子情報システムに関する数学的および物理的制約を提供する。
非相対論的量子力学の言語は、ハード散乱のための密度行列を導出するために提示される。
陽子からの電子の非弾性散乱に対して、相対論的量子力学の言語は運動量エントロピー(英語版)(Sackur-Tetrode equation)を導出するために用いられる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:38:58 GMT)
Two-photon coupling via Josephson element I: Breaking the symmetry with magnetic fields [0.0] 対称超伝導量子干渉デバイス(SQUID)に基づく結合素子について考察する。
2光子相互作用を媒介することを示す。
SQUIDによる他の誘導相互作用は、その場でオフにすることができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:43:21 GMT)
Training a Distributed Acoustic Sensing Traffic Monitoring Network With Video Inputs [0.0] 本稿では,DASデータと協調した視覚情報を統合する新しい概念を提案する。
本モデルでは,検出と分類において94%以上の性能を示し,約1.2%の誤警報率を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:06:42 GMT)
Thermal Pure States for Systems with Antiunitary Symmetries and Their Tensor Network Representations [0.0] 本稿では,特定の反単位対称性を持つ系の熱純状態を構築するためのテンソルネットワークアルゴリズムを提案する。
提案手法は, 体積則の絡み合いを示す一方で, 簡単な変換によってテンソルネットワーク状態にマッピングできる熱純状態を利用する。
以上の結果から, 熱平衡状態に限らず, 体積法則状態に対する新しい変動波動関数のクラスが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:45:46 GMT)
The composition rule for quantum systems is not the only possible one [0.0] 我々は、組成の仮定は、量子論の他の特徴とは独立して実験的に精査されるべきであると主張する。
我々は、そのシステム構成則によって標準量子理論とのみ区別される操作理論の族を定式化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:40:00 GMT)
The binarisation loophole in high-dimensional quantum correlation experiments [0.0] 我々は,ブラックボックス相関実験において,測定バイナライゼーションの手順に欠陥があり,抜け穴が開いていることを論じる。
本稿では,二項化による相関関係を忠実に解析する手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:49:51 GMT)
The Societal Implications of Blockchain Technology in the Evolution of Humanity as a "Superorganism" [0.0] この記事では、ブロックチェーン技術と暗号資産のより広範な社会的意味について考察する。
人類の進化における彼らの役割は、分権的で自己統制的なシステムを持つ「スーパー・オーガニゼーション」として強調されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:59:53 GMT)
Symmetry operations and Critical Behaviour in Classical to Quantum Stochastic Processes [0.0] 緩和過程は異なる量子拡大に対して非常に異なる展開を示す。
L1-ノルムに基づくコヒーレンス測度と緩和過程の速度との間には,かなりあいまいな関係がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:45:51 GMT)
Superfluorescent upconversion nanoparticles as an emerging second generation quantum technology material [0.0] アップコンバージョンナノ粒子(UCNP)の超蛍光は室温量子現象であり、ネオジム(Nd3+)ドープUCNPによって放出される光子の速度と総量を大幅に増加させることができる。
この視点では、SF-UCNPを第2世代の量子技術応用のための光学ナノマテリアルのクラスとして利用する方法を文脈化している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:18:08 GMT)
Strong and weak symmetries and their spontaneous symmetry breaking in mixed states emerging from the quantum Ising model under multiple decoherence [0.0] 一次元横フィールドイジングモデル(TFIM)に適用された2種類のデコヒーレンス間の相互作用によって生じる現象について検討する。
TFIMの基底状態から様々な混合状態が出現する。
この研究では、Z$対称性の強さと弱さが重要な役割を担い、効率的な順序パラメータを導入する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:00:29 GMT)
Stochastic weight matrix dynamics during learning and Dyson Brownian motion [0.0] 学習アルゴリズムにおける重み行列の更新はダイソン・ブラウン運動の枠組みに記述できることを示す。
ガス分布の普遍的特徴と非普遍的特徴を議論し,教師-学生モデルにおいて,Wigner surmise と Wigner 半円を明示的に同定する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:13:36 GMT)
Small but large: Single organic molecules as hybrid platforms for quantum technologies [0.0] 固体マトリックスに埋め込まれた単一の有機分子は、顕著な光学的性質を示す。
このシステムが含む豊富な内部状態について詳しく検討し、量子メモリ、スピン光子インタフェース、スピンレジスタ、光力学の応用にそれらを活用するための戦略を提唱する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:32:28 GMT)
Simulating imperfect quantum optical circuits using unsymmetrized bases [0.0] 我々は、情報を捨てることなく、MN$でずっと小さな非対称ベースを使用することが可能であることを示す。
量子パリティ符号を用いて符号化された不完全量子ビットの生成を初めてシミュレーションすることで、この手法を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:03:26 GMT)
Sharp finite statistics for quantum key distribution [0.0] 量子鍵分布(QKD)におけるランダムサンプリング問題に対する単純な指数境界を考案する。
副生成物として、非正則ベルヌーイパラメータの平均に対する信頼区間も従う。
超幾何分布の累積質量関数が正確に計算可能であるので, 広いパラメータ構造では, テール境界の使用は強制されない。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:51:14 GMT)
Search Strategy Generation for Branch and Bound Using Genetic Programming [0.0] GP2S(Genetic Programming for Search Strategy)は,B&B検索戦略を自動生成する機械学習手法である。
我々は、SCIPソルバの標準手法、最近のグラフニューラルネットワークに基づく手法、手工芸品との比較を行った。
我々の手法は最良基準よりも2%遅く、SCIPを一貫して上回り、平均速度は11.3%に達する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:24:36 GMT)
Revisiting the origin of neutrino flavor transformations [0.0] ニュートリノ変換を合理的に説明できる別のメカニズムを提案する。
これは空間上のZボゾン場の仮想励起に基づいている。
ニュートリノが物質中に伝播するとき、その挙動は散乱に起因するコヒーレントフレーバー変換とデコヒーレンス効果の競合によって決定される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:07:13 GMT)
Reservoir Computing for Fast, Simplified Reinforcement Learning on Memory Tasks [0.0] 貯留層計算はメモリタスクの強化学習を大幅に単純化し、高速化する。
特に、これらの発見は、主に効率的で汎用的なメモリシステムに依存するメタラーニングに大きな恩恵をもたらす。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:02:06 GMT)
Relative volume of comparable pairs under semigroup majorization [0.0] 行列の任意の半群 $mathcalS$ は、確率 $n$-ベクトルの集合 $Delta_n-1$ 上で半群素化関係 $precmathcalS$ を誘導する。
Delta_n-1$:$X$と$Y$が$precmathcalS$に匹敵する確率は?
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:50:28 GMT)
Regimes of Steady-State Turbulence in a Quantum Fluid [0.0] 異方性強制から広範囲の強制振幅に対する等方性乱流の発生を観察する。
スペクトルは、密度の強い渦乱流に関連する圧縮可能な運動エネルギーのみに対して$k-7/3$レギュレーションに遷移する。
強い強制機構は、小さな渦消滅によって駆動される圧縮可能エネルギーの逆カスケードと一致している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:00:09 GMT)
Recent advancements in LLM Red-Teaming: Techniques, Defenses, and Ethical Considerations [0.0] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な機能を示しているが、Jailbreak攻撃に対する脆弱性は重大なセキュリティリスクをもたらす。
本稿では,Large Language Model (LLM) のレッドチームにおける攻撃戦略と防御機構の最近の進歩を包括的に分析する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:34:32 GMT)
Re-calibrating methodologies in social media research: Challenge the visual, work with Speech [0.0] 本稿は,ソーシャルメディア研究者が分析において,音声に基づくデータに効果的に関与する方法を考察する。
我々の方法論的レパートリーの拡大は、プラットフォーム化されたコンテンツのより豊かな解釈を可能にすると結論づける。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:47:57 GMT)
Question: How do Large Language Models perform on the Question Answering tasks? Answer: [0.0] 大型言語モデル(LLM)は、少数ショットまたはゼロショットプロンプト技術を用いることで、これらのタスクを明示的にトレーニングする必要なしに、様々なNLPタスクに対して有望な結果を示している。
スタンフォード質問回答データセット 2.0 (SQuAD2) 上で、小型の微調整モデルとアウト・オブ・ザ・ボックスの命令追従 LLM の総合的な性能比較を提案する。
以上の結果から, より小型で細調整されたモデルでは, 細調整されたタスクにおいて, 現状のSOTA(State-Of-The-Art) LLMよりも優れていることがわかったが, 最新のSOTAモデルでは, このギャップを埋めることができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:19:38 GMT)
Quantum thermal machine as a rectifier [0.0] 両端の異なる温度で熱浴に接続された相互作用する個々の量子系の連鎖を研究する。
弱い結合状態における熱の整合性は鎖長とは独立であり, 負の差分熱伝導が生じる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 02:29:43 GMT)
Quantum geometry in many-body systems with precursors of criticality [0.0] 量子位相遷移(QPT)を用いたパラメータ依存多体系における基底状態多様体の幾何解析
本研究は,1次QPTの形成におけるダイアボリックポイントの役割を解明し,これらの孤立した幾何学的特異点が有限系における測地線の不規則な挙動を生じる種子を表すことを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:28:38 GMT)
Quantum delocalization of a 1-milligram torsional pendulum for gravity experiments [0.0] 我々は18Hzで動作する1ミリグラムのねじり振り子を開発した。
我々は、最先端の量子重力フィギュア・オブ・メリットと、非並列的な改善ポテンシャルをベンチマークする。
結果は重力の量子的側面の探索のフロンティアを開く。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:39:48 GMT)
Quantum computing topological invariants of two-dimensional quantum matter [0.0] 量子コンピュータ上で2次元量子物質のチャーン数を計算するための2つの量子回路を提案する。
まず,多くの量子ビットを用い,量子回路のテンソルネットワークシミュレータを用いて解析する。
第2の回路はより少ない量子ビットを使用し、超伝導量子ビットに基づく量子コンピュータで実験的に実装する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:10:55 GMT)
Quantum Sensing with Driven-Dissipative Su-Schrieffer-Heeger Lattices [0.0] 非エルミート系の感度は、新しいタイプのセンサーの開発についてのアイデアを広く研究し、刺激している。
本稿では, 圧縮したSu-Schrieffer-Heegerモデルによって制御されるパラメトリック駆動共振器の連鎖について検討する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:00:00 GMT)
Producing Histopathology Phantom Images using Generative Adversarial Networks to improve Tumor Detection [0.0] 本稿では,GANを用いたデータ拡張が,我々のデータセットにおける異なる種類のがんの分布の不均一性を軽減するための有効な解決策であることを確かめる。
実験の結果,50%に増強されたデータセットは腫瘍検出率を80%から87.5%に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:04:46 GMT)
Prepare-and-measure scenarios with photon-number constraints [0.0] 非可換プログラミングに対する半定緩和は、光子数分布タスクの制約の下で相関の集合を束縛するためにどのように利用できるかを示す。
我々は、コヒーレントな状態とホモダイン測定に基づいて、確立されたプロトコルにおけるランダム性抽出を改善することで、このツールを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:23:59 GMT)
Political Fact-Checking Efforts are Constrained by Deficiencies in Coverage, Speed, and Reach [0.0] この研究は、政治事実確認の取り組みによって直面する現実世界の限界について、最も包括的な評価を提供する。
現在開発および配布されている事実チェックは、その範囲、速度、リーチに関する制約により、選挙状況において著しく抑制されている。
我々は、誤報が政治的権利に偏っているという仮定に反する実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:15:08 GMT)
Phase transitions from Heating to non-heating in SU(1, 1) quantum dynamics: applications to Bose-Einstein condensates and periodically driven coupled oscillators [0.0] SU(1, 1)構造を持つ非平衡量子系の絡み合い特性について検討する。
量子力学がSU(1, 1)構造を示す実験可能な2つのシステムを考える。
熱領域内の2つの異なる位相は, 絡み合いエントロピーの成長速度によってのみ識別される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:51:10 GMT)
Performance Comparison of Security Credential Management Systems for V2X: North American Standard IEEE 1609.2.1 and European Standard ETSI TS 102 941 [0.0] 本研究では,V2X通信におけるセキュリティ・クレデンシャル・マネジメント・システム(SCMS)の性能と構造的差異について検討した。
それぞれのPublic Key Infrastructure(PKI)アーキテクチャ、証明書アプリケーション、および証明書アプリケーションで使用されるリクエスト/レスポンスメッセージのフォーマットを比較することに焦点を当てている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:19:08 GMT)
Parallel transport in rotating frames and projective holonomic quantum computation [0.0] 射影ゲートを用いた非線形ホロノミック量子計算のためのフレームワークを開発した。
我々は等ホロノミックな不等式を拡張し、ホロノミックな量子ゲートを実装するために使用されるプロトコルの効率に基礎的な拘束力を与える。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:29:47 GMT)
Optimization of Flight Routes: Quantum Approximate Optimization Algorithm for the Tail Assignment Problem [0.0] TAP(Tail Assignment Problem)は、航空会社の運用において重要な最適化課題である。
この研究は、量子近似最適化アルゴリズム(QAOA)をTAPに適用する。
この分析は量子ハードウェアの現在の限界を明らかにしているが、技術が進歩するにつれて潜在的な利点が示唆される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:35:26 GMT)
Online optimisation for dynamic electrical impedance tomography [0.0] 非線形時間離散逆問題に対する原始双対オンライン手法を提案する。
本手法を後悔理論を用いて解析し,流体中の物体のリアルタイムモニタリングにおいてその性能を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:22:44 GMT)
On the application of the Rayleigh-Ritz method to a projected Hamiltonian [0.0] 我々は、RRM固有値が、下から投影されたハミルトニアンの値へのアプローチを示す。
また、エネルギーシフトの影響とアイデンティティ演算子の投影についても論じる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:34:08 GMT)
On the Sample Complexity of Quantum Boltzmann Machine Learning [0.0] モデルと目標との期待値の差からQBM学習の運用的定義を与える。
解は、少なくとも複数のギブス状態を用いて勾配降下で得られることを証明した。
特に,平均場,ガウスフェルミオン,幾何学的局所ハミルトニアンに基づく事前学習戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:06:32 GMT)
On the Hardness of Training Deep Neural Networks Discretely [0.0] ニューラルネットワークトレーニング(NNT)の硬さは,ネットワーク深度に大きく影響している。
具体的には、標準仮定の下では、D-NNTは、固定次元とデータセットサイズを持つインスタンスであってもクラスNPに含まれていないことを示す。
これらの結果を2層ネットワーク上でのD-NNTのNP硬度下界の包括的リストで補完する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:20:29 GMT)
On Model Extrapolation in Marginal Shapley Values [0.0] モデル説明可能性の最も一般的な方法の1つは、Shapley値に基づいている。
シェープ値を計算するための限界的なアプローチは、うまく定義されていないかもしれないモデル外挿につながる。
本稿では,限界平均化を用いてモデル外挿を回避し,因果情報を付加することで因果シャプリー値を再現する手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:33:14 GMT)
Observing dynamical localization on a trapped-ion qudit quantum processor [0.0] 捕捉イオンキューディット量子プロセッサを用いて、障害のない$S=1$Floquetモデルを研究する。
非エルゴード力学をキュービット系を超えて観測できることを実証し,創発的な3T$サブハーモニック応答を実験的に観察した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:07:03 GMT)
Nonperturbative features in the Lie-algebraic Kähler sigma model with fermions [0.0] 複数の右利きキラルフェルミオンを持つリー代数K"ahler sigmaモデルから導かれる量子力学系について検討する。
我々は,サドル点解の同定と解析を行い,基底状態エネルギーの摂動膨張におけるそれらの寄与について検討する。
本稿では,3ループレベルから系の量子的振舞いを形作る際に,伸長パラメータが関係することを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:30:41 GMT)
Multi-parametric Nonlinear Generalization of Klein-Gordon: Real and Complex Fields [0.0] 一般化されたモデルのクラスが3つあり、複素体は1つ、実体は2つの異なるクラスが存在することを示す。
これら3つのクラスの全てのモデルは、移動-波動解を持ち、相対論的分散関係を満たす。
また、複素クラスにはローレンツのソリトン解を持つ方程式のサブクラスが存在することも示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:19:43 GMT)
Modeling Quantum Volume Using Randomized Benchmarking of Room-Temperature NV Center Quantum Registers [0.0] 室温で動作しているダイヤモンドのNV中心に基づく量子レジスタのベンチマーク問題に取り組む。
オール・ツー・オール接続のおかげで、2と3のqubitゲートの性能は他のプラットフォームで有望で競争力がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:43:31 GMT)
Model Cards for Quantum Technologies Reporting [0.0] 計算、通信、センシングなど、アプリケーション領域で破壊的になる可能性のある、数多くの新興量子技術がある。
本稿では,量子技術に用いるエンティティのユースケースと性能特性を詳述した文書化のためのモデルカードを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:22:31 GMT)
Memory-minimal quantum generation of stochastic processes: spectral invariants of quantum hidden Markov models [0.0] 我々は、それを生成する任意のモデルから計算できるプロセスのスペクトル不変量を特定する。
古典的操作に制限を加えると、境界は二次的に上昇する。
古典的境界は量子モデルによって破られることを実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:30:51 GMT)
Many-body delocalization from embedded thermal inclusion [0.0] 2つのXXZスピン鎖をアタッチすることで、1次元不規則スピン系の量子雪崩を数値的に研究する。
希少領域が存在する場合,多体局在状態において指数関数的に遅い熱化(障害)を示す証拠が発見された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 03:11:54 GMT)
Machine Learning-Based Estimation Of Wave Direction For Unmanned Surface Vehicles [0.0] 本稿では,USVから収集したセンサデータを用いて,波動方向の予測を行う機械学習手法を提案する。
実験の結果,LSTMモデルが時間的依存を学習し,正確な予測を行う能力を示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:53:12 GMT)
Logic-Constrained Shortest Paths for Flight Planning [0.0] 論理制約短経路問題(LCSP)は、1対1の短経路問題と、ルーティンググラフに課される満足度制約を組み合わせた問題である。
LCSPのための新しい分岐および境界ベースアルゴリズムを提案する。
本稿では,TLFをLCSPとしてモデル化し,分岐および有界アルゴリズムを用いてそれを解決する方法について述べる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:18:06 GMT)
Liftability and Contracting Property of Multi-EGS Groups [0.0] 我々は、端点の1つを安定化する有限次正規木に推移的に作用する群の新しい例を作成する。
このクラスの群の収縮核を明示的に計算する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:48:31 GMT)
Lane-Keeping Control of Autonomous Vehicles Through a Soft-Constrained Iterative LQR [0.0] 我々は,CILQRアルゴリズムとモデル予測制御(MPC)制約緩和法を統合することで,ソフト制約付き反復線形二次制御器(ソフトCILQR)アルゴリズムを開発した。
提案したソフトCILQRアルゴリズムは平均実行時間2.55msを実現し、リアルタイム自動運転シナリオに適用可能である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:06:02 GMT)
LITA: An Efficient LLM-assisted Iterative Topic Augmentation Framework [0.0] 大きな言語モデル(LLM)は動的トピックの洗練と発見の可能性を秘めている。
これらの課題に対処するため、LLM支援反復トピック拡張フレームワーク(LITA)を提案する。
LITAは、ユーザが提供するシードと埋め込みベースのクラスタリングと反復的な改良を統合している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 01:43:44 GMT)
Knowledge Graphs: The Future of Data Integration and Insightful Discovery [0.0] 知識グラフはポイントをリンクすることでデータを整理し、研究者は多様な情報ソースを単一のデータベースにまとめることができる。
構造化されていないデータソースに固有の複雑な関係を捉え、多様なエンティティのセマンティックなフレームワークを提供する。
知識グラフを開発するための戦略としては、シードデータの使用、名前付きエンティティ認識、関係抽出などがある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:49:33 GMT)
Joint-measurability and quantum communication with untrusted devices [0.0] 我々は,信頼できない測定装置を用いた幅広いシナリオやプロトコルにおいて,許容レベルの損失とノイズを特徴付けるための一般的なフレームワークを開発する。
我々の研究における重要なステップは、信頼できない測定装置との量子プロトコル間の一般的な接続を確立することである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:18:33 GMT)
Is it the end of (generative) linguistics as we know it? [0.0] ピアンタドシによるチョムスキーのアプローチの取り消しは残酷だが、生成言語学者はそれに値する。
言語学における中心的な役割を取り戻すためには、生成言語学は真剣な更新が必要である。
形式的な視点を無視することは、計算と実験の両方のアプローチに大きな欠点をもたらす。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:00:34 GMT)
Inhomogeneous SU(2) symmetries in homogeneous integrable U(1) circuits and transport [0.0] 近接するU(1)ゲートを持つ量子回路の対称性について検討し、新しい不均質スクリューSU(2)と$rm U_q(rm sl_2)$対称性を発見した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:10:39 GMT)
Improving Fine-grained Visual Understanding in VLMs through Text-Only Training [0.0] テキストのみの学習を通して視覚言語モデル(VLM)におけるきめ細かい視覚的理解を高める可能性について検討する。
我々は2つの異なる領域、細粒度の種分類と文化的な視覚的理解タスクについて包括的な実験を行った。
その結果,テキストのみのトレーニングは従来の画像テキスト学習に匹敵するが,計算コストは大幅に削減できることがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:18:50 GMT)
Identifying Bias in Deep Neural Networks Using Image Transforms [0.0] CNNは過去20年で最もよく使われている計算ツールの1つになっている。
CNNの主な欠点の1つは、イメージデータがどのように分析されているかをユーザが必ずしも知ることができないブラックボックスとして動作することだ。
これはニューラルネットワークのパフォーマンス評価に影響を与えるが、識別が難しい隠れバイアスにつながる可能性がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:51:44 GMT)
Generation of genuine multipartite entangled states via indistinguishability of identical particles [0.0] 同一粒子の識別不可能性は、量子情報処理の資源である。
純積状態の$N$ qubitsから絡み合いを生成することができる制御可能なスキームを提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:15:05 GMT)
Gaussian process model kernels for noisy optimization in variational quantum algorithms [0.0] 変分量子アルゴリズム(VQA)は、ノイズのある射影測定の結果に基づいて、量子デバイス上でのパラメトリック化試行状態を最適化することにより、古典的または量子最適化の問題を解決することを目的としている。
我々は、典型的なVQAコスト関数が周波数の少ない振動挙動を示すという観察から着想を得た三角カーネルを紹介した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:05:32 GMT)
Galilean decoherence and quantum measurement [0.0] 我々は、質量依存デコヒーレンス効果を導入する量子論を、$QTast$と表記する。
導入されたデコヒーレンス効果は、特徴的な質量依存デコヒーレンス時間スケールによって決定されるマイクロシステムとマクロシステムとを区別する。
量子測定プロセスは$QTast$のフレームワーク内で分析され、ガリレオ・デコヒーレンスは絡み合った状態から適切な混合物への移行を可能にする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:20:40 GMT)
GPgym: A Remote Service Platform with Gaussian Process Regression for Online Learning [0.0] GPgymはガウスのプロセス回帰に基づくリモートサービスノードである。
さまざまな分野の専門家が、既存の専門ソフトウェアに機械学習技術をシームレスに組み込むことができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:10:59 GMT)
FootstepNet: an Efficient Actor-Critic Method for Fast On-line Bipedal Footstep Planning and Forecasting [0.0] 本研究では,障害物のある環境下を移動するための効率的なフットステップ計画法を提案する。
また,地域目標の異なる候補に到達するのに必要なステップ数を素早く推定できる予測手法を提案する。
本研究は,RoboCup 2023コンペティションにおいて,シミュレーション結果と,子供サイズのヒューマノイドロボットへの展開によるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:28:10 GMT)
Floquet-driven crossover from density-assisted tunneling to enhanced pair tunneling [0.0] Floquet-reduced single- Particle tunneling と比較して, 対のトンネル速度を向上できるだけでなく, 静的な超交換速度を超えても向上できることを示す。
これにより、超低温原子系における明示的なペアトンネルによるモデルの実現が可能となる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:53:11 GMT)
Fisher information and quantum entropies of a 2D system under a non-central scalar and a vector potentials [0.0] 双極子モーメントを持つクラッツァーポテンシャルからなる非中央ポテンシャルに影響される2次元システムについて検討する。
我々は、フィッシャー情報、シャノンエントロピー、ツァリスエントロピー、レニエントロピーなど、様々な情報理論を探求する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:59:47 GMT)
Fault-tolerant Quantum Computation without Distillation on a 2D Device [0.0] 2次元曲面符号間の耐故障性のない非クリフォードゲートの実装に、ループパイプラインアーキテクチャをどのように利用できるかを示す。
このゲートを実装するのに必要なシャットリングスケジュールは、標準的な2Dサーフェスコードを実装するのに必要なものよりも、わずかに複雑である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 04:38:49 GMT)
Factoring an integer with three oscillators and a qubit [0.0] 従来の量子アルゴリズム設計の共通の出発点は、スケーラブルな数量子ビットを持つ普遍量子コンピュータの概念である。
ここでは、物理的な設定と関連する操作のセットに焦点を当てた代替アプローチを提唱する。
個々の量子ビットの観点から測定に関する推論の標準的アプローチをサイドステッピングすることで、これらの利点を最大限に活用できることが示される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:43:18 GMT)
Extending the European Competence Framework for Quantum Technologies: new proficiency triangle and qualification profiles [0.0] バージョン2.5の2024アップデートでは、新しい熟練度三角形と資格プロファイルによって拡張されている。
熟練度三角形は3つの熟練度領域に対して6つの熟練度レベルを提案し、各レベルの知識とスキルを指定する。
9つの資格プロファイルは、量子産業に関連する原型的資格または職種を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:02:25 GMT)
Exploring Diffusion and Flow Matching Under Generator Matching [0.0] 拡散とフローマッチングは、Generator Matchingの統一されたフレームワークの下で見ることができる。
同じ生成的マルコフフレームワークの下で拡散とフローマッチングの両方をリキャストすることにより、フローマッチングモデルがより堅牢になる理由に関する理論的知見を提供する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:45:29 GMT)
Explainable AI in Handwriting Detection for Dyslexia Using Transfer Learning [0.0] このフレームワークはトランスファーラーニングとトランスフォーマーベースのモデルを統合し、ディフレキシアに関連する手書きの特徴を識別する。
異なる言語や書記システムへの適応性は、グローバルな適用可能性を示している。
この知見は、早期発見を支援し、ステークホルダ信頼を構築し、パーソナライズされた教育戦略を可能にするフレームワークの能力を強調した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 22:40:26 GMT)
Experimental noiseless quantum amplification of coherent states of light by two-photon addition and subtraction [0.0] ノイズのない量子増幅器は、ノイズを加えることなくコヒーレントな状態の振幅を高める。
多重光子付加と減算の列は多重化に代わる効率的かつ実験的に実現可能であることを示す。
我々の実験は、走行光ビーム上の複雑な量子演算の工学的発展に向けた重要な一歩である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:36:01 GMT)
Evaluating tamper resistance of digital forensic artifacts during event reconstruction [0.0] 本稿では,イベント再構成に使用されるデータソースの改ざん抵抗を評価する枠組みを提案する。
データレジリエンスに影響を与える要因について議論し、評価のためのスコアリングシステムを導入し、ケーススタディでその応用を解説する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:32:02 GMT)
Error analysis of quantum operators written as a linear combination of permutations [0.0] 置換の線形結合とビットと位相の反転が固有値の摂動に与える影響を考察する。
線形結合の係数が正のとき、得られた行列の固有値が量子ビットフリップ誤差に耐性があることを観察する。
誤差にはあまり耐性がないが、数値的な証拠は、これらの誤差の比率が小さい場合には固有スペクトルの摂動が非常に小さいことを示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:27:10 GMT)
Equivariant Variational Quantum Eigensolver to detect Phase Transitions through Energy Level Crossings [0.0] 我々は、全スピンと翻訳対称性を保存し、一重項および三重項励起状態を正確に記述する等変量子回路を導入する。
また、ノイズが変動状態に与える影響も評価し、ゼロノイズ補間のような従来の緩和技術が物理的特性を確実に回復することを示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 13:36:51 GMT)
Equity in the Use of ChatGPT for the Classroom: A Comparison of the Accuracy and Precision of ChatGPT 3.5 vs. ChatGPT4 with Respect to Statistics and Data Science Exams [0.0] ChatGPTはこれらのプラットフォームの中で最も人気があり、有料版(ChatGPT4)と無料版(ChatGPT3.5)がある。
生成型AIプログラムの新規かつ高速なバージョンを学べない学生が、そのようなプロジェクトを書き、これらの方法を学ぶことに関して、どの程度不利であるかを判断する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:38:13 GMT)
Entropic probability and context states [0.0] 本稿では,熱力学と情報力学の両方を含むエントロピー関数を導出した,情報熱力学の公理系を提案する。
ここでは、エントロピー確率の概念をより一般的なコレクションに拡張し、貯水池と文脈状態によって状態を増強する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:43:57 GMT)
Entanglement scaling and charge fluctuations in a Fermi liquid of composite fermions [0.0] ランダウ準位が$nu=1/2$の合成フェルミ液体(CFL)は、クーロン相互作用によって純粋に放出されるパラダイム的非フェルミ液体である。
エンタングルメントエンハンスメントは$nu=1/2$だけでなく、$nu=1/4$、および$nu=1$および$nu=1/3$のボソニックCFL状態に存在することを示す。
その結果, CFL状態における非Fermi-液性相関の指紋として, 絡み合いの増大と電荷変動の抑制が確認された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:13:50 GMT)
Enhancing Persona Classification in Dialogue Systems: A Graph Neural Network Approach [0.0] 本研究では,テキスト埋め込みとグラフニューラルネットワーク(GNN)を組み合わせた効果的なペルソナ分類手法を提案する。
専用のペルソナ分類データセットがないため、モデルトレーニングと評価を容易にするために手動で注釈付きデータセットを作成します。
我々のアプローチ、特にGNNの統合は、特に限られたデータにおいて、分類性能を大幅に改善する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:27:24 GMT)
Enhancement of non-Gaussianity and nonclassicality of pair coherent states with postselected von Neumann measurement [0.0] ポストセレクトされたフォン・ノイマン測定がペアコヒーレント状態(PCS)の非古典的性質に及ぼす影響について検討する。
その結果,ポストセレクトされたフォン・ノイマン測定により,PCSの非ガウス性および非古典性の両方が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:46:51 GMT)
Enhanced Schmidt number criteria based on correlation trace norms [0.0] シュミット数 (Schmidt number) は、二部量子状態の真の絡み合い次元を表す。
任意の局所次元における密度行列のシュミット数に対する簡単な基準を導出する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:01:40 GMT)
Enhanced Facial Feature Extraction and Recignation Using Optimal Fully Dispersed Haar-like Filters [0.0] 本稿では,顔の特徴抽出と再帰性を高めるために,完全分散Haarライクなフィルタを最適に同定するアルゴリズムを提案する。
従来のHaarライクなフィルターとは異なり、これらの新しいフィルターはピクセルを画像内に自由に移動させ、複雑な局所的な特徴をより効果的に捉えることができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:22:23 GMT)
Enabling the Verification and Formalization of Hybrid Quantum-Classical Computing with OpenQASM 3.0 compatible QASM-TS 2.0 [0.0] TypeScriptに型付きQASM 3.0を実装し、検証と検証ソフトウェアの実装を可能にします。
型理論表記法におけるOpenQASM 3.0の型システムの形式的処理は、さらなる形式的検証を促進する可能性がある。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 06:13:31 GMT)
Empirical Analysis of Pull Requests for Google Summer of Code [0.0] Google Summer of Codeは、学生や新しいコントリビュータと経験豊富なメンターをマッチングして、オープンソースプロジェクトに取り組むグローバルイニシアチブである。
本研究では,Google Summer of Codeプログラム中にインターンが生成したプルリクエストの実証分析を行った。
その結果、ほとんどのタスクは、新しい機能の追加やバグ修正といったコード集約的なタスクと、ドキュメントの更新やコードベースの再構築といった非コードタスクを含むことがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:42:43 GMT)
Emergent Equilibrium in All-Optical Single Quantum-Trajectory Ising Machines [0.0] 2光子過程によって駆動され、非局所的な損失を受ける多モード光学系の力学を、ガウスレベルで量子ノイズを取り入れて検討する。
その結果, 1つのガウス量子軌道から得られた統計は, モード間の散逸結合に符号化されたイジング・ハミルトニアンによって支配される創発的な熱平衡を示すことがわかった。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:31:55 GMT)
Efficiently measuring $d$-wave pairing and beyond in quantum gas microscopes [0.0] 本稿では,フェルミオン型量子ガス顕微鏡における可観測物の幅広いクラスを測定するためのプロトコルを提案する。
このプロトコルは、大域的な制御と、そこで解決された粒子数の測定しか必要としない。
我々はさらに、格子不均一性のような実験的な不完全性に対するロバスト性のためにパルスを最適化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:58:32 GMT)
Efficient quantum algorithm to simulate open systems through a single environmental qubit [0.0] 量子コンピュータ上でのリンドブラッドマスター方程式により記述された開量子系の力学をシミュレーションする効率的なアルゴリズムを提案する。
固定精度条件下では,他の手法と比較してトロッター数を減らすことができる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:01:48 GMT)
Dual Interpretation of Machine Learning Forecasts [0.0] 我々は、(カーネル)尾根回帰、ランダム森林、隆起木、ニューラルネットワークに対して、どのように重みをシームレスに回収できるかを示す。
いずれの場合も、アプローチは新しい角度からブラックボックスを開き、機械学習モデルが履歴を部分的に繰り返して活用する方法を実証する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:44:39 GMT)
Driving of an open quantum system at finite temperature across first- and second-order quantum phase transitions [0.0] 非零温度でのクビットの開完全連結系は有限時間間隔で駆動される。
駆動は、第1および第2次量子相遷移の有限サイズの前駆体を分解された基底状態相から絡み合った基底状態相へと導く。
量子相転移に伴うパラメータ領域における熱浴の存在と、地表面に影響を及ぼす回避交差の特定のパターンと、励起状態とが相まって、ターゲット地表面状態の生成精度が著しく向上する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 12:05:41 GMT)
Diffusion map particle systems for generative modeling [0.0] 拡散写像とラプラシアン調整ワッサーシュタイン勾配勾配(LAWGD)に基づく新しい拡散写像粒子システム(DMPS)を提案する。
拡散写像は、サンプルから対応するランゲヴィン拡散過程の生成元を近似し、基礎となるデータ生成多様体を学習するために用いられる。LAWGDは、核の適切な選択を条件として、対象分布からの効率的なサンプリングを可能にする。
本手法では、オフライントレーニングや最小限のチューニングは必要とせず、適度な次元のデータセットにおいて、他の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:15:24 GMT)
Dephasing and error dynamics affecting a singlet-triplet qubit during coherent spin shuttling [0.0] 我々は,コヒーレントスピンシャットリング中の一重項量子ビットの劣化と緩和に寄与する崩壊ダイナミクスを探索する。
我々は、スピンシャットリングによる遠方量子ビットの絡み合いに対する将来の実装を奨励する指標として、シャトルの誤り率を1時間10〜4ドルから少なくとも103ドルまで見積もる。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 00:54:41 GMT)
Defect groups of class $\mathcal{S}$ theories from the Coulomb branch [0.0] クラス $mathcalS[A_N-1]$ 4d $mathcalN = 2$理論をクーロン分岐データからそれらの欠陥群を導出することにより研究する。
欠陥群が$(mathbbZ_N)2g$であり、$g$が対応する曲面の種数であることを示すために、完全正則句読点の場合、BPS quiver を明示的に構成する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:54:55 GMT)
DateLogicQA: Benchmarking Temporal Biases in Large Language Models [0.0] 本稿では,DateLogicQAについて紹介する。DateLogicQAは190の質問で,様々な日付形式,時間的文脈,推論型について紹介する。
本稿では,セマンティック・インテリティ・メトリック(Semantic Integrity Metric)を提案し,トークン化の品質を評価し,表現レベルバイアス(Representation-Level Bias)と論理レベルバイアス(Logical-Level Bias)の2つのバイアスを分析する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:25:47 GMT)
Creating an LLM-based AI-agent: A high-level methodology towards enhancing LLMs with APIs [0.0] 大規模言語モデル(LLM)は、工学と科学の様々な側面に革命をもたらした。
この論文は総合的なガイドとして機能し、アプリケーションプログラミングインタフェース(API)を活用する能力を備えたLLMの強化のための多面的アプローチを解明する。
本稿では,Hugging Faceコミュニティの小さなモデルを用いて,携帯端末の機能を活用したオンデバイスアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:14:04 GMT)
Contrastive Learning and Mixture of Experts Enables Precise Vector Embeddings [0.0] 本稿では,類似度指標として共引用を用いてニッチデータセットを組み立てることにより,科学的テキストのベクトル埋め込みを改善する。
本研究では,複数層のパーセプトロン区間を拡大し,複数の異なる専門家にコピーする,新たなMixture of Experts(MoE)拡張パイプラインを事前訓練されたBERTモデルに適用する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 20:58:26 GMT)
Continuous Patient Monitoring with AI: Real-Time Analysis of Video in Hospital Care Settings [0.0] 本研究は, 病院環境における継続的および受動的患者モニタリングのためのAI駆動型プラットフォームを提案する。
このプラットフォームは、ビデオ分析を通じて患者の行動と相互作用に関するリアルタイムな洞察を提供する。
このデータセットは11人の病院パートナーと共同で作成され、300人以上の高リスクの転倒患者を対象とする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:23:33 GMT)
ClustEm4Ano: Clustering Text Embeddings of Nominal Textual Attributes for Microdata Anonymization [0.0] この研究は、一般化と抑圧ベースの匿名化に使用できる匿名化パイプラインであるClustEm4Anoを紹介する。
これは自動的に値一般化階層(VGH)を生成し、従って、準識別子の属性を一般化することができる。
ClustEm4Anoは任意に選択されたVGHよりも多くの可能性を提供することで匿名化手順をサポートする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 08:16:04 GMT)
Closed-channel parameters of Feshbach resonances [0.0] フェシュバッハ共鳴に関連する2体の観測物は、閉じたチャネルの性質に敏感である。
これは超低温原子における全ての磁気フェシュバッハ共鳴のケースである。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 11:08:38 GMT)
Chatbots im Schulunterricht: Wir testen das Fobizz-Tool zur automatischen Bewertung von Hausaufgaben [0.0] 本研究では,ドイツのFobizz社によるAIによるグレーディングツール"AI Grading Assistant"について検討した。
ツールの数値グレードと定性的フィードバックは、しばしばランダムであり、提案が組み込まれても改善されない。
この研究は、教育における体系的な問題に対する迅速な修正としてAIを採用するというより広い傾向を批判している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:06:01 GMT)
Challenges learning from imbalanced data using tree-based models: Prevalence estimates systematically depend on hyperparameters and can be upwardly biased [0.0] 不均衡二項分類問題は、多くの研究分野において発生する。
モデルのトレーニングのための(より)バランスのとれたデータセットを作成するために、多数派のクラスをサブサンプルするのが一般的です。
これは、モデルが新しいデータと同じデータ生成プロセスに従わないデータセットから学習するため、モデルの予測をバイアスする。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:38:29 GMT)
Bound of Casimir Effect by Holography [0.0] ゴーストフリーホログラフィックモデルはカシミール効果の普遍的な下界を課す。
注目すべきは、ホログラフィック境界は共形対称性を持たない場の量子論の一般クラスによって従うことである。
カシミール効果のホログラフィック境界に対する場の理論的な証明や反例を見つけることは興味深い。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 23:22:05 GMT)
Black Hole Multi-Entropy Curves [0.0] 蒸発ブラックホールの絡み合い構造とホーキング放射について検討した。
これらの構成の多エントロピーを用いて、ブラックホール多エントロピー曲線を定義する。
この曲線は、ブラックホールの蒸発中にマルチエントロピーがどう変化するかを記述する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 07:18:00 GMT)
Black Box Work Extraction and Composite Hypothesis Testing [0.0] ブラックボックスワーク抽出は、量子熱力学において最も中心的なプロセスの1つである。
ブラックボックス設定における最適抽出作業は,複合仮説テストタスクの性能によって完全に特徴づけられることを示す。
また、この物理環境では、合成仮説が特定の相関を含む新しい量子シュタインの補題も示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:09:44 GMT)
Assessment of the application of the Universal Competencies [0.0] ユニバーサル・コンピテンシーの実践的応用に関する普遍的な評価はない。
この研究の主な考え方は、普遍的な能力の応用に関する一般的な評価である。
積分指標は、ユニバーサルコンピテンシーの適用に関する普遍的な評価である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:00:29 GMT)
Assessing fault-tolerant quantum advantage for $k$-SAT with structure [0.0] 量子バックトラックとグローバーのアルゴリズムが2023年のSAT大会のメイントラック勝者に対して有する可能性を評価する。
以上の結果から,より構造化された$k$-SAT解決における実用的な量子スピードアップの可能性は限定的であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:06:38 GMT)
Approximation by Steklov Neural Network Operators [0.0] 本稿では,ニューラルネットワーク演算子の新バージョンであるSteklov Neural Network演算子を紹介する。
我々は、一意収束や一様収束など、族に対する収束定理(英語版)を得る。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:09:40 GMT)
Anomalous discharging of quantum batteries: the ergotropic Mpemba effect [0.0] 量子バッテリの文脈で、Mpemba効果の新たなシグネチャが見つかる。
具体的には、単一ボソニックモードで符号化された量子電池を、ユニタリガウス演算を用いて充電する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 19:00:02 GMT)
An algorithm for determining the state of a non-stationary dynamic system for assessing fire safety control in an enterprise by the method of integrated indicators [0.0] 企業における火災安全管理を評価するアルゴリズムには,積分指標の手法が用いられている。
本研究は,企業状態を表す積分指標の値に有意な変化を示した。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:55:12 GMT)
An Ad-hoc graph node vector embedding algorithm for general knowledge graphs using Kinetica-Graph [0.0] 本稿では,知識グラフ表現から一般的なグラフノードの埋め込みを生成する方法について論じる。
埋め込み空間は、局所親和性とリモート構造関連性の両方を模倣するいくつかのサブ機能から構成される。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 16:25:06 GMT)
All non-Gaussian states are advantageous for channel discrimination: Robustness of non-convex continuous variable quantum resources [0.0] 有限次元資源理論において非ガウス状態の混合に一般化する。
これは、マルチコピーチャネル識別タスクにおける最大優位性に上限を与える。
多くの関連する理論において、チャネル分解状態の最悪のコピーを凸部分集合に定量化する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 15:32:59 GMT)
Agnosticism About Artificial Consciousness [0.0] 人工意識の展望について唯一正当化できるスタンスは、無知主義である、と私は主張する。
主な違いは、人工的な意識を知覚する生物学的視点と、それに共感する機能的視点の間にある。
どちらのキャンプも、証拠が教えてくれるものを過大評価するのと同じ過ちを犯していると私は主張する。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 18:11:12 GMT)
Agentic AI-Driven Technical Troubleshooting for Enterprise Systems: A Novel Weighted Retrieval-Augmented Generation Paradigm [0.0] 本稿では,企業の技術的トラブルシューティングに適したRAG(Weighted Retrieval-Augmented Generation)フレームワーク上に構築されたエージェントAIソリューションを提案する。
製品マニュアル、内部知識ベース、FAQ、トラブルシューティングガイドなどの検索ソースを動的に重み付けすることで、最も関連性の高いデータを優先順位付けする。
大規模エンタープライズデータセットに関する予備評価では、トラブルシューティングの精度を改善し、解決時間を短縮し、さまざまな技術的課題に適応する上で、フレームワークの有効性が示されている。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:02:27 GMT)
A simple DNN regression for the chemical composition in essential oil [0.0] そこで本研究では, 化学組成に基づくDNNレジストレータを3つ構成し, 精油特性の予測を行った。
データセットのサイズが小さいため過度に適合しているにもかかわらず、この研究ではすべてのモデルが効果的に訓練された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:15:30 GMT)
A note on the holographic time-like entanglement entropy in Lifshitz theory [0.0] 三次元リフシッツ時空の境界理論におけるホログラフィック時間的絡み合いエントロピー(TEE)について検討する。
異なるホログラフィックの提案は、LifshitzバックグラウンドのTEEに同じ結果を与える。
さらに,Lifshitz系のTEEは,異方性パラメータに依存する実部と虚部を含むことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 09:28:40 GMT)
A Scalable Approach to Benchmarking the In-Conversation Differential Diagnostic Accuracy of a Health AI [0.0] 本研究では、健康AIシステムを評価するためのスケーラブルなベンチマーク手法を提案する。
提案手法では,14の専門分野に400の検証済み臨床ヴィグネットを用いて,現実的な臨床行為をシミュレートするためにAIを利用した患者アクターを用いた。
8月は81.8%(327/400件)の診断精度、85.0%(340/400件)のトップ2の診断精度を達成し、従来の症状チェッカーを上回った。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 05:02:33 GMT)
A Quantum Annealing Protocol to Solve the Nuclear Shell Model [0.0] 我々は、大きなギャップを保ち、ベースサイズが最大105ドルの12のセットアップで我々のアプローチを検証する調整されたドライバーハミルトンを提案する。
核ハミルトニアンは非局所的であり、現在の設定では実装が困難であるが、推定計算コストは多体ベースサイズでは困難である。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 17:48:18 GMT)
A Novel Machine Learning Classifier Based on Genetic Algorithms and Data Importance Reformatting [0.0] データの性質に関わる問題を克服するためにGADICという遺伝的アルゴリズムが提案されている。
GADICはデータ再構成、トレーニング、テストの3つのフェーズで構成されている。
GADICは様々なデータセットを用いたほとんどのML分類器の性能を大幅に向上させた。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 21:54:55 GMT)
A Framework for Critical Evaluation of Text-to-Image Models: Integrating Art Historical Analysis, Artistic Exploration, and Critical Prompt Engineering [0.0] 本稿では,テキスト・ツー・イメージ・モデルの批判的評価のための新たな学際的枠組みを提案する。
アート・ヒストリカル・アナリティクス、芸術的な探究、重要なプロンプト・エンジニアリングを統合することで、このフレームワークはこれらのモデルの能力と社会的意味についてより微妙な理解を提供する。
ケーススタディは、このフレームワークの実践的応用を実証し、性別、人種、文化的表現に関連するバイアスを明らかにする方法を示している。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 10:35:27 GMT)
"Clustering and Conquer" Procedures for Parallel Large-Scale Ranking and Selection [0.0] 並列コンピューティングにおいてよく使われる「分割と征服」フレームワークを,相関に基づくクラスタリングのステップを追加して修正する。
この一見単純な修正は、$mathcalO(p)$サンプルの複雑さの減少率を達成することができる。
ニューラルネットワーク探索のような大規模AIアプリケーションでは,本手法は優れた性能を示す。
論文参考訳(メタデータ) (Tue, 17 Dec 2024 14:02:24 GMT)