Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking [124.7] HaluSearchは、ツリー検索ベースのアルゴリズムを組み込んだ新しいフレームワークである。
テキスト生成をステップバイステップの推論プロセスとしてフレーム化する。
認知科学における二重プロセス理論に着想を得た階層的思考システムスイッチ機構を導入する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:29:37 GMT)
VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction [104.4] 視覚情報と音声情報の両方を段階的に学習する多段階学習手法を提案する。
提案手法は, 視覚言語能力の強化だけでなく, 音声音声対話の効率向上にも寄与する。
画像, ビデオ, 音声タスクのベンチマークにおいて, 我々の手法を最先端の手法と比較することにより, モデルが強い視覚と音声の両機能を備えていることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:59:52 GMT)
Virgo: A Preliminary Exploration on Reproducing o1-like MLLM [89.5] スロー思考推論システムは、推論中の思考時間をスケールすることで、広く注目を集めている。
マルチモーダル大規模言語モデル(MLLM)への適応にも関心が高まっている。
本稿では,少量のテキスト長文思考データを用いて,有能なMLLMを微調整することで,簡単なアプローチを探索する。
自然言語で表現されたこれらの長文推論プロセスは,MLLMに効果的に転送できることがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:14:16 GMT)
Agent Planning with World Knowledge Model [88.5] エージェント計画を容易にするためにパラメトリック世界知識モデル(WKM)を導入する。
我々はWKMを開発し,グローバルプランニングと動的状態知識を指導し,地域プランニングを支援する。
本手法は, 各種の強靭なベースラインと比較して, 優れた性能が得られる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:44:55 GMT)
2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining [86.8] 本稿では,VLM事前学習のための基礎知識を充実させた高品質な教科書コーパスについて紹介する。
2.5年以上の授業ビデオを集め、クラス時間は22,000時間である。
ビデオ中心の教科書は、それと比較すると、より一貫性のあるコンテキスト、より豊かな知識、より優れた画像テキストアライメントを提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:25:27 GMT)
SVFR: A Unified Framework for Generalized Video Face Restoration [86.2] 顔復元(FR)は画像およびビデオ処理において重要な領域であり、劣化した入力から高品質な肖像画を再構成することに焦点を当てている。
本稿では,映像BFR,インペイント,カラー化タスクを統合した汎用映像顔復元タスクを提案する。
この研究は、ビデオFRにおける最先端技術を進め、一般化されたビデオ顔の復元のための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:26:32 GMT)
Conservation-informed Graph Learning for Spatiotemporal Dynamics Prediction [84.3] 本稿では,保護インフォームドGNN(CiGNN)について紹介する。
このネットワークは、保守的かつ非保守的な情報が、潜時的行進戦略によって多次元空間を通過する対称性による一般的な対称性保存則に従うように設計されている。
結果は,CiGNNが顕著なベースライン精度と一般化性を示し,様々な時間的ダイナミクスの予測のための学習に容易に適用可能であることを示した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:50:03 GMT)
Free-Form Motion Control: A Synthetic Video Generation Dataset with Controllable Camera and Object Motions [78.7] 自由形運動制御のための合成データセット(SynFMC)を提案する。
提案したSynFMCデータセットは、さまざまなオブジェクトと環境を含み、特定のルールに従ってさまざまな動きパターンをカバーしている。
さらに,物体とカメラの動きの独立的あるいは同時制御を可能にするFMC(Free-Form Motion Control)を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:42:56 GMT)
Cold-Start Recommendation towards the Era of Large Language Models (LLMs): A Comprehensive Survey and Roadmap [78.3] コールドスタート問題は、リコメンデータシステムにおける長年の課題のひとつだ。
インターネットプラットフォームの普及とユーザやアイテムの指数的な成長により、コールドスタートレコメンデーション(CSR)の重要性が増している。
本稿では、CSRのロードマップ、関連文献、今後の方向性について、包括的なレビューと議論を行う。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:51:18 GMT)
Metadata Conditioning Accelerates Language Model Pre-training [76.5] 本稿では,Metadata Conditioning then Cooldown (MeCo) と呼ばれる新しい手法を提案する。
MeCoはまず、トレーニング中にテキストと一緒にメタデータを提供し、後に標準テキストのみのフェーズを使用して、メタデータなしでモデルが正常に機能できるようにする。
MeCoは驚くほどシンプルで、計算オーバーヘッドを追加せず、より有能でステアブルな言語モデルを生成するという約束を示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:59:23 GMT)
LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks [75.0] 本稿では,LongBench v2を提案する。LongBench v2は,LLMが長期コンテキスト問題に対処する能力を評価するためのベンチマークである。
LongBench v2は、503の挑戦的な複数選択の質問で構成され、コンテキストは8kから200M語で、6つの主要なタスクカテゴリにまたがる。
我々は、品質と難易度を維持するために、自動レビュープロセスと手動レビュープロセスの両方を使用し、その結果15分間の制約の下で、人間の専門家は53.7%の精度しか達成できなかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:44:51 GMT)
Metric3Dv2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.3] Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。
距離深度推定と表面正規度推定の両方の解を提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:39:16 GMT)
Disentangling Speakers in Multi-Talker Speech Recognition with Speaker-Aware CTC [73.2] マルチトーカー音声認識は、重複する音声を遠ざけ、書き起こす際、独特な課題に直面している。
本稿では,MTASRにSOT(Serialized Output Training)を取り入れた場合の話者の絡み合いにおける接続性時間分類(CTC)の役割について検討する。
本研究では,ベイズリスクCTCフレームワークに基づく話者認識型CTC(SACTC)学習目標を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:36:25 GMT)
ACE: Anti-Editing Concept Erasure in Text-to-Image Models [73.0] 既存の概念消去手法は、削除された概念がプロンプトから生成されるのを防ぐために優れた結果が得られる。
本稿では、生成時にターゲット概念を消去するだけでなく、編集時に除去する反編集概念消去(ACE)手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:57:27 GMT)
Few-shot Implicit Function Generation via Equivariance [71.0] Inlicit Neural Representations (INR) は、連続的な信号を表現するための強力なフレームワークとして登場した。
インプリシット関数生成は、いくつかの例から多様だが機能的に一貫したINR重みを生成することを目的としている。
限られたデータから新しいINRを生成するフレームワークであるEquiGenを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:23:55 GMT)
CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings [71.0] LiveCodeBenchやUSACOといった既存のベンチマークは、プライベートテストケースの可用性の欠如、特別な審査員のサポートの欠如、不整合実行環境のために不足している。
CodeEloは標準化された競合レベルのコード生成ベンチマークで、これらすべての課題に初めて効果的に対処する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:36:12 GMT)
AVTrustBench: Assessing and Enhancing Reliability and Robustness in Audio-Visual LLMs [70.5] 我々は9つの細工されたタスクにまたがる600万のサンプルからなるAudio-Visual Trustworthiness Assessment Benchmark (AVTrustBench)を紹介する。
ベンチマークを用いて、13の最先端AVLLMを広範囲に評価した。
その結果、既存のモデルのほとんどは、人間のような理解を達成できないことが判明した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:03:24 GMT)
Classifier-Guided Captioning Across Modalities [69.8] 本稿では,音声キャプションにおける可聴性の獲得など,代替設定のセマンティクスにキャプションネットワークを適用する手法を提案する。
本フレームワークは, (i) 言語モデル(LM)を組み込んだ冷凍キャプションシステムと, (ii) キャプションシステムを案内するテキスト分類器の2つの主要コンポーネントから構成される。
特に、既存のゼロショット音声キャプションシステムと組み合わせることで、その品質を改善し、ゼロショット音声キャプションにおける最先端の性能を設定する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:09:26 GMT)
Reflections from the 2024 Large Language Model (LLM) Hackathon for Applications in Materials Science and Chemistry [69.0] 材料科学・化学分野における応用のための第二大言語モデル(LLM)ハッカソンの結果について述べる。
このイベントは、グローバルなハイブリッドな場所を巡って参加者が参加し、34チームが応募した。
提出は7つの主要なアプリケーション領域にまたがって行われ、アプリケーションのためのLLMの多種多様な実用性を実証した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 01:55:35 GMT)
The Essence of Contextual Understanding in Theory of Mind: A Study on Question Answering with Story Characters [67.6] 理論・オブ・ミンド(ToM)は、人間が他者の精神状態を理解し解釈することを可能にする。
本稿では,ToMにおける長期的個人的背景を理解することの重要性を検証する。
現実的な評価シナリオにおける機械のToM能力の評価を行う。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:04:45 GMT)
Mitigating Hallucination for Large Vision Language Model by Inter-Modality Correlation Calibration Decoding [66.1] 大規模視覚言語モデル(LVLM)は、下流のマルチモーダルタスクに対する視覚言語理解において顕著な能力を示している。
LVLMは、複雑な生成タスクにおいて幻覚を生じさせ、視覚入力と生成されたコンテンツの間に矛盾が生じている。
本研究では,LVLMにおける幻覚を無訓練で緩和するIMCCD法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:56:28 GMT)
On the Statistical Complexity for Offline and Low-Adaptive Reinforcement Learning with Structures [63.4] 本稿では、オフラインおよび低適応環境における強化学習(RL)の統計的基礎に関する最近の進歩を概観する。
まず最初に、オフラインRLが、RLを使用する最近のAIブレークスルーとは無関係であっても、ほぼすべての実生活のML問題に対して適切なモデルである理由について議論する。
オフラインポリシー評価(OPE)とオフラインポリシー学習(OPL)という,オフラインRLの基本的な2つの問題に展開する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:27:53 GMT)
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment [62.7] VideoLifterは、ビデオシーケンスから直接、グローバルスパースから高密度な3D表現に漸進的に最適化する新しいフレームワークである。
フレームやフラグメント間のスパースポイント対応の追跡と伝播によって、VideoLifterはカメラのポーズと3D構造を徐々に洗練する。
このアプローチは、視覚的忠実度と計算効率において、現在の最先端の手法を超越しながら、トレーニング時間を82%以上短縮する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:52:36 GMT)
Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models [62.1] Auto-RTは、複雑な攻撃戦略を探索し最適化する強化学習フレームワークである。
探索効率を大幅に改善し、攻撃戦略を自動的に最適化することにより、Auto-RTはボーダの脆弱性範囲を検出し、検出速度が速く、既存の方法と比較して16.63%高い成功率を達成する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:30:14 GMT)
DreamMask: Boosting Open-vocabulary Panoptic Segmentation with Synthetic Data [61.6] オープンな語彙設定でトレーニングデータを生成する方法と、実データと合成データの両方でモデルをトレーニングする方法を探索するDreamMaskを提案する。
一般的に、DreamMaskは大規模なトレーニングデータの収集を著しく単純化し、既存のメソッドのプラグイン・アンド・プレイ・エンハンスメントとして機能する。
例えば、COCOで訓練しADE20Kで試験すると、ドリームマスクを装備したモデルは以前の最先端の2.1% mIoUよりも優れていた。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:00:00 GMT)
Uncertainty-Aware Label Refinement on Hypergraphs for Personalized Federated Facial Expression Recognition [59.0] 我々はhYpergraphs (AMY) 法に基づく新しい不確実性認識ラベルリファレントを開発する。
ローカルトレーニングでは、各ローカルモデルは、バックボーン、不確実性推定(UE)ブロック、および式分類(EC)ブロックで構成される。
次に、ローカルクライアントにおける標本の不確実性重みを推定するために、パーソナライズされた不確実性推定器を導入する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:59:21 GMT)
Interpretable Face Anti-Spoofing: Enhancing Generalization with Multimodal Large Language Models [58.9] 顔認識システムのセキュリティと信頼性を確保するためには,FAS(Face Anti-Spoofing)が不可欠である。
I-FAS(Interpretable Face Anti-Spoofing)と呼ばれるFASのためのマルチモーダルな大規模言語モデルフレームワークを提案する。
本稿では,FAS画像の高品質なキャプションを生成するために,Spof-Aware Captioning and Filtering(SCF)戦略を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:25:04 GMT)
NNsight and NDIF: Democratizing Access to Open-Weight Foundation Model Internals [58.8] NNsightとNDIFは、非常に大きなニューラルネットワークの科学的研究を可能にするために、タンデムで機能する技術である。
NNsightは、遅延リモート実行を導入するためにPyTorchを拡張したオープンソースのシステムである。
NDIFは、NNsightリクエストを実行するスケーラブルな推論サービスで、GPUリソースと事前トレーニングされたモデルを共有することができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:06:56 GMT)
Instruction-Following Pruning for Large Language Models [58.3] 我々は、モデルに対する固定的なプルーニングマスクを決定する従来の静的プルーニングアプローチを超えて移動する。
本手法では,プルーニングマスクは入力依存型であり,ユーザ命令に記述された情報に基づいて動的に適応する。
我々の手法は「命令追従プルーニング」と呼ばれ、ユーザ命令を入力とし、与えられたタスクに対して最も関連性の高いモデルパラメータを動的に選択するスパースマスク予測器を導入している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:19:14 GMT)
SDPO: Segment-Level Direct Preference Optimization for Social Agents [57.0] 大規模言語モデル(LLM)を利用した社会エージェントは、人間の社会的振る舞いをシミュレートできるが、複雑な目標指向の社会対話を扱うには不十分である。
トレーニングノイズを最小限に抑えつつ,マルチターンエージェントの動作を最適化するために,Segment-Level Direct Preference Optimization (SDPO)を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:09:46 GMT)
On the Multi-modal Vulnerability of Diffusion Models [56.1] 本稿では,MMP-Attackによる拡散モデル生成結果の操作について,特定の接尾辞を元のプロンプトに付加することで提案する。
我々のゴールは、拡散モデルを誘導し、元のオブジェクトを同時に除去しながら特定のオブジェクトを生成することである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:36:11 GMT)
DreamDrive: Generative 4D Scene Modeling from Street View Images [55.5] 生成と再構成の利点を組み合わせた4次元時空間シーン生成手法であるDreamDriveを提案する。
具体的には,映像拡散モデルの生成力を利用して,映像参照のシーケンスを合成する。
次に、ガウシアンスプラッティングで3D一貫性のあるドライビングビデオをレンダリングします。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:06:37 GMT)
OmniFlatten: An End-to-end GPT Model for Seamless Voice Conversation [53.7] エンド・ツー・エンドのGPTベースモデルであるOmniFlattenは、低レイテンシで自然な会話に固有の複雑な振る舞いを効果的にモデル化することができる。
提案手法は, 簡便なモデリング手法と, より効率的かつ自然な対話システムを構築するための研究の方向性を提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:15:58 GMT)
HLV-1K: A Large-scale Hour-Long Video Benchmark for Time-Specific Long Video Understanding [52.7] 我々は、長時間ビデオ理解モデルを評価するために、大規模な時間長ビデオベンチマークHLV-1Kを構築した。
HLV-1Kは、高品質質問応答(QA)とマルチチョイス質問応答(MCQA)を備えた1009時間ビデオからなる。
我々は,既存の最先端手法を用いてベンチマークを評価し,様々なレベルでの深層ビデオ理解能力をテストすることの価値を実証した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:32:37 GMT)
EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation [52.3] 本稿では,ロボット操作タスクに特化して設計された将来宇宙開発のための包括的フレームワークを提案する。
本稿では,一括一方向生成パラダイムと組み合わさったスパースメモリコンテキストを提案し,無限長列の生成を可能にする。
マルチカメラ観測の禁止コストと労働強度に対処するため,4次元ガウススプラッティング(4DGS)と生成モデルを統合したデータエンジンパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:00:33 GMT)
Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations [52.1] 公共の安全のためには、自動X線禁止アイテム検出が不可欠である。
既存のディープラーニングベースの手法はすべて、X線画像のトレーニングのアノテーションが正しいことを前提としている。
ラベル対応混合パッチペースト増量法(Mix-Paste)を提案する。
我々は,ノイズの多いアノテーションの下で,X線データセット上での手法の優位性を示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:51:51 GMT)
Turning Logic Against Itself : Probing Model Defenses Through Contrastive Questions [51.5] 非倫理的反応を誘発する対照的な推論を利用したジェイルブレイク手法であるPOATEを導入する。
POATEは意味論的に反対の意図でプロンプトを生成し、敵テンプレートと組み合わせて有害な応答を生成するためのモデルを微妙に指示する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:40:03 GMT)
Look Back for More: Harnessing Historical Sequential Updates for Personalized Federated Adapter Tuning [50.5] 既存のパーソナライズド・フェデレーション・ラーニング(PFL)アプローチは、クライアントの最新モデルにのみ依存する。
FLの基盤モデルを微調整するアダプタをパーソナライズするために設計されたpFedSeqを提案する。
pFedSeqでは、サーバはシーケンシャルな学習者をメンテナンスし、訓練し、クライアントからの過去のアダプタ更新のシーケンスを処理する。
以前の更新に隠されたクロスクライアントとクロスステップの関係を効果的にキャプチャするために、pFedSeqは強力な選択状態空間モデルを採用している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:10:09 GMT)
Learning Chemical Reaction Representation with Reactant-Product Alignment [50.3] RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:55:38 GMT)
EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference [49.9] 本稿では,既存の並列処理方式を超越したMoE用パイプラインスケジューラであるEPS-MoEを紹介する。
その結果,既存の並列推論手法と比較して,プリフィルスループットは52.4%向上した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:19:14 GMT)
Multi-Label Contrastive Learning : A Comprehensive Study [48.8] マルチラベルの分類は、研究と産業の両方において重要な領域として現れてきた。
対照的な学習をマルチラベル分類に適用することは、ユニークな課題である。
多様な環境における多ラベル分類のためのコントラスト学習損失の詳細な研究を行う。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:10:09 GMT)
Nearly Linear Sparsification of $\ell_p$ Subspace Approximation [47.8] $ell_p$ 部分空間近似問題のNP硬度に対処する一般的なアプローチは、強いコアセットを計算することである。
我々は、$ell_p$部分空間近似に対して、ランクパラメータ$k$にほぼ最適に依存する強いコアセットを構築するための最初のアルゴリズムを得る。
我々の手法は、オフライン設定と同様のバウンダリを持つ$ell_p$サブスペース近似のための、ほぼ最適に近いオンライン強力なコアセットにも繋がる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:59:39 GMT)
John Ellipsoids via Lazy Updates [47.8] 近似したジョン楕円体を$d$次元の$n$ポイントで計算するためのより高速なアルゴリズムを与える。
精度の高いレバレッジスコアの計算を遅らせることで,このアルゴリズムを著しく高速化できることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:17:55 GMT)
Multi-modal classification of forest biodiversity potential from 2D orthophotos and 3D airborne laser scanning point clouds [47.7] 本研究では,2次元正光線と3次元空中レーザースキャン(ALS)点群からの深層学習に基づく近距離センシングデータの融合により,生物多様性の評価が向上するかどうかを検討する。
デンマークの温帯森林から採取した44.378個の正光とALS点雲のサンプルからなるBioVistaデータセットを紹介した。
深層ニューラルネットワーク(直視用ResNetとALS点雲用PointResNet)を用いて、各データモダリティの森林生物多様性ポテンシャルを評価する能力を調べ、それぞれ69.4%と72.8%の精度を達成した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:42:25 GMT)
Knowledge Circuits in Pretrained Transformers [47.3] 現代の大言語モデルが知識をいかに保存するかという内部的な研究は、長い間、研究者の間で激しい関心と調査の対象となっていた。
本稿では,言語モデルのグラフを掘り下げて,特定の知識を明確にするための知識回路を明らかにする。
これらの知識回路に対する現在の知識編集技術の影響を評価し,これらの編集手法の機能や制約についてより深い知見を提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:41:37 GMT)
Enhancing Table Recognition with Vision LLMs: A Benchmark and Neighbor-Guided Toolchain Reasoner [47.1] 我々は、非構造化テーブルを認識するための訓練不要推論パラダイムとして、視覚大言語モデル(VLLM)を採用している。
低画質の入力画像の問題を軽減するために,Nighbor-Guided Toolchain Reasoner (NGTR) フレームワークを提案する。
提案手法は,バニラVLLMの認識能力を著しく向上させる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:22:52 GMT)
Digital twins in tourism: a systematic literature review [45.5] 本稿では,観光関連分野におけるデジタルツインニング(DT)技術の現状について述べる。
3つの主要な科学データベースから34のピアレビュー研究が選択された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:26:33 GMT)
A Comprehensive Study of Structural Pruning for Vision Models [45.2] PruningBenchと呼ばれる、構造的プルーニングのための最初の総合的なベンチマークを提示する。
PruningBenchは、多様な構造的プルーニング技術の有効性を評価するために、統一的で一貫したフレームワークを使用している。
オンラインプルーニングプラットフォーム http://pruning.azoo.cn で、プルーニングタスクをカスタマイズし、すべての結果をこの論文で再現する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:58:06 GMT)
Can Transformers Do Enumerative Geometry? [45.0] 計算列挙幾何に対する Transformer ベースのアプローチを提案する。
交差点番号は10-45ドルから1045ドルまでの範囲で計算します。
我々はトランスフォーマーの列挙型「世界モデル」を探求する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:21:20 GMT)
Seeing the Unseen: Learning Basis Confounder Representations for Robust Traffic Prediction [44.8] 交通予測はインテリジェント交通システムと都市コンピューティングにとって不可欠である。
各種統計・深層学習手法を用いて, 過去の交通データXと将来の交通状況Yの関係を確立することを目的とする。
X -> Y の関係は、しばしば X と Y の両方に同時に影響を与える外部共同設立者の影響を受けている。
既存のディープラーニングトラフィック予測モデルでは、共同創業者の問題に対処するために、古典的なフロントドアとバックドアの調整が採用されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:19:55 GMT)
Age-Based Device Selection and Transmit Power Optimization in Over-the-Air Federated Learning [44.0] オーバー・ザ・エア・フェデレーション・ラーニング(FL)は、コミュニケーション効率を高める能力において大きな注目を集めている。
特に、FLでストラグラーデバイスを無視すると、モデル更新の公平性が低下し、あるデバイスのデータに対するグローバルモデルのバイアスが増幅される可能性がある。
本稿では、トラグラー装置の適切な参加を保証し、効率的なトレーニング性能を維持し、タイムリーな更新を保証する共同装置選択および送信電力最適化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:27:13 GMT)
AL-QASIDA: Analyzing LLM Quality and Accuracy Systematically in Dialectal Arabic [43.0] 方言アラビア(DA)の品種は、言語技術、特に大きな言語モデル(LLM)によって不足している。
本研究では,LLMのDAモデリング能力を,忠実度,理解度,品質,威厳の4次元にわたって評価するフレームワークを提案する。
評価の結果, LLMはDAを生成せず, DAが貧弱であるためではなく, DAを生成できないため, DAを生成できないことが示唆された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:04:48 GMT)
EventHallusion: Diagnosing Event Hallucinations in Video LLMs [39.7] MLLM(Multimodal Large Language Models)はビデオ理解の分野で大きな進歩を遂げている。
本稿では,イベントに対するビデオLLMの幻覚を評価する新しいベンチマークであるEventHallusionを提案する。
また,ビデオLLMの幻覚化問題に対処するため,TCD(Temporal Contrastive Decoding)と呼ばれるシンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:57:17 GMT)
Compressed Domain Prior-Guided Video Super-Resolution for Cloud Gaming Content [39.6] 本稿では,圧縮ゲームビデオコンテンツにおけるSR問題に対処するため,CPGSR (Coding Prior-Guided Super-Resolution) と呼ばれる軽量ネットワークを提案する。
ビデオ符号化における量子化に着想を得て,高頻度情報の保存に焦点を合わせるために,分割された焦点周波数損失を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:01:36 GMT)
GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models [39.5] 2次元視覚言語モデル(VLM)は、画像テキスト理解タスクにおいて大きな進歩を遂げている。
近年の進歩は、3Dポイントクラウドとマルチビューイメージを入力として活用し、有望な結果をもたらしている。
人間の知覚にインスパイアされた、純粋に視覚に基づくソリューションを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:30:16 GMT)
MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation [39.3] 音声アバターの生成は、正確な音声同期において大きな進歩を遂げた。
現在の手法は、単一の基本的な感情表現をモデル化するフレームワークの欠如など、基本的な課題に直面している。
本研究では,6つの基本的な感情を分離し,特異な感情状態と複合的な感情状態の両方を正確に合成する混合感情エキスパートモデルを提案する。
DH-FaceEmoVid-150データセットと組み合わせて、複雑な感情表現とニュアンスのある顔の詳細を生成するのにMoEEフレームワークが優れていることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:43:21 GMT)
Cross-View Geo-Localization with Street-View and VHR Satellite Imagery in Decentrality Settings [39.3] Cross-View Geo-Localizationは、ストリートビュークエリ画像とジオタグ付き空中ビュー参照画像とを一致させる。
分散性はより深い調査を保証する重要な要因であり、より大規模な分散性は局所化効率を大幅に改善できるが、局所化精度の低下のコストがかかる。
DReSSは、広い地理的範囲と多様な景観を持つクロスビューなジオローカライゼーションを評価するために設計された、新しいデータセットである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:48:03 GMT)
Listening and Seeing Again: Generative Error Correction for Audio-Visual Speech Recognition [39.2] 「我々はAVSRのための新しいGERパラダイム、AVGERを提案し、それを聴いて再び見るという概念に従っている。」
AVGERは、現在の主流のAVSRシステムと比較して、ワードエラー率(WER)を24%削減できる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:51:14 GMT)
Prompting Disentangled Embeddings for Knowledge Graph Completion with Pre-trained Language Model [36.4] グラフ構造とテキスト情報の両方が知識グラフ補完(KGC)において重要な役割を果たす
本稿では, PDKGCと呼ばれる新しいKGC手法を提案し, ハードタスクプロンプトとアンタングル構造プロンプトの2つのプロンプトを提案する。
2つのプロンプトにより、PDKGCはテキスト予測器と構造予測器をそれぞれ構築し、それらの組み合わせはより包括的なエンティティ予測をもたらす。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:16:52 GMT)
Dissecting the Failure of Invariant Learning on Graphs [36.1] 本研究では、2つの顕著な不変学習法の性能を理論的に判別する構造因果モデル(SCM)を開発した。
我々は,同じクラスに設定されたクロス環境表現をアライメントすることで,突発的特徴を明示的に排除する,クロス環境内アライメント(CIA)を提案する。
さらに、隣接ラベルの分布を利用してノード表現を選択的に整列させるCIA-LRA(Localized Reweighting Alignment)を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:55:51 GMT)
Flow Priors for Linear Inverse Problems via Iterative Corrupted Trajectory Matching [35.8] 本稿では,MAP推定器を効率的に近似する反復アルゴリズムを提案し,様々な線形逆問題の解法を提案する。
本アルゴリズムは,MAPの目的を局所MAP'の目的の和で近似できるという観測によって数学的に正当化される。
我々は,超解法,デブロアリング,インペイント,圧縮センシングなど,様々な線形逆問題に対するアプローチを検証する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:24:36 GMT)
Learning from Ambiguous Data with Hard Labels [34.1] 現実世界のデータには、共通のシングル・ハード・ラベル・アノテーションのパラダイムが無視する固有の曖昧さがしばしば含まれている。
硬いラベルを持つあいまいなデータを用いた標準的なトレーニングは、過度に自信過剰なモデルを生み出し、その結果、一般化が不十分になる可能性がある。
我々はこの問題を軽減するために、Quantized Label Learning(QLL)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:54:49 GMT)
GoBERT: Gene Ontology Graph Informed BERT for Universal Gene Function Prediction [33.4] BERT(GoBERT)を用いた遺伝子オントロジーグラフとアノテーションの探索により,遺伝子機能予測問題に取り組むことを提案する。
2つのプレトレインタスクは、関数の明示的および暗黙的な関係をキャプチャするために、GoBERTを共同で訓練するように設計されている。
GoBERTは、既知の機能アノテーションに基づいて、様々な遺伝子および遺伝子産物の新規機能を予測する能力を持っている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:02:50 GMT)
EventSum: A Large-Scale Event-Centric Summarization Dataset for Chinese Multi-News Documents [32.6] イベント中心多文書要約(ECS)タスクは、複数の関連するニュース文書に基づいて、所定のイベントの簡潔で包括的な要約を生成することを目的としている。
EventSumデータセットを構築し,5,100件のイベントと57,984件のニュースドキュメントを含む。
我々は、イベントリコール、Argument Recall、Causal Recall、Temporal Recallなどの特定のメトリクスを、対応する計算方法とともに設計し、評価を行った。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:18:19 GMT)
Merging Context Clustering with Visual State Space Models for Medical Image Segmentation [32.6] 既存のViMモデルにコンテキストクラスタリングモジュールを組み込んだコンテキストクラスタリングViM(CCViM)を導入する。
提案手法は,医用画像分割作業における空間的文脈表現の強化を効果的に行う。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:25:30 GMT)
PolypDB: A Curated Multi-Center Dataset for Development of AI Algorithms in Colonoscopy [32.2] PolypDBは、3934の静止ポリプイメージと、実際の大腸内視鏡ビデオから対応する地上真実を含む、大規模な公開データセットである。
PolypDBは、ブルーライトイメージング(BLI)、フレキシブルイメージングカラーエンハンスメント(FICE)、リンクカラーイメージング(LCI)、ナローバンドイメージング(NBI)、ホワイトライトイメージング(WLI)の5つのモードからなる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:47:39 GMT)
CoT-based Synthesizer: Enhancing LLM Performance through Answer Synthesis [32.0] 本稿では,CoTをベースとした新しい推論スケーリング戦略であるSynthesizerを提案する。
複数の候補応答から相補的な情報を解析することにより、優れた回答を合成する。
その結果,Llama3-8Bは11.8%,GPT-4oは10.3%向上した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:50:06 GMT)
Ingredients: Blending Custom Photos with Video Diffusion Transformers [31.7] texttIngredientsは、複数のID写真を含むビデオ作成をカスタマイズするフレームワークである。
本手法は3つの主要モジュールから構成される: (textbfi) グローバル・ローカル・パースペクティブおよびローカル・パースペクティブ・パースペクティブの両面から、多目的かつ正確な顔の特徴を抽出する顔抽出装置。
texttIngredientsは、カスタム写真をダイナミックでパーソナライズされたビデオコンテンツに変える上で、優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:45:22 GMT)
UniZero: Generalized and Efficient Planning with Scalable Latent World Models [29.6] UniZeroは、モジュールトランスフォーマーベースの世界モデルを使用して、共有潜在空間を効果的に学習する新しいアプローチである。
長期メモリを必要とするベンチマークにおいて、UniZeroが既存のベースラインを大幅に上回ることを示す。
Atari や DMControl のような標準のシングルタスク RL 設定では、UniZero は現在の最先端メソッドのパフォーマンスを上回ります。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:57:39 GMT)
Enhancing Large Vision Model in Street Scene Semantic Understanding through Leveraging Posterior Optimization Trajectory [29.6] バックボーンおよび下流認識ヘッドとしてのLVM(Large Vision Models)は、ADセマンティック情報を理解するために使用される。
後最適化軌道(POT)誘導最適化スキーム(POTGui)は収束を加速する。
実験の結果,提案手法は66.48%以上の性能向上を実現し,6倍の速度で収束することがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:10:56 GMT)
AdaptVC: High Quality Voice Conversion with Adaptive Learning [28.3] 鍵となる課題は、ソースと音声スタイルから絡み合った言語コンテンツを抽出することである。
本稿では,アダプタを用いた自己教師型音声特徴の調整により,コンテンツと話者の特徴のアンタングル化を成功させる。
アダプタは、リッチな自己教師付き特徴からニュアンス特徴を動的に符号化するように訓練され、デコーダはそれらを融合して参照に正確に類似した音声を生成する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:37:03 GMT)
AgentRefine: Enhancing Agent Generalization through Refinement Tuning [28.2] LLM(Large Language Model)ベースのエージェントは、人間のような複雑なタスクを実行する能力を示した。
オープンソースLLMとGPTシリーズのような商用モデルの間にはまだ大きなギャップがある。
本稿では,命令チューニングによるLLMのエージェント一般化機能の改善に焦点をあてる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:55:19 GMT)
MoVE-KD: Knowledge Distillation for VLMs with Mixture of Visual Encoders [28.2] 視覚エンコーダは視覚言語モデル(VLM)の基本コンポーネントである
近年の研究では、複数のエンコーダを単一のVLMに組み込んでおり、計算コストが大幅に増大している。
本稿では、複数の視覚エンコーダのユニークな習熟度を1つの効率的なエンコーダモデルに抽出する新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:10:34 GMT)
Decoupled Functional Central Limit Theorems for Two-Time-Scale Stochastic Approximation [28.1] 2回のスケール近似では、異なるステップサイズで異なるレートで2つのイテレーションが更新され、それぞれが他方に影響を与える。
以前の研究では、これらの更新に対する誤差項の収束率はそれぞれのステップサイズにのみ依存していることが示されており、これは分離収束と呼ばれる性質である。
我々の研究はこのギャップを埋めるために、2段階のSAに対して分離された機能中心極限定理を確立し、その挙動をより正確に評価する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:49:18 GMT)
Enhancing Vision-Language Model Safety through Progressive Concept-Bottleneck-Driven Alignment [28.0] 本稿では,視覚的モダリティの安全性向上を目的とした,プログレッシブなコンセプトベースアライメント戦略であるPSA-VLMを提案する。
提案手法は,VLMの安全性ベンチマークにおいて,最先端の安全性を実現する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:44:46 GMT)
AR4D: Autoregressive 4D Generation from Monocular Videos [27.6] 既存のアプローチは主に、ノベルビューの動画を推測するためにスコア蒸留サンプリングに依存している。
SDSフリー4D生成のための新しいパラダイムであるAR4Dを提案する。
我々は,AR4DがSDSを使わずに最先端の4D生成を実現し,多様性の向上,空間的時間的整合性の向上,入力プロンプトとの整合性の向上を実現していることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:27:36 GMT)
Automating Legal Concept Interpretation with LLMs: Retrieval, Generation, and Evaluation [27.3] 本稿では,過去の判例から関連情報を取得するための新しい検索強化世代フレームワークATRIを紹介する。
そこで我々は,生成した概念解釈の評価を自動化するために,新たな基準である法的な概念包含手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:11:38 GMT)
D$^3$-Human: Dynamic Disentangled Digital Human from Monocular Video [26.9] D$3$-Humanは、モノクロビデオから動的不整形デジタルヒューマン幾何を再構成する手法である。
本研究では, 可視領域をSDFとして再構成し, 可視衣服と可視体を分割し, 可視体と可視体をマージする新規な人体距離場(hmSDF)を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 00:58:35 GMT)
Enhancing LLM Reasoning with Multi-Path Collaborative Reactive and Reflection agents [26.6] マルチパス推論(Multi-Path Reasoning:RR-MP)フレームワークを用いたリアクティブおよびリフレクションエージェントを提案する。
提案手法は,マルチパス推論機構を用いて科学的推論精度を向上させる。
道徳的シナリオ,大学レベルの物理,数学に関わる課題について,ゼロショットと少数ショットの評価を行った。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:50:59 GMT)
Kernel PCA for Out-of-Distribution Detection [26.5] ディープニューラルネットワーク(DNN)の信頼性には,アウト・オブ・ディストリビューション(OoD)検出が不可欠である
我々は、OoD検出にKernel PCA(KPCA)のフレームワークを活用し、主成分が分散する部分空間におけるInDとOoDデータの分離性を主張する適切な非線形カーネルを求める。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:45:43 GMT)
Adaptive Few-shot Prompting for Machine Translation with Pre-trained Language Models [25.9] 文脈内学習を伴う大規模言語モデル(LLM)は、ニューラルマシン翻訳の処理において顕著な可能性を示している。
既存の証拠は、LLMはプロンプトに敏感であり、下流機械翻訳タスクの入力に固定プロンプトを適用するのが最適であることを示している。
本稿では,様々な入力文に対して適切な翻訳デモを自動的に選択するための適応的な数ショットプロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:47:59 GMT)
TabTreeFormer: Tabular Data Generation Using Hybrid Tree-Transformer [25.4] TabTreeFormerは、ツリーベースのモデルを組み込んだハイブリッドトランスフォーマーアーキテクチャである。
マルチモーダル連続分布を捉えるための二重量子化トークン化器を提案する。
実験の結果,TabTreeFormerは優れた忠実度,実用性,プライバシ,効率性を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:58:31 GMT)
Debate-to-Write: A Persona-Driven Multi-Agent Framework for Diverse Argument Generation [25.4] 議論記述のためのペルソナベースのマルチエージェントフレームワークを提案する。
人間の議論に触発されて、我々はまず各エージェントに、その高いレベルの信念を表すペルソナを、ユニークな視点から割り当てる。
次にエージェントインタラクションプロセスを設計し、エージェントが協調して議論し、議論書の全体計画を形成するアイデアを議論できるようにします。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:23:21 GMT)
RadHop-Net: A Lightweight Radiomics-to-Error Regression for False Positive Reduction In MRI Prostate Cancer Detection [25.4] 本稿では,FP削減のための新しい軽量CNNであるRadHop-Netを紹介する。
提案されたステージ2は、公開可能なpi-caiデータセットにおける病変検出における平均精度(AP)を0.407から0.468に改善する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:20:04 GMT)
MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization [25.0] 音楽理解のための自己教師付き音楽表現学習モデルを提案する。
MuQはMel Residual Vector Quantization(Mel-RVQ)によって生成されるトークンを予測するために訓練される
様々なダウンストリームタスクの実験では、MuQが以前の自己教師付き音楽表現モデルより優れていたことが示されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:35:34 GMT)
TCPFormer: Learning Temporal Correlation with Implicit Pose Proxy for 3D Human Pose Estimation [25.0] 中間表現として暗黙のポーズプロキシを利用するTCPFormerを提案する。
提案手法は,PUM(Proxy Update Module),PIM(Proxy Invocation Module),PAM(Proxy Attention Module)の3つの重要なコンポーネントから構成される。
Human3.6M と MPI-INF-3DHP データセットの実験により,提案した TCPFormer が従来の最先端手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:50:44 GMT)
A quantitative analysis of knowledge-learning preferences in large language models in molecular science [24.8] 大規模言語モデル(LLM)は、自然言語処理(NLP)の観点から科学的問題に取り組むための新しい研究パラダイムを導入している。
LLMは分子の理解と生成を著しく強化し、しばしば複雑な分子パターンをデコードし合成する能力で既存の手法を超越している。
我々は、ChEBI-20-MMというマルチモーダルベンチマークを提案し、モデルとデータモダリティとの互換性と知識獲得を評価する1263の実験を行った。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:29:03 GMT)
Communication-Efficient Split Learning via Adaptive Feature-Wise Compression [24.2] SplitFCはコミュニケーション効率のよい分割学習フレームワークである。
i)適応的特徴量ドロップアウトと(ii)適応的特徴量量子化の2つの圧縮戦略が組み込まれている。
MNIST、CIFAR-100、CelebAデータセットのシミュレーション結果は、SplitFCが最先端のSLフレームワークより優れていることを示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:05:15 GMT)
From Age Estimation to Age-Invariant Face Recognition: Generalized Age Feature Extraction Using Order-Enhanced Contrastive Learning [23.8] 一般的な年齢特徴抽出は、年齢に関連する顔分析タスクに不可欠である。
我々は,異なるデータセットやシナリオ間のドメインギャップを最小限に抑えるために,秩序強化コントラスト学習(OrdCon)を提案する。
提案手法は,各種ベンチマークデータセットの最先端手法に匹敵する結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:23:52 GMT)
HPCR: Holistic Proxy-based Contrastive Replay for Online Continual Learning [23.7] オンライン連続学習は、オンラインデータストリーム上の単一パスから新しいデータを継続的に学習するニューラルネットワークを開発することを目的としている。
既存のリプレイベースのメソッドは、部分的に古いデータをプロキシベースまたはコントラストベースのリプレイ方法でリプレイすることで、忘れを緩和する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:44:02 GMT)
Exoplanet Detection via Differentiable Rendering [23.6] 太陽系外惑星の直接撮像は、主星と惑星の間の高コントラストのために大きな課題に直面している。
波面収差は、惑星の外観を模した回折された星のパターンである望遠鏡科学画像にスペックルを導入している。
従来の後処理方式は、主に画像強度領域で動作するが、波面センシングデータを統合していない。
本稿では、これらの波面センシングデータを利用して、外惑星検出を改善する微分可能なレンダリング手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:30:44 GMT)
CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction [23.1] 我々は,タンパク質-RNA結合親和性データセットPRA310を構築し,性能評価を行った。
我々は,(1)タンパク質-RNA結合親和性,(2)変異による結合親和性の変化を正確に予測できること,(3)データのスケーリングとモデルサイズによるメリットを広く分析し,検証する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:03:15 GMT)
ZeroFlow: Overcoming Catastrophic Forgetting is Easier than You Think [22.3] 我々はZeroFlowの最初のベンチマークを導入し、勾配のない最適化アルゴリズムを評価し、忘れを克服する。
このベンチマークでは、複数のメソッドをまたいだフォワードパスメソッドのスイートを調べ、シナリオやデータセットを忘れる。
フォワードパスだけでは、忘れを乗り越えるには十分です。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:02:46 GMT)
Denoising and Adaptive Online Vertical Federated Learning for Sequential Multi-Sensor Data in Industrial Internet of Things [22.2] 本研究では,複数のセンサがリアルタイムデータを逐次収集する産業組立ラインシナリオに焦点を当てた。
本稿では,Denoising and Adaptive Online Vertical Federated Learning (DAO-VFL)アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:22:15 GMT)
ArtCrafter: Text-Image Aligning Style Transfer via Embedding Reframing [22.1] ArtCrafterは、テキストから画像へのスタイル転送のための新しいフレームワークである。
注意に基づくスタイル抽出モジュールを導入する。
また,新たなテキスト画像アライメント拡張コンポーネントを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:17:27 GMT)
Cloth-Splatting: 3D Cloth State Estimation from RGB Supervision [21.8] 本稿では,RGB画像から布の3次元状態を予測・更新フレームワークを用いて推定する方法であるClos-Splattingを紹介する。
キーとなる洞察は、3Dメッシュベースの表現とガウススプラッティングを結合することで、布の状態空間と画像空間の間の微分可能なマップを定義することができるということです。
実験により,クロス・スプレイティングは電流ベースラインよりも状態推定精度を向上するだけでなく,収束時間を短縮することを示した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:17:30 GMT)
Adaptive Homophily Clustering: A Structure Homophily Graph Learning with Adaptive Filter for Hyperspectral Image [21.7] ハイパースペクトル画像(HSI)クラスタリングは、ゼロトレーニングラベルによる基本的だが難しい課題である。
本稿では,HSIのための適応フィルタクラスタリング法(AHSGC)を用いたホモフィリ構造グラフ学習を提案する。
AHSGCには高いクラスタリング精度、低い計算複雑性、強い堅牢性が含まれています。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 01:54:16 GMT)
E-ICL: Enhancing Fine-Grained Emotion Recognition through the Lens of Prototype Theory [21.5] 本稿では,プロトタイプ理論の観点からICLの性能低下の原因を明らかにする。
感情認識のための感情文脈学習法(E-ICL)を提案する。
EDOS, Empathetic-Dialogues, EmpatheticIntent, GoEmotionsの詳細な感情データセット実験により, E-ICLが優れた感情予測性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:00:01 GMT)
S-NeRF++: Autonomous Driving Simulation via Neural Reconstruction and Generation [21.5] S-NeRF++は神経再構成に基づく革新的な自律運転シミュレーションシステムである。
S-NeRF++は、nuScenesやradianceなど、広く使われている自動運転データセットでトレーニングされている。
システムは、ノイズとスパースLiDARデータを効果的に利用して、トレーニングを洗練し、奥行きの外れ値に対処する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:23:51 GMT)
KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model [21.4] KaLM-Embeddingは、よりクリーンで、より多様な、ドメイン固有のトレーニングデータを活用する一般的な多言語埋め込みモデルである。
我々のモデルは、性能を向上させることが証明された重要な技術で訓練されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:16:10 GMT)
LCFed: An Efficient Clustered Federated Learning Framework for Heterogeneous Data [21.3] クラスタ型フェデレーションラーニング(CFL)は、フェデレーションラーニング(FL)におけるデータ不均一性に起因するパフォーマンス上の課題に対処する。
既存のCFLアプローチは、クラスタ内の知識共有を厳密に制限し、クラスタ内のトレーニングとグローバル知識の統合を欠いている。
これらの課題に対処するための効率的なCFLフレームワークであるLCFedを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:59:48 GMT)
TAB: Transformer Attention Bottlenecks enable User Intervention and Debugging in Vision-Language Models [21.0] MHSA(Multi-head Self-attention)は、トランスフォーマーの主要なコンポーネントであり、言語と視覚の両方で広く使われているアーキテクチャである。
本稿では,従来のMHSAアーキテクチャの後に挿入された新しい1ヘッドトランスフォーマー・アテンション・ボトルネック層を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:58:50 GMT)
Prism: Mining Task-aware Domains in Non-i.i.d. IMU Data for Flexible User Perception [20.6] モバイルデバイス上で高いFUP精度を得ることができるPrismと呼ばれる新しいスキームを提案する。
Prismの中核は、IMUデータセットに埋め込まれたタスク認識ドメインを発見し、特定されたドメインごとにドメイン認識モデルをトレーニングすることである。
結果は、Prismが低レイテンシで最高のFUPパフォーマンスを達成できることを示しています。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:07:42 GMT)
Evaluating the Capabilities of Large Language Models for Multi-label Emotion Understanding [20.6] EthioEmoは、4つのエチオピア語に対するマルチラベル感情分類データセットである。
SemEval 2018 Task 1から追加の英語マルチラベル感情データセットで広範な実験を行う。
その結果,高精度なマルチラベル感情分類は,ハイソース言語においても依然として不十分であることが示唆された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:32:35 GMT)
PAFUSE: Part-based Diffusion for 3D Whole-Body Pose Estimation [20.4] 本研究では,3次元全体のポーズ推定に新たなアプローチを導入し,身体部分間の分散と変形性という課題に対処する。
不均一なサンプルデータにおける動きの活用という課題に対処するだけでなく、安定な拡散と階層的な部分表現を結合する。
H3WBデータセットでは,時間情報の活用に失敗した技術の現状を大幅に上回っている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:32:12 GMT)
Robust Self-Paced Hashing for Cross-Modal Retrieval with Noisy Labels [20.3] クロスモーダルハッシュ (CMH) は, 大規模データの保存コストが低く, 計算効率が高いことから, クロスモーダル検索の手法として人気がある。
既存のほとんどの手法では、マルチモーダルデータが正しくラベル付けされていると暗黙的に仮定している。
雑音ラベル付きロバストセルフペーストハッシュ (RSHNL) と呼ばれる新しい認知的クロスモーダル検索手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:41:34 GMT)
Ano-SuPs: Multi-size anomaly detection for manufactured products by identifying suspected patches [20.2] 画像背景と様々な異常パターンの複雑さは、既存の行列分解法に新たな課題をもたらす。
本稿では,疑わしいパッチを同定して異常を検出する2段階戦略異常検出手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:31:04 GMT)
An Offline Reinforcement Learning Algorithm Customized for Multi-Task Fusion in Large-Scale Recommender Systems [19.4] Multi-Task Fusion (MTF) は、Multi-Task Learning (MTL) が出力する複数のスコアを最終スコアに組み合わせ、ユーザの満足度を最大化する。
近年,レコメンデーションセッションにおける長期ユーザ満足度を最適化するために,業界におけるMDFには強化学習(Reinforcement Learning, RL)が用いられている。
統合RL-MTFは、オフラインRLモデルとオンライン探索ポリシーを統合し、制約を緩和し、複雑な制約を緩和します。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:55:13 GMT)
Attribution Analysis Meets Model Editing: Advancing Knowledge Correction in Vision Language Models with VisEdit [18.7] 我々は、トークン予測のための視覚表現の寄与を測定するために、コントリビューションアロケーションとノイズ摂動法を用いる。
帰属分析により,このプロンプトに非常に関係のある中後期層における視覚的表現が予測に大きく寄与していることが示唆された。
そこで我々はVisEditを提案する。VisEditはVis-LLMsの新しいモデルエディタで、編集プロンプトに重要な領域の中間的な視覚表現を編集することで知識を効果的に修正する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:01:55 GMT)
Beyond Non-Degeneracy: Revisiting Certainty Equivalent Heuristic for Online Linear Programming [18.4] この結果から,不確実性等価性は分布の微妙な仮定の下で一様に近い最適後悔を達成できることが示唆された。
以上の結果から,CE は従来の信念とは対照的に,幅広い問題事例に対する退化の呪いを効果的に打ち負かしていると考えられる。
これらの手法は、より広範なオンライン意思決定コンテキストにおける潜在的な応用を見出すことができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:21:27 GMT)
A recent evaluation on the performance of LLMs on radiation oncology physics using questions of randomly shuffled options [17.8] 2024年9月30日までにリリースされた5つの大きな言語モデル(LLM)は、新しい試験セットを使用して精査された。
帰納的推論能力を評価するために,質問の正解を「上述しない」に置き換えた。
LLMの性能は、医学物理学者の回答と比較された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:12:37 GMT)
Unsupervised Robust Cross-Lingual Entity Alignment via Neighbor Triple Matching with Entity and Relation Texts [17.5] 言語間エンティティアライメント(EA)は、異なる言語間での複数の知識グラフ(KG)の統合を可能にする。
近隣の3重マッチング戦略により、エンティティレベルとリレーレベルアライメントを共同で実行するEAパイプライン。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:25:56 GMT)
Data Augmentation for Sparse Multidimensional Learning Performance Data Using Generative AI [17.2] 学習パフォーマンスデータは、適応学習における正しい解答や問題解決の試みを記述している。
学習性能データは、適応的なアイテム選択のため、ほとんどの実世界のアプリケーションでは、非常にスパースな(80%(sim)90%の欠落)傾向にある。
本稿では,学習者のデータの分散性に対処するために,学習者のデータを拡張するための体系的フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:27:26 GMT)
FedMIA: An Effective Membership Inference Attack Exploiting "All for One" Principle in Federated Learning [17.1] Federated Learning(FL)は、分散データ上で機械学習モデルをトレーニングするための有望なアプローチである。
メンバーシップ推論攻撃(MIA)は、特定のデータポイントがターゲットクライアントのトレーニングセットに属するかどうかを判断することを目的としている。
我々はFedMIAと呼ばれる3段階のメンバーシップ推論攻撃(MIA)手法を導入し、MIAの有効性を高めるため、複数の通信ラウンドにまたがる全クライアントからの更新を平均化する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:10:28 GMT)
MADGEN -- Mass-Spec attends to De Novo Molecular generation [16.9] 質量分析データを用いたデノボ分子構造生成のための足場に基づく手法を提案する。
MADGENは、足場検索とスペクトル条件分子生成の2段階で動作する。
我々は3つのデータセット(NIST23、CANOPUS、MassSpecGym)上でMADGENを評価する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:54:26 GMT)
AdaCQR: Enhancing Query Reformulation for Conversational Search via Sparse and Dense Retrieval Alignment [16.6] 本稿では,対話型検索再構成のための新しいフレームワークAdaCQRを提案する。
AdaCQRは、情報検索クエリの一般化性を向上させる。
TopiOCQAとQReCCデータセットの実験結果は、AdaCQRが既存のメソッドをより効率的なフレームワークで上回ることを示した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:22:08 GMT)
End-to-End Long Document Summarization using Gradient Caching [16.5] 長い文書要約のためのトランスフォーマーベースのエンコーダデコーダモデルを訓練することは大きな課題である。
CachED(Gradient $textbfCach$ing for $textbfE$ncoder-$textbfD$ecoder model)を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:32:57 GMT)
Boosting Explainability through Selective Rationalization in Pre-trained Language Models [16.4] 自然言語処理(NLP)における事前学習言語モデル(PLM)の広範な適用により、その説明可能性に対する懸念が高まっている。
PLMに既存の合理化フレームワークを適用すると、深刻な退化と失敗の問題が起こり、準最適または無意味な合理性を生み出す。
本稿では, PLMをジェネレータと予測器に分割し, 解釈可能な有理性を提供しながら, NLPタスクに対処するPLMR(Pre-trained Language Model's Rationalization)法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:52:40 GMT)
AI Suggestions Homogenize Writing Toward Western Styles and Diminish Cultural Nuances [16.3] 本稿では,西洋中心のAIモデルが,異なる文化的背景を持つユーザに対して提案書を提示した場合に何が起こるかを検討する。
インドと米国からの参加者118名を対象に、異文化間制御実験を行った。
分析の結果、AIはインド人に比べて、アメリカ人の効率が向上したことがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:24:16 GMT)
PB-UAP: Hybrid Universal Adversarial Attack For Image Segmentation [15.7] セグメンテーションモデル用に設計された新しいユニバーサル逆攻撃法を提案する。
提案手法は,最先端の手法よりも高い攻撃成功率を達成し,異なるモデル間で強い伝達性を示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:39:46 GMT)
How Your Location Relates to Health: Variable Importance and Interpretable Machine Learning for Environmental and Sociodemographic Data [15.5] 健康の結果は、場所や時間によって影響が変化する複雑な環境や社会的な要因に依存する。
我々は、これらの効果、すなわち、イギリスの健康、環境、社会デマトグラフィー情報のMEDSATデータセットを研究するために、きめ細かい空間的・時間的データを使用します。
次に、GAM(Generalized Additive Models)とMGWR(Multiscale Geographically Weighted Regression)に基づく解釈可能な機械学習フレームワークを開発する。
以上の結果から,NO2は喘息,高血圧,不安の世界的な予測因子であり,職業,結婚,植生に関連する他の結果特異的な予測因子であることがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:34:35 GMT)
Chain-of-Instructions: Compositional Instruction Tuning on Large Language Models [15.4] チェーン・オブ・インストラクション(CoI)と呼ばれる新しい構成命令の概念を提案する。
従来の単一命令タスクの解法とは異なり,提案手法では各サブタスクを段階的に解き,最終的な解答に到達するまで解き明かす。
CoIチューニングは、複数のサブタスクからなる命令と、多言語要約のような目に見えない複合タスクを扱うモデルの能力を改善する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 22:50:35 GMT)
A Comprehensive Framework to Operationalize Social Stereotypes for Responsible AI Evaluations [15.4] 社会的なステレオタイプは、責任あるAI介入の無数の中心にある。
生成AI評価におけるステレオタイプを運用するための統合フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:39:48 GMT)
Spiking-PhysFormer: Camera-Based Remote Photoplethysmography with Parallel Spike-driven Transformer [15.1] スパイキングネットワーク(SNN)は、エネルギー効率のよいディープラーニングの可能性を秘めている。
本稿では,消費電力削減を目的としたハイブリッドニューラルネットワーク(HNN)モデルであるSpking-PhysFormerを提案する。
提案モデルでは,PhysFormerと比較して12.4%の消費電力削減を実現している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:05:30 GMT)
Fast algorithms for classical specifications of stabiliser states and Clifford gates [14.9] 安定化状態とクリフォードゲートの異なる仕様の変換と検証は、量子情報における古典的アルゴリズムの重要な構成要素である。
我々は安定化状態とクリフォードゲートに関する新しい数学的洞察を開発し、それらの記述を明確にした。
そして、これらを利用して、既存の実装よりも有利な10の新しい高速アルゴリズムを提供します。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 00:56:29 GMT)
Generic Objects as Pose Probes for Few-shot View Synthesis [14.8] NeRFや3D Gaussianなどの放射場は、高忠実なレンダリングやシーン再構成において大きな可能性を示している。
COLMAPはポーズを推定する前処理によく使用される。
我々は,3~6面のシーン画像のみを用いて,少数視点のNeRF再構成を実現することを目的としている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:05:06 GMT)
FairSense: Long-Term Fairness Analysis of ML-Enabled Systems [14.6] 多くのテスト、検証、バイアス軽減技術が、機械学習モデルにおける公平性の問題を特定し、軽減するために提案されている。
本研究では,ML対応システムの長期不公平性を検知・解析するFairSenseというシミュレーションベースのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:38:58 GMT)
Evaluating Scenario-based Decision-making for Interactive Autonomous Driving Using Rational Criteria: A Survey [14.5] 本調査では, 自律走行における深部強化学習(DRL)アルゴリズムの適用について概説する。
シナリオとしては、ハイウェイ、オンランプのマージ、ラウンドアバウンド、未署名の交差点などがある。
DRLに基づくアルゴリズムは、運転安全性、運転効率、訓練効率、非利己性、解釈可能性の5つの基準に基づいて評価される。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:37:52 GMT)
Efficient Generation of Multi-partite Entanglement between Non-local Superconducting Qubits using Classical Feedback [14.3] ゲートベースの量子コンピューティングでは、絡み合った状態の生成や量子プロセッサ間の絡み合いの分布は、絡み合った量子ビットの数で増加する回路深さを必要とすることが多い。
テレポーテーションベースの量子コンピューティングでは、量子ビット数で一定となる回路深さの絡み合った状態を決定論的に生成することができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:39:42 GMT)
METAGENE-1: Metagenomic Foundation Model for Pandemic Monitoring [14.0] メタゲノミクス基礎モデルMETAGENE-1を, 種々のメタゲノミクスDNAおよびRNA配列の新規コーパスでプレトレーニングした。
このデータセットは、深層メタゲノミクスシークエンシング法を用いて処理およびシーケンスされたヒト排水サンプルの大規模なコレクションから得られたものである。
我々は、このモデルをメダゲノミクスデータセット上で事前トレーニングし、事前トレーニングの過程における損失、システムメトリクス、トレーニング安定性の詳細を提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:44:43 GMT)
Gradual Domain Adaptation: Theory and Algorithms [14.0] 教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ラベル付きソースドメインからラベルなしターゲットドメインへのモデルをワンオフで適応する。
本研究ではまず,GDAアルゴリズムである漸進的な自己学習を理論的に解析し,より優れた一般化バウンダリを提供する。
我々は、$textbfG$enerative Gradual D$textbfO$main $textbfA$daptation with Optimal $textbfT$ransport (GOAT)を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:19:14 GMT)
RCAEval: A Benchmark for Root Cause Analysis of Microservice Systems with Telemetry Data [13.7] 近年,マイクロサービスシステムの根本原因分析(RCA)が注目されている。
大規模なデータセットを含み、包括的な評価環境をサポートする標準ベンチマークはまだ存在しない。
マイクロサービスシステムにおけるRCAEvalは、データセットとRCAEvalの評価環境を提供するオープンソースのベンチマークである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 01:10:42 GMT)
Balanced Residual Distillation Learning for 3D Point Cloud Class-Incremental Semantic Segmentation [13.6] CIL(Class-incremental Learning)は、新しいクラスの継続的な学習を可能にすると同時に、古いクラスの破滅的な忘れを緩和する。
ベースモデルから過去の知識を効果的に洗練し、それを新しい学習とバランスさせることは不可欠だが、難しい。
本研究は, このギャップに対処し, CIL性能を向上させるための残差蒸留学習フレームワーク(BRDL)を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:18:15 GMT)
Universal Online Temporal Calibration for Optimization-based Visual-Inertial Navigation Systems [13.4] 最適化に基づくビジュアル慣性ナビゲーションシステムのための汎用的なオンライン時間的キャリブレーション戦略を提案する。
我々は、最適化残差モデルにおいて、タイムオフセットtdを状態パラメータとして使用し、IMU状態を対応する画像のタイムスタンプに整列させる。
我々のアプローチは、特にノイズの多いセンサデータの存在下で、より正確な時間オフセット推定とより高速な収束を提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:41:25 GMT)
Aesthetic Matters in Music Perception for Image Stylization: A Emotion-driven Music-to-Visual Manipulation [13.1] EmoMVは感情駆動型音楽-視覚間操作方式である。
我々は,画像品質指標,審美評価,脳波測定を含むマルチスケールフレームワークを用いてEmoMVを評価する。
以上の結果から,EmoMVは音楽の感情コンテンツを視覚的に説得力のある画像に効果的に翻訳することを示した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:41:53 GMT)
IGAF: Incremental Guided Attention Fusion for Depth Super-Resolution [13.0] 誘導深度超解像(GDSR)のための新しいセンサ融合手法を提案する。
GDSRは、LR深度マップとHR画像を組み合わせて詳細なHR深度マップを推定する。
本モデルでは,NYU v2データセットのベースラインモデルすべてと比較して,最先端の結果が得られている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:27:51 GMT)
An Enhanced-State Reinforcement Learning Algorithm for Multi-Task Fusion in Large-Scale Recommender Systems [12.3] Recommender Systems(RS)におけるマルチタスク融合(MTF)のための拡張状態RLと呼ばれる新しい手法を提案する。
提案手法はまず,ユーザの特徴,項目の特徴,その他の重要な特徴を拡張状態として集合的に定義し,さらに,ユーザとイズムのペアに対してより優れたアクションを実現するために,拡張状態を活用する新しいアクタと批判的学習プロセスを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:42:44 GMT)
Time Series Language Model for Descriptive Caption Generation [11.8] 本稿では,時系列キャプションに特化して設計された新しい時系列言語モデルTSLMを紹介する。
TSLMはエンコーダ・デコーダモデルとして機能し、テキストプロンプトと時系列データ表現の両方を活用する。
TSLMは、複数のデータモダリティから既存の最先端アプローチよりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:34:30 GMT)
BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems [11.8] 協調型多エージェント深層強化学習(c-MADRL)は、バックドア攻撃の脅威にさらされている。
我々は,c-MADRLに対して,単一のエージェントに唯一のバックドアを埋め込むことで,マルチエージェントチーム全体を攻撃する新しいバックドアレバレッジアタックを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 01:33:29 GMT)
Improving Transducer-Based Spoken Language Understanding with Self-Conditioned CTC and Knowledge Transfer [11.4] 我々は、RNNトランスデューサモデル(RNN-T)において、エンドツーエンド(E2E)音声言語理解(SLU)を改善することを提案する。
提案モデルは,ASRおよびSLUを逐次実行するE2E微分可能なカスケードモデルに類似する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:19:12 GMT)
Pushing the Boundaries of Text to Motion with Arbitrary Text: A New Task [11.3] 本稿では,制限されたアクションテキストを任意のテキストに拡張する。
明示的なアクションラベルのないシーンテキストは、複雑で多様な産業におけるモデルの実用性を高めることができる。
任意のテキストからアクション命令を抽出し,その後に動作を生成する,シンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:20:48 GMT)
Active Learning Enables Extrapolation in Molecular Generative Models [11.2] 分子生成モデルのための能動的学習・閉ループ分子生成パイプラインを作成する。
他の生成モデルアプローチと比較して、我々のアクティブな学習アプローチだけがトレーニングデータを超える性質を持つ分子を生成する。
生成する安定分子の割合は、次のベストモデルよりも3.5倍高い。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:07:06 GMT)
Summarizing Bayesian Nonparametric Mixture Posterior -- Sliced Optimal Transport Metrics for Gaussian Mixtures [10.7] 混合モデルの後方推論を要約する既存の方法は、クラスタリングのための暗黙のランダムパーティションの点推定を同定することに焦点を当てている。
本研究では,非パラメトリックベイズ混合モデルにおける後部推論を要約し,混合度(または混合度)の密度推定を推論対象として優先順位付けする手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:03:24 GMT)
DELA: A Novel Approach for Detecting Errors Induced by Large Atomic Condition Numbers [10.6] ほとんどの数値誤差は、原子操作における大きな条件数から来ており、それが伝播して蓄積される。
我々のアプローチは、ほとんどの数値誤差は原子操作における大きな条件数に由来するという観察に基づいている。
DELAはプログラム内の個々の原子操作の結果に小さな摂動を注入し、元のプログラムの結果と摂動バージョンを比較してエラーを検出する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:19:41 GMT)
Dual Mutual Learning Network with Global-local Awareness for RGB-D Salient Object Detection [10.4] 本研究では,グローバルな相互学習ネットワークであるGL-DMNetを提案する。
異なるモード間の相互依存性を利用するために,位置相互融合モジュールとチャネル相互融合モジュールを提案する。
提案するGL-DMNetは, 24 RGB-D SOD法よりも優れた性能を示し, 平均3%の改善を実現している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:37:54 GMT)
Stackelberg Game Based Performance Optimization in Digital Twin Assisted Federated Learning over NOMA Networks [10.3] フェデレートラーニング(FL)は、分散クライアントの限られたコンピューティングリソースと信頼性の低い無線通信環境のために、依然としてトラグル問題に悩まされている。
分散リソースを効果的に模倣することにより、デジタルツイン(DT)はこの問題を軽減する大きな可能性を示している。
本稿では、FLフレームワークにおけるDTを非直交多重アクセス(NOMA)ネットワーク上で活用し、クライアントからのモデル更新に対する悪意のある攻撃を考慮してFLトレーニングプロセスを支援する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 00:43:28 GMT)
Entanglement transfer between giant atoms in waveguide-QED systems [10.1] 導波管-QED系における巨大原子間の絡み合い移動について検討する。
分離、編み、ネストされた3つの巨大な原子結合構成について検討する。
原子対$ac$から原子対$bd$への絡み合い転送については、完全絡み合い転送を編み込み構成で示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:56:44 GMT)
A Separable Self-attention Inspired by the State Space Model for Computer Vision [10.0] Mambaは線形計算複雑性を持つ効率的な状態空間モデルである。
近年の研究では、状態空間モデルとアテンション変種の間には、豊富な理論的な関係があることが示されている。
本稿では,マンバの優れた設計概念を分離可能な自己注意に導入した新しい自己注意法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:23:36 GMT)
VidFormer: A novel end-to-end framework fused by 3DCNN and Transformer for Video-based Remote Physiological Measurement [9.6] 本稿では、畳み込みネットワーク(CNN)とrタスクのモデルを統合する新しいフレームワークであるVidFormerを紹介する。
5つの公開データセットに対する評価は、VidFormerが現在のSOTA(State-of-the-art)メソッドより優れていることを示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:18:08 GMT)
Testing Stationarity and Change Point Detection in Reinforcement Learning [9.5] 予め収集した履歴データに基づいて最適なQ-関数の非定常性をテストする一貫した手順を開発する。
さらに、非定常環境における政策最適化のための既存の最先端RL手法と自然に結合可能な逐次変化点検出法を開発した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:17:28 GMT)
Dedicated Inference Engine and Binary-Weight Neural Networks for Lightweight Instance Segmentation [9.4] 2つの動作モードを持つ最新のBNNを扱うために,推論エンジンの設計手法を提案する。
MAC操作のアーキテクチャは、ハードウェアコストのわずか52%でBNNの推論結果を効率的に計算することができる。
SegNeXtのバックボーンとインスタンスセグメンテーションのためのSparseInstのデコーダを組み合わせた2つの軽量ネットワークも提案されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:46:34 GMT)
Spot Risks Before Speaking! Unraveling Safety Attention Heads in Large Vision-Language Models [9.3] 大規模視覚言語モデル(LVLM)の内部アクティベーションは、異なる攻撃に対して悪意のあるプロンプトを識別することができる。
この固有の安全性の認識は、私たちが安全の頭と呼ぶ、まばらな注意の頭によって支配されている」。
これらの安全ヘッドを配置し、それらのアクティベーションを連結することにより、単純だが強力な悪意のあるプロンプト検出器を構築する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:01:15 GMT)
Towards Robust and Accurate Stability Estimation of Local Surrogate Models in Text-based Explainable AI [9.3] NLP領域における説明可能なAI(XAI)に対する敵攻撃では、生成された説明が操作される。
このXAI操作の中心は、ある説明が他の説明とどのように異なるかを計算するのに使用される類似度尺度である。
本研究は,テキストベースのランキングリストを対象とした類似度尺度について検討し,その使用適性について検討した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:44:57 GMT)
Higher Order Structures For Graph Explanations [9.2] グラフ説明における高階表現のためのフレームワーク(FORGE)を提案する。
FORGEはグラフ説明器が高次のマルチノードインタラクションをキャプチャすることを可能にする。
平均説明精度をそれぞれ1.9倍と2.25倍に改善する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:58:17 GMT)
XLSTM-HVED: Cross-Modal Brain Tumor Segmentation and MRI Reconstruction Method Using Vision XLSTM and Heteromodal Variational Encoder-Decoder [9.1] 我々は,XLSTM-HVEDモデルを導入し,ヘテロモーダルエンコーダ・デコーダ・フレームワークをVision XLSTMモジュールと統合し,欠落したMRIモダリティを再構築する。
このアプローチの主な革新は、モーダル機能の統合を改善する自己意識変動(SAVE)モジュールである。
BraTS 2024データセットを用いた実験では、モダリティが欠落している場合の処理において、既存の先進的手法を著しく上回ります。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:22:41 GMT)
Transfer Learning with Partially Observable Offline Data via Causal Bounds [9.0] 本稿では,部分的に観測可能なコンテキスト帯の移動学習について検討する。
エージェントは不完全な情報と隠れた共同設立者への限られたアクセスで操作する。
本稿では,未知分布の関数的制約を線形制約に識別する効率的な手法を提案する。
この手法は推定誤差を考慮し、強い収束特性を示し、堅牢で信頼性の高い因果境界を保証する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:43:00 GMT)
SNeRV: Spectra-preserving Neural Representation for Video [9.0] 本稿では,暗黙の映像表現を強化する新しい手法として,スペクトル保存型NeRV(SneRV)を提案する。
本稿では,2次元離散ウェーブレット変換(DWT)を用いて映像を低周波(LF)と高周波(HF)に分解する。
我々は,SNeRVが既存のNeRVモデルよりも細部まで細部を捉え,再現性の向上を実現していることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:57:38 GMT)
Electron hopping induced phonon pumping in opto-mechanical molecular nanocavities [8.9] プラズモニック分子ナノ接合はナノスケールでオプトメカニカルカップリングを示す。
導電性分子における非弾性電子ホッピングにより誘導されるプラズモンを介するフォノンポンプを実証する。
本研究は, プラズモンナノキャビティにおける振動, 光, 電子現象の微視的記述を提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:05:48 GMT)
Quantitative Gait Analysis from Single RGB Videos Using a Dual-Input Transformer-Based Network [8.9] 本稿では,デュアルパターン入力畳み込み変換器ネットワークを用いた臨床歩行解析のための効率的な手法を提案する。
このシステムは歩行偏差指数(GDI)、膝屈曲角度、歩幅、歩行リズムなどの重要な指標を推定する上で高い精度を示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:10:08 GMT)
Non-Hermitian sensing in the absence of exceptional points [8.9] 例外点の欠如による普遍的非エルミート感覚を実験的に実証した。
このスキームは、非エルミートプローブの内在感度を弱い外部場に利用し、非ハーミティティーの直接的な結果と解釈できる。
我々の実験は、オープンシステムのユニークな特徴を活用することを目的とした既存の取り組みを補完し、例外的なポイントを伴わずに強化されたセンシングの道を開く。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:12:31 GMT)
Large Language Model Based Multi-Agent System Augmented Complex Event Processing Pipeline for Internet of Multimedia Things [8.7] 本稿では,複合イベント処理(CEP)のためのLarge Language Model (LLM)ベースのシステムフレームワークの開発と評価について述べる。
第一の目的は概念実証を作ることで、現在のCEPシステムとのLLMの統合に対処するために、最先端のLLMオーケストレーションフレームワークとパブリッシュ/サブスクライブ(pub/sub)ツールを統合することである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:47:36 GMT)
QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture [8.7] QuArchは、言語モデルによるコンピュータアーキテクチャの理解を評価し、強化するために設計された1500の人間検証された質問対のデータセットである。
最高のクローズドソースモデルは84%の精度を実現し、上位の小さなオープンソースモデルは72%に達しています。
QuArchによる微調整により、モデル精度が最大8%向上し、AI駆動型コンピュータアーキテクチャ研究の基盤を確立する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:55:53 GMT)
The interplay between domain specialization and model size: a case study in the legal domain [8.7] 計算制約シナリオ下での連続事前学習におけるドメインサイズとモデルサイズ間の相互作用について検討する。
私たちのゴールは、このシナリオの計算効率のよいトレーニング体制を特定することです。
モデルのサイズが大きくなると、特殊モデルと一般モデルの間の計算効率のギャップが広がる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:28:53 GMT)
Online Detection of Water Contamination Under Concept Drift [8.5] 水分配ネットワーク(WDN)は重要なインフラであり、汚染は公衆衛生上の重大なリスクをもたらす。
本研究ではDual-Threshold Anomaly and Drift Detection (AD&DD)法を提案する。
マルチスレッドドリフト検出機構とLSTMベースの変動オートエンコーダ(LSTM-VAE)を組み合わせて、リアルタイムな汚染検知を行う。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:29:09 GMT)
IGGA: A Dataset of Industrial Guidelines and Policy Statements for Generative AIs [8.4] 本稿では,GAI(Generative AIs)とLLM(Large Language Models)を産業や職場で使用するための,160の産業ガイドラインと政策ステートメントのデータセットであるIGGAを紹介する。
データセットには104,565語が含まれており、要求工学に一般的に適用される自然言語処理タスクの貴重なリソースとして機能している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:17:56 GMT)
Generative AI and LLMs in Industry: A text-mining Analysis and Critical Evaluation of Guidelines and Policy Statements Across Fourteen Industrial Sectors [8.4] ジェネレーティブAI(GAI)とLarge Language Models(LLM)の台頭は、産業の景観を変革した。
本研究は、14の産業セクターにおける160のガイドラインと政策ステートメントをテキストベースで分析する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:19:22 GMT)
AGGA: A Dataset of Academic Guidelines for Generative AI and Large Language Models [8.4] 本稿では,GAI(Generative AI)とLLM(Large Language Models)の学術的利用に関する80のガイドラインをまとめたデータセットであるAGGAを紹介する。
このデータセットには188,674語が含まれており、要求工学に一般的に適用される自然言語処理タスクの貴重なリソースとして機能している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:16:36 GMT)
FastTrackTr:Towards Fast Multi-Object Tracking with Transformers [8.3] トランスフォーマーベースのマルチオブジェクト追跡(MOT)モデルは、しばしば構造や他の問題によって推論速度が遅くなる。
本稿では,高速かつ斬新なJDT型MOTフレームワークであるFastTrackTrを構築し,DETR上のフレーム間の情報伝達を効率的に行う手法を提案する。
この情報伝達手法の優位性により,本手法はトラッキング時に要求されるクエリ数を削減できるだけでなく,ネットワーク構造が過度に導入されるのを避けることができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:47:52 GMT)
CompetitorFormer: Competitor Transformer for 3D Instance Segmentation [8.2] トランスフォーマーベースの手法が3Dインスタンスセグメンテーションの主要なアプローチとなっている。
現在のモデルは、シーン内に存在するインスタンスよりも、固定的で高いクエリを使用する。
このようなインスタンスでは、複数のクエリが同じインスタンスを予測しますが、最終的には1つのクエリのみが最適化されます。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:54:56 GMT)
Leveraging Sustainable Systematic Literature Reviews [8.2] 本稿では,持続可能なSLRに向けた具体的な方向性を示す。
我々はまず,SLRの持続可能性に直接影響を及ぼす可能性のある18人のグリーンドライバー(GD)を特定した。
持続可能性指標(SI)を25点蒸留し,その持続性についてSLRを評価した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:03:15 GMT)
Towards a Maturity Model for Systematic Literature Review Process [8.2] 本研究の主な目的は,MM4 SLR というシステム文献レビュープロセスの成熟度モデルの導入である。
文献からまず39のSLRの重要プラクティスを特定し,9つの目標に分類し,さらに5つのプロセス領域に分類した。
MM4 SLRを4つのSLRに適用することにより、MM4 SLRはSLRの評価に適しており、SLRの品質の重要な欠陥を識別できることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:18:35 GMT)
GS-KGC: A Generative Subgraph-based Framework for Knowledge Graph Completion with Large Language Models [8.0] 我々は textbfGenerative textbfSubgraph-based KGC (GS-KGC) と呼ばれる新しい補完フレームワークを提案する。
このフレームワークは、主に負と隣人を生成するように設計された部分グラフ分割アルゴリズムを含んでいる。
4つの共通のKGCデータセットで実施された実験は、提案されたGS-KGCの利点を強調している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:12:32 GMT)
Language Models for Code Optimization: Survey, Challenges and Future Directions [7.9] ディープニューラルネットワーク(DNN)上に構築された言語モデル(LM)は、先日、ソフトウェアエンジニアリングタスクにおいて、画期的な効果を実証した。
本研究は、この急速に発展する分野において、研究者と実践者の両方に実行可能な洞察と参照を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:55:21 GMT)
Bridging Simplicity and Sophistication using GLinear: A Novel Architecture for Enhanced Time Series Prediction [7.9] Time Series Forecasting (TSF)は多くの分野において重要なアプリケーションです。
最近の研究では、より単純な線形モデルは、TSFタスクの複雑なTransformerベースのモデルに比べて、性能が優れているか、少なくとも競合する可能性があることが示唆されている。
本稿では,多変量TSFのための新しいデータ効率アーキテクチャGLinearを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:05:32 GMT)
SafeAug: Safety-Critical Driving Data Augmentation from Naturalistic Datasets [7.9] 本稿では,この問題に対処するために,自然主義的データセットから安全クリティカルな運転データを強化する新しい枠組みを提案する。
本フレームワークでは、まずYOLOv5を用いて車両を検知し、次いで深度推定と3次元変換を行い、車両近接と臨界運転シナリオをより良くシミュレートする。
シミュレーションデータや人工的なデータと比較すると,画像の信頼性を損なうことなく,安全クリティカルな運転データを生成することができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:46:29 GMT)
DFF: Decision-Focused Fine-tuning for Smarter Predict-then-Optimize with Limited Data [7.7] 意思決定中心学習(DFL)は、予測モデルを直接判断損失(DL)に基づいて訓練することにより、予測テーマ最適化(PO)フレームワークへのエンドツーエンドアプローチを提供する。
いくつかの予測モデルは微分不可能またはブラックボックスであり、勾配法では調整できない。
本稿では,DFLモジュールを新しいバイアス補正モジュールを介してPOパイプラインに埋め込む,DFF(Decision-Focused Fine-tuning)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:46:25 GMT)
E-LoQ: Enhanced Locking for Quantum Circuit IP Protection [7.7] 量子回路(E-LoQ)のための拡張ロック手法を提案する。
キービット毎に1量子ビットを使用した以前の作業と比較して、我々のアプローチはより高いセキュリティレベルを達成する。
その結果,E-LoQは量子回路の機能を効果的に隠蔽し,平均忠実度は1%以下であった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 00:37:29 GMT)
Small Language Models Also Work With Small Vocabularies: Probing the Linguistic Abilities of Grapheme- and Phoneme-Based Baby Llamas [7.6] トークン化のない,音素および音素に基づく言語モデルにより,強力な言語性能が得られることを示す。
以上の結果から,より言語学的に妥当な言語モデルを作成する上で,有望な方向性が示唆された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:17:44 GMT)
The Proof is in the Almond Cookies [7.5] 本稿では、ロボットや人工調理アシスタントがキッチンのシェフを支援できるように、調理レシピ(およびより一般的にはハウツー指導)の処理方法に関するケーススタディを提案する。
本稿では,ナラティブに基づく人間の感覚形成過程を模倣する,計算レシピ理解のための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:25:35 GMT)
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing [7.4] JoyGenは、対面生成のための2段階のフレームワークである。
第1段階では、3次元再構成モデルとオーディオ2モーションモデルにより同一性および表現係数が予測される。
第2段階では,顔生成における口唇音の正確な同期を包括的に監視する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:14:52 GMT)
ASKCOS: an open source software suite for synthesis planning [7.2] 合成計画のためのオープンソースソフトウェアスイートであるASKCOSの最新バージョンについて詳述する。
4つの1段階のレトロシンセシスモデルが、対話型計画モードと自動計画モードの両方の基礎を形成している。
ASKCOSのようなCASPツールは、現代の化学研究の重要な部分であると考えています。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:38:03 GMT)
A Minimal Subset Approach for Efficient and Scalable Loop Closure [7.1] 大規模および長期のミッションにおけるループ検出は、計算的に要求される。
キーフレームサンプリングは、バックエンドシステムに格納され、処理されるフレームの数を減らし、これを緩和する。
本稿では,ポーズグラフ最適化とループ閉鎖検出の併用問題に対する最適化サンプリングのギャップを解消する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:48:01 GMT)
Active learning of neural population dynamics using two-photon holographic optogenetics [7.0] 神経集団動態を同定するための最も効果的な光刺激パターンを決定する方法を開発した。
我々は、実データと合成データの両方にアプローチを示し、いくつかのケースでは、所定の予測力に到達するために必要なデータの量を2倍に減らすことができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:22:43 GMT)
Enhancing Cross-Dataset Performance of Distracted Driving Detection With Score Softmax Classifier And Dynamic Gaussian Smoothing Supervision [6.9] ディープニューラルネットワークは、車内ドライバのリアルタイム監視を可能にし、邪魔や疲労、潜在的な危険のタイムリーな予測を容易にする。
最近の研究では、限られたデータサンプルとバックグラウンドノイズにより、信頼性の低いクロスデータセットドライバの動作認識が明らかにされている。
Score-Softmax分類器を提案し、カテゴリ独立性を高めてモデル過信を低減する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:56:43 GMT)
A Unifying View of Linear Function Approximation in Off-Policy RL Through Matrix Splitting and Preconditioning [6.8] 我々は線形値関数近似に注目し、新しい視点を提供する。
目的値関数で更新数を増やすことは、基本的には定型プリコンディショナーからデータ機能適応型プリコンディショナーへの移行を表す。
この統一的な視点は、これらのアルゴリズムの収束条件の分析を単純化する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:03:21 GMT)
Grand Challenges in Immersive Technologies for Cultural Heritage [6.7] 没入型技術の統合は、文化遺産の提示方法を変えてきた。
これらのテクノロジの採用は、さまざまな課題や潜在的なリスクをもたらします。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:56:22 GMT)
Multivariate Time Series Anomaly Detection using DiffGAN Model [6.6] DiffGANを提案する。これは拡散モデルのデノイザーに生成的対向ネットワークコンポーネントを付加する。
複数の最先端再構成モデルと比較して、DiffGANは異常検出において優れた性能を発揮することを示す実験結果が得られた。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 01:20:38 GMT)
PG-SAG: Parallel Gaussian Splatting for Fine-Grained Large-Scale Urban Buildings Reconstruction via Semantic-Aware Grouping [6.2] 本稿では,分割処理とカーネル最適化の両方にセマンティックキューをフル活用した並列ガウス分割手法PG-SAGを提案する。
その結果, 建物表面の再構成におけるPG-SAGの優れた性能を示すことができた。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:40:16 GMT)
CUQDS: Conformal Uncertainty Quantification under Distribution Shift for Trajectory Prediction [6.0] 軌道予測モデルは、有限未来の軌道とその関連する不確実性の両方をオンライン環境で推測することができる。
本研究では、予測された軌道の不確かさを定量化するために、分散シフトフレームワークCUQDSのコンフォーマル不確実性定量化を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:17:13 GMT)
KG4Diagnosis: A Hierarchical Multi-Agent LLM Framework with Knowledge Graph Enhancement for Medical Diagnosis [6.0] KG4Diagnosisは、大規模言語モデルと知識グラフの自動構築を組み合わせた、新しい階層型マルチエージェントフレームワークである。
本フレームワークは,2層構造を用いて実世界の医療システムをミラーリングする。初期評価とトリアージのためのGPエージェントであり,特定のドメインにおける深度診断のための特殊なエージェントと協調する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 00:07:09 GMT)
Advancing Pancreatic Cancer Prediction with a Next Visit Token Prediction Head on top of Med-BERT [5.9] 我々は,病気のバイナリ予測タスクをトークン予測タスクと次のビジターマスクトークン予測タスクに再構成し,Med-BERTの事前学習タスクフォーマットに適合させた。
Med-BERT-Sumと呼ばれるトークン予測タスクへのタスクの再構築は、少数のシナリオとより大きなデータサンプルの両方において、わずかに優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:32:05 GMT)
Toward Robust Early Detection of Alzheimer's Disease via an Integrated Multimodal Learning Approach [5.9] アルツハイマー病(英: Alzheimer's Disease、AD)は、記憶障害、執行機能障害、性格変化を特徴とする複雑な神経変性疾患である。
本研究では,臨床,認知,神経画像,脳波データを統合した高度なマルチモーダル分類モデルを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:07:10 GMT)
An Investigation into Value Misalignment in LLM-Generated Texts for Cultural Heritage [5.9] 大型言語モデル(LLM)は、文化遺産に関連するタスクでますます普及している。
古文書の翻訳、口伝の保存、教育内容の制作など、歴史的記念物の記述を作成するのに用いられる。
しかし、歴史的事実の誤表現、文化的なアイデンティティの侵食、複雑な文化的な物語の単純化など、文化的な価値の誤認識は発生した文献に存在している可能性がある。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:35:32 GMT)
A Reference Architecture for Governance of Cloud Native Applications [5.8] クラウドネイティブアプリケーション(CNA)間のガバナンスを合理化するために設計された包括的な参照アーキテクチャを導入します。
私たちのアーキテクチャは、管理をCNAフレームワークにシームレスに統合し、"バタリーインクルード"な哲学を固執します。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:58:23 GMT)
ESG Rating Disagreement and Corporate Total Factor Productivity:Inference and Prediction [5.6] Disは減少する。
特に、国有、資本集約、低汚染、ハイテク企業において。
グリーンイノベーションは、Dis onの減衰効果を強化する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:29:27 GMT)
Parallelized Midpoint Randomization for Langevin Monte Carlo [5.5] 本稿では,対数密度勾配の並列評価が可能なフレームワークにおいて,対象確率密度関数からのサンプリング問題について検討する。
サンプリングとターゲット密度の間のワッサーシュタイン距離の上限を導出する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:22:20 GMT)
CrossView-GS: Cross-view Gaussian Splatting For Large-scale Scene Reconstruction [5.5] 3D Gaussian Splatting (3DGS) はシーンの表現と再構築に顕著な手法である。
両ブランチ融合に基づく大規模シーン再構成のための新しいクロスビューガウス分割法を提案する。
本手法は,最先端の手法と比較して,新規なビュー合成における優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:24:59 GMT)
Fusion DeepONet: A Data-Efficient Neural Operator for Geometry-Dependent Hypersonic Flows on Arbitrary Grids [5.4] 限られたデータで幾何依存の超音速流れ場を学習するための高度なニューラル演算子モデルを評価する。
We developed a novel framework called Fusion DeepONet, which leverages neural field concept and effectiveizes across various geometries。
トレーニングデータの不足にもかかわらず、Fusion DeepONetは均一グリッド上のパラメータ条件付きU-Netに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:15:23 GMT)
ANTHROPOS-V: benchmarking the novel task of Crowd Volume Estimation [5.4] 本稿では,RGB画像のみを用いて,群集の集合体容積を推定する手法として,群集容積推定(imation)という新たなタスクを導入する。
イベント管理と公共安全に加えて、CVEは体重の近似、インフラのストレスアセスメントのような重量に敏感なアプリケーションのロック解除、重量バランスの確保にも役立てることができる。
本稿では,様々な都市環境における群衆を対象とする合成ビデオデータセットであるANTHROPOS-Vを用いたCVEの最初のベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:57:28 GMT)
Integrating Domain Knowledge into Large Language Models for Enhanced Fashion Recommendations [5.3] 本稿では,ファッションアドバイスをパーソナライズする能力を高めるために,自動プロンプト生成トレーニング戦略を利用するFashion Large Language Model(FLLM)を紹介する。
提案手法は, 精度, 解釈可能性, 数発の学習能力において, 既存のモデルを超えていることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:49:44 GMT)
Evaluating the Ability of Large Language Models to Generate Verifiable Specifications in VeriFast [5.0] 本稿では,VeriFast で検証可能な C プログラムの仕様作成における OpenAI の GPT-4o モデルの有効性について検討する。
以上の結果から,GPT-4oで生成された仕様は機能的挙動を保っているが,検証に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:19:03 GMT)
A Conceptual Algorithm for Applying Ethical Principles of AI to Medical Practice [5.0] AIを利用するツールは、複数のドメインにまたがる専門家レベルのパフォーマンスに、ますます一致するか、超えている。
これらのシステムは、人口、人種、社会経済の境界を越えたケア提供の格差を減らすことを約束している。
このようなAIツールの民主化は、ケアコストを削減し、リソース割り当てを最適化し、ケアの質を向上させる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:06:22 GMT)
LogicAD: Explainable Anomaly Detection via VLM-based Text Feature Extraction [5.0] 自動回帰マルチモーダル視覚言語モデル(AVLM)は、視覚的推論における異常なパフォーマンスのために、将来的な代替手段を提供する。
本研究では,AVLMを用いて論理的異常検出を行い,その課題に適していることを示す。
我々は、AUROCが86.4%、F1-maxが83.7%の公開ベンチマークであるMVTec LOCO ADにおいて、異常の説明とともにSOTA性能を達成する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:40:41 GMT)
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning [5.0] 画像キャプションはコンピュータビジョンと自然言語処理の交差において重要な課題である。
本稿では,ドメイン固有知識と一般知識を統合する新しいエージェント強化モデル協調フレームワークを提案する。
放射線学レポート生成実験の結果,提案手法の有効性が検証された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:38:01 GMT)
Lindbladian dynamics with loss of quantum jumps [4.9] 本研究では,ポストセレクション実験からのジャンプを部分的に排除し,バランス破りのダイナミクスについて検討する。
この力学を説明するために、非線形リンドブラッドマスター方程式(NLME)は量子軌道法から導かれる。
NLMEは、量子軌道法よりも分析学的に有利である。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:52:43 GMT)
BARTPredict: Empowering IoT Security with LLM-Driven Cyber Threat Prediction [4.8] IoT(Internet of Things)テクノロジの統合は運用上の進歩につながったが、サイバーセキュリティの脅威に対する新たな脆弱性も導入した。
侵入検知システムは、しばしば反応し、ネットワーク内で観察される特定のパターンや異常によって引き起こされる。
本稿では,事前学習型大規模言語モデル(LLM)を応用した,革新的な侵入予測フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:37:39 GMT)
Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning [4.8] 金融、ヘルスケア、ロボティクスといった分野では、最悪のシナリオを管理することが重要です。
分散強化学習(DRL)は、リスク感受性を意思決定プロセスに組み込む自然な枠組みを提供する。
より広範な静的スペクトルリスク対策(SRM)を最適化する収束保証付きDRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:25:41 GMT)
Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study [4.8] 本研究では,空間的タスクにおけるいくつかの高度なモデルの性能を探索し,比較するために,新しいマルチタスク空間評価データセットを提案する。
データセットには、空間的理解や単純なルート計画など、12の異なるタスクタイプが含まれており、それぞれが検証され、正確な答えを持っている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:03:32 GMT)
Adaptive Meta-learning-based Adversarial Training for Robust Automatic Modulation Classification [4.8] メタラーニングに基づく自動変調分類(AMC)モデルのための逆トレーニングフレームワークを提案する。
以上の結果から,このトレーニングフレームワークは従来のAMCモデルの対戦型トレーニングよりもオンライントレーニング時間が少なく,堅牢性と正確性に優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:28:33 GMT)
A Hassle-free Algorithm for Private Learning in Practice: Don't Use Tree Aggregation, Use BLTs [4.7] 本稿では,最近導入されたBuffered Linear Toeplitz (BLT) メカニズムをマルチ参加シナリオに拡張する。
我々のBLT-DP-FTRLは、木集約の使いやすさを維持しつつ、実用性とプライバシの観点から行列の分解にほぼ一致する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:48:38 GMT)
Human and Machine: How Software Engineers Perceive and Engage with AI-Assisted Code Reviews Compared to Their Peers [4.7] 本稿では,Large Language Model (LLM) を利用したコードレビューにおいて,ソフトウェアエンジニアがどのように認識し,関与しているかを検討する。
コードレビューにおけるエンゲージメントは多次元であり、認知的、感情的、行動的な側面にまたがっていることがわかった。
我々の発見は、AIツールがSE社会技術プロセスにどのように影響しているかをより深く理解するのに役立ちます。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:42:51 GMT)
Speech Retrieval-Augmented Generation without Automatic Speech Recognition [4.7] SpeechRAGは、音声データに対するオープンクエスト応答のために設計された新しいフレームワークである。
提案手法は,事前学習した音声エンコーダを,凍結した大言語モデルに入力した音声アダプタに微調整する。
テキストと音声の埋め込み空間を整列させることで、音声検索者はテキストベースのクエリから音声を直接検索する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:18:30 GMT)
A stable phase-locking-free single beam optical lattice with multiple configurations [4.6] 我々は,n次元の面対称および大きな頂点角を持つプリズムを1つのレーザビームで通過させることにより,光学格子を実装する位相ロックフリー方式を報告した。
三角形格子や10倍対称性を持つ準結晶格子を含む様々な格子構成を示す。
いずれの場合も、安定度測定は1.14%未満の格子定数の変化を示し、1.61%未満の格子位置のドリフトを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:52:59 GMT)
Adaptive Anomaly Detection for Identifying Attacks in Cyber-Physical Systems: A Systematic Literature Review [4.6] 本稿では,適応異常検出(Adaptive Anomaly Detection, AAD)研究の体系的文献レビュー(SLR)について述べる。
AADは、進化するサイバー攻撃を検出する最も有望な技術の一つである。
本稿では,攻撃タイプ,CPSアプリケーション,学習パラダイム,データ管理,アルゴリズムを考慮した新しい分類法を提案する。
我々は、研究者が最先端の技術を身につけるのを手助けし、実践者がこの分野の最近の進歩に親しむのを助けることを目的としている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:56:28 GMT)
Inversely Learning Transferable Rewards via Abstracted States [4.5] 逆強化学習(IRL)は、行動データから離散領域と連続領域の両方において、基礎となる報酬を正確に学習する方向に大きく進歩している。
ロボットアプリケーションのコンテキストでは、ロボットをスクラッチからプログラミングすることなく、新しいタスクを含む処理ラインに統合するのに役立つ。
ドメインの2つ以上の異なるインスタンスにおける行動軌跡から抽象的な報酬関数を逆学習する手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:00:21 GMT)
FS-Net: Full Scale Network and Adaptive Threshold for Improving Extraction of Micro-Retinal Vessel Structures [4.5] 網膜血管の分節は独特の課題を呈する。
最近のニューラルネットワークアプローチは、ローカルとグローバルプロパティのバランスをとるのに苦労している。
エンコーダ・デコーダニューラルネットワークアーキテクチャに基づく包括的マイクロ容器抽出機構を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:30:43 GMT)
EAUWSeg: Eliminating annotation uncertainty in weakly-supervised medical image segmentation [4.3] 正確なピクセル間ラベルではなく、粗いアノテーションのみを必要とするため、弱く管理された医用画像のセグメンテーションが勢いを増している。
本稿では,その学習フレームワークEAUWSegと結合して,アノテーションの不確実性を排除した新しい弱いアノテーション手法を提案する。
EAUWSegは、既存の弱教師付きセグメンテーション法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:21:02 GMT)
IAM: Enhancing RGB-D Instance Segmentation with New Benchmarks [4.3] RGB-Dセグメンテーションは、RGBのみの手法よりもリッチなシーン理解を約束する。
インスタンスレベルのRGB-Dセグメンテーションデータセットは比較的少ない。
インスタンスレベルで区別された3つのRGB-Dインスタンスセグメンテーションベンチマークを導入する。
本稿では,RGB-Dデータ統合のための簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:03:24 GMT)
Empirical Asset Pricing via Ensemble Gaussian Process Regression [4.3] 我々のアンサンブル学習アプローチは、GPR推論に固有の計算複雑性を著しく減少させる。
本手法は,統計的,経済的に既存の機械学習モデルを支配している。
これは不確実な投資家にアピールし、S&P500を上回る等級と重み付けの予測対象ポートフォリオを圧倒的に上回っている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:04:20 GMT)
ViiNeuS: Volumetric Initialization for Implicit Neural Surface reconstruction of urban scenes with limited image overlap [4.2] ViiNeuSは、符号付き距離場を効率よく初期化する、新しいハイブリッドな暗黙曲面学習法である。
ViiNeuSは、訓練の2倍の速さで、様々な都市景観の正確な3次元表面表現を学習できることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:18:36 GMT)
Restoring Heisenberg-Limited Precision in Non-Markovian Open Quantum Systems via Dynamical Decoupling [4.2] 測定精度の究極の量子極限であるハイゼンベルクスケーリングは、非マルコフ雑音の下で量子メートル法で回復することができる。
我々は,減衰したJaynes-Cummingsモデルに適用し,メモリ効果を軽減し,複雑な非マルコフ環境における測定精度を維持する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:37:15 GMT)
LMS-AutoTSF: Learnable Multi-Scale Decomposition and Integrated Autocorrelation for Time Series Forecasting [4.1] 自動相関を組み込んだ新しい時系列予測アーキテクチャであるLMS-AutoTSFを紹介する。
事前定義されたトレンドと季節的なコンポーネントに依存するモデルとは異なり、LMS-AutoTSFはスケール毎に2つの独立したエンコーダを使用する。
このアプローチにおける重要な革新は、時間ステップの差分を計算することによって達成される自己相関の統合です。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:22:31 GMT)
Efficient Deterministic Renewable Energy Forecasting Guided by Multiple-Location Weather Data [4.0] 本稿では,複数の発電施設を対象とした風力・太陽光発電予測手法を提案する。
気象及びエネルギー関連時系列の時間的処理にU字型の時間的畳み込み自動エンコーダアーキテクチャを用いる。
5つのデータセットの日平均太陽・風力エネルギー予測シナリオを実験により評価し,提案手法が最上位となることを示した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:54:37 GMT)
CarbonChat: Large Language Model-Based Corporate Carbon Emission Analysis and Climate Knowledge Q&A System [4.0] 大規模言語モデルに基づくコーポレートカーボンエミッション分析と気候知識Q&Aシステムを提案する。
ルールベースおよび長文文書のセグメンテーションを扱うために,多種多様なインデックスモジュール構築法を提案する。
炭素排出量分析のための14の次元が確立されており、レポートの要約、関連性評価、カスタマイズされた応答を可能にしている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:45:38 GMT)
PriveShield: Enhancing User Privacy Using Automatic Isolated Profiles in Browsers [3.9] PriveShieldは、情報収集サイクルを妨害する軽量なプライバシーメカニズムである。
評価の結果,これらのシナリオの91%で再ターゲティング広告を防止できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:29:33 GMT)
Social Processes: Probabilistic Meta-learning for Adaptive Multiparty Interaction Forecasting [3.9] 社会プロセス(SP)モデルを導入し、全てのグループメンバーに対して、将来のマルチモーダルキューの分布を予測する。
また,現実的な合成データセットを用いて,SPモデルの出力および潜時空間における一般化能力を解析した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:34:53 GMT)
A PLMs based protein retrieval framework [3.9] 本稿では,配列類似性に対するバイアスを緩和する新規なタンパク質検索フレームワークを提案する。
我々のフレームワークは、タンパク質の配列を高次元の特徴空間に埋め込むために、タンパク質言語モデル(PLM)を主導的に活用する。
大規模な実験により、我々のフレームワークは類似タンパク質と異種タンパク質の両方を等しく回収できることが示された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:27:44 GMT)
Regulating radiology AI medical devices that evolve in their lifecycle [3.8] 深層学習モデルは、画像特性のわずかなバリエーションにも非常に影響を受けやすい。
最近まで、米国と欧州連合でそのようなモデル更新を実施することは、再承認の申請を意味していた。
2024年、これらの領域の規制フレームワークにおけるいくつかの開発が実施され、モデル更新を安全にロールアウトするプロセスを合理化することを約束している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:53:02 GMT)
Test Input Validation for Vision-based DL Systems: An Active Learning Approach [3.8] ディープラーニング(DL)システムをテストするには、広範囲で多様だが有効なテスト入力が必要である。
本稿では,視覚に基づくDLシステムに対するテスト入力検証手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:50:43 GMT)
Detecting Music Performance Errors with Transformers [3.7] 既存の音楽誤り検出ツールは自動アライメントに依存している。
音楽エラー検出モデルをトレーニングするのに十分なデータが不足している。
本稿では,大規模な合成音楽誤りデータセットを作成することのできる新しいデータ生成手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:04:20 GMT)
MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators [3.6] フルグラフ上でのグラフ畳み込みネットワーク(GCN)のトレーニングは難しい。
機能テンソルは簡単にメモリを爆発させ、現代のアクセラレーターの通信帯域をブロックすることができる。
トレーニングのワークフロー GCNはスパース演算と密度行列演算を交互に行う。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:54:46 GMT)
Nonparametric estimation of a factorizable density using diffusion models [3.6] 本稿では,非パラメトリック密度推定に対する暗黙的なアプローチとして拡散モデルについて検討する。
拡散モデルから構成した暗黙密度推定器は、分解構造に適応し、最小値の最適速度を達成することを示す。
推定器を構築する際には、疎ウェイトシェアリングニューラルネットワークアーキテクチャを設計する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:32:19 GMT)
Comparative Performance Analysis of Quantum Machine Learning Architectures for Credit Card Fraud Detection [3.5] 本研究では3つのQML分類器の性能に異なる量子特徴写像とアンザッツ構成がどう影響するかを検討する。
VQCは引き続き強力な分類結果を示し、F1スコアは0.88であり、SQNNも有望な結果をもたらす。
対照的に、EQNNは、非標準化されたデータによってもたらされる課題を強調しながら、堅牢な結果を生み出すのに苦労している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:36:44 GMT)
The Impact of Student Writing Assessment Literacy on Psychological Factors: An Ordinal Logistic Regression Analysis [3.5] 学生の文章評価リテラシー(SWAL)のレベルは,自己効力と達成動機に肯定的に関連していた。
これらの知見は第2言語(L2)の書き方に大きな影響を及ぼす。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:41:18 GMT)
Recommender systems and reinforcement learning for human-building interaction and context-aware support: A text mining-driven review of scientific literature [3.5] 本研究では,テキストマイニングと自然言語処理(NLP)技術を用いてレコメンデーションシステムと強化学習(RL)の関連性を検討することを目的とする。
この研究は、ScienceDirectデータベースから27,595の論文を分析し、空間最適化、位置推奨、パーソナライズされた制御提案のためのレコメンデーションシステムとRLの広範な使用を明らかにした。
イノベーションのためのフィールドとしては、予測的メンテナンス、ビルド関連製品レコメンデーション、ユーザフィードバックに基づいた睡眠や生産性の向上など、特定のニーズに適した環境の最適化などがある。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:45:45 GMT)
MobileNetV2: A lightweight classification model for home-based sleep apnea screening [3.5] 本研究は、心電図(ECG)と呼吸信号から抽出した特徴を早期OSAスクリーニングに利用した、新しい軽量ニューラルネットワークモデルを提案する。
ECG信号は睡眠段階を予測するための特徴スペクトログラムを生成するのに使用され、呼吸信号は睡眠関連呼吸異常を検出するために用いられる。
これらの予測を統合することで、AHI(apnea-hypopnea index)を精度良く算出し、OSAの正確な診断を容易にする。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:55:34 GMT)
Heuristic-Induced Multimodal Risk Distribution Jailbreak Attack for Multimodal Large Language Models [3.5] 本研究では,HIMRDと呼ばれる2つの要素からなるマルチモーダルジェイルブレイク攻撃手法を提案する。
理解促進プロンプトは、MLLMが悪意のあるプロンプトと誘導プロンプトを再構築するのに役立ち、肯定的な出力の可能性を高める。
このアプローチはMLLMの脆弱性を効果的に発見し、人気の高い7つのオープンソースMLLMの平均攻撃成功率は90%、人気の高い3つのオープンソースMLLMの平均攻撃成功率は約68%に達する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:54:37 GMT)
Bridging Classification and Segmentation in Osteosarcoma Assessment via Foundation and Discrete Diffusion Models [3.2] パッチ分類と領域分割のギャップを埋める新しいフレームワークであるFDDMを紹介する。
FDDMは2つの段階で機能する: パッチベースの分類、次いでリージョンベースの改良により、クロスパッチ情報通信を可能にする。
このフレームワークは骨肉腫評価の新しいベンチマークを設定し、基礎モデルと拡散に基づく改善の可能性を強調している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:06:18 GMT)
Noise-Mitigated Variational Quantum Eigensolver with Pre-training and Zero-Noise Extrapolation [3.2] 雑音環境下での分子基底状態エネルギーの正確な計算に有効なノイズ緩和型変分量子固有解器を提案する。
我々は、ゼロノイズ外挿を用いて量子ノイズを緩和し、ニューラルネットワークと組み合わせ、ノイズ適合機能の精度を向上させる。
その結果,本アルゴリズムは,主成分の量子固有解法よりも高い精度で,$mathcalO(10-2) sim MathcalO(10-1)$の範囲内でノイズ誤差を抑えることができることがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:34:36 GMT)
Magnetoelectric effect in van der Waals magnets [3.0] 磁力(ME)効果は磁極の電気的制御を表す。
2次元(2次元)のファンダーワール磁石(vdW)が新しい種類の材料として登場した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:35:15 GMT)
QuantumBind-RBFE: Accurate Relative Binding Free Energy Calculations Using Neural Network Potentials [2.9] タンパク質-リガンド結合親和性の正確な予測は、薬物発見に不可欠である。
ニューラルネットワーク電位を用いた相対自由エネルギー精度の検証を行った。
結合親和性予測における精度の向上と相関性を示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:51:02 GMT)
PSYCHE: A Multi-faceted Patient Simulation Framework for Evaluation of Psychiatric Assessment Conversational Agents [2.8] 精神科アセスメント会話エージェント(PACA)は、臨床評価における精神科医の役割をシミュレートすることを目的としている。
本稿では,(1)臨床関連性,2)倫理的安全性,3)費用効率,および4)PACAの定量的評価を可能にする新しい枠組みであるPSYCHEを提案する。
これは、シミュレーションされた患者のプロファイル、履歴、行動を定義する多面的な精神科構成に基づいて、精神科患者をシミュレートすることで達成される。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 01:38:46 GMT)
MRG: A Multi-Robot Manufacturing Digital Scene Generation Method Using Multi-Instance Point Cloud Registration [2.8] 本稿では,Multi-Robot Manufacturing Digital Scene Generation (MRG)法を初めて紹介する。
産業用ロボットの特性と製造環境に配慮し,インスタンス中心のトランスフォーマーモジュールを開発した。
効率的なスクリーニングと最適化のアルゴリズムは、最終的な登録結果を洗練するために設計されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:23:13 GMT)
Accuracy Can Lie: On the Impact of Surrogate Model in Configuration Tuning [2.7] われわれは13ヶ月の期間にわたって,過去最大規模の実証研究を行っている。
高い精度が実際にチューニング結果の改善に繋がらないケースがかなりの数存在する。
多くのチューナーで選択されたモデルは準最適であり、チューニング品質を著しく向上させるために要求される精度はモデル精度の範囲によって異なる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:57:20 GMT)
Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization [2.7] CVGL(Cross-View Geo-Localization)は、最もよく似たGPSタグ付き衛星画像を取得することで、ドローン画像のローカライゼーションを決定する。
既存の手法は、モデルの性能を改善する際に、計算と記憶の要求が増大する問題をしばしば見落としている。
マルチレベル・エンベディング・アライメント・ネットワーク(MEAN)と呼ばれる軽量なアライメント・ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:05:44 GMT)
Small Language Models (SLMs) Can Still Pack a Punch: A survey [2.7] 約160の論文のサーベイでは、10億から80億のパラメータ範囲でSLM(Small Language Models)のファミリーを提示している。
我々は,タスクに依存しない汎用SLM,タスク固有のSLM,および,コミュニティがモデルを構築するためのガイドとなるSLMを作成する技術について検討する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:53:57 GMT)
Laparoscopic Scene Analysis for Intraoperative Visualisation of Gamma Probe Signals in Minimally Invasive Cancer Surgery [2.7] がんは世界中で深刻な健康上の課題であり、英国では2分ごとに新たな診断が行われる。
手術はがんの主要な治療法の1つである。
外科医は、がん組織や転移の切除を誘導するために、触覚と裸眼に頼っている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:50:15 GMT)
FLAME: Financial Large-Language Model Assessment and Metrics Evaluation [2.6] 本稿では,中国における総合的なLLM評価システムであるFLAMEを紹介する。
FLAME-Cerは14種類の認証ファイナンスをカバーしており、合計で約16,000の慎重に選択された質問がある。
FLAME-Sceは10の主要な金融ビジネスシナリオ、21の二次金融ビジネスシナリオ、100近い第三次金融アプリケーションタスクの包括的な評価セットで構成されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:17:23 GMT)
Detecting and Mitigating Adversarial Attacks on Deep Learning-Based MRI Reconstruction Without Any Retraining [2.6] 本稿では,MRI再建モデルに対する逆行性攻撃を再訓練せずに検出・緩和するための新しいアプローチを提案する。
我々の検出戦略は循環測定一貫性の考え方に基づいている。
提案手法は,異なるデータセット間での対向摂動の影響を著しく低減することを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:23:52 GMT)
Qubit-assisted quantum metrology under a time-reversal strategy [2.5] 本稿では,プローブシステムの2段階のジョイント進化と,量子量子ビットおよび量子計測に基づく量子メトロジープロトコルを提案する。
プローブ系に符号化された位相パラメータに関する量子フィッシャー情報(QFI)は、位相発生器の正方形の期待値によって決定されることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:47:29 GMT)
LEAST: "Local" text-conditioned image style transfer [2.5] 我々は,テキスト条件付き画像編集とスタイル転送技術について,正確な「ローカル」スタイル転送のためのユーザプロンプトのきめ細かい理解に基づいて評価した。
ユーザの意図に合わせた"ローカル"なトランスファーのためのエンドツーエンドパイプラインを開発しました。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:34:35 GMT)
Creating Artificial Students that Never Existed: Leveraging Large Language Models and CTGANs for Synthetic Data Generation [2.4] 総合的なデータを利用して、学習分析モデルを提供するための人工的な学生を創出できるかどうかを検討する。
本研究は,学生データに類似した高品質な合成データセットを作成する上で,これらの手法の強い可能性を示すものである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:52:51 GMT)
Latent Mutants: A large-scale study on the Interplay between mutation testing and software evolution [2.2] 我々は、潜伏変異体と呼ばれる変異体の特徴、すなわち、1つのバージョンで生き、後のリビジョンで殺される変異体について研究する。
13のオープンソースプロジェクト上でPitestによって生成された131,308のミュータントについて検討した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:44:38 GMT)
Can Synthetic Data be Fair and Private? A Comparative Study of Synthetic Data Generation and Fairness Algorithms [2.1] Debiasing CAusal Fairness (DECAF)アルゴリズムは、プライバシとフェアネスの最良のバランスを実現する。
合成データに事前処理の公正性アルゴリズムを適用することで、実際のデータに適用した場合よりも公平性が向上する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:35:58 GMT)
KeyNode-Driven Geometry Coding for Real-World Scanned Human Dynamic Mesh Compression [2.1] 実世界のスキャンされた3Dヒューマンメッシュの圧縮は、テレプレゼンス、バーチャルリアリティ、そして3Dデジタルストリーミングといったアプリケーションによって駆動される、新たな研究領域である。
本研究では,実世界の人間の動的メッシュをスキャンし,鍵ノードを組み込んだ圧縮手法を提案する。
提案手法は, 評価シーケンス全体で平均24.51%の節約率で, 最先端技術よりも大幅な改善を実現している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:22:16 GMT)
FUSED-Net: Detecting Traffic Signs with Limited Data [2.1] 本稿では,交通信号検出のための高速RCNN「FUSED-Net」を提案する。
従来のアプローチとは異なり、トレーニング中にすべてのパラメータを凍結しないようにし、限られたサンプルからFUSED-Netを学習できるようにします。
1ショット,3ショット,5ショット,10ショットのシナリオでそれぞれ2.4倍,2.2倍,1.5倍,1.3倍の改善を実現しています。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:11:47 GMT)
Laws of thermodynamics for exponential families [2.1] 一般指数族の観点から熱力学の法則を発展させる。
指数族が熱力学と学習平衡を特徴付けるよく知られた方法を拡張する。
これらの考え方は分布シフトの定量化と対処に幅広い意味を持っている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:36:09 GMT)
Catch Causal Signals from Edges for Label Imbalance in Graph Classification [2.0] エッジ情報を利用して、元のグラフから因果部分グラフをアンタングルする。
我々の設計は、ラベルの不均衡問題を伴うグラフ分類タスクの性能改善につながる。
我々は,実単語データセット PTC,Tox21,ogbg-molhiv に対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:09:58 GMT)
Multimodal Contrastive Representation Learning in Augmented Biomedical Knowledge Graphs [2.0] PrimeKG++はマルチモーダルデータを組み込んだ豊富な知識グラフである。
提案手法は強い一般化可能性を示し,未知のノードに対しても正確なリンク予測を可能にする。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:29:12 GMT)
Coherent control of a superconducting qubit using light [2.0] 低温環境で動作している超伝導マイクロ波量子ビットは、量子プロセッサノードの候補として期待されている。
超伝導量子ビットのコヒーレント光制御を実証する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:04:07 GMT)
Ensemble Learning for Microbubble Localization in Super-Resolution Ultrasound [1.9] 超解像超音波(SR-US)は、微小血管と血流を高空間分解能で捉えるための強力なイメージング技術である。
本稿では,マイクロバブル(MB)のローカライゼーションを高めるためのアンサンブル学習手法の可能性について検討する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:55:39 GMT)
MicroFlow: An Efficient Rust-Based Inference Engine for TinyML [1.9] 我々は、Rustプログラミング言語を使用した組み込みシステムにニューラルネットワーク(NN)をデプロイするためのオープンソースのフレームワークであるMicroFlowを紹介する。
提案するフレームワークは、リソース制約の高いデバイスへのNNのデプロイを成功させる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:45:08 GMT)
Telegram as a Battlefield: Kremlin-related Communications during the Russia-Ukraine Conflict [1.9] 本稿では,プロクレムリンチャネルとアンチクレムリンテレグラムチャネルの両方からのポストのデータセットを提案する。
データセットは404のプロクレムリンチャネルと4,109,645のポスト、114の反クレムリンチャネルと1,117,768のポストで構成されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:31:59 GMT)
Transformer-Driven Inverse Problem Transform for Fast Blind Hyperspectral Image Dehazing [1.9] ハイパースペクトル脱ハージング(HyDHZ)は、その後の識別および分類作業を容易にする重要な信号処理技術となっている。
本稿では,HyDHZに強力な空間スペクトル変換器を初めて導入する。
実験では、色歪みの少ないT2HyDHZの優位性を実証した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:52:51 GMT)
Google is all you need: Semi-Supervised Transfer Learning Strategy For Light Multimodal Multi-Task Classification Model [1.8] 本研究では,複数のラベルを単一画像にアサインする頑健なマルチラベル分類システムを提案する。
本稿では,高度な画像認識アルゴリズムを自然言語処理(NLP)モデルと組み合わせたマルチモーダル分類器を提案する。
提案する分類モデルは,画像処理のための畳み込みニューラルネットワーク(CNN)と,テキスト記述を解析するためのNLP技術を組み合わせたものである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:11:17 GMT)
Quantum Error Correction Without Encoding via the Circulant Structure of Pauli Noise and the Fast Fourier Transform [1.6] 本研究では,量子コンピュータの出力分布を補正する手法を紹介する。
より物理的な量子ビットへの論理量子ビットの符号化は不要である。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:58:19 GMT)
The State of Data Curation at NeurIPS: An Assessment of Dataset Development Practices in the Datasets and Benchmarks Track [1.6] この研究は、データキュレーションのレンズを通してNeurIPSにおけるデータセット開発プラクティスの分析を提供する。
本稿では,ルーブリックとツールキットからなるデータセットドキュメンテーションの評価フレームワークを提案する。
結果は、環境のフットプリント、倫理的考慮、データ管理に関するドキュメントの必要性がさらに高まっていることを示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:12:16 GMT)
Uncertainty and Energy based Loss Guided Semi-Supervised Semantic Segmentation [1.5] 半教師付きセマンティックセグメンテーション(SS)はラベル付き画像とラベルなし画像の両方を利用して、退屈で高価なピクセルレベルのアノテーション問題を克服する。
この研究は、交叉ユニオン擬教師付きネットワークにおけるアレータリックまたはデータ不確実性とエネルギーベースモデリングを用いる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:18:38 GMT)
Recursive Decomposition of Logical Thoughts: Framework for Superior Reasoning and Knowledge Propagation in Large Language Models [1.5] RDoLTは大規模言語モデルの推論性能を大幅に向上させる新しいフレームワークである。
RDoLTは、(1)複雑な推論タスクを進歩的複雑性のサブタスクに分解すること、(2)最も有望な推論思考を特定するための高度な選択とスコアリング機構を使用すること、(3)人間の学習を模倣する知識伝達モジュールを統合すること、の3つの主要なイノベーションに基づいて構築されている。
提案手法は,GSM8K,SVAMP,MultiArithm,LastLetterConcatenation,Gaokao2023 Mathなど,複数のベンチマークで評価された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:55:44 GMT)
TryOffAnyone: Tiled Cloth Generation from a Dressed Person [1.5] 高忠実なタイル付き衣料品画像は、パーソナライズされたレコメンデーション、服装構成、バーチャルトライオンシステムに不可欠である。
本研究では, 微調整型安定拡散モデルを用いた新しい手法を提案する。
本手法は,服飾用マスクを統合し,対象の衣服を効果的に分離・処理する,一段ネットワーク設計の合理化を特徴とする。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:34:09 GMT)
3D Cloud reconstruction through geospatially-aware Masked Autoencoders [1.4] 本研究では,MSG/SEVIRIの静止画像とCloudSat/CPRの雲面のレーダ反射率測定を利用して3次元雲構造を再構成する。
まず、自己教師あり学習法(SSL)の手法をMAE(Masked Autoencoders)とSatMAE(SatMAE)に応用し、マッチングした画像のペアにモデルを微調整する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:26:04 GMT)
Large Language Models: An Applied Econometric Framework [1.3] 我々はこの問題に答えるための計量的枠組みを開発する。
LLMのトレーニングデータセットと研究者のサンプルの間に「漏れがない」という条件下では、予測問題にLLMを使用することは有効である。
これらの要件は厳密であり、それらが破られると、LLMの制限は信頼できない経験的推定をもたらす。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:19:58 GMT)
Steganography and Probabilistic Risk Analysis: A Game Theoretical Framework for Quantifying Adversary Advantage and Impact [1.3] 本研究では, 防衛企業と敵との戦略的相互作用を分析するための, 新たなステガノグラフィーゲーム理論モデルを提案する。
非協力的なゲームとしてシナリオをフレーミングすることにより、双方にとって最適な戦略を体系的に評価する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:27:30 GMT)
Trapped-Ion Quantum Simulation of Electron Transfer Models with Tunable Dissipation [1.2] 我々は,多種のイオン結晶を用いた分子電子移動のパラダイムモデルを実験的にシミュレーションした。
我々は,スピン励起のリアルタイムダイナミクスを観察し,アディバチティーと緩和ダイナミクスのいくつかの状態における伝達速度を測定した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:58:59 GMT)
K-Gate Lock: Multi-Key Logic Locking Using Input Encoding Against Oracle-Guided Attacks [1.1] K-Gate Lockは、複数のキーを使用して入力パターンをエンコードする。
複数のキーを使用すると、回路はオラクル誘導攻撃に対して安全になり、攻撃者は指数関数的に時間のかかるブルートフォースサーチに努力するようになる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 22:07:38 GMT)
Event-based backpropagation on the neuromorphic platform SpiNNaker2 [1.1] EventPropはスパイクニューラルネットワーク(SNN)におけるイベントベースのバックプロパゲーションのためのアルゴリズム
本実装では, 微分方程式とその共役の離散バージョンを用いて, 漏洩した積分・発火ニューロンの多層ネットワークを計算した。
我々は,Yin Yangデータセットを用いたSNNのバッチ並列化オンチップトレーニングの概念実証を行った。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:07:41 GMT)
SymbolNet: Neural Symbolic Regression with Adaptive Dynamic Pruning for Compression [1.0] モデル圧縮技術として特別に設計された記号回帰に対するニューラルネットワークアプローチである$ttSymbolNet$を提案する。
このフレームワークは、単一のトレーニングプロセスにおいてモデルウェイト、入力特徴、数学的演算子の動的プルーニングを可能にする。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:27:46 GMT)
Deep Clustering via Community Detection [1.0] 本稿では,コミュニティ検出によるディープクラスタリングの新たなアプローチを提案する。
多くのコミュニティを検出してクラスタ化を初期化し、その後、コミュニティのマージによって徐々にクラスタを拡大する。
これは、高い擬似ラベルの純粋さの固有の利点があり、自己監督のパフォーマンスに欠かせない。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:56:12 GMT)
AVATAR: Adversarial Autoencoders with Autoregressive Refinement for Time Series Generation [0.9] AVATARは,AAE(Adversarial Autoencoders)とAutoregressive Learningを組み合わせた時系列データを生成するフレームワークである。
具体的には、オートエンコーダをスーパーバイザと統合し、デコーダが時系列データの時間的ダイナミクスを学習するのを支援するために、新しい教師付き損失を導入する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:44:13 GMT)
A little less conversation, a little more action, please: Investigating the physical common-sense of LLMs in a 3D embodied environment [0.9] 大規模言語モデル (LLM) はエージェントシステムにおける推論エンジンとしてますます使われている。
LLMにおける身体的常識推論の具体的かつ認知的な評価を初めて提示する。
シミュレーション3次元仮想実験室であるAnimal-AI環境を用いて, LLMの物理的常識推論について検討した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:29:35 GMT)
BERT4MIMO: A Foundation Model using BERT Architecture for Massive MIMO Channel State Information Prediction [0.9] 本研究では,高次元CSIデータを処理するための基盤モデルであるBERT4MIMOを提案する。
実験により,様々な無線環境におけるBERT4MIMOの有効性が示された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:22:19 GMT)
Mingling with the Good to Backdoor Federated Learning [0.9] Federated Learning(FL)は、複数のエンティティがデータセットのプライバシを保持しながらモデルを共同でトレーニングすることを可能にする、分散機械学習技術である。
本稿では,様々な防御を回避しつつ,FLにバックドアを設置可能な汎用攻撃法の設計の可能性について検討する。
具体的には、MIGOと呼ばれる攻撃的戦略に注目し、正当性を微妙にブレンドしたモデル更新を作成することを目的としている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:30:59 GMT)
From Occasional to Steady: Habit Formation Insights From a Comprehensive Fitness Study [0.8] 定期的な運動は健康の基盤として広く認められているが、一貫した運動習慣を維持するという課題は続いている。
この研究は、トゥルキエ最大のスポーツチェーンであるマルス・アスレティック・クラブ(Mars Athletic Club)のデータを利用して、体育館への出席と習慣形成のダイナミクスを調査している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:22:07 GMT)
The membership problem for constant-sized quantum correlations is undecidable [0.8] 測定結果の数と測定結果の数が固定された,一定サイズの相関関係の族が存在することを示す。
これは量子相関集合に対して与えられる記述の種類に強い制約を与える。
本証明は, 線形システム非局所ゲームにおいて, 量子自己検定法と第3著者の判定不能結果を組み合わせたものである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:04:19 GMT)
Navigation Variable-based Multi-objective Particle Swarm Optimization for UAV Path Planning with Kinematic Constraints [0.8] 無人航空機(UAV)は、UAVがタスクを完了するために従わなければならない経路を決定するため、経路計画が不可欠である。
この研究は、ナビゲーション変数に基づく多目的粒子群最適化(NMOPSO)と呼ばれる新しいアルゴリズムを導入する。
このアルゴリズムは、航法変数に基づく新しい経路表現を特徴とし、キネマティック制約を含み、UAVの操作可能な特性を利用する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:07:37 GMT)
Dynamic Feature Fusion: Combining Global Graph Structures and Local Semantics for Blockchain Fraud Detection [0.8] 本稿では,グラフに基づく表現学習と意味的特徴抽出を組み合わせた動的特徴融合モデルを提案する。
我々は,グラフ構築,時間的特徴強調,テキスト前処理を含む包括的データ処理パイプラインを開発する。
大規模な実世界のブロックチェーンデータセットの実験結果は、我々の手法が既存のベンチマークを精度、F1スコア、リコールメトリクスで上回っていることを示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:04:43 GMT)
Defending Compute Thresholds Against Legal Loopholes [0.7] 既存のAIに関する法的フレームワークは、潜在的に危険なAIモデルを特定するプロキシとして、計算しきい値のトレーニングに依存している。
モデル能力の保存や増大を図りながら、トレーニング計算の使用量を減らし得る強化手法について検討する。
これらの能力向上と計算省力化技術は、既存のトレーニング計算しきい値の法的な抜け穴となる可能性がある。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:07:21 GMT)
Globally Scalable Glacier Mapping by Deep Learning Matches Expert Delineation Accuracy [0.7] Glacier-VisionTransformer-U-Net (GlaViTU) は畳み込み変換型ディープラーニングモデルである。
合成開口レーダデータ、すなわち後方散乱と干渉コヒーレンスを追加することで、利用可能なすべての領域の精度が向上する。
世界中の氷河の9%をカバーするベンチマークデータセットをリリースしました。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:27:51 GMT)
How Toxic Can You Get? Search-based Toxicity Testing for Large Language Models [0.6] 大型言語モデル(LLM)は、有害な応答を発生させる傾向にある場合、大きな損傷を引き起こす可能性がある。
毒性に対するLSMの傾きを自動テストするフレームワークであるEvoToxについて紹介する。
我々は4つの最先端LCMを用いて定量的・定性的な実験評価を行う。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:08:49 GMT)
On-Chip Verified Quantum Computation with an Ion-Trap Quantum Processing Unit [0.5] 本稿では、量子コンピューティングの検証とベンチマークのための新しいアプローチを提示し、実験的に実証する。
従来の情報理論的にセキュアな検証プロトコルとは異なり、我々のアプローチは完全にオンチップで実装されている。
我々の結果は、短期量子デバイスにおけるよりアクセスしやすく効率的な検証とベンチマーク戦略の道を開いた。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:42:00 GMT)
BlockDialect: Block-wise Fine-grained Mixed Format for Energy-Efficient LLM Inference [0.5] 大規模言語モデル(LLM)は目覚ましい成功を収めているが、メモリ使用量や計算コストの増大は大きな課題となっている。
ブロック単位の最適な数値形式をフォーマットブックから割り当ててデータ表現を改善する,ブロック単位できめ細かな混合形式であるBlockDialectを提案する。
また、さまざまなデータ分布に対応するFP4変種(方言と同様)のフォーマットブックであるDialectFP4を導入する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:27:46 GMT)
Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map [0.5] 深層学習に基づくセマンティックセグメンテーションを用いたデジタル化の自動化手法を提案する。
このプロセスにおける重要な課題は、ディープニューラルネットワークのトレーニングに必要な地味なアノテーションの欠如である。
モデル微調整のための弱教師付き年齢追跡戦略を導入する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:55:22 GMT)
Relaxation-assisted reverse annealing on nonnegative/binary matrix factorization [0.5] 本稿では,リニアプログラミング緩和技術とリバースアニーリングを統合した改良戦略を提案する。
顔画像データセットを用いた実験により,本手法は既知の逆アニール法よりも収束性が高いことが示された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:48:35 GMT)
Signal Recovery Using a Spiked Mixture Model [0.4] 本研究では,無作為かつ雑音の多い多くの観測結果から,信号の集合を推定する問題に対処するために,スパイク混合モデル(SMM)を導入する。
我々はSMMの全てのパラメータを復元する新しい予測最大化(EM)アルゴリズムを設計する。
数値実験により,SMMが関連するデータ型は,信号回復性能の点で従来のガウス混合モデル(GMM)を上回ることがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:43:57 GMT)
Advancing privacy in learning analytics using differential privacy [0.4] 本稿では、差分プライバシー(DP)を適用して新しいフレームワークを提案することにより、学習者のデータプライバシと学習分析(LA)データとのバランスをとるという課題に対処する。
LA用に特別に設計された最初のDPフレームワークを紹介し,その実装に関する実践的なガイダンスを提供する。
我々は、このフレームワークをLA利用シナリオを通じて実演し、よく知られたLAデータセットの実験を通して、潜在的攻撃に対するデータプライバシ保護におけるDPの有効性を検証する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:36:11 GMT)
Physics-constrained coupled neural differential equations for one dimensional blood flow modeling [0.4] 計算心血管モデリングは、血流動態を理解する上で重要な役割を担っている。
有限要素法(FEM)に基づく従来の1次元モデルは、3次元平均解に比べて精度が低いことが多い。
本研究では1次元血流モデルの精度を向上させる物理制約付き機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:11:35 GMT)
Online Data Augmentation for Forecasting with Deep Learning [0.3] この研究は、ニューラルネットワークのトレーニング中に合成サンプルを生成するオンラインデータ拡張フレームワークを導入する。
トレーニングプロセスを通じて、実データと合成データのバランスの取れた表現を維持します。
オンラインデータ拡張はオフラインデータ拡張よりも予測性能が向上する、あるいは拡張アプローチがない、という実験結果が示唆されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:56:29 GMT)
A Survey on Large Language Models with some Insights on their Capabilities and Limitations [0.3] 大規模言語モデル(LLM)は、様々な言語関連タスクで顕著なパフォーマンスを示す。
LLMは、そのコア機能を超えて、創発的な能力を示す。
本稿では,これらの機能を実現する基盤となるコンポーネント,スケーリング機構,アーキテクチャ戦略について検討する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:04:49 GMT)
Counterfactual Explanation for Auto-Encoder Based Time-Series Anomaly Detection [0.3] オートエンコーダは意思決定プロセスに固有の不透明さを示し、大規模な実践を妨げている。
本研究では,機能セレクタを用いて特徴を抽出し,モデル出力にコンテキストを与える。
実験結果から,提案手法がモデル決定過程に有意義かつ有意義な洞察を与える可能性が示唆された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:30:11 GMT)
On robust recovery of signals from indirect observations [0.2] 信号集合が凸集合である状況において、どのようにしてソートの「期待できる良い」推定が構成されるかを示す。
我々は、$cal N$ が凸有界集合かスパースベクトルの集合である2つの「不確実集合」を考える。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:17:47 GMT)
Reading Between the Lines: A dataset and a study on why some texts are tougher than others [0.2] 本研究の目的は,知的障害のある特定の観衆に対して,テキストの読解が難しいことの理解を深めることである。
本稿では,心理学における経験的研究に基づく難易度アノテーションの体系について紹介する。
マルチクラス分類のタスクを実行するために,4種類の事前学習型トランスフォーマーモデルを微調整した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:09:46 GMT)
Automating Work Orders and Tracking Winter Snow Plows and Patrol Vehicles with Telematics Data [0.2] 冬季道路の整備はインディアナ州交通省にとって重要な優先事項である。
現在のSnowplowワークロードのマニュアルトラッキングは非効率であり、エラーを起こしやすい。
我々は,テレマティクスシステムを用いた大規模GPSデータセットを用いて作業順序の作成と検証を自動化するブラウザ内Webアプリケーションを開発した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:16:55 GMT)
Dynamic Prompt Adjustment for Multi-Label Class-Incremental Learning [0.1] CLIPのようなビジュアル言語モデルは、分類タスクにおいて良い結果を得た。
我々は、改良されたデータ再生機構を統合し、知識の忘れを抑えるために損失を早める。
提案手法は,複数のベンチマークデータセットにまたがるMLCILタスクの性能を大幅に改善した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:22:32 GMT)
Current, quantum transport and entropic force of bosonic systems interacting with two thermal reservoirs [0.1] ボゾン系における電流および量子輸送係数のダイナミクスについて検討する。
特に、温度が無限大になるとき、量子系の輸送係数が対応する因子よりも大きいことが観察される。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:17:44 GMT)
Applying Text Mining to Analyze Human Question Asking in Creativity Research [0.1] 本研究は,質問の認知可能性を測定するためにテキストマイニング手法を適用しようとする試みである。
このコントリビューションは、創造性研究の一部としての質問マイニングの歴史と、この研究で有用または有用と考えられる自然言語処理手法をまとめたものである。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:28:42 GMT)
Undermining Mental Proof: How AI Can Make Cooperation Harder by Making Thinking Easier [0.0] 「心証」とは、観察不可能な心的事実を認定するために観察可能な行動を用いる場合である。
雇用からデートまで、精神的な証明は、人々が自分の心の価値観、意図、知識の状態、その他のプライベートな特徴を確実に伝えることを可能にする。
これらのメカニズムの分析は、人工知能がいつどのように、どのようにして低信頼の協力を困難にできるかを明らかにする。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:04:04 GMT)
pyBoLaNO: A Python symbolic package for normal ordering involving bosonic ladder operators [0.0] pyBoLaNOはSymPyWickをベースとしたPythonのシンボリックパッケージで、ボソニック演算子の任意のラグを高速に順序付けする。
拡張により、pyBoLaNO はボソニック・ラグ作用素の任意の2つの交換子の通常の順序付けを提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:33:15 GMT)
Using hypervisors to create a cyber polygon [0.0] この記事では、ハイパーバイザがハードウェアリソースの効率を向上し、ネットワーク構造の詳細なモデリングとサイバー空間の実際の状況のシミュレーションのための複雑な仮想環境を作成する能力を示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:51:06 GMT)
Urban Metaverse: Die Smart City im Industrial Metaverse [0.0] 都市メタバース(Urban Metaverse)は、都市と市民の物理的世界とデジタルデータとシステムを結ぶ没入型3D環境を記述している。
この傾向研究は、都市とコミュニティのリーダー、都市計画家、IT専門家、そして都市空間の将来に関心のある人のためのインスピレーションとガイダンスの源泉となっている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:13:10 GMT)
Unlocking Heisenberg Sensitivity with Sequential Weak Measurement Preparation [0.0] 非線型スピン相互作用の必要性のない絡み合ったスピン状態を生成する。
結果として生じる状態のメロジカル感度は、標準量子限界を超える。
本研究は,大規模,非古典的,絡み合った状態を生成する新しい方法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:45:12 GMT)
Universality class of a spinor Bose-Einstein condensate far from equilibrium [0.0] 加熱された2次元スピノルボースガスの普遍粗大化ダイナミクスの分類について報告する。
この結果は、系の対称性特性に基づいて、平衡量子力学から遠く離れた普遍性のクラスを分類する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:24:39 GMT)
Unified Native Spaces in Kernel Methods [0.0] 本稿では、よく知られたカーネルを特殊ケースとして包含する単一クラスに統一する。
副産物として、既存のカーネルのクラスに関連するソボレフ空間を推論する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:17:41 GMT)
Two-cavity-mediated photon-pair emission by one atom [0.0] 2つの光ファイバーキャビティに結合した、はしご構成の3つのエネルギーレベルを持つ1つの原子に基づく光源について報告する。
本研究では, 繊維内発光効率が$eta_mathrmpair=16(1)%$の光子対を効率よく生成し, 時間相関特性について検討した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:55:32 GMT)
Tree-NET: Enhancing Medical Image Segmentation Through Efficient Low-Level Feature Training [0.0] 本稿では,医療画像セグメンテーションのための新しいフレームワークであるTree-NETを紹介する。
Tree-NETは、セグメンテーション精度と計算効率の両方を向上させるためにボトルネック機能監視を使用する。
実験の結果、Tree-NETはFLOPを4倍から13倍に減らし、メモリ使用量を減らし、元のものと同等または優れた精度を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:17:01 GMT)
Towards Hard and Soft Shadow Removal via Dual-Branch Separation Network and Vision Transformer [0.0] 本稿では,ハードとソフトの影を別々に処理するデュアルパスモデルを提案する。
モデルはシャドウタイプを分類し、それらを適切な経路で処理し、シャドウフリーな出力を生成する。
我々のモデルは最先端の手法より優れ、ISTDデータセット上で2.905 RMSE値を達成する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:29:46 GMT)
Topological quantum compilation of metaplectic anyons [0.0] 解析的に得られた初等装荷行列を用いてメタプレクティック・エノンモデルのコンパイルについて検討した。
CNOTゲートの行列は、CNOTゲートの局所同値類を近似することができ、フィボナッチモデルよりもはるかに小さな誤差を示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:18:16 GMT)
Subject Specific Deep Learning Model for Motor Imagery Direction Decoding [0.0] 運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は神経可塑性を促進し、運動機能の回復を支援する。
深層学習は脳卒中リハビリテーションのためのMI動作の復号化を約束している。
本研究では,二方向MI信号のオンライン復号化のための新しいディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:35:32 GMT)
Spontaneous Unitarity Violation and Quantum State Reduction [0.0] 自発ユニタリティ違反モデル(SUV)の最近の発展は、量子状態の減少が熱力学現象として現れることを示唆している。
本稿では、量子力学および統計力学における確率の性質とSUVの哲学的意味を考察する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 22:29:30 GMT)
Speeding up Lindblad dynamics via time-rescaling engineering [0.0] 我々は、元の軌道を保存するリンドブラッド力学を加速する普遍的な方法を導入する。
この手法は、時間非依存のリンドブラッド作用素を持つマルコフ的(Markovian)な、正確な高速過程を解析的に提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:48:14 GMT)
Snakes on a Plane: mobile, low dimensional logical qubits on a 2D surface [0.0] 近年の実証では、シリコンスピンQPUは物理量子ビットを高速かつ高忠実に移動させることができることが示されている。
しかし、デバイス内の静的な欠陥は、パスするにつれて論理量子ビットを'クラッチ'する可能性があり、コードが非常に脆弱な相関エラーを引き起こします。
ここでは、論理キュービットが平面格子上で自由に移動可能な1次元弦('snakes')であるアーキテクチャを探求する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 22:08:51 GMT)
Simultaneous Latent State Estimation and Latent Linear Dynamics Discovery from Image Observations [0.0] 状態推定の問題は、ノイズの観測から解析的導出や後続のフィルタリング分布の近似を可能にする多くの成功したアルゴリズムで長い歴史を持っている。
本報告では, 画像ベース観測による潜時状態推定の課題を解決し, 新たな解決法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:17:24 GMT)
Siamese Networks for Cat Re-Identification: Exploring Neural Models for Cat Instance Recognition [0.0] 中国の都市移動会社ハローはこれらの問題に対処するため、ハローストリートキャットイニシアチブを立ち上げた。
このプロジェクトは、中国の14都市に2万1000以上のスマート給餌ステーションを配備し、ライブストリーミングカメラを統合し、ユーザーの寄付によって起動されるディスペンサーを治療した。
本研究では,ハローストリートキャットイニシアチブにおけるストリートキャット再同定のためのディープラーニングモデルについて検討する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:37:49 GMT)
Semiring Activation in Neural Networks [0.0] ニューラルネットワークでの使用に適したセミリングに基づいて、トレーニング可能な非線形演算子のクラスを導入する。
トレーニング可能なセミリング演算子のアクティベーション関数を置き換える実験を行い、これらが完全に接続されたネットワークに組み込むことができることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:55:50 GMT)
Responses for one-dimensional quantum spin systems via tensor networks [0.0] 熱平衡状態にある1次元量子スピン系の応答を計算する。
最初の2つの反応は、励起が弱いときに$z$-directionの平衡磁化に対する優れた補正であることが示されている。
この結果は、非自明な量子多体系に対する応答論の例を示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:42:33 GMT)
Relative descriptors for quantum agents [0.0] 我々は、エベレット量子力学のハイゼンベルク図を用いて、フラウチャー=レンナーの思考実験の相対的な記述子を探索する。
エベレット力学は思考実験においてパラドックスを示さないが、デコヒーレンスのないセットアップは指示的分岐木を提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 12:15:44 GMT)
Refinement of Uncertainty Relations in Quantum Mechanics [0.0] 量子力学における3つの量の不確実性関係は、通勤者の観点から推定される。
結果として得られる不等式は、2つの非共役作用素に対するハイゼンベルクの不定式性を洗練させる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:25:23 GMT)
Quantum state transfer of superposed multi-photon states via phonon-induced dynamic resonance in an optomechanical system [0.0] メカニカル発振器によって媒介される2つの光学キャビティ間でマクロ的に重畳された状態を伝達する方法を提案する。
現在利用可能な技術では, 実験パラメータを用いて, 0.99 の転送忠実度を達成できることが示されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:36:11 GMT)
Quantum Channel Learning [0.0] $mathcalU$fidelity 上の二次構造は、$sqrtrho(l) to sqrtvarrho(l)$ mapping および量子チャネル上で構成できることが示されている。
この手法は量子逆問題、変分量子アルゴリズム、量子トモグラフィなどの研究に応用できる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:50:55 GMT)
Quantifying A Firm's AI Engagement: Constructing Objective, Data-Driven, AI Stock Indices Using 10-K Filings [0.0] 本稿では,自然言語処理(NLP)技術を用いたAIストックの分類手法を提案する。
2011年から2023年の間に3,395社のNASDAQ上場企業の年間10-K申請を分析した。
これらの指標を用いて、等重AI指数(AII)、大きさ重AI指数(SAII)、時間割AI指数(TAII05とTAII5X)の4つのAIストック指標を構築した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:27:49 GMT)
Protocols for Creating Anyons and Defects via Gauging [0.0] 非アベリア・エノンのリボン作用素と対称性欠陥を実装する物理プロトコルを提供する。
これを、$mathbbZ_3$トーリック符号と$S_3$量子倍の値で示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:27:22 GMT)
Proposing Hierarchical Goal-Conditioned Policy Planning in Multi-Goal Reinforcement Learning [0.0] 強化学習と自動計画を組み合わせた手法を提案する。
我々のアプローチは,高レベル行動(HLA)を用いたモンテカルロ木探索(MCTS)計画を用いて,階層的に構成された短期目標条件ポリシーを用いる。
エージェントの生涯に維持される単一のプランツリーは、目標達成に関する知識を持っている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:37:54 GMT)
Properties and Applications of the Kirkwood-Dirac Distribution [0.0] KD分布は任意の観測可能量の観点から量子状態を表すことができる。
本稿はKD分布を3つにまとめる。
我々は、オペレーショナル量子アドバンテージと負あるいは非実のKD準確率の間の接続を強調する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:40:34 GMT)
Prompt-Based Segmentation at Multiple Resolutions and Lighting Conditions using Segment Anything Model 2 [0.0] 本稿では、ゼロショット、プロンプトベースのセグメンテーションモデル(SAM)とその更新版であるSAM2とSAM2.1と、RGB空中リモートセンシング画像におけるソーラーパネルのセグメンテーションのための非プロンプタブルニューラルネットワーク(CNN)について検討する。
SAMモデルは、ユーザ定義ボックスによって誘導される場合、すべてのシナリオにおいてCNNよりも優れており、特に低解像度データにおいて適切なパフォーマンスを達成するためには、ユーザボックスプロンプトが不可欠であることが判明した。
Eff-UNet は YOLOv9 によって誘導される SAM よりも高解像度で、準最適照明条件下では、Eff-UNet は SAM より優れていた。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:34:10 GMT)
Projected ensemble in a system with conserved charges with local support [0.0] 我々は,多数の保存電荷が存在するシステムにおいて,投影されたアンサンブルについて検討する。
時間進化状態から構築された投影されたアンサンブルは、後期にスクロージュアンサンブルに収束する。
これは、アンサンブルが測定ベースと連続的に変化する大域保存電荷を持つシステムとは対照的である。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:13:50 GMT)
Probabilistic Genotype-Phenotype Maps Reveal Mutational Robustness of RNA Folding, Spin Glasses, and Quantum Circuits [0.0] 本稿では,各遺伝子型を表現型確率ベクトルにマッピングする確率的遺伝子型フェノタイプマップを紹介する。
本研究では,PrGPマップが様々な物理源から生じる不確実性に対処可能な一般化されたフレームワークを提供することを示す3つのモデルシステムについて検討する。
PrGPロバストネスの挙動に関する解析理論を導出し、この理論が経験的ロバストネスの予測性が高いことを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:13:32 GMT)
Practical machine learning is learning on small samples [0.0] 統計的学習理論は、そのアプローチを正当化するために、無限に増加するトレーニングサンプルを想像する。
実際、学習には無限の時間や無限の一般集団は存在しない。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:38:07 GMT)
Practical Secure Inference Algorithm for Fine-tuned Large Language Model Based on Fully Homomorphic Encryption [0.0] 大規模言語モデル(LLM)の効率的かつセキュアな推論手法を提案する。
オープンソースモデルChatGLM2-6Bを,LoRAで微調整したベースモデルとして使用する。
実験結果から,提案方式の予測効率は1.61s/に向上した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:19:23 GMT)
Phase-space localization at the lowest Landau level [0.0] 我々は,高調波トラップにおける接触相互作用の弱いボゾンについて検討し,最低ランダウレベルの状態に着目した。
対応するグロス=ピタエフスキー方程式のエネルギー汎函数の既知の非自明位相空間トポグラフィーにより、シュローディンガー場の古典位相空間における量子エネルギー固有状態のフシミ分布を探索する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 02:16:10 GMT)
Optimal Fiducial Marker Placement for Satellite Proximity Operations Using Observability Gramians [0.0] 衛星対の絶対的および相対的な移動方程式と姿勢方程式は、二重四元数を用いてモデル化される。
相対二重四元数系の可観測性は経験的グラミアン法を用いて解析する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:03:48 GMT)
Ohm's law, Joule heat, and Planckian dissipation [0.0] 我々は、金属線中の電流によるジュール加熱のよく研究された散逸問題を再考する。
ジュール熱のエネルギーは、ワイヤーの外側から放射として入射し、ワイヤーの中で消費される。
そして、接続された電池から供給されるエネルギーとともに、ワイヤから放射される放射のエネルギーとしてジュール熱を得る。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:13:17 GMT)
Nonlinear skin modes and fixed-points [0.0] 非対称結合と様々な非線形性を持つ一次元強結合格子について検討し,非線形非エルミート皮膚効果について検討した。
非線形スキンモードの特徴として,パワー・エネルギー依存,デジェネリアシー,パワー・エネルギ・不連続などの特徴を同定した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:49:20 GMT)
Modified Condition/Decision Coverage in the GNU Compiler Collection [0.0] GCC 14におけるマスキング修正条件/決定カバレッジ(MC/DC)サポートの実装について述べる。
バイナリ決定図を解析することにより、MC/DCの重要な特性、結果に独立して影響を与える力、制御フローグラフのエッジにマップすることができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 22:59:38 GMT)
Modeling COVID-19 spread in the USA using metapopulation SIR models coupled with graph convolutional neural networks [0.0] グラフ畳み込みニューラルネットワーク(GCN)は、データ集約的な課題に対処する上で、非常に有望であることを示している。
メタポピュレーション間の人体移動を取り入れることで、感受性-感染-回復モデル(SIR)の予測を改善する試みがいくつかなされている。
近年,GCN-SIRのハイブリッド手法は,地域レベルで収集したデータに対して,既存の手法よりも優れていることが報告されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:06:26 GMT)
Millikelvin Nb nanoSQUID-embedded tuneable resonator fabricated with a neon focused-ion-beam [0.0] そこで, ナノSQUIDのネオン集束ビーム加工により, 周波数調整性能が$T=16$mKとなるモノリシックNbナノSQUID埋込み共振器を提案する。
小型のスピンクラスターに結合する装置の適用性を評価するため,マイクロ波駆動電力と外部磁場の関数としてフラックス感度を特徴付ける。
本稿では, Nb SQUID埋込み共振器をハイブリッド超電導体-スピン用として実現し, フラックス感度を劇的に向上させるデバイス設計の改善について論じる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:06:32 GMT)
MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models [0.0] 医療大言語モデル(MLLM)は医療応用の可能性を示している。
幻覚に対する寛容性は、患者医療に重大なリスクをもたらす。
本稿では,MLLMにおける幻覚の評価と緩和のためのベンチマークフレームワークであるMedHallBenchを紹介する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 00:16:52 GMT)
Mapping Compliance: A Taxonomy for Political Content Analysis under the EU's Digital Electoral Framework [0.0] 本稿では,EUのデジタル選挙環境における政治内容の分析のための包括的分類法を提案する。
法的な教義的手法を用いて、ユーザ生成および政治広告コンテンツ間の体系的なコンテンツ分析を可能にする詳細なコードブックを構築し、規制委任事項の遵守を評価する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:01:35 GMT)
MIRAGE: Exploring How Large Language Models Perform in Complex Social Interactive Environments [0.0] 本稿では,MIRAGE(Multiverse Interactive Role-play Ability General Evaluation)を紹介する。
MIRAGEは、殺人ミステリーゲームを通じて高度な人間の行動を描写する大規模言語モデルの能力を評価するために設計されたフレームワークである。
我々の実験は、GPT-4のような人気モデルでさえ、MIRAGEが提示する複雑さをナビゲートする上で大きな課題に直面していることを示している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:07:48 GMT)
Learning Fricke signs from Maass form Coefficients [0.0] マアスのフーリエ係数を同じフリッケ符号で平均化すると、最近発見された「大腿骨」現象に類似したパターンが明らかになる。
データセットの約43%のフォームには、未知のフリッケサインがあります。
残りの形式については、リニア判別分析(LDA)を用いてフリッケ符号を機械的に学習し、偶数(奇数)パリティの形式に対して96%の精度(Resp. 94%)を達成する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:22:29 GMT)
LLMs & Legal Aid: Understanding Legal Needs Exhibited Through User Queries [0.0] GPT-4oをゼロショット分類に使用し,ユーザによる問題点の事実情報提供に関する質問を分類した。
ユーザニーズに対する定量的かつ質的な洞察と,LCMによるユーザエンゲージメントの理解の向上に寄与する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:12:35 GMT)
ICPC: In-context Prompt Compression with Faster Inference [0.0] I CPC(In-context Prompt Compression)は,新規かつスケーラブルなプロンプト圧縮手法であり,プロンプト長を適応的に削減する。
I CPCの鍵となる考え方は、エンコーダを用いてプロンプトに現れる各単語の確率を計算し、情報関数を介して各単語が持つ情報を計算することである。
実験により、I CPCは、異なるカテゴリの長いテキストを効果的に圧縮し、異なるタイプのNLPタスクにおいてより優れた性能と速度を実現することができることを示した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:46:51 GMT)
High-Order Tensor Regression in Sparse Convolutional Neural Networks [0.0] 本稿では、現在の機械学習文献における従来の方法論とは大きく異なる、畳み込みに対する一般的なアプローチを示す。
スパース畳み込みニューラルネットワークの一般的な見方の枠組みとして、ニューラルネットワークにおける回帰の合理的理論が開発されている。
直接的な結果として、古典的バックプロパゲーションアルゴリズムは、この有理テンソルベースのアプローチと整合するように再定義され、最も単純で最も一般的な形式で表される。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:57:34 GMT)
Genuine quantum non-Gaussianity and metrological sensitivity of Fock states prepared in a mechanical resonator [0.0] 高オーバトンバルク波共振器(HBAR)における高フォック状態の生成
我々は,マルチフォノンコントリビューションを明らかにするために,真の量子非ガウス性(QNG)の基準を用いて,実験により実現された状態を特徴付ける。
本結果は,HBARデバイスを用いた量子センシングとシミュレーションに即時に適用できる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:04:06 GMT)
Genetic algorithm enhanced Solovay-Kitaev algorithm for quantum compiling [0.0] 遺伝的アルゴリズム(GA)を改良したSolovay-Kitaevアルゴリズム(SKA)を開発し,単一キュービットゲートを近似する。
近似した1量子ビット量子ゲートの精度はモンテカルロ(MC)拡張SKAよりも優れている。
我々の研究は、非アベリア・エノン量子ゲートの量子コンパイルを解き、最適化するための代替アプローチを提供する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:18:31 GMT)
Fast and Accurate Method for Doppler Averaging of Rydberg EIT Signals [0.0] 本稿では,運動方程式を2回解くだけで,高速で正確な速度推定を可能にする手法を提案する。
この方法は、メモリと時間計算資源を1桁から数桁の規模で節約することが期待されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:18:47 GMT)
Exploring Equality: An Investigation into Custom Loss Functions for Fairness Definitions [0.0] 本稿では,Guptaらにより理論的に提案された,新しいグループ精度パリティフレームワークのフェアネス駆動による実装を初めて作成する。
本稿は,CompASの現在の全国的実装と比較して,GAPが公正性と精度の均衡性の向上を実現していることを結論する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:49:17 GMT)
Exciton Dynamics and Quantum Efficiencies in Optically Coupled OLEDs: A Unified Quantum Master Equation Approach [0.0] ゼロ、弱、強結合状態にまたがる量子マスター方程式モデルを導入する。
我々はフェルミの黄金律とマーカス理論を用いて異なるレートを導出する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 13:17:34 GMT)
Equalities and inequalities from entanglement, loss, and beam splitters [0.0] 二次コヒーレンススケールによる非古典性は50%以上の損失を達成できないという予想を証明した。
これらのアイデアは量子光学を通してアフレッシュを循環することができる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 19:00:00 GMT)
Enhancing entangled two-photon absorption of Nile Red via temperature-controlled SPDC [0.0] 絡み合った2光子吸収は、励起パワーによる蛍光発光の線形スケーリングを可能にする。
既存の理論モデルは、化学的に複雑な染料の絡み合った2光子吸収挙動を正確に予測するのに苦労している。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 10:36:14 GMT)
Enhancing energy transport utilising permanent molecular dipoles [0.0] 分子鎖に沿って励起子量子移動を研究する。
分子軌道における電荷変位によって誘導される永久双極子は、分子系において重要な役割を果たす。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:12:53 GMT)
Enhanced Condensation Through Rotation [0.0] 薄い超伝導シリンダの回転は、超伝導相転移の臨界温度を大幅に上昇させる。
この現象は、クーパー対の凝縮に関連する慣性の効果的な負のモーメントと解釈できる。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:54:20 GMT)
Effective LLM-Driven Code Generation with Pythoness [0.0] Pythonessは、大きな言語モデル(LLM)を使用したコード生成のための組み込みドメイン固有言語である。
Pythonessでは、関数やクラス、プログラム全体を記述する際に、開発者は振る舞い仕様のレベルで動作します。
Pythonessは、テストとコード生成の組み合わせをうまく利用して、仕様のみよりも高品質なコードを生成することができることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 23:14:46 GMT)
Dissecting a Small Artificial Neural Network [0.0] 論理排他論理(XOR)ゲートを表す最も単純な人工ニューラルネットワークの損失景観と収束のバックプロパゲーションダイナミクスについて検討する。
9次元パラメータ空間におけるロスランドスケープの断面は異なる特徴を示しており、なぜバックプロパゲーションがゼロロスへの収束を達成できるのかを理解するのに役立つ。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:14:46 GMT)
Deformation of a one dimensional ferromagnetic domain wall due to double exchange interaction with a free electron system [0.0] 総エネルギーの最小化は、磁気相互作用よりも大きい化学ポテンシャルに対して、磁壁は一般的に薄い壁に変形し、化学ポテンシャルよりも大きい磁場は広い壁に向かう傾向があることを示している。
エネルギーと伝導度は、このプロトタイプモデル内のBlochとN'eelの磁区壁と同一である。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:48:33 GMT)
Data augmentation with automated machine learning: approaches and performance comparison with classical data augmentation methods [0.0] 最先端のアプローチは一般的に、自動機械学習(AutoML)の原則に依存します。
本稿では,AutoMLに基づくデータ拡張技術に関する総合的な調査を紹介する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:36:41 GMT)
DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring [0.0] 冠動脈疾患(CAD)は世界中で死亡率の高い疾患の一つである。
UNETアーキテクチャをベースとした従来の方法では、冠動脈カルシウム(CAC)を含む注記CTスキャンの不足など、課題に直面している。
本研究では,DINOの自己教師型学習(SSL)技術を取り入れることで,これらの制約に対処する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:40:42 GMT)
Cyber Shadows: Neutralizing Security Threats with AI and Targeted Policy Measures [0.0] サイバー脅威は個人、組織、社会レベルでリスクを引き起こす。
本稿では,AI駆動型ソリューションと政策介入を統合した包括的サイバーセキュリティ戦略を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:26:50 GMT)
Custom Loss Functions in Fuel Moisture Modeling [0.0] 燃料水分含有量(FMC)は拡散の山火事率(ROS)の予測因子である
本研究では, FMCの各種機械学習モデルを用いて, 乾式燃料に重みを与えるカスタム損失関数について検討した。
その結果,ROS予測におけるカスタム損失関数の精度は,少ない値で向上した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 01:04:10 GMT)
Curious, Critical Thinker, Empathetic, and Ethically Responsible: Essential Soft Skills for Data Scientists in Software Engineering [0.0] データサイエンティストは、大量のデータを管理し、AIアルゴリズムの社会的影響に対処する上で、課題に直面している。
この研究は、AIを使ったプロジェクトに取り組む際に、データサイエンティストが必要とする重要なソフトスキルを特定することを目的としている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 20:27:14 GMT)
Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation [0.0] インドネシア語から英語への翻訳を自動化するための実用的で効率的なソリューションを開発した。
我々のパイプラインには、音声バブル検出のための細調整YOLOv5xu、OCRのためのTesseract、機械翻訳のための微細調整MarianMTが含まれている。
我々のモデルは各ステップで良い結果を示し、インドネシア語から英語に効率的に翻訳することができた。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:32:27 GMT)
Coverage and Bias of Street View Imagery in Mapping the Urban Environment [0.0] ストリートビュー画像(SVI)は、都市研究において貴重なデータ形式として出現し、都市環境を地図化し、知覚する新しい方法を可能にしている。
しかし、SVIの代表性、品質、信頼性に関する根本的な懸念はいまだに未解決のままである。
本研究は, 都市環境におけるSVIの要素レベルカバレッジを推定するための, 新規かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:18:56 GMT)
Corrections to the Optomechanical Hamiltonian from Quadratic Fluctuations of a Moving Mirror [0.0] 我々は、放射圧の理論を拡張して、移動鏡の位置に二次的なゆらぎを含ませる。
基本空洞周波数に匹敵する機械共振器の場合、オプティメカルハミルトニアンへの補正は二次的である。
これらの補正は、光力学、電気力学、超伝導回路アナログの強い結合機構において重要な役割を果たすことが期待されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 15:21:15 GMT)
Conditions for separability in multiqubit systems with an accelerating qubit using a conditional entropy [0.0] 多ビット純および混合グリーンベルガー・ホーネ・ザイリンガー(GHZ)とW状態の分離性について,加速量子ビットを用いて検討した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:13:09 GMT)
Conditional Consistency Guided Image Translation and Enhancement [0.0] マルチドメイン画像変換のための条件整合モデル(CCM)を提案する。
タスク固有の条件入力を導入し,これらの修正を施す。
CCMを10種類のデータセットで評価し,高品質な翻訳画像の作成の有効性を実証した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:30:10 GMT)
Comparative Study of Deep Learning Architectures for Textual Damage Level Classification [0.0] 本研究では、自然言語処理(NLP)とディープラーニングモデルを用いて、非構造化テキストの物語を分析することを目的とする。
LSTM, BLSTM, GRU, およびsRNN深層学習モデルを用いて, 安全発生時に発生する航空機の損傷レベルを分類する。
sRNNモデルはリコールと精度でトップパフォーマーとして登場し、驚くべき89%を誇った。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:23:29 GMT)
Coherent control over the high-dimensional space of the nuclear spin of alkaline-earth atoms [0.0] 我々は超低温ストロンチウム87原子の核自由度のコヒーレントな操作を示す。
我々は、対応する大きなヒルベルト空間を量子資源として完全に活用するためのツールキットを提供する。
本稿では,3秒後に測定可能なデコヒーレンスを伴わない孤立したゼーマン状態を含むラムゼー干渉計を提案する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 09:48:16 GMT)
ChatGPT's advice drives moral judgments with or without justification [0.0] ユーザーは不合理なアドバイスよりも簡単に合理的なアドバイスに従わない。
アドバイスは、ユーザーに道徳的なジレンマから逃れるための安価な方法を提供するようだ。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:03:17 GMT)
Can AI Help with Your Personal Finances? [0.0] 大規模言語モデル(LLM)は人工知能(AI)の変革的発展として登場した。
本稿では、米国を中心に、個人金融における重要な課題にLLMが取り組む可能性について考察する。
OpenAIのChatGPT、GoogleのGemini、AnthropicのClaude、MetaのLlamaなど、主要なLLMを評価し、正確な財務アドバイスを提供することの有効性を評価する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:03:26 GMT)
Artificial Intelligent Implications on Health Data Privacy and Confidentiality [0.0] 医療における人工知能の急速な統合は、医療診断、パーソナライズされた医療、運用効率に革命をもたらしている。
しかし、患者のデータのプライバシ、倫理的考慮、規制遵守に関する重大な問題が発生する。
本稿では、医療におけるAIの二重効果について検討し、その変革の可能性と、敏感な健康情報を保護するための重要な必要性を強調した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:17:23 GMT)
Architecture for Trajectory-Based Fishing Ship Classification with AIS Data [0.0] 本稿では,現実のキネマティックと漁船検出のためのデータ作成プロセスを提案する。
使用されるデータは、古典的なデータマイニングアプリケーションに見られる典型的な問題によって特徴づけられる。
実験により,提案したデータ作成プロセスが提案問題に有用であることが確認された。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 14:12:40 GMT)
Approximation by non-symmetric networks for cross-domain learning [0.0] 非対称カーネルを用いたカーネルネットワークの近似能力について検討する。
我々は、$r$が必ずしも整数ではないとき、ReLU$r$ネットワークにより、ソボレフクラスの関数の均一近似の精度の推定値を得る。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 21:32:43 GMT)
Applications of natural language processing in aviation safety: A review and qualitative analysis [0.0] 本研究では,航空安全における自然言語処理の活用について検討する。
安全対策を強化するための機械学習アルゴリズムに焦点を当てている。
現在、キーワード検索自然言語処理と航空安全による34のScoopus結果がある。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 07:36:10 GMT)
Analyzing Aviation Safety Narratives with LDA, NMF and PLSA: A Case Study Using Socrata Datasets [0.0] 本研究は,1908年から2009年までのソクラタデータセットにおけるトピックモデリング手法の適用について検討した。
この分析では、パイロットエラー、機械的故障、天候条件、訓練不足などの重要なテーマを特定した。
今後の方向性としては、追加のコンテキスト変数の統合、ニューラルトピックモデルの利用、航空安全プロトコルの強化などがある。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 08:14:39 GMT)
An Overview and Discussion on Using Large Language Models for Implementation Generation of Solutions to Open-Ended Problems [0.0] 大規模言語モデルは、オープンな問題に対する問題解決活動をサポートする新しいメソッドの作成をサポートすることができる。
本報告では、モデルプロンプト、強化学習、検索型生成を含む、大規模言語モデルに関する現在の研究を要約する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 06:28:02 GMT)
Ambiguity Clustering: an accurate and efficient decoder for qLDPC codes [0.0] 本稿では,Ambiguity Clustering Decoder (AC)を導入し,測定データを独立に復号可能なクラスタに分割する。
0.3%の回路レベルの脱分極ノイズにより、ACはBP-OSDの27倍の精度で出力される。
本実装では,M2 CPU上でのシンドローム抽出1ラウンドあたり135usで144キュービットのGross符号をデコードする。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 16:40:42 GMT)
Alleviating Overfitting in Transformation-Interaction-Rational Symbolic Regression with Multi-Objective Optimization [0.0] 変換-相互作用-関係表現を用いた遺伝的プログラミングの性能は、前者よりも大幅に向上した。
我々は、多目的最適化、特にNSGA-IIアルゴリズムをサポートするために変換-相互作用-Rationalを拡張し、それを同じベンチマークに適用する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 17:21:05 GMT)
Adverse Weather Conditions Augmentation of LiDAR Scenes with Latent Diffusion Models [0.0] 本稿では,オートエンコーダと潜時拡散モデルにより構成される潜時拡散過程を提案する。
我々は,環境条件のクリアなシーンを後処理のステップで活用し,発生した悪天候のシーンの現実性を改善する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 11:26:29 GMT)
Abstractive Text Summarization for Contemporary Sanskrit Prose: Issues and Challenges [0.0] この論文は、現代サンスクリット文の抽象テキスト要約モデルを示す。
この論文が研究する鍵となる疑問は、サンスクリットの抽象的TSを開発する上での課題である。
この作品では、4つの異なるテーマに基づくサブクエストが提案されている。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 18:12:13 GMT)
A non-ergodic framework for understanding emergent capabilities in Large Language Models [0.0] 大規模言語モデルには、予期せぬ規模で現れる創発的な能力がある。
スチュアート・カウフマン(Stuart Kauffman)の隣接可能な可能性(TAP)の理論に基づく数学的枠組みを提供し、能力の出現を説明する。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 05:11:41 GMT)
A hybrid marketplace of ideas [0.0] 我々は、AIエージェントの文化的重要性は学術文献においてほとんど解明されていないと論じる。
我々は、アイデア生成、伝播、エンゲージメントにおけるAIエージェントの現状を調べ、メメティクスのレンズを通して、彼らの文化的エージェントとしての役割を位置づける。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 22:53:43 GMT)
A Probabilistic Model for Node Classification in Directed Graphs [0.0] ノードが属性とラベルを持つ有向グラフに対する確率モデルを提案する。
このモデルは、最大確率または最大アフター推定を用いて、目に見えないノードのラベルを予測することができる生成分類器として機能する。
我々はこのモデルを2つのデータセットに適用し、最先端の手法と競合し、さらに優れている予測性能を実証した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 04:33:25 GMT)
A Bayesian Flow Network Framework for Chemistry Tasks [0.0] ベイジアンフローネットワークに基づく化学タスクを処理する言語モデルであるChemBFNを紹介する。
サンプリング品質を改善するために,新しい精度スケジュールを提案する。
本手法は, 少ないサンプリングステップを用いても, 十分な多様性を持つ分子を生成するのに適していることを示す。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 03:38:19 GMT)
(WhyPHI) Fine-Tuning PHI-3 for Multiple-Choice Question Answering: Methodology, Results, and Challenges [0.0] この研究は、マイクロソフトのPHI-3citeAbdin2024(コンパクトで効率的で複数の質問に答えるLLM)の可能性を探るものである。
PHI-3.5のMCQ処理は4.68から2.27に減少し、精度は62%から90.8%に向上した。
論文参考訳(メタデータ) (Fri, 03 Jan 2025 00:56:46 GMT)