4月からAIの関連ではnoteを書き始めましたので、少し違う角度で抽出してる論文です。

  • [2604.21999] Universal Transformers Need Memory: Depth-State Trade-offs in Adaptive Recursive Reasoning (Score 70 / L1 / E2)
  • ACTの初期化トラップ解明とメモリトークンの必要性実証により推論プロセスの再構成を示し、認知科学との接続とコード公開で高評価。
  • https://arxiv.org/abs/2604.21999
  • [2604.22177] Uni-Encoder Meets Multi-Encoders: Representation Before Fusion for Brain Tumor Segmentation with Missing Modalities (Score 70 / L1 / E3)
    • 欠損モダリティ対応という臨床課題に対し、ViTとCNNの異分野融合による表現学習の再構成を行い、大規模ベンチマークで実証かつコード公開しているため。
    • https://arxiv.org/abs/2604.22177
  • [2604.22215] Verbal Confidence Saturation in 3-9B Open-Weight Instruction-Tuned LLMs: A Pre-Registered Psychometric Validity Screen (Score 70 / L1 / E2)
    • LLMの出力特性に関する根本的な限界(知の歪み)を実証し、評価プロセスの再設計を促す異分野融合研究だが、ベンチマーク検証の域を出ていないため。
    • https://arxiv.org/abs/2604.22215
  • [2604.22302] Knowledge Visualization: A Benchmark and Method for Knowledge-Intensive Text-to-Image Generation (Score 70 / L1 / E2)
    • 教育・科学領域との横断的接続とプロセス再構成(KE-Check)により知の生成プロセスに革新をもたらすが、評価は標準ベンチ(KVBench)に留まり実世界での構造的影響は未検証のため中スコア。
    • https://arxiv.org/abs/2604.22302
  • [2604.22240] OccDirector: Language-Guided Behavior and Interaction Generation in 4D Occupancy Space (Score 69 / L1 / E3)
    • 自然言語による4D占有空間の動的生成は知の構造化プロセスを再定義するが、実世界インフラへの直接的な包摂性や完全なオープンソース化には限界がある。
    • https://arxiv.org/abs/2604.22240
  • [2604.22273] When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention (Score 68 / L1 / E3)
    • 制御理論を用いた自己修正のメカニズム解明は知の再構成に寄与し、大規模実証で高い信頼性を持つが、包摂性や完全なオープンソース化の点で改善の余地あり。
    • https://arxiv.org/abs/2604.22273
  • [2604.22333] ChangeQuery: Advancing Remote Sensing Change Analysis for Natural and Human-Induced Disasters from Visual Detection to S (Score 67 / L1 / E3)
    • SARと光学の融合による災害分析プロセスの再構築とDICQデータセットの構築は知の流通を促進するが、既存のVLMアーキテクチャの延長線上にあるためプロセス革新性は限定的。
    • https://arxiv.org/abs/2604.22333
  • [2604.21953] Performance Anomaly Detection in Athletics: A Benchmarking System with Visual Analytics (Score 66 / L1 / E3)
    • 既存の生物学的検査プロセスを補完する「知の流通・監視」プロセスを再構成し、大規模実データで実証されたが、AIによる知の生成そのものより応用システムに留まるため。
    • https://arxiv.org/abs/2604.21953
  • [2604.21956] Conditional anomaly detection using soft harmonic functions: An application to clinical alerting (Score 66 / L1 / E3)
    • 臨床データという実世界大規模データセットを用い、数学的アプローチと医療インフラを接続する実証的貢献は高いが、コード公開の有無が不明確でプロセスの根本的再構成には至っていないため。
    • https://arxiv.org/abs/2604.21956
  • [2604.22128] Dissociating Decodability and Causal Use in Bracket-Sequence Transformers (Score 66 / L1 / E2)
    • 解釈可能性の因果的検証という知の流通プロセスに本質的な問いを投げかけ、認知科学とMLを横断的に接続しているが、標準ベンチ(Dyck)での検証にとどまり実世界影響や完全オープン性は限定的。
    • https://arxiv.org/abs/2604.22128
  • [2604.22271] How LLMs Detect and Correct Their Own Errors: The Role of Internal Confidence Signals (Score 66 / L1 / E3)
    • 神経科学の第二秩序モデルをMLに適用し知の生成プロセスを再定義したが、実世界デプロイや完全なオープンソース化には至っていない。
    • https://arxiv.org/abs/2604.22271
  • [2604.22324] A Brain-Inspired Deep Separation Network for Single Channel Raman Spectra Unmixing (Score 66 / L1 / E2)
    • 音声分離の知見を化学分析に転用し実証可能だが、合成データ依存とコード非公開によりプロセス革新と包摂性の限界がある
    • https://arxiv.org/abs/2604.22324
  • [2604.22067] Optimal Question Selection from a Large Question Bank for Clinical Field Recovery in Conversational Psychiatric Intake (Score 65 / L1 / E2)
    • 臨床プロセスの再構築と異分野接続に優れるが、合成データ・小規模検証・コード非公開により実証力と包摂性の限界がある。
    • https://arxiv.org/abs/2604.22067
  • [2604.22167] Estimating Tail Risks in Language Model Output Distributions (Score 64 / L4 / E3)
    • 重要度サンプリングによる安全評価プロセスの再構成と実世界デプロイリスクの可視化により、知の流通・学習の安全性インフラを再設計する構造的影響を持つ。
    • https://arxiv.org/abs/2604.22167
  • [2604.22260] Towards Safe Mobility: A Unified Transportation Foundation Model enabled by Open-Ended Vision-Language Dataset (Score 64 / L1 / E3)
    • 既存のAD研究を都市スケールの交通分析へ再構成し、大規模オープンデータとモデルを公開したが、ベンチマーク性能向上が主目的であり、知の生成プロセスそのものの根本的転換には至っていない。
    • https://arxiv.org/abs/2604.22260
  • [2604.22294] Contexts are Never Long Enough: Structured Reasoning for Scalable Question Answering over Long Document Sets (Score 61 / L1 / E3)
    • LLMのコンテキスト窓依存をSQLによる構造化データベースへ移行させる知の処理プロセスを再構成し、大規模実証で有効性を示したが、分野横断性や包摂性、完全なオープンソース化には課題が残る。
    • https://arxiv.org/abs/2604.22294
  • [2604.22076] PrivUn: Unveiling Latent Ripple Effects and Shallow Forgetting in Privacy Unlearning (Score 60 / L1 / E2)
    • 既存のアンラーニング評価プロセスを再定義し、勾配ベースの隠れた関連性や浅い忘却という新知を可視化した点は画期的だが、標準ベンチマークに基づく検証であり、コード公開の有明記がないため。
    • https://arxiv.org/abs/2604.22076
  • [2604.22080] Sound Agentic Science Requires Adversarial Experiments (Score 60 / L2 / E0)
    • AIによる科学プロセスの根本的な再定義(反証可能性の重視)を提唱し異分野接続と長期的影響を示すが、実証データやコード公開がなく、提案段階の意見レベルであるため。
    • https://arxiv.org/abs/2604.22080
  • [2604.22139] Anatomy-Aware Unsupervised Detection and Localization of Retinal Abnormalities in Optical Coherence Tomography (Score 60 / L1 / E3)
    • ラベル不要の異常検出により臨床ワークフローを再構成し、複数データセットで実証されたが、コード公開の有無が不明で完全なオープン性は欠ける。
    • https://arxiv.org/abs/2604.22139
  • [2604.22154] Reliable Self-Harm Risk Screening via Adaptive Multi-Agent LLM Systems (Score 60 / L1 / E1)
    • 精神医療と統計的決定理論を融合したプロセス革新と社会的包摂性は高いが、小規模トイデータのみで実証され、再現性情報が不足しているため。
    • https://arxiv.org/abs/2604.22154