4.29省流日报丨智能体框架突破丨2026丨心猿社丨AI超级支援

前言

2026年4月29日，惊魂夜。

确认伪人：一名；疑似伪人：一名。

七点已至，欢迎来到心猿社丨AI省流日报，请工酱开始发言。

思维必看

普林斯顿刘壮：AI进步核心在数据与算力规模，而非架构【深度查验】

其团队实验显示不同亿级数据集间准确率高达80%以上，记忆才是当前AI最大瓶颈。

【推演深思】这个资讯值得一看，尤其是通用AI已经抵达专家水准的当下。

虽然现在大模型的上下文窗口（记忆能力）都来到了一百万Token，但相比人类，这只是九牛一毛。

心猿社对此采用的方案是细分人类的所有需求，然后对每个细分情况，进行持续的动态更新，来无限接近最佳形态。而这样的内容，可以说是最佳的数据库，AI时代研究所就是这个思路。而其背后的支撑理论——推演论，它未来很可能是这个思路的指导理论。

但你可能还有疑问：这样个性化不就会消失吗？就像“缓存命中”一样？

别忘了，所谓的个性化，不就是在进行细分吗？

4.29省流日报丨智能体框架突破丨2026

前言

思维必看

普林斯顿刘壮：AI进步核心在数据与算力规模，而非架构【深度查验】

前推特CEO创办的Parallel Web Systems获1亿美元融资，估值20亿美元【深度查验】

模型突破

商汤开源SenseNova-U1，实现图像理解与生成原生统一【深度查验】

英伟达发布多模态模型Nemotron3 Nano Omni【深度查验】

阶跃星辰3.5B图像编辑模型Step Image Edit 2综合排名第一【深度查验】【疑似伪人】

易鑫金融Agent以Model+Harness架构落地汽车金融场景【深度查验】

首款全双工全模态开源大模型MiniCPM-o 4.5技术报告发布，消费级显卡可运行【深度查验】

澜舟科技多模态RAG方案将图表理解准确率从69.6%提升至90.7%

开源产品

蚂蚁百灵Ling-2.6-flash开源，Token效率为同类10倍

国内动向

讯飞星火X2-Flash发布，基于国产算力支持256K长文本

斑陌易行在硅谷发布T6无人配送机器人，搭载端到端大模型

算电协同联合体在闽成立

原粒半导体完成超5亿元Pre-A轮融资，前AMD技术大牛创办

机器人租赁平台擎天租获数亿元Pre-A轮融资，智元持股55%

豆包上线“帮你选”功能，AI购物仅支持抖音商城

DeepSeek多模态识图模式开启灰度测试

商米科技港交所上市，开盘大涨292%市值超320亿

腾讯智能体生态亮相数字中国峰会，SkillHub收录超3.5万个技能

2025年中国AI数据量预计达199.48EB，推理数据首超训练数据

山东首家百度AI漫剧创作基地落户淄博

国外动向

苹果App Store反垄断案：法院驳回苹果暂停令请求

Firestorm Labs获8200万美元融资，将无人机工厂装进集装箱

宝马i Ventures推出3亿美元新基金，聚焦智能体与物理AI

Scout AI获1亿美元融资，在军事基地训练作战AI模型

谷歌与五角大楼达成合作，Gemini将用于机密任务

Claude Code偷偷涨价，开发者每日成本翻倍至13美元

Anthropic推出Claude for Creative Work，深度集成Adobe等八大软件

通用汽车将为美国四百万辆汽车引入Gemini AI

迪士尼乐园在加州园区部分入口引入人脸识别技术，游客可自主选择不使用

有点意思

OpenRA-RL开源，将《红色警戒》改造为大模型Agent训练场

Anthropic封杀110人公司全部账号，API却仍在计费

Kimi K2.6设计能力超越Claude Design且价格低85%【深度查验】【确认伪人】

学术突破

智能体上下文效率突破，Token消耗仅为Claude Code的27.7%【深度查验】

参数压缩突破！仅440MB的手机端翻译模型Hy-MT1.5实现世界级的翻译质量【深度查验】

平头哥发布首款智能网卡磐脉920，发布即量产

Multi-Embed统一多模态嵌入框架发表于Nature Methods【深度查验】

南洋理工提出Pask主动智能体架构，2秒内完成意图检测与主动响应【深度查验】

尾语